Devore.pdf
12/3/08
10:13:56
www.FreeLibros.me
00Ander(i-xxviii).qxd 2/29/08 10:41 AM Page iv
www.FreeLibros.me
Prels_p00i-xvi.qxd
3/12/08
10:17 AM
Page i
SÉPTIMA EDICIÓN
Probabilidad y Estadística
para Ingeniería
y Ciencias
www.FreeLibros.me
Prels_p00i-xvi.qxd
3/12/08
10:17 AM
Page ii
www.FreeLibros.me
Prels_p00i-xvi.qxd
3/12/08
10:17 AM
Page iii
SÉPTIMA EDICIÓN
Probabilidad y Estadística
para Ingeniería
y Ciencias
JAY L. DEVORE
California Polytechnic State University, San Luis Obispo
Traducción
Jorge Humberto Romo
Traductor profesional
Revisión Técnica
A. Leonardo Bañuelos Saucedo
Profesor de carrera titular
Facultad de Ingeniería
Universidad Nacional Autónoma de México
Australia • Brasil • Corea • España • Estados Unidos • Japón • México • Singapur • Reino Unido
www.FreeLibros.me
Prels_p00i-xvi.qxd
3/12/08
10:17 AM
Page iv
Probabilidad y Estadística para
Ingeniería y Ciencias
Séptima edición
Jay L. Devore
Presidente de Cengage Learning
Latinoamérica:
Javier Arellano Gutiérrez
Director general México y
Centroamérica:
Héctor Enrique Galindo Iturribarría
Director editorial Latinoamérica:
José Tomás Pérez Bonilla
Director de producción:
Raúl D. Zendejas Espejel
Editor:
Sergio R. Cervantes González
Editora de producción:
Abril Vega Orozco
Ilustrador: Lori Heckelman / Graphic World,
International Typesetting and Composition
Diseño de portada:
Grupo Insigne OTA S. A. de C. V.
Composición tipográfica:
EDITEC, S.A. de C.V
© D.R. 2008 por Cengage Learning Editores,
S.A. de C.V.,
una Compañía de Cengage Learning, Inc.
Corporativo Santa Fe
Av. Santa Fe núm. 505, piso 12
Col. Cruz Manca, Santa Fe
C.P. 05349, México, D.F.
Cengage Learning™ es una marca registrada
usada bajo permiso.
DERECHOS RESERVADOS. Ninguna parte de
este trabajo amparado por la Ley Federal del
Derecho de Autor, podrá ser reproducida,
transmitida, almacenada o utilizada en
cualquier forma o por cualquier medio, ya sea
gráfico, electrónico o mecánico, incluyendo,
pero sin limitarse a lo siguiente: fotocopiado,
reproducción, escaneo, digitalización,
grabación en audio, distribución en Internet,
distribución en redes de información o
almacenamiento y recopilación en sistemas de
información a excepción de lo permitido en
el Capítulo III, Artículo 27 de la Ley Federal del
Derecho de Autor, sin el consentimiento por
escrito de la Editorial.
Traducido del libro Probability and Statistics
for Engineering and the Sciences. Seventh Edition.
Publicado en inglés por Brooks/Cole © 2008
ISBN: 0-495-38217-5
Datos para catalogación bibliográfica:
Devore, Jay L. Probabilidad y Estadística para
Ingeniería y Ciencias. Séptima edición.
ISBN-13: 978-607-481-338-8
ISBN-10: 607-481-338-8
Visite nuestro sitio en:
http://latinoamerica.cengage.com
www.FreeLibros.me
Prels_p00i-xvi.qxd
3/12/08
10:17 AM
Page v
A mi esposa Carol:
Su esmero en la enseñanza
es una continua inspiración para mí.
A mis hijas, Allison y Teresa:
Con gran orgullo admito sus
logros que no conocen ningún límite.
v
www.FreeLibros.me
Prels_p00i-xvi.qxd
3/12/08
10:17 AM
Page vi
www.FreeLibros.me
Prels_p00i-xvi.qxd
3/12/08
10:17 AM
Page vii
Contenido
1 Generalidades y estadística descriptiva
1.1
1.2
1.3
1.4
Introducción 1
Poblaciones, muestras y procesos 2
Métodos pictóricos y tabulares en la estadística descriptiva 10
Medidas de localización 24
Medidas de variabilidad 31
Ejercicios suplementarios 42
Bibliografía 45
2 Probabilidad
2.1
2.2
2.3
2.4
2.5
Introducción 46
Espacios muestrales y eventos 47
Axiomas, interpretaciones y propiedades de probabilidad 51
Técnicas de conteo 59
Probabilidad condicional 67
Independencia 76
Ejercicios suplementarios 82
Bibliografía 85
3 Variables aleatorias discretas
y distribuciones de probabilidad
3.1
3.2
3.3
3.4
3.5
3.6
Introducción 86
Variables aleatorias 87
Distribuciones de probabilidad para variables aleatorias discretas 90
Valores esperados 100
Distribución de probabilidad binomial 108
Distribuciones hipergeométricas y binomiales negativas 116
Distribución de probabilidad de Poisson 121
Ejercicios suplementarios 126
Bibliografía 129
vii
www.FreeLibros.me
Prels_p00i-xvi.qxd
viii
3/12/08
10:17 AM
Page viii
Contenido
4 Variables aleatorias continuas
y distribuciones de probabilidad
4.1
4.2
4.3
4.4
4.5
4.6
Introducción 130
Funciones de densidad de probabilidad 131
Funciones de distribución acumulativa y valores esperados 136
Distribución normal 144
Distribuciones exponencial y gama 157
Otras distribuciones continuas 163
Gráficas de probabilidad 170
Ejercicios suplementarios 179
Bibliografía 183
5 Distribuciones de probabilidad conjunta
y muestras aleatorias
5.1
5.2
5.3
5.4
5.5
Introducción 184
Variables aleatorias conjuntamente distribuidas 185
Valores esperados, covarianza y correlación 196
Estadísticos y sus distribuciones 202
Distribución de la media muestral 213
Distribución de una combinación lineal 219
Ejercicios suplementarios 224
Bibliografía 226
6 Estimación puntual
Introducción 227
6.1 Algunos conceptos generales de estimación puntual 228
6.2 Métodos de estimación puntual 243
Ejercicios suplementarios 252
Bibliografía 253
7 Intervalos estadísticos basados en una sola muestra
Introducción 254
7.1 Propiedades básicas de los intervalos de confianza 255
7.2 Intervalos de confianza de muestra grande para una media
y proporción de población 263
www.FreeLibros.me
Prels_p00i-xvi.qxd
3/12/08
10:17 AM
Page ix
Contenido
7.3 Intervalos basados en una distribución de población normal 270
7.4 Intervalos de confianza para la varianza y desviación estándar
de una población normal 278
Ejercicios suplementarios 281
Bibliografía 283
8 Pruebas de hipótesis basadas en una sola muestra
8.1
8.2
8.3
8.4
8.5
Introducción 284
Hipótesis y procedimientos de prueba 285
Pruebas sobre una media de población 294
Pruebas relacionadas con una proporción de población 306
Valores P 311
Algunos comentarios sobre la selección de una prueba 318
Ejercicios suplementarios 321
Bibliografía 324
9 Inferencias basadas en dos muestras
9.1
9.2
9.4
9.5
Introducción 325
Pruebas z e intervalos de confianza para una diferencia entre
dos medias de población 326
Prueba t con dos muestras e intervalo de confianza 336
Inferencias sobre una diferencia entre proporciones
de población 353
Inferencias sobre dos varianzas de población 360
Ejercicios suplementarios 364
Bibliografía 368
10 Análisis de la varianza
Introducción 369
10.1 ANOVA unifactorial 370
10.2 Comparaciones múltiples en ANOVA 379
10.3 Más sobre ANOVA unifactorial 385
Ejercicios suplementarios 395
Bibliografía 396
www.FreeLibros.me
ix
Prels_p00i-xvi.qxd
x
3/12/08
10:17 AM
Page x
Contenido
11 Análisis de varianza con varios factores
11.1
11.2
11.3
11.4
Introducción 397
ANOVA bifactorial con Kij 1 398
ANOVA bifactorial con Kij 1 410
ANOVA con tres factores 419
Experimentos 2p factoriales 429
Ejercicios suplementarios 442
Bibliografía 445
12 Regresión lineal simple y correlación
12.1
12.2
12.3
12.4
12.5
Introducción 446
Modelo de regresión lineal simple 447
Estimación de parámetros de modelo 454
Inferencias sobre el parámetro de pendiente 1 468
Inferencias sobre Yx* y predicción de valores Y futuros 477
Correlación 485
Ejercicios suplementarios 494
Bibliografía 499
13 Regresión múltiple y no lineal
13.1
13.2
13.3
13.4
13.5
Introducción 500
Aptitud y verificación del modelo 501
Regresión con variables transformadas 508
Regresión con polinomios 519
Análisis de regresión múltiple 528
Otros problemas en regresión múltiple 550
Ejercicios suplementarios 562
Bibliografía 567
14 Pruebas de bondad de ajuste
y análisis de datos categóricos
Introducción 568
14.1 Pruebas de bondad de ajuste cuando las probabilidades categóricas
se satisfacen por completo 569
14.2 Pruebas de bondad de ajuste para hipótesis compuestas 576
www.FreeLibros.me
Prels_p00i-xvi.qxd
3/12/08
10:17 AM
Page xi
Contenido
14.3 Tablas de contingencia mutuas (o bidireccionales) 587
Ejercicios suplementarios 595
Bibliografía 598
15 Procedimientos sin distribución
15.1
15.2
15.3
15.4
Introducción 599
La prueba Wilcoxon de rango con signo 600
Prueba Wilcoxon de suma de rangos 608
Intervalos de confianza sin distribución 614
ANOVA sin distribución 618
Ejercicios suplementarios 622
Bibliografía 624
16 Métodos de control de calidad
16.1
16.2
16.3
16.4
16.5
16.6
Introducción 625
Comentarios generales sobre gráficas de control 626
Gráficas de control para ubicación de proceso 627
Gráficas de control para variación de proceso 637
Gráficas de control para atributos 641
Procedimientos CUSUM 646
Muestreo de aceptación 654
Ejercicios suplementarios 660
Bibliografía 661
Apéndice/Tablas
A.1
A.2
A.3
A.4
A.5
A.6
A.7
A.8
A.9
A.10
Distribuciones binomiales acumulativas 664
Distribuciones acumulativas de Poisson 666
Áreas de la Curva normal estándar 668
La Función Gamma incompleta 670
Valores críticos para Distribuciones t 671
Valores críticos de tolerancia para distribuciones normales de población 672
Valores críticos para distribuciones chi-cuadrada 673
Curva t para áreas de cola 674
Valores críticos para distribuciones F 676
Valores críticos para distribuciones de rango estudentizado 682
www.FreeLibros.me
xi
Prels_p00i-xvi.qxd
xii
3/12/08
10:17 AM
Page xii
Contenido
A.11
A.12
A.13
A.14
A.15
A.16
A.17
Curvas chi-cuadrada para áreas de cola 683
Valores críticos para la prueba de normalidad Ryan-Joiner 685
Valores críticos para la prueba Wilcoxon de rangos con signo 686
Valores críticos para la prueba Wilcoxon de suma de rangos 687
Valores críticos para el intervalo Wilcoxon de rangos con signo 688
Valores críticos para el intervalo Wilcoxon de suma de rangos 689
Curvas para pruebas t 690
Respuestas a ejercicios seleccionados de número impar 691
Índice 710
www.FreeLibros.me
Prels_p00i-xvi.qxd
3/12/08
10:17 AM
Page xiii
Prefacio
Propósito
El uso de modelos de probabilidad y métodos estadísticos para analizar datos se ha convertido en una práctica común en virtualmente todas las disciplinas científicas. Este libro pretende introducir con amplitud aquellos modelos y métodos que con mayor probabilidad se
encuentran y utilizan los estudiantes en sus carreras de ingeniería y las ciencias naturales.
Aun cuando los ejemplos y ejercicios se diseñaron pensando en los científicos e ingenieros,
la mayoría de los métodos tratados son básicos en los análisis estadísticos en muchas otras
disciplinas, por lo que los estudiantes de las ciencias administrativas y sociales también se
beneficiarán con la lectura del libro.
Enfoque
Los estudiantes de un curso de estadística diseñado para servir a otras especialidades de estudio al principio es posible que duden del valor pertinencia de la materia, pero mi experiencia es que los estudiantes pueden ser conectados a la estadística con el uso de buenos
ejemplos y ejercicios que combinen sus experiencias diarias con sus intereses científicos.
Así pues, he trabajado duro para encontrar ejemplos reales y no artificiales, que alguien pensó que valía la pena recopilar y analizar. Muchos de los métodos presentados, sobre todo en
los últimos capítulos sobre inferencia estadística, se ilustran analizando datos tomados de
una fuente publicada y muchos de los ejercicios también implican trabajar con dichos datos. En ocasiones es posible que el lector no esté familiarizado con el contexto de un problema particular (como muchas veces yo lo estuve), pero me di cuenta que los problemas
reales atraen más a los estudiantes con un contexto un tanto extraño que por problemas definitivamente artificiales en un entorno conocido.
Nivel matemático
La exposición es relativamente modesta en función de desarrollo matemático. El uso sustancial del cálculo se hace sólo en el capítulo 4 y en partes de los capítulos 5 y 6. En particular, con excepción de una observación o nota ocasional, el cálculo aparece en la parte de
inferencia del libro sólo en la segunda sección del capítulo 6. No se utiliza álgebra matricial
en absoluto. Por lo tanto, casi toda la exposición deberá ser accesible para aquellos cuyo conocimiento matemático incluye un semestre o dos trimestres de cálculo diferencial e integral.
Contenido
El capítulo 1 se inicia con algunos conceptos y terminología básicos (población, muestra,
estadística descriptiva e inferencial, estudios enumerativos contra analíticos, y así sucesivamente) y continúa con el estudio de métodos descriptivos gráficos y numéricos importantes.
En el capítulo 2 se ofrece el desarrollo un tanto tradicional de la probabilidad, seguido por
distribuciones de probabilidad de variables aleatorias continuas y discretas en los capítulos
3 y 4, respectivamente. Las distribuciones conjuntas y sus propiedades se analizan en la primera parte del capítulo 5. La última parte de este capítulo introduce la estadística y sus distribuciones muestrales, las cuales constituyen el puente entre probabilidad e inferencia. Los
siguientes tres capítulos se ocupan de la estimación puntual, los intervalos estadísticos y la
comprobación de hipótesis basados en una muestra única. Los métodos de inferencia que
implican dos muestras independientes y datos apareados se presentan en el capítulo 9.
El análisis de la varianza es el tema de los capítulos 10 y 11 (unifactorial y multifactorial,
xiii
www.FreeLibros.me
Prels_p00i-xvi.qxd
xiv
3/12/08
10:17 AM
Page xiv
Prefacio
respectivamente). La regresión aparece por primera vez en el capítulo 12 (el modelo de regresión lineal simple y correlación) y regresa para una amplia repetición en el capítulo 13.
Los últimos tres capítulos analizan métodos de ji cuadrada, procedimientos sin distribución
(no paramétricos) y técnicas de control de calidad estadístico.
Ayuda para el aprendizaje de los estudiantes
Aunque el nivel matemático del libro representará poca dificultad para la mayoría de los estudiantes de ciencia e ingeniería, es posible que el trabajo dirigido hacia la comprensión de
los conceptos y apreciación del desarrollo lógico de la metodología en ocasiones requiera
un esfuerzo sustancial. Para ayudar a que los estudiantes ganen en comprensión y apreciación he proporcionado numerosos ejercicios de dificultad variable desde muchos que implican la aplicación rutinaria del material incluido en el texto hasta algunos que piden al lector
que extienda los conceptos analizados en el texto a situaciones un tanto nuevas. Existen muchos ejercicios que la mayoría de los profesores desearía asignar durante cualquier curso
particular, pero recomiendo que se les pida a los estudiantes que resuelvan un número sustancial de ellos; en una disciplina de solución de problemas, el compromiso activo de esta
clase es la forma más segura de identificar y cerrar las brechas en el entendimiento que inevitablemente surgen. Las respuestas a la mayoría de los ejercicios impares aparecen en la
sección de respuestas al final del texto. Además, está disponible un Manual de Soluciones
para el Estudiante, que incluye soluciones resueltas de casi todos los ejercicios de número
impar.
Nuevo en esta edición
• Ejercicios y ejemplos nuevos, muchos basados en fuentes publicadas que incluyen datos
reales. Algunos de los ejercicios permiten una interpretación más amplia de los ejercicios tradicionales que incluyen cuestiones muy específicas y algunos de éstos implican
material de las primeras secciones y capítulos.
• El material de los capítulos 2 y 3 sobre propiedades de probabilidad, conteo y tipos de variables aleatorias se reescribió para alcanzar una mayor claridad.
• La sección 3.6 sobre la distribución de Poisson ha sido revisada, incluido el material nuevo sobre la aproximación de Poisson a la distribución binomial y la reorganización de la
subsección sobre procesos de Poisson.
• El material de la sección 4.4 sobre distribuciones gama y exponencial ha sido reordenado
de tal suerte que las segundas aparecen antes que las primeras. Esto es muy conveniente
para aquellos que desean abordar la distribución exponencial y evitar la distribución gama.
• Una breve introducción al error en la media de los cuadrados en la sección 6.1 ahora aparece como ayuda para motivar la propiedad de insesgabilidad y se da un ejemplo nuevo
que ilustra la posibilidad de tener más de un solo estimador insesgado razonable.
• Existe un énfasis disminuido en los cálculos manuales en el ANOVA multifactorial para
reflejar el hecho de que ahora hay software apropiado ampliamente disponible y ahora se
incluyen gráficas residuales para verificar suposiciones de modelo.
• Se han realizado miles de pequeños cambios en la redacción a lo largo del libro para mejorar las explicaciones y pulir la exposición.
• El sitio web incluye applets Java™ creados por Gary McClelland, específicamente para
este texto basado en el cálculo, así como también conjuntos de datos tomados del texto
principal.
• WebAssign, el sistema de asignación de tareas más ampliamente utilizado en la educación
superior, permite asignar, reunir, calificar y registrar tareas vía la web. Este comprobado
sistema de asignación de tareas ha sido mejorado para incluir vínculos al contenido específico del texto, ejemplos de video y tutoriales propios del problema. Disponible para este libro, Enhanced WebAssign es más que un sistema de asignación de tareas; es un
completo sistema de aprendizaje para los estudiantes.
www.FreeLibros.me
Prels_p00i-xvi.qxd
3/12/08
10:17 AM
Page xv
Prefacio
xv
Material de apoyo para el profesor
Este libro cuenta con una serie de recursos para el profesor, los cuales están disponibles en
el inglés y sólo se proporcionan a los docentes que lo adopten como texto en sus cursos.
Para mayor información, póngase en contacto con el área de servicio a clientes en las
siguientes direcciones de correo electrónico:
Cengage Learning México y Centroamérica
Cengage Learning Caribe
Cengage Learning Cono Sur
Cengage Learning Paraninfo
Cengage Learning Pacto Andino
clientes.mexicoca@cengage.com
clientes.caribe@cengage.com
clientes.conosur@cengage.com
clientes.paraninfo@cengage.com
clientes.pactoandino@cengage.com
Los recursos disponibles se encuentran en el sitio web del libro:
http: //latinoamerica.cengage.com/devore
Las direcciones de los sitios web referidas en el texto no son administradas por Cengage
Learning Latinoamérica, por lo que ésta no es responsable de los cambios o actualizaciones
de las mismas.
Reconocimentos
Mis colegas en Cal Poly me proporcionaron apoyo y retroalimentación invaluables durante
el curso de los años. También agradezco a los muchos usuarios de ediciones previas que me
sugirieron mejoras (y en ocasiones errores identificados). Una nota especial de agradecimiento va para Matt Carlton por su trabajo en los dos manuales de soluciones, uno para profesores y el otro para estudiantes. Y me he beneficiado mucho de un diálogo que tuve con Doug
Bates sobre el contenido, aun cuando no siempre he estado de acuerdo con sus muy precavidas sugerencias.
La generosa retroalimentación provista por los siguientes revisores de ésta y previas
ediciones, ha sido de mucha ayuda para mejorar el libro: Robert L. Armacost, University of
Central Florida; Bill Bade, Lincoln Land Community College; Douglas M. Bates, University of Wisconsin-Madison; Michael Berry, West Virginia Wesleyan College; Brian Bowman, Auburn University; Linda Boyle, University of lowa; Ralph Bravaco, Stonehill
College; Linfield C. Brown, Tufts University; Karen M. Bursic, University of Pittsburgh;
Lynne Butler, Haverford College; Raj S. Chhikara, University of Houston-Clear Lake; Edwin Chong, Colorado State University; David Clark, California State Polytechnic University en Pomona; Ken Constantine, Taylor University; David M. Cresap, University of
Portland; Savas Dayanik, Princeton University; Don E. Deal, University of Houston; Annjanette M. Dodd, Humboldt State University; Jimmy Doi, California Polytechnic State University-San Luis Obispo; Charles E. Donaghey, University of Houston; Patrick J. Driscoll,
U.S. Military Academy; Mark Duva, University of Virginia; Nassir Eltinay, Lincoln Land
Community College; Thomas English, College of the Mainland; Nasser S. Fard, Northeastern University; Ronald Fricker, Naval Postgraduate School; Steven T. Garren, James Madison University; Harland Glaz, University of Maryland; Ken Grace, Anoka-Ramsey
Community College; Celso Grebogi, University of Maryland; Veronica Webster Griffis, Michigan Technological University; Jose Guardiola, Texas A&M University-Corpus Christi;
K.L.D. Gunawardena, University of Wisconsin-Oshkosh; James J. Halavin, Rochester
Institute of Technology; James Hartman, Marymount University; Tyler Haynes, Saginaw
Valley State University; Jennifer Hoeting, Colorado State University; Wei-Min Huang,
Lehigh University; Roger W. Johnson, South Dakota School of Mines & Technology; Chihwa Kao, Syracuse University; Saleem A. Kassam, University of Pennsylvania; Mohammad
T. Khasawneh, State University of NewYork-Binghamton; Stephen Kokoska, Colgate University; Sarah Lam, Binghamton University; M. Louise Lawson, Kennesaw State University; Jialiang Li, University of Wisconsin-Madison; Wooi K. Lim, William Paterson
www.FreeLibros.me
Prels_p00i-xvi.qxd
xvi
3/12/08
10:17 AM
Page xvi
Prefacio
University; Aquila Lipscomb, The Citadel; Manuel Lladser, University of Colorado en
Boulder; Graham Lord, University of Califomia-Los Angeles; Joseph L. Macaluso, DeSales
University; Ranjan Maitra, Iowa State University; David Mathiason, Rochester Institute of
Technology; Arnold R. Miller, University of Denver; John J. Millson, University of Maryland; Pamela Kay Miltenberger, West Virginia Wesleyan College; Monica Molsee, Portland
State University; Thomas Moore, Naval Postgraduate School; Robert M. Norton, College of
Charleston; Steven Pilnick, Naval Postgraduate School; Robi Polikar, Rowan University;
Ernest Pyle, Houston Baptist University; Steve Rein, California Polytechnic State University-San Luis Obispo; Tony Richardson, University of Evansville; Don Ridgeway, North
Carolina State University; Larry J. Ringer, Texas A&M University; Robert M. Schumacher, Cedarville University; Ron Schwartz, Florida Atlantic University; Kevan Shafizadeh, California
State University-Sacramento; Robert K. Smidt, California Polytechnic State University-San
Luis Obispo; Alice E. Smith, Auburn University; James MacGregor Smith, University of
Massachusetts; Paul J. Smith, University of Maryland; Richard M. Soland, The George
Washington University; Clifford Spiegelman, Texas A&M University; Jery Stedinger, Cornell University; David Steinberg, Tel Aviv University; William Thistleton, State University
of New York Institute of Technology; G. Geoffrey Vining, University of Florida; Bhutan
Wadhwa, Cleveland State University; Elaine Wenderholm, State University of New YorkOswego; Samuel P. Wilcock, Messiah College; Michael G. Zabetakis, University of Pittsburgh y Maria Zack, Point Loma Nazarene University.
Gracias a Merrill Peterson y sus colegas en Matrix Productions por hacer el proceso de producción lo menos embarazoso posible. Una vez más me siento obligado a expresar
mi gratitud a todas las personas que han hecho importantes contribuciones a lo largo de siete ediciones del libro. En particular, Carolyn Crockett ha sido tanto una editora de primera
clase como una buena amiga. Jennifer Risden, Joseph Rogove, Ann Day, Elizabeth Gershman y Ashley Summers merecen una mención especial por sus recientes esfuerzos. También
deseo extender mi aprecio a los cientos de representantes de ventas quienes durante los últimos 20 años han predicado hábilmente el evangelio sobre este libro y otros que he escrito. Por último pero no menos importante, un sincero agradecimiento a mi esposa Carol por
tolerar mi programa de trabajo y mis frecuentes y demasiadas quejas a lo largo de mi carrera de escritor.
Jay Devore
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
1
Page 1
Generalidades y
estadística descriptiva
INTRODUCCIÓN
Los conceptos y métodos estadísticos no son sólo útiles sino que con frecuencia son indispensables para entender el mundo que nos rodea. Proporcionan formas de obtener
ideas nuevas del comportamiento de muchos fenómenos que se presentarán en su
campo de especialización escogido en ingeniería o ciencia.
La disciplina de estadística nos enseña cómo realizar juicios inteligentes y tomar
decisiones informadas entre la presencia de incertidumbre y variación. Sin incertidumbre y variación, habría poca necesidad de métodos estadísticos o de profesionales
en estadística. Si cada componente de un tipo particular tuviera exactamente la misma duración, si todos los resistores producidos por un fabricante tuvieran el mismo
valor de resistencia, si las determinaciones del pH en muestras de suelo de un lugar
particular dieran resultados idénticos, y así sucesivamente, entonces una sola observación revelaría toda la información deseada.
Una importante manifestación de variación surge en el curso de la medición de
emisiones en vehículos automotores. Los requerimientos de costo y tiempo del Federal Test Procedure (FTP, por sus siglas en inglés) impiden su uso generalizado en programas de inspección de vehículos. En consecuencia, muchas agencias han creado
pruebas menos costosas y más rápidas, las que se espera reproduzcan los resultados
obtenidos con el FTP. De acuerdo con el artículo “Motor Vehicle Emissions Variability” (J. of the Air and Waste Mgmt. Assoc., 1996: 667-675), la aceptación del FTP
como patrón de oro ha llevado a la creencia ampliamente difundida de que las mediciones repetidas en el mismo vehículo conducirían a resultados idénticos (o casi
idénticos). Los autores del artículo aplicaron el FTP a siete vehículos caracterizados
como “altos emisores”. He aquí los resultados de uno de los vehículos.
HC (g/milla)
13.8
18.3
32.2
32.5
CO (g/milla)
118
149
232
236
1
www.FreeLibros.me
c1_p001-045.qxd
2
3/12/08
CAPÍTULO 1
2:31 AM
Page 2
Generalidades y estadística descriptiva
La variación sustancial en las mediciones tanto de HC como de CO proyecta una duda considerable sobre la sabiduría convencional y hace mucho más difícil realizar evaluaciones precisas sobre niveles de emisiones.
¿Cómo se pueden utilizar técnicas estadísticas para reunir información y sacar
conclusiones? Supóngase, por ejemplo, que un ingeniero de materiales inventó un recubrimiento para retardar la corrosión en tuberías de metal en circunstancias específicas. Si este recubrimiento se aplica a diferentes segmentos de la tubería, la variación de
las condiciones ambientales y de los segmentos mismos producirá más corrosión sustancial en algunos segmentos que en otros. Se podría utilizar un análisis estadístico en
datos de dicho experimento para decidir si la cantidad promedio de corrosión excede
un límite superior especificado de alguna clase o para predecir cuánta corrosión ocurrirá en una sola pieza de tubería.
Por otra parte, supóngase que el ingeniero inventó el recubrimiento con la creencia de que será superior al recubrimiento actualmente utilizado. Se podría realizar un
experimento comparativo para investigar esta cuestión aplicando el recubrimiento actual a algunos segmentos de la tubería y el nuevo a otros segmentos. Esto debe realizarse con cuidado o se obtendrá una conclusión errónea. Por ejemplo, tal vez la
cantidad promedio de corrosión sea idéntica con los dos recubrimientos. Sin embargo,
el recubrimiento nuevo puede ser aplicado a segmentos que tengan una resistencia superior a la corrosión y en condiciones ambientales severas en comparación con los segmentos y condiciones del recubrimiento actual. El investigador probablemente observaría
entonces una diferencia entre los dos recubrimientos atribuibles no a los recubrimientos mismos, sino sólo a variaciones extrañas. La estadística ofrece no sólo métodos para
analizar resultados de experimentos una vez que se han realizado sino también sugerencias sobre cómo pueden realizarse los experimentos de una manera eficiente para
mitigar los efectos de variación y tener una mejor oportunidad de llegar a conclusiones
correctas.
1.1 Poblaciones, muestras y procesos
Los ingenieros y científicos constantemente están expuestos a la recolección de hechos o
datos, tanto en sus actividades profesionales como en sus actividades diarias. La disciplina
de estadística proporciona métodos de organizar y resumir datos y de sacar conclusiones basadas en la información contenida en los datos.
Una investigación típicamente se enfocará en una colección bien definida de objetos
que constituyen una población de interés. En un estudio, la población podría consistir de
todas las cápsulas de gelatina de un tipo particular producidas durante un periodo específico. Otra investigación podría implicar la población compuesta de todos los individuos que
recibieron una licenciatura de ingeniería durante el año académico más reciente. Cuando la
información deseada está disponible para todos los objetos de la población, se tiene lo que
se llama un censo. Las restricciones de tiempo, dinero y otros recursos escasos casi siempre hacen que un censo sea impráctico o infactible. En su lugar, se selecciona un subconjunto de la población, una muestra, de manera prescrita. Así pues, se podría obtener una
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
Page 3
1.1 Poblaciones, muestras y procesos
3
muestra de cojinetes de una corrida de producción particular como base para investigar si
los cojinetes se ajustan a las especificaciones de fabricación, o se podría seleccionar una
muestra de los graduados de ingeniería del último año para obtener retroalimentación sobre
la calidad de los programas de estudio de ingeniería.
Por lo general, existe interés sólo en ciertas características de los objetos en una población: el número de grietas en la superficie de cada recubrimiento, el espesor de cada pared de cápsula, el género de un graduado de ingeniería, la edad a la cual el individuo se
graduó, y así sucesivamente. Una característica puede ser categórica, tal como el género o
tipo de funcionamiento defectuoso o puede ser de naturaleza numérica. En el primer caso,
el valor de la característica es una categoría (p. ej., femenino o soldadura insuficiente),
mientras que en el segundo caso, el valor es un número (p. ej., edad 23 años o diámetro
0.502 cm). Una variable es cualquier característica cuyo valor puede cambiar de un objeto a otro en la población. Inicialmente las letras minúsculas del alfabeto denotarán las variables. Algunos ejemplos incluyen:
x marca de la calculadora de un estudiante
y número de visitas a un sitio web particular durante un periodo específico
z distancia de frenado de un automóvil en condiciones específicas
Se obtienen datos al observar o una sola variable o en forma simultánea dos o más variables. Un conjunto de datos univariantes se compone de observaciones realizadas en una sola variable. Por ejemplo, se podría determinar el tipo de transmisión automática (A) o
manual (M) en cada uno de diez automóviles recientemente adquiridos en cierto concesionario y el resultado sería el siguiente conjunto de datos categóricos
M A A A M A A M A A
La siguiente muestra de duraciones (horas) de baterías D puestas en cierto uso es un conjunto de datos numéricos univariantes:
5.6
5.1
6.2
6.0
5.8
6.5
5.8
5.5
Se tienen datos bivariantes cuando se realizan observaciones en cada una de dos variables.
El conjunto de datos podría consistir en un par (altura, peso) por cada jugador integrante del
equipo de básquetbol, con la primera observación como (72, 168), la segunda como (75,
212), y así sucesivamente. Si un ingeniero determina el valor tanto de x componente de
duración y y razón de la falla del componente, el conjunto de datos resultante es bivariante con una variable numérica y la otra categórica. Los datos multivariantes surgen cuando
se realizan observaciones en más de una variable (por lo que bivariante es un caso especial
de multivariante). Por ejemplo, un médico investigador podría determinar la presión sanguínea sistólica, la presión sanguínea diastólica y nivel de colesterol en suero de cada paciente participante en un estudio. Cada observación sería un triple de números, tal como (120,
80, 146). En muchos conjuntos de datos multivariantes, algunas variables son numéricas
y otras son categóricas. Por lo tanto, el número anual dedicado al automóvil de Consumer
Reports da valores de tales variables como tipo de vehículo (pequeño, deportivo, compacto,
tamaño mediano, grande), eficiencia de consumo de combustible en la ciudad (mpg), eficiencia de consumo de combustible en carretera (mpg), tipo de tren motriz (ruedas traseras,
ruedas delanteras, cuatro ruedas), etcétera.
Ramas de la estadística
Es posible que un investigador que ha recopilado datos desee resumir y describir características importantes de los mismos. Esto implica utilizar métodos de estadística descriptiva.
Algunos de ellos son de naturaleza gráfica; la construcción de histogramas, diagramas de
caja y gráficas de puntos son ejemplos primordiales. Otros métodos descriptivos implican
www.FreeLibros.me
4
3/12/08
CAPÍTULO 1
2:31 AM
Page 4
Generalidades y estadística descriptiva
el cálculo de medidas numéricas, tales como medias, desviaciones estándar y coeficientes
de correlación. La amplia disponibilidad de programas de computadora estadísticos han hecho que estas tareas sean más fáciles de realizar de lo que antes eran. Las computadoras son
mucho más eficientes que los seres humanos para calcular y crear imágenes (¡una vez que
han recibido las instrucciones apropiadas del usuario!). Esto significa que el investigador no
tiene que esforzarse mucho en el “trabajo tedioso” y tendrá más tiempo para estudiar los datos y extraer mensajes importantes. A lo largo de este libro, se presentarán los datos de salida de varios paquetes tales como MINITAB, SAS, S-Plus y R. El programa R puede ser
descargado sin cargo del sitio http://www.r-project.org.
Ejemplo 1.1
La tragedia que sufrió el transbordador espacial Challenger y sus astronautas en 1986 condujo a varios estudios para investigar las razones de la falla de la misión. La atención se enfocó de inmediato en el comportamiento de los sellos anulares del motor del cohete. He aquí
datos derivados de observaciones en x temperatura del sello anular (°F) en cada encendido de prueba o lanzamiento del motor del cohete del transbordador (Presidential Commission on the Space Shuttle Challenger Accident, Vol. 1, 1986: 129-131).
84
68
53
49
60
67
61
67
75
40
72
61
83
73
70
67
70
81
45
57
76
66
63
79
70
70
75
69
78
76
80
52
58
58
67
31
Sin organización, es difícil tener una idea de cuál podría ser una temperatura típica o representativa, ya sea que los valores estén muy concentrados en torno a un valor típico o bastante esparcidos, ya sea que existan brechas en los datos, qué porcentaje de los valores están en
los 60, y así sucesivamente. La figura 1.1 muestra lo que se conoce como gráfica de tallo y
hojas de los datos, así como también un histograma. En breve, se discutirá la construcción
e interpretación de estos resúmenes gráficos; por el momento se espera que se vea cómo están distribuidos los valores de temperatura a lo largo de la escala de medición. Algunos de
estos lanzamientos/encendidos fueron exitosos y otros fallaron.
Tallo y hojas de temperatura N 36
Unidad de hojas 1.0
1
3
1
1
3
2
4
0
4
4
59
6
5
23
9
5
788
13
6
0113
(7)
6
6777789
16
7
000023
10
7
556689
4
8
0134
40
30
Porcentaje
c1_p001-045.qxd
20
10
0
25
35
45
55
65
75
85
Temperatura
Figura 1.1 Una gráfica de tallo y hojas e histograma generados con MINITAB de los datos
de temperatura de los sellos anulares.
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
Page 5
1.1 Poblaciones, muestras y procesos
5
La temperatura más baja es de 31 grados, mucho más baja que la siguiente temperatura más
baja y ésta es la observación en relación con el desastre del Challenger. La investigación
presidencial descubrió que se requerían temperaturas calientes para la operación exitosa de
los sellos anulares y que 31 grados eran demasiado frío. En el capítulo 13 se presentará una
relación entre temperatura y la probabilidad de un lanzamiento exitoso.
■
Después de haber obtenido una muestra de una población, un investigador con frecuencia desearía utilizar la información muestral para sacar algún tipo de conclusión (hacer
una inferencia de alguna clase) con respecto a la población. Es decir, la muestra es un medio para llegar a un fin en lugar de un fin por sí misma. Las técnicas para generalizar desde
una muestra hasta una población se congregan dentro de la rama de la disciplina llamada estadística inferencial.
Ejemplo 1.2
Las investigaciones de resistencia de materiales constituyen una rica área de aplicación de
métodos estadísticos. El artículo “Effects of Aggregates and Microfillers on the Flexural
Properties of Concrete” (Magazine of Concrete Research, 1997: 81-98) reportó sobre un estudio de propiedades de resistencia de concreto de alto desempeño obtenido con el uso de
superplastificantes y ciertos aglomerantes. La resistencia a la compresión de dicho concreto previamente había sido investigada, pero no se sabía mucho sobre la resistencia a la flexión (una medida de la capacidad de resistir fallas a flexión). Los datos anexos sobre
resistencia a la flexión (en megapascales, MPa, donde 1 Pa (pascal) 1.45 104 lb/pulg2)
aparecieron en el artículo citado:
5.9
8.2
7.2
8.7
7.3
7.8
6.3
9.7
8.1
7.4
6.8
7.7
7.0
9.7
7.6
7.8
6.8
7.7
6.5
11.6
7.0
11.3
6.3
11.8
7.9
10.7
9.0
Supóngase que se desea estimar el valor promedio de resistencia a la flexión de todas las vigas que pudieran ser fabricadas de esta manera (si se conceptualiza una población de todas
esas vigas, se trata de estimar la media poblacional). Se puede demostrar que, con un alto grado de confianza, la resistencia media de la población se encuentra entre 7.48 MPa y 8.80 MPa;
esto se llama intervalo de confianza o estimación de intervalo. Alternativamente, se podrían
utilizar estos datos para predecir la resistencia a la flexión de una sola viga de este tipo. Con
un alto grado de confianza, la resistencia de una sola viga excederá de 7.35 MPa; el número 7.35 se conoce como límite de predicción inferior.
■
El objetivo principal de este libro es presentar e ilustrar métodos de estadística inferencial que son útiles en el trabajo científico. Los tipos más importantes de procedimientos
inferenciales, estimación puntual, comprobación de hipótesis y estimación por medio de intervalos de frecuencia, se introducen en los capítulos 6 a 8 y luego se utilizan escenarios más
complicados en los capítulos 9 a 16. El resto de este capítulo presenta métodos de estadística descriptiva que se utilizan mucho en el desarrollo de inferencia.
Los capítulos 2 a 5 presentan material de la disciplina de probabilidad. Este material
finalmente tiende un puente entre las técnicas descriptivas e inferenciales. El dominio de la probabilidad permite entender mejor cómo se desarrollan y utilizan los procedimientos inferenciales, cómo las conclusiones estadísticas pueden ser traducidas al lenguaje diario e interpretadas
y cuándo y dónde pueden ocurrir errores al aplicar los métodos. La probabilidad y estadística se
ocupan de cuestiones que implican poblaciones y muestras, pero lo hacen de una “manera inversa” una con respecto a la otra.
En un problema de probabilidad, se supone que las propiedades de la población estudiada son conocidas (p. ej., en una población numérica, se puede suponer una cierta distribución específica de valores de la población) y se pueden plantear y responder preguntas
con respecto a una muestra tomada de una población. En un problema de estadística, el experimentador dispone de las características de una muestra y esta información le permite sacar conclusiones con respecto a la población. La relación entre las dos disciplinas se resume
diciendo que la probabilidad discurre de la población a la muestra (razonamiento deductivo),
www.FreeLibros.me
c1_p001-045.qxd
6
3/12/08
CAPÍTULO 1
2:31 AM
Page 6
Generalidades y estadística descriptiva
Probabilidad
Muestra
Población
Estadística
inferencial
Figura 1.2
Relación entre probabilidad y estadística inferencial.
mientras que la estadística inferencial discurre de la muestra a la población (razonamiento
inductivo). Esto se ilustra en la figura 1.2.
Antes de que se pueda entender lo que una muestra particular pueda decir sobre la población, primero se deberá entender la incertidumbre asociada con la toma de una muestra
de una población dada. Por eso se estudia la probabilidad antes que la estadística.
Como un ejemplo del enfoque contrastante de la probabilidad y la estadística inferencial, el uso que los conductores hacen de los cinturones de seguridad manuales de regazo
en carros equipados con sistemas de cinturones de hombro automáticos. (El artículo “Automobile Seat Belts: Usage Patterns in Automatic Belt Systems”, Human Factors, 1998:
126-135, resume datos de uso.) Se podría suponer que probablemente 50% de todos los conductores de carros equipados de esta forma en cierta área metropolitana utilizan de manera
regular su cinturón de regazo (una suposición sobre la población), así que se podría preguntar, “¿qué tan probable es que una muestra de 100 conductores incluirá por lo menos 70 que
regularmente utilicen su cinturón de regazo?” o “¿cuántos de los conductores en una muestra de tamaño 100 se puede esperar que utilicen con regularidad su cinturón de regazo?” Por
otra parte, en estadística inferencial se dispone de información sobre la muestra; por ejemplo, una muestra de 100 conductores de tales vehículos reveló que 65 utilizan con regularidad su cinturón de regazo. Se podría entonces preguntar: “¿proporciona esto evidencia
sustancial para concluir que más de 50% de todos los conductores en esta área utilizan con
regularidad su cinturón de regazo?” En el último escenario, se intenta utilizar la información relativa a la muestra para responder una pregunta acerca de la estructura de toda la población de la cual se seleccionó la muestra.
En el ejemplo del cinturón de regazo, la población está bien definida y concreta: todos
los conductores de carros equipados de una cierta manera en un área metropolitana particular. En el ejemplo 1.1, sin embargo, una muestra de temperaturas de sello anular está disponible, pero proviene de una población que en realidad no existe. En su lugar, conviene pensar
en la población como compuesta de todas las posibles mediciones de temperatura que se podrían hacer en condiciones experimentales similares. Tal población se conoce como población conceptual o hipotética. Existen varias situaciones en las cuales las preguntas encajan
en el marco de referencia de la estadística inferencial al conceptualizar una población.
Estudios enumerativos contra analíticos
W. E. Deming, estadístico estadounidense muy influyente quien fue una fuerza propulsora
en la revolución de calidad de Japón durante las décadas de 1950 y 1960, introdujo la distinción entre estudios enumerativos y estudios analíticos. En los primeros, el interés se enfoca en un conjunto de individuos u objetos finito, identificable y no cambiante que
conforman una población. Un marco de muestreo, es decir, una lista de los individuos u objetos que tienen que ser muestreados, está disponible para un investigador o puede ser construida. Por ejemplo, el marco se podría componer de todas las firmas incluidas en una
petición para calificar una cierta iniciativa para las boletas de votación en una elección próxima; por lo general se elige una muestra para indagar si el número de firmas válidas sobrepasa un valor especificado. Como otro ejemplo, el marco puede contener números de serie
de todos los hornos fabricados por una compañía particular durante cierto periodo; se puede
seleccionar una muestra para inferir algo sobre la duración promedio de estas unidades. El
uso de métodos inferenciales presentados en este libro es razonablemente no controversial
en tales escenarios (aun cuando los estadísticos continúan argumentando sobre qué métodos
particulares deben ser utilizados).
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
Page 7
1.1 Poblaciones, muestras y procesos
7
Un estudio analítico se define ampliamente como uno que no es de naturaleza enumerativa. Tales estudios a menudo se realizan con el objetivo de mejorar un producto futuro al
actuar sobre un proceso de una cierta clase (p. ej., recalibrar equipo o ajustar el nivel de alguna sustancia tal como la cantidad de un catalizador). A menudo se obtienen datos sólo
sobre un proceso existente, uno que puede diferir en aspectos importantes del proceso futuro. No existe por lo tanto un marco de muestreo que enliste los individuos u objetos de interés. Por ejemplo, una muestra de cinco turbinas con un nuevo diseño puede ser fabricada
y probada para investigar su eficiencia. Estas cinco podrían ser consideradas como una
muestra de la población conceptual de todos los prototipos que podrían ser fabricados en
condiciones similares, pero no necesariamente representativas de la población de las unidades fabricadas una vez que la producción futura esté en proceso. Los métodos para utilizar
la información sobre muestras para sacar conclusiones sobre unidades de producción futuras pueden ser problemáticos. Se deberá llamar a alguien con los conocimientos necesarios
en el área del diseño e ingeniería de turbinas (o de cualquier otra área pertinente) para que
juzgue si tal extrapolación es sensible. Una buena exposición de estos temas se encuentra
en el artículo “Assumptions for Statistical Inference”, de Gerald Hahn y William Meeker
(The American Statistician, 1993: 1-11).
Recopilación de datos
La estadística se ocupa no sólo de la organización y análisis de datos una vez que han sido
recopilados sino también con el desarrollo de técnicas de recopilación de datos. Si éstos no
son apropiadamente recopilados, un investigador no puede ser capaz de responder las preguntas consideradas con un razonable grado de confianza. Un problema común es que la población objetivo, aquella sobre la cual se van a sacar conclusiones, puede ser diferente de la
población realmente muestreada. Por ejemplo, a los publicistas les gustaría contar con varias clases de información sobre los hábitos de ver televisión de sus clientes potenciales. La
información más sistemática de esta clase proviene de colocar dispositivos de monitoreo en
un pequeño número de casas a través de Estados Unidos. Se ha conjeturado que la colocación de semejantes dispositivos por sí misma modifica el comportamiento del televidente,
de modo que las características de la muestra pueden ser diferentes de aquellas de la población objetivo.
Cuando la recopilación de datos implica seleccionar individuos u objetos de un marco, el método más simple para garantizar una selección representativa es tomar una muestra aleatoria simple. Ésta es una para la cual cualquier subconjunto particular del tamaño
especificado (p. ej., una muestra de tamaño 100) tiene la misma oportunidad de ser seleccionada. Por ejemplo, si el marco se compone de 1 000 000 de números de serie, los números 1, 2, . . . , hasta 1 000 000 podrían ser anotados en trozos idénticos de papel. Después de
colocarlos en una caja y mezclarlos perfectamente, se sacan uno por uno hasta que se obtenga el tamaño de muestra requisito. De manera alternativa (y mucho más preferible), se
podría utilizar una tabla de números aleatorios o un generador de números aleatorios de
computadora.
En ocasiones se pueden utilizar métodos de muestreo alternativos para facilitar el proceso de selección, a fin de obtener información extra o para incrementar el grado de confianza en conclusiones. Un método como ése, el muestreo estratificado, implica separar las
unidades de la población en grupos no traslapantes y tomar una muestra de cada uno. Por
ejemplo, un fabricante de reproductores de DVD podría desear información sobre la satisfacción del cliente para unidades producidas durante el año previo. Si tres modelos diferentes fueran fabricados y vendidos, se podría seleccionar una muestra distinta de cada uno de
los estratos correspondientes. Esto daría información sobre los tres modelos y garantizaría
que ningún modelo estuviera sobre o subrepresentado en toda la muestra.
Con frecuencia, se obtiene una muestra de “conveniencia” seleccionando individuos u
objetos sin aleatorización sistemática. Por ejemplo, un conjunto de ladrillos puede ser apilado
www.FreeLibros.me
c1_p001-045.qxd
8
3/12/08
CAPÍTULO 1
2:31 AM
Page 8
Generalidades y estadística descriptiva
de tal modo que sea extremadamente difícil seleccionar a los que se encuentran en el centro. Si los ladrillos localizados en la parte superior y a los lados de la pila fueran de algún
modo diferentes a los demás, los datos muestrales resultantes no representarían la población. A menudo un investigador supondrá que tal muestra de conveniencia representa en forma aproximada una muestra aleatoria, en cuyo caso el repertorio de métodos inferenciales
de un estadístico puede ser utilizado; sin embargo, ésta es una cuestión de criterio. La mayoría de los métodos aquí analizados se basan en una variación del muestreo aleatorio simple descrito en el capítulo 5.
Los ingenieros y científicos a menudo reúnen datos realizando alguna clase de experimento. Esto puede implicar cómo asignar varios tratamientos diferentes (tales como fertilizantes o recubrimientos anticorrosivos) a las varias unidades experimentales (parcelas o
tramos de tubería). Por otra parte, un investigador puede variar sistemáticamente los niveles
o categorías de ciertos factores (p. ej., presión o tipo de material aislante) y observar el efecto en alguna variable de respuesta (tal como rendimiento de un proceso de producción).
Ejemplo 1.3
Un artículo en el New York Times (27 de enero de 1987) reportó que el riesgo de sufrir un
ataque cardiaco podría ser reducido tomando aspirina. Esta conclusión se basó en un experimento diseñado que incluía tanto un grupo de control de individuos que tomaron un
placebo que tenía la apariencia de aspirina pero que se sabía era inerte y un grupo de tratamiento que tomó aspirina de acuerdo con un régimen específico. Los sujetos fueron
asignados al azar a los grupos para protegerlos contra cualquier prejuicio de modo que se
pudieran utilizar métodos basados en la probabilidad para analizar los datos. De los
11 034 individuos en el grupo de control, 189 subsecuentemente experimentaron ataques
cardiacos, mientras que sólo 104 de los 11 037 en el grupo de aspirina sufrieron un ataque cardiaco. La tasa de incidencia de ataques cardiacos en el grupo de tratamiento fue de
sólo aproximadamente la mitad de aquella en el grupo de control. Una posible explicación de este resultado es la variación de la probabilidad, que la aspirina en realidad no tiene el efecto deseado y la diferencia observada es sólo una variación típica del mismo
modo que el lanzamiento al aire de dos monedas idénticas por lo general produciría diferente cantidad de águilas. No obstante, en este caso, los métodos inferenciales sugieren
que la variación de la probabilidad por sí misma no puede explicar en forma adecuada la
magnitud de la diferencia observada.
■
Ejemplo 1.4
Un ingeniero desea investigar los efectos tanto del tipo de adhesivo como del material conductor en la fuerza adhesiva cuando se monta un circuito integrado (CI) sobre cierto sustrato. Se consideraron dos tipos de adhesivos y dos materiales conductores. Se realizaron dos
observaciones por cada combinación de tipo de adhesivo/material conductor y se obtuvieron los datos anexos.
Tipo de adhesivo
1
1
2
2
Material conductor
Fuerza de adhesión observada
Promedio
1
2
1
2
82, 77
75, 87
84, 80
78, 90
79.5
81.0
82.0
84.0
Las fuerzas adhesivas promedio resultantes se ilustran en la figura 1.3. Parece que el adhesivo tipo 2 mejora la fuerza adhesiva en comparación con el tipo 1 en aproximadamente la
misma cantidad siempre que se utiliza uno de los materiales conductores, con la combinación 2, 2 como la mejor. De nuevo se pueden utilizar métodos inferenciales para juzgar si
estos efectos son reales o simplemente se deben a la variación de la probabilidad.
Supóngase además que se consideran dos tiempos de curado y también dos tipos de
posrecubrimientos de los circuitos integrados. Existen entonces 2 ? 2 ? 2 ? 2 16 combinaciones de estos cuatro factores y es posible que el ingeniero no disponga de suficientes
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
Page 9
1.1 Poblaciones, muestras y procesos
Fuerza
promedio
85
9
Adhesivo tipo 2
Adhesivo tipo 1
80
1
Figura 1.3
2
Material conductor
Fuerzas de adhesión promedio en el ejemplo 1.4.
recursos para hacer incluso una observación sencilla para cada una de estas combinaciones.
En el capítulo 11 se verá cómo la selección cuidadosa de una fracción de estas posibilidades usualmente dará la información deseada.
■
EJERCICIOS
Sección 1.1 (1-9)
1. Dé una posible muestra de tamaño 4 de cada una de las siguientes poblaciones.
a. Todos los periódicos publicados en Estados Unidos.
b. Todas las compañías listadas en la Bolsa de Valores de
Nueva York.
c. Todos los estudiantes en su colegio o universidad.
d. Todas las calificaciones promedio de los estudiantes en su
colegio o universidad.
2. Para cada una de las siguientes poblaciones hipotéticas, dé
una muestra posible de tamaño 4.
a. Todas las distancias que podrían resultar cuando usted lanza un balón de fútbol americano.
b. Las longitudes de las páginas de libros publicados de aquí
a 5 años.
c. Todas las mediciones de intensidades posibles de terremotos (escala de Richter) que pudieran registrarse en California durante el siguiente año.
d. Todos los posibles rendimientos (en gramos) de una cierta
reacción química realizada en un laboratorio.
3. Considere la población compuesta de todas las computadoras de
una cierta marca y modelo y enfóquese en si una computadora
necesita servicio mientras se encuentra dentro de la garantía.
a. Plantee varias preguntas de probabilidad con base en la selección de 100 de esas computadoras.
b. ¿Qué pregunta de estadística inferencial podría ser respondida determinando el número de dichas computadoras en una
muestra de tamaño 100 que requieren servicio de garantía?
4. a. Dé tres ejemplos diferentes de poblaciones concretas y tres
ejemplos distintos de poblaciones hipotéticas.
b. Por cada una de sus poblaciones concretas e hipotéticas, dé
un ejemplo de una pregunta de probabilidad y un ejemplo
de pregunta de estadística inferencial.
5. Muchas universidades y colegios han instituido programas de
instrucción suplementaria (IS), en los cuales un facilitador regularmente se reúne con un pequeño grupo de estudiantes
inscritos en el curso para promover discusiones sobre el material incluido en el curso y mejorar el dominio de la materia.
Suponga que los estudiantes inscritos en un largo curso de estadística (¿de qué más?) se dividen al azar en un grupo de
control que no participará en la instrucción suplementaria y
en un grupo de tratamiento que sí participará. Al final del curso, se determina la calificación total de cada estudiante en el
curso.
a. ¿Son las calificaciones del grupo IS una muestra de una
población existente? De ser así, ¿cuál es? De no ser así,
¿cuál es la población conceptual pertinente?
b. ¿Cuál piensa que es la ventaja de dividir al azar a los estudiantes en los dos grupos en lugar de permitir que cada
estudiante elija el grupo al que desea unirse?
c. ¿Por qué los investigadores no pusieron a todos los estudiantes en el grupo de tratamiento? Nota: El artículo
(“Supplemental Instruction: An Effective Component of
Student Affairs Programming”, J. of College Student Devel., 1997:577-586) discute el análisis de datos de varios
programas de instrucción suplementaria.
6. El sistema de la Universidad Estatal de California (CSU, por
sus siglas en inglés) consta de 23 terrenos universitarios, desde la Estatal de San Diego en el sur hasta la Estatal Humboldt
cerca de la frontera con Oregon. Un administrador de CSU
desea hacer una inferencia sobre la distancia promedio entre
la ciudad natal y sus terrenos universitarios. Describa y discuta
diferentes métodos de muestreo, que pudieran ser empleados.
¿Éste sería un estudio enumerativo o un estudio analítico?
Explique su razonamiento.
7. Cierta ciudad se divide naturalmente en diez distritos. ¿Cómo
podría seleccionar un valuador de bienes raíces una muestra
de casas unifamiliares que pudiera ser utilizada como base
para desarrollar una ecuación para predecir el valor estimado
a partir de características tales como antigüedad, tamaño, número de baños, distancia a la escuela más cercana y así sucesivamente? ¿El estudio es enumerativo o analítico?
www.FreeLibros.me
c1_p001-045.qxd
10
3/12/08
CAPÍTULO 1
2:31 AM
Page 10
Generalidades y estadística descriptiva
8. La cantidad de flujo a través de una válvula solenoide en el
sistema de control de emisiones de un automóvil es una característica importante. Se realizó un experimento para estudiar cómo la velocidad de flujo dependía de tres factores: la
longitud de la armadura, la fuerza del resorte y la profundidad
de la bobina. Se eligieron dos niveles diferentes (alto y bajo) de
cada factor y se realizó una sola observación del flujo por cada combinación de niveles.
a. ¿De cuántas observaciones consistió el conjunto de datos
resultante?
b. ¿Este estudio es enumerativo o analítico? Explique su razonamiento.
9. En un famoso experimento realizado en 1882, Michelson y
Newcomb obtuvieron 66 observaciones del tiempo que requería la luz para viajar entre dos lugares en Washington,
D.C. Algunas de las mediciones (codificadas en cierta manera) fueron, 31, 23, 32, 36, 2, 26, 27 y 31.
a. ¿Por qué no son idénticas estas mediciones?
b. ¿Es éste un estudio enumerativo? ¿Por qué sí o por qué
no?
1.2 Métodos pictóricos y tabulares
en la estadística descriptiva
La estadística descriptiva se divide en dos temas generales. En esta sección, se considera la
representación de un conjunto de datos por medio de técnicas visuales. En las secciones 1.3
y 1.4, se desarrollarán algunas medidas numéricas para conjuntos de datos. Es posible que
usted ya conozca muchas técnicas visuales; tablas de frecuencia, hojas de contabilidad, histogramas, gráficas de pastel, gráficas de barras, diagramas de puntos y similares. Aquí se seleccionan algunas de estas técnicas que son más útiles y pertinentes a la estadística de
probabilidad e inferencial.
Notación
Alguna notación general facilitará la aplicación de métodos y fórmulas a una amplia variedad de problemas prácticos. El número de observaciones en una muestra única, es decir, el
tamaño de muestra, a menudo será denotado por n, de modo que n 4 para la muestra de
universidades {Stanford, Iowa State, Wyoming, Rochester} y también para la muestra
de lecturas de pH {6.3, 6.2, 5.9, 6.5}. Si se consideran dos muestras al mismo tiempo, m y
n o n1 y n2 se pueden utilizar para denotar los números de observaciones. Por lo tanto, si
{29.7, 31.6, 30.9} y {28.7, 29.5, 29.4, 30.3} son lecturas de eficiencia térmica de dos tipos
diferentes de motores diesel, entonces m 3 y n 4.
Dado un conjunto de datos compuesto de n observaciones de alguna variable x, entonces x1, x2, x3, . . . , xn denotarán las observaciones individuales. El subíndice no guarda ninguna relación con la magnitud de una observación particular. Por lo tanto, x1 en general no
será la observación más pequeña del conjunto, ni xn será la más grande. En muchas aplicaciones, x1 será la primera observación realizada por el experimentador, x2 la segunda, y así
sucesivamente. La observación i-ésima del conjunto de datos será denotada por xi.
Gráficas de tallos y hojas
Considérese un conjunto de datos numéricos x1, x2, . . . , xn para el cual xi se compone de
por lo menos dos dígitos. Una forma rápida de obtener la representación visual informativa
del conjunto de datos es construir una gráfica de tallos y hojas.
Pasos para construir una gráfica de tallos y hojas
1. Seleccione uno o más de los primeros dígitos para los valores de tallo. Los segundos dígitos se convierten en hojas.
2. Enumere los posibles valores de tallos en una columna vertical.
3. Anote la hoja para cada observación junto al valor de tallo.
4. Indique las unidades para tallos y hojas en algún lugar de la gráfica.
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
Page 11
1.2 Métodos pictóricos y tabulares en la estadística descriptiva
11
Si el conjunto de datos se compone de calificaciones de exámenes, cada uno entre 0 y 100,
la calificación de 83 tendría un tallo de 8 y una hoja de 3. Para un conjunto de datos de eficiencias de consumo de combustible de automóviles (mpg), todas entre 8.1 y 47.8, se podrían utilizar como el tallo, así que 32.6 tendría entonces una hoja de 2.6. En general, se
recomienda una gráfica basada en tallos entre 5 y 20.
Ejemplo 1.5
El consumo de alcohol por parte de estudiantes universitarios preocupa no sólo a la comunidad académica sino también, a causa de consecuencias potenciales de salud y seguridad,
a la sociedad en su conjunto. El artículo (“Health and Behavioral Consequences of Binge
Drinking in College”, J. of the Amer. Med. Assoc., 1994: 1672-1677) presentó un amplio estudio sobre el consumo excesivo de alcohol en universidades a través de Estados Unidos.
Un episodio de parranda se definió como cinco o más tragos en fila para varones y cuatro o
más para mujeres. La figura 1.4 muestra una gráfica de tallo y hojas de 140 valores de x
porcentaje de edades de los estudiantes de licenciatura bebedores. (Estos valores no aparecieron en el artículo citado, pero la gráfica concuerda con una gráfica de los datos que sí lo
hicieron.)
0
1
2
3
4
5
6
Figura 1.4
4
1345678889
1223456666777889999
0112233344555666677777888899999
111222223344445566666677788888999
00111222233455666667777888899
01111244455666778
Tallo: dígitos de diez cifras
Hojas: dígitos de una cifra
Gráfica de tallo y hojas de porcentajes de bebedores en cada una de 140 universidades.
La primera hoja de la fila 2 del tallo es 1, la cual dice que 21% de los estudiantes de
una de las universidades de la muestra eran bebedores. Sin la identificación de los dígitos
en los tallos y los dígitos en las hojas, no se sabría si la observación correspondiente al tallo 2, hoja 1 debería leerse como 21%, 2.1% o 0.21 por ciento.
Cuando se crea una imagen a mano, la ordenación de las hojas de la más pequeña a
la más grande en cada línea puede ser tediosa. Esta ordenación contribuye poco si no se dispone de información adicional. Supóngase que las observaciones hubieran sido puestas en
lista en orden alfabético por nombre de la escuela, como
16% 33% 64% 37% 31% . . .
Entonces la colocación de estos valores en la gráfica en este orden haría que la fila 1 del tallo tuviera 6 como su primera hoja y el principio de la fila 3 del tallo sería
3 ° 371 . . .
La gráfica sugiere que un valor típico o representativo se encuentra en la fila 4 del tallo, tal vez en el rango medio de 40%. Las observaciones no aparecen muy concentradas en
torno a este valor típico, como sería el caso si todos los valores estuvieran entre 20 y 49%.
Esta gráfica se eleva a una sola cresta a medida que desciende, y luego declina; no hay brechas en la gráfica. La forma de la gráfica no es perfectamente simétrica, pero en su lugar parece alargarse un poco más en la dirección de las hojas bajas que en la dirección de las hojas
altas. Por último, no existen observaciones que se alejen inusualmente del grueso de los datos (ningunos valores apartados), como sería el caso si uno de los valores de 26% hubiera
sido de 86%. La característica más sobresaliente de estos datos es que, en la mayoría de las
universidades de la muestra, por lo menos una cuarta parte de los estudiantes son bebedores. El problema de beber en exceso en las universidades es mucho más extenso de lo que
muchos hubieran sospechado.
■
www.FreeLibros.me
c1_p001-045.qxd
12
3/12/08
CAPÍTULO 1
2:31 AM
Page 12
Generalidades y estadística descriptiva
Una gráfica de tallos y hojas da información sobre los siguientes aspectos de los datos:
Ejemplo 1.6
64
65
66
67
68
69
70
71
72
35
26
05
90
90
00
51
31
80
64
27
94
70
70
27
05
69
09
•
Identificación de un valor típico o representativo.
•
Grado de dispersión en torno al valor típico.
•
Presencia de brechas en los datos.
•
Grado de simetría en la distribución de los valores.
•
Número y localización de crestas.
•
Presencia de valores afuera de la gráfica.
La figura 1.5 presenta gráficas de tallos y hojas de una muestra aleatoria de longitudes de
campos de golf (yardas) designados por Golf Magazine como los más desafiantes en Estados Unidos. Entre la muestra de 40 campos, el más corto es de 6 433 yardas de largo y
el más largo es de 7 280 yardas. Las longitudes parecen estar distribuidas de una manera
aproximadamente uniforme dentro del rango de valores presentes en la muestra. Obsérvese
que la selección de tallo en este caso de un solo dígito (6 ó 7) o de tres (643, . . . , 728) produciría una gráfica no informativa, primero a causa de pocos tallos y segundo a causa de demasiados.
Los programas de computadora de estadística en general no producen gráficas con tallos de dígitos múltiples. La gráfica MINITAB que aparece en la figura 1.5(b) resulta de
truncar cada observación al borrar los dígitos uno.
33
06
14
00
73
36
11
68
70
83
Tallo: dígitos de miles y cientos de cifras
Hojas: dígitos de decenas de cifras y una cifra
98
50
04
40
05
70
45
50
13
22
65
13
Tallo y hojas de yardaje N 40
Unidad de hojas 10
4
64 3367
8
65 0228
11
66 019
18
67 0147799
(4)
68 5779
18
69 0023
14
70 012455
8
71 013666
2
72 08
b)
a)
Figura 1.5 Gráficas de tallo y hojas de yardajes de campos de golf: a) hojas de dos dígitos;
b) gráfica generada por MINITAB con las hojas de un dígito truncadas.
■
Gráficas de puntos
Una gráfica de puntos es un resumen atractivo de datos numéricos cuando el conjunto de
datos es razonablemente pequeño o existen pocos valores de datos distintos. Cada observación está representada por un punto sobre la ubicación correspondiente en una escala de medición horizontal. Cuando un valor ocurre más de una vez, existe un punto por cada
ocurrencia y estos puntos se apilan verticalmente. Como con la gráfica de tallos y hojas, una
gráfica de puntos da información sobre la localización, dispersión, extremos y brechas.
Ejemplo 1.7
La figura 1.6 muestra una gráfica de puntos para los datos de temperatura de los sellos anulares introducidos en el ejemplo 1.1 en la sección previa. Un valor de temperatura representativo es uno que se encuentra entre la mitad de los 60 (°F) y existe poca dispersión en torno
al centro. Los datos se alargan más en el extremo inferior que en el superior y la observación más pequeña, 31, apenas puede ser descrita como valor extremo.
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
Page 13
1.2 Métodos pictóricos y tabulares en la estadística descriptiva
13
Temperatura
30
40
Figura 1.6
50
60
70
80
Gráfica de puntos de los datos de temperatura de los sellos anulares (°F).
■
Si el conjunto de datos del ejemplo 1.7 hubieran consistido en 50 o 100 observaciones de temperatura, cada una registrada a un décimo de grado, habría sido muy tedioso construir una gráfica de puntos. La técnica siguiente es muy adecuada a situaciones como esas.
Histogramas
Algunos datos numéricos se obtienen contando para determinar el valor de una variable (el
número de citatorios de tráfico que una persona recibió durante el año pasado, el número de
personas que solicitan empleo durante un periodo particular), mientras que otros datos se
obtienen tomando mediciones (peso de un individuo, tiempo de reacción a un estímulo particular). La prescripción para trazar un histograma es en general diferente en estos dos
casos.
DEFINICIÓN
Una variable numérica es discreta si su conjunto de valores posibles es finito o se
puede enumerar en una sucesión infinita (una en la cual existe un primer número, un
segundo número, y así sucesivamente). Una variable numérica es continua si sus valores posibles abarcan un intervalo completo sobre la línea de números.
Una variable discreta x casi siempre resulta de contar, en cuyo caso posibles valores
son 0, 1, 2, 3, . . . o algún subconjunto de estos enteros. De la toma de mediciones surgen
variables continuas. Por ejemplo, si x es el pH de una sustancia química, entonces en teoría
x podría ser cualquier número entre 0 y 14: 7.0, 7.03, 7.032 y así sucesivamente. Desde luego, en la práctica existen limitaciones en el grado de precisión de cualquier instrumento de
medición, por lo que es posible que no se pueda determinar el pH, el tiempo de reacción, la
altura y la concentración con un número arbitrariamente grande de decimales. Sin embargo,
desde el punto de vista de crear modelos matemáticos de distribuciones de datos, conviene
imaginar un conjunto completo continuo de valores posibles.
Considérense datos compuestos de observaciones de una variable discreta x. La frecuencia de cualquier valor x particular es el número de veces que ocurre un valor en el conjunto de datos. La frecuencia relativa de un valor es la fracción o proporción de veces que
ocurre el valor:
número de veces que ocurre el valor
frecuencia relativa de un valor número de observaciones en el conjunto de datos
Supóngase, por ejemplo, que el conjunto de datos se compone de 200 observaciones de x
el número de cursos que un estudiante está tomando en este semestre. Si 70 de estos valores x es 3, entonces
frecuencia del valor 3 de x: 70
frecuencia relativa del valor 3 de x:
70
5 0.35
200
Si se multiplica una frecuencia relativa por 100 se obtiene un porcentaje en el ejemplo de
cursos universitarios, 35% de los estudiantes de la muestra están tomando tres cursos. Las
www.FreeLibros.me
c1_p001-045.qxd
14
3/12/08
CAPÍTULO 1
2:31 AM
Page 14
Generalidades y estadística descriptiva
frecuencias relativas, o porcentajes, por lo general interesan más que las frecuencias mismas. En teoría, las frecuencias relativas deberán sumar 1, pero en la práctica la suma puede
diferir un poco de 1 por el redondeo. Una distribución de frecuencia es una tabla de las
frecuencias o de las frecuencias relativas, o de ambas.
Construcción de un histograma para datos discretos
En primer lugar, se determina la frecuencia y la frecuencia relativa de cada valor x.
Luego se marcan los valores x posibles en una escala horizontal. Sobre cada valor, se
traza un rectángulo cuya altura es la frecuencia relativa (o alternativamente, la frecuencia) de dicho valor.
Esta construcción garantiza que el área de cada rectángulo es proporcional a la frecuencia
relativa del valor. Por lo tanto, si las frecuencias relativas de x 1 y x 5 son 0.35 y 0.07,
respectivamente, entonces el área del rectángulo sobre 1 es cinco veces el área del rectángulo sobre 5.
Ejemplo 1.8
¿Qué tan inusual es un juego de béisbol sin hit o de un hit en las ligas mayores y cuán frecuentemente un equipo pega más de 10, 15 o incluso 20 hits? La tabla 1.1 es una distribución de frecuencia del número de hits por equipo por juego de todos los juegos de nueve
episodios que se jugaron entre 1989 y 1993.
Tabla 1.1 Distribución de frecuencia de hits en juegos de nueve episodios
Hits/juego
Número de
juegos
Frecuencia
relativa
Hits/juego
0
1
2
3
4
5
6
7
8
9
10
11
12
13
20
72
209
527
1048
1457
1988
2256
2403
2256
1967
1509
1230
834
0.0010
0.0037
0.0108
0.0272
0.0541
0.0752
0.1026
0.1164
0.1240
0.1164
0.1015
0.0779
0.0635
0.0430
14
15
16
17
18
19
20
21
22
23
24
25
26
27
Número de
juegos
Frecuencia
relativa
569
393
253
171
97
53
31
19
13
5
1
0
1
1
0.0294
0.0203
0.0131
0.0088
0.0050
0.0027
0.0016
0.0010
0.0007
0.0003
0.0001
0.0000
0.0001
0.0001
19 383
1.0005
El histograma correspondiente en la figura 1.7 se eleva suavemente hasta una sola
cresta y luego declina. El histograma se extiende un poco más hacia la derecha (hacia valores grandes) que hacia la izquierda, un poco “asimétrico positivo”.
O con la información tabulada o con el histograma mismo, se puede determinar lo siguiente:
frecuencia
frecuencia
frecuencia
relativa
relativa
proporción de juegos relativa
de x 0
de x 1
de x 2
a lo sumo de dos hits
0.0010 0.0037 0.0108 0.0155
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
Page 15
1.2 Métodos pictóricos y tabulares en la estadística descriptiva
15
Frecuencia relativa
0.10
0.05
0
Hits/juego
0
10
Figura 1.7
20
Histograma de número de hits por juego de nueve episodios.
Asimismo,
proporción de juegos con
entre 5 y 10 hits (inclusive)
0.0752 0.1026 . . . 0.1015 0.6361
Esto es, aproximadamente 64% de todos estos juegos fueron de entre 5 y 10 hits (inclusive).
■
La construcción de un histograma para datos continuos (mediciones) implica subdividir el eje de medición en un número adecuado de intervalos de clase o clases, de tal suerte que cada observación quede contenida en exactamente una clase. Supóngase, por
ejemplo, que se hacen 50 observaciones de x eficiencia de consumo de combustible de
un automóvil (mpg), la más pequeña de las cuales es 27.8 y la más grande 31.4. Entonces
se podrían utilizar los límites de clase 27.5, 28.0, 28.5, . . . , y 31.5 como se muestra a continuación:
27.5
28.0
28.5
29.0
29.5
30.0
30.5
31.0
31.5
Una dificultad potencial es que de vez en cuando una observación está en un límite de clase así que por consiguiente no cae en exactamente un intervalo, por ejemplo, 29.0. Una forma de habérselas con este problema es utilizar límites como 27.55, 28.05, . . . , 31.55.
La adición de centésimas a los límites de clase evita que las observaciones queden en los límites resultantes. Otro método es utilizar las clases 27.5–<28.0, 28.0–<28.5, . . . ,
31.0–<31.5. En ese caso 29.0 queda en la clase 29.0–<29.5 y no en la clase 28.5–<29.0. En
otras palabras, con esta convención, una observación que queda en el límite se coloca en el
intervalo a la derecha del mismo. Así es como MINITAB construye un histograma.
Construcción de un histograma para datos continuos: anchos de clase iguales
Se determina la frecuencia y la frecuencia relativa de cada clase. Se marcan los
límites de clase sobre un eje de medición horizontal. Sobre cada intervalo de clase, se traza un rectángulo cuya altura es la frecuencia relativa correspondiente (o
frecuencia).
www.FreeLibros.me
16
3/12/08
CAPÍTULO 1
2:31 AM
Page 16
Generalidades y estadística descriptiva
Ejemplo 1.9
Las compañías eléctricas requieren información sobre el consumo de los clientes para obtener pronósticos precisos de demandas. Investigadores de Wisconsin Power and Light determinaron el consumo de energía (BTU) durante un periodo particular con una muestra de 90
hogares calentados con gas. Se calculó un valor de consumo promedio como sigue:
consumo ajustado
consumo
(clima, en grados días)(área de casa)
Esto dio por resultado los datos anexos (una parte del conjunto de datos guardados FURNACE.MTW disponible en MINITAB, el cual se ordenó desde el valor más pequeño al más
grande).
2.97
6.80
7.73
8.61
9.60
10.28
11.12
12.31
13.47
4.00
6.85
7.87
8.67
9.76
10.30
11.21
12.62
13.60
5.20
6.94
7.93
8.69
9.82
10.35
11.29
12.69
13.96
5.56
7.15
8.00
8.81
9.83
10.36
11.43
12.71
14.24
5.94
7.16
8.26
9.07
9.83
10.40
11.62
12.91
14.35
5.98
7.23
8.29
9.27
9.84
10.49
11.70
12.92
15.12
6.35
7.29
8.37
9.37
9.96
10.50
11.70
13.11
15.24
6.62
7.62
8.47
9.43
10.04
10.64
12.16
13.38
16.06
6.72
7.62
8.54
9.52
10.21
10.95
12.19
13.42
16.90
6.78
7.69
8.58
9.58
10.28
11.09
12.28
13.43
18.26
Se permite que MINITAB seleccione los intervalos de clase. La característica del histograma en la figura 1.8 que más llama la atención es su parecido a una curva en forma de campana (y por consiguiente simétrico), con el punto de simetría aproximadamente en 10.
Frecuencia
de clase
Frecuencia
relativa
1–3 3–5 5–7 7–9 9–11 11–13 13–15 15–17 17–19
1
1
11
21
25
17
9
4
1
0.011 0.011 0.122 0.233
0.278
0.189
0.100
0.044
0.011
30
Porcentaje
c1_p001-045.qxd
20
10
0
1
3
5
7
9
11 13
15
17 19
BTU
Figura 1.8
Histograma de los datos de consumo de energía del ejemplo 1.9.
De acuerdo con el histograma,
proporción de
observaciones
menor que 9
0.01 0.01 0.12 0.23 0.37 (valor exacto
www.FreeLibros.me
34
5 0.378d
90
c1_p001-045.qxd
3/12/08
2:31 AM
Page 17
1.2 Métodos pictóricos y tabulares en la estadística descriptiva
17
La frecuencia relativa para la clase 9-<11 es aproximadamente 0.27, así que se estima que
en forma aproximada la mitad de ésta, o 0.135, queda entre 9 y 10. Por lo tanto
proporción de observaciones
0.37 + 0.135 0.505 (poco más de 50%)
menores que 10
El valor exacto de esta proporción es 47/90 0.522
■
No existen reglas inviolables en cuanto al número de clases o la selección de las mismas. Entre 5 y 20 serán satisfactorias para la mayoría de los conjuntos de datos. En general, mientras más grande es el número de observaciones en un conjunto de datos, más clases
deberán ser utilizadas. Una razonable regla empírica es
número de clases n
ú
m
ero
d
eo
b
serv
acio
n
es
Es posible que las clases de ancho-igual no sean una opción sensible si un conjunto
de datos “se alarga” hacia un lado o el otro. La figura 1.9 muestra una curva de puntos de
dicho conjunto de datos. Con un pequeño número de clases de ancho-igual casi todas las observaciones quedan en exactamente una o dos de las clases. Si se utiliza un gran número de
clases de ancho-igual las frecuencias de muchas clases será cero. Una buena opción es utilizar algunos intervalos más anchos cerca de las observaciones extremas y más angostos en
la región de alta concentración.
a)
b)
c)
Figura 1.9 Selección de intervalos de clase para un conjunto “alargado” de puntos: a) intervalos angostos de ancho igual; b) intervalos amplios de ancho igual; c) intervalos de anchos diferentes.
Construcción de un histograma para datos continuos: anchos de clase desiguales
Después de determinar las frecuencias y las frecuencias relativas, se calcula la altura
de cada rectángulo con la fórmula
altura del rectángulo
frecuencia relativa de la clase
ancho de clase
Las alturas del rectángulo resultante en general se conocen como densidades y la escala vertical es la escala de densidades. Esta prescripción también funcionará cuando los anchos de clase son iguales.
Ejemplo 1.10
La corrosión del acero de refuerzo es un problema serio en estructuras de concreto localizadas en ambientes afectados por condiciones climáticas severas. Por esa razón, los investigadores han estado estudiando el uso de barras de refuerzo hechas de un material compuesto.
Se realizó un estudio para desarrollar indicaciones para adherir barras de refuerzo reforzadas
con fibra de vidrio a concreto (“Design Recommendations for Bond of GFRP Rebars to Concrete”, J. of Structural Engr., 1996: 247-254). Considérense las siguientes 48 observaciones
de fuerza adhesiva medida:
www.FreeLibros.me
18
3/12/08
CAPÍTULO 1
2:31 AM
Page 18
Generalidades y estadística descriptiva
11.5
5.7
3.6
5.2
Frecuencia
de clase
Frecuencia
relativa
Densidad
12.1
5.4
3.4
5.5
9.9
5.2
20.6
5.1
9.3
5.1
25.5
5.0
7.8
4.9
13.8
5.2
6.2
10.7
12.6
4.8
6.6
15.2
13.1
4.1
7.0
8.5
8.9
3.8
13.4
4.2
8.2
3.7
17.1
4.0
10.7
3.6
9.3
3.9
14.2
3.6
5.6
3.8
7.6
3.6
2–4
9
4 –6
15
6–8
5
8–12
9
12–20
8
20–30
2
0.1875
0.3125
0.1042
0.1875
0.1667
0.0417
0.094
0.156
0.052
0.047
0.021
0.004
El histograma resultante aparece en la figura 1.10. La cola derecha o superior se alarga mucho más que la izquierda o inferior, un sustancial alejamiento de la simetría.
0.15
Densidad
c1_p001-045.qxd
0.10
0.05
0.00
2 4 6 8
12
20
30
Fuerza adhesiva
Figura 1.10 Un histograma de densidad generado por MINITAB de los datos de fuerza adhesiva del ejemplo 1.10.
■
Cuando los anchos de clase son desiguales, si no se utiliza una escala de densidad se
obtendrá una gráfica con áreas distorsionadas. Con anchos de clase iguales, el divisor es el
mismo en cada cálculo de densidad y la aritmética adicional simplemente implica reescalar
el eje vertical (es decir, el histograma que utiliza frecuencia relativa y el que utiliza densidad tendrán exactamente la misma apariencia). Un histograma de densidad tiene una propiedad interesante. Si se multiplican ambos miembros de la fórmula para densidad por el
ancho de clase se obtiene
frecuencia relativa (ancho de clase)(densidad)
(ancho del rectángulo)(altura del rectángulo) área del rectángulo
Es decir, el área de cada rectángulo es la frecuencia relativa de la clase correspondiente.
Además, como la suma de frecuencias relativas debe ser 1, el área total de todos los rectángulos en un histograma de densidad es 1. Siempre es posible trazar un histograma de modo
que el área sea igual a la frecuencia relativa (esto es cierto también para un histograma de
datos discretos), simplemente se utiliza la escala de densidad. Esta propiedad desempeñará
un importante papel al crear modelos de distribución en el capítulo 4.
Formas de histograma
Los histogramas se presentan en varias formas. Un histograma unimodal es el que se eleva a
una sola cresta y luego declina. Uno bimodal tiene dos crestas diferentes. Puede ocurrir bimodalidad cuando el conjunto de datos se compone de observaciones de dos clases bastante diferentes de individuos u objetos. Por ejemplo, considérese un gran conjunto de datos compuesto
de tiempos de manejo de automóviles que viajan entre San Luis Obispo, California
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
Page 19
1.2 Métodos pictóricos y tabulares en la estadística descriptiva
19
y Monterey, California (sin contar el tiempo utilizado para ver puntos de interés, comer,
etc.). Este histograma mostraría dos crestas, una para los carros que toman la ruta interior
(aproximadamente 2.5 horas) y otra para los carros que viajan a lo largo de la costa (3.5-4
horas). Sin embargo, la bimodalidad no se presenta automáticamente en dichas situaciones.
Sólo si los dos histogramas distintos están “muy alejados” en forma relativa con respecto a sus
esparcimientos la bimodalidad ocurrirá en el histograma de datos combinados. Por consiguiente un conjunto de datos grande compuesto de estaturas de estudiantes universitarios no
producirá un histograma bimodal porque la altura típica de hombres de aproximadamente
69 pulgadas no está demasiado por encima de la altura típica de mujeres de aproximadamente 64-65 pulgadas. Se dice que un histograma con más de dos crestas es multimodal.
Por supuesto, el número de crestas dependerá de la selección de intervalos de clase, en particular, con un pequeño número de observaciones. Mientras más grande es el número de
clases, es más probable que se manifieste bimodalidad o multimodalidad.
Un histograma es simétrico si la mitad izquierda es una imagen de espejo de la mitad derecha. Un histograma bimodal es positivamente asimétrico si la cola derecha o
superior se alarga en comparación con la cola izquierda o inferior y negativamente asimétrico si el alargamiento es hacia la izquierda. La figura 1.11 muestra histogramas “alisados”
obtenidos superponiendo una curva alisada sobre los rectángulos, que ilustran varias posibilidades.
a)
b)
c)
d)
Figura 1.11 Histogramas alisados: a) unimodal simétrico; b) bimodal; c) positivamente asimétrico y d) negativamente asimétrico.
Datos cualitativos
Tanto una distribución de frecuencia y un histograma pueden ser construidos cuando el conjunto de datos es de naturaleza cualitativa (categórico). En algunos casos, habrá un ordenamiento
natural de las clases, por ejemplo, estudiantes de primer año, segundo, tercero, cuarto y graduados, mientras que en otros casos el orden será arbitrario, por ejemplo, católico, judío, protestante, etc. Con esos datos categóricos, los intervalos sobre los que se construyen rectángulos
deberán ser de igual ancho.
Ejemplo 1.11
El Public Policy Institute of California realizó una encuesta telefónica de 2501 residentes adultos en California durante abril de 2006 para indagar qué pensaban sobre varios aspectos de la
educación pública K-12. Una pregunta fue “En general, ¿cómo calificaría la calidad de las escuelas públicas de su vecindario hoy en día? La tabla 1.2 muestra las frecuencias y las frecuencias relativas y la figura 1.12 muestra el histograma correspondiente (gráfica de barras).
Tabla 1.2 Distribución de frecuencia de calificaciones escolares
Calificación
A
B
C
D
F
Desconocida
Frecuencia
Frecuencia relativa
478
893
680
178
100
172
0.191
0.357
0.272
0.071
0.040
0.069
2501
1.000
www.FreeLibros.me
c1_p001-045.qxd
20
3/12/08
CAPÍTULO 1
2:31 AM
Page 20
Generalidades y estadística descriptiva
Gráfica de frecuencia relativa vs calificación
Frecuencia relativa
0.4
0.3
0.2
0.1
0.0
A
B
C
D
F Desconocida
Calificación
Figura 1.12
Histograma de calificaciones de las escuelas obtenido con MINITAB.
Más de la mitad de los encuestados otorgaron una calificación A o B y sólo un poco más de
10% otorgó una calificación D o F. Los porcentajes de padres de niños que asisten a escuelas
públicas fueron un poco más favorables para las escuelas: 24, 40, 24, 6, 4 y 2 por ciento. ■
Datos multivariantes
Los datos multivariantes en general son más difíciles de describir en forma visual. Varios
métodos para hacerlo aparecen más adelante en el libro, notablemente en gráficas de puntos de datos numéricos bivariantes.
EJERCICIOS
Sección 1.2 (10-32)
10. Considere los datos de resistencia de las vigas del ejemplo 1.2.
a. Construya una gráfica de tallos y hojas de los datos.
¿Cuál parece ser el valor de resistencia representativo?
¿Parecen estar las observaciones altamente concentradas
en torno al valor representativo o algo dispersas?
b. ¿Parece ser la gráfica razonablemente simétrica en torno
a un valor representativo o describiría su forma de otra
manera?
c. ¿Parece haber algunos valores de resistencia extremos?
d. ¿Qué proporción de las observaciones de resistencia en
esta muestra exceden de 10 MPa?
11. Cada calificación en el siguiente lote de calificaciones de
exámenes se encuentra en los 60, 70, 80 o 90. Una gráfica
de tallos y hojas con sólo los cuatro tallos 6, 7, 8 y 9 no describiría detalladamente la distribución de calificaciones. En
tales situaciones, es deseable utilizar tallos repetidos. En este caso se repetiría el tallo 6 dos veces, utilizando 6L para
las calificaciones en los 60 bajos (hojas 0, 1, 2, 3 y 4) y 6H
para las calificaciones en los 60 altos (hojas 5, 6, 7, 8 y 9).
Asimismo, los demás tallos pueden ser repetidos dos veces
para obtener una gráfica de ocho filas. Construya la gráfica para las calificaciones dadas. ¿Qué característica de los
datos es resaltada por esta gráfica?
74 89 80 93 64 67 72 70 66 85 89 81 81
71 74 82 85 63 72 81 81 95 84 81 80 70
69 66 60 83 85 98 84 68 90 82 69 72 87
88
12. Los valores de densidad relativa anexos de varios tipos de
madera utilizados en la construcción aparecieron en el artículo (“Bolted Connection Design Values Based on European
Yield Model”, J. of Structural Engr., 1993: 2169-2186):
0.31
0.41
0.45
0.54
0.35
0.41
0.46
0.55
0.36
0.42
0.46
0.58
0.36
0.42
0.47
0.62
0.37
0.42
0.48
0.66
0.38
0.42
0.48
0.66
0.40
0.42
0.48
0.67
0.40
0.43
0.51
0.68
0.40
0.44
0.54
0.75
Construya una gráfica de tallos y hojas con tallos repetidos
(véase el ejercicio previo) y comente sobre cualquier característica interesante de la gráfica.
13. Las propiedades mecánicas permisibles para el diseño estructural de vehículos aeroespaciales metálicos requieren un
método aprobado para analizar estadísticamente datos de
prueba empíricos. El artículo (“Establishing Mechanical Property Allowables for Metals”, J. of Testing and Evaluation,
1998: 293-299) utilizó los datos anexos sobre resistencia a la
tensión última (lb/pulg2) como base para abordar las dificultades que se presentan en el desarrollo de dicho método.
122.2
127.5
130.4
131.8
132.7
133.2
134.0
124.2
127.9
130.8
132.3
132.9
133.3
134.0
124.3
128.6
131.3
132.4
133.0
133.3
134.0
www.FreeLibros.me
125.6
128.8
131.4
132.4
133.1
133.5
134.1
126.3
129.0
131.4
132.5
133.1
133.5
134.2
126.5
129.2
131.5
132.5
133.1
133.5
134.3
126.5
129.4
131.6
132.5
133.1
133.8
134.4
127.2
129.6
131.6
132.5
133.2
133.9
134.4
127.3
130.2
131.8
132.6
133.2
134.0
134.6
c1_p001-045.qxd
3/12/08
2:31 AM
Page 21
1.2 Métodos pictóricos y tabulares en la estadística descriptiva
134.7
135.2
135.7
135.9
136.6
137.8
138.4
139.1
140.9
143.6
134.7
135.2
135.8
136.0
136.8
137.8
138.4
139.5
140.9
143.8
134.7
135.3
135.8
136.0
136.9
137.8
138.4
139.6
141.2
143.8
134.8
135.3
135.8
136.1
136.9
137.9
138.5
139.8
141.4
143.9
134.8
135.4
135.8
136.2
137.0
137.9
138.5
139.8
141.5
144.1
134.8
135.5
135.8
136.2
137.1
138.2
138.6
140.0
141.6
144.5
134.9
135.5
135.9
136.3
137.2
138.2
138.7
140.0
142.9
144.5
134.9
135.6
135.9
136.4
137.6
138.3
138.7
140.7
143.4
147.7
135.2
135.6
135.9
136.4
137.6
138.3
139.0
140.7
143.5
147.7
a. Construya una gráfica de tallos y hojas de los datos eliminando (truncando) los dígitos de décimos y luego repitiendo cada valor de tallo cinco veces (una vez para las
hojas 1 y 2, una segunda vez para las hojas 3 y 4, etc.).
¿Por qué es relativamente fácil identificar un valor de resistencia representativo?
b. Construya un histograma utilizando clases de ancho
igual con la primera clase que tiene un límite inferior de
122 y un límite superior de 124. Enseguida comente sobre cualquier característica interesante del histograma.
14. El conjunto de datos adjunto se compone de observaciones
del flujo de una regadera (l/min) para una muestra de n
129 casas en Perth, Australia (“An Application of Bayes
Methodology to the Analysis of Diary Records in a Water
Use Study”, J. Amer. Stat. Assoc., 1987: 705-711):
4.6 12.3 7.1 7.0 4.0 9.2 6.7 6.9
11.2 10.5 14.3 8.0 8.8 6.4 5.1 5.6
7.5 6.2 5.8 2.3 3.4 10.4 9.8 6.6
8.3 6.5 7.6 9.3 9.2 7.3 5.0 6.3
5.4 4.8 7.5 6.0 6.9 10.8 7.5 6.6
7.6 3.9 11.9 2.2 15.0 7.2 6.1 15.3
5.4 5.5 4.3 9.0 12.7 11.3 7.4 5.0
8.4 7.3 10.3 11.9 6.0 5.6 9.5 9.3
5.1 6.7 10.2 6.2 8.4 7.0 4.8 5.6
10.8 15.5 7.5 6.4 3.4 5.5 6.6 5.9
7.8 7.0 6.9 4.1 3.6 11.9 3.7 5.7
9.3 9.6 10.4 9.3 6.9 9.8 9.1 10.6
8.3 3.2 4.9 5.0 6.0 8.2 6.3 3.8
11.5 5.1
9.6 7.5
3.7 6.4
13.8 6.2
5.0 3.3
18.9 7.2
3.5 8.2
10.4 9.7
10.5 14.6
15.0 9.6
6.8 11.3
4.5 6.2
6.0
a. Construya una gráfica de tallos y hojas de los datos.
b. ¿Cuál es una velocidad de flujo o gasto típico o representativo?
c. ¿Parece estar la gráfica altamente concentrada o dispersa?
d. ¿Es la distribución de valores razonablemente simétrica?
Si no, ¿cómo describiría el alejamiento de la simetría?
e. ¿Describiría cualquier observación como alejada del
resto de los datos (un valor extremo)?
15. Un artículo de Consumer Reports sobre crema de cacahuate (septiembre de 1990) reportó las siguientes calificaciones
para varias marcas:
Creamy
56
56
Crunchy 62
50
44
68
53
34
62
41
75
42
36
30
42
36
39
40
47
75
53
50
40
80
50
56
34
47
65
30
62
56
45
22
52
62
40
21
Construya una gráfica de tallos y hojas comparativa y ponga una lista de tallos a la mitad de la página y luego coloque
las hojas “creamy” a la derecha y las “crunchy” a la izquierda. Describa las similitudes y diferencias de los dos tipos.
16. El artículo citado en el ejemplo 1.2 también dio las observaciones de resistencia adjuntas para los cilindros:
6.1
7.8
5.8
8.1
7.8
7.4
7.1
8.5
7.2
8.9
9.2
9.8
6.6
9.7
8.3
14.1
7.0
12.6
8.3
11.2
a. Construya una gráfica de tallos y hojas comparativa (véase el ejercicio previo) de los datos de la viga y el cilindro
y luego responda las preguntas en las partes b)-d) del
ejercicio 10 para las observaciones de los cilindros.
b. ¿En qué formas son similares los dos lados de la gráfica? ¿Existen algunas diferencias obvias entre las observaciones de la viga y las observaciones del cilindro?
c. Construya una gráfica de puntos de los datos del cilindro.
17. Transductores de temperatura de cierto tipo se envían en lotes
de 50. Se seleccionó una muestra de 60 lotes y se determinó
el número de transductores en cada lote que no cumplen
con las especificaciones de diseño y se obtuvieron los datos
siguientes:
2 1 2 4 0 1 3 2 0 5 3 3 1 3 2 4 7 0 2 3
0 4 2 1 3 1 1 3 4 1 2 3 2 2 8 4 5 1 3 1
5 0 2 3 2 1 0 6 4 2 1 6 0 3 3 3 6 1 2 3
a. Determine las frecuencias y las frecuencias relativas de
los valores observados de x número de transductores
en un lote que no cumple con las especificaciones.
b. ¿Qué proporción de lotes muestreados tienen a lo sumo
cinco transductores que no cumplen con las especificaciones? ¿Qué proporción tiene menos de cinco? ¿Qué proporción tienen por lo menos cinco unidades que no cumplen
con las especificaciones?
c. Trace un histograma de los datos que utilizan la frecuencia
relativa en la escala vertical y comente sus características.
18. En un estudio de productividad de autores (“Lotka’s Test”,
Collection Mgmt., 1982: 111-118), se clasificó a un gran número de autores de artículos de acuerdo con el número de artículos que publicaron durante cierto periodo. Los resultados
se presentaron en la distribución de frecuencia adjunta:
Número de
artículos
Frecuencia
Número de
artículos
Frecuencia
1
2 3
4
784 204 127 50
9
6
10
7
11
6
12
7
5
33
13
4
6
28
14
4
7
19
15
5
8
19
16
3
17
3
a. Construya un histograma correspondiente a esta distribución de frecuencia. ¿Cuál es la característica más interesante de la forma de la distribución?
b. ¿Qué proporción de estos autores publicó por lo menos
cinco artículos? ¿Por lo menos diez artículos? ¿Más de
diez artículos?
c. Suponga que los cinco 15, los tres 6 y los tres 17 se
agruparon en una sola categoría mostrada como “ 15”.
¿Podría trazar un histograma? Explique.
www.FreeLibros.me
c1_p001-045.qxd
22
3/12/08
CAPÍTULO 1
2:31 AM
Page 22
Generalidades y estadística descriptiva
a. Construya una gráfica de hojas y tallos con las milésimas como el tallo y las centésimas como las hojas y comente sobre algunas características de la gráfica.
b. Construya un histograma con los límites de clase, 0,
1000, 2000, 3000, 4000, 5000 y 6000. ¿Qué proporción
de subdivisiones tienen una longitud total menor que
2000? ¿Entre 2000 y 4000? ¿Cómo describiría la forma
del histograma?
d. Suponga que los valores 15, 16 y 17 se enlistan por separado y se combinan en la categoría 15-17 con frecuencia 11. ¿Sería capaz de trazar un histograma? Explique.
19. Se determinó el número de partículas contaminadas en una
oblea de silicio antes de cierto proceso de enjuague por cada oblea en una muestra de tamaño 100 y se obtuvieron las
siguientes frecuencias:
Número de
partículas
Frecuencia
0
1
1
2
2
3
Número de
partículas
Frecuencia
8
12
9
4
10
5
3
12
4
5
11 15
11 12
3
1
13
2
6
18
21. El artículo citado en el ejercicio 20 también da los siguientes valores de las variables y número de calles cerradas y
z número de intersecciones:
7
10
y 1 0 1 0 0 2 0 1 1 1 2 1 0 0 1 1 0 1 1
z 1 8 6 1 1 5 3 0 0 4 4 0 0 1 2 1 4 0 4
14
1
y 1 1 0 0 0 1 1 2 0 1 2 2 1 1 0 2 1 1 0
z 0 3 0 1 1 0 1 3 2 4 6 6 0 1 1 8 3 3 5
a. ¿Qué proporción de las obleas muestreadas tuvieron por
lo menos una partícula? ¿Por lo menos cinco partículas?
b. ¿Qué proporción de las obleas muestreadas tuvieron entre cinco y diez partículas, inclusive? ¿Estrictamente entre
cinco y diez partículas?
c. Trace un histograma con la frecuencia relativa en el eje
vertical. ¿Cómo describiría la forma del histograma?
20. El artículo (“Determination of Most Representative Subdivision”, J. of Energy Engr., 1993: 43-55) dio datos sobre
varias características de subdivisiones que podrían ser utilizados para decidir si se suministra energía eléctrica con líneas elevadas o líneas subterráneas. He aquí los valores de
la variable x longitud total de calles dentro de una subdivisión:
1280
1050
1320
960
3150
2700
510
5320
360
530
1120
5700
2730
240
4390
3330
3350
2120
5220
1670
396
2100
3380
540
450
500
100
1419
1240
340
3870
2250
1850
5770
2109
3060
1000
1250
2320
2460
3150
4770
960
2400
2400
5850
1890
y 1 5 0 3 0 1 1 0 0
z 0 5 2 3 1 0 0 0 3
a. Construya un histograma con los datos y. ¿Qué proporción de estas subdivisiones no tenía calles cerradas?
¿Por lo menos una calle cerrada?
b. Construya un histograma con los datos z. ¿Qué proporción de estas subdivisiones tenía cuando mucho cinco
intersecciones? ¿Menos de cinco intersecciones?
22. ¿Cómo varía la velocidad de un corredor en el recorrido del
curso de un maratón (una distancia de 42.195 km)? Considere determinar tanto el tiempo de recorrido de los primeros 5 km y el tiempo de recorrido entre los 35 y 40 km, y
luego reste el primer tiempo del segundo. Un valor positivo de esta diferencia corresponde a un corredor que corre más lento hacia el final de la carrera. El histograma
adjunto está basado en tiempos de corredores que participaron en varios maratones japoneses (“Factors Affecting
Runners’ Maratón Performance”, Chance, otoño de 1993:
24-30).
Histograma del ejercicio 22
Frecuencia
200
150
100
50
–100
0
100
200
300
400
500
600
700
www.FreeLibros.me
800
Diferencia
de tiempo
c1_p001-045.qxd
3/12/08
2:31 AM
Page 23
1.2 Métodos pictóricos y tabulares en la estadística descriptiva
estadísticas que los datos originales. En particular, puede ser
posible encontrar una función para la cual el histograma de
valores transformados es más simétrico (o, incluso mejor,
más parecido a una curva en forma de campana) que los datos
originales. Por ejemplo, el artículo (“Time Lapse Cinematographic Analysis of Beryllium-Lung Fibroblast Interactions”,
Environ. Research, 1983: 34-43) reportó los resultados de experimentos diseñados para estudiar el comportamiento de
ciertas células individuales que habían estado expuestas a berilio. Una importante característica de dichas células individuales es su tiempo de interdivisión (IDT, por sus siglas en
inglés). Se determinaron tiempos de interdivisión de un gran
número de células tanto en condiciones expuestas (tratamiento) como no expuestas (control). Los autores del artículo utilizaron una transformación logarítmica, es decir, valor
transformado log(valor original). Considere los siguientes
tiempos de interdivisión representativos.
¿Cuáles son algunas características interesantes de este
histograma? ¿Cuál es un valor de diferencia típico? ¿Aproximadamente qué proporción de los competidores corren la
última distancia más rápido que la primera?
23. En un estudio de ruptura de la urdimbre durante el tejido de
telas (Technometrics, 1982: 63), se sometieron a prueba 100
muestras de hilo. Se determinó el número de ciclos de esfuerzo hasta ruptura para cada muestra de hilo y se obtuvieron los datos siguientes:
86
175
157
282
38
211
497
246
393
198
146
176
220
224
337
180
182
185
396
264
251
76
42
149
65
93
423
188
203
105
653
264
321
180
151
315
185
568
829
203
98
15
180
325
341
353
229
55
239
124
249
364
198
250
40
571
400
55
236
137
400
195
38
196
40
124
338
61
286
135
292
262
20
90
135
279
290
244
194
350
131
88
61
229
597
81
398
20
277
193
169
264
121
166
246
186
71
284
143
188
a. Construya un histograma de frecuencia relativa basado
en los intervalos de clase 0-<100, 100-<200, . . . y comente sobre las características del histograma.
b. Construya un histograma basado en los siguientes intervalos de clase: 0-<50, 50-<100, 100-<150, 150-<200,
200-<300, 300-<400, 400-<500, 500-<600 y 600-<900.
c. Si las especificaciones de tejido requieren una resistencia
a la ruptura de por lo menos 100 ciclos, ¿qué proporción
de los especímenes de hilos en esta muestra sería considerada satisfactoria?
24. El conjunto de datos adjuntos consiste en observaciones de
resistencia al esfuerzo cortante (lb) de soldaduras de puntos
ultrasónicas aplicadas en un cierto tipo de lámina alclad.
Construya un histograma de frecuencia relativa basado en
diez clases de ancho igual con límites 4000, 4200, . . . [El
histograma concordará con el que aparece en (“Comparison
of Properties of Joints Prepared by Ultrasonic Welding and
Other Means”, J. of Aircraft, 1983: 552-556).] Comente sobre sus características.
5434
5112
4820
5378
5027
4848
4755
5207
5049
4740
5248
5227
4931
5364
5189
4948
5015
5043
5260
5008
5089
4925
5621
4974
5173
5245
5555
4493
5640
4986
4521
4659
4886
5055
4609
5518
5001
4918
4592
4568
4723
5388
5309
5069
4570
4806
4599
5828
4772
5333
4803
5138
4173
5653
5275
5498
5582
5188
4990
4637
5288
5218
5133
5164
4951
4786
5296
5078
5419
4681
4308
5764
5702
5670
5299
4859
5095
5342
5679
4500
4965
4900
5205
5076
4823
5273
5241
4381
4848
4780
4618
5069
5256
5461
5170
4968
4452
4774
4417
5042
25. Una transformación de valores de datos por medio de alguna
función matemática, tal como 2x o 1/x a menudo produce
un conjunto de números que tienen “mejores” propiedades
23
IDT
log10(IDT)
IDT
log10(IDT)
IDT
log10(IDT)
28.1
31.2
13.7
46.0
25.8
16.8
34.8
62.3
28.0
17.9
19.5
21.1
31.9
28.9
1.45
1.49
1.14
1.66
1.41
1.23
1.54
1.79
1.45
1.25
1.29
1.32
1.50
1.46
60.1
23.7
18.6
21.4
26.6
26.2
32.0
43.5
17.4
38.8
30.6
55.6
25.5
52.1
1.78
1.37
1.27
1.33
1.42
1.42
1.51
1.64
1.24
1.59
1.49
1.75
1.41
1.72
21.0
22.3
15.5
36.3
19.1
38.4
72.8
48.9
21.4
20.7
57.3
40.9
1.32
1.35
1.19
1.56
1.28
1.58
1.86
1.69
1.33
1.32
1.76
1.61
Use los intervalos de clase 10–<20, 20–<30, . . . para construir un histograma de los datos originales. Use los intervalos
1.1–<1.2, 1.2–<1.3, . . . para hacer lo mismo con los datos
transformados. ¿Cuál es el efecto de la transformación?
26. En la actualidad se está utilizando la difracción retrodispersada de electrones en el estudio de fenómenos de fractura.
La siguiente información sobre ángulo de desorientación
(grados) se extrajo del artículo (“Observations on the Faceted Initiation Site in the Dwell-Fatigue Tested Ti-6242
Alloy: Crystallographic Orientation and Size Effects”, Metallurgical and Materials Trans., 2006: 1507-1518).
Clase:
Frec. rel.:
0 –5
0.177
5–10
0.166
10–15
0.175
15–20
0.136
Clase:
Frec. rel.:
20 –30
0.194
30–40
0.078
40–60
0.044
60–90
0.030
a. ¿Es verdad que más de 50% de los ángulos muestreados
son más pequeños que 15°, como se afirma en el artículo?
b. ¿Qué proporción de los ángulos muestreados son por lo
menos de 30°?
c. ¿Aproximadamente qué proporción de los ángulos son
de entre 10° y 25°?
d. Construya un histograma y comente sobre cualquier característica interesante.
www.FreeLibros.me
c1_p001-045.qxd
24
3/12/08
CAPÍTULO 1
2:31 AM
Page 24
Generalidades y estadística descriptiva
de Exposure in Tree Planting de British Columbia Silviculture Workers”, Ergonomics, 1993: 951-961.)
27. El artículo (“Study on the Life Distribution of Microdrills”,
J. of Engr. Manufacture, 2002: 301-305) reportó las siguientes observaciones, listadas en orden creciente sobre la
duración de brocas (número de agujeros que una broca fresa antes de que se rompa) cuando se fresaron agujeros en
una cierta aleación de latón.
11 14 20 23 31 36 39 44 47 50
59 61 65 67 68 71 74 76 78 79
81 84 85 89 91 93 96 99 101 104
105 105 112 118 123 136 139 141 148 158
161 168 184 206 248 263 289 322 388 513
a. ¿Por qué una distribución de frecuencia no puede estar
basada en los intervalos de clase 0-50, 50-100, 100-150
y así sucesivamente?
b. Construya una distribución de frecuencia e histograma
de los datos con los límites de clase 0, 50, 100, . . . y luego comente sobre las características interesantes.
c. Construya una distribución de frecuencia e histograma
de los logaritmos naturales de las observaciones de duración y comente sobre características interesantes.
d. ¿Qué proporción de las observaciones de duración en
esta muestra son menores que 100? ¿Qué proporción de
las observaciones son de por lo menos 200?
28. Las mediciones humanas constituyen una rica área de aplicación de métodos estadísticos. El artículo (“A Longitudinal
Study of the Development of Elementary School Children’s
Private Speech”, Merrill-Palmer Q., 1990: 443-463) reportó sobre un estudio de niños que hablan solos (conversación
a solas). Se pensaba que la conservación a solas tenía que
ver con el IQ, porque se supone que éste mide la madurez
mental y se sabía que la conservación a solas disminuye
conforme los estudiantes avanzan a través de los años de la
escuela primaria. El estudio incluyó 33 estudiantes cuyas
calificaciones de IQ de primer año se dan a continuación:
82 96 99 102 103 103 106 107 108 108 108 108
109 110 110 111 113 113 113 113 115 115 118 118
119 121 122 122 127 132 136 140 146
O
O
J
O
J
O
F
O
F
O
N
F
J
J
F
J
O
J
O
N
C
O
F
O
F
N
N
B
B
O
O
N
B
N
B
C
F
J
M
O
O J O
F J B
O J M
O O M
O M
O C
O B
B F
30. Un diagrama de Pareto es una variación de un histograma
de datos categóricos producidos por un estudio de control de
calidad. Cada categoría representa un tipo diferente de no
conformidad del producto o problema de producción. Las categorías se ordenaron de modo que la categoría con la frecuencia más grande aparezca a la extrema izquierda, luego la
categoría con la segunda frecuencia más grande, y así sucesivamente. Suponga que se obtiene la siguiente información
sobre no conformidades en paquetes de circuito: componentes averiados, 126; componentes incorrectos, 210; soldadura
insuficiente, 67; soldadura excesiva, 54; componente faltante, 131. Construya un diagrama de Pareto.
31. La frecuencia acumulativa y la frecuencia relativa acumulativa de un intervalo de clase particular son la suma de frecuencias y frecuencias relativas, respectivamente, del intervalo y
todos los intervalos que quedan debajo de él. Si, por ejemplo, existen cuatro intervalos con frecuencias 9, 16, 13 y 12,
entonces las frecuencias acumulativas son 9, 25, 38 y 50 y
las frecuencias relativas acumulativas son 0.18, 0.50, 0.76
y 1.00 Calcule las frecuencias acumulativas y las frecuencias relativas de los datos del ejercicio 24.
32. La carga de incendio (MJ/m2) es la energía calorífica que podría ser liberada por metro cuadrado de área de piso por la
combustión del contenido y la estructura misma. El artículo
(“Fire Loads in Office Buildings”, J. of Structural Engr.,
1997: 365-368) dio los siguientes porcentajes acumulativos
(tomados de una gráfica) de cargas de fuego en una muestra
de 388 cuartos:
Describa los datos y comente sobre cualquier característica
importante.
29. Considere los siguientes datos sobre el tipo de problemas de
salud (J hinchazón de las articulaciones, F fatiga, B
dolor de espalda, M debilidad muscular, C tos, N
nariz suelta/irritación, O otro) que aquejan a los plantadores de árboles. Obtenga las frecuencias y las frecuencias
relativas de las diversas categorías y trace un histograma.
(Los datos son consistentes con los porcentajes dados en el
artículo (“Physiological Effects of Work Stress and Pestici-
Valor
% acumulativo
0
0
150
19.3
300
37.6
450
62.7
600
77.5
Valor
% acumulativo
750
87.2
900
93.8
1050
95.7
1200
98.6
1350
99.1
Valor
% acumulativo
1500
99.5
1650
99.6
1800
99.8
1950
100.0
a. Construya un histograma de frecuencia relativa y comente sobre características interesantes.
b. ¿Qué proporción de cargas de fuego es menor que 600?
¿Por lo menos de 1200?
c. ¿Qué proporción de las cargas está entre 600 y 1200?
1.3 Medidas de localización
Los resúmenes visuales de datos son herramientas excelentes para obtener impresiones y
percepciones preliminares. Un análisis de datos más formal a menudo requiere el cálculo e
interpretación de medidas resumidas numéricas. Es decir, de los datos se trata de extraer varios números resumidos, números que podrían servir para caracterizar el conjunto de datos
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
Page 25
1.3 Medidas de ubicación
25
y comunicar algunas de sus características prominentes. El interés principal se concentrará
en los datos numéricos; al final de la sección aparecen algunos comentarios con respecto a
datos categóricos.
Supóngase, entonces, que el conjunto de datos es de la forma x1, x2, . . . , xn, donde cada xi es un número. ¿Qué características del conjunto de números son de mayor interés y
merecen énfasis? Una importante característica de un conjunto de números es su localización y en particular su centro. Esta sección presenta métodos para describir la localización
de un conjunto de datos; en la sección 1.4 se regresará a los métodos para medir la variabilidad en un conjunto de números.
La media
Para un conjunto dado de números x1, x2, . . . , xn, la medida más conocida y útil del centro
es la media o promedio aritmético del conjunto. Como casi siempre se pensará que los números xi constituyen una muestra, a menudo se hará referencia al promedio aritmético como la media muestral y se la denotará por x.
DEFINICIÓN
La media muestral x de las observaciones x1, x2, . . . , xn está dada por
n
g xi
x1 1 x2 1 c 1 xn
i51
5 n
n
El numerador de x se escribe más informalmente como xi , donde la suma incluye
todas las observaciones muestrales.
x5
Para reportar x, se recomienda utilizar una precisión decimal de un dígito más que la precisión de los números xi. Por consiguiente las observaciones son distancias de detención con
x1 125, x2 131 y así sucesivamente, se podría tener x 127.3 pies.
Ejemplo 1.12
El agrietamiento de hierro y acero provocado por corrosión producida por esfuerzo cáustico ha sido estudiado debido a las fallas que se presentan alrededor de los remaches en calderas de acero y fallas de rotores de turbinas de vapor. Considérense las observaciones
adjuntas de x longitud de agrietamiento (m) derivadas de pruebas de corrosión con esfuerzo constante en probetas de barras pulidas sometidas a tensión durante un periodo fijo.
(Los datos concuerdan con un histograma y cantidades resumidas tomadas del artículo “On
the Role of Phosphorus in the Caustic Stress Corrosion Cracking of Low Alloy Steels”, Corrosion Science, 1989: 53-68.)
x1 16.1 x2 9.6 x3 24.9 x4 20.4 x5 12.7 x6 21.2 x7 30.2
x8 25.8 x9 18.5 x10 10.3 x11 25.3 x12 14.0 x13 27.1 x14 45.0
x15 23.3 x16 24.2 x17 14.6 x18 8.9 x19 32.4 x20 11.8 x21 28.5
La figura 1.13 muestra una gráfica de tallo y hojas de los datos; una longitud de agrietamiento en los 20 bajos parece ser “típica”.
0H
1L
1H
2L
2H
3L
3H
4L
4H
Figura 1.13
96 89
27 03 40 46 18
61 85
49 04 12 33 42
58 53 71 85
02 24
Tallo: dígitos de decenas
Hojas: dígitos de unidades y decenas
50
Gráfica de tallo y hojas de los datos de la longitud de agrietamiento.
www.FreeLibros.me
c1_p001-045.qxd
26
3/12/08
CAPÍTULO 1
2:31 AM
Page 26
Generalidades y estadística descriptiva
Con xi 444.8, la media muestral es
444.8
5 21.18
21
un valor consistente conforme a la información dada por la gráfica de tallo y hojas.
x5
■
Una interpretación física de x demuestra cómo mide la ubicación (centro) de una
muestra. Se traza y gradúa un eje de medición horizontal y luego se representa cada observación muestral por una pesa de 1 lb colocada en el punto correspondiente sobre el eje. El
único punto en el cual se puede colocar un punto de apoyo para equilibrar el sistema de pesas es el punto correspondiente al valor de x (véase la figura 1.14).
x = 21.18
10
Figura 1.14
20
30
40
La media como punto de equilibrio de un sistema de pesas.
Así como x representa el valor promedio de las observaciones incluidas en una muestra, se puede calcular el promedio de todos los valores incluidos en la población. Este promedio se llama media de la población y está denotada por la letra griega . Cuando existen
N valores en la población (una población finita), entonces (suma de los N valores de
población)/N. En los capítulos 3 y 4, se dará una definición más general de que se aplica
tanto a poblaciones finitas y (conceptualmente) infinitas. Así como x es una medida interesante e importante de la ubicación de la muestra, es una interesante e importante característica (con frecuencia la más importante) de una población. En los capítulos de inferencia
estadística, se presentarán métodos basados en la media muestral para sacar conclusiones
con respecto a una media de población. Por ejemplo, se podría utilizar la media muestral
x 21.18 calculada en el ejemplo 1.12 como una estimación puntual (un solo número que
es la “mejor” conjetura) de la longitud de agrietamiento promedio verdadera de todas las
probetas tratadas como se describe.
La media sufre de una deficiencia que la hace ser una medida inapropiada del centro
en algunas circunstancias: su valor puede ser afectado en gran medida por la presencia de
incluso un solo valor extremo (una observación inusualmente grande o pequeña). En el
ejemplo 1.12, el valor x14 45.0 es obviamente un valor extremo. Sin esta observación,
x 399.8/20 19.99; el valor extremo incrementa la media en más de 1 m. Si la observación de 45.0 m fuera reemplazada por el valor catastrófico de 295.0 m, un valor realmente extremo, entonces x 694.8/21 33.09, ¡el cual es más grande que todos excepto
una de las observaciones!
Una muestra de ingresos a menudo produce algunos valores apartados (unos cuantos
afortunados que gana cantidades astronómicas) y el uso del ingreso promedio como medida de ubicación con frecuencia será engañoso. Tales ejemplos sugieren que se busca una
medida que sea menos sensible a los valores apartados que x y momentáneamente se propondrá una. Sin embargo, aunque x sí tiene este defecto potencial, sigue siendo la medida
más ampliamente utilizada, en gran medida porque existen muchas poblaciones para las
cuales un valor extremo en la muestra sería altamente improbable. Cuando se muestrea una
población como esa (una población normal o en forma de campana es el ejemplo más importante), la media muestral tenderá a ser estable y bastante representativa de la muestra.
La mediana
La palabra mediana es sinónimo de “medio” y la mediana muestral es en realidad el valor
medio una vez que se ordenan las observaciones de la más pequeña a la más grande. Cuando
las observaciones están denotadas por x1, . . . , xn, se utilizará el símbolo |
x para representar la
mediana muestral.
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
Page 27
1.3 Medidas de ubicación
DEFINICIÓN
La mediana muestral se obtiene ordenando primero las n observaciones de la más
pequeña a la más grande (con cualesquiera valores repetidos incluidos de modo que
cada observación muestral aparezca en la lista ordenada). Entonces,
¨
«
«
«
«
|
x ©
«
«
«
«
ª
Ejemplo 1.13
27
El valor
medio único
si n es
impar
El promedio
de los dos
valores
medios si n
es par
promedio de
n1
2
n-ésimo
valor ordenado
n
2
n-ésimo
y
n
1
2
n-ésimo
valores ordenados
El riesgo de desarrollar deficiencia de hierro es especialmente alto durante el embarazo. El
problema con la detección de tal deficiencia es que algunos métodos para determinar el estado del hierro pueden ser afectados por el estado de gravidez mismo. Considérense las siguientes observaciones ordenadas de concentración de receptores de transferrina de una
muestra de mujeres con evidencia de laboratorio de anemia por deficiencia de hierro evidente (“Serum Transferrin Receptor for the Detection of Iron Deficiency in Pregnancy”, Amer.
J. of Clinical Nutrition, 1991: 1077-1081):
7.6
8.3
9.3
9.4
9.4
9.7
10.4
11.5
11.9
15.2
16.2
20.4
Como n 12 es par, el n/2 los valores sexto y séptimo ordenados deben ser promediados:
9.7 1 10.4
|
5 10.05
x 5
2
Note que si la observación más grande, 20.4, no hubiera aparecido en la muestra, la mediana muestral resultante de las n 11 observaciones habría sido el valor medio 9.7 [el (n + 1)/2
sexto valor ordenado]. La media muestral es x 5 xi /n 5 139.3/12 5 11.61, la cual es
un tanto más grande que la mediana debido a los valores apartados 15.2, 16.2 y 20.4.
■
Los datos del ejemplo 1.13 ilustran una importante propiedad de |
x en contraste con x.
La mediana muestral es muy insensible a los valores apartados. Si, por ejemplo, las dos xi
más grandes se incrementan desde 16.2 y 20.4 hasta 26.2 y 30.4, respectivamente, |
x no se
vería afectada. Por lo tanto, en el tratamiento de valores apartados, x y |
x no son extremos
opuestos de un espectro.
Debido a que los valores grandes presentes en la muestra del ejemplo 1.13 afectan
a x más que |
x, |
x x con esos datos. Aunque tanto x como |
x ubican el centro de un conjunto de datos, en general no serán iguales porque se enfocan en aspectos diferentes de la
muestra.
Análogo a |
x como valor medio de la muestra es un valor medio de la población, la
|. Como con x y , se puede pensar en utilizar la memediana poblacional, denotada por m
|
|. En el ejemplo 1.13, se podría utilizar
diana muestral x para hacer una inferencia sobre m
|
x 10.05 como estimación de la concentración de la mediana en toda la población de
la cual se tomó la muestra. A menudo se utiliza una mediana para describir ingresos o salarios (debido a que no es influida en gran medida por unos pocos salarios grandes). Si el salario mediano de una muestra de ingenieros fuera |
x 66 416 dólares se podría utilizar
como base para concluir que el salario mediano de todos los ingenieros es de más de 60 000
dólares.
www.FreeLibros.me
c1_p001-045.qxd
28
3/12/08
CAPÍTULO 1
2:31 AM
Page 28
Generalidades y estadística descriptiva
~
a) Asimétrico negativo
Figura 1.15
~
b) Simétrico
~
c) Asimétrico positivo
Tres formas diferentes de una distribución de población.
| poblacionales en general no serán idénticas. Si la distriLa media y la mediana m
bución de la población es positiva o negativamente asimétrica, como se ilustra en la figura
|. Cuando éste es el caso, al hacer inferencias primero se debe decidir
1.15, entonces m 2 m
cuál de las dos características de la población es de mayor interés y luego proceder como
corresponda.
Otras medidas de localización:
cuartiles, percentiles y medias recortadas
La mediana (poblacional o muestral) divide el conjunto de datos en dos partes iguales. Para obtener medidas de ubicación más finas, se podrían dividir los datos en más de dos partes. Tentativamente, los cuartiles dividen el conjunto de datos en cuatro partes iguales y las
observaciones arriba del tercer cuartil constituyen el cuarto superior del conjunto de datos,
el segundo cuartil es idéntico a la mediana y el primer cuartil separa el cuarto inferior de los
tres cuartos superiores. Asimismo, un conjunto de datos (muestra o población) puede ser incluso más finamente dividido por medio de percentiles, el 99o percentil separa el 1% más
alto del 99% más bajo, y así sucesivamente. A menos que el número de observaciones sea
un múltiplo de 100, se debe tener cuidado al obtener percentiles. En el capítulo 4 se utilizarán percentiles con conexión con ciertos modelos de poblaciones infinitas y por tanto su discusión se pospone hasta ese punto.
La media es bastante sensible a un solo valor extremo, mientras que la mediana es insensible a muchos valores apartados. Como el comportamiento extremo de uno u otro tipo
podría ser indeseable, se consideran brevemente medidas alternativas que no son ni sensibles como x ni tan insensibles como |
x . Para motivar estas alternativas, obsérvese que x y |
x
se encuentran en extremos opuestos de la misma “familia” de medidas. La media es el promedio de todos los datos, mientras que la mediana resulta de eliminar todos excepto uno o
dos valores medios y luego promediar. Parafraseando, la media implica recortar 0% de cada
extremo de la muestra, mientras que en el caso de la mediana se recorta la cantidad máxima
posible de cada extremo. Una muestra recortada es un término medio entre x y |
x . Una media 10% recortada, por ejemplo, se calcularía eliminando el 10% más pequeño y el 10%
más grande de la muestra y luego promediando lo que queda.
Ejemplo 1.14
La producción de Bidri es una artesanía tradicional de India. Las artesanías Bidri (tazones,
recipientes, etc.) se funden con una aleación que contiene principalmente zinc y algo de cobre. Considere las siguientes observaciones sobre contenido de cobre (%) de una muestra de
artefactos Bidri tomada del Museo Victoria y Albert en Londres (“Enigmas of Bidri”, Surface Engr., 2005: 333-339), enlistadas en orden creciente.
2.0 2.4 2.5 2.6 2.6 2.7 2.7 2.8 3.0 3.1 3.2 3.3
3.4 3.4 3.6 3.6 3.6 3.6 3.7 4.4 4.6 4.7 4.8 5.3
3.3
10.1
La figura 1.16 es una gráfica de puntos de los datos. Una característica prominente es el valor
extremo único en el extremo superior; la distribución está más dispersa en la región de valores
grandes que en el caso de valores pequeños. La media muestral y la mediana son 3.65 y 3.35,
respectivamente. Se obtiene una media recortada (xr) con un porcentaje de recorte de 100(2/26)
7.7% al eliminar las dos observaciones más pequeñas y las dos más grandes; esto da
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
Page 29
29
1.3 Medidas de ubicación
1
2
3
4
5
6
7
8
9
10
11
x–
–x
r(7.7)
x~
Figura 1.16
Gráfica de puntos de contenidos de cobre del ejemplo 1.14.
xrs7.7d 5 3.42. El recorte en este caso elimina el valor extremo más grande y por tanto aproxima la media recortada hacia la mediana.
■
Una media recortada con un porcentaje de recorte moderado, algo entre 5 y 25%, producirá una medida del centro que no es ni tan sensible a los valores apartados como la media ni tan insensible como la mediana. Si el porcentaje de recorte deseado es 100% y n no
es un entero, la media recortada debe ser calculada por interpolación. Por ejemplo, considérese 0.10 para un porcentaje de recorte de 10% y n 26 como en el ejemplo 1.14. Entonces xrs10d sería el promedio ponderado apropiado de la media 7.7% recortada calculada allí
y la media 11.5% recortada que resulta de recortar tres observaciones de cada extremo.
Datos categóricos y proporciones muestrales
Cuando los datos son categóricos, una distribución de frecuencia o una distribución de frecuencia relativa proporciona un resumen tabular efectivo de los datos. Las cantidades resumidas numéricas naturales en esta situación son las frecuencias individuales y las frecuencias
relativas. Por ejemplo, si se realiza una encuesta de personas que poseen cámaras digitales
para estudiar la preferencia de marcas y cada persona en la muestra identifica la marca de
cámara que él o ella posee, con lo cual se podría contar el número que poseen Cannon, Sony,
Kodak, y así sucesivamente. Considérese muestrear una población dividida en dos partes,
una que consiste en sólo dos categorías (tal como votó o no votó en la última elección, si
posee o no una cámara digital, etc.). Si x denota el número en la muestra que cae en la
categoría 1, entonces el número en el categoría 2 es n x. La frecuencia relativa o proporción muestral en la categoría 1 es x/n y la proporción muestral en la categoría 2 es 1 x/n.
Que 1 denote una respuesta que cae en la categoría 1 y que 0 denote una respuesta que cae
en la categoría 2. Un tamaño de muestra de n 10 podría dar entonces las respuestas 1, 1,
0, 1, 1, 1, 0, 0, 1, 1. La media muestral de esta muestra numérica es (como el número de
unos x 7)
x1 1 c1 xn
1 1 1 1 0 1 c1 1 1 1
x
7
5
5 n 5 proporción muestral
5
n
10
10
Más generalmente, enfóquese la atención en una categoría particular y codifíquense
los resultados de modo que se anote un 1 para una observación comprendida en la categoría y un 0 para una observación no comprendida en la categoría. Entonces la proporción
muestral de observaciones comprendida en la categoría es la media muestral de la secuencia de los 1 y los 0. Por consiguiente se puede utilizar una media muestral para resumir los
resultados de una muestra categórica. Estos comentarios también se aplican a situaciones en
las cuales las categorías se definen agrupando valores en una muestra o población numérica (p. ej., podría existir interés en saber si las personas han tenido su automóvil actual durante por lo menos 5 años, en lugar de estudiar la duración exacta de la tenencia).
Análogo a la proporción muestral x/n de personas u objetos que caen en una categoría particular, que p represente la proporción de aquellos presentes en toda la población que
cae en la categoría. Como con x/n, p es una cantidad entre 0 y 1 y mientras que x/n es
una característica de muestra, p es una característica de la población. La relación entre las
www.FreeLibros.me
c1_p001-045.qxd
30
3/12/08
CAPÍTULO 1
2:31 AM
Page 30
Generalidades y estadística descriptiva
| y entre x y m. En particular, subsecuentemente se utilidos es igual a la relación entre |
x ym
zará x/n para hacer inferencias sobre p. Si, por ejemplo, una muestra de 100 propietarios de
automóviles reveló que 22 tenían su automóvil desde por lo menos 5 años atrás, en tal caso se
podría utilizar 22/100 0.22 como estimación puntual de la proporción de todos los propietarios que tenían su automóvil desde por lo menos 5 años atrás. Se estudiarán las propiedades
de x/n como una estimación de p para ver cómo se puede utilizar x/n para responder otras preguntas inferenciales. Con k categorías (k > 2), se pueden utilizar las k proporciones muestrales para responder preguntas sobre las proporciones de población p1, . . . , pk.
EJERCICIOS
Sección 1.3 (33-43)
33. El artículo (“The Pedaling Technique of Elite Endurance
Cyclists”, Inst. J. of Sport Biomechanics, 1991: 29-53) reportó los datos adjuntos sobre potencia de una sola pierna
sometida a una alta carga de trabajo.
244 191 160 187 180 176 174
205 211 183 211 180 194 200
a. Calcule e interprete la media y la mediana muestral.
b. Suponga que la primera observación hubiera sido 204 en
lugar de 244. ¿Cómo cambiarían la media y la mediana?
c. Calcule una media recortada eliminando las observaciones muestrales más pequeñas y más grandes. ¿Cuál es el
porcentaje de recorte correspondiente?
d. El artículo también reportó valores de potencia de una
sola pierna con carga de trabajo baja. La media muestral
de n 13 observaciones fue x 119.8 (en realidad
119.7692) y la 14a. observación, algo así como un valor extremo, fue 159. ¿Cuál es el valor de x de toda la muestra?
34. La exposición a productos microbianos, especialmente endotoxina, puede tener un impacto en la vulnerabilidad a
enfermedades alérgicas. El artículo (“Dust Sampling Methods
for Endotoxin-An Essential, But Underestimated Issue”,
Indoor Air, 2006: 20-27) consideró temas asociados con la
determinación de concentración de endotoxina. Los siguientes datos sobre concentración (EU/mg) en polvo asentado
de una muestra de hogares urbanos y otra de casas campestres fueron amablemente suministrados por los autores del
artículo citado.
U: 6.0 5.0 11.0 33.0 4.0 5.0 80.0 18.0 35.0 17.0 23.0
C: 4.0 14.0 11.0 9.0 9.0 8.0 4.0 20.0 5.0 8.9 21.0
9.2 3.0 2.0 0.3
a. Determine la media muestral de cada muestra. ¿Cómo se
comparan?
b. Determine la mediana muestral de cada muestra. ¿Cómo
se comparan? ¿Por qué es la mediana de la muestra urbana tan diferente de la media de dicha muestra?
c. Calcule la media recortada de cada muestra eliminando
la observación más pequeña y más grande. ¿Cuáles son
los porcentajes de recorte correspondientes? ¿Cómo se
comparan los valores de estas medias recortadas a las
medias y medianas correspondientes?
35. La presión de inyección mínima (lb/pulg2) de especímenes
moldeados por inyección de fécula de maíz se determinó
con ocho especímenes diferentes (la presión más alta corresponde a una mayor dificultad de procesamiento) y se
obtuvieron las siguientes observaciones (tomadas de “Thermoplastic Starch Blends with Polyethylene-Co-Vinyl Alcohol: Processability and Physical Properties”, Polymer Engr.
and Science, 1994: 17-23):
15.0
13.0
18.0
14.5
12.0
11.0
8.9
8.0
a. Determine los valores de la media muestral, la mediana
muestral y la media 12.5% recortada y compare estos
valores.
b. ¿En cuánto se podría incrementar la observación de la
muestra más pequeña, actualmente 8.0, sin afectar el valor de la mediana muestral?
c. Suponga que desea los valores de la media y la mediana
muestrales cuando las observaciones están expresadas en
kilogramos por pulgada cuadrada (kg/pulg2) en lugar de
lb/pulg2. ¿Es necesario volver a expresar cada observación
en kg/pulg2 o se pueden utilizar los valores calculados en
el inciso a) directamente? [Sugerencia: 1 kg 2.2 lb.]
36. Una muestra de 26 trabajadores de plataforma petrolera marina tomaron parte en un ejercicio de escape y se obtuvieron
los datos adjuntos de tiempo (s) para completar el escape
(“Oxygen Consumption and Ventilation During Escape from
an Offshore Platform”, Ergonomics, 1997: 281-292):
389
373
392
356
373
369
359
370
374
363
364
359
375
366
356
424
364
403
325
325
334
394
339
397
402
393
a. Construya una gráfica de tallo y hojas de los datos. ¿Cómo sugiere la gráfica que la media y mediana muestrales se comparen?
b. Calcule los valores de la media y mediana muestrales
[Sugerencia: xi 9638.]
c. ¿En cuánto se podría incrementar el tiempo más largo,
actualmente de 424, sin afectar el valor de la mediana
muestral? ¿En cuánto se podría disminuir este valor sin
afectar el valor de la mediana muestral?
d. ¿Cuáles son los valores de x y |
x cuando las observaciones se reexpresan en minutos?
37. El artículo (“Snow Cover and Temperature Relationships in
North America and Eurasia”, J. Climate and Applied Meteorology, 1983: 460-469) utilizó técnicas estadísticas para
relacionar la cantidad de cobertura de nieve sobre cada
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
Page 31
1.4 Medidas de variabilidad
41. Se eligió una muestra de n 10 automóviles y cada uno se
sometió a una prueba de choque a 5 mph. Denotando un carro sin daños visibles por S (por éxito) y un carro con daños
por F, los resultados fueron los siguientes:
continente para promediar la temperatura continental. Los
datos allí presentados incluyeron las siguientes diez observaciones de la cobertura de nieve en octubre en Eurasia durante los años 1970-1979 (en millones de km2):
6.5 12.0 14.9 10.0 10.7 7.9 21.9 12.5 14.5 9.2
S S F S S S F F S S
¿Qué reportaría como valor representativo, o típico de cobertura de nieve en octubre durante este periodo y qué motivaría su elección?
a. ¿Cuál es el valor de la proporción muestral de éxitos
x/n?
b. Reemplace cada S con 1 y cada F con 0. Acto seguido
calcule x de esta muestra numéricamente codificada.
¿Cómo se compara x con x/n?
c. Suponga que se decide incluir 15 carros más en el experimento. ¿Cuántos de éstos tendrían que ser S para dar
x/n 0.80 para toda la muestra de 25 carros?
38. Los valores de presión sanguínea a menudo se reportan a
los 5 mmHg más cercanos (100, 105, 110, etc.). Suponga
que los valores de presión sanguínea reales de nueve individuos seleccionados al azar son
118.6
131.5
127.4
133.2
138.4
130.0
113.7
122.0
108.3
42. a. Si se agrega una constante c a cada xi en una muestra y
se obtiene yi xi c, ¿cómo se relacionan la media
y mediana muestrales de las yi con la media y mediana
muestrales de las xi? Verifique sus conjeturas.
b. Si cada xi se multiplica por una constante c y se obtiene
yi cxi, responda la pregunta del inciso a). De nuevo,
verifique sus conjeturas.
a. ¿Cuál es la mediana de los valores de presión sanguínea
reportados?
b. Suponga que la presión sanguínea del segundo individuo es 127.6 en lugar de 127.4 (un pequeño cambio en
un solo valor). ¿Cómo afecta esto a la mediana de los valores reportados? ¿Qué dice esto sobre la sensibilidad de
la mediana al redondeo o agrupamiento en los datos?
43. Un experimento para estudiar la duración (en horas) de
un cierto tipo de componente implicaba poner diez
componentes en operación y observarlos durante 100 horas. Ocho de ellos fallaron durante dicho periodo y se registraron las duraciones. Denote las duraciones de dos
componentes que continuaron funcionando después
de 100 horas por 100. Las observaciones muestrales resultantes fueron:
39. La propagación de grietas provocadas por fatiga en varias
partes de un avión ha sido el tema de extensos estudios en
años recientes. Los datos adjuntos se componen de vidas de
propagación (horas de vuelo/104) para alcanzar un tamaño
de agrietamiento dado en orificios para sujetadores utilizados en aviones militares (“Statistical Crack Propagation in
Fastener Holes ander Spectrum Loading”, J. Aircraft, 1983:
1028-1032):
0.736
1.011
0.863
1.064
0.865
1.109
0.913
1.132
0.915
1.140
0.937
1.153
0.983
1.253
31
48
1.007
1.394
79
100
35
92
86
57
100
17
29
¿Cuáles de las medidas del centro discutidas en esta sección
pueden ser calculadas y cuáles son los valores de dichas
medidas? [Nota: Se dice que los datos obtenidos con este
experimento están “censurados a la derecha”.]
a. Calcule y compare los valores de la media y mediana
muestrales.
b. ¿En cuánto se podría disminuir la observación muestral
más grande sin afectar el valor de la mediana?
40. Calcule la mediana muestral, media 25% recortada, media
10% recortada y media muestral de los datos de duración
dados en el ejercicio 27 y compare estas medidas.
1.4 Medidas de variabilidad
El reporte de una medida de centro da sólo información parcial sobre un conjunto o distribución de datos. Diferentes muestras o poblaciones pueden tener medidas idénticas de centro y aún diferir entre sí en otras importantes maneras. La figura 1.17 muestra gráficas de
puntos de tres muestras con las mismas media y mediana, aunque el grado de dispersión en
1:
*
*
*
*
*
*
*
*
*
2:
3:
30
Figura 1.17
40
50
60
70
Muestras con medidas idénticas de centro pero diferentes cantidades de variabilidad.
www.FreeLibros.me
c1_p001-045.qxd
32
3/12/08
CAPÍTULO 1
2:31 AM
Page 32
Generalidades y estadística descriptiva
torno al centro es diferente para las tres muestras. La primera tiene la cantidad más grande
de variabilidad, la tercera tiene la cantidad más pequeña y la segunda es intermedia con respecto a las otras dos.
Medidas de variabilidad de datos muestrales
La medida más simple de variabilidad en una muestra es el rango, el cual es la diferencia
entre los valores muestrales más grande y más pequeño. El valor del rango de la muestra 1 en
la figura 1.17 es mucho más grande que el de la muestra 3, lo que refleja más variabilidad
en la primera muestra que en la tercera. Un defecto del rango, no obstante, es que depende
de sólo las dos observaciones más extremas y hace caso omiso de las posiciones de los n – 2
valores restantes. Las muestras 1 y 2 en la figura 1.17 tienen rangos idénticos, aunque cuando se toman en cuenta las observaciones entre los dos extremos, existe mucho menos variabilidad o dispersión en la segunda muestra que en la primera.
Las medidas principales de variabilidad implican las desviaciones de la media,
x1 x, x2 x, . . . , xn x. Es decir, las desviaciones de la media se obtienen restando x de
cada una de la n observaciones muestrales. Una desviación será positiva si la observación
es más grande que la media (a la derecha de la media sobre el eje de medición) y negativa
si la observación es más pequeña que la media. Si todas las desviaciones son pequeñas en
magnitud, entonces todas las xi se aproximan a la media y hay poca variabilidad. Alternativamente, si algunas de las desviaciones son grandes en magnitud, entonces algunas xi quedan lejos de x lo que sugiere una mayor cantidad de variabilidad. Una forma simple de
combinar las desviaciones en una sola cantidad es promediarlas. Desafortunadamente, esto
es una mala idea:
n
suma de desviaciones (xi x ) 0
i1
por lo que la desviación promedio siempre es cero. La verificación utiliza varias reglas estándar y el hecho de que x x x x nx:
n
(xi x) xi x xi nx xi n 1 xi 0
¿Cómo se puede evitar que las desviaciones negativas y positivas se neutralicen entre sí
cuando se combinan? Una posibilidad es trabajar con los valores absolutos de las desviaciones y calcular la desviación absoluta promedio °xi x°/n. Como la operación de valores
absolutos conduce a dificultades teóricas, considérense en cambio las desviaciones al cuadrado (x1 x )2, (x2 x )2, . . . , (xn x )2. En vez de utilizar la desviación al cuadrado promedio (xi x )2/n, por varias razones se divide la suma de desviaciones al cuadrado
entre n 1 en lugar de entre n.
DEFINICIÓN
La varianza muestral, denotada por s2 está dada por
s2
(xi x)2
n1
Sxx
n1
La desviación estándar muestral, denotada por s, es la raíz cuadrada (positiva) de la
varianza
s s2
Obsérvese que s2 y s son no negativas. La unidad de s es la misma que la de cada una de las
xi. Si por ejemplo, las observaciones son eficiencias de combustible en millas por galón, entonces se podría tener s 2.0 mpg. Una interpretación preliminar de la desviación estándar
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
Page 33
1.4 Medidas de variabilidad
33
muestral es que es el tamaño de una desviación típica o representativa de la media muestral
dentro de la muestra dada. Por tanto si s 2.0 mpg, entonces algunas xi en la muestra se
aproximan más que 2.0 a x, en tanto que otras están más alejadas; 2.0 es una desviación representativa (o “estándar”) de la eficiencia de combustible media. Si s 3.0 de una segunda
muestra de carros de otro tipo, una desviación típica en esta muestra es aproximadamente 1.5
veces la de la primera muestra, una indicación de más variabilidad en la segunda muestra.
Ejemplo 1.15
La resistencia es una característica importante de los materiales utilizados en casas prefabricadas. Cada uno de n 11 elementos de placa prefabricados se sometieron a prueba de esfuerzo severo y se registró el ancho máximo (mm) de las grietas resultantes. Los datos
proporcionados (tabla 1.3) aparecieron en el artículo (“Prefabricated Ferrocement Ribbed
Elements for Low-Cost Housing”, J. Ferrocement, 1984: 347-364).
Tabla 1.3
Datos del ejemplo 1.15
xi x
(xi x )2
0.684
2.540
0.924
3.130
1.038
0.598
0.483
3.520
1.285
2.650
1.497
0.9841
0.8719
0.7441
1.4619
0.6301
1.0701
1.1851
1.8519
0.3831
0.9819
0.1711
0.9685
0.7602
0.5537
2.1372
0.3970
1.1451
1.4045
3.4295
0.1468
0.9641
0.0293
xi 18.349
(xi x ) 0.0001
xi
Sxx (xi x )2 11.9359
x 18.349/11 1.6681
Los efectos de redondeo hacen que la suma de las desviaciones no sea exactamente cero.
El numerador de s2 es 11.9359, por consiguiente s2 11.9359/(11 1) 11.9359/10
9
3
5
9
1.0925 mm.
■
1.19359 y s 1.1
Motivación para s2
Para explicar el porqué del divisor n 1 en s2, obsérvese primero que en tanto que s2 mide
la variabilidad muestral, existe una medida de variabilidad en la población llamada varianza
poblacional. Se utilizará 2 (el cuadrado de la letra griega sigma minúscula) para denotar la
varianza poblacional y para denotar la desviación estándar poblacional (la raíz cuadrada de
2
). Cuando la población es finita y se compone de N valores,
N
2 (xi )2/N
i1
la cual es el promedio de todas las desviaciones al cuadrado con respecto a la media poblacional (para la población, el divisor es N y no N 1). En los capítulos 3 y 4 aparecen definiciones
más generales de 2.
Así como x se utilizará para hacer inferencias sobre la media poblacional , se deberá definir la variancia muestral de modo que pueda ser utilizada para hacer inferencias
sobre 2. Ahora obsérvese que 2 implica desviaciones cuadradas con respecto a la media poblacional . Si en realidad se conociera el valor de , entonces se podría definir la
www.FreeLibros.me
c1_p001-045.qxd
34
3/12/08
CAPÍTULO 1
2:31 AM
Page 34
Generalidades y estadística descriptiva
varianza muestral como la desviación al cuadrado promedio de las xi de la muestra con
respecto a . Sin embargo, el valor de casi nunca es conocido, por lo que se debe utilizar el cuadrado de la suma de las desviaciones con respecto a x. Pero las xi tienden a
acercarse más a su valor promedio que el promedio poblacional , así que para compensar esto se utiliza el divisor n – 1 en lugar de n. En otras palabras, si se utiliza un divisor
n en la varianza muestral, entonces la cantidad resultante tendería a subestimar 2 (se producen valores demasiado pequeños en promedio), mientras que si se divide entre el divisor un poco más pequeño n – 1 se corrige esta subestimación.
Se acostumbra referirse a s2 que está basada en n – 1 grados de libertad (gl o df, por
sus siglas en inglés). Esta terminología se deriva del hecho de que aunque s2 está basada en
las n cantidades x1 x, x2 x, . . . , xn x, éstas suman 0, por lo que al especificar los
valores de cualquier n – 1 de las cantidades se determina el valor restante. Por ejemplo, si
n 4 y x1 x 8, x2 x 6 y x4 x 4, entonces automáticamente x3 x 2,
así que sólo tres de los cuatro valores de xi x son libremente determinados (3 gl).
Una fórmula para calcular s2
Es mejor obtener s2 con software estadístico o bien utilizar una calculadora que permita ingresar datos en la memoria y luego ver s2 con un solo golpe de tecla. Si su calculadora no
tiene esta capacidad, existe una fórmula alternativa para Sxx que evita calcular las desviacio2
nes. La fórmula implica sumar ( xi ) , sumar y luego elevar al cuadrado y xi2, elevar al
cuadrado y sumar.
Una alternativa para el numerador de s2 es
Sxx (xi x )2 x2i
Comprobación
( xi)2
n
2
Como x xi/n, nx 2 ( xi ) /n. Entonces
(xi x )2 (x2i 2x xi x 2) x2i 2x xi (x )2
x2i 2x nx n(x )2 x2i n(x )2
Ejemplo 1.16
La cantidad de luz reflejada por las hojas ha sido utilizada para varios propósitos, incluidas la
evaluación del color del césped, la estimación del estado del nitrógeno y la medición de la biomasa. El artículo (“Leaf Reflectance-Nitrogen-Chlorophyll Relations in Buffel-Grass”, Photogrammetric Engr. and Remote Sensing, 1985: 463-466) dio las siguientes observaciones
obtenidas por medio de espectrofotogrametría, de la reflexión de las hojas en condiciones experimentales.
Observación
xi
x2i
Observación
xi
x2i
1
2
3
4
5
6
7
8
15.2
16.8
12.6
13.2
12.8
13.8
16.3
13.0
231.04
282.24
158.76
174.24
163.84
190.44
265.69
169.00
9
10
11
12
13
14
15
12.7
15.8
19.2
12.7
15.6
13.5
12.9
161.29
249.64
368.64
161.29
243.36
182.25
166.41
xi 216.1
x 2i 3168.13
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
Page 35
1.4 Medidas de variabilidad
35
La fórmula de cálculo ahora da
Sxx
x2i
( xi)2
n
(216.1)2
15
3168.13 3113.28 54.85
3168.13
con la cual s2 Sxx /(n 1) 54.85/14 3.92 y s 1.98.
■
Tanto la fórmula definitoria como la de cálculo para s2 pueden ser sensibles al redondeo, por
lo que en los cálculos intermedios se deberá usar tanta precisión decimal como sea posible.
Algunas otras propiedades de s2 pueden mejorar el entendimiento y facilitar el cálculo.
PROPOSICIÓN
Sean x1, x2, . . . , xn una muestra y c cualquier constante no cero.
1.
2.
Si y1 x1 c, y2 x2 c, . . . , yn xn c, entonces s2y s2x, y
Si y1 cx1, . . . , yn cxn, entonces s2y c2s2x, sy °c°sx,
donde s2x es la varianza muestral de las x y s2y es la varianza muestral de las y.
En palabras, el resultado 1 dice que si se suma una constante c (o resta) de cada valor de dato,
la varianza no cambia. Esto es intuitivo, puesto que la adición o sustracción de c cambia la
localización del conjunto de datos pero deja las distancias iguales entre los valores de datos.
De acuerdo con el resultado 2, la multiplicación de cada xi por c hace que s2 sea multiplicada
por un factor de c2. Estas propiedades pueden ser comprobadas al observar que en el resultado 1, y x c y que en el resultado 2, y cx.
Gráficas de caja
Las gráficas de tallo y hojas e histogramas transmiten impresiones un tanto generales sobre
un conjunto de datos, mientras que un resumen único tal como la media o la desviación estándar se enfoca en sólo un aspecto de los datos. En años recientes, se ha utilizado con éxito un
resumen gráfico llamado gráfica de caja para describir varias de las características más prominentes de un conjunto de datos. Estas características incluyen 1) el centro, 2) la dispersión, 3) el grado y naturaleza de cualquier alejamiento de la simetría y 4) la identificación
de las observaciones “extremas o apartadas” inusualmente alejadas del cuerpo principal de los
datos. Como incluso un solo valor extremo puede afectar drásticamente los valores de x y s,
una gráfica de caja está basada en medidas “resistentes” a la presencia de unos cuantos valores apartados, la mediana y una medida de variabilidad llamada dispersión de los cuartos.
DEFINICIÓN
Se ordenan las observaciones de la más pequeña a la más grande y se separa la mitad
más pequeña de la más grande; se incluye la mediana ~x en ambas mitades si n es impar. En tal caso el cuarto inferior es la mediana de la mitad más pequeña y el cuarto superior es la mediana de la mitad más grande. Una medida de dispersión que es
resistente a los valores apartados es la dispersión de los cuartos fs, dada por
fs cuarto superior – cuarto inferior
En general, la dispersión de los cuartos no se ve afectada por las posiciones de las observaciones comprendidas en el 25% más pequeño o el 25% más grande de los datos. Por consiguiente es resistente a valores apartados.
La gráfica de caja más simple se basa en el siguiente resumen de cinco números:
xi más pequeñas
cuarto inferior
www.FreeLibros.me
mediana
cuarto superior
xi más grandes
c1_p001-045.qxd
CAPÍTULO 1
2:31 AM
Page 36
Generalidades y estadística descriptiva
Primero, se traza una escala de medición horizontal. Luego se coloca un rectángulo sobre este eje; el lado izquierdo del rectángulo está en el cuarto inferior y el derecho en el cuarto superior (por lo que el ancho de la caja fs). Se coloca un segmento de línea vertical o algún
otro símbolo dentro del rectángulo en la ubicación de la mediana; la posición del símbolo de
mediana con respecto a los dos lados da información sobre asimetría en el 50% medio de los
datos. Por último, se trazan “bigotes” hacia fuera de ambos extremos del rectángulo hacia las
observaciones más pequeñas y más grandes. También se puede trazar una gráfica de caja con
orientación vertical mediante modificaciones obvias en el proceso de construcción.
Ejemplo 1.17
Se utilizó ultrasonido para reunir los datos de corrosión adjuntos de la placa de piso de un
tanque elevado utilizado para almacenar petróleo crudo (“Statistical Analysis of UT Corrosion Data from Floor Plates of a Crude Oil Aboveground Storage Tank”, Materials Eval.,
1994: 846-849); cada observación es la profundidad de picadura más grande en la placa, expresada en milésimas de pulgada.
¨
«
«
«
«
«
«
«
«
«
©
«
«
«
«
«
«
«
«
ª
40 52 55 60 70 75 85 85 90 90 92 94 94 95 98 100 115 125 125
¨
«
«
«
«
«
«
«
©
«
«
«
«
«
«
«
«
ª
36
3/12/08
El resumen de cinco números es como sigue:
xi más pequeña 40
xi más grande 125
cuarto inferior 72.5
|
x 90
cuarto superior 96.5
La figura 1.18 muestra la gráfica de caja resultante. El lado derecho de la caja está mucho
más cerca a la mediana que el izquierdo, lo que indica una asimetría sustancial en la mitad
derecha de los datos. El ancho de la caja (fs) también es razonablemente grande con respecto al rango de datos (distancia entre las puntas de los bigotes).
40
Figura 1.18
50
60
70
80
90
Profundidad
100 110 120 130
Gráfica de caja de los datos de corrosión.
La figura 1.19 muestra los resultados obtenidos con MINITAB en respuesta a la petición de describir los datos de corrosión. La media recortada es el promedio de las 17 observaciones que permanecen después de eliminar los valores más grandes y más pequeños
(porcentaje de recorte 5%), Q1 y Q3 son los cuartiles inferior y superior; éstos son similares a los cuartos pero se calculan de una manera diferente; el error estándar promedio
(SE Mean) es s/n; esta será una importante cantidad en el trabajo subsiguiente con respecto a inferencias en torno a .
Profundidad N
variable 19
Profundidad
variable
Figura 1.19
Media
86.32
Mínima
40.00
Media
90.00
Media recortada
86.76
Máxima
125.00
Q1
70.00
Desv. estándar
23.32
Media SE
5.35
Q3
98.00
Descripción de MINITAB de los datos de profundidad de picaduras.
■
Gráficas de caja que muestran valores apartados
Una gráfica de caja puede ser embellecida para indicar explícitamente la presencia de valores apartados. Muchos procedimientos inferenciales se basan en la suposición de que la distribución de la población es normal (un cierto tipo de curva en forma de campana). Incluso
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
Page 37
1.4 Medidas de variabilidad
DEFINICIÓN
37
Cualquier observación a más de 1.5fs del cuarto más cercano es un valor apartado (o
atípico). Un valor apartado es extremo si se encuentra a más de 3fs del cuarto más
cercano y moderado de lo contrario.
un solo valor apartado extremo que aparezca en la muestra advierte al investigador que tales procedimientos pueden ser no confiables y la presencia de varios valores apartados transmite el mismo mensaje.
Modifíquese ahora la construcción previa de una gráfica de caja trazando un bigote que
sale de cada extremo de la caja hacia las observaciones más pequeñas y más grandes que no
son valores apartados. Cada valor apartado moderado está representado por un círculo cerrado y cada valor apartado extremo por uno abierto. Algunos programas de computadora estadísticos no distinguen entre valores apartados moderados y extremos.
Ejemplo 1.18
Los efectos de descargas parciales en la degradación de materiales para cavidades aislantes
tienen implicaciones importantes en relación con las duraciones de componentes de alto voltaje. Considérese la siguiente muestra de n 25 anchos de pulso de descargas lentas en una
cavidad cilíndrica de polietileno. (Estos datos son consistentes con un histograma de 250
observaciones en el artículo “Assessment of Dielectric Degradation by Ultrawide-band PD
Detection”, IEEE Trans. on Dielectrics and Elec. Insul., 1995: 744-760.) El autor del artículo señala el impacto de una amplia variedad de herramientas estadísticas en la interpretación
de datos de descarga.
5.3 8.2
94.9 95.5
13.8
95.8
74.1 85.3
95.9 96.6
88.0
96.7
90.2
98.1
91.5
99.0
92.4
101.4
92.9
103.7
93.6 94.3
106.0 113.5
94.8
Las cantidades pertinentes son
x̃ 94.8
fs 6.5
cuarto inferior 90.2
1.5fs 9.75
cuarto superior 96.7
3fs 19.50
Por lo tanto, cualquier observación menor que 90.2 9.75 80.45 o mayor que 96.7
9.75 106.45 es un valor apartado. Hay un valor apartado en el extremo superior de la
muestra y cuatro en el extremo inferior. Debido a que 90.2 19.5 70.7, las tres observaciones 5.3, 8.2 y 13.8 son valores apartados extremos; los otros dos son moderados. Los bigotes se extienden a 85.3 y 106.0, las observaciones más extremas que no son valores
apartados. La gráfica de caja resultante aparece en la figura 1.20. Existe una gran cantidad
de asimetría negativa en la mitad media de la muestra así como también en toda la muestra.
0
50
100
Ancho de pulso
Figura 1.20 Gráfica de caja de los datos de ancho de pulso que muestra valores apartados moderados y extremos.
■
Gráficas de caja comparativas
Una gráfica de caja comparativa o lado a lado es una forma muy efectiva de revelar similitudes y diferencias entre dos o más conjuntos de datos compuestos de observaciones de la misma variable, observaciones de eficiencia de consumo de combustible de cuatro tipos distintos
de automóviles, rendimientos de cosechas de tres variedades diferentes y así sucesivamente.
www.FreeLibros.me
c1_p001-045.qxd
38
3/12/08
CAPÍTULO 1
2:31 AM
Page 38
Generalidades y estadística descriptiva
Ejemplo 1.19
En años recientes, algunas evidencias sugieren que las altas concentraciones de radón bajo
techo pueden estar ligadas al desarrollo de cánceres en niños, pero muchos profesionales de
la salud aún no están convencidos. Un artículo reciente (“Indoor Radon and Childhood Cancer”, The Lancet, 1991: 1537-1538) presentó los datos adjuntos sobre concentración de radón (Bq/m3) en dos muestras diferentes de casas. La primera consistió en casas en las cuales
un niño diagnosticado con cáncer había estado residiendo. Las casas en la segunda muestra
no incluían casos registrados de cáncer infantil. La figura 1.21 presenta una gráfica de tallo
y hojas de los datos.
1. Con cáncer
2. Sin cáncer
9683795
86071815066815233150
12302731
8349
5
7
HI: 210
Figura 1.21
0
1
2
3
4
5
6
7
8
95768397678993
12271713114
99494191
839
55
5
Tallo: dígitos de decenas
Hojas: dígitos de unidades
Gráfica de tallo y hojas del ejemplo 1.19.
El resumen de cantidades numéricas es el siguiente:
Con cáncer
Sin cáncer
x
|
x
s
fs
22.8
19.2
16.0
12.0
31.7
17.0
11.0
18.0
Los valores tanto de la media como de la mediana sugieren que la muestra de cáncer se encuentra en el centro un poco a la derecha de la muestra sin cáncer sobre la escala de medición. La media, sin embargo, exagera la magnitud de este desplazamiento, en gran medida
debido a la observación 210 en la muestra con cáncer. Los valores de s sugieren más variabilidad en la muestra con cáncer que en la muestra sin cáncer, pero las dispersiones de los
cuartos contradicen esta impresión. De nuevo, la observación 210, un valor apartado extremo, es el culpable. La figura 1.22 muestra una gráfica de caja comparativa generada por el
Concentración
de radón
200
150
100
50
0
Sin cáncer
Figura 1.22
Con cáncer
Gráfica de caja de los datos del ejemplo 1.19, obtenida con S-Plus.
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
Page 39
1.4 Medidas de variabilidad
39
programa de computadora S-Plus. La caja sin cáncer aparece alargada en comparación con
la caja con cáncer (fs 18 vs. fs 11) y las posiciones de las líneas medianas en las dos cajas muestran más asimetría en la mitad media de la muestra sin cáncer que la muestra con
cáncer. Los valores apartados están representados por segmentos de línea horizontales y no
hay distinción entre los valores apartados moderados y extremos.
■
EJERCICIOS
Sección 1.4 (44-61)
44. El artículo (“Oxygen Consumption During Fire Suppression: Error of Heart Rate Estimation”, Ergonomics, 1991:
1469-1474) reportó los siguientes datos sobre consumo de
oxígeno (ml/kg/min) para una muestra de diez bomberos
que realizaron un simulacro de supresión de incendio.
29.5 49.3 30.6 28.2 28.0 26.3 33.9 29.4 23.5 31.6
Calcule lo siguiente:
a. El rango muestral.
b. La varianza muestral s2 a partir de la definición (es decir, calculando primero las desviaciones y luego elevándolas al cuadrado, etcétera).
c. La desviación estándar muestral.
d. s2 utilizando el método más corto.
leídas en una gráfica que aparece en el artículo (“Heat-Resistant Active Brazing of Silicon Nitride: Mechanical Evaluation of Braze Joints”, Welding J., agosto de 1997):
87
115.9
114.6
115.2
U:
C:
46. Las observaciones adjuntas de viscosidad estabilizada (cP)
realizadas en probetas de un cierto grado de asfalto con
18% de caucho agregado se tomaron del artículo (“Viscosity Characteristics of Rubber-Modified Asphalts”, J. of
Materials in Civil Engr. 1996: 153-156):
2781
2900
3013
2856
2888
a. ¿Cuáles son los valores de la media y mediana muestrales?
b. Calcule la varianza muestral por medio de la fórmula de
cálculo. [Sugerencia: Primero reste un número conveniente de cada observación.]
47. Calcule e interprete los valores de la mediana muestral, la
media muestral y la desviación estándar muestral de las siguientes observaciones de resistencia a la fractura (MPa,
98
105
114
128
131
142
168
6.0 5.0 11.0 33.0 4.0 5.0 80.0 18.0 35.0 17.0 23.0
4.0 14.0 11.0 9.0 9.0 8.0 4.0 20.0 5.0 8.9 21.0
9.2 3.0 2.0 0.3
a. Determine el valor de la desviación estándar muestral de
cada muestra, interprete estos valores y luego contraste
la variabilidad en las dos muestras. [Sugerencia: xi
237.0 para la muestra urbana y 128.4 para la muestra
campestre y x 2i 10 079 para la muestra urbana y
1617.94 para la muestra campestre.]
b. Calcule la dispersión de los cuartos de cada muestra y
compare. ¿Transmiten el mismo mensaje las dispersiones de los cuartos sobre la variabilidad que las desviaciones estándar? Explique.
c. Los autores del artículo citado también proporcionan
concentraciones de endotoxina en el polvo presente en
bolsas captadoras de polvo:
115.8
a. Calcule x y las desviaciones de la media.
b. Use las desviaciones calculadas en el inciso a) para
obtener la varianza muestral y la desviación estándar
muestral.
c. Calcule s2 utilizando la fórmula para el numerador Sxx.
d. Reste 100 de cada observación para obtener una muestra de valores transformados. Ahora calcule la varianza
muestral de estos valores transformados y compárela
con s2 de los datos originales.
96
48. El ejercicio 34 presentó los siguientes datos sobre concentración de endotoxina en polvo asentado, obtenidos con una
muestra de casas urbanas y una muestra de casas campestres:
45. Se determinó el valor del módulo de Young (GPa) de placas
fundidas compuestas de ciertos sustratos intermetálicos y se
obtuvieron las siguientes observaciones muestrales
(“Strength and Modulus of a Molybdenum-Coated Ti25A1-10Nb-3U-1Mo Intermetallic”, J. of Materials Engr.
and Performance, 1997: 46-50):
116.4
93
U: 34.0 49.0 13.0 33.0 24.0 24.0 35.0 104.0 34.0 40.0 38.0 1.0
C: 2.0 64.0 6.0 17.0 35.0 11.0 17.0 13.0 5.0 27.0 23.0
28.0 10.0 13.0 0.2
Construya una gráfica de caja comparativa (como se hizo en
el artículo citado) y compare y contraste las cuatro muestras.
49. Un estudio de la relación entre edad y varias funciones visuales (tales como agudeza y percepción de profundidad)
reportó las siguientes observaciones de área de la lámina esclerótica (mm2) de las cabezas del nervio óptico humano
(“Morphometry of Nerve Fiber Bundle Pores in the Optic
Nerve Head of the Human”, Experimental Eye Research,
1988: 559-568):
2.75
4.33
2.62
3.46
2.74
4.52
3.85
2.43
2.34
3.65
2.74
2.78
3.93
3.56
4.21
3.01
3.88
a. Calcule xi y x 2i .
b. Use los valores calculados en el inciso a) para calcular la
varianza muestral s2 y luego la desviación estándar muestral s.
50. En 1997, una mujer demandó a un fabricante de teclados de
computadora y lo acusó de que sus repetitivas lesiones por
esfuerzo eran provocadas por el teclado (Genessy . Digital
www.FreeLibros.me
c1_p001-045.qxd
40
3/12/08
CAPÍTULO 1
2:31 AM
Page 40
Generalidades y estadística descriptiva
Equipment Corp.). El jurado adjudicó $3.5 millones por el
dolor y sufrimiento pero la corte anuló dicha adjudicación
por considerarla una compensación irrazonable. Al hacer esta determinación, la corte identificó un grupo “normativo” de
27 casos similares y especificó una adjudicación razonable
como una dentro de dos desviaciones estándar de la media
de las adjudicaciones en los 27 casos. Las 27 adjudicaciones
fueron (en el rango de los $1000) 37, 60, 75, 115, 135, 140,
149, 150, 238, 290, 340, 410, 600, 750, 750, 750, 1050, 1100,
1139, 1150, 1200, 1200, 1250, 1576, 1700, 1825 y 2000 con
las cuales xi 20179, x i2 24 657 511. ¿Cuál es la cantidad máxima posible que podría ser adjudicada conforme a
la regla de dos desviaciones estándar?
55. He aquí una gráfica de tallo y hojas de los datos de tiempo
de escape introducidos en el ejercicio 36 de este capítulo.
51. El artículo (“A Thin-Film Oxygen Uptake Test for the Evaluation of Automotive Crankcase Lubricants”, Lubric. Engr.,
1984: 75-83) reportó los siguientes datos sobre tiempo de inducción de oxidación (min) de varios aceites comerciales:
a. Determine el valor de la dispersión de los cuartos.
b. ¿Hay algunos valores apartados en la muestra? ¿Algunos valores apartados extremos?
c. Construya una gráfica de caja y comente sobre sus características.
d. ¿En cuánto se podría disminuir la observación más grande, actualmente de 424, sin afectar el valor de la dispersión de los cuartos?
32
33
34
35
36
37
38
39
40
41
42
87 103 130 160 180 195 132 145 211 105 145
153 152 138 87 99 93 119 129
a. Calcule la varianza muestral y la desviación estándar.
b. Si las observaciones se volvieran a expresar en horas,
¿cuáles serían los valores resultantes de la varianza de la
muestra y la desviación estándar muestral? Responda
sin realizar en realidad la reexpresión.
52. Las primeras cuatro desviaciones de la media en una muestra de n 5 tiempos de reacción fueron 0.3, 0.9, 1.0 y 1.3.
¿Cuál es la quinta desviación de la media? Dé una muestra
para la cual estas son las cinco desviaciones de la media.
53. Reconsidere los datos sobre el área de lámina esclerótica
dados en el ejercicio 49.
a. Determine los cuartos inferior y superior.
b. Calcule el valor de la dispersión de los cuartos.
c. Si los dos valores muestrales más grandes, 4.33 y 4.52
hubieran sido 5.33 y 5.52, ¿cómo afectaría esto a fs? Explique.
d. ¿En cuánto se podría incrementar la observación 2.34
sin afectar a fs? Explique.
e. Si la 18a. observación, x18 4.60, se suma a la muestra,
¿cuál es fs?
54. Considere las siguientes observaciones sobre resistencia al esfuerzo cortante (MPa) de una junta unida de una manera particular (tomadas de una gráfica que aparece en el artículo
(“Diffusion of Silicon Nitride to Austenitic Stainless Steel
without Interlayers”, Metallurgical Trans., 1993: 1835-1843).
22.2
30.0
40.4
4.4
16.4
33.1
73.7
66.7
36.6
81.5
109.9
a. ¿Cuáles son los valores de los cuartos y cuál es el valor
de fs?
b. Construya una gráfica de caja basada en el resumen de
cinco números y comente sobre sus características.
c. ¿Qué tan grande o pequeña tiene que ser una observación para calificar como valor apartado? ¿Como valor
apartado extremo?
d. ¿En cuánto podría disminuir la observación más grande
sin afectar fs?
55
49
6699
34469
03345
9
2347
23
4
56. Se determinó la cantidad de contaminación por aluminio
(ppm) en plástico de cierto tipo con una muestra de 26 probetas de plástico y se obtuvieron los siguientes datos (“The Lognormal Distribution for Modeling Quality Data when the
Mean Is Near Zero”, J. of Quality Technology, 1990: 105-110):
30
102
172
30
115
182
60
118
183
63
119
191
70
119
222
79
120
244
87
125
291
90
140
511
101
145
Construya una gráfica de caja que muestre valores apartados y comente sobre sus características.
57. Se seleccionó una muestra de 20 botellas de vidrio de un tipo particular y se determinó la resistencia a la presión interna de cada botella. Considere la siguiente información
parcial sobre la muestra:
mediana 202.2
cuarto inferior 196.0
cuarto superior 216.8
Las tres observaciones más pequeñas 125.8 188.1 193.7
Las tres observaciones más grandes 221.3 230.5 250.2
a. ¿Hay valores apartados en la muestra? ¿Algunos valores
apartados extremos?
b. Construya una gráfica de caja que muestre valores apartados y comente sobre cualesquiera características interesantes.
58. Una compañía utiliza dos máquinas diferentes para fabricar
piezas de cierto tipo. Durante un solo turno, se obtuvo una
muestra de n 20 piezas producidas por cada máquina y se
determinó el valor de una dimensión crítica particular de
cada pieza. La gráfica de caja comparativa que aparece en
la parte superior de la página 41 se construyó con los datos
resultantes. Compare y contraste las dos muestras.
59. Se determinó la concentración de cocaína (mg/l) tanto con
una muestra de individuos que murieron de delirio excitado
(DE) inducido por el consumo de cocaína y con una muestra de aquellos que murieron de una sobredosis de cocaína sin
delirio excitado; el tiempo de sobrevivencia de las personas
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
Page 41
1.4 Medidas de variabilidad
41
Gráfica de caja comparativa del ejercicio 58
Máquina
2
1
85
95
105
en ambos grupos fue a lo sumo de 6 horas. Los datos adjuntos se tomaron de una gráfica de caja comparativa incluida en
el artículo (“Fatal Excited Delirium Following Cocaine Use”,
J. of Forensic Sciences, 1997: 25-31).
Con DE 0 0 0 0 0.1 0.1 0.1 0.1 0.2 0.2 0.3 0.3
0.3 0.4 0.5 0.7 0.8 1.0 1.5 2.7 2.8
3.5 4.0 8.9 9.2 11.7 21.0
Sin DE 0 0 0 0 0 0.1 0.1 0.1 0.1 0.2 0.2 0.2
0.3 0.3 0.3 0.4 0.5 0.5 0.6 0.8 0.9 1.0
1.2 1.4 1.5 1.7 2.0 3.2 3.5 4.1
4.3 4.8 5.0 5.6 5.9 6.0 6.4 7.9
8.3 8.7 9.1 9.6 9.9 11.0 11.5
12.2 12.7 14.0 16.6 17.8
a. Determine las medianas, cuartos y dispersiones de los
cuartos de las dos muestras,
b. ¿Existen algunos valores apartados en una u otra muestra? ¿Algunos valores apartados extremos?
c. Construya una gráfica de caja comparativa y utilícela
como base para comparar y contrastar las muestras con
DE y sin DE.
Dimensión
115
60. Se obtuvieron observaciones de resistencia al estallamiento
(lb/pulg2) tanto con soldaduras de cierre de toberas de prueba
como con soldaduras para toberas de envases de producción
(“Proper Procedures Are the Key to Welding Radioactive
Waste Cannisters”, Welding J., agosto de 1997: 61-67).
Prueba
7200
7300
6100
7300
7300
8000
7300
6700
8000
8300
7400
Envase
5250
5800
5625
6000
5900
5875
5900
6100
5700
5850
6050
6600
Construya una gráfica de caja comparativa y comente sobre
las características interesantes (el artículo citado no incluía
tal gráfica, pero los autores comentaron que habían visto
uno.)
61. La gráfica de caja comparativa adjunta de coeficientes de
vapor de gasolina de vehículos en Detroit apareció en el artículo (“Receptor Modeling Approach to VOC Emission Inventory Validation”, J. of Envir. Engr., 1995: 483-490).
Discuta las características interesantes.
Gráfica de caja comparativa del ejercicio 61
Coeficiente de vapor de gasolina
70
60
50
40
30
20
10
0
6 a.m.
8 a.m.
12 mediodía
2 p.m.
www.FreeLibros.me
10 p.m.
Tiempo
c1_p001-045.qxd
42
3/12/08
CAPÍTULO 1
2:31 AM
Page 42
Generalidades y estadística descriptiva
EJERCICIOS SUPLEMENTARIOS (62-83)
62. Considere la siguiente información sobre resistencia a la
tensión final (lb/pulg) de una muestra de n 4 probetas de
alambre de cobre al zirconio duro (de “Characterization
Methods for Fine Copper Wire”, Wire J. Intl., agosto de
1997: 74-80):
x 76 831 s 180, xi más pequeña 76 683,
xi más grande 77 048.
Determine los valores de las dos observaciones muestrales intermedias (¡pero no lo haga mediante conjeturas sucesivas!)
63. La cantidad de radiación recibida en un invernadero desempeña un importante papel al determinar el coeficiente de fotosíntesis. Las observaciones adjuntas sobre radiación solar
incidente se leyeron en una gráfica que aparece en el artículo (“Radiation Components over Bare Planted Soils in a
Greenhouse”, Solar Energy, 1990: 1011-1016).
6.3
9.0
10.7
11.4
6.4
9.1
10.7
11.9
7.7
10.0
10.8
11.9
8.4
10.1
10.9
12.2
8.5
10.2
11.1
13.1
8.8
10.6
11.2
8.9
10.6
11.2
Use algunos de los métodos estudiados en este capítulo para describir y resumir estos datos.
64. Los siguientes datos sobre emisiones de HC y CO de un vehículo particular se dieron en la introducción del capítulo.
HC (g/milla)
CO (g/milla)
13.8 18.3 32.2
118 149 232
32.5
236
a. Calcule las desviaciones estándar muestrales de las observaciones de HC y CO. ¿Parece justificarse la creencia
difundida?
b. El coeficiente de variación muestral s/ x (o 100 s/ x) evalúa el grado de variabilidad con respecto a la media. Los
valores de este coeficiente para varios conjuntos de datos diferentes pueden ser comparados para determinar
cuáles conjuntos de datos exhiben más o menos variación. Realice la comparación con los datos dados.
65. La distribución de frecuencia adjunta de observaciones de
resistencia a la fractura (MPa) de barras de cerámicas cocidas en un horno particular apareció en el artículo (“Evaluating Tunnel Kiln Performance”, Amer. Ceramic Soc. Bull.,
agosto de 1997: 59-63).
Frecuencia 81–83 83–85 85–87 87–89 89–91
de clase
6
7
17
30
43
Frecuencia
de clase
91–93
28
93–95
22
95–97
13
97–99
3
a. Construya un histograma basado en frecuencias relativas y comente sobre cualesquiera características interesantes.
b. ¿Qué proporción de las observaciones de resistencia son
por lo menos de 85? ¿Menores que 95?
c. Aproximadamente, ¿qué proporción de las observaciones son menores que 90?
66. Una deficiencia de indicios de selenio en la dieta puede impactar negativamente el crecimiento, la inmunidad, la función
muscular y neuromuscular y la fertilidad. La introducción de
suplementos de selenio en vacas lecheras se justifica cuando las pasturas contienen niveles bajos de selenio. Los autores del artículo (“Effects of Short-Term Supplementation
with Selenised Yeast on Milk Production and Composition
of Lactating Cows”, Australian J. of Dairy Tech., 2004:
199-203) suministraron los siguientes datos sobre la concentración de selenio en la leche (mg/l) obtenidos con una
muestra de vacas a las que se les administró un suplemento
de selenio y una muestra de control de vacas a las que no se
les administró suplemento, tanto inicialmente como después de un periodo de 9 días.
Cont.
Se
Cont.
Obs.
Se inicial
inicial
final
final
1
11.4
9.1
138.3
9.3
2
9.6
8.7
104.0
8.8
3
10.1
9.7
96.4
8.8
4
8.5
10.8
89.0
10.1
5
10.3
10.9
88.0
9.6
6
10.6
10.6
103.8
8.6
7
11.8
10.1
147.3
10.4
8
9.8
12.3
97.1
12.4
9
10.9
8.8
172.6
9.3
10
10.3
10.4
146.3
9.5
11
10.2
10.9
99.0
8.4
12
11.4
10.4
122.3
8.7
13
9.2
11.6
103.0
12.5
14
10.6
10.9
117.8
9.1
15
10.8
121.5
16
8.2
93.0
a. ¿Parecen ser similares las concentraciones iniciales de
Se en las muestras de suplemento y en las de control?
Use varias técnicas de este capítulo para resumir los datos y responder la pregunta planteada.
b. De nuevo use métodos de este capítulo para resumir los
datos y luego describa cómo los valores de concentración de Se finales en el grupo de tratamiento difieren de
aquellos en el grupo de control.
67. Estenosis aórtica se refiere al estrechamiento de la válvula aórtica en el corazón. El artículo (“Correlation Analysis of Stenotic Aortic Valve Flow Patterns Using Phase Constrast MRI”,
Annals of Biomed. Engr., 2005: 878-887) dio los siguientes
datos sobre el diámetro de la raíz aórtica (cm) y el género de
una muestra de pacientes con varios grados de estenosis aórtica:
H: 3.7 3.4 3.7 4.0 3.9 3.8 3.4 3.6 3.1 4.0 3.4 3.8 3.5
M: 3.8 2.6 3.2 3.0 4.3 3.5 3.1 3.1 3.2 3.0
a. Compare y contraste los diámetros observados en los
dos géneros.
b. Calcule una media 10% recortada de cada una de las dos
muestras y compare las demás medidas centrales (de
la muestra de hombre, se debe utilizar el método de interpolación mencionado en la sección 1.3).
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
Page 43
Ejercicios suplementarios
68. a. ¿Con qué valor de c es mínima la cantidad (xi c)2?
[Sugerencia: Tome la derivada con respecto a c, iguale a
0 y resuelva.]
b. Utilizando el resultado del inciso a), ¿cuál de las dos
cantidades (xi x)2 y (xi )2 será más pequeña
que la otra (suponiendo que x )?
69. a. Sean a y b constantes y sea yi axi b con i 1, 2, . . . ,
n. ¿Cuáles son las relaciones entre x y y y entre s 2x y s 2y ?
b. Una muestra de temperaturas para iniciar una cierta
reacción química dio un promedio muestral (°C) de 87.3
y una desviación estándar muestral de 1.04. ¿Cuáles son
el promedio muestral y la desviación estándar medidos
9
en °F? [Sugerencia: F 5 C 32.]
70. El elevado consumo de energía durante el ejercicio continúa
después de que termina la sesión de entrenamiento. Debido
a que las calorías quemadas por ejercicio contribuyen a la
pérdida de peso y tienen otras consecuencias, es importante
entender el proceso. El artículo (“Effect of Weight Training
Exercise and Treadmill Exercise on Post-Exercise Oxygen
Consumption”, Medicine and Science in Sports and Exercise, 1998: 518-522) reportó los datos adjuntos tomados de un
estudio en el cual se midió el consumo de oxígeno (litros) de
forma continua durante 30 minutos de cada uno de 15 sujetos tanto después de un entrenamiento con pesas como después de una sesión de ejercicio en una caminadora.
Sujeto
Peso (x)
1
10
2
11
3
12
14.6
23.0
23.2
14.4
18.7
18.5
Caminadora (y) 11.3
20.8
23.6
4
13
5 6
14 15
19.5
19.0
15.9
5.3
10.3
12.6
7
24.3
17.0
9.1
10.3
4.4
8
16.3
19.1
15.2
2.6
9
22.1
19.6
10.1
16.6
19.6
22.4
a. Construya una gráfica de caja comparativa de las observaciones del ejercicio con pesas y la caminadora y comente sobre lo que ve.
b. Debido a que estos datos aparecen en pares (x, y), con
mediciones de x y y de la misma variable en dos condiciones distintas, es natural enfocarse en las diferencias
que existen en ellos: d1 x1 – y1, . . . , dn xn – yn.
Construya una gráfica de caja de las diferencias muestrales. ¿Qué sugiere la gráfica?
71. La siguiente es una descripción dada por MINITAB de los
datos de resistencia dados en el ejercicio 13.
Med. Desv. Media
Resistencia N Media Mediana rec. est.
SE
variable
153 135.39 135.40 135.41 4.59 0.37
Resistencia Mínima
variable
122.20
Máxima
147.70
Q1
132.95
Q3
138.25
a. Comente sobre cualesquiera características interesantes
(los cuartiles y los cuartos son virtualmente idénticos en
este caso).
b. Construya una gráfica de caja de los datos basada en los
cuartiles y comente sobre lo que ve.
72. Los desórdenes y síntomas de ansiedad con frecuencia pueden ser tratados exitosamente con benzodiazepina. Se sabe
43
que los animales expuestos a estrés exhiben una disminución de la ligadura de receptor de benzodiazepina en la corteza frontal. El artículo (“Decreased Benzodiazepine
Receptor Binding in Prefrontal Cortex in Combat-Related
Posttraumatic Stress Disorder”, Amer. J. of Psychiatry.
2000: 1120-1126) describió el primer estudio de ligadura
de receptor de benzodiazepina en individuos que sufren de
PTSD. Los datos anexos sobre una medición de ligadura a
receptor (volumen de distribución ajustado) se leyeron en
una gráfica que aparece en el artículo.
PTSD: 10, 20, 25, 28, 31, 35, 37, 38, 38, 39, 39,
42, 46
Saludables: 23, 39, 40, 41, 43, 47, 51, 58, 63, 66, 67,
69, 72
Use varios métodos de este capítulo para describir y resumir los datos.
73. El artículo (“Can We Really Walk Straight?, Amer. J. of
Physical Anthropology, 1992: 19-27) reportó sobre un experimento en el cual a cada uno de 20 hombres saludables
se les pidió que caminarán en línea recta como fuera posible hacia un punto a 60 m de distancia a velocidad normal.
Considérense las siguientes observaciones de cadencia (número de pasos por segundo):
0.95 0.85 0.92 .95 0.93 0.86 1.00 0.92 0.85 0.81
0.78 0.93 0.93 1.05 0.93 1.06 1.06 0.96 0.81 0.96
Use los métodos desarrollados en este capítulo para resumir
los datos; incluya una interpretación o discusión en los casos en que sea apropiado. [Nota: El autor del artículo utilizó un análisis estadístico un tanto complejo para concluir
que las personas no pueden caminar en línea recta y sugirió
varias explicaciones para esto.]
74. La moda de un conjunto de datos numéricos es el valor que
ocurre con más frecuencia en el conjunto.
a. Determine la moda de los datos de cadencia dados en el
ejercicio 73.
b. Para una muestra categórica, ¿cómo definiría la categoría modal?
75. Se seleccionaron especímenes de tres tipos diferentes de cable y se determinó el límite de fatiga (Mpa) de cada espécimen y se obtuvieron los datos adjuntos.
Tipo 1 350
371
350
372
350
372
358
384
370
391
370
391
370
392
371
Tipo 2
350
373
354
374
359
376
363
380
365
383
368
388
369
392
371
Tipo 3
350
377
361
377
362
377
364
379
364
380
365
380
366
392
371
a. Construya una gráfica de caja comparativa y comente
sobre las similitudes y diferencias.
b. Construya un diagrama de caja comparativo (una gráfica de puntos de cada muestra con una escala común).
Comente sobre las similitudes y diferencias.
c. ¿Da la gráfica de caja comparativa del inciso a) una evaluación informativa de similitudes y diferencias? Explique su razonamiento.
www.FreeLibros.me
c1_p001-045.qxd
44
3/12/08
CAPÍTULO 1
2:31 AM
Page 44
Generalidades y estadística descriptiva
76. Las tres medidas de centro introducidas en este capítulo son
las media, la mediana y la media recortada. Dos medidas de
centro adicionales que de vez en cuando se utilizan son el
rango medio, el cual es el promedio de las observaciones
más pequeñas y más grandes y el cuarto medio, el cual es el
promedio de los dos cuartos. ¿Cuál de estas medidas de
centro son resistentes a los efectos de los valores apartados
y cuáles no? Explique su razonamiento.
a. Trace un histograma correspondiente a estas frecuencias.
b. ¿Qué proporción de estas distancias de ruta son menores
que 20? ¿Qué proporción de estas rutas tienen distancias
de recorrido de por lo menos 30?
c. ¿Aproximadamente cuál es el valor de 90o percentil de
la distribución de distancia de recorrido de las rutas?
d. ¿Aproximadamente cuál es la distancia de recorrido de
ruta mediana?
77. Considere los siguientes datos sobre el tiempo de reparación activo (horas) de una muestra de n 46 receptores de
comunicaciones aerotransportados:
81. Un estudio realizado para investigar la distribución de tiempo de frenado total (tiempo de reacción más tiempo de movimiento de acelerador a freno, en ms) durante condiciones
de manejo reales a 60 km/h da la siguiente información
sobre la distribución de los tiempos (“A Field Study on
Braking Response during Driving”, Ergonomics, 1995:
1903-1910):
media 535 mediana 500 moda 500
Desv. estd. 96 mínima 220 máxima 925
5o percentil 400
10o percentil 430
o
90 percentil 640
95o percentil 720
¿Qué puede concluir sobre la forma de un histograma de estos datos? Explique su razonamiento.
0.2
0.8
2.0
5.0
0.3
1.0
2.2
5.4
0.5
1.0
2.5
5.4
0.5
1.0
2.7
7.0
0.5
1.0
3.0
7.5
0.6
1.1
3.0
8.8
0.6 0.7 0.7 0.7
1.3 1.5 1.5 1.5
3.3 3.3 4.0 4.0
9.0 10.3 22.0 24.5
0.8 0.8
1.5 2.0
4.5 4.7
Construya lo siguiente:
a. Una gráfica de tallo y hojas en la cual los dos valores
más grandes se muestran por separado en la fila HI.
b. Un histograma basado en seis intervalos de clase con 0
como el límite inferior del primer intervalo y anchos de
intervalo de 2, 2, 2, 4, 10 y 10, respectivamente.
78. Considere una muestra x1, x2, . . . , xn y suponga que los valores de x, s2 y s han sido calculados.
a. Sea yi xi x con i 1, . . . , n. ¿Cómo se comparan
los valores de s2 y s de las yi con los valores correspondientes de las xi? Explique.
b. Sea zi (xi x )/s con i 1, . . . , n. ¿Cuáles son los valores de la varianza muestral y la desviación estándar
muestral de las zi?
79. Si xn y s 2n denotan la media y la varianza de la muestra
x1, . . . , xn y si xn11 y s 2n11 denotan estas cantidades cuando
se agrega una observación adicional xn1 a la muestra.
a. Demuestre cómo se puede calcular xn11 con xn y xn11.
b. Demuestre que
n
ns 2n11 5 sn 2 1ds 2n 1
sxn11 2 xnd2
n11
de modo que s 2n11 pueda ser calculada con xn1, xn, y s 2n.
c. Suponga que una muestra de 15 torzales de hilo para telas dio por resultado un alargamiento del hilo mediano
muestral de 12.58 mm y una desviación estándar muestral de 0.512 mm. ¿Cuáles son los valores de la media
muestral y la desviación estándar muestral de las 16 observaciones de alargamiento?
80. Las distancias de recorrido de rutas de autobuses de cualquier sistema de tránsito particular por lo general varían de
una ruta a otra. El artículo (“Planning of City Bus Routes”,
J. of the Institution of Engineers, 1995: 211-215) da la siguiente información sobre las distancias (km) de un sistema
particular.
Distancia 6–8
Frecuencia
6
8–10
23
10–12
30
Distancia 16–18 18–20 20–22
Frecuencia
48
42
40
12–14
35
14–16
32
22–24 24–26
28
27
Distancia 26–28 28–30 30–35 35–40 40–45
Frecuencia 26
14
27
11
2
82. Los datos muestrales x1, x2, . . . , xn en ocasiones representan una serie de tiempo, donde xt el valor observado de
una variable de respuesta x en el tiempo t. A menudo la serie observada muestra una gran cantidad de variación aleatoria, lo que dificulta estudiar el comportamiento a largo
plazo. En tales situaciones, es deseable producir una versión alisada de la serie. Una técnica para hacerlo implica el
alisamiento o atenuación exponencial. Se elige el valor de
una constante de alisamiento (0 < < 1). Luego con xt
valor alisado o atenuado en el tiempo t se hace x1 5 x1 con
t 2, 3, . . . , n, xt 5 axt 1 s1 2 adxt21.
a. Considere la siguiente serie de tiempo en la cual xt
temperatura (°F) del efluente en una planta de tratamiento de aguas negras en el día t: 47, 54, 53, 50, 46, 46, 47,
50, 51, 50, 46, 52, 50, 50. Trace cada xt contra t en un
sistema de coordenadas de dos dimensiones (una gráfica de tiempo-serie). ¿Parece haber algún patrón?
b. Calcule las xt con 0.1. Repita con 0.5. ¿Qué
valor de da una serie xt más atenuada?
c. Sustituya xt21 5 axt21 1 s1 2 adxt22 en el miembro de
la derecha de la expresión para xt, acto seguido sustituya
xt22 en función de xt2, y xt23, y así sucesivamente. ¿De
cuántos de los valores x1, xt1, . . . , x1 depende xt? ¿Qué
le sucede al coeficiente de xtk conforme k se incrementa?
d. Remítase al inciso c). Si t es grande, ¿qué tan sensible es
xt a la inicialización x1 5 x1? Explique.
[Nota: Una referencia pertinente es el artículo “Simple Statistics for Interpreting Environmental Data”, Water Pollution Control Fed. J., 1981: 167-175.]
83. Considere las observaciones numéricas x1, . . . , xn. Con frecuencia interesa saber si las xi están (por lo menos en forma
aproximada) simétricamente distribuidas en torno al mismo
valor. Si n es por lo menos grande de manera moderada, el
grado de simetría puede ser valorado con una gráfica de tallo y hojas o un histograma. Sin embargo, si n no es muy
grande, las gráficas mencionadas no son informativas en
www.FreeLibros.me
c1_p001-045.qxd
3/12/08
2:31 AM
Page 45
Bibliografía
particular. Considere la siguiente alternativa. Que y1 denote la xi más pequeña, y2 la segunda xi más pequeña y así
sucesivamente. Luego coloque los siguientes pares como
puntos en una sistema de coordenadas de dos dimensiones syn 2 |
x, |
x 2 y1d, syn21 2 |
x, |
x 2 y2d, syn22 2 |
x,
|
x 2 y3d, c Existen n/2 puntos cuando n es par y (n – 1)/2
cuando n es impar.
a. ¿Qué apariencia tiene esta gráfica cuando la simetría en
los datos es perfecta? ¿Qué apariencia tiene cuando las
observaciones se alargan más sobre la mediana que debajo de ella (una larga cola superior)?
45
b. Los datos adjuntos sobre cantidad de lluvia (acres-pies)
producida por 26 nubes bombardeadas se tomaron del artículo (“A Bayesian Analysis of Multiplicative Treatment
Effect in Weather Modification”, Technometrics, 1975:
161-166). Construya la gráfica y comente sobre el grado
de simetría o la naturaleza del alejamiento de la misma.
4.1
115.3
255.0
703.4
7.7
118.3
274.7
978.0
17.5
119.0
274.7
1656.0
31.4
129.6
302.8
1697.8
32.7
198.6
334.1
2745.6
40.6
200.7
430.0
92.4
242.5
489.1
Bibliografía
Chambers, John, William Cleveland, Beat Kleiner y Paul Tukey,
Graphical Methods for Data Analysis, Brooks/Cole, Pacific
Grove, CA, 1983. Una presentación altamente recomendada
de varias metodologías gráficas y pictóricas en estadística.
Cleveland, William, Visualizing Data, Hobart Press, Summit, NJ,
1993. Un entretenido recorrido de técnicas pictóricas.
Devore, Jay y Roxy Peck, Statistics: The Exploration and Analysis of Data (5a. ed.), Thomson Brooks/Cole, Belmont, CA,
2005. Los primeros capítulos hacen un recuento no muy matemático de métodos para describir y resumir datos.
Freedman, David, Robert Pisani y Roger Purves, Statistics (3a. ed.),
Norton, Nueva York, 1998. Un excelente estudio no muy matemático de razonamiento y metodología estadísticos básicos.
Hoaglin, David, Frederick Mosteller y John Tukey, Understanding Robust and Exploratory Data Analysis, Wiley, Nueva
York, 1983. Discute el porqué y cómo deben ser utilizados los
métodos exploratorios; es bueno por lo que se refiere a los detalles de gráficas de tallo y hojas y gráficas de caja.
Moore, David y William Notz, Statistics: Concepts and Controversies (6a. ed.), Freeman, San Francisco, 2006. Un libro de
pasta blanda extremadamente fácil de leer y ameno que contiene una discusión intuitiva de problemas conectados con experimentos de muestreo y diseñados.
Peck, Roxy y colaboradores (eds.), Statistics: A Guide to the Unknown (4a. ed.), Thomson Brooks/Cole, Belmont, CA, 2006.
Contiene muchos artículos no técnicos que describen varias
aplicaciones de estadística.
Verzani, John, Using R for Introductory Statistics, Chapman y
Hall/CRC, Boca Ratón, FL, 2005. Una introducción muy agradable al paquete de “software” R.
www.FreeLibros.me
c2_p046-085.qxd
3/12/08
2
3:58 AM
Page 46
Probabilidad
INTRODUCCIÓN
El término probabilidad se refiere al estudio de azar y la incertidumbre en cualquier
situación en la cual varios posibles sucesos pueden ocurrir; la disciplina de la probabilidad proporciona métodos de cuantificar las oportunidades y probabilidades asociadas con varios sucesos. El lenguaje de probabilidad se utiliza constantemente de
manera informal tanto en el contexto escrito como en el hablado. Algunos ejemplos
incluyen enunciados tales como “es probable que el índice Dow-Jones se incremente al final del año”, “existen 50-50 probabilidades de que la persona con posesión
de su cargo busque la reelección”, “probablemente se ofrecerá por lo menos una
sección del curso el próximo año”, “las probabilidades favorecen la rápida solución
de la huelga” y “se espera que se vendan por lo menos 20 000 boletos para el concierto”. En este capítulo, se introducen algunos conceptos de probabilidad, se indica
cómo pueden ser interpretadas las probabilidades y se demuestra cómo pueden ser
aplicadas las reglas de probabilidad para calcular las probabilidades de muchos eventos
interesantes. La metodología de probabilidad permite entonces expresar en lenguaje preciso enunciados informales como los antes expresados.
El estudio de la probabilidad como una rama de las matemáticas se remonta a
más de 300 años, cuando nace en conexión con preguntas que implicaban juegos
de azar. Muchos libros se han ocupado exclusivamente de la probabilidad, pero el objetivo en este caso es cubrir sólo la parte de la materia que tiene más aplicación directa en problemas de inferencia estadística.
46
www.FreeLibros.me
c2_p046-085.qxd
3/12/08
3:58 AM
Page 47
2.1 Espacios muestrales y eventos
47
2.1 Espacios muestrales y eventos
Un experimento es cualquier acción o proceso cuyo resultado está sujeto a la incertidumbre. Aunque la palabra experimento en general sugiere una situación de prueba cuidadosamente controlada en un laboratorio, se le utiliza aquí en un sentido mucho más amplio. Por
lo tanto, experimentos que pueden ser de interés incluyen lanzar al aire una moneda una vez
o varias veces, seleccionar una carta o cartas de un mazo, pesar una hogaza de pan, el tiempo de recorrido de la casa al trabajo en una mañana particular, obtener tipos de sangre de un
grupo de individuos o medir las resistencias a la compresión de diferentes vigas de acero.
El espacio muestral de un experimento
DEFINICIÓN
El espacio muestral de un experimento denotado por S, es el conjunto de todos los
posibles resultados de dicho experimento.
Ejemplo 2.1
El experimento más simple al que se aplica la probabilidad es uno con dos posibles resultados. Tal experimento consiste en examinar un fusible para ver si está defectuoso. El espacio
muestral de este experimento se abrevia como S {N, D}, donde N representa no defectuoso, D representa defectuoso y las llaves se utilizan para encerrar los elementos de un conjunto. Otro experimento como ése implicaría lanzar al aire una tachuela y observar si cae
punta arriba o punta abajo, con espacio muestral S {U, D} y otro más consistiría en observar el sexo del siguiente niño nacido en el hospital, con S {H, M}.
■
Ejemplo 2.2
Si se examinan tres fusibles en secuencia y se anota el resultado de cada examen, entonces un
resultado del experimento es cualquier secuencia de letras N y D de longitud 3, por lo tanto
S {NNN, NND, NDN, NDD, DNN, DND, DDN, DDD}
Si se hubiera lanzado una tachuela tres veces, el espacio muestral se obtendría reemplazando N
por U en la expresión S anterior y con un cambio de notación similar se obtendría el espacio
muestral para el experimento en el cual se observan los sexos de tres niños recién nacidos. ■
Ejemplo 2.3
Dos gasolinerías están localizadas en cierta intersección. Cada una dispone de 6 bombas de
gasolina. Considérese el experimento en el cual se determina el número de bombas en uso
a una hora particular del día en cada una de las gasolinerías. Un resultado experimental especifica cuántas bombas están en uso en la primera gasolinería y cuántas están en uso en la
segunda. Un posible resultado es (2, 2), otro es (4, 1) y otro más es (1, 4). Los 49 resultados en S se muestran en la tabla adjunta. El espacio muestral del experimento en el cual un
dado de 6 lados es lanzado dos veces se obtiene eliminando la fila 0 y la columna 0 de la tabla y se obtienen 36 resultados.
Segunda gasolinería
Primera
gasolinería
0
1
2
3
4
5
6
0
1
2
3
4
5
6
(0, 0)
(1, 0)
(2, 0)
(3, 0)
(4, 0)
(5, 0)
(6, 0)
(0, 1)
(1, 1)
(2, 1)
(3, 1)
(4, 1)
(5, 1)
(6, 1)
(0, 2)
(1, 2)
(2, 2)
(3, 2)
(4, 2)
(5, 2)
(6, 2)
(0, 3)
(1, 3)
(2, 3)
(3, 3)
(4, 3)
(5, 3)
(6, 3)
(0, 4)
(1, 4)
(2, 4)
(3, 4)
(4, 4)
(5, 4)
(6, 4)
(0, 5)
(1, 5)
(2, 5)
(3, 5)
(4, 5)
(5, 5)
(6, 5)
(0, 6)
(1, 6)
(2, 6)
(3, 6)
(4, 6)
(5, 6)
(6, 6)
■
www.FreeLibros.me
c2_p046-085.qxd
48
3/12/08
CAPÍTULO 2
3:58 AM
Page 48
Probabilidad
Ejemplo 2.4
Si el voltaje de una nueva batería tipo D para linterna queda fuera de ciertos límites, dicha
batería se caracteriza como falla (F); si el voltaje de la batería se encuentra dentro de los límites prescritos, se caracteriza como éxito (E). Supóngase un experimento que consiste en
probar cada batería como sale de la línea de ensamble hasta que se observe primero un éxito. Aunque no es muy probable, un posible resultado de este experimento es que las primeras 10 (o 100 o 1000 o . . .) sean F y la siguiente sea un E. Es decir, para cualquier entero
positivo n, es posible que se tenga que examinar n baterías antes de encontrar el primer E.
El espacio muestral es S {E, FE, FFE, FFFE, . . .}, el cual contiene un número infinito
de posibles resultados. La misma forma abreviada del espacio muestral es apropiada para un
experimento en el cual, a partir de una hora especificada, se anota el sexo de cada infante
recién nacido hasta que nazca un varón.
■
Eventos
En el estudio de la probabilidad, interesan no sólo los resultados individuales de S sino también varias recopilaciones de resultados de S.
DEFINICIÓN
Un evento es cualquier recopilación (subconjunto) de resultados contenidos en el espacio muestral S. Un evento es simple si consiste en exactamente un resultado y compuesto si consiste en más de un resultado.
Cuando se realiza un experimento, se dice que ocurre un evento particular A si el resultado
experimental obtenido está contenido en A. En general, ocurrirá exactamente un evento simple, pero muchos eventos compuestos ocurrirán al mismo tiempo.
Ejemplo 2.5
Considérese un experimento en el cual cada uno de tres vehículos que toman una salida de
una autopista particular vira a la izquierda (L) o la derecha (R) al final de la rampa de salida. Los ocho posibles resultados que constituyen el espacio muestral son LLL, RLL, LRL,
LLR, LRR, RLR, RRL y RRR. Así pues existen ocho eventos simples, entre los cuales están
E1 {LLL} y E5 {LRR}. Algunos eventos compuestos incluyen
A {RLL, LRL, LLR} el evento en que exactamente uno de los tres vehículos vire a
la derecha.
B {LLL, RLL, LRL, LLR} el evento en que cuando mucho uno de los vehículos
vire a la derecha.
C {LLL, RRR} el evento en que los tres vehículos viren en la misma dirección.
Suponga que cuando se realiza el experimento, el resultado es LLL. Entonces ha ocurrido el
evento simple E1 y por lo tanto también comprende los eventos B y C (pero no A).
■
Ejemplo 2.6
(continuación
del ejemplo
2.3)
Cuando se observa el número de bombas en uso en cada una de dos gasolinerías de 6
bombas, existen 49 posibles resultados, por lo que existen 49 eventos simples: E1 {(0,
0)}, E2 {(0, 1)}, . . . , E49 {(6, 6)}. Ejemplos de eventos compuestos son
A {(0, 0), (1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)} el evento en que el número de
bombas en uso es el mismo en ambas gasolinerías.
B {(0, 4), (1, 3) (2, 2), (3, 1), (4, 0)} el evento en que el número total de bombas
en uso es cuatro.
C {(0, 0), (0, 1), (1, 0), (1, 1)} el evento en que a lo sumo una bomba está en uso
en cada gasolinería.
■
www.FreeLibros.me
c2_p046-085.qxd
3/12/08
3:58 AM
Page 49
2.1 Espacios muestrales y eventos
Ejemplo 2.7
(continuación
del ejemplo
2.4)
49
El espacio muestral del experimento del examen de las baterías contiene un número infinito de resultados, por lo que existe un número infinito de eventos simples. Los eventos compuestos incluyen
A {E, FE, FFE} el evento en que cuando mucho se examinan tres baterías.
E {FE, FFFE, FFFFFE,. . .} el evento en que se examina un número par de
baterías.
■
Algunas relaciones de la teoría de conjuntos
Un evento es simplemente un conjunto, así que las relaciones y resultados de la teoría elemental de conjuntos pueden ser utilizados para estudiar eventos. Se utilizarán las siguientes
operaciones para crear eventos nuevos a partir de eventos dados.
DEFINICIÓN
Ejemplo 2.8
(continuación
del ejemplo
2.3)
Ejemplo 2.9
(continuación
del ejemplo
2.4)
1. El complemento de un evento A, denotado por A, es el conjunto de todos los resultados en S que no están contenidos en A.
2. La unión de dos eventos A y B, denotados por A B y leídos “A o B”, es el evento que consiste en todos los resultados que están en A o en B o en ambos eventos
(de tal suerte que la unión incluya resultados donde tanto A como B ocurren, así
también resultados donde ocurre exactamente uno), es decir, todos los resultados
en por lo menos uno de los eventos.
3. La intersección de dos eventos A y B, denotada por A B y leída “A y B”, es el
evento que consiste en todos los resultados que están tanto en A como en B.
En el experimento en el cual se observa el número de bombas en uso en una sola gasolinería de seis bombas, sea A {0, 1, 2, 3, 4}, B {3, 4, 5, 6} y C {1, 3, 5}. Entonces
A {5, 6}, A B {0, 1, 2, 3, 4, 5, 6} S, A C {0, 1, 2, 3, 4, 5},
A B {3, 4},
A C {1, 3},
(A C) {0, 2, 4, 5, 6}
■
En el experimento de la batería, defina A, B y C como
A {E, FE, FFE}, B {E, FFE, FFFFE}, C {FE, FFFE, FFFFFE, . . .}
Entonces
A {FFFE, FFFFE, FFFFFE, . . .}, C {E, FFE, FFFFE, . . .}
A B {E, FE, FFE, FFFFE},
A B {E, FFE}
■
En ocasiones A y B no tienen resultados en común, por lo que la intersección de A y
B no contiene resultados.
DEFINICIÓN
Ejemplo 2.10
Que denote el evento nulo (el evento sin resultados). Cuando A B , se dice
que A y B son eventos mutuamente excluyentes o disjuntos.
En una pequeña ciudad hay tres distribuidores de automóviles: un distribuidor GM que vende Chevrolets, Pontiacs y Buicks; un distribuidor Ford que vende Fords y Mercurys; y un
distribuidor Chrysler que vende Plymouths y Chryslers. Si un experimento consiste en observar la marca del siguiente carro vendido, entonces los eventos A {Chevrolet, Pontiac,
Buick} y B {Ford, Mercury} son mutuamente excluyentes porque el siguiente carro vendido no puede ser tanto un producto GM como un producto Ford.
■
www.FreeLibros.me
c2_p046-085.qxd
50
3/12/08
CAPÍTULO 2
3:58 AM
Page 50
Probabilidad
Las operaciones de unión e intersección pueden ser ampliadas a más de dos eventos. Para
tres eventos cualesquiera A, B y C, el evento A B C es el conjunto de resultados contenidos
en por lo menos uno de los tres eventos, mientras que A B C es el conjunto de resultados contenidos en los tres eventos. Se dice que los eventos dados A1, A2, A3, . . . , son mutuamente excluyentes (disjuntos por pares) si ninguno de dos eventos tienen resultados en común.
Con diagramas de Venn se obtiene una representación pictórica de eventos y manipulaciones con eventos. Para construir un diagrama de Venn, se traza un rectángulo cuyo interior
representará el espacio muestral S. En tal caso cualquier evento A se representa como el interior de una curva cerrada (a menudo un círculo) contenido en S. La figura 2.1 muestra ejemplos de diagramas de Venn.
A
B
A
B
A
B
A
B
A
a) Diagrama de Venn
de los eventos A y B
b) La región sombreada c) La región sombreada d) La región sombreada e) Eventos mutuamente
es A B
excluyentes
es A'
es A B
Figura 2.1
EJERCICIOS
Diagramas de Venn.
Sección 2.1 (1-10)
1. Cuatro universidades, 1, 2, 3 y 4, están participando en un
torneo de básquetbol. En la primera ronda, 1 jugará con 2 y
3 jugará con 4. Acto seguido los ganadores jugarán por el
campeonato y los dos perdedores también jugarán. Un posible resultado puede ser denotado por 1324 (1 derrota a 2
y 3 derrota a 4 en los juegos de la primera ronda y luego 1
derrota a 3 y 2 derrota a 4).
a. Enumere todos los resultados en S.
b. Que A denote el evento en que 1 gana el torneo. Enumere los resultados en A.
c. Que B denote el evento en que 2 gana el juego de campeonato. Enumere los resultados en B.
d. ¿Cuáles son los resultados en A B y en A B? ¿Cuáles son los resultados en A?
2. Suponga que un vehículo que toma una salida particular de
una autopista puede virar a la derecha (R), virar a la izquierda (L) o continuar de frente (S). Observe la dirección de cada
uno de tres vehículos sucesivos.
a. Elabore una lista de todos los resultados en el evento A
en que los tres vehículos van en la misma dirección.
b. Elabore una lista de todos los resultados en el evento B
en que los tres vehículos toman direcciones diferentes.
c. Elabore una lista de todos los resultados en el evento C
en que exactamente dos de los tres vehículos dan vuelta
a la derecha.
d. Elabore una lista de todos los resultados en el evento D
en que dos vehículos van en la misma dirección.
e. Enumere los resultados en D, C D y C D.
3. Tres componentes están conectados para formar un sistema
como se muestra en el diagrama adjunto. Como los componentes del subsistema 2-3 están conectados en paralelo, dicho subsistema funcionará si por lo menos uno de los dos
componentes individuales funciona. Para que todo el sistema funcione, el componente 1 debe funcionar y por lo tanto el subsistema 2-3 debe hacerlo.
2
1
3
El experimento consiste en determinar la condición de cada
componente [E (éxito) para un componente que funciona y
F (falla) para un componente que no funciona].
a. ¿Qué resultados están contenidos en el evento A en que
exactamente dos de los tres componentes funcionan?
b. ¿Qué resultados están contenidos en el evento B en
que por lo menos dos de los componentes funcionan?
c. ¿Qué resultados están contenidos en el evento C en que
el sistema funciona?
d. Ponga en lista los resultados en C, A C, A C, B
C y B C.
4. Cada muestra de cuatro hipotecas residenciales está clasificada como tasa fija (F ) o tasa variable (V ).
a. ¿Cuáles son los 16 resultados en S ?
b. ¿Qué resultados están en el evento en que exactamente
tres de las hipotecas seleccionadas son de tasa fija?
c. ¿Qué resultados están en el evento en que las cuatro hipotecas son del mismo tipo?
d. ¿Qué resultados están en el evento en que a lo sumo una
de las cuatro es una hipoteca de tasa variable?
e. ¿Cuál es la unión de eventos en los incisos c) y d) y cuál
es la intersección de estos dos eventos?
f. ¿Cuáles son la unión e intersección de los dos eventos en
los incisos b) y c)?
5. Una familia compuesta de tres personas, A, B y C, pertenece a una clínica médica que siempre tiene disponible un
doctor en cada una de las estaciones 1, 2 y 3. Durante cierta semana, cada miembro de la familia visita la clínica una
vez y es asignado al azar a una estación. El experimento
consiste en registrar la estación para cada miembro. Un
www.FreeLibros.me
c2_p046-085.qxd
3/12/08
3:58 AM
Page 51
2.2 Axiomas, interpretaciones y propiedades de probabilidad
resultado es (1, 2, 1) para A a la estación 1, B a la estación
2 y C a la estación 1.
a. Elabore una lista de los 27 resultados en el espacio
muestral.
b. Elabore una lista de todos los resultados en el evento en
que los tres miembros van a la misma estación.
c. Elabore una lista de todos los resultados en que los tres
miembros van a diferentes estaciones.
d. Elabore una lista de los resultados en el evento en que
ninguno va a la estación 2.
6. La biblioteca de una universidad dispone de cinco ejemplares de un cierto texto en reserva. Dos ejemplares (1 y 2)
son primeras impresiones y los otros tres (3, 4 y 5) son segundas impresiones. Un estudiante examina estos libros en
orden aleatorio, y se detiene sólo cuando una segunda impresión ha sido seleccionada. Un posible resultado es 5 y
otro 213.
a. Ponga en lista los resultados en S.
b. Que A denote el evento en que exactamente un libro debe ser examinado. ¿Qué resultados están en A?
c. Sea B el evento en que el libro 5 es seleccionado. ¿Qué
resultados están en B?
d. Sea C el evento en que el libro 1 no es examinado. ¿Qué
resultados están en C?
7. Un departamento académico acaba de votar secretamente
para elegir un jefe de departamento. La urna contiene cuatro boletas con votos para el candidato A y tres con votos
para el candidato B. Suponga que estas boletas se sacan de
la urna una por una.
a. Ponga en lista todos los posibles resultados.
b. Suponga que mantiene un conteo continuo de la boletas
51
retiradas de la urna. ¿Para qué resultados A se mantiene
adelante durante todo el conteo?
8. Una firma constructora de ingeniería en la actualidad está trabajando en plantas eléctricas en tres sitios diferentes. Que A
denote el evento en que la planta localizada en el sitio i se completa alrededor de la fecha contratada. Use las operaciones de
unión, intersección y complemento para describir cada uno
de los siguientes eventos en función de A1, A2 y A3, trace un
diagrama y sombree la región que corresponde a cada uno.
a. Por lo menos una planta se completa alrededor de la fecha contratada.
b. Todas las plantas se completan alrededor de la fecha
contratada.
c. Sólo la planta localizada en el sitio 1 se completa alrededor de la fecha contratada.
d. Exactamente una planta se completa alrededor de la fecha contratada.
e. O la planta localizada en el sitio 1 o las otras dos plantas se completan alrededor de la fecha contratada.
9. Use diagramas de Venn para las dos siguientes relaciones
para los eventos A y B (éstas se conocen como leyes De
Morgan):
a. (A B) A B
b. (A B) A B
10. a. En el ejemplo 2.10, identifique tres eventos que son mutuamente excluyentes.
b. Suponga que no hay ningún resultado común a los tres
eventos A, B y C. ¿Son estos tres eventos necesariamente mutuamente excluyentes? Si su respuesta es sí, explique por qué; si su respuesta es no, dé un contraejemplo
valiéndose del experimento del ejemplo 2.10.
2.2 Axiomas, interpretaciones y
propiedades de probabilidad
Dados un experimento y un espacio muestral S, el objetivo de la probabilidad es asignar a
cada evento A un número P(A), llamado la probabilidad del evento A, el cual dará una medida precisa de la oportunidad de que A ocurra. Para garantizar que las asignaciones serán
consistentes con las nociones intuitivas de la probabilidad, todas las asignaciones deberán satisfacer los siguientes axiomas (propiedades básicas) de probabilidad.
AXIOMA 1
AXIOMA 2
AXIOMA 3
Para cualquier evento A, P(A)
P(S ) 1.
0.
Si A1, A2, A3, . . . es un conjunto de eventos mutuamente excluyentes, entonces
PsA1 ´ A2 ´ A3 ´ cd 5
`
g PsAid
i51
Se podría preguntar por qué el tercer axioma no contiene ninguna referencia a un conjunto finito de eventos mutuamente excluyentes. Es porque la propiedad correspondiente para
un conjunto finito puede ser derivada de los tres axiomas. Se pretende que la lista de axiomas sea tan corta como sea posible y que no contenga alguna propiedad que pueda ser derivada de los demás que aparecen en la lista. El axioma 1 refleja la noción intuitiva de que la
www.FreeLibros.me
c2_p046-085.qxd
52
3/12/08
CAPÍTULO 2
3:58 AM
Page 52
Probabilidad
probabilidad de que ocurra A deberá ser no negativa. El espacio muestral es por definición el
evento que debe ocurrir cuando se realiza el experimento (S contiene todos los posibles resultados), así se dice el axioma 2 que es la máxima probabilidad posible de 1 está asignada
a S. El tercer axioma formaliza la idea que si se desea la probabilidad de que ocurra al menos uno de varios eventos, y no ocurran dos al mismo tiempo, entonces la probabilidad de
que por lo menos uno ocurra es la suma de las probabilidades de los eventos individuales.
PROPOSICIÓN
P() 0 donde es el evento nulo (el evento que no contiene resultados en absoluto). Esto a su vez implica que la propiedad contenida en el axioma 3 es válida para
un conjunto finito de eventos.
Comprobación Primero considérese el conjunto infinito A1 5 [, A2 5 [, A3 5 [, . . . .
Como , los eventos en este conjunto son disjuntos y Ai . El tercer axioma
da entonces
Ps[d 5
g Ps[d
Esto puede suceder sólo si P() 0.
Ahora supóngase que A1, A2, . . . , Ak son eventos disjuntos y anéxense a éstos el conjunto finito Ak11 5 [, Ak12 5 [, Ak13 5 [, . . . . De nuevo si se invoca el tercer axioma.
k
`
i51
i51
Pa ´ Ai b 5 Pa ´ Ai b 5
`
k
i51
i51
g PsAid 5 g PsAid
■
como se deseaba.
Ejemplo 2.11
Considere lanzar una tachuela al aire. Cuando se detiene en el suelo, o su punta estará hacia arriba (el resultado U) o hacia abajo (el resultado D). El espacio muestral de este evento es por consiguiente S {U, D}. Los axiomas especifican P(S ) 1, por lo que la
asignación de probabilidad se completará determinando P(U ) y P(D). Como U y D están
desarticulados y su unión S, la siguiente proposición implica que
1 P(S ) P(U) P(D)
Se desprende que P(D) 1 P(U ). Una posible asignación de probabilidades es P(U )
0.5, P(D) 0.5, mientras que otra posible asignación es P(U ) 0.75, P(D) 0.25. De
hecho, si p representa cualquier número fijo entre 0 y 1, P(U ) p, P(D) 1 p es una
asignación compatible con los axiomas.
■
Ejemplo 2.12
Regresemos al experimento del ejemplo 2.4, en el cual se prueban las baterías que salen de la
línea de ensamble una por una hasta que se encuentra una con el voltaje dentro de los límites
prescritos. Los eventos simples son E1 {E}, E2 {FE}, E3 {FFE}, E4 {FFFE}, . . . .
Suponga que la probabilidad de que cualquier batería resulte satisfactoria es de 0.99. Entonces
se puede demostrar que P(E1) 0.99, P(E2) (0.01)(0.99), P(E3) (0.01)2(0.99), . . . es una
asignación de probabilidades a los eventos simples que satisface los axiomas. En particular, como los Ei son disjuntos y S E1 E2 E3 . . . , debe ser el caso de que
1 P(S ) P(E1) P(E2) P(E3) . . .
0.99[1 0.01 (0.01)2 (0.01)3 . . .]
Aquí se utilizó la fórmula para la suma de una serie geométrica:
a 1 ar 1 ar 2 1 ar 3 1 c 5
www.FreeLibros.me
a
12r
3/12/08
3:58 AM
Page 53
2.2 Axiomas, interpretaciones y propiedades de probabilidad
53
Sin embargo, otra asignación de probabilidad legítima (de acuerdo con los axiomas)
del mismo tipo “geométrico” se obtiene reemplazando 0.99 por cualquier otro número p entre 0 y 1 (y 0.01 por 1 p).
■
Interpretación de probabilidad
Los ejemplos 2.11 y 2.12 muestran que los axiomas no determinan por completo una asignación de probabilidades a eventos. Los axiomas sirven sólo para excluir las asignaciones
incompatibles con las nociones intuitivas de probabilidad. En el experimento de lanzar al aire tachuelas del ejemplo 2.11, se sugirieron dos asignaciones particulares. La asignación apropiada o correcta depende de la naturaleza de la tachuela y también de la interpretación de
probabilidad. La interpretación que más frecuentemente se utiliza y más fácil de entender
está basada en la noción de frecuencias relativas.
Considérese un experimento que pueda ser realizado repetidamente de una manera
idéntica e independiente y sea A un evento que consiste en un conjunto fijo de resultados
del experimento. Ejemplos simples de experimentos repetibles incluyen el lanzamiento al
aire de tachuelas y dados previamente discutidos. Si el experimento se realiza n veces, en
algunas de las réplicas el evento A ocurrirá (el resultado estará en el conjunto A) y en otros,
A no ocurrirá. Que n(A) denote el número de réplicas en las cuales A sí ocurre. Entonces la
relación n(A)/n se conoce como la frecuencia relativa de ocurrencia del evento A en la secuencia de n réplicas. La evidencia empírica basada en los resultados de muchas de estas
secuencias de experimentos repetibles, indica que a medida que n se hace más grande, la
frecuencia relativa n(A)/n se estabiliza, como se ilustra en la figura 2.2. Es decir, conforme
n se hace arbitrariamente grande, la frecuencia relativa tiende a un valor límite al que se hace referencia como frecuencia relativa límite del evento A. La interpretación objetiva de probabilidad identifica esta frecuencia relativa límite con P(A).
1
x
n(A) Frecuencia
n
relativa
c2_p046-085.qxd
x
x
x
x
100
101
102
x x x
x
0
n
1
2
3
n Número de experimentos realizados
Figura 2.2
Estabilización de la frecuencia relativa.
Si se asignan probabilidades a eventos de acuerdo con sus frecuencias relativas límite,
entonces se puede interpretar una aseveración tal como “la probabilidad de que una moneda que cae con el águila hacia arriba cuando es lanzada al aire es 0.5” para dar a entender
que en un gran número de los lanzamientos, aparecerá un águila en aproximadamente la mitad de los lanzamientos y un sol en la otra mitad.
Se dice que esta interpretación de frecuencia relativa de probabilidad es objetiva porque se apoya en una propiedad del experimento y no en cualquier individuo particular interesado en el experimento. Por ejemplo, dos observadores diferentes de una secuencia de
lanzamiento de una moneda deberán utilizar la misma asignación de probabilidad puesto que
los observadores no tienen nada que ver con la frecuencia relativa límite. En la práctica,
la interpretación no es tan objetiva como pudiera parecer, puesto que la frecuencia relativa
www.FreeLibros.me
c2_p046-085.qxd
54
3/12/08
CAPÍTULO 2
3:58 AM
Page 54
Probabilidad
límite de un evento no será conocida. Por tanto, se tendrán que asignar probabilidades con base en creencias sobre la frecuencia relativa límite de eventos en estudio. Afortunadamente,
existen muchos experimentos para los cuales habrá consenso con respecto a asignaciones de
probabilidad. Cuando se habla de una moneda imparcial, significa P(H ) P(T ) 0.5 y un
dado imparcial es uno para el cual las frecuencias relativas límite de los seis resultados son
1/6, lo que sugiere las asignaciones de probabilidad P({1}) · · · P({6}) 1/6.
Como la interpretación objetiva de probabilidad está basada en la noción de frecuencia límite, su aplicabilidad está restringida a situaciones experimentales repetibles. No obstante, el lenguaje de probabilidad a menudo se utiliza en conexión con situaciones que son
inherentemente irrepetibles. Algunos ejemplos incluyen: “las probabilidades de un tratado
de paz son buenas”; “es probable que el contrato le será otorgado a nuestra compañía”; y
“como su mejor mariscal de campo está lesionado, espero que no anoten más de 10 puntos
contra nosotros”. En tales situaciones se desearía, como antes, asignar probabilidades numéricas a varios resultados y eventos (p. ej., la probabilidad es 0.9 de que obtendremos el
contrato). Por consiguiente se debe adoptar una interpretación alternativa de estas probabilidades. Como diferentes observadores pueden tener información y opiniones previas con
respecto a tales situaciones experimentales, las asignaciones de probabilidad ahora pueden
definir de un individuo a otro. Las interpretaciones en tales situaciones se conocen por lo
tanto como subjetivas. El libro de Robert Winkler citado en las referencias del capítulo da
un recuento muy fácil de leer de varias interpretaciones subjetivas.
Más propiedades de probabilidad
PROPOSICIÓN
Para cualquier evento A, P(A) + P(A) 1, a partir de la cual P(A) 1 – P(A).
Comprobación En el axioma 3, sea k 2, A1 A y A2 A. Como por definición
de A, A A S en tanto A y A sean eventos disjuntos, 1 P(S ) P(A A)
P(A) P(A).
■
Esta proposición es sorprendentemente útil porque se presentan muchas situaciones
en las cuales P(A) es más fácil de obtener mediante métodos directos que P(A).
Ejemplo 2.13
Considere un sistema de cinco componentes idénticos conectados en serie, como se ilustra
en la figura 2.3.
1
2
Figura 2.3
3
4
5
Un sistema de cinco componentes conectados en serie.
Denote un componente que falla por F y uno que no lo hace por E (éxito). Sea A el evento
en que el sistema falla. Para que ocurra A, por lo menos uno de los componentes individuales
debe fallar. Los resultados en A incluyen EEFEE(1, 2, 4 y 5 funcionarán, pero 3 no). FFEEE,
y así sucesivamente. Existen de hecho 31 resultados diferentes en A. Sin embargo, A, el
evento en que el sistema funciona, consiste en el resultado único EEEEE. En la sección 2.5
se verá que si 90% de todos estos componentes no fallan y diferentes componentes lo hacen
independientemente uno de otro, entonces P(A) P(EEEEE) 0.95 0.59. Así pues P(A)
1 0.59 0.41; por lo tanto, entre un gran número de sistemas como ése, aproximadamente 41% fallarán.
■
En general, la proposición anterior es útil cuando el evento de interés puede ser
expresado “por lo menos . . . ,” puesto que en ese caso puede ser más fácil trabajar con el
www.FreeLibros.me
c2_p046-085.qxd
3/12/08
3:58 AM
Page 55
2.2 Axiomas, interpretaciones y propiedades de probabilidad
55
complemento “menos que . . .” (en algunos problemas es más fácil trabajar con “más
que. . .” que con “cuando . . .”). Cuando se tenga dificultad al calcular P(A) directamente,
habrá que pensar en determinar P(A).
PROPOSICIÓN
Para cualquier evento A, P(A) 1.
Esto se debe a que 1 P(A) P(A) P(A) puesto que P(A) 0.
Cuando los eventos A y B son mutuamente excluyentes, P(A B) P(A) P(B).
Para eventos que no son mutuamente excluyentes, la adición de P(A ) y P(B) da por resultado un “doble conteo” de los resultados en la intersección. El siguiente resultado muestra
cómo corregir esto.
PROPOSICIÓN
Para dos eventos cualesquiera A y B.
P(A B) P(A) P(B) P(A B)
Comprobación Obsérvese primero que A B puede ser descompuesto en dos eventos
excluyentes, A y B A; la última es la parte B que queda afuera de A. Además, B por sí
mismo es la unión de los dos eventos excluyentes A B y A B, por lo tanto P(B)
P(A B) + P(A B). Por lo tanto
P(A B) P(A) P(B A) P(A) [P(B) P(A B)]
P(A) P(B) P(A B)
A
Figura 2.4
Ejemplo 2.14
B
Representación de A B como una unión de eventos excluyentes.
■
En cierto suburbio residencial, 60% de las familias se suscriben al periódico en una ciudad
cercana, 80% lo hacen al periódico local y 50% de todas las familias a ambos periódicos. Si
se elige una familia al azar, ¿cuál es la probabilidad de que se suscriba a (1) por lo menos a
uno de los dos periódicos y (2) exactamente a uno de los dos periódicos?
Con A {se suscribe al periódico metropolitano} y B {se suscribe al periódico local}, la información dada implica que P(A) 0.6, P(B) 0.8 y P(A B) 0.5. La proposición precedente ahora lleva a
P(se suscribe a por lo menos uno de los dos periódicos)
P(A B) P(A) P(B) P(A B) 0.6 0.8 0.5 0.9
El evento en que una familia se suscribe a sólo el periódico local se escribe como A B
[(no metropolitano) y local]. Ahora la figura 2.4 implica que
0.9 P(A B) P(A) P(A B) 0.6 P(A B)
a partir de la cual P(A B) 0.3. Asimismo P(A B) P(A B) P(B) 0.1. Todo
esto se ilustra en la figura 2.5, donde se ve que
P(exactamente uno) P(A B) P(A B) 0.1 0.3 0.4
www.FreeLibros.me
c2_p046-085.qxd
56
3/12/08
CAPÍTULO 2
3:58 AM
Page 56
Probabilidad
P(A B' )
P(A' B)
0.1 0.5 0.3
Figura 2.5
Probabilidades para el ejemplo 2.14.
■
La probabilidad de una unión de más de dos eventos se calcula en forma análoga.
Para tres eventos cualesquiera A, B y C,
P(A B C) P(A) P(B) P(C) P(A B) P(A C)
P(B C) P(A B C)
Esto se puede ver examinando un diagrama de Venn de A B C, el cual se muestra en
la figura 2.6. Cuando P(A), P(B) y P(C) se agregan, ciertas intersecciones se cuentan dos
veces, por lo que deben ser restadas, pero esto hace que P(A B C) se reste una vez en
exceso.
B
A
C
Figura 2.6
A B C.
Determinación de probabilidades sistemáticamente
Considérese un espacio muestral que es o finito o “contablemente infinito” (lo segundo significa que los resultados pueden ser puestos en lista en una secuencia infinita, por lo que
existe un primer resultado, un segundo, un tercero, y así sucesivamente, por ejemplo, el escenario de prueba de baterías del ejemplo 2.4). Que E1, E2, E3, . . . denoten los eventos simples correspondientes, cada uno compuesto de un solo resultado. Una estrategia sensible para
el cálculo de probabilidad es determinar primero cada probabilidad de evento simple, con el
requerimiento de que PsE id 5 1. Entonces la probabilidad de cualquier evento compuesto
A se calcula agregando los P(Ei) para todos los Ei que existen en A:
PsAd 5
g
PsEid
todos los Ei en A
Ejemplo 2.15
Durante las horas no pico el tren que viaja entre los suburbios y la ciudad utiliza cinco carros.
Suponga que existe el doble de probabilidades de que un usuario seleccione el carro intermedio (#3) que cualquier carro adyacente (#2 o #4) y el doble de probabilidades de que seleccione cualquier carro adyacente que cualquier carro extremo (#1 o #5). Sea pi P(carro i
seleccionado) P(Ei). Entonces se tiene p3 2p2 2p4 y p2 2p1 2p5 p4. Esto da
15
g PsE id 5 p1 1 2p1 1 4p1 1 2p1 1 p1 5 10p1
es decir, p1 p5 0.1, p2 p4 0.2, p3 0.4. La probabilidad de que uno de los tres carros intermedios se seleccione (un evento compuesto) es entonces p2 + p3 + p4 0.8.
■
www.FreeLibros.me
c2_p046-085.qxd
3/12/08
3:58 AM
Page 57
2.2 Axiomas, interpretaciones y propiedades de probabilidad
57
Resultados igualmente probables
En muchos experimentos compuestos de N resultados, es razonable asignar probabilidades
iguales a los N eventos simples. Éstos incluyen ejemplos tan obvios como lanzar al aire una
moneda o un dado imparciales una o dos veces (o cualquier número fijo de veces) o seleccionar una o varias cartas de un mazo bien barajado de 52 cartas. Con p P(Ei) por cada i,
N
N
i1
i1
1 P(Ei) p p N
por lo tanto p
1
N
Es decir, si existen N resultados igualmente probables, la probabilidad de cada uno es 1/N.
Ahora considérese un evento A, con N(A) como el número de resultados contenidos
en A. Entonces
P(A)
1
N(A)
N
en A N
P(Ei)
Ei en A
Ei
Por lo tanto, cuando los resultados son igualmente probables, el cálculo de probabilidades se reduce a contar: determinar tanto el número de resultados N(A) en A como el número de resultados N en S y formar su relación.
Ejemplo 2.16
Cuando dos dados se lanzan por separado, existen N 36 resultados (elimine la primera
fila y la primera columna de la tabla del ejemplo 2.3). Si ambos dados son imparciales, los
1
36 resultados son igualmente probables, por lo tanto P(Ei) 36 . Entonces el evento A
{suma de dos números 7} consta de seis resultados (1, 6), (2, 5), (3, 4), (4, 3), (5, 2) y
(6, 1), por lo tanto
P(A)
EJERCICIOS
6
1
N(A)
N
36
6
■
Sección 2.2 (11-28)
11. Una compañía de fondos de inversión mutua ofrece a sus
clientes varios fondos diferentes: un fondo de mercado de
dinero, tres fondos de bonos (a corto, intermedio y a largo
plazos), dos fondos de acciones (de moderado y alto riesgo)
y un fondo balanceado. Entre los clientes que poseen acciones en un solo fondo, los porcentajes de clientes en los diferentes fondos son como sigue:
Mercado de dinero 20%
Bonos a corto plazo 15%
Bonos a plazo
intermedio
10%
Bonos a largo plazo 5%
Acciones de alto riesgo 18%
Acciones de riesgo
moderado
25%
Balanceadas
7%
Se selecciona al azar un cliente que posee acciones en sólo
un fondo.
a. ¿Cuál es la probabilidad de que el individuo seleccionado posea acciones en el fondo balanceado?
b. ¿Cuál es la probabilidad de que el individuo posea acciones en un fondo de bonos?
c. ¿Cuál es la probabilidad de que el individuo seleccionado no posea acciones en un fondo de acciones?
12. Considere seleccionar al azar un estudiante en cierta universidad y que A denote el evento en que el individuo seleccio-
a.
b.
c.
nado tenga una tarjeta de crédito Visa y que B sea el evento
análogo para la tarjeta MasterCard. Suponga que P(A)
0.5, P(B) 0.4 y P(A B) 0.25.
Calcule la probabilidad de que el individuo seleccionado
tenga por lo menos uno de los dos tipos de tarjetas (es decir, la probabilidad del evento A B).
¿Cuál es la probabilidad de que el individuo seleccionado
no tenga ningún tipo de tarjeta?
Describa, en función de A y B, el evento de que el estudiante seleccionado tenga una tarjeta Visa pero no una MasterCard y luego calcule la probabilidad de este evento.
13. Una firma consultora de computación presentó propuestas en
tres proyectos. Sea Ai {proyecto otorgado i}, con i 1, 2,
3 y suponga que P(A1) 0.22, P(A2) 0.25, P(A3) 0.28,
P(A1 A2) 0.11, P(A1 A3) 0.05, P(A2 A3) 0.07,
P(A1 A2 A3) 0.01. Exprese en palabras cada uno de
los siguientes eventos y calcule la probabilidad de cada uno:
a. A1 A2
b. A1 A2 [ Sugerencia: (A1 A2) A1 A2]
c. A1 A2 A3
d. A1 A2 A3
e. A1 A2 A3
f. (A1 A2) A3
14. Una compañía de electricidad ofrece una tarifa de consumo
mínimo a cualquier usuario cuyo consumo de electricidad
www.FreeLibros.me
c2_p046-085.qxd
58
3/12/08
CAPÍTULO 2
3:58 AM
Page 58
Probabilidad
sea de menos de 240 kWh durante un mes particular. Si A
denota el evento en que un usuario seleccionado al azar en
una cierta comunidad no excede el consumo mínimo durante enero y B el evento análogo para el mes de julio (A y B
se refieren al mismo usuario. Suponga P(A) 0.8, P(B)
0.7 y P(A B) 0.9. Calcule lo siguiente:
a. P(A B).
b. La probabilidad de que el consumo mínimo sea sobrepasado en exactamente uno de los dos meses. Describa este evento en función de A y B.
15. Considere el tipo de secadora de ropa (de gas o eléctrica)
adquirida por cada uno de cinco clientes diferentes en cierta tienda.
a. Si la probabilidad de que a lo sumo uno de éstos adquiera
una secadora eléctrica es 0.428, ¿cuál es la probabilidad de
que por lo menos dos adquieran una secadora eléctrica?
b. Si P(los cinco compran una secadora de gas) 0.116 y
P(los cinco compran una secadora eléctrica) 0.005,
¿cuál es la probabilidad de que por lo menos se adquiera una secadora de cada tipo?
16. A un individuo se le presentan tres vasos diferentes de refresco de cola, designados C, D y P. Se le pide que pruebe los tres
y que los ponga en lista en orden de preferencia. Suponga que
se sirvió el mismo refresco de cola en los tres vasos.
a. ¿Cuáles son los eventos simples en este evento de clasificación y qué probabilidad le asignaría a cada uno?
b. ¿Cuál es la probabilidad de que C obtenga el primer lugar?
c. ¿Cuál es la probabilidad de que C obtenga el primer lugar y D el último?
17. Que A denote el evento en que la siguiente solicitud de asesoría de un consultor de “software” estadístico tenga que
ver con el paquete SPSS y que B denote el evento en que la
siguiente solicitud de ayuda tiene que ver con SAS. Suponga que P(A ) 0.30 y P(B) 0.50.
a. ¿Por qué no es el caso en que P(A) + P(B) 1?
b. Calcule P(A).
c. Calcule P(A B).
d. Calcule P(A B).
18. Una caja contiene cuatro focos de 40 W, cinco de 60 W y
seis de 75 W. Si los focos se eligen uno por uno en orden
aleatorio, ¿cuál es la probabilidad de que por lo menos dos
focos deban ser seleccionados para obtener uno de 75 W?
19. La inspección visual humana de uniones soldadas en un
circuito impreso puede ser muy subjetiva. Una parte del
problema se deriva de los numerosos tipos de defectos de
soldadura (p. ej., almohadilla seca, visibilidad en escuadra,
picaduras) e incluso el grado al cual una unión posee uno
o más de estos defectos. Por consiguiente, incluso inspectores altamente entrenados pueden discrepar en cuanto a la
disposición particular de una unión particular. En un lote
de 10 000 uniones, el inspector A encontró 724 defectuosas, el inspector B, 751 y 1159 de las uniones fueron consideradas defectuosas por cuando menos uno de los
inspectores. Suponga que se selecciona una de las 10 000
uniones al azar.
a. ¿Cuál es la probabilidad de que la unión seleccionada no
sea juzgada defectuosa por ninguno de los dos inspectores?
b. ¿Cuál es la probabilidad de que la unión seleccionada
sea juzgada defectuosa por el inspector B pero no por
inspector A?
20. Cierta fábrica utiliza tres turnos diferentes. Durante el año
pasado, ocurrieron 200 accidentes en la fábrica. Algunos de
ellos pueden ser atribuidos por lo menos en parte a condiciones de trabajo inseguras. La tabla adjunta da el porcentaje de accidentes que ocurren en cada tipo de categoría de
accidente-turno.
Condiciones
inseguras
Turno
Día
Tarde
Noche
No relacionados
a condiciones
10%
8%
5%
35%
20%
22%
Suponga que uno de los 200 reportes de accidente se selecciona al azar de un archivo de reportes y que el turno y el tipo de accidente se determinan.
a. ¿Cuáles son los eventos simples?
b. ¿Cuál es la probabilidad de que el accidente seleccionado se atribuya a condiciones inseguras?
c. ¿Cuál es la probabilidad de que el accidente seleccionado no ocurrió en el turno de día.
21. Una compañía de seguros ofrece cuatro diferentes niveles
de deducible, ninguno, bajo, medio y alto, para sus tenedores de pólizas de propietario de casa y tres diferentes niveles, bajo, medio y alto, para sus tenedores de pólizas de
automóviles. La tabla adjunta da proporciones de las varias
categorías de tenedores de pólizas que tienen ambos tipos
de seguro. Por ejemplo, la proporción de individuos con deducible bajo de casa como deducible bajo de carro es 0.06
(6% de todos los individuos).
Propietario de casa
Auto
N
B
M
A
B
M
A
0.04
0.07
0.02
0.06
0.10
0.03
0.05
0.20
0.15
0.03
0.10
0.15
Suponga que se elige al azar un individuo que posee ambos
tipos de pólizas.
a. ¿Cuál es la probabilidad de que el individuo tenga un deducible de auto medio y un deducible de casa alto?
b. ¿Cuál es la probabilidad de que el individuo tenga un deducible de casa bajo y un deducible de auto bajo?
c. ¿Cuál es la probabilidad de que el individuo se encuentre en la misma categoría de deducibles de casa y auto?
d. Basado en su respuesta en el inciso c), ¿cuál es la probabilidad de que las dos categorías sean diferentes?
e. ¿Cuál es la probabilidad de que el individuo tenga por lo
menos un nivel deducible bajo?
f. Utilizando la respuesta del inciso e). ¿cuál es la probabilidad de que ningún nivel deducible sea bajo?
22. La ruta utilizada por un automovilista para trasladarse a su
trabajo contiene dos intersecciones con señales de tránsito.
www.FreeLibros.me
c2_p046-085.qxd
3/12/08
3:58 AM
Page 59
2.3 Técnicas de conteo
La probabilidad de que tenga que detenerse en la primera
señal es 0.4, el problema análogo para la segunda señal es
0.5 y la probabilidad de que tenga que detenerse en por lo
menos una de las dos señales es 0.6. ¿Cuál es la probabilidad de que tenga que detenerse
a. En ambas señales?
b. En la primera señal pero no en la segunda?
c. En exactamente una señal?
23. Las computadoras de seis miembros del cuerpo de profesores en cierto departamento tienen que ser reemplazadas.
Dos de ellos seleccionaron computadoras portátiles y los
otros cuatro escogieron computadoras de escritorio. Suponga que sólo dos de las configuraciones pueden ser realizadas en un día particular y las dos computadoras que van
a ser configuradas se seleccionan al azar de entre las seis
(lo que implica 15 resultados igualmente probables; si las
computadoras se numeran 1, 2, . . . , 6 entonces un resultado
se compone de las computadoras 1 y 2, otro de las computadoras 1 y 3, y así sucesivamente).
a. ¿Cuál es la probabilidad de que las dos configuraciones
seleccionadas sean computadoras portátiles?
b. ¿Cuál es la probabilidad de que ambas configuraciones seleccionadas sean computadoras de escritorio?
c. ¿Cuál es la probabilidad de que por lo menos una configuración seleccionada sea una computadora de escritorio?
d. ¿Cuál es la probabilidad de que por lo menos una computadora de cada tipo sea elegida para configurarla?
24. Demuestre que si un evento A está contenido en otro evento B (es decir, A es un subconjunto de B), entonces P(A)
P(B). [Sugerencia: Con los eventos A y B, A y B A son
eventos excluyentes y B A (B A), como se ve en el
diagrama de Venn.] Para los eventos A y B, ¿qué implica esto sobre la relación entre P(A B), P(A) y P(A B)?
25. Las tres opciones principales en un tipo de carro nuevo son
una transmisión automática (A), un quemacocos (B) y un
estéreo con reproductor de discos compactos (C ). Si 70% de
todos los compradores solicitan A, 80% solicitan B, 75% solicitan C, 85% solicitan A o B, 90% solicitan A o C, 95%
solicitan B o C y 98% solicitan A o B o C, calcule las probabilidades de los siguientes eventos. [Sugerencia: “A o B” es
el evento en que por lo menos una de las dos opciones es solicitada; trate de trazar un diagrama de Venn y rotule todas
las regiones.]
a. El siguiente comprador solicitará por lo menos una de
las tres opciones.
b. El siguiente comprador no seleccionará ninguna de las
tres opciones.
59
c. El siguiente comprador solicitará sólo una transmisión
automática y ninguna otra de las otras dos opciones.
d. El siguiente comprador seleccionará exactamente una de
estas tres opciones.
26. Un sistema puede experimentar tres tipos diferentes de
defectos. Sea Ai (i 1, 2, 3) el evento en que el sistema tiene un defecto de tipo i. Suponga que
P(A1) 0.12 P(A2) 0.07 P(A3) 0.05
P(A1 A2) 0.13 P(A1 A3) 0.14
P(A2 A3) 0.10 P(A1 A2 A3) 0.01
a. ¿Cuál es la probabilidad de que el sistema no tenga un
defecto de tipo 1?
b. ¿Cuál es la probabilidad de que el sistema tenga tanto
defectos de tipo 1 como de tipo 2?
c. ¿Cuál es la probabilidad de que el sistema tenga tanto
defectos de tipo 1 como de tipo 2 pero no de tipo 3?
d. ¿Cuál es la probabilidad de que el sistema tenga a lo sumo dos de estos defectos?
27. Un departamento académico con cinco miembros del cuerpo
de profesores, Anderson, Box, Cox, Cramer y Fisher, debe
seleccionar dos de ellos para que participen en un comité de
revisión de personal. Como el trabajo requerirá mucho tiempo, ninguno está ansioso de participar, por lo que se decidió
que el representante será elegido introduciendo cinco trozos
de papel en una caja, revolviéndolos y seleccionando dos.
a. ¿Cuál es la probabilidad de que tanto Anderson como
Box serán seleccionados? [Sugerencia: Nombre los resultados igualmente probables.]
b. ¿Cuál es la probabilidad de que por lo menos uno de los
dos miembros cuyo nombre comienza con C sea seleccionado?
c. Si los cinco miembros del cuerpo de profesores han dado
clase durante 3, 6, 7, 10 y 14 años, respectivamente, en la
universidad, ¿cuál es la probabilidad de que los dos representantes seleccionados acumulen por lo menos 15 años
de experiencia académica en la universidad?
28. En el ejercicio 5, suponga que cualquier individuo que entre a la clínica tiene las mismas probabilidades de ser asignado a cualquiera de las tres estaciones independientemente
de adónde hayan sido asignados otros individuos.
¿Cuál es la probabilidad de que
a. Los tres miembros de una familia sean asignados a la
misma estación?
b. A lo sumo dos miembros de la familia sean asignados a
la misma estación?
c. Cada miembro de la familia sea asignado a una estación
diferente?
2.3 Técnicas de conteo
Cuando los diversos resultados de un experimento son igualmente probables (la misma probabilidad es asignada a cada evento simple), la tarea de calcular probabilidades se reduce a
contar. Sea N el número de resultados en un espacio muestral y N(A) el número de resultados contenidos en un evento A.
P(A)
N(A)
N
www.FreeLibros.me
(2.1)
c2_p046-085.qxd
60
3/12/08
CAPÍTULO 2
3:58 AM
Page 60
Probabilidad
Si una lista de resultados es fácil de obtener y N es pequeño, entonces N y N(A) pueden ser
determinadas sin utilizar ningún principio de conteo.
Existen, sin embargo, muchos experimentos en los cuales el esfuerzo implicado al elaborar la lista es prohibitivo porque N es bastante grande. Explotando algunas reglas de conteo generales, es posible calcular probabilidades de la forma (2.1) sin una lista de resultados.
Estas reglas también son útiles en muchos problemas que implican resultados que no son
igualmente probables. Se utilizarán varias de las reglas desarrolladas aquí al estudiar distribuciones de probabilidad en el siguiente capítulo.
La regla de producto para pares ordenados
La primera regla de conteo se aplica a cualquier situación en la cual un conjunto (evento) se
compone de pares de objetos ordenados y se desea contar el número de pares. Por par ordenado, se quiere decir que, si O1 y O2 son objetos, entonces el par (O1, O2) es diferente del
par (O2, O1). Por ejemplo, si un individuo selecciona una línea aérea para un viaje de Los
Ángeles a Chicago y (después de realizar transacciones de negocios en Chicago) un segundo para continuar a Nueva York, una posibilidad es (American, United), otra es (United,
American) y otra más es (United, United).
PROPOSICIÓN
Si el primer elemento u objeto de un par ordenado puede ser seleccionado de n1 maneras y por cada una de estas n1 maneras el segundo elemento del par puede ser seleccionado de n2 maneras, entonces el número de pares es n1n2.
Ejemplo 2.17
El propietario de una casa que va a llevar a cabo una remodelación requiere los servicios
tanto de un contratista de fontanería como de un contratista de electricidad. Si existen 12
contratistas de fontanería y 9 contratistas electricistas disponibles en el área, ¿de cuántas
maneras pueden ser elegidos los contratistas? Sean P1, . . . , P12 los fontaneros y Q1, . . . ,
Q9 los electricistas, entonces se desea el número de pares de la forma (Pi, Qj). Con n1 12
y n2 9, la regla de producto da N (12)(9) 108 formas posibles de seleccionar los
dos tipos de contratistas.
■
En el ejemplo 2.17, la selección del segundo elemento del par no dependió de qué primer elemento ocurrió o fue elegido. En tanto exista el mismo número de opciones del segundo elemento por cada primer elemento, la regla de producto es válida incluso cuando el
conjunto de posibles segundos elementos depende del primer elemento.
Ejemplo 2.18
Una familia se acaba de cambiar a una nueva ciudad y requiere los servicios tanto de un obstetra como de un pediatra. Existen dos clínicas médicas fácilmente accesibles y cada una tiene dos obstetras y tres pediatras. La familia obtendrá los máximos beneficios del seguro de
salud si se une a la clínica y selecciona ambos doctores de la clínica. ¿De cuántas maneras
se puede hacer esto? Denote los obstetras por O1, O2, O3 y O4 y los pediatras por P1, . . . ,
P6. Entonces se desea el número de pares (Oi,Pj) para los cuales Oi y Pj están asociados con
la misma clínica. Como existen cuatro obstetras, n1 4, y por cada uno existen tres opciones de pediatras, por lo tanto n2 3. Aplicando la regla de producto se obtienen N
n1n2 12 posibles opciones.
■
En muchos problemas de conteo y probabilidad, se puede utilizar una configuración conocida como diagrama de árbol para representar pictóricamente todas las posibilidades. El diagrama de árbol asociado con el ejemplo 2.18 aparece en la figura 2.7. Partiendo de un punto
localizado en el lado izquierdo del diagrama, por cada posible primer elemento de un par
emana un segmento de línea recta hacia la derecha. Cada una de estas líneas se conoce como
www.FreeLibros.me
c2_p046-085.qxd
3/12/08
3:59 AM
Page 61
2.3 Técnicas de conteo
61
P1
P2
O1
P1
P2
O2
O3
P3
P4
P3
P5
O4
P4
P6
P5
P6
Figura 2.7
Diagrama de árbol para el ejemplo 2.18.
rama de primera generación. Ahora para cualquier rama de primera generación se construye otro segmento de línea que emana de la punta de la rama por cada posible opción de un
segundo elemento del par. Cada segmento de línea es una rama de segunda generación. Como existen cuatro obstetras, existen cuatro ramas de primera generación y tres pediatras por
cada obstetra se obtienen tres ramas de segunda generación que emanan de cada rama de
primera generación.
Generalizando, supóngase que existen n1 ramas de primera generación y por cada rama de primera generación existen n2 ramas de segunda generación. El número total de ramas
de segunda generación es entonces n1n2. Como el extremo de cada rama de segunda generación corresponde a exactamente un posible par (la selección de un primer elemento y luego
de un segundo nos sitúa en el extremo de exactamente una rama de segunda generación),
existen n1n2 pares, lo que verifica la regla de producto.
La construcción de un diagrama de árbol no depende de tener el mismo número de ramas de segunda generación que emanen de cada rama de primera generación. Si la segunda clínica tenía cuatro pediatras, entonces habría sólo tres ramas que emanan de dos de las
ramas de primera generación y cuatro que emanan de cada una de las otras dos ramas de primera generación. Un diagrama de árbol puede ser utilizado por lo tanto para representar pictóricamente experimentos aparte de aquellos a los que se aplica la regla de producto.
Una regla de producto más general
Si se lanza al aire un dado de seis lados cinco veces en sucesión en lugar de sólo dos veces,
entonces cada posible resultado es un conjunto ordenado de cinco números tal como (1, 3,
1, 2, 4) o (6, 5, 2, 2, 2). Un conjunto ordenado de k objetos recibirá el nombre de k-tupla
(por tanto un par es un 2-tupla y un triple es un 3-tupla). Cada resultado del experimento del
lanzamiento al aire de el dado es entonces un 5-tupla.
Regla de producto para k-tuplas
Supóngase que un conjunto se compone de conjuntos ordenados de k elementos
(k-tuplas) y que existen n1 posibles opciones para el primer elemento por cada opción
del primer elemento, existen n2 posibles opciones del segundo elemento; . . . ; por cada
posible opción de los primeros k 1 elementos, existen nk opciones del elemento
k-ésimo. Existen entonces n1n2· · · · ·nk posibles k-tuplas.
www.FreeLibros.me
c2_p046-085.qxd
62
3/12/08
CAPÍTULO 2
3:59 AM
Page 62
Probabilidad
Esta regla más general también puede ser ilustrada por un diagrama de árbol; simplemente se construye un diagrama más elaborado añadiendo una tercera generación de ramas
que emanan de la punta de cada segunda generación, luego ramas de cuarta generación, y
así sucesivamente, hasta que por último se agregan ramas de k-ésima generación.
Ejemplo 2.19
(continuación
del ejemplo
2.17)
Ejemplo 2.20\
(continuación
del ejemplo
2.18)
Suponga que el trabajo de remodelación de la casa implica adquirir primero varios utensilios de cocina. Se adquirirán en la misma tienda y hay cinco tiendas en el área. Con las tiendas denotadas por D1, . . . , D5, existen N n1n2n3 (5)(12)(9) 540 3 tuplas de la forma
(Di, Pj, Qk), así que existen 540 formas de elegir primero una tienda, luego un contratista de
fontanería y finalmente un contratista electricista.
■
Si cada clínica tiene dos especialistas en medicina interna y dos médicos generales, existen
n1n2n3n4 (4)(3)(3)(2) 72 formas de seleccionar un doctor de cada tipo de tal suerte que
todos los doctores practiquen en la misma clínica.
■
Permutaciones y combinaciones
Considérese un grupo de n individuos u objetos distintos (“distintos” significa que existe alguna característica que diferencia a cualquier individuo u objeto de cualquier otro). ¿Cuántas maneras existen de seleccionar un subconjunto de tamaño k del grupo? Por ejemplo, si
un equipo de ligas menores tiene 15 jugadores registrados, ¿cuántas maneras existen de seleccionar 9 jugadores para una alineación inicial? O si en su librero tiene 10 libros de misterio no
leídos y desea seleccionar 3 para llevarlos consigo en unas vacaciones cortas, ¿cuántas maneras existen de hacerlo?
Una respuesta a la pregunta general que se acaba de plantear requiere distinguir entre
dos casos. En algunas situaciones, tal como el escenario del béisbol, el orden de la selección
es importante. Por ejemplo, con Ángela como lanzador y Ben como receptor se obtiene una
alineación diferente de aquella con Ángela como receptor y Ben como lanzador. A menudo,
sin embargo, el orden no es importante y a nadie le interesa qué individuos u objetos sean
seleccionados, como sería el caso en el escenario de selección de libros.
DEFINICIÓN
Un subconjunto ordenado se llama permutación. El número de permutaciones de tamaño k que se puede formar con los n individuos u objetos en un grupo será denotado
por Pk,n. Un subconjunto no ordenado se llama combinación. Una forma de denotar el
número de combinaciones es Ck,n, pero en su lugar se utilizará una notación que es basn
tante común en libros de probabilidad: A k B , que se lee “de n se eligen k”.
El número de permutaciones se determina utilizando la primera regla de conteo para
k-tuplas. Supóngase, por ejemplo, que un colegio de ingeniería tiene siete departamentos,
denotados por a, b, c, d, e, f y g. Cada departamento tiene un representante en el consejo de
estudiantes del colegio. De estos siete representantes, uno tiene que ser elegido como presidente, otro como vicepresidente y un tercero como secretario. ¿Cuántas maneras existen para seleccionar los tres oficiales? Es decir, ¿cuántas permutaciones de tamaño 3 pueden ser formadas
con los 7 representantes? Para responder esta pregunta, habrá que pensar en formar una tripleta
(3-tupla) en la cual el primer elemento es el presidente, el segundo es el vicepresidente y el tercero es el secretario. Una tripleta es (a, g, b), otra es (b, g, a) y otra más es (d, f, b). Ahora bien
el presidente puede ser seleccionado en cualesquiera de n1 7 formas. Por cada forma de seleccionar el presidente, existen n2 6 formas de seleccionar el vicepresidente y por consiguiente 7 6 42 (pares de presidente, vicepresidente). Por último, por cada forma de seleccionar
un presidente y vicepresidente, existen n3 5 formas de seleccionar el secretario. Esto da
P3,7 (7)(6)(5) 210
www.FreeLibros.me
c2_p046-085.qxd
3/12/08
3:59 AM
Page 63
2.3 Técnicas de conteo
63
como el número de permutaciones de tamaño 3 que se pueden formar con 7 individuos distintos. Una representación de diagrama de árbol mostraría tres generaciones de ramas.
La expresión para P3,7 puede ser rescrita con la ayuda de notación factorial. Recuérdese que 7! (se lee “factorial de 7”) es una notación compacta para el producto descendente de enteros (7)(6)(5)(4)(3)(2)(1). Más generalmente, para cualquier entero positivo m, m!
m(m 1)(m 2)· · · · · (2)(1). Esto da 1! 1 y también se define 0! 1. Entonces
P3,7 5 s7ds6ds5d 5
s7ds6ds5ds4!d
7!
5
s4!d
4!
Más generalmente
Pk,n 5 nsn 2 1dsn 2 2d . . . sn 2 sk 2 2ddsn 2 sk 2 1dd
Multiplicando y dividiendo ésta por (n – k)! se obtiene una expresión compacta para el número de permutaciones.
Pk,n 5
PROPOSICIÓN
Ejemplo 2.21
n!
sn 2 kd!
Existen diez asistentes de profesor disponibles para calificar exámenes en un curso de
cálculo en una gran universidad. El primer examen se compone de cuatro preguntas y el
profesor desea seleccionar un asistente diferente para calificar cada pregunta (sólo un asistente por pregunta). ¿De cuántas maneras se pueden elegir los asistentes para calificar? En
este caso n tamaño del grupo 10 y k tamaño del subconjunto 4. El número de permutaciones es
P4,10 5
10!
10!
5
5 10s9ds8ds7d 5 5040
s10 2 4d!
6!
Es decir, el profesor podría aplicar 5040 exámenes diferentes de cuatro preguntas sin utilizar la misma asignación de calificadores a preguntas, ¡tiempo en el cual todos los asistentes
seguramente habrán terminado sus programas de licenciatura!
■
Considérense ahora las combinaciones (es decir, subconjuntos ordenados). De nuevo
habrá que remitirse al escenario de consejo estudiantil y supóngase que tres de los siete representantes tienen que ser seleccionados para que asistan a una convención estatal. El orden de selección no es importante; lo que importa es cuáles tres son seleccionados. Así que
7
se busca ( 3), el número de combinaciones de 3 que se pueden formar con los 7 individuos.
Considérese por un momento las combinaciones a, c, g. Estos tres individuos pueden ser ordenados en 3! 6 formas para producir el número de permutaciones:
a,c,g
a,g,c
c,a,g
c,g,a
g,a,c
g,c,a
De manera similar, hay 3! 6 maneras para ordenar la combinación b, c, e para producir
combinaciones y de hecho hay 3! modos para ordenar cualquier combinación particular de
tamaño 3 para producir permutaciones. Esto implica la siguiente relación entre el número
de combinaciones y el número de permutaciones.
P3,7
s7ds6ds5d
7
7
7!
5
5
5 35
P3,7 5 s3!d ? Q R 1 Q R 5
3
3
3!
s3!ds4!d
s3ds2ds1d
No sería difícil poner en lista las 35 combinaciones, pero no hay necesidad de hacerlo si sólo interesa cuántas son. Obsérvese que el número 210 de permutaciones excede por mucho
www.FreeLibros.me
c2_p046-085.qxd
64
3/12/08
CAPÍTULO 2
3:59 AM
Page 64
Probabilidad
el número de combinaciones; el segundo es más grande que el primero por un factor de 3!
puesto que así es como cada combinación puede ser ordenada.
Generalizando la línea de razonamiento anterior se obtiene una relación simple entre
el número de permutaciones y el número de combinaciones que produce una expresión concisa para la última cantidad.
n
k
PROPOSICIÓN
Pk,n
n!
k!
k!(n k)!
Nótese que ( n) 1 y ( 0) 1 puesto que hay sólo una forma de seleccionar un conjunto
n
de (todos) n elementos o de ningún elemento y ( 1) n puesto que existen n subconjuntos de tamaño 1.
n
Ejemplo 2.22
n
Una mano de bridge se compone de 13 cartas seleccionadas de entre un mazo de 52 cartas
52
sin importar el orden. Existen ( 13) 52!/13!39! manos de bridge diferentes, lo que asciende a
aproximadamente 635 000 millones. Como existen 13 cartas de cada palo, el número de ma26
nos compuestas por completo de tréboles y/o espadas (nada de cartas rojas) es ( 13)
26
26!/13!13! 10 400 600. Una de estas manos ( 13) se compone por completo de espadas y una
26
se compone por completo de tréboles, por lo tanto existen [( 13) 2] manos compuestas por
completo de tréboles y espadas con ambos palos representados en la mano. Supóngase que
una mano de bridge repartida de un mazo bien barajado (es decir, 13 cartas se seleccionan
al azar de entre 52 posibilidades) y si
A {la mano se compone por completo de espadas y tréboles con ambos palos representados}
B {la mano se compone de exactamente dos palos}
Los N ( 13) posibles resultados son igualmente probables, por lo tanto
26
2
N(A)
13
P(A)
0.0000164
N
52
13
Como existen ( 42 ) 6 combinaciones compuestas de dos palos, de las cuales espadas y tréboles es una de esas combinaciones,
52
6
P(B)
13 2
0.0000983
52
13
26
Es decir, una mano compuesta por completo de cartas de exactamente dos de los cuatro palos ocurrirá aproximadamente una vez por cada 100 000 manos. Si juega bridge sólo una
vez al mes, es probable que nunca le repartan semejante mano.
■
Ejemplo 2.23
El almacén de una universidad recibió 25 impresoras, de las cuales 10 son impresoras láser
y 15 son modelos de inyección de tinta. Si 6 de estas 25 se seleccionan al azar para que las
revise un técnico particular, ¿cuál es la probabilidad de que exactamente 3 de las seleccionadas sean impresoras láser (de modo que las otras 3 sean de inyección de tinta)?
Sea D3 {exactamente 3 de las 6 seleccionadas son impresoras de inyección de tinta}. Suponiendo que cualquier conjunto particular de 6 impresoras es tan probable de ser elegido como cualquier otro conjunto de 6, se tienen resultados igualmente probables, por lo
tanto P(D3) N(D3)/N, donde N es el número de formas de elegir 6 impresoras de entre las
25 y N(D3) es el número de formas de elegir 3 impresoras láser y 3 de inyección de tinta. Por
25
lo tanto N ( 6 ). Para obtener N(D3), primero se piensa en elegir 3 de las 15 impresoras de
15
inyección de tinta y luego 3 de las impresoras láser. Existen ( 3 ) formas de elegir las 3 im10
presoras de inyección de tinta y ( 3 ) formas de elegir las 3 impresoras láser; N(D3) es ahora
www.FreeLibros.me
c2_p046-085.qxd
3/12/08
3:59 AM
Page 65
2.3 Técnicas de conteo
65
el producto de estos dos números (visualícese un diagrama de árbol, en realidad aquí se está
utilizando el argumento de la regla de producto), por lo tanto
3 3
N(D )
P(D )
N
25
6
15 10
3
3
15!
10!
3!12! 3!7!
0.3083
25!
6!19!
Sea D4 {exactamente 4 de las 6 impresoras seleccionadas son impresoras de inyección de
tinta} y defínanse D5 y D6 del mismo modo. Entonces la probabilidad de seleccionar por lo
menos 3 impresoras de inyección de tinta es
P(D3 D4 D5 D6) P(D3) P(D4) P(D5) P(D6)
3 3 4 2 5 1 6 0
0.8530
25
25
25
25
■
6
6
6
6
15 10
15 10
EJERCICIOS
15 10
15 10
Sección 2.3 (29-44)
29. Con fecha de abril de 2006, aproximadamente 50 millones
de nombres de dominio web.com fueron registrados (p. ej.,
yahoo.com).
a. ¿Cuántos nombres de dominio compuestos de exactamente dos letras pueden ser formados? ¿Cuántos nombres de dominio de dos letras existen si como caracteres
se permiten dígitos y números? [Nota: Una longitud de
carácter de tres o más ahora es obligatoria.]
b. ¿Cuántos nombres de dominio existen compuestos de
tres letras en secuencia? ¿Cuántos de esta longitud existen si se permiten letras o dígitos? [Nota: En la actualidad todos están utilizados.]
c. Responda las preguntas hechas en b) para secuencias de
cuatro caracteres.
d. Con fecha de abril de 2006, 97 786 de las secuencias de
cuatro caracteres utilizando letras o dígitos aún no habían sido reclamadas. Si se elige un nombre de cuatro
caracteres al azar, ¿cuál es la probabilidad de que ya tenga dueño?
30. Un amigo mío va a ofrecer una fiesta. Sus existencias actuales de vino incluyen 8 botellas de zinfandel, 10 de merlot y
12 de cabernet (él sólo bebe vino tinto), todos de diferentes
fábricas vinícolas.
a. Si desea servir 3 botellas de zinfandel y el orden de servicio es importante, ¿cuántas formas existen de hacerlo?
b. Si 6 botellas de vino tienen que ser seleccionadas al azar
de las 30 para servirse, ¿cuántas formas existen de hacerlo?
c. Si se seleccionan al azar 6 botellas, ¿cuántas formas
existen de obtener dos botellas de cada variedad?
d. Si se seleccionan 6 botellas al azar, ¿cuál es la probabilidad de que el resultado sea dos botellas de cada variedad?
e. Si se eligen 6 botellas al azar, ¿cuál es la probabilidad de
que todas ellas sean de la misma variedad.
31. a. Beethoven escribió 9 sinfonías y Mozart 27 conciertos
para piano. Si el locutor de una estación de radio de una
universidad desea tocar primero una sinfonía de Beethoven y luego un concierto de Mozart, ¿de cuántas maneras puede hacerlo?
b. El gerente de la estación decide que en cada noche sucesiva (7 días a la semana), se tocará una sinfonía de Beethoven, seguida por un concierto para piano de Mozart,
seguido por un cuarteto de cuerdas de Schubert (de los
cuales existen 15). ¿Durante aproximadamente cuántos
años se podría continuar con esta política antes de que
exactamente el mismo programa se repitiera?
32. Una tienda de equipos de sonido está ofreciendo un precio
especial en un juego completo de componentes (receptor,
reproductor de discos compactos, altavoces, casetera). Al
comprador se le ofrece una opción de fabricante por cada componente.
Receptor: Kenwood, Onkyo, Pioneer, Sony, Sherwood
Reproductor de discos compactos: Onkyo, Pioneer, Sony,
Technics
Altavoces: Boston, Infinity, Polk
Casetera: Onkyo, Sony, Teac, Technics
Un tablero de distribución en la tienda permite al cliente conectar cualquier selección de componentes (compuesta de
uno de cada tipo). Use las reglas de producto para responder las siguientes preguntas.
a. ¿De cuántas maneras puede ser seleccionado un componente de cada tipo?
b. ¿De cuántas maneras pueden ser seleccionados los componentes si tanto el receptor como el reproductor de discos compactos tienen que ser Sony?
www.FreeLibros.me
c2_p046-085.qxd
66
33.
34.
35.
36.
3/12/08
CAPÍTULO 2
3:59 AM
Page 66
Probabilidad
c. ¿De cuántas maneras pueden ser seleccionados los componentes si ninguno tiene que ser Sony?
d. ¿De cuántas maneras se puede hacer una selección si por
lo menos se tiene que incluir un componente Sony?
e. Si alguien mueve los interruptores en el tablero de distribución completamente al azar, ¿cuál es la probabilidad
de que el sistema seleccionado contenga por lo menos un
componente Sony? ¿Exactamente un componente Sony?
De nuevo considere el equipo de ligas menores que tiene
15 jugadores en su plantel.
a. ¿Cuántas formas existen de seleccionar 9 jugadores para la alineación inicial?
b. ¿Cuántas formas existen de seleccionar 9 jugadores para la
alineación inicial y un orden al bat de los 9 inicialistas?
c. Suponga que 5 de los 15 jugadores son zurdos. ¿Cuántas
formas existen de seleccionar 3 jardineros zurdos y tener
las otras 6 posiciones ocupadas por jugadores derechos?
Poco tiempo después de ser puestos en servicio, algunos autobuses fabricados por una cierta compañía presentaron
grietas debajo del chasis principal. Suponga que una ciudad
particular utiliza 25 de estos autobuses y que en 8 de ellos
aparecieron grietas.
a. ¿Cuántas maneras existen de seleccionar una muestra de
5 autobuses de entre los 25 para una inspección completa?
b. ¿De cuántas maneras puede una muestra de 5 autobuses
contener exactamente 4 con grietas visibles?
c. Si se elige una muestra de 5 autobuses al azar, ¿cuál es
la probabilidad de que exactamente 4 de los 5 tengan
grietas visibles?
d. Si los autobuses se seleccionan como en el inciso c),
¿cuál es la probabilidad de que por lo menos 4 de los
seleccionados tengan grietas visibles?
Una empresa de producción emplea 20 trabajadores en el
turno de día, 15 en el turno de tarde y 10 en el turno de medianoche. Un consultor de control de calidad va a seleccionar
6 de estos trabajadores para entrevistas a fondo. Suponga
que la selección se hace de tal modo que cualquier grupo
particular de 6 trabajadores tiene la misma oportunidad de
ser seleccionado al igual que cualquier otro grupo (sacando
6 papelitos de entre 45 sin reemplazarlos).
a. ¿Cuántas selecciones resultarán en que los 6 trabajadores seleccionados provengan del turno de día?
b. ¿Cuál es la probabilidad de que los 6 trabajadores seleccionados sean del mismo turno?
c. ¿Cuál es la probabilidad de que por lo menos dos turnos
diferentes estarán representados entre los trabajadores
seleccionados?
d. ¿Cuál es la probabilidad de que por lo menos uno de
los turnos no estará representado en la muestra de trabajadores?
Un departamento académico compuesto de cinco profesores limitó su opción para jefe de departamento a el candidato A o el candidato B. Cada miembro votó entonces con un
papelito por uno de los candidatos. Suponga que en realidad
existen tres votos para A y dos para B. Si los papelitos se
cuentan al azar, ¿cuál es la probabilidad de que A permanezca delante de B durante todo el conteo de votos (p. ej.
¿ocurre este evento si el orden seleccionado es AABAB pero no si es ABBAA)?
37. Un experimentador está estudiando los efectos de la temperatura, la presión y el tipo de catalizador en la producción
de cierta reacción química. Tres diferentes temperaturas,
cuatro presiones distintas y cinco catalizadores diferentes se
están considerando.
a. Si cualquier experimento particular implica utilizar una
temperatura, una presión y un catalizador, ¿cuántos experimentos son posibles?
b. ¿Cuántos experimentos existen que impliquen el uso de
la temperatura más baja y dos presiones bajas?
c. Suponga que se tienen que realizar cinco experimentos
diferentes el primer día de experimentación. Si los cinco se eligen al azar de entre todas las posibilidades, de
modo que cualquier grupo de cinco tenga la misma probabilidad de selección, ¿cuál es la probabilidad de que
se utilice un catalizador diferente en cada experimento?
38. Una caja en un almacén contiene cuatro focos de 40 W, cinco de 60 W y seis de 75 W. Suponga que se eligen al azar
tres focos.
a. ¿Cuál es la probabilidad de que exactamente dos de los
focos seleccionados sean de 75 W?
b. ¿Cuál es la probabilidad de que los tres focos seleccionados sean de los mismos watts?
c. ¿Cuál es la probabilidad de que se seleccione un foco de
cada tipo?
d. Suponga ahora que los focos tienen que ser seleccionados uno por uno hasta encontrar uno de 75 W. ¿Cuál es
la probabilidad de que sea necesario examinar por lo
menos seis focos?
39. Quince teléfonos acaban de llegar a un centro de servicio
autorizado. Cinco de éstos son celulares, cinco inalámbricos y los otros cincos alámbricos. Suponga que a estos componentes se les asignan al azar los números 1, 2, . . . , 15
para establecer el orden en que serán reparados.
a. ¿Cuál es la probabilidad de que los teléfonos inalámbricos estén entre los primeros diez que van a ser reparados?
b. ¿Cuál es la probabilidad de que después de reparar diez
de estos teléfonos, sólo dos de los tres tipos de teléfonos
queden para ser reparados?
c. ¿Cuál es la probabilidad que dos teléfonos de cada tipo
estén entre los primeros seis reparados?
40. Tres moléculas de tipo A, tres de tipo B, tres de tipo C y tres
de tipo D tienen que ser unidas para formar una cadena molecular. Una cadena molecular como esa es ABCDABCDABCD y otra es BCDDAAABDBCC.
a. ¿Cuántas moléculas en cadena hay? [Sugerencia: si se
pudieran distinguir entre sí las tres letras A, A1, A2, A3, y
también las letras B, C y D, ¿cuántas moléculas del tipo
habría? ¿Cómo se reduce este número cuando se eliminan de las letras A los subíndices?
b. Suponga que se elige al azar una molécula del tipo descrito. ¿Cuál es la probabilidad de que las tres moléculas de cada tipo terminen una junto a la otra (como en
BBBAAADDDCCC)?
41. Una profesora de matemáticas desea programar una cita
con cada uno de sus ochos asistentes, cuatro hombres y cuatro mujeres, para discutir su curso de cálculo. Suponga que
todos los posibles ordena mientos de citas tienen la misma
probabilidad de ser seleccionados.
www.FreeLibros.me
c2_p046-085.qxd
3/12/08
3:59 AM
Page 67
2.4 Probabilidad condicional
67
(esposo y esposa) se sienten en los dos asientos extremos
del lado izquierdo? ¿Cuál es la probabilidad de que Jim y
Paula terminen sentándose uno junto al otro? ¿Cuál es la
probabilidad de que por lo menos dos de las esposas terminen sentándose al lado de su esposo?
a. ¿Cuál es la probabilidad de que por lo menos una mujer
asistente quede entre los primeros tres con quien la profesora se reúna?
b. ¿Cuál es la probabilidad de que después de las primeras
cinco citas se haya reunido con todas las asistentes mujeres?
c. Suponga que la profesora tiene los mismos ocho asistentes el siguiente semestre y de nuevo programa citas sin
importar el orden que hubo durante el primer semestre.
¿Cuál es la probabilidad de que los ordenamientos de las
citas sean diferentes?
43. En un juego de póker de cinco cartas, una escalera se compone de cinco cartas con denominaciones adyacentes (p. ej.
9 de tréboles, 10 de corazones, joto de corazones, reina de
espadas y rey de tréboles). Suponiendo que los ases pueden estar arriba o abajo, si le reparten una mano de cinco
cartas, ¿cuál es la probabilidad que será una escalera con un
10 como carta alta? ¿Cuál es la probabilidad de que sea una
escalera del mismo palo?
42. Tres parejas de casados compraron boletos para el teatro y
están sentados en una fila compuesta de sólo seis asientos.
Si ocupan sus asientos de un modo completamente al azar
(orden aleatorio), ¿cuál es la probabilidad de que Jim y Paula
44. Demuestre que ( k ) ( nk ). Dé una interpretación que implique subconjuntos.
n
n
2.4 Probabilidad condicional
Las probabilidades asignadas a varios eventos dependen de lo que se sabe sobre la situación
experimental cuando se hace la asignación. Subsiguiente a la asignación inicial puede llegar a estar disponible información parcial pertinente al resultado del experimento. Tal información puede hacer que se revisen algunas de las asignaciones de probabilidad. Para un
evento particular A, se ha utilizado P(A) para representar la probabilidad asignada a A; ahora se considera P(A) como la probabilidad original no condicional del evento A.
En esta sección, se examina cómo afecta la información de que “un evento B ha ocurrido” a la probabilidad asignada a A. Por ejemplo, A podría referirse a un individuo que sufre una enfermedad particular en la presencia de ciertos síntomas. Si se realiza un examen
de sangre en el individuo y el resultado es negativo (B examen de sangre negativo), entonces la probabilidad de que tenga la enfermedad cambiará (deberá reducirse, pero no a cero, puesto que los exámenes de sangre no son infalibles). Se utilizará la notación P(A | B)
para representar la probabilidad condicional de A dado que el evento B haya ocurrido.
B es el “evento condicionante”.
Por ejemplo, considérese el evento A en que un estudiante seleccionado al azar en su
universidad obtuvo todas las clases deseadas durante el ciclo de inscripciones del semestre
anterior. Presumiblemente P(A) no es muy grande. Sin embargo, supóngase que el estudiante seleccionado es un atleta con prioridad de inscripción especial (el evento B). Entonces
P(A | B) deberá ser sustancialmente más grande que P(A), aunque quizá aún no cerca de 1.
Ejemplo 2.24
En una planta se ensamblan componentes complejos en dos líneas de ensamble diferentes,
A y A. La línea A utiliza equipo más viejo que A, por lo que es un poco más lenta y menos confiable. Suponga que en un día dado la línea A ensambla 8 componentes, de los cuales 2 han sido identificados como defectuosos (B) y 6 como no defectuosos (B), mientras
que A ha producido 1 componente defectuoso y 9 no defectuosos. Esta información se resume en la tabla adjunta.
Condición
Línea
A
A
B
B
2
1
6
9
Ajeno a esta información, el gerente de ventas selecciona al azar 1 de estos 18 componentes para una demostración. Antes de la demostración
www.FreeLibros.me
c2_p046-085.qxd
68
3/12/08
CAPÍTULO 2
3:59 AM
Page 68
Probabilidad
P(componente de la línea A seleccionado) P(A)
N(A)
8
0.44
N
18
No obstante, si el componente seleccionado resulta defectuoso, entonces el evento B ha ocurrido, por lo que el componente debe haber sido 1 de los 3 de la columna B de la tabla. Como estos 3 componentes son igualmente probables entre ellos mismos una vez que B ha
ocurrido,
2
18
2
P(A B)
P(A°B)
(2.2)
3
3
P(B)
18
■
En la ecuación (2.2), la probabilidad condicional está expresada como una razón de
probabilidades incondicionales. El numerador es la probabilidad de la intersección de los
dos eventos, en tanto que el denominador es la probabilidad del evento condicionante B. Un
diagrama de Venn ilustra esta relación (figura 2.8).
A
B
Figura 2.8
Motivación para la definición de probabilidad condicional.
Dado que B ha ocurrido, el espacio muestral pertinente ya no es S pero consta de resultados en B; A ha ocurrido si y sólo si uno de los resultados en la intersección ocurrió, así
que la probabilidad condicional de A dado B es proporcional a P(A B). Se utiliza la constante de proporcionalidad 1/P(B) para garantizar que la probabilidad P(B | B) del nuevo espacio muestral B sea igual a 1.
Definición de probabilidad condicional
El ejemplo 2.24 demuestra que cuando los resultados son igualmente probables, el cálculo
de probabilidades condicionales puede basarse en intuición. Cuando los experimentos son
más complicados, la intuición puede fallar, así que se requiere una definición general de probabilidad condicional que dé respuestas intuitivas en problemas simples. El diagrama de
Venn y la ecuación (2.2) sugieren cómo proceder.
DEFINICIÓN
Para dos eventos cualesquiera A y B con P(B) 0, la probabilidad condicional de
A dado que B ha ocurrido está definida por
P(A°B)
Ejemplo 2.25
P(A B)
P(B)
(2.3)
Supóngase que de todos los individuos que compran cierta cámara digital, 60% incluye
una tarjeta de memoria opcional en su compra, 40% incluyen una batería extra y 30% incluyen tanto una tarjeta como una batería. Considere seleccionar al azar un comprador y sea
A {tarjeta de memoria adquirida} y B {batería adquirida}. Entonces P(A) 0.60,
P(B) 0.40 y P(ambas adquiridas) P(A B) 0.30. Dado que el individuo seleccionado
adquirió una batería extra, la probabilidad de que una tarjeta opcional también sea adquirida es
0.30
P(A B)
P(A°B)
0.75
0.40
P(B)
www.FreeLibros.me
c2_p046-085.qxd
3/12/08
3:59 AM
Page 69
2.4 Probabilidad condicional
69
Es decir, de todos los que adquieren una batería extra, 75% adquirieron una tarjeta de memoria opcional. Asimismo,
P(batería | tarjeta de memoria) P(B°A)
0.30
P(A B)
0.50
0.60
P(A)
Obsérvese que P(A | B) P(A) y P(B | A) P(B).
■
El evento cuya probabilidad se desea podría ser una unión o intersección de otros eventos y
lo mismo podría ser cierto del evento condicionante.
Ejemplo 2.26
Una revista de noticias publica tres columnas tituladas “Arte” (A), “Libros” (B) y “Cine”
(C ). Los hábitos de lectura de un lector seleccionado al azar con respecto a estas columnas
son
Lee con regularidad
Probabilidad
A
0.14
B
0.23
AB
0.08
C
0.37
AC
0.09
BC
0.13
ABC
0.05
La figura 2.9 ilustra las probabilidades pertinentes.
A
B
0.02 0.03 0.07
0.05
0.04 0.08
0.20
C
0.51
Figura 2.9
Diagrama de Venn para el ejemplo 2.26.
Por lo tanto se tiene
P(A°B)
0.08
P(A B)
0.348
0.23
P(B)
P(A°B C )
0.12
0.04 0.05 0.03
P(A (B C ))
0.255
0.47
P(B C )
0.47
P(A°lee por lo menos una) P(A°A B C )
P(A (A B C ))
P(A B C )
0.14
P(A)
0.286
P(A B C )
0.49
y
P(A B°C )
P((A B) C )
0.04 0.05 0.08
0.459
P(C )
0.37
■
Regla de multiplicación para P (A B )
La definición de probabilidad condicional da el siguiente resultado, obtenido multiplicando
ambos miembros de la ecuación (2.3) por P(B).
La regla de multiplicación
P(A B) P(A°B) P(B)
www.FreeLibros.me
c2_p046-085.qxd
70
3/12/08
CAPÍTULO 2
3:59 AM
Page 70
Probabilidad
Esta regla es importante porque a menudo se desea obtener P(A B), en tanto que
P(B) y P(A | B) pueden ser especificadas a partir de la descripción del problema. La consideración de P(B | A) da P(A B) = P(B | A) P(A).
Ejemplo 2.27
Cuatro individuos han respondido a una solicitud de un banco de sangre para donaciones de
sangre. Ninguno de ellos ha donado antes, por lo que sus tipos de sangre son desconocidos.
Suponga que sólo se desea el tipo O y sólo uno de los cuatro tiene ese tipo. Si los donadores potenciales se seleccionan en orden aleatorio para determinar su tipo de sangre, ¿cuál
es la probabilidad de que por los menos tres individuos tengan que ser examinados para determinar su tipo de sangre y obtener el tipo deseado?
Haciendo la identificación B {primer tipo no O} y A {segundo tipo no O},
3
P(B) 4 . Dado que el primer tipo no es O, dos de los tres individuos que quedan no son
2
O, por lo tanto P(A°B) 3 . La regla de multiplicación ahora da
P(por lo menos tres individuos fueron examinados
para determinar su tipo de sangre)
P(A B)
P(A°B) P(B)
2 3
6
3 4
12
0.5
■
La regla de multiplicación es más útil cuando los experimentos se componen de varias etapas en sucesión. El evento condicionante B describe entonces el resultado de la primera etapa y A el resultado de la segunda, de modo que P(A | B), condicionada en lo que
ocurra primero, a menudo será conocida. La regla es fácil de ser ampliada a experimentos
que implican más de dos etapas. Por ejemplo,
P(A1 A2 A3) P(A3°A1 A2) P(A1 A2)
P(A3°A1 A2) P(A2°A1) P(A1)
(2.4)
donde A1 ocurre primero, seguido por A2 y finalmente A3.
Ejemplo 2.28
Para el experimento de determinación de tipo de sangre del ejemplo 2.27,
P(el tercer tipo es O) P(el tercero es | el primero no es el segundo no es)
P(el segundo no es | el primero no es) P(el primero no es)
1 2 3
1
0.25
■
2 3 4
4
Cuando el experimento de interés se compone de una secuencia de varias etapas, es
conveniente representarlas con diagrama de árbol. Una vez que se tiene un diagrama de árbol apropiado, las probabilidades y las probabilidades condicionales pueden ser ingresadas
en las diversas ramas; esto implicará el uso repetido de la regla de multiplicación.
Ejemplo 2.29
Una cadena de tiendas de video vende tres marcas diferentes de reproductores de DVD. De
sus ventas de reproductores de DVD, 50% son de la marca 1 (la menos cara), 30% son de
la marca 2 y 20% son de la marca 3. Cada fabricante ofrece 1 año de garantía en las partes
y mano de obra. Se sabe que 25% de los reproductores de DVD de la marca 1 requieren trabajo de reparación dentro del periodo de garantía, mientras que los porcentajes correspondientes de las marcas 2 y 3 son 20% y 10%, respectivamente.
1. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya adquirido un reproductor de DVD marca 1 que necesitará reparación mientras se encuentra dentro de garantía?
2. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya comprado un reproductor de DVD que necesitará reparación mientras se encuentra dentro de garantía.
3. Si un cliente regresa a la tienda con un reproductor de DVD que necesita reparación dentro de garantía, ¿cuál es la probabilidad de que sea un reproductor de DVD marca 1?
¿Un reproductor de DVD marca 2? ¿Un reproductor de DVD marca 3?
www.FreeLibros.me
c2_p046-085.qxd
3/12/08
3:59 AM
Page 71
2.4 Probabilidad condicional
71
La primera etapa del problema implica un cliente que selecciona una de las tres marcas de reproductor de DVD. Sea Ai {marca i adquirida}, con i 1, 2 y 3. Entonces P(A1
0.50, P(A2) 0.30 y P(A3) 0.20. Una vez que se selecciona una marca de reproductor
de DVD, la segunda etapa implica observar si el reproductor de DVD seleccionado necesita
reparación dentro de garantía. Con B {necesita reparación} y B {no necesita reparación}, la información dada implica que P(B | A1) 0.25, P(B | A2) 0.20 y P(B | A3) 0.10.
El diagrama de árbol que representa esta situación experimental se muestra en la figura 2.10. Las ramas iniciales corresponden a marcas diferentes de reproductores de DVD;
hay dos ramas de segunda generación que emanan de la punta de cada rama inicial, una para “necesita reparación” y la otra para “no necesita reparación”. La probabilidad de que
P(Ai) aparezca en la rama i-ésima inicial, en tanto que las probabilidades condicionales
P(B | Ai) y P(B | Ai) aparecen en las ramas de segunda generación. A la derecha de cada rama de segunda generación correspondiente a la ocurrencia de B, se muestra el producto de
probabilidades en las ramas que conducen hacia fuera de dicho punto. Ésta es simplemente
la regla de multiplicación en acción. La respuesta a la pregunta planteada en 1 es por lo tanto P(A1 B) P(B°A1) P(A1) 0.125. La respuesta a la pregunta 2 es
P(B) P[(marca 1 y reparación) o (marca 2 y reparación) o (marca 3 y reparación)]
P(A1 B) P(A2 B) P(A3 B)
0.125 0.060 0.020 0.205
P(B A1) P(A1) P(B A1) 0.125
0.25
A 1)
P(B
n
ració
Repa
P(B'
0
A
)
1
0.5
P(
a1
M
P(B
P(A2) 0.30
A 2)
3)
a3
ción
0
0.2
n
ració
P(B'
Ning
A
arc
epara
P(B A2) P(A2) P(B A2) 0.060
Repa
Marca 2
M
0.75
una r
arc
P(
A1 )
Ning
A2 )
0.80
una r
epara
0.2
0
ción
.10
P(B
0
A 3)
n
ració
P(B'
P(B A3) P(A3) P(B A3) 0.020
Repa
Ning
A3 )
una r
Figura 2.10
0.90
epara
ción
P(B) 0.205
Diagrama de árbol para el ejemplo 2.29.
Finalmente,
0.125
P(A1 B)
0.61
0.205
P(B)
0.060
P(A2 B)
P(A2°B)
0.29
0.205
P(B)
P(A1°B)
y
P(A3°B) 1 P(A1°B) P(A2°B) 0.10
www.FreeLibros.me
c2_p046-085.qxd
72
3/12/08
CAPÍTULO 2
3:59 AM
Page 72
Probabilidad
La probabilidad previa o inicial de la marca 1 es 0.50. Una vez que se sabe que el reproductor de DVD seleccionado necesitaba reparación, la probabilidad posterior de la marca 1 se
incrementa a 0.61. Esto se debe a que es más probable que los reproductores de DVD marca 1
necesiten reparación de garantía que las demás marcas. La probabilidad posterior de la marca
3 es P(A3 | B) 0.10, la cual es mucho menor que la probabilidad previa P(A3) 0.20.
■
Teorema de Bayes
El cálculo de una probabilidad posterior P(Aj | B) a partir de probabilidades previas dadas
P(Ai) y probabilidades condicionales P(B | Ai) ocupa una posición central en la probabilidad
elemental. La regla general de dichos cálculos, los que en realidad son una aplicación simple de la regla de multiplicación, se remonta al reverendo Thomas Bayes, quien vivió en el
siglo XVIII. Para formularla primero se requiere otro resultado. Recuérdese que los eventos
A1, . . . , Ak son mutuamente excluyentes si ninguno de los dos tiene resultados comunes.
Los eventos son exhaustivos si un Ai debe ocurrir, de modo que A1 Ak S.
Ley de probabilidad total
Sean A1, . . . , Ak eventos mutuamente excluyentes y exhaustivos. Entonces para cualquier otro evento B,
P(B) P(B°A1)P(A1) . . . P(B°Ak)P(Ak)
(2.5)
k
P(B°Ai)P(Ai)
i1
Comprobación Como los eventos Ai son mutuamente excluyentes y exhaustivos, si B ocurre debe ser en forma conjunta con uno de los eventos Ai de manera exacta. Es decir,
B (A1 B) . . . (Ak B), donde los eventos (Ai B) son mutuamente excluyentes.
Esta “partición de B” se ilustra en la figura 2.11. Por lo tanto
P(B)
k
k
i1
i1
P(Ai B) P(B°Ai)P(Ai)
como se deseaba.
B
A1
A2
Figura 2.11
A3
A4
División de B entre Ai’ mutuamente excluyentes y exhaustivas.
■
Un ejemplo del uso de la ecuación (2.5) apareció al responder la pregunta 2 del
ejemplo 2.29, donde A1 {marca 1}, A2 {marca 2}, A3 {marca 3} y B {reparación}.
www.FreeLibros.me
c2_p046-085.qxd
3/12/08
3:59 AM
Page 73
2.4 Probabilidad condicional
73
Teorema de Bayes
Sean A1, A2, . . . , Ak un conjunto de eventos mutuamente excluyentes y exhaustivos
con probabilidades previas P(Ai)(i 1, . . . , k). Entonces para cualquier otro evento
B para el cual P(B) 0, la probabilidad posterior de Aj dado que B ha ocurrido es
P(Aj°B)
P(Aj B)
P(B)
P(B°Aj)P(Aj)
k
P(B°Ai) P(Ai)
j 1, . . . , k
(2.6)
i1
La transición de la segunda a la tercera expresión en (2.6) se apoya en el uso de la regla de multiplicación en el numerador y la ley de probabilidad total en el denominador. La
proliferación de eventos y subíndices en (2.6) puede ser un poco intimidante para los recién
llegados a la probabilidad. Mientras existan relativamente pocos eventos en la repartición,
se puede utilizar un diagrama de árbol (como en el ejemplo 2.29) como base para calcular
probabilidades posteriores sin jamás referirse de manera explícita al teorema de Bayes.
Ejemplo 2.30
Incidencia de una enfermedad rara. Sólo 1 de 1000 adultos padece una enfermedad rara para la cual se ha creado una prueba de diagnóstico. La prueba es tal que cuando un individuo
que en realidad tiene la enfermedad, un resultado positivo se presentará en 99% de las veces mientras que en individuos sin enfermedad el examen será positivo sólo en un 2% de las
veces. Si se somete a prueba un individuo seleccionado al azar y el resultado es positivo,
¿cuál es la probabilidad de que el individuo tenga la enfermedad?
Para utilizar el teorema de Bayes, sea A1 {el individuo tiene la enfermedad}, A2
{el individuo no tiene la enfermedad} y B {resultado de prueba positivo}. Entonces
P(A1) 0.001, P(A2) 0.999, P(B | A1) 0.99 y P(B | A2) 0.02. El diagrama de árbol
para este problema aparece en la figura 2.12.
P(A1 B) 0.00099
0.99
1
0.00
A1
d
eda
ferm
en
e la
B'
tien
0.99
A2
9
no t
iene
la e
nfer
Prueb
a
P(A2 B) 0.01998
0.02
med
ad
ba
Prue
B 0
.98
B'
Figura 2.12
ba
Prue
.01
B 0
Prueb
a
Diagrama de árbol para el problema de la enfermedad rara.
Junto a cada rama correspondiente a un resultado positivo de prueba, la regla de multiplicación da las probabilidades anotadas. Por consiguiente, P(B) 0.00099 0.01998
0.02097, a partir de la cual se tiene
0.00099
P(A1 B)
P(A1°B)
0.047
0.02097
P(B)
Este resultado parece contraintuitivo; la prueba de diagnóstico parece tan precisa que es altamente probable que alguien con un resultado positivo de prueba tenga la enfermedad, mientras que la probabilidad condicional calculada es de sólo 0.047. Sin embargo, como la
enfermedad es rara y la prueba es sólo moderadamente confiable, surgen más resultados
www.FreeLibros.me
c2_p046-085.qxd
74
3/12/08
CAPÍTULO 2
3:59 AM
Page 74
Probabilidad
positivos de prueba a causa de errores y no de individuos enfermos. La probabilidad de tener
la enfermedad se ha incrementado por un factor de multiplicación de 47 (desde la probabilidad previa de 0.001 hasta la probabilidad posterior de 0.047); pero para incrementar aún más
la probabilidad posterior, se requiere una prueba de diagnóstico con tasas de error mucho
más pequeñas. Si la enfermedad no fuera tan rara (p. ej., 25% de incidencia en la población),
entonces las tasas de error de la prueba actual proporcionaría buenos diagnósticos.
■
EJERCICIOS
Sección 2.4 (45-69)
45. La población de un país particular se compone de tres grupos étnicos. Cada individuo pertenece a uno de los cuatro
grupos sanguíneos principales. La tabla de probabilidad
conjunta anexa da la proporción de individuos en las diversas combinaciones de grupo étnico-grupo sanguíneo.
Grupo sanguíneo
Grupo étnico
1
2
3
O
A
B
AB
0.082
0.135
0.215
0.106
0.141
0.200
0.008
0.018
0.065
0.004
0.006
0.020
Suponga que se selecciona un individuo al azar de la población y que los eventos se definen como A {tipo A seleccionado}, B {tipo B seleccionado} y C {grupo étnico 3
seleccionado}.
a. Calcule P(A), P(C ) y P(A C).
b. Calcule tanto P(A | C) y P(C | A) y explique en contexto lo que cada una de estas probabilidades representa.
c. Si el individuo seleccionado no tiene sangre de tipo B,
¿cuál es la probabilidad de que él o ella pertenezca al
grupo étnico 1?
46. Suponga que un individuo es seleccionado al azar de la población de todos los adultos varones que viven en Estados
Unidos. Sea A el evento en que el individuo seleccionado
tiene una estatura de más de 6 pies y sea B el evento
en que el individuo seleccionado es un jugador profesional
de básquetbol. ¿Cuál piensa que es más grande, P(A | B) o
P(B | A)? ¿Por qué?
47. Regrese al escenario de la tarjeta de crédito del ejercicio 12
(sección 2.2), donde A {Visa}, B {MasterCard}, P(A)
0.5, P(B) 0.4 y P(A B) 0.25. Calcule e interprete cada una de las siguientes probabilidades (un diagrama de Venn
podría ayudar).
a. P(B°A)
b. P(B°A)
c. P(A°B)
d. P(A°B)
e. Dado que el individuo seleccionado tiene por lo menos
una tarjeta, ¿cuál es la probabilidad de que él o ella tenga una tarjeta Visa?
48. Reconsidere la situación del sistema defectuoso descrito en
el ejercicio 26 (sección 2.2).
a. Dado que el sistema tiene un defecto de tipo 1, ¿cuál es
la probabilidad de que tenga un defecto de tipo 2?
b. Dado que el sistema tiene un defecto de tipo 1, ¿cuál es
la probabilidad de que tenga los tres tipos de defectos?
c. Dado que el sistema tiene por lo menos un tipo de defecto, ¿cuál es la probabilidad de que tenga exactamente un
tipo de defecto?
d. Dado que el sistema tiene los primeros dos tipos de
defectos, ¿cuál es la probabilidad de que no tenga el tercer tipo de defecto?
49. Si se seleccionan al azar dos focos de la caja descrita en el
ejercicio 38 (sección 2.3) y por lo menos uno de ellos es de
75 W, ¿cuál es la probabilidad de que los dos sean de 75 W?
Dado que por lo menos uno de los dos seleccionados no es
de 75 W, ¿cuál es la probabilidad de que los dos focos seleccionados sean de la misma clase?
50. Una tienda de departamentos vende camisas sport en tres
tallas (chica, mediana y grande), tres diseños (a cuadros, estampadas y a rayas) y dos largos de manga (larga y corta).
Las tablas adjuntas dan las proporciones de camisas vendidas en las combinaciones de categoría.
Manga corta
Diseño
Talla
Cuadros
Estampada
Rayas
CH
M
G
0.04
0.08
0.03
0.02
0.07
0.07
0.05
0.12
0.08
Manga larga
Diseño
Talla
Cuadros
Estampada
Rayas
CH
M
G
0.03
0.10
0.04
0.02
0.05
0.02
0.03
0.07
0.08
a. ¿Cuál es la probabilidad de que la siguiente camisa vendida sea una camisa mediana estampada de manga larga?
b. ¿Cuál es la probabilidad de que la siguiente camisa vendida sea una camisa estampada mediana?
c. ¿Cuál es la probabilidad de que la siguiente camisa vendida sea de manga corta? ¿De manga larga?
d. ¿Cuál es la probabilidad de que la talla de la siguiente
camisa vendida sea mediana? ¿Que la siguiente camisa
vendida sea estampada?
e. Dado que la camisa que se acaba de vender era de manga corta a cuadros, ¿cuál es la probabilidad de que fuera
mediana?
f. Dado que la camisa que se acaba de vender era mediana
a cuadros, ¿cuál es la probabilidad de que fuera de manga corta? ¿De manga larga?
www.FreeLibros.me
c2_p046-085.qxd
3/12/08
3:59 AM
Page 75
2.4 Probabilidad condicional
51. Una caja contiene seis pelotas rojas y cuatro verdes y una segunda caja contiene siete pelotas rojas y tres verdes. Se selecciona una pelota al azar de la primera caja y se le coloca en
la segunda caja. Luego se selecciona al azar una pelota de la
segunda caja y se le coloca en la primera caja.
a. ¿Cuál es la probabilidad de que se seleccione una pelota roja de la primera caja y de que se seleccione una pelota roja de la segunda caja?
b. Al final del proceso de selección, ¿cuál es la probabilidad
de que los números de pelotas rojas y verdes que hay en
la primera caja sean idénticas a los números iniciales?
52. Un sistema se compone de bombas idénticas, #1 y #2. Si
una falla, el sistema seguirá operando. Sin embargo, debido
al esfuerzo adicional, ahora es más probable que la bomba restante falle de lo que era originalmente. Es decir,
r P(#2 falla | #1 falla) > P(#2 falla) q. Si por lo menos
una bomba falla alrededor del final de su vida útil en 7% de
todos los sistemas y ambas bombas fallan durante dicho periodo en sólo 1%, ¿cuál es la probabilidad de que la bomba
#1 falle durante su vida útil de diseño?
53. Un taller repara tanto componentes de audio como de video. Sea A el evento en que el siguiente componente traído
a reparación es un componente de audio y sea B el evento
en que el siguiente componente es un reproductor de discos
compactos (así que el evento B está contenido en A). Suponga que P(A) 0.6 y P(B) 0.05. ¿Cuál es P(B | A)?
54. En el ejercicio 13, Ai {proyecto otorgado i}, con i 1, 2, 3.
Use las probabilidades dadas allí para calcular las siguientes probabilidades y explique en palabras el significado de
cada una.
a. P(A2°A1)
b. P(A2 A3°A1)
c. P(A2 A3°A1)
d. P(A1 A2 A3°A1 A2 A3).
55. Las garrapatas de venados pueden ser portadoras de la enfermedad de Lyme o de la Erhlichiosis granulocítica humana (HGE, por sus siglas en inglés). Con base en un estudio
reciente, suponga que 16% de todas las garrapatas en cierto
lugar portan la enfermedad de Lyme, 10% portan HGE y
10% de las garrapatas que portan por lo menos una de estas
enfermedades en realidad portan las dos. Si determina que
una garrapata seleccionada al azar ha sido portadora de
HGE, ¿cuál es la probabilidad de que la garrapata seleccionada también porte la enfermedad de Lyme?
56. Para los eventos A y B con P(B) > 0, demuestre que P(A | B)
P(A | B) 1.
57. Si P(B | A) P(B), demuestre que P(B|A) P(B). [Sugerencia: Sume P(B | A) a ambos lados de la desigualdad dada y luego utilice el resultado del ejercicio 56.]
58. Demuestre que para tres eventos cualesquiera A, B y C con
P(C ) 0, P(A B | C ) P(A | C ) P(B | C ) – P(A B | C ).
59. En una gasolinería, 40% de los clientes utilizan gasolina regular (A1), 35% usan gasolina plus (A2) y 25% utilizan premium (A3). De los clientes que utilizan gasolina regular, sólo
30% llenan sus tanques (evento B). De los clientes que utilizan plus, 60% llenan sus tanques, mientras que los que utilizan premium, 50% llenan sus tanques.
a. ¿Cuál es la probabilidad de que el siguiente cliente pida
gasolina plus y llene el tanque (A2 B)?
b. ¿Cuál es la probabilidad de que el siguiente cliente llene el tanque?
75
c. Si el siguiente cliente llena el tanque, ¿cuál es la probabilidad que pida gasolina regular? ¿Plus? ¿Premium?
60. El 70% de las aeronaves ligeras que desaparecen en vuelo
en cierto país son posteriormente localizadas. De las aeronaves que son localizadas, 60% cuentan con un localizador
de emergencia, mientras que 90% de las aeronaves no localizadas no cuentan con dicho localizador. Suponga que una
aeronave ligera ha desaparecido.
a. Si tiene un localizador de emergencia, ¿cuál es la probabilidad de que no sea localizada?
b. Si no tiene un localizador de emergencia, ¿cuál es la
probabilidad de que sea localizada?
61. Componentes de cierto tipo son enviados a un distribuidor en
lotes de diez. Suponga que 50% de dichos lotes no contienen componentes defectuosos, 30% contienen un componente
defectuoso y 20% contienen dos componentes defectuosos.
Se seleccionan al azar dos componentes de un lote y se
prueban. ¿Cuáles son las probabilidades asociadas con 0, 1
y 2 componentes defectuosos que están en el lote en cada
una de las siguientes condiciones?
a. Ningún componente probado está defectuoso.
b. Uno de los dos componentes probados está defectuoso.
[Sugerencia: Trace un diagrama de árbol con tres ramas
de primera generación correspondientes a los tres tipos
diferentes de lotes.]
62. Una compañía que fabrica cámaras de video produce un modelo básico y un modelo de lujo. Durante el año pasado,
40% de las cámaras vendidas fueron del modelo básico. De
aquellos que compraron el modelo básico, 30% adquirieron
una garantía ampliada, en tanto que 50% de los que compraron el modelo de lujo también lo hicieron. Si sabe que un
comprador seleccionado al azar tiene una garantía ampliada,
¿qué tan probable es que él o ella tengan un modelo básico?
63. Para los clientes que compran un refrigerador en una tienda
de aparatos domésticos, sea A el evento en que el refrigerador fue fabricado en EU, B el evento en que el refrigerador
contaba con una máquina de hacer hielos y C el evento en
que el cliente adquirió una garantía ampliada. Las probabilidades pertinentes son
P(A) 0.75 P(B°A) 0.9 P(B°A) 0.8
P(C°A B) 0.8 P(C°A B) 0.6
P(C°A B) 0.7 P(C°A B) 0.3
a. Construya un diagrama de árbol compuesto de ramas de
primera, segunda y tercera generaciones y anote el evento y la probabilidad apropiada junto a cada rama.
b. Calcule P(A B C ).
c. Calcule P(B C ).
d. Calcule P(C ).
e. Calcule P(A | B C ), la probabilidad de la compra de un
refrigerador fabricado en EU dado que también se adquirieron una máquina de hacer hielos y una garantía ampliada.
64. En el ejemplo 2.30, suponga que la tasa de incidencia de la
enfermedad es de 1 en 25 y no de 1 en 1000. ¿Cuál es entonces la probabilidad de un resultado de prueba positivo?
Dado que el resultado de prueba es positivo, ¿cuál es la probabilidad de que el individuo tenga la enfermedad? Dado un
resultado de prueba negativo, ¿cuál es la probabilidad de
que el individuo no tenga la enfermedad?
www.FreeLibros.me
c2_p046-085.qxd
76
3/12/08
CAPÍTULO 2
3:59 AM
Page 76
Probabilidad
65. En una gran universidad, en la búsqueda que nunca termina
de un libro de texto satisfactorio, el Departamento de Estadística probó un texto diferente durante cada uno de los últimos
tres trimestres. Durante el trimestre de otoño, 500 estudiantes
utilizaron el texto del profesor Mean; durante el trimestre de
invierno, 300 estudiantes usaron el texto del profesor Median
y durante el trimestre de primavera, 200 estudiantes utilizaron el texto del profesor Mode. Una encuesta realizada al final de cada trimestre mostró que 200 estudiantes se sintieron
satisfechos con el libro de Mean, 150 con el libro de Median
y 160 con el libro de Mode. Si se selecciona al azar un estudiante que cursó estadística durante uno de estos trimestres y
admite haber estado satisfecho con el texto, ¿es probable que
el estudiante haya utilizado el libro de Mean, Median o Mode? ¿Quién es el autor menos probable? [Sugerencia: Trace
un diagrama de árbol o use el teorema de Bayes.]
66. Considere la siguiente información sobre vacacionistas (basada en parte en una encuesta reciente de Travelocity): 40%
revisan su correo electrónico de trabajo, 30% utilizan un teléfono celular para permanecer en contacto con su trabajo,
25% trajeron una computadora portátil consigo, 23% revisan
su correo electrónico de trabajo y utilizan un teléfono celular
para permanecer en contacto y 51% ni revisan su correo electrónico de trabajo ni utilizan un teléfono celular para permanecer en contacto ni trajeron consigo una computadora
portátil. Además, 88 de cada 100 que traen una computadora portátil también revisan su correo electrónico de trabajo y
70 de cada 100 que utilizan un teléfono celular para permanecer en contacto también traen una computadora portátil.
a. ¿Cuál es la probabilidad de que un vacacionista seleccionado al azar que revisa su correo electrónico de trabajo también utilice un teléfono celular para permanecer
en contacto.
b. ¿Cuál es la probabilidad de que alguien que trae una
computadora portátil también utilice un teléfono celular
para permanecer en contacto.
c. Si el vacacionista seleccionado al azar revisó su correo
electrónico de trabajo y trajo una computadora portátil,
¿cuál es la probabilidad de que él o ella utilice un teléfono celular para permanecer en contacto?
67. Ha habido una gran controversia durante los últimos años
con respecto a qué tipos de vigilancia son apropiados para
impedir el terrorismo. Suponga que un sistema de vigilancia
particular tiene 99% de probabilidades de identificar correctamente a un futuro terrorista y 99.9% de probabilidades de
identificar correctamente a alguien que no es un futuro terrorista. Si existen 1000 futuros terroristas en una población de
300 millones y se selecciona al azar uno de estos 300 millones,
examinado por el sistema e identificado como futuro terrorista, ¿cuál es la probabilidad de él o ella que sean futuros terroristas? ¿Le inquieta el valor de esta probabilidad sobre el
uso del sistema de vigilancia? Explique.
68. Una amiga que vive en Los Ángeles hace viajes frecuentes
de consultoría a Washington, D.C.; 50% del tiempo viaja en
la línea aérea #1, 30% del tiempo en la aerolínea #2 y el
20% restante en la aerolínea #3. Los vuelos de la aerolínea
#1 llegan demorados a D.C. 30% del tiempo y 10% del
tiempo llegan demorados a L.A. Para la aerolínea #2, estos
porcentajes son 25% y 20%, en tanto que para la aerolínea
#3 los porcentajes son 40% y 25%. Si se sabe que en un viaje particular ella llegó demorada a exactamente uno de los
destinos, ¿cuáles son las probabilidades posteriores de haber
volado en las aerolíneas #1, #2 y #3? Suponga que la probabilidad de arribar con demora a L.A. no se ve afectada por lo
que suceda en el vuelo a D.C. [Sugerencia: Desde la punta de
cada rama de primera generación en un diagrama de árbol,
trace tres ramas de segunda generación identificadas, respectivamente, como, 0 demorado, 1 demorado y 2 demorado.]
69. En el ejercicio 59, considere la siguiente información adicional sobre el uso de tarjetas de crédito:
El 70% de todos los clientes que utilizan gasolina regular y
que llenan el tanque usan una tarjeta de crédito.
El 50% de todos los clientes que utilizan gasolina regular
y que no llenan el tanque usan una tarjeta de crédito.
El 60% de todos los clientes que llenan el tanque con gasolina plus usan una tarjeta de crédito.
El 50% de todos los clientes que utilizan gasolina plus y
que no llenan el tanque usan una tarjeta de crédito.
El 50% de todos los clientes que utilizan gasolina premium
y que llenan el tanque usan una tarjeta de crédito.
El 40% de todos los clientes que utilizan gasolina premium y
que no llenan el tanque usan una tarjeta de crédito.
Calcule la probabilidad de cada uno de los siguientes eventos para el siguiente cliente que llegue (un diagrama de árbol podría ayudar).
a. {Plus, tanque lleno y tarjeta de crédito}
b. {Premium, tanque no lleno y tarjeta de crédito}
c. {Premium y tarjeta de crédito}
d. {Tanque lleno y tarjeta de crédito}
e. {Tarjeta de crédito}
f. Si el siguiente cliente utiliza una tarjeta de crédito, ¿cuál
es la probabilidad de que pida premium?
2.5 Independencia
La definición de probabilidad condicional permite revisar la probabilidad P(A) originalmente
asignada a A cuando después se informa que otro evento B ha ocurrido; la nueva probabilidad
de A es P(A | B). En los ejemplos, con frecuencia fue el caso de que P(A | B) difería de la probabilidad no condicional P(A), lo que indica que la información “B ha ocurrido” cambia la
probabilidad de que ocurra A. A menudo la probabilidad de que ocurra o haya ocurrido A no se
ve afectada por el conocimiento de que B ha ocurrido, así que P(A | B) P(A). Es entonces
www.FreeLibros.me
c2_p046-085.qxd
3/12/08
3:59 AM
Page 77
77
2.5 Independencia
natural considerar a A y B como eventos independientes, es decir que la ocurrencia o no ocurrencia de un evento no afecta la probabilidad de que el otro ocurra.
DEFINICIÓN
Los eventos A y B son independientes si P(A | B) P(A) y son dependientes de lo
contrario.
La definición de independencia podría parecer “no simétrica” porque no demanda
también que P(B | A) P(B). Sin embargo, utilizando la definición de probabilidad condicional y la regla de multiplicación,
P(B°A)
P(A B)
P(A°B)P(B)
P(A)
P(A)
(2.7)
El lado derecho de la ecuación (2.7) es P(B) si y sólo si P(A | B) P(A) (independencia), así que la igualdad en la definición implica la otra igualdad (y viceversa). También es
fácil demostrar que si A y B son independientes, entonces también lo son los pares de eventos: (1) A y B, (2) A y B y (3) A y B.
Ejemplo 2.31
Considere una gasolinería con seis bombas numeradas 1, 2, . . . , 6 y sea Ei el evento simple en
que un cliente seleccionado al azar utiliza la bomba i (i 1, . . . , 6). Suponga que P(E1)
P(E6) 0.10, P(E2) P(E5) 0.15 y P(E3) P(E4) 0.25. Defina los eventos A, B, C
como A {2, 4, 6}, B {1, 2, 3} y C {2, 3, 4, 5}. Luego se tiene P(A) 0.50, P(A | B)
0.30 y P(A | C) 0.50. Es decir, los eventos A y B son dependientes, en tanto que los eventos
A y C son independientes. Intuitivamente, A y C son independientes porque la división de probabilidad relativa entre las bombas pares e impares es la misma entre las bombas 2, 3, 4, 5
como lo es entre todas las seis bombas.
■
Ejemplo 2.32
Sean A y B dos eventos excluyentes cualesquiera con P(A) 0. Por ejemplo, para un automóvil seleccionado al azar, sea A {el carro es de cuatro cilindros} y B {el carro es de
seis cilindros}. Como los eventos son mutuamente excluyentes, si B ocurre, entonces A quizá
no puede haber ocurrido, así que P(A | B) 0 P(A). El mensaje aquí es que si dos eventos
son mutuamente excluyentes, no pueden ser independientes. Cuando A y B son mutuamente excluyentes, la información de que A ocurrió dice algo sobre B (no puede haber ocurrido), así que se impide la independencia.
■
Regla de multiplicación para P (A B )
Con frecuencia la naturaleza de un experimento sugiere que dos eventos A y B deben suponerse independientes. Este es el caso, por ejemplo, si un fabricante recibe una tarjeta de
circuito de cada uno de dos proveedores diferentes, cada tarjeta se somete a prueba al llegar
y A {la primera está defectuosa} y B {la segunda está defectuosa}. Si P(A) 0.1, también deberá ser el caso de que P(A | B) 0.1; sabiendo que la condición de la segunda tarjeta no informa sobre la condición de la primera. El siguiente resultado muestra cómo
calcular P(A B) cuando los eventos son independientes.
PROPOSICIÓN
A y B son independientes si y sólo si
P(A B) P(A) P(B)
www.FreeLibros.me
(2.8)
c2_p046-085.qxd
78
3/12/08
CAPÍTULO 2
3:59 AM
Page 78
Probabilidad
Parafraseando la proposición, A y B son independientes si y sólo si la probabilidad de
que ambos ocurran (A B) es el producto de las dos probabilidades individuales. La verificación es como sigue:
P(A B) P(A°B) P(B) P(A) P(B)
(2.9)
donde la segunda igualdad en la ecuación (2.9) es válida si y sólo si A y B son independientes. Debido a la equivalencia de independencia con la ecuación (2.8), la segunda puede ser
utilizada como definición de independencia.
Ejemplo 2.33
Se sabe que 30% de las lavadoras de cierta compañía requieren servicio mientras se encuentran dentro de garantía, en tanto que sólo 10% de sus secadoras necesitan dicho servicio. Si
alguien adquiere tanto una lavadora como una secadora fabricadas por esta compañía, ¿cuál
es la probabilidad de que ambas máquinas requieran servicio de garantía?
Sea A el evento en que la lavadora necesita servicio mientras se encuentra dentro de
garantía y defina B de forma análoga para la secadora. Entonces P(A) 0.30 y P(B) 0.10.
Suponiendo que las dos máquinas funcionan independientemente una de otra, la probabilidad deseada es
P(A B) P(A) P(B) (0.30)(0.10) 0.03
■
Es fácil demostrar que A y B son independientes si y sólo si A y B son independientes, A y
B son independientes y A y B son independientes. Por lo tanto, en el ejemplo 2.33, la probabilidad de que ninguna máquina necesite servicio es
P(A B) P(A) P(B) (0.70)(0.90) 0.63
Ejemplo 2.34
Cada día, de lunes a viernes, un lote de componentes enviado por un primer proveedor arriba a una instalación de inspección. Dos días a la semana, también arriba un lote de un segundo proveedor. El 80% de todos los lotes del proveedor 1 son inspeccionados y 90% de
los del proveedor 2 también lo son. ¿Cuál es la probabilidad de que, en un día seleccionado
al azar, dos lotes sean inspeccionados? Esta pregunta se responderá suponiendo que en los
días en que se inspeccionan dos lotes, si el primer lote pasa es independiente de si el segundo también lo hace. La figura 2.13 muestra la información pertinente.
0.8
0.6
e de
Lot dor 1
e
v e
pro
0.4
L
prov ote de
eed
or 2
Pasa
0.2
0.4 (0.8 0.9)
0.9
Falla
pasa
2o.
0.1
0.8
2o. fa
pasa
1o.
0.2
lla
0.9
asa
2o. p
0.1
1o. fa
lla
2o. f
alla
Figura 2.13
Diagrama de árbol para el ejemplo 2.34.
P(dos pasan) P(dos recibidos ambos pasan)
P(ambos pasan | dos recibidos) P(dos recibidos)
[(0.8)(0.9)(0.4) 0.288
www.FreeLibros.me
■
c2_p046-085.qxd
3/12/08
3:59 AM
Page 79
2.5 Independencia
79
Independencia de más de dos eventos
La noción de independencia de dos eventos puede ser ampliada a conjuntos de más de dos
eventos. Aunque es posible ampliar la definición para dos eventos independientes trabajando en función de probabilidades condicionales y no condicionales, es más directo y menos
tedioso seguir las líneas de la última proposición.
DEFINICIÓN
Los eventos A1, . . . , An son mutuamente independientes si por cada k (k 2,
3, . . . , n) y cada subconjunto de índices i1, i2, . . . , ik,
P(Ai Ai . . . Ai ) P(Ai ) P(Ai ) . . . P(Ai ).
1
2
k
1
2
k
Parafraseando la definición, los eventos son mutuamente independientes si la probabilidad de la intersección de cualquier subconjunto de “n”-elementos, es igual al producto de las
probabilidades individuales. Al utilizar la propiedad de multiplicación para más de dos eventos
independientes, es legítimo reemplazar una o más de las Ai por su complemento (p. ej., si A1,
A2 y A3 son eventos independientes, también lo son A1, A2 y A).
3 Como fue el caso con dos eventos, con frecuencia se especifica al principio de un problema la independencia de ciertos
eventos. La probabilidad de una intersección puede entonces ser calculada vía multiplicación.
Ejemplo 2.35
El artículo “Reliability Evaluation of Solar Photovoltaic Arrays” (Solar Energy, 2002:
129–141) presenta varias configuraciones de redes fotovoltaicas solares compuestas de celdas
solares de silicio cristalino. Considérese primero el sistema ilustrado en la figura 2.14(a).
1
2
3
1
2
3
4
5
6
4
5
6
(a)
(b)
Figura 2.14 Configuración del sistema para el ejemplo 2.35: (a) en serie-paralelo;
(b) vinculado en cruz total.
Existen dos subsistemas conectados en paralelo y cada uno contiene tres celdas. Para que el
sistema funcione, por lo menos uno de los dos subsistemas en paralelo debe funcionar. Dentro de cada subsistema, las tres celdas están conectadas en serie, así que un subsistema funcionará sólo si todas sus celdas funcionan. Considere un valor de duración particular t0 y
suponga que desea determinar la probabilidad de que la duración del sistema exceda de t0.
Sea Ai el evento en que la duración de la celda i excede de t0 (i 1, 2, . . . , 6). Se supone
que las Ai son eventos independientes (ya sea que cualquier celda particular que dure más
de t0 horas no tenga ningún efecto en sí o no cualquier otra celda lo hace) y que P(Ai) 0.9
por cada i puesto que las celdas son idénticas. Entonces
P(la duración del
sistema excede de t0) P[(A1 A2 A3) (A4 A5 A6)]
P(A1 A2 A3) P(A4 A5 A6)
P [(A1 A2 A3) (A4 A5 A6)]
(0.9)(0.9)(0.9) (0.9)(0.9)(0.9) (0.9)(0.9)(0.9)(0.9)(0.9)(0.9) 0.927
Alternativamente,
P(la duración del sistema excede de t0) 1 P(ambas duraciones del subsistema son t0)
1 [P(la duración del subsistema es t0)]2
1 [1 P(la duración del subsistema es t0)]2
1 [1 (0.9)3]2 0.927
www.FreeLibros.me
c2_p046-085.qxd
80
3/12/08
CAPÍTULO 2
3:59 AM
Page 80
Probabilidad
Considérese a continuación el sistema vinculado en cruz mostrado en la figura 2.14(b), obtenido a partir de la red conectada en serie-paralelo mediante la conexión de enlaces a través de cada columna de uniones. Ahora bien, el sistema falla en cuanto toda una columna
falla y la duración del sistema excede de t0 sólo si la duración de cada columna lo hace. Para esta configuración,
P(la duración del sistema
es de por lo menos t0) [P(la duración de la columna excede de t0)]3
[1 P(duración de la columna t0)]3
[1 P(la duración de ambas celdas en una columna es t0)]3
[1 (1 0.9)2]3 0.970
■
EJERCICIOS
Sección 2.5 (70-89)
70. Reconsidere el escenario de la tarjeta de crédito del ejercicio
47 (sección 2.4) y demuestre que A y B son dependientes utilizando primero la definición de independencia y luego verificando que la propiedad de multiplicación no prevalece.
71. Una compañía de exploración petrolera en la actualidad tiene dos proyectos activos, uno en Asia y el otro en Europa. Sea
A el evento en que el proyecto asiático tiene éxito y B el evento en que el proyecto europeo tiene éxito. Suponga que A y B
son eventos independientes con P(A) 0.4 y P(B) 0.7.
a. Si el proyecto asiático no tiene éxito, ¿cuál es la probabilidad de que el europeo también fracase? Explique su
razonamiento.
b. ¿Cuál es la probabilidad de que por lo menos uno de los
dos proyectos tenga éxito?
c. Dado que por lo menos uno de los dos proyectos tiene
éxito, ¿cuál es la probabilidad de que sólo el proyecto
asiático tenga éxito?
72. En el ejercicio 13, ¿es cualquier Ai independiente de cualquier otro Aj? Responda utilizando la propiedad de multiplicación para eventos independientes.
73. Si A y B son eventos independientes, demuestre que A y B
también son independientes. [Sugerencia: Primero establezca una relación entre P(A B), P(B) y P(A B).]
74. Suponga que las proporciones de fenotipos sanguíneos en
una población son las siguientes:
A
0.42
B
0.10
AB
0.04
O
0.44
Suponiendo que los fenotipos de dos individuos seleccionados al azar son independientes uno de otro, ¿cuál es la probabilidad de que ambos fenotipos sean O? ¿Cuál es la
probabilidad de que los fenotipos de dos individuos seleccionados al azar coincidan?
75. Una de las suposiciones que sustentan la teoría de las gráficas de control (véase el capítulo 16) es que los puntos dibujados consecutivamente son independientes entre sí. Cada
punto puede señalar que un proceso de producción está funcionando correctamente o que existe algún funcionamiento
defectuoso. Aun cuando un proceso esté funcionando de
manera correcta, existe una pequeña probabilidad de que un
punto particular señalará un problema con el proceso. Suponga que esta probabilidad es de 0.05. ¿Cuál es la probabilidad
de que por lo menos uno de 10 puntos sucesivos indique un
problema cuando de hecho el proceso está operando correctamente? Responda está pregunta para 25 puntos sucesivos.
76. La probabilidad de que un calificador se equivoque al marcar cualquier pregunta particular de un examen de opciones
múltiples es de 0.1. Si existen diez preguntas y éstas se marcan en forma independiente, ¿cuál es la probabilidad de que
no se cometan errores? ¿Que por lo menos se cometa un
error? Si existen n preguntas y la probabilidad de un error
de marcado es p en lugar de 0.1, dé expresiones para estas
dos probabilidades.
77. La costura de un avión requiere 25 remaches. La costura
tendrá que ser retrabajada si alguno de los remaches está
defectuoso. Suponga que los remaches están defectuosos
independientemente uno de otro, cada uno con la misma
probabilidad.
a. Si 20% de todas las costuras tienen que ser retrabajadas,
¿cuál es la probabilidad de que un remache esté defectuoso?
b. ¿Qué tan pequeña deberá ser la probabilidad de un remache defectuoso para garantizar que sólo 10% de las
costuras tienen que ser retrabajadas?
78. Una caldera tiene cinco válvulas de alivio idénticas. La probabilidad de que cualquier válvula particular se abra en un
momento de demanda es de 0.95. Suponiendo que operan
independientemente, calcule P(por lo menos una válvula se
abre) y P(por lo menos una válvula no se abre).
79. Dos bombas conectadas en paralelo fallan independientemente una de otra en cualquier día dado. La probabilidad de
que falle sólo la bomba más vieja es de 0.10 y la probabilidad de que sólo la bomba más nueva falle es de 0.05. ¿Cuál
es la probabilidad de que el sistema de bombeo falle en
cualquier día dado (lo que sucede si ambas bombas fallan)?
80. Considere el sistema de componentes conectados como en
la figura adjunta. Los componentes 1 y 2 están conectados
en paralelo, de modo que el subsistema trabaja si y sólo si
www.FreeLibros.me
c2_p046-085.qxd
3/12/08
3:59 AM
Page 81
81
2.5 Independencia
1 o 2 trabaja; como 3 y 4 están conectados en serie, qué subsistema trabaja si y sólo si 3 y 4 trabajan. Si los componentes funcionan independientemente uno de otro y P(el
componente trabaja) 0.9, calcule P(el sistema trabaja).
1
2
3
4
81. Remítase otra vez al sistema en serie-paralelo introducido
en el ejemplo 2.35 y suponga que existen sólo dos celdas en
lugar de tres en cada subsistema en paralelo [en la figura
2.14(a), elimine las celdas 3 y 6 y renumere las celdas 4 y
5 como 3 y 4]. Utilizando P(Ai) 0.9, es fácil ver que la
probabilidad de que la duración del sistema exceda de t0 es
de 0.9639. ¿A qué valor tendría que cambiar 0.9 para incrementar la duración del sistema de 0.9639 a 0.99? [Sugerencia: Sea P(Ai) p, exprese la confiabilidad del sistema en
función de p, luego haga x p2.]
82. Considere lanzar en forma independiente dos dados imparciales, uno rojo y otro verde. Sea A el evento en que el dado rojo muestra 3 puntos, B el evento en que el dado verde
muestra 4 puntos y C el evento en que el número total de
puntos que muestran los dos dados es 7. ¿Son estos eventos
independientes por pares (es decir, ¿son A y B eventos independientes, son A y C independientes y son B y C independientes? ¿Son los tres eventos mutuamente independientes?
83. Los componentes enviados a un distribuidor son revisados
en cuanto a defectos por dos inspectores diferentes (cada
componente es revisado por ambos inspectores). El primero
detecta 90% de todos los defectuosos que están presentes y
el segundo hace lo mismo. Por lo menos un inspector no detecta un defecto en 20% de todos los componentes defectuosos. ¿Cuál es la probabilidad de que ocurra lo siguiente?
a. ¿Un componente defectuoso será detectado sólo por el
primer inspector? ¿Por exactamente uno de los dos inspectores?
b. ¿Los tres componentes defectuosos en un lote no son
detectados por ambos inspectores (suponiendo que las
inspecciones de los diferentes componentes son independientes unas de otras)?
84. El 70% de todos los vehículos examinados en un centro de verificación de emisiones pasan la inspección. Suponiendo que
vehículos sucesivos pasan o fallan independientemente uno de
otro, calcule las siguientes probabilidades:
a. P(los tres vehículos siguientes inspeccionados pasan).
b. P(por lo menos uno de los tres vehículos siguientes pasa).
c. P(exactamente uno de los tres vehículos siguientes pasa).
d. P(cuando mucho uno de los tres vehículos siguientes
inspeccionados pasa).
e. Dado que por lo menos uno de los tres vehículos siguientes pasa la inspección, ¿cuál es la probabilidad de
que los tres pasen (una probabilidad condicional)?
85. Un inspector de control de calidad verifica artículos recién
producidos en busca de fallas. El inspector examina un
artículo en busca de fallas en una serie de observaciones independientes, cada una de duración fija. Dado que en realidad está presente una imperfección, sea p la probabilidad de
que la imperfección sea detectada durante cualquier observación (este modelo se discute en “Human Performance in
Sampling Inspection”, Human Factors, 1979: 99–105).
a. Suponiendo que un artículo tiene una imperfección, ¿cuál
es la probabilidad de que sea detectada al final de la segunda observación (una vez que una imperfección ha sido detectada, la secuencia de observaciones termina)?
b. Dé una expresión para la probabilidad de que una imperfección sea detectada al final de la n-ésima observación.
c. Si cuando en tres observaciones no ha sido detectada una
imperfección, el artículo es aprobado, ¿cuál es la probabilidad de que un artículo imperfecto pase la inspección?
d. Suponga que 10% de todos los artículos contienen una
imperfección [P(artículo seleccionado al azar muestra
una imperfección) 0.1]. Con la suposición del inciso
c), ¿cuál es la probabilidad de que un artículo seleccionado al azar pase la inspección (pasará automáticamente si no tiene imperfección, pero también podría pasar si
tiene una imperfección)?
e. Dado que un artículo ha pasado la inspección (sin imperfecciones en tres observaciones), ¿cuál es la probabilidad
de que sí tenga una imperfección? Calcule para p 0.5.
86. a. Una compañía maderera acaba de recibir un lote de
10 000 tablas de 2 4. Suponga que 20% de estas tablas
(2 000) en realidad están demasiado tiernas o verdes para
ser utilizadas en construcción de primera calidad. Se eligen dos tablas al azar, una después de la otra. Sea A
{la primera tabla está verde} y B {la segunda tabla está verde}. Calcule P(A), P(B) y P(A B) (un diagrama
de árbol podría ayudar). ¿Son A y B independientes?
b. Con A y B independientes y P(A) P(B) 0.2, ¿cuál
es P(A B)? ¿Cuánta diferencia existe entre esta respuesta y P(A B) en el inciso a)? Para propósitos de
cálculo P(A B), ¿se puede suponer que A y B del inciso a) son independientes para obtener en esencia la
probabilidad correcta?
c. Suponga que un lote consta de 10 tablas, de las cuales
dos están verdes. ¿Produce ahora la suposición de independencia aproximadamente la respuesta correcta para
P(A B)? ¿Cuál es la diferencia crítica entre la situación
en este caso y la del inciso a)? ¿Cuándo piensa que una
suposición de independencia sería válida al obtener
una respuesta aproximadamente correcta a P(A B)?
87. Remítase a las suposiciones manifestadas en el ejercicio 80
y responda la pregunta planteada allí para el sistema de la
figura adjunta. ¿Cómo cambiaría la probabilidad si ésta fuera un subsistema conectado en paralelo al subsistema ilustrado en la figura 2.14(a)?
1
3
4
2
5
6
7
88. El profesor Stan der Deviation puede tomar una de las rutas
en el trayecto del trabajo a su casa. En la primera ruta, hay
www.FreeLibros.me
c2_p046-085.qxd
82
3/12/08
CAPÍTULO 2
3:59 AM
Page 82
Probabilidad
cuatro cruces de ferrocarril. La probabilidad de que sea detenido por un tren en cualquiera de los cruces es 0.1 y los
trenes operan independientemente en los cuatro cruces. La
otra ruta es más larga pero sólo hay dos cruces, independientes uno de otro, con la misma posibilidad de que sea detenido por un tren al igual que en la primera ruta. En un día
particular, el profesor Deviation tiene una reunión programada en casa durante cierto tiempo. Cualquiera ruta que tome, calcula que llegará tarde si es detenido por los trenes en
por lo menos la mitad de los cruces encontrados.
a. ¿Cuál ruta deberá tomar para reducir al mínimo la probabilidad de llegar tarde a la reunión?
b. Si lanza al aire una moneda imparcial para decidir que ruta tomar y llega tarde, ¿cuál es la probabilidad de que
tomó la ruta de los cuatro cruces?
89. Suponga que se colocan etiquetas idénticas en las dos orejas de un zorro. El zorro es dejado en libertad durante un
tiempo. Considere los dos eventos C1 {se pierde la etiqueta de la oreja izquierda} y C2 {se pierde la etiqueta de
la oreja derecha}. Sea P(C1) P(C2) y suponga que
C1 y C2 son eventos independientes. Derive una expresión
(que implique ) para la probabilidad de que exactamente
una etiqueta se pierda dado que cuando mucho una se pierde (“Ear Tag Loss in Red Foxes”, J. Wildlife Mgmt., 1976:
164–167). [Sugerencia: Trace un diagrama de árbol en el
cual las dos ramas iniciales se refieren a si la etiqueta de la
oreja izquierda se pierde.]
EJERCICIOS SUPLEMENTARIOS (90-114)
90. Una pequeña compañía manufacturera iniciará un turno de noche. Hay 20 mecánicos empleados por la compañía.
a. Si una cuadrilla nocturna se compone de 3 mecánicos,
¿cuántas cuadrillas diferentes son posibles?
b. Si los mecánicos están clasificados 1, 2, . . . , 20 en orden de competencia, ¿cuántas de estas cuadrillas no incluirían al mejor mecánico?
c. ¿Cuántas de las cuadrillas tendrían por lo menos 1 de los
10 mejores mecánicos?
d. Si se selecciona al azar una de estas cuadrillas para que
trabajen una noche particular, ¿cuál es la probabilidad
de que el mejor mecánico no trabaje esa noche?
91. Una fábrica utiliza tres líneas de producción para fabricar
latas de cierto tipo. La tabla adjunta da porcentajes de latas
que no cumplen con las especificaciones, categorizadas por
tipo de incumplimiento de las especificaciones, para cada
una de las tres líneas durante un periodo particular.
Manchas
Grietas
Problema con la argolla
de apertura
Defecto superficial
Otros
Línea 1
Línea 2
Línea 3
15
50
12
44
20
40
21
10
4
28
8
8
24
15
2
Durante este periodo, la línea 1 produjo 500 latas fuera de
especificación, la 2 produjo 400 latas como esas y la 3 fue
responsable de 600 latas fuera de especificación. Suponga
que se selecciona al azar una de estas 1500 latas.
a. ¿Cuál es la probabilidad de que la lata la produjo la línea 1? ¿Cuál es la probabilidad de que la razón del incumplimiento de la especificación es una grieta?
b. Si la lata seleccionada provino de la línea 1, ¿cuál es la
probabilidad de que tenía una mancha?
c. Dado que la lata seleccionada mostró un defecto superficial, ¿cuál es la probabilidad de que provino de la línea 1?
92. Un empleado de la oficina de inscripciones en una universidad en este momento tiene diez formas en su escritorio en
espera de ser procesadas. Seis de éstas son peticiones de baja y las otras cuatro son solicitudes de sustitución de curso.
a. Si selecciona al azar seis de estas formas para dárselas a
un subordinado, ¿cuál es la probabilidad de que sólo uno
de los dos tipos permanezca en su escritorio?
b. Suponga que tiene tiempo para procesar sólo cuatro de
estas formas antes de salir del trabajo. Si estas cuatro se
seleccionan al azar una por una, ¿cuál es la probabilidad
de que cada forma subsiguiente sea de un tipo diferente de
su predecesora?
93. Un satélite está programado para ser lanzado desde Cabo Cañaveral en Florida y otro lanzamiento está programado para
la Base de la Fuerza Aérea Vandenberg en California. Sea A
el evento en que el lanzamiento en Vandenberg se hace a la
hora programada y B el evento en que el lanzamiento en Cabo Cañaveral se hace a la hora programada. Si A y B son
eventos independientes con P(A) P(B) y P(A B) 0.626,
P(A B) 0.144, determine los valores de P(A) y P(B).
94. Un transmisor envía un mensaje utilizando un código binario, esto es, una secuencia de ceros y unos. Cada bit transmitido (0 o 1) debe pasar a través de tres relevadores para
llegar al receptor. En cada relevador, la probabilidad es 0.20
de que el bit enviado será diferente del bit recibido (una inversión). Suponga que los relevadores operan independientemente uno de otro.
Transmisor A Relevador 1 A Relevador 2 A Relevador 3
A Receptor
a. Si el transmisor envía un 1, ¿cuál es la probabilidad de
que los tres relevadores envíen un 1?
b. Si el transmisor envía un 1, ¿cuál es la probabilidad de
que el receptor reciba un 1? [Sugerencia: Los ocho resultados experimentales pueden ser mostrados en un
diagrama de árbol con tres ramas de generación, una por
cada relevador.]
c. Suponga que 70% de todos los bits enviados por el
transmisor son 1. Si el receptor recibe un 1, ¿cuál es la
probabilidad de que un 1 fue enviado?
95.
El individuo A tiene un círculo de cinco amigos cercanos
(B, C, D, E y F). A escuchó cierto rumor originado fuera del
círculo e invitó a sus cinco amigos a una fiesta para contarles el rumor. Para empezar, A escoge a uno de los cinco al
www.FreeLibros.me
c2_p046-085.qxd
3/12/08
3:59 AM
Page 83
Ejercicios suplementarios
96.
97.
98.
99.
100.
azar y se lo cuenta. Dicho individuo escoge entonces
al azar a uno de los cuatro individuos restantes y repite el
rumor. Después, de aquellos que ya oyeron el rumor uno se
lo cuenta a otro nuevo individuo y así hasta que todos oyen
el rumor.
a. ¿Cuál es la probabilidad de que el rumor se repita en el
orden B, C, D, E y F?
b. ¿Cuál es la probabilidad de que F sea la tercera persona en la reunión a quien se cuenta el rumor?
c. ¿Cuál es la probabilidad de que F sea la última persona
en oír el rumor?
Remítase al ejercicio 95. Si en cada etapa la persona que
actualmente “oyó” el rumor no sabe quién ya lo oyó y selecciona el siguiente receptor al azar de entre todos los cinco probables individuos, ¿cuál es la probabilidad de que F
aún no haya escuchado el rumor después de que el rumor
haya sido contado diez veces en la reunión?
Un ingeniero químico está interesado en determinar si cierta
impureza está presente en un producto. Un experimento tiene una probabilidad de 0.80 de detectarla si está presente. La
probabilidad de no detectarla si está ausente es de 0.90.
Las probabilidades previas de que la impureza esté presente o ausente son de 0.40 y 0.60, respectivamente. Tres experimentos distintos producen sólo dos detecciones. ¿Cuál es
la probabilidad posterior de que la impureza esté presente?
A cada concursante en un programa de preguntas se le pide que especifique una de seis posibles categorías de entre
las cuales se le hará una pregunta. Suponga P(el concur1
sante escoge la categoría i) 6 y concursantes sucesivos
escogen sus categorías independientemente uno de otro. Si
participan tres concursantes en cada programa y los tres en
un programa particular seleccionan diferentes categorías,
¿cuál es la probabilidad de que exactamente uno seleccione la categoría 1?
Los sujetadores roscados utilizados en la fabricación de
aviones son levemente doblados para que queden bien
apretados y no se aflojen durante vibraciones. Suponga
que 95% de todos los sujetadores pasan una inspección inicial. De 5% que fallan, 20% están tan seriamente defectuosos que deben ser desechados. Los sujetadores restantes son
enviados a una operación de redoblado, donde 40% no
pueden ser recuperados y son desechados. El otro 60% de
estos sujetadores son corregidos por el proceso de redoblado y posteriormente pasan la inspección.
a. ¿Cuál es la probabilidad de que un sujetador que acaba
de llegar seleccionado al azar pase la inspección inicialmente o después del redoblado?
b. Dado que un sujetador pasó la inspección, ¿cuál es la
probabilidad de que apruebe la inspección inicial y de
que no necesite redoblado?
Un porcentaje de todos los individuos en una población
son portadores de una enfermedad particular. Una prueba de diagnóstico para esta enfermedad tiene una tasa de
detección de 90% para portadores y de 5% para no portadores. Suponga que la prueba se aplica independientemente a dos muestras de sangre diferentes del mismo individuo
seleccionado al azar.
a. ¿Cuál es la probabilidad de que ambas pruebas den el
mismo resultado?
83
b. Si ambas pruebas son positivas, ¿cuál es la probabilidad
de que el individuo seleccionado sea un portador?
101. Un sistema consta de dos componentes. La probabilidad de
que el segundo componente funcione de manera satisfactoria durante su duración de diseño es de 0.9, la probabilidad
de que por lo menos uno de los dos componentes lo haga
es de 0.96 y la probabilidad de que ambos componentes lo
hagan es de 0.75. Dado que el primer componente funciona
de manera satisfactoria durante toda su duración de diseño,
¿cuál es la probabilidad de que el segundo también lo haga?
102. Cierta compañía envía 40% de sus paquetes de correspondencia nocturna vía un servicio de correo Express E1. De
estos paquetes, 2% llegan después del tiempo de entrega
garantizado (sea L el evento “entrega demorada”). Si se
selecciona al azar un registro de correspondencia nocturna
del archivo de la compañía, ¿cuál es la probabilidad de que
el paquete se fue vía E1 y llegó demorado?
103. Remítase al ejercicio 102. Suponga que 50% de los paquetes nocturnos se envían vía servicio de correo Express E2 y
el 10% restante se envía por E3. De los paquetes enviados
vía E2, sólo 1% llegan demorados, en tanto que 5% de los
paquetes manejados por E3 llegan demorados.
a. ¿Cuál es la probabilidad de que un paquete seleccionado al azar llegue demorado?
b. Si un paquete seleccionado al azar llegó a tiempo, ¿cuál
es la probabilidad de que no fue mandado vía E1?
104. Una compañía utiliza tres líneas de ensamble diferentes: A1,
A2 y A3, para fabricar un componente particular. De los fabricados por la línea A1, 5% tienen que ser retrabajados para
corregir un defecto, mientras que 8% de los componentes de
A2 tienen que ser retrabajados y 10% de los componentes
de A3 tienen que ser retrabajados. Suponga que 50% de todos los componentes los produce la línea A1, 30% la línea A2
y 20% la línea A3. Si un componente seleccionado al azar
tiene que ser retrabajado, ¿cuál es la probabilidad de que
provenga de la línea A1? ¿De la línea A2? ¿De la línea A3?
105. Desechando la posibilidad de cumplir años el 29 de febrero, suponga que es igualmente probable que un individuo
seleccionado al azar haya nacido en cualquiera de los demás 365 días.
a. Si se seleccionan al azar diez personas, ¿cuál es la probabilidad que tendrán diferentes cumpleaños? ¿De que
por lo menos dos tengan el mismo cumpleaños?
b. Si k reemplaza a diez en el inciso a), ¿cuál es la k más
pequeña para la cual existe por lo menos una probabilidad de 50-50 de que dos o más personas tengan el mismo cumpleaños?
c. Si seleccionan diez personas al azar, ¿cuál es la probabilidad de que por los menos dos tengan el mismo cumpleaños o por lo menos dos tengan los mismos tres
últimos dígitos de sus números del Seguro Social? [Nota: El artículo “Methods for Studying Coincidences” (F.
Mosteller y P. Diaconis, J. Amer. Stat. Assoc., 1989:
853–861) discute problemas de este tipo.]
106. Un método utilizado para distinguir entre rocas graníticas
(G) y basálticas (B) es examinar una parte del espectro infrarrojo de la energía solar reflejada por la superficie de la roca. Sean R1, R2 y R3 intensidades espectrales medidas a tres
www.FreeLibros.me
c2_p046-085.qxd
84
3/12/08
CAPÍTULO 2
3:59 AM
Page 84
Probabilidad
longitudes de onda diferentes, en general, para granito R1
R2 R3, en tanto que para basalto R3 R1 R2. Cuando se
hacen mediciones a distancia (mediante un avión), varios ordenamientos de Ri pueden presentarse ya sea que la roca sea
basalto o granito. Vuelos sobre regiones de composición conocida han arrojado la siguiente información:
R1 R2 R3
R1 R3 R2
R3 R1 R2
Granito
Basalto
60%
25%
15%
10%
20%
70%
Suponga que para una roca seleccionada al azar en cierta
región P(granito) 0.25 y P(basalto) 0.75.
a. Demuestre que P(granito | R1 R2 R3) P(basalto |
R1 R2 R3). Si las mediciones dieron R1 R2 R3,
¿clasificaría la roca como granito o como basalto?
b. Si las mediciones dieron R1 R3 R2, ¿cómo clasificaría la roca? Responda la misma pregunta para R3
R1 R2.
c. Con las reglas de clasificación indicadas en los incisos
a) y b) cuando se seleccione una roca de esta región,
¿cuál es la probabilidad de una clasificación errónea?
[Sugerencia: G podría ser clasificada como B o B como
G y P(B) y P(G) son conocidas.]
d. Si P(granito p en lugar de 0.25, ¿existen valores de p
(aparte de 1) para los cuales una roca siempre sería clasificada como granito?
107. A un sujeto se le permite una secuencia de vistazos para detectar un objetivo. Sea Gi {el objetivo es detectado en el
vistazo i-ésimo}, con pi P(Gi). Suponga que los Gi son
eventos independientes y escriba una expresión para la probabilidad de que el objetivo haya sido detectado al final del
vistazo n-ésimo. [Nota: Este modelo se discute en “Predicting
Aircraft Detectability”, Human Factors, 1979: 277–291.]
108. En un juego de béisbol de Ligas menores, el lanzador del
equipo A lanza un “strike” 50% del tiempo y una bola 50%
del tiempo; los lanzamientos sucesivos son independientes
unos de otros y el lanzador nunca golpea a un bateador. Sabiendo esto, el “mánager” del equipo B ha instruido al primer bateador que no le batee a nada. Calcule la probabilidad
de que:
a. El bateador reciba base por bolas en el cuarto lanzamiento.
b. El bateador reciba base por bolas en el sexto lanzamiento (por lo que dos de los primeros cinco deben ser
“strikes”), por medio de un argumento de conteo o un
diagrama de árbol.
c. El bateador recibe base por bolas.
d. El primer bateador en el orden al bat anota mientras no
hay ningún “out” (suponiendo que cada bateador utiliza la estrategia de no batearle a nada).
109. Cuatro ingenieros, A, B, C y D han sido citados para entrevistas de trabajo a las 10 A.M., el viernes 13 de enero, en
Random Sampling, Inc. El gerente de personal ha programado a los cuatro para las oficinas de entrevistas 1, 2, 3 y
4, respectivamente. Sin embargo, el secretario del gerente
no está enterado de esto, por lo que los asigna a las oficinas
de un modo completamente aleatorio (¡Qué más!) ¿Cuál es
la probabilidad de que
a. Los cuatro terminen en las oficinas correctas?
b. Ninguno de los cuatro termine en la oficina correcta?
110. Una aerolínea particular opera vuelos a las 10 A.M., de
Chicago a Nueva York, Atlanta y Los Ángeles. Sea A el
evento en que el vuelo a Nueva York está lleno y defina
los eventos B y C en forma análoga para los otros dos vuelos.
Suponga que P(A) 0.6, P(B) 0.5, P(C) 0.4 y los tres
eventos son independientes. ¿Cuál es la probabilidad de que
a. Los tres vuelos estén llenos? Que por lo menos uno no
esté lleno?
b. Sólo el vuelo a Nueva York esté lleno? Que exactamente uno de los tres vuelos esté lleno?
111. Un gerente de personal va a entrevistar cuatro candidatos
para un puesto. Éstos están clasificados como 1, 2, 3 y 4 en
orden de preferencia y serán entrevistados en orden aleatorio. Sin embargo, al final de cada entrevista, el gerente sabrá sólo cómo se compara el candidato actual con los
candidatos previamente entrevistados. Por ejemplo, el orden de entrevista 3, 4, 1, 2 no genera información después de
la primera entrevista, muestra que el segundo candidato es
peor que el primero y que el tercero es mejor que los primeros dos. Sin embargo, el orden 3, 4, 2, 1 generaría la
misma información después de cada una de las primeras
tres entrevistas. El gerente desea contratar al mejor candidato pero debe tomar una decisión irrevocable de contratarlo o no contratarlo después de cada entrevista. Considere la
siguiente estrategia: Rechazar automáticamente a los primeros s candidatos y luego contratar al primer candidato
subsiguiente que resulte mejor entre los que ya fueron entrevistados (si tal candidato no aparece, el último entrevistado es el contratado).
Por ejemplo, con s 2, el orden 3, 4, 1, 2 permitiría contratar al mejor, en tanto que el orden 3, 1, 2, 4 no. De los cuatro posibles valores de s (0, 1, 2 y 3), ¿cuál incrementa al
máximo a P(el mejor es contratado)? [Sugerencia: los 24 ordenamientos de entrevista igualmente probables: s 0 significa que el primer candidato es automáticamente contratado.]
112. Considere cuatro eventos independientes A1, A2, A3 y A4 y
sea pi P(Ai) con i 1, 2, 3, 4. Exprese la probabilidad
de que por lo menos uno de estos eventos ocurra en función de las pi y haga lo mismo para la probabilidad de que
por lo menos dos de los eventos ocurran.
113. Una caja contiene los siguientes cuatro papelitos y cada
uno tiene exactamente las mismas dimensiones: (1) gana el
premio 1; (2) gana el premio 2; (3) gana el premio 3; (4)
ganan los premios 1, 2 y 3. Se selecciona un papelito al
azar. Sea A1 {gana el premio 1}, A2 {gana el premio
2} y A3 {gana el premio 3}. Demuestre que A1 y A2 son
independientes, que A1 y A3 son independientes y que A2 y
A3 también son independientes (esta es una independencia
por pares). Sin embargo, demuestre que P(A1 A2 A3)
P(A1) P(A2) · P(A3), así que los tres eventos no son mutuamente independientes.
114. Demuestre que si A1, A2 y A3 son eventos independientes,
entonces P(A1 | A2 A3) P(A1).
www.FreeLibros.me
c2_p046-085.qxd
3/12/08
3:59 AM
Page 85
Blibliografía
85
Bibliografía
Durrett, Richard, The Essentials of Probability, Duxbury Press,
Belmont, CA, 1993. Una presentación concisa a un nivel un
poco más alto que este texto.
Mosteller, Frederick, Robert Rourke y George Thomas, Probability with Statistical Applications (2a. ed.), Addison-Wesley,
Reading, MA, 1970. Una muy buena introducción a la probabilidad con muchos ejemplos entretenidos; especialmente
buenos con respecto a reglas de conteo y su aplicación.
Olkin, Ingram, Cyrus Derman y Leon Gleser, Probability Models
and Application (2a. ed.), Macmillan, Nueva York, 1994. Una
amplia introducción a la probabilidad escrita a un nivel matemático un poco más alto que este texto pero que contiene muchos buenos ejemplos.
Ross, Sheldon, A First Course in Probability (6a. ed.), Macmillan, Nueva York, 2002. Algo concisamente escrito y más matemáticamente complejo que este texto pero contiene una gran
cantidad de ejemplos y ejercicios interesantes.
Winkler, Robert, Introducction to Bayesian Inference and Decision, Holt, Rinehart & Winston, Nueva York, 1972. Una muy
buena introducción a la probabilidad subjetiva.
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
3
4:01 AM
Page 86
Variables aleatorias
discretas y distribuciones
de probabilidad
INTRODUCCIÓN
Ya sea que un experimento produzca resultados cualitativos o cuantitativos, los métodos de análisis estadístico requieren enfocarse en ciertos aspectos numéricos de los
_
datos (como la proporción muestral x/n, la media x o la desviación estándar s). El
concepto de variable aleatoria permite pasar de los resultados experimentales a la
función numérica de los resultados. Existen dos tipos fundamentalmente diferentes
de variables aleatorias: las variables aleatorias discretas y las variables aleatorias continuas. En este capítulo, se examinan las propiedades básicas y se discuten los ejemplos más importantes de variables discretas. El capítulo 4 se enfoca en las variables
aleatorias continuas.
86
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 87
3.1 Variables aleatorias
87
3.1 Variables aleatorias
En cualquier experimento, existen numerosas características que pueden ser observadas o
medidas, pero en la mayoría de los casos un experimentador se enfoca en algún aspecto específico o aspectos de una muestra. Por ejemplo, en un estudio de patrones de viaje entre los
suburbios y la ciudad en un área metropolitana, a cada individuo en una muestra se le
podría preguntar sobre la distancia que recorre para ir de su casa al trabajo y viceversa y el
número de personas que lo hacen en el mismo vehículo, pero no sobre su coeficiente intelectual, ingreso, tamaño de su familia y otras características. Por otra parte, un investigador
puede probar una muestra de componentes y anotar sólo el número de los que han fallado
dentro de 1000 horas, en lugar de anotar los tiempos de falla individuales.
En general, cada resultado de un experimento puede ser asociado con un número especificando una regla de asociación (p. ej., el número entre la muestra de diez componentes
que no duran 1000 horas o el peso total del equipaje en una muestra de 25 pasajeros de aerolínea). Semejante regla de asociación se llama variable aleatoria, variable porque diferentes valores numéricos son posibles y aleatoria porque el valor observado depende de cuál
de los posibles resultados experimentales resulte (figura 3.1).
2 1 0
Figura 3.1
DEFINICIÓN
1
2
Una variable aleatoria.
Para un espacio muestral dado S de algún experimento, una variable aleatoria (va, o
rv, por sus siglas en inglés) es cualquier regla que asocia un número con cada resultado en S. En lenguaje matemático, una variable aleatoria es una función cuyo dominio es el espacio muestral y cuyo rango es el conjunto de números reales.
Se acostumbra denotar las variables aleatorias con letras mayúsculas, tales como X y Y,
que son las de cerca del final del alfabeto. En contraste al uso previo de una letra minúscula, tal como x, para denotar una variable, ahora se utilizarán letras mayúsculas para representar algún valor particular de la variable aleatoria correspondiente. La notación X(s) x
significa que x es el valor asociado con el resultado s por la va X.
Ejemplo 3.1
Cuando un estudiante intenta entrar a un sistema de tiempo compartido de computadora, o
todos los puertos están ocupados (F), en cuyo caso el estudiante no podrá tener acceso o hay
por lo menos un puerto libre (S), en cuyo caso el estudiante sí podrá tener acceso al sistema. Con S {S, F}, la va X se define como
X(S) 1
X(F) 0
La va X indica si (1) o no (2) el estudiante puede entrar al sistema.
■
La va X en el ejemplo 3.1 se especificó al poner en lista explícitamente cada elemento de S y el número asociado. Una lista como esa es tediosa si S contiene más de algunos
cuantos resultados, pero con frecuencia puede ser evitada.
www.FreeLibros.me
c3_p086-129.qxd
88
3/12/08
CAPÍTULO 3
4:01 AM
Page 88
Variables aleatorias discretas y distribuciones de probabilidad
Ejemplo 3.2
Considere el experimento en el cual un número telefónico en cierto código de área es elegido con un marcador de números aleatorio (tales dispositivos los utilizan en forma extensa
organizaciones encuestadoras) y defina una va Y como
Y
{
1 si el número seleccionado no aparece en el directorio
0 si el número seleccionado sí aparece en el directorio
Por ejemplo, si 5282966 aparece en el directorio telefónico, entonces Y(5282966) 0 en
tanto que Y(7727350) dice que el número 7727350 no aparece en el directorio telefónico. Una descripción en palabras de esta índole es más económica que una lista completa,
por lo que se utilizará tal descripción siempre que sea posible.
■
En los ejemplos 3.1 y 3.2, los únicos valores posibles de la variable aleatoria fueron
0 y 1. Tal variable aleatoria se presenta con suficiente frecuencia como para darle un nombre especial, en honor del individuo que la estudió primero.
DEFINICIÓN
Cualquier variable aleatoria cuyos únicos valores posibles son 0 y 1 se llama variable aleatoria de Bernoulli.
En ocasiones se deseará definir y estudiar varias variables diferentes del mismo espacio muestral.
Ejemplo 3.3
El ejemplo 2.3 describe un experimento en el cual se determinó el número de bombas en
uso en cada una de dos gasolinerías. Defina las variables aleatorias X, Y y U como
X el número total de bombas en uso en las dos gasolinerías.
Y la diferencia entre el número de bombas en uso en la gasolinería 1 y el número
en uso en la gasolinería 2.
U el máximo de los números de bombas en uso en las dos gasolinerías.
Si se realiza este experimento y s (2, 3) se obtiene entonces X((2, 3)) 2 3 5, por
lo que se dice que el valor observado de X fue x 5. Asimismo, el valor observado de Y sería y 2 3 1 y el de U sería u máx(2, 3) 3.
■
Cada una de las variables aleatorias de los ejemplos 3.1–3.3 puede asumir sólo un número finito de posibles valores. Éste no tiene que ser el caso.
Ejemplo 3.4
En el ejemplo 2.4, se consideraron experimentos en los cuales se examinaron baterías hasta que se obtuvo una buena (S). El espacio muestral fue S {S, FS, FFS, . . .}. Defina una
variable aleatoria X como
X el número de baterías examinadas antes que se termine el experimento.
En ese caso X(S) 1, X(FS) 2, X(FFS) 3, . . . , X(FFFFFFS) 7, y así sucesivamente. Cualquier entero positivo es un valor positivo de X, así que el conjunto de valores posibles es infinito.
■
Ejemplo 3.5
Suponga que del mismo modo aleatorio, se selecciona un lugar (latitud y longitud) en los
Estados Unidos continentales. Defina una variable aleatoria Y como
Y la altura sobre el nivel del mar en el lugar seleccionado.
Por ejemplo, si el lugar seleccionado fuera (39° 50N, 98° 35O, entonces se podría tener
Y((39° 50N, 98° 35O)) 1748.26 pies. El valor más grande posible de Y es 14 494
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 89
3.1 Variables aleatorias
89
(Monte Whitney) y el valor más pequeño posible es 282 (Valle de la Muerte). El conjunto de todos los valores posibles de Y es el conjunto de todos los números en el intervalo entre 282 y 14 494, es decir,
{y: y es un número, 282 y 14 494}
y existe un número infinito de números en este intervalo.
■
Dos tipos de variables aleatorias
En la sección 1.2, se distinguió entre los datos que resultan de observaciones de una variable de conteo y los datos obtenidos observando valores de una variable de medición. Una
distinción un poco más formal caracteriza dos tipos diferentes de variables aleatorias.
DEFINICIÓN
Una variable aleatoria discreta es una variable aleatoria cuyos valores posibles o
constituyen un conjunto finito o bien pueden ser puestos en lista en una secuencia infinita en la cual existe un primer elemento, un segundo elemento, y así sucesivamente (“contablemente” infinita).
Una variable aleatoria es continua si ambas de las siguientes condiciones aplican:
1. Su conjunto de valores posibles se compone de o todos los números que hay en un
solo intervalo sobre la línea de numeración (posiblemente de extensión infinita, es
decir, desde hasta ) o todos los números en una unión excluyente de dichos
intervalos (p. ej., [0, 10] [20, 30]).
2. Ningún valor posible de la variable aleatoria tiene probabilidad positiva, esto es,
P(X c) 0 con cualquier valor posible de c.
Aunque cualquier intervalo sobre la línea de numeración contiene un número infinito de números, se puede demostrar que no existe ninguna forma de crear una lista infinita de todos
estos valores, existen sólo demasiados de ellos. La segunda condición que describe una variable aleatoria continua es tal vez contraintuitiva, puesto que parecería que implica una probabilidad total de cero con todos los valores posibles. Pero en el capítulo 4 se verá que los
intervalos de valores tienen probabilidad positiva; la probabilidad de un intervalo se reducirá a cero a medida que su ancho tienda a cero.
Ejemplo 3.6
Todas las variables aleatorias de los ejemplos 3.1-3.4 son discretas. Como otro ejemplo, suponga que se eligen al azar parejas de casados y que a cada persona se le hace una prueba de
sangre hasta encontrar un esposo y esposa con el mismo factor Rh. Con X el número de pruebas de sangre que serán realizadas, los posibles valores de X son D {2, 4, 6, 8, . . .}.
Como los posibles valores se dieron en secuencia, X es una variable aleatoria discreta.
■
Para estudiar las propiedades básicas de las variables aleatorias discretas, sólo se requieren las herramientas de matemáticas discretas: sumas y diferencias. El estudio de variables continuas requiere las matemáticas continuas del cálculo: integrales y derivadas.
EJERCICIOS
Sección 3.1 (1-10)
1. Una viga de concreto puede fallar o por esfuerzo cortante (S)
o flexión (F). Suponga que se seleccionan al azar tres vigas
que fallaron y que se determina el tipo de falla de cada una.
Sea X el número de vigas entre las tres seleccionadas que
fallaron por cortante. Ponga en lista cada resultado en el espacio muestral junto con el valor asociado de X.
3. Con el experimento del ejemplo 3.3, defina dos variables
aleatorias más y mencione los valores posibles de cada una.
2. Dé tres ejemplos de variables aleatorias de Bernoulli (aparte de los que aparecen en el texto).
5. Si el espacio muestral S es un conjunto infinito, ¿implica esto necesariamente que cualquier variable aleatoria X definida
4. Sea X el número de dígitos no cero en un código postal
seleccionado al azar. ¿Cuáles son los posibles valores de X?
Dé tres posibles resultados y sus valores X asociados.
www.FreeLibros.me
c3_p086-129.qxd
90
3/12/08
CAPÍTULO 3
4:01 AM
Page 90
Variables aleatorias discretas y distribuciones de probabilidad
a partir de S tendrá un conjunto infinito de posibles valores?
Si la respuesta es sí, diga por qué. Si es no, dé un ejemplo.
A2
6. A partir de una hora fija, cada carro que entra a una intersección es observado para ver si da vuelta a la izquierda (L), la
derecha (R) o si sigue de frente (A). El experimento termina
en cuanto se observa que un carro da vuelta a la izquierda.
Sea X el número de carros observados. ¿Cuáles son los
posibles valores de X? Dé cinco resultados y sus valores X
asociados.
7. Para cada variable definida aquí, describa el conjunto de posibles valores de la variable y diga si la variable es discreta.
a. X el número de huevos no quebrados en una caja de
huevos estándar seleccionada al azar.
b. Y el número de estudiantes en una lista de clase de un
curso particular que no asisten el primer día de clases.
c. U el número de veces que un novato tiene que hacerle
“swing” a una pelota de golf antes de golpearla.
d. X la longitud de una serpiente de cascabel seleccionada en forma aleatoria.
e. Z la cantidad de regalías devengada por la venta de la
primera edición de 10 000 libros de texto.
f. Y el pH de una muestra de suelo elegida al azar.
g. X la tensión (lb/pulg2) a la cual una raqueta de tenis seleccionada al azar fue encordada.
h. X el número total de lanzamientos al aire de una moneda requerido para que tres individuos obtengan una
coincidencia (HHH o TTT ).
8. Cada vez que un componente se somete a prueba, ésta es un
éxito (E) o una falla (F). Suponga que el componente
se prueba repetidamente hasta que ocurre un éxito en tres
pruebas consecutivas. Sea Y el número de pruebas necesario para lograrlo. Haga una lista de todos los resultados
correspondientes a los primeros posibles valores más pequeños de Y y diga qué valor de Y está asociado con cada uno.
9. Un individuo de nombre Claudius se encuentra en el punto 0
del diagrama adjunto.
B1
B2
A3
B3
0
A1
B4
A4
Con un dispositivo de aleatorización apropiado (tal como un
dado tetraédrico, uno que tiene cuatro lados), Claudius primero se mueve a uno de los cuatro lugares B1, B2, B3, B4.
Una vez que está en uno de estos lugares, se utiliza otro dispositivo de aleatorización para decidir si Claudius regresa a
0 o visita uno de los otros dos lugares adyacentes. Este
proceso continúa entonces; después de cada movimiento,
se determina otro movimiento a uno de los (nuevos) puntos adyacentes lanzando al aire un dado o moneda apropiada.
a. Sea X el número de movimientos que Claudius hace
antes de regresar a 0. ¿Cuáles son los posibles valores de
X? ¿Es X discreta o continua?
b. Si también se permiten movimientos a lo largo de los trayectos diagonales que conectan 0 con A1, A2, A3 y A4, respectivamente, responda la pregunta del inciso a).
10. Se determinará el número de bombas en uso tanto en la gasolinería de seis bombas como en la gasolinería de cuatro
bombas. Dé los posibles valores de cada una de las siguientes variables aleatorias:
a. T el número total de bombas en uso.
b. X la diferencia entre el número en uso en las gasolinerías 1 y 2.
c. U el número máximo de bombas en uso en una u otra
gasolinería.
d. Z el número de gasolinerías que tienen exactamente
dos bombas en uso.
3.2 Distribuciones de probabilidad
para variables aleatorias discretas
Las probabilidades asignadas a varios resultados en S determinan a su vez las probabilidades
asociadas con los valores de cualquier variable aleatoria X particular. La distribución de probabilidad de X dice cómo está distribuida (asignada) la probabilidad total de 1 entre los varios posibles valores de X. Supóngase, por ejemplo, que una empresa acaba de adquirir cuatro
impresoras láser y sea X el número entre éstas que requieren servicio durante el periodo de
garantía. Los posibles valores de X son entonces 0, 1, 2, 3 y 4. La distribución de probabilidad dirá cómo está subdividida la probabilidad de 1 entre estos cinco posibles valores: cuánta probabilidad está asociada con el valor 0 de X, cuánta está adjudicada al valor 1 de X, y así
sucesivamente. Se utilizará la siguiente notación para las probabilidades en la notación:
p(0) la probabilidad del valor 0 de X P(X 0)
p(1) la probabilidad del valor 1 de X P(X 1)
y así sucesivamente. En general, p(x) denotará la probabilidad asignada al valor de x.
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 91
3.2 Distribuciones de probabilidad para variables aleatorias discretas
Ejemplo 3.7
91
Una cierta gasolinería tiene seis bombas. Sea X el número de bombas que están en servicio
a una hora particular del día. Suponga que la distribución de probabilidad de X es como se
da en la tabla siguiente; la primera fila de la tabla contiene los posibles valores de X y la segunda da la probabilidad de dicho valor.
x
0
1
2
3
4
5
6
p(x)
0.05
0.10
0.15
0.25
0.20
0.15
0.10
Ahora se pueden usar propiedades de probabilidad elemental para calcular otras probabilidades de interés. Por ejemplo, la probabilidad de que cuando mucho dos bombas estén en
servicio es
P(X 2) P(X 0 o 1 o 2) p(0) p(1) p(2) 0.05 0.10 0.15 0.30
Como el evento de que por lo menos 3 bombas estén en servicio es complementario a cuando mucho 2 bombas están en servicio.
3) 1 P(X 2) 1 0.30 0.70
P(X
la que, desde luego, también se obtiene sumando las probabilidades de los valores 3, 4, 5 y 6.
La probabilidad de que entre 2 y 5 bombas inclusive estén en servicio es
P(2 X 5) P(X 2, 3, 4 o 5) 0.15 0.25 0.20 0.15 0.75
en tanto que la probabilidad de que el número de bombas en servicio esté estrictamente entre 2 y 5 es
P(2 X 5) P(X 3 o 4) 0.25 0.20 0.45
DEFINICIÓN
■
La distribución de probabilidad o función masa de probabilidad (fmp) de una variable discreta se define para cada número x como p(x) P(X x) P(todas las
s S: X(s) x).
En palabras, para cada valor posible x de la variable aleatoria, la función masa de probabilidad especifica la probabilidad de observar dicho valor cuando se realiza el experimento. Se requieren las condiciones p(x)
0 y todas las x posibles p(x) 1 de cualquier función
masa de probabilidad.
La función masa de probabilidad de X en el ejemplo previo se dio simplemente en la
descripción del problema. A continuación se consideran varios ejemplos en los cuales varias propiedades de probabilidad son explotadas para obtener la distribución deseada.
Ejemplo 3.8
Seis lotes de componentes están listos para ser enviados por un proveedor. El número de
componentes defectuosos en cada lote es como sigue:
Lote
Número de defectuosos
1
0
2
2
3
0
4
1
5
2
6
0
Uno de estos lotes tiene que ser seleccionado al azar para ser enviado a un cliente particular. Sea X el número de defectuosos en el lote seleccionado. Los tres posibles valores de X
www.FreeLibros.me
c3_p086-129.qxd
92
3/12/08
CAPÍTULO 3
4:01 AM
Page 92
Variables aleatorias discretas y distribuciones de probabilidad
son 0, 1 y 2. De los seis eventos simples igualmente probables, tres dan por resultado
X 0, uno X 1 y los otros dos X 2. Entonces
p(0) P(X 0) P(el lote 1 o 3 o 6 es enviado)
3
0.5
6
1
0.167
6
2
p(2) P(X 2) P(el lote 2 o 5 es enviado) 0.333
6
p(1) P(X 1) P(el lote 4 es enviado)
Es decir, una probabilidad de 0.5 se asigna al valor 0 de X, una probabilidad de 0.167 se
asigna al valor 1 de X y la probabilidad restante 0.333 se asocia con el valor 2 de X. Los valores de X junto con sus probabilidades especifican la función de masa de probabilidad. Si
este experimento se repitiera una y otra vez, a la larga X 0 ocurriría la mitad del tiempo,
X 1 un sexto del tiempo y X 2 un tercio del tiempo.
■
Ejemplo 3.9
Considere si la siguiente persona que compre una computadora en una librería universitaria
comprará un modelo portátil o uno de escritorio. Sea
X
{
1 si el cliente compra una computadora portátil
0 si el cliente compra una computadora de escritorio
Si 20% de todas las compras durante esa semana seleccionan una portátil, la función
masa de probabilidad de X es
p(0) P(X 0) P(el siguiente cliente compra un modelo de escritorio) 0.8
p(1) P(X 1) P(el siguiente cliente compra un modelo portátil) 0.2
p(x) P(X x) 0 con x 0 o 1
Una descripción equivalente es
0.8 si x 0
p(x) 0.2 si x 1
0
si x 0 o 1
{
La figura 3.2 es una ilustración de esta función masa de probabilidad, llamada gráfica lineal. X es, desde luego, una variable aleatoria de Bernoulli y p(x) es una función masa de
probabilidad de Bernoulli.
p(x)
1
x
0
Figura 3.2
Ejemplo 3.10
1
Gráfica lineal de la función de masa de probabilidad en el ejemplo 3.9.
■
Considere un grupo de cinco donadores de sangre potenciales, a, b, c, d y e, de los cuales
sólo a y b tienen sangre tipo O. Se determinará en orden aleatorio el tipo de sangre con
cinco muestras, una de cada individuo hasta que se identifique un individuo O. Sea la
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 93
3.2 Distribuciones de probabilidad para variables aleatorias discretas
93
variable aleatoria Y el número de exámenes de sangre para identificar un individuo O.
Entonces la función masa de probabilidad de Y es
2
p(1) P(Y 1) P(a o b examinados primero)
0.4
5
p(2) P(Y 2) P(c, d o e primero y luego a o b)
P(c, d o e primero) P(a o b a continuación°c, d o e primero)
3 2
0.3
5 4
p(3) P(Y 3) P(c, d o e primero y segundo y luego a o b)
3 2 2
0.2
5 4 3
p(4) P(Y 4) P(c, d y e primero)
3
2
1
5 4 3 0.1
p(y) 0 si y 1, 2, 3, 4
En forma tabular, la función de masa de probabilidad es
y
1
2
3
4
p(y)
0.4
0.3
0.2
0.1
donde cualquier valor de y que no aparece en la tabla recibe cero probabilidad. La figura 3.3
muestra una gráfica lineal de la función de masa de probabilidad.
p(y)
0.5
0
Figura 3.3
1
2
3
y
4
Gráfica lineal de la función de masa de probabilidad en el ejemplo 3.10.
■
Un modelo utilizado en física para un sistema de “masas puntuales” sugirió el nombre “función masa de probabilidad”. En este modelo, las masas están distribuidas en varios
x lugares a lo largo de un eje unidimensional. La función masa de probabilidad describe cómo está distribuida la masa de probabilidad total de 1 en varios puntos a lo largo del eje de
posibles valores de la variable aleatoria (dónde y cuánta masa hay en cada x).
Otra representación pictórica útil de una función de masa de probabilidad, llamada
histograma de probabilidad, es similar a los histogramas discutidos en el capítulo 1. Sobre cada y con p(y) 0, se construye un rectángulo con su centro en y. La altura de cada
rectángulo es proporcional a p(y) y la base es la misma para todos los rectángulos. Cuando
los valores posibles están equidistantes, con frecuencia se selecciona la base como la distancia entre valores y sucesivos (aunque podría ser más pequeña). La figura 3.4 muestra dos
histogramas de probabilidad.
0
1
a)
Figura 3.4
1
2
3
4
b)
Histogramas de probabilidad: a) ejemplo 3.9; b) ejemplo 3.10.
www.FreeLibros.me
c3_p086-129.qxd
94
3/12/08
CAPÍTULO 3
4:01 AM
Page 94
Variables aleatorias discretas y distribuciones de probabilidad
A menudo es útil pensar en una función masa de probabilidad como un modelo matemático de una población discreta.
Ejemplo 3.11
Considere seleccionar al azar un estudiante de entre los 15 000 inscritos en el semestre actual en la Universidad Mega. Sea X el número de cursos en los cuales el estudiante seleccionado está inscrito y suponga que X tiene la siguiente función masa de probabilidad.
x
1
2
3
4
5
6
7
p(x)
0.01
0.03
0.13
0.25
0.39
0.17
0.02
Una forma de ver esta situación es pensar en la población como compuesta de 15 000
individuos, cada uno con su propio valor X; la proporción con cada valor de X está dada por
p(x). Un punto de vista alternativo es olvidarse de los estudiantes y pensar en la población
como compuesta de los valores X: Existen algunos 1 en la población, algunos 2, . . . y finalmente algunos 7. La población se compone entonces de los números, 1, 2, . . . , 7 (por lo tanto es discreta) y p(x) da un modelo para la distribución de los valores de población.
■
Una vez que se tiene el modelo de la población, se utilizará para calcular valores de
características de la población (p. ej., la media ) y para hacer inferencias sobre tales características.
Parámetro de una distribución de probabilidad
En el ejemplo 3.9, se tuvo p(0) 0.8 y p(1) 0.2 porque 20% de todos los compradores
seleccionaron una computadora portátil. En otra librería, puede ser el caso que p(0) 0.9
y p(1) 0.1. Más generalmente, la función masa de probabilidad de cualquier variable aleatoria de Bernoulli puede ser expresada en la forma p(1) y p(0) 1 , donde
0 1. Como la función masa de probabilidad depende del valor particular de , con
frecuencia se escribe p(x; ) en lugar de sólo p(x):
p(x; )
{
1
0
si x 0
si x 1
de lo contrario
(3.1)
Entonces cada opción de en la expresión (3.1) da una función de masa de probabilidad diferente.
DEFINICIÓN
Supóngase que p(x) depende de la cantidad que puede ser asignada a cualesquiera de
varios valores posibles y cada valor determina una distribución de probabilidad diferente. Tal cantidad se llama parámetro de distribución. El conjunto de todas las distribuciones de probabilidad con diferentes valores del parámetro se llama familia de
distribuciones de probabilidad.
La cantidad en la expresión (3.1) es un parámetro. Cada número diferente entre
0 y 1 determina un miembro diferente de una familia de distribuciones; dos de esos miembros son
p(x; 0.6)
{
0.4
si x 0
0.6
si x 1
0
y
de lo contrario
0.5
si x 0
p(x; 0.5) 0.5
si x 1
{
0
de lo contrario
Toda distribución de probabilidad de una variable aleatoria de Bernoulli tiene la forma de la
expresión (3.1), por lo tanto se llama familia de distribuciones de Bernoulli.
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 95
95
3.2 Distribuciones de probabilidad para variables aleatorias discretas
Ejemplo 3.12
A partir de un tiempo fijo, se observa el sexo de cada niño recién nacido en un hospital hasta que nace un varón (B). Sea p P(B) y suponga que los nacimientos sucesivos son independientes y defina la variable aleatoria X como X número de nacimientos observados.
Entonces
p(1) P(X 1) P(B) p
p(2) P(X 2) P(GB) P(G) P(B) (1 p)p
y
p(3) P(X 3) P(GGB) P(G) P(G) P(B) (1 p)2p
Continuando de esta manera, emerge una fórmula general:
p(x)
{
(1 p)x1p
0
x 1, 2, 3, . . .
de lo contrario
(3.2)
La cantidad p en la expresión (3.2) representa un número entre 0 y 1 y es un parámetro de
la distribución de probabilidad. En el ejemplo de sexo, p 0.51 podría ser apropiada, pero
si se estuviera buscando el primer niño con sangre Rh positivo, entonces se podría tener
p 0.85.
■
Función de distribución acumulativa
Para algún valor fijo x, a menudo se desea calcular la probabilidad de que el valor observado de X será cuando mucho x. Por ejemplo, la función masa de probabilidad en el ejemplo 3.8 fue
p(x)
x0
x1
0.333 x 2
0
de lo contrario
0.500
¨ 0.167
©ª
La probabilidad de que X sea cuando mucho de 1 es entonces
P(X 1) p(0) p(1) 0.500 0.167 0.667
En este ejemplo, X 1.5 si y sólo si X 1, por lo tanto
P(X 1.5) P(X 1) 0.667
Asimismo,
P(X 0) P(X 0) 0.5,
P(X 0.75) 0.5
y de hecho con cualquier x que satisfaga 0 x 1, P(X x) 0.5. El valor X más
grande posible es 2, por lo tanto
P(X 2) 1,
P(X 3.7) 1,
P(X 20.5) 1
y así sucesivamente. Obsérvese que P(X 1) P(X 1) puesto que la segunda parte
de la desigualdad incluye la probabilidad del valor 1 de X, en tanto que la primera no.
Más generalmente, cuando X es discreta y x es un valor posible de la variable, P(X x)
P(X x).
DEFINICIÓN
La función de distribución acumulativa (fda) F(x) de una variable aleatoria discreta X con función masa de probabilidad p(x) se define para cada número x como
F(x) P(X x)
p(y)
(3.3)
y: yx
Para cualquier número x, F(x) es la probabilidad de que el valor observado de X será
cuando mucho x.
www.FreeLibros.me
c3_p086-129.qxd
96
3/12/08
CAPÍTULO 3
4:01 AM
Page 96
Variables aleatorias discretas y distribuciones de probabilidad
Ejemplo 3.13
La función masa de probabilidad de Y (el número de determinaciones de tipo de sangre) en
el ejemplo 3.10 fue
y
1
2
3
4
p(y)
0.4
0.3
0.2
0.1
Primero se determina F(y) para cada uno de los valores posibles del conjunto (1, 2, 3, 4):
F(1) P(Y 1) P(Y 1) p(1) 0.4
F(2) P(Y 2) P(Y 1 o 2) p(1) p(2) 0.7
F(3) P(Y 3) P(Y 1 o 2 o 3) p(1) p(2) p(3) 0.9
F(4) P(Y 4) P(Y 1 o 2 o 3 o 4) 1
Ahora con cualquier otro número y, F(y) será igual al valor de F con el valor más próximo
posible de Y a la izquierda de y. Por ejemplo, F(2,7) P(Y 2.7) P(Y 2) 0.7 y
F(3.999) F(3) 0.9. La función de distribución acumulativa es por lo tanto
¨
F(y)
«
©
ǻ
si y 1
0.4 si 1 y 2
0.7 si 2 y 3
0.9 si 3 y 4
1 si 4 y
0
En la figura 3.5 se muestra una gráfica de F(y).
F(y)
1
1
Figura 3.5
2
3
4
y
Gráfica de la función de distribución acumulativa del ejemplo 3.13.
■
Para una variable aleatoria discreta X, la gráfica de F(x) mostrará un salto con cada
valor posible de X y será plana entre los valores posibles. Tal gráfica se conoce como función escalonada.
Ejemplo 3.14
En el ejemplo 3.12, cualquier entero fue un valor posible de X y la comprobación fue
p(x)
{
(1 p)x1p
0
x 1, 2, 3, . . .
de lo contrario
Con cualquier entero positivo x,
F(x)
x
x1
y1
y0
p(y) (1 p)y1 p p (1 p)y
yx
(3.4)
Para evaluar esta suma, se utiliza el hecho de que la suma parcial de una serie geométrica es
k
ay
y0
1 a k1
1a
Utilizando esta ecuación (3.4), con a 1 p y k x 1, se obtiene
F(x) p
1 (1 p)x
1 (1 p) x
1 (1 p)
www.FreeLibros.me
un entero positivo x
c3_p086-129.qxd
3/12/08
4:01 AM
Page 97
97
3.2 Distribuciones de probabilidad para variables aleatorias discretas
Como F es una constante entre enteros positivos
0
F(x) 1 (1 p)[x]
{
x1
x 1
(3.5)
donde [x] es el entero más grande x (p. ej., [2.7] 2). Así pues, si p 0.51 como el ejemplo de los nacimientos, entonces la probabilidad de tener que examinar cuando mucho cinco
nacimientos para ver el primer niño es F(5) 1 (0.49)5 1 0.0282 0.9718, mientras que F(10) 1.0000. Esta función de distribución acumulativa se ilustra en la figura 3.6.
F(x)
1
0
1
Figura 3.6
2
3
4
5
50
51
x
Gráfica de F(x) del ejemplo 3.14.
■
En los ejemplos presentados hasta ahora, la función de distribución acumulativa se derivó de la función masa de probabilidad. Este proceso puede ser invertido para obtener la
función masa de probabilidad de la función de distribución acumulativa siempre que
ésta esté disponible. Por ejemplo, considérese otra vez la variable aleatoria del ejemplo 3.7
(el número de bombas en servicio en una gasolinería); los valores posibles de X son 0,
1, . . . , 6. Entonces
p(3) P(X 3)
[p(0) p(1) p(2) p(3)] [p(0) p(1) p(2)]
P(X 3) P(X 2)
F(3) F(2)
Más generalmente, la probabilidad de que X quede dentro de un intervalo especificado es
fácil de obtener a partir de la función de distribución acumulativa. Por ejemplo,
P(2 X 4) p(2) p(3) p(4)
[p(0) . . . p(4)] [p(0) p(1)]
P(X 4) P(X 1)
F(4) F(1)
Obsérvese que P(2 X 4) F(4) F(2). Esto es porque el valor 2 de X está incluido
en 2 X 4, así que no se desea restar su probabilidad. Sin embargo, P(2 X 4)
F(4) F(2) porque X 2 no está incluido en el intervalo 2 X 4.
PROPOSICIÓN
Para dos números cualesquiera a y b con a b.
P(a X b) F(b) F(a )
donde “a” representa el valor posible de X más grande que es estrictamente menor
que a. En particular, si los únicos valores posibles son enteros y si a y b son enteros,
entonces
P(a X b) P(X a o a 1 o . . . o b)
F(b) F(a 1)
Con a b se obtiene P(X a) F(a) F(a 1) en este caso.
www.FreeLibros.me
c3_p086-129.qxd
98
3/12/08
4:01 AM
Page 98
Variables aleatorias discretas y distribuciones de probabilidad
CAPÍTULO 3
La razón para restar F(a) en lugar de F(a) es que se desea incluir P(X a);
F(b) F(a) da P(a X b). Esta proposición se utilizará extensamente cuando se calculen las probabilidades binomial y de Poisson en las secciones 3.4 y 3.6.
Sea X el número de días de ausencia por enfermedad tomados por un empleado seleccionado al azar de una gran compañía durante un año particular. Si el número máximo de días
de ausencia por enfermedad permisibles al año es de 14, los valores posibles de X son
0, 1, . . . , 14. Con F(0) 0.58, F(1) 0.72, F(2) 0.76, F(3) 0.81, F(4) 0.88 y
F(5) 0.94,
Ejemplo 3.15
P(2 X 5) P(X 2, 3, 4 o 5) F(5) F(1) 0.22
y
P(X 3) F(3) F(2) 0.05
EJERCICIOS
Sección 3.2 (11-28)
11. En un taller de servicio automotriz especializado en afinaciones se sabe que 45% de todas las afinaciones se realizan en
automóviles de cuatro cilindros, 40% en automóviles de seis
cilindros y 15% en automóviles de ocho cilindros. Sea X el
número de cilindros en el siguiente carro que va a ser afinado.
a. ¿Cuál es la función masa de probabilidad de X?
b. Trace tanto una gráfica lineal como un histograma de
probabilidad de la función masa de probabilidad del
inciso a).
c. ¿Cuál es la probabilidad de que el siguiente carro afinado
sea de por lo menos seis cilindros? ¿Más de seis cilindros?
12. Las líneas aéreas en ocasiones venden boletos de más. Suponga que para un avión de 50 asientos, 55 pasajeros tienen
boletos. Defina la variable aleatoria Y como el número de
pasajeros con boletos que en realidad aparecen para el vuelo. La función masa de probabilidad de Y aparece en la tabla
adjunta.
y
45
p( y)
46
47
■
48
49
50
51
52
53
54
55
0.05 0.10 0.12 0.14 0.25 0.17 0.06 0.05 0.03 0.02 0.01
a. ¿Cuál es la probabilidad de que el vuelo acomodará a todos los pasajeros con boleto que aparecieron?
b. ¿Cuál es la probabilidad de que no todos los pasajeros
con boleto que aparecieron puedan ser acomodados?
c. Si usted es la primera persona en la lista de espera (lo que
significa que será el primero en abordar el avión si hay
boletos disponibles después de que todos los pasajeros
con boleto hayan sido acomodados), ¿cuál es la probabilidad de que podrá tomar el vuelo? ¿Cuál es esta probabilidad si usted es la tercera persona en la lista de espera?
13. Una empresa de ventas en línea dispone de seis líneas telefónicas. Sea X el número de líneas en uso en un tiempo especificado. Suponga que la función masa de probabilidad de X
es la que se da en la tabla adjunta.
x
0
1
2
3
4
5
6
p(x)
0.10
0.15
0.20
0.25
0.20
0.06
0.04
Calcule la probabilidad de cada uno de los siguientes eventos.
a. {cuando mucho tres líneas están en uso}
b. {menos de tres líneas están en uso}
c. {por lo menos tres líneas están en uso}
d. {entre dos y cinco líneas, inclusive, están en uso}
e. {entre dos y cuatro líneas, inclusive, no están en uso
f. {por lo menos cuatro líneas no están en uso}
14. El departamento de planeación de un condado requiere que
un contratista presente uno, dos, tres, cuatro o cinco formas
(según la naturaleza del proyecto) para solicitar un permiso
de construcción. Sea Y número de formas requeridas del
siguiente solicitante. Se sabe que la probabilidad de que se
requieran y formas es proporcional a y, es decir, p(y) ky
con y 1, . . . , 5.
a. ¿Cuál es el valor de k? [Sugerencia: 5y1 p(y) 1.]
b. ¿Cuál es la probabilidad de que cuando mucho se requieran tres formas?
c. ¿Cuál es la probabilidad de que se requieran entre dos y
cuatro formas (inclusive)?
d. ¿Podría ser p(y) y2/50 con y 1, . . . , 5 la función
masa de probabilidad de Y?
15. Muchos fabricantes cuentan con programas de control de calidad que incluyen la inspección de los materiales recibidos
en busca de defectos. Suponga que un fabricante de computadoras recibe tarjetas madre en lotes de cinco. Se seleccionan dos tarjetas de cada lote para inspeccionarlas. Se pueden
representar los posibles resultados del proceso de selección
por pares. Por ejemplo, el par (1, 2) representa la selección de las tarjetas 1 y 2 para inspección.
a. Mencione los diez posibles resultados diferentes.
b. Suponga que las tarjetas 1 y 2 son las únicas tarjetas defectuosas en un lote de cinco. Dos tarjetas tienen que ser
seleccionadas al azar. Defina X como el número de tarjetas defectuosas observadas entre las inspeccionadas. Encuentre la distribución de probabilidad de X.
c. Sea F(x) la función de distribución acumulativa de X. Primero determine F(0) P(X 0), F(1) y F(2); luego obtenga F(x) para todas las demás x.
16. Algunas partes de California son particularmente propensas
a los temblores. Suponga que en un área metropolitana, 30%
de todos los propietarios de casa están asegurados contra daños provocados por terremotos. Se seleccionan al azar cuatro
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 99
3.2 Distribuciones de probabilidad para variables aleatorias discretas
17.
18.
19.
20.
21.
propietarios de casa, sea X el número entre los cuatro que están asegurados contra terremotos.
a. Encuentre la distribución de probabilidad de X [Sugerencia: Sea S un propietario de casa asegurado y F uno no
asegurado. Entonces un posible resultado es SFSS, con
probabilidad (0.3)(0.7)(0.3)(0.3) y el valor 3 de X asociado. Existen otros 15 resultados.]
b. Trace el histograma de probabilidad correspondiente.
c. ¿Cuál es el valor más probable de X?
d. ¿Cuál es la probabilidad de que por lo menos dos de los
cuatro seleccionados estén asegurados contra terremotos?
El voltaje de una batería nueva puede ser aceptable (A) o
inaceptable (U). Una linterna requiere dos baterías, así que
las baterías serán independientemente seleccionadas y probadas hasta encontrar dos aceptables. Suponga que 90% de
todas las baterías tienen voltajes aceptables. Sea Y el número de baterías que deben ser probadas.
a. ¿Cuál es p(2), es decir P(Y 2)?
b. ¿Cuál es p(3)? [Sugerencia: Existen dos resultados diferentes que producen Y 3.]
c. Para tener Y 5, ¿qué debe ser cierto de la quinta batería seleccionada? Mencione los cuatro resultados con los
cuales Y 5 y luego determine p(5).
d. Use el patrón de sus respuestas en los incisos a)–c)
para obtener una fórmula general para p(y).
Dos dados de seis caras son lanzados al aire en forma independiente. Sea M el máximo de los dos lanzamientos (por
lo tanto M(1, 5) 5, M(3, 3) 3, etcétera).
a. ¿Cuál es la función masa de probabilidad de M? [Sugerencia: Primero determine p(1), luego p(2), y así sucesivamente.]
b. Determine la función de distribución acumulativa de M y
dibújela.
Una biblioteca se suscribe a dos revistas de noticias semanales, cada una de las cuales se supone que llega en el correo
de los miércoles. En realidad, cada una puede llegar el miércoles, jueves, viernes o sábado. Suponga que las dos llegan
independientemente una de otra y para cada una P(mié)
0.3, P(jue) 0.4, P(vie) 0.2 y P(sáb) 0.1. Sea Y el
número de días después del miércoles que pasan para que ambas revistas lleguen (por lo tanto los posibles valores de Y son
0, 1, 2 o 3). Calcule la función masa de probabilidad de
Y [Sugerencia: Hay 16 posibles resultados: Y(M, M) 0,
Y(V, J) 2, y así sucesivamente.]
Tres parejas y dos individuos solteros han sido invitados a un
seminario de inversión y han aceptado asistir. Suponga que
la probabilidad de que cualquier pareja o individuo particular
llegue tarde es de 0.4 (una pareja viajará en el mismo vehículo, así que ambos llegarán a tiempo o bien ambos llegarán tarde). Suponga que diferentes parejas e individuos llegan
puntuales o tarde independientemente unos de otros. Sea X
el número de personas que llegan tarde al seminario.
a. Determine la función masa de probabilidad de X. [Sugerencia: Designe las tres parejas #1, #2 y #3 y los dos individuos #4 y #5.]
b. Obtenga la función de distribución acumulativa de X y
úsela para calcular P(2 X 6).
Suponga que lee los números de este año del New York Times y
que anota cada número que aparece en un artículo de noticias:
99
el ingreso de un oficial ejecutivo en jefe, el número de cajas de
vino producidas por una compañía vinícola, la contribución caritativa total de un político durante el año fiscal previo, la edad
de una celebridad y así sucesivamente. Ahora enfóquese en el
primer dígito de cada número, el cual podría ser 1, 2, . . . , 8
o 9. Su primer pensamiento podría ser que el primer dígito X
de un número seleccionado al azar sería igualmente probable
que fuera una de las nueve posibilidades (una distribución
uniforme discreta). Sin embargo, mucha evidencia empírica así
como también algunos argumentos teóricos, sugieren una distribución de probabilidad alternativa llamada ley de Benford:
p(x) P(el primer dígito es x) log10 (1 1/x) x 1, 2, . . . , 9
a. Calcule las probabilidades individuales y compare con la
distribución uniforme discreta correspondiente.
b. Obtenga la función de distribución acumulativa de X.
c. Utilizando la función de distribución acumulativa, ¿cuál
es la probabilidad de que el primer dígito sea cuando mucho 3? ¿Por lo menos 5?
[Nota: La ley de Benford es la base de algunos procedimientos de auditoría utilizados para detectar fraudes en reportes financieros, por ejemplo, por el Servicio de Ingresos Internos.]
22. Remítase al ejercicio 13 y calcule y trace la gráfica de la función de distribución acumulativa F(x). Luego utilícela para
calcular las probabilidades de los eventos dados en los incisos a)–d) de dicho problema.
23. Una organización de protección al consumidor que habitualmente evalúa automóviles nuevos reporta el número de
defectos importantes encontrados en cada carro examinado.
Sea X el número de defectos importantes en un carro seleccionado al azar de cierto tipo. La función de distribución
acumulativa de X es la siguiente:
¨ 0
«
0.06 0 x 1
0.19
«
0.39
F(x)
©« 0.67
«
«
ª
x0
1x2
2x3
3x4
0.92 4 x 5
0.97 5 x 6
1
6x
Calcule las siguientes probabilidades directamente con la
función de probabilidad acumulativa:
a. p(2), es decir, P(X 2)
b. P(X 3)
c. P(2 X 5)
d. P(2 X 5)
24. Una compañía de seguros ofrece a sus asegurados varias opciones diferentes de pago de primas. Para un asegurado seleccionado al azar, sea X el número de meses entre pagos sucesivos.
La función de distribución acumulativa es la siguiente:
www.FreeLibros.me
¨ 0
F(x)
«©
«
ª
x1
0.30
1x3
0.40
3x4
0.45
4x6
0.60
6 x 12
1
12 x
c3_p086-129.qxd
100
3/12/08
CAPÍTULO 3
4:01 AM
Page 100
Variables aleatorias discretas y distribuciones de probabilidad
a. Sea X el número de veces que Alvie visita a un amigo.
Obtenga la función masa de probabilidad de X.
b. Sea Y el número de segmentos de línea recta que Alvie
recorre (incluidos los que conducen a o que parten de 0).
¿Cuál es la función masa de probabilidad de Y?
c. Suponga que sus amigas viven en A y C y sus amigos en
B y D. Si Z el número de visitas a amigas, ¿cuál es la
función masa de probabilidad de Z?
a. ¿Cuál es la función de masa de probabilidad de X?
b. Con sólo la función de distribución acumulativa, calcule
P(3 X 6) y P(4 X).
25. En el ejemplo 3.12, sea Y el número de niñas nacidas antes
de que termine el experimento. Con p P(B) y 1 – p P(G),
¿cuál es la función masa de probabilidad de Y? [Sugerencia:
Primero ponga en lista los posibles valores de Y, inicie con
el más pequeño y continúe hasta que encuentre una fórmula general.]
B
27. Después de que todos los estudiantes salieron del salón de
clases, un profesor de estadística nota que cuatro ejemplares
del texto se quedaron debajo de los escritorios. Al principio
de la siguiente clase, el profesor distribuye los cuatro libros
al azar a cada uno de los cuatro estudiantes (1, 2, 3 y 4) que
dicen haber dejado los libros. Un posible resultado es que 1
reciba el libro de 2, que 2 reciba el libro de 4 y que 3 reciba
su propio libro y que 4 reciba el libro de 1. Este resultado
puede ser abreviado como (2, 4, 3, 1).
a. Mencione los otros 23 posibles resultados.
b. Si X es el número de estudiantes que reciben su propio libro, determine la función masa de probabilidad de X.
C
28. Demuestre que la función de distribución acumulativa de
F(x) es una función no decreciente; es decir, x1 x2 implica que F(x1) F(x2). ¿En qué condición será F(x1)
F(x2)?
26. Alvie Singer vive en 0 en el diagrama adjunto y sus cuatro
amigos viven en A, B, C y D. Un día Alvie decide visitarlos,
así que lanza al aire una moneda imparcial dos veces para
decidir a cuál de los cuatro visitar. Una vez que está en la
casa de uno de sus amigos, o regresará a su casa o bien proseguirá a una de las dos casas adyacentes (tales como 0, A o
C, cuando está en B) con cada una de las tres posibilidades
1
cuya probabilidad es 3 . De este modo, Alvie continúa visitando a sus amigos hasta que regresa a casa.
A
0
D
3.3 Valores esperados
Considérese una universidad que tiene 15 000 estudiantes y sea X el número de cursos en
los cuales está inscrito un estudiante seleccionado al azar. La función de masa de probabilidad de X se determina como sigue. Como p(1) 0.01, se sabe que (0.01) (15000) 150
de los estudiantes están inscritos en un curso y asimismo con los demás valores de x.
x
1
2
3
4
5
6
7
p (x)
0.01
0.03
0.13
0.25
0.39
0.17
0.02
Número de inscrito
150
450
1950
3750
5850
2550
300
(3.6)
El número promedio de cursos por estudiante o el valor promedio de X en la población
se obtiene al calcular el número total de cursos tomados por todos los estudiantes y al dividir
entre el número total de estudiantes. Como cada uno de los 150 estudiantes está tomando un
curso, estos 150 contribuyen con 150 cursos al total. Asimismo, 450 estudiantes contribuyen
con 2(450) cursos, y así sucesivamente. El valor promedio de la población de X es entonces
1(150) 2(450) 3(1950) . . . 7(300)
4.57
(3.7)
15 000
Como 150/15 000 0.01 p(1), 450/15000 0.03 p(2), y así sucesivamente, una expresión alterna para (3.7) es
1 p(1) 2 p(2) . . . 7 p(7)
(3.8)
La expresión (3.8) muestra que para calcular el valor promedio de la población de X,
sólo se necesitan los valores posibles de X junto con las probabilidades (proporciones). En
particular, el tamaño de la población no viene al caso en tanto la función masa de probabilidad esté dada por (3.6). El valor promedio o medio de X es entonces el promedio ponderado de los posibles valores 1, . . . , 7, donde las ponderaciones son las probabilidades de
esos valores.
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 101
3.3 Valores esperados
101
Valor esperado de X
DEFINICIÓN
Sea X una variable aleatoria discreta con un conjunto de valores posibles D y una función masa de probabilidad p(x). El valor esperado o valor medio de X, denotado por
E(X) o X, es
E(X) X x p(x)
xD
Cuando está claro a que X se refiere el valor esperado, a menudo se utiliza en lugar
de X.
Ejemplo 3.16
Para la función masa de probabilidad en (3.6),
1 p(1) 2 p(2) . . . 7 p(7)
(1)(0.01) 2(0.03) . . . (7)(0.02)
0.01 0.06 0.39 1.00 1.95 1.02 0.14 4.57
Si se piensa en la población como compuesta de los valores 1, 2, . . . , 7, de X, entonces
4.57 es la media de la población. En lo que sigue, a menudo se hará referencia a
como la media de la población en lugar de la media de X en la población.
■
En el ejemplo 3.16, el valor esperado fue 4.57, el cual no es un valor posible de X.
La palabra esperado deberá interpretarse con precaución porque no se esperaría ver un valor de X de 4.57 cuando se selecciona un solo estudiante.
Ejemplo 3.17
Exactamente después de nacer, cada niño recién nacido es evaluado en una escala llamada
escala de Apgar. Las evaluaciones posibles son 0, 1, . . . , 10, con la evaluación del niño determinada por color, tono muscular, esfuerzo para respirar, ritmo cardiaco e irritabilidad refleja (la mejor evaluación posible es 10). Sea X la evaluación Apgar de un niño seleccionado
al azar nacido en cierto hospital durante el siguiente año y supóngase que la función
masa de probabilidad de X es
x
0
1
2
3
4
5
6
7
8
9
10
p(x)
0.002
0.001
0.002
0.005
0.02
0.04
0.18
0.37
0.25
0.12
0.01
Entonces el valor medio de X es
E(X) 0(0.002) 1(0.001) 2(0.002)
. . . 8(0.25) 9(0.12) 10(0.01)
7.15
De nuevo, no es un valor posible de la variable X. Además, como la variable se refiere a
un niño futuro, no existe ninguna población existente concreta a la cual se podría referir .
En cambio, la función masa de probabilidad se considera como un modelo de una población
compuesta de los valores 0, 1, 2, . . . , 10. El valor medio de esta población conceptual es
entonces 7.15.
■
Ejemplo 3.18
Sea X 1 si un componente seleccionado al azar necesita servicio de garantía y 0 si no.
Entonces X es una variable aleatoria de Bernoulli con función masa de probabilidad
¨1p
p(x)
p
ª 0
©
www.FreeLibros.me
x0
x1
x 0, 1
c3_p086-129.qxd
102
3/12/08
CAPÍTULO 3
4:01 AM
Page 102
Variables aleatorias discretas y distribuciones de probabilidad
a partir de la cual E(X) 0 p(0) 1 p(1) 0(1 p) 1( p) p. Es decir, el valor esperado de X es exactamente la probabilidad de que X tome el valor 1. Si se conceptualiza
una población compuesta de ceros en la proporción de 1 p y unos en la proporción de p,
entonces el promedio de la proporción es p.
■
Ejemplo 3.19
La forma general de función de masa de probabilidad de X número de niños nacidos hasta e incluido el primer varón es
p(x)
{
p(1 p)x1
0
x 1, 2, 3, . . .
de lo contrario
De acuerdo con la definición,
x1
x1
E(X) x p(x) xp(1 p)x1 p
D
d
(1 p)x
dp
(3.9)
Si se intercambia el orden de tomar la derivada y la suma, ésta es la de una serie geométrica. Una vez que se calcula la suma, se toma la derivada y el resultado final es E(X) 1/p.
Si p se aproxima a 1, se espera ver que nazca un varón muy pronto, mientras que si p
se aproxima a 0, se esperan muchos nacimientos antes del primer varón. Con p 0.5,
E(X) 2.
■
Existe otra interpretación frecuentemente utilizada de . Considérese la función masa de probabilidad
p(x)
{
(0.5) (0.5)x1
si x 1, 2, 3, . . .
de lo contrario
0
Esta es la función masa de probabilidad de X el número de lanzamientos al aire de una
moneda imparcial necesarios para obtener la primera H (cara) (un caso especial del ejemplo 3.19). Supóngase que se observa un valor x de esta función masa de probabilidad (lanzar al aire una moneda hasta que aparezca una H (cara), luego se observa de modo
independiente otro valor (sígase lanzando al aire la moneda), luego otro y así sucesivamente. Si después de observar un número muy grande de valores x se promedian, el promedio
muestral resultante se aproximará a 2. Es decir, puede ser interpretado como el valor
promedio observado a largo plazo de X cuando el experimento se realiza de manera repetida.
Ejemplo 3.20
X es el número de entrevistas que un estudiante sostiene antes de conseguir un trabajo y tiene la función masa de probabilidad
p(x)
{
k/x2
x 1, 2, 3, . . .
0
de lo contrario
donde k se elige de modo que x1 (k/x2) 1. (En un curso de matemáticas de series infinitas, se demostró que x1 (1/x2) , lo cual implica que tal k existe, pero su valor exacto no interesa.) El valor esperado de X es
E(X) x
x1
1
k
k
2
x
x1 x
(3.10)
La suma del lado derecho de la ecuación (3.10) es la famosa serie armónica de matemáticas y se puede demostrar que tiende a . E(X) no es finita en este caso porque p(x) no
disminuye suficientemente rápido a medida que x se incrementa; los estadísticos dicen que
la distribución de probabilidad de X tiene “una cola gruesa”. Si se selecciona una secuencia
de valores X utilizando esta distribución, el promedio muestral no se establecerá en un número finito sino que tenderá a crecer sin límite.
Los estadísticos utilizan la frase “colas gruesas” en conexión con cualquier distribución con una gran cantidad de probabilidad alejada de (así que las colas gruesas no requieren ). Tales colas gruesas hacen difícil hacer inferencias sobre .
■
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 103
3.3 Valores esperados
103
Valor esperado de una función
A menudo interesará el valor esperado de alguna función h(X) en lugar de X propiamente
dicha.
Ejemplo 3.21
Suponga que una librería adquiere diez ejemplares de un libro a $6.00 cada uno para venderlos a $12.00 en el entendimiento de que al final de un periodo de 3 meses cualquier
ejemplar no vendido puede ser compensado por $2.00. Si X el número de ejemplares vendidos, entonces el ingreso neto h(X) 12X 2(10 X) 60 10X 40.
■
El siguiente ejemplo sugiere una forma fácil de calcular el valor esperado de h(X).
Ejemplo 3.22
Sea X el número de cilindros del motor del siguiente carro que va a ser afinado en cierto
taller. El costo de una afinación está relacionado con X mediante h(X) 20 3X 0.5X2.
Como X es una variable aleatoria, también lo es h(X); denote esta última variable aleatoria
por Y. Las funciones de masa de probabilidad de X y Y son las siguientes:
x
4
6
8
y
40
56
76
p( x)
0.5
0.3
0.2
p(y)
0.5
0.3
0.2
Con D* denotando posibles valores de Y,
E(Y) E[h(X)] y p(y)
(3.11)
D*
(40)(0.5) (56)(0.3) (76)(0.2)
h(4) (0.5) h(6) (0.3) h(8) (0.2)
h(x) p(x)
D
De acuerdo con la ecuación (3.11), no fue necesario determinar la función masa de probabilidad de Y para obtener E(Y); en su lugar, el valor esperado deseado es un promedio ponderado de los posibles valores de h(x) (y no de x).
■
PROPOSICIÓN
Si la variable aleatoria X tiene un conjunto de posibles valores D y una función
masa de probabilidad p(x), entonces el valor esperado de cualquier función h(X), denotada por E[h(X)] o h(X), se calcula con
E[h(X)] h(x) p(x)
D
Esto es, E[h(X)] se calcula del mismo modo que E(X), excepto que h(x) sustituye a x.
Ejemplo 3.23
Una tienda de computadoras adquirió tres computadoras de un tipo a $500 cada una. Las
venderá a $1000 cada una. El fabricante se comprometió a readquirir cualquier computadora que no se haya vendido después de un periodo especificado a $200 cada una. Sea X el número de computadoras vendidas y suponga que p(0) 0.1, p(1) 0.2, p(2) 0.3 y
p(3) 0.4. Con h(X) denotando la utilidad asociada con la venta de X unidades, la información dada implica que h(X) ingreso costo 1000X 200(3 X) 1500 800X 900.
La utilidad esperada es entonces
E[h(X)] h(0) p(0) h(1) p(1) h(2) p(2) h(3) p(3)
( 900)(0.1) ( 100)(0.2) (700)(0.3) (1500)(0.4)
$700
www.FreeLibros.me
■
c3_p086-129.qxd
104
3/12/08
CAPÍTULO 3
4:01 AM
Page 104
Variables aleatorias discretas y distribuciones de probabilidad
Reglas de valor esperado
La función de interés h(X) con bastante frecuencia es una función lineal aX b. En este
caso, E[h(X)] es fácil de calcular a partir de E(X).
E(aX b) a E(X) b
PROPOSICIÓN
(O, con notación alternativa, aX b X b.)
Parafraseando, el valor esperado de una función lineal es igual a la función lineal evaluada con el valor esperado E(X). Como h(X) en el ejemplo 3.23 es lineal y E(X) 2,
E[h(X)] 800(2) 900 $700, como antes.
Comprobación
E(aX b) (ax b) p(x) a x p(x) b p(x)
D
D
D
aE(X) b
■
Dos casos especiales de proposición producen dos reglas importantes de valor esperado.
1. Con cualquier constante a, E(aX) a E(X) (considérese b 0).
(3.12)
2. Con cualquier constante b, E(X b) E(X) b
(considérese a 1).
La multiplicación de X por una constante cambia la unidad de medición (de dólares a
centavos, donde a 100, pulgadas a centímetros, donde a 2.54, etc.). La regla 1 dice que
el valor esperado en las nuevas unidades es igual al valor esperado en las viejas unidades
multiplicado por el factor de conversión a. Asimismo, si se agrega una constante b a cada
valor posible de X, entonces el valor esperado se desplazará en esa misma cantidad constante.
Varianza de X
El valor esperado de X describe dónde está centrada la distribución de probabilidad. Utilizando la analogía física de colocar una masa puntual p(x) en el valor x sobre un eje unidimensional, si el eje estuviera entonces soportado por un fulcro colocado en , el eje no
tendería a ladearse. Esto se ilustra para dos distribuciones diferentes en la figura 3.7.
p(x)
p(x)
0.5
0.5
1
2
3
(a )
Figura 3.7
5
1
2
3
5
6
7
8
(b )
Dos distribuciones de probabilidad diferentes con 4.
Aunque ambas distribuciones ilustradas en la figura 3.7 tienen el mismo centro , la
distribución de la figura 3.7(b) tiene una mayor dispersión o variabilidad que la de la figura 3.7(a). Se utilizará la varianza de X para evaluar la cantidad de variabilidad en (la distribución de) X, del mismo modo que se utilizó s2 en el capítulo 1 para medir la variabilidad
en una muestra.
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 105
3.3 Valores esperados
DEFINICIÓN
105
Sea p(x) la función masa de probabilidad de X y su valor esperado. En ese caso la
varianza de X, denotada por V(X) o X2 o simplemente 2, es
V(X) (x )2 p(x) E[(X )2]
D
La desviación estándar (DE) de X es
X
2X
La cantidad h(X) (X – )2 es la desviación al cuadrado de X con respecto a su media y 2 es la desviación al cuadrado esperada, es decir, el promedio ponderado de desviaciones al cuadrado, donde las ponderaciones son probabilidades de la distribución. Si la
mayor parte de la distribución de probabilidad está cerca de , entonces 2 será relativamente pequeña. Sin embargo, existen valores x alejados de que tienen una gran p(x), en ese
caso 2 será bastante grande.
Ejemplo 3.24
Si X es el número de cilindros del siguiente carro que va a ser afinado en un taller de servicio, con la función masa de probabilidad dada en el ejemplo 3.22 [p(4) 0.5, p(6) 0.3,
p(8) 0.2, a partir de la cual 5.4], entonces
8
V(X) 2 (x 5.4)2 p(x)
x4
(4 5.4)2(0.5) (6 5.4)2(0.3) (8 5.4)2(0.2) 2.44
La desviación estándar de X es 2
.4
4 1.562.
■
Cuando la función masa de probabilidad p(x) especifica un modelo matemático
para la distribución de los valores de la población, tanto 2 como miden la dispersión de
los valores en la población; 2 es la varianza de la población y es su desviación estándar.
Fórmula abreviada para 2
El número de operaciones aritméticas necesarias para calcular 2 pueden reducirse si se utiliza una fórmula de cálculo alternativa.
PROPOSICIÓN
V(X) 2
x p(x) E(X ) [E(X)]
2
2
2
2
D
Al utilizar esta fórmula, E(X2) se calcula primero sin ninguna sustracción; acto seguido E(X)
se calcula, se eleva al cuadrado y se resta (una vez) de E(X2).
Ejemplo 3.25
La función masa de probabilidad del número de cilindros X del siguiente carro que va a ser
afinado en un taller se dio en el ejemplo 3.24 como p(4) 0.5, p(6) 0.3 y p(8) 0.2,
a partir de las cuales 5.4 y
E(X 2) (42)(0.5) (62)(0.3) (82)(0.2) 31.6
Por lo tanto 2 31.6 (5.4)2 2.44 en el ejemplo 3.24.
www.FreeLibros.me
■
c3_p086-129.qxd
106
3/12/08
CAPÍTULO 3
4:01 AM
Page 106
Variables aleatorias discretas y distribuciones de probabilidad
Comprobación de la fórmula abreviada
Expándase (x )2 en la definición de 2 para obtener x2 2x 2 y luego lleve a
cada uno de los tres términos:
2 x2 p(x) 2 x p(x) 2 p(x)
D
D
D
■
E(X 2) 2 2 E(X 2) 2
Reglas de varianza
La varianza de h(X) es el valor esperado de la diferencia al cuadrado entre h(X) y su valor
esperado:
V[h(X)] h2 (X) {h(x) E[h(X)]}2 p(x)
(3.13)
D
Cuando h(X) aX b, una función lineal
h(x) E[h(X)] ax b (a b) a(x )
Sustituyendo esto en la ecuación (3.13) se obtiene una relación simple entre V[h(X)] y V(X):
VsaX 1 bd 5 s2aX1b 5 a 2 ? s2X and saX1b 5 |a| ? sx
PROPOSICIÓN
En particular,
saX 5 |a| ? sX,
sX1b 5 sX
(3.14)
El valor absoluto es necesario porque a podría ser negativa, no obstante una desviación estándar no puede serlo. Casi siempre la multiplicación por a corresponde a un cambio de la
unidad de medición (p. ej., kg a lb o dólares a euros). De acuerdo con la primera relación
en (3.14), la desviación estándar en la nueva unidad es la desviación estándar original multiplicada por el factor de conversión. La segunda relación dice que la adición o sustracción
de una constante no impacta la variabilidad; simplemente desplaza la distribución a la derecha o izquierda.
Ejemplo 3.26
En el problema de ventas de computadoras del ejemplo 3.23, E(X) 2 y
E(X 2) (0)2(0.1) (1)2(0.2) (2)2(0.3) (3)2(0.4) 5
así que V(X) 5 (2)2 1. La función de utilidad h(X) 800X 900 tiene entonces la
varianza (800)2 · V(X) (640 000)(1) 640 000 y la desviación estándar 800.
■
EJERCICIOS
Sección 3.3 (29-45)
29. La función masa de probabilidad de X el número de defectos importantes en un aparato eléctrico de un tipo seleccionado al azar es
x
0
1
2
3
4
p(x)
0.08
0.15
0.45
0.27
0.05
Calcule lo siguiente:
a. E(X).
b. V(X) directamente a partir de la definición.
c. La desviación estándar de X.
d. V(X) por medio de la fórmula abreviada.
30. Se selecciona al azar un individuo que tiene asegurado su automóvil con una compañía. Sea Y el número de infracciones
de tránsito por las que el individuo fue citado durante los últimos 3 años. La función masa de probabilidad de Y es
y
0
1
2
3
p(y)
0.60
0.25
0.10
0.05
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 107
3.3 Valores esperados
a. Calcule E(Y).
b. Suponga que un individuo con Y infracciones incurre en
un recargo de $100Y2. Calcule la cantidad esperada del
recargo.
31. Remítase al ejercicio 12 y calcule V(Y) y Y. Determine entonces la probabilidad de que Y esté dentro de una desviación estándar de 1 de su valor medio.
32. Un distribuidor de enseres para el hogar vende tres modelos de congeladores verticales de 13.5, 15.9 y 19.1 pies cúbicos de espacio de almacenamiento, respectivamente. Sea
X la cantidad de espacio de almacenamiento adquirido
por el siguiente cliente que compre un congelador. Suponga
que X tiene la función masa de probabilidad
x
13.5
15.9
19.1
p(x)
0.2
0.5
0.3
a. Calcule E(X), E(X2) y V(X).
b. Si el precio de un congelador de X pies cúbicos de capacidad es 25X 8.5, ¿cuál es el precio esperado pagado
por el siguiente cliente que compre un congelador?
c. ¿Cuál es la varianza del precio 25X 8.5 pagado por el
siguiente cliente?
d. Suponga que aunque la capacidad nominal de un congelador X, la real es h(X) X 0.01X2. ¿Cuál es la capacidad real esperada del congelador adquirido por el
siguiente cliente?
33. Sea X una variable aleatoria de Bernoulli con función
masa de probabilidad como en el ejemplo 3.18.
a. Calcule E(X2).
b. Demuestre que V(X) p(1 p).
c. Calcule E(X79).
34. Suponga que el número de plantas de un tipo particular encontradas en una región particular (llamada cuadrante por
ecologistas) en cierta área geográfica es una variable aleatoria X con función masa de probabilidad
p(x)
{
c/x3
x 1, 2, 3, . . .
0
de lo contrario
¿Es E(X) finita? Justifique su respuesta (ésta es otra distribución que los estadísticos llamarían de cola gruesa).
35. Un pequeño mercado ordena ejemplares de cierta revista
para su exhibidor de revistas cada semana. Sea X demanda de la revista, con función masa de probabilidad
x
1
2
3
4
5
6
p(x)
1
15
2
15
3
15
4
15
3
15
2
15
107
5000 y 10 000 dólares con probabilidades de 0.8, 0.1, 0.08,
y 0.02, respectivamente. Una compañía particular ofrece una
póliza con deducible de $500. Si la compañía desea que su
utilidad esperada sea de $100, ¿qué cantidad de prima deberá cobrar?
37. Los n candidatos para un trabajo fueron clasificados como
1, 2, 3, . . . , n. Sea X el rango de un candidato seleccionado al azar, de modo que X tenga la función masa de probabilidad
p(x)
{
1/n
x 1, 2, 3, . . . , n
0
de lo contrario
(ésta se llama distribución uniforme discreta). Calcule E(X)
y V(X) por medio de la fórmula abreviada. [Sugerencia: La
suma de los primeros n enteros positivos es n(n 1)/2,
mientras que la suma de sus cuadrados es n(n 1)(2n 1) /6.]
38. Sea X el resultado cuando un dado imparcial es lanzado
una vez. Si antes de lanzar el dado le ofrecen o (1/3.5) dólares o h(X) 1/X dólares, ¿aceptaría la suma garantizada o
jugaría? [Nota: Generalmente no es cierto que 1(E/X)
E(1/X).]
39. Una compañía de productos químicos en la actualidad tiene
en existencia 100 lb de un producto químico, el cual se vende a sus clientes en lotes de 5 lb. Sea X el número de lotes solicitados por un cliente seleccionado al azar y suponga
que X tiene la función masa de probabilidad
x
1
2
3
4
p(x)
0.2
0.4
0.3
0.1
Calcule E(X) y V(X). Calcule enseguida el número esperado
de libras que quedan una vez que se envía el pedido del siguiente cliente y la varianza del número de libras sobrantes.
[Sugerencia: El número de libras que quedan es una función
lineal de X.]
40. a. Trace una gráfica lineal de la función masa de probabilidad de X en el ejercicio 35. Enseguida determine la
función masa de probabilidad de X y trace su gráfica lineal. Con base en estas dos figuras, ¿qué se puede decir
sobre V(X) y V(X)?
b. Use la proposición que implica V(aX b) para establecer una relación general entre V(X) y V(X).
41. Use la definición en la expresión (3.13) para comprobar que
V(aX b) a2 X2. [Sugerencia: Con h(X) aX b,
E[h(X)] a b, donde E(X).]
42. Suponga E(X) 5 y E[X(X 1)] 27.5. ¿Cuál es
a. E(X2)? [Sugerencia: E[X(X 1)] E(X2 X] E(X2)
E(X)]?
b. V(X)?
c. La relación general entre las cantidades E(X), E[X(X) 1)]
y V(X)?
Suponga que el propietario de la tienda paga $1.00 por cada
ejemplar de la revista y el precio para los consumidores es
de $2.00. Si las revistas que se quedan al final de la semana
no tienen valor de recuperación, ¿es mejor ordenar tres o
cuatro ejemplares de la revista? [Sugerencia: Tanto para tres
o cuatro ejemplares ordenados, exprese un ingreso neto
como una función de la demanda X y luego calcule el ingreso esperado.]
43. Escriba una regla general para E(X c), donde c es una
constante. ¿Qué sucede cuando hace c , el valor esperado de X?
36. Sea X el daño incurrido (en dólares) en un tipo de accidente
durante un año dado. Valores posibles de X son 0, 1000,
44. Un resultado llamado desigualdad de Chebyshev establece
que para cualquier distribución de probabilidad de una
www.FreeLibros.me
c3_p086-129.qxd
108
3/12/08
CAPÍTULO 3
4:01 AM
Page 108
Variables aleatorias discretas y distribuciones de probabilidad
variable aleatoria X y cualquier número k que por lo menos
sea 1, P(°X ° k) 1/k2. En palabras, la posibilidad
de que el valor de X quede por lo menos a k desviaciones estándar de su media es cuando mucho 1/k2.
a. ¿Cuál es el valor del límite superior con k 2?, ¿k 3?,
¿k 4?, ¿k 5?, ¿k 10?
b. Calcule y para la distribución del ejercicio 13. Evalúe enseguida P(|X | * k) con los valores de k dados
en el inciso a). ¿Qué sugiere esto sobre el límite superior
con respecto a la probabilidad correspondiente?
c. Que X tenga los valores posibles 1, 0 y 1, con las proba1 8
1
bilidades 18 , 9 y 18 , respectivamente. ¿Cuál es P(°X °
3) y cómo se compara con el límite correspondiente?
d. Dé una distribución con la cual P(°X ° 5) 0.04.
45. Si a X b, demuestre que a E(X) b.
3.4 Distribución de probabilidad binomial
Existen muchos experimentos que se ajustan exacta o aproximadamente a la siguiente lista
de requerimientos:
1. El experimento consta de una secuencia de n experimentos más pequeños llamados ensayos, donde n se fija antes del experimento.
2. Cada ensayo puede dar por resultado uno de los mismos dos resultados posibles (ensayos dicotómicos), los cuales se denotan como éxito (E ) y falla (F).
3. Los ensayos son independientes, de modo que el resultado en cualquier ensayo particular no influye en el resultado de cualquier otro ensayo.
4. La probabilidad de éxito es constante de un ensayo a otro; esta probabilidad se denota
por p.
DEFINICIÓN
Ejemplo 3.27
Un experimento para el que se satisfacen las condiciones 1–4 se llama experimento
binomial.
La misma moneda se lanza al aire sucesiva e independientemente n veces. De manera arbitraria se utiliza E para denotar el resultado H (caras) y F para denotar el resultado T (cruces). Entonces este experimento satisface las condiciones 1–4. El lanzamiento al aire de una
tachuela n veces, con E punta hacia arriba y F punta hacia abajo), también da por
resultado un experimento binomial.
■
Muchos experimentos implican una secuencia de ensayos independientes para los
cuales existen más de dos resultados posibles en cualquier ensayo. Entonces, un experimento binomial puede crearse dividiendo los posibles resultados en dos grupos.
Ejemplo 3.28
El color de las semillas de chícharo lo determina un solo lugar geométrico genético. Si los
dos alelos en este lugar geométrico son AA o Aa (el genotipo), entonces el chícharo será
amarillo (el fenotipo) y si el alelo es aa, el chícharo será verde. Suponga que aparean 20 semillas Aa y se cruzan las dos semillas en cada uno de los diez pares para obtener diez nuevos genotipos. Designe a cada nuevo genotipo como éxito (E ) si es aa y falla (F ) si es lo
contrario. Entonces con esta identificación de S y F, el experimento es binomial con n 10
y p P (genotipo aa). Si es igualmente probable que cada miembro del par contribuya con
1 1
1
a o A, entonces p P(a) P(a) ( 2 )( 2 ) 4 .
■
Ejemplo 3.29
Suponga que una ciudad tiene 50 restaurantes autorizados, de los cuales 15 han cometido en
la actualidad una seria violación del código sanitario y los otros 35 no han cometido violaciones serias. Hay cinco inspectores, cada uno de los cuales inspeccionará un restaurante
durante la semana entrante. El nombre de cada restaurante se anota en un pedacito de papel
diferente y a continuación se mezclan perfectamente, cada inspector a su vez saca uno de
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 109
3.4 Distribución de probabilidad binomial
109
los papelitos sin reemplazarlos. Anótese el ensayo i-ésimo como éxito si el restaurante i-ésimo seleccionado (i 1, . . . , 5) no ha cometido violaciones serias. Entonces
■
P(E en el primer ensayo)
35
0.70
50
y
P(E en el segundo ensayo) P(EE ) P(FE )
P(segundo E°primer E) P(primer E)
P(segundo E°primer F) P(primer F)
34 35
35 15
35 34
15
35
0.70
49 50
49 50
50 49
49
50
Asimismo, se puede demostrar que P(E en el ensayo i-ésimo) 0.70 con i 3, 4, 5. Sin
embargo,
31
P(E en el quinto ensayo°EEEE )
0.67
46
puesto que
P(E en el quinto ensayo°FFFF )
35
0.76
46
El experimento no es binomial porque los ensayos no son independientes. En general,
si se muestrea sin reemplazo, el experimento no producirá ensayos independientes. Si cada
papelito hubiera sido reemplazado después de ser sacado, entonces los ensayos habrían
sido independientes, pero esto podría haber dado por resultado que el mismo restaurante
fuera inspeccionado por más de un inspector.
■
Ejemplo 3.30
Un estado tiene 500 000 conductores con licencia, de los cuales 400 000 están asegurados.
Se selecciona una muestra de 10 conductores sin reemplazo. El ensayo i-ésimo se denota S
si el conductor i-ésimo seleccionado está asegurado. Aunque está situación parecería idéntica a la del ejemplo 3.29, la diferencia importante es que el tamaño de la población muestreada es muy grande con respecto al tamaño de la muestra. En este caso
399 999
P(E en 2°E en 1)
0.80000
499 999
y
P(E en 10°E en los primeros 9)
399 991
0.799996 0.80000
499 991
Estos cálculos sugieren que aunque los ensayos no son exactamente independientes, las probabilidades condicionales difieren tan poco una de otra que en la práctica los ensayos se
consideran independientes con la constante P(E ) 0.8. Por lo tanto, para una muy buena
aproximación, el experimento es binomial con n 10 y p 0.8.
■
Se utilizará la siguiente regla empírica para decidir si un experimento “sin reemplazo” puede ser tratado como experimento binomial.
REGLA
Considérese muestreo sin reemplazo de una población dicotómica de tamaño N. Si el
tamaño de la muestra (número de ensayos) n es cuando mucho 5% del tamaño de la
población, el experimento puede ser analizado como si fuera exactamente un experimento binomial.
Por “analizado” se quiere decir que las probabilidades basadas en suposiciones de experimento binomial se aproximarán bastante a las probabilidades reales “sin reemplazo”, las
www.FreeLibros.me
c3_p086-129.qxd
110
3/12/08
CAPÍTULO 3
4:01 AM
Page 110
Variables aleatorias discretas y distribuciones de probabilidad
que generalmente son más difíciles de calcular. En el ejemplo 3.29, n/N 5/50 0.1 0.05,
de modo que el experimento binomial no es una buena aproximación, pero en el ejemplo
3.30, n/N 10/500 000 0.05.
Variable aleatoria binomial y distribución
En la mayoría de los experimentos binomiales, lo que interesa es el número total de los éxitos (E ), en lugar del conocimiento de qué ensayos dieron los éxitos.
DEFINICIÓN
La variable aleatoria binomial X asociada con un experimento binomial que consiste en n ensayos se define como
X el número de los E entre los n ensayos
Supóngase, por ejemplo, que n 3. Entonces existen ocho posibles resultados para el experimento:
EEE EEF EFE EFF FEE FEF FFE FFF
Por la definición de X, X(EEF) 2, X(EFF) 1 y así sucesivamente. Valores posibles de
X en un experimento de n ensayos son x 0, 1, 2, . . . , n. A menudo se escribirá X
Bin(n, p) para indicar que X es una variable aleatoria binomial basada en n ensayos con
probabilidad de éxito p.
NOTACIÓN
Como la función masa de probabilidad de una variable aleatoria binomial X depende de los dos parámetros n y p, la función masa de probabilidad se denota por b(x;
n, p).
Considérese primero el caso n 4 para el cual cada resultado, su probabilidad y
valor x correspondiente se dan en la tabla 3.1. Por ejemplo,
P(EEFE) P(E ) P(E ) P(F) P(E )
p p (1 p) p
(ensayos independientes)
(constante P(E))
p (1 p)
3
Tabla 3.1 Resultados y probabilidades de un experimento binomial
con cuatro ensayos
Resultado
x
Probabilidad
Resultado
x
Probabilidad
EEEE
EEEF
EEFE
EEFF
EFEE
EFEF
EFFE
EFFF
4
3
3
2
3
2
2
1
p4
p3(1 p)
p3(1 p)
p2(1 p)2
p3(1 p)
p2(1 p)2
p2(1 p)2
p(1 p)3
FEEE
FEEF
FEFE
FEFF
FFEE
FFEF
FFFE
FFFF
3
2
2
1
2
1
1
0
p3(1 p)
p2(1 p)2
p2(1 p)2
p(1 p)3
p2(1 p)2
p(1 p)3
p(1 p)3
(1 p)4
En este caso especial, se desea b(x; 4, p) con x 0, 1, 2, 3 y 4. Para b(3; 4, p), identifíquese cuál de los 16 resultados dan un valor x de 3 y sume las probabilidades asociadas
con cada resultado.
b(3; 4, p) P(FEEE ) P(EFEE) P(EEFE) P(EEEF) 4p3(1 p)
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 111
3.4 Distribución de probabilidad binomial
111
Existen cuatro resultados con x 3 y la probabilidad de cada uno es p3(1 p) (el orden de
los E y las F no es importante, sino sólo el número de los E), por lo tanto
b(3; 4, p)
{
}{
}
número de resultados
probabilidad de cualquier resultado
con X 3
con X 3
Asimismo, b(2; 4, p) 6p2(1 p)2, la cual también es el producto del número de resultados con X 2 y la probabilidad de cualquier resultado como ese.
En general,
b(x; n, p)
longitud
de
{compuestassecuencias
} {probabilidad
}
de los éxitos de x
secuencia como esa
número de
de
n
cualquier
Como el orden de los E y las F no es importante, el segundo factor en la ecuación previa es
px(1 p)nx (p. ej., los primeros x ensayos producen E y los últimos n x producen F. El
primer factor es el número de formas de escoger x de los n ensayos para que sean los E, es
decir, el número de combinaciones de tamaño x que pueden ser construidas con n objetos
distintos (ensayos en este caso).
TEOREMA
b(x; n, p)
Ejemplo 3.31
{
n
x p (1 p)
x
nx
0
x 0, 1, 2, . . . n
de lo contrario
A cada uno de seis bebedores de refrescos de cola seleccionados al azar se le sirve un vaso
de refresco de cola A y uno de refresco de cola B. Los vasos son idénticos en apariencia excepto por un código que viene en el fondo para identificar el refresco de cola. Suponga que
en realidad no existe una tendencia entre los bebedores de refresco de cola de preferir un refresco de cola al otro. Entonces p P(un individuo seleccionado prefiere A) 0.5, así que
con X el número entre los seis que prefieren A, X Bin(6, 0.5).
Por lo tanto
6
P(X 3) b(3; 6, 0.5)
(0.5)3(0.5)3 20(0.5)6 0.313
3
La probabilidad de que por lo menos tres prefieran A es
6
6
6
P(3 X) b(x; 6, 0.5)
(0.5)x(0.5)6x 0.656
x
x3
x3
y la probabilidad de que cuando mucho uno prefiera A es
1
P(X 1) b(x; 6, 0.5) 0.109
■
x0
Utilización de tablas binomiales*
Incluso con un valor relativamente pequeño de n, el cálculo de probabilidades binomiales es
tedioso. La tabla A.1 del apéndice tabula la función de distribución acumulativa F(x) P(X
x) con n 5, 10, 15, 20, 25 en combinación con valores seleccionados de p. Varias otras
probabilidades pueden entonces ser calculadas por medio de la proposición sobre funciones
de distribución acumulativas de la sección 3.2. Una anotación de 0 en la tabla significa únicamente que la probabilidad es 0 a tres dígitos significativos puesto que todos los valores
ingresados en la tabla en realidad son positivos.
*
Los paquetes de programas estadísticos tales como MINITAB y R proporcionan la función masa de probabilidad o la función de distribución acumulativa en forma casi instantánea al solicitarla para cualquier valor de p y
n hasta 2 millones. También existe un comando en R para calcular la probabilidad de que X quede en el mismo
intervalo.
www.FreeLibros.me
c3_p086-129.qxd
112
3/12/08
CAPÍTULO 3
4:01 AM
Page 112
Variables aleatorias discretas y distribuciones de probabilidad
NOTACIÓN
Para X
Bin(n, p), la función de distribución acumulativa será denotada por
x
P(X x) B(x; n, p) b(y; n, p)
x 0, 1, . . . , n
y0
Ejemplo 3.32
Suponga que 20% de todos los ejemplares de un libro de texto particular no pasan una prueba de resistencia de encuadernación. Sea X el número entre 15 ejemplares seleccionados
al azar que no pasan la prueba. Entonces X tiene una distribución binomial con n 15 y
p 0.2.
1. La probabilidad de que cuando mucho 8 no pasen la prueba es
8
P(X 8) b(y; 15, 0.2) B(8; 15, 0.2)
y0
la cual es el ingreso en la fila x 8 y la columna p 0.2 de la tabla binomial
n 15. Según la tabla A.1 del apéndice, la probabilidad es B(8; 15, 0.2) 0.999.
2.
La probabilidad de que exactamente 8 fallen es
P(X 8) P(X 8) P(X 7) B(8; 15, 0.2) B(7; 15, 0.2)
la cual es la diferencia entre dos ingresos consecutivos en la columna p 0.2. El resultado es 0.999 0.996 0.003.
3.
La probabilidad de que por lo menos 8 fallen es
P(X
8) 1 P(X 7) 1 B(7; 15, 0.2)
1
ingreso en x 7
fila de columna p 0.2
1 0.996 0.004
4.
Finalmente, la probabilidad de que entre 4 y 7, inclusive, fallen es
P(4 X 7) P(X 4, 5, 6 o 7) P(X 7) P(X 3)
B(7; 15, 0.2) B(3; 15, 0.2) 0.996 0.648 0.348
Obsérvese que esta última probabilidad es la diferencia entre los ingresos en las filas x 7
y x 3, no en las filas x 7 y x 4.
■
Ejemplo 3.33
Un fabricante de aparatos electrónicos afirma que cuando mucho 10% de sus unidades de
suministro de potencia necesitan servicio durante el periodo de garantía. Para investigar
esta afirmación, técnicos en un laboratorio de prueba adquieren 20 unidades y someten a
cada una a una prueba acelerada para simular el uso durante el periodo de garantía. Sea p
la probabilidad de que una unidad de suministro de potencia necesite reparación durante el
periodo (proporción de unidades que requieren reparación). Los técnicos de laboratorio deben
decidir si los datos obtenidos con el experimento respaldan la afirmación de que p 0.10. Sea
X el número entre las 20 muestreadas que necesitan reparación, así que X Bin(20, p). Considere la regla de decisión
Rechazar la afirmación de que p 0.10 a favor de la conclusión de que p 0.10 si
x 5 (donde x es el valor observado de X) y considere posible la afirmación si x 4.
La probabilidad de que la afirmación sea rechazada cuando p 0.10 (una conclusión incorrecta) es
P(X
5 cuando p 0.10) 1 B(4; 20, 0.1) 1 0.957 0.043
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 113
3.4 Distribución de probabilidad binomial
113
La probabilidad de que la afirmación no sea rechazada cuando p 0.20 (un tipo diferente
de conclusión incorrecta) es
P(X 4 cuando p 0.2) B(4; 20, 0.2) 0.630
La primera probabilidad es algo pequeña, pero la segunda es intolerablemente grande.
Cuando p 0.20, significa que el fabricante subestimó de manera excesiva el porcentaje de unidades que necesitan servicio y si se utiliza la regla de decisión establecida, ¡el 63%
de las muestras dan como resultado que la afirmación del fabricamte se considere plausible!
Se podría pensar que la probabilidad de este segundo tipo de conclusión errónea podría hacerse más pequeña cambiando el valor de corte de 5 en la regla de decisión por algún
otro. Sin embargo, aunque el reemplazo de 5 por un número más pequeño daría una probabilidad más pequeña que 0.630, la otra probabilidad se incrementaría entonces. La única
forma de hacer ambas “probabilidades de error” pequeñas es basar la regla de decisión en
un experimento que implique muchas más unidades.
■
La media y varianza de X
Con n 1, la distribución binomial llega a ser la distribución de Bernoulli. De acuerdo con
el ejemplo 3.18, el valor medio de una variable de Bernoulli es p, así que el número
esperado de los S en cualquier ensayo único es p. Como un experimento binomial se compone de n ensayos, la intuición sugiere que para X Bin(n, p), E(X) np, el producto del
número de ensayos y la probabilidad de éxito en un solo ensayo. La expresión para V(X) no
es tan intuitiva.
PROPOSICIÓN
Si X Bin(n, p), entonces E(X) np, V(X) np(1 p) npq y X npq (donde q 1 p).
Por tanto, para calcular la media y varianza de una variable aleatoria binomial no se requiere evaluar las sumas. La comprobación del resultado para E(X) se ilustra en el ejercicio 64.
Ejemplo 3.34
EJERCICIOS
Si 75% de todas las compras en una tienda se hacen con tarjeta de crédito y X es el número
entre diez compras seleccionadas al azar realizadas con tarjeta de crédito, entonces X
Bin(10, 0.75). Por lo tanto, E(X) np (10)(0.75) 7.5, V(X) npq 10(0.75)(0.25)
1.875 y 1.
87
5
. Otra vez, aun cuando X puede tomar sólo valores enteros, E(X) no tiene
que ser un entero. Si se realiza un gran número de experimentos binomiales independientes,
cada uno con n 10 ensayos y p 0.75, entonces el número promedio de los E por experimento se acercará a 7.5.
■
Sección 3.4 (46-67)
46. Calcule las siguientes probabilidades binomiales directamente con la fórmula para b(x; n, p):
a. b(3; 8, 0.35)
b. b(5; 8, 0.6)
c. P(3 X 5) cuando n 7 y p 0.6
d. P(1 X) cuando n 9 y p 0.1
47. Use la tabla A.1 del apéndice para obtener las siguientes
probabilidades:
a. B(4; 15, 0.3)
b. b(4; 15, 0.3)
c. b(6; 15, 0.7)
d. P(2 X 4) cuando X Bin(15, 0.3)
e. P(2 X) cuando X Bin(15, 0.3)
f. P(X 1) cuando X Bin(15, 0.7)
g. P(2 X 6) cuando X Bin(15, 0.3)
48. Cuando se utilizan tarjetas de circuito en la fabricación de
reproductores de discos compactos se prueban; el porcentaje de defectuosas es de 5%. Sea X el número de tarjetas
defectuosas en una muestra aleatoria de tamaño n 25, así
que X Bin(25, 0.05).
www.FreeLibros.me
c3_p086-129.qxd
114
3/12/08
CAPÍTULO 3
4:01 AM
Page 114
Variables aleatorias discretas y distribuciones de probabilidad
Determine P(X 2).
Determine P(X 5).
Determine P(1 X 4).
¿Cuál es la probabilidad que ninguna de estas 25 tarjetas
esté defectuosa?
e. Calcule el valor esperado y la desviación estándar X.
a.
b.
c.
d.
49. Una compañía que produce cristales finos sabe por experiencia que 10% de sus copas de mesa tienen imperfecciones
cosméticas y deben ser clasificadas como “de segunda”.
a. Entre seis copas seleccionadas al azar, ¿qué tan probable
es que sólo una sea de segunda?
b. Entre seis copas seleccionadas al azar, ¿qué tan probable es
que por lo menos dos sean de segunda?
c. Si las copas se examinan una por una, ¿cuál es la probabilidad de cuando mucho cinco deban ser seleccionadas
para encontrar cuatro que no sean de segunda?
50. Se utiliza un número telefónico particular para recibir tanto llamadas de voz como faxes. Suponga que 25% de las llamadas
entrantes son faxes y considere una muestra de 25 llamadas entrantes. ¿Cuál es la probabilidad de que
a. Cuando mucho 6 de las llamadas sean un fax?
b. Exactamente 6 de las llamadas sean un fax?
c. Por lo menos 6 de las llamadas sean un fax?
d. Más de 6 de las llamadas sean un fax?
51. Remítase al ejercicio previo.
a. ¿Cuál es el número esperado de llamadas entre las 25 que
impliquen un fax?
b. ¿Cuál es la desviación estándar del número entre las 25
llamadas que implican un fax?
c. ¿Cuál es la probabilidad de que el número de llamadas
entre las 25 que implican una transmisión de fax sobrepase el número esperado por más de 2 desviaciones
estándar?
52. Suponga que 30% de todos los estudiantes que tienen que
comprar un texto para un curso particular desean un ejemplar nuevo (¡los exitosos!), mientras que el otro 70% desea
comprar un ejemplar usado. Considere seleccionar 25 compradores al azar.
a. ¿Cuáles son el valor medio y la desviación estándar del
número que desea un ejemplar nuevo del libro?
b. ¿Cuál es la probabilidad de que el número que desea
ejemplares nuevos esté a más de dos desviaciones estándar del valor medio?
c. La librería tiene 15 ejemplares nuevos y 15 usados en existencia. Si 25 personas llegan una por una a comprar el texto, ¿cuál es la probabilidad de las 25 que obtengan el tipo
de libro que desean de las existencias actuales? [Sugerencia: Sea X el número que desea un ejemplar nuevo.
¿Con qué valores de X obtendrán las 15 lo que desean?]
d. Suponga que los ejemplares nuevos cuestan $100 y los
usados $70. Suponga que la librería en la actualidad tiene 50 ejemplares nuevos y 50 usados. ¿Cuál es el valor
esperado del ingreso total por la venta de los siguientes
25 ejemplares comprados? Asegúrese de indicar qué regla de valor esperado está utilizando. [Sugerencia: Sea
h(X) el ingreso cuando X de los 25 compradores desean ejemplares nuevos. Exprese esto como una función
lineal.]
53. El ejercicio 30 (sección 3.3) dio la función masa de probabilidad de Y, el número de citaciones de tránsito de un individuo seleccionado al azar asegurado por una compañía
particular. ¿Cuál es la probabilidad de que entre 15 individuos seleccionados al azar
a. por lo menos 10 no tengan citaciones?
b. menos de la mitad tengan por lo menos una citación?
c. el número que tengan por lo menos una citación esté entre 5 y 10, inclusive?*
54. Un tipo particular de raqueta de tenis viene en tamaño mediano y en tamaño extragrande. El 60% de todos los clientes
en una tienda desean la versión extragrande.
a. Entre diez clientes seleccionados al azar que desean este
tipo de raqueta, ¿cuál es la probabilidad de que por lo
menos seis deseen la versión extragrande?
b. Entre diez clientes seleccionados al azar, ¿cuál es la probabilidad de que el número que desea la versión extragrande
esté dentro de una desviación estándar del valor medio?
c. La tienda dispone actualmente de siete raquetas de cada
versión. ¿Cuál es la probabilidad de que los siguientes
diez clientes que desean esta raqueta puedan obtener la
versión que desean de las existencias actuales?
55. El 20% de todos los teléfonos de cierto tipo son llevados a
servicio mientras se encuentran dentro de la garantía. De éstos, 60% puede ser reparado, mientras el 40% restante debe
ser reemplazado con unidades nuevas. Si una compañía adquiere diez de estos teléfonos, ¿cuál es la probabilidad de
que exactamente dos sean reemplazados bajo garantía?
56. La Junta de Educación reporta que 2% de los dos millones
de estudiantes de preparatoria que toman el SAT cada año
reciben un trato especial a causa de discapacidades documentadas (Los Angeles Times, 16 de julio de 2002). Considere
una muestra aleatoria de 25 estudiantes que recientemente
presentaron el examen.
a. ¿Cuál es la probabilidad de que exactamente 1 reciba un
trato especial?
b. ¿Cuál es la posibilidad de que por lo menos 1 reciba
un trato especial?
c. ¿Cuál es la probabilidad de que por lo menos 2 reciban
un trato especial?
d. ¿Cuál es la probabilidad de que el número entre los 25
que recibieron un trato especial esté dentro de 2 desviaciones estándar del número que esperaría reciba un trato
especial?
e. Suponga que a un estudiante que no recibe un trato especial se le permiten 3 horas para el examen, mientras que
a un estudiante que recibió un trato especial se le permiten 4.5 horas. ¿Qué tiempo promedio piensa que le sería
permitido a los 25 estudiantes seleccionados?
57. Suponga que 90% de todas las baterías de cierto proveedor
tienen voltajes aceptables. Un tipo de linterna requiere que
las dos baterías sean tipo D y la linterna funcionará sólo
si sus dos baterías tienen voltajes aceptables. Entre diez linternas seleccionadas al azar, ¿cuál es la probabilidad de que
por lo menos nueve funcionarán? ¿Qué suposiciones hizo
para responder la pregunta planteada?
*
“Entre a y b, inclusive” equivale a (a X b).
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 115
115
3.4 Distribución de probabilidad binomial
58. Un distribuidor recibe un lote muy grande de componentes.
El lote sólo puede ser caracterizado como aceptable si la
proporción de componentes defectuosos es cuando mucho
de 10. El distribuidor decide seleccionar 10 componentes al
azar y aceptar el lote sólo si el número de componentes defectuosos presentes en la muestra es cuando mucho de 2.
a. ¿Cuál es la probabilidad de que el lote será aceptado
cuando la proporción real de componentes defectuosos es
de 0.01?, 0.05? 0.10? 0.20? 0.25?
b. Sea p la proporción real de componentes defectuosos
presentes en el lote. Una gráfica de P(se acepta el lote) en
función de p y con p sobre el eje horizontal y P(se acepta el lote) sobre el eje vertical, se llama curva característica de operación del plan de muestreo de aceptación.
Use los resultados del inciso a) para trazar esta curva con
0 p 1.
c. Repita los incisos a) y b) con “1” reemplazando a “2” en
el plan de muestreo de aceptación.
d. Repita los incisos a) y b) con “15” reemplazando a “10”
en el plan de muestreo de aceptación.
e. ¿Cuál de estos planes de muestreo, el del inciso a), c) o
d) parece más satisfactorio y por qué?
59. Un reglamento que requiere que se instale un detector de
humo en todas las casas previamente construidas ha estado
en vigor en una ciudad particular durante 1 año. Al departamento de bomberos le preocupa que muchas casas permanezcan sin detectores. Sea p la proporción verdadera de
las casas que tienen detectores y suponga que se inspecciona una muestra aleatoria de 25 casas. Si ésta indica marcadamente que menos de 80% de todas las casas tienen un
detector, el departamento de bomberos lanzará una campaña
para la puesta en ejecución de un programa de inspección
obligatorio. Debido a lo caro del programa, el departamento
prefiere no requerir tales inspecciones a menos que una evidencia muestral indique que se requieren. Sea X el número
de casas con detectores entre las 25 muestreadas. Considere
rechazar el requerimiento de que p 0.8 si x 15.
a. ¿Cuál es la probabilidad de que el requerimiento sea rechazado cuando el valor real de p es 0.8?
b. ¿Cuál es la probabilidad de no rechazar el requerimiento
cuando p 0.7? ¿Cuándo p 0.6?
c. ¿Cómo cambian las “probabilidades de error” de los incisos a) y b) si el valor 15 en la regla de decisión es reemplazado por 14?
60. Un puente de cuota cobra $1.00 por cada automóvil de uso
particular y $2.50 por cualquier otro vehículo. Suponga que
durante el día 60% son vehículos de uso particular. Si 25
vehículos cruzan el puente durante un periodo determinado
del día, ¿cuál es la expectativa de ingresos resultantes en el
día? [Sugerencia: Exprese X número de automóviles de
uso particular; cuando el ingreso por concepto de cuota h(X)
es una función lineal de X].
61. Un estudiante que está tratando de escribir un ensayo para
un curso tiene la opción de dos temas, A y B. Si selecciona
el tema A, el estudiante pedirá dos libros mediante préstamo
interbiblioteca, mientras que si selecciona el tema B, el estudiante pedirá cuatro libros. El estudiante cree que un buen
ensayo necesita recibir y utilizar por lo menos la mitad de
los libros pedidos para uno u otro tema seleccionado. Si la
probabilidad de que un libro pedido mediante préstamo interbiblioteca llegue a tiempo es de 0.9 y los libros llegan independientemente uno de otro, ¿qué tema deberá seleccionar el
estudiante para incrementar al máximo la probabilidad de escribir un buen ensayo? ¿Qué pasa si la probabilidad de que lleguen los libros es de sólo 0.5 en lugar de 0.9?
62. a. Con n fijo, ¿hay valores de p(0 p 1) para los cuales
V(X) 0? Explique por qué esto es así.
b. ¿Con qué valor de p se incrementa al máximo V(X)? [Sugerencia: Trace la gráfica de V(X) en función de p o bien
tome una derivada.]
63. a. Demuestre que b(x; n, 1 p) b(n x; n, p).
b. Demuestre que B(x; n, 1 p) 1 B(n x 1; n, p).
[Sugerencia: Cuando mucho x éxitos (S) equivalen a por
lo menos (n x) fracasos (F).]
c. ¿Qué implican los incisos a) y b) sobre la necesidad de
incluir valores de p más grandes que 0.5 en la tabla A.1
del apéndice?
64. Demuestre que E(X) np cuando X es una variable aleatoria
binomial [Sugerencia: Primero exprese E(X) como una suma
con límite inferior x 1. Luego saque a np como factor, sea
y x 1 de modo que la suma sea de y 0 a y n 1
y demuestre que la suma es igual a 1.]
65. Los clientes en una gasolinería pagan con tarjeta de crédito (A), tarjeta de débito (B) o efectivo (C). Suponga qué
clientes sucesivos toman decisiones independientes con
P(A) 0.5, P(B) 0.2 y P(C) 0.3.
a. Entre los siguientes 100 clientes, ¿cuáles son la media y
varianza del número que paga con tarjeta de débito? Explique su razonamiento.
b. Conteste el inciso a) para el número entre 100 que no pagan con efectivo.
66. Una limusina de aeropuerto puede transportar hasta cuatro
pasajeros en cualquier viaje. La compañía aceptará un máximo de seis reservaciones para un viaje y un pasajero debe tener una reservación. Según registros previos, 20% de los que
reservan no se presentan para el viaje. Responda las siguientes preguntas, suponiendo independencia en los casos en que
sea apropiado.
a. Si se hacen seis reservaciones, ¿cuál es la probabilidad de
que por lo menos un individuo con reservación no pueda
ser acomodado en el viaje?
b. Si se hacen seis reservaciones, ¿cuál es el número esperado de lugares disponibles cuando la limusina parte?
c. Suponga que la distribución de probabilidad del número
de reservaciones hechas se da en la tabla adjunta.
Número de reservaciones
Probabilidad
3
4
5
6
0.1
0.2
0.3
0.4
Sea X el número de pasajeros en un viaje seleccionado al
azar. Obtenga la función masa de probabilidad de X.
67. Remítase a la desigualdad de Chebyshev dada en el ejercicio
44. Calcule P(°X ° k) con k 2 y k 3 cuando
X Bin (20, 0.5) y compare con el límite superior correspondiente. Repita para X Bin(20, 0.75).
www.FreeLibros.me
c3_p086-129.qxd
116
3/12/08
CAPÍTULO 3
4:01 AM
Page 116
Variables aleatorias discretas y distribuciones de probabilidad
3.5 Distribuciones hipergeométricas
y binomiales negativas
Las distribuciones hipergeométricas y binomiales negativas están relacionadas con la distribución binomial. En tanto que la distribución binomial es el modelo de probabilidad aproximada de muestreo sin reemplazo de una población dicotómica finita (E–F), la distribución
hipergeométrica es el modelo de probabilidad exacta del número de éxitos (E ) en la muestra. La variable aleatoria binomial X es el número de éxitos cuando el número n de ensayos
es fijo, mientras que la distribución binomial surge de fijar el número de éxitos deseados y
de permitir que el número de ensayos sea aleatorio.
Distribución hipergeométrica
Las suposiciones que conducen a la distribución hipergeométrica son las siguientes:
1. La población o conjunto que se va a muestrear se compone de N individuos, objetos o
elementos (una población finita).
2. Cada individuo puede ser caracterizado como éxito (E ) o falla (F) y hay M éxitos en la
población.
3. Se selecciona una muestra de n individuos sin reemplazo de tal modo que cada subconjunto de tamaño n es igualmente probable de ser seleccionado.
La variable aleatoria de interés es X el número de éxitos en la muestra. La distribución de
probabilidad de X depende de los parámetros n, M y N, así que se desea obtener P(X x)
h(x; n, M, N).
Ejemplo 3.35
Durante un periodo particular una oficina de tecnología de la información de una universidad recibió 20 solicitudes de servicio de problemas con impresoras, de las cuales 8 eran impresoras láser y 12 eran modelos de inyección de tinta. Se tiene que seleccionar una muestra
de 5 de estas solicitudes de servicio completamente al azar, de modo que cualquier subconjunto de tamaño 5 tenga la misma probabilidad de ser seleccionado como cualquier otro
subconjunto (piense en escribir los números 1, 2, . . . , 20 en 20 papelitos idénticos, mezclarlos y seleccionar 5 de ellos). ¿Cuál es entonces la probabilidad de que exactamente
x(x 0, 1, 2, 3, 4 o 5) de las solicitudes de servicio fueran para impresoras de inyección de
tinta?
En este caso, el tamaño de la población es N 20, el tamaño de la muestra es n 5
y el número de éxitos (inyección de tinta E ) y las fallas (F) en la población son M 12
y N M 8, respectivamente. Considérese el valor x 2. Como todos los resultados (cada uno consta de 5 solicitudes particulares) son igualmente probables.
P(X 2) h(2; 5, 12, 20)
número de resultados con X 2
número de posibles resultados
El número de posibles resultados en el experimento es el número de formas de seleccionar
20
5 de los 20 objetos sin importar el orden, es decir, ( 5 ). Para contar el número de resultados
12
con X 2, obsérvese que existen ( 2 ) formas de seleccionar 2 de la solicitudes para impresoras
8
de inyección de tinta, y por cada forma existen (3) formas de seleccionar las 3 solicitudes para impresoras láser a fin de completar la muestra. La regla de producto del capítulo 2 da en12 8
tonces ( 2 )(3) como el número de resultados con X 2, por lo tanto
2 3
20
5
12 8
h(2; 5, 12, 20)
www.FreeLibros.me
77
0.238
323
■
c3_p086-129.qxd
3/12/08
4:01 AM
Page 117
3.5 Distribuciones hipergeométricas y binomiales negativas
117
En general, si el tamaño de la muestra n es más pequeño que el número de éxitos en
la población (M), entonces el valor de X más grande posible es n. Sin embargo, si M n (p.
ej., un tamaño de muestra de 25 y sólo hay 15 éxitos en la población), entonces X puede ser
cuando mucho M. Asimismo, siempre que el número de fallas en la población (N M) sobrepase el tamaño de la muestra, el valor más pequeño de X es 0 (puesto que todos los individuos muestreados podrían entonces ser fallas). Sin embargo, si N M n, el valor más
pequeño posible de X es n (N M). Por lo tanto, los posibles valores de X satisfacen la
restricción máx(0, n (N M)) x mín(n, M). Un argumento paralelo al del ejemplo
previo da la función masa de probabilidad de X.
PROPOSICIÓN
Si X es el número de éxitos (E ) en una muestra completamente aleatoria de tamaño n
extraída de la población compuesta de M éxitos y (N M) fallas, entonces la distribución de probabilidad de X llamada distribución hipergeométrica, es
M NM
x n x
P(X x) h(x; n, M, N)
N
n
(3.15)
con x un entero que satisface máx(0, n N M) x mín(n, M).
En el ejemplo 3.35, n 5, M 12 y N 20, por lo tanto h(x; 5, 12, 20) con x 0, 1, 2,
3, 4, 5 se obtiene sustituyendo estos números en la ecuación (3.15).
Ejemplo 3.36
Se capturaron, etiquetaron y liberaron cinco individuos de una población de animales que
se piensa están al borde de la extinción en una región para que se mezclen con la población.
Después de haber tenido la oportunidad de mezclarse, se selecciona una muestra aleatoria
de 10 de estos animales. Sea X el número de animales etiquetados en la segunda muestra. Si en realidad hay 25 animales de este tipo en la región, ¿cuál es la probabilidad de que
a) X 2? b) ¿X 2?
Los valores de los parámetros son n 10, M 5 (cinco animales etiquetados en la
población) y N 25, por lo tanto
x10 x
h(x; 10, 5, 25)
25
10
20
5
x 0, 1, 2, 3, 4, 5
Para el inciso a)
2 8 0.385
P(X 2) h(2; 10, 5, 25)
25
10
5 20
Para el inciso b)
P(X 2) P(X 0, 1 o 2)
2
h(x; 10, 5, 25)
x0
0.057 0.257 0.385 0.699
■
Están disponibles tablas amplias de la distribución hipergeométrica, pero como la distribución tiene tres parámetros, estas tablas requieren mucho más espacio que las tablas
www.FreeLibros.me
c3_p086-129.qxd
118
3/12/08
CAPÍTULO 3
4:01 AM
Page 118
Variables aleatorias discretas y distribuciones de probabilidad
para la distribución binomial. MINITAB y otros paquetes de software de estadística generan con facilidad las probabilidades hipergeométricas.
Como en el caso binomial, existen expresiones simples para E(X) y V(X) para variables aleatorias hipergeométricas.
PROPOSICIÓN
La media y la varianza de la variable aleatoria hipergeométrica X cuya función masa
de probabilidad es h(x; n, M, N) son
E(X) n
M
N
V(X)
Nn
M
M
N 1 n N 1 N
La razón M/N es la proporción de éxitos en la población. Si se reemplaza M/N por p
en E(X) y V(X), se obtiene
E(X) np
V(X)
Nn
N 1 np(1 p)
(3.16)
La expresión (3.16) muestra que las medias de las variables aleatorias binomiales e hipergeométricas son iguales, en tanto que las varianzas de las dos variables aleatorias difieren
por el factor (N n)/(N 1), a menudo llamado factor de corrección por población finita.
Este factor es menor que 1, así que la variable hipergeométrica tiene una varianza más pequeña que la variable aleatoria binomial. El factor de corrección puede escribirse como (1
n/N)(1 1/N), el cual es aproximadamente 1 cuando n es pequeño con respecto a N.
Ejemplo 3.37
(continuación del
ejemplo 3.36)
En el ejemplo de etiquetación de animales, n 10, M 5 y N 25, por lo tanto p
0.2 y
5
25
E(X) 10(0.2) 2
V(X)
15
(10)(0.2)(0.8) (0.625)(1.6) 1
24
Si el muestreo se realizó con reemplazo, V(X) 1.6.
Suponga que en realidad no se conoce el tamaño de la población N, así que se observa el valor x y se desea estimar N. Es razonable igualar la proporción muestral observada de
éxitos, x/n, y la proporción de la población, M/N da la estimación
N̂
Mn
x
Si M 100, n 40 y x 16, entonces N̂ 250.
■
La regla general empírica dada en la sección 3.4 plantea que si el muestreo se realizó
sin reemplazo pero n/N era cuando mucho de 0.05, entonces la distribución binomial podría
ser utilizada para calcular probabilidades aproximadas que implican el número de éxitos en
la muestra. Un enunciado más preciso es el siguiente. Permita que el tamaño de la población N y el número de M éxitos presentes en la población, se hagan más grandes a medida
que la razón M/N tiende a p. Entonces h(x; n, M, N) tiende a b(x; n, p); así que con n/N pequeña, las dos son aproximadamente iguales siempre que p no esté muy cerca de 0 o 1.
Este es el razonamiento de la regla empírica.
Distribución binomial negativa
La variable aleatoria y la distribución binomial negativa se basan en un experimento que satisface las siguientes condiciones:
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 119
3.5 Distribuciones hipergeométricas y binomiales negativas
119
1. El experimento consiste en una secuencia de ensayos independientes.
2. Cada ensayo puede dar por resultado un éxito (E ) o una falla (F).
3. La probabilidad de éxito es constante de un ensayo a otro, por lo tanto P(E en el ensayo
i) p con i 1, 2, 3. . . .
4. El experimento continúa (se realizan ensayos) hasta que un total de r éxitos hayan sido
observados, donde r es un entero positivo especificado.
La variable aleatoria de interés es X el número de fallas que preceden al r-ésimo éxito; X
se llama variable aleatoria binomial negativa porque, en contraste con la variable aleatoria binomial, el número de éxitos es fijo y el número de ensayos es aleatorio.
Posibles valores de X son 0, 1, 2, . . . . Sea nb(x; r, p) la función masa de probabilidad
de X. El evento {X x} equivale a {r 1 éxitos en los primeros (x r 1) ensayos y un
éxito (E ) en el ensayo (x r) perceptil} (p. ej., si r 5 y x 10, entonces debe haber cuatro éxitos en los primeros 14 ensayos y en el ensayo 15 debe ser un éxito). Como los ensayos son independientes,
nb(x; r, p) P(X x)
P(r 1 éxitos en los primeros x r 1 ensayos) P(E )
(3.17)
La primera probabilidad en el miembro de más a la derecha de la expresión (3.17) es la probabilidad binomial
PROPOSICIÓN
x r 1 r1
p (1 p)x
r1
La función masa de probabilidad de la variable aleatoria binomial negativa X con
los parámetros r número de éxitos (E ) y p P(E ) es
nb(x; r, p)
Ejemplo 3.38
donde P(E) p
xr1 r
p (1 p)x
r1
x 0, 1, 2, . . .
Un pediatra desea reclutar cinco parejas, cada una de las cuales espera a su primer hijo,
para participar en un nuevo régimen de alumbramiento natural. Sea p P(una pareja seleccionada al azar está de acuerdo en participar). Si p 0.2, ¿cuál es la probabilidad de que 15
parejas tengan que ser entrevistadas antes de encontrar cinco que estén de acuerdo en participar? Es decir, E {está de acuerdo en participar}, ¿cuál es la probabilidad de que ocurran
10 fallas antes del quinto éxito? Sustituyendo r 5, p 0.2 y x 10 en nb(x; r, p) da
nb(10; 5, 0.2)
14
4 (0.2) (0.8)
5
10
0.034
La probabilidad de que cuando mucho se observen 10 fallas (cuando mucho con 15 parejas
entrevistadas) es
10
10
x0
x0
P(X 10) nb(x; 5, 0.2) (0.2)5
x4
(0.8)x 0.164
4
■
En algunas fuentes, la variable aleatoria binomial negativa se considera como el número de ensayos X r en lugar del número de fallas.
En el caso especial r 1, la función masa de probabilidad es
nb(x; 1, p) (1 p) x p
x 0, 1, 2, . . .
(3.18)
En el ejemplo 3.12, la función masa de probabilidad se derivó para el número de ensayos
necesarios para obtener el primer éxito (E ) y allí la función masa de probabilidad es similar a la expresión (3.18). En la literatura se hace referencia tanto a X número de fallas (F)
como a Y número de ensayos ( 1 X) como variables aleatorias geométricas y la
función masa de probabilidad en la expresión (3.18) se llama distribución geométrica.
www.FreeLibros.me
c3_p086-129.qxd
120
3/12/08
CAPÍTULO 3
4:01 AM
Page 120
Variables aleatorias discretas y distribuciones de probabilidad
En el ejemplo 3.19, se demostró que el número esperado de ensayos hasta que aparece el primer éxito es 1/p, así que el número esperado de fallas hasta que aparece el primer
éxito es (1/p) 1 (1 p)/p. Intuitivamente, se esperaría ver r (1 p)/p fallas antes
del r-ésimo éxito y éste en realidad es E(X). También existe una fórmula simple para V(X).
PROPOSICIÓN
Si X es una variable aleatoria binomial negativa con función masa de probabilidad
nb(x; r, p), entonces
E(X)
r(1 p)
p
V(X)
r(1 p)
p2
Por último, al expandir el coeficiente binomial en frente de pr(1 p)x y haciendo alguna reducción o cancelación, se ve que nb(x; r, p) está bien definido incluso cuando r no es un entero. Se ha encontrado la distribución binomial negativa generalizada para ajustar muy bien
los datos observados en una amplia variedad de aplicaciones.
EJERCICIOS
Sección 3.5 (68-78)
68. Un tipo de cámara digital viene en una versión de 3 megapixeles o una versión de 4 megapixeles. Una tienda de cámaras recibió un envío de 15 de estas cámaras, de las cuales 6
tienen una resolución de 3 megapixeles. Suponga que se
seleccionan al azar 5 de estas cámaras para guardarlas detrás
del mostrador; las otras 10 se colocan en una bodega. Sea
X el número de cámaras de 3 megapixeles entre las 5 seleccionadas para guardarlas detrás del mostrador.
a. ¿Qué distribución tiene X (nombre y valores de todos los
parámetros)?
b. Calcule P(X 2), P(X 2) y P(X 2).
c. Calcule el valor medio y la desviación estándar de X.
69. Cada uno de 12 refrigeradores de un tipo ha sido regresado
a un distribuidor debido a un ruido agudo audible producido
por oscilación cuando el refrigerador está funcionando. Suponga que 7 de estos refrigeradores tienen un compresor defectuoso y que los otros 5 tienen problemas menos serios. Si
los refrigeradores se examinan en orden aleatorio, sea X el
número entre los primeros 6 examinados que tienen un compresor defectuoso. Calcule lo siguiente:
a. P(X 5)
b. P(X 4)
c. La probabilidad de que X exceda su valor medio por más
de una desviación estándar.
d. Considere un gran envío de 400 refrigeradores, 40 de los
cuales tienen compresores defectuosos. Si X es el número entre 15 refrigeradores seleccionados al azar que tienen compresores defectuosos, describa una forma menos
tediosa de calcular (por lo menos de forma aproximada)
P(X 5) que utilizar la función masa de probabilidad hipergeométrica.
70. Un instructor que impartió dos secciones de estadística de
ingeniería el semestre pasado, la primera con 20 estudiantes
y la segunda con 30, decidió asignar un proyecto semestral.
Una vez que todos los proyectos le fueron entregados, el instructor los ordenó al azar antes de calificarlos. Considere los
primeros 15 proyectos calificados.
a. ¿Cuál es la probabilidad de que exactamente 10 de estos
sean de la segunda sección?
b. ¿Cuál es la probabilidad de que por lo menos 10 de estos
sean de la segunda sección?
c. ¿Cuál es la probabilidad de que por lo menos 10 de estos
sean de la misma sección?
d. ¿Cuáles son el valor medio y la desviación estándar del
número entre estos 15 que son de la segunda sección?
e. ¿Cuáles son el valor medio y la desviación estándar del
número de proyectos que no están entre estos primeros 15
que son de la segunda sección?
71. Un geólogo recolectó 10 especímenes de roca basáltica y 10
especímenes de granito. Él le pide a su ayudante de laboratorio que seleccione al azar 15 de los especímenes para analizarlos.
a. ¿Cuál es la función masa de probabilidad del número
de especímenes de granito seleccionados para su análisis?
b. ¿Cuál es la probabilidad de que todos los especímenes de
uno de los dos tipos de roca sean seleccionados para su
análisis?
c. ¿Cuál es la probabilidad de que el número de especímenes de granito seleccionados para analizarlos esté dentro
de una desviación estándar de su valor medio?
72. Un director de personal que va a entrevistar a 11 ingenieros
para cuatro vacantes de trabajo ha programado seis entrevistas para el primer día y cinco para el segundo. Suponga que
los candidatos son entrevistados en orden aleatorio.
a. ¿Cuál es la probabilidad que x de los cuatro mejores candidatos sean entrevistados el primer día?
b. ¿Cuántos de los mejores cuatro candidatos se espera que
puedan ser entrevistados el primer día?
73. Veinte parejas de individuos que participan en un torneo de
bridge han sido sembrados del 1, . . . , 20. En esta primera
parte del torneo, los 20 son divididos al azar en 10 parejas
este-oeste y 10 parejas norte-sur.
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 121
3.6 Distribución de probabilidad de Poisson
a. ¿Cuál es la probabilidad de que x de las 10 mejores parejas terminen jugando este-oeste?
b. ¿Cuál es la probabilidad de que las cinco mejores parejas
terminen jugando en la misma dirección?
c. Si existen 2n parejas, ¿cuál es la función masa de probabilidad de X el número entre las mejores n parejas que
terminan jugando este-oeste? ¿Cuáles son E(X) y V(X)?
74. Una alerta contra el esmog de segunda etapa ha sido emitida en una área del condado de Los Ángeles en la cual hay 50
firmas industriales. Un inspector visitará 10 firmas seleccionadas al azar para ver si no han violado los reglamentos.
a. Si 15 de las firmas sí están violando por lo menos un reglamento, ¿cuál es la función masa de probabilidad del
número de firmas visitadas por el inspector que violan
por lo menos un reglamento?
b. Si existen 500 firmas en el área, 150 de las cuales violan
algún reglamento, represente de forma aproximada la
función masa de probabilidad del inciso a) con una función masa de probabilidad más simple.
c. Con X el número entre las 10 visitadas que violan algún reglamento, calcule E(X) y V(X) ambas para la función masa de probabilidad exacta y función masa de
probabilidad aproximada del inciso b).
121
75. Suponga que p P(nacimiento de un varón) 0.5. Una pareja desea tener exactamente dos niñas en su familia. Tendrán hijos hasta que esta condición se satisfaga.
a. ¿Cuál es la probabilidad de que la familia tenga x varones?
b. ¿Cuál es la probabilidad de que la familia tenga cuatro
hijos?
c. ¿Cuál es la probabilidad de que la familia tenga cuando
mucho cuatro hijos?
d. ¿Cuántos varones cree que tenga esta familia? ¿Cuántos
hijos esperaría que tenga esta familia?
76. Una familia decide tener hijos hasta que tengan tres del mismo
sexo. Suponiendo P(B) P(G) 0.5, ¿cuál es la función masa de probabilidad de X el número de hijos en la familia?
77. Tres hermanos y sus esposas deciden tener hijos hasta que
cada familia tenga dos niñas. ¿Cuál es la función masa de
probabilidad de X el número total de varones procreados
por los hermanos? ¿Cuál es E(X) y cómo se compara con el
número esperado de varones procreados por cada hermano?
78. El individuo A tiene un dado rojo y el B uno verde (ambos
imparciales). Si cada uno los lanza hasta que obtiene cinco
“dobles” (11, . . . , 66), ¿cuál es la función masa de probabilidad de X el número total de veces que un dado es
lanzado? ¿Cuáles son E(X) y V(X)?
3.6 Distribución de probabilidad de Poisson
Las distribuciones binomiales, hipergeométricas y binomiales negativas se derivaron partiendo de un experimento compuesto de ensayos o sorteos y aplicando las leyes de probabilidad a varios resultados del experimento. No existe un experimento simple en el cual esté
basada la distribución de Poisson, aun cuando en breve se describirá cómo puede ser obtenida mediante ciertas operaciones restrictivas.
DEFINICIÓN
Se dice que una variable aleatoria X tiene una distribución de Poisson con parámetro ( 0) si la función masa de probabilidad de X es
p(x; )
e x
x!
x 0, 1, 2, . . .
El valor de es con frecuencia un valor por unidad de tiempo o por unidad de área.
La letra e en p(x; ) representa la base del sistema de logaritmos naturales; su valor numérico es aproximadamente 2.71828. Como debe ser positiva, p(x; ) 0 con todos los va
lores posibles x. El hecho de que x0 p(x; ) 1 es una consecuencia de la expansión de
la serie infinita de Maclaurin de e , la cual aparece en la mayoría de los textos de cálculo:
e 1
x
2
3
...
2!
3!
x0 x!
(3.19)
Si los dos términos extremos de la expresión (3.19) se multiplican por e y luego e se
coloca adentro de la suma, el resultado es
1 e
x0
x
x!
lo que demuestra que p(x; ) satisface la segunda condición necesaria para especificar una
función masa de probabilidad.
www.FreeLibros.me
c3_p086-129.qxd
122
3/12/08
CAPÍTULO 3
4:01 AM
Page 122
Variables aleatorias discretas y distribuciones de probabilidad
Ejemplo 3.39
Sea X el número de criaturas de un tipo particular capturadas en una trampa durante un
periodo determinado. Suponga que X tiene una distribución de Poisson con 4.5, así que
en promedio las trampas contendrán 4.5 criaturas [El artículo “Dispersal Dynamics of the
Bivalve Gemma Gemma in a Patchy Environment (Ecological Monographs, 1995: 1–20) sugiere este modelo: el molusco bivalvo Gemma gemma es una pequeña almeja.] La probabilidad de que una trampa contenga exactamente cinco criaturas es
e
P(X 5)
4.5
(4.5)5
0.1708
5!
La probabilidad de que una trampa contenga cuando mucho cinco criaturas es
5
P(X 5)
x0
e
4.5
(4.5)2
(4.5)x
(4.5)5
e 4.5 1 4.5
...
0.7029
x!
2!
5!
■
La distribución de Poisson como límite
La siguiente proposición proporciona el razonamiento para utilizar la distribución de Poisson en muchas situaciones.
PROPOSICIÓN
Suponga que en la función masa de probabilidad binomial b(x; n, p), si n A y
p A 0 de tal modo que np tienda a un valor 0. Entonces b(x; n, p) A p(x; ).
De acuerdo con esta proposición, en cualquier experimento binomial en el cual n es
grande y p es pequeña, b(x; n, p) p(x; ), donde np. Como regla empírica, esta aproximación puede ser aplicada con seguridad si n 50 y np 5.
Ejemplo 3.40
Si un editor de libros no técnicos hace todo lo posible porque sus libros estén libres de errores tipográficos, de modo que la probabilidad de que cualquier página dada contenga por lo
menos uno de esos errores es de 0.005 y los errores son independientes de una página a otra,
¿cuál es la probabilidad de que una de sus novelas de 400 páginas contenga exactamente una
página con errores? ¿Cuándo mucho tres páginas con errores?
Con S denotando una página que contiene por lo menos un error y F una página libre
de errores, el número X de páginas que contienen por lo menos un error es una variable aleatoria binomial con n 400 y p 0.005, así que np 2. Se desea
P(X 1) b(1; 400, 0.005) p(1; 2)
e 2(2)1
0.270671
1!
El valor binomial es b(1; 400, 0.005) 0.270669, así que la aproximación es muy buena.
Asimismo
3
3
P(X 3) p(x, 2) e
x0
x0
2
2x
x!
0.135335 0.270671 0.270671 0.180447
0.8571
y éste de nuevo se aproxima bastante al valor binomial P(X 3) 0.8576.
■
La tabla 3.2 muestra la distribución de Poisson con 3 junto con las tres distribuciones binomiales con np 3 y la figura 3.8 (generada por S-Plus) ilustra una gráfica de la
distribución de Poisson junto con las dos primeras distribuciones binomiales. La aproximación es de uso limitado con n 30, pero desde luego la precisión es mejor con n 100 y
mucho mejor con n 300.
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 123
123
3.6 Distribución de probabilidad de Poisson
Tabla 3.2 Comparación de la distribución de Poisson con tres distribuciones
binomiales
x
n 30, p 0.1
n 100, p 0.03
n 300, p 0.01
0
1
2
3
4
5
6
7
8
9
10
0.042391
0.141304
0.227656
0.236088
0.177066
0.102305
0.047363
0.018043
0.005764
0.001565
0.000365
0.047553
0.147070
0.225153
0.227474
0.170606
0.101308
0.049610
0.020604
0.007408
0.002342
0.000659
0.049041
0.148609
0.224414
0.225170
0.168877
0.100985
0.050153
0.021277
0.007871
0.002580
0.000758
p(x)
Poisson,
3
0.049787
0.149361
0.224042
0.224042
0.168031
0.100819
0.050409
0.021604
0.008102
0.002701
0.000810
Bin, n30 (o); Bin, n100 (x); Poisson ( )
0.25
o
x
o
x
0.20
o
x
0.15
x
o
x
o
0.10
0.05
x
o
x
o
x
o
x
o
0
Figura 3.8
0
2
4
6
8
x
o
x
o
x
10
Comparación de una distribución de Poisson con dos distribuciones binomiales.
La tabla A.2 del apéndice muestra la función de distribución acumulativa F(x; )
para 0.1, 0.2, . . . , 1, 2, . . . , 10, 15 y 20. Por ejemplo, si 2 entonces P(X 3)
F(3; 2) 0.857 como en el ejemplo 3.40, en tanto que P(X 3) F(3; 2) F(2; 2) 0.180.
Alternativamente, muchos paquetes de computadora estadísticos generarán p(x; ) y F(x; )
al solicitarlo.
Media y varianza de X
Como b(x; n, p) A p(x; ) a medida que n A , p A 0, np A , la media y varianza de una
variable binomial deberán aproximarse a las de una variable de Poisson. Estos límites son
np A y np(1 p) A .
PROPOSICIÓN
Si X tiene una distribución de Poisson con parámetro , entonces E(X) V(X) .
Estos resultados también pueden ser derivados directamente de la definición de media y varianza.
Ejemplo 3.41
(continuación del
ejemplo 3.39)
Tanto el número esperado de criaturas atrapadas como la varianza de éste son iguales a 4.5,
y X
4.5
2.12.
■
www.FreeLibros.me
c3_p086-129.qxd
124
3/12/08
CAPÍTULO 3
4:01 AM
Page 124
Variables aleatorias discretas y distribuciones de probabilidad
Proceso de Poisson
Una aplicación muy importante de la distribución de Poisson surge en conexión con la ocurrencia de eventos de algún tipo en el transcurso del tiempo. Eventos de interés podrían ser
visitas a un sitio web particular, pulsos de alguna clase registrados por un contador, mensajes de correo electrónico enviados a una dirección particular, accidentes en una instalación
industrial o lluvias de rayos cósmicos observados por astrónomos en un observatorio particular. Se hace la siguiente suposición sobre la forma en que los eventos de interés ocurren:
1. Existe un parámetro 0 de tal modo que durante cualquier intervalo de tiempo corto
t, la probabilidad de que ocurra exactamente un evento es t o(t).*
2. La probabilidad de que ocurra más de un evento durante t es o(t) [la que junto con
la suposición 1, implica que la probabilidad de cero eventos durante t es 1
t o(t)].
3. El número de eventos ocurridos durante este intervalo de tiempo t es independiente del
número ocurrido antes de este intervalo de tiempo.
Informalmente, la suposición 1 dice que durante un corto intervalo de tiempo, la probabilidad de que ocurra un solo evento es aproximadamente proporcional a la duración del intervalo de tiempo, donde es la constante de proporcionalidad. Ahora sea Pk(t) la probabilidad
de que k eventos serán observados durante cualquier intervalo de tiempo particular de duración t.
Pk(t) et (t)k/k!, de modo que el número de eventos durante un intervalo de
tiempo de duración t es una variable de Poisson con parámetro t. El número esperado de eventos durante cualquier intervalo de tiempo es entonces t, así que el número esperado durante un intervalo de tiempo unitario es .
PROPOSICIÓN
La ocurrencia de eventos en el transcurso del tiempo como se describió se llama proceso de
Poisson; el parámetro especifica el ritmo del proceso.
Ejemplo 3.42
Suponga que llegan pulsos a un contador a un ritmo promedio de seis por minuto, así que
6. Para determinar la probabilidad de que en un intervalo de 0.5 min se reciba por lo
menos un pulso, obsérvese que el número de pulsos en ese intervalo tiene una distribución
de Poisson con parámetro t 6(0.5) 3 (se utiliza 0.5 min porque está expresada como ritmo por minuto). Entonces con X el número de pulsos recibidos en el intervalo de
30 segundos,
P(1 X) 1 P(X 0) 1
e 3(3)0
0.950
0!
■
En lugar de observar eventos en el transcurso del tiempo, considere observar eventos
de algún tipo que ocurren en una región de dos o tres dimensiones. Por ejemplo, se podría
seleccionar un mapa de una región R de un bosque, ir a dicha región y contar el número de
árboles. Cada árbol representaría un evento que ocurre en un punto particular del espacio.
Conforme a suposiciones similares a 1–3, se puede demostrar que el número de eventos que
ocurren en una región R tiene una distribución de Poisson con parámetro a(R), donde
a(R) es el área de R. La cantidad es el número esperado de eventos por unidad de área o
volumen.
Una cantidad es o(t) (léase “o minúscula de delta t”) si, a medida que t tiende a cero, también lo hace o(t)/t.
Es decir, o(t) es incluso más insignificante (tiende a 0 más rápido) que t mismo. La cantidad (t)2 tiene esta propiedad, pero sen(t) no.
*
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 125
3.6 Distribución de probabilidad de Poisson
EJERCICIOS
125
Sección 3.6 (79-93)
79. Sea X el número de imperfecciones superficiales de una caldera seleccionada al azar de un tipo que tiene una distribución de Poisson con parámetro 5. Use la tabla A.2 del
apéndice para calcular las siguientes probabilidades:
a. P(X 8)
b. P(X 8)
c. P(9 X)
d. P(5 X 8)
e. P(5 X 8)
80. Suponga que el número X de tornados observados en una región particular durante un año tiene una distribución de
Poisson con 8.
a. Calcule P(X 5).
b. Calcule P(6 X 9).
c. Calcule P(10 X).
d. ¿Cuál es la probabilidad de que el número observado de
tornados sobrepase el número esperado por más de una
desviación estándar?
81. Suponga que el número de conductores que viajan entre un
origen y destino particulares durante un periodo designado
tiene una distribución de Poisson con parámetro 20 (sugerido en el artículo “Dynamic Ride Sharing: Theory and
Practice”, J. of Transp. Engr., 1997: 308–312). ¿Cuál es la
probabilidad de que el número de conductores
a. sea cuando mucho de 10?
b. sea de más de 20?
c. sea de entre 10 y 20, inclusive? ¿Sea estrictamente de entre 10 y 20?
d. esté dentro de dos desviaciones estándar del valor medio?
82. Considere escribir en un disco de computadora y luego enviarlo a través de un certificador que cuenta el número de pulsos
faltantes. Suponga que este número X tiene una distribución
de Poisson con parámetro 0.2. (Sugerido en “Average
Sample Number for Semi-Curtailed Sampling Using the Poisson Distribution”, J. Quality Technology, 1983: 126–129.)
a. ¿Cuál es la probabilidad de que un disco tenga exactamente un pulso faltante?
b. ¿Cuál es la probabilidad de que un disco tenga por lo menos dos pulsos faltantes?
c. Si seleccionan dos discos independientemente, ¿cuál es la
probabilidad de que ninguno contenga un pulso faltante?
83. Un artículo en Los Ángeles Times (3 de diciembre de 1993)
reporta que una de cada 200 personas portan el gen defectuoso que provoca cáncer de colon hereditario. En una
muestra de 1000 individuos, ¿cuál es la distribución aproximada del número que porta este gen? Use esta distribución
para calcular la probabilidad aproximada de que
a. Entre 5 y 8 (inclusive) porten el gen.
b. Por lo menos 8 porten el gen.
84. Suponga que sólo 0.10% de todas las computadoras de cierto tipo experimentan fallas del CPU durante el periodo de
garantía. Considere una muestra de 10 000 computadoras.
a. ¿Cuáles son el valor esperado y la desviación estándar
del número de computadoras en la muestra que tienen el
defecto?
b. ¿Cuál es la probabilidad (aproximada) de que más de 10
computadoras muestreadas tengan el defecto?
c. ¿Cuál es la probabilidad (aproximada) de que ninguna
computadora muestreada tenga el defecto?
85. Suponga que una pequeña aeronave aterriza en un aeropuerto de acuerdo con un proceso de Poisson con razón 8
por hora de modo que el número de aterrizajes durante un
periodo de t horas es una variable aleatoria de Poisson con
parámetro 8t.
a. ¿Cuál es la probabilidad de que exactamente seis aeronaves pequeñas aterricen durante un intervalo de una hora?
¿Por lo menos seis? ¿Por lo menos 10?
b. ¿Cuáles son el valor esperado y la desviación estándar
del número de aeronaves pequeñas que aterrizan durante
un lapso de 90 min?
c. ¿Cuál es la probabilidad de que por lo menos 20 aerona1
ves pequeñas aterricen durante un lapso de 2 2 -horas? ¿De
qué cuando mucho aterricen 10 durante este periodo?
86. El número de personas que llegan para tratamiento a una
sala de urgencias puede ser modelado mediante un proceso
de Poisson con parámetro de razón de cinco por hora.
a. ¿Cuál es la probabilidad de que ocurran exactamente
cuatro arribos durante una hora particular?
b. ¿Cuál es la probabilidad de que por lo menos cuatro personas arriben durante una hora particular?
c. ¿Cuántas personas espera que arriben durante un periodo
de 45 min?
87. El número de solicitudes de ayuda recibidas por un servicio
de grúas es un proceso de Poisson con razón 4 por hora.
a. Calcule la probabilidad de que exactamente diez solicitudes sean recibidas durante un periodo particular de 2 horas.
b. Si los operadores del servicio de grúas hacen una pausa
de 30 min para el almuerzo, ¿cuál es la probabilidad de
que no dejen de atender llamadas de ayuda?
c. ¿Cuántas llamadas esperaría durante esta pausa?
88. Al someter a prueba tarjetas de circuito, la probabilidad de
que cualquier diodo particular falle es de 0.01. Suponga que
una tarjeta de circuito contiene 200 diodos.
a. ¿Cuántos diodos esperaría que fallen y cuál es la desviación estándar del número que se espera fallen?
b. ¿Cuál es la probabilidad (aproximada) de que por lo menos
cuatro diodos fallen en una tarjeta seleccionada al azar?
c. Si se envían cinco tarjetas a un cliente particular, ¿qué tan
probable es que por lo menos cuatro de ellas funcionen
apropiadamente? (Una tarjeta funciona apropiadamente
sólo si todos sus diodos funcionan.)
89. El artículo “Reliability-Based Service-Life Assessment of
Aging Concrete Structures”. (J. Structural Engr., 1993:
1600–1621) sugiere que un proceso de Poisson puede ser
utilizado para representar la ocurrencia de cargas estructurales en el transcurso del tiempo. Suponga que el tiempo medio
entre ocurrencias de cargas es de 0.5 al año.
a. ¿Cuántas cargas se espera que ocurran durante un periodo de 2 años?
b. ¿Cuál es la probabilidad de que ocurran más de cinco
cargas durante un periodo de 2 años?
c. ¿Qué tan largo debe ser un periodo de modo que la probabilidad de que no ocurran cargas durante dicho periodo
sea cuando mucho de 0.1?
www.FreeLibros.me
c3_p086-129.qxd
126
3/12/08
CAPÍTULO 3
4:01 AM
Page 126
Variables aleatorias discretas y distribuciones de probabilidad
90. Si X tiene una distribución de Poisson con parámetro . Demuestre que E(X) derivada directamente de la definición de valor esperado. [Sugerencia: El primer término en la
suma es igual a 0 y luego x puede ser eliminada. Ahora saque como factor a y demuestre que la suma es uno.]
91. Suponga que hay árboles distribuidos en un bosque de
acuerdo con un proceso de Poisson bidimensional con parámetro , el número esperado de árboles por acre es de 80.
a. ¿Cuál es la probabilidad de que en un terreno de un cuarto de acre, haya cuando mucho 16 árboles?
b. Si el bosque abarca 85 000 acres, ¿cuál es el número esperado de árboles en el bosque?
c. Suponga que selecciona un punto en el bosque y construye un círculo de 0.1 milla de radio. Sea X el número de
árboles dentro de esa región circular. ¿Cuál es la función
masa de probabilidad de X? [Sugerencia: 1 milla cuadrada 640 acres.]
92. A una estación de inspección de equipo vehicular llegan automóviles de acuerdo con un proceso de Poisson con razón
10 por hora. Suponga que un vehículo que llega con
probabilidad de 0.5 no tendrá violaciones de equipo.
a. ¿Cuál es la probabilidad de que exactamente diez lleguen
durante la hora y que los diez no tengan violaciones?
b. Con cualquier y 10 fija, ¿cuál es la probabilidad de que
y automóviles lleguen durante la hora, diez de los cuales
no tengan violaciones?
c. ¿Cuál es la probabilidad de que lleguen diez carros “sin
violaciones” durante la siguiente hora? [Sugerencia: Sume
la probabilidades en el inciso b) desde y 10 hasta .]
93. a. En un proceso de Poisson, ¿qué tiene que suceder tanto en
el intervalo de tiempo (0, t) como en el intervalo (t, t
t) de modo que no ocurran eventos en todo el intervalo
(0, t t)? Use esto y las suposiciones 1–3 para escribir
una relación entre P0(t t) y P0(t).
b. Use el resultado del inciso a) para escribir una expresión
para la diferencia P0(t t) P0(t). Divida entonces entre t y permita que t A 0 para obtener una ecuación
que implique (d/dt)P0(t), la derivada de P0(t) con respecto a t.
c. Verifique que P0(t) et satisface la ecuación del inciso b).
d. Se puede demostrar de manera similar a los incisos a) y
b) que Pk(t)s debe satisfacer el sistema de ecuaciones diferenciales
d
dt
Pk(t) Pk1(t) Pk(t)
k 1, 2, 3, . . .
Verifique que Pk(t) e t (t)k/k! satisface el sistema. (En
realidad esta es la única solución.)
EJERCICIOS SUPLEMENTARIOS (94-122)
94. Considere un mazo compuesto de siete cartas, marcadas 1,
2, . . . , 7. Se seleccionan al azar tres de estas cartas. Defina
una variable aleatoria W como W la suma de los números
resultantes y calcule la función masa de probabilidad de W.
Calcule entonces y 2. [Sugerencia: Considere los resultados sin orden, de modo que (1, 3, 7) y (3, 1, 7) no son resultados diferentes. Entonces existen 35 resultados y pueden
ser puestos en lista. (Este tipo de variable aleatoria en realidad se presenta en conexión con una prueba de hipótesis llamada prueba de suma de filas de Wilcoxon, en la cual hay
una muestra x y una muestra y y W es la suma de las filas de
x en la muestra combinada.)]
95. Después de barajar un mazo de 52 cartas, un tallador reparte 5. Sea X el número de palos representados en la mano
de 5 cartas.
a. Demuestre que la función masa de probabilidad de X es
x
1
2
3
4
p(x)
0.002
0.146
0.588
0.264
[Sugerencia: p(1) 4P(todas son espadas), p(2) 6P(sólo
espadas y corazones con por lo menos una de cada palo) y
p(4) 4P(2 espadas una de cada otro palo).]
b. Calcule , 2 y .
96. La variable aleatoria binomial negativa X se definió como el número de fallas (F) que preceden al r-ésimo éxito (S). Sea Y
el número de ensayos necesarios para obtener el r-ésimo éxito
(S). Del mismo modo en que fue derivada la función masa de
probabilidad, derive la función masa de probabilidad de Y.
97. De todos los clientes que adquieren abrepuertas de cochera
automáticas, 75% adquieren el modelo de transmisión por
cadena. Sea X el número entre los siguientes 15 compradores que seleccionan el modelo de transmisión por cadena.
a. ¿Cuál es la función masa de probabilidad de X?
b. Calcule P(X 10).
c. Calcule P(6 X 10).
d. Calcule y 2.
e. Si la tienda actualmente tiene en existencia 10 modelos
de transmisión por cadena y 8 modelos de transmisión
por flecha, ¿cuál es la probabilidad de que las solicitudes
de estos 15 clientes puedan ser satisfechas con las existencias actuales?
98. Un amigo recientemente planeó un viaje de campamento.
Tenía dos linternas, una que requería una sola batería de 6 V
y otra que utilizaba dos baterías de tamaño D. Antes había
empacado dos baterías de 6 V y cuatro tamaño D en su
“camper”. Suponga que la probabilidad de que cualquier batería particular funcione es p y que las baterías funcionan o
fallan independientemente una de otra. Nuestro amigo desea
llevar sólo una linterna. ¿Con qué valores de p deberá llevar
la linterna de 6 V?
99. Un sistema k de n es uno que funcionará si y sólo si por lo
menos k de los n componentes individuales en el sistema
funcionan. Si los componentes individuales funcionan independientemente uno de otro, cada uno con probabilidad de
0.9, ¿cuál es la probabilidad de que un sistema 3 de 5 funcione?
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 127
Ejercicios suplementarios
100. Un fabricante de baterías para linternas desea controlar la
calidad de sus productos rechazando cualquier lote en el
que la proporción de baterías que tienen un voltaje inaceptable parezca ser demasiado alto. Con esta finalidad, de
cada lote de 10 000 baterías, se seleccionaron y probarán
25. Si por lo menos 5 de estas generan un voltaje inaceptable, todo el lote será rechazado. ¿Cuál es la probabilidad de
que un lote será rechazado si
a. 5% de las baterías en el lote tienen voltajes inaceptables?
b. 10% de las baterías en el lote tienen voltajes inaceptables?
c. 20% de las baterías en el lote tienen voltajes inaceptables?
d. ¿Qué les sucedería a las probabilidades en los incisos
a)–c) si el número de rechazo crítico se incrementara de
5 a 6?
101. De las personas que pasan a través de un detector de metales en un aeropuerto, el 0.5% lo activan; sea X el número entre un grupo de 500 seleccionado al azar que activan
el detector.
a. ¿Cuál es la función masa de probabilidad (aproximada)
de X?
b. Calcule P(X 5).
c. Calcule P(5 X).
102. Una firma consultora educativa está tratando de decidir si
los estudiantes de preparatoria que nunca antes han utilizado una calculadora de mano pueden resolver cierto tipo de
problema más fácilmente con una calculadora que utiliza
lógica polaca inversa o una que no utiliza esta lógica. Se
selecciona una muestra de 25 estudiantes y se les permite
practicar con ambas calculadoras. Luego a cada estudiante
se le pide que resuelva un problema con la calculadora polaca inversa y un problema similar con la otra. Sea p
P(S), donde S indica que un estudiante resolvió el problema más rápido con la lógica polaca inversa que sin ella y
sea X número de éxitos.
a. Si p 0.5, ¿cuál es P(7 X 18)?
b. Si p 0.8, ¿cuál es P(7 X 18)?
c. Si la pretensión de que p 0.5 tiene que ser rechazada
cuando X 7 o X 18, ¿cuál es la probabilidad de rechazar la pretensión cuando en realidad es correcta?
d. Si la decisión de rechazar la pretensión p 0.5 se hace
como en el inciso c), ¿cuál es la probabilidad de que la
pretensión no sea rechazada cuando p 0.6? ¿Cuándo
p 0.8?
e. ¿Qué regla de decisión escogería para rechazar la pretensión de que p 0.5 si desea que la probabilidad en
el inciso c) sea cuando mucho de 0.01?
103. Considere una enfermedad cuya presencia puede ser identificada por medio de un análisis de sangre. Sea p la probabilidad de que un individuo seleccionado al azar tenga la
enfermedad. Suponga se seleccionan independientemente
n individuos para analizarlos. Una forma de proceder es
analizar cada una de las n muestras de sangre. Un procedimiento potencialmente más económico, de análisis en
grupo se introdujo durante la Segunda Guerra Mundial para identificar hombres sifilíticos entre los reclutas. En primer lugar, se toma una parte de cada muestra de sangre, se
combinan estos especímenes y se realiza un solo análisis.
Si ninguno tiene la enfermedad, el resultado será negativo
127
y sólo se requiere un análisis. Si por lo menos un individuo
está enfermo, el análisis de la muestra combinada dará un
resultado positivo, en cuyo caso se realizan los análisis de
los n individuos. Si p 0.1 y n 3, ¿cuál es el número esperado de análisis si se utiliza este procedimiento? ¿Cuál
es el número esperado cuando n 5? [El artículo “Random Multiple-Access Communication and Group Testing”
(IEEE Trans. on Commun., 1984: 769–774) aplicó estas
ideas a un sistema de comunicación en el cual la dicotomía
fue usuario ocioso/activo en lugar de enfermo/no enfermo.]
104. Sea p1 la probabilidad de que cualquier símbolo de código
particular sea erróneamente transmitido a través de un
sistema de comunicación. Suponga que en diferentes símbolos, ocurren errores de manera independiente uno de
otro. Suponga también que con probabilidad p2 un símbolo erróneo es corregido al ser recibido. Sea X el número de
símbolos correctos en un bloque de mensaje compuesto
de n símbolos (una vez que el proceso de corrección ha terminado). ¿Cuál es la distribución de probabilidad de X?
105. El comprador de una unidad generadora de potencia requiere de arranques consecutivos exitosos antes de aceptar la unidad. Suponga que los resultados de arranques individuales
son independientes entre sí. Sea p la probabilidad de que
cualquier arranque particular sea exitoso. La variable aleatoria de interés es X el número de arranques que deben hacerse antes de la aceptación. Dé la función masa de
probabilidad de X en el caso c 2. Si p 0.9, ¿cuál es P(X
8)? [Sugerencia: Con x 5, exprese p(x) “recursivamente” en términos de la función masa de probabilidad evaluada con los valores más pequeños x 3, x 4, . . . , 2.]
(Este problema fue sugerido del artículo “Evaluation of a
Start-Up Demonstration Test”, J. Quality Technology,
1983: 103–106.)
106. Una aerolínea ha desarrollado un plan para un club de viajeros ejecutivos sobre la premisa de que 10% de sus clientes actuales calificarían para membresía.
a. Suponiendo la validez de esta premisa, entre 25 clientes
actuales seleccionados al azar, ¿cuál es la probabilidad
de que entre 2 y 6 (inclusive) califiquen para membresía?
b. De nuevo suponiendo la validez de la premisa, ¿cuál es
el número esperado de clientes que califican y la desviación estándar del número que califica en una muestra
aleatoria de 100 clientes actuales?
c. Sea X el número en una muestra al azar de 25 clientes
actuales que califican para membresía. Considere rechazar la premisa de la compañía a favor de la pretensión
de que p 0.10 si x 7. ¿Cuál es la probabilidad de
que la premisa de la compañía sea rechazada cuando en
realidad es válida?
d. Remítase a la regla de decisión introducida en el inciso
c). ¿Cuál es la probabilidad de que la premisa de la
compañía no sea rechazada aun cuando p 0.20 (es decir, 20% califican)?
107. 40% de las semillas de mazorcas de maíz (maíz moderno)
portan sólo una espiga y el 60% restante portan dos espigas.
Una semilla con una espiga producirá una mazorca con espigas únicas 29% del tiempo, en tanto que una semilla con
dos espigas producirán una mazorca con espigas únicas
26% del tiempo. Considere seleccionar al azar diez semillas.
www.FreeLibros.me
c3_p086-129.qxd
128
3/12/08
CAPÍTULO 3
4:01 AM
Page 128
Variables aleatorias discretas y distribuciones de probabilidad
a. ¿Cuál es la probabilidad de que exactamente cinco de estas semillas porten una sola espiga y de que produzcan
una mazorca con una sola espiga?
b. ¿Cuál es la probabilidad de que exactamente cinco de
estas mazorcas producidas por estas semillas tengan espigas únicas? ¿Cuál es la probabilidad de que cuando
mucho cinco mazorcas tengan espigas únicas?
108. Un juicio terminó con el jurado en desacuerdo porque ocho
de sus miembros estuvieron a favor de un veredicto de culpabilidad y los otros cuatro estuvieron a favor de la absolución. Si los jurados salen de la sala en orden aleatorio y
cada uno de los primeros cuatro que salen de la sala es acosado por un reportero para entrevistarlo, ¿cuál es la función
masa de probabilidad de X el número de jurados a favor
de la absolución entre los entrevistados? ¿Cuántos de los
que están a favor de la absolución espera que sean entrevistados?
109. Un servicio de reservaciones emplea cinco operadores de
información que reciben solicitudes de información independientemente uno de otro, cada uno de acuerdo con un
proceso de Poisson con razón 2 por minuto.
a. ¿Cuál es la probabilidad de que durante un periodo de
un min dado, el primer operador no reciba solicitudes?
b. ¿Cuál es la probabilidad de que durante un periodo de
un min dado, exactamente cuatro de los cinco operadores no reciban solicitudes?
c. Escriba una expresión para la probabilidad de que durante un periodo de un min dado, todos los operadores
reciban exactamente el mismo número de solicitudes.
110. En un gran campo se distribuyen al azar las langostas de
acuerdo con una distribución de Poisson con parámetro
2 por yarda cuadrada. ¿Qué tan grande deberá ser el
radio R de una región de muestreo circular para que la probabilidad de hallar por lo menos una en la región sea igual
a 0.99?
111. Un puesto de periódicos ha pedido cinco ejemplares de
cierto número de una revista de fotografía. Sea X el número de individuos que vienen a comprar esta revista. Si X
tiene una distribución de Poisson con parámetro 4,
¿cuál es el número esperado de ejemplares que serán vendidos?
112. Los individuos A y B comienzan a jugar una secuencia de
partidas de ajedrez. Sea S {A gana un juego} y suponga
que los resultados de juegos sucesivos son independientes
con P(S) p y P(F) 1 p (nunca empatan). Jugarán
hasta que uno de ellos gane diez juegos. Sea X el número de partidas jugadas (con posibles valores 10, 11, . . . ,
19).
a. Con x 10, 11, . . . , 19, obtenga una expresión para
p(x) P(X x).
b. Si un empate es posible, con p P(S), q P(F), 1
p q P(empate), ¿cuáles son los posibles valores de
X? ¿Cuál es P(20 X)? [Sugerencia: P(20 X) 1
P(X 20).]
113. Un análisis para detectar la presencia de una enfermedad
tiene una probabilidad de 0.20 de dar un resultado falso positivo (lo que indica que un individuo tiene la enfermedad
cuando éste no es el caso) y una probabilidad de 0.10 de
dar un resultado falso negativo. Suponga que diez individuos
son analizados, cinco de los cuales tienen la enfermedad y
cinco de los cuales no. Sea X el número de lecturas positivas que resultan.
a. ¿Tiene X una distribución binomial? Explique su razonamiento.
b. ¿Cuál es la probabilidad de que exactamente tres de
diez resultados sean positivos?
114. La función masa de probabilidad binomial negativa generalizada está dada por
nb(x; r, p) k(r, x) pr(1 p)x
x 0, 1, 2, . . .
Sea X el número de plantas de cierta especie encontrada en
una región particular y tenga esta distribución con p 0.3 y
r 2.5. ¿Cuál es P(X 4)? ¿Cuál es la probabilidad de
que por lo menos se encuentre una planta?
115. Defina una función p(x; , ) mediante
p(x; , )
{
1
e
2
x
1
e
x!
2
0
x
x!
x 0, 1, 2, . . .
de lo contrario
a. Demuestre que p(x; , ) satisface las dos condiciones
necesarias para especificar una función masa de probabilidad. [Nota: Si una firma emplea dos mecanógrafos,
uno de los cuales comete errores tipográficos a razón de
por página y el otro a razón de por página y cada
uno ellos realiza la mitad del trabajo de mecanografía
de la firma, entonces p(x; , ) es la función masa de
probabilidad de X el número de errores en una página escogida al azar.]
b. Si el primer mecanógrafo (razón ) teclea 60% de todas
las páginas, ¿cuál es la función masa de probabilidad de
X del inciso a)?
c. ¿Cuál es E(X) para p(x; , ) dada por la expresión mostrada?
d. ¿Cuál es 2 para p(x; , ) dada por esta expresión?
116. La moda de una variable aleatoria discreta X con función
masa de probabilidad p(x) es ese valor x* con el cual p(x)
alcanza su valor más grande (el valor x más probable).
a. Sea X
Bin(n, p). Considerando la razón b(x 1; n,
p)/b(x; n, p), demuestre que b(x; n, p) se incrementa con
x en tanto x np (1 p). Concluya que el modo x*
es el entero que satisface (n 1)p 1 x* (n 1)p.
b. Demuestre que si X tiene una distribución de Poisson
con parámetro , la moda es el entero más grande menor que . Si es un entero, demuestre que tanto 1
como son modas.
117. Un disco duro de computadora tiene diez pistas concéntricas, numeradas 1, 2, . . . , 10 desde la más externa hasta la
más interna y un solo brazo de acceso. Sea pi la probabilidad de que cualquier solicitud particular de datos hará
que el brazo se vaya a la pista i (i 1, . . . , 10. Suponga que las pistas accesadas en búsquedas sucesivas son independientes. Sea X el número de pistas sobre las cuales
pasa el brazo de acceso durante dos solicitudes sucesivas
(excluida la pista que el brazo acaba de dejar, así que los
www.FreeLibros.me
c3_p086-129.qxd
3/12/08
4:01 AM
Page 129
Ejercicios suplementarios
valores posibles son x 0, 1, . . . , 9). Calcule la función
masa de probabilidad de X [Sugerencia: P(el brazo
está ahora sobre la pista i y X j) P(X j°el
brazo está ahora sobre i) pi. Una vez que se escribe la
probabilidad condicional en función de p1, . . . , p10, mediante la ley de la probabilidad total, se obtiene la probabilidad deseada sumando a lo largo de i.]
118. Si X es una variable aleatoria hipergeométrica demuestre
directamente con la definición que E(X) nM/N (considere sólo el caso n M). [Sugerencia: Saque como factor a
nM/N de la suma para E(X) y demuestre que los términos
adentro de la suma son de la forma h(y; n 1, M 1,
N 1) donde y x 1.]
119. Use el hecho de que
(x )2p(x)
(x )2p(x)
x:°x° k
todos x
para comprobar la desigualdad de Chebyshev dada en el
ejercicio 44.
120. El proceso de Poisson simple de la sección 3.6 está caracterizado por una razón constante a la cual los eventos ocurren por unidad de tiempo. Una generalización de esto es
suponer que la probabilidad de que ocurra exactamente un
evento en el intervalo [t, t t] es (t) t o(t). Se
puede demostrar entonces que el número de eventos que
ocurren durante un intervalo [t1, t2] tiene una distribución
de Poisson con parámetro
t2
t1
(t) dt
La ocurrencia de eventos en el transcurso del tiempo en esta
situación se llama proceso de Poisson no homogéneo. El
artículo “Inference Based on Retrospective Ascertainment”, J. Amer. Stat. Assoc., 1989: 360–372, considera la
función de intensidad
(t) eabt
en su forma apropiada para eventos que implican la transmisión VIH (el virus del SIDA) vía transfusiones sanguíneas. Suponga que a 2 y b 0.6 (cercanos a los valores
sugeridos en el artículo), con el tiempo en años.
a. ¿Cuál es el número esperado de eventos en el intervalo
[0, 4?]? ¿En [2, 6]?
129
b. ¿Cuál es la probabilidad de que cuando mucho ocurran
15 eventos en el intervalo [0, 0.9907]?
121. Considere un conjunto de A1, . . . , Ak de eventos mutuamente excluyentes y exhaustivos y una variable aleatoria X
cuya distribución depende de cuál de los eventos Ai ocurra
(p. ej., un viajero abonado podría seleccionar una de tres
rutas posibles de su casa al trabajo, con X como el tiempo
de recorrido). Sea E(X°Ai) el valor esperado de X dado que
el evento Ai ocurre. Entonces se puede demostrar que E(X)
E (X°Ai) ? P(Ai) el promedio ponderado de las “expectativas condicionales” individuales donde las ponderaciones son las probabilidades de la división de eventos.
a. La duración esperada de una llamada de voz a un número telefónico particular es de 3 minutos, mientras que la
duración esperada de una llamada de datos a ese mismo
número es de 1 minuto. Si 75% de las llamadas son de
voz, ¿cuál es la duración esperada de la siguiente llamada?
b. Una pastelería vende tres diferentes tipos de galletas
con briznas de chocolate. El número de briznas de chocolate en un tipo de galleta tiene una distribución de
Poisson con parámetro i i 1 (i 1, 2, 3). Si 20%
de todos los clientes que compran una galleta con briznas de chocolate selecciona el primer tipo, 50% elige el
segundo tipo y el 30% restante opta por el tercer tipo,
¿cuál es el número esperado de briznas en una galleta
comprada por el siguiente cliente?
122. Considere una fuente de comunicaciones que transmite paquetes que contienen lenguaje digitalizado. Después de cada
transmisión, el receptor envía un mensaje que indica si
la transmisión fue exitosa o no. Si una transmisión no es
exitosa, el paquete es reenviado. Suponga que el paquete de
voz puede ser transmitido un máximo de 10 veces. Suponiendo que los resultados de transmisiones sucesivas son
independientes una de otra y que la probabilidad de que
cualquier transmisión particular sea exitosa es p, determine
la función masa de probabilidad de la variable aleatoria
X el número de veces que un paquete es transmitido.
Luego obtenga una expresión para el número de veces esperado que un paquete es transmitido.
Bibliografía
Johnson, Norman, Samuel Kotz y Adrienne Kemp. Discrete Univariate Distributions. Wiley, Nueva York, 1972. Una enciclopedia de información sobre distribuciones discretas.
Olkin, Ingram, Cyrus Derman y Leon Gleser, Probability Models
and Applications (2a. ed.), Macmillan, Nueva York, 1994.
Contiene una discusión a fondo tanto de las propiedades gene-
rales de distribuciones discretas y continuas como los resultados para distribuciones específicas.
Ross, Sheldon, Introduction to Probability Models (7a. ed.), Academic Press, Nueva York, 2003. Una fuente de material sobre
el proceso de Poisson y generalizaciones y una amena introducción a otros temas de probabilidad aplicada.
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4
4:04 AM
Page 130
Variables aleatorias
continuas y distribuciones
de probabilidad
INTRODUCCIÓN
El capítulo 3 se concentró en el desarrollo de distribuciones de probabilidad de variables aleatorias discretas. En este capítulo se estudia el segundo tipo general de variable
aleatoria que se presenta en muchos problemas aplicados. Las secciones 4.1 y 4.2
presentan las definiciones y propiedades básicas de las variables aleatorias continuas
y sus distribuciones de probabilidad. En la sección 4.3, se estudia en detalle la variable aleatoria normal y su distribución, sin duda la más importante y útil en la probabilidad y estadística. Las secciones 4.4 y 4.5 se ocupan de otras distribuciones
continuas utilizadas con frecuencia en trabajo aplicado. En la sección 4.6, se introduce un método de evaluar si un dato muestral es compatible con una distribución especificada.
130
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:04 AM
Page 131
4.1 Funciones de densidad de probabilidad
131
4.1 Funciones de densidad de probabilidad
Una variable aleatoria (va) discreta es una cuyos valores posibles o constituyen un conjunto finito o bien pueden ser puestos en lista en una secuencia infinita (una lista en la cual existe un primer elemento, un segundo elemento, etc.). Una variable aleatoria cuyo conjunto de
valores posibles es un intervalo completo de números no es discreta.
Recuérdese de acuerdo con el capítulo 3 que una variable aleatoria X es continua si
1) sus valores posibles comprenden un solo intervalo sobre la línea de numeración (para alguna A B, cualquier número x entre A y B es un valor posible) o una unión de intervalos
disjuntos y 2) P(X c) 0 para cualquier número c que sea un valor posible de X.
Ejemplo 4.1
En el estudio de la ecología de un lago, se mide la profundidad en lugares seleccionados,
entonces X la profundidad en ese lugar es una variable aleatoria continua. En este caso A
es la profundidad mínima en la región muestreada y B es la profundidad máxima.
■
Ejemplo 4.2
Si se selecciona al azar un compuesto químico y se determina su pH X, entonces X es una
variable aleatoria continua porque cualquier valor pH entre 0 y 14 es posible. Si se conoce
más sobre el compuesto seleccionado para su análisis, entonces el conjunto de posibles valores podría ser un subintervalo de [0, 14], tal como 5.5 x 6.5 pero X seguiría siendo
continua.
■
Ejemplo 4.3
Sea X la cantidad de tiempo que un cliente seleccionado al azar pasa esperando que le corten el pelo antes de que comience su corte de pelo. El primer pensamiento podría ser que X
es una variable aleatoria continua, puesto que se requiere medirla para determinar su valor.
Sin embargo, existen clientes suficientemente afortunados que no tienen que esperar antes
de sentarse en el sillón del peluquero. Así que el caso debe ser P(X 0) 0. Condicional
en cuanto a los sillones vacíos, aun cuando, el tiempo de espera será continuo puesto que X
podría asumir entonces cualquier valor entre un tiempo mínimo posible A y un tiempo máximo posible B. Esta variable aleatoria no es ni puramente discreta ni puramente continua
sino que es una mezcla de los dos tipos.
■
Se podría argumentar que aunque en principio las variables tales como altura, peso y
temperatura son continuas, en la práctica las limitaciones de los instrumentos de medición
nos restringen a un mundo discreto (aunque en ocasiones muy finamente subdividido). Sin
embargo, los modelos continuos a menudo representan muy bien de forma aproximada situaciones del mundo real y con frecuencia es más fácil trabajar con matemáticas continuas
(el cálculo) que con matemáticas de variables discretas y distribuciones.
Distribuciones de probabilidad de variables continuas
Supóngase que la variable X de interés es la profundidad de un lago en un punto sobre la superficie seleccionado al azar. Sea M la profundidad máxima (en metros), así que cualquier número en el intervalo [0, M] es un valor posible de X. Si se “discretiza” X midiendo
la profundidad al metro más cercano, entonces los valores posibles son enteros no negativos
menores que o iguales a M. La distribución discreta resultante de profundidad se ilustra con
un histograma de probabilidad. Si se traza el histograma de modo que el área del rectángulo sobre cualquier entero posible k sea la proporción del lago cuya profundidad es (al metro más cercano) k, entonces el área total de todos los rectángulos es 1. En la figura 4.1a)
aparece un posible histograma.
Si se mide la profundidad con mucho más precisión y se utiliza el mismo eje de medición de la figura 4.1a), cada rectángulo en el histograma de probabilidad resultante es mucho más angosto, aun cuando el área total de todos los rectángulos sigue siendo 1. En la
www.FreeLibros.me
c4_p130-183.qxd
132
3/12/08
CAPÍTULO 4
4:04 AM
Page 132
Variables aleatorias continuas y distribuciones de probabilidad
figura 4.1b) se ilustra un posible histograma; tiene una apariencia mucho más regular que el
histograma de la figura 4.1a). Si se continúa de esta manera midiendo la profundidad más y
más finamente, la secuencia resultante de histogramas se aproxima a una curva más regular,
tal como la ilustrada en la figura 4.1c). Como en cada histograma el área total de todos los
rectángulos es igual a 1, el área total bajo la curva regular también es 1. La probabilidad de
que la profundidad en un punto seleccionado al azar se encuentre entre a y b es simplemente el área bajo la curva regular entre a y b. Es de manera exacta una curva regular del tipo
ilustrado en la figura 4.1c) la que especifica un distribución de probabilidad continua.
0
M
0
M
a)
0
M
b)
c)
Figura 4.1 a) Histograma de probabilidad de profundidad medida al metro más cercano; b) histograma
de probabilidad de profundidad medida al centímetro más cercano; c) un límite de una secuencia de histogramas discretos.
DEFINICIÓN
Sea X una variable aleatoria continua. Entonces, una distribución de probabilidad o
función de densidad de probabilidad (fdp) de X es una función f(x) tal que para dos
números cualesquiera a y b con a b,
P(a X b)
b
f (x) dx
a
Es decir, la probabilidad de que X asuma un valor en el intervalo [a, b] es el área sobre este intervalo y bajo la gráfica de la función de densidad, como se ilustra en la figura 4.2. La gráfica de f(x) a menudo se conoce como curva de densidad.
x
a
Figura 4.2
b
P (a X b) el área debajo de la curva de densidad entre a y b.
Para que f(x) sea una función de densidad de probabilidad legítima, debe satisfacer las
dos siguientes condiciones:
1. f(x)
2.
Ejemplo 4.4
0 con todas las x
f(x) dx área bajo la curva f (x)
1
La dirección de una imperfección con respecto a una línea de referencia sobre un objeto circular tal como un neumático, un rotor de freno o un volante está, en general, sujeta a incertidumbre. Considérese la línea de referencia que conecta el vástago de la válvula de un neumático con
su punto central y sea X el ángulo medido en el sentido de las manecillas del reloj con respecto
a la ubicación de una imperfección. Una posible función de densidad de probabilidad de X es
Ï 1
f (x) 360 0 x 360
Ó 0 de lo contrario
Ì
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:04 AM
Page 133
133
4.1 Funciones de densidad de probabilidad
La función de densidad de probabilidad aparece dibujada en la figura 4.3. Claramente f(x)
0. El área bajo la curva de densidad es simplemente el área de un rectángulo (altura)
1
(base) ( 360 )(360) 1. La probabilidad de que el ángulo esté entre 90° y 180° es
180
P(90 X 180)
90
1
x
dx
360
360
°
x180
x90
1
0.25
4
La probabilidad de que el ángulo de ocurrencia esté dentro de 90° de la línea de referencia
es
P(0 X 90) P(270 X 360) 0.25 0.25 0.50
f(x)
f(x)
Área sombreada P(90 X 180)
1
360
x
x
0
360
Figura 4.3
90
180
270
360
■
Función de densidad de probabilidad del ejemplo 4.4.
Como siempre que 0 a b 360 en el ejemplo 4.4, P(a X b) depende sólo del ancho b a del intervalo, se dice que X tiene una distribución uniforme.
DEFINICIÓN
Se dice que una variable aleatoria continua X tiene una distribución uniforme en el
intervalo [A, B] si la función de densidad de probabilidad de X es
Ï 1
f (x; A, B) B A
Ó 0
Ì
AxB
de lo contrario
La gráfica de cualquier función de densidad de probabilidad uniforme es como la de la figura 4.3 excepto que el intervalo de densidad positiva es [A, B] en lugar de [0, 360].
En el caso discreto, una función masa de probabilidad indica cómo estan distribuidas
pequeñas “manchas” de masa de probabilidad de varias magnitudes a lo largo del eje de
medición. En el caso continuo, la densidad de probabilidad está “dispersa” en forma continua a lo largo del intervalo de posibles valores. Cuando la densidad está dispersa uniformemente a lo largo del intervalo, se obtiene una función de densidad de probabilidad uniforme
como en la figura 4.3.
Cuando X es una variable aleatoria discreta, a cada valor posible se le asigna una probabilidad positiva. Esto no es cierto en el caso de una variable aleatoria continua (es decir,
se satisface la segunda condición de la definición) porque el área bajo una curva de densidad situada sobre cualquier valor único es cero:
PsX 5 cd 5
c
c
fsxd dx 5 lim
´
eS0
ce
ce
fsxd dx 5 0
El hecho de que P(X c) 0 cuando X es continua tiene una importante consecuencia práctica: La probabilidad de que X quede en algún intervalo entre a y b no depende de
si el límite inferior a o el límite superior b está incluido en el cálculo de probabilidad
P(a X b) P(a X b) P(a X b) P(a X b)
www.FreeLibros.me
(4.1)
c4_p130-183.qxd
134
3/12/08
CAPÍTULO 4
4:04 AM
Page 134
Variables aleatorias continuas y distribuciones de probabilidad
Si X es discreta y tanto a como b son valores posibles (p. ej., X es binomial con n 20 y
a 5, b 10), entonces cuatro de estas probabilidades son diferentes.
La condición de probabilidad cero tiene un análogo físico. Considérese una barra
circular sólida con área de sección transversal 1 pulg2. Coloque la barra a lo largo de un
eje de medición y supóngase que la densidad de la barra en cualquier punto x está dada por
el valor f(x) de una función de densidad. Entonces si la barra se rebana en los puntos a y b
y este segmento se retira, la cantidad de masa eliminada es ba f (x) dx; si la barra se rebana
exactamente en el punto c, no se elimina masa. Se asigna masa a segmentos de intervalo de
la barra pero no a puntos individuales.
Ejemplo 4.5
“Intervalo de tiempo” en el flujo de tránsito es el tiempo transcurrido entre el tiempo en que
un carro termina de pasar por un punto fijo y el instante en que el siguiente carro comienza
a pasar por ese punto. Sea X el intervalo de tiempo de dos carros consecutivos seleccionados al azar en una autopista durante un periodo de tráfico intenso. La siguiente función
de densidad de probabilidad de X es en esencia el sugerido en “The Statistical Properties of
Freeway Traffic” (Transp. Res. vol. 11: 221-228):
f (x) Ï0.15e
Ì
0
Ó
0.15(x0.5)
x 0.5
de lo contrario
La gráfica de f(x) se da en la figura 4.4; no hay ninguna densidad asociada con intervalos de tiempo de menos de 0.5 y la densidad del intervalo decrece con rapidez (exponencial) a medida que x se incrementa a partir de 0.5. Claramente, f(x) 0; para demostrar que
kx
dx (1/k)e k a.
f (x) dx 1, se utiliza el resultado obtenido con cálculo integral a e
Entonces
f (x) dx
0.5
0.15(x0.5)
0.15e
0.15e0.075
dx 0.15e0.075
1
e
0.15
f (x)
0.15
(0.15)(0.5)
0.5
e
0.15x
dx
1
P(X 5)
x
0
2
4
6
8
10
0.5
Figura 4.4
Curva de densidad del intervalo de tiempo entre vehículos en el ejemplo 4.5.
La probabilidad de que el intervalo de tiempo sea cuando mucho de 5 segundos es
5
P(X 5)
0.15e0.075
e
5
f (x) dx
0.075
( e
0.5
5
0.5
0.75
e
0.15e
0.15x
e
0.15(x0.5)
dx
dx 0.15e0.075
0.075
1
e
0.15
°
0.15x
x5
x0.5
) 1.078( 0.472 0.928) 0.491
P(menos de 5 seg) P(X 5)
■
A diferencia las distribuciones discretas tales como la binomial, la hipergeométrica y
la binomial negativa, la distribución de cualquier variable aleatoria continua dada en general no puede ser derivada mediante simples argumentos probabilísticos. En cambio, se debe
hacer una selección juiciosa de la función de densidad de probabilidad basada en conocimientos previos y en los datos disponibles. Afortunadamente, existen algunas familias generales de funciones de densidad de probabilidad que se ajustan bien a una amplia variedad
de situaciones experimentales; varias de éstas se discuten más adelante en el capítulo.
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:04 AM
Page 135
4.1 Funciones de densidad de probabilidad
135
Exactamente como en el caso discreto, a menudo es útil pensar en la población de interés
como compuesta de valores X en lugar de individuos u objetos. La función de densidad de probabilidad es entonces un modelo de la distribución de valores en esta población numérica y con
base en este modelo se pueden calcular varias características de la población (tal como la media).
EJERCICIOS
Sección 4.1 (1-10)
1. Sea X la cantidad de tiempo durante la cual un libro puesto
en reserva durante dos horas en la biblioteca de una universidad es solicitado en préstamo por un estudiante seleccionado y suponga que X tiene la función de densidad
Ï0.5x
0x2
de lo contrario
f(x) Ì
Ó0
Calcule las siguientes probabilidades:
a. P(X 1)
b. P(0.5 X 1.5)
c. P(1.5 X)
2. Suponga que la temperatura de reacción X (en °C) en cierto proceso químico tiene una distribución uniforme con
A 5 y B 5.
a. Calcule P(X 0).
b. Calcule P( 2.5 X 2.5).
c. Calcule P( 2 X 3).
d. Para que k satisfaga 5 k k 4 5, calcule
P(k X k 4).
3. El error implicado al hacer una medición es una variable
aleatoria continua X con función de densidad de probabilidad
Ï0.09375(4
x )
f(x) Ì
0 Ó de lo contrario
a.
b.
c.
d.
4. Sea X el esfuerzo vibratorio (lb/pulg2) en el aspa de una turbina de viento a una velocidad del viento particular en un
túnel aerodinámico. El artículo “Blade Fatigue Life Assessment with Application to VAWTS” (J. Solar Energy Engr.
1982: 107-111) propone la distribución Rayleigh, con función de densidad de probabilidad
Ïx
ÌÓ
2
2
e x /(2
0
Ï kx2
f(x) Ì
Ó0
2
)
x0
de lo contrario
como modelo de la distribución X.
a. Verifique que f(x; ) es una función de densidad de probabilidad legítima.
b. Suponga que 100 (un valor sugerido por una gráfica
en el artículo). ¿Cuál es la probabilidad de que X es cuando mucho de 200? ¿Menos de 200? ¿Por lo menos de 200?
c. ¿Cuál es la probabilidad de que X esté entre 100 y 200
(de nuevo con 100)?
d. Dé una expresión para P(X x).
5. Un profesor universitario nunca termina su disertación antes del final de la hora y siempre termina dentro de 2 minutos después de la hora. Sea X el tiempo que transcurre
0x2
de lo contrario
a. Determine el valor de k y trace la curva de densidad correspondiente. [Sugerencia: El área total bajo la gráfica
de f(x) es 1.]
b. ¿Cuál es la probabilidad de que la disertación termine
dentro de un minuto del final de la hora?
c. ¿Cuál es la probabilidad de que la disertación continúe
después de la hora durante entre 60 y 90 segundos.
d. ¿Cuál es la probabilidad de que la disertación continúe
durante por lo menos 90 segundos después del final de
la hora?
6. El peso de lectura real de una pastilla de estéreo ajustado a
3 gramos en un tocadiscos particular puede ser considerado
como una variable aleatoria continua X con función de densidad de probabilidad
Ï k[1 (x 3)2]
f(x) Ì
2x2
2
Bosqueje la gráfica de f(x).
Calcule P(X 0).
Calcule P( 1 X 1).
Calcule P(X 0.5 o X 0.5).
f(x; )
entre el final de la hora y el final de la disertación y suponga que la función de densidad de probabilidad de X es
Ó0
2x4
de lo contrario
a. Trace la gráfica de f(x).
b. Determine el valor de k.
c. ¿Cuál es la probabilidad de que el peso real de lectura
sea mayor que el peso prescrito?
d. ¿Cuál es la probabilidad de que el peso real de lectura
esté dentro de 0.25 gramos del peso prescrito?
e. ¿Cuál es la probabilidad de que el peso real difiera del
peso prescrito por más de 0.5 gramos?
7. Se cree que el tiempo X (min) para que un ayudante de laboratorio prepare el equipo para cierto experimento tiene
una distribución uniforme con A 25 y B 35.
a. Determine la función de densidad de probabilidad de X
y trace la curva de densidad de correspondiente.
b. ¿Cuál es la probabilidad de que el tiempo de preparación
exceda de 33 min?
c. ¿Cuál es la probabilidad de que el tiempo de preparación
esté dentro de dos min del tiempo medio? [Sugerencia:
Identifique en la gráfica de f(x).]
d. Con cualquier a de modo que 25 a a 2 35,
¿cuál es la probabilidad de que el tiempo de preparación
esté entre a y a 2 min?
8. Para ir al trabajo, primero tengo que tomar un camión cerca
de mi casa y luego tomar un segundo camión. Si el tiempo de
espera (en minutos) en cada parada tiene una distribución
uniforme con A 0 y B 5, entonces se puede demostrar
que el tiempo de espera total Y tiene la función de densidad
de probabilidad
www.FreeLibros.me
c4_p130-183.qxd
136
3/12/08
CAPÍTULO 4
f(y)
4:04 AM
Page 136
Variables aleatorias continuas y distribuciones de probabilidad
Ï
Ì
Ó
a. Cuando mucho de seis segundos?
b. De más de seis segundos? ¿Por lo menos de seis segundos?
c. De entre cinco y seis segundos?
1
y
0y5
25
2
1
y 5 y 10
25
5
0
y 0 o y 10
10. Una familia de funciones de densidad de probabilidad que
ha sido utilizada para aproximar la distribución del ingreso,
el tamaño de la población de una ciudad y el tamaño de firmas es la familia Pareto. La familia tiene dos parámetros,
k y , ambos 0 y la función de densidad de probabilidad es
a. Trace la gráfica de la función de densidad de probabilidad de Y.
b. Verifique que
f(y) dy 1.
c. ¿Cuál es la probabilidad de que el tiempo de espera total sea cuando mucho de tres minutos?
d. ¿Cuál es la probabilidad de que el tiempo de espera
total sea cuando mucho de ocho minutos?
e. ¿Cuál es la probabilidad de que el tiempo de espera total esté entre tres y ocho minutos?
f. ¿Cuál es la probabilidad de que el tiempo de espera total sea de menos de 2 minutos o de más de 6 minutos?
Ïk
Ì
k
x
f(x; k, ) x
Ó 0
k1
x
a. Trace la gráfica de f(x; k, ).
b. Verifique que el área total bajo la gráfica es igual a 1.
c. Si la variable aleatoria X tiene una función de densidad
de probabilidad f(x; k, ), con cualquier b , obtenga
una expresión para P(X b).
d. Con a b, obtenga una expresión para la probabilidad P(a X b).
9. Considere de nuevo la función de densidad de probabilidad
de X intervalo de tiempo dado en el ejemplo 4.5. ¿Cuál
es la probabilidad de que el intervalo de tiempo sea
4.2 Funciones de distribución acumulativa
y valores esperados
Varios de los más importantes conceptos introducidos en el estudio de distribuciones discretas también desempeñan un importante papel en las distribuciones continuas. Definiciones
análogas a las del capítulo 3 implican reemplazar la suma por integración.
Función de distribución acumulativa
La función de distribución acumulativa F(x) de una variable aleatoria discreta X da, con cualquier
número especificado x, la probabilidad P(X x). Se obtiene sumando la función masa de probabilidad p(y) a lo largo de todos los valores posibles y que satisfacen y x. La función de distribución acumulativa de una variable aleatoria continua da las mismas probabilidades P(X x)
y se obtiene integrando la función de densidad de probabilidad f(y) entre los límites y x.
DEFINICIÓN
La función de distribución acumulativa F(x) de una variable aleatoria continua X se
define para todo número x como
F(x) P(X x)
x
f (y) dy
Con cada x, F(x) es el área bajo la curva de densidad a la izquierda de x. Esto se ilustra en
la figura 4.5, donde F(x) se incrementa con regularidad a medida que x se incrementa.
f (x)
F (x)
1
F(8)
F(8)
0.5
x
5
10
8
Figura 4.5
x
5
10
8
Una función de densidad de probabilidad y función de distribución acumulativa asociada.
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:04 AM
Page 137
4.2 Funciones de distribución acumulativa y valores esperados
Ejemplo 4.6
137
Sea X el espesor de una cierta lámina de metal con distribución uniforme en [A, B]. La función de densidad se muestra en la figura 4.6. Con x A, F(x) 0, como no hay área bajo
la gráfica de la función de densidad a la izquierda de la x. Con x B, F(x) 1, puesto que
toda el área está acumulada a la izquierda de la x. Finalmente con A x B,
yx
F(x)
x
x
f (y) dy
A
°
1
1
xA
dy
y°
BA
B A ° yA B A
f (x)
Área sombreada F(x)
1
B A
1
B A
A
Figura 4.6
B
x
A
x B
Función de densidad de probabilidad de una distribución uniforme.
La función de distribución acumulativa completa es
F(x)
Ï x 0 A
ÌÓ
BA
1
xA
AxB
x
B
La gráfica de esta función de distribución acumulativa aparece en la figura 4.7.
F (x)
1
A
Figura 4.7
B
x
Función de distribución acumulativa de una distribución uniforme.
■
Utilización de F(x) para calcular probabilidades
La importancia de la función de distribución acumulativa en este caso, lo mismo que para variables aleatorias discretas, es que las probabilidades de varios intervalos pueden ser calculadas
con una fórmula o una tabla de F(x).
PROPOSICIÓN
Sea X una variable aleatoria continua con función de densidad de probabilidad f(x) y
función de distribución acumulativa F(x). Entonces con cualquier número a,
P(X a) 1 F(a)
y para dos números cualesquiera a y b con a b.
P(a X b) F(b) F(a)
www.FreeLibros.me
c4_p130-183.qxd
138
3/12/08
CAPÍTULO 4
4:04 AM
Page 138
Variables aleatorias continuas y distribuciones de probabilidad
La figura 4.8 ilustra la segunda parte de esta proposición; la probabilidad deseada es el área
sombreada bajo la curva de densidad entre a y b y es igual a la diferencia entre las dos
áreas sombreadas acumulativas. Esto es diferente de lo que es apropiado para una variable
aleatoria discreta de valor entero (p. ej., binomial o Poisson): P(a X b) F(b) F(a 1)
cuando a y b son enteros.
f (x)
a
b
Figura 4.8
Ejemplo 4.7
b
a
Cálculo de P (a X b) a partir de probabilidades acumulativas.
Suponga que la función de densidad de probabilidad de la magnitud X de una carga dinámica sobre un puente (en newtons) está dada por
3
Ï1
x 0x2
f(x) 8
8
Ó 0
de lo contrario
Ì
Para cualquier número x entre 0 y 2,
F(x)
x
f(y) dy
x
0
8 8 y dy 8 16 x
1
3
x
3
2
Por lo tanto
Ïx
ÌÓ
0
3 2
F(x)
x
8
16
1
x0
0x2
2x
Las gráficas de f(x) y F(x) se muestran en la figura 4.9. La probabilidad de que la carga esté
entre 1 y 1.5 es
P(1 X 1.5) F(1.5) F(1)
1
1
3
3
(1.5)
(1.5)2
(1)
(1)2
8
8
16
16
19
0.297
64
La probabilidad de que la carga sea de más de uno es
P(X 1) 1 P(X 1) 1 F(1) 1
11
0.688
16
f (x)
1
3
2
F (x)
1
7
8
1
8
0
8 (1) 16 (1)
x
2
x
2
Figura 4.9 Función de densidad de probabilidad y función de distribución acumulativa del ejemplo 4.7. ■
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:04 AM
Page 139
4.2 Funciones de distribución acumulativa y valores esperados
139
Una vez que se obtiene la función de distribución acumulativa, cualquier probabilidad
que implique X es fácil de calcular sin cualquier integración adicional.
Obtención de f(x) a partir de F(x)
Para X discreta, la función masa de probabilidad se obtiene a partir de la función de distribución acumulativa considerando la diferencia entre dos valores F(x). El análogo continuo
de una diferencia es una derivada. El siguiente resultado es una consecuencia del teorema
fundamental del cálculo.
PROPOSICIÓN
Si X es una variable aleatoria continua con función de densidad de probabilidad f(x)
y función de distribución acumulativa F(x), entonces con cada x hace posible que la
derivada F(x) exista, F(x) f(x).
Ejemplo 4.8
Cuando X tiene una distribución uniforme, F(x) es derivable excepto con x A y x B, donde la gráfica de F(x) tiene esquinas afiladas. Como F(x) 0 con x A y F(x) 1 con x
B. F(x) 0 f(x) con dicha x. Con A x B,
(continuación
del ejemplo
4.6)
F(x)
d xA
1
f(x)
dx B A
BA
■
Percentiles de una distribución continua
Cuando se dice que la calificación de un individuo en una prueba fue el 85o percentil de la
población, significa que 85% de todas las calificaciones de la población estuvieron por debajo de dicha calificación y que 15% estuvo arriba. Asimismo, el 40o percentil es la calificación que sobrepasa 40% de todas las calificaciones y que es superada por 60% de todas
las calificaciones.
DEFINICIÓN
Sea p un número entere 0 y 1. El (100p)o percentil de la distribución de una variable
aleatoria continua X, denotada por (p), se define como
p F( (p))
( p)
f (y) dy
(4.2)
De acuerdo con la expresión (4.2), (p) es ese valor sobre el eje de medición de tal suerte
que el 100p% del área bajo la gráfica de f(x) queda a la izquierda de (p) y 100(1 p)% queda a la derecha. Por lo tanto, (0.75), el 75o percentil, es tal que el área bajo la gráfica de f(x)
a la izquierda de (0.75) es 0.75. La figura 4.10 ilustra la definición.
f (x)
Área sombreada p
( p)
Figura 4.10
x
F(x)
1
p F( ( p))
( p)
El (100p)o percentil de una distribución continua.
www.FreeLibros.me
x
c4_p130-183.qxd
140
3/12/08
CAPÍTULO 4
4:04 AM
Page 140
Variables aleatorias continuas y distribuciones de probabilidad
Ejemplo 4.9
La distribución de la cantidad de grava (en toneladas) vendida por una compañía de materiales para la construcción particular en una semana dada es una variable aleatoria continua
X con función de densidad de probabilidad
Ï 3 (1 x2) 0 x 1
f(x) 2
Ó
de lo contrario
0
Ì
La función de distribución acumulativa de las ventas para cualquier x entre 0 y 1 es
F(x)
x
0
yx
3
3
y3 °
3
x3
(1 y2) dy
y
x
°
2
2
3 ° y0 2
3
Las gráficas tanto de f(x) como de F(x) aparecen en la figura 4.11. El (100p)o percentil de
esta distribución satisface la ecuación
p F( (p))
3
2
(p)
( ( p))3
3
es decir,
( (p))3 3 (p) 2p 0
Para el 50o percentil, p 0.5 y la ecuación que se tiene que resolver es 3 3 1 0;
la solución es (0.5) 0.347. Si la distribución no cambia de una semana a otra, entonces a la larga 50% de todas las semanas se realizarán ventas de menos de 0.347 ton y
50% de más de 0.347 ton.
f (x)
F(x)
1.5
1
0.5
0
1
x
0 0.347
1
x
Figura 4.11 Función de densidad de probabilidad y función de distribución acumulativa del ejemplo 4.9. ■
DEFINICIÓN
La mediana de una distribución continua, denotada por ,
˜ es el 50o percentil, así que
˜ satisface 0.5 F( ).
˜ Es decir, la mitad del área bajo la curva de densidad se encuentra a la izquierda de ˜ y la mitad a la derecha de ˜ .
Una distribución continua cuya función de densidad de probabilidad es simétrica, lo cual
significa que la gráfica a la izquierda de un punto en particular es una imagen a espejo de la
gráfica a la derecha de dicho punto, tiene una mediana ˜ igual al punto de simetría, puesto
que la mitad del área bajo la curva queda a uno u otro lado de este punto. La figura 4.12 da
varios ejemplos. A menudo se supone que el error en la medición de una cantidad física tiene una distribución simétrica.
f (x)
f (x)
f (x)
x
A
˜
B
x
˜
Figura 4.12
Medianas y distribuciones simétricas.
www.FreeLibros.me
x
˜
c4_p130-183.qxd
3/12/08
4:04 AM
Page 141
4.2 Funciones de distribución acumulativa y valores esperados
141
Valores esperados
Para una variable aleatoria discreta X, E(X) se obtuvo sumando x p(x) a lo largo de posibles
valores de X. Aquí se reemplaza la suma con la integración y la función masa de probabilidad
por la función de densidad de probabilidad para obtener un promedio ponderado continuo.
DEFINICIÓN
El valor esperado o valor medio de una variable aleatoria continua X con función de
densidad de probabilidad f(x) es
X E(X)
Ejemplo 4.10
x f (x) dx
La función de densidad de probabilidad de las ventas semanales de grava X fue
(continuación
del ejemplo
4.9)
Ï 3 (1 x2) 0 x 1
f(x) 2
Ó 0
de lo contrario
Ì
por lo tanto
E(X)
3
2
x f(x) dx
1
0
1
x
0
(x x3) dx
3
(1 x2) dx
2
x1
3 x2
x4 °
3
°
2 2
4 ° x0 8
■
Cuando la función de densidad de probabilidad f(x) especifica un modelo para la distribución de valores en una población numérica, entonces es la media de la población, la
cual es la medida más frecuentemente utilizada de la ubicación o centro de la población.
Con frecuencia se desea calcular el valor esperado de alguna función h(X) de la variable aleatoria X. Si se piensa en h(X) como una nueva variable aleatoria Y, se utilizan técnicas de estadística matemática para derivar la función de densidad de probabilidad de Y y
E(Y) se calcula a partir de la definición. Afortunadamente, como en el caso discreto, existe
una forma más fácil de calcular E[h(X)].
PROPOSICIÓN
Si X es una variable aleatoria continua con función de densidad de probabilidad f(x)
y h(X) es cualquier función de X, entonces
E[h(X)] h(X)
Ejemplo 4.11
h(x) f(x) dx
Dos especies compiten en una región por el control de una cantidad limitada de un cierto recurso. Sea X la proporción del recurso controlado por la especie 1 y suponga que la función de densidad de probabilidad de X es
Ï1
f(x) Ì
Ó0
0x1
de lo contrario
la cual es una distribución uniforme en [0, 1]. (En su libro Ecological Diversity, E. C. Pielou
llama a esto el modelo del “palo roto” para la asignación de recursos, puesto que es análogo
www.FreeLibros.me
c4_p130-183.qxd
142
3/12/08
CAPÍTULO 4
4:04 AM
Page 142
Variables aleatorias continuas y distribuciones de probabilidad
a la ruptura de un palo en un lugar seleccionado al azar.) Entonces la especie que controla
la mayor parte de este recurso controla la cantidad
1
Ï 1 X si 0 X
2
h(X) máx(X, 1 X)
1
si X 1
ÓX
2
Ì
La cantidad esperada controlada por la especie que controla la mayor parte es entonces
E[h(X)]
1/2
0
1
máx(x, 1 x) f(x) dx
(1 x) 1 dx
1
1/2
0
máx(x, 1 x) 1 dx
x 1 dx
3
4
■
Para h(X) una función lineal, E[h(X)] E(aX b) aE(X) b.
En el caso discreto, la varianza de X se definió como la desviación al cuadrado esperada con
respecto a y se calculó por medio de suma. En este caso de nuevo la integración reemplaza a la suma.
La varianza de una variable aleatoria continua X con función de densidad de probabilidad f(x) y valor medio es
DEFINICIÓN
X2 V(X)
(x )2 f(x) dx E[(X )2]
La desviación estándar (DE) de X es X V
(X
) .
La varianza y la desviación estándar dan medidas cuantitativas de cuánta dispersión hay
en la distribución o población de valores x. La forma más fácil de calcular 2 es utilizar una
fórmula abreviada.
V(X) E(X 2) [E(X)]2
PROPOSICIÓN
Para X ventas semanales de grava, se calcula E(X) 8 . Como
3
Ejemplo 4.12
(continuación
del ejemplo
4.10)
E(X 2)
x2 f(x) dx
1
0
x2
3
(1 x2) dx
2
3 2
1
(x x 4) dx
2
5
1
3 2
19
V(X)
0.059
5
8
320
1
0
y
X 0.244
■
Cuando h(X) aX b, el valor esperado y la varianza de h(X) satisfacen las mismas propiedades que en el caso discreto: E[h(X)] a b y V[h(X)] a2 2.
EJERCICIOS
Sección 4.2 (11-27)
11. La función de distribución acumulativa del tiempo de préstamo X como se describe en el ejercicio 1 es
F(x)
Ïxx2 0
ÌÓ
4
1
0x2
2x
Use ésta para calcular lo siguiente:
a. P(X 1)
b. P(0.5 X 1)
c. P(X 0.5)
d. El tiempo de préstamo medio ˜ [resolver 0.5 F( )]
˜
e. F(x) para obtener la función de densidad f(x)
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:04 AM
Page 143
4.2 Funciones de distribución acumulativa y valores esperados
f. E(X)
g. V(X) y X
h. Si al prestatario se le cobra una cantidad h(X) X2 cuando el tiempo de préstamo es X, calcule el cobro esperado
E[h(X)].
12. La función de distribución acumulativa de X ( error de
medición) del ejercicio 3 es
x 2
Ï 0
3
1
x3
4x
2x2
F(x)
32
2
3
2x
Ó 1
a. Calcule P(X 0).
b. Calcule P(1 X 1).
c. Calcule P(0.5 X).
d. Verifique que f(x) está dada en el ejercicio 3 obteniendo
F’(x).
e. Verifique que ˜ 0.
13. El ejemplo 4.5 introdujo el concepto de intervalo de tiempo
en el flujo de tránsito y propuso una distribución particular
para X el intervalo de tiempo entre dos carros consecutivos seleccionados al azar (s). Suponga que en un entorno de
tránsito diferente, la distribución del intervalo de tiempo
tiene la forma
Ïk x 1
f(x) x 4
Ó0 x 1
Ì
Ì
a. Determine el valor de k con el cual f(x) es una función de
densidad de probabilidad legítima.
b. Obtenga la función de distribución acumulativa.
c. Use la función de distribución acumulativa de (b) para
determinar la probabilidad de que el intervalo de tiempo
exceda de 2 segundos y también la probabilidad de que
el intervalo esté entre 2 y 3 segundos.
d. Obtenga un valor medio del intervalo de tiempo y su
desviación estándar.
e. ¿Cuál es la probabilidad de que el intervalo de tiempo
quede dentro de una desviación estándar del valor medio?
14. El artículo “Modeling Sediment and Water Column Interactions for Hidrophobic Pollutants” (Water Research, 1984:
1169-1174) sugiere la distribución uniforme en el intervalo
7.5, 20) como modelo de profundidad (cm) de la capa de
bioturbación en sedimento en una región.
a. ¿Cuáles son la media y la varianza de la profundidad?
b. ¿Cuál es la función de distribución acumulativa de la
profundidad?
c. ¿Cuál es la probabilidad de que la profundidad observada sea cuando mucho de 10? ¿Entre 10 y 15?
d. ¿Cuál es la probabilidad de que la profundidad observada esté dentro de una desviación estándar del valor medio? ¿Dentro de dos desviaciones estándar?
15. Sea X la cantidad de espacio ocupado por un artículo colocado en un contenedor de un pie3. La función de densidad
de probabilidad de X es
Ï 90x8(1 x)
0x1
de lo contrario
0
a. Dibuje la función de densidad de probabilidad. Luego
obtenga la función de distribución acumulativa de X y
dibújela.
f(x) Ì
Ó
143
b. ¿Cuál es P(X 0.5) [es decir, F(0.5)]?
c. Con la función de distribución acumulativa de (a), ¿cuál
es P(0.25 X 0.5)? ¿Cuál es P(0.25 X 0.5)?
d. ¿Cuál es el 75o percentil de la distribución?
e. Calcule E(X) y X.
f. ¿Cuál es la probabilidad de que X esté a más de una desviación estándar de su valor medio?
16. Responda los incisos a)-f) del ejercicio 15 con X tiempo
de disertación después de la hora dado en el ejercicio 5.
17. Si la distribución de X en el intervalo [A, B] es uniforme.
a. Obtenga una expresión para el (100p)o percentil.
b. Calcule E(X), V(X) y X.
c. Con n, un entero positivo, calcule E(Xn).
18. Sea X el voltaje a la salida de un micrófono y suponga que
X tiene una distribución uniforme en el intervalo de 1 a 1.
El voltaje es procesado por un “limitador duro” con valores
de corte de 0.5 y 0.5, de modo que la salida del limitador
es una variable aleatoria Y relacionada con X por Y X si
|X| 0.5, Y 0.5 si X 5 y Y 0.5 si X 0.5.
a. ¿Cuál es P(Y 0.5)?
b. Obtenga la función de distribución acumulativa de Y y
dibújela.
19. Sea X una variable aleatoria continua con función de distribución acumulativa
Ïx
x0
4
1 ln
0x4
F(x)
4
x
1
x4
[Este tipo de función de distribución acumulativa es sugerido en el artículo “Variabilitiy in Measured Bedload-Transport Rates” (Water Resources Bull., 1985: 39-48) como
modelo de cierta variable hidrológica.] Determinar:
a. P(X 1)
b. P(1 X 3)
c. La función de densidad de probabilidad de X
Ì
Ó
0
20. Considere la función de densidad de probabilidad del tiempo de espera total Y de dos camiones
1
y
0y5
25
1
f(y) 2
y 5 y 10
25
5
0
de lo contrario
Ï
Ì
Ó
introducida en el ejercicio 8.
a. Calcule y trace la función de distribución acumulativa
de Y. [Sugerencia: Considere por separado 0 y 5 y
5 y 10 al calcular F(y). Una gráfica de la función
de densidad de probabilidad debe ser útil.]
b. Obtenga una expresión para el (100p)o percentil. [Sugerencia: Considere por separado 0 p 0.5 y 0.5 p 1.]
c. Calcule E(Y) y V(Y). ¿Cómo se comparan estos valores
con el tiempo de espera probable y la varianza de un
solo camión cuando el tiempo está uniformemente distribuido en [0, 5]?
21. Un ecólogo desea marcar una región de muestreo circular
de 10 m de radio. Sin embargo, el radio de la región resultante en realidad es una variable aleatoria R con función de
densidad de probabilidad
www.FreeLibros.me
c4_p130-183.qxd
144
3/12/08
CAPÍTULO 4
4:04 AM
Page 144
Variables aleatorias continuas y distribuciones de probabilidad
Ï 3 [1 (10 r)2] 9 r 11
ÌÓ
f(r) 4
de lo contrario
0
¿Cuál es el área esperada de la región circular resultante?
22. La demanda semanal de gas propano (en miles de galones)
de una instalación particular es una variable aleatoria X con
función de densidad de probabilidad
f(x)
Ï2 1 1
2
ÌÓ
x
0
1x2
de lo contrario
a. Calcule la función de distribución acumulativa de X.
b. Obtenga una expresión para el (100p)o percentil. ¿Cuál
es el valor de ?
˜
c. Calcule E(X) y V(X).
d. Si 1500 galones están en existencia al principio de la semana y no se espera ningún nuevo suministro durante
la semana, ¿cuántos de los 1500 galones se espera que
queden al final de la semana? [Sugerencia: Sea h(x)
cantidad que queda cuando la demanda es x.]
23. Si la temperatura a la cual cierto compuesto se funde es una
variable aleatoria con valor medio de 120°C y desviación estándar de 2°C, ¿cuáles son la temperatura media y la desviación estándar medidas en °F? [Sugerencia: °F 1.8°C 32.]
24. La función de densidad de probabilidad de Pareto de X es
f(x; k, )
Ïk
ÌÓ
k
x k1
0
x
x
introducida en el ejercicio 10.
a. Si k 1, calcule E(X).
b. ¿Qué se puede decir sobre E(X) si k 1?
c. Si k 2, demuestre que V(X) k 2(k 1)2(k 2)1.
d. Si k 2, ¿qué se puede decir sobre V(X)?
e. ¿Qué condiciones en cuanto a k son necesarias para garantizar que E(Xn) es finito?
25. Sea X la temperatura en °C a la cual ocurre una reacción química y sea Y la temperatura en °F (así que Y 1.8X 32).
a. Si la mediana de la distribución X es ˜ , demuestre que
1.8 ˜ 32 es la mediana de la distribución Y.
b. ¿Cómo está relacionado el 90o percentil de la distribución Y con el 90o de la distribución X? Verifique su conjetura.
c. Más generalmente, si Y aX b, ¿cómo está relacionado cualquier percentil de la distribución Y con el percentil correspondiente de la distribución X?
26. Sea X los gastos médicos totales (en miles de dólares) incurridos por un individuo particular durante un año dado.
Aunque X es una variable aleatoria discreta, suponga que
su distribución es bastante bien aproximada por una distribución continua con función de densidad de probabilidad
f(x) k(1 x/2.5)7 con x 0.
a. ¿Cuál es el valor de k?
b. Dibuje la función de densidad de probabilidad de X.
c. ¿Cuáles son el valor esperado y la desviación estándar
de los gastos médicos totales?
d. Un individuo está cubierto por un plan de aseguramiento
que le impone una provisión deducible de $500 (así que
los primeros $500 de gastos son pagados por el individuo).
Luego el plan pagará 80% de cualquier gasto adicional que
exceda de $500 y el pago máximo por parte del individuo
(incluida la cantidad deducible) es de $2500. Sea Y la cantidad de gastos médicos de este individuo pagados por la
compañía de seguros. ¿Cuál es el valor esperado de Y?
[Sugerencia: Primero indague qué valor de X corresponde al gasto máximo que sale del bolsillo de $2500. Luego escriba una expresión para Y como una función de X
(la cual implique varios precios diferentes) y calcule el
valor esperado de la función.]
27. Cuando se lanza un dardo a un blanco circular, considere la
ubicación del punto de aterrizaje respecto al centro. Sea X
el ángulo en grados medido con respecto a la horizontal
y suponga que X está uniformemente distribuida en [0, 360].
Defina Y como la variable transformada Y h(X)
(2/360)X , por lo tanto, Y es el ángulo medido en radianes y Y está entre y . Obtenga E(Y) y y obteniendo
primero E(X) y X y luego utilizando el hecho de que h(X)
es una función lineal de X.
4.3 Distribución normal
La distribución normal es la más importante en toda la probabilidad y estadística. Muchas poblaciones numéricas tienen distribuciones que pueden ser representadas muy fielmente por
una curva normal apropiada. Los ejemplos incluyen estaturas, pesos y otras características físicas (el famoso artículo Biométrica 1903 “On the Laws of Inheritance in Man” discutió muchos ejemplos de esta clase), errores de medición en experimentos científicos, mediciones
antropométricas en fósiles, tiempos de reacción en experimentos psicológicos, mediciones de
inteligencia y aptitud, calificaciones en varios exámenes y numerosas medidas e indicadores
económicos. Incluso cuando la distribución subyacente es discreta, la curva normal a menudo da una excelente aproximación. Además, aun cuando las variables individuales no estén
www.FreeLibros.me
3/12/08
4:04 AM
Page 145
4.3 Distribución normal
145
normalmente distribuidas, las sumas y promedios de las variables en condiciones adecuadas
tendrán de manera aproximada una distribución normal; este es el contenido del Teorema del
Límite Central discutido en el siguiente capítulo.
DEFINICIÓN
Se dice que una variable aleatoria continua X tiene una distribución normal con parámetros y (o y 2), donde y o, si la función de densidad de
probabilidad de X es
f(x; , )
1
e
22p s
2
2
(x) /(2 )
x
(4.3)
De nuevo e denota la base del sistema de logaritmos naturales y es aproximadamente igual
a 2.71828 y representa la conocida constante matemática con un valor aproximado de
3.14159. El enunciado de que X está normalmente distribuida con los parámetros y 2 a
menudo se abrevia como X N(, 2).
Claramente f(x; , ) 0 aunque se tiene que utilizar un argumento de cálculo un
tanto complicado para verificar que f(x; , ) dx 1. Se puede demostrar que E(X)
y V(X) 2, de modo que los parámetros son la media y la desviación estándar de X. La figura 4.13 representa gráficas de f(x; , ) de varios pares diferentes (, ). Cada curva de
densidad es simétrica con respecto a y acampanada, de modo que el centro de la campana (punto de simetría) es tanto la media de la distribución como la mediana. El valor de
es la distancia desde hasta los puntos de inflexión de la curva (los puntos donde la curva
cambia de virar hacia abajo a virar hacia arriba). Los grandes valores de producen gráficas que están bastante extendidas en torno a , en tanto que los valores pequeños de dan
gráficas con una alta cresta sobre y la mayor parte del área bajo de la gráfica bastante cerca de . Así pues, una grande implica que se puede observar muy bien un valor de X alejado de , en tanto que dicho valor es bastante improbable cuando es pequeña.
⎧
⎨
⎩
c4_p130-183.qxd
Figura 4.13
Curvas de densidad normal.
Distribución normal estándar
Para calcular P(a X b) cuando X es una variable aleatoria normal con parámetros y ,
se debe determinar
b
a
1
e
22p s
2
2
(x) /(2 )
dx
(4.4)
Ninguna de las técnicas estándar de integración puede ser utilizada para evaluar la expresión (4.4). En cambio, con 0 y 1, se calculó la expresión (4.4) por medio de técnicas numéricas y se tabuló para ciertos valores de a y b. Esta tabla también puede ser
utilizada para calcular probabilidades con cualesquiera otros valores de y considerados.
www.FreeLibros.me
c4_p130-183.qxd
146
3/12/08
CAPÍTULO 4
4:04 AM
Page 146
Variables aleatorias continuas y distribuciones de probabilidad
La distribución normal con valores de parámetro 0 y 1 se llama distribución normal estándar. Una variable aleatoria que tiene una distribución normal estándar se llama variable aleatoria normal estándar y se denotará por Z. La función
de densidad de probabilidad de Z es
DEFINICIÓN
1
e z /2
z
2
La gráfica de f(z; 0, 1) se llama curva normal estándar (o z). La función de distribución acumulativa de Z es P(Z z) z f(y; 0, 1) dy, la cual será denotada por (z).
f(z; 0, 1)
2
La distribución normal estándar no sirve con frecuencia como modelo de una población que surge naturalmente. En cambio, es una distribución de referencia de la que se
puede obtener información sobre otra distribución normal. La tabla A.3 del apéndice, da
(z) P(Z z), el área bajo la curva de densidad normal estándar a la izquierda de z con
z 3.49, 3.48, . . . , 3.48, 3.49. La figura 4.14 ilustra el tipo de área acumulativa (probabilidad) tabulada en la tabla A.3. Con esta tabla, varias probabilidades que implican Z
pueden ser calculadas.
Área sombreada (z)
Curva normal estándar (z)
0
Figura 4.14
Ejemplo 4.13
z
Áreas acumulativas normales estándar tabuladas en la tabla A.3 del apéndice.
Determínense las siguientes probabilidades normales estándar: (a) P(Z 1.25), (b) P(Z
1.25), (c) P(Z 1.25) y (d) P(0.38 Z 1.25).
a.
P(Z 1.25) (1.25), una probabilidad tabulada en la tabla A.3 del apéndice en la intersección de la fila 1.2 y la columna 0.05. El número allí es 0.8944, así que P(Z 1.25)
0.8944. La figura 4.15(a) ilustra esta probabilidad.
Área sombreada (1.25)
0
a)
Figura 4.15
b.
c.
curva z
1.25
curva z
0
b)
1.25
Áreas (probabilidades) de curvas normales del ejemplo 4.13.
P(Z 1.25) 1 P(Z 1.25) 1 (1.25), el área bajo la curva z a la derecha
de 1.25 (un área de cola superior). En ese caso (1.25) 0.8944 implica que P(Z
1.25) 0.1056. Como Z es una variable aleatoria continua, P(Z 1.25) 0.1056.
Véase la figura 4.15(b).
P(Z 1.25) (1.25), un área de cola inferior. Directamente de la tabla A.3 del
apéndice (1.25) 0.1056. Por simetría de la curva z, ésta es la misma respuesta
del inciso b).
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:04 AM
Page 147
4.3 Distribución normal
147
d. P(0.38 Z 1.25) es el área bajo la curva normal estándar sobre el intervalo cuyo
punto extremo izquierdo es 0.38 y cuyo punto extremo derecho es 1.25. Según la sección 4.2, si X es una variable aleatoria continua con función de distribución acumulativa
F(x), entonces P(a X b) F(b) F(a). Por lo tanto, P(0.38 Z 1.25)
(1.25) (0.38) 0.8944 0.3520 0.5424. (Véase la figura 4.16.)
curva z
0.38 0
Figura 4.16
1.25
0
1.25
0.38 0
P(0.38 Z 1.25) como la diferencia entre dos áreas acumulativas.
■
Percentiles de la distribución normal estándar
Con cualquier p entre 0 y 1, se puede utilizar la tabla A.3 del apéndice para obtener el
(100p)o percentil de la distribución normal estándar.
Ejemplo 4.14
El 99o percentil de la distribución normal estándar es el valor sobre el eje horizontal tal que
el área bajo la curva z a la izquierda de dicho valor es 0.9900. La tabla A.3 del apéndice da
con z fija el área bajo la curva normal estándar a la izquierda de z, mientras que aquí se tiene
el área y se desea el valor de z. Este es problema “inverso” a P(Z z) ? así que la tabla
se utiliza a la inversa: Encuentre en la mitad de la tabla 0.9900; la fila y la columna en la que se
encuentra identificado el 99o percentil z. En este caso 0.9901 queda en la intersección
de la fila 2.3 y la columna 0.03, así que el 99o percentil es (aproximadamente) z 2.33.
(Véase la figura 4.17). Por simetría, el primer percentil está tan debajo de 0 como el 99o está
sobre 0, así que es igual a 2.33 (1% queda debajo del primero y también sobre el 99o).
(Véase la figura 4.18.)
Área sombreada 0.9900
curva z
0
99o percentil
Localización del 99o percentil.
Figura 4.17
curva z
Área sombreada 0.01
0
2.33 1er percentil
Figura 4.18
2.33 99o percentil
Relación entre el 1er y 99o percentiles.
www.FreeLibros.me
■
c4_p130-183.qxd
148
3/12/08
CAPÍTULO 4
4:04 AM
Page 148
Variables aleatorias continuas y distribuciones de probabilidad
En general, la fila y la columna de la tabla A.3 del apéndice, donde el ingreso p está
localizado identifican el (100p)o percentil (p. ej., el 67o percentil se obtiene localizando
0.6700 en el cuerpo de la tabla, la cual da z 0.44). Si p no aparece, a menudo se utiliza el
número más cercano a él, aunque la interpolación lineal da una respuesta más precisa. Por
ejemplo, para encontrar el 95o percentil, se busca 0.9500 adentro de la tabla. Aunque 0.9500
no aparece, tanto 0.9495 como 0.9505 sí, correspondientes a z 1.64 y 1.65, respectivamente. Como 0.9500 está a la mitad entre las dos probabilidades que sí aparecen, se utilizará 1.645 como el 95o percentil y 1.645 como el 5o percentil.
Notación z
En inferencia estadística, se necesitan valores sobre el eje horizontal z que capturen ciertas
áreas de cola pequeña bajo la curva normal estándar.
Notación
z denotará el valor sobre el eje z para el cual del área bajo la curva z queda a la derecha de z. (Véase la figura 4.19.)
Por ejemplo, z0.10 captura el área de cola superior 0.10 y z0.01 captura el área de cola superior
0.01.
Área sombreada P(Z
curva z
z)
0
z
Figura 4.19 Notación z ilustrada.
Como del área bajo la curva z queda a la derecha de z, 1 del área queda a su
izquierda. Por lo tanto, z es el 100(1 )o percentil de la distribución normal estándar.
Por simetría el área bajo la curva normal estándar a la izquierda de z también es . Los
valores z en general se conocen como valores críticos z. La tabla 4.1 incluye los percentiles z y los valores z más útiles.
Tabla 4.1 Percentiles normales estándar y valores críticos
Percentil
(área de cola)
z 100(1 )o
percentil
Ejemplo 4.15
90
0.1
1.28
95
0.05
1.645
97.5
0.025
1.96
99
0.01
2.33
99.5
0.005
2.58
99.9
0.001
3.08
99.95
0.0005
3.27
z0.05 es el 100(1 0.05)o 95o percentil de la distribución normal estándar, por lo tanto
z0.05 1.645. El área bajo la curva normal estándar a la izquierda de z0.05 también es 0.05.
(Véase la figura 4.20.)
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:04 AM
Page 149
4.3 Distribución normal
149
curva z
Área sombreada 0.05
Área sombreada 0.05
0
1.645 z0.05
Figura 4.20
z0.05 95o percentil 1.645
■
Determinación de z0.05.
Distribuciones normales no estándar
Cuando X N(, 2), las probabilidades que implican X se calculan “estandarizando”. La
variable estandarizada es (X ) . Al restar la media cambia de a cero y luego al
dividir entre cambian las escalas de la variable de modo que la desviación estándar es uno
en lugar de .
PROPOSICIÓN
Si X tiene una distribución normal con media y desviación estándar , entonces
Z
X
tiene una distribución normal estándar. Por lo tanto,
a
b
Z
b
a
a
b
P(X a)
P(X b) 1
P(a X b) P
La idea clave de la proposición es que estandarizando cualquier probabilidad que implique
X puede ser expresada como una probabilidad que implica una variable aleatoria normal estándar Z, de modo que se pueda utilizar la tabla A.3 del apéndice. Esto se ilustra en la figura 4.21. La proposición se comprueba escribiendo la función de distribución acumulativa de
Z (X )/ como
P(Z z) P(X z )
z
f(x; , ) dx
Utilizando un resultado del cálculo, esta integral puede ser derivada con respecto a z para
que dé la función de densidad de probabilidad deseada f(z; 0, 1).
N( ,
2)
N(0, 1)
x
0
(x )/
Figura 4.21
Igualdad de áreas de curvas normales estándar y no estándar.
www.FreeLibros.me
c4_p130-183.qxd
150
3/12/08
CAPÍTULO 4
4:04 AM
Page 150
Variables aleatorias continuas y distribuciones de probabilidad
Ejemplo 4.16
El tiempo que requiere un conductor para reaccionar a las luces de freno de un vehículo que
está desacelerando es crítico para evitar colisiones por alcance. El artículo “Fast-Rise Brake Lamp as a Collision-Prevention Device” (Ergonomics, 1993: 391-395), sugiere que el
tiempo de reacción de respuesta en tráfico a una señal de freno de luces de freno estándar
puede ser modelado con una distribución normal que tiene un valor medio de 1.25 s y desviación estándar de 0.46 s. ¿Cuál es la probabilidad de que el tiempo de reacción esté entre
1.00 s y 1.75 s? Si X denota el tiempo de reacción, entonces estandarizando se obtiene
1.00 X 1.75
si y sólo si
1.00 1.25
X 1.25
1.75 1.25
0.46
0.46
.46
.46
.46
0.46
Por lo tanto
P(1.00 X 1.75) P
1.00 1.25
1.75 1.25
Z
0.46
0.46
.46
.46
P( 0.54 Z 1.09) (1.09) ( 0.54)
0.8621 0.2946 0.5675
normal 1.25,
P(1.00 X 1.75)
0.46
curva z
1.25
1.00
0
1.75
0.54
1.09
Figura 4.22 Curvas normales del ejemplo 4.16.
Esto se ilustra en la figura 4.22. Asimismo, si se ven los 2 s como un tiempo de reacción críticamente largo, la probabilidad de que el tiempo de reacción real exceda este valor es
P(X 2) P Z
2 1.25
P(Z 1.63) 1 (1.63) 0.0516
0.46
.46
■
Estandarizar no lleva nada más que a calcular una distancia al valor medio y luego reexpresarla como algún número de desviaciones estándar. Por lo tanto, si 100 y 15, entonces x 130 corresponde a z (130 100)/15 30/15 2.00. Es decir, 130 está a 2
desviaciones estándar sobre (a la derecha de) el valor medio. Asimismo, estandarizando 85
se obtiene (85 100)/15 1.00, por lo tanto, 85 está a una desviación estándar por debajo de la media. La tabla z se aplica a cualquier distribución normal siempre que se piense en función del número de desviaciones estándar de alejamiento del valor medio.
Ejemplo 4.17
Se sabe que el voltaje de ruptura de un diodo seleccionado al azar de un tipo particular está
normalmente distribuido. ¿Cuál es la probabilidad de que el voltaje de ruptura de un diodo
esté dentro de una desviación estándar de su valor medio? Esta pregunta puede ser respondi-
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:04 AM
Page 151
4.3 Distribución normal
151
da sin conocer o , en tanto se sepa que la distribución es normal; la respuesta es la misma para cualquier distribución normal:
P(X está dentro de 1 desviación estándar de su media) P( X )
P
Z
P(1.00 Z 1.00)
(1.00) (1.00) 0.6826
La probabilidad de que X esté dentro de dos desviaciones estándar es P( 2.00 Z 2.00)
0.9544 y dentro de tres desviaciones estándar es P( 3.00 Z 3.00) 0.9974.
■
Los resultados del ejemplo 4.17 a menudo se reportan en forma de porcentaje y se les
conoce como regla empírica (porque la evidencia empírica ha demostrado que los histogramas de datos reales con frecuencia pueden ser aproximados por curvas normales).
Si la distribución de la población de una variable es (aproximadamente) normal,
entonces
1. Aproximadamente 68% de los valores están dentro de 1 DE de la media.
2. Aproximadamente 95% de los valores están dentro de 2 DE de la media.
3. Aproximadamente 99.7% de los valores están dentro de 3 DE de la media.
En realidad es inusual observar un valor de una población normal que esté mucho más lejos de 2 desviaciones estándar de . Estos resultados serán importantes en el desarrollo de
procedimientos de prueba de hipótesis en capítulos posteriores.
Percentiles de una distribución normal arbitraria
El (100p)o percentil de una distribución normal con media y desviación estándar es fácil de relacionar con el (100p)o percentil de la distribución normal estándar.
PROPOSICIÓN
(100p)o percentil
(100p)o percentil
de normal estándar
de (m, s) normal
Otra forma de decir es que si z es el percentil deseado de la distribución normal estándar,
entonces el percentil deseado de la distribución (, ) normal está a z desviaciones estándar de .
Ejemplo 4.18
La cantidad de agua destilada despachada por una cierta máquina está normalmente distribuida con valor medio de 64 oz y desviación estándar de 0.78 oz. ¿Qué tamaño de contenedor c asegurará que ocurra rebosamiento sólo 0.5% del tiempo? Si X denota la cantidad
despachada, la condición deseada es que P(X c) 0.005, o, en forma equivalente, que
P(X c) 0.995. Por lo tanto, c es el 99.5o percentil de la distribución normal con 64
y 0.78. El 99.5o percentil de la distribución normal estándar es de 2.58, por lo tanto,
c (0.995) 64 (2.58)(0.78) 64 2.0 66 oz
Esto se ilustra en la figura 4.23.
www.FreeLibros.me
c4_p130-183.qxd
152
3/12/08
CAPÍTULO 4
4:04 AM
Page 152
Variables aleatorias continuas y distribuciones de probabilidad
Área sombreada 0.995
64
c 99.5o percentil 66.0
Figura 4.23
Distribución de la cantidad despachada en el ejemplo 4.18.
■
Distribución normal y poblaciones discretas
La distribución normal a menudo se utiliza como una aproximación a la distribución de valores en una población discreta. En semejantes situaciones, se debe tener un cuidado especial para asegurarse de que las probabilidades se calculen con precisión.
Ejemplo 4.19
Se sabe que el coeficiente intelectual en una población particular (medido con una prueba
estándar) está más o menos normalmente distribuido con 100 y 15. ¿Cuál es la
probabilidad de que un individuo seleccionado al azar tenga un CI de por lo menos 125?
Con X el CI de una persona seleccionada al azar, se desea P(X 125). La tentación en
este caso es estandarizar X 125 como en ejemplos previos. Sin embargo, la distribución
de la población de coeficientes intelectuales en realidad es discreta, puesto que los coeficientes intelectuales son valores enteros. Así que la curva normal es una aproximación a un
histograma de probabilidad discreto como se ilustra en la figura 4.24.
Los rectángulos del histograma están centrados en enteros, por lo que los coeficientes intelectuales de por lo menos 125 corresponden a rectángulos que comienzan en 124.5,
la zona sombreada en la figura 4.24. Por lo tanto, en realidad se desea el área bajo la curva
aproximadamente normal a la derecha de 124.5. Si se estandariza este valor se obtiene P(Z
1.63) 0.0516, en tanto que si se estandariza 125 se obtiene P(Z 1.67 0.0475. La
diferencia no es grande, pero la respuesta 0.0516 es más precisa. Asimismo, P(X 125) sería aproximada por el área entre 124.5 y 125.5, puesto que el área bajo la curva normal sobre el valor único de 125 es cero.
125
Figura 4.24
Aproximación normal a una distribución discreta.
■
La corrección en cuanto a discrecionalidad de la distribución subyacente en el ejemplo 4.19 a menudo se llama corrección por continuidad. Es útil en la siguiente aplicación
de la distribución normal al cálculo de probabilidades binomiales.
Aproximación de la distribución binomial
Recuérdese que el valor medio y la desviación estándar de una variable aleatoria binomial
X son X np y X npq, respectivamente. La figura 4.25 muestra una histograma de
probabilidad binomial de la distribución binomial con n 20, p 0.6 con el cual
20(0.6) 12 y 20
(.
06)(
0
.4
) 2.19. Sobre el histograma de probabilidad se superpuso una curva normal con esas y . Aunque el histograma de probabilidad es un poco
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:04 AM
Page 153
4.3 Distribución normal
153
Curva normal,
μ 12, σ 2.19
0.20
0.15
0.10
0.05
0
2
4
6
8
10
12
14
16
18
20
Figura 4.25 Histograma de probabilidad binomial para n 20, p 0.6 con curva de aproximación
normal sobrepuesta.
asimétrico (debido a que p 0.5), la curva normal da una muy buena aproximación, sobre
todo en la parte media de la figura. El área de cualquier rectángulo (probabilidad de cualquier valor X particular), excepto la de los localizados en las colas extremas, puede ser
aproximada con precisión mediante el área de la curva normal correspondiente. Por ejemplo, P(X 10) B(10; 20, 0.6) B(9; 20, 0.6) 0.117, mientras que el área bajo la curva
normal entre 9.5 y 10.5 es P(1.14 Z 0.68) 0.1212.
En términos generales, en tanto que el histograma de probabilidad binomial no sea demasiado asimétrico, las probabilidades binomiales pueden ser aproximadas muy bien por
áreas de curva normal. Se acostumbra entonces decir que X tiene aproximadamente una distribución normal.
PROPOSICIÓN
Sea X una variable aleatoria normal basada en n ensayos con probabilidad de éxito p.
Luego si el histograma de probabilidad binomial no es demasiado asimétrico, X tiene
aproximadamente una distribución normal con np y npq. En particular,
con x un valor posible de X,
área bajo la curva normal
a la izquierda de x 0.5
x 0.5 np
npq
P(X x) B(x; n, p)
En la práctica, la aproximación es adecuada siempre que tanto np 10 como nq 10,
puesto que en ese caso existe bastante simetría en la distribución binomial subyacente.
Una comprobación directa de este resultado es bastante difícil. En el siguiente capítulo se verá que es una consecuencia de un resultado más general llamado Teorema del Límite Central.
Con toda honestidad, esta aproximación no es tan importante en el cálculo de probabilidad
como una vez lo fue. Esto se debe a que los programas de computadora ahora son capaces
de calcular probabilidades binomiales con exactitud con valores bastante grandes de n.
Ejemplo 4.20
Suponga que 25% de los conductores con licencia de manejo en un estado particular no
están asegurados. Sea X el número de conductores no asegurados en una muestra aleatoria de tamaño 50 (algo perversamente, un éxito es un conductor no asegurado), de modo que
www.FreeLibros.me
c4_p130-183.qxd
154
3/12/08
CAPÍTULO 4
4:04 AM
Page 154
Variables aleatorias continuas y distribuciones de probabilidad
p 0.25. Entonces 12.5 y 3.06. Como np 50(0.25) 12.5
10, la aproximación puede ser aplicada con seguridad:
P(X 10) B(10; 50, 0.25)
10 0.5 12.5
3.0 6
10 y nq 37.5
( 0.65) 0.2578
Asimismo, la probabilidad de que entre 5 y 15 (inclusive) de los conductores seleccionados
no estén asegurados es
P(5 X 15) B(15; 50, 0.25) B(4; 50, 0.25)
15.5 12.5
4.5 12.5
0.8320
3.06
3.06
Las probabilidades exactas son 0.2622 y 0.8348, respectivamente, así que las aproximaciones son bastante buenas. En el último cálculo, la probabilidad P(5 X 15) está siendo
aproximada por el área bajo la curva normal entre 4.5 y 15.5, se utiliza la corrección de continuidad tanto para el límite superior como para el inferior.
■
Cuando el objetivo de la investigación es hacer una inferencia sobre una proporción
de población p, el interés se enfocará en la proporción muestral de X/n éxitos y no en X. Como
esta proporción es exactamente X multiplicada por la constante 1/n, también tendrá aproximadamente una distribución normal (con media p y desviación estándar
p
q),
/n siempre que tanto np 10 como nq 10. Esta aproximación normal es la base
de varios procedimientos inferenciales que se discutirán en capítulos posteriores.
EJERCICIOS
Sección 4.3 (28-58)
28. Sea Z una variable aleatoria normal estándar y calcule las
siguientes probabilidades, trace las figuras siempre que sea
apropiado.
a. P(0 Z 2.17)
b. P(0 Z 1)
c. P( 2.50 Z 0)
d. P( 2.50 Z 2.50)
e. P(Z 1.37)
f. P( 1.75 Z)
g. P( 1.50 Z 2.00)
h. P(1.37 Z 2.50)
i. P(1.50 Z)
j. P(°Z° 2.50)
29. En cada caso, determine el valor de la constante c que hace
que el enunciado de probabilidad sea correcto.
a. (c) 0.9838
b. P(0 Z c) 0.291
c. P(c Z) 0.121
d. P( c Z c) 0.668
e. P(c °Z°) 0.016
30. Encuentre los siguientes percentiles de la distribución
normal estándar. Interpole en los casos en que sea apropiado.
a. 91o
b. 9o
c. 75o
d. 25o
e. 6o
31. Determine z para lo siguiente:
a. 0.0055
b. 0.09
c. 0.663
32. Si X es una variable aleatoria normal con media 80 y desviación estándar 10, calcule las siguientes probabilidades
mediante estandarización:
a. P(X 100)
b. P(X 80)
c. P(65 X 100)
d. P(70 X)
e. P(85 X 95)
f. P(°X 80° 10)
33. Suponga que la fuerza que actúa en una columna que ayuda a soportar un edificio está normalmente distribuida con
media de 15.0 kips y desviación estándar de 1.25 kips.
¿Cuál es la probabilidad de que la fuerza
a. sea de más de 18 kips?
b. esté entre 10 y 12 kips?
c. Difiera de 15.0 kips en cuando mucho 1.5 desviaciones
estándar?
34. El artículo “Reliability of Domestic-Waste Biofilm Reactors”
(J. of Envir. Engr., 1995: 785-790) sugiere que la concentración de sustrato (mg/cm3) del afluente que llega a un reactor
está normalmente distribuida con 0.30 y 0.06.
a. ¿Cuál es la probabilidad de que la concentración exceda
de 0.25?
b. ¿Cuál es la probabilidad de que la concentración sea
cuando mucho de 0.10?
c. ¿Cómo caracterizaría el 5% más grande de todos los valores de concentración?
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:04 AM
Page 155
4.3 Distribución normal
35. Suponga que el diámetro a la altura del pecho (pulg) de árboles de un tipo está normalmente distribuido con 8.8
y 2.8 como se sugiere en el artículo “Simulating a Harvester-Forwarder Softwood Thinning” (Forest Products J.
mayo de 1997; 36-41).
a. ¿Cuál es la probabilidad de que el diámetro de un árbol
seleccionado al azar sea por lo menos de 10 pulg?
¿Mayor de 10 pulg?
b. ¿Cuál es la probabilidad de que el diámetro de un árbol
seleccionado al azar sea de más de 20 pulg?
c. ¿Cuál es la probabilidad de que el diámetro de un árbol
seleccionado al azar esté entre 5 y 10 pulg?
d. ¿Qué valor c es tal que el intervalo (8.8 c, 8.8 c) incluya 98% de todos los valores de diámetro?
e. Si se seleccionan cuatro árboles al azar, ¿cuál es la probabilidad de que por lo menos uno tenga un diámetro de
más de 10 pulg?
36. La deriva de las atomizaciones de pesticidas es una preocupación constante de los fumigadores y productores agrícolas.
La relación inversa entre el tamaño de gota y el potencial de
deriva es bien conocida. El artículo “Effects of 2,4-D Formulation and Quinclorac on Spray Droplet Size and Deposition”
(Weed Technology, 2005: 1030-1036) investigó los efectos de
formulaciones de herbicidas en atomizaciones. Una figura en
el artículo sugirió que la distribución normal con media de
1050 m y desviación estándar de 150 m fue un modelo razonable de tamaño de gotas de agua (el “tratamiento de control”) pulverizada a través de una boquilla de 760 ml/min.
a. ¿Cuál es la probabilidad de que el tamaño de una sola gota sea de menos de 1500 m? ¿Por lo menos de 1000 m?
b. ¿Cuál es la probabilidad de que el tamaño de una sola
gota esté entre 1000 y 1500 m?
c. ¿Cómo caracterizaría el 2% más pequeño de todas las
gotas?
d. Si se miden los tamaños de cinco gotas independientemente seleccionadas, ¿cuál es la probabilidad de que por
lo menos una exceda de 1500 m?
37. Suponga que la concentración de cloruro en sangre (mmol/L)
tiene una distribución normal con media de 104 y desviación estándar de 5 (información en el artículo “Matemathical Model of Chloride Concentration in Human Blood”,
J. of Med. Engr. and Tech., 2006; 25-30, incluida una gráfica
de probabilidad normal como se describe en la sección 4.6,
apoyando esta suposición).
a. ¿Cuál es la probabilidad de que la concentración de cloruro sea igual a 105? ¿Sea menor que 105? ¿Sea cuando
mucho de 105?
b. ¿Cuál es la probabilidad de que la concentración de cloruro difiera de la media por más de una desviación estándar? ¿Depende esta probabilidad de los valores de y ?
c. ¿Cómo caracterizaría el 0.1% más extremo de los valores
de concentración de cloruro?
38. Hay dos máquinas disponibles para cortar corchos para usarse
en botellas de vino. La primera produce corchos con diámetros que están normalmente distribuidos con media de 3 cm y
desviación estándar de 0.1 cm. La segunda máquina produce
corchos con diámetros que tienen una distribución normal con
media de 3.04 cm y desviación estándar de 0.02 cm. Los cor-
39.
40.
41.
42.
43.
44.
45.
46.
155
chos aceptables tienen diámetros entre 2.9 y 3.1 cm. ¿Cuál
máquina es más probable que produzca un corcho aceptable?
a. Si una distribución normal tiene 30 y 5, ¿cuál
es el 91o percentil de la distribución?
b. ¿Cuál es el 6o percentil de la distribución?
c. El ancho de una línea grabada en un “chip” de circuito integrado normalmente está distribuida con media de 3.000
m y desviación estándar de 0.140. ¿Qué valor de ancho
separa 10% de las líneas más anchas del 90% restante?
El artículo “Monte Carlo Simulation-Tool for Better Understanding of LRFD” (J. Structural Engr., 1993: 15861599) sugiere que la resistencia a ceder (lb/pulg2) de un
acero grado A36 está normalmente distribuida con 43
y 4.5.
a. ¿Cuál es la probabilidad de que la resistencia a ceder sea
cuando mucho de 40? ¿De más de 60?
b. ¿Qué valor de resistencia a ceder separa al 75% más resistente del resto?
El dispositivo de apertura automática de un paracaídas de
carga militar se diseñó para que abriera el paracaídas a 200 m
sobre el suelo. Suponga que la altitud de abertura en realidad
tiene una distribución normal con valor medio de 200 m y
desviación estándar de 30 m. La carga útil se dañará si el
paracaídas se abre a menos de 100 m. ¿Cuál es la probabilidad de que se dañe la carga útil de cuando menos uno de
cinco paracaídas lanzados en forma independiente?
La lectura de temperatura tomada con un termopar colocado
en un medio a temperatura constante normalmente está distribuida con media , la temperatura real del medio y la desviación estándar . ¿Qué valor tendría para asegurarse de
que el 95% de todas las lecturas están dentro de 0.1º de ?
Se sabe que la distribución de resistencia de resistores de un
tipo es normal y la resistencia del 10% de ellos es mayor de
10.256 ohms y la del 5% es de una resistencia menor de 9.671
ohms. ¿Cuáles son el valor medio y la desviación estándar de
la distribución de resistencia?
Si la longitud roscada de un perno está normalmente distribuida, ¿cuál es la probabilidad de que la longitud roscada de
un perno seleccionado al azar esté
a. dentro de 1.5 desviaciones estándar de su valor medio?
b. a más de 2.5 desviaciones estándar de su valor medio?
c. entre una y dos desviaciones estándar de su valor medio?
Una máquina que produce cojinetes de bolas inicialmente se
ajustó de modo que el diámetro promedio verdadero de los
cojinetes que produce sea de 0.500 pulg. Un cojinete es
aceptable si su diámetro está dentro de 0.004 pulg de su valor objetivo. Suponga, sin embargo, que el ajuste cambia durante el curso de la producción, de modo que los cojinetes
tengan diámetros normalmente distribuidos con valor medio
de 0.499 pulg y desviación estándar de 0.002 pulg. ¿Qué
porcentaje de los cojinetes producidos no será aceptable?
La dureza Rockwell de un metal se determina hincando una
punta endurecida en la superficie del metal y luego midiendo la profundidad de penetración de la punta. Suponga que
la dureza Rockwell de una aleación particular está normalmente distribuida con media de 70 y desviación estándar de
3. (La dureza Rockwell se mide en una escala continua.)
www.FreeLibros.me
c4_p130-183.qxd
156
3/12/08
CAPÍTULO 4
4:04 AM
Page 156
Variables aleatorias continuas y distribuciones de probabilidad
a. Una probeta es aceptable sólo si su dureza oscila entre
67 y 75, ¿cuál es la probabilidad de que una probeta seleccionada al azar tenga una dureza aceptable?
b. Si el rango de dureza aceptable es (70 c, 70 c), ¿con
qué valor de c tendría 95% de todas las probetas una dureza aceptable?
c. Si el rango de dureza aceptable es como el del inciso a)
y la dureza de cada una de diez probetas seleccionadas
al azar se determina de forma independiente, ¿cuál es el
valor esperado de probetas aceptables entre las diez?
d. ¿Cuál es la probabilidad de que cuando mucho ocho de
diez probetas independientemente seleccionadas tengan
una dureza de menos de 73.84? [Sugerencia: Y el número de entre las diez probetas con dureza de menos de
73.84 es una variable binomial; ¿cuál es p?]
47. La distribución de peso de paquetes enviados de cierta manera es normal con valor medio de 12 lb y desviación estándar de 3.5 lb. El servicio de paquetería desea establecer
un valor de peso c más allá del cual habrá un cargo extra.
¿Qué valor de c es tal que 99% de todos los paquetes estén
por lo menos 1 lb por debajo del peso de cargo extra?
48. Suponga que la tabla A.3 del apéndice contiene (z) sólo
para z 0. Explique cómo aún así podría calcular
a. P( 1.72 Z 0.55)
b. P( 1.72 Z 0.55)
¿Es necesario tabular (z) para z negativo? ¿Qué propiedad
de la curva normal estándar justifica su respuesta?
49. Considere los bebés nacidos en el rango “normal” de 37-43
semanas de gestación. Datos extensos sustentan la suposición de que el peso de nacimiento de estos bebés nacidos en
Estados Unidos está normalmente distribuido con media de
3432 g y desviación estándar de 482 g. [El artículo “Are Babies Normal?” (The American Statistician (1999): 298-302)
analizó datos de un año particular; con una selección sensible de intervalos de clase, un histograma no parecía del todo
normal pero después de una investigación se determinó que
esto se debía a que en algunos hospitales medían el peso en
gramos, en otros lo medían a la onza más cercana y luego lo
convertían en gramos. Una selección modificada de intervalos de clase que permitía esto produjo un histograma que era
descrito muy bien por una distribución normal.]
a. ¿Cuál es la probabilidad de que el peso de nacimiento de
un bebé seleccionado al azar de este tipo exceda de 4 000
gramos? ¿Esté entre 3 000 y 4 000 gramos?
b. ¿Cuál es la probabilidad de que el peso de nacimiento de
un bebé seleccionado al azar de este tipo sea de menos
de 2 000 gramos o de más de 5 000 gramos?
c. ¿Cuál es la probabilidad de que el peso de nacimiento
de un bebé seleccionado al azar de este tipo exceda de
7 libras?
d. ¿Cómo caracterizaría el 0.1% más extremo de todos los
pesos de nacimiento?
e. Si X es una variable aleatoria con una distribución normal y a es una constante numérica (a 0), entonces
Y aX también tiene una distribución normal. Use esto
para determinar la distribución de pesos de nacimiento
expresados en libras (forma, media y desviación están-
dar) y luego calcule otra vez la probabilidad del inciso c)
¿Cómo se compara ésta con su respuesta previa?
50. En respuesta a preocupaciones sobre el contenido nutricional
de las comidas rápidas. McDonald’s ha anunciado que utilizará un nuevo aceite de cocinar para sus papas a la francesa
que reducirá sustancialmente los niveles de ácidos grasos e
incrementará la cantidad de grasa poliinsaturada más benéfica. La compañía afirma que 97 de 100 personas no son capaces de detectar una diferencia de sabor entre los nuevos y los
viejos aceites. Suponiendo que esta cifra es correcta (como
proporción de largo plazo) ¿cuál es la probabilidad aproximada de que en una muestra aleatoria de 1000 individuos que
han comprado papas a la francesa en McDonald’s:
a. ¿Por lo menos 40 puedan notar la diferencia de sabor entre los dos aceites?
b. Cuando mucho 5% pueda notar la diferencia de sabor
entre los dos aceites?
51. La desigualdad de Chebyshev (véase el ejercicio 44 del
capítulo 3), es válida para distribuciones continuas y discretas. Estipula que para cualquier número k que satisfaga
k 1, P(°X ° k) 1/k2 (véase el ejercicio 44 en
el capítulo 3 para una interpretación). Obtenga esta probabilidad en el caso de una distribución normal con k 1, 2,
3 y compare con el límite superior.
52. Sea X el número de defectos en un carrete de cinta magnética de 100 m (una variable de valor entero). Suponga que
X tiene aproximadamente una distribución normal con
25 y 5. Use la corrección por continuidad para calcular la probabilidad de que el número de defectos sea:
a. Entre 20 y 30, inclusive.
b. Cuando mucho 30. Menos de 30.
53. Si X tiene una distribución binomial con parámetros n 25 y
p, calcule cada una de las siguientes probabilidades mediante
la aproximación normal (con la corrección por continuidad)
en los casos p 0.5, 0.6, y 0.8 y compare con las probabilidades exactas calculadas con la tabla A.1 del apéndice.
a. P(15 X 20)
b. P(X 15)
c. P(20 X)
54. Suponga que 10% de todas las flechas de acero producidas
por medio de un proceso no cumplen con las especificaciones pero pueden ser retrabajadas (en lugar de ser desechadas). Considere una muestra aleatoria de 200 flechas y sea
X el número entre éstas que no cumplen con las especificaciones y pueden ser retrabajadas. ¿Cuál es la probabilidad
aproximada de que X sea
a. Cuando mucho 30?
b. Menos que 30?
c. Entre 15 y 25 (inclusive)?
55. Suponga que sólo 75% de todos los conductores en un estado usan con regularidad el cinturón de seguridad. Se selecciona una muestra aleatoria de 500 conductores. ¿Cuál es la
probabilidad de que
a. Entre 360 y 400 (inclusive) de los conductores en la
muestra usen con regularidad el cinturón de seguridad?
b. Menos de 400 de aquellos en la muestra usen con regularidad el cinturón de seguridad?
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:04 AM
Page 157
157
4.4 Distribuciones exponencial y gama
56. Demuestre que la relación entre un percentil normal general y el percentil z correspondiente es como se estipuló en
esta sección.
57. a. Demuestre que si X tiene una distribución normal con
parámetros y , entonces Y aX b (una función lineal de X) también tiene una distribución normal. ¿Cuáles son los parámetros de la distribución de Y [es decir,
E(Y) y V(Y)]? [Sugerencia: Escriba la función de distribución acumulativa de Y, P(Y y), como una integral
que implique la función de densidad de probabilidad de
X y luego derive con respecto a y para obtener la función
de densidad de probabilidad de Y.]
b. Si cuando se mide en °C, la temperatura está normalmente distribuida con media de 115 y desviación estándar de dos, ¿qué se puede decir sobre la distribución de
temperatura medida en °F?
58. No existe una fórmula exacta para función de distribución
acumulativa normal estándar (z), aunque se han publicado
varias aproximaciones en artículos. La siguiente se tomó de
“Approximations for Hand Calculators Using Small Integer
Coefficients” (Mathematics of Computation, 1977: 214222). Con 0 z 5.5,
P(Z
z) 1 (z)
0.5 exp
(83z 351)z 562
703/z 165
El error relativo de esta aproximación es de menos de 0.042%.
Úsela para calcular aproximaciones a las siguientes probabilidades y compare siempre que sea posible con las probabilidades obtenidas con la tabla A.3 del apéndice.
a. P(Z 1)
b. P(Z 3)
c. P( 4 Z 4)
d. P(Z 5)
4.4 Distribuciones exponencial y gama
La curva de densidad correspondiente a cualquier distribución normal tiene forma de campana y por consiguiente es simétrica. Existen muchas situaciones prácticas en las cuales la variable de interés para un investigador podría tener una distribución asimétrica. Una familia de
distribuciones que tiene esta propiedad es la familia gama. Primero se considera un caso especial, la distribución exponencial y luego se le generaliza más adelante en esta sección.
Distribución exponencial
La familia de distribuciones exponenciales proporciona modelos de probabilidad que son
muy utilizados en disciplinas de ingeniería y ciencias.
DEFINICIÓN
Se dice que X tiene una distribución exponencial con parámetro ( 0) si la función de densidad de probabilidad de X es
Ï elx x
0
f(x; ) ÌÓ 0
de lo contrario
(4.5)
Algunas fuentes escriben la función de densidad de probabilidad exponencial en la forma
(1/b)ex/b, de modo que 1/. El valor esperado de una variable aleatoria exponencialmente distribuida X es
E(X)
0
x ex dx
Para obtener este valor esperado se requiere integrar por partes. La varianza de X se calcula
utilizando el hecho de que V(X) E(X2) [E(X)]2. La determinación de E(X2) requiere integrar por partes dos veces en sucesión. Los resultados de estas integraciones son los siguientes:
m5
1
l
s2 5
1
l2
Tanto la media como la desviación estándar de la distribución exponencial son iguales a 1/.
En la figura 4.26 aparecen algunas gráficas de varias funciones de densidad de probabilidad
exponenciales.
www.FreeLibros.me
c4_p130-183.qxd
158
3/12/08
CAPÍTULO 4
4:04 AM
Page 158
Variables aleatorias continuas y distribuciones de probabilidad
f (x; )
2
2
1
0.5
1
0.5
x
Figura 4.26
Curvas de densidad exponencial.
La función de densidad de probabilidad exponencial es fácil de integrar para obtener la función de densidad acumulativa.
Ï
0
F(x; ) Ì
Ó1 ex
Ejemplo 4.21
x0
x 0
Suponga que el tiempo de respuesta X en una terminal de computadora en línea (el tiempo
transcurrido entre el final de la consulta de un usuario y el inicio de la respuesta del sistema a dicha consulta) tiene una distribución exponencial con tiempo de respuesta esperado
de 5 s. Entonces E(X) 1/ 5, por lo tanto 0.2. La probabilidad de que el tiempo de
respuesta sea cuando mucho de 10 s es
P(X 10) F(10; 0.2) 1 e(0.2)(10) 1 e2 1 0.135 0.865
La probabilidad de que el tiempo de respuesta sea de entre 5 y 10 s es
P(5 X 10) F(10; 0.2) F(5; 0.2)
(1 e2) (1 e1) 0.233
■
La distribución exponencial se utiliza con frecuencia como modelo de la distribución
de tiempos entre la ocurrencia de eventos sucesivos, tales como clientes que llegan a una
instalación de servicio o llamadas que entran a un conmutador. La razón de esto es que la
distribución exponencial está estrechamente relacionada con el proceso de Poisson discutido en el capítulo 3.
PROPOSICIÓN
Suponga que el número de eventos que ocurren en cualquier intervalo de tiempo de
duración t tiene una distribución de Poisson con parámetro t (donde , la razón del
proceso de eventos, es el número esperado de eventos que ocurren en una unidad de
tiempo) y que los números de ocurrencias en intervalos no traslapantes son independientes uno de otro. Entonces la distribución del tiempo transcurrido entre la ocurrencia de dos eventos sucesivos es exponencial con parámetro .
Aunque una comprobación completa queda fuera del alcance de este libro, el resultado es
fácil de verificar para el tiempo X1 hasta que ocurre el primer evento:
P(X1 t) 1 P(X1 t) 1 P[ningún evento en (0, t)]
et (t)0
1 et
0!
la cual es exactamente la función de distribución acumulativa de la distribución exponencial.
1
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:04 AM
Page 159
4.4 Distribuciones exponencial y gama
Ejemplo 4.22
159
Suponga que se reciben llamadas durante las 24 horas en una “línea de emergencia para prevención del suicidio” de acuerdo con un proceso de Poisson a razón 0.5 llamadas por
día. Entonces el número de días X entre llamadas sucesivas tiene una distribución exponencial con valor de parámetro 0.5, así que la probabilidad de que transcurran más de dos días
entre llamadas es
P(X 2) 1 P(X 2) 1 F(2; 0.5) e(0.5)(2) 0.368
El tiempo esperado entre llamadas sucesivas es 1/0.5 2 días.
■
Otra aplicación importante de la distribución exponencial es modelar la distribución
de la duración de un componente. Una razón parcial de la popularidad de tales aplicaciones
es la propiedad de “ falta de memoria o amnesia” de la distribución exponencial. Suponga que la duración de un componente está exponencialmente distribuida con parámetro .
Después de poner el componente en servicio, se deja que pase un periodo de t0 horas y luego se ve si el componente sigue trabajando; ¿cuál es ahora la probabilidad de que dure por
lo menos t horas más? En símbolos, se desea P(X t t0°X t0). Por la definición de probabilidad condicional,
P(X
t t0°X
t0)
P[(X
t t0) (X
P(X t0)
t0)]
Pero el evento X t0 en el numerador es redundante, puesto que ambos eventos pueden ocurrir si y sólo si X t t0. Por consiguiente,
1 F(t t0; )
P(X t t0)
P(X t t0°X t0)
1 F(t ; ) et
P(X t0)
0
Esta probabilidad condicional es idéntica a la probabilidad original P(X t) de que el componente dure t horas. Por lo tanto, la distribución de duración adicional es exactamente la
misma que la distribución original de duración, así que en cada punto en el tiempo el componente no muestra ningún efecto de desgaste. En otras palabras, la distribución de la duración restante es independiente de la antigüedad actual.
Aunque la propiedad de amnesia se justifica por lo menos en forma aproximada en
muchos problemas aplicados, en otras situaciones los componentes se deterioran con el
tiempo o de vez en cuando mejoran con él (por lo menos hasta cierto punto). Las distribuciones gama, Weibull y lognormales proporcionan modelos de duración más generales (las
últimas dos se discuten en la siguiente sección).
La función gama
Para definir la familia de distribuciones gama, primero se tiene que introducir una función
que desempeña un importante papel en muchas ramas de las matemáticas.
DEFINICIÓN
Con 0, la función gama () se define como
()
0
x 1 ex dx
(4.6)
Las propiedades más importantes de la función gama son las siguientes:
1. Con cualquier 1, () ( 1) ( 1) [vía integración por partes].
2. Con cualquier entero positivo, n, (n) (n 1)!
.
3. 2
1
www.FreeLibros.me
c4_p130-183.qxd
160
3/12/08
CAPÍTULO 4
4:04 AM
Page 160
Variables aleatorias continuas y distribuciones de probabilidad
De acuerdo con la expresión (4.6), si
Ï x1ex
f(x; ) ()
Ó 0
Ì
x
0
(4.7)
de lo contrario
entonces f (x; ) 0 y 0 f(x; ) dx ()/() 1, así que f(x; ) satisface las dos propiedades básicas de una función de densidad de probabilidad.
La distribución gama
DEFINICIÓN
Se dice que una variable aleatoria continua X tiene una distribución gama si la función de densidad de probabilidad de X es
Ï 1
x1e
f(x; , ) ()
Ó
0
Ì
x/
x
0
(4.8)
de lo contrario
donde los parámetros y satisfacen 0, 0. La distribución gama estándar tiene 1, así que (4.7) da la función de densidad de probabilidad de una variable aleatoria gama estándar.
La distribución exponencial se deriva de considerar 1 y 1/.
La figura 4.27(a) ilustra las gráficas de la función de densidad de probabilidad gama
f(x; , ) (4.8) para varios pares (, ), en tanto que la figura 4.27(b) presenta gráficas de
la función de densidad de probabilidad gama estándar. Para la función de densidad de probabilidad estándar cuando 1, f(x; ) es estrictamente decreciente a medida que x se incrementa desde 0; cuando 1, f(x; ) se eleva desde 0 en x 0 hasta un máximo y luego
decrece. El parámetro en (4.8) se llama parámetro de escala porque los valores diferentes de uno alargan o comprimen la función de densidad de probabilidad en la dirección x.
f (x; , )
f (x; )
2,
1.0
1
3
1.0
1
1, 1
0.5
0.6
0.5
2, 2
2
2, 1
0
0
x
1
2
3
4
(a )
Figura 4.27
5
6
5
x
1
7
2
3
4 5
(b )
(a) Curvas de densidad gama; (b) Curvas de densidad gama estándar.
La media y la varianza de una variable aleatoria X que tiene la distribución gama f(x; , ) son
E(X)
V(X) 2 2
Cuando X es una variable aleatoria gama estándar, la función de distribución acumulativa de X,
F(x; )
y1ey
dy
0 ( )
x
www.FreeLibros.me
x0
(4.9)
c4_p130-183.qxd
3/12/08
4:04 AM
Page 161
4.4 Distribuciones exponencial y gama
161
se llama función gama incompleta [en ocasiones la función gama incompleta se refiere a
la expresión (4.9) sin el denominador () en el integrando]. Existen tablas extensas de F(x; )
disponibles; en la tabla A.4 del apéndice se presenta una pequeña tabulación para 1,
2, . . . , 10 y x 1, 2, . . . , 15.
Ejemplo 4.23
Suponga que el tiempo de reacción X de un individuo seleccionado al azar a un estímulo tiene una distribución gama estándar con 2. Como
P(a X b) F(b) F(a)
cuando X es continua,
P(3 X 5) F(5; 2) F(3; 2) 0.960 0.801 0.159
La probabilidad de que el tiempo de reacción sea de más de 4 s es
P(X 4) 1 P(X 4) 1 F(4; 2) 1 0.908 0.092
■
La función gama incompleta también se utiliza para calcular probabilidades que implican distribuciones gama no estándar. Estas probabilidades también se obtienen casi instantáneamente con varios paquetes de software.
PROPOSICIÓN
Si X tiene una distribución gama con parámetros y entonces con cualquier x 0,
la función de distribución acumulativa de X es
P(X x) F(x; , ) F
;
x
donde F(; ) es la función gama incompleta.
Ejemplo 4.24
Suponga que el tiempo de sobrevivencia de un ratón macho seleccionado al azar expuesto a
240 rads de radiación gama tiene una distribución gama con 8 y 15. (Datos en Survival Distributions: Reliability Applications in the Biomedical Services, de A. J. Gross y
V. Clark, sugiere 8.5 y 13.3.) El tiempo de sobrevivencia esperado es E(X)
(8)(15) 120 semanas, en tanto que V(X) (8)(15)2 1800 y X 1
800 42.43
semanas. La probabilidad de que un ratón sobreviva entre 60 y 120 semanas es
P(60 X 120) P(X 120) P(X 60)
F(120/15; 8) F(60/15; 8)
F(8; 8) F(4; 8) 0.547 0.051 0.496
La probabilidad de que un ratón sobreviva por lo menos 30 semanas es
P(X
30) 1 P(X 30) 1 P(X 30)
1 F(30/15; 8) 0.999
■
Distribución ji cuadrada
La distribución ji cuadrada es importante porque es la base de varios procedimientos de inferencia estadística. El papel central desempeñado por la distribución ji cuadrada en inferencia se deriva de su relación con distribuciones normales (véase el ejercicio 71). Se
discutirá esta distribución con más detalle en capítulos posteriores.
www.FreeLibros.me
c4_p130-183.qxd
162
3/12/08
CAPÍTULO 4
4:04 AM
Page 162
Variables aleatorias continuas y distribuciones de probabilidad
DEFINICIÓN
Sea un entero positivo. Se dice entonces que una variable aleatoria X tiene una distribución ji cuadrada con parámetro si la función de densidad de probabilidad de
X es la densidad gama con /2 y 2. La función de densidad de probabilidad
de una variable aleatoria ji cuadrada es por lo tanto
1
Ï
x(
f(x; ) 2 /2( /2)
Ó
0
Ì
/2)1
ex/2
x
0
(4.10)
x0
El parámetro se llama número de grados de libertad (gl) de X. A menudo se utiliza el símbolo 2 en lugar de “ji cuadrada”.
EJERCICIOS
Sección 4.4 (59-71)
59. Sea X el tiempo entre dos llegadas sucesivas a la ventanilla
de autopago de un banco local. Si X tiene una distribución exponencial con 1 (la cual es idéntica a una distribución
gama estándar con 1), calcule lo siguiente:
a. El tiempo esperado entre dos llegadas sucesivas.
b. La desviación estándar del tiempo entre dos llegadas sucesivas.
c. P(X 4)
d. P(2 X 5)
60. Sea X la distancia (m) que un animal recorre desde el sitio de
su nacimiento hasta el primer territorio vacante que encuentra. Suponga que ratas canguro con etiqueta en la cola, X tiene una distribución exponencial con parámetro 0.01386
(como lo sugiere el artículo “Competition and Dispersal from
Multiple Nests”, Ecology, 1997: 873-883).
a. ¿Cuál es la probabilidad de que la distancia sea cuando
mucho de 100 m? ¿Cuándo mucho de 200? ¿Entre 100
y 200 m?
b. ¿Cuál es la probabilidad de que la distancia exceda la
distancia media por más de dos desviaciones estándar?
c. ¿Cuál es el valor de la distancia mediana?
61. La amplia experiencia con ventiladores de un tipo utilizados en motores diesel ha sugerido que la distribución exponencial proporciona un buen modelo del tiempo hasta
la falla. Suponga que el tiempo medio hasta la falla es de
25 000 horas. ¿Cuál es la probabilidad de que
a. Un ventilador seleccionado al azar dure por lo menos
20 000 horas? ¿Cuándo mucho 30 000 horas? ¿Entre
20 000 y 30 000 horas?
b. ¿Exceda la duración de un ventilador el valor medio por
más de dos desviaciones estándar? ¿Más de tres desviaciones estándar?
62. El artículo “Microwave Observations of Daily Antarctic SeaIce Edge Expansion and Contribution Rates” (IEEE Geosci.
and Remote Sensing Letters, 2006: 54-58) establece que “la
distribución del avance/retroceso diarios del hielo marino con
respecto a cada sensor es similar y es aproximadamente una
exponencial doble”. La distribución exponencial doble propuesta tiene una función de densidad f(x) 0.5e|x| para
x . La desviación estándar se da como 40.9 km.
a. ¿Cuál es el valor del parámetro ?
b. ¿Cuál es la probabilidad de que la extensión del cambio
del hielo marino esté dentro de una desviación estándar del
valor medio?
63. Un consumidor está tratando de decidir entre dos planes de
llamadas de larga distancia. El primero aplica una sola tarifa de 10¢ por minuto, en tanto que el segundo cobra una tarifa de 99¢ por llamadas hasta de 20 minutos y luego 10¢
por cada minuto adicional que exceda de 20 (suponga que
las llamadas que duran un número no entero de minutos son
cobradas proporcionalmente a un cargo por minuto entero).
Suponga que la distribución de duración de llamadas del
consumidor es exponencial con parámetro .
a. Explique intuitivamente cómo la selección del plan de llamadas deberá depender de cuál sea la duración de las llamadas.
b. ¿Cuál plan es mejor si la duración esperada de las llamadas es de 10 minutos? ¿Y de 15 minutos? [Sugerencia:
Sea h1(x) el costo del primer plan cuando la duración
de las llamadas es de x minutos y sea h2(x) la función de
costo del segundo plan. Dé expresiones para estas dos
funciones de costo y luego determine el costo esperado
de cada plan.]
64. Evalúe lo siguiente:
a. (6)
b. (5/2)
c. F(4; 5) (la función gama incompleta)
d. F(5; 4)
e. F(0; 4)
65. Si X tiene una distribución gama estándar con 7 evalúe
lo siguiente:
a. P(X 5)
b. P(X 5)
c. P(X 8)
d. P(3 X 8)
e. P(3 X 8)
f. P(X 4 o X 6)
66. Suponga que el tiempo empleado por un estudiante seleccionado al azar que utiliza una terminal conectada a un sistema
de computadoras de tiempo compartido tiene una distribución gama con media de 20 min y varianza de 80 min2.
a. ¿Cuáles son los valores de y ?
b. ¿Cuál es la probabilidad de que un estudiante utilice la
terminal durante cuando mucho 24 min?
c. ¿Cuál es la probabilidad de que un estudiante utilice la
terminal durante entre 20 y 40 min?
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:04 AM
Page 163
4.5 Otras distribuciones continuas
ÌÓ
(n 1 ) !
0
x
0
x0
Se puede demostrar que si los tiempos entre eventos sucesivos son independientes, cada uno con distribución exponencial con parámetro , entonces el tiempo total que transcurre
antes de que ocurran los siguientes n eventos tiene una función de densidad de probabilidad f(x; , n).
a. ¿Cuál es el valor esperado de X? Si el tiempo (en minutos) entre llegadas de clientes sucesivos está exponencialmente distribuido con 0.5, ¿cuánto tiempo se
puede esperar que transcurra antes de que llegue el décimo cliente?
b. Si el tiempo entre llegadas de clientes está exponencialmente distribuido con 0.5, ¿cuál es la probabilidad
de que el décimo cliente (después del que acaba de llegar) llegue dentro de los siguientes 30 min?
c. El evento {X t} ocurre si y sólo si ocurren n eventos
en el siguiente t. Use el hecho de que el número de eventos que ocurren en un intervalo de duración t tiene una
distribución de Poisson con parámetro t para escribir
1
2
3
4
5
En cuanto un componente falla, todo el sistema lo hace. Suponga que cada componente tiene una duración que está exponencialmente distribuida con 0.01 y que los
componentes fallan de manera independiente uno de otro.
Defina los eventos Ai {el componente i-ésimo dura por lo
menos t horas}, i 1, . . . , 5, de modo que los Ai son eventos independientes. Sea X el tiempo al cual el sistema falla, es decir, la duración más corta (mínima) entre los cinco
componentes.
a. ¿A qué evento equivale el evento {X t} que implique
A1, . . . , A5?
b. Utilizando la independencia de los eventos Ai, calcule
P(X t). Luego obtenga F(t) P(X t) y la función
de densidad de probabilidad de X. ¿Qué tipo de distribución tiene X?
c. Suponga que existen n componentes y cada uno tiene
una duración exponencial con parámetro . ¿Qué tipo de
distribución tiene X?
70. Si X tiene una distribución exponencial con parámetro ,
derive una expresión general para el (100p)o percentil de la
distribución. Luego especifique cómo obtener la mediana.
71. a. ¿A qué evento equivale el evento {X2 y} que implique
a X misma?
b. Si X tiene una distribución normal estándar, use el inciso
a) para escribir la integral que es igual a P(X2 y). Luego derive con respecto a y para obtener la función de densidad de probabilidad de X2 [el cuadrado de una variable
N(0, 1)]. Por último, demuestre que X2 tiene una
distribución ji cuadrada con 1 grados de libertad
[véase (4.10)]. [Sugerencia: Use la siguiente identidad.]
d Ï
Ì
dy Ó
b(y)
a(y)
f(x) dx f [b(y)] b(y) f [a(y)] a(y)
Ï
f(x; , n)
Ï (x )n1ex
69. Un sistema consta de cinco componentes idénticos conectados en serie como se muestra:
Ì
68. El caso especial de la distribución gama en la cual es un
entero positivo n se llama distribución Erlang. Si se reemplaza por 1/ en la expresión (4.8), la función de densidad de probabilidad Erlang es
una expresión (que implique probabilidades de Poisson)
para la función de distribución acumulativa de Erlang
F(t; , n) P(X t).
Ó
67. Suponga que cuando un transistor de cierto tipo se somete
a una prueba de duración acelerada, la duración X (en semanas) tiene una distribución gama acelerada con media de 24
semanas y desviación estándar de 12 semanas.
a. ¿Cuál es la probabilidad de que un transistor dure entre
12 y 24 semanas?
b. ¿Cuál es la probabilidad de que un transistor dure cuando mucho 24 semanas? ¿Es la mediana de la distribución de duración menor que 24? ¿Por qué si o por qué
no?
c. ¿Cuál es el 99o percentil de la distribución de duración?
d. Suponga que la prueba termina en realidad después de t
semanas. ¿Qué valor de t es tal que sólo el 0.5% de todos
los transistores continuarán funcionando al término de la
prueba?
163
4.5 Otras distribuciones continuas
Las familias de distribuciones normal, gama (incluida la exponencial) y uniforme proporcionan una amplia variedad de modelos de probabilidad de variables continuas, pero existen muchas situaciones prácticas en las cuales ningún miembro de estas familias se adapta
bien a un conjunto de datos observados. Los estadísticos y otros investigadores han desarrollado otras familias de distribuciones que a menudo son apropiadas en la práctica.
Distribución Weibull
El físico sueco Waloddi Weibull introdujo la familia de distribuciones Weibull en 1939; su
artículo de 1951 “A Statistical Distribution Function of Wide Applicability” (J. Applied Mechanics, vol. 18: 293-297) discute varias aplicaciones.
www.FreeLibros.me
c4_p130-183.qxd
164
3/12/08
CAPÍTULO 4
4:04 AM
Page 164
Variables aleatorias continuas y distribuciones de probabilidad
DEFINICIÓN
Se dice que una variable aleatoria X tiene una distribución Weibull con parámetros
y ( 0, 0) si la función de densidad de probabilidad de X es
Ï x1e(x /)
f(x; , )
ÌÓ
x
0
(4.11)
x0
0
En algunas situaciones, existen justificaciones teóricas para la pertinencia de la distribución Weibull, pero en muchas aplicaciones f(x; , ) simplemente proporciona una concordancia con los datos observados con valores particulares de y . Cuando 1, la
función de densidad de probabilidad se reduce a la distribución exponencial (con 1/),
de modo que la distribución exponencial es un caso especial tanto de la distribución gama
como de la distribución Weibull. No obstante, existen distribuciones gama que no son Weibull y viceversa, por lo que una familia no es un subconjunto de la otra. Tanto como
pueden ser variadas para obtener diferentes formas distribucionales, como se ilustra en la figura 4.28. es un parámetro de escala, así que diferentes valores alargan o comprimen
la gráfica en la dirección x.
Si se integra para obtener E(X) y E(X2) se tiene
1
1
2 2 1
2
1
1
2
El cálculo de y 2 requiere por lo tanto el uso de la función gama.
La integración 0x f(y; , ) dy es fácil de realizar para obtener la función de distribución acumulativa de X.
La función de distribución acumulativa de una variable aleatoria de Weibull con parámetros y es
Ï
F(x; , ) Ì
Ó1
Ejemplo 4.25
0
e(x/)
x0
x 0
(4.12)
En años recientes la distribución Weibull ha sido utilizada para modelar emisiones de varios contaminantes de motores. Sea X la cantidad de emisiones de NOx (g/gal) de un motor de cuatro tiempos de un tipo seleccionado al azar y suponga que X tiene una
distribución Weibull con 2 y 10 (sugeridos por la información que aparece en el
artículo “Quantification of Variability and Uncertainty in Lawn and Garden Equipment
NOx and Total Hydrocarbon Emission Factors”, J. of the Air and Waste Management Assoc., 2002: 435-448). La curva de densidad correspondiente se ve exactamente como la de
la figura 4.28 con 2, 1 excepto que ahora los valores 50 y 100 reemplazan a 5 y
10 en el eje horizontal (debido a que es un “parámetro de escala”). Entonces
P(X 10) F(10; 2, 10) 1 e(10/10) 1 e1 0.632
2
Asimismo, P(X 25) 0.998, así que la distribución está concentrada casi por completo
en valores entre 0 y 25. El valor c, el cual separa 5% de todos los motores que emiten las
más grandes cantidades de NOx del 95% restante, satisface
0.95 1 e(c/10)
2
Aislando el término exponencial en un lado, tomando logaritmos y resolviendo la ecuación
resultante se obtiene c 17.3 como el 95o percentil de la distribución de emisiones.
■
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:04 AM
Page 165
4.5 Otras distribuciones continuas
165
En situaciones prácticas, un modelo de Weibull puede ser razonable excepto que el
valor de X más pequeño posible puede ser algún valor que no se supone sea cero (esto
también se aplicaría a un modelo gama). La cantidad puede entonces ser considerada como un tercer parámetro de la distribución, lo cual es lo que Weibull hizo en su trabajo original. Con, por ejemplo,
3, todas las curvas que aparecen en la figura 4.28 se
desplazarían 3 unidades a la derecha. Esto equivale a decir que X tiene la función de
densidad de probabilidad (4.11) de modo que la función de distribución acumulativa de X
se obtiene reemplazando x en (4.12) por x .
f(x)
1
a = 1, b = 1 (exponencial)
a = 2, b = 1
0.5
a = 2, b = 0.5
x
0
5
10
f(x)
8
6
a = 10, b = 0.5
4
a = 10, b = 1
a = 10, b = 2
2
0
x
0
0.5
1.0
Figura 4.28
Ejemplo 4.26
1.5
2.0
2.5
Curvas de densidad Weibull.
Sea X la pérdida de peso por corrosión de una pequeña placa de aleación de magnesio
cuadrada sumergida durante 7 días en una solución inhibida acuosa al 20% de MgBr2. Suponga que la pérdida de peso mínima posible es 3 y que el exceso X 3 sobre esta
mínima tiene una distribución Weibull con 2 y 4. (Este ejemplo se consideró en
“Practical Applications of the Weibull Distribution”, Industrial Quality Control, agosto de
1964: 71-78; los valores de y se consideraron como 1.8 y 3.67, respectivamente, aun
cuando en el artículo se utilizó una selección de parámetros un poco diferente.) La función
de distribución acumulativa de X es entonces
Ï
F(x; , , ) F(x; 2, 4, 3) Ì
Ó1
www.FreeLibros.me
0
e[(x3)/4]
2
x3
x 3
c4_p130-183.qxd
166
3/12/08
CAPÍTULO 4
4:04 AM
Page 166
Variables aleatorias continuas y distribuciones de probabilidad
Por consiguiente,
P(X 3.5) 1 F(3.5; 2, 4, 3) e0.0156 0.985
y
■
P(7 X 9) 1 e2.25 (1 e1 ) 0.895 0.632 0.263
Distribución lognormal
DEFINICIÓN
Se dice que una variable aleatoria no negativa X tiene una distribución lognormal si
la variable aleatoria Y ln(X) tiene una distribución normal. La función de densidad
de probabilidad resultante de una variable aleatoria lognormal cuando el ln(X) está
normalmente distribuido con parámetros y es
Ï 1 e[ln(x)] /(2
f(x; , ) 2
x
0
Ó
Ì
2
2
)
x
0
x0
Hay que tener cuidado aquí; los parámetros y no son la media y la desviación estándar
de X sino de ln(X). Se puede demostrar que la media y varianza de X son
E(X) e
V(X) e2 (e 1)
2
2
/2
2
En el capítulo 5, se presenta una justificación teórica para esta distribución en conexión con el Teorema del Límite Central, pero como con cualesquiera otras distribuciones, se
puede utilizar la lognormal como modelo incluso en la ausencia de semejante justificación.
La figura 4.29 ilustra gráficas de la función de densidad de probabilidad lognormal; aunque
una curva normal es simétrica, una curva lognormal tiene una asimetría positiva.
Como el ln(X) tiene una distribución normal, la función de distribución acumulativa
de X puede ser expresada en términos de la función de distribución acumulativa (z) de una
variable aleatoria normal estándar Z.
F(x; , ) P(X x) P[ln(X) ln(x)]
ln(x)
ln(x)
P Z
,x0
(4.13)
f(x)
0.25
0.20
m = 1, s = 1
0.15
m = 3, s = √3
0.10
m = 3, s = 1
0.05
0
x
0
5
Figura 4.29
10
15
20
Curvas de densidad lognormal.
www.FreeLibros.me
25
c4_p130-183.qxd
3/12/08
4:04 AM
Page 167
4.5 Otras distribuciones continuas
Ejemplo 4.27
167
La distribución lognormal se utiliza con frecuencia como modelo de varias propiedades de
materiales. El artículo “Reliability of Wood Joist Floor Systems with Creep” (J. of Structural Engr., 1995: 946-954) sugiere que la distribución lognormal con 0.375 y 0.25
es un modelo factible de X el módulo de elasticidad (MDE, en 106 lb/pulg2) de sistemas
de piso de viguetas de madera de pino grado #2. La media y varianza del módulo de elasticidad son
E(X) e0.375 (0.25) /2 e0.40625 1.50
2
V(X) e0.8125(e0.0625 1) 0.1453
La probabilidad de que el módulo de elasticidad esté entre uno y dos es
P(1 X 2) P(ln(1) ln(X) ln(2))
P(0 ln(X) 0.693)
0 0.375
0.693 0.375
Z
0.25
0.25
(1.27) ( 1.50) 0.8312
P
¿Qué valor de c es tal que sólo el 1% de todos los sistemas tienen un módulo de elasticidad
que excede c? Se desea el valor de c con el cual
In(c) 0.375
0.99 P(X c) P Z
0.25
con la cual (ln(c) 0.375)/0.25 2.33 y c 2.605. Por lo tanto, 2.605 es el 99o percentil
de la distribución del módulo de elasticidad.
■
Distribución beta
Todas las familias de distribuciones continuas estudiadas hasta ahora, excepto la distribución uniforme, tienen densidad positiva a lo largo de un intervalo infinito (aunque por lo general la función de densidad se reduce con rapidez a cero más allá de unas cuantas
desviaciones estándar de la media). La distribución beta proporciona densidad positiva sólo
para X en un intervalo de longitud finita.
DEFINICIÓN
Se dice que una variable aleatoria X tiene una distribución beta con parámetros ,
(ambos positivos), A y B si la función de densidad de probabilidad de X es
Ï 1 ( ) x A
f(x; , , A, B) B A () () B A
0
Ó
Ì
1
Bx
1
B A
AxB
de lo contrario
El caso A 0, B 1 da la distribución beta estándar.
La figura 4.30 ilustra varias funciones de densidad de probabilidad beta estándar. Las gráficas de la función de densidad de probabilidad son similares, excepto que están desplazadas
y luego alargadas o comprimidas para ajustarse al intervalo [A, B]. A menos que y sean
enteros, la integración de la función de densidad de probabilidad para calcular probabilidades es difícil. Se deberá utilizar una tabla de la función beta incompleta o un programa de
computadora apropiado. La media y varianza de X son
A (B A)
www.FreeLibros.me
2
(B A)2
( )2( 1)
c4_p130-183.qxd
168
3/12/08
CAPÍTULO 4
4:04 AM
Page 168
Variables aleatorias continuas y distribuciones de probabilidad
f(x; , )
5
2
0.5
4
5
2
3
0.5
2
1
x
0
0.2
Figura 4.30
Ejemplo 4.28
0.4
0.6
0.8
1
Curvas de densidad beta estándar.
Los gerentes de proyectos a menudo utilizan un método llamado PERT (técnica de revisión
y evaluación de programas) para coordinar las diversas actividades que conforman un gran
proyecto. (Una aplicación exitosa ocurrió en la construcción de la nave espacial Apolo.) Una
suposición estándar en el análisis PERT es que el tiempo necesario para completar cualquier
actividad particular una vez que se ha iniciado tiene una distribución beta con A el tiempo optimista (si todo sale bien) y B tiempo pesimista (si todo sale mal). Suponga que al
construir una casa unifamiliar, el tiempo X (en días) necesario para echar los cimientos tiene una distribución beta con A 2, B 5, 2 y 3. Entonces, /( ) 0.4, así
que E(X) 2 (3)(0.4) 3.2. Con estos valores de y , la función de densidad de probabilidad de X es una función polinomial simple. La probabilidad de que se requieran a lo
sumo tres días para echar los cimientos es
P(X 3)
3
2
1 4! x 2
3 1!2!
3
4
27
3
2
5x
3
(x 2)(5 x)2 dx
dx
2
11
4 11
0.407
27
27 4
■
La distribución beta estándar se utiliza comúnmente para modelar la variación en la
proporción o porcentaje de una cantidad que ocurre en diferentes muestras, tal como la proporción de un día de 24 horas que un individuo está despierto o la proporción de un cierto
elemento químico en un compuesto.
EJERCICIOS
Sección 4.5 (72-86)
72. La duración X (en cientos de horas) de un tipo de tubo de
vacío tiene una distribución de Weibull con parámetros
2 y 3. Calcule lo siguiente:
a. E(X) y V(X)
b. P(X 6)
c. P(1.5 X 6)
(Esta distribución de Weibull se sugiere como modelo de
tiempo de servicio en “On the Assessment of Equipment
Reliability: Trading Data Collection Costs for Precision”,
J. Engr. Manuf., 1991: 105-109.)
73. Los autores del artículo “A Probabilistic Insulation Life Model for Combined Thermal-Electrical Stresses” (IEEE Trans.
on Elect. Insulation, 1985: 519-522) expresa que “la distribución de Weibull se utiliza mucho en problemas estadísticos relacionados con el envejecimiento de materiales sólidos
aislantes sometidos a envejecimiento y esfuerzo”. Proponen
el uso de la distribución como modelo del tiempo (en horas) hasta la falla de especímenes aislantes sólidos sometidos a voltaje de CA. Los valores de los parámetros dependen
del voltaje y temperatura, suponga 2.5 y 200 (valores sugeridos por datos que aparecen en el artículo).
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:04 AM
Page 169
4.5 Otras distribuciones continuas
74.
75.
76.
77.
78.
79.
a. ¿Cuál es la probabilidad de que la duración de un espécimen sea cuando mucho de 250? ¿De menos de 250?
¿De más de 300?
b. ¿Cuál es la probabilidad de que la duración de un espécimen esté entre 100 y 250?
c. ¿Qué valor es tal que exactamente 50% de todos los especímenes tengan duraciones que sobrepasen ese valor?
Sea X el tiempo (en 101 semanas) desde el envío de un
producto defectuoso hasta que el cliente lo devuelve. Suponga que el tiempo de devolución mínimo es 3.5 y que el
excedente X 3.5 sobre el mínimo tiene una distribución de
Weibull con parámetros 2 y 1.5 (véase el artículo
Industrial Quality Control, citado en el ejemplo 4.26).
a. ¿Cuál es la función de distribución acumulativa de X?
b. ¿Cuáles son el tiempo de devolución esperado y la varianza del tiempo de devolución? [Sugerencia: Primero
obtenga E(X 3.5) y V(X 3.5).]
c. Calcule P(X 5).
d. Calcule P(5 X 8).
Si X tiene una distribución de Weibull con la función de densidad de probabilidad de la expresión (4.11), verifique que
(1 1/). [Sugerencia: En la integral para E(X)
cambie la variable y (x/), de modo que x y1/.]
a. En el ejercicio 72, ¿cuál es la duración mediana de los
tubos? [Sugerencia: Use la expresión (4.12).]
b. En el ejercicio 74, ¿cuál es el tiempo de devolución
mediano?
c. Si X tiene una distribución de Weibull con la función de
distribución acumulativa de la expresión (4.12), obtenga
una expresión general para el percentil (100p)o de la distribución.
d. En el ejercicio 74, la compañía desea negarse a aceptar
devoluciones después de t semanas. ¿Para qué valor de t
sólo el 10% de todas las devoluciones serán rechazadas?
Los autores del artículo del cual se extrajeron los datos en
el ejercicio 1.27 sugirieron que un modelo de probabilidad
razonable de la duración de las brocas era una distribución
lognormal con 4.5 y 0.8.
a. ¿Cuáles son el valor medio y la desviación estándar de
la duración?
b. ¿Cuál es la probabilidad de que la duración sea cuando
mucho de 100?
c. ¿Cuál es la probabilidad de que la duración sea por lo
menos de 200? ¿De más de 200?
El artículo “On Assessing the Accuracy of Offshore Wind
Turbine Reliability-Based Design Loads from the Environmental Contour Method” (Intl. J. of Offshore and Polar
Engr., 2005: 132-140) propone la distribución de Weibull
con 1.817 y 0.863 como modelo de una altura (m)
de olas significativa durante una hora en un sitio.
a. ¿Cuál es la probabilidad de que la altura de las olas sea
cuando mucho de 0.5 m?
b. ¿Cuál es la probabilidad de que la altura de las olas exceda su valor medio por más de una desviación estándar?
c. ¿Cuál es la mediana de la distribución de la altura de las
olas?
d. Para 0 p 1, dé una expresión general para el percentil (100p)o de la distribución de altura de olas.
Sea X la potencia mediana por hora (en decibeles) de señales de radio transmitidas entre dos ciudades. Los autores
80.
81.
82.
83.
84.
85.
169
del artículo “Families of Distributions for Hourly Median
Power and Instantaneous Power of Received Radio Signals” (J. Research National Bureau of Standards, vol. 67D,
1963: 753-762) argumentan que la distribución lognormal
proporciona un modelo de probabilidad razonable para X.
Si los valores de parámetros son 3.5 y 1.2, calcule lo siguiente:
a. El valor medio y la desviación estándar de la potencia
recibida.
b. La probabilidad de que la potencia recibida esté entre 50
y 250 dB.
c. La probabilidad de que X sea menor que su valor medio.
¿Por qué esta probabilidad no es de 0.5?
a. Use la ecuación (4.13) para escribir una fórmula para la
~ de la distribución lognormal. ¿Cuál es la memediana
diana de la distribución de potencia del ejercicio 79?
b. Recordando que z es la notación para el percentil
100(1 ) de la distribución normal estándar, escriba
una expresión para el percentil 100(1 ) de la distribución lognormal. En el ejercicio 79, ¿qué valor excederá la potencia recibida sólo 5% del tiempo?
Una justificación teórica basada en el mecanismo de falla
de cierto material sustenta la suposición de que la resistencia dúctil X de un material tiene una distribución lognormal.
Suponga que los parámetros son 5 y 0.1.
a. Calcule E(X) y V(X).
b. Calcule P(X 125).
c. Calcule P(110 X 125).
d. ¿Cuál es el valor de la resistencia dúctil mediana?
e. Si diez muestras diferentes de un acero de aleación de este tipo se sometieran a una prueba de resistencia, ¿cuántas
esperaría que tengan una resistencia de por lo menos 125?
f. Si 5% de los valores de resistencia más pequeños fueran
inaceptables, ¿cuál sería la resistencia mínima aceptable?
El artículo “The Statistics of Phytotoxic Air Pollutants” (J.
Royal Stat. Soc., 1989:183-198) sugiere la distribución
lognormal como modelo de la concentración de SO2 sobre
un cierto bosque. Suponga que los valores de parámetro
son 1.9 y 0.9.
a. ¿Cuáles son el valor medio y la desviación estándar de
la concentración?
b. ¿Cuál es la probabilidad de que la concentración sea
cuando mucho de 10? ¿De entre 5 y 10?
¿Qué condición en relación con y es necesaria para que
la función de densidad de probabilidad beta estándar sea simétrica?
Suponga que la proporción X de área en un cuadrado seleccionado al azar que está cubierto por cierta planta tiene una
distribución beta estándar con 5 y 2.
a. Calcule E(X) y V(X).
b. Calcule P(X 0.2).
c. Calcule P(0.2 X 0.4).
d. ¿Cuál es la proporción esperada de la región de muestreo no cubierta por la planta?
Si X tiene una densidad beta estándar con parámetros y .
a. Verifique la fórmula para E(X) dada en la sección.
b. Calcule E[(1 X)m]. Si X representa la proporción de
una sustancia compuesta de un ingrediente particular,
¿cuál es la proporción esperada que no se compone de
ese ingrediente?
www.FreeLibros.me
c4_p130-183.qxd
170
3/12/08
CAPÍTULO 4
4:05 AM
Page 170
Variables aleatorias continuas y distribuciones de probabilidad
86. Se aplica esfuerzo a un barra de acero de 20 pulg sujeta por
cada extremo en una posición fija. Sea Y la distancia del
extremo izquierdo al punto donde se rompe la barra. Suponga que Y/20 tiene una distribución beta estándar con
100
E(Y ) 10 y V(Y ) 7 .
a. ¿Cuáles son los parámetros de la distribución beta estándar de interés?
b. Calcule P(8 Y 12).
c. Calcule la probabilidad de que la barra se rompa a más
de 2 pulg de donde esperaba que se rompiera.
4.6 Gráficas de probabilidad
Un investigador a menudo ha obtenido una muestra numérica x1, x2, . . . , xn y desea saber
si es factible que provenga de una distribución de población de un tipo particular (p. ej.,
de una distribución normal). Entre otras cosas, muchos procedimientos formales de inferencia estadística están basados en la suposición de que la distribución de población es de un tipo
específico. El uso de un procedimiento como esos es inapropiado si la distribución de probabilidad subyacente existente difiere en gran medida del tipo supuesto. Además, el entendimiento de la distribución subyacente en ocasiones puede dar una idea de los mecanismos
físicos implicados en la generación de los datos. Una forma efectiva de verificar una suposición distribucional es construir una gráfica de probabilidad. La esencia de una gráfica como
ésa es que si la distribución en la cual está basada es correcta, los puntos en la gráfica quedarán casi en una línea recta. Si la distribución real es bastante diferente de la utilizada para construir la curva, los puntos deberán apartarse sustancialmente de un patrón lineal.
Percentiles muestrales
Los detalles implicados al construir gráficas de probabilidad difieren un poco de una fuente a otra. La base de la construcción es una comparación entre percentiles de los datos muestrales y los percentiles correspondientes de la distribución considerada. Recuérdese que el
percentil (100p)o de una distribución continua con función de distribución acumulativa F()
es el número (p) que satisface F( (p)) p. Es decir, (p) es el número sobre la escala de
medición de modo que el área bajo la curva de densidad a la izquierda de (p) es p. Por lo
tanto el percentil 50o (0.5) satisface F( (0.5)) 0.5 y el percentil 90o satisface F( (0.9))
0.9. Considere como ejemplo la distribución normal estándar, para la cual la función de
distribución acumulativa es (). En la tabla A.3 del apéndice, el 20o percentil se halla localizando la fila y columna en la cual aparece 0.2000 (o un número tan cerca de él como es
posible) en el interior de la tabla. Como 0.2005 aparece en la intersección de la fila 0.8 y la
columna 0.04, el 20o percentil es aproximadamente 0.84. Asimismo el 25o percentil de
la distribución normal estándar es (utilizando interpolación lineal) aproximadamente 0.675.
En general, los percentiles muestrales se definen del mismo modo que se definen los
percentiles de una distribución de población. El 50o percentil muestral deberá separarse del
50% más pequeño de la muestra del 50% más grande, el 90o percentil deberá ser tal que el
90% de la muestra quede debajo de ese valor y el 10% quede sobre ese valor, y así de manera sucesiva. Desafortunadamente, se presentan problemas cuando en realidad se trata de
calcular los percentiles muestrales de una muestra particular de n observaciones. Si, por
ejemplo, n 10, se puede separar 20% de estos valores o 30% de los datos, pero no hay
ningún valor que separe con exactitud 23% de estas diez observaciones. Para ir más allá, se
requiere una definición operacional de percentiles muestrales (este es un lugar donde diferentes personas hacen cosas un poco diferentes). Recuérdese que cuando n es impar, la mediana muestral o el 50o percentil muestral es el valor medio en la lista ordenada, por
ejemplo, el sexto valor más grande cuando n 11. Esto equivale a considerar la observación media como la mitad en la mitad inferior de los datos y la mitad en la mitad superior.
Asimismo, supóngase que n 10. Entonces, si a este tercer valor más pequeño se le da el
nombre de 25o percentil, ese valor se está considerando como la mitad en el grupo inferior
(compuesto de las dos observaciones más pequeñas) y la mitad en el grupo superior (las siete
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:05 AM
Page 171
4.6 Gráficas de probabilidad
171
observaciones más grandes). Esto conduce a la siguiente definición general de percentiles
muestrales.
DEFINICIÓN
Se ordenan las n observaciones muestrales de la más pequeña a la más grande. Entonces la observación i-ésima más pequeña en la lista se considera que es el [100(i
0.5)/n]o percentil muestral.
Una vez que se han calculado los valores porcentuales 100(i 0.5)/n(i 1, 2, . . . ,
n), se pueden obtener los percentiles muestrales correspondientes a porcentajes intermedios
mediante interpolación lineal. Por ejemplo, si n 10, los porcentajes correspondientes a las
observaciones muestrales ordenadas son 100(1 0.5)/10 5%, 100(2 0.5)/10 15%,
25%, . . . , y 100(10 0.5)/10 95%. El 10o percentil está entonces a la mitad entre el
5o percentil (observación muestral más pequeña) y el 15o (segunda observación más pequeña). Para los propósitos, en este caso, tal interpolación no es necesaria porque una gráfica de probabilidad se basa sólo en los porcentajes 100(i 0.5)/n correspondientes a las n
observaciones muestrales.
Gráfica de probabilidad
Supóngase ahora que para los porcentajes 100(i 0.5)/n(i 1, . . . , n) se determinan los
percentiles de una distribución de población especificada cuya factibilidad está siendo investigada. Si la muestra en realidad se seleccionó de la distribución especificada, los percentiles muestrales (observaciones muestrales ordenadas) deberán estar razonablemente
próximos a los percentiles de distribución de población correspondientes. Es decir, con i
1, 2, . . . , n deberá haber una razonable concordancia entre la i-ésima observación muestral
más pequeña y el [100(i 0.5)/n]o percentil de la distribución especificada. Considérense
los (percentil poblacional, percentil muestral) pares, es decir, los pares
[100(i 0.5)/n]o percentil
de la distribución
,
i-ésima observación
muestral más pequeña
con i 1, . . . , n. Cada uno de esos pares se dibuja como un punto en un sistema de coordenadas bidimensional. Si los percentiles muestrales se acercan a los percentiles de distribución de población correspondientes, el primer número en cada par será aproximadamente
igual al segundo número. Los puntos dibujados se quedarán entonces cerca de una línea a
45°. Desviaciones sustanciales de los puntos dibujados con respecto a una línea a 45° hacen
dudar de la suposición de que la distribución considerada es la correcta.
Ejemplo 4.29
Un experimentador conoce el valor de cierta constante física. El experimentador realiza n 10
mediciones independientes de este valor por medio de un dispositivo de medición particular y anota los errores de medición resultantes (error valor observado valor verdadero). Estas observaciones aparecen en la tabla adjunta.
Porcentaje
5
15
25
35
45
Percentil z
1.645
1.037
0.675
0.385
0.126
1.91
1.25
0.75
0.53
0.20
Porcentaje
55
65
75
85
95
Percentil z
0.126
0.385
0.675
1.037
1.645
0.35
0.72
0.87
1.40
1.56
Observación muestral
Observación muestral
www.FreeLibros.me
c4_p130-183.qxd
172
3/12/08
CAPÍTULO 4
4:05 AM
Page 172
Variables aleatorias continuas y distribuciones de probabilidad
¿Es factible que el error de medición de una variable aleatoria tenga una distribución normal estándar? Los percentiles (z) normales estándares requeridos también se muestran en la
tabla. Por lo tanto, los puntos en la gráfica de probabilidad son (1.645, 1.91), (1.037,
1.25), . . . , y (1.645, 1.56). La figura 4.31 muestra la gráfica resultante. Aunque los puntos
se desvían un poco de la línea a 45°, la impresión predominante es que la línea se adapta a
los puntos muy bien. La gráfica sugiere que la distribución normal estándar es un modelo
de probabilidad razonable de error de medición.
Valor
observado
1.6
Línea a 45˚
1.2
0.8
0.4
Percentil z
1.6 1.2 0.8 0.4
0.4
0.8
1.2
1.6
0.4
0.8
1.2
1.6
1.8
Figura 4.31 Gráficas de pares (percentil z, valor observado) con los datos del ejemplo 4.29:
primera muestra.
La figura 4.32 muestra una gráfica de pares (percentil z¸ observación) de una segunda
muestra de diez observaciones. La línea a 45° da una buena adaptación a la parte media de
la muestra pero no a los extremos. La gráfica tiene apariencia S bien definida. Las dos observaciones muestrales más pequeñas son considerablemente más grandes que los percentiles z correspondientes
Valor
observado
Línea a 45˚
1.2
Curva en forma de S
0.8
0.4
1.6 1.2 0.8 0.4
Percentil z
0.4
0.8
1.2
1. 6
0.4
0.8
1.2
Figura 4.32 Gráficas de pares (percentil z, valor observado) con los datos del ejemplo 4.29:
segunda muestra.
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:05 AM
Page 173
4.6 Gráficas de probabilidad
173
(los puntos a la extrema izquierda de la gráfica están bien por arriba de la línea a 45°). Asimismo, las dos observaciones muestrales más grandes son mucho más pequeñas que los percentiles z asociados. Esta gráfica indica que la distribución normal estándar no sería una opción
factible del modelo de probabilidad que dio lugar a estos errores de medición observados. ■
A un investigador en general no le interesa saber con exactitud si una distribución de
probabilidad especificada, tal como la distribución normal estándar (normal con 0 y
1) o la distribución exponencial con 0.1, es un modelo factible de la distribución de
población de la cual se seleccionó la muestra. En cambio, la cuestión es si algún miembro
de una familia de distribuciones de probabilidad especifica un modelo factible, la familia de
distribuciones normales, la familia de distribuciones exponenciales, la familia de distribuciones Weibull, y así sucesivamente. Los valores de los parámetros de una distribución casi
nunca se especifican al principio. Si la familia de distribuciones Weibull se considera como
modelo de datos de duración, ¿existen algunos valores de los parámetros y con los cuales
la distribución de Weibull correspondiente se adapta bien a los datos? Afortunadamente, casi
siempre es el caso de que sólo una gráfica de probabilidad bastará para evaluar la factibilidad
de una familia completa. Si la gráfica se desvía sustancialmente de una línea recta, ningún
miembro de la familia es factible. Cuando la gráfica es bastante recta, se requiere más trabajo para estimar valores de los parámetros que generen la distribución más razonable del
tipo especificado.
Habrá que enfocarse en una gráfica para verificar la normalidad. Tal gráfica es útil en
trabajo aplicado porque muchos procedimientos estadísticos formales dan inferencias precisas sólo cuando la distribución de población es por lo menos aproximadamente normal.
Estos procedimientos en general no deben ser utilizados si la gráfica de probabilidad normal muestra un alejamiento muy pronunciado de la linealidad. La clave para construir una
gráfica de probabilidad normal que comprenda varios elementos es la relación entre los percentiles (z) normales estándares y aquellos de cualquier otra distribución normal:
percentil de una
distribución normal (, )
( percentil z correspondiente)
Considérese primero el caso, 0. Si cada observación es exactamente igual al percentil
normal correspondiente con algún valor de , los pares ( [percentil z], observación) quedan sobre una línea a 45°, cuya pendientes es 1. Esto implica que los pares (percentil z, observación) quedan sobre una línea que pasa por (0, 0) (es decir, una con intercepción y
en 0) pero con pendiente en lugar de 1. El efecto del valor no cero de es simplemente
cambiar la intercepción y de 0 a .
Una gráfica de los n pares
([100(i 0.5)/n]o percentil z, observación i-ésima más pequeña)
en un sistema de coordenadas bidimensional se llama gráfica de probabilidad normal. Si las observaciones muestrales se extraen en realidad de una distribución
normal con valor medio y desviación estándar , los puntos deberán quedar cerca
de una línea recta con pendiente e intercepción en . Así pues, una gráfica en la
cual los puntos quedan cerca de alguna línea recta sugiere que la suposición de una
distribución de población normal es factible.
Ejemplo 4.30
La muestra adjunta compuesta de n 20 observaciones de voltaje de ruptura dieléctrica
de un pedazo de resina epóxica apareció en el artículo “Maximum Likelihood Estimation
in the 3-Parameter Weibull Distribution” (IEEE Trans. on Dielectrics and Elec. Insul.,
www.FreeLibros.me
174
3/12/08
CAPÍTULO 4
4:05 AM
Page 174
Variables aleatorias continuas y distribuciones de probabilidad
1996: 43-55). Los valores de (i 0.5)/n para los cuales se requieren los percentiles z son
(1 0.5)/20 0.025, (2 0.5)/20 0.075, . . . , y 0.975.
Observación 24.46 25.61 26.25 26.42 26.66 27.15 27.31 27.54 27.74 27.94
Percentil z
1.96 1.44 1.15 0.93 0.76 0.60 0.45 0.32 0.19 0.06
Observación
Percentil z
27.98
0.06
28.04
0.19
28.28 28.49 28.50 28.87 29.11 29.13 29.50 30.88
0.32 0.45 0.60 0.76 0.93 1.15 1.44 1.96
La figura 4.33 muestra la gráfica de probabilidad normal resultante. La configuración en la
gráfica es bastante recta, lo que indica que es factible que la distribución de la población de
voltaje de ruptura dieléctrica es normal.
Voltaje
31
30
29
28
27
26
25
24
–2
Figura 4.33
–1
0
1
Percentil z
2
Gráfica de probabilidad normal de la muestra de voltaje de ruptura dieléctrica.
■
Existe una versión alternativa de una curva de probabilidad normal en la cual el eje de
los percentiles z es reemplazado por un eje de probabilidad no lineal. La graduación a escala
de este eje se construye de modo que los puntos graficados de nuevo queden cerca de una línea cuando la distribución muestreada es normal. La figura 4.34 muestra una gráfica como esa
generada por MINITAB con los datos de voltaje de ruptura del ejemplo 4.30.
0.999
0.99
0.95
Probabilidad
c4_p130-183.qxd
0.80
0.50
0.20
0.05
0.01
0.001
24.2
25.2
26.2
27.2
28.2
29.2
30.2
31.2
Voltaje
Figura 4.34 Gráfica de probabilidad normal de los datos de voltaje de ruptura generada
por MINITAB.
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:05 AM
Page 175
4.6 Gráficas de probabilidad
175
Una distribución de población no normal a menudo puede ser colocada en una de las
siguientes tres categorías:
1. Es simétrica y tiene “colas más livianas” que una distribución normal; es decir la curva
de densidad declina con más rapidez en la cola de lo que lo hace una curva normal.
2. Es simétrica y con colas pesadas en comparación con una distribución normal.
3. Es asimétrica.
Una distribución uniforme es de cola liviana, puesto que su función de densidad se reduce a
cero afuera de un intervalo finito. La función de densidad f(x) 1/[(1 x2)] en x
2
es de cola pesada, puesto que 1/(1 x2) declina mucho menos rápidamente que ex /2. Las distribuciones lognormal y Weibull se encuentran entre aquellas que son asimétricas. Cuando
los puntos en una gráfica de probabilidad normal no se adhieren a una línea recta, la configuración con frecuencia sugerirá que la distribución de la población se encuentra en una categoría particular de estas tres categorías.
Cuando la distribución de la cual se selecciona la muestra es de cola liviana, las observaciones más grandes y más pequeñas en general no son tan extremas como podría esperarse de una muestra aleatoria normal. Visualícese una línea recta trazada a través de la parte
media de la gráfica; los puntos a la extrema derecha tienden a estar debajo de la línea (valor observado el percentil z) en tanto que los puntos a la extrema izquierda de la gráfica
tienden a quedar sobre la línea recta (valor observado percentil z). El resultado es una
configuración en forma de S del tipo ilustrado en la figura 4.32.
Una muestra tomada de una distribución de cola pesada también tiende a producir una
gráfica en forma de S. Sin embargo, en contraste con el caso de cola liviana, el extremo izquierdo de la gráfica se curva hacia abajo (observado percentil z), como se muestra en la
figura 4.35a). Si la distribución subyacente es positivamente asimétrica (una cola izquierda
corta y una cola derecha larga), las observaciones muestrales más pequeñas serán más grandes que las esperadas con una muestra normal y también lo serán las observaciones más
grandes. En este caso, los puntos en ambos extremos de la gráfica quedarán sobre una línea
recta que pasa por la parte media, que produce una configuración curvada, como se ilustra
en la figura 4.35b). Una muestra tomada de una distribución lognormal casi siempre producirá la configuración mencionada. Una gráfica de (percentil z, ln(x)) pares deberán parecerse entonces a una línea recta.
Observación
Observación
Percentil z
Percentil z
b)
a)
Figura 4.35 Gráficas de probabilidad que sugieren una distribución no normal: a) una gráfica compatible con
una distribución de cola pesada; b) una gráfica compatible con una distribución positivamente asimétrica.
www.FreeLibros.me
c4_p130-183.qxd
176
3/12/08
CAPÍTULO 4
4:05 AM
Page 176
Variables aleatorias continuas y distribuciones de probabilidad
Aun cuando la distribución de la población sea normal, los percentiles muestrales no
coincidirán exactamente con los teóricos debido a la variabilidad del muestreo. ¿Qué tanto
pueden desviarse los puntos de la gráfica de probabilidad de un patrón de línea recta antes
de que la suposición de normalidad ya no sea factible? Esta no es una pregunta fácil de responder. En general, es más probable que una pequeña muestra de una distribución normal
produzca una gráfica con un patrón no lineal que una grande. El libro Fitting Equations to
Data (véase la bibliografía del capítulo 13) presenta los resultados de un estudio de simulación
en el cual se seleccionaron numerosas muestras de diferentes tamaños de distribuciones normales. Los autores concluyeron que en general varía mucho la apariencia de la gráfica de
probabilidad con tamaños de muestra de menos de 30 y sólo con tamaños de muestra mucho más grandes en general predomina el patrón lineal. Cuando una gráfica está basada en
un pequeño tamaño de muestra, sólo un alejamiento muy sustancial de la linealidad se deberá considerar como evidencia concluyente de no normalidad. Un comentario similar se
aplica a gráficas de probabilidad para comprobar la factibilidad de otros tipos de distribuciones.
Más allá de la normalidad
Considérese una familia de distribuciones de probabilidad que implica dos parámetros 1 y
2 y sea F(x; 1, 2) la función de distribución acumulativa correspondiente. La familia de distribuciones normales es una de esas familias, con 1 , 2 y F(x; , ) [(x )/].
Otro ejemplo es la familia Weibull, con 1 , 2 y
F(x; , ) 1 e(x/)
Otra familia más de este tipo es la familia gama, para la cual la función de distribución
acumulativa es una integral que implica la función gama incompleta que no puede ser expresada en cualquier forma más simple.
Se dice que los parámetros 1 y 2 son parámetros de ubicación y escala, respectivamente, si F(x; 1, 2) es una función de (x 1)/ 2. Los parámetros y de la familia
normal son los parámetros de ubicación y escala, respectivamente. Al cambiar la curva de
densidad acampanada se desplaza a la derecha o izquierda y al cambiar se alarga o comprime la escala de medición (la escala sobre el eje horizontal cuando se dibuja la función de
densidad). La función de distribución acumulativa da otro ejemplo
F(x;
1,
2)
1 ee
(x )/
1
2
x
Se dice que una variable aleatoria con esta función de distribución acumulativa tiene una
distribución de valor extremo. Se utiliza en aplicaciones que implican la duración de un
componente y la resistencia de un material.
Aunque la forma de la función de distribución acumulativa de valor extremo a primera vista pudiera sugerir que 1 es el punto de simetría de la función de densidad y por ende
la media y la mediana, éste no es el caso. En cambio, P(X 1) F( 1; 1, 2) 1 e1
0.632, y la función de densidad f(x; 1, 2) F(x; 1, 2) es negativamente asimétrica (una
larga cola inferior). Asimismo, el parámetro de escala 2 no es la desviación estándar (
1 0.5772 2 y 1.283 2). Sin embargo, al cambiar el valor de 1 cambia la ubicación
de la curva de densidad, mientras que al cambiar 2 cambia la escala del eje de medición.
El parámetro de la distribución de Weibull es un parámetro de escala, pero no es un
parámetro de ubicación. El parámetro en general se conoce como parámetro de forma.
Un comentario similar es pertinente para los parámetros y de la distribución gama. En
la forma usual, la función de densidad de cualquier miembro de o la distribución gama o Weibull es positiva con x 0 y cero de lo contrario. Un parámetro de ubicación puede ser introducido como tercer parámetro (se hizo esto para la distribución de Weibull) para
desplazar la función de densidad de modo que sea positiva si x y cero de lo contrario.
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:05 AM
Page 177
4.6 Gráficas de probabilidad
177
Cuando la familia considerada tiene sólo parámetros de ubicación y escala, el tema de
si cualquier miembro de la familia es una distribución de población factible puede ser abordado vía una gráfica de probabilidad única de fácil construcción. Primero se obtienen los
percentiles de la distribución estándar, una con 1 0 y 2 1, con los porcentajes
100 (i 0.5)/n (i 1, . . . , n). Los n pares (percentil estandarizado, observación) dan los
puntos en la gráfica. Esto es exactamente lo que se hizo para obtener una gráfica de probabilidad normal ómnibus. Un tanto sorprendentemente, esta metodología puede ser aplicada
para dar una gráfica de probabilidad Weibull ómnibus. El resultado clave es que X tiene una
distribución de Weibull con parámetro de forma y parámetro de escala , entonces la variable transformada ln(X) tiene una distribución de valor extremo con parámetro de ubicación 1 ln() y parámetro de escala 1/. Así pues una gráfica de los pares (percentil
estandarizado de valor extremo, ln(x)) que muestre un fuerte patrón lineal apoya la selección de la distribución de Weibull como modelo de una población.
Ejemplo 4.31
Las observaciones adjuntas son de la duración (en horas) del aislamiento de aparatos eléctricos cuando la aceleración del esfuerzo térmico y eléctrico se mantuvo fijo a valores particulares (“On the Estimation of Life of Power Apparatus Insulation Under Combined
Electrical and Thermal Stress”, IEEE Trans. on Electrical Insulation, 1985: 70-78). Una
gráfica de probabilidad de Weibull necesita calcular primero los percentiles 5o, 15o, . . . , y
95o de la distribución de valor extremo estándar. El (100p)o percentil (p) satisface
p F( (p)) 1 ee
(p)
de donde (p) ln[ln(1 p)].
2.97
1.82
1.25
0.84
0.51
x
282
501
741
851
1072
ln(x)
5.64
6.22
6.61
6.75
6.98
0.23
0.05
0.33
0.64
1.10
x
1122
1202
1585
1905
2138
ln(x)
7.02
7.09
7.37
7.55
7.67
Percentil
Percentil
Los pares (2.97, 5.64), (1.82, 6.22), . . . , (1.10, 7.67) se dibujan como puntos en la figura 4.36. La forma recta de la gráfica hacia la derecha argumenta firmemente a favor del
uso de la distribución de Weibull como modelo de duración de aislamiento, una conclusión
también alcanzada por el autor del citado artículo.
ln(x)
8
7
6
5
3
Figura 4.36
2
1
0
1
Percentil
Gráfica de probabilidad Weibull de los datos de duración del aislamiento.
www.FreeLibros.me
■
c4_p130-183.qxd
178
3/12/08
4:05 AM
Page 178
Variables aleatorias continuas y distribuciones de probabilidad
CAPÍTULO 4
La distribución gama es un ejemplo de una familia que implica un parámetro de forma para el cual no hay ninguna transformación h(·) de tal suerte que h(X) tenga una distribución que dependa sólo de los parámetros de ubicación y escala. Para construir una gráfica
de probabilidad primero se tiene que estimar el parámetro de forma de los datos muestrales
(algunos métodos para realizar lo anterior se describen en el capítulo 6). En ocasiones un
investigador desea saber si la variable transformada X tiene una distribución normal con algún valor de (por convención, 0 es idéntica a la transformación, en cuyo caso X tiene una distribución lognormal). El libro Graphical Methods for Data Analysis, citado en la
bibliografía del capítulo 1, discute este tipo de problema así como también otros refinamientos de construcción de gráficas de probabilidad. Afortunadamente, la amplia disponibilidad
de varias gráficas de probabilidad junto con paquetes de software estadísticos significa que
el usuario con frecuencia puede evitar los detalles técnicos.
EJERCICIOS
Sección 4.6 (87-97)
87. La gráfica de probabilidad normal adjunta se construyó con
una muestra de 30 lecturas de tensión de pantallas de malla
localizadas detrás de la superficie de tubos de visualización
de video utilizadas en monitores de computadora. ¿Parece
factible que la distribución de tensión sea normal?
Tensión
350
90. El artículo “A Probabilistic Model of Fracture in Concrete
and Size Effects on Fracture Toughness” (Magazine of Concrete Res., 1996: 311-320) da argumentos de por qué la distribución de tenacidad a la fractura en especímenes de
concreto deben tener una distribución de Weibull y presentar varios histogramas de datos a los que adaptan bien curvas de Weibull superpuestas. Considere la siguiente muestra
de tamaño n 18 observaciones de tenacidad de concreto de
alta resistencia (compatible con uno de los histogramas);
también se dan los valores de pi (i 0.5)/18.
300
Observación
0.47
0.58
0.65
0.69
0.72
0.74
0.0278 0.0833 0.1389 0.1944 0.2500 0.3056
pi
250
Observación
0.77
0.79
0.80
0.81
0.82
0.84
0.3611 0.4167 0.4722 0.5278 0.5833 0.6389
pi
200
Percentil z
–2
0
–1
1
2
88. Considere las siguientes diez observaciones de duración de
cojinetes (en horas):
152.7
204.7
172.0
216.5
172.5
234.9
173.3
262.6
193.0
422.6
Construya una gráfica de probabilidad normal y comente
sobre la factibilidad de la distribución normal como modelo de la duración de cojinetes (datos de “Modified Moment
Estimation for the Three-Parameter Lognormal Distribution”, J. Quality Technology, 1985: 92-99).
89. Construya una gráfica de probabilidad normal con la siguiente muestra de observaciones de espesor de recubrimiento de
pintura de baja viscosidad (“Achieving a Target Value for a
Manufacturing Process: A Case Study”, J. of Quality Technology, 1992: 22-26). ¿Se sentiría cómodo estimando el espesor medio de la población con un método que supuso una
distribución de población normal?
0.83
0.88
0.88
1.04
1.09
1.12
1.29
1.31
1.48
1.49
1.59
1.62
1.65
1.71
1.76
1.83
Observación
0.86
0.89
0.91
0.95
1.01
1.04
0.6944 0.7500 0.8056 0.8611 0.9167 0.9722
pi
Construya una gráfica de probabilidad Weibull y comente
acerca de ella.
91. Construya una gráfica de probabilidad normal con los datos
de propagación de grietas por fatiga dados en el ejercicio 39
(capítulo 1). ¿Parece factible que la duración de la propagación tenga una distribución normal? Explique.
92. El artículo “The Load-Life Relationship for M50 Bearings with Silicon Nitride Ceramic Balls” (Lubrication
Engr., 1984: 153-159) reporta los datos adjuntos de duración de cojinetes (millones de revs.) probados con una
carga de 6.45 kN.
47.1
68.1
68.1
90.8
103.6
106.0
115.0
126.0
146.6
229.0
240.0
240.0
278.0
278.0
289.0
289.0
367.0
385.9
392.0
505.0
a. Construya una gráfica de probabilidad normal. ¿Es factible la normalidad?
b. Construya una gráfica de probabilidad de Weibull. ¿Es
factible la familia de distribución Weibull?
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:05 AM
Page 179
Ejercicios suplementarios
93. Construya una gráfica de probabilidad que le permita evaluar
la factibilidad de la distribución lognormal como modelo de
los datos de cantidad de lluvia del ejercicio 83 (capítulo 1).
94. Las observaciones adjuntas son valores de precipitación durante marzo a lo largo de un periodo de 30 años en Minneapolis-St. Paul.
0.77 1.20
3.00
1.62
2.81
2.48
1.74 0.47
3.09
1.31
1.87
0.96
0.81 1.43
1.51
0.32
1.18
1.89
1.20 3.37
2.10
0.59
1.35
0.90
1.95 2.20
0.52
0.81
4.75
2.05
a. Construya e interprete una gráfica de probabilidad normal con este conjunto de datos.
b. Calcule la raíz cuadrada de cada valor y luego construya una gráfica de probabilidad normal basada en estos
datos transformados. ¿Parece factible que la raíz cuadrada de la precipitación esté normalmente distribuida?
c. Repita el inciso b) después de transformar por medio de
raíces cúbicas.
95. Use un paquete de software estadístico para construir una gráfica de probabilidad normal de los datos de resistencia última
a la tensión dados en el ejercicio 13 del capítulo 1 y comente.
96. Sean y1, y2, . . . , yn, las observaciones muestrales ordenadas
(con y1 como la más pequeña y yn como la más grande). Una
179
verificación sugerida de normalidad es dibujar los pares
(1((i 0.5)/n), yi). Suponga que se cree que las observaciones provienen de una distribución con media 0 y sean
w1, . . . , wn los valores absolutos ordenados de las xi. Una
gráfica medio normal es una gráfica de probabilidad de las
wi. Más específicamente, como P(°Z° w) P(w
w) 2(w) 1, una gráfica medio normal es una gráfica de los pares (1{[(i 0.5)/n 1]/2}, wi ) La virtud
de esta gráfica es que los valores apartados pequeños o
grandes en la muestra original ahora aparecerán sólo en el
extremo superior de la gráfica y no en ambos extremos.
Construya una gráfica medio normal con la siguiente
muestra de errores de medición y comente: 3.78, 1.27,
1.44, 0.39, 12.38, 43.40, 1.15, 3.96, 2.34, 30.84.
97. Las siguientes observaciones de tiempo de falla (miles de
horas) se obtuvieron con una prueba de duración acelerada
de 16 chips de circuitos integrados de un tipo:
82.8
11.6
359.5
502.5
307.8
179.7
242.0
26.5
244.8
304.3
379.1
212.6
229.9
558.9
366.7
204.6
Use los percentiles correspondientes de la distribución
exponencial con 1 para construir una gráfica de probabilidad. Luego explique por qué la gráfica valora la factibilidad de la muestra habiendo sido generada con cualquier
distribución exponencial.
EJERCICIOS SUPLEMENTARIOS (98-128)
98. Sea X el tiempo que una cabeza de lectura/escritura requiere para localizar un registro deseado en un dispositivo
de memoria de disco de computadora una vez que la cabeza se ha colocado sobre la pista correcta. Si los discos giran
una vez cada 25 milisegundos, una suposición razonable es
que X está uniformemente distribuida en el intervalo [0, 25].
a. Calcule P(10 X 20).
b. Calcule P(X 10).
c. Obtenga la función de distribución acumulativa F(X).
d. Calcule E(X) y X.
99. Una barra de 12 pulg que está sujeta por ambos extremos se
somete a una cantidad creciente de esfuerzo hasta que
se rompe. Sea Y la distancia del extremo izquierdo al
punto donde ocurre la ruptura. Suponga que Y tiene la función de densidad de probabilidad
f(y)
Ï 1 y 1 y
Ì 24
Ó
0
12
100. Sea X el tiempo hasta la falla (en años) de cierto componente hidráulico. Suponga que la función de densidad de
probabilidad de X es f(x) 32/(x 4)3 con x 0.
a. Verifique que f(x) es una función de densidad de probabilidad legítima.
b. Determine la función de distribución acumulativa.
c. Use el resultado del inciso b) para calcular la probabilidad de que el tiempo hasta la falla esté entre dos y cinco años.
d. ¿Cuál el tiempo esperado hasta la falla?
e. Si el componente tiene un valor de recuperación igual a
100/(4 x) cuando su tiempo para la falla es x, ¿cuál
es el valor de recuperación esperado?
101. El tiempo X para la terminación de cierta tarea tiene una
función de distribución acumulativa F(x) dada por
Ï
0 y 12
Ì
de lo contrario
Calcule lo siguiente:
a. La función de densidad de probabilidad de Y y dibújela.
b. P(Y 4), P(Y 6) y P(4 Y 6)
c. E(Y), E(Y2) y V(Y).
d. La probabilidad de que el punto de ruptura ocurra a más
de 2 pulg del punto de ruptura esperado.
e. La longitud esperada del segmento más corto cuando
ocurre la ruptura.
Ó
x0
0
x3
3
1
0x1
4 4 x
1x
1
x
1 7
x
2 3
7
3
7
3
7
3
a. Obtenga la función de densidad de probabilidad f(x) y
trace su gráfica.
b. Calcule P(0.5 X 2).
c. Calcule E(X).
www.FreeLibros.me
c4_p130-183.qxd
180
3/12/08
CAPÍTULO 4
4:05 AM
Page 180
Variables aleatorias continuas y distribuciones de probabilidad
102. Se sabe que el voltaje de ruptura de un diodo seleccionado
al azar de cierto tipo está normalmente distribuido con valor medio de 40 V y desviación estándar de 1.5 V.
a. ¿Cuál es la probabilidad de que el voltaje de un solo
diodo esté entre 39 y 42?
b. ¿Qué valor es tal que sólo 15% de todos los diodos tengan voltajes que excedan ese valor?
c. Si se seleccionan cuatro diodos independientemente,
¿cuál es la probabilidad de que por lo menos uno tenga
un voltaje de más de 42?
103. El artículo “Computer Assisted Net Weight Control” (Quality Progress, 1983: 22-25) sugiere una distribución normal
con media de 137.2 oz y desviación estándar de 1.6 oz del
contenido de frascos de cierto tipo. El contenido declarado
fue de 135 oz.
a. ¿Cuál es la probabilidad de que un solo frasco contenga más que el contenido declarado?
b. Entre diez frascos seleccionados al azar, ¿cuál es la probabilidad de que por lo menos ocho contengan más del
contenido declarado?
c. Suponiendo que la media permanece en 137.2, ¿a qué
valor se tendría que cambiar la desviación estándar de
modo que 95% de todos los frascos contengan más que
el contenido declarado?
104. Cuando tarjetas de circuito utilizadas en la fabricación de
reproductores de discos compactos se someten a prueba,
el porcentaje de tarjetas defectuosas es de 5%. Suponga
que se recibió un lote de 250 tarjetas y que la condición
de cualquier tarjeta particular es independiente de las
demás.
a. ¿Cuál es la probabilidad aproximada de que por lo
menos 10% de las tarjetas en el lote sean defectuosas?
b. ¿Cuál es la probabilidad aproximada de que haya exactamente 10 defectuosas en el lote?
105. El artículo “Characterization of Room Temperature Damping in Aluminum-Indium Alloys” (Metallurgical Trans.
1993: 1611-1619) sugiere que el tamaño de grano de matriz A1 (m) de una aleación compuesta de 2% de indio
podría ser modelado con una distribución normal con valor
medio de 96 y desviación estándar de 14.
a. ¿Cuál es la probabilidad de que el tamaño de grano exceda de 100?
b. ¿Cuál es la probabilidad de que el tamaño de grano esté
entre 50 y 80?
c. ¿Qué intervalo (a, b) incluye 90% central de todos los
tamaños de grano (de modo que 5% esté por debajo de
a y 5% por encima de b)?
106. El tiempo de reacción (en segundos) a un estímulo es una
variable aleatoria continua con función de densidad de probabilidad
Ï3 1
f(x) 2 x2
Ó 0
Ì
1x3
de lo contrario
a. Obtenga la función de distribución acumulativa.
b. ¿Cuál es la probabilidad de que el tiempo de reacción
sea cuando mucho de 2.5 s? ¿De entre 1.5 y 2.5 s?
c. Calcule el tiempo de reacción esperado.
d. Calcule la desviación estándar del tiempo de reacción.
e. Si un individuo requiere más de 1.5 s para reaccionar a
una luz que se enciende y permanece encendida hasta que
transcurre un segundo más o hasta que la persona reacciona (lo que suceda primero). Determine la cantidad de
tiempo esperado de que la luz permanezca encendida.
[Sugerencia: Sea h(X) el tiempo que la luz está encendida como una función del tiempo de reacción X.]
107. Sea X la temperatura a la cual ocurre una reacción química.
Suponga que X tiene una función de densidad de probabilidad
Ï 1 (4 x2) 1 x 2
f (x) 9
Ó
0
de lo contrario
Ì
a. Trace la gráfica de f(x).
b. Determine la función de distribución acumulativa y
dibújela.
c. ¿Es cero la temperatura mediana a la cual ocurre la
reacción? Si no, ¿es la temperatura mediana menor o
mayor que cero?
d. Suponga que esta reacción es independientemente realizada una vez en cada uno de diez laboratorios diferentes
y que la función de densidad de probabilidad del tiempo
de reacción en cada laboratorio es como se da. Sea Y
el número entre los diez laboratorios en los cuales la
temperatura excede de uno. ¿Qué clase de distribución
tiene Y? (Dé el nombre y valores de los parámetros.)
108. El artículo “Determination of the MTF of Positive Photoresists Using the Monte Carlo Method” (Photographic Sci.
and Engr., 1983: 254-260) propone la distribución exponencial con parámetro 0.93 como modelo de la distribución
de una longitud de trayectoria libre de fotones (m) en ciertas circunstancias. Suponga que éste es el modelo correcto.
a. ¿Cuál es la longitud de trayectoria esperada y cuál es su
desviación estándar?
b. ¿Cuál es la probabilidad de que la longitud de trayectoria exceda de 3.0? ¿Cuál es la probabilidad de que la
longitud de trayectoria esté entre 1.0 y 3.0?
c. ¿Qué valor es excedido por sólo 10% de todas las longitudes de trayectoria?
109. El artículo “The Prediction of Corrosion by Statistical
Analysis of Corrosion Profiles” (Corrosion Science, 1985:
305-315) sugiere la siguiente función de distribución acumulativa de la profundidad X de la picadura más profunda en
un experimento que implica la exposición de acero al manganeso de carbono a agua de mar acidificada.
(x)/
F(x; , ) ee
x
Los autores proponen los valores 150 y 90. Suponga que éste es el modelo correcto.
a. ¿Cuál es la probabilidad de que la profundidad de la picadura más profunda sea cuando mucho de 150?
¿Cuándo mucho 300? ¿De entre 150 y 300?
b. ¿Por debajo de qué valor será observada la profundidad de
la picadura máxima en 90% de todos los experimentos?
c. ¿Cuál es la función de densidad de X?
d. Se puede demostrar que la función de densidad es unimodal (una sola cresta). ¿Por encima de qué valor sobre el eje
de medición ocurre esta cresta? (Este valor es el modo.)
e. Se puede demostrar que E(X) 0.5772 . ¿Cuál
es la media de los valores dados de y y cómo se
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:05 AM
Page 181
Ejercicios suplementarios
compara con la mediana y el modo? Trace la gráfica de
la función de densidad. [Nota: Ésta se conoce como
distribución de valor extremo más grande.]
110. Un componente tiene una duración X exponencialmente
distribuida con parámetro .
a. Si el costo de operación por unidad de tiempo es c,
¿cuál es el costo esperado de operación de este componente durante el tiempo que dura?
b. En lugar de un coeficiente de costos constante como en
el inciso a), suponga que el coeficiente de costos es
c(1 0.5eax) con a 0, de modo que el costo por unidad de tiempo es menor que c cuando el componente es
nuevo y se vuelve más caro a medida que el componente envejece. Ahora calcule el costo de operación esperado durante la duración del componente.
111. La moda de una distribución continua es el valor x* que incrementa al máximo f(x).
a. ¿Cuál es la moda de una distribución normal con parámetros y ?
b. ¿Tiene una sola moda la distribución uniforme con parámetros A y B? ¿Por qué sí o por qué no?
c. ¿Cuál es la moda de una distribución exponencial con
parámetro ? (Trace una gráfica.)
d. Si X tiene una distribución gama con parámetros y y
1, halle la moda [Sugerencia: ln[f(x)] se incrementará al máximo si y sólo si f(x) es, y puede ser más simple considerar la derivada de ln[f(x)].
e. ¿Cuál es la moda de una distribución ji cuadrada con
grados de libertad?
112. El artículo “Error Distribution in Navigation” (J. Institute of
Navigation, 1971: 429-442) sugiere que una distribución
exponencial reproduce con más o menos precisión a una
distribución de frecuencia de errores positivos (magnitudes
de errores). Sea X el error de posición lateral (millas náuticas), el cual puede ser positivo o negativo. Suponga que la
función de densidad de probabilidad de X es
f(x) (0.1)e
.2°x°
x
a. Trace una gráfica de f(x) y compruebe que f(x) es una
función de densidad de probabilidad legítima (demuestre que se integra a 1).
b. Obtenga la función de distribución acumulativa de X y
trácela.
c. Calcule P(X 0), P(X 2), P( 1 X 2), y la probabilidad de cometer un error de más de dos millas.
113. En algunos sistemas, un cliente es asignado a una o dos prestadoras de servicios. Si el tiempo para que el cliente sea atendido por la prestadora de servicios i tiene una distribución
exponencial con parámetro i (i 1, 2) y p es la proporción de
todos los clientes atendidos por la prestadora de servicios 1,
entonces la función de densidad de probabilidad de X el
tiempo para ser atendido de un cliente seleccionado al azar es
Ïp e x (1 p)2e x
x 0
f(x; 1, 2, p) Ì 1
0
de lo contrario
Ó
1
2
Ésta a menudo se llama distribución hiperexponencial o exponencial combinada. Esta distribución también se propone
como modelo de la cantidad de lluvia en “Modeling Monsoon Affected Rainfall of Pakistan by Point Processes” (J.
Water Resources Planning and Mgmnt., 1992: 671-688).
181
a. Verifique que f(x; 1, 2, p) es una función de densidad
de probabilidad.
b. ¿Cuál es la función de distribución acumulativa F(x; 1,
2, p)?
c. Si f(x; 1, 2, p) es la función de densidad de probabilidad de X, ¿cuál es E(X)?
d. Utilizando el hecho de que E(X 2) 2/2 cuando X tiene
una distribución exponencial con parámetro , calcule
E(X2) cuando X tiene la función de densidad de probabilidad f(x; 1, 2, p). Luego calcule V(X).
e. El coeficiente de variación de una variable aleatoria (o distribución) es CV /. ¿Cuál es CV para una variable
aleatoria exponencial? ¿Qué puede decir sobre el valor de
CV cuando X tiene una distribución hiperexponencial?
f. ¿Cuál es el CV de una distribución Erlang con parámetros y n como se definen en el ejercicio 68? [Nota: En
trabajo aplicado, el CV muestral se utiliza para decidir
cuál de las tres distribuciones podría ser apropiada.]
114. Suponga que en un estado particular se permite que las personas físicas que presentan su declaración de impuestos detallen sus deducciones sólo si el total de las deducciones
detalladas es por lo menos de $5 000. Sea X (en miles de dólares) el total de deducciones detalladas en un formulario
seleccionado al azar. Suponga que X tiene la función de
densidad de probabilidad
Ï k/x
f(x; ) Ì
Ó0
x 5
de lo contrario
a. Encuentre el valor de k. ¿Qué restricción en es necesaria?
b. ¿Cuál es la función de distribución acumulativa de X?
c. ¿Cuál es la deducción total esperada en un formulario
seleccionado al azar? ¿Qué restricción en es necesaria para que E(X) sea finita?
d. Demuestre que ln(X/5) tiene una distribución exponencial con parámetro 1.
115. Sea Ii la corriente de entrada a un transistor e I0 la corriente de salida. En ese caso la ganancia de corriente es proporcional a ln(I0/Ii). Suponga que la constante de
proporcionalidad es 1 (lo que conduce a seleccionar una
unidad de medición particular), así que la ganancia de corriente X ln(I0/Ii). Suponga que X está normalmente
distribuida con 1 y 0.05.
a. ¿Qué tipo de distribución tiene la razón I0/Ii?
b. ¿Cuál es la probabilidad de que la corriente de salida
sea más de dos veces la corriente de entrada?
c. ¿Cuáles son el valor esperado y la varianza de la razón
de corriente de salida a corriente de entrada?
116. El artículo “Response of SiCf/Si3N4 Composites Under
Static and Cyclic Loading-An Experimental and Statistical
Analysis” (J. of Engr. Materials and Technology, 1997:
186-193) sugiere que la resistencia a la tensión (MPa) de
compuestos en condiciones especificadas puede ser modelada por una distribución de Weibull con 9 y 180.
a. Trace una gráfica de la función de densidad.
b. ¿Cuál es la probabilidad de que la resistencia de un espécimen seleccionado al azar exceda de 175? ¿Sea de
entre 150 y 175?
c. Si se seleccionan al azar dos especímenes y sus resistencias
son independientes entre sí, ¿cuál es la probabilidad de que
por lo menos uno tenga una resistencia entre 150 y 175?
www.FreeLibros.me
c4_p130-183.qxd
182
3/12/08
CAPÍTULO 4
4:05 AM
Page 182
Variables aleatorias continuas y distribuciones de probabilidad
d. ¿Qué valor de resistencia separa al 10% de todos los especímenes más débiles del 90% restante?
117. Si Z tiene una distribución normal estándar, defina una
nueva variable aleatoria Y como Y Z . Demuestre
que Y tiene una distribución normal con parámetros y .
[Sugerencia: Y y si y sólo si Z ? Use ésta para definir
la función de distribución acumulativa de Y y luego derívela con respecto a y.]
118. a. Suponga que la duración X de un componente, medida
en horas, tiene una distribución gama con parámetros
y . Sea Y la duración medida en minutos. Deduzca
la función de densidad de probabilidad de Y. [Sugerencia:
Y y si y sólo si X y/60. Use esto para obtener la función de distribución acumulativa de Y y luego derívela para obtener la función de densidad de probabilidad.]
b. Si X tiene una distribución gama con parámetros y ,
¿cuál es la distribución de probabilidad de Y cX?
119. En los ejercicios 111 y 112, así como también en muchas
otras situaciones, se tiene la función de densidad de probabilidad f(x) de X y se desea conocer la función de densidad
de probabilidad de Y h(X). Suponga que h() es una función invertible, de modo que y h(x) se resuelve para x a
fin de obtener x k(y). Entonces se puede demostrar que
la función de densidad de probabilidad de Y es
g(y) f [k(y)] °k(y)°
a. Si X tiene una distribución uniforme con A 0 y B 1,
derive la función de densidad de probabilidad de Y
ln(X).
b. Resuelva el ejercicio 117, utilizando este resultado.
c. Resuelva el ejercicio 118(b), utilizando este resultado.
120. Basado en los datos del experimento de lanzamiento de dardo, el artículo “Shooting Darts” (Chance, verano de 1997:
16-19) propuso que los errores horizontales y verticales al
apuntar a un blanco deben ser independientes unos de
otros, cada uno con una distribución normal con media 0 y
varianza 2. Se puede demostrar entonces que la distancia
V del blanco al punto de aterrizaje es
f(v)
v
ev /2 v 0
2
a. ¿De qué familia introducida en este capítulo es esta
función de densidad de probabilidad?
b. Si 20 mm (cerca del valor sugerido por el artículo),
¿Cuál es la probabilidad de que un dardo aterrice dentro
de 25 mm (aproximadamente una pulg) del blanco?
121. El artículo “Three Sisters Give Birth on the Same Day”
(Chance, primavera de 2001, 23-25) utilizó el hecho de que
tres hermanas de Utah dieron a luz el 11 de marzo de 1998
como base para plantear algunas preguntas interesantes con
respecto a coincidencias de fechas de nacimiento.
a. No haciendo caso del año bisiesto y suponiendo que los
otros 365 días son igualmente probables, ¿cuál es la
probabilidad de que tres nacimientos seleccionados al
azar ocurran el 11 de marzo? Asegúrese de indicar qué,
si las hay, suposiciones adicionales está haciendo.
b. Con las suposiciones utilizadas en el inciso a), ¿cuál es
la probabilidad de que tres nacimientos seleccionados
al azar ocurran el mismo día?
c. El autor sugirió, basado en datos extensos, que el tiempo
de gestación (tiempo entre la concepción y el nacimiento)
2
2
podía ser modelado como si tuviera una distribución
normal con valor medio de 280 días y desviación estándar de 19.88 días. Las fechas esperadas para las tres hermanas de Utah fueron el 15 de marzo, el 1 de abril y el
4 de abril, respectivamente. Suponiendo que las tres fechas esperadas están en la media de la distribución,
¿cuál es la probabilidad de que los nacimientos ocurrieran el 11 de marzo? [Sugerencia: La desviación de la fecha de nacimiento con respecto a la fecha esperada está
normalmente distribuida con media 0.]
d. Explique cómo utilizaría la información del inciso c)
para calcular la probabilidad de una fecha de nacimiento común.
122. Sea X la duración de un componente, con f(x) y F(x) la función de densidad de probabilidad y la función de distribución
acumulativa de X. La probabilidad de que el componente falle en el intervalo (x, x x) es aproximadamente f(x) x.
La probabilidad condicional de que falle en (x, x x) dado
que ha durado por lo menos x es f(x) x/[1 F(x)]. Dividiendo ésta entre x se produce la función de coeficiente
de falla:
f (x)
r(x)
1 F(x)
Una función de coeficiente de falla creciente indica que la
probabilidad de que los componentes viejos se desgasten
es cada vez más grande, mientras que un coeficiente de falla
decreciente evidencia una confiabilidad cada vez más
grande con la edad. En la práctica, a menudo se supone una
falla “en forma de tina de baño”.
a. Si X está exponencialmente distribuida, ¿cuál es r(x)?
b. Si X tiene una distribución de Weibull con parámetros
y , ¿cuál es r(x)? ¿Con qué valores de parámetros se
incrementará r(x)? ¿Con qué valores de parámetro decrecerá r(x) con x?
c. Como r(x) (d/dx)ln[1 F(x)], ln[1 F(x)] r(x)
dx. Suponga
Ï 1 x 0 x
r(x)
Ó
0
de lo contrario
Ì
de modo que si un componente dura horas, durará por
siempre (si bien parece irrazonable, este modelo puede
ser utilizado para estudiar el “desgaste inicial”). ¿Cuáles son la función de distribución acumulativa y la función de densidad de probabilidad de X?
123. Sea que U tenga una distribución uniforme en el intervalo
[0, 1]. Entonces los valores observados que tienen esta distribución se obtienen con un generador de números aleatorios de computadora. Sea X (1/)ln(1 U).
a. Demuestre que X tiene una distribución exponencial
con parámetro . [Sugerencia: La función de distribución acumulativa de X es F(x) P(X x); X x equivale a U ?]
b. ¿Cómo utilizaría el inciso a) y un generador de números
aleatorios para obtener valores observados derivados de
una distribución exponencial con parámetro 10?
124. Considere una variable aleatoria con media y desviación
estándar y sea g(X) una función especificada de X. La
aproximación de la serie de Taylor de primer grado a g(X)
en la cercanía de es
g(X) g() g() (X )
www.FreeLibros.me
c4_p130-183.qxd
3/12/08
4:05 AM
Page 183
Bibliografía
El miembro del lado derecho de esta ecuación es una función
lineal de X. Si la distribución de X está concentrada en un intervalo a lo largo del cual g() es aproximadamente lineal
[p. ej., x es aproximadamente lineal en (1, 2)], entonces la
ecuación produce aproximaciones a E(g(X)) y V(g(X)).
a. Dé expresiones para estas aproximaciones. [Sugerencia: Use reglas de valor esperado y varianza de una función lineal aX b.]
b. Si el voltaje a través de un medio se mantiene fijo
pero la corriente I es aleatoria, entonces la resistencia
también será una variable aleatoria relacionada con I
por R v/I. Si I 20 y I 0.5, calcule aproximaciones a R y R.
125. Una función g(x) es convexa si la cuerda que conecta dos
puntos cualesquiera de su gráfica quedan sobre ésta. Cuando g(x) es derivable, una condición equivalente es que para cada x, la línea tangente en x queda por completo sobre
o debajo de la gráfica. (Véanse las figuras a continuación.)
¿Cómo se compara g() g(E(X)) con E(g(X))? [Sugerencia: La ecuación de la línea tangente en x es y
g() g() (x ). Use la condición de convexidad,
sustituya x por X y considere los valores esperados. Nota:
A menos que g(x) sea lineal, la desigualdad resultante (por
lo general llamada desigualdad de Jensen) es estricta ( en
lugar de ); es válida tanto con variables aleatorias continuas como discretas.]
183
126. Si X tiene una distribución de Weibull con parámetros
2 y , demuestre que Y 2X 2/2 tiene una distribución ji
cuadrada con 2. [Sugerencia: La función de distribución
acumulativa de Y es P(Y y); exprese esta probabilidad en
la forma P(X g(y)), use el hecho de que X tiene una función de distribución acumulativa de la forma de la expresión
(4.12) y derive con respecto a y para obtener la función de
densidad de probabilidad de Y.]
127. El registro crediticio de un individuo es un número calculado basado en el historial crediticio de dicho individuo el
cual ayuda a un prestamista a determinar cuánto se le puede prestar o qué límite de crédito debe ser establecido
para una tarjeta de crédito. Un artículo en los Los Angeles
Times presentó datos que sugerían que una distribución
beta con parámetros A 150 y B 850, 8, 2 proporcionaría una aproximación razonable a la distribución
de registros de crédito estadounidenses [Nota: Los registros de crédito son valores enteros].
a. Sea X un registro estadounidense de crédito seleccionado al azar. ¿Cuáles son el valor medio y la desviación
estándar de esta variable aleatoria? ¿Cuál es la probabilidad de que X esté dentro de una desviación estándar
de su valor medio?
b. ¿Cuál es la probabilidad aproximada de que un registro
seleccionado al azar excederá de 750 (lo que los prestamistas consideran un muy buen registro)?
128. Sea V el volumen de lluvia y W el volumen de escurrimiento (ambos en mm). De acuerdo con el artículo “Runoff
Quality Analysis of Urban Catchments with Analytical
Probability Models” (J. of Water Resource Planning and
Management, 2006: 4-14), el volumen de escurrimiento
será 0 si V d y será k(V d) si V vd. Aquí d es el
volumen de almacenamiento en una depresión (una constante) y k (también una constante) es el coeficiente de escurrimiento. El artículo citado propone una distribución
exponencial con parámetro para V.
a. Obtenga una expresión para la función de distribución
acumulativa de W. [Nota: W no es ni puramente continua ni puramente discreta; en cambio tiene una distribución “combinada” con un componente discreto en 0
y es continua con valores w 0.]
b. ¿Cuál es la función de densidad de probabilidad de W
con w 0? Úsela para obtener una expresión para el
valor esperado de volumen de escurrimiento.
Línea
tangente
x
Bibliografía
Bury, Kart, Statistical Distributions in Engineering, Cambridge
Univ. Press, Cambridge, Inglaterra, 1999. Un estudio informativo y fácil de leer de distribuciones y sus propiedades.
Johnson, Norman, Samuel Kotz y N. Balakrishnan Continuous
Univariate Distributions, vols. 1-2, Wiley, Nueva York, 1994.
Estos dos volúmenes presentan un estudio exhaustivo de varias distribuciones continuas.
Nelson, Wayne, Applied Life Data Analysis, Wiley, Nueva York,
1982. Presenta amplia discusión de distribuciones y métodos
que se utilizan en el análisis de datos de vida útil.
Olkin, Ingram, Cyrus Derman y Leon Gleser, Probability Models
and Applications (2a. ed.), Macmillan, Nueva York, 1994. Una
buena cobertura de las propiedades generales y distribuciones
específicas.
www.FreeLibros.me
c5_p184-226.qxd
3/12/08
5
4:07 AM
Page 184
Distribuciones de
probabilidad conjunta
y muestras aleatorias
INTRODUCCIÓN
En los capítulos 3 y 4 se estudiaron modelos de probabilidad para una sola variable
aleatoria. Muchos problemas de probabilidad y estadística implican diversas variables aleatorias al mismo tiempo. En este capítulo, primero se discuten modelos de
probabilidad del comportamiento conjunto (es decir, simultáneo) de diversas variables aleatorias, con énfasis especial en el caso en el cual las variables son independientes una de otra. Enseguida se estudian los valores esperados de funciones de diversas
variables aleatorias, incluidas la covarianza y la correlación como medidas del grado de
asociación entre dos variables.
Las últimas tres secciones del capítulo consideran funciones de n variables aleatorias X1, X2, . . . , Xn, con un enfoque especial en su promedio (X1 · · · Xn)/n.
A cualquier función de esta clase, que por sí misma es una variable aleatoria, se le llama estadística. Se utilizan métodos de probabilidad para obtener información sobre
la distribución de un estadístico. El resultado principal de este tipo es el Teorema del
Límite Central (TLC), la base de muchos procedimientos inferenciales que implican
tamaños de muestra grandes
184
www.FreeLibros.me
c5_p184-226.qxd
3/12/08
4:07 AM
Page 185
5.1 Variables aleatorias conjuntamente distribuidas
185
5.1 Variables aleatorias conjuntamente distribuidas
Existen muchas situaciones experimentales en las cuales más de una variable aleatoria será
de interés para un investigador. Primero se consideran las distribuciones de probabilidad
conjunta para dos variables aleatorias discretas, enseguida para dos variables continuas y
por último para más de dos variables.
Dos variables aleatorias discretas
La función masa de probabilidad (fmp) de una sola variable aleatoria discreta X especifica
cuánta masa de probabilidad está colocada en cada valor posible de X. La función masa de
probabilidad conjunta de dos variables aleatorias discretas X y Y describe cuánta masa de probabilidad se coloca en cada par posible de valores (x, y).
Sean X y Y dos variables aleatorias discretas definidas en el espacio muestral S de un
experimento. La función masa de probabilidad conjunta p(x, y) se define para cada
par de números (x, y) como
DEFINICIÓN
p(x, y) P(X x y Y y)
Debe cumplirse que p(x, y)
0 y p(x, y) 1.
x
y
Ahora sea A cualquier conjunto compuesto de pares de valores (x, y) (p. ej., A {(x, y):
x y 5} o {(x, y): máx(x, y) 3}). Entonces la probabilidad P[(X, Y) A] se obtiene
sumando la función masa de probabilidad conjunta incluidos todos los pares en A:
P[(X, Y) A] p(x, y)
(x, y) A
Ejemplo 5.1
Una gran agencia de seguros presta servicios a numerosos clientes que han adquirido tanto
una póliza de propietario de casa como una póliza de automóvil en la agencia. Por cada tipo
de póliza, se debe especificar una cantidad deducible. Para una póliza de automóvil, las
opciones son $100 y $250, mientras que para la póliza de propietario de casa, las opciones
son 0, $100 y $200. Suponga que se selecciona al azar un individuo con ambos tipos de póliza de los archivos de la agencia. Sea X la cantidad deducible sobre la póliza de auto y Y
la cantidad deducible sobre la póliza de propietario de casa. Los posibles pares (X, Y) son
entonces (100, 0), (100, 100), (100, 200), (250, 0), (250, 100) y (250, 200); la función masa
de probabilidad conjunta especifica la probabilidad asociada con cada uno de estos pares,
con cualquier otro par tiene probabilidad cero. Suponga que la tabla de probabilidad conjunta siguiente da la función masa de probabilidad conjunta:
p(x, y)
100
250
x
|
|
|
0
y
100
200
0.20
0.05
0.10
0.15
0.20
0.30
Entonces p(100, 100) P(X 100 y Y 100) P($100 deducible sobre ambas pólizas)
0.10. La probabilidad P(Y
100) se calcula sumando las probabilidades de todos los
pares (x, y) para los cuales y 100:
P(Y
100) p(100, 100) p(250, 100) p(100, 200) p(250, 200)
0.75
www.FreeLibros.me
■
c5_p184-226.qxd
186
3/12/08
CAPÍTULO 5
4:07 AM
Page 186
Distribuciones de probabilidad conjunta y muestras aleatorias
La función masa de probabilidad de una de las variables sola se obtiene sumando p(x,
y) con los valores de la otra variable. El resultado se llama función masa de probabilidad
marginal cuando los valores p(x, y) aparecen en una tabla rectangular, las sumas son totales
marginales (filas o columnas).
Las funciones masa de probabilidad marginal de X y de Y, denotadas por pX(x) y
pY(y), respectivamente, están dadas por
DEFINICIÓN
pX (x) p(x, y)
pY (y) p(x, y)
y
x
Así pues para obtener la función masa de probabilidad marginal de X evaluada en, por ejemplo, x 100, las probabilidades p(100, y) se suman con todos los valores posibles de y. Si se
hace esto por cada valor posible de X se obtiene la función masa de probabilidad marginal
de X sola (sin referencia a Y). Con las funciones masa de probabilidad marginal, se pueden
calcular las probabilidades de eventos que implican sólo X o sólo Y.
Ejemplo 5.2
(continuación
del ejemplo
5.1)
Los valores posibles de X son x 100 y x 250, por lo que si se calculan los totales en las
filas de la tabla de probabilidad conjunta se obtiene
pX (100) p(100, 0) p(100, 100) p(100, 200) 0.50
y
pX (250) p(250, 0) p(250, 100) p(250, 200) 0.50
La función masa de probabilidad marginal de X es entonces
0.5 x 100, 250
pX (x)
de lo contrario
0
{
Asimismo, la función masa de probabilidad marginal de Y se obtiene con los totales de las
columnas como
0.25
¨
p (y) ©0.50
ª0
y 0, 100
y 200
Y
Por lo tanto, P(Y
de lo contrario
100) pY (100) pY (200) 0.75 como antes.
■
Dos variables aleatorias continuas
La probabilidad de que el valor observado de una variable aleatoria continua X esté en un
conjunto unidimensional A (tal como un intervalo) se obtiene integrando la función de densidad de probabilidad f(x) a lo largo del conjunto A. Asimismo, la probabilidad de que el par
(X, Y) de variables aleatorias continuas quede en un conjunto A en dos dimensiones (tal como
un rectángulo) se obtiene integrando una función llamada función de densidad conjunta.
DEFINICIÓN
Sean X y Y variables aleatorias continuas. Una función de densidad de probabilidad conjunta
f(x, y) de estas dos variables es una función que satisface f(x, y) 0
y
f(x, y) dx dy 1. Entonces para cualquier conjunto A en dos dimensiones
P[(X, Y) A]
f(x, y) dx dy
A
En particular, si A es el rectángulo {(x, y): a x b, c y d}, entonces
P[(X, Y) A] P(a X b, c Y d)
www.FreeLibros.me
b d
f(x, y) dy dx
a c
c5_p184-226.qxd
3/12/08
4:07 AM
Page 187
5.1 Variables aleatorias conjuntamente distribuidas
187
Se puede considerar que f(x, y) especifica una superficie situada a una altura f(x, y)
sobre el punto (x, y) en un sistema de coordenadas tridimensional. Entonces P[(X, Y) A]
es el volumen debajo de esta superficie y sobre la región A, similar al área bajo una curva en
el caso unidimensional. Esto se ilustra en la figura 5.1.
f (x, y)
y
Superficie f (x, y)
A Rectángulo
sombreado
Figura 5.1
Ejemplo 5.3
x
P(X, Y) A volumen bajo la superficie de densidad sobre A.
Un banco dispone tanto de una ventanilla para automovilistas como de una ventanilla normal. En un día seleccionado al azar, sea X la proporción de tiempo que la ventanilla
para automovilistas está en uso (por lo menos un cliente está siendo atendido o está esperando ser atendido) y Y la proporción del tiempo que la ventanilla normal está en uso. Entonces
el conjunto de valores posibles de (X, Y ) es el rectángulo D {(x, y): 0 x 1, 0 y 1}.
Suponga que la función de densidad de probabilidad conjunta de (X, Y ) está dada por
6
(x y2)
f(x, y) 5
0
{
0 x 1, 0 y 1
de lo contrario
Para verificar que ésta es una función de densidad de probabilidad legítima, obsérvese que
f (x, y) 0 y
f(x, y) dx dy
1 1
6
(x y2) dx dy
5
0 0
1 1
6
x dx dy
5
0 0
1
0
6
x dx
5
1
0
1 1
0 0
6 2
y dx dy
5
6
6
6 2
y dy
1
10
15
5
La probabilidad de que ninguna ventanilla esté ocupada más de un cuarto del tiempo es
P 0X
1
1
,0Y
4
4
1/4 1/4
0
0
6
(x y2) dx dy
5
1/4 1/4
6
5
6 x2
20 2
0
.0109
0
°
x dx dy
x1/4
x0
6
5
6 y3
20 3
1/4 1/4
y2 dx dy
0
°
0
y1/4
y0
7
640
■
Como con las funciones masa de probabilidad conjunta, con la función de densidad de
probabilidad conjunta de X y Y, se puede calcular cada una de las dos funciones de densidad marginal.
www.FreeLibros.me
c5_p184-226.qxd
188
3/12/08
CAPÍTULO 5
4:07 AM
Page 188
Distribuciones de probabilidad conjunta y muestras aleatorias
DEFINICIÓN
Las funciones de densidad de probabilidad marginal de X y Y, denotadas por fX(x)
y fY(y), respectivamente, están dadas por
fX(x)
fY (y)
Ejemplo 5.4
(continuación
del ejemplo
5.3)
f(x, y) dy
con x
f(x, y) dx
con y
La función de densidad de probabilidad marginal de X, la cual da la distribución de probabilidad del tiempo que permanece ocupada la ventanilla para automovilistas sin referencia
a la ventanilla normal, es
fX(x)
f(x, y) dy
16
0
(x y 2) dy
5
6
2
x
5
5
con 0 x 1 y 0 de lo contrario. La función de densidad de probabilidad marginal de Y es
{
6 2 3
y
fY (y) 5
5
0
0y1
de lo contrario
Entonces
P
1
3
Y
4
4
3/4
1/4
fY (y) dy
37
0.4625
80
■
En el ejemplo 5.3, la región de densidad conjunta positiva fue un rectángulo, el cual
facilitó el cálculo de las funciones de densidad de probabilidad marginal. Considere ahora
un ejemplo en el cual la región de densidad positiva es más complicada.
Ejemplo 5.5
Una compañía de nueces comercializa latas de nueces combinadas de lujo que contienen
almendras, nueces de acajú y cacahuates. Suponga que el peso neto de cada lata es exactamente de 1 lb, pero la contribución al peso de cada tipo de nuez es aleatoria. Como los tres
pesos suman 1, un modelo de probabilidad conjunta de dos cualquiera da toda la información necesaria sobre el peso del tercer tipo. Sea X el peso de las almendras en una lata
seleccionada y Y el peso de las nueces de acajú. Entonces la región de densidad positiva es
D {(x, y): 0 x 1, 0 y 1, x y 1}, región sombreada ilustrada en la figura 5.2.
y
(0, 1)
(x, 1
x
Figura 5.2
x)
(1, 0)
x
Región de densidad positiva para el ejemplo 5.5.
Ahora sea la función de densidad de probabilidad conjunta de (X, Y)
f(x, y)
{
24xy
0
0 x 1, 0 y 1, x y 1
de lo contrario
www.FreeLibros.me
c5_p184-226.qxd
3/12/08
4:07 AM
Page 189
5.1 Variables aleatorias conjuntamente distribuidas
189
Con cualquier x fija, f (x, y) se incrementa con y; con y fija, f (x, y) se incrementa con x. Esto
es apropiado porque las palabras de lujo implican que la mayor parte de la lata deberá estar
compuesta de almendras y nueces de acajú en lugar de cacahuates, así que la función de
densidad deberá ser grande cerca del límite superior y pequeña cerca del origen. La superficie determinada por f (x, y) se inclina hacia arriba desde cero a medida que (x, y) se alejan
de uno u otro eje.
Claramente, f(x, y) 0. Para verificar la segunda condición sobre una función de densidad de probabilidad conjunta, recuérdese que una integral doble se calcula como una integral iterada manteniendo una variable fija (tal como x en la figura 5.2), integrando con los
valores de la otra variable localizados a lo largo de la línea recta que pasa a través de la
variable fija y finalmente integrando todos los valores posibles de la variable fija. Así pues
f(x, y) dy dx
f(x, y) dy dx
D
1
y2
2
24x
0
°
y1x
1
1x
0
0
24xy dy dx
dx
y0
1
0
12x(1 x)2 dx 1
Para calcular la probabilidad de que los dos tipos de nueces conformen cuando mucho 50%
de la lata, Sea A {(x, y): 0 x 1, 0 y 1, y x y 0.5}, como se muestra en la
figura 5.3. Entonces
P((X, Y ) A)
A
f(x, y) dx dy
0.5 0.5x
0
0
24xy dy dx 0.0625
La función de densidad de probabilidad marginal de las almendras se obtiene manteniendo
X fija en x e integrando la función de densidad de probabilidad conjunta f(x, y) a lo largo de
la línea vertical que pasa por x:
f X(x)
f(x, y) dy
{
1x
0
24xy dy 12x(1 x)2
0
0x1
de lo contrario
1
A Región sombreada
x
y
x
x
1
y 0.5
y
5
0.
x
Figura 5.3
1
Calcule de P [(X, Y) A] para el ejemplo 5.5.
Por simetría de f(x, y) y la región D, la función de densidad de probabilidad marginal de Y
■
se obtiene reemplazando x y X en fX(x) por y y Y, respectivamente.
Variables aleatorias independientes
En muchas situaciones, la información sobre el valor observado de una de las dos variables
X y Y da información sobre el valor de la otra variable. En el ejemplo 5.1, la probabilidad
marginal de X con x 250 fue de 0.5, como lo fue la probabilidad de que X 100. Sin
embargo, si se sabe que el individuo seleccionado tuvo Y 0, entonces X 100 es cuatro
veces más probable que X 250. Por lo tanto, existe dependencia entre las dos variables.
www.FreeLibros.me
c5_p184-226.qxd
190
3/12/08
CAPÍTULO 5
4:07 AM
Page 190
Distribuciones de probabilidad conjunta y muestras aleatorias
En el capítulo 2, se señaló que una forma de definir la independencia de dos eventos
es vía la condición de que P(A B) P(A) P(B). A continuación se da una definición
análoga de la independencia de dos variables aleatorias.
DEFINICIÓN
Se dice que dos variables aleatorias X y Y son independientes si por cada par de valores x y y,
p(x, y) pX (x) pY (y)
cuando X y Y son discretas
o
(5.1)
f(x, y) fX (x) fY (y)
cuando X y Y son continuas
Si (5.1) no se satisface con todos los pares (x, y), entonces se dice que X y Y son
dependientes.
La definición dice que dos variables son independientes si su función masa de probabilidad conjunta o función de densidad de probabilidad conjunta es el producto de las dos
funciones masa de probabilidad marginal o de las funciones de densidad de probabilidad
marginal.
Ejemplo 5.6
En la situación de la agencia de seguros de los ejemplos 5.1 y 5.2,
p(100, 100) 0.10 (0.5)(0.25) pX (100) pY (100)
de modo que X y Y no son independientes. La independencia de X y Y requiere que toda
entrada en la tabla de probabilidad conjunta sea el producto de las probabilidades marginales que aparecen en la filas y columnas correspondientes.
■
Ejemplo 5.7
(continuación
del ejemplo
5.5)
Como f(x, y) tiene la forma de un producto, X y Y parecerían ser independientes. Sin embar9
9
9
3
3
3 3
go, aunque fX ( 4 ) fY( 4 ) 16 , f( 4 , 4 ) 0 16 16 , de modo que las variables no son en realidad independientes. Para que sean independientes f (x, y) debe tener la forma g(x) h(y) y
la región de densidad positiva debe ser un rectángulo con sus lados paralelos a los ejes de
coordenadas.
■
La independencia de dos variables aleatorias es más útil cuando la descripción del experimento en estudio sugiere que X y Y no tienen ningún efecto entre ellas. Entonces, una vez
que las funciones masa de probabilidad y de densidad de probabilidad marginales han sido
especificadas, la función masa de probabilidad conjunta o la función de densidad de probabilidad conjunta es simplemente el producto de dos funciones marginales. Se desprende que
Ejemplo 5.8
P(a X b, c Y d) P(a X b) P(c Y d)
Suponga que las duraciones de dos componentes son independientes entre sí y que la distribución exponencial de la primera duración es X1 con parámetro 1, mientras que la distribución exponencial de la segunda es X2 con parámetro 2. Entonces la función de densidad de
probabilidad conjunta es
f (x1, x2) fX (x1) fX (x2)
2
1
1e
1x1
2e x 12e x x
0
2 2
1 1
2 2
x1 0, x2 0
de lo contrario
Sean 1 1/1000 y 2 1/1 200, de modo que las duraciones esperadas son 1000 y 1 200 horas,
respectivamente. La probabilidad de que ambas duraciones sean de por lo menos 1500 horas es
P(1500 X1, 1500 X2) P(1500 X1) P(1500 X2)
e (1500) e (1500)
1
2
(0.2231)(0.2865) 0.0639
www.FreeLibros.me
■
c5_p184-226.qxd
3/12/08
4:07 AM
Page 191
5.1 Variables aleatorias conjuntamente distribuidas
191
Más de dos variables aleatorias
Para modelar el comportamiento conjunto de más de dos variables aleatorias, se amplía el
concepto de una distribución conjunta de dos variables.
Si X1, X2, . . . , Xn son variables aleatorias discretas, la función masa de probabilidad
conjunta de las variables es la función
DEFINICIÓN
p(x1, x2, . . . , xn) P(X1 x1, X2 x2, . . . , Xn xn)
Si las variables son continuas, la función de densidad de probabilidad conjunta de
X1, . . . , Xn es la función f(x1, x2, . . . , xn) de modo que para n intervalos cualesquiera
[a1, b1], . . . , [an, bn],
P(a1 X1 b1, . . . , an Xn bn)
b1
bn
...
a1
an
f(x1, . . . , xn) dxn . . . dx1
En un experimento binomial, cada ensayo podría dar por resultado uno de sólo dos
posibles resultados. Considérese ahora un experimento compuesto de n ensayos independientes e idénticos, en los que cada ensayo puede dar uno cualquiera de r posibles resultados. Sea p1 P(resultado i en cualquier ensayo particular) y defínanse las variables
aleatorias como Xi el número de ensayos que dan el resultado i(i 1, . . . , r). Tal experimento se llama experimento multinomial y la función masa de probabilidad conjunta de
X1, . . . , Xr se llama distribución multinomial. Utilizando un argumento de conteo análogo al utilizado al derivar la distribución binomial, la función masa de probabilidad conjunta de X1, . . . , Xr, se puede demostrar que es
p(x1, . . . , xr)
{
n!
p x 1 . . . pxr
(x1!)(x2!) . . . (xr!) 1
0
xi 0, 1, 2, . . . , con x1 . . . xr n
r
de lo contrario
El caso r 2 da la distribución binomial, con X1 número de éxitos y X2 n X1
número de fallas.
Ejemplo 5.9
Si se determina el alelo de cada una de diez secciones de un chícharo obtenidas independientemente y p1 P(AA), p2 P(Aa), p3 P(aa), X1 número de AA, X2 número de
Aa y X3 número de aa, entonces la función masa de probabilidad multinomial para estas
Xi es
p(x1, x2, x3)
10!
px px px
(x1!)(x2!)(x3!) 1 2 3
1
2
3
xi 0, 1, . . .
y x1 x2 x3 10
con p1 p3 0.25, p2 0.5.
P(X1 2, X2 5, X3 3) p(2, 5, 3)
10!
(0.25)2(0.5)5(0.25)3 0.0769
2! 5! 3!
Ejemplo 5.10
■
Cuando se utiliza cierto método para recolectar un volumen fijo de muestras de roca en una
región, existen cuatro tipos de roca. Sean X1, X2 y X3 la proporción por volumen de los tipos
de roca 1, 2 y 3 en una muestra aleatoriamente seleccionada (la proporción del tipo de roca
4 es 1 X1 X2 X3, de modo que una variable X4 sería redundante). Si la función de
densidad de probabilidad conjunta de X1, X2, X3 es
f(x1, x2, x3)
kx1x2(1 x3)
0
0 x1 1, 0 x2 1, 0 x3 1, x1 x2 x3 1
de lo contrario
www.FreeLibros.me
c5_p184-226.qxd
192
3/12/08
CAPÍTULO 5
4:07 AM
Page 192
Distribuciones de probabilidad conjunta y muestras aleatorias
entonces k se determina como sigue
1
1 1x1
0
0
f(x1, x2, x3) dx3 dx2 dx1
1x1x2
0
kx1x2(1 x3) dx3 dx2 dx1
El valor de la integral iterada es k/144, por lo tanto k 144. La probabilidad de que las rocas
de los tipos 1 y 2 integren más de 50% de la muestra es
P(X1 X2 0.5)
f (x1, x2, x3) dx3 dx2 dx1
0xi1 para i1, 2, 3
x1x2x31, x1x20.5
{
0.5
0.5x1
0
0
}
1x1x2
0
144x1x2(1 x3) dx3 dx2
dx1
■
0.6066
La noción de independencia de más de dos variables aleatorias es similar a la noción
de independencia de más de dos eventos.
DEFINICIÓN
Se dice que las variables aleatorias X1, X2, . . . , Xn son independientes si para cada
subconjunto Xi , Xi , . . . , Xi de las variables (cada par, cada tripleta, y así sucesivamente), la función masa de probabilidad conjunta o función de densidad de probabilidad conjunta del subconjunto es igual al producto de funciones masa de probabilidad
o funciones de densidad de probabilidad marginales.
1
2
k
Así pues si las variables son independientes con n 4, entonces la función masa de probabilidad conjunta o función de densidad de probabilidad conjunta de dos variables cualesquiera es el producto de las dos marginales y asimismo para tres variables cualesquiera y
las cuatro variables juntas. Aún más importante, una vez que se dice que n variables son
independientes, entonces la función masa de probabilidad conjunta o función de densidad
de probabilidad conjunta es el producto de las n marginales.
Ejemplo 5.11
Si X1, . . . , Xn representan las duraciones de n componentes y éstos operan de manera independiente uno de otro y cada duración está exponencialmente distribuida con parámetro ,
entonces
f (x1, x2, . . . , xn) (ex ) (ex ) . . . (ex )
nex
x1 0, x2 0, . . . , xn
0
de lo contrario
1
n
2
0
i
Si estos n componentes constituyen un sistema que fallará en cuanto un solo componente lo
haga, entonces la probabilidad de que el sistema dure más allá del tiempo t es
P(X1 t, . . . , Xn t)
'
t
...
'
'
f (x1, . . . , xn) dx1 . . . dxn
t
ex dx1 . . .
1
t
(e
'
ex dxn
n
t
) e
t n
nt
Por consiguiente,
P(duración del sistema t) 1 ent
www.FreeLibros.me
con t
0
c5_p184-226.qxd
3/12/08
4:07 AM
Page 193
5.1 Variables aleatorias conjuntamente distribuidas
193
lo que demuestra que la distribución de la duración del sistema es exponencial con parámetro n; el valor esperado de la duración del sistema es 1/n.
■
En muchas situaciones exponenciales que se considerarán en este libro, la independencia es una suposición razonable, de modo que la especificación de la distribución conjunta se reduce a decidir sobre distribuciones marginales apropiadas.
Distribuciones condicionales
Suponga X el número de defectos mayores en un automóvil nuevo seleccionado al azar y
Y el número de defectos menores en el mismo auto. Si se sabe que el carro seleccionado
tiene un defecto mayor, ¿cuál es ahora la probabilidad de que el carro tenga cuando mucho
tres defectos menores?, es decir, ¿cuál es P(Y 3 | X 1)? Asimismo, si X y Y denotan las
duraciones de los neumáticos delantero y trasero de una motocicleta y sucede que X 10 000
millas, ¿cuál es ahora la probabilidad de que Y sea cuando mucho de 15 000 millas y cuál es
la duración esperada del neumático trasero “condicionada en” este valor de X? Preguntas de
esta clase pueden ser respondidas estudiando distribuciones de probabilidad condicional.
DEFINICIÓN
Sean X y Y dos variables aleatorias continuas con función de densidad de probabilidad conjunta f (x, y) y función de densidad de probabilidad marginal X fX(x). Entonces
para cualquier valor x de X con el cual fX(x) 0, la función de densidad de probabilidad condicional de Y dado que X x es
fY°X (y°x)
f ( x, y)
fX(x)
y
Si X y Y son discretas, si en esta definición se reemplazan las funciones de densidad
de probabilidad por funciones masa de probabilidad en esta definición da la función
masa de probabilidad condicional de Y cuando X x.
Obsérvese que la definición de fY | X(y | x) es igual a la de P(B | A), la probabilidad condicional de que B ocurra, dado que A ha ocurrido. Una vez que la función de densidad de probabilidad o la función masa de probabilidad ha sido determinada, preguntas del tipo
planteado al principio de esta subsección pueden ser respondidas integrando o sumando a
lo largo de un conjunto apropiado de valores Y.
Ejemplo 5.12
Reconsidere la situación del ejemplo 5.3 y 5.4 que implica X la proporción del tiempo que
la ventanilla para automovilista de un banco está ocupada y Y la proporción análoga de ventanilla normal. La función de densidad de probabilidad condicional de Y dado que X 0.8 es
fY°X( y°0.8)
f(0.8, y)
1
1.2(0.8 y2)
(24 30y2)
1.2(0.8) 0.4
34
fX (0.8)
0y1
La probabilidad de que la ventanilla normal esté ocupada cuando mucho la mitad del tiempo dado que X 0.8 es entonces
P(Y 0.5°X 0.8)
0.5
fY°X(y°0.8) dy
0.5
0
1
(24 30y2) dy 0.390
34
Utilizando la función de densidad de probabilidad marginal de Y se obtiene P(Y 0.5)
0.350. Además E(Y) 0.6, mientras que la proporción esperada del tiempo que la ventanilla normal está ocupada dado que X 0.8 (una expectativa condicional) es
1 1
E(Y°X 0.8)
y fY°X(y°0.8) dy
y(24 30y2) dy 0.574
■
34 0
www.FreeLibros.me
c5_p184-226.qxd
194
3/12/08
CAPÍTULO 5
4:07 AM
Page 194
Distribuciones de probabilidad conjunta y muestras aleatorias
EJERCICIOS
Sección 5.1 (1-21)
1. Una gasolinería cuenta tanto con islas de autoservicio como de
servicio completo. En cada isla, hay una sola bomba de gasolina sin plomo regular con dos mangueras. Sea X el número de
mangueras utilizadas en la isla de autoservicio y en un tiempo
particular y sea Y el número de mangueras en uso en la isla de
servicio completo en ese tiempo. La función masa de probabilidad conjunta de X y Y aparece en la tabla adjunta.
y
1
p(x, y)
0
2
|
|
|
|
0
1
2
x
0.10
0.08
0.06
0.04
0.20
0.14
0.02
0.06
0.30
a. ¿Cuál es P(X 1 y Y 1)?
b. Calcule P(X 1 y Y 1).
c. Describa el evento (X 0 y Y 0) y calcule su probabilidad.
d. Calcule la función masa de probabilidad marginal de X
y Y. Utilizando pX(x), ¿cuál es P(X 1)?
e. ¿Son X y Y variables aleatorias independientes? Explique.
2. Cuando un automóvil es detenido por una patrulla de seguridad, cada uno de los neumáticos es revisado en cuanto a
desgaste y cada uno de los faros es revisado para ver si está
apropiadamente alineado. Sean X el número de faros que
necesitan ajuste y Y el número de neumáticos defectuosos.
a. Si X y Y son independientes con pX(0) 0.5, pX(1) 0.3,
pX (2) 0.2 y pY (0) 0.6, pY (1) 0.1, pY (2) pY (3)
0.05, pY (4) 0.2, muestre la función masa de probabilidad conjunta de (X, Y) en una tabla de probabilidad
conjunta.
b. Calcule P(X 1 y Y 1) con la tabla de probabilidad
conjunta y verifique que es igual al producto P(X 1)
P(Y 1).
c. ¿Cuál es P(X Y 0) (la probabilidad de ninguna violación)?
d. Calcule P(X Y 1).
3. Un supermercado cuenta tanto con una caja rápida como
con una superrápida. Sea X1 el número de clientes formados
en la caja rápida a una hora particular del día y sea X2 el
número de clientes formados en la caja superrápida a la
misma hora. Suponga que la función masa de probabilidad
de X1 y X2 es la que aparece en la tabla adjunta.
x2
0
1
2
3
x1
0
1
2
3
4
|
|
|
|
|
|
0.08
0.06
0.05
0.00
0.00
0.07
0.15
0.04
0.03
0.01
0.04
0.05
0.10
0.04
0.05
0.00
0.04
0.06
0.07
0.06
a. ¿Cuál es P(X1 1, X2 1), es decir, la probabilidad de
que haya exactamente un cliente en cada caja?
b. ¿Cuál es P(X1 X2), es decir, la probabilidad de que los
números de clientes en las dos cajas sean idénticos?
c. Sea A el evento en que hay por lo menos dos clientes
más en una caja que en la otra. Exprese A en función de
X1 y X2 y calcule la probabilidad de este evento.
d. ¿Cuál es la probabilidad de que el número total de clientes en las dos líneas sea exactamente cuatro? ¿Por lo
menos cuatro?
4. Regrese a la situación descrita en el ejercicio 3.
a. Determine la función masa de probabilidad marginal de
X1 y enseguida calcule el número esperado de clientes
formados en la caja rápida.
b. Determine la función masa de probabilidad marginal
de X2.
c. Por inspección de las probabilidades P(X1 4), P(X2 0)
y P(X1 4, X2 0), ¿son X1 y X2 variables aleatorias
independientes? Explique.
5. El número de clientes que esperan en el servicio de envoltura de regalos en una tienda de departamentos es una variable
aleatoria X con valores posibles 0, 1, 2, 3, 4 y probabilidades
correspondientes 0.1, 0.2, 0.3, 0.25, 0.15. Un cliente seleccionado al azar tendrá 1, 2 ó 3 paquetes para envoltura con
probabilidades de 0.6, 0.3 y 0.1, respectivamente. Sea Y el
número total de paquetes que van a ser envueltos para los
clientes que esperan formados en la fila (suponga que el
número de paquetes entregado por un cliente es independiente del número entregado por cualquier otro cliente).
a. Determine P(X 3, Y 3), es decir, p(3, 3).
b. Determine p(4, 11)
6. Sea X el número de cámaras digitales Canon vendidas
durante una semana particular por una tienda. La función
masa de probabilidad de X es
x
pX(x)
|
|
0
1
2
3
4
0.1
0.2
0.3
0.25
0.15
El 60% de todos los clientes que compran estas cámaras
también compran una garantía extendida. Sea Y el número
de compradores durante esta semana que compran una
garantía extendida.
a. ¿Cuál es P(X 4, Y 2)? [Sugerencia: Esta probabilidad es igual a P(Y 2|X 4) P(X 4); ahora piense
en las cuatro compras como cuatro ensayos de un experimento binomial, con el éxito en un ensayo correspondiente a comprar una garantía extendida.]
b. Calcule P(X Y).
c. Determine la función masa de probabilidad conjunta de
X y Y y luego la función masa de probabilidad marginal
de Y.
7. La distribución de probabilidad conjunta del número X de
carros y el número Y de autobuses por ciclo de señal en un
carril de vuelta a la izquierda propuesto se muestra en la
tabla de probabilidad conjunta anexa.
y
1
p(x, y)
0
2
x
www.FreeLibros.me
0
1
2
3
4
5
|
|
|
|
|
|
|
0.025
0.050
0.125
0.150
0.100
0.050
0.015
0.030
0.075
0.090
0.060
0.030
0.010
0.020
0.050
0.060
0.040
0.020
c5_p184-226.qxd
3/12/08
4:07 AM
Page 195
5.1 Variables aleatorias conjuntamente distribuidas
a. ¿Cuál es la probabilidad de que haya exactamente un
carro y exactamente un autobús durante un ciclo?
b. ¿Cuál es la probabilidad de que haya cuando mucho
un carro y cuando mucho un autobús durante un ciclo?
c. ¿Cuál es la probabilidad de que haya exactamente un
carro durante un ciclo? ¿Exactamente un autobús?
d. Suponga que el carril de vuelta a la izquierda tiene una
capacidad de cinco carros y un autobús que equivale a
tres carros. ¿Cuál es la probabilidad de un exceso de
vehículos durante un ciclo?
e. ¿Son X y Y variables aleatorias independientes? Explique.
8. Un almacén cuenta con 30 componentes de un tipo, de los cuales 8 fueron surtidos por el proveedor 1, 10 por el proveedor 2
y 12 por el proveedor 3. Seis de éstos tienen que ser seleccionados al azar para un ensamble particular. Sea X el número
de componentes del proveedor 1 seleccionados, Y el número de componentes del proveedor 2 seleccionados y que p(x, y)
denote la función masa de probabilidad conjunta de X y Y.
a. ¿Cuál es p(3, 2)? [Sugerencia: La probabilidad de que
cada muestra de tamaño 6 sea seleccionada es igual. Por
consiguiente, p(3, 2) (número de resultados con X 3
y Y 2)/(el número total de resultados). Ahora use la
regla de producto de conteo para obtener el numerador y
denominador.]
b. Utilizando la lógica del inciso a), obtenga p(x, y). (Esto
puede ser considerado como un muestreo con distribución hipergeométrica multivariante sin reemplazo de una
población finita compuesta de más de dos categorías.)
9. Se supone que cada neumático delantero de un tipo particular de vehículo está inflado a una presión de 26 lb/pulg2.
Suponga que la presión de aire real en cada neumático es una
variable aleatoria: X para el neumático derecho y Y para el
izquierdo con función de densidad de probabilidad conjunta
f(x, y)
{K(x0 y )
2
2
20 x 30, 20 y 30
de lo contrario
a. ¿Cuál es el valor de K?
b. ¿Cuál es la probabilidad de que ambos neumáticos estén
inflados a menos presión?
c. ¿Cuál es la probabilidad de que la diferencia en la presión del aire entre los dos neumáticos sea de cuando
mucho 2 lb/pulg2?
d. Determine la distribución (marginal) de la presión del
aire en el neumático derecho.
e. ¿Son X y Y variables aleatorias independientes?
10. Annie y Alvie acordaron encontrarse entre las 5:00 P.M. y las
6:00 P.M. para cenar en un restaurante local de comida saludable. Sea X la hora de llegada de Annie y Y la hora de
llegada de Alvie. Suponga que X y Y son independientes con
cada una distribuida uniformemente en el intervalo [5, 6].
a. ¿Cuál es la función de densidad de probabilidad conjunta de X y Y?
b. ¿Cuál es la probabilidad de que ambos lleguen entre las
5:15 y las 5:45?
c. Si el primero en llegar espera sólo 10 min antes de irse a
comer a otra parte, ¿cuál es la probabilidad de que cenen
en el restaurante de comida saludable? [Sugerencia: El
1
evento de interés es A {(x, y):°x y° 6 }.]
11. Dos profesores acaban de entregar los exámenes finales
para su copia. Sea X el número de errores tipográficos en el
195
examen del primer profesor y Y el número de tales errores
en el segundo examen. Suponga que X tiene una distribución
de Poisson con parámetro , que Y tiene una distribución de
Poisson con parámetro y que X y Y son independientes.
a. ¿Cuál es la función masa de probabilidad conjunta de X
y Y?
b. ¿Cuál es la probabilidad de que se cometa cuando
mucho un error en ambos exámenes combinados?
c. Obtenga una expresión general para la probabilidad de que
el número total de errores en los dos exámenes sea m (donde m es un entero no negativo). [Sugerencia: A {(x, y):
x y m} {(m, 0), (m 1, 1), . . . , (1, m 1),
(0, m)}. Ahora sume la función masa de probabilidad conjunta a lo largo de (x, y) A y use el teorema binomial, el
cual dice que
m
m
k akb mk (a b)m
k0
con cualquier a, b.]
12. Dos componentes de una minicomputadora tienen la
siguiente función de densidad de probabilidad conjunta de
sus vidas útiles X y Y:
f (x, y)
x(1y)
{xe 0
x 0yy 0
de lo contrario
a. ¿Cuál es la probabilidad de que la vida útil X del primer
componente exceda de 3?
b. ¿Cuáles son las funciones de densidad de probabilidad
marginal de X y Y? ¿Son las dos vidas útiles independientes? Explique.
c. ¿Cuál es la probabilidad de que la vida útil de por lo
menos un componente exceda de 3?
13. Tiene dos focos para una lámpara particular. Sea X la
vida útil del primer foco y Y la vida útil del segundo
(ambas en miles de horas). Suponga que X y Y son independientes y que cada una tiene una distribución exponencial con parámetro 1.
a. ¿Cuál es la función de densidad de probabilidad conjunta de X y Y?
b. ¿Cuál es la probabilidad de que cada foco dure cuando
mucho 1000 horas (es decir, X 1 y Y 1)?
c. ¿Cuál es la probabilidad de que la vida útil total de los
dos focos sea cuando mucho de 2? [Sugerencia: Trace
una figura de la región A {(x, y): x 0, y 0, x
y 2} antes de integrar.]
d. ¿Cuál es la probabilidad de que la vida útil total esté
entre 1 y 2?
14. Suponga que tiene diez focos y que la vida útil de cada uno
es independiente de la de los demás y que la distribución de
cada vida útil es exponencial con parámetro .
a. ¿Cuál es la probabilidad de que los diez focos fallen
antes del tiempo t?
b. ¿Cuál es la probabilidad de que exactamente k de los
diez focos fallen antes del tiempo t?
c. Suponga que nueve de los focos tienen vidas útiles
exponencialmente distribuidas con parámetro y que el
foco restante tiene una vida útil que está exponencialmente distribuida con parámetro (fue hecho por otro
fabricante). ¿Cuál es la probabilidad de que exactamente cinco de los diez focos fallen antes del tiempo t?
www.FreeLibros.me
c5_p184-226.qxd
196
3/12/08
CAPÍTULO 5
4:07 AM
Page 196
Distribuciones de probabilidad conjunta y muestras aleatorias
15. Considere un sistema compuesto de tres componentes como
se ilustra. El sistema continuará funcionando en tanto el primer componente funcione y o el componente 2 o el componente 3 funcione. Sean X1, X2 y X3 las vidas útiles de los
componentes 1, 2 y 3, respectivamente. Suponga que las Xi
son independientes una de otra y que cada Xi tiene una distribución exponencial con parámetro .
2
1
3
a. Sea Y la vida útil del sistema. Obtenga la función de distribución acumulativa de Y y derívela para obtener la
función de densidad de probabilidad. [Sugerencia:
F(y) P(Y y); exprese el evento {Y y} en función
de uniones y/o intersecciones de los tres eventos {X1 y},
{X2 y} y {X3 y}.]
b. Calcule la vida útil esperada del sistema.
16. a. Con f(x1, x2, x3) del ejemplo 5.10, calcule la función de
densidad marginal conjunta de X1 y X3 (integrando
para x2).
b. ¿Cuál es la probabilidad de que las rocas de tipos 1 y 3
constituyan cuando mucho 50% de la muestra? [Sugerencia: Use el resultado del inciso a).]
c. Calcule la función de densidad de probabilidad marginal
de X1 [Sugerencia: Use el resultado del inciso a).]
17. Un ecólogo desea seleccionar un punto adentro de una región
de muestreo circular de acuerdo con una distribución uniforme (en la práctica esto podría hacerse seleccionando primero
una dirección y luego una distancia a partir del centro en esa
dirección). Sea X la coordenada x del punto seleccionado
y Y la coordenada y del punto seleccionado. Si el círculo
tiene su centro en (0, 0) y su radio es R, entonces la función
de densidad de probabilidad conjunta de X y Y es
{
a.
b.
c.
d.
1
x2 y2 R2
f(x, y) R2
0
de lo contrario
¿Cuál es la probabilidad de que el punto seleccionado
quede dentro de R/2 del centro de la región circular?
[Sugerencia: Trace una figura de la región de densidad
positiva D. Como f (x, y) es constante en D, el cálculo de
probabilidad se reduce al cálculo de un área.]
¿Cuál es la probabilidad de que tanto X como Y difieran
de 0 por cuando mucho R/2?
Responda el inciso b) con R/2 reemplazando a R/2.
¿Cuál es la función de densidad de probabilidad marginal de X? ¿De Y? ¿Son X y Y independientes?
18. Remítase al ejercicio 1 y responda las siguientes preguntas:
a. Dado que X 1, determine la función masa de probabilidad condicional de Y, es decir, pY°X (0°1), pY°X (1°1) y
pY°X (2°1).
b. Dado que dos mangueras están en uso en la isla de autoservicio, ¿cuál es la función masa de probabilidad condicional del número de mangueras en uso en la isla de
servicio completo?
c. Use el resultado del inciso b) para calcular la probabilidad condicional P(Y 1|X 2).
d. Dado que dos mangueras están en uso en la isla de
servicio completo, ¿Cuál es la función masa de probabilidad condicional del número en uso en la isla de autoservicio?
19. La función de densidad de probabilidad conjunta de las presiones de los neumáticos delanteros derecho e izquierdo se
da en el ejercicio 9.
a. Determine la función de densidad de probabilidad condicional de Y dado que X x y la función de densidad
de probabilidad condicional de X dado que Y y.
b. Si la presión del neumático derecho es de 22 lb/pulg2,
¿cuál es la probabilidad de que la presión del neumático
izquierdo sea de por lo menos 25 lb/pulg2? Compare con
P(Y 25).
c. Si la presión del neumático derecho es de 22 lb/pulg2,
¿cuál es la presión esperada en el neumático izquierdo y
cuál es la desviación estándar de la presión en este neumático?
20. Sean X1, X2, X3, X4, X5 y X6 los números de lunetas M&M
azules, cafés, verdes, naranjas, rojas y amarillas, respectivamente, en una muestra de tamaño n. Entonces estas Xi tienen una distribución multinomial. De acuerdo con el sitio
web de M&M, las proporciones de colores son p1 0.24,
p2 0.13, p3 0.16, p4 0.20, p5 0.13 y p6 0.14.
a. Si n 12, ¿cuál es la probabilidad de que haya exactamente dos lunetas M&M de cada color?
b. Con n 20, ¿cuál es la probabilidad de que haya cuando mucho cinco lunetas naranjas? [Sugerencia: Considere la luneta naranja como un éxito y cualquier otro
color como falla.]
c. En una muestra de 20 lunetas M&M, ¿cuál es la probabilidad de que el número de lunetas azules, verdes o
naranjas sea por lo menos 10?
21. Sean X1, X2 y X3 las vidas útiles de los componentes 1, 2 y
3 en un sistema de tres componentes.
a. ¿Cómo definiría la función de densidad de probabilidad
condicional de X3 dado que X1 x1 y X2 x2?
b. ¿Cómo definiría la función de densidad de probabilidad
conjunta condicional de X2 y X3 dado que X1 x1?
5.2 Valores esperados, covarianza y correlación
Previamente se vio que cualquier función h(X) de una sola variable aleatoria X es por sí
misma una variable aleatoria. Sin embargo, para calcular E[h(X)], no fue necesario obtener
la distribución de probabilidad de h(X); en cambio, E[h(X)] se calculó como un promedio
ponderado de valores de h(x), donde la función de ponderación fue la función masa de probabilidad p(x) o la función de densidad de probabilidad f(x) de X. Se obtiene un resultado
similar para una función h(X, Y) de dos variables aleatorias conjuntamente distribuidas.
www.FreeLibros.me
c5_p184-226.qxd
3/12/08
4:07 AM
Page 197
5.2 Valores esperados, covarianza y correlación
Sean X y Y variables aleatorias conjuntamente distribuidas con función masa de probabilidad p(x, y) o función de densidad de probabilidad f (x, y) ya sea que las variables sean discretas o continuas. Entonces el valor esperado de una función h(X, Y)
denotada por E[h(X, Y)] o h(X, Y) está dada por
PROPOSICIÓN
E [h(X, Y )]
Ejemplo 5.13
197
{
h(x, y) p(x, y)
x y
' '
' '
Si X y Y son discretas
h(x, y) f (x, y) dx dy
Si X y Y son continuas
Cinco amigos compraron boletos para un concierto. Si los boletos son para asientos 1-5 en
una fila particular y los boletos se distribuyen al azar entre los cinco, ¿cuál es el número
esperado de asientos que separen a cualquiera dos de los cinco? Sean X y Y los números de
asiento del primer y segundo individuos, respectivamente. Los pares posibles (X, Y) son
(1, 2), (1, 3), . . . , (5, 4) y la función masa de probabilidad conjunta de (X, Y) es
{
1
p(x, y) 20
0
x 1, . . . , 5; y 1, . . . , 5; x y
de lo contrario
El número de asientos que separan a los dos individuos es h(X, Y) |X Y| 1. La tabla
adjunta da h(x, y) para cada par posible (x, y).
h(x, y)
y
1
2
3
4
5
|
|
|
|
|
|
1
2
x
3
4
5
—
0
1
2
3
0
—
0
1
2
1
0
—
0
1
2
1
0
—
0
3
2
1
0
—
Por lo tanto
5
E[h(X, Y )] h(x, y) p(x, y)
(x, y)
Ejemplo 5.14
5
1
(°x y° 1) 20 1
x1 y1
■
xy
En el ejemplo 5.5, la función de densidad de probabilidad conjunta de la cantidad X de
almendras y la cantidad de nueces de acajú en una lata de una lb de nueces fue
f(x, y)
{
24xy
0
0 x 1, 0 y 1, x y 1
de lo contrario
Si una lb de almendras le cuesta a la compañía $1.00, una lb de nuez de acajú le cuesta $1.50
y una lb de cacahuates le cuesta $0.50, entonces el costo total del contenido de una lata es
h(X, Y) (1)X (1.5)Y (0.5)(1 X Y) 0.5 0.5X Y
(puesto que 1 X Y del peso se compone de cacahuates). El costo esperado total es
E[h(X, Y)]
h(x, y) f(x, y) dx dy
1 1x
0 0
(0.5 0.5x y) 24xy dy dx $1.10
■
El método de calcular el valor esperado de una función h(X1, . . . , Xn) de n variables
aleatorias es similar al de dos variables aleatorias. Si las Xi son discretas, E[h(X1, . . . , Xn)]
es una suma de n dimensiones; si las Xi son continuas, es una integral de n dimensiones.
www.FreeLibros.me
c5_p184-226.qxd
198
3/12/08
CAPÍTULO 5
4:07 AM
Page 198
Distribuciones de probabilidad conjunta y muestras aleatorias
Covarianza
Cuando dos variables aleatorias X y Y no son independientes, con frecuencia es de interés
valorar qué tan fuerte están relacionadas una con otra.
La covarianza entre dos variables aleatorias X y Y es
DEFINICIÓN
Cov(X, Y ) E[(X X)(Y Y)]
{
(x X)(y Y)p(x, y)
x y
X, Y discretas
(x X)(y Y)f (x, y) dx dy
X, Y continuas
Es decir, como X X y Y Y son las desviaciones de las dos variables con respecto a
sus valores medios, la covarianza es el producto esperado de las desviaciones. Obsérvese
que Cov(X, X) E[(X X)2] V(X).
La exposición razonada para la definición es como sigue. Suponga que X y Y tienen
una fuerte relación positiva entre ellas, lo que significa que los valores grandes de X tienden a
ocurrir con valores grandes de Y y los valores pequeños de X con los valores pequeños de
Y. Entonces la mayor parte de la masa o densidad de probabilidad estará asociada con (x
X) y (y Y) o ambos positivos (tanto X como Y sobre sus respectivas medias) o ambos
negativos, así que el producto (x X)(y Y) tenderá a ser positivo. Por tanto con una
fuerte relación positiva, Cov(X, Y) deberá ser bastante positiva. Con una fuerte relación
negativa los signos de (x X) y (y Y) tenderán a ser opuestos, lo que da un producto negativo. Por tanto con una fuerte relación negativa, Cov(X, Y) deberá ser bastante negativa. Si
X y Y no están fuertemente relacionadas, los productos positivo y negativo tenderán a eliminarse entre sí, lo que da una covarianza de cerca de 0. La figura 5.4 ilustra las diferentes
posibilidades. La covarianza depende tanto del conjunto de pares posibles como de las probabilidades. En la figura 5.4, las probabilidades podrían ser cambiadas sin que se altere el
conjunto de pares posibles y esto podría cambiar drásticamente el valor de Cov(X, Y).
y
y
y
Y
Y
Y
x
x
x
X
X
X
a)
b)
c)
Figura 5.4 p(x, y) 1/10 de cada uno de los diez pares correspondientes a los puntos indicados; a) covarianza positiva; b) covarianza negativa; c) covarianza cerca de cero.
Ejemplo 5.15
Las funciones masa de probabilidad conjunta y marginal de X cantidad deducible sobre
una póliza de automóvil y Y cantidad deducible sobre póliza de propietario de casa en el
ejemplo 5.1 fueron
p(x, y)
x
100
250
|
|
|
y
100
200
x
0.20 0.10
0.05 0.15
0.20
0.30
pX(x)
0
|
|
100
250
y
0.5
0.5
pY (y)
www.FreeLibros.me
|
|
0
100
200
0.25
0.25
0.5
c5_p184-226.qxd
3/12/08
4:07 AM
Page 199
199
5.2 Valores esperados, covarianza y correlación
de la cual X xpX(x) 175 y Y 125. Por consiguiente,
Cov(X, Y) (x 175)(y 125)p(x, y)
(x, y)
(100 175)(0 125)(0.20) . . .
(250 175)(200 125)(0.30)
■
1875
La siguiente fórmula abreviada para Cov(X, Y) simplifica los cálculos.
Cov(X, Y ) E(XY) X Y
PROPOSICIÓN
De acuerdo con esta fórmula, no se requieren sustracciones intermedias; sólo al final de
cálculo X Y se resta de E(XY). La comprobación implica expandir (X X)(Y Y) y
luego considerar el valor esperado de cada término por separado.
Ejemplo 5.16
(continuación
del ejemplo
5.5)
Las funciones de densidad de probabilidad conjunta y marginal de X cantidad de almendras y Y cantidad de nueces de acajú fueron
f(x, y)
{
fX(x)
{
0 x 1, 0 y 1, x y 1
de lo contrario
24xy
0
12x(1 x)2
0
0x1
de lo contrario
con fY(y) obtenida reemplazando x por y en fX(x). Es fácil verificar que X Y 5 , y
2
E(XY)
xy f(x, y) dx dy
1 1x
0 0
1
xy 24xy dy dx
8 x2(1 x)3 dx
0
2
15
Por lo tanto, Cov(X, Y ) 15 ( 5 )( 5 ) 15 25 75 . Una covarianza negativa se considera razonable en este caso porque más almendras contenidas en la lata implican menos
nueces de acajú.
■
2
2
2
2
4
2
Pudiera parecer que la relación en el ejemplo de los seguros es bastante fuerte puesto
2
que Cov(X, Y) 1875, mientras que Cov(X, Y ) 75 en el ejemplo de las nueces parecería implicar una relación bastante débil. Desafortunadamente, la covarianza tiene un serio
defecto que hace imposible interpretar un valor calculado. En el ejemplo de los seguros,
suponga que la cantidad deducible se expresó en centavos en lugar de dólares. Entonces
100X reemplazaría a X, 100Y reemplazaría a Y y la covarianza resultante sería Cov(100X,
100Y ) (100)(100)Cov(X, Y ) 18 750 000. Si, por otra parte, la cantidad deducible se
hubiera expresado en cientos de dólares, la covarianza calculada habría sido
(0.01)(0.01)(1875) 0.1875. El defecto de la covarianza es que su valor calculado depende críticamente de las unidades de medición. De manera ideal, la selección de las unidades no debe tener efecto en la medida de la fuerza de la relación. Esto se logra graduando
a escala la covarianza.
www.FreeLibros.me
c5_p184-226.qxd
200
3/12/08
CAPÍTULO 5
4:07 AM
Page 200
Distribuciones de probabilidad conjunta y muestras aleatorias
Correlación
DEFINICIÓN
El coeficiente de correlación de X y Y, denotado por Corr(X, Y), X,Y o simplemente
, está definido por
X,Y
Ejemplo 5.17
Cov (X, Y)
X Y
Es fácil verificar que en el escenario de los seguros del ejemplo 5.15, E(X2) 36 250, X2
36 250 (175)2 5625, X 75, E(Y 2) 22 500, Y2 6875, y Y 82.92. Esto da
1875
0.301
(75)(82.92)
■
La siguiente proposición muestra que remedia el defecto de Cov(X, Y) y también
sugiere cómo reconocer la existencia de una fuerte relación (lineal).
PROPOSICIÓN
1. Si a y c son ambas positivas o ambas negativas,
Corr(aX b, cY d) Corr(X, Y)
2. Para dos variables aleatorias cualesquiera X y Y, 1 Corr(X, Y) 1.
La proposición 1 dice precisamente que el coeficiente de correlación no se ve afectado por
un cambio lineal en las unidades de medición (si, por ejemplo, X temperatura en °C,
entonces 9X/5 32 temperatura en °F). De acuerdo con la proposición 2, la relación
positiva más fuerte posible es puesta en evidencia por 1, en tanto que la relación negativa más fuerte posible corresponde a 1. La comprobación de la primera proposición
se ilustra en el ejercicio 35, y la de la segunda aparece en el ejercicio suplementario 87 al final
del capítulo. Para propósitos descriptivos, la relación se describirá como fuerte si || 0.8,
moderada si 0.5 || 0.8 y débil si || 0.5.
Si se considera que p(x, y) o f(x, y) prescribe un modelo matemático de cómo las dos
variables numéricas X y Y están distribuidas en alguna población (estatura y peso, calificación SAT verbal y calificación SAT cuantitativa, etc.), entonces es una característica o
parámetro de población que mide cuán fuertemente X y Y están relacionadas en la población. En el capítulo 12, se considerará tomar una muestra de pares (x1, y1), . . . , (xn, yn) de
la población. El coeficiente de correlación muestral r se definirá y utilizará entonces para
hacer inferencias con respecto a .
El coeficiente de correlación no es en realidad una medida completamente general
de la fuerza de una relación.
PROPOSICIÓN
1. Si X y Y son independientes, entonces 0, pero 0 no implica independencia.
2. 1 o 1 si y sólo si Y aX b con algunos números a y b con a 0.
Esta proposición dice que mide el grado de asociación lineal entre X y Y y sólo cuando
las dos variables están perfectamente relacionadas de una manera lineal será tan positivo
o negativo como pueda ser. Un menor que 1 en valor absoluto indica sólo que la relación
no es completamente lineal, sino que aún puede haber una fuerte relación no lineal. Además,
www.FreeLibros.me
c5_p184-226.qxd
3/12/08
4:08 AM
Page 201
5.2 Valores esperados, covarianza y correlación
201
0 no implica que X y Y son independientes, sino sólo que existe una ausencia completa de relación lineal. Cuando 0, se dice que X y Y no están correlacionadas. Dos variables podrían estar no correlacionadas y no obstante ser altamente dependientes porque
existe una fuerte relación no lineal, así que se debe tener cuidado de no concluir demasiado
del hecho de que 0.
Ejemplo 5.18
Sean X y Y variables aleatorias discretas con función masa de probabilidad conjunta
{
1
p(x, y) 4
0
(x, y) ( 4, 1), (4, 1), (2, 2), ( 2, 2)
de lo contrario
Los puntos que reciben masa de probabilidad positiva están identificados en el sistema de
coordenadas (x, y) en la figura 5.5. Es evidente por la figura que el valor de X está completamente determinado por el valor de Y y viceversa, de modo que las dos variables son
1
completamente dependientes. Sin embargo, por simetría X Y 0 y E(XY ) ( 4) 4
1
1
1
( 4) 4 (4) 4 (4) 4 0, por tanto Cov(X, Y ) E(XY ) X Y 0 y por consiguiente
X,Y 0. ¡Aunque hay una dependencia perfecta, también hay una ausencia completa de
cualquier relación lineal!
2
1
4
3
2
1
1
2
3
4
1
2
Figura 5.5
Población de pares del ejemplo 5.18.
■
Un valor de próximo a 1 no necesariamente implica que el incremento del valor de
X hace que se incremente Y. Implica sólo que los valores grandes de X están asociados con
valores grandes de Y. Por ejemplo, en la población de niños, el tamaño del vocabulario y el
número de caries están bastante correlacionados positivamente, pero con certeza no es cierto que las caries hagan que crezca el vocabulario. En cambio, los valores de estas dos variables tienden a incrementarse conforme el valor de la edad, una tercera variable, se
incrementa. Para niños de una edad fija, quizá existe una muy baja correlación entre el
número de caries y el tamaño del vocabulario. En suma, asociación (una alta correlación)
no es lo mismo que causa.
EJERCICIOS
Sección 5.2 (22-36)
22. Un instructor aplicó un corto examen compuesto de dos partes. Para un estudiante seleccionado al azar, sea X el número de puntos obtenidos en la primera parte y Y el número
de puntos obtenidos en la segunda parte. Suponga que la función masa de probabilidad conjunta de X y Y se da en la tabla
adjunta.
0
5
10
15
23. La diferencia entre el número de clientes formados en la
caja rápida y el número formado en la caja superrápida del
ejercicio 3 es X1 X2. Calcule la diferencia esperada.
0.02
0.04
0.01
0.06
0.15
0.15
0.02
0.20
0.14
0.10
0.10
0.01
24. Seis individuos, incluidos A y B, se sientan alrededor de una
tabla circular de una forma completamente al azar. Suponga
que los asientos están numerados 1, . . . , 6. Sea X el
y
p(x, y)
x
0
5
10
|
|
|
|
a. Si la calificación anotada en la libreta de calificaciones
es el número total de puntos obtenidos en las dos partes,
¿cuál es la calificación anotada esperada E(X Y)?
b. Si se anota la máxima de las dos calificaciones, ¿cuál es
la calificación anotada esperada?
www.FreeLibros.me
c5_p184-226.qxd
202
3/12/08
CAPÍTULO 5
4:08 AM
Page 202
Distribuciones de probabilidad conjunta y muestras aleatorias
número de asiento de A y Y el número de asiento de B.
Si A envía un mensaje escrito alrededor de la mesa a B en
la dirección en la cual están más cerca, ¿cuántos individuos
(incluidos A y B) esperarían manipular el mensaje?
28. Demuestre que si X y Y son variables aleatorias independientes, entonces E(XY) E(X) E(Y). Luego aplique esto
en el ejercicio 25. [Sugerencia: Considere el caso continuo
con f(x, y) fX (x) fY (y).]
25. Un topógrafo desea delimitar una región cuadrada con L de
lado. Sin embargo, debido a un error de medición, delimita
en cambio un rectángulo en el cual los lados norte-sur son
de longitud X y los lados este-oeste son de longitud Y.
Suponga que X y Y son independientes y que cada uno está
uniformemente distribuido en el intervalo [L A, L A]
(donde 0 A L). ¿Cuál es el área esperada del rectángulo resultante?
29. Calcule el coeficiente de correlación , de X y Y del ejemplo 5.16 (ya se calculó la covarianza).
26. Considere un pequeño transbordador que puede transportar
carros y autobuses. La cuota para carros es de $3 y para
autobuses es de $10. Sean X y Y el número de carros y autobuses, respectivamente, transportados en un solo viaje.
Suponga que la distribución conjunta de X y Y aparece en la
tabla del ejercicio 7. Calcule el ingreso esperado en un solo
viaje.
27. Annie y Alvie quedaron de encontrarse para desayunar
entre el mediodía (0:00 M.) y 1:00 P.M. Denote la hora de
llegada de Annie por X, y la de Alvie por Y y suponga que
X y Y son independientes con funciones de densidad de probabilidad
{3x0
2y
f (y) {
0
fX(x)
Y
2
0x1
de lo contrario
0y1
de lo contrario
¿Cuál es la cantidad esperada de tiempo que el que llega
primero debe esperar a la otra persona? [Sugerencia: h(X,
Y) |X Y|.]
30. a. Calcule la covarianza de X y Y en el ejercicio 22.
b. Calcule para X y Y en el mismo ejercicio.
31. a. Calcule la covarianza entre X y Y en el ejercicio 9.
b. Calcule el coeficiente de correlación para X y Y.
32. Reconsidere las vidas útiles de los componentes de minicomputadoras X y Y como se describe en el ejercicio 12.
Determine E(XY). ¿Qué se puede decir sobre Cov(X, Y) y ?
33. Use el resultado del ejercicio 28 para demostrar que cuando X y Y son independientes Cov(X, Y) Corr(X, Y) 0.
34. a. Recordando la definición de 2 para una sola variable
aleatoria X, escriba una fórmula que sería apropiada para
calcular la varianza de una función h(X, Y) de dos variables aleatorias. [Sugerencia: Recuerde que la varianza es
simplemente un valor especial esperado.]
b. Use esta fórmula para calcular la varianza de la calificación anotada h(X, Y) [ máx(X, Y)] en el inciso b) del
ejercicio 22.
35. a. Use las reglas de valor esperado para demostrar que
Cov(aX b, cY d) ac Cov(X, Y).
b. Use el inciso a) junto con las reglas de varianza y desviación estándar para demostrar que Corr(aX b, cY d)
Corr(X, Y) cuando a y c tienen el mismo signo.
c. ¿Qué sucede si a y c tienen signos opuestos?
36. Demuestre que si Y aX b (a 0), entonces Corr(X, Y)
1 o 1. ¿En que condiciones será 1?
5.3 Estadísticos y sus distribuciones
En el capítulo 1, x1, x2, . . . , xn denotaron las observaciones en una sola muestra. Considérese
seleccionar dos muestras diferentes de tamaño n de la misma distribución de población. Las
xi en la segunda muestra virtualmente siempre diferirán por lo menos un poco de aquellas en
la primera muestra. Por ejemplo, una primera muestra de n 3 carros de un tipo particular
podría producir eficiencias de combustible x1 30.7, x2 29.4, x3 31.1, mientras que
una segunda muestra puede dar x1 28.8, x2 30.0 y x3 31.1. Antes de obtener datos,
existe incertidumbre sobre el valor de cada xi. Debido a esta incertidumbre, antes de que los
datos estén disponibles, cada observación se considera como una variable aleatoria y la
muestra se denota por X1, X2, . . . , Xn (letras mayúsculas para variables aleatorias).
Esta variación en los valores observados implica a su vez que el valor de cualquier
función de las observaciones muestrales, tal como la media muestral, la desviación estándar
muestral o la dispersión de los cuartos muestrales, también varía de una muestra a otra. Es
decir, antes de obtener x1, . . . , xn, existe incertidumbre en cuanto al valor de x, el valor de
s, y así sucesivamente.
Ejemplo 5.19
Suponga que la resistencia del material de un especimen seleccionado al azar de un tipo
particular tiene una distribución Weibull con valores de parámetro 2 (forma) y 5
www.FreeLibros.me
c5_p184-226.qxd
3/12/08
4:08 AM
Page 203
5.3 Estadísticos y sus distribuciones
203
(escala). La curva de densidad correspondiente se muestra en la figura 5.6. Fórmulas de la
sección 4.5 dan
~ 4.1628
2.316
2 V(X) 5.365
E(X) 4.4311
La media excede a la mediana debido a la asimetría positiva de la distribución.
f(x)
0.15
0.10
0.05
0
0
5
Figura 5.6
10
15
x
Curva de densidad Weibull del ejemplo 5.19.
Se utilizó MINITAB para generar seis muestras diferentes, cada una con n 10, de
esta distribución (resistencias de material de seis diferentes grupos de diez especímenes
cada uno). Los resultados aparecen en la tabla 5.1, seguidos por los valores de la media, la
mediana y la desviación estándar de cada muestra. Obsérvese en primer lugar que las diez
observaciones en cualquier muestra particular son diferentes de aquellas en cualquier otra
muestra. En segundo lugar, los seis valores de la media son diferentes entre sí, como lo son
los seis valores de la mediana y los seis valores de la desviación estándar. Lo mismo es
cierto para las medias 10% recortadas, la dispersiones de los cuartos de las muestras, y así
sucesivamente.
Tabla 5.1
Muestra
1
2
3
4
5
6
7
8
9
10
x
x̃
s
Muestras de la distribución Weibull del ejemplo 5.19
1
6.1171
4.1600
3.1950
0.6694
1.8552
5.2316
2.7609
10.2185
5.2438
4.5590
4.401
4.360
2.642
2
3
4
5
6
5.07611
6.79279
4.43259
8.55752
6.82487
7.39958
2.14755
8.50628
5.49510
4.04525
5.928
6.144
2.062
3.46710
2.71938
5.88129
5.14915
4.99635
5.86887
6.05918
1.80119
4.21994
2.12934
4.229
4.608
1.611
1.55601
4.56941
4.79870
2.49759
2.33267
4.01295
9.08845
3.25728
3.70132
5.50134
4.132
3.857
2.124
3.12372
6.09685
3.41181
1.65409
2.29512
2.12583
3.20938
3.23209
6.84426
4.20694
3.620
3.221
1.678
8.93795
3.92487
8.76202
7.05569
2.30932
5.94195
6.74166
1.75468
4.91827
7.26081
5.761
6.342
2.496
www.FreeLibros.me
c5_p184-226.qxd
204
3/12/08
CAPÍTULO 5
4:08 AM
Page 204
Distribuciones de probabilidad conjunta y muestras aleatorias
Además, el valor de la media de cualquier muestra puede ser considerada como estimación puntual (“puntual” porque es un solo número, correspondiente a un solo punto sobre
la línea de numeración) de la media de la población , cuyo valor se sabe que es 4.4311.
Ninguna de las estimaciones de estas seis muestras es idéntica a la que se está estimando.
Las estimaciones de la segunda y sexta muestras son demasiado grandes, en tanto que la
quinta da una subestimación sustancial. Asimismo, la desviación estándar muestral da una
estimación puntual de la desviación estándar de la población. Las seis estimaciones resultantes están equivocadas por lo menos en una pequeña cantidad.
En resumen, los valores de cada una de las observaciones muestrales varían de una
muestra a otra, así que en general el valor de cualquier cantidad calculado a partir de los
datos de la muestra, y el valor de una característica muestral utilizado como estimación de
la característica poblacional correspondiente, prácticamente nunca coincidirá con lo que está
■
siendo estimado.
DEFINICIÓN
Un estadístico es cualquier cantidad cuyo valor puede ser calculado a partir de datos
muestrales. Antes de obtener los datos, existe incertidumbre sobre qué valor de cualquier estadístico particular resultará. Por consiguiente, un estadístico es una variable
aleatoria y será denotada por una letra mayúscula; se utiliza una letra minúscula para
representar el valor calculado u observado del estadístico.
Por lo tanto la media muestral, considerada como estadístico (antes de seleccionar una
muestra o realizar un experimento), está denotada por
X; el valor calculado de este estadístico es x. Del mismo modo, S representa la desviación estándar muestral considerada como
estadístico y su valor calculado es s. Si se seleccionan muestras de dos tipos diferentes
de ladrillos y las resistencias a la compresión individuales se denotan por X1, . . . , Xm y
Y1, . . . , Yn, respectivamente, entonces el estadístico
X
Y, la diferencia entre las dos resistencias muestrales medias a la compresión, a menudo es de gran interés.
Cualquier estadístico, por el hecho de ser una variable aleatoria, tiene una distribución
de probabilidad. En particular, la media muestral
X tiene una distribución de probabilidad.
Supóngase, por ejemplo, que n 2 componentes se seleccionan al azar y que el número de
descomposturas mientras se encuentran dentro de garantía se determina para cada uno. Los
valores posibles del número medio muestral de descomposturas
X son 0 (si X1 X2 0),
0.5 (si o X1 0 y X2 1 o X1 1 y X2 0), 1, 1.5, . . . La distribución de probabilidad de
X especifica P(X
0), P(X
0.5), y así sucesivamente, a partir de las cuales otras probabilidades tales como P(1
X 3) y P(X
2.5) pueden ser calculadas. Asimismo, si para una
muestra de tamaño n 2, los únicos valores posibles de la varianza muestral son 0, 12.5 y
50 (el cual es el caso si X1 y X2 pueden tomar sólo los valores 40, 45 o 50), entonces la distribución de probabilidad de S2 da P(S2 0), P(S2 12.5) y P(S2 50). La distribución de
probabilidad de un estadístico en ocasiones se conoce como distribución de muestreo para
enfatizar que describe cómo varía el valor del estadístico a través de todas las muestras que
pudieran ser seleccionadas.
Muestras aleatorias
La distribución de probabilidad de cualquier estadístico particular depende no sólo de la distribución de la población (normal, uniforme, etc.) y el tamaño de muestra n sino también del
método de muestreo. Considérese seleccionar una muestra de tamaño n 2 de una población compuesta de sólo los tres valores 1, 5 y 10 y supóngase que el estadístico de interés
es la varianza muestral. Si el muestreo se realiza “con reemplazo”, entonces S2 0 resultará si X1 X2. Sin embargo, S2 no puede ser igual a 0 si el muestreo se realiza “sin reemplazo”. Por tanto P(S2 0) 0 con un método de muestreo, y esta probabilidad es positiva
www.FreeLibros.me
c5_p184-226.qxd
3/12/08
4:08 AM
Page 205
5.3 Estadísticos y sus distribuciones
205
con el otro método. La siguiente definición describe un método de muestreo encontrado a
menudo (por lo menos aproximadamente) en la práctica.
Se dice que las variables aleatorias X1, X2, . . . , Xn forman una muestra aleatoria simple de tamaño n si
1. Las Xi son variables aleatorias independientes.
2. Cada Xi tiene la misma distribución de probabilidad.
DEFINICIÓN
Las condiciones 1 y 2 pueden ser parafraseadas diciendo que las Xi son independientes e
idénticamente distribuidas (iid). Si el muestreo se realiza con reemplazo o de una población
infinita (conceptual), las condiciones 1 y 2 se satisfacen con exactitud. Estas condiciones
serán aproximadamente satisfechas si el muestreo se realiza sin reemplazo, aunque el tamaño de la muestra sea mucho más pequeño que el tamaño de la población N. En la práctica,
si n/N 0.05 (cuando mucho 5% de la población se muestrea), se puede proceder como si
las Xi formarán una muestra aleatoria. La virtud de este método de muestreo es que la distribución de probabilidad de cualquier estadístico es más fácil de obtener que con cualquier
otro método de muestreo.
Existen dos métodos generales de obtener información sobre una distribución de
muestreo estadístico. Uno implica cálculos basados en reglas de probabilidad y el otro
implica realizar un experimento de simulación.
Derivación de una distribución de muestreo
Se pueden utilizar reglas de probabilidad para obtener la distribución de un estadístico siempre que sea una función “bastante simple” de las Xi y o existen relativamente pocos valores
X diferentes en la población o bien la distribución de la población tiene una forma “accesible”. Los dos ejemplos siguientes ilustran tales situaciones.
Ejemplo 5.20
Un gran centro de servicio automotriz cobra $40, $45 y $50 por la afinación de carros de
cuatro, seis y ocho cilindros, respectivamente. Si 20% de sus afinaciones se realizan en
carros de cuatro cilindros, 30% en carros de seis cilindros y 50% en carros de ocho cilindros, entonces la distribución de probabilidad de los ingresos por una afinación seleccionada al azar está dada por
x
p(x)
|
|
40
45
50
0.2
0.3
0.5
(5.2)
con 46.5, 2 15.25
Suponga que en un día particular sólo se realizan dos trabajos de servicio que implican afinaciones. Sea X1 el ingreso por la primera afinación y X2 el ingreso por la segunda.
Suponga que X1 y X2 son independientes, cada una con la distribución de probabilidad mostrada en (5.2) [de modo que X1 y X2 constituyen una muestra aleatoria de la distribución
(5.2)]. La tabla 5.2 pone en lista pares posibles (x1, x2), la probabilidad de cada uno [calculado por medio de (5.2) y la suposición de independencia] y los valores x y s2 resultantes.
Ahora para obtener la distribución de probabilidad de X
, el ingreso promedio muestral por
afinación, se debe considerar cada valor posible de x y calcular su probabilidad. Por ejemplo, x 45 ocurre tres veces en la tabla con probabilidades 0.10, 0.09 y 0.10, por lo tanto
p X (45) P(X
45) 0.10 0.09 0.10 0.29
Asimismo
pS (50) P(S 2 50) P(X1 40, X2 50
0.10 0.10 0.20
2
www.FreeLibros.me
o
X1 50, X2 40)
c5_p184-226.qxd
206
3/12/08
CAPÍTULO 5
4:08 AM
Page 206
Distribuciones de probabilidad conjunta y muestras aleatorias
Tabla 5.2 Resultados, probabilidades y valores
2
de x
y s en el ejemplo 5.20
x1
x2
p(x1, x2)
40
40
40
45
45
45
50
50
50
40
45
50
40
45
50
40
45
50
0.04
0.06
0.10
0.06
0.09
0.15
0.10
0.15
0.25
x
s2
40
42.5
45
42.5
45
47.5
45
47.5
50
0
12.5
50
12.5
0
12.5
50
12.5
0
Las distribuciones de muestreo completas de X
y S 2 aparecen en (5.3) y (5.4).
x
pX (x)
s2
pS2(s 2)
|
|
|
|
40
42.5
45
47.5
50
0.04
0.12
0.29
0.30
0.25
0
12.5
50
0.38
0.42
0.20
(5.3)
(5.4)
La figura 5.7 ilustra un histograma de probabilidad tanto de la distribución original (5.2)
(5.3). La figura sugiere primero que la media (valor esperado) de la
como la distribución X
distribución
X es igual a la media 46.5 de la distribución original, puesto que ambos histogramas parecen estar centrados en el mismo lugar.
0.5
0.29
0.30
0.3
0.25
0.12
0.2
0.04
40
45
50
40
42.5
45
47.5
50
en el ejemplo 5.20.
Figura 5.7 Histogramas de probabilidad de la distribución subyacente y distribución X
De acuerdo con (5.3),
X E(X
) xpX(x) (40)(0.04) . . . (50)(0.25) 46.5
En segundo lugar, parece que la distribución
X tiene una dispersión más pequeña (variabilidad) que la distribución original, puesto que la masa de probabilidad se movió hacia la
media. De nuevo de acuerdo con (5.3),
X2 V(X
) x 2 pX(x) X2
(40)2(0.04) . . . (50)2(0.25) (46.5)2
7.625
2
15.25
2
2
La varianza de
X es precisamente la mitad de la varianza original (porque n 2).
El valor medio de S2 es
S E(S2) s2 pS (s2)
2
2
(0)(0.38) (12.5)(0.42) (50)(0.20) 15.25 2
www.FreeLibros.me
c5_p184-226.qxd
3/12/08
4:08 AM
Page 207
5.3 Estadísticos y sus distribuciones
207
Es decir, la distribución de muestreo
X tiene su centro en la media de la población y la
distribución de muestreo S2 está centrada en la varianza de la población 2.
Si se hubieran realizado cuatro afinaciones en el día de interés, el ingreso promedio
muestral
X estaría basado en una muestra aleatoria de cuatro Xi, cada una con la distribución
(5.2). Con más cálculos se obtiene la función masa de probabilidad de
X con n 4 como
x
p X (x)
|
|
40
41.25
0.0016
0.0096
42.5
43.75
45
0.0376 0.0936
46.25
47.5
0.1761 0.2340
0.2350
48.75
50
0.1500 0.0625
2
X
De acuerdo con esta, X 46.50 y
3.8125 2/4. La figura 5.8 es un histogra
ma de probabilidad de esta función masa de probabilidad.
40
42.5
45
47.5
50
Figura 5.8 Histograma de probabilidad de X
basado en el n 4 en el ejemplo 5.20.
■
El ejemplo 5.20 sugiere que el cálculo de pX(x) y pS 2(s2) puede ser tedioso. Si la distri
bución original (5.2) hubiera permitido más de tres valores posibles, 40, 45 y 50, entonces
incluso con n 2 los cálculos hubieran sido más complicados. El ejemplo también sugiere,
sin embargo, que existen algunas relaciones generales entre E(X
), V(X
), E(S 2), y la media
y la varianza 2 de la distribución original. Éstas se formulan en la siguiente sección. Ahora
considérese un ejemplo en el cual la muestra aleatoria se extrae de una distribución continua.
Ejemplo 5.21
Tiempo de servicio para un tipo de transacción bancaria es una variable aleatoria con distribución exponencial y parámetro . Suponga que X1 y X2 son tiempos de servicio para dos
clientes diferentes, supuestos independientes entre sí. Considere el tiempo de servicio total
To X1 X2 para los dos clientes, también un estadístico. La función de distribución acumulativa de To con t 0,
FT (t) P(X1 X2 t)
0
f(x1, x2) dx1 dx2
{(x1, x2):x1x2t}
t tx1
1
0 0
t
ex ex dx2 dx1
2
[ex et] dx1
1
0
1 et tet
La región de integración se ilustra en la figura 5.9.
x2
(x1, t x1)
x1
x1
x2
t
x1
Figura 5.9 Región de integración para obtener la función de distribución acumulativa de To
en el ejemplo 5.21.
www.FreeLibros.me
c5_p184-226.qxd
208
3/12/08
CAPÍTULO 5
4:08 AM
Page 208
Distribuciones de probabilidad conjunta y muestras aleatorias
La función de densidad de probabilidad de To se obtiene derivando FT (t):
o
2tet t 0
fT (t)
0
t0
{
0
(5.5)
Esta es una función de densidad de probabilidad gama ( 2 y 1/). La función de
densidad de probabilidad de
X To /2 se obtiene a partir de la relación {X
x} si y sólo si
{To 2x} como
f X(x )
{
42xe
0
2x
x 0
x 0
(5.6)
La media y la varianza de la distribución exponencial subyacente son 1/ y 2 1/2.
Con las expresiones (5.5) y (5.6) se puede verificar que E(X
) 1/, V(X
) 1/(22), E(To)
2
2/, y V(To) 2/ . Estos resultados sugieren de nuevo algunas relaciones generales entre
medias y varianzas de
X, To y la distribución subyacente.
■
Experimentos de simulación
El segundo método de obtener información sobre distribución de muestreo estadístico es
realizar un experimento de simulación. Este método casi siempre se utiliza cuando la obtención
vía reglas de probabilidad es demasiado difícil o complicada de realizar. Tal experimento virtualmente siempre se realiza con la ayuda de una computadora. Las siguientes características
de un experimento deben ser especificadas:
, S, una media recortada particular, etcétera).
1. El estadístico de interés (X
2. La distribución de la población (normal con 100 y 15, uniforme con límite
inferior A 5 y superior B 10, etcétera).
3. El tamaño de muestra n(p. ej., n 10 o n 50).
4. El número de réplicas k (p. ej., k 500).
Luego se utiliza una computadora para obtener k diferentes muestras aleatorias, cada una de
tamaño n, de la distribución de población designada. Para cada una de las muestras, calcule el valor del estadístico y construya un histograma de los k valores calculados. Este histograma da la distribución de muestreo aproximada del estadístico. Mientras más grande es el
valor de k, mejor tenderá a ser la aproximación (la distribución de muestreo real emerge a
medida que k A ). En la práctica k 500 o 1000 casi siempre es suficiente si el estadístico es “bastante simple”.
Ejemplo 5.22
La distribución de la población del primer estudio de simulación es normal con 8.25 y
0.75, como se ilustra en la figura 5.10. [El artículo “Platelet Size in Myocardial
Infarction” (British Med. J., 1983: 449-451) sugiere esta distribución de volumen de plaquetas en individuos sin historial clínico de problemas de corazón serios.]
0.75
¨
©
ª
6.00
6.75
7.50
9.00
9.75
10.50
8.25
Figura 5.10 Distribución normal, con 8.25 y 0.75.
www.FreeLibros.me
c5_p184-226.qxd
3/12/08
4:08 AM
Page 209
5.3 Estadísticos y sus distribuciones
209
En realidad se realizaron cuatro experimentos diferentes, con 500 réplicas por cada uno. En
el primero, se generaron 500 muestras de n 5 observaciones cada una con MINITAB y
los tamaños de las otras tres muestras fueron n 10, n 20 y n 30, respectivamente. La
media muestral se calculó para cada muestra y los histogramas resultantes de valores x aparecen en la figura 5.11.
Frecuencia
relativa
Frecuencia
relativa
0.25
0.25
0.20
0.20
0.15
0.15
0.10
0.10
0.05
0.05
x
x
7.50 7.80 8.10 8.40 8.70
7.65 7.95 8.25 8.55 8.85
7.35 7.65 7.95 8.25 8.55 8.85 9.15
7.50 7.80 8.10 8.40 8.70 9.00 9.30
a)
b)
Frecuencia
relativa
Frecuencia
relativa
0.25
0.25
0.20
0.20
0.15
0.15
0.10
0.10
0.05
0.05
x
7.80 8.10 8.40 8.70
7.95 8.25 8.55
c)
x
7.80 8.10 8.40 8.70
7.95 8.25 8.55
d)
Figura 5.11 Histogramas muestrales de x basados en 500 muestras, cada uno compuesto de n observaciones: a) n 5; b) n 10; c) n 20; d) n 30.
Lo primero que se nota en relación con los histogramas es su forma. En cuanto a una
razonable aproximación, cada uno de los cuatro se ve como una curva normal. El parecido
sería aún más impactante si cada histograma se hubiera basado en más de 500 x valores. En
segundo lugar, cada histograma está centrado aproximadamente en 8.25, la media de la
población muestreada. Si los histogramas se hubieran basado en un secuencia interminable
de valores x, sus centros habrían sido exactamente la media de la población, 8.25.
www.FreeLibros.me
c5_p184-226.qxd
210
3/12/08
CAPÍTULO 5
4:08 AM
Page 210
Distribuciones de probabilidad conjunta y muestras aleatorias
El aspecto final del histograma es su dispersión uno con respecto al otro. Mientras
más pequeño es el valor de n, más grande es la extensión hacia la cual la distribución se
esparce con respecto al valor medio. Por eso los histogramas con n 20 y n 30 están
basados en intervalos de clase más angostos que aquellos de los dos tamaños de muestra
más pequeños. Con los tamaños de muestra más grandes, la mayoría de los valores x están
bastante cerca de 8.25. Este es el efecto de promediar. Cuando n es pequeño, un valor x
inusual puede dar por resultado un valor x alejado del centro. Con un tamaño de muestra
grande, cualesquiera valores x inusuales, cuando se promedian con los demás valores
muestrales, seguirá tendiendo a producir un valor x próximo a . Si se combinan estas
ideas se obtiene un resultado muy apegado a su intuición: X
basado en n grande tiende a
acercarse más a que X
basado en n pequeño.
■
Ejemplo 5.23
Considere un experimento de simulación en el cual la distribución de la población es bastante asimétrica. La figura 5.12 muestra la curva de densidad de las vidas útiles de un tipo de
control electrónico [ésta es en realidad una distribución lognormal con E(ln(X)) 3 y
V(ln(X)) 0.16]. De nueva cuenta el estadístico de interés es la media muestral
X. El experimento utilizó 500 réplicas y consideró los mismos cuatro tamaños de muestra que en el ejemplo 5.22. Los histogramas resultantes junto con una curva de probabilidad normal generada
por MINITAB con los 500 x valores basados en n 30 se muestran en la figura 5.13.
f(x)
0.05
0.04
0.03
0.02
0.01
x
0
25
50
75
Figura 5.12 Curva de densidad del experimento de simulación del ejemplo 5.23 [E(X) 21.7584,
V(X) 82.1449].
A diferencia del caso normal, estos histogramas difieren en cuanto a forma. En particular,
se vuelven progresivamente menos asimétricos a medida que el tamaño de muestra n se
incrementa. El promedio de los 500 x valores con los cuatro tamaños de muestra diferentes
se aproximan bastante al valor medio de la distribución de la población. Si cada histograma se
hubiera basado en una secuencia interminable de valores x en lugar de sólo 500, los cuatro
habrían tenido su centro en exactamente 21.7584. Por tanto los valores diferentes de n cambian la forma mas no el centro de la distribución de muestreo de X
. La comparación de los
cuatro histogramas en la figura 5.13 también muestra que conforme n se incrementa, la dispersión de los histogramas decrece. El incremento de n produce un mayor grado de concentración en torno al valor medio de la población y hace que el histograma se vea más
como una curva normal. El histograma de la figura 5.13d) y la curva de probabilidad normal en la figura 5.13e) proporcionan una evidencia convincente de que un tamaño de muestra de n 30 es suficiente para superar la asimetría de la distribución de la población y para
producir una distribución de muestreo
X aproximadamente normal.
www.FreeLibros.me
3/12/08
4:08 AM
Page 211
5.3 Estadísticos y sus distribuciones
211
0.10
0.10
n=5
n = 10
0.05
0.05
0
0
x
10
20
30
20
10
40
30
a)
40
x
b)
Densidad
Densidad
0.2
0.2
n = 20
n = 30
0.1
0.1
0
0
x
15
20
25
x
20
15
c)
25
d)
0.999
0.99
0.95
Probabilidad
c5_p184-226.qxd
0.80
0.50
0.20
0.05
0.01
0.001
18
19
Promedio: 21.7891
Desv. Est. = 1.57396
N: 500
20
21
22
23
Media 30
e)
24
25
26
27
Prueba W de normalidad
R:
0.9975
Valor P (aprox.): > 0.1000
Figura 5.13 Resultados del experimento de simulación del ejemplo 5.23: a) histograma de x con n 5; b) histograma de
x con n 10; c) histograma de x con n 20; d) histograma de x con n 30; e) curva de probabilidad normal con
n 30 (generados por MINITAB).
■
www.FreeLibros.me
c5_p184-226.qxd
212
3/12/08
4:08 AM
Page 212
Distribuciones de probabilidad conjunta y muestras aleatorias
CAPÍTULO 5
EJERCICIOS
Sección 5.3 (37-45)
37. Una marca particular de jabón para lavadora de platos se
vende en tres tamaños: 25 oz, 40 oz y 65 oz. El 20% de todos los compradores seleccionan la caja de 25 oz, 50% seleccionan una caja de 40 oz y el 30% restante seleccionan
la caja de 65 oz. Sean X1 y X2 los tamaños de paquete seleccionados por dos compradores independientemente seleccionados.
a. Determine la distribución de muestreo de
X, calcule
E(X
), y compare con .
b. Determine la distribución de muestreo de la varianza
muestral S2, calcule E(S2) y compare con 2.
38. Hay dos semáforos en mi camino al trabajo. Sea X1 el
número de semáforos en los cuales me tengo que detener y
suponga que la distribución X1 es como sigue:
x1
p(x1)
|
|
0
1
2
1.1, 2 0.49
0.2 0.5 0.3
Sea X2 el número de semáforos en los cuales me tengo que
detener camino a casa; X2 es independiente de X1. Suponga
que X2 tiene la misma distribución que X1, de modo que X1,
X2 es una muestra aleatoria de tamaño n 2.
a. Sea To X1 X2, y determine la distribución de probabilidad de To.
b. Calcule T . ¿Cómo se relaciona con , la media de la
población?
c. Calcule T2 . ¿Cómo se relaciona con 2, la varianza de
la población?
x
p(x)
|
|
1
2
3
4
0.4
0.3
0.2
0.1
a. Considere una muestra aleatoria de tamaño n 2 (dos
clientes) y sea
X el número medio muestral de paquetes
enviados. Obtenga la distribución de probabilidad de
X.
b. Remítase al inciso a) y calcule P(X
2.5).
c. De nuevo considere una muestra aleatoria de tamaño
n 2, pero ahora enfóquese en el estadístico R el rango muestral (diferencia entre los valores más grande y
más pequeño en la muestra). Obtenga la distribución de
R. [Sugerencia: Calcule el valor de R por cada resultado
y use las probabilidades del inciso a).]
d. Si se selecciona una muestra aleatoria de tamaño n 4,
¿Cuál es P(X
1.5)? [Sugerencia: No tiene que dar
todos los resultados posibles, sólo aquellos para los cuales x 1.5.]
42. Una compañía mantiene tres oficinas en una región, cada
una manejada por dos empleados. Información concerniente a salarios anuales (miles de dólares) es la siguiente:
Oficina
1
Empleado 1
Salario
29.7
1
2
33.6
2
2
3
3
3
4
5
6
30.2 33.6 25.8 29.7
o
o
39. Se sabe que 80% de todos los discos de almacenamiento
extraíbles funcionan satisfactoriamente durante el periodo
de garantía (son “éxitos”). Suponga que se seleccionan al
azar n 10 unidades de disco. Sea X el número de éxitos en la muestra. El estadístico X/n es la proporción de la
muestra (fracción) de éxitos. Obtenga la distribución muestral de este estadístico. [Sugerencia: Un posible valor de X/n
es 0.3, correspondiente a X 3. ¿Cuál es la probabilidad de
este valor (qué clase de variable aleatoria es X)?]
40. Una caja contiene diez sobres sellados numerados 1, . . . ,
10. Los primeros cinco no contienen dinero, cada uno de los
siguientes tres contiene $5 y hay un billete de $10 en cada
uno de los últimos dos. Se selecciona un tamaño de muestra de 3 con reemplazo (así que se tiene una muestra aleatoria) y se obtiene la cantidad más grande en cualquiera de
los sobres seleccionados. Si X1, X2 y X3 denotan las cantidades en los sobres seleccionados, el estadístico de interés
es M el máximo de X1, X2 y X3.
a. Obtenga la distribución de probabilidad de este estadístico.
b. Describa cómo realizaría un experimento de simulación
para comparar las distribuciones de M con varios tamaños de muestra. ¿Cómo piensa que cambiaría la distribución a medida que n se incrementa?
41. Sea X el número de paquetes enviados por un cliente seleccionado al azar vía una compañía de paquetería y mensajería. Suponga que la distribución de X es como sigue:
a. Suponga que dos de estos empleados se seleccionan al
azar de entre los seis (sin reemplazo). Determine la distribución del salario medio muestral X
.
b. Suponga que se selecciona al azar una de las tres oficinas. Sean X1 y X2 los salarios de los dos empleados.
Determine la distribución muestral de X
.
c. ¿Cómo se compara E(X
) de los incisos a) y b) con el
salario medio de la población ?
43. Suponga que la cantidad de líquido despachado por una
máquina está uniformemente distribuida con límite inferior
A 8 oz y límite superior B 10 oz. Describa cómo realizaría experimentos de simulación para comparar la distribución de la (muestra) dispersión de los cuartos con
tamaños de muestra n 5, 10, 20 y 30.
44. Realice un experimento con un programa de computadora
estadístico u otro programa para estudiar la distribución
muestral de X
cuando la distribución de la población es
Weibull con 2 y 5, como en el ejemplo 5.19.
Considere los cuatro tamaños de muestra n 5, 10, 20 y 30
y en cada caso utilice 500 réplicas. ¿Con cuál de estos
tamaños de muestra la distribución muestral X
parece ser
aproximadamente normal?
45. Realice un experimento de simulación con un programa de
computadora estadístico u otro programa para estudiar
la distribución muestral de
X cuando la distribución de la
población es lognormal con E(ln(X)) 3 y V(ln(X)) 1.
Considere los cuatro tamaños de muestra n 10, 20, 30 y
50 y en cada caso utilice 500 réplicas. ¿Con cuál de estos
tamaños de muestra la distribución muestral X
parece ser
aproximadamente normal?
www.FreeLibros.me
c5_p184-226.qxd
3/12/08
4:08 AM
Page 213
5.4 Distribución de la media muestral
213
5.4 Distribución de la media muestral
La importancia de la medía muestral X
proviene de su uso al sacar conclusiones sobre la
media de la población . Algunos de los procedimientos inferenciales más frecuentemente utilizados están basados en propiedades de la distribución muestral de X
. Un examen
previo de estas propiedades apareció en los cálculos y experimentos de simulación de la
sección previa, donde se observaron las relaciones entre E(X
) y y también entre V(X
),
2 y n.
PROPOSICIÓN
Sean X1, X2, . . . , Xn una muestra aleatoria de una distribución con valor medio y
desviación estándar . Entonces
1. E(X
) X
2. V(X
) X2 2/n
y
X /n
Además, con To X1 . . . Xn (el total de la muestra), E(To) n, V(To) n 2 y
T n
.
o
Comprobaciones de estos resultados se difieren a la siguiente sección. De acuerdo con el
resultado 1, la distribución (es decir, probabilidad) muestral de
X está centrada precisamente
en la media de la población de la cual se seleccionó la muestra. El resultado 2 muestra que
la distribución
X se concentra más en torno a a medida que se incrementa el tamaño de la
muestra n. En un marcado contraste, la distribución de To se dispersa más a medida que n se
incrementa. Al promediar la probabilidad se mueve hacia la parte media, en tanto que al totalizar la probabilidad se dispersa sobre un rango más y más amplio de valores.
Ejemplo 5.24
En una prueba de fatiga por tensión con un espécimen de titanio, el número esperado de
ciclos hasta la primera emisión acústica (utilizada para indicar la iniciación del agrietamiento) es 28 000 y la desviación estándar del número de ciclos es 5000. Sean X1,
X2, . . . , X25 una muestra aleatoria de tamaño 25, donde cada Xi es el número de ciclos en
un espécimen diferente seleccionado al azar. Entonces el valor esperado del número de
ciclos medio muestral hasta la primera emisión es E(X
) 28000, y el número total
esperado de ciclos para los 25 especímenes es E(To) n 25(28000) 700000. La desviación estándar de
X y To son
5000
X /n
1000
2
5
2
5
(5000) 25 000
T n
o
Si el tamaño de muestra se incrementa a n 100, E(X
) no cambió, pero 500, la mitad
de su valor previo (el tamaño de muestra debe ser cuadruplicado al dividir a la mitad la desviación estándar de
X ).
■
El caso de una distribución de población normal
El experimento de simulación del ejemplo 5.22 indicó que cuando la distribución de la
población es normal, cada histograma de valores x se representa muy bien con una curva
normal.
www.FreeLibros.me
c5_p184-226.qxd
214
3/12/08
CAPÍTULO 5
4:08 AM
Page 214
Distribuciones de probabilidad conjunta y muestras aleatorias
PROPOSICIÓN
Sean X1, X2, . . . , Xn una muestra aleatoria de una distribución normal con media
y desviación estándar . Entonces con cualquier n, X
está normalmente distribuida
(con media y desviación estándar /n), al igual que To (con media n y desviación estándar n).*
Se sabe todo lo que se tiene que saber sobre las distribuciones X
y To cuando la distribución de la población es normal. En particular, las probabilidades de modo que P(a
X b)
y P(c To d) se obtienen simplemente estandarizando. La figura 5.14 ilustra la proposición.
Distribución X cuando n 10
Distribución X cuando n 4
Distribución de población
Figura 5.14
Ejemplo 5.25
Distribución de la población normal y distribuciones muestrales
X.
El tiempo que requiere una rata de cierta subespecie seleccionada al azar para encontrar su
camino a través de un laberinto es una variable aleatoria normalmente distribuida con
1.5 min y 0.35 min. Suponga que se seleccionan cinco ratas. Sean X1, . . . , X5 sus tiempos en el laberinto. Suponiendo que las Xi son una muestra aleatoria de esta distribución normal, ¿cuál es la probabilidad de que el tiempo total To X1 · · · X5 de las cinco sea de
entre 6 y 8 min? De acuerdo con la proposición, To tiene una distribución normal con T
n 5(1.5) 7.5 y varianza T2 n 2 5(0.1225) 0.6125, por tanto T 0.783. Para
estandarizar To, reste T y divida entre T :
o
o
o
o
P(6 To 8) P
o
6 7.5
8 7.5
Z
0.783
0.783
P( 1.92 Z 0.64) (0.64) ( 1.92) 0.7115
La determinación de la probabilidad de que el tiempo promedio muestral X
(una variable
normalmente distribuida) sea cuando mucho de 2.0 min requiere X 1.5 y X
/n
0.35/5
0.1565. Entonces
P(X
2.0) P Z
2.0 1.5
P(Z 3.19) (3.19) 0.9993
0.1565
■
* Una comprobación del resultado para To cuando n 2 es posible si se utiliza el método del ejemplo 5.21, pero
los detalles son complicados. El resultado general casi siempre se comprueba por medio de una herramienta teórica llamada función generadora de momentos. Se puede consultar una de las referencias del capítulo para más
información.
www.FreeLibros.me
c5_p184-226.qxd
3/12/08
4:08 AM
Page 215
5.4 Distribución de la media muestral
215
Teorema del límite central
Cuando las Xi están normalmente distribuidas, también lo está
X con cada tamaño de muestra n. El experimento de simulación del ejemplo 5.23, sugiere que incluso cuando la distribución de la población es altamente no normal, el cálculo de promedios produce una
distribución más acampanada que la que está siendo muestreada. Una conjetura razonable
es que si n es grande, una curva normal apropiada representará de forma más o menos aproximada la distribución real de
X. La proposición formal de este resultado es el teorema de
probabilidad más importante.
TEOREMA
Teorema del límite central (TLC)
Sean X1, X2, . . . , Xn una muestra aleatoria de una distribución con media y varianza 2. Entonces si n es suficientemente grande, X
tiene aproximadamente una distribución normal con X y X2 2/n, y To también tiene aproximadamente una
distribución normal con T n, 2T n 2. Mientras más grande es el valor de n,
o
mejor es la aproximación.
o
La figura 5.15 ilustra el teorema del límite central. De acuerdo con el TLC, cuando n es
grande y se desea calcular una probabilidad tal como P(a
X b), lo único que se requiere
es “pretender” que
X es normal, estandarizarla y utilizar la tabla normal. La respuesta resultante será aproximadamente correcta. Se podría obtener la respuesta correcta determinando
primero la distribución de X
así que el TLC proporciona un a tajo verdaderamente impresionante. La comprobación del teorema implica muchas matemáticas avanzadas.
Distribución
Distribución X con
n grande (aproximadamente normal)
Distribución X
pequeño a moderado n
Distribución
Distribución
de
de población
población
Figura 5.15 Teorema del límite central ilustrado.
Ejemplo 5.26
La cantidad de una impureza particular en un lote de cierto producto químico es una variable aleatoria con valor medio de 4.0 g y desviación estándar de 1.5 g. Si se preparan 50 lotes
en forma independiente, ¿cuál es la probabilidad (aproximada) de que la cantidad promedio muestral de la impureza X
sea de 3.5 a 3.8 g? De acuerdo con la regla empírica que se
formulará en breve, n 50 es suficientemente grande como para que el TLC sea aplicable.
En ese caso X
tiene aproximadamente una distribución normal con valor medio X 4.0 y
X 1.5/50 0.2121, por lo tanto
3.5 4.0
3.8 4.0
P(3.5
X 3.8) P
Z
0.2121
0.2121
( 0.94) ( 2.36) 0.1645
■
Ejemplo 5.27
Una organización de protección al consumidor reporta cotidianamente el número de defectos
mayores de cada automóvil nuevo que prueba. Suponga que el número de tales defectos en
cierto modelo es una variable aleatoria con valor medio de 3.2 y desviación estándar de 2.4.
www.FreeLibros.me
c5_p184-226.qxd
216
3/12/08
CAPÍTULO 5
4:08 AM
Page 216
Distribuciones de probabilidad conjunta y muestras aleatorias
Entre 100 carros seleccionados al azar de este modelo, ¿qué tan probable es que el número
promedio muestral de defectos mayores exceda de 4? Sea Xi el número de defectos mayores del i-ésimo carro en la muestra aleatoria. Obsérvese que Xi es una variable aleatoria discreta, pero el TLC es aplicable si la variable de interés es discreta o continua. Además,
aunque el hecho de que la desviación estándar de esta variable no negativa es bastante
grande con respecto al valor medio sugiere que su distribución es positivamente asimétrica,
el gran tamaño de muestra implica que X
sí tiene aproximadamente una distribución normal.
Con X 3.2 y X 0.24,
4 3.2
P(X
4) P Z
1 (3.33) 0.0004
■
0.24
El TLC da una idea de por qué muchas variables aleatorias tienen distribuciones de
probabilidad que son aproximadamente normales. Por ejemplo, el error de medición en un
experimento científico puede ser considerado como la suma de varias perturbaciones y errores subyacentes de pequeña magnitud.
Aunque la utilidad del TLC para inferencia pronto será evidente, el contenido intuitivo
del resultado presenta muchas dificultades para los estudiantes novicios. De nuevo regresando a la figura 5.7, el histograma de probabilidad a la izquierda ilustra la distribución que se
está muestreando. Es discreta y bastante asimétrica de modo que no se vea en absoluto como
una distribución normal. La distribución de
X con n 2 comienza a exhibir algo de simetría
y ésta incluso es más pronunciada con n 4 en la figura 5.8. La figura 5.16 contiene la distribución de probabilidad
X con n 8, así como también un histograma de probabilidad de
esta distribución. Con X 46.5 y X /n
3.905/8
1.38, si se ajusta una cur
va normal con esta media y desviación estándar al histograma de
X, el área de los rectángulos
en el histograma de probabilidad son razonablemente bien aproximadas por las áreas de curva
normal, por lo menos en la parte central de la distribución. La figura de To es similar excepto
que la escala horizontal está mucho más dispersa, con To dentro de 320 (x 40) a 400 (x 50).
x
p(x )
x
p(x )
x
p(x )
|
|
|
|
|
|
40
40.625
41.25
41.875
42.5
43.125
0.0000 0.0000 0.0003 0.0012 0.0038 0.0112
43.75
44.375
45
45.625
46.25
46.875
0.0274 0.0556 0.0954 0.1378 0.1704 0.1746
47.5
48.125
48.75
49.375
50
0.1474 0.0998 0.0519 0.0188 0.0039
a)
0.175
0.15
0.125
0.10
0.075
0.05
0.025
40
42.5
45
47.5
50
b)
Figura 5.16 a) Distribución de probabilidad de
X con n 8; b) histograma de probabilidad y aproximación normal a la distribución de
X cuando la distribución original es como en el ejemplo 5.20.
www.FreeLibros.me
c5_p184-226.qxd
3/12/08
4:08 AM
Page 217
5.4 Distribución de la media muestral
217
Una dificultad práctica al aplicar el teorema del límite central es saber cuándo n es
suficientemente grande. El problema es que la precisión de la aproximación con una n
particular depende de la forma de la distribución subyacente original que está siendo
muestreada. Si la distribución subyacente tiende a una curva de densidad normal, entonces
la aproximación será buena incluso con n pequeña, mientras que si está lejos de ser normal,
entonces se requerirá una n grande.
Regla empírica
Si n 30, se puede utiliza el teorema del límite central.
Existen distribuciones de población para las cuales una n de 40 o 50 no son suficientes, pero
tales distribuciones rara vez se encuentran en la práctica. Por otra parte, la regla empírica a
menudo es conservadora; para muchas distribuciones de población, una n mucho menor que
30 serían suficientes. Por ejemplo, en el caso de una distribución de población uniforme, el
teorema del límite central da una buena aproximación con n 12.
Otras aplicaciones del teorema del límite central
El teorema del límite central puede ser utilizado para justificar la aproximación normal a
la distribución binomial discutida en el capítulo 4. Recuérdese que una variable binomial X
es el número de éxitos en una experiencia binomial compuesta de n ensayos independientes con éxitos/fallas y p P(S) para cualquier ensayo particular. Defínanse nuevas variables aleatorias X1, X2, . . . , Xn como
1 Si el i-ésimo ensayo produce un éxito
Xi
(i 1, . . . , n)
0 Si el i-ésimo ensayo produce una falla
Como los ensayos son independientes y P(S) es constante de un ensayo a otro, las Xi son
idénticas (una muestra aleatoria de una distribución de Bernoulli). El teorema del límite central implica entonces que si n es suficientemente grande, tanto la suma como el promedio
de las Xi tienen distribuciones normales de manera aproximada. Cuando se suman las Xi, se
agrega un 1 por cada S (éxito) que ocurra y un 0 por cada F (falla), por tanto X1 · · · Xn
X. La media muestral de las Xi es X/n, la proporción muestral de éxitos. Es decir, tanto X
como X/n son aproximadamente normales cuando n es grande. El tamaño de muestra necesario para esta aproximación depende del valor de p: Cuando p se acerca a 0.5, la distribución de cada Xi es razonablemente simétrica (véase la figura 5.17), mientras que la
distribución es bastante asimétrica cuando p se acerca a 0 o 1. Utilizando la aproximación
sólo si tanto np 10 como a n(1 p) 10 garantiza que n es suficientemente grande para
superar cualquier asimetría en la distribución de Bernoulli subyacente.
{
0
1
a)
Figura 5.17
asimétrica).
0
1
b)
Dos distribuciones de Bernoulli: a) p 5 4 (razonablemente simétrica); b) p 5 1 (muy
Recuérdese por la sección 4.5 que X tiene una distribución lognormal si ln(X) tiene
una distribución normal.
PROPOSICIÓN
Sean X1, X2, . . . , Xn una muestra aleatoria de una distribución para la cual sólo valores positivos son posibles [P(Xi 0) 1]. Entonces si n es suficientemente grande,
el producto Y X1X2 · · · · · Xn tiene aproximadamente una distribución lognormal.
www.FreeLibros.me
c5_p184-226.qxd
218
3/12/08
CAPÍTULO 5
4:08 AM
Page 218
Distribuciones de probabilidad conjunta y muestras aleatorias
Para verificar esto, obsérvese que
ln(Y) ln(X1) ln(X2) . . . ln(Xn)
Como ln(Y) es una suma de variables aleatorias independientes y distribuidas de manera
idéntica [las ln(Xi)], es aproximadamente normal cuando n es grande, así que Y tiene aproximadamente una distribución lognormal. Como ejemplo de la aplicabilidad de este resultado, Bury (Statistical Models in Applied Science, Wiley, p. 590) argumenta que el proceso
de daños en el flujo plástico y en la propagación de grietas es un proceso multiplicativo, de
modo que las variables tales como porcentaje de alargamiento y resistencia a la ruptura tienen aproximadamente distribuciones lognormales.
EJERCICIOS
Sección 5.4 (46-57)
46. El diámetro interno de un anillo de pistón seleccionado al
azar es una variable aleatoria con valor medio de 12 cm y
desviación estándar de 0.04 cm.
a. Si
X es el diámetro medio en una muestra aleatoria de
n 16 anillos, ¿dónde está centrada la distribución muestral
de
X y cuál es la desviación estándar de la distribución
X?
b. Responda las preguntas planteadas en el inciso a) con un
tamaño de muestra de n 64 anillos.
c. ¿Con cuál de las dos muestras aleatorias, la del inciso a)
o la del inciso b), es más probable que
X esté dentro de
0.01 cm de 12 cm? Explique su razonamiento.
47. Remítase al ejercicio 46. Suponga que el diámetro de la distribución es normal.
a. Calcule P(11.99
X 12.01) cuando n 16.
b. ¿Qué tan probable es que el diámetro medio muestral
exceda de 12.01 cuando n 25?
48. Sean X1, X2, . . . , X100 los pesos netos reales de 100 sacos
de 50 lb de fertilizante seleccionados al azar.
a. Si el peso esperado de cada saco es de 50 lb y la varianza es uno, calcule P(49.9
X 50.1) (aproximadamente) por medio del teorema del límite central.
b. Si el peso esperado es de 49.8 lb en lugar de 50 lb de
modo que en promedio los sacos están menos llenos,
calcule P(49.9
X 50.1).
49. Hay 40 estudiantes en una clase de estadística elemental.
Basado en años de experiencia, el instructor sabe que el
tiempo requerido para calificar un primer examen seleccionado al azar es una variable aleatoria con un valor esperado
de seis min y una desviación estándar de seis min.
a. Si los tiempos de calificación son independientes y el
instructor comienza a calificar a las 6:50 p.m. y califica
en forma continua, ¿cuál es la probabilidad (aproximada) de que termine de calificar antes de que se inicie el
programa de noticias de las 11:00 p.m.?
b. Si el reporte de deportes se inicia a la 11:10, ¿cuál es
la probabilidad de que se pierda una parte del reporte
si se espera hasta que termine de calificar antes de
prender la TV?
50. La resistencia a la ruptura de un remache tiene un valor
medio de 10 000 lb/pulg2 y una desviación estándar de 500
lb/pulg2.
a. ¿Cuál es la probabilidad de que la resistencia a la ruptura media de una muestra aleatoria de 40 remaches sea de
entre 9900 y 10 200?
51.
52.
53.
54.
55.
b. Si el tamaño de muestra hubiera sido de 15 y no de 40,
¿se podría calcular la probabilidad solicitada en el inciso a) con la información dada?
El tiempo requerido por un solicitante seleccionado al azar
de una hipoteca para llenar un formulario tiene una distribución normal con valor medio de 10 min y desviación
estándar de dos min. Si cinco individuos llenan un formulario en un día y seis en otro, ¿cuál es la probabilidad de que
la cantidad promedio muestral de tiempo requerido cada día
sea cuando mucho de 11 min?
La vida útil de un tipo de batería está normalmente distribuida
con valor medio de 10 horas y desviación estándar de una hora.
Hay cuatro baterías en un paquete. ¿Qué valor de vida útil es
tal que la vida útil total de todas las baterías contenidas en un
paquete exceda de ese valor en sólo 5% de todos los paquetes?
Se sabe que la dureza Rockwell de “pernos” de un tipo tiene un valor medio de 50 y una desviación estándar de 1.2.
a. Si la distribución es normal, ¿cuál es la probabilidad de
que la dureza media de una muestra aleatoria de 9 pernos sea por lo menos de 51?
b. ¿Cuál es la probabilidad (aproximada) de que la dureza
media de una muestra aleatoria de 40 pernos sea por lo
menos de 51?
Suponga que la densidad de un sedimento (g/cm) de un
espécimen seleccionado al azar de cierta región está normalmente distribuida con media de 2.65 y desviación estándar de 0.85 (sugerida en “Modeling Sediment and Water
Column Interactions for Hydrophobic Pollutants”, Water
Research, 1984: 1169-1174).
a. Si se selecciona una muestra aleatoria de 25 especímenes, ¿cuál es la probabilidad de que la densidad del sedimento promedio muestral sea cuando mucho de 3.00?
¿De entre 2.65 y 3.00?
b. ¿Qué tan grande debe ser un tamaño de muestra para
garantizar que la primera probabilidad en el inciso a) sea
por lo menos de 0.99?
El número de infracciones de estacionamiento aplicadas en
una ciudad en cualquier día de la semana dado tiene una
distribución de Poisson con parámetro 50. ¿Cuál es la
probabilidad aproximada de que
a. entre 35 y 70 infracciones sean aplicadas en un día particular? [Sugerencia: Cuando es grande, una variable
aleatoria de Poisson tiene aproximadamente una distribución normal.]
www.FreeLibros.me
c5_p184-226.qxd
3/12/08
4:08 AM
Page 219
5.5 Distribución de una combinación lineal
b. el número total de infracciones aplicadas durante una
semana de 5 días sea de entre 225 y 275?
56. Un canal de comunicación binaria transmite una secuencia
de “bits” (ceros y unos). Suponga que por cualquier bit particular transmitido, existe una probabilidad de 0.1 de que
ocurra un error en la transmisión (un 0 se convierte en 1 o
un 1 se convierte en 0). Suponga que los errores en los bits
ocurren independientemente uno de otro.
a. Considere transmitir 1000 bits. ¿Cuál es la probabilidad
aproximada de que cuando mucho ocurran 125 errores
de transmisión?
219
b. Suponga que el mismo mensaje de 1000 bits es enviado
en dos momentos diferentes independientemente uno de
otro? ¿Cuál es la probabilidad aproximada de que el
número de errores en la primera transmisión sea dentro
de 50 del número en la segunda?
57. Suponga que la distribución del tiempo X (en horas) utilizado por estudiantes en cierta universidad en un proyecto
particular es gama con parámetros 50 y 2. Como
es grande, se puede demostrar que X tiene aproximadamente una distribución normal. Use este hecho para calcular la probabilidad de que un estudiante seleccionado al azar
utilice cuando mucho 125 horas en el proyecto.
5.5 Distribución de una combinación lineal
La media muestral X
y el total muestral To son casos especiales de un tipo de variable aleatoria que surgen con frecuencia en aplicaciones estadísticas.
DEFINICIÓN
Dado un conjunto de n variables aleatorias X1, . . . , Xn y n constantes numéricas a1,...,
an, la variable aleatoria
n
Y a1X1 . . . an Xn aiXi
(5.7)
i1
se llama combinación lineal de las Xi.
1
Con a1 a2 . . . an 1 se obtiene Y X1 . . . Xn To, y a1 a2 . . . an n da
1
1
1
1
.
.
.
.
.
.
Y n X1
n Xn n (X1
Xn) n To
X. Obsérvese que no se requiere que las
Xi sean independientes o que estén idénticamente distribuidas. Todas las Xi podrían tener
distribuciones diferentes y por consiguiente valores y varianzas medias diferentes. Primero
se considera el valor y la varianza esperados de una combinación lineal.
PROPOSICIÓN
Si X1, X2, . . . , Xn tienen valores medios 1, . . . , n, respectivamente y varianzas 21,
. . . , 2n, respectivamente.
1. Si las Xi son independientes o no.
E(a1X1 a2X2 . . . an Xn) a1E(X1) a2E(X2) . . . an E(Xn)
a ...a
1
1
n
n
(5.8)
2. Si X1, . . . , Xn son independientes,
V(a1X1 a2X2 . . . an Xn) a21V(X1) a22V(X2) . . . a2nV(Xn)
a 2 2 . . . a2 2
1
1
n
n
(5.9)
y
2
2 2
. . . a
a X . . .a X
a 21
1
n
n
1
1
n
n
3. Con cualquiera X1, . . . , Xn,
n
V(a1X1 . . . an Xn)
n
aiaj COV(Xi, Xj)
i1 j1
www.FreeLibros.me
(5.10)
(5.11)
c5_p184-226.qxd
220
3/12/08
CAPÍTULO 5
4:08 AM
Page 220
Distribuciones de probabilidad conjunta y muestras aleatorias
Las comprobaciones se dan al final de la sección. Un parafraseo de (5.8) es que el valor esperado de una combinación lineal es la misma combinación lineal de los valores esperados, por
ejemplo, E(2X1 5X2) 21 52. El resultado (5.9) en la proposición 2 es un caso especial
de (5.11) en la proposición 3; cuando las Xi son independientes, Cov(Xi, Xj) 0 con i j
e igual a V(Xi) con i j (esta simplificación en realidad ocurre cuando las Xi no están correlacionadas, una condición más débil que la de independencia). Especializando al caso de una
muestra aleatoria (Xi idénticamente distribuidas) con ai 1/n con cada i da E(X
) y V(X
)
2/n, como se discutió en la sección 5.4. Un comentario similar se aplica a las reglas para To.
Ejemplo 5.28
Una gasolinería vende tres grados de gasolina; regular, extra y súper. Éstas se venden a
$21.20, $21.35 y $21.50 por galón, respectivamente. Sean X1, X2 y X3 las cantidades (galones) de estas gasolinas compradas en un día particular. Suponga que las Xi son independientes con 1 1000, 2 500, 3 300, 1 100, 2 80, y 3 50. El ingreso por
las ventas es Y 21.2X1 21.35X2 21.5X3 y
E(Y ) 21.21 21.352 21.53 $4125
V(Y ) (21.2)2 21 (21.35)2 22 (21.5)2 23 104 025
5 $322.53
Y 10402
■
Diferencia entre dos variables aleatorias
Un caso especial importante de una combinación lineal se presenta con n 2, a1 1 y
a2 1:
Y a1X1 a2X2 X1 X2
Entonces se tiene el siguiente corolario de la proposición.
COROLARIO
E(X1 X2) E(X1) E(X2) y, si X1 y X2 son independientes, V(X1 X2)
V(X1) V(X2).
El valor esperado de una diferencia es la diferencia de los dos valores esperados, pero la
varianza de una diferencia entre dos variables independientes es la suma, no la diferencia,
de las dos varianzas. Existe tanta variabilidad en X1 X2 como en X1 X2 [escribiendo
X1 X2 X1 (1)X2, (1)X2 tiene la misma cantidad de variabilidad que X2].
Ejemplo 5.29
Una compañía automotriz equipa un modelo particular con un motor de seis cilindros o un
motor de cuatro cilindros. Sean X1 y X2 eficiencias de combustible de carros de seis y cuatro cilindros seleccionados en forma independiente al azar, respectivamente. Con 1 22,
2 26, 1 1.2 y 2 1.5,
E(X1 X2) 1 2 22 26 4
V(X1 X2) 21 22 (1.2)2 (1.5)2 3.69
9
1.92
X X 3.6
1
2
Si se cambia la notación de modo que X1 se refiera al carro de cuatro cilindros, entonces
E(X1 X2) 4, pero la varianza de la diferencia sigue siendo de 3.69.
■
El caso de variables aleatorias normales
Cuando las Xi forman una muestra aleatoria de una distribución normal,
X y To están normalmente distribuidas. He aquí un resultado más general con respecto a combinaciones lineales.
www.FreeLibros.me
c5_p184-226.qxd
3/12/08
4:08 AM
Page 221
5.5 Distribución de una combinación lineal
221
PROPOSICIÓN
Si X1, X2, . . . , Xn son variables aleatorias independientes normalmente distribuidas
(con quizá diferentes medias y/o varianzas), entonces cualquier combinación lineal de
las Xi también tiene una distribución normal. En particular, la diferencia X1 X2 entre
dos variables independientes normalmente distribuidas también está distribuida en
forma normal.
Ejemplo 5.30
El ingreso total por la venta de los tres grados de gasolina en un día particular fue Y 21.2X1
21.35X2 21.5X3, y se calculó Y 4125 y (suponiendo independencia) Y 322.53. Si las
Xi están normalmente distribuidas, la probabilidad de que el ingreso sea de más de 4500 es
(continuación
del ejemplo
5.28)
4500 4125
322.53
P(Y 4500) P Z
P(Z 1.16) 1 (1.16) 0.1230
■
El teorema del límite central también puede ser generalizado para aplicarlo a ciertas combinaciones lineales. En general, si n es grande y no es probable que algún término individual contribuya demasiado al valor total, entonces Y tiene aproximadamente una distribución normal.
Comprobaciones en el caso n 2
En cuanto al resultado por lo concerniente a los valores esperados, suponga que X1 y X2 son
continuas con función de densidad de probabilidad conjunta f(x1, x2). Entonces
E(a1X1 a2X2)
a1
x1 f(x1, x2) dx2 dx1
a2
a1
(a1x1 a2x2)f(x1, x2) dx1 dx2
x2 f(x1, x2) dx1 dx2
x1 fX (x1) dx1 a2
1
x2 fX (x2) dx2
2
a1E(X1) a2E(X2)
La suma reemplaza a la integración en el caso discreto. El argumento en cuanto a la varianza resultante no requiere especificar si la variable es discreta o continua. Recordando que
V(Y) E[(Y Y)2],
V(a1X1 a2X2) E{[a1X1 a2X2 (a11 a22)]2}
E{a 21(X1 1)2 a 22(X2 2)2 2a1a2(X1 1)(X2 2)}
La expresión adentro de las llaves es una combinación lineal de las variables Y1 (X1 1)2,
Y2 (X2 2)2 y Y3 (X1 1)(X2 2), así que si se acarrea la operación E a través de
los tres términos se obtiene a 21V(X1) a 22V(X2) 2a1a2 Cov(X1, X2) como se requiere.
■
EJERCICIOS
Sección 5.5 (58-74)
58. Una compañía naviera maneja contenedores en tres diferentes tamaños: (1) 27 pies3 (3 3 3), (2) 125 pies3 y (3)
512 pies3. Sea Xi (i 1, 2, 3) el número de contenedores de
tipo i embarcados durante una semana dada. Con i E(Xi)
y 2i V(Xi), suponga que los valores medios y las desviaciones estándar son como sigue:
1 200
2 250
3 100
1 10
2 12
3 8
www.FreeLibros.me
c5_p184-226.qxd
222
3/12/08
CAPÍTULO 5
4:08 AM
Page 222
Distribuciones de probabilidad conjunta y muestras aleatorias
a. Suponiendo que X1, X2, X3 son independientes, calcule el
valor esperado y la varianza del volumen total embarcado [Sugerencia: Volumen 27X1 125X2 512X3.]
b. ¿Serían sus cálculos necesariamente correctos si las Xi
no fueran independientes? Explique.
59. Si X1, X2 y X3 representan los tiempos necesarios para realizar tres tareas de reparación sucesivas en cierto taller de
servicio. Suponga que son variables aleatorias normales
independientes con valores esperados 1, 2 y 3 y varianzas 21, 22 y 23, respectivamente.
a. Si 2 3 60 y 21 22 23 15, calcule
P(X1 X2 X3 200). ¿Cuál es P(150 X1 X2
X3 200)?
b. Con las i y i dadas en el inciso a), calcule P(55
X)
y P(58
X 62).
c. Con las i y i dadas en el inciso a), calcule P(10
X1 0.5X2 0.5X3 5).
d. Si 1 40, 2 50, 3 60, 21 10, 22 12, y
23 14, calcule P(X1 X2 X3 160) y P(X1
X2 2 X3).
60. Cinco automóviles del mismo tipo tienen que realizar un
viaje de 300 millas. Los primeros dos utilizarán una marca
económica de gasolina y los otros tres una marca de renombre. Sean X1, X2, X3, X4 y X5 las eficiencias de combustible
observadas (mpg) de los cinco carros. Suponga que estas
variables son independientes y normalmente distribuidas
con 1 2 20, 3 4 5 21 y 2 4 con la marca económica y 3.5 con la marca de renombre. Defina una
variable aleatoria Y como
Y
X1 X 2
2
X3 X4 X5
3
de modo que Y mide la diferencia de eficiencia entre la
gasolina económica y la de renombre. Calcule P(0 Y) y
P(1 Y 1). [Sugerencia: Y a1X1 . . . a5X5, con
1
1
a1 2 , . . . , a5 3 .]
61. El ejercicio 26 introdujo variables aleatorias X y Y, el número de carros y autobuses, respectivamente, transportados
por un transbordador en un solo viaje. La función masa de
probabilidad conjunta de X y Y se da en la tabla del ejercicio 7. Es fácil verificar que X y Y son independientes.
a. Calcule el valor esperado, la varianza y la desviación
estándar del número total de vehículos en un solo viaje.
b. Si a cada carro se le cobran $3 y a cada autobús $10,
calcule el valor esperado, la varianza y la desviación
estándar del ingreso resultante de un solo viaje.
62. Un fabricante de un cierto componente requiere tres operaciones de maquinado diferentes. El tiempo de maquinado de
cada operación tiene una distribución normal y los tres tiempos son independientes entre sí. Los valores medios son 15,
30 y 20 min, respectivamente y las desviaciones estándar
son 1, 2 y 1.5 min respectivamente. ¿Cuál es la probabilidad
de que se requiera cuando mucho una hora de tiempo de
maquinado para producir un componente seleccionado al azar?
63. Remítase al ejercicio 3.
a. Calcule la covarianza entre X1 el número de clientes
en la caja rápida y X2 el número de clientes en la caja
súperrápida.
b. Calcule V(X1 X2). ¿Cómo se compara con V(X1)
V(X2)?
64. Suponga que el tiempo de espera para un autobús en la mañana está uniformemente distribuido en [0, 8], mientras que el
tiempo de espera en la noche está uniformemente distribuido
en [0, 10] independiente del tiempo de espera en la mañana.
a. Si toma el autobús en la mañana y en la noche durante
una semana, ¿cuál es su tiempo de espera total esperado? [Sugerencia: Defina las variables aleatorias X1, . . . ,
X10 y use una regla de valor esperado.]
b. ¿Cuál es la varianza de su tiempo de espera total?
c. ¿Cuáles son el valor esperado y la varianza de la diferencia entre los tiempos de espera en la mañana y en la
noche en un día dado?
d. ¿Cuáles son el valor esperado y la varianza de la diferencia
entre el tiempo de espera total en la mañana y el tiempo de
espera total en la noche durante una semana particular?
65. Suponga que cuando el pH de cierto compuesto químico es
5.00, el pH medido por un estudiante de química de primer
año seleccionado al azar es una variable aleatoria con media
de 5.00 y desviación estándar de 0.2. Un gran lote del compuesto se subdivide y a cada estudiante se le da una muestra en un laboratorio matutino y a cada estudiante en un
laboratorio vespertino. Sea
X el pH promedio determinado por los estudiantes matutinos y
Y el pH promedio
determinado por los estudiantes vespertinos.
a. Si el pH es una variable normal y hay 25 estudiantes
en cada laboratorio, calcule P(0.1
X
Y 0.1).
[Sugerencia:
X
Y es una combinación lineal de variables normales, así que está normalmente distribuida.
Calcule XY y XY.]
b. Si hay 36 estudiantes en cada laboratorio, pero las determinaciones del pH no se suponen normales, calcule
(aproximadamente) P(0.1 X
Y
0.1).
66. Si se aplican dos cargas a una viga en voladizo como se
muestra en la figura adjunta, el momento de flexión en 0
debido a las cargas es a1X1 a2X2.
X1
X2
a1
a2
0
a. Suponga que X1 y X2 son variables independientes con
medias de 2 y 4 klb, respectivamente y desviación
estándar de 0.5 y 1.0 klb, respectivamente. Si a1 5
pies y a2 10 pies, ¿cuál es el momento de flexión
esperado y cuál es la desviación estándar del momento
de flexión?
b. Si X1 y X2 están normalmente distribuidas, ¿cuál es la
probabilidad de que el momento de flexión sea de más
de 75 klb-pie?
c. Suponga que las posiciones de las dos cargas son variables aleatorias. Denotándolas por A1 y A2, suponga que
estas variables tienen medias de 5 y 10 pies, respectivamente, que cada una tiene una desviación estándar de
0.5 y que todas las Ai y Xi son independientes entre sí.
¿Cuál es el momento esperado ahora?
d. En la situación del inciso c), ¿cuál es la varianza del
momento de flexión?
www.FreeLibros.me
c5_p184-226.qxd
3/12/08
4:08 AM
Page 223
5.5 Distribución de una combinación lineal
e. Si la situación es como se describe en el inciso a) excepto que Corr(X1, X2) 0.5 (de modo que las dos cargas
no sean independientes), ¿cuál es la varianza del momento de flexión?
67. Un tramo de tubería de PVC tiene que ser insertado en otro
tramo. La longitud del primer tramo está normalmente distribuido con valor medio de 20 pulg y desviación estándar
de 0.5 pulg. El segundo tramo es una variable aleatoria normal con media y desviación estándar de 15 pulg y 0.4 pulg,
respectivamente. La cantidad de traslape está normalmente
distribuido con valor medio de una pulg y desviación estándar de 0.1 pulg. Suponiendo que los tramos y cantidad de
traslape son independientes entre sí, ¿cuál es la probabilidad de que la longitud total después de la inserción esté
entre 34.5 pulg y 35 pulg?
68. Dos aviones vuelan en la misma dirección en dos corredores adyacentes. En el instante t 0, el primer avión está a
10 km adelante del segundo. Suponga que la velocidad del
primero (km/h) está normalmente distribuida con media de
520 y desviación estándar de 10 y que la velocidad del
segundo también está normalmente distribuida con media y
desviación estándar de 500 y 10, respectivamente.
a. ¿Cuál es la probabilidad de que después de 2 horas de
vuelo, el segundo avión no haya alcanzado al primer
avión?
b. Determine la probabilidad de que los aviones estén
separados cuando mucho 10 km después de 2 horas.
69. Tres carreteras diferentes entroncan en una autopista particular. Suponga que durante un tiempo fijo, el número de
carros que llegan por cada carretera a la autopista es una
variable aleatoria, con valor esperado y desviación estándar
como se dan en la tabla
| Carretera 1 Carretera 2 Carretera 3
| 800
1000
600
Valor esperado
Desviación estándar |
16
25
18
a. ¿Cuál es el número de carros total esperado que entran
a la autopista en este punto durante el periodo?
[Sugerencia: Sea Xi el número de la carretera i.]
b. ¿Cuál es la varianza del número total de carros que
entran? ¿Ha hecho suposiciones sobre la relación entre
los números de carros en las diferentes carreteras?
c. Con Xi denotando el número de carros que entran de la
carretera i durante el periodo, suponga que Cov(X1,
X2) 80, Cov(X1, X3) 90 y Cov(X2, X3) 100 (de
modo que las tres corrientes de tráfico no son independientes). Calcule el número total esperado de los carros
que entran y la desviación estándar del total.
70. Considere una muestra aleatoria de tamaño n tomada de una
distribución continua con mediana 0 de modo que la probabilidad de cualquier observación sea positiva de 0.5. Haciendo caso omiso de los signos de las observaciones,
clasifíquelas desde la más pequeña a la más grande en valor
absoluto y sea W la suma de las filas de las observaciones con signos positivos. Por ejemplo, si las observaciones
son 0.3, 0.7, 2.1 y 2.5, entonces las filas de observaciones positivas son 2 y 3, de modo que W 5. En el
223
capítulo 15, W se llamará estadístico de filas con signo de
Wilcoxon. W puede representarse como sigue:
W 1 Y1 2 Y2 3 Y3 . . . n Yn
n
i Yi
i1
donde las Yi son variables aleatorias independientes de
Bernoulli, cada una con p 0.5(Yi 1 corresponde a la
observación con fila i positiva).
a. Determine E(Yi) y luego E(W) utilizando la ecuación
para W. [Sugerencia: Los primeros n enteros positivos
suman n(n 1)/2.]
b. Determine V(Yi) y luego V(W). [Sugerencia: La suma de
los cuadrados de los primeros n enteros positivos puede
expresarse como n(n 1)(2n 1)/6.]
71. En el ejercicio 66, el peso de viga contribuye al momento
de flexión. Suponga que la viga es de espesor y densidad
uniformes, de modo que la carga resultante esté uniformemente distribuida en la viga. Si el peso de ésta es aleatorio,
la carga resultante a consecuencia del peso también es aleatoria; denote esta carga por W(klb-pies).
a. Si la viga es de 12 pies de largo, W tiene una media de
1.5 y una desviación estándar de 0.25 y las cargas fijas
son como se describen en el inciso a) del ejercicio 66,
¿cuáles son el valor esperado y la varianza del momento de flexión? [Sugerencia: Si la carga originada por la
viga fuera w klb-pies, la contribución al momento de flexión sería w 12 x dx.]
0
b. Si las tres variables (X1, X2 y W) están normalmente distribuidas, ¿cuál es la probabilidad de que el momento de
flexión será cuando mucho de 200 klb-pies?
72. Tengo tres encargos que atender en el edificio de administración. Sea Xi el tiempo que requiere el i-ésimo encargo
(i 1, 2, 3) y sea X4 el tiempo total en minutos que me paso caminando hasta y desde el edificio y entre cada encargo.
Suponga que las Xi son independientes y normalmente distribuidas con las siguientes medias y desviaciones estándar
1 15, 1 4, 2 5, 2 1, 3 8, 3 2, 4 12,
4 3. Pienso salir de mi oficina precisamente a las 10:00
a.m. y deseo pegar una nota en la puerta que diga “Regreso alrededor de las t a.m.”. ¿Qué hora debo escribir si deseo que la
probabilidad de mi llegada después de t sea de 0.01?
73. Suponga que la resistencia a la tensión de acero tipo A es
de 105 klb2 y que la desviación estándar de la resistencia a
la tensión es de 8 klb2. Para acero tipo B, suponga que la
resistencia a la tensión esperada y la desviación estándar de
la resistencia a la tensión son de 100 klb2 y 6 klb2, respectivamente. Sea X
la resistencia a la tensión promedio de
una muestra aleatoria de 40 especímenes tipo A y sea Y
la resistencia a la tensión promedio de una muestra aleatoria de 35 especímenes tipo B.
a. ¿Cuál es la distribución aproximada de
X? ¿De
Y?
b. ¿Cuál es la distribución aproximada de
X
Y ? Justifique su respuesta.
c. Calcule (aproximadamente) P(1
X
Y 1).
d. Calcule P(X
Y
10). Si en realidad observó X
Y
10, dudaría que 1 2 5?
www.FreeLibros.me
c5_p184-226.qxd
224
3/12/08
CAPÍTULO 5
4:08 AM
Page 224
Distribuciones de probabilidad conjunta y muestras aleatorias
74. En un área de suelo arenoso se plantaron 50 árboles
pequeños de un cierto tipo y otros 50 se plantaron en un
área de suelo arcilloso. Sea X el número de árboles
plantados en suelo arenoso que sobreviven un año y Y el
número de árboles plantados en suelo arcilloso que sobre-
viven un año. Si la probabilidad de que un árbol plantado
en suelo arenoso sobreviva un año es de 0.7 y la probabilidad de sobrevivencia de un año en suelo arcilloso es de 0.6,
calcule una aproximación a P(5 X Y 5) (no se
moleste con la corrección de continuidad).
EJERCICIOS SUPLEMENTARIOS (75-95)
75. Un restaurante sirve tres comidas que cuestan $12, $15 y
$20. Para una pareja seleccionada al azar que está comiendo en este restaurante, sea X el costo de la comida del
hombre y Y el costo de la comida de la mujer. La función
masa de probabilidad conjunta de X y Y se da en la siguiente tabla:
y
p(x, y)
12
15
20
x
12
15
20
|
|
|
|
0.05
0.05
0
0.05
0.10
0.20
0.10
0.35
0.10
a. Calcule las funciones masa de probabilidad marginal de
X y Y.
b. ¿Cuál es la probabilidad de que las comidas del hombre
y la mujer cuesten cuando mucho $15 cada una?
c. ¿Son X y Y independientes? Justifique su respuesta.
d. ¿Cuál es el costo total esperado de la comida de las dos
personas?
e. Suponga que cuando una pareja abre las galletas de la
fortuna al final de la comida, encuentran el mensaje
“Recibirá como reembolso la diferencia entre el costo de
la comida más cara y la menos cara que eligió”. ¿Cuánto
espera reembolsar el restaurante?
76. En una estimación de costos, el costo total de un proyecto
es la suma de los costos de las tareas componentes. Cada
uno de estos costos es una variable aleatoria con distribución
de probabilidad. Se acostumbra obtener información sobre
la distribución de costos total sumando las características
de las distribuciones de costo de componente individuales;
esto se conoce como procedimiento de “despliegue”. Por
ejemplo, E(X1 . . . Xn) E(X1) . . . E(Xn), así que
el procedimiento de despliegue es válido para costo medio.
Suponga que hay dos tareas componentes y que X1 y X2 son
variables aleatorias independientes normalmente distribuidas. ¿Es válido el procedimiento de despliegue para el 75º
percentil? Es decir, ¿Es el 75º percentil de la distribución de
X1 X2 el mismo que la suma de los 75º percentiles de las
dos distribuciones individuales? Si no, ¿cuál es la relación
entre el percentil de la suma y la suma de los percentiles?
¿Con qué percentiles es válido el procedimiento de despliegue en este caso?
77. Una tienda de comida saludable vende dos marcas diferentes de un tipo de grano. Sea X la cantidad (lb) de la marca A disponible y Y la cantidad de la marca B, disponible.
Suponga que la función de densidad de probabilidad conjunta de X y Y es
f(x, y)
{kxy0
x 0, y 0, 20 x y 30
de lo contrario
a. Trace la región de densidad positiva y determine el valor
de k.
b. ¿Son X y Y independientes? Responda obteniendo primero la función de densidad de probabilidad marginal
de cada variable.
c. Calcule P(X Y 25).
d. ¿Cuál es la cantidad total esperada de este grano disponible?
e. Calcule Cov(X, Y) y Corr(X, Y).
f. ¿Cuál es la varianza de la cantidad total de grano
disponible?
78. Sean X1, X2, . . . , Xn variables aleatorias que denotan n posturas independientes para un artículo que está a la venta.
Suponga que cada Xi está uniformemente distribuida en el
intervalo [100, 200]. Si el vendedor se lo vende al postor más
alto, ¿cuánto puede esperar ganar en la venta? [Sugerencia:
Sea Y máx(X1, X2, . . . , Xn). Primero halle FY(y) observando que Y y si y sólo si cada Xi es y. Luego obtenga la
función de densidad de probabilidad y E(Y).]
79. Suponga que para un individuo, la ingesta de calorías en el
desayuno es una variable aleatoria con valor esperado de
500 y desviación estándar de 50, la ingesta de calorías en el
almuerzo es aleatoria con valor esperado de 900 y desviación estándar de 100 y la ingesta de calorías en la comida
es una variable aleatoria con valor esperado de 2000 y desviación estándar de 180. Suponiendo que las ingestas en las
diferentes comidas son independientes entre sí, ¿cuál es la
probabilidad de que la ingesta de calorías promedio por día
durante el siguiente año (365 días) sea cuando mucho de
3500? [Sugerencia: Sean Xi, Yi y Zi las tres ingestas de calorías en el día i. Entonces la ingesta total es (Xi Yi Zi).]
80. El peso medio del equipaje documentado por un pasajero de
clase turista seleccionado al azar que vuela entre dos ciudades en cierta aerolínea es de 40 lb y la desviación estándar
es de 10 lb. La media y la desviación estándar de un pasajero de clase de negocios son 30 lb y 6 lb, respectivamente.
a. Si hay 12 pasajeros de clase de negocios y 50 de clase
turista en un vuelo particular, ¿cuáles son el valor esperado y la desviación estándar del peso total del equipaje?
b. Si los pesos individuales de los equipajes son variables
aleatorias independientes normalmente distribuidas,
¿cuál es la probabilidad de que el peso total del equipaje sea cuando mucho de 2500 lb?
81. Se ha visto que si E(X1) E(X2) . . . E(Xn) ,
entonces E(X1 . . . Xn) n. En algunas aplicaciones, el número de Xi considerado no es un número fijo n
sino una variable aleatoria N. Por ejemplo, sea N el
número de componentes que son traídos a un taller de reparación en un día particular y sea Xi el tiempo de reparación
www.FreeLibros.me
c5_p184-226.qxd
3/12/08
4:08 AM
Page 225
Ejercicios suplementarios
del i-ésimo componente, entonces el tiempo de reparación
total es X1 X2 . . . XN, la suma de un número aleatorio de variables aleatorias. Cuando N es independiente de
las Xi se puede demostrar que
E(X1 . . . XN) E(N)
a. Si el número de componentes traídos en un día particular es 10 y el tiempo de reparación esperado de un componente seleccionado al azar es de 40 min, ¿cuál es el
tiempo de reparación total de componentes entregados
en cualquier día particular?
b. Suponga que componentes de un tipo llegan para ser reparados de acuerdo en un proceso de Poisson a razón de cinco por hora. El número esperado de defectos por
componente es de 3.5. ¿Cuál es el valor esperado del
número total de defectos en componentes traídos a reparación durante un periodo de cuatro horas? Asegúrese de
indicar cómo su respuesta se deriva del resultado general
que se acaba de dar.
82. Suponga que la proporción de votantes rurales en un estado
que favorecen a un candidato particular es de 0.45 y que la
proporción de votantes suburbanos y urbanos que favorecen
al candidato es de 0.60. Si se obtiene una muestra de 200
votantes rurales y 300 votantes suburbanos y urbanos, ¿cuál
es la probabilidad aproximada de que por lo menos 250
de estos votantes favorezcan a este candidato?
83. Sea el pH verdadero de un compuesto químico. Se realizará una secuencia de n determinaciones de pH muestrales
independientes. Suponga que cada pH muestra es una variable aleatoria con valor esperado y desviación estándar de
0.1. ¿Cuántas determinaciones se requieren si se desea que
la probabilidad de que el promedio muestral esté dentro
de 0.02 de pH verdadero sea por lo menos de 0.95? ¿Qué
teorema justifica su cálculo de probabilidad?
84. Si la cantidad de refresco que consumo en cualquier día dado
es independiente del consumo en cualquier otro día y está
normalmente distribuido con 13 oz y 2 y en este
momento tengo dos paquetes de seis botellas de 16 oz, ¿cuál
es la probabilidad de que todavía tenga algo de refresco
al cabo de 2 semanas (14 días)?
85. Remítase al ejercicio 58 y suponga que las Xi son independientes entre sí y que cada una tiene una distribución normal. ¿Cuál es la probabilidad de que el volumen total
embarcado sea cuando mucho de 100 000 pies3?
86. Un estudiante tiene una clase que se supone termina a las
9:00 a.m. y otra que se supone comienza a las 9:10 a.m. Suponga que el tiempo real de terminación de la clase de las
9:00 a.m. es una variable aleatoria normalmente distribuida
X1 con media de 9:02 y desviación estándar de 1.5 min y que
la hora de inicio de la siguiente clase también es una variable aleatoria normalmente distribuida X2 con media de 9:10
y desviación estándar de un min. Suponga que el tiempo necesario para ir de un salón de clases al otro es una variable
aleatoria normalmente distribuida X3 con media de
seis min y desviación estándar de un min. ¿Cuál es la probabilidad de que el estudiante llegue a la segunda clase antes
de que comience? (Suponga independencia de X1, X2 y X3,
la cual es razonable si el estudiante no presta atención a la
hora de terminación de la primera clase.)
225
87. a. Use la fórmula general de la varianza de una combinación
lineal para escribir una expresión para V(aX Y). Luego
si a Y /X, y demuestre que 1. [Sugerencia: La
varianza siempre es 0 y Cov(X, Y) X Y .]
b. Considerando que V(aX Y), concluya que 1.
c. Use el hecho de que V(W) 0 sólo si W es una constante para demostrar que 1 sólo si Y aX b.
88. Suponga que una calificación oral X y una calificación
cuantitativa Y de un individuo seleccionado al azar en un
examen de aptitud aplicado a nivel nacionalmente tienen
una función de densidad de probabilidad conjunta
{
2
(2x 3y) 0 x 1, 0 y 1
f (x, y) 5
0
de lo contrario
Se le pide que haga una predicción t de la calificación total
X Y del individuo. El error de predicción es la media del
error al cuadrado E[(X Y t)2]. ¿Qué valor de t reduce al
mínimo el error de predicción?
89. a. Que Xi tenga una distribución ji cuadrada con parámetro
1 (véase la sección 4.4) y que X2 sea independiente de
X1 y que tenga una distribución ji cuadrada con parámetro 2. Use la técnica del ejemplo 5.21 para demostrar
que X1 X2 tiene una distribución ji cuadrada con parámetro 1 2.
b. En el ejercicio 71 del capítulo 4, se le pidió que demostrara que si Z es una variable normal estándar, entonces
Z 2 tiene una distribución ji cuadrada con 1. Sean Z1,
Z2, . . . , Zn n variables aleatorias normales estándar.
¿Cuál es la distribución de Z 21 . . . Z 2n? Justifique su
respuesta.
c. Sean X1, . . . , Xn una muestra aleatoria de una distribución normal con media y varianza 2. ¿Cuál es la distribución de la suma Y ni1 [(Xi )/]2? Justifique
su respuesta.
90. a. Demuestre que Cov(X, Y Z) Cov(X, Y) Cov(X, Z).
b. Sean X1 y X2 calificaciones cuantitativas y orales en un
examen de aptitud y sean Y1 y Y2 calificaciones correspondientes en otro examen. Si Cov(X1, Y1) 5, Cov(X1,
Y2) 1, Cov(X2, Y1) 2 y Cov(X2, Y2) 8, ¿cuál es la
covarianza entre las dos calificaciones totales X1 X2 y
Y1 Y2?
91. Se selecciona al azar y se pesa dos veces un espécimen de roca
de un área particular. Sea W el peso real y X1 y X2 los dos pesos
medidos. Entonces X1 W E1 y X2 W E2, donde E1 y
E2 son los dos errores de medición. Suponga que los Ei son
independientes entre sí y de W y que V(E1) V(E2) E2.
a. Exprese , el coeficiente de correlación entre los dos
pesos medidos X1 y X2 en función de W2 , la varianza
del peso real y 2x , la varianza del peso medido.
b. Calcule cuando W 1 kg y E 0.01 kg.
92. Sea A el porcentaje de un constituyente en un espécimen de
roca seleccionado al azar y sea B el porcentaje de un segundo
constituyente en ese mismo espécimen. Suponga que D y E
son errores de medición al determinar los valores de A y B de
modo que los valores medidos sea X A D y Y B E,
respectivamente. Suponga que los errores de medición son
independientes entre sí y de los valores reales.
www.FreeLibros.me
c5_p184-226.qxd
226
3/12/08
CAPÍTULO 5
4:08 AM
Page 226
Distribuciones de probabilidad conjunta y muestras aleatorias
a. Demuestre que
Corr(X, Y) Corr(A, B)
Co
rr
(X1,
X2)
Co
rr
(Y1,
Y2)
donde X1 y X2 son mediciones replicadas del valor de A
y Y1 y Y2 se definen análogamente con respecto a B.
¿Qué efecto tiene la presencia del error de medición en
la correlación?
b. ¿Cuál es valor máximo de Corr(X, Y) cuando Corr(X1,
X2) 0.8100 y Corr(Y1, Y2) 0.9025? ¿Es esto perturbador?
93. Sean X1, . . . , Xn variables aleatorias independientes con
valores medios 1, . . . , n y varianzas 21, . . . , 2n.
Considere una función h(x1, . . . , xn) y úsela para definir una
nueva variable aleatoria Y h(X1, . . . , Xn). En condiciones
un tanto generales en cuanto a la función h, si las i son
pequeñas con respecto a las i correspondientes se puede
demostrar que E(Y) h(1, . . . , n) y
V(Y)
,h
2
,x
1
21
...
,h
2
,x
2n
n
donde cada derivada parcial se evalúa en (x1, . . . , xn)
(1, . . . , n). Suponga tres resistores con resistencias
X1, X2, X3 conectadas en paralelo a través de una batería con
voltaje X4. Luego, según la ley de Ohm, la corriente es
Y X4
X
1
1
1
1
X2
X3
Sea 1 10 ohms, 1 1.0 ohms, 2 15 ohms, 2 1.0
ohms, 3 20 ohms, 3 1.5 ohms, 4 120 V, 4 4.0 V.
Calcule el valor esperado aproximado y la desviación estándar de la corriente (sugerido por “Random Samplings”,
CHEMTECH, 1984: 696-697).
94. Una aproximación más precisa a E[h(X1,
ejercicio 93 es
,2h
1
h(1, . . . , n) 21
...
2
,x21
. . . , Xn)] en el
1 2 ,2h
2 n ,x2n
Calcule esto con Y h(X1, X2, X3, X4) dada en el ejercicio
93 y compárela con el primer término h(1, . . . , n).
95. Sean X y Y variables aleatorias normales estándar independientes y defina una nueva variable aleatoria como U 0.6X
0.8Y.
a. Determine Corr(X, U).
b. ¿Cómo modificaría U para obtener Corr(X, U) con
un valor especificado de ?
Bibliografía
Devore, Jay y Kenneth Berk, Modern Mathematical Statistics
with Applications, Thomson-Brooks/Cole, Belmont, CA,
2007. Una exposición un poco más complicada de temas de
probabilidad que en el presente libro.
Olkin, Ingram, Cyrus Derman y Leon Gleser, Probability Models
and Applications (2a. ed.). Macmillan, Nueva York, 1994.
Contiene una cuidadosa y amplia exposición de distribuciones
conjuntas, reglas de probabilidad y teoremas de límites.
www.FreeLibros.me
c6_p227-253.qxd
3/12/08
4:12 AM
6
Page 227
Estimación puntual
INTRODUCCIÓN
Dado un parámetro de interés, tal como la media o la proporción p de una población, el objetivo de la estimación puntual es utilizar una muestra para calcular un
número que representa en cierto sentido una buena suposición del valor verdadero
del parámetro. El número resultante se llama estimación puntual. En la sección 6.1,
se presentan algunos conceptos generales de estimación puntual. En la sección 6.2, se
describen e ilustran dos métodos importantes de obtener estimaciones puntuales: el
método de momentos y el método de máxima probabilidad.
227
www.FreeLibros.me
c6_p227-253.qxd
228
3/12/08
CAPÍTULO 6
4:12 AM
Page 228
Estimación puntual
6.1 Algunos conceptos generales de estimación puntual
El objetivo de la inferencia estadística casi siempre es sacar algún tipo de conclusión sobre
uno o más parámetros (características de la población). Para hacer eso un investigador tiene que obtener datos muestrales de cada una de las poblaciones estudiadas. Las conclusiones pueden entonces basarse en los valores calculados de varias cantidades muestrales. Por
ejemplo, sea (un parámetro) la resistencia a la ruptura promedio verdadera de conexiones
alámbricas utilizadas en la unión de obleas semiconductoras. Se podría tomar una muestra
aleatoria de n 10 conexiones y determinar la resistencia a la ruptura de cada una y se tendrían las resistencias observadas x1, x2, . . . , x10. La resistencia a la ruptura media muestral
x se utilizaría entonces para sacar una conclusión con respecto al valor de . Asimismo, si
2 es la varianza de la distribución de la resistencia a la ruptura (varianza de la población,
otro parámetro), el valor de la varianza muestral s2 se utiliza para inferir algo sobre 2.
Cuando se discuten los métodos y conceptos generales de inferencia, es conveniente
disponer de un símbolo genérico para el parámetro de interés. Se utilizará la letra griega
para este propósito. El objetivo de la estimación puntual es seleccionar un solo número, con
base en los datos muestrales, que represente un valor sensible de . Supóngase, por ejemplo, que el parámetro de interés es , la vida útil promedio verdadera de baterías de un tipo.
Una muestra aleatoria de n 3 baterías podría dar las vidas útiles (horas) observadas x1
5.0, x2 6.4, x3 5.9. El valor calculado de la vida útil media muestral es x 5.77 y es
razonable considerar 5.77 como un valor muy factible de , la “mejor suposición” del valor
de basado en la información muestral disponible.
Supóngase que se desea estimar un parámetro de una población (p. ej., o ) con una
muestra aleatoria de tamaño n. Recuérdese por el capítulo previo de que antes que los datos
estén disponibles, las observaciones muestrales deben ser consideradas como variables aleatorias X1, X2, . . . , Xn. Se deduce que cualquier función de las Xi, es decir, cualquier estadístico, tal como la media muestral
X o la desviación estándar muestral S también es una
variable aleatoria. Lo mismo es cierto si los datos disponibles se componen de más de
una muestra. Por ejemplo, se pueden representar las resistencias a la tensión de m especímenes de tipo 1 y de n especímenes de tipo 2 por X1, . . . , Xm y Y1, . . . , Yn, respectivamente. La diferencia entre las dos resistencias medias muestrales es
X
Y, el estadístico natural
para inferir sobre 1 2, la diferencia entre las resistencias medias de la población.
DEFINICIÓN
Una estimación puntual de un parámetro es un número único que puede ser considerado como un valor sensible de . Se obtiene una estimación puntual seleccionando un estadístico apropiado y calculando su valor con los datos muestrales dados.
El estadístico seleccionado se llama estimador puntual de .
En el ejemplo de la batería que se acaba de dar, el estimador utilizado para obtener la
estimación puntual de fue X
y la estimación puntual de fue 5.77. Si las tres vidas útiles
hubieran sido x1 5.6, x2 4.5 y x3 6.1, el uso del estimador X
habría dado por resultado la estimación x (5.6 4.5 6.1)/3 5.40. El símbolo ˆ (“teta testada”) se utiliza
comúnmente para denotar tanto la estimación de como la estimación puntual que resulta
de una muestra dada.* Por tanto, ˆ X
se lee como “el estimador puntual de es la media
ˆ (teta mayúscula) para el estimador, pero ésta es difícil de
* Siguiendo la primera notación, se podría utilizar
escribir.
www.FreeLibros.me
c6_p227-253.qxd
3/12/08
4:12 AM
Page 229
6.1 Algunos conceptos generales de estimación puntual
229
muestral X
”. La proposición “la estimación puntual de es 5.77” se escribe concisamente
como ˆ 5.77. Obsérvese que cuando se escribe ˆ 72.5, no hay ninguna indicación
de cómo se obtuvo esta estimación puntual (qué estadístico se utilizó). Se recomienda reportar tanto el estimador como la estimación resultante.
Ejemplo 6.1
Un fabricante automotriz ha producido un nuevo tipo de defensa, la que se presume absorbe impactos con menos daño que las defensas previas. El fabricante ha utilizado esta defensa en una secuencia de 25 choques controlados con un muro, cada uno a 10 mph, utilizando
uno de sus modelos de carro compacto. Sea X el número de choques que no provocaron
daños visibles al automóvil. El parámetro que tiene que ser estimado es p la proporción
de todos los choques que no provocaron daños [alternativamente, p P(ningún daño en un
choque)]. Si se observa que X es x 15, el estimador y estimación más razonables son
estimador p̂
X
n
estimación
15
x
0.60
25
n
■
Si por cada parámetro de interés hubiera sólo un estimador puntual razonable, no
habría mucho para la estimación puntual. En la mayoría de los problemas, sin embargo, habrá
más de un estimador razonable.
Ejemplo 6.2
Reconsidere las 20 observaciones adjuntas de voltaje de ruptura dieléctrica de piezas de
resina epóxica introducidas por primera vez en el ejemplo 4.30 (sección 4.6).
24.46 25.61 26.25 26.42 26.66 27.15 27.31 27.54 27.74 27.94
27.98 28.04 28.28 28.49 28.50 28.87 29.11 29.13 29.50 30.88
El patrón en la gráfica de probabilidad normal dado allí es bastante recto, así que ahora se
supone que la distribución de voltaje de ruptura es normal con valor medio . Como las distribuciones normales son simétricas, también es la vida útil mediana de la distribución. Se
supone entonces que las observaciones dadas son el resultado de una muestra aleatoria X1,
X2, . . . , X20 de esta distribución normal. Considere los siguientes estimadores y las estimaciones resultantes de :
a. Estimador X
, estimación x xi /n 555.86/20 27.793
|
b. Estimador X, estimación |
x (27.94 27.98)/2 27.960
c. Estimador [mín(Xi) máx(Xi)]/2 el promedio de las dos vidas útiles extremas, estimación [mín(xi) máx(xi)]/2 (24.46 30.88)/2 27.670
d. Estimador
Xtr(10), la media 10% recortada (desechar el 10% más pequeño y más grande de la muestra y luego promediar).
estimación xtr(10)
555.86 24.46 25.61 29.50 30.88
16
27.838
Cada uno de los estimadores a) al d) utiliza una medición diferente del centro de la muestra para estimar . ¿Cuál de las estimaciones se acerca más al valor verdadero? No se puede
responder esta pregunta sin conocer el valor verdadero. Una pregunta que se puede hacer es:
“¿Cuál estimador, cuando se utiliza en otras muestras de Xi, tiende a producir estimaciones
cercanas al valor verdadero? En breve se considerará este tipo de pregunta.
■
www.FreeLibros.me
c6_p227-253.qxd
230
3/12/08
CAPÍTULO 6
4:12 AM
Page 230
Estimación puntual
Ejemplo 6.3
En el futuro inmediato habrá un creciente interés por desarrollar aleaciones de Mg de bajo
costo para varios procesos de fundición. Es por consiguiente importante contar con formas
prácticas de determinar varias propiedades mecánicas de esas aleaciones. El artículo “On
the Development of a New Approach for the Determination of Yield Strength in Mg-based
Alloys” (Light Metal Age, octubre de 1998: 50-53) propuso un método ultrasónico para este
propósito. Considere la siguiente muestra de observaciones de módulo elástico (GPa) de
especímenes de aleación AZ91D tomados de un proceso de fundición a troquel:
44.2
43.9
44.7
44.2
44.0
43.8
44.6
43.1
Suponga que estas observaciones son el resultado de una muestra aleatoria X1, . . . , X8 tomada de la distribución de población de módulos elásticos en semejantes circunstancias. Se
desea estimar la varianza de la población 2. Un estimador natural es la varianza muestral:
ˆ 2 S 2
(Xi
X )2
n 1
X 2i ( Xi)2/n
n1
La estimación correspondiente es
ˆ 2 s 2
x 2i ( xi)2/8
7
15533.79 (352.5)2/8
7
0.25125 0.251
La estimación de sería entonces ˆ s 0
.25125 0.501.
Si se utiliza el divisor n en lugar de n 1 se obtendría un estimador alternativo (es
decir, la desviación al cuadrado promedio):
ˆ 2
(Xi X )2
n
estimación
1.75875
0.220
8
En breve se indicará por qué muchos estadísticos prefieren S2 al estimador con divisor n. ■
En el mejor de todos los mundos posibles, se podría hallar un estimador ˆ con el cual
ˆ siempre. Sin embargo, ˆ es una función de las Xi muestrales, así que es una variable
aleatoria. Con algunas muestras, ˆ dará un valor más grande que , mientras que con otras
muestras ˆ subestimará . Si se escribe
ˆ
error de estimación
entonces un estimador preciso sería uno que produzca errores de estimación pequeños, así
que los valores estimados se aproximarán al valor verdadero.
Una forma sensible de cuantificar la idea de ˆ cercano a es considerar el error al
cuadrado (ˆ )2. Con algunas muestras, ˆ se acercará bastante a y el error al cuadrado
se aproximará a 0. Otras muestras pueden dar valores de ˆ alejados de , correspondientes
a errores al cuadrado muy grandes. Una medida general de precisión es el error cuadrático
medio ECM E[( ˆ )2]. Si un primer estimador tiene una media del error al cuadrado
más pequeña que un segundo, es natural decir que el primer estimador es el mejor. Sin
embargo, el error cuadrático medio en general dependerá del valor de . Lo que a menudo
sucede es que un estimador tendrá una media del error al cuadrado más pequeña con algunos valores de y una media del error al cuadrado más grande con otros valores. En general no es posible determinar un estimador con el error cuadrático medio mínimo.
Una forma de librarse de este dilema es limitar la atención sólo en estimadores que
tengan una propiedad deseable específica y luego determinar el mejor estimador en este
grupo limitado. Una propiedad popular de esta clase en la comunidad estadística es el insesgamiento.
www.FreeLibros.me
3/12/08
4:12 AM
Page 231
6.1 Algunos conceptos generales de estimación puntual
231
Estimadores insesgados
Supóngase que se tienen dos instrumentos de medición: uno ha sido calibrado con precisión,
pero el otro sistemáticamente da lecturas más pequeñas que el valor verdadero que se está
midiendo. Cuando cada uno de los instrumentos se utiliza repetidamente en el mismo objeto, debido al error de medición, las mediciones observadas no serán idénticas. Sin embargo,
las mediciones producidas por el primer instrumento se distribuirán en torno al valor verdadero de tal modo que en promedio este instrumento mide lo que se propone medir, por lo que este
instrumento se conoce como instrumento insesgado. El segundo instrumento proporciona
observaciones que tienen un componente de error o sesgo sistemático.
DEFINICIÓN
Se dice que un estimador puntual ˆ es un estimador insesgado de si E( ˆ ) con
todo valor posible de . Si ˆ no es insesgado, la diferencia E( ˆ ) se conoce como
el sesgo de ˆ.
Es decir, ˆ es insesgado si su distribución de probabilidad (es decir, muestreo) siempre está
“centrada” en el valor verdadero del parámetro. Supóngase que ˆ es un estimador insesgado;
entonces si 100, la distribución muestral ˆ está centrada en 100; si 27.5, en ese caso
la distribución muestral ˆ está centrada en 27.5, y así sucesivamente. La figura 6.1 ilustra la
distribución de varios estimadores sesgados e insesgados. Obsérvese que “centrada” en este
caso significa que el valor esperado, no la mediana de la distribución de ˆ es igual a .
Función de densidad
de probabilidad de ^2
Función de densidad
de probabilidad de ^2
Función de densidad
de probabilidad de ^1
¨
©
ª
Función de densidad
de probabilidad de ^1
¨
©
ª
c6_p227-253.qxd
Sesgo de 1
Sesgo de 1
Figura 6.1 Funciones de densidad de probabilidad de un estimador sesgado ˆ 1 y un estimador insesgado ˆ 2 de un parámetro .
Parece como si fuera necesario conocer el valor de (en cuyo caso la estimación es
innecesaria) para ver si ˆ es insesgado. Éste casi nunca es el caso, puesto que insesgamiento es una propiedad general del estimador muestral, donde se centra, y generalmente no
depende de cualquier valor de parámetro particular.
En el ejemplo 6.1, se utilizó la proporción muestral X/n como estimador de p, donde
X, el número de éxitos muestrales, tenía una distribución binomial con parámetros n y p. Por
lo tanto,
E( p̂) E
PROPOSICIÓN
n n E(X) n (np) p
X
1
1
Cuando X es una variable aleatoria binomial con parámetros n y p, la proporción
muestral p̂ X/n es un estimador insesgado de p.
No importa cuál sea el valor verdadero de p, la distribución del estimador p̂ estará centrada
en el valor verdadero.
www.FreeLibros.me
c6_p227-253.qxd
232
3/12/08
CAPÍTULO 6
4:12 AM
Page 232
Estimación puntual
Ejemplo 6.4
Suponga que X, el tiempo de reacción a un estímulo, tiene una distribución uniforme en el
intervalo desde 0 hasta un límite superior desconocido (por tanto la función de densidad
de X es rectangular con altura 1/ en el intervalo 0 x ). Se desea estimar con base
en una muestra aleatoria X1, X2, . . . , Xn de los tiempos de reacción. Como es el tiempo
más grande posible en toda la población de tiempos de reacción, considere como un primer
estimador el tiempo de reacción muestral más grande ˆ1 máx(X1, . . . , Xn). Si n 5 y
x1 4.2, x2 1.7, x3 2.4, x4 3.9, x5 1.3, la estimación puntual de es ˆ1 máx(4.2,
1.7, 2.4, 3.9, 1.3) 4.2.
El insesgamiento implica que algunas muestras darán estimaciones que exceden y
otras que darán estimaciones más pequeñas que , de lo contrario posiblemente no podría
ser el centro (punto de equilibrio) de la distribución de ˆ1. Sin embargo, el estimador propuesto nunca sobrestimará (el valor muestral más grande no puede exceder el valor de la
población más grande) y subestimará a menos que el valor muestral más grande sea igual
a . Este argumento intuitivo demuestra que ˆ1 es un estimador sesgado. Más precisamente,
se puede demostrar (véase el ejercicio 32) que
n
n
E( ˆ1)
como
1
n1
n1
n /(n 1) /(n 1) da el sesgo de ˆ1, el cual tiende a 0 a medida que n se hace
grande.
Es fácil modificar ˆ1 para obtener un estimador insesgado de . Considere el estimador
ˆ n 1 máx(X , . . . , X )
2
1
n
n
Utilizando este estimador en los datos se obtiene la estimación (6/5)(4.2) 5.04. El hecho
de que (n 1)/n 1 implica que ˆ2 sobrestimará con algunas muestras y subestimará
otras. El valor medio de este estimador es
E( ˆ2) E
n1
n1
máx(X1, . . . , Xn)
E[máx(X1, . . . , Xn)]
n
n
n1
n
n
n1
Si ˆ2 se utiliza repetidamente en diferentes muestras para estimar , algunas estimaciones
serán demasiado grandes y otras demasiado pequeñas, pero a la larga no habrá ninguna tendencia simétrica a subestimar o sobreestimar .
■
Principio de estimación insesgada
Cuando se elige entre varios estimadores diferentes de , se elige uno insesgado.
De acuerdo con este principio, el estimador insesgado ˆ2 en el ejemplo 6.4 deberá ser
preferido al estimador sesgado ˆ1. Considérese ahora el problema de estimar 2.
PROPOSICIÓN
Sean X1, X2, . . . , Xn una muestra aleatoria de una distribución con media y varianza 2. Entonces el estimador
ˆ 2 S 2
(Xi X )2
n1
es un estimador insesgado de .
2
www.FreeLibros.me
c6_p227-253.qxd
3/12/08
4:12 AM
Page 233
6.1 Algunos conceptos generales de estimación puntual
233
Comprobación Para cualquier variable aleatoria Y, V(Y) E(Y 2) [E(Y)]2, por lo tanto
E(Y 2) V(Y) [E(Y)]2. Aplicando esto a
S2
1
n1
X 2i
( Xi)2
n
se obtiene
E(S 2)
1
n1
E(X 2i ) 1 E[( Xi)2]
1
n1
( 2 2) 1 {V( Xi) [E( Xi)]2}
1
1
1
n 2 n2 n 2 (n)2
n
n
n1
1
{n 2 2} 2
n1
n
n
(como se desea)
■
El estimador que utiliza el divisor n se expresa como (n 1)S2/n, por lo tanto
E
(n 1)S 2
n1
n1 2
E(S 2)
n
n
n
Este estimador es por consiguiente sesgado. El sesgo es (n 1) 2/n 2 2/n. Como
el sesgo es negativo, el estimador con divisor n tiende a subestimar 2 y por eso muchos
estadísticos prefieren el divisor n 1 (aunque cuando n es grande, el sesgo es pequeño y
hay poca diferencia entre los dos).
Aun cuando S2 es insesgado para 2, S es un estimador sesgado de (su sesgo
es pequeño a menos que n sea bastante pequeño). Sin embargo, existen otras buenas
razones para utilizar S como estimador, en especial cuando la distribución de la población
es normal. Éstas se volverán más aparentes cuando se discutan los intervalos de confianza
y la prueba de hipótesis en los siguientes capítulos.
En el ejemplo 6.2, se propusieron varios estimadores diferentes de la media de una
distribución normal. Si hubiera un estimador insesgado único para , el problema de estimación se resolvería utilizando dicho estimador. Desafortunadamente, éste no es el caso.
PROPOSICIÓN
Si X1, X2, . . . , Xn es una variable aleatoria tomada de una distribución con media ,
entonces X
es un estimador insesgado de . Si además la distribución es continua y
|
simétrica, entonces X y cualquier media recortada también son estimadores insesgados de .
El hecho de que X
sea insesgado es simplemente un replanteamiento de una de las reglas de
valor esperado: E(X
) con cada valor posible de (para distribuciones discretas y continuas). El insesgamiento de los demás estimadores es más difícil de verificar.
El siguiente ejemplo introduce otra situación en la cual existen varios estimadores
insesgados para un parámetro particular.
Ejemplo 6.5
En ciertas circunstancias contaminantes, orgánicos se adhieren con facilidad a las superficies de obleas y deterioran los dispositivos de fabricación de semiconductores. El artículo
“Ceramic Chemical Filter for Removal of Organic Contaminants” (J. of the Institute of
Environmental Sciences and Technology, 2003: 59-65) discutió una alternativa recientemente desarrollada de filtros de carbón convencionales para eliminar contaminación
molecular transportada por el aire en aplicaciones de cuartos limpios. Un aspecto de la
investigación del desempeño de filtros implicó estudiar cómo se relaciona la concentración
de contaminantes en aire con la concentración en las superficies de obleas después de una
www.FreeLibros.me
c6_p227-253.qxd
234
3/12/08
CAPÍTULO 6
4:12 AM
Page 234
Estimación puntual
exposición prolongada. Considere los siguientes datos representativos de x concentración
de DBP en aire y y concentración de DBP en la superficie de obleas luego de 4 horas de
exposición (ambas en g/m3, donde DBP ftalato de dibutilo).
Obs. i:
1
x: 0.8
y: 0.6
2
1.3
1.1
3
1.5
4.5
4
3.0
3.5
5
11.6
14.4
6
26.6
29.1
Los autores comentan que la “adhesión de DBP en la superficie de obleas fue aproximadamente proporcional a la concentración de DBP en aire”. La figura 6.2 muestra una gráfica
de y contra x, es decir, de los pares (x, y).
Ftalato de dibutilo en oblea
30
25
20
15
10
5
Ftalato de
dibutilo en aire
0
0
5
10
Figura 6.2
15
20
25
30
Gráfica de los datos de ftalato de dibutilo del ejemplo 6.5.
Si y fuera exactamente proporcional a x, se tendría y x con algún valor de , la cual expresa que los puntos (x, y) en la gráfica quedarían exactamente sobre una línea recta con pendiende , que pasa por (0, 0). Pero es sólo aproximadamente el caso. Así que a continuación se
supone que con cualquier x fija, la concentración de DBP en las obleas es una variable aleatoria Y con valor medio x. Es decir, se postula que el valor medio de Y está relacionado con x
por una línea que pasa por (0, 0) pero que el valor observado de Y en general se desviará de esta
línea (esto se conoce en la literatura estadística como “regresión a través del origen”).
Ahora se desea estimar el parámetro de la pendiente . Considere los siguientes tres
estimadores:
1
Yi
Yi #3: ˆ xiYi
#1: ˆ
#2: ˆ
2
n xi
x
x
i
i
Las estimaciones resultantes basadas en los datos dados son 1.3497, 1.1875 y 1.1222, respectivamente. Así que de manera definitiva la estimación depende de qué estimador se utilice. Si uno de estos tres estimadores fuera insesgado y los otros dos sesgados, habría un
buen motivo para utilizar el insesgado. Pero los tres son insesgados; el argumento se apoya
en el hecho de que cada uno es una función lineal de las Yi (aquí se supone que las xi son
fijas, no aleatorias):
E
n x n
1
Yi
1
i
E
Yi
x 1x
i
i
E
xi
E(Yi)
n
1
1
n
xi
xi
n
n
EYi
1
xi
xi
1
xi
xi
xiYi
1
1
1
2
ExiYi
xi
xi xi
2
2
2
2
xi
xi
xi
xi
www.FreeLibros.me
■
c6_p227-253.qxd
3/12/08
4:12 AM
Page 235
6.1 Algunos conceptos generales de estimación puntual
235
Tanto en el ejemplo anterior como en la situación que implica estimar una media de población normal, el principio de insesgamiento (prefiere un estimador insesgado a uno sesgado)
no puede ser invocado para seleccionar un estimador. Lo que ahora se requiere es un criterio para elegir entre estimadores insesgados.
Estimadores con varianza mínima
Supóngase que ˆ1 y ˆ2 son dos estimadores de insesgados. Entonces, aunque la distribución de cada estimador esté centrada en el valor verdadero de , las dispersiones de las distribuciones en torno al valor verdadero pueden ser diferentes.
Principio de estimación insesgada con varianza mínima
Entre todos los estimadores de insesgados, se selecciona el de varianza mínima. El
ˆ resultante se llama estimador insesgado con varianza mínima (EIVM) de .
La figura 6.3 ilustra las funciones de densidad de probabilidad de los dos estimadores
insesgados, donde ˆ1 tiene una varianza más pequeña que ˆ2. Entonces es más probable que ˆ1
produzca una estimación próxima al valor verdadero que ˆ2. El estimador insesgado con
varianza mínima es, en cierto sentido, el que tiene más probabilidades entre todos los estimadores insesgados de producir una estimación cercana al verdadero .
Función de densidad de probabilidad de ^ 1
Función de densidad de probabilidad de^ 2
Figura 6.3 Gráficas de las funciones de densidad de probabilidad de dos estimadores
insesgados diferentes.
En el ejemplo 6.5, supóngase que cada Yi está normalmente distribuida con media xi y varianza 2 (la suposición de varianza constante). Entonces se puede demostrar que el tercer
estimador ˆ xi Yi / x 2i no sólo tiene una varianza más pequeña que cualquiera de los
otros dos estimadores insesgados, sino que de hecho es el estimador insesgado con varianza mínima, tiene una varianza más pequeña que cualquier otro estimador insesgado de .
Ejemplo 6.6
En el ejemplo 6.4 se argumentó que cuando X1, . . . , Xn es una variable aleatoria tomada de
una distribución uniforme en el intervalo [0, ], el estimador
ˆ n 1 máx(X , . . . , X )
1
1
n
n
es insesgado para (previamente este estimador se denotó por ˆ2 ). Este no es el único estimador insesgado de . El valor esperado de una variable aleatoria uniformemente distribuida
es simplemente el punto medio del intervalo de densidad positiva, por lo tanto E(Xi) /2. Esto implica que E(X
) /2, a partir de la cual E(2X
) . Es decir, el estimador 2 2X
es insesgado para .
Si X está uniformemente distribuida en el intervalo A, B, en ese caso V(X) 2
(B A)2/12. Así pues, en esta situación, V(Xi) 2/12, V(X
) 2/n 2/(12n) y
2
ˆ
V( 2) V(2X
) 4V(X
) /(3n). Se pueden utilizar los resultados del ejercicio 32 para
www.FreeLibros.me
c6_p227-253.qxd
236
3/12/08
CAPÍTULO 6
4:12 AM
Page 236
Estimación puntual
demostrar que V(ˆ1) 2/[n(n 2)]. El estimador ˆ1 tiene una varianza más pequeña que
ˆ si 3n n(n 2), es decir, si 0 n2 n n(n 1). En tanto n 1, V( ˆ ) V( ˆ ), así
2
1
2
que ˆ1 es mejor estimador que ˆ2. Se pueden utilizar métodos más avanzados para demostrar que ˆ1 es el estimador insesgado con varianza mínima de , cualquier otro estimador
insesgado de tiene una varianza que excede 2/[n(n 2)].
■
Uno de los triunfos de la estadística matemática ha sido el desarrollo de una metodología para identificar el estimador insesgado con varianza mínima en una amplia variedad
de situaciones. El resultado más importante de este tipo para nuestros propósitos tiene que
ver con la estimación de la media de una distribución normal.
TEOREMA
Sean X1, . . . , Xn una muestra aleatoria tomada de una distribución normal con paráˆ
metros y . Entonces el estimador
X es el estimador insesgado con varianza
mínima para .
Siempre que exista la seguridad de que la población que se está muestreando es normal, el
resultado dice que
X debería usarse para estimar . Entonces, en el ejemplo 6.2 la estimación sería x 27.793.
En algunas situaciones, es posible obtener un estimador con sesgo pequeño que se
preferiría al mejor estimador insesgado. Esto se ilustra en la figura 6.4. Sin embargo, los
estimadores insesgados con varianza mínima a menudo son más fáciles de obtener que el
tipo de estimador sesgado cuya distribución se ilustra.
Función de densidad de probabilidad
de ^1, un estimador sesgado
Función de densidad de probabilidad
de ^2, el estimador insesgado con varianza mínima
Figura 6.4
Un estimador sesgado que es preferible al estimador insesgado con varianza mínima.
Algunas complicaciones
El último teorema no dice que al estimar la media de una población, se deberá utilizar el
estimador
X independientemente de la distribución que se está muestreando.
Ejemplo 6.7
Suponga que se desea estimar la conductividad térmica de un material. Con técnicas de
medición estándar, se obtendrá una muestra aleatoria X1, . . . , Xn de n mediciones de conductividad térmica. Suponga que la distribución de la población es un miembro de una de
las siguientes tres familias:
f(x)
f(x)
1
2
2
e(x) /(2
2
2
)
1
[1 (x )2]
{
1
f(x) 2c
0
www.FreeLibros.me
'x'
(6.1)
'x'
(6.2)
c x c
de lo contrario
(6.3)
c6_p227-253.qxd
3/12/08
4:12 AM
Page 237
6.1 Algunos conceptos generales de estimación puntual
237
La función de densidad de probabilidad (6.1) es la distribución normal, (6.2) se llama distribución de Cauchy y (6.3) es una distribución uniforme. Las tres distribuciones son simétricas
con respecto a y de hecho la distribución de Cauchy tiene forma de campana pero con
colas muchos más gruesas (más probabilidad hacia fuera) que la curva normal. La distribución uniforme no tiene colas. Los cuatro estimadores de considerados con anterioridad son
|
X
Xe (el promedio de las dos observaciones extremas) y
Xrec(10), una media recortada.
, X,
La muy importante moraleja en este caso es que el mejor estimador de depende crucialmente de qué distribución está siendo muestreada. En particular,
1. Si la muestra aleatoria proviene de una distribución normal, en ese caso
X es el mejor
de los cuatro estimadores, puesto que tiene una varianza mínima entre todos los estimadores insesgados.
2. Si la muestra aleatoria proviene de una distribución de Cauchy, entonces
Xy
Xe son esti|
madores terribles de , en tanto que X es bastante bueno (el estimador insesgado con
varianza mínima no es conocido); X
es malo porque es muy sensible a las observaciones subyacentes y las colas gruesas de la distribución de Cauchy hacen que sea improbable que aparezcan tales observaciones en cualquier muestra.
3. Si la distribución subyacente es uniforme, el mejor estimador es X
e; este estimador está
influido en gran medida por las observaciones subyacentes, pero la carencia de colas
hace que tales observaciones sean imposibles.
4. En ninguna de estas tres situaciones es mejor la media recortada pero funciona razonablemente bien en las tres. Es decir, X
rec(10) no sufre demasiado en comparación con el
mejor procedimiento en cualquiera de las tres situaciones.
■
Investigaciones recientes en estadística han establecido que cuando se estima un punto
de simetría de una distribución de probabilidad continua, una media recortada con proporción de recorte de 10 o 20% (de cada extremo de la muestra) produce estimaciones
razonablemente comportadas dentro de un rango muy amplio de posibles modelos. Por
esta razón, se dice que una media recortada con poco porcentaje de recorte es un estimador robusto.
En algunas situaciones, la selección no es entre dos estimadores diferentes construidos con la misma muestra, sino entre estimadores basados en dos experimentos distintos.
Ejemplo 6.8
Suponga que cierto tipo de componente tiene una distribución de vida útil exponencial con
parámetro de modo que la vida útil esperada es 1/. Se selecciona una muestra de n
de esos componentes y cada uno es puesto en operación. Si el experimento continúa hasta
que todas las n vidas útiles, X1, . . . , Xn han sido observadas, en ese caso
X es un estimador
insesgado de .
En algunos experimentos, sin embargo, los componentes se dejan en operación sólo
hasta el tiempo de la r-ésima falla, donde r n. Este procedimiento se conoce como censura. Sea Y1 el tiempo de la primera falla (la vida útil mínima entere los n componentes) y
Y2 el tiempo en el cual ocurre la segunda falla (la segunda vida útil más pequeña), y así sucesivamente. Como el experimento termina en el tiempo Yr, la vida útil acumulada al final es
r
Tr Yi (n r)Yr
i 1
A continuación se demuestra que ˆ Tr /r es un estimador insesgado de . Para hacerlo, se
requieren dos propiedades de variables exponenciales.
1. La propiedad de amnesia (véase la sección 4.4), dice que cualquier punto de tiempo, la
vida útil restante tiene la misma distribución exponencial que la vida útil original.
2. Si X1, . . . , Xk son independientes, cada exponencial con parámetro , entonces mín
(X1, . . . , Xk) es exponencial con parámetro k y su valor esperado es 1/(k).
www.FreeLibros.me
c6_p227-253.qxd
238
3/12/08
CAPÍTULO 6
4:13 AM
Page 238
Estimación puntual
Como los n componentes duran hasta Y1, n 1 duran una cantidad de tiempo adicional
Y2 Y1 adicional y n 2, duran una cantidad de tiempo Y3 Y2 adicional, y así sucesivamente, otra expresión para Tr es
Tr nY1 (n 1)(Y2 Y1) (n 2)(Y3 Y2)
(n r 1)(Yr Yr1)
Pero Y1 es el mínimo de n variables exponenciales, por tanto E(Y1) 1/(n). Asimismo,
Y2 Y1 es la más pequeña de las n 1 vidas útiles restantes, cada exponencial con
parámetro (según la propiedad de amnesia), así que E(Y2 Y1) 1/[(n 1)].
Continuando, E(Yi1 Yi) 1/[(n i)], así que
E(Tr ) nE(Y1) (n 1)E(Y2 Y1) (n r 1)E(Yr Yr 1)
n
1
1
1
(n 1)
(n r 1)
n
(n 1)
(n r 1)
r
Por consiguiente, E(Tr /r) (1/r)E(Tr ) (1/r) (r/) 1/ como se dijo.
Como un ejemplo, supónganse que se prueban 20 componentes y r 10. Entonces
si los primeros diez tiempos de falla son 11, 15, 29, 33, 35, 40, 47, 55, 58 y 72, la estimación de es
ˆ
11 15 72 (10)(72)
111.5
10
La ventaja del experimento con censura es que termina más rápido que el experimento sin censura. Sin embargo, se puede demostrar que V(Tr /r) 1/(2r), la cual es más grande que 1/(2n), la varianza de
X en el experimento sin censura.
■
Reporte de una estimación puntual: el error estándar
Además de reportar el valor de una estimación puntual, se debe dar alguna indicación de su
precisión. La medición usual de precisión es el error estándar del estimador usado.
DEFINICIÓN
Ejemplo 6.9
(continuación
del ejemplo
6.2)
Ejemplo 6.10
(continuación
del ejemplo
6.1)
El error estándar de un estimador ˆ es su desviación estándar ˆ
V
( ˆ). Si el error
estándar implica parámetros desconocidos cuyos valores pueden ser estimados, la
sustitución de estas estimaciones en ˆ da el error estándar estimado (desviación
estándar estimada) del estimador. El error estándar estimado puede ser denotado o por
ˆ ˆ (el ^ sobre recalca que ˆ está siendo estimada) o por sˆ.
Suponiendo que el voltaje de ruptura está normalmente distribuido, ˆ
X es la mejor estimación de . Si se sabe que el valor de es 1.5, el error estándar de X
es X /n
1.5/20 0.335. Si, como casi siempre es el caso, el valor de es desconocido, la estimación ˆ s 1.462 se sustituye en X para obtener el error estándar estimado ˆ X
sX s/n
1.462/2
0 0.327.
■
El error estándar de p̂ X/n es
p̂ V
(X
/n
)
Vn(X) nnpq pnq
2
2
Como p y q 1 p son desconocidas (¿de otro modo por qué estimar?), se sustituye p̂
x/n y q̂ 1 x/n en p̂ para obtener el error estándar estimado ˆ p̂ p̂
q̂/n
www.FreeLibros.me
c6_p227-253.qxd
3/12/08
4:13 AM
Page 239
6.1 Algunos conceptos generales de estimación puntual
239
(0.6)(0.4)/25 0.098. Alternativamente, como el valor más grande de pq se obtiene
cuando p q 0.5, un límite superior en el error estándar es 1/(
4
n
) 0.10.
■
Cuando la distribución del estimador puntual ˆ es normal de modo aproximado, lo que
a menudo será el caso cuando n es grande, en tal caso se puede estar confiado de manera razonable en que el valor verdadero de queda dentro de aproximadamente dos errores estándar
(desviaciones estándar) de ˆ. De este modo si una muestra de n 36 vidas útiles de componentes da ˆ x 28.50 y s 3.60, por consiguiente, s/n
0.60 dentro de dos errores estándar estimados de ˆ se transforma en el intervalo 28.50 ! (2)(0.60) (27.30, 29.70).
Si ˆ no es necesariamente normal en forma aproximada pero es insesgado, entonces
se puede demostrar que la estimación se desviará de hasta por cuatro errores estándar
cuando mucho 6% del tiempo. Se esperaría entonces que el valor verdadero quede dentro
de cuatro errores estándar de ˆ (y ésta es proposición muy conservadora, puesto que se aplica a cualquier ˆ insesgado). Resumiendo, el error estándar indica de forma aproximada a
qué distancia de ˆ se puede esperar que quede el valor verdadero de .
La forma del estimador de ˆ puede ser suficientemente complicado de modo que la
teoría estadística estándar no pueda ser aplicada para obtener una expresión para ˆ . Esto es
cierto, por ejemplo, en el caso , ˆ S, la desviación estándar del estadístico S, S, en
general no puede ser determinada. No hace mucho, se introdujo un método de computadora intensivo llamado bootstrap para abordar este problema. Supóngase que la función de
densidad de probabilidad de la población es f(x; ), un miembro de una familia paramétrica
particular y que los datos x1, x2, . . . , xn dan ˆ 21.7. Ahora se utiliza la computadora para
obtener “muestras bootstrap” tomadas de la función de densidad de probabilidad f(x; 21.7)
y por cada muestra se calcula una “estimación bootstrap” ˆ *:
Primera muestra “bootstrap”: x*1, x*2, . . . , x*n ; estimación ˆ *1
Segunda muestra “bootstrap”: x*1, x*2, . . . , x*n ; estimación ˆ *2
B-ésima muestra bootstrap: x*1, x*2, . . . , x*n ; estimación ˆ *B
A menudo se utiliza B 100 o 200. Ahora sea * ˆ *i /B, la media muestral de las estimaciones “bootstrap”. La estimación bootstrap del error de estándar de las ˆ ahora es simplemente la desviación estándar muestral de las ˆ *i :
Sˆ
B1 (ˆ**)
1
i
2
(En la literatura de bootstrap, a menudo se utiliza B en lugar de B 1; con valores típicos
de B, casi siempre hay poca diferencia entre las estimaciones resultantes.)
Ejemplo 6.11
Un modelo teórico sugiere que X, el tiempo para la ruptura de un fluido aislante entre electrodos a un voltaje particular, tiene f(x; ) ex, una distribución exponencial. Una muestra aleatoria de n 10 tiempos de ruptura (min) da los datos siguientes:
41.53 18.73 2.99 30.34 12.33 117.52 73.02 223.63 4.00 26.78
Como E(X) 1/, E(X
) 1/, una estimación razonable de es ˆ 1/x 1/55.087
0.018153. Se utilizaría entonces un programa de computadora para obtener B 100 muestras bootstrap, cada una de tamaño 10, provenientes de f(x; .018153). La primera muestra
fue 41.00, 109.70, 16.78, 6.31, 6.76, 5.62, 60.96, 78.81, 192.25, 27.61, con la cual
ˆ 1/54.58 0.01832. El promedio de 100 estimaciones bootstrap es
x*i 545.8 y *
1
www.FreeLibros.me
c6_p227-253.qxd
240
3/12/08
4:13 AM
Page 240
Estimación puntual
CAPÍTULO 6
* 0.02153 y la desviación estándar muestral de estas 100 estimaciones es sˆ 0.0091.
ˆ Un histograma de los 100 *
ˆ resultó un tanLa estimación bootstrap del error estándar de .
i
to positivamente asimétrico lo que sugiere que la distribución muestral de ˆ también tiene
esta propiedad.
■
En ocasiones un investigador desea estimar una característica poblacional sin suponer
que la distribución de la población pertenece a una familia paramétrica particular. Una instancia de esto ocurrió en el ejemplo 6.7, cuando una media 10% recortada fue propuesta
para estimar el centro de la distribución de la población simétrica. Los datos del ejemplo
6.2 dieron ˆ xrec(10) 27.838 pero ahora no hay ninguna f(x; ) supuesta, por consiguiente
¿cómo se puede obtener una muestra bootstrap? La respuesta es considerar la muestra como
que constituye la población (las n 20 observaciones en el ejemplo 6.2) y considerar B
muestras diferentes, cada una de tamaño n, con reemplazo de esta población. El libro de
Bradley Efron y Robert Tibshirani o el de John Rice incluidos en la bibliografía del capítulo proporcionan más información.
EJERCICIOS
Sección 6.1 (1-19)
1. Los datos adjuntos sobre resistencia a la flexión (MPa) de
vigas de concreto de un tipo se introdujeron en el ejemplo 1.2.
5.9
7.2
7.3
6.3
8.1
6.8
7.0
7.6
6.8
6.5
7.0
6.3
7.9
9.0
8.2
8.7
7.8
9.7
7.4
7.7
9.7
7.8
7.7
11.6
11.3
11.8
10.7
0.83 0.88 0.88 1.04 1.09 1.12 1.29 1.31
a. Calcule una estimación puntual del valor medio de resistencia de la población conceptual de todas las vigas
fabricadas de esta manera y diga qué estimador utilizó:
[Sugerencia: xi 219.8.]
b. Calcule una estimación puntual del valor de resistencia
que separa el 50% más débil de dichas vigas del 50%
más resistente y diga qué estimador se utilizó.
c. Calcule e interprete una estimación puntual de la desviación estándar de la población . ¿Qué estimador utilizó? [Sugerencia: x 2i 1860.94.]
d. Calcule una estimación puntual de la proporción de las
vigas cuya resistencia a la flexión exceda de 10 MPa.
[Sugerencia: Considere una observación como “éxito” si
excede de 10.]
e. Calcule una estimación puntual del coeficiente de variación de la población / y diga qué estimador utilizó.
2. Una muestra de 20 estudiantes que recientemente tomaron un
curso de estadística elemental arrojó la siguiente información
sobre la marca de calculadora que poseían. (T Texas
Instruments, H Hewlett Packard, C Casio, S Sharp):
T T H
T
C
H
S
H C T T T H
T
S
T
C T T
S
ción de estudiantes que no poseen una calculadora con
graficación TI.
3. Considere la siguiente muestra de observaciones sobre
espesor de recubrimiento de pintura de baja viscosidad
(“Achieving a Target Value for a Manufacturing Process: A
Case Study”, J. of Quality Technology, 1992: 22-26):
a. Estime la proporción verdadera de los estudiantes que
poseen una calculadora Texas Instruments.
b. De los 10 estudiantes que poseían una calculadora TI, 4
tenían calculadoras con graficación. Estime la propor-
1.48 1.49 1.59 1.62 1.65 1.71 1.76 1.83
Suponga que la distribución del espesor de recubrimiento es
normal (una gráfica de probabilidad normal soporta fuertemente esta suposición).
a. Calcule la estimación puntual de la mediana del espesor
de recubrimiento y diga qué estimador utilizó.
b. Calcule una estimación puntual de la mediana de la distribución del espesor de recubrimiento y diga qué estimador utilizó.
c. Calcule la estimación puntual del valor que separa el
10% más grande de todos los valores de la distribución
del espesor del 90% restante y diga qué estimador utilizó. [Sugerencia: Exprese lo que está tratando de estimar
en función de y .]
d. Estime P(X 1.5), es decir, la proporción de todos los
valores de espesor menores que 1.5 [Sugerencia: Si
conociera los valores de y podría calcular esta probabilidad. Estos valores no están disponibles, pero pueden ser estimados.]
e. ¿Cuál es el error estándar estimado del estimador que
utilizó en el inciso b)?
4. El artículo del cual se extrajeron los datos en el ejercicio 1
también dio las observaciones de resistencias adjuntas de
cilindros:
6.1
5.8
7.8
7.1
7.2
9.2
6.6
7.8
8.1
7.4
8.5
8.9
9.8
9.7 14.1
www.FreeLibros.me
8.3
7.0
8.3
12.6 11.2
c6_p227-253.qxd
3/12/08
4:13 AM
Page 241
6.1 Algunos conceptos generales de estimación puntual
Antes de obtener los datos, denote las resistencias de vigas
mediante X1, . . . , Xm y Y1, . . . , Yn las resistencias de cilindros.
Suponga que las Xi constituyen una muestra aleatoria de
una distribución con media 1 y desviación estándar 1 y
que las Yi forman una muestra aleatoria (independiente de
las Xi) de otra distribución con media 2 y desviación estándar 2.
a. Use las reglas de valor esperado para demostrar que
X
Y es un estimador insesgado de 1 2. Calcule la
estimación con los datos dados.
b. Use las reglas de varianza del capítulo 5 para obtener
una expresión para la varianza y desviación estándar
(error estándar) del estimador del inciso a) y luego calcule
el error estándar estimado.
c. Calcule una estimación puntual de la razón 1/2 de las
dos desviaciones estándar.
d. Suponga que se seleccionan al azar una sola viga y un
solo cilindro. Calcule una estimación puntual de la varianza de la diferencia X Y entre la resistencia de las
vigas y la resistencia de los cilindros.
5. Como ejemplo de una situación en la que varios estadísticos diferentes podrían ser razonablemente utilizados para
calcular una estimación puntual, considere una población
de N facturas. Asociado con cada factura se encuentra su
“valor en libros”, la cantidad anotada de dicha factura. Sea
T el valor en libros total, una cantidad conocida. Algunos de
estos valores en libros son erróneos. Se realizará una auditoría seleccionando al azar n facturas y determinando el valor
auditado (correcto) para cada una. Suponga que la muestra da
los siguientes resultados (en dólares).
Factura
Valor en libros
Valor auditado
Error
1
2
3
4
5
300
300
0
720
520
200
526
526
0
200
200
0
127
157
30
Sea
Y valor en libros medio muestral
X
valor auditado medio muestral
241
127.96 210.07 203.24 108.91 178.21
285.37 100.85
200.19
89.59 185.36 126.94
66.24 247.11 299.87 109.64
125.86 114.79 109.11 330.33
85.54
117.64 302.74 280.55 145.11
95.36
204.91 311.13 150.58 262.09 477.08
94.33
Una gráfica de probabilidad apropiada soporta el uso de la
distribución lognormal (véase la sección 4.5) como modelo
razonable de flujo de corriente de agua.
a. Calcule los parámetros de la distribución [Sugerencia:
Recuerde que X tiene una distribución lognormal con
parámetros y 2 si ln(X) está normalmente distribuida
con media y varianza 2.]
b. Use las estimaciones del inciso a) para calcular una estimación del valor esperado del flujo de corriente de agua
[Sugerencia: ¿Cuál es E(X)?]
7. a. Se selecciona una muestra de 10 casas en un área particular, cada una de las cuales se calienta con gas natural y se
determina la cantidad de gas (termias) utilizada por cada
casa durante el mes de enero. Las observaciones resultantes son 103, 156, 118, 89, 125, 147, 122, 109, 138, 99. Sea
el consumo de gas promedio durante enero de todas las
casas del área. Calcule una estimación puntual de .
b. Suponga que hay 10 000 casas en esta área que utilizan
gas natural para calefacción. Sea la cantidad total de gas
consumido por todas estas casas durante enero. Calcule
con los datos del inciso a). ¿Qué estimador utilizó para
calcular su estimación?
c. Use los datos del inciso a) para estimar p, la proporción
de todas las casas que usaron por lo menos 100 termias.
d. Proporcione una estimación puntual de la mediana de la
población usada (el valor intermedio en la población de
todas las casas) basada en la muestra del inciso a). ¿Qué
estimador utilizó?
8. En una muestra aleatoria de 80 componentes de un tipo, se
encontraron 12 defectuosos.
a. Dé una estimación puntual de la proporción de todos los
componentes que no están defectuosos.
b. Se tiene que construir un sistema seleccionando al azar
dos de estos componentes y conectándolos en serie,
como se muestra a continuación.
D
error medio muestral
Proponga tres estadísticos diferentes para estimar el valor
total (correcto) auditado: uno que implique exactamente N y
X
D y el último que implique T
, otro que implique T, N y
yX
. Si N 5000 y T 1761300, calcule las tres estima/Y
ciones puntuales correspondientes. (El artículo “Statistical
Models and Analysis in Auditing”, Statistical Science, 1989:
2-33, discute propiedades de estos tres estimadores.)
6. Considere las observaciones adjuntas sobre el flujo de una
corriente de agua (miles de acres-pies) registradas en una estación en Colorado durante el periodo del 1 de abril al 31 de
agosto durante 31 años (tomadas de un artículo que apareció
en el volumen 1974 de Water Resources Research).
La conexión en serie implica que el sistema funcionará siempre y cuando ningún componente esté defectuoso (es decir,
ambos componentes funcionan apropiadamente). Estime la
proporción de todos los sistemas que funcionan de manera
apropiada. [Sugerencia: Si p denota la probabilidad de que el
componente funcione apropiadamente, ¿cómo puede ser
expresada P(el sistema funciona) en función de p?]
9. Se examina cada uno de 150 artículos recién fabricados y se
anota el número de rayones por artículo (se supone que los
artículos están libres de rayones) y se obtienen los siguientes datos:
www.FreeLibros.me
c6_p227-253.qxd
242
3/12/08
CAPÍTULO 6
4:13 AM
Page 242
Estimación puntual
Número de
rayones
por artículo
0
1
2
3
4
5
6
7
Frecuencia
observada
18
37
42
30
13
7
2
1
Sea X el número de rayones en un artículo seleccionado
al azar y suponga que X tiene una distribución de Poisson
con parámetro .
a. Determine un estimador insesgado de y calcule la estimación de los datos. [Sugerencia: E(X) para una
distribución Poisson de X, por lo tanto E(X
) ?]
b. ¿Cuál es la desviación estándar (error estándar) de su
estimador? Calcule el error estándar estimado.
[Sugerencia: X2 con distribución de Poisson de X.]
10. Con una larga varilla de longitud , va a trazar una curva
cuadrada en la cual la longitud de cada lado es . Por consiguiente el área de la curva será 2. Sin embargo, no conoce el valor de así que decide hacer n mediciones
independientes X1, X2, . . . , Xn de la longitud. Suponga que
cada Xi tiene una media (mediciones insesgadas) y
varianza 2.
2
a. Demuestre que X
no es un estimador insesgado de 2.
[Sugerencia: Con cualquier variable aleatoria Y, E(Y 2)
V(Y ) [E(Y)]2. Aplique ésta con Y
X.]
2
b. ¿Con qué valor de k es el estimador X
kS 2 insesgado
2
2
para 2? [Sugerencia: Calcule E(X
kS ).]
11. De n1 fumadores seleccionados al azar, X1 fuman cigarrillos
con filtro, mientras que de n2 fumadoras seleccionadas al
azar, X2 fuman cigarrillos con filtro. Sean p1 y p2 las probabilidades de que un varón y una mujer seleccionados al
azar, fumen, respectivamente, cigarrillos con filtro.
a. Demuestre que (X1/n1) (X2/n2) es un estimador insesgado de p1 p2. [Sugerencia: E(Xi) ni pi con i 1, 2.]
b. ¿Cuál es el error estándar del estimador en el inciso a)?
c. ¿Cómo utilizaría los valores observados x1 y x2 para estimar el error estándar de su estimador?
d. Si n1 n2 200, x1 127 y x2 176, use el estimador
del inciso a) para obtener una estimación de p1 p2.
e. Use el resultado del inciso c) y los datos del inciso d)
para estimar el error estándar del estimador.
12. Suponga que un tipo de fertilizante rinde 1 por acre con
varianza 2, mientras que el rendimiento esperado de un
segundo tipo de fertilizante es 2, con la misma varianza 2.
Sean S 21 y S 22 las varianzas muestrales de rendimientos basadas en tamaños muestrales n1 y n2, respectivamente, de los
dos fertilizantes. Demuestre que el estimador combinado es
ˆ 2
(n1 1)S 21 (n2 1)S 22
n1 n2 2
es un estimador insesgado de 2.
13. Considere una muestra aleatoria de X1, . . . , Xn de la función de densidad de probabilidad
f (x; ) 0.5(1 x)
1x1
donde 1 1 (esta distribución se presenta en la física
de partículas. Demuestre que ˆ 3X
es un estimador insesgado de . [Sugerencia: Primero determine E(X) E(X
).]
14. Una muestra de n aviones de combate Pandemonium capturados tienen los números de serie x1, x2, x3, . . . , xn. La
CIA sabe que los aviones fueron numerados consecutivamente en la fábrica comenzando con y terminando con , por lo
que el número total de aviones fabricados es 1
(p. ej., si 17 y 29, entonces 29 17 1 13
aviones con números de serie 17, 18, 19, . . . , 28, 29 fueron
fabricados). Sin embargo, la CIA no conoce los valores de
y . Un estadístico de la CIA sugiere utilizar el estimador
máx(Xi) mín(Xi) 1 para estimar el número total de
aviones fabricados.
a. Si n 5, x1 237, x2 375, x3 202, x4 525 y
x5 418, ¿cuál es la estimación correspondiente?
b. ¿En qué condiciones de la muestra será el valor de la estimación exactamente igual al número total verdadero de
aviones? ¿Alguna vez será más grande la estimación que
el total verdadero? ¿Piensa que el estimador es insesgado
para estimar 1? Explique en una o dos oraciones.
15. Si X1, X2, . . . , Xn representan una muestra aleatoria tomada de una distribución de Rayleigh con función de densidad
de probabilidad
x
2
f (x; ) e x /(2 )
x0
a. Se puede demostrar que E(X2) 2 . Use este hecho
para construir un estimador insesgado de basado en
X 2i (y use reglas de valor esperado para demostrar que
es insesgado).
b. Calcule a partir de las siguientes n 10 observaciones de esfuerzo vibratorio de un aspa de turbina en condiciones específicas:
16.88 10.23 4.59 6.66 13.68
14.23 19.87 9.40 6.51 10.95
16. Suponga que el crecimiento promedio verdadero de un tipo
de planta durante un periodo de un año es idéntico al de un
segundo tipo, aunque la varianza del crecimiento del primer
tipo es 2, en tanto que para el segundo tipo, la varianza es
42. Sean X1, . . . , Xm, m observaciones de crecimiento independientes del primer tipo [por consiguiente E(Xi) , V(Xi)
2] y sean Y1, . . . , Yn, n observaciones de crecimiento
independientes del segundo tipo [E(Yi) , V(Yi) 42].
a. Demuestre que con cualquier entre 0 y 1, el estimador
ˆ X
(1 )Y
es insesgado para .
ˆ y luego determine el valor de
b. Con m y n fijas, calcule V()
ˆ [Sugerencia: Derive V()
ˆ
que reduzca al mínimo V().
con respecto a .]
17. En el capítulo tres, se definió una variable aleatoria binomial negativa como el número de fallas que ocurren antes
del r-ésimo éxito en una secuencia de ensayos con éxitos y
fallas independientes e idénticos. La función masa de probabilidad (fmp) de X es
nb(x; r, p)
xr1 r
p (1 p)x x 0, 1, 2, . . .
x
0
de lo contrario
{
www.FreeLibros.me
c6_p227-253.qxd
3/12/08
4:13 AM
Page 243
6.2 Métodos de estimación puntual
a. Suponga que r
2. Demuestre que
p̂ (r 1)/(X r 1)
es un estimador insesgado de p. [Sugerencia: Escriba
E( p̂ ) y elimine x r 1 dentro de la suma.]
b. Un reportero desea entrevistar a cinco individuos que
apoyan a un candidato y comienza preguntándoles si (S)
o no (F) apoyan al candidato. Si la secuencia de respuestas es SFFSFFFSSS estiman p la proporción verdadera que apoya al candidato.
18. Sean X1, X2, . . . , Xn una muestra aleatoria de una función
de densidad de probabilidad f(x) simétrica con respecto a
|
, de modo que X sea un estimador insesgado de . Si n es
|
grande, se puede demostrar que V(X) 1/(4n[ f()]2).
|
a. Compara V( X) con V(X
X
) cuando la distribución subyacente es normal.
b. Cuando la función de densidad de probabilidad subyacente es Cauchy (véase el ejemplo 6.7), V(X
) por lo
|
tanto X
es un estimador terrible. ¿Cuál es V( X) en este
caso cuando n es grande?
19. Una investigadora desea estimar la proporción de estudiantes en una universidad que han violado el código de honor.
Habiendo obtenido una muestra aleatoria de n estudiantes,
se da cuenta que si a cada uno le pregunta “¿Has violado el
código de honor?” probablemente recibirá algunas respues-
243
tas faltas de veracidad. Considere el siguiente esquema,
conocido de técnica de respuesta aleatorizada. La investigadora forma un mazo de 100 cartas de las cuales 50 son de
tipo I y 50 de tipo II.
Tipo I: ¿Has violado el código de honor (sí o no)?
Tipo II: ¿Es el último dígito de su número telefónico un 0,
1 o 2 (sí o no)?
A cada estudiante en la muestra aleatoria se le pide que
baraje el mazo, que saque una carta y que responda la pregunta con sinceridad. A causa de la pregunta irrelevante en
las cartas de tipo II, una respuesta sí ya no estigmatiza a
quien contesta, así que se supone que éste es sincero. Sea p
la proporción de violadores del código de honor (es decir, la
probabilidad de que un estudiante seleccionado al azar sea
un violador) y sea P(respuesta sí). Entonces y p están
relacionados por 0.5p (0.5)(0.3).
a. Sea Y el número de respuestas sí, por consiguiente Y
Bin(n, ). Por tanto Y/n es un estimador insesgado de .
Obtenga un estimador de p basado en Y. Si n 80 y
y 20, ¿cuál es su estimación? [Sugerencia: Resuelva
0.5p 1.5 para p y luego sustituya Y/n en lugar de .]
b. Use el hecho de que E(Y/n) para demostrar que su
estimador p̂ es insesgado.
c. Si hubiera 70 cartas de tipo I y 30 de tipo II, ¿cuál sería
su estimador para p?
6.2 Métodos de estimación puntual
La definición de insesgamiento no indica en general cómo se pueden obtener los estimadores
insesgados. A continuación se discuten dos métodos “constructivos” para obtener estimadores puntuales: el método de momentos y el método de máxima verosimilitud. Por constructivo se quiere dar a entender que la definición general de cada tipo de estimador sugiere
explícitamente cómo obtener el estimador en cualquier problema específico. Aun cuando se
prefieren los estimadores de máxima verosimilitud a los de momento debido a ciertas propiedades de eficiencia, a menudo requieren significativamente más cálculo que los estimadores
de momento. En ocasiones es el caso que estos métodos dan estimadores insesgados.
El método de momentos
La idea básica de este método es poder igualar ciertas características muestrales, tales como
la media, a los valores esperados de la población correspondiente. Luego resolviendo estas
ecuaciones con valores de parámetros conocidos se obtienen los estimadores.
DEFINICIÓN
Si X1, . . . , Xn constituyen una muestra aleatoria proveniente de una función masa de
probabilidad o de una función de densidad de probabilidad f(x). Con k 1, 2,
3, . . . el k-ésimo momento de la población o el k-ésimo momento de la distribución f(x), es E(Xk). El k-ésimo momento muestral es (1/n)ni1X ki.
Por consiguiente el primer momento de la población es E(X) y el primer momento
muestral es Xi /n
X. Los segundos momentos de la población y muestral son E(X2) y
2
X i /n, respectivamente. Los momentos de la población serán funciones de cualquier parámetro desconocido 1, 2, . . .
www.FreeLibros.me
c6_p227-253.qxd
244
3/12/08
CAPÍTULO 6
4:13 AM
Page 244
Estimación puntual
DEFINICIÓN
Si X1, X2, . . . , Xn son una muestra aleatoria de una distribución con función masa de
probabilidad o función de densidad de probabilidad f(x; 1, . . . , m), donde 1, . . . , m
son parámetros cuyos valores son desconocidos. Entonces los estimadores de momento ˆ1, . . . , ˆm se obtienen igualando los primeros m momentos muestrales con los primeros m momentos de la población correspondientes y resolviendo para 1, . . . , m.
Si, por ejemplo, m 2, E(X) y E(X2) serán funciones de 1 y 2. Con E(X) (1/n) Xi
(
X) y E(X 2) (1/n) X 2i se obtienen dos ecuaciones en 1 y 2. La solución define entonces los estimadores. Para estimar una media poblacional, el método da
X, por lo
tanto el estimador es la media muestral.
Ejemplo 6.12
Si X1, X2, . . . , Xn representan una muestra aleatoria de tiempos de servicio de n clientes en
una instalación, donde la distribución subyacente se supone exponencial con el parámetro .
Como sólo hay un parámetro que tiene que ser estimado, el estimador se obtiene igualando E(X) a X
. Como E(X) 1/ con una distribución exponencial, ésta da 1/ X
o
1/X
■
. El estimador de momento de es entonces ˆ 1/X
.
Ejemplo 6.13
Sean X1, . . . , Xn una muestra aleatoria de una distribución gama con parámetros y . De
acuerdo con la sección 4.4, E(X) y E(X 2) 2( 2)/() 2( 1). Los estimadores de momento y se obtienen resolviendo
X
1
n
X 2i ( 1)2
Como ( 1)2 22 2 y la primera ecuación implica 22
X 2, la segunda
ecuación se vuelve
1
n
2
2
X 2i X
Ahora si se divide cada miembro de esta segunda ecuación entre el miembro correspondiente de la primera ecuación y se sustituye otra vez se obtienen los estimadores
2
X
2
ˆ (1/n) X 2 X
i
ˆ
(1/n) X 2i X
X
2
Para ilustrar, los datos de tiempo de sobrevivencia mencionados en el ejemplo 4.24 son
152
115
125
40
109
94
88
137
128 123 136
101
152
77
160
165
62 153
83
69
con x 113.5 y (1/20)x2i 14 087.8. Los estimadores son
ˆ
(113.5)2
10.7
14 087.8 (113.5)2
ˆ
14 087.8 (113.5)2
10.6
113.5
Estas estimaciones de y difieren de los valores sugeridos por Gross y Clark porque ellos
utilizaron una técnica de estimación diferente.
■
Ejemplo 6.14
Sean X1, . . . , Xn una muestra aleatoria de una distribución binomial negativa generalizada
con parámetros r y p (sección 3.5). Como E(X) r(1 p)/p y V(X) r(1 p)/p2,
www.FreeLibros.me
c6_p227-253.qxd
3/12/08
4:13 AM
Page 245
6.2 Métodos de estimación puntual
245
E(X 2) V(X) [E(X)]2 r(1 p)(r rp 1)/p2. Si se iguala E(X) a
X y E(X2) a
2
(1/n)X i a la larga se obtiene
p̂
X
2
(1/n) X 2i X
2
r̂
X
2
2
(1/n) X i X
X
Como ilustración, Reep, Pollard y Benjamin (“Skill and Chance in Ball Games”, J.
Royal Stat. Soc., 1971: 623-629) consideran la distribución binomial negativa como modelo
del número de goles por juego anotados por los equipos de la Liga Nacional de Jockey.
Los datos de 1966-1967 son los siguientes (420 juegos):
Goles
0
1
2
3
4
5
6
7
8
9
10
Frecuencia
29
71
82
89
65
45
24
7
4
1
3
Entonces,
x xi /420 [(0)(29) (1)(71) (10)(3)]/420 2.98
y
x 2i /420 [(0)2(29) (1)2(71) (10)2(3)]/420 12.40
Por consiguiente,
p̂
2.98
0.85
12.40 (2.98)2
r̂
(2.98)2
16.5
12.40 (2.98)2 2.98
Aunque r por definición debe ser positivo, el denominador de r̂ podría ser negativo, lo que
indica que la distribución binomial negativa no es apropiada (o que el estimador de momento es defectuoso).
■
Estimación de máxima verosimilitud
El método de máxima probabilidad lo introdujo por primera vez R. A. Fisher, genetista y
estadístico en la década de 1920. La mayoría de los estadísticos recomiendan este método,
por lo menos cuando el tamaño de muestra es grande, puesto que los estimadores resultantes
tienen ciertas propiedades de eficiencia deseables (véase la proposición en la página 249).
Ejemplo 6.15
Se obtuvo una muestra de diez cascos de ciclista nuevos fabricados por una compañía. Al
probarlos, se encontró que el primero, el tercero y el décimo estaban agrietados, en tanto que
los demás no. Sea p P(casco agrietado) y defina X1, . . . , X10 como Xi 1 si el i-ésimo
casco está agrietado y cero de lo contrario. En ese caso las xi son 1, 0, 1, 0, 0, 0, 0, 0, 0, 1,
así que la función masa de probabilidad conjunta de la muestra es
f(x1, x2, . . . , x10; p) p(1 p)p p p3(1 p)7
(6.4)
Ahora se hace la pregunta, “¿Con qué valor de p es más probable que la muestra observada
haya ocurrido?” Es decir, se desea encontrar el valor de p que incrementa al máximo la función masa de probabilidad (6.4) o, en forma equivalente, que incrementa al máximo el logaritmo natural de (6.4).* Como
ln[ f(x1, . . . , x10; p)] 3 ln(p) 7 ln(1 p)
(6.5)
* Como ln[g(x)] es una función monotónica de g(x), determinar x para incrementar al máximo ln[g(x)] equivale a
incrementar al máximo g(x). En estadística, si se toma el logaritmo con frecuencia, un producto cambia a una
suma, con la cual es más fácil trabajar.
www.FreeLibros.me
c6_p227-253.qxd
246
3/12/08
CAPÍTULO 6
4:13 AM
Page 246
Estimación puntual
la cual es una función derivable de p, igualando la derivada de (6.5) a cero se obtiene el valor
maximizante†
3
d
7
3
x
ln[ f(x1, . . . , x10; p)]
0p
p
dp
1p
10
n
donde x es el número de éxitos observados (cascos agrietados). La estimación de p ahora
3
es p̂ 10 . Se llama estimación de máxima verosimilitud porque para x1, . . . , x10 establecido, es el valor del parámetro que maximiza la probabilidad (función masa de probabilidad conjunta) de la muestra observada.
Obsérvese que si sólo se hubiera dicho que entre los diez cascos había tres agrietados,
la ecuación (6.4) sería reemplazada por la función masa de probabilidad binomial
3
(103 )p3(1 p)7, la cual también se incrementa al máximo con p̂ 10 .
■
DEFINICIÓN
Que X1, X2, . . . , Xn tengan una función masa de probabilidad o una función de densidad de probabilidad
f(x1, x2, . . . , xn;
1,
...,
(6.6)
m)
donde los parámetros 1, . . . , m tienen valores desconocidos. Cuando x1, . . . , xn son
los valores muestrales observados y (6.6) se considera como una función de 1, . . . , m,
se llama función de verosimilitud. Las estimaciones de máxima verosimilitud (emv)
ˆ , . . . , ˆ son aquellos valores de las que incrementan al máximo la función de pro1
m
i
babilidad, de modo que
f (x1, . . . , xn; ˆ1, . . . , ˆm)
f(x1, . . . , xn;
1,
...,
m)
con todos los
1,
...,
m
Cuando se sustituyen las Xi en lugar de las xi, se obtienen los estimadores de máxima verosimilitud.
La función de verosimilitud dice qué tan probable es que la muestra observada sea una
función de los posibles valores de parámetro. Al incrementarse al máximo la probabilidad
se obtienen los valores de parámetro con los que la muestra observada es más probable que
haya sido generada, es decir, los valores de parámetro que “más concuerdan” con los datos
observados.
Ejemplo 6.16
Suponga que X1, X2, . . . , Xn es una muestra aleatoria de una distribución exponencial con
parámetro . Debido a la independencia, la función de verosimilitud es un producto de las
funciones de densidad de probabilidad individuales:
f(x1, . . . , xn; ) (ex1) (exn) nexi
El ln(verosimilitud) es
ln[ f(x1, . . . , xn; )] n ln() xi
Si se iguala (d/d)[ln(verosimilitud)] a cero se obtiene n/ xi 0, o n/xi 1/x.
Por consiguiente el estimador de máxima verosimilitud es ˆ 1/X
; es idéntico al método de
estimador de momentos [pero no es un estimador insesgado, puesto que E(1/X
) 1/E(X
)]. ■
†
Esta conclusión requiere que se verifique la segunda derivada, pero se omiten los detalles.
www.FreeLibros.me
c6_p227-253.qxd
3/12/08
4:13 AM
Page 247
6.2 Métodos de estimación puntual
Ejemplo 6.17
247
Sean X1, . . . , Xn una muestra aleatoria de una distribución normal. La función de probabilidad es
f (x1, . . . , xn; , 2)
1
2/(2 2)
e(x1)
2
2
2
1
n/2
1
2
2
2/(2 2)
e(xn)
2/(2 2)
e(xi)
2
por consiguiente
ln[ f(x1, . . . , xn; , 2)]
n
1
ln(2 2)
2
2 2
(xi )2
Para determinar los valores maximizantes de y 2, se deben tomar las derivadas parciales
de ln( f ) con respecto a y 2, igualarlas a cero y resolver las dos ecuaciones resultantes.
Omitiendo los detalles, los estimadores de máxima probabilidad resultantes son
ˆ X
ˆ 2
)2
(Xi X
n
El estimador de máxima verosimilitud de no es el estimador insesgado, por consiguiente dos principios diferentes de estimación (insesgamiento y máxima verosimilitud) dan dos
estimadores diferentes.
■
2
Ejemplo 6.18
En el capítulo 3, se analizó el uso de la distribución de Poisson para modelar el número de
“eventos” que ocurren en una región bidimensional. Suponga que cuando el área de la
región R que se está muestreando es a(R), el número X de eventos que ocurren en R tiene
una distribución de Poisson con parámetro a(R) (donde es el número esperado de eventos por unidad de área) y que las regiones no traslapantes dan X independientes.
Suponga que un ecólogo selecciona n regiones no traslapantes R1, . . . , Rn y cuenta el
número de plantas de una especie en cada región. La función masa de probabilidad conjunta es entonces
p(x1, . . . , xn; )
[ a(R1)]x1ea(R1 )
[ a(Rn)]xnea(Rn)
x1!
xn!
[a(R1)]x1 [a(Rn)]xn xi ea(Ri )
x1! xn!
el ln(verosimilitud) es
ln[p(x1, . . . , xn; )] xi ln[a(Ri)] ln() xi a(Ri) ln(xi!)
Con d/d ln(p) e igualándola a cero da
xi
a(Ri) 0
por consiguiente
xi
a(Ri)
El estimador de máxima verosimilitud es entonces ˆ Xi /a(Ri). Ésta es razonablemente intituitiva porque es la densidad verdadera (plantas por unidad de área), mientras que ˆ
es la densidad muestral puesto que a(Ri) es tan sólo el área total muestreada. Como
E(Xi) a(Ri), el estimador es insesgado.
En ocasiones se utiliza un procedimiento de muestreo alternativo. En lugar de fijar las
regiones que van a ser muestreadas, el ecólogo seleccionará n puntos en toda la región de
www.FreeLibros.me
c6_p227-253.qxd
248
3/12/08
CAPÍTULO 6
4:13 AM
Page 248
Estimación puntual
interés y sea yi la distancia del i-ésimo punto a la planta más cercana. La función de distribución acumulativa de Y distancia a la planta más cercana es
ninguna planta en
FY (y) P(Y y) 1 P(Y y) 1 P un círculo de radio y
1
y2
(y2)0
2
1 ey
0!
e
Al tomar la derivada de FY (y) con respecto a y proporciona
fY (y; )
{
2yey
0
2
y 0
de lo contrario
Si ahora se forma la probabilidad fY (y1; ) fY (yn; ), derive ln(verosimilitud), y así
sucesivamente, el estimador de máxima verosimilitud resultante es
ˆ
n
número de plantas observadas
área total muestreada
Y 2i
la que también es una densidad muestral. Se puede demostrar que un ambiente ralo (pequeño ), el método de distancia es en cierto sentido mejor, en tanto que en un ambiente denso, el primer método de muestreo es mejor.
■
Ejemplo 6.19
Sean X1, . . . , Xn una muestra aleatoria de una función de densidad de probabilidad Weibull
x 1 e(x/)
f(x; , )
0
{
x
0
de lo contrario
Si se escribe la verosimilitud y el ln(verosimilitud) y luego con (,/,)[ln( f )] 0 y
(,/,)[ln(f)] 0 se obtienen las ecuaciones
x i ln (xi) ln(xi)
n
x i
1
x i
n
1/
Estas dos ecuaciones no pueden ser resueltas explícitamente para obtener fórmulas generales
ˆ En su lugar, por cada muestra x , . . . , x ,
de los estimadores de máxima verosimilitud ˆ y .
1
n
las ecuaciones deben ser resueltas con un procedimiento numérico iterativo. Incluso los estimadores de momento de y son un tanto complicados (véase el ejercicio 21).
■
Estimación de funciones de parámetros
En el ejemplo 6.17, se obtuvo el estimador de máxima verosimilitud de 2 cuando la distribución subyacente es normal. El estimador de máxima verosimilitud de
2, como
el de muchos otros estimadores de máxima verosimilitud, es fácil de derivar con la siguiente proposición.
PROPOSICIÓN
El principio de invarianza
Sean ˆ1, ˆ2, . . . , ˆm los estimadores de máxima verosimilitud de los parámetros
1, 2, . . . , m. Entonces el estimador de máxima verosimilitud de cualquier función
h( 1, 2, . . . , m) de estos parámetros es la función h( ˆ1, ˆ2, . . . , ˆm) de los estimadores de máxima verosimilitud.
www.FreeLibros.me
c6_p227-253.qxd
3/12/08
4:13 AM
Page 249
6.2 Métodos de estimación puntual
Ejemplo 6.20
(continuación
del ejemplo
6.17)
249
En el caso normal, los estimadores de máxima verosimilitud de y 2 son ˆ
X y ˆ 2
2
(Xi
X) /n. Para obtener el estimador de máxima verosimilitud de la función h(, 2)
2
, sustituya los estimadores de máxima verosimilitud en la función.
ˆ ˆ
2
1n (X X)
i
2
1/2
el estimador de máxima verosimilitud de no es la desviación estándar muestral S y se
aproximan bastante cuando n es bastante pequeño.
■
Ejemplo 6.21
(continuación
del ejemplo
6.19)
El valor medio de una variable aleatoria X que tiene una distribución Weibull es
(1 1/)
ˆ
El estimador de máxima verosimilitud de es por consiguiente ˆ (1
1/ˆ), donde ˆ
ˆ
y son los estimadores de máxima verosimilitud de y . En particular
X no es el estimador de máxima verosimilitud de , aunque es un estimador insesgado. Por lo menos con
n grande, ˆ es un mejor estimador que
X
■
Comportamiento con muestra grande del estimador
de máxima verosimilitud
Aunque el principio de la estimación de máxima verosimilitud tiene un considerable atractivo intuitivo, la siguiente proposición proporciona razones adicionales fundamentales para
el uso de estimadores de máxima verosimilitud.
PROPOSICIÓN
En condiciones muy generales en relación con la distribución conjunta de la muestra,
cuando el tamaño de la muestra n es grande, el estimador de máxima verosimilitud
de cualquier parámetro es aproximadamente insesgado [E( ˆ ) ] y su varianza es
casi tan pequeña como la que puede ser lograda por cualquier estimador. Expresado
de otra manera, el estimador de máxima verosimilitud ˆ es aproximadamente el estimador insesgado con varianza mínima de .
Debido a este resultado y al hecho de que las técnicas basadas en el cálculo casi siempre
pueden ser utilizadas para derivar los estimadores de máxima verosimilitud (aunque a veces
se requieren métodos numéricos, tales como el método de Newton), la estimación de máxima
verosimilitud es la técnica de estimación más ampliamente utilizada entre los estadísticos.
Muchos de los estimadores utilizados en lo que resta del libro son estimadores de máxima
verosimilitud. La obtención de un estimador de máxima verosimilitud, sin embargo, requiere que se especifique la distribución subyacente.
Algunas complicaciones
En ocasiones no se puede utilizar el cálculo para obtener estimadores de máxima verosimilitud.
Ejemplo 6.22
Suponga que mi tiempo de espera de un autobús está uniformemente distribuido en [0, ] y
que se observaron los resultados x1, . . . , xn de una muestra aleatoria tomada de esta distribución. Como f(x; ) 1/ con 0 x , y 0 de lo contrario,
1
0 x1 , . . . , 0 x n
f(x1, . . . , xn; ) n
de lo contrario
0
En tanto máx(xi) , la verosimilitud es 1/ n, la cual es positiva, pero en cuanto
máx(xi), la verosimilitud se reduce a 0. Esto se ilustra en la figura 6.5. El cálculo no funciona porque el máximo de la probabilidad ocurre en un punto de discontinuidad.
www.FreeLibros.me
c6_p227-253.qxd
250
3/12/08
CAPÍTULO 6
4:13 AM
Page 250
Estimación puntual
Probabilidad
máx(xi)
Figura 6.5
Función de probabilidad del ejemplo 6.22.
pero la figura indica que ˆ máx(Xi). Por consiguiente si mis tiempos de espera son 2.3,
3.7, 1.5, 0.4 y 3.2, entonces el estimador de máxima verosimilitud es ˆ 3.7.
■
Ejemplo 6.23
Un método que a menudo se utiliza para estimar el tamaño de una población de vida silvestre implica realizar un experimento de captura/recaptura. En este experimento, se captura una muestra inicial de M animales, y cada uno se éstos se etiqueta y luego son regresados
a la población. Tras de permitir un tiempo suficiente para que los individuos etiquetados
se mezclen con la población, se captura otra muestra de tamaño n. Con X el número de
animales etiquetados en la segunda muestra, el objetivo es utilizar las x observadas para estimar la población de tamaño N.
El parámetro de interés es N, el cual asume sólo valores enteros, así que incluso
después de determinar la función de verosimilitud (función masa de probabilidad de X en
este caso), el uso del cálculo para obtener N presentaría dificultades. Si se considera un éxito la recaptura de un animal previamente etiquetado, entonces el muestreo es sin reemplazo
de una población que contiene M éxitos y N M fallas, de modo que X es una variable aleatoria hipergeométrica y la función de probabilidad es
M
NM
x n x
p(x; N) h(x; n, M, N)
Nn
La naturaleza de valor entero de N, dificultaría tomar la derivada de p(x; N). Sin embargo,
si se considera la razón de p(x; N) a p(x; N 1), se tiene
p(x; N)
(N M) (N n)
p(x; N 1)
N(N M n x)
Esta razón es más grande que 1 si y sólo si N Mn/x. El valor de N con el cual p(x; N) se
incrementa al máximo es por consiguiente el entero más grande menor que Mn/x. Si se utiliza la notación matemática estándar [r] para el entero más grande menor que o igual a r, el
estimador de máxima probabilidad de N es N̂ [Mn/x]. Como ilustración, si M 200 peces
se sacan del lago y etiquetan, posteriormente n 100 son recapturados y entre los 100 hay
x 11 etiquetados, en ese caso N̂ [(200)(100)/11] [1818.18] 1818. La estimación
es en realidad un tanto intuitiva; x/n es la proporción de la muestra recapturada etiquetada,
mientras que M/N es la proporción de toda la población etiquetada. La estimación se obtiene
igualando estas dos proporciones (estimando una proporción poblacional mediante una proporción muestral).
■
Supóngase que X1, X2, . . . , Xn es una muestra aleatoria de una función de densidad
de probabilidad f(x; ) simétrica con respecto a aunque el investigador no está seguro de
la forma de la función f. Es entonces deseable utilizar un estimador ˆ robusto, es decir,
uno que funcione bien con una amplia variedad de funciones de densidad de probabilidad
www.FreeLibros.me
c6_p227-253.qxd
3/12/08
4:13 AM
Page 251
6.2 Métodos de estimación puntual
251
subyacentes. Un estimador como ése es una media recortada. En años recientes, los estadísticos han propuesto otro tipo de estimador, llamado estimador M, basado en una generalización de la estimación de máxima verosimilitud. En lugar de incrementar al máximo el
logaritmo de la probabilidad ln[ f(x; )] para una f específica, se incrementa al máximo
(xi; ). Se selecciona la “función objetivo” para que dé un estimador con buenas propiedades de robustez. El libro de David Hoaglin y colaboradores (véase la bibliografía) contiene una buena exposición de esta materia.
EJERCICIOS
Sección 6.2 (20-30)
20. Se selecciona una muestra aleatoria de n cascos para ciclistas fabricados por una compañía. Sea X el número entre
los n que están agrietados y sea p P(agrietado). Suponga
que sólo se observa X, en lugar de la secuencia de S y F.
a. Obtenga el estimador de máxima verosimilitud de p. Si
n 20 y x 3, ¿cuál es la estimación?
b. ¿Es insesgado el estimador del inciso a)?
c. Si n 20 y x 3, ¿cuál es el estimador de máxima
verosimilitud de la probabilidad (1 p)5 de que ninguno de los siguientes cinco cascos esté agrietado?
21. Si X tiene una distribución de Weibull con parámetros y
, entonces
E(X) (1 1/)
V(X) 2{(1 2/) [(1 1/)]2}
a. Basado en una muestra aleatoria X1, . . . , Xn, escriba
ecuaciones para el método de estimadores de momentos
y . Demuestre que, una vez que se obtiene la estimación de , la estimación de se puede hallar en una
tabla de la función gama y que la estimación de es la
solución de una ecuación complicada que implica la función gama.
b. Si n 20, x 28.0 y x 2i 16 500, calcule las estimaciones. [Sugerencia: [(1.2)]2/(1.4) 0.95.]
22. Sea X la proporción de tiempo destinado que un estudiante
seleccionado al azar pasa resolviendo cierta prueba de aptitud. Suponga que la función de densidad de probabilidad de
X es
( 1)x
f(x; )
0
0x1
de lo contrario
donde 1 . Una muestra aleatoria de diez estudiantes
produce los datos x1 0.92, x2 0.79, x3 0.90, x4 0.65,
x5 0.86, x6 0.47, x7 0.73, x8 0.97, x9 0.94,
x10 0.77.
a. Use el método de momentos para obtener un estimador
de y luego calcule la estimación con estos datos.
b. Obtenga el estimador de máxima verosimilitud de y
luego calcule la estimación con los datos dados.
23. Dos sistemas de computadoras diferentes son monitoreados
durante un total de n semanas. Sea Xi el número de descomposturas del primer sistema durante la i-ésima semana y
suponga que las Xi son independientes y que se extraen de
una distribución de Poisson con parámetro 1. Asimismo,
sea Yi el número de descomposturas del segundo sistema durante la semana i-ésima y suponga independencia con cada
Yi extraída de una distribución de Poisson con parámetro 2.
Derive los estimadores de máxima verosimilitud de 1, 2 y
1 2. [Sugerencia: Utilizando independencia, escriba la
función masa de probabilidad conjunta de las Xi y Yi juntas.]
24. Remítase al ejercicio 20. En lugar de seleccionar n 20
cascos para examinarlos, suponga que se examinan en sucesión hasta que se encuentran r 3 agrietados. Si el vigésimo percentil casco es el tercer agrietado (de modo que el
número de cascos examinados que no están agrietados sea
x 17), ¿cuál es el estimador de máxima verosimilitud de
p? ¿Es ésta la misma estimación del ejercicio 20? ¿Por qué
sí o por qué no? ¿Es la misma que la estimación calculada
con el estimador insesgado del ejercicio 17?
25. Se determina la resistencia al esfuerzo cortante de soldaduras de puntos de prueba y se obtienen los siguientes datos
(lb/pulg2):
392
376
401
367
389
362
409
415
358
375
a. Suponiendo que la resistencia al esfuerzo cortante está
normalmente distribuida, estime la resistencia al esfuerzo cortante promedio verdadera y la desviación estándar
de la resistencia al esfuerzo cortante utilizando el método de máxima verosimilitud.
b. De nuevo suponiendo una distribución normal, calcule
el valor de resistencia por debajo del cual 95% de todas
las soldaduras tendrán sus resistencias. [Sugerencia:
¿Cuál es el percentil 95 en función de y ? Utilice
ahora el principio de invarianza.]
26. Remítase al ejercicio 25. Suponga que decide examinar otra
soldadura de puntos de prueba. Sea X resistencia al esfuerzo cortante de la soldadura. Use los datos dados para obtener
el estimador de máxima verosimilitud de P(X 400).
[Sugerencia: P(X 400) ((400 )/).]
27. Sean X1, . . . , Xn una muestra aleatoria de una distribución
gama con parámetros y .
a. Derive las ecuaciones cuya solución da los estimadores
de máxima verosimilitud de y . ¿Piensa que pueden
ser resueltos explícitamente?
b. Demuestre que el estimador de máxima verosimilitud de
es ˆ
X.
28. Si X1, X2, . . . , Xn representan una muestra aleatoria de la
distribución Rayleigh con función densidad dada en el ejercicio 15. Determine:
a. El estimador de máxima verosimilitud de y luego calcule la estimación con los datos de esfuerzo de vibración
dados en ese ejercicio. ¿Es este estimador el mismo que
el estimador insesgado del ejercicio 15?
www.FreeLibros.me
c6_p227-253.qxd
252
3/12/08
CAPÍTULO 6
4:13 AM
Page 252
Estimación puntual
b. El estimador de máxima verosimilitud de la mediana de
la distribución del esfuerzo de vibración. [Sugerencia:
Exprese primero la mediana en función de .]
29. Considere la muestra aleatoria X1, X2, . . . , Xn de la función
de densidad de probabilidad exponencial desplazada
f(x; , )
{e 0
(x )
x
de lo contrario
Con 0 da la función de densidad de probabilidad de la distribución exponencial previamente considerada (con densidad
positiva a la derecha de cero). Un ejemplo de la distribución
exponencial desplazada apareció en el ejemplo 4.5, en el
cual la variable de interés fue el tiempo entre vehículos en
el flujo de tráfico y 0.5 fue el tiempo entre vehículos
máximo posible.
a. Obtenga los estimadores de máxima verosimilitud de y .
b. Si n 10 observaciones de tiempo entre vehículos son
realizadas y se obtienen los siguientes resultados 3.11,
0.64, 2.55, 2.20, 5.44, 3.42, 10.39, 8.93, 17.82 y 1.30,
calcule las estimaciones de y .
30. En los instantes t 0, 20 componentes idénticos son puestos
a prueba. La distribución de vida útil de cada uno es exponencial con parámetro . El experimentador deja la instalación de prueba sin monitorear. A su regreso 24 horas más
tarde, el experimentador termina de inmediato la prueba después de notar que y 15 de los 20 componentes aún están en
operación (así que 5 han fallado). Derive el estimador de
máxima verosimilitud de . [Sugerencia: Sea Y el número
que sobreviven 24 horas. En ese caso Y Bin(n, p). ¿Cuál es
el estimador de máxima verosimilitud de p? Observe ahora
que p P(Xi 24), donde Xi está exponencialmente distribuida. Esto relaciona con p, de modo que el primero puede
ser estimado una vez que lo ha sido el segundo.]
EJERCICIOS SUPLEMENTARIOS (31-38)
31. Se dice que un estimador ˆ es consistente si con cualquier
0, P(°ˆ ° ) A 0 a medida que n A . Es decir,
ˆ es consistente, si, a medida que el tamaño de muestra se
hace más grande, es menos y menos probable que ˆ se aleje más que del valor verdadero de . Demuestre que
X es
un estimador consistente de cuando 2 mediante la
desigualdad de Chebyshev del ejercicio 44 del capítulo 3.
[Sugerencia: La desigualdad puede ser reescrita en la forma
P(°Y Y°
) Y2 /
Ahora identifique Y con X
.]
32. a. Sean X1, . . . , Xn una muestra aleatoria de una distribución uniforme en [0, ]. Entonces el estimador de máxima verosimilitud de
es ˆ Y máx(Xi). Use el
hecho de que Y y si y sólo si cada Xi y para obtener
la función de distribución acumulativa de Y. Luego
demuestre que la función de densidad de probabilidad
de Y máx(Xi) es
fY (y)
{
ny n1
n
0
0y
de lo contrario
b. Use el resultado del inciso a) para demostrar que el estimador de máxima verosimilitud es sesgado pero que
(n 1)máx(Xi)/n es insesgado.
33. En el instante t 0, hay un individuo vivo en una población.
Un proceso de nacimientos puro se desarrolla entonces
como sigue. El tiempo hasta que ocurre el primer nacimiento está exponencialmente distribuido con parámetro .
Después del primer nacimiento, hay dos individuos vivos. El
tiempo hasta que el primero da a luz otra vez es exponencial
con parámetro y del mismo modo para el segundo individuo. Por consiguiente, el tiempo hasta el siguiente nacimiento es el mínimo de dos variables () exponenciales, el
cual es exponencial con parámetro 2. Asimismo, una vez
que el segundo nacimiento ha ocurrido, hay tres individuos
vivos, de modo que el tiempo hasta el siguiente nacimiento
es una variable aleatoria exponencial con parámetro 3 y así
sucesivamente (aquí se está utilizando la propiedad de
amnesia de la distribución exponencial). Suponga que se
observa el proceso hasta que el sexto nacimiento ha ocurrido y los tiempos hasta los nacimientos sucesivos son 25.2,
41.7, 51.2, 55.5, 59.5, 61.8 (con los cuales deberá calcular
los tiempos entre nacimientos sucesivos). Obtenga el estimador de máxima verosimilitud de . [Sugerencia: La verosimilitud es un producto de términos exponenciales.]
34. El error cuadrático medio de un estimador ˆ es ECM( ˆ)
E( ˆ )2. Si ˆ es insesgado, entonces ECM( ˆ) V( ˆ), pero
en general ECM( ˆ) V( ˆ) (sesgo)2. Considere el estimador ˆ 2 KS 2, donde S2 varianza muestral. ¿Qué valor
de K reduce al mínimo el error cuadrático medio de este
estimador cuando la distribución de la población es normal?
[Sugerencia: Se puede demostrar que
E[(S 2)2] (n 1) 4/(n 1)
En general, es difícil determinar ˆ para reducir al mínimo
el ECM( ˆ), por lo cual se buscan sólo estimadores insesgados y reducir al mínimo V( ˆ).]
35. Sean X1, . . . , Xn una muestra aleatoria de una función de
densidad de probabilidad simétrica con respecto a . Un
estimador de que se ha visto que funciona bien con una
amplia variedad de distribuciones subyacentes es el estimador de Hodges-Lehmann. Para definirla, primero calcule
para cada i j y cada j 1, 2, . . . , n el promedio por pares
Xi,j (Xi Xj)/2. Entonces el estimador es la media
na de las
Xi,j . Calcule el valor de esta estimación con los
datos del ejercicio 44 del capítulo 1. [Sugerencia:
Construya una tabla con las xi en el margen izquierdo y en
la parte superior. Luego calcule los promedios en y sobre la
diagonal.]
36. Cuando la distribución de la población es normal, se puede
|
|
utilizar la mediana estadística {°X1 X°, . . . , °Xn X°}
www.FreeLibros.me
c6_p227-253.qxd
3/12/08
4:13 AM
Page 253
Bibliografía
/0.6745 para estimar . Este estimador es más resistente a los
efectos de los valores apartados (observaciones alejadas del
grueso de los datos) que es la desviación estándar muestral.
Calcule tanto la estimación puntual correspondiente como s
de los datos del ejemplo 6.2.
37. Cuando la desviación estándar muestral S está basada en
una muestra aleatoria de una distribución de población normal, se puede demostrar que
E(S) 2/(
n
)
1(n/2)/((n 1)/2)
Use ésta para obtener un estimador insesgado de de la
forma cS. ¿Cuál es c cuando n 20?
253
38. Cada uno de n especímenes tiene que ser pesado dos veces en
la misma báscula. Sean Xi y Yi los dos pesos observados del
i-ésimo espécimen. Suponga que Xi y Yi son independientes
uno de otro, cada uno normalmente distribuido con valor medio i (el peso verdadero del espécimen i) y varianza 2.
a. Demuestre que el estimador de máxima verosimilitud de
2 es ˆ 2 (Xi Yi)2/(4n). [Sugerencia: Si z (z1
z2)/2, entonces (zi z)2 (z1 z2)2/2.]
b. ¿Es el estimador de máxima verosimilitud ˆ 2 un estimador insesgado de 2? Determine una estimador insesgado de 2. [Sugerencia: Con cualquier variable aleatoria
Z, E(Z 2) V(Z) [E(Z)]2. Aplique ésta a Z Xi Yi.]
Bibliografía
DeGroot, Morris y Mark Schervish, Probability and Statistics (3a.
ed.), Addison-Wesley, Boston, MA, 2002. Incluye una excelente discusión tanto de propiedades generales como de métodos
de estimación puntual; de particular interés son los ejemplos
que muestran cómo los principios y métodos generales pueden
dar estimadores insatisfactorios en situaciones particulares.
Devore, Jay y Kenneth Berk, Modern Mathematical Statistics with
Applications. Thomson-Brooks/Cole, Belmont, CA, 2007. La
exposición es un poco más completa y compleja que la de este
libro.
Efron, Bradley y Robert Tibshirani, An Introduction to the
Bootstrap, Chapman and Hall, Nueva York, 1993. La Biblia
del bootstrap.
Hoaglin, David, Frederick Mosteller y John Turkey, Understanding Robust and Exploratory Data Analysis, Wiley, Nueva
York, 1983. Contiene varios buenos capítulos sobre estimación
puntual robusta, incluido uno sobre estimación M.
How, Robert y Allen Craig, Introduction to Mathematical
Statistics (5a. ed.), Prentice-Hall, Englewood Cliffs, NJ, 1995.
Una buena discusión de insesgadez.
Rice, John, Mathematical Statistics and Data Analysis (3a. ed.),
Thomson-Brooks/Cole, Belmont, CA, 2007. Una agradable
mezcla de teoría y datos estadísticos.
www.FreeLibros.me
c7_p225-283.qxd
3/12/08
7
4:15 AM
Page 254
Intervalos estadísticos
basados en una sola
muestra
INTRODUCCIÓN
Una estimación puntual, por el hecho de ser un solo número no proporciona información sobre la precisión y confiabilidad de la estimación. Considérese, por ejemplo,
utilizar el estadístico
X para calcular una estimación puntual de la resistencia a la ruptura promedio verdadera (g) de toallas de papel de cierta marca y supóngase que
x 9322.7. Debido a la variabilidad del muestreo, virtualmente nunca es el caso de
que x . La estimación puntual no dice nada sobre qué tan cerca pudiera estar a
. Una alternativa para reportar un solo valor sensible del parámetro que se está estimando es calcular y reportar un intervalo completo de valores factibles: una estimación de intervalo o un intervalo de confianza (IC). Un intervalo de confianza siempre
se calcula seleccionando primero un nivel de confianza, el cual mide el grado de confiabilidad del intervalo. Un intervalo de confianza con 95% de nivel de confianza
de la resistencia a la ruptura promedio verdadera podría tener un límite inferior de
9162.5 y un límite superior de 9482.9. Entonces al nivel de confianza de 95%, cualquier valor de entre 9162.5 y 9482.5 es factible. Un nivel de confianza de 95% implica que 95% de todas las muestras daría un intervalo que incluye , o cualquier
otro parámetro que se esté estimando y sólo 5% de las muestras darían un intervalo erróneo. Los niveles de confianza más frecuentemente utilizados son 95%, 99%
y 90%. Mientras más alto es el nivel de confianza, más fuerte es la creencia de que
el valor del parámetro que se está estimando queda dentro del intervalo (en breve se
dará una interpretación de cualquier nivel de confianza particular).
El ancho del intervalo da información sobre la precisión de una estimación de
intervalo. Si el nivel de confianza es alto y el intervalo resultante es bastante angosto, el conocimiento del valor del parámetro es razonablemente preciso. Un muy amplio intervalo de confianza, sin embargo, transmite el mensaje de que existe gran
cantidad de incertidumbre sobre el valor de lo que se está estimando. La figura 7.1
254
www.FreeLibros.me
c7_p225-283.qxd
3/12/08
4:15 AM
Page 255
7.1 Propiedades básicas de los intervalos de confianza
255
muestra intervalos de confianza de 95% de resistencias a la ruptura promedio verdaderas de dos marcas diferentes de marcas de toallas de papel. Uno de estos intervalos
sugiere un conocimiento preciso de , mientras que el otro sugiere un rango muy amplio de valores factibles.
(
Marca 1:
Marca 2:
Figura 7.1
sobre .
)
(
Resistencia
)
Resistencia
Intervalos de confianza que indican información precisa (marca 1) e imprecisa (marca 2)
7.1 Propiedades básicas de los intervalos de confianza
Los conceptos y propiedades básicas de los intervalos de confianza son más fáciles de introducir si primero se presta atención a un problema simple, aunque un tanto irreal. Supóngase que el parámetro de interés es una media poblacional y que:
1.
La distribución de la población es normal.
2.
El valor de la desviación estándar de la población es conocido.
Con frecuencia la normalidad de la distribución de la población es una suposición razonable. Sin embargo, si el valor de es desconocido, no es factible que el valor de estaría
disponible (el conocimiento del centro de una población en general precede a la información con respecto a la dispersión). En secciones posteriores, se desarrollarán métodos basados en suposiciones menos restrictivas.
Ejemplo 7.1
Ingenieros industriales especialistas en ergonomía se ocupan del diseño de espacios de trabajo y dispositivos operados por trabajadores con objeto de alcanzar una alta productividad
y comodidad. El artículo “Studies on Ergonomically Designed Alphanumeric Keyboards”
(Human Factors, 1985: 175-187) reporta sobre un estudio de altura preferida de un teclado
experimental con un gran soporte para el antebrazo y muñeca. Se seleccionó una muestra de
n 31 mecanógrafos entrenados y se determinó la altura preferida del teclado de cada mecanógrafo. La altura preferida promedio muestral resultante fue de x 80.0 cm. Suponiendo que la altura preferida está normalmente distribuida con 2.0 cm (un valor sugerido
por datos que aparecen en el artículo), obtenga un intervalo de confianza para , la altura preferida promedio verdadera por la población de todos los mecanógrafos experimentados. ■
Se supone que las observaciones muestrales reales x1, x2, . . . , xn son el resultado de
una muestra aleatoria X1, . . . , Xn tomada de una distribución normal con valor medio y
desviación estándar . Los resultados del capítulo 5 implican entonces que independientemente del tamaño de muestra n, la media muestral X
está normalmente distribuida con valor esperado y desviación estándar /n
. Si se estandariza
X restando primero su valor
esperado y luego dividiendo entre su desviación estándar se obtiene la variable normal estándar
Z
www.FreeLibros.me
X
/n
(7.1)
c7_p225-283.qxd
256
3/12/08
CAPÍTULO 7
4:15 AM
Page 256
Intervalos estadísticos basados en una sola muestra
Como el área bajo la curva normal estándar entre 1.96 y 1.96 es 0.95,
P 1.96
X
1.96 0.95
/n
(7.2)
A continuación manipúlense las desigualdades que están adentro del paréntesis en
(7.2) de modo que aparezcan en la forma equivalente l u, donde los puntos extremos
l y u implican a X
y /n. Esto se logra mediante la siguiente secuencia de operaciones y
cada una da desigualdades equivalentes a las originales.
1. Multiplíquese por /n
:
1.96
X 1.96
n
n
2. Réstese X
de cada término:
X
1.96
n
n
X
1.96
3. Multiplíquese por 1 para eliminar el signo menos en frente de (el cual invierte la dirección de cada desigualdad):
X
1.96
X
1.96
n
n
X
1.96
X
1.96
n
n
es decir,
La equivalencia de cada conjunto de desigualdades con el conjunto original implica que
P X
1.96
X
0.95
1.96
n
n
(7.3)
El evento en el interior del paréntesis en (7.3) tiene una apariencia poco común; previamente, la cantidad aleatoria aparecía a la mitad con constantes en ambos extremos, como en
a Y b. En (7.3) la cantidad aleatoria aparece en dos extremos, mientras que la constante desconocida aparece a la mitad. Para interpretar (7.3), considérese un intervalo aleatorio
con el punto extremo izquierdo
X 1.96 /n
y punto extremo derecho
X 1.96 /n
.
En notación de intervalo, esto se transforma en
X
,
X 1.96
(7.4)
1.96
n
n
El intervalo (7.4) es aleatorio porque los dos puntos extremos del intervalo implican una variable aleatoria. Está centrada en la media muestral X
y se extiende a 1.96/n a cada
lado de X
. Por consiguiente el ancho del intervalo es 2 (1.96) /n, el cual no es aleatorio; sólo su localización (su punto medio X
) lo es (figura 7.2). Ahora (7.3) puede ser parafraseado como “la probabilidad es 0.95 de que el intervalo aleatorio (7.4) incluya o cubra
el valor verdadero de ”. Antes de realizar cualquier experimento y de recolectar cualquier
dato, es bastante probable que estará adentro del intervalo (7.4).
1.96 /
n
1.96 /
n
⎧
⎨
⎩
⎧
⎨
⎩
X 1.96 /
n
Figura 7.2
X
n
X 1.96 /
Intervalo aleatorio (7.4) con su centro en X
.
www.FreeLibros.me
c7_p225-283.qxd
3/12/08
4:15 AM
Page 257
7.1 Propiedades básicas de los intervalos de confianza
DEFINICIÓN
257
Si después de observar X1 x1, X2 x2, . . . , Xn xn, se calcula la media muestral
observada x y luego se sustituye x en (7.4) en lugar de X
, el intervalo fijo resultante
se llama intervalo de 95% de confianza para . Este intervalo de confianza se expresa como
x 1.96 n , x 1.96 n
es un intervalo de 95% de confianza para
o cuando
x 1.96
x 1.96
n
n
con 95% de confianza
Una expresión concisa para el intervalo es x ! 1.96 /n
, donde – da el punto extremo izquierdo (límite inferior) y da el punto extremo derecho (límite superior).
Ejemplo 7.2
(continuación
del ejemplo
7.1)
Las cantidades requeridas para calcular el intervalo de 95% de confianza para la altura preferida promedio verdadera son 2.0, n 31 y x 80.0. El intervalo resultante es
2.0
x ! 1.96
80.0 ! (1.96)
80.0 ! 0.7 (79.3, 80.7)
n
3
1
Es decir, se puede estar totalmente confiado, en el nivel de confianza de 95%, de que
79.3 80.7. Este intervalo es relativamente angosto, lo que indica que ha sido estimada con bastante precisión.
■
Interpretación de un intervalo de confianza
El nivel de 95% de confianza para el intervalo que se acaba de definir fue heredado de 0.95
de probabilidad para el intervalo aleatorio (7.4). Los intervalos con otros niveles de confianza serán introducidos en breve. Por ahora, más bien, considérese cómo se puede interpretar
el 95% de confianza.
Como se inició con un evento cuya probabilidad era de 0.95, de que el intervalo aleatorio (7.4) capturaría el valor verdadero de , y luego se utilizaron los datos del ejemplo 7.1
para calcular el intervalo de confianza (79.3, 80.7), es tentador concluir que está dentro
X, tode este intervalo fijo con probabilidad de 0.95. Pero al sustituir x 80.0 en lugar de
da la aleatoriedad desaparece; el intervalo (79.3, 80.7) no es un intervalo aleatorio y es
una constante (desafortunadamente desconocida). Es por consiguiente incorrecto escribir la
proposición P( queda en (79.3, 80.7)) 0.95.
Una interpretación correcta de “95% de confianza” se basa en la interpretación de probabilidad de frecuencia relativa a largo plazo. Decir que un evento A tiene una probabilidad
de 0.95 es decir que si el experimento en el cual se definió A se realiza una y otra vez, a la
larga A ocurrirá el 95% del tiempo. Supóngase que se obtiene otra muestra de alturas preferidas por los mecanógrafos y se calcula otro intervalo de 95%. Luego se considera repetir
esto con una tercera muestra, una cuarta, una quinta, y así sucesivamente. Sea A el evento
en que
X 1.96 /n
X 1.96 /n
. Ya que P(A) 0.95, a la larga el 95%
de los intervalos de confianza calculados contendrán . Esto se ilustra en la figura 7.3,
donde la línea vertical corta el eje de medición en el valor verdadero (pero desconocido) de
. Obsérvese que de los 11 intervalos ilustrados, sólo los intervalos 3 y 11 no contienen .
A la larga, sólo 5% de los intervalos construidos así no contendrán .
De acuerdo con esta interpretación, el nivel de confianza de 95% no es en sí una proposición sobre cualquier intervalo particular tal como (79.3, 80.7). En su lugar pertenece a
lo que sucedería si se construyera un número de intervalos como esos por medio de la misma
www.FreeLibros.me
c7_p225-283.qxd
258
3/12/08
CAPÍTULO 7
4:15 AM
Page 258
Intervalos estadísticos basados en una sola muestra
Valor verdadero de
Número
Nmero dede
intervalo
intervalo
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
Figura 7.3
Construcción repetida de intervalos de confianza de 95 por ciento.
fórmula de intervalo de confianza. Aunque esto puede parecer no satisfactorio, el origen de la
dificultad yace en la interpretación de probabilidad, es válida para una larga secuencia de
réplicas de un experimento en lugar de sólo para una. Existe el método de abordar la construcción e interpretación de intervalos de confianza que utiliza la noción de probabilidad
subjetiva y el teorema de probabilidad de Bayes, aunque los detalles técnicos se salen del
alcance de este libro; el libro de DeGroot y colaboradores (véase la bibliografía del capítulo 6)
es una buena fuente. El intervalo presentado aquí (así como también cada intervalo presentado subsecuentemente) se llama intervalo de confianza “clásico” porque su interpretación se
apoya en la noción clásica de probabilidad (aunque las ideas principales se desarrollaron tan
recientemente como en la década de 1930).
Otros niveles de confianza
El nivel de confianza de 95% fue heredado de la probabilidad de 0.95 de las desigualdades
iniciales que aparecen en (7.2). Si se desea un nivel de confianza de 99%, la probabilidad inicial de 0.95 debe ser reemplazada por 0.99, lo que implica cambiar el valor crítico z
de 1.96 a 2.58. Un intervalo de confianza de 99% resulta entonces de utilizar 2.58 en lugar de
1.96 en la fórmula para el intervalo de confianza de 95 por ciento.
Esto sugiere que cualquier nivel de confianza deseado se obtiene reemplazando 1.96
o 2.58 con el valor crítico normal estándar apropiado. Como la figura 7.4 muestra, utilizando z/2 en lugar de 1.96 se logra una probabilidad de 1 .
Curva z
1
z/2
Figura 7.4
DEFINICIÓN
0
Área sombreada /2
z /2
P( z/2 Z z/2) 1 .
La siguiente expresión da un intervalo de confianza de 100 (1 )% para la media de una población normal cuando se conoce el valor de
x z/2
, x z/2
n
n
o, de forma equivalente, por x ! z/2 /n
.
www.FreeLibros.me
(7.5)
c7_p225-283.qxd
3/12/08
4:15 AM
Page 259
7.1 Propiedades básicas de los intervalos de confianza
Ejemplo 7.3
259
No hace mucho tiempo que el proceso de producción de una caja de control de un tipo particular para un motor fue modificado. Antes de esta modificación, datos históricos sugirieron
que la distribución de diámetros de agujeros para bujes en las cajas era normal con desviación estándar de 0.100 mm. Se cree que la modificación no ha afectado la forma de la distribución ni la desviación estándar, pero que el valor del diámetro medio pudo haber cambiado.
Se selecciona una muestra de 40 cajas y se determina el diámetro de agujero para cada una
y el resultado es un diámetro medio muestral de 5.426 mm. Calcúlese un intervalo de confianza para el diámetro de agujero promedio verdadero utilizando un nivel de confianza de
90%. Esto requiere que 100(1 ) 90, de donde 0.10 y z/2 z0.05 1.645 (correspondiente a un área de curva z acumulativa de 0.9500). El intervalo deseado es entonces
5.426 ! (1.645)
.100
4
0
5.426 ! 0.026 (5.400, 5.452)
Con un razonablemente alto grado de confianza, se puede decir que 5.400 5.452. Este intervalo es algo angosto debido a la pequeña cantidad de variabilidad del diámetro del
agujero ( 0.100).
■
Nivel de confianza, precisión y tamaño de muestra
¿Por qué decidirse por un nivel de confianza de 95% cuando un nivel de 99% es alcanzable? Porque el precio pagado por el nivel de confianza más alto es un intervalo más ancho.
Como el intervalo de 95% se extiende 1.96 /n
a cada lado de x, el ancho del intervalo
es 2(1.96) /n
3.92 /n
. Asimismo, el ancho del intervalo de 99% es 2(2.58)
/n
5.16 /n
. Es decir, se tiene más confianza en el intervalo de 99% precisamente
porque es más ancho. Mientras más alto es el grado de confianza, más ancho es el intervalo resultante. En realidad, el único intervalo de 100% para es (, ), el cual no es terriblemente informativo porque se sabía que este intervalo cubriría incluso antes del
muestreo.
Si se considera que el ancho del intervalo especifica su precisión o exactitud, entonces el nivel de confianza (o confiabilidad) del intervalo está relacionado de manera inversa
con su precisión. La estimación de un intervalo altamente confiable puede ser imprecisa por
el hecho de que los puntos extremos del intervalo pueden estar muy alejados, mientras que
un intervalo preciso puede acarrear una confiabilidad relativamente baja. Por consiguiente
no se puede decir de modo inequívoco que se tiene que preferir un intervalo de 99% a uno
de 95%; la ganancia de confiabilidad acarrea una pérdida de precisión.
Una estrategia atractiva es especificar tanto del nivel de confianza deseado como el
ancho del intervalo y luego determinar el tamaño de muestra necesario.
Ejemplo 7.4
Un intensivo monitoreo de un sistema de tiempo compartido de computadoras sugiere que
el tiempo de respuesta a un comando de edición particular está normalmente distribuido con
desviación estándar de 25 milisegundos. Se instaló un nuevo sistema operativo y se desea
estimar el tiempo de respuesta promedio verdadero en el nuevo entorno. Suponiendo que
los tiempos de respuesta siguen estando normalmente distribuidos con 25, ¿qué tamaño de muestra es necesario para asegurarse de que el intervalo de confianza de 95% resultante tiene un ancho de (cuando mucho) 10? El tamaño de muestra n debe satisfacer
10 2 (1.96)(25/n
)
Reordenando esta ecuación se obtiene
n 2 (1.96)(25)/10 9.80
por consiguiente
n (9.80)2 96.04
En vista de que n debe ser un entero, se requiere un tamaño de muestra de 97.
www.FreeLibros.me
■
c7_p225-283.qxd
260
3/12/08
CAPÍTULO 7
4:15 AM
Page 260
Intervalos estadísticos basados en una sola muestra
La fórmula general para el tamaño de muestra n necesario para garantizar un ancho
de intervalo w se obtiene a partir de w 2 z/2 /n como
n 2z/2
w
2
Mientras más pequeño es el ancho deseado w, más grande debe ser n. Además, n es una función creciente de (más variabilidad de la población requiere un tamaño de muestra más
grande) y del nivel de confianza 100(1 ) (conforme decrece, z/2 se incrementa).
La mitad del ancho 1.96/n
del intervalo de confianza de 95% en ocasiones se llama
límite en el error de estimación asociado con un nivel de confianza de 95%. Es decir, con
95% de confianza, la estimación puntual x no estará a más de esta distancia de .
Antes de obtener datos, es posible que un investigador desee determinar un tamaño de muestra
con el cual se logra un valor particular del límite. Por ejemplo, si representa la eficiencia
de combustible promedio (mpg) de todos los carros de cierto tipo, el objetivo de una investigación puede ser estimar adentro de 1 mpg con 95% de confianza. Más generalmente, si
se desea estimar adentro de una cantidad B (el límite especificado en el error de estimación) con confianza de 100(1 )%, el tamaño de muestra necesario se obtiene al reemplazar 2/w por 1/B en la fórmula adentro del cuadro precedente.
Derivación de un intervalo de confianza
Sean X1, X2, . . . , Xn la muestra en la cual se tiene que basar el intervalo de confianza para
un parámetro . Supóngase que se puede determinar una variable aleatoria que satisface las
dos siguientes propiedades:
1. La variable depende funcionalmente tanto de X1, . . . , Xn como de .
2. La distribución de probabilidad de la variable no depende de
parámetros desconocidos.
ni de cualesquiera otros
Sea h(X1, X2, . . . , Xn; ) esta variable aleatoria. Por ejemplo, si la distribución de
la población es normal con conocida y
la variable h(X1, . . . , Xn; )
(X
) satisface ambas propiedades; claramente depende funcionalmente de , no
)/(/n
obstante su distribución de probabilidad es normal estándar, la cual no depende de . En general, la forma de la función h casi siempre se pone de manifiesto al examinar la distribución de un estimador apropiado ˆ.
Con cualquier entre 0 y 1, se ve que las constantes a y b satisfacen
P(a h(X1, . . . , Xn; ) b) 1
(7.6)
A causa de la segunda propiedad, a y b no dependen de . En el ejemplo normal, a z/2
y b z/2. Ahora supóngase que las desigualdades en (7.6) pueden ser manipuladas para aislar y así se obtiene la proposición de probabilidad equivalente
P(l(X1, X2, . . . , Xn)
u(X1, X2, . . . , Xn)) 1
Entonces l(x1, x2, . . . , xn) y u(x1, . . . , xn) son los límites de confianza inferior y superior,
respectivamente, para un intervalo de confianza de 100(1 )%. En el ejemplo normal, se
vio que l(X1, . . . , Xn)
X z/2 /n
y u(X1, . . . , Xn)
X z/2 /n
.
Ejemplo 7.5
Un modelo teórico sugiere que el tiempo hasta la ruptura de un fluido aislante entre electrodos a un voltaje particular tiene una distribución exponencial con parámetro (véase la sección 4.4). Una muestra aleatoria de n 10 tiempos de ruptura da los siguientes datos
www.FreeLibros.me
c7_p225-283.qxd
3/12/08
4:15 AM
Page 261
7.1 Propiedades básicas de los intervalos de confianza
261
muestrales (en min): x1 41.53, x2 18.73, x3 2.99, x4 30.34, x5 12.33, x6 117.52,
x7 73.02, x8 223.63, x9 4.00, x10 26.78. Se desea un intervalo de 95% para y para
el tiempo de ruptura promedio verdadero.
Sea h(X1, X2, . . . , Xn; ) 2Xi. Se puede demostrar que esta variable aleatoria
tiene una distribución de probabilidad llamada distribución ji cuadrada con 2n grados de libertad (gl) ( 2n, donde es el parámetro de una distribución ji cuadrada como se menciona en la sección 4.4). La tabla A.7 del apéndice ilustra una curva de densidad ji cuadrada
típica y tabula valores críticos que capturan áreas de colas específicas. El número pertinente de grados de libertad en este caso es 2(10) 20. La fila 20 de la tabla muestra que
34.170 captura un área de cola superior de 0.025 y 9.591 captura un área de cola inferior de
0.025 (área de cola superior de 0.975). Por consiguiente con n 10,
P(9.591 2 Xi 34.170) 0.95
La división entre 2Xi aísla y se obtiene
P(9.591/(2 Xi) (34.170/(2 Xi)) 0.95
El límite inferior del intervalo de confianza de 95% para es 9.591/(2xi) y el límite superior es 34.170/(2xi). Con los datos dados xi 550.87 da el intervalo (0.00871, 0.03101).
El valor esperado de una variable aleatoria exponencial es 1/. Puesto que
P(2 Xi /34.170 1/ 2 Xi /9.591) 0.95
el intervalo de confianza de 95% para el tiempo de ruptura promedio verdadero es
(2xi /34.170, 2xi /9.591) (32.24, 114.87). Obviamente este intervalo es bastante ancho,
lo que refleja una variabilidad sustancial de los tiempos de ruptura y un pequeño tamaño de
muestra.
■
En general, los límites de confianza superior e inferior resultan de reemplazar cada
en (7.6) por y resolviendo para . En el ejemplo del fluido aislante que se acaba de considerar, 2xi 34.170 da 34.170/(2xi) como límite de confianza superior y el límite
inferior se obtiene con la otra ecuación. Obsérvese que los dos límites de intervalo no están
equidistantes de la estimación puntual, en vista de que el intervalo no es de la forma ˆ ! c.
Intervalos de confianza bootstrap
La técnica bootstrap se introdujo en el capítulo 6 como una forma de estimar . También
puede ser aplicada para obtener un intervalo de confianza para . Considérese de nuevo la
estimación de la media de una distribución normal cuando es conocido. Reemplácese
con y úsese ˆ
X como estimador puntual. Obsérvese que 1.96/n
es el percentil 97.5
de la distribución de ˆ (esto es, P(X
) P(Z 1.96) 0.9750).
1.96/n
Del mismo modo 1.96/n
es el percentil 2.5, por consiguiente
0.95 P(percentil 2.5 ˆ percentil 97.5)
P(ˆ percentil 2.5 ˆ percentil 97.5)
Es decir, con
l ˆ percentil 97.5 de ˆ
u ˆ percentil 2.5 de ˆ
(7.7)
El intervalo de confianza para es (l, u). En muchos casos, los percentiles en (7.7) no pueden ser calculados, pero sí pueden serlo con muestras bootstrap. Supóngase que se obtienen
B 1000 muestras bootstrap y se calculan ˆ *1, . . . , ˆ *1000 y * seguidos por las diferencias
ˆ *1 *, . . . , ˆ*1000 *. Las 25 más grandes y las 25 más pequeñas de estas diferencias son
estimaciones de los percentiles desconocidos en (7.7). Consúltense los libros de Devore y
Berk o de Efron citados en el capítulo 6 para más información.
www.FreeLibros.me
c7_p225-283.qxd
262
3/12/08
CAPÍTULO 7
EJERCICIOS
4:15 AM
Page 262
Intervalos estadísticos basados en una sola muestra
Sección 7.1 (1-11)
1. Considere una distribución de población normal con el valor de conocido.
a. ¿Cuál es el nivel de confianza para el intervalo x !
2.81/n
?
b. ¿Cuál es el nivel de confianza para el intervalo x !
1.44/n
?
c. ¿Qué valor de z/2 en la fórmula de intervalo de confianza (7.5) da un nivel de confianza de 99.7%?
d. Responda la pregunta hecha en el inciso c) para un nivel
de confianza de 75%.
2. Cada uno de los siguientes intervalos es un intervalo de
confianza para frecuencia de resonancia promedio verdadera (Hz) (es decir, media de la población) para todas las
raquetas de tenis de un tipo:
(114.4, 115.6)
5.
(114.1, 115.9)
a. ¿Cuál es el valor de la frecuencia de resonancia media
muestral?
b. Ambos intervalos se calcularon con los mismos datos
muestrales. El nivel de confianza para uno de estos intervalos es de 90% y para el otro es de 99%. ¿Cuál de los
intervalos tiene el nivel de confianza de 90% y por qué?
3. Suponga que se selecciona una muestra de 50 botellas de una
marca particular de jarabe para la tos y se determina el contenido de alcohol. Sea el contenido promedio de alcohol de la
población de todas las botellas de la marca estudiada. Suponga que el intervalo de confianza de 95% resultante es (7.8, 9.4).
a. ¿Habría resultado un intervalo de confianza de 90% calculado con esta muestra más angosto o más ancho que el
intervalo dado? Explique su razonamiento.
b. Considere la siguiente proposición: Existe 95% de probabilidades de que el esté entre 7.8 y 9.4. ¿Es correcta esta proposición? ¿Por qué sí o por qué no?
c. Considere la siguiente proposición: Se puede estar totalmente confiado de que 95% de todas las botellas de este
tipo de jarabe para la tos tienen un contenido de alcohol
entre 7.8 y 9.4. ¿Es correcta esta proposición? ¿Por qué
sí o por qué no?
d. Considere la siguiente proposición: Si el proceso de selección de una muestra de tamaño 50 y de cálculo del intervalo de 95% correspondiente se repite 100 veces, 95
de los intervalos resultantes incluirán . ¿Es correcta
esta proposición? ¿Por qué sí o por qué no?
4. Se desea un intervalo de confianza para la pérdida por carga parásita promedio verdadera (watts) de cierto tipo de
motor de inducción cuando la corriente a través de la línea
se mantiene a 10 amps a una velocidad de 1500 rpm. Suponga que la pérdida por carga parásita está normalmente
distribuida con 3.0.
a. Calcule un intervalo de confianza para de 95% cuando
n 25 y x 58.3.
b. Calcule un intervalo de confianza para de 95% cuando
n 100 y x 58.3.
c. Calcule un intervalo de confianza para de 99% cuando
n 100 y x 58.3.
6.
7.
8.
d. Calcule un intervalo de confianza para de 82% cuando
n 100 y x 58.3.
e. ¿Qué tan grande debe ser n si el ancho del intervalo de
99% para tiene que ser 1.0?
Suponga que la porosidad al helio (en porcentaje) de muestras
de carbón tomadas de cualquier costura particular está normalmente distribuida con desviación estándar verdadera de 0.75.
a. Calcule un intervalo de confianza de 95% para la porosidad promedio verdadera de una costura si la porosidad
promedio en 20 especímenes de la costura fue de 4.85.
b. Calcule un intervalo de confianza de 98% para la porosidad promedio verdadera de otra costura basada en 16
especímenes con porosidad promedio muestral de 4.56.
c. ¿Qué tan grande debe ser un tamaño de muestra si el ancho del intervalo de 95% tiene que ser de 0.40?
d. ¿Qué tan grande debe ser un tamaño de muestra para
calcular la porosidad promedio verdadera dentro de 0.2
con confianza de 99%?
Con base en pruebas extensas, se sabe que el punto de cedencia de un tipo particular de varilla de refuerzo de acero suave
está normalmente distribuido con 100. La composición
de la varilla se modificó un poco, pero no se cree que la modificación haya afectado o la normalidad o el valor de .
a. Suponiendo que éste tiene que ser el caso, si una muestra de 25 varillas modificadas dio por resultado un punto de cedencia promedio muestral de 8439 lb, calcule un
intervalo de confianza de 90% para el punto de cedencia
promedio verdadero de la varilla modificada.
b. ¿Cómo modificaría el intervalo del inciso a) para obtener un nivel de confianza de 92%?
¿En cuánto se debe incrementar el tamaño de muestra n si
el ancho del intervalo de confianza (7.5) tiene que ser reducido a la mitad? Si el tamaño de muestra n se incrementa
por un factor de 25, ¿qué efecto tendrá en el ancho del intervalo? Justifique sus aseveraciones.
Sea 1 0, 2 0, con 1 2 . Entonces
P z1
X
z2 1
/n
a. Use esta ecuación para obtener una expresión más general para un intervalo de confianza de 100(1 )% para
del cual el intervalo (7.5) es un caso especial.
b. Sea 0.05 y 1 /4, 2 3/4. ¿Da por resultado
esto un intervalo más angosto o más ancho que el intervalo (7.5)?
9. a. En las mismas condiciones que aquellas que conducen
al intervalo (7.5), P[(X
) 1.645] 0.95.
)/(/n
Use esta expresión para obtener un intervalo unilateral
para de ancho infinito y que proporcione un límite de
confianza inferior para . ¿Cuál es el intervalo para los
datos del ejercicio 5(a)?
b. Generalice el resultado del inciso a) para obtener un límite inferior con nivel de confianza de 100(1 )%.
www.FreeLibros.me
c7_p225-283.qxd
3/12/08
4:15 AM
Page 263
7.2 Intervalos de confianza de muestra grande para una media y proporción de población
c. ¿Cuál es un intervalo de confianza de 95% para la desviación estándar de la distribución de la vida útil? [Sugerencia: ¿Cuál es la desviación estándar de una variable
aleatoria exponencial?]
c. ¿Cuál es un intervalo análogo al del inciso b) que proporcione un límite superior para ? Calcule este intervalo de 99% para los datos del ejercicio 4(a).
10. Una muestra aleatoria de n 15 bombas térmicas de cierto tipo produjo las siguientes observaciones de vida útil (en años):
2.0
1.3
6.0 1.9
5.1
0.4
1.0
15.7
0.7
4.8 0.9 12.2
5.3
0.6
263
11. Considere los siguientes 1000 intervalos de confianza de
95% para que un consultor estadístico obtendrá para varios clientes. Suponga que se seleccionan independientemente uno de otro los conjuntos de datos en los cuales están
basados los intervalos. ¿Cuántos de estos 1000 intervalos
espera que capturen el valor correspondiente de ? ¿Cuál es
la probabilidad de que entre 940 y 960 de estos intervalos
contengan el valor correspondiente de ? [Sugerencia: Sea
Y el número entre los 1000 intervalos que contienen .
¿Qué clase de variable aleatoria es Y?]
5.3
a. Suponga que la distribución de la vida útil es exponencial y use un argumento paralelo al del ejemplo 7.5 para
obtener un intervalo de confianza de 95% para la vida
útil esperada (promedio verdadero).
b. ¿Cómo debería modificarse el intervalo del inciso a) para
obtener un nivel de confianza de 99%?
7.2 Intervalos de confianza de muestra grande
para una media y proporción de población
Se supuso en el intervalo de confianza para dado en la sección previa que la distribución
de la población es normal con el valor de conocido. A continuación se presenta un intervalo de confianza de muestra grande cuya validez no requiere estas suposiciones. Después
de demostrar cómo conduce el argumento a este intervalo se aplica en forma extensa para
producir otros intervalos de muestra grande y habrá que enfocarse en un intervalo
para una proporción de población p.
Intervalo de muestra grande para
Sean X1, X2, . . . , Xn una muestra aleatoria de una población con media y desviación estándar . Siempre que n es grande, el teorema del límite central implica que X
tiene de manera aproximada una distribución normal cualquiera que sea la naturaleza de la distribución
de la población. Se deduce entonces que Z (X
) tiene aproximadamente una
)/(/n
distribución estándar normal, de modo que
P z/2
X
z/2 1
/n
Un argumento paralelo al dado en la sección 7.1 da x ! z/2 /n como intervalo de
confianza de muestra grande para con un nivel de confianza de aproximadamente
100(1 )%. Es decir, cuando n es grande, el intervalo de confianza para dado antes
permanece válido cualquiera que sea la distribución de la población, siempre que el calificador esté insertado “aproximadamente” enfrente del nivel de confianza.
Una dificultad práctica con este desarrollo es que el cálculo del intervalo de confianza requiere el valor de , el cual rara vez es conocido. Considérese la variable estandarizada (X
), en la cual la desviación estándar muestral S ha sido reemplazada a .
)/(S/n
Previamente había aleatoriedad sólo en el numerador de Z gracias a
X. En la nueva variable
estandarizada, tanto
X como S cambian de valor de una muestra a otra. Así que aparentemente la distribución de la nueva variable deberá estar más dispersa que la curva z para reflejar la variación extra en el denominador. Esto en realidad es cierto cuando n es pequeño.
Sin embargo, con n grande la sustitución de S en lugar de agrega un poco de variabilidad
extra, así que esta variable también tiene una distribución normal estándar. La manipulación
de la variable en la proposición de probabilidad, como en el caso de conocida, da un intervalo de confianza de muestra grande general para .
www.FreeLibros.me
c7_p225-283.qxd
264
3/12/08
CAPÍTULO 7
4:15 AM
Page 264
Intervalos estadísticos basados en una sola muestra
PROPOSICIÓN
Si n es suficientemente grande, la variable estandarizada
Z
X
S/n
tiene aproximadamente una distribución normal estándar. Esto implica que
s
x ! z/2
n
(7.8)
es un intervalo de confianza de muestra grande para con nivel de confianza
aproximadamente de 100(1 )%. Esta fórmula es válida sin importar la forma de
la distribución de la población.
En general, n 40 será suficiente para justificar el uso de este intervalo. Esto es algo más
conservador que la regla empírica del teorema del límite central debido a la variabilidad adicional introducida por el uso de S en lugar de .
Ejemplo 7.6
El voltaje de ruptura de corriente alterna (CA) de un líquido aislante indica su resistencia dieléctrica. El artículo “Testing Practices for the AC Breakdown Voltage Testing of Insulation
Liquids” (IEEE Electrical Insulation Magazine, 1995: 21-26) dio las observaciones muestrales adjuntas de voltaje de ruptura (kV) de un circuito particular en ciertas condiciones.
62
50
53
57
41
53
55
61
59
64
50
53
64
62
50
68
54
55
57
50
55
50
56
55
46
55
53
54
52
47
47
55
57
48
63
57
57
55
53
59
53
52
50
55
60
50
56
58
Una gráfica de caja de los datos (figura 7.5) muestra una alta concentración a la mitad de la
parte media de los datos (ancho de caja angosto). Hay sólo un valor apartado en el extremo
superior, pero éste en realidad está un poco más cerca de la mediana (55) que la observación muestral más pequeña.
Voltaje
40
Figura 7.5
50
60
70
Gráfica de los datos de voltaje de ruptura del ejemplo 7.6.
Las cantidades resumidas incluyen n 48, xi 2626 y x 2i 144 950, a partir de
las cuales x 54.7 y s 5.23. El intervalo de confianza de 95% es entonces
54.7 ! 1.96
5.23
4
8
54.7 ! 1.5 (53.2, 56.2)
Es decir,
53.2 56.2
con un nivel de confianza de aproximadamente 95%. El intervalo es angosto de manera razonable, lo que indica que ha sido estimada con precisión.
■
www.FreeLibros.me
c7_p225-283.qxd
3/12/08
4:15 AM
Page 265
7.2 Intervalos de confianza de muestra grande para una media y proporción de población
265
Desafortunadamente, la selección del tamaño de muestra para que dé un ancho de intervalo deseado no es simple en este caso como lo fue en el caso de conocida. Por eso el
ancho de (7.8) es 2z/2s/n
. Como el valor de s no está disponible antes de que los datos
hayan sido recopilados, el ancho del intervalo no puede ser determinado tan sólo con la selección de n. La única opción de un investigador que desea especificar el ancho deseado es
hacer una suposición instruida a qué valor de s podría ser. Siendo conservador y suponiendo un valor más grande de s, se seleccionará un n más grande de lo necesario. El investigador puede ser capaz de especificar un valor razonablemente preciso del rango de población
(la diferencia entre los valores más grande y más pequeño). Entonces si la distribución de
la población no es demasiado asimétrica, si se divide el rango entre 4 se obtiene un valor
aproximado de lo que s podría ser.
Ejemplo 7.7
Remítase al ejemplo 7.6 sobre voltaje de ruptura. Suponga que el investigador cree que virtualmente todos los valores en la población se encuentran entre 40 y 70. Entonces (70 –
40)/4 7.5 da un valor razonable para s. El tamaño de muestra apropiado para estimar el
voltaje de ruptura promedio verdadero a dentro de 1 kV con nivel de confianza de 95%, es
decir, para que el intervalo de confianza de 95% tenga un ancho de 2 kV, es
n [(1.96)(7.5)/1]2 217
■
Un intervalo de confianza de muestra grande general
Los intervalos de muestra grande x ! z/2 /n
y x ! z/2 s/n
son casos especiales de un
intervalo de confianza de muestra grande general para un parámetro . Suponga que ˆ es un estimador que satisface las siguientes propiedades: 1) Tiene aproximadamente una distribución
normal; 2) es insesgado (por lo menos aproximadamente); y 3) una expresión para ˆ, la desviación estándar de ˆ, está disponible. Por ejemplo, en el caso , ˆ
X es un estimador
insesgado cuya distribución es aproximadamente normal cuando n es grande y ˆ X
/n
. Estandarizando ˆ se obtiene la variable aleatoria Z ( ˆ )/ ˆ, la cual tiene aproximadamente una distribución normal estándar. Esto justifica la proposición de probabilidad
P z/2
ˆ
ˆ
z/2 1
(7.9)
Suponga, primero, que ˆ parámetros desconocidos (p. ej., conocida en el caso ).
Entonces si se reemplaza cada en (7.9) por se obtiene ˆ ! z/2 ˆ, por consiguiente
los límites de confianza inferior y superior son ˆ z/2 ˆ y ˆ z/2 ˆ, respectivamente.
Suponga ahora que ˆ no implica pero sí implica por lo menos otro parámetro desconocido. Sea s ˆ la estimación de ˆ obtenido utilizando estimaciones en lugar de los parámetros
desconocidos (p. ej., s/n
estima /n
). En condiciones generales (esencialmente que s ˆ
se aproxime a ˆ con la mayoría de las muestras), un intervalo de confianza válido es ˆ !
z/2 s ˆ. El intervalo muestral grande x ! z/2 s/n
es un ejemplo.
Por último, suponga que ˆ no implica el desconocido. Este es el caso, por ejemplo,
cuando p, una proporción de población. Entonces (ˆ )/ ˆ z/2 puede ser difícil de
resolver. Con frecuencia se puede obtener una solución aproximada reemplazando en ˆ
por su estimación ˆ. Esto da una desviación estándar estimada s ˆ y el intervalo correspondiente es de nuevo ˆ ! z/2 sˆ.
Un intervalo de confianza para una proporción
de población
Sea p la proporción de “éxitos” en una población, donde éxito identifica a un individuo u
objeto que tiene una propiedad específica (p. ej., individuos que se graduaron en una universidad, computadoras que no requieren servicio de garantía, etc.). Una variable aleatoria
de n individuos que tiene que ser seleccionada y X es el número de éxitos en la muestra.
www.FreeLibros.me
c7_p225-283.qxd
266
3/12/08
CAPÍTULO 7
4:15 AM
Page 266
Intervalos estadísticos basados en una sola muestra
Siempre que n sea pequeño comparado con el tamaño de la población, X puede ser considerada como una variable aleatoria binomial con E(X) np y X n
p(1
)
p. Además, si
tanto np 10 como nq 10, X tiene aproximadamente una distribución normal.
El estimador natural de p es p̂ X/n, la fracción muestral de éxitos. Como p̂ es
simplemente X multiplicada por la constante 1/n, p̂ también tiene aproximadamente una
distribución normal. Como se muestra en la sección 6.1, E( p̂) p (insesgamiento) y
p̂ p
(1
)/
pn. La desviación estándar p̂ implica el parámetro desconocido p. Si se estandariza p̂ restando p y dividiendo entre p̂ entonces se tiene
P z/2
p̂ p
p
(1
p)/
n
z/2 1
Procediendo como se sugirió en la subsección “Derivación de un intervalo de confianza” (sección 7.1), los límites de confianza se obtienen al reemplazar cada por y resolver la ecuación cuadrática resultante para p. Esto da las dos raíces
p̂
p
PROPOSICIÓN
z2/2
! z/2
2n
p̂q̂
z2
/22
n
4n
1 (z2/2)/n
Un intervalo de confianza para una proporción de población p con nivel de confianza aproximadamente de 100(1 )% tiene
p̂
límite de confianza inferior
z2/2
z/2
2n
1
p̂q̂
z2
/22
n
4n
(z2/2)/n
y
(7.10)
p̂
límite de confianza superior
z2/2
z/2
2n
1
p̂q̂
z2
/22
n
4n
(z2/2)/n
Si el tamaño de muestra es bastante grande, z2/(2n) es insignificante comparado con p̂,
z2/(4n2), bajo la raíz cuadrada es insignificante comparado con p̂q̂/n y z2/n es insignificante
comparado con 1. Si se desechan estos términos insignificantes se obtienen los límites de
confianza aproximados
p̂ ! z/2
p̂q̂/
n
(7.11)
Esta es la forma general ˆ ! z/2 ˆ ˆ de un intervalo de muestra grande sugerido en la última
subsección. Por décadas este último intervalo ha sido recomendado en tanto la aproximación normal para p̂ se justifique. Sin embargo, investigaciones recientes han demostrado que
el intervalo un poco más complicado dado en la proposición tiene un nivel de confianza real
que tiende a acercarse más al nivel nominal que el intervalo tradicional (Agresti, Alan y
Coull, “Approximate Is Better Than ‘Exact’ for Interval Estimation of a Binomial Proportion”, The American Statistician, 1998: 119-126). Es decir, si se utiliza z/2 1.96, el nivel
de confianza para el “nuevo” intervalo tiende a acercarse más a 95% con casi todos los valores de p que en el caso del intervalo tradicional; esto también es cierto con otros niveles
de confianza. Además, Agresti y Coull proponen que el intervalo “puede ser recomendado
para usarse con casi todos los tamaños de muestra y valores de parámetro” por lo que las
condiciones n p̂ 10 y nq̂ 10 no tienen que ser verificadas.
www.FreeLibros.me
c7_p225-283.qxd
3/12/08
4:15 AM
Page 267
7.2 Intervalos de confianza de muestra grande para una media y proporción de población
Ejemplo 7.8
267
El artículo “Repeatability and Reproducibility for Pass/Fail Data” (J. of Testing and Eval.,
1997: 151-153) reportó que en n 48 ensayos en un laboratorio particular, 16 dieron por
resultado la ignición de un tipo particular de sustrato por un cigarrillo encendido. Sea p la
proporción a largo plazo de tales ensayos que producirían ignición. Una estimación puntual
de p es p̂ 16/48 0.333. Un intervalo de confianza para p con un nivel de confianza de
aproximadamente 95% es
0.333 (1.96)2/96 ! 1.96(0
(1
)2/9
.3
33)(
0.6
67)/48
.9
6
216
2
1 (1.96) /48
0.373 ! 0.139
(0.217, 0.474)
1.08
El intervalo tradicional es
0.333 ! 1.96 (0
.3
33)(
0.6
67)/48 0.333 ! 0.133 (0.200, 0.466)
Estos dos intervalos concordarían mucho más si el tamaño de muestra fuera sustancialmente más grande.
■
Si se iguala al ancho del intervalo de confianza para p al ancho preespecificado w se
obtiene una ecuación cuadrática para el tamaño de muestra n necesario para dar un intervalo con un grado de precisión deseado. Si se suprime el subíndice en z/2, la solución es
n
4
2z2p̂q̂ z2w2 ! 4
z
p̂
q̂ (p̂q̂
w2)
w
2
z 4
w2
(7.12)
Omitiendo los términos en el numerador que implican w2 se obtiene
n
4z2p̂q̂
w2
Esta última expresión es lo que resulta de igualar el ancho del intervalo tradicional a w.
Estas fórmulas desafortunadamente implican la p̂ desconocida. El método más conservador es aprovechar el hecho de que p̂ q̂ [ p̂(1 p̂)] es un máximo cuando p̂ 0.5.
Por consiguiente si se utiliza p̂ q̂ 0.5 en (7.12), el ancho será cuando mucho w haciendo caso omiso de que el valor de p̂ resulte de la muestra. De manera alternativa, si el investigador cree de manera firme, basado en información previa, que p p0 0.5, en ese caso
se utiliza p0 en lugar de p̂. Un comentario similar es válido cuando p p0 0.5.
Ejemplo 7.9
El ancho del intervalo de confianza de 95% en el ejemplo 7.8 es 0.257. El valor de n necesario para garantizar un ancho de 0.10 independientemente del valor de p̂ es
2
2
)4(0
0.0
)4 380.3
(1
.9
6
.2
5)(
0.2
5
1)
(0.0
1)(
1.9
6
n 2(1.96) (0.25) (1.96) (0.01) ! 4
0.01
Por consiguiente se deberá utilizar un tamaño de muestra de 381. La expresión para n basada en el intervalo de confianza tradicional da un valor un poco más grande de 385.
■
Intervalos de confianza unilaterales
(límites de confianza)
Los intervalos de confianza discutidos hasta ahora dan tanto un límite de confianza inferior
como uno superior para el parámetro que se está estimando. En algunas circunstancias, es
posible que un investigador desee sólo uno de estos dos tipos de límites. Por ejemplo, es posible que un psicólogo desee calcular un límite de confianza superior de 95% para el tiempo
www.FreeLibros.me
c7_p225-283.qxd
268
3/12/08
CAPÍTULO 7
4:15 AM
Page 268
Intervalos estadísticos basados en una sola muestra
de reacción promedio verdadero a un estímulo particular o es posible que un ingeniero de
confiabilidad desee sólo un límite de confianza inferior para la vida útil promedio de componentes de un tipo. Como el área acumulativa bajo la curva normal estándar a la izquierda
de 1.645 es de 0.95,
P
X
S/n
1.645 0.95
Si se manipula la desigualdad entre el paréntesis para aislar en un lado y reemplazan las
variables aleatorias con valores calculados se obtiene la desigualdad x 1.645s/n
;
la expresión a la derecha es el límite de confianza inferior deseado. Comenzando con
P( 1.645 Z) 0.95 y manipulando la desigualdad se obtiene el límite de confianza superior.
Un argumento similar da un límite unilateral asociado con cualquier otro nivel de confianza.
PROPOSICIÓN
Un límite de confianza superior muestral grande para es
s
x z
n
y un límite de confianza inferior muestral grande para es
s
x z
n
Se obtiene un límite de confianza unilateral para p reemplazando z/2 en lugar de
z y ! en lugar de o – en la fórmula para el intervalo de confianza (7.10) para p.
En todos los casos, el nivel de confianza es aproximadamente de 100(1 )%.
Ejemplo 7.10
La prueba de esfuerzo cortante es el procedimiento más aceptado de evaluar la calidad de
una unión entre un material de reparación y su sustrato de concreto. El artículo “Testing the
Bond Between Repair Materials and Concrete Substrate” (ACI Materials J., 1996: 553-558)
reportó que en una investigación particular, una muestra de 48 observaciones de resistencia
al esfuerzo cortante dio una resistencia media muestral de 17.17 N/mm2 y una desviación
estándar muestral de 3.28 N/mm2. Un límite de confianza inferior para la resistencia al esfuerzo cortante promedio verdadera con nivel de confianza de 95% es
17.17 (1.645)
(3.28)
17.17 0.78 16.39
4
8
Es decir, con un nivel de confianza de 95%, el valor de queda en el intervalo (16.39, ).
■
EJERCICIOS
Sección 7.2 (12-27)
12. Una muestra aleatoria de 110 relámpagos en cierta región
dieron por resultado una duración de eco de radar promedio
muestral de 0.81 segundos y una desviación estándar muestral de 0.34 segundos (“Lightning Strikes to an Airplane in a
Thunderstorm”, J. of Aircraft, 1984: 607-611). Calcule un intervalo de confianza de 99% (bilateral) para la duración de
eco promedio verdadera e interprete el intervalo resultante.
13. El artículo “Gas Cooking, Kitchen Ventilation, and Exposure to Combustion Products” (Indoor Air, 2006: 65-73)
reportó que para una muestra de 50 cocinas con estufas de
gas monitoreadas durante una semana, el nivel de CO2 me-
dio muestral (ppm) fue de 654.16 y la desviación estándar
muestral fue de 164.43.
a. Calcule e interprete un intervalo de confianza de 95%
(bilateral) para un nivel de CO2 promedio verdadero en
la población de todas las casas de la cual se seleccionó la
muestra.
b. Suponga que el investigador había hecho una suposición
preliminar de 175 para el valor de la s antes de recopilar
los datos. ¿Qué tamaño de muestra sería necesario para
obtener un ancho de intervalo de 50 ppm para un nivel
de confianza de 95%?
www.FreeLibros.me
c7_p225-283.qxd
3/12/08
4:15 AM
Page 269
7.2 Intervalos de confianza de muestra grande para una media y proporción de población
14. El artículo “Evaluating Tunnel Kiln Performance” (Amer.
Ceramic Soc. Bull., agosto de 1997: 59-63) reportó la siguiente información resumida sobre resistencias a la fractura (MPa) de n 169 barras de cerámica horneadas en un
horno particular: x 89.10, s 3.73.
a. Calcule un intervalo de confianza (bilateral) para la resistencia a la fractura promedio verdadera utilizando un nivel
de confianza de 95%. ¿Se podría decir que la resistencia a
la fractura promedio verdadera fue estimada con precisión?
b. Suponga que los investigadores creyeron a priori que la
desviación estándar de la población era aproximadamente de 4 MPa. Basado en esta suposición, ¿qué tan
grande tendría que ser una muestra para estimar hasta
dentro de 0.5 MPa con 95% de confianza?
15. Determine el nivel de confianza de cada uno de los siguientes límites de confianza unilaterales muestrales grandes:
a. Límite superior: x 0.84s/n
b. Límite inferior: x 2.05s/n
c. Límite superior: x 0.67s/n
16. El tiempo desde la carga hasta el vaciado (min) de un acero al carbono en un tipo de horno Siemens-Martin se determinó para cada hornada en una muestra de tamaño 46 y el
resultado fue un tiempo medio muestral de 382.1 y una desviación estándar muestral de 31.5. Calcule un límite de confianza superior de 95% para el tiempo de carga a vaciado
promedio verdadero.
17. El ejercicio 1.13 dio una muestra de observaciones de resistencia última a la tensión (klb/pulg2). Use los datos de salida
estadísticos descriptivos adjuntos de MINITAB para calcular
un límite de confianza inferior de 99% para la resistencia a la
tensión última promedio verdadera e interprete el resultado.
N Media Mediana MediaTrDesvEstand MedianaSE
153 135.39 135.40 135.41
4.59
0.37
Mínimo Máximo
Q1
Q3
122.20 147.70 132.95 138.25
18. El artículo “Ultimate Load Capacities of Expansion Anchor
Bolts” (J. of Energy Engr., 1993: 139-158) reportó los siguientes datos resumidos sobre resistencia al esfuerzo cortante (klb/pulg2) para una muestra de pernos de anclaje de 3/8
pulg: n 78, x 4.25, s 1.30. Calcule un límite de confianza inferior utilizando un nivel de confianza de 90% para
una resistencia al esfuerzo cortante promedio verdadero.
19. El artículo “Limited Yield Estimation for Visual Defect
Sources” (IEEE Trans. on Semiconductor Manuf., 1997:
17-23) reportó que, en un estudio de un proceso de inspección de obleas particular, 356 troqueles fueron examinados
por una sonda de inspección y 201 de éstos pasaron la prueba. Suponiendo un proceso estable, calcule un intervalo de
confianza (bilateral) de 95% para la proporción de todos los
troqueles que pasan la prueba.
20. La Prensa Asociada (9 de octubre de 2002) reportó que en
una encuesta de 4722 jóvenes estadounidenses de 6 a 19 años
de edad, 15% sufría de problemas serios de sobrepeso (un índice de masa corporal de por lo menos 30; este índice mide
el peso con respecto a la estatura). Calcule e interprete un intervalo de confianza utilizando un nivel de confianza de 99%
para la proporción de todos los jóvenes estadounidenses con
un problema de sobrepeso serio.
269
21. Se seleccionó una muestra aleatoria de 539 familias de una
ciudad del medio oeste y se determinó que 133 de éstas poseían por lo menos un arma de fuego (“The Social Determinants of Gun Ownership: Self-Protection in an Urban
Environment”, Criminology, 1997: 629-640). Utilizando un
nivel de confianza de 95%, calcule un límite de confianza
inferior para la proporción de todas las familias en esta ciudad que poseen por lo menos un arma de fuego.
22. Se seleccionó una muestra aleatoria de 487 mujeres no fumadoras de peso normal (índice de masa corporal entre 19.8 y
26.0) que había dado a luz en un gran centro médico metropolitano (“The Effects of Cigarette Smoking and Gestational Weight Change on Birth Outcomes in Obese and Normal
Weight Women”, Amer. J. of Public Health, 1997: 591-596).
Se determinó que 7.2% de estos nacimientos dieron por resultado niños con bajo peso al nacer (menos de 2500 g). Calcule
un límite de confianza superior utilizando un nivel de confianza de 99% para la proporción de todos esos nacimientos que
dieron por resultado niños de bajo peso al nacer.
23. El artículo “An Evaluation of Football Helmets Under Impact Conditions” (Amer. J. Sports Medicine, 1984: 233237) reporta que cuando cada casco de fútbol en una
muestra aleatoria de 37 cascos de tipo suspensión se sometieron a una prueba de impacto, 24 mostraron daños. Sea p
la proporción de todos los cascos de este tipo que mostraría
daños cuando se someten a prueba de la manera prescrita.
a. Calcule un intervalo de confianza de 99% para p.
b. ¿Qué tamaño de muestra se requeriría para que el ancho
de un intervalo de confianza de 99% sea cuando mucho de
0.10, independientemente de p̂?
24. Una muestra de 56 muestras de algodón produjo un porcentaje de alargamiento promedio muestral de 8.17 y una desviación estándar de 1.42 (“An Apparent Relation Between
the Spiral Angle , the Percent Elongation E1, and the Dimensions of the Cotton Fiber”, Textile Research J., 1978:
407-410). Calcule un intervalo de confianza de 95% muestral grande para el porcentaje de alargamiento promedio
verdadero . ¿Qué suposiciones está haciendo sobre la distribución del porcentaje de alargamiento?
25. Una legisladora estatal desea encuestar a los residentes de su
distrito para ver qué proporción del electorado está consciente de su posición sobre la utilización de fondos estatales
para solventar abortos.
a. ¿Qué tamaño de muestra es necesario si el intervalo de
confianza de 95% para p debe tener un ancho de cuando
mucho 0.10 independientemente de p?
b. Si la legisladora está firmemente convencida de que por
2
lo menos 3 del electorado conoce su posición, ¿qué tamaño de muestra recomendaría?
26. El superintendente de un gran distrito escolar, que una ocasión
tomó un curso de probabilidad y estadística, cree que el número de maestros ausentes en cualquier día dado tiene una distribución de Poisson con parámetro . Use los datos adjuntos
sobre ausencias durante 50 días para obtener un intervalo de
confianza muestral grande para . [Sugerencia: La media y la
varianza de una variable de Poisson son iguales a , por consiguiente
X
Z
/n
www.FreeLibros.me
c7_p225-283.qxd
270
3/12/08
CAPÍTULO 7
4:15 AM
Page 270
Intervalos estadísticos basados en una sola muestra
tiene aproximadamente una distribución normal estándar.
Ahora prosiga como en la derivación del intervalo para p
haciendo una proposición de probabilidad (con probabilidad de 1 ) y resolviendo las desigualdades resultantes
para (véase el argumento exactamente después de (7.10)).]
Número de
ausencias
0
1
2
3
4
5
6
7
8
9
10
Frecuencia
1
4
8
10
8
7
5
3
2
1
1
27. Reconsidere el intervalo de confianza (7.10) para p y enfóquese en un nivel de confianza de 95%. Demuestre que los
límites de confianza concuerdan bastante bien con los del
intervalo tradicional (7.11) una vez que dos éxitos y dos
fallas se anexaron a la muestra [es decir, (7.11) basado en
x 2 éxitos (S) en n 4 ensayos]. [Sugerencia: 1.96 2.
Nota: Agresti y Coull demostraron que este ajuste del intervalo tradicional también tiene un nivel de confianza próximo al nivel nominal.]
7.3 Intervalos basados en una distribución
de población normal
El intervalo de confianza para presentado en la sección 7.2 es válido siempre que n es
grande. El intervalo resultante puede ser utilizado cualquiera que sea la naturaleza de la distribución de la población. El teorema del límite central no puede ser invocado, sin embargo,
cuando n es pequeña. En este caso, una forma de proceder es hacer una suposición específica sobre la forma de la distribución de la población y luego obtener un intervalo de confianza adecuado a esa suposición. Por ejemplo, se podría desarrollar un intervalo de confianza
para , cuando una distribución gama describe la población, otro para el caso de una población Weibull, y así sucesivamente. Estadísticos en realidad han realizado este programa para
varias familias distribucionales diferentes. Como la distribución normal es más frecuentemente apropiada como modelo de una población que cualquier otro tipo de distribución, la
atención aquí se concentrará en un intervalo de confianza para esta situación.
SUPOSICIÓN
La población de interés es normal, de modo que X1, . . . , Xn constituyen una muestra
aleatoria tomada de una distribución normal con y desconocidas.
El resultado clave que sustenta el intervalo de la sección 7.2 fue que con n grande, la
variable aleatoria Z (X
) tiene aproximadamente una distribución normal es )/(S/n
tándar. Cuando n es pequeño, no es probable que S se aproxime a , de modo que la variabilidad de la distribución de Z surge la aleatoriedad tanto en el numerador como en el
denominador. Esto implica que la distribución de probabilidad de (X
) se dis )/(S/n
persará más que la distribución normal estándar. El resultado en el cual están basadas las inferencias introduce una nueva familia de distribuciones de probabilidad llamada familia de
distribuciones t.
TEOREMA
Cuando X
es la media de una muestra aleatoria de tamaño n tomada de una distribución normal con media , la variable aleatoria
X
T
(7.13)
S/
n
tiene una distribución de probabilidad llamada distribución t con n – 1 grados de libertad (gl).
Propiedades de distribuciones t
Antes de aplicar este teorema, se impone una discusión de propiedades de distribuciones t.
Aunque la variable de interés sigue siendo (X
), ahora se denota por T para re )/(S/n
calcar que no tiene una distribución normal estándar cuando n es pequeña. Recuérdese que
www.FreeLibros.me
c7_p225-283.qxd
3/12/08
4:15 AM
Page 271
7.3 Intervalos basados en una distribución de población normal
271
una distribución normal está regida por dos parámetros, la media y la desviación estándar
. Una distribución t está regida por sólo un parámetro, llamado número de grados de libertad de la distribución, abreviado como gl. Este parámetro se denota con la letra griega
. Posibles valores de son los enteros positivos 1, 2, 3, . . . Cada diferente valor del parámetro corresponde a una distribución t diferente.
Con cualquier valor fijo del parámetro , la función de densidad que especifica la
curva t asociada tiene una apariencia incluso más complicada que la función de densidad
normal. Afortunadamente, sólo hay que ocuparse de algunas de las más importantes características de estas curvas.
Propiedades de distribuciones t
Sea t , la curva de función de densidad para el grado de libertad .
1.
2.
3.
4.
Cada curva t tiene forma de campana y con su centro en 0.
Cada curva t está más esparcida que la curva (z) normal estándar.
Conforme se incrementa, la dispersión de t correspondiente disminuye.
A medida que A , la secuencia de curvas t tiende a la curva normal estándar
(así que la curva z a menudo se llama curva t con grado de libertad ).
La figura 7.6 ilustra varias de estas propiedades con valores seleccionados de .
Curva z
Curva t25
Curva t5
0
Figura 7.6
Curvas t y z.
El número de grados de libertad con T en (7.13) es n 1 porque, aunque S está basada en las n desviaciones X1
X, . . . , X
X, (Xi
X) 0 implica que sólo n – 1 de ésn
tas están “libremente determinadas”. El número de grados de libertad para una variable t es
el número de desviaciones libremente determinadas en las cuales está basada la desviación
estándar estimada en el denominador de T.
Como se desea utilizar T para obtener un intervalo de confianza del mismo modo que
Z fue previamente utilizada, es necesario establecer una notación análoga a z para la distribución t.
Notación
Sea t, el número sobre el eje de medición con el cual el área bajo la curva t con
grados de libertad a la derecha de t, es ; t, se llama valor crítico t.
www.FreeLibros.me
c7_p225-283.qxd
272
3/12/08
CAPÍTULO 7
4:15 AM
Page 272
Intervalos estadísticos basados en una sola muestra
Esta notación se ilustra en la figura 7.7. La tabla A.5 del apéndice da t, con valores seleccionados de y . Esta tabla también aparece en el interior de la tapa posterior. Las columnas de la tabla corresponden a diferentes valores de . Para obtener t0.05,15, hay que ir a la
columna 0.05, buscar hacia abajo en la fila 15 y leer t0.05,15 1.753. Asimismo,
t0.05,22 1.717 (columna 0.05, fila 22) y t0.01,22 2.508.
Curva t
Área sombreada
0
t ,
Figura 7.7
Definición pictórica de t, .
Los valores de t, exhiben un comportamiento regular al recorrer una fila o al descender por una columna. Con fijo, t, se incrementa a medida que disminuye, puesto que
hay que moverse más a la derecha de cero para capturar el área en la cola. Con fija, a
medida que se incrementa (es decir, cuando se recorre hacia abajo cualquier columna particular de la tabla t) el valor de t, disminuye. Esto es porque un valor más grande de implica una distribución t con dispersión más pequeña, de modo que no es necesario ir más
lejos de cero para capturar el área de cola . Además, t, disminuye más lentamente a medida que se incrementa. Por consiguiente, los valores que aparecen en la tabla se muestran
en incrementos de 2 entre 30 y 40 grados de libertad y luego saltar a 50, 60, 120 y por
último . Como t es la curva normal estándar, los valores z conocidos aparecen en la última fila de la tabla. La regla empírica sugería con anterioridad que el uso del intervalo de
confianza muestral grande (si n 40) proviene de la igualdad aproximada de las distribuciones normales estándar y t con
40.
Intervalo de confianza t para una muestra
La variable estandarizada T tiene una distribución t con n – 1 grados de libertad y el área
bajo la curva de densidad t correspondiente entre t/2,n1 y t/2,n1 es 1 (el área /2 queda en cada cola), por consiguiente
P(t/2,n1 T t/2,n1) 1
(7.14)
La expresión (7.14) difiere de las expresiones que aparecen en secciones previas en que T y
t/2,n1 se utilizan en lugar de Z y z/2, aunque pueden ser manipuladas de la misma manera
para obtener un intervalo de confianza para .
PROPOSICIÓN
Sean x y s la media y la desviación estándar muestrales calculadas con los resultados
de una muestra aleatoria tomada de una población normal con media . Entonces un
intervalo de confianza de 100(1 )% para es
x t
/2,n1
s
s
, x t/2,n1
n
n
(7.15)
o, más compactamente, x ! t/2,n1 s/n.
Un límite de confianza superior para es
s
x t,n1
n
y reemplazando por en la última expresión se obtiene un límite de confianza inferior para , ambos con nivel de confianza de 100(1 )%.
www.FreeLibros.me
3/12/08
4:15 AM
Page 273
7.3 Intervalos basados en una distribución de población normal
Ejemplo 7.11
273
Como parte de un proyecto más grande para estudiar el comportamiento de paneles de revestimiento sometidos a esfuerzo, un componente estructural extensamente utilizado en Estados Unidos, el artículo “Time-Dependent Bending Properties of Lumber” (J. of Testing
and Eval., 1996: 187-193) reportó sobre varias propiedades mecánicas de especímenes de
madera de pino escocés. Considere las siguientes observaciones de módulo de elasticidad
(MPa) obtenidas un minuto después de cargar una configuración:
10 490
16 620
17 300
15 480
12 970
17 260
13 400
13 900
13 630
13 260
14 370
11 700
15 470
17 840
14 070
14 760
La figura 7.8 muestra un diagrama de probabilidad normal obtenido con R. La rectitud del
diagrama apoya fuertemente la suposición de que la distribución de la población del módulo de elasticidad es por lo menos aproximadamente normal.
Diagrama Q-Q normal
18 000
Cuartiles muestrales
c7_p225-283.qxd
16 000
14 000
12 000
10 000
-2
-1
0
1
2
Cuartiles teóricos
Figura 7.8
Diagrama de probabilidad normal de los datos de módulo de elasticidad.
El cálculo manual de la media y la desviación estándar muestrales se simplifica restando 10 000 de cada observación: yi xi 10 000. Es fácil verificar que yi 72 520 y
y i2 392 083 800, de donde y 4532.5 y sy 2055.67. Por consiguiente x 14 532.5
y sx 2055.67 (el sumar o restar la misma cantidad de cada observación no afecta la variabilidad). El tamaño de muestra es 16, así que un intervalo de confianza para el módulo de elasticidad medio de la población está basado en 15 grados de libertad. Un nivel de confianza de
95% para un intervalo bilateral requiere el valor crítico t de 2.131. El intervalo resultante es
s
2055.67
x ! t0.025,15
14 532.5 ! (2.131)
n
1
6
14 532.5 ! 1095.2 (13 437.3, 15 627.7)
Este intervalo es bastante ancho tanto debido al tamaño de muestra pequeño como por la
gran cantidad de variabilidad de la muestra. Un límite de confianza inferior de 95% se obtiene utilizando y 1.753 en lugar de ! y 2.131, respectivamente.
■
Por desgracia, no es fácil seleccionar n para controlar el ancho del intervalo t. Esto es
porque el ancho implica la s desconocida (antes de recopilar los datos) y porque n ingresa
no sólo a través de 1/n sino también a través de t/2,n1. Por consiguiente, se puede obtener una n apropiada sólo mediante ensayo y error.
En el capítulo 15, se discutirá un intervalo de confianza de muestra pequeña para
que es válido siempre que sólo la distribución de la población sea simétrica, una suposición más débil que la de normalidad. No obstante, cuando la distribución de la población
es normal, el intervalo t tiende a acortarse más de lo que lo haría cualquier otro intervalo
con el mismo nivel de confianza.
www.FreeLibros.me
c7_p225-283.qxd
274
3/12/08
CAPÍTULO 7
4:15 AM
Page 274
Intervalos estadísticos basados en una sola muestra
Un intervalo de predicción para un solo valor futuro
En muchas aplicaciones, un investigador desea predecir un solo valor de una variable que tiene que ser observada en un tiempo futuro, en lugar de estimar el valor medio de dicha variable.
Ejemplo 7.12
Considere la siguiente muestra de contenido de grasa (en porcentaje) de n 10 perros calientes seleccionados al azar (“Sensory and Mechanical Assessment of the Quality of Frankfurters”, J. Texture Studies, 1990: 395-409):
25.2
21.3
22.8
17.0
29.8
21.0
25.5
16.0
20.9
19.5
Suponiendo que estas observaciones se seleccionaron de una distribución de población normal, un intervalo de confianza de 95% para (estimación del intervalo de) el contenido de
grasa medio de la población es
s
4.134
x ! t0.025,9
21.90 ! 2.262
21.90 ! 2.96
n
1
0
(18.94, 24.86)
Suponga, sin embargo, que se va a comer un solo perro caliente de este tipo y desea predecir el contenido de grasa resultante. Una predicción puntual, análoga a una estimación puntual, es simplemente x 21.90. Esta predicción desafortunadamente no da información
sobre confiabilidad o precisión.
■
El escenario general es como sigue. Se dispondrá de una muestra aleatoria X1, X2, . . . ,
Xn tomada de una distribución de población normal y se desea predecir el valor de Xn1, una
sola observación futura. Un predictor puntual es X
y el error de predicción resultante es
X
Xn1. El valor esperado del error de predicción es
E(X
Xn1) E(X
) E(Xn1) 0
Como Xn1, es independiente de X1, . . . , Xn, es independiente de
X, así que la varianza del
error de predicción es
2
1
V(X
2 2 1
Xn1) V(X
) V(Xn1)
n
n
El error de predicción es una combinación lineal de variables aleatorias independientes normalmente distribuidas, así que también está normalmente distribuido. Por consiguiente
(X
X
Xn1) 0
Xn1
1
1
2 1
2 1
n
n
tiene una distribución normal estándar. Se puede demostrar que si se reemplaza con la
desviación estándar muestral S (de X1, . . . , Xn) se obtiene
Z
T
X
Xn1
1
S 1
n
distribución t con n 1 grados de libertad
Si se manipula esta variable T como se manipuló T (X
) en el desarrollo de
)/(S/n
un intervalo de confianza se obtiene el siguiente resultado.
PROPOSICIÓN
Un intervalo de predicción (IP) para una sola observación que tiene que ser seleccionado de una distribución de población normal es
1
x ! t/2,n1 s 1
n
El nivel de predicción es 100(1 )%.
www.FreeLibros.me
(7.16)
c7_p225-283.qxd
3/12/08
4:15 AM
Page 275
7.3 Intervalos basados en una distribución de población normal
275
La interpretación de un nivel de predicción de 95% es similar a la de un nivel de confianza
de 95%; si se calcula el intervalo (7.16) para muestra tras muestra, a la larga 95% de estos
intervalos incluirán los valores futuros correspondientes de X.
Ejemplo 7.13
(continuación
del ejemplo
7.12)
Con n 10, x 21.90, s 4.134 y t0.025,9 2.262, un intervalo de predicción de 95%
para el contenido de grasa de un solo perro caliente es
21.90 ! 9.81
10
21.90 ! (2.262)(4.134) 1
1
(12.09, 31.71)
El intervalo es bastante ancho, lo que indica una incertidumbre sustancial en cuanto al contenido de grasa. Obsérvese que el ancho del intervalo de predicción es más de tres veces el
del intervalo de confianza.
■
El error de predicción es
X Xn1, la diferencia entre dos variables aleatorias, en tanto que el error de estimación es X
, la diferencia entre una variable aleatoria y un valor
fijo (aunque desconocido). El intervalo de predicción es más ancho que el intervalo de confianza porque hay más variabilidad en el error de predicción (debido a Xn1) que en el error
de estimación. De hecho, a medida que n se hace arbitrariamente grande, el intervalo de confianza se contrae a un solo valor y el intervalo de predicción tiende a ! z/2 . Existe
incertidumbre con respecto a un solo valor X incluso cuando no hay necesidad de estimarlo.
Intervalos de tolerancia
Considérese una población de automóviles de cierto tipo y supóngase que en condiciones
específicas, la eficiencia de combustible (mpg) tiene una distribución normal con 30 y
2. Entonces como el intervalo de 1.645 a 1.645 captura 90% del área bajo la curva z,
90% de todos estos automóviles tendrán valores de eficiencia de combustible entre
1.645 26.71 y 1.645 33.29. Pero ¿qué sucederá si los valores de y no
son conocidos? Se puede tomar una muestra de tamaño n, determinar las eficiencias de combustible, x y s y formar el intervalo cuyo límite inferior es x 1.645s y cuyo límite superior es x 1.645s. Sin embargo, debido a la variabilidad de muestreo en las estimaciones
de y , existe una buena probabilidad de que el intervalo resultante incluirá menos de
90% de los valores de la población. Intuitivamente, para tener a priori una probabilidad
de 95% del intervalo resultante incluido por lo menos 90% de los valores de la población,
cuando x y s se utilizan en lugar de y , también se deberá reemplazar 1.645 con un número más grande. Por ejemplo, cuando n 20, el valor 2.310 es tal que se puede estar 95%
confiado en que el intervalo x ! 2.310s incluirá por lo menos 90% de los valores de eficiencia de combustible en la población.
Sea k un número entre 0 y 100. Un intervalo de tolerancia para capturar por lo menos el k% de los valores en una distribución de población normal con nivel de confianza de 95% tiene la forma
x ! (valor crítico de tolerancia) s
En la tabla A.6 del apéndice aparecen valores críticos de tolerancia con k 90, 95 y
99 en combinación con varios tamaños de muestra. Esta tabla también incluye valores críticos para un nivel de confianza de 99% (estos valores son más grandes que los
valores correspondientes al 95%). Si se reemplaza ! con se obtiene un límite de
tolerancia superior y si se utiliza en lugar de ! se obtiene un límite de tolerancia
inferior. En la tabla A.6 también aparecen valores críticos para obtener estos límites
unilaterales.
www.FreeLibros.me
c7_p225-283.qxd
276
3/12/08
CAPÍTULO 7
4:15 AM
Page 276
Intervalos estadísticos basados en una sola muestra
Ejemplo 7.14
Regresemos a los datos de módulo de elasticidad discutidos en el ejemplo 7.11, donde n
16, x 14532.5, s 2055.67 y una curva de probabilidad normal de los datos indicaron
que la normalidad de la población era bastante factible. Con un nivel de confianza de 95%,
un intervalo de tolerancia bilateral para capturar por lo menos 95% de los valores de módulo de elasticidad de especímenes de madera en la población muestreada utiliza el valor crítico de tolerancia de 2.903. El intervalo resultante es
14 532.5 ! (2.903)(2055.67) 14 532.5 ! 5967.6 (8 564.9, 20 500.1)
Se puede estar totalmente confiado de que por lo menos 95% de todos los especímenes de
madera tienen valores de módulo de elasticidad entre 8564.9 y 20500.1.
El intervalo de confianza de 95% para fue (13437.3, 15627.7) y el intervalo de predicción de 95% para el módulo de elasticidad de un solo espécimen de madera es (10017.0,
19048.0). Tanto el intervalo de predicción como el intervalo de tolerancia son sustancialmente más anchos que el intervalo de confianza.
■
Intervalos basados en distribuciones
de población no normales
El intervalo de confianza t para una muestra de es robusto en cuanto a alejamientos pequeños o incluso moderados de la normalidad a menos que n sea bastante pequeño. Con esto
se quiere decir que si se utiliza un valor crítico para confianza de 95%, por ejemplo, al calcular
el intervalo, el nivel de confianza real se aproximará de manera razonable al nivel nominal de
95%. Sin embargo, si n es pequeño y la distribución de la población es altamente no normal,
entonces el nivel de confianza real puede ser diferente en forma considerable del que se utiliza
cuando se obtiene un valor crítico particular de la tabla t. Ciertamente ¡sería penoso creer que
el nivel de confianza es de más o menos 95% cuando en realidad era como de 88%! Se ha
visto que la técnica bootstrap, introducida en la sección 7.1 es bastante exitosa al estimar
parámetros en una amplia variedad de situaciones no normales.
En contraste con el intervalo de confianza, la validez de los intervalos de predicción y
tolerancia descritos en esta sección están estrechamente vinculados a la suposición de normalidad. Estos últimos intervalos no deberán ser utilizados sin evidencia apremiante de normalidad. La excelente referencia Statistical Intervals, citada en la bibliografía al final de este
capítulo, discute procedimientos alternativos de esta clase en otras situaciones.
EJERCICIOS
Sección 7.3 (28-41)
28. Determine los valores de las siguientes cantidades:
a. t0.1,15 b. t0.05,15 c. t0.05,25 d. t0.05,40 e. t0.005,40
29. Determine el valor crítico t que capturará el área deseada de
la curva t en cada uno de los siguientes casos:
a. Área central 0.95, gl 10
b. Área central 0.95, gl 20
c. Área central 0.99, gl 20
d. Área central 0.99, gl 50
e. Área de cola superior 0.01, gl 25
f. Área de cola inferior 0.025, gl 5
30. Determine el valor t crítico de un intervalo de confianza bilateral en cada una de las siguientes situaciones:
a. Nivel de confianza 95%, gl 10
b. Nivel de confianza 95%, gl 15
c. Nivel de confianza 99%, gl 15
d. Nivel de confianza 99%, n 5
e. Nivel de confianza 98%, gl 24
f. Nivel de confianza 99%, n 38
31. Determine el valor t crítico para un límite de confianza inferior o superior en cada una de las situaciones descritas en
el ejercicio 30.
32. Una muestra aleatoria de n 18 especímenes de prueba de
fibra de vidrio E de un tipo dio un esfuerzo de cedencia por
esfuerzo cortante interfacial medio muestral de 30.2 y una
desviación estándar muestral de 3.1 (“On Interfacial Failure in Notched Unidirectional Glass/Epoxy Composites”, J. of
Composite Materials, 1985: 276–286). Suponiendo que el
esfuerzo de cedencia por esfuerzo cortante interfacial está
normalmente distribuido, calcule un intervalo de confianza de 95% para el esfuerzo promedio verdadero (como lo
hicieron los autores del artículo citado).
www.FreeLibros.me
c7_p225-283.qxd
3/12/08
4:15 AM
Page 277
7.3 Intervalos basados en una distribución de población normal
33. El artículo “Measuring and Understanding the Aging of
Kraft Insulating Paper in Power Transformers” (IEEE Electrical Insul. Mag., 1996: 28-34) contiene las siguientes observaciones de grado de polimerización de especímenes de
papel para los cuales la concentración de tiempos de viscosidad cayeron en un rango medio:
418
434
454
421
437
463
421
439
465
422
446
425
447
427
448
431
453
a. Construya una gráfica de caja de los datos y comente sobre cualquier característica interesante.
b. ¿Es factible que las observaciones muestrales dadas fueron seleccionadas de una distribución normal?
c. Calcule un intervalo de confianza de 95% bilateral para
un grado de polimerización promedio verdadero (como
lo hicieron los autores del artículo). ¿Sugiere este intervalo que 440 es un valor factible del grado de polimerización promedio verdadero? ¿Qué hay en cuanto a 450?
34. Una muestra de 14 especímenes de junta de un tipo particular produjo un esfuerzo límite proporcional medio muestral
de 8.48 MPa y una desviación estándar muestral de 0.79 MPa
(“Characterization of Bearing Strength Factors in Pegged
Timber Connections”, J. of Structural Engr., 1997: 326-332).
a. Calcule e interprete un límite de confianza inferior de
95% para el esfuerzo límite proporcional promedio verdadero de todas las juntas. ¿Qué suposiciones hizo sobre
la distribución del esfuerzo límite proporcional?
b. Calcule e interprete un límite de predicción inferior de
95% para el esfuerzo límite proporcional de una sola
unión de este tipo.
35. Para corregir deformidades nasales congénitas se utiliza rinoplastia de aumento mediante implante de silicón. El éxito del
procedimiento depende de varias propiedades biomecánicas
del periostio y fascia nasales humanas. El artículo “Biomechanics in Augmentation Rhinoplasty” (J. of Med. Engr. and
Tech., 2005: 14-17) reportó que para una muestra de 15 adultos (recién fallecidos), la deformación de falla media (en porcentaje) fue de 25.0 y la desviación estándar fue de 3.5.
a. Suponiendo una distribución normal de la deformación
de falla, estime la deformación promedio verdadera en
una forma que transmita información acerca de precisión y confiabilidad.
b. Pronostique la deformación para un solo adulto en una
forma que transmita información sobre precisión y confiabilidad. ¿Cómo se compara la predicción con la estimación calculada en el inciso a)?
36. Las n 26 observaciones de tiempo de escape dadas en el
ejercicio 36 del capítulo 1 dan una media y desviación estándar muestrales de 370.69 y 24.36, respectivamente.
a. Calcule un límite de confianza superior para el tiempo
de escape medio de la población utilizando un nivel de
confianza de 95 por ciento.
b. Calcule un límite de predicción superior para el tiempo
de escape de un solo trabajador adicional utilizando un
nivel de predicción de 95%. ¿Cómo se compara este límite con el límite de confianza del inciso a)?
c. Suponga que se escogerán dos trabajadores más para participar en el ejercicio de escape simulado. Denote sus
277
tiempos de escape por X27 y X28 y sea
Xnuevo el promedio
de estos dos valores. Modifique la fórmula para un intervalo de predicción con un solo valor de x para obtener un
intervalo de predicción para
Xnuevo y calcule un intervalo
bilateral de 95% basado en los datos de escape dados.
37. Un estudio de la capacidad de individuos de caminar en línea recta (“Can We Really Walk Straight?” Amer. J. of Physical Anthro, 1992: 19-27) reportó los datos adjuntos sobre
cadencia (pasos por segundo) con una muestra de n 20
hombres saludables seleccionados al azar.
0.95 0.85 0.92
0.95 0.93 0.86
1.00 0.92 0.85 0.81
0.78 0.93 0.93
1.05 0.93 1.06
1.06 0.96 0.81 0.96
Un diagrama de probabilidad normal apoya de manera sustancial la suposición de que la distribución de la población de cadencia es aproximadamente normal. A continuación se da un
resumen descriptivo de los datos obtenidos con MINITAB:
Variable N Media Mediana MediaTR DesvEst MedianaSE
Cadencia 20 0.9255 0.9300 0.9261 0.0809 0.0181
Cadencia
variable
Mín
Máx
Q1
Q3
0.7800 1.0600 0.8525 0.9600
a. Calcule e interprete un intervalo de confianza de 95%
para la cadencia media de la población.
b. Calcule e interprete un intervalo de predicción de 95%
para la cadencia de un solo individuo seleccionado
al azar de esta población.
c. Calcule un intervalo que incluya por lo menos 99% de
las cadencias incluidas en la distribución de la población
utilizando un nivel de confianza de 95 por ciento.
38. Se seleccionó una muestra de 25 piezas de laminado utilizado en la fabricación de tarjetas de circuito y se determinó
la cantidad de pandeo (pulg) en condiciones particulares
con cada pieza y el resultado fue un pandeo medio muestral
de 0.0635 y una desviación estándar muestral de 0.0065.
a. Calcule una predicción de la cantidad de pandeo de una
sola pieza de laminado de una manera que proporcione
información sobre precisión y confiabilidad.
b. Calcule un intervalo con el cual pueda tener un alto grado de confianza de que por lo menos 95% de todas las
piezas de laminado produzcan cantidades de pandeo que
estén entre los dos límites del intervalo.
39. El ejercicio 72 del capítulo 1 dio las siguientes observaciones de afinidad de receptor (volumen de distribución ajustado) con una muestra de 13 individuos sanos: 23, 39, 40,
41, 43, 47, 51, 58, 63, 66, 67, 69, 72.
a. ¿Es factible que la distribución de la población de la cual
se seleccionó esta muestra sea normal?
b. Calcule un intervalo con el cual pueda estar 95% confiado de que por lo menos 95% de todos los individuos
saludables en la población tienen volúmenes de distribución ajustados que quedan entre los límites del intervalo.
c. Pronostique el volumen de distribución ajustado de un
solo individuo saludable calculando un intervalo de
predicción de 95%. ¿Cómo se compara el ancho de este
intervalo con el ancho del intervalo calculado en el inciso b)?
www.FreeLibros.me
c7_p225-283.qxd
278
3/12/08
CAPÍTULO 7
4:15 AM
Page 278
Intervalos estadísticos basados en una sola muestra
40. El ejercicio 13 del capítulo 1 presentó una muestra de n
153 observaciones de resistencia última a la tensión y el
ejercicio 17 de la sección previa dio cantidades resumidas y
solicitó un intervalo de confianza muestral grande. Como el
tamaño de muestra es grande, no se requieren suposiciones
sobre la distribución de la población en cuanto la validez
del intervalo de confianza.
a. ¿Se requiere alguna suposición sobre la distribución
de la resistencia a la tensión antes de calcular un límite de
predicción inferior para la resistencia a la tensión del
nuevo espécimen seleccionado por medio del método
descrito en esta sección? Explique.
b. Use un paquete de software estadístico para investigar la
probabilidad de una distribución de población normal.
c. Calcule un límite de predicción inferior con un nivel de
predicción de 95% para la resistencia última a la tensión
del siguiente espécimen seleccionado.
41. Una tabla más extensa de valores t críticos que la que aparece en este libro muestra que para la distribución t con 20
grados de libertad, las áreas a la derecha de los valores
0.687, 0.860 y 1.064 son 0.25, 0.20 y 0.15, respectivamente. ¿Cuál es el nivel de confianza para cada uno de los siguientes tres intervalos de confianza para la media de una
distribución de población normal? ¿Cuál de los tres intervalos recomendaría utilizar y por qué?
a. (x 0.687s/2
1, x 1.725s/2
1)
b. (x 0.860s/2
1, x 1.325s/2
1)
c. (x 1.064s/2
1, x 1.064s/2
1)
7.4 Intervalos de confianza para la varianza
y desviación estándar de una población normal
Aun cuando las inferencias por lo que se refiere a la varianza 2 o a la desviación estándar
de una población en general son de menos interés que aquellas con respecto a una media o
proporción, hay ocasiones en que se requieren tales procedimientos. En el caso de una distribución de población normal, las inferencias están basadas en el siguiente resultado por lo
que se refiere a la varianza muestral S 2.
TEOREMA
Sean X1, X2, . . . , Xn una muestra aleatoria de una distribución normal con parámetros
y 2. Entonces la variable aleatoria
(n 1)S 2
2
(Xi X
)2
2
tiene una distribución de probabilidad ji cuadrada (2) con n 1 grados de libertad.
Como se discutió en las secciones 4.4 y 7.1, la distribución ji cuadrada es una distribución de probabilidad continua con un solo parámetro , llamado número de grados de libertad, con posibles valores de 1, 2, 3, . . . Las gráficas de varias funciones de distribución
de probabilidad 2 se ilustran en la figura 7.9. Cada función de distribución de probabilidad
f(x; ) es positiva sólo con x 0 y cada una tiene asimetría positiva (una larga cola superior), aunque la distribución se mueve hacia la derecha y se vuelve más simétrica a medida
que se incrementa . Para especificar procedimientos inferenciales que utilizan la distribución ji cuadrada, se requiere una notación análoga a aquella para un valor t crítico t, .
f (x; )
8
12
20
x
Figura 7.9
Gráficas de funciones de densidad ji cuadrada.
www.FreeLibros.me
c7_p225-283.qxd
3/12/08
4:15 AM
Page 279
7.4 Intervalos de confianza para la varianza y desviación estándar de una población normal
279
Notación
2
Sea ,
, llamado valor crítico ji cuadrada, el número sobre el eje de medición de
modo que del área bajo la curva ji cuadrada con grados de libertad quede a la
2
derecha de ,
.
La simetría de las distribuciones t hizo que fuera necesario tabular sólo valores críticos t de cola superior (t, con valores pequeños de ). La distribución ji cuadrada no es si2
métrica, por lo que la tabla A.7 del apéndice contiene valores de ,
tanto para cerca de
0 como cerca de 1, como se ilustra en la figura 7.10b). Por ejemplo, 20.025,14 26.119 y
20.95,20 (el 5o percentil) 10.851.
2 función de distribución
de probabilidad
Cada área
sombreada 0.01
Área sombreada
2,
2
0.99,
a)
2
0.01,
b)
Figura 7.10
Notación 2, ilustrada.
La variable aleatoria (n 1)S 2/ 2 satisface los dos parámetros en los cuales está basado el método general de obtener un intervalo de confianza. Es una función del parámetro
de interés 2, no obstante su distribución de probabilidad (ji cuadrada) no depende de este
parámetro. El área bajo una curva ji cuadrada con grados de libertad a la derecha de 2/2,
es /2, lo mismo que a la izquierda de 21/2, . De este modo el área capturada entre estos
dos valores críticos es 1 . Como una consecuencia de esto y el teorema que se acaba de
formular,
P 21/2,n1
(n 1)S 2
2/2,n1 1
2
(7.17)
Las desigualdades en (7.17) equivalen a
(n 1)S 2
(n 1)S 2
2 2
2
/2,n1
1/2,n1
Sustituyendo el valor calculado s2 en los límites se obtiene un intervalo de confianza para
2 y tomando las raíces cuadradas se obtiene un intervalo para .
Un intervalo de confianza de 100(1 )% para la varianza 2 de una población
normal tiene un límite inferior
(n 1)s 2/ 2/2,n1
y límite superior
(n 1)s 2/ 21/2,n1
Un intervalo de confianza para tiene límites superior e inferior que son las raíces
cuadradas de los límites correspondientes en el intervalo para 2.
www.FreeLibros.me
c7_p225-283.qxd
280
3/12/08
CAPÍTULO 7
4:15 AM
Page 280
Intervalos estadísticos basados en una sola muestra
Ejemplo 7.15
Los datos adjuntos sobre voltaje de ruptura de circuitos eléctricamente sobrecargados se tomaron de un diagrama de probabilidad normal que apareció en el artículo “Damage of Flexible Printed Wiring Boards Associated with Lightning-Induced Voltage Surges”, (IEEE
Transactions on Components, Hybrids, and Manuf. Tech., 1985: 214-220). La linealidad del
diagrama apoyó de manera firme la suposición de que el voltaje de ruptura está aproximadamente distribuido en forma normal.
1470
1510
1690
1740
1900
2000
2030
2100
2200
2290
2380
2390
2480
2500
2580
2700
2190
Sea 2 la varianza de la distribución del voltaje de ruptura. El valor calculado de la varianza muestral es s2 137 324.3, la estimación puntual de 2. Con grados de libertad n
1 16, un intervalo de confianza de 95% requiere 20.975,16 6.908 y 20.025,16 28.845. El
intervalo es
16(137 324.3) 16(137 324.3)
,
(76 172.3, 318 064.4)
28.845
6.908
Tomando la raíz cuadrada de cada punto extremo se obtiene (276.0, 564.0) como el intervalo
de confianza de 95% para . Estos intervalos son bastante anchos, lo que refleja la variabilidad
sustancial del voltaje de ruptura en combinación con un tamaño de muestra pequeño.
■
Los intervalos de confianza para 2 y cuando la distribución de la población no es
normal pueden ser difíciles de obtener, incluso cuando el tamaño de muestra es grande. En
esos casos, consulte a un estadístico conocedor.
EJERCICIOS
Sección 7.4 (42-46)
——
Publ. No. 381, 1965: 328-356 (en k/pulg pulg., dadas en
orden creciente)]:
42. Determine los valores de las siguientes cantidades:
a. 20.1,15
b. 20.1,25
2
c. 0.01,25
d. 20.005,25
e. 20.99,25
f. 20.995,25
43. Determine lo siguiente:
a. El 95o percentil de la distribución ji cuadrada con
10.
b. El 5o percentil de la distribución ji cuadrada con
10.
c. P(10.98 2 36.78), donde 2 es una variable aleatoria ji cuadrada con 22.
d. P( 2 14.611 o 2 37.652), donde 2 es una variable
aleatoria ji cuadrada con 25.
44. Se determinó la cantidad de expansión lateral (mils) con
una muestra de n 9 soldaduras de arco de gas metálico de
energía pulsante utilizadas en tanques de almacenamiento
de buques LNG. La desviación estándar muestral resultante fue s 2.81 mils. Suponiendo normalidad, obtenga un
intervalo de confianza de 95% para 2 y para .
45. Se hicieron las siguientes observaciones de tenacidad a la
fractura de una placa base de acero maraging con 18% de
níquel [“Fracture Testing of Weldments”, ASTM Special
69.5
71.9
72.6
73.1
73.3
73.5
75.5
75.7
75.8
76.1
76.2
76.2
77.0
77.9
78.1
79.6
79.7
79.9
80.1
82.2
83.7
93.7
Calcule un intervalo de confianza de 99% para la desviación estándar de la distribución de la tenacidad a la fractura. ¿Es válido este intervalo cualquiera que sea la naturaleza
de la distribución? Explique.
46. Los resultados de una prueba de turbiedad de Wagner realizada con 15 muestras de arena de prueba Ottawa estándar
(en microamperes)
26.7
25.8
24.0
24.9
26.4
25.9
24.4
24.1
25.9
27.3
26.9
27.3
24.8
23.6
21.7
a. ¿Es factible que esta muestra fuera seleccionada de una
distribución de población normal?
b. Calcule un límite de confianza superior con nivel de
confianza de 95% para la desviación estándar de turbiedad
de la población.
www.FreeLibros.me
c7_p225-283.qxd
3/12/08
4:15 AM
Page 281
Ejercicios suplementarios
281
EJERCICIOS SUPLEMENTARIOS (47–62)
47. El ejemplo 1.10 introdujo las observaciones adjuntas sobre
fuerza de adhesión.
11.5
13.4
4.9
3.6
8.2
5.2
12.1
17.1
10.7
3.4
10.7
4.8
9.9
9.3
15.2
20.6
14.2
4.1
9.3
5.6
8.5
25.5
7.6
3.8
7.8
5.7
4.2
13.8
5.2
3.7
6.2
5.4
4.0
12.6
5.5
3.6
6.6
5.2
3.9
13.1
5.1
3.6
7.0
5.1
3.8
8.9
5.0
3.6
a. Calcule la fuerza de adhesión promedio verdadera de
una manera que dé información sobre precisión y confiabilidad. [Sugerencia: xi 387.8 y x 2i 4247.08.]
b. Calcule un intervalo de confianza de 95% para la proporción de todas las adhesiones cuyos valores de fuerza
excederían de 10.
48. Un triatlón incluye natación, ciclismo y carrera a pie y es
uno de los eventos deportivos amateurs más extenuantes.
El artículo “Cardiovascular and Thermal Response of
Triathlon Performance” (Medicine and Science in Sports
and Exercise, 1988: 385-389) reporta sobre un estudio de
investigación de nueve triatletas varones. Se registró el ritmo cardiaco máximo (pulsaciones/min) durante la actuación de cada uno de los tres eventos. Para natacion, la media
y la desviación estándar muestrales fueron 188.0 y 7.2,
respectivamente. Suponiendo que la distribución de ritmo
cardiaco es (de manera aproximada) normal, construya un
intervalo de confianza de 98% para el ritmo cardiaco medio
verdadero de triatletas mientras nadan.
49. Para cada uno de los 18 núcleos de depósitos de carbonato
humedecidos con aceite, la cantidad de saturación de gas residual después de la inyección de un solvente se midió en la
corriente de agua de salida. Las observaciones, en porcentaje de volumen de poros, fueron
23.5
41.4
44.5
31.5
37.2
35.7
34.0
42.5
33.5
46.7
46.9
39.3
45.6
51.5
22.0
32.5
36.4
51.2
(Véase “Relative Permeability Studies of Gas-Water Flow
Following Solvent Injection in Carbonate Rocks”, Soc. Petroleum Engineers J., 1976: 23-30.)
a. Construya una gráfica de caja de estos datos y comente
sobre cualquier característica interesante.
b. ¿Es factible que la muestra fuera seleccionada de una
distribución de población normal?
c. Calcule un intervalo de confianza de 98% para la cantidad promedio verdadera de saturación de gas residual.
50. Un artículo publicado en un periódico reporta que se utilizó
una muestra de tamaño 5 como base para calcular un intervalo de confianza de 95% para la frecuencia natural (Hz)
promedio verdadera de vigas deslaminadas de cierto tipo.
El intervalo resultante fue (229.764, 233.504). Usted decide
que un nivel de confianza de 99% es más apropiado que el
de 95% utilizado. ¿Cuáles son los límites del intervalo de
99% [Sugerencia: Use el centro del intervalo y su ancho
para determinar x y s.]
51. El gerente financiero de una gran cadena de tiendas departamentales seleccionó una muestra aleatoria de 200 de sus
clientes que pagan con tarjeta de crédito y encontró que 136
habían incurrido en pago de intereses durante el año previo
a causa de saldos vencidos.
a. Calcule un intervalo de confianza de 90% para la proporción verdadera de clientes de tarjeta de crédito que
incurrieron en pago de intereses durante el año previo.
b. Si el ancho deseado del intervalo de 90% es de 0.05, ¿qué
tamaño de muestra se requiere para garantizar esto?
c. ¿Especifica el límite superior del intervalo del inciso a)
un límite de confianza superior de 90% para la proporción que se está estimando? Explique.
52. La alta concentración del elemento tóxico arsénico es demasiado común en el agua subterránea. El artículo “Evaluation of Treatment Systems for the Removal of Arsenic from
Groundwater” (Practice Periodical of Hazardous, Toxic,
and Radioactive Waste Magmt., 2005: 152-157) reportó que
para una muestra de n 5 especímenes de agua seleccionada para tratamiento por coagulación, la concentración de
arsénico media muestral fue de 24.3 g/l, y la desviación
estándar muestral fue de 4.1. Los autores del artículo citado
utilizaron métodos basados en t para analizar sus datos, así
que venturosamente tuvieron razón al creer que la distribución de concentración de arsénico era normal.
a. Calcule e interprete un intervalo de confianza de 95%
para concentración de arsénico verdadera en todos los
especímenes de agua.
b. Calcule un límite de confianza superior de 90% para la
desviación estándar de la distribución de la concentración de arsénico.
c. Pronostique la concentración de arsénico de un solo espécimen de agua de modo que dé información sobre precisión y confiabilidad.
53. La infestación con pulgones de árboles frutales puede ser
controlada rociando un pesticida o mediante la inundación
con mariquitas. En un área particular, se seleccionan cuatro
diferentes arboledas de árboles frutales para experimentación. Las primeras tres arboledas se rocían con los pesticidas 1, 2 y 3, respectivamente y la cuarta se trata con
mariquitas con los siguientes resultados de cosecha:
Tratamiento
1
2
3
4
ni
Número de
árboles
xi
(Medida de
áridos/árbol)
si
100
90
100
120
10.5
10.0
10.1
10.7
1.5
1.3
1.8
1.6
Sea i la cosecha promedio verdadera (medida de áridos/
árbol) después de recibir el i-ésimo tratamiento. En ese caso
1
(1 2 3) 4
3
mide la diferencia de las cosechas promedio verdaderas entre
el tratamiento con pesticidas y el tratamiento con mariquitas.
www.FreeLibros.me
c7_p225-283.qxd
282
3/12/08
CAPÍTULO 7
4:15 AM
Page 282
Intervalos estadísticos basados en una sola muestra
Cuando n1, n2 y n3 son grandes, el estimador ˆ obtenido al
reemplazar cada i con
Xi es aproximadamente normal. Use
esto para obtener un intervalo de confianza muestral grande
de 100(1 )% y calcule el intervalo de 95% con los datos dados.
54. Es importante que las máscaras utilizadas por bomberos
sean capaces de soportar altas temperaturas porque los
bomberos comúnmente trabajan en temperaturas de 200500°F. En una prueba de un tipo de máscara, a 11 de 55
máscaras se les desprendió la mica a 250°. Construya un intervalo de confianza de 90% para la proporción de máscaras verdadera de este tipo cuya mica se desprendería a 250°.
55. Un fabricante de libros de texto universitarios está interesado
en investigar la resistencia de las encuadernaciones producidas por máquina de encuadernar particular. La resistencia
puede ser medida registrando la fuerza requerida para
arrancar las páginas de la encuadernación. Si esta fuerza se
mide en libras, ¿cuántos libros deberán ser probados para
calcular la fuerza promedio requerida para romper la encuadernación dentro de 0.1 lb con 95% de confianza? Suponga
que se sabe que es de 0.8.
56. Es bien sabido que la exposición a la fibra de asbesto es un
riesgo para la salud. El artículo “The Acute Effects of Chrysotile Asbestos Exposure on Lung Function” (Environ. Research, 1978: 360-372) reporta resultados sobre un estudio
basado en una muestra de trabajadores de la construcción
que habían estado expuestos a asbesto durante un periodo
prolongado. Entre los datos dados en el artículo se encontraron los siguientes valores (ordenados) de elasticidad pulmonar (cm3/cm H2O) por cada uno de los 16 sujetos 8
meses después del periodo de exposición (la elasticidad
pulmonar mide la elasticidad de los pulmones o cuán efectivamente los pulmones son capaces de inhalar y exhalar):
167.9
180.8
184.8
189.8
194.8
200.2
201.9
206.9
207.2
208.4
226.3
227.7
228.5
232.4
239.8
258.6
58. Sean X1, X2, . . . , Xn una muestra aleatoria de una distribu~ (de modo que
ción de probabilidad continua con mediana
~
~
P(Xi ) P(Xi ) 0.5).
a. Demuestre que
n1
~ máx(X )) 1 1
P(mín(Xi)
i
2
de modo que (mín(xi), máx(xi)) es un intervalo de confian~ con 1 n1. [Sugerencia:
za de 100(1 )% para
2
~ máx(X )} es
El complemento del evento {mín(Xi)
i
~ {mín(X ) }.
~ Pero máx(X )
~ si y
{máx(Xi) }
i
i
~ con todas las i.]
sólo si Xi
b. Para cada uno de seis infantes normales varones, se determinó la cantidad de alanina aminoácida (mg/100 ml)
mientras que los infantes llevaban un dieta libre de isoleucina y se obtuvieron los siguientes resultados
2.84
3.54
2.80
57. En el ejemplo 6.8, se introdujo el concepto de experimento
censurado en el cual n componentes se prueban y el experimento termina en cuanto r de los componentes fallan. Suponga que las vidas útiles de los componentes son
independientes, cada uno con distribución exponencial y
parámetro . Sea Y1 el tiempo en el cual ocurre la primera
falla, Y2 el tiempo en el cual ocurre la segunda falla, y así
sucesivamente, de modo que Tr Y1 Yr (n r)
Yr, es la vida útil total acumulada. En ese caso se puede demostrar que 2Tr, tiene una distribución ji cuadrada con 2r
grados de libertad. Use esto para desarrollar una fórmula
para un intervalo de confianza de 100(1 )% para una vida útil promedio verdadera 1/. Calcule un intervalo de
confianza de 95% con los datos del ejemplo 6.8.
2.94
2.70
Calcule un intervalo de confianza de 97% para cantidad
mediana verdadera de alanina para infantes que llevaban
esa dieta (“The Essential Amino-Acid Requirements of
Infants”, Amer. J. Nutrition, 1964: 322-330).
c. Sean x(2) la segunda más pequeña de las xi y x(n1) la segunda más grande de las xi. ¿Cuál es el coeficiente de
~
confianza del intervalo (x(2), x(n1)) para ?
59. Sean X1, X2, . . . , Xn una muestra aleatoria de una distribución uniforme en el intervalo [0, ], de modo que
f(x)
{
1
0x
0 de lo contrario
Entonces si Y máx(Xi), se puede demostrar que la variable aleatoria U Y/ tiene una función de densidad
fU(u)
n1
{nu0
0u1
de lo contrario
a. Use fU(u) para verificar que
P (/2)1/n
a. ¿Es factible que la distribución de la población sea normal?
b. Calcule un intervalo de confianza de 95% para la elasticidad
pulmonar promedio verdadera después de la exposición.
c. Calcule un intervalo que, con un nivel de confianza de
95%, incluya por lo menos 95% de los valores de elasticidad pulmonar en la distribución de la población.
1.44
Y
(1 /2)1/n 1
y use ésta para derivar un intervalo de confianza de
100(1 )% para .
b. Verifique que P(1/n Y/ 1) 1 y obtenga un
intervalo de confianza de 100(1 )% para basado en
esta proposición de probabilidad.
c. ¿Cuál de los dos intervalos derivados previamente es más
corto? Si mi tiempo de espera en la mañana de un camión
está uniformemente distribuido y los tiempos de espera
observados son x1 4.2, x2 3.5, x3 1.7, x4 1.2 y
x5 2.4 derive un intervalo de confianza de 95% para
utilizando el más corto de los dos intervalos.
60. Sea 0 . Entonces un intervalo de confianza de
100(1 )% para cuando n es grande es
x z
s
s
, x z
n
n
La opción de /2 da el intervalo usual derivado en la
sección 7.2; si /2, este intervalo no es simétrico con
respecto a x. El ancho de este intervalo es w s(z
z )/n. Demuestre que w se reduce al mínimo con la op-
www.FreeLibros.me
c7_p225-283.qxd
3/12/08
4:15 AM
Page 283
Bibliografía
283
ción /2, de modo que el intervalo simétrico sea el más
corto. [Sugerencia: a) Por definición de z, (z) 1 ,
de modo que z 1(1 ); b) la relación entre la derivada de una función y f(x) y la función inversa x f 1(y)
es (d/dy) f 1(y) 1/f (x).]
El valor de la cantidad entre paréntesis es 2.10 con n 10,
1.94 con n 20 y 1.91 con n 30. Calcule este intervalo
de confianza con los datos del ejercicio 45 y compare con
el intervalo de confianza t apropiado para distribución de
población normal.
61. Suponga que x1, x2, . . . , xn son valores observados resultantes de una muestra aleatoria tomada de una distribución simétrica pero posiblemente de cola gruesa. Sean ~
x y fs
la mediana muestral y la dispersión de los cuartos, respectivamente. El capítulo 11 de Understanding Robust and
Exploratory Data Analysis (véase la bibliografía del capítulo 6) sugiere el siguiente intervalo de confianza de 95%
robusto para la media de la población (punto de simetría):
62. a. Use los resultados del ejemplo 7.5 para obtener un límite de confianza inferior de 95% para el parámetro de
una distribución exponencial y calcule el límite basado
en los datos dados en el ejemplo.
b. Si la vida útil tiene una distribución exponencial, la probabilidad de que la vida útil exceda de t es P(X t)
e t. Use el resultado del inciso a) para obtener un límite de confianza inferior de 95% para la probabilidad de
que el tiempo de ruptura exceda de 100 min.
f
valor crítico t conservador
~
x!
s
1.075
n
Bibliografía
DeGroot, Morris y Mark Schervish, Probability and Statistics
(3a. ed.), Addison-Wesley, Reading MA, 2002. Una muy buena exposición de los principios generales de inferencia estadística.
Hahn, Gerald y William Meeker, Statistical Intervals, Wiley,
Nueva York, 1991. Todo lo que alguna vez quiso saber sobre
intervalos estadísticos (de confianza, predicción, tolerancia
y otros).
Larsen, Richard y Morris Marx, Introduction to Mathematical
Statistics: (2a. ed.), Prentice Hall, Englewood, Cliffs, NJ.,
1986. Similar a la presentación de DeGroot, pero un poco menos matemática.
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
8
4:17 AM
Page 284
Pruebas de hipótesis
basadas en una sola
muestra
INTRODUCCIÓN
Un parámetro puede ser estimado a partir de datos muestrales o con un solo número (una estimación puntual) o un intervalo completo de valores plausibles (un intervalo de confianza). Con frecuencia, sin embargo, el objetivo de una investigación no
es estimar un parámetro sino decidir cuál de dos pretensiones contradictorias sobre
el parámetro es la correcta. Los métodos para lograr esto comprenden la parte de la
inferencia estadística llamada prueba de hipótesis. En este capítulo, primero se discuten algunos de los conceptos y terminología básicos en la prueba de hipótesis y
luego se desarrollan procedimientos para la toma de decisiones para los problemas
de realización de pruebas más frecuentemente encontrados con base en una muestra tomada de una sola población.
284
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:17 AM
Page 285
8.1 Hipótesis y procedimientos de prueba
285
8.1 Hipótesis y procedimientos de prueba
Una hipótesis estadística o simplemente hipótesis es una pretensión o aseveración sobre el
valor de un solo parámetro (característica de una población o característica de una distribución de probabilidad), sobre los valores de varios parámetros o sobre la forma de una
distribución de probabilidad completa. Un ejemplo de una hipótesis es la pretensión de que
0.75, donde es el diámetro interno promedio verdadero de un cierto tipo de tubo de
PVC. Otro ejemplo es la proposición p 0.10, donde p es la proporción de tarjetas de circuito defectuosas entre todas las tarjetas de circuito producidas por un cierto fabricante. Si
1 y 2 denotan las resistencias a la ruptura promedio verdaderas de dos tipos diferentes de
cuerdas, una hipótesis es la aseveración de que 1 2 0 y otra es que 1 2 5. No
obstante otro ejemplo de una hipótesis es la aseveración de que la distancia de detención en
condiciones particulares tiene una distribución normal. Hipótesis de esta última clase se
considerarán en el capítulo 14. En éste y en los siguientes capítulos, la atención se concentra en hipótesis en relación con parámetros.
En cualquier problema de prueba de hipótesis, existen dos hipótesis contradictorias
consideradas. Una podría ser la pretensión de que 0.75 y la otra 0.75 o las dos proposiciones contradictorias podrían ser p 0.10 y p 0.10. El objetivo es decidir, con base en información muestral, cuál de las dos hipótesis es la correcta. Existe una analogía
conocida de esto en un juicio criminal. Una pretensión es la aseveración de que el individuo
acusado es inocente. En el sistema judicial estadounidense, esta es la pretensión que inicialmente se cree que es cierta. Sólo de cara a una fuerte evidencia que diga lo contrario el jurado deberá rechazar esta pretensión a favor de la aseveración alternativa de que el acusado
es culpable. En este sentido, la pretensión de inocencia es la hipótesis favorecida o protegida y el agobio de comprobación recae en aquellos que creen en la pretensión alternativa.
Asimismo, al probar hipótesis estadísticas, el problema se formulará de modo que una
de las pretensiones sea inicialmente favorecida. Esta pretensión inicialmente favorecida no
será rechazada a favor de la pretensión alternativa a menos que la evidencia muestral la contradiga y apoye fuertemente la aseveración alternativa.
DEFINICIÓN
La hipótesis nula denotada por H0, es la pretensión de que inicialmente se supone
cierta (la pretensión de “creencia previa”). La hipótesis alternativa denotada por Ha,
es la aseveración contradictoria a H0.
La hipótesis nula será rechazada en favor de la hipótesis alternativa sólo si la
evidencia muestral sugiere que H0 es falsa. Si la muestra no contradice fuertemente a H0, se continuará creyendo en la verdad de la hipótesis nula. Las dos posibles
conclusiones derivadas de un análisis de prueba de hipótesis son entonces rechazar
H0 o no rechazar H0.
Una prueba de hipótesis es un método de utilizar datos muestrales para decidir si la hipótesis nula debe ser rechazada. Por consiguiente se podría probar H0: 0.75 contra la Ha
alternativa: 0.75. Sólo si los datos muestrales sugieren fuertemente que es otra diferente de 0.75 deberá ser rechazada la hipótesis nula. Sin semejante evidencia, H0 no deberá
ser rechazada, puesto que sigue siendo bastante plausible.
En ocasiones un investigador no desea aceptar una aseveración particular a menos y
hasta que los datos apoyan fuertemente la aseveración. Como ejemplo, supóngase que una
compañía está considerando aplicar un nuevo tipo de recubrimiento en los cojinetes que fabrica. Se sabe que la vida de desgaste promedio verdadera con el recubrimiento actual es de
www.FreeLibros.me
c8_p284-324.qxd
286
3/12/08
CAPÍTULO 8
4:17 AM
Page 286
Pruebas de hipótesis basadas en una sola muestra
1000 horas. Si denota la vida promedio verdadera del nuevo recubrimiento, la compañía
no desea cambiar a menos que la evidencia sugiera fuertemente que excede de 1000. Una
formulación apropiada del problema implicaría probar H0: 1000 contra Ha: 1000.
La conclusión de que se justifica un cambio está identificada con Ha y se requeriría evidencia conclusiva para justificar el rechazo de H0 y cambiar al nuevo recubrimiento.
La investigación científica a menudo implica tratar de decidir si una teoría actual debe ser reemplazada por una explicación más plausible y satisfactoria del fenómeno investigado. Un método conservador es identificar la teoría actual con H0 y la explicación
alternativa del investigador con Ha. El rechazo de la teoría actual ocurrirá entonces sólo
cuando la evidencia es mucho más compatible con la nueva teoría. En muchas situaciones,
Ha se conoce como “hipótesis del investigador”, puesto que es la pretensión que al investigador en realidad le gustaría validar. La palabra nulo significa “sin ningún valor, efecto o
consecuencia”, la que sugiere que H0 no deberá ser identificada con la hipótesis de ningún
cambio (de la opinión actual), ninguna diferencia, ninguna mejora, y así sucesivamente. Supóngase, por ejemplo, que 10% de todas las tarjetas de circuito producidas por un cierto fabricante durante un periodo reciente estaban defectuosas. Un ingeniero ha sugerido un
cambio del proceso de producción en la creencia de que dará por resultado una proporción
reducida de tarjetas defectuosas. Sea p la proporción verdadera de tarjetas defectuosas
que resultan del proceso cambiado. Entonces la hipótesis de investigación en la cual recae
el agobio de comprobación, es la aseveración de que p 0.10. Por consiguiente la hipótesis alternativa es Ha: p 0.10.
En el tratamiento de la prueba de hipótesis, H0 siempre será formulada como una afirmación de igualdad. Si denota el parámetro de interés, la hipótesis nula tendrá la forma
H0: 0 donde 0 es un número específico llamado valor nulo del parámetro (valor pretendido para por la hipótesis nula). Como ejemplo, considérese la situación de la tarjeta
de circuito que se acaba de discutir. La hipótesis alternativa sugerida fue Ha: p 0.10, la
pretensión de que la modificación del proceso redujo la proporción de tarjetas defectuosas.
Una opción natural de H0 en esta situación es la pretensión de que p 0.10 de acuerdo a la
cual el nuevo proceso no es mejor o peor que el actualmente utilizado. En su lugar se considerará H0: p 0.10 contra Ha: p 0.10. El razonamiento para utilizar esta hipótesis nula simplificada es que cualquier procedimiento de decisión razonable para decidir entre H0:
p 0.10 y Ha: p 0.10 también será razonable para decidir entre la pretensión de que p
0.10 y Ha. Se prefiere utilizar una H0 simplificada porque tiene ciertos beneficios técnicos,
los que en breve serán aparentes.
La alternativa de la hipótesis nula H0: 0 se verá como una de las siguientes tres
aseveraciones: 1) Ha: 0 (en cuyo caso la hipótesis nula implícita es 0), 2) Ha:
0) o 3) Ha: 0. Por
0 (por consiguiente la hipótesis implícita nula establece que
ejemplo, sea la desviación estándar de la distribución de diámetros internos (pulgadas) de
un cierto tipo de manguito de metal. Si se decidió utilizar el manguito a menos que la evidencia muestral demuestre conclusivamente que 0.001, la hipótesis apropiada sería H0:
0.001 contra Ha: 0.001. El número 0 que aparece tanto en H0 como en Ha (separa la alternativa de la nula) se llama valor nulo.
Procedimientos de prueba
Un procedimiento de prueba es una regla, basada en datos muestrales, para decidir si rechazar H0. Una prueba de H0: p 0.10 contra Ha: p 0.10 en el problema de tarjetas de
circuito podría estar basado en examinar una muestra aleatoria de n 200 tarjetas. Sea X
el número de tarjetas defectuosas en la muestra, una variable aleatoria binomial; x representa el valor observado de X, Si H0 es verdadera, E(X) np 200(0.10) 20, en tanto
que se pueden esperar menos de 20 tarjetas defectuosas si Ha es verdadera. Un valor de x
un poco por debajo de 20 no contradice fuertemente a H0, así que es razonable rechazar H0
sólo si x es sustancialmente menor que 20. Un procedimiento de prueba como ése es
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:17 AM
Page 287
8.1 Hipótesis y procedimientos de prueba
287
rechazar H0 si x 15 y no rechazarla de lo contrario. Este procedimiento consta de dos
constituyentes: 1) un estadístico de prueba o función de los datos muestrales utilizados para tomar la decisión y 2) una región de rechazo compuesta de aquellos valores x con los
cuales H0 será rechazada a favor de Ha. De acuerdo a la regla que se acaba de sugerir, la
región de rechazo se compone de x 0, 1, 2, . . . , y 15, H0 no será rechazada si x 16,
17, . . . , 199 o 200.
Un procedimiento de prueba se especifica como sigue:
1. Un estadístico de prueba, una función de los datos muestrales en los cuales ha de
basarse la decisión (rechazar H0 o no rechazar H0)
2. Una región de rechazo, el conjunto de todos los valores estadísticos de prueba por
los cuales H0 será rechazada.
La hipótesis nula será rechazada entonces si y sólo si el valor estadístico de prueba
observado o calculado queda en la región de rechazo.
Como otro ejemplo, supóngase que una compañía tabacalera afirma que el contenido
de nicotina prometido de los cigarrillos marca B es (cuando mucho) de 1.5 mg. Sería imprudente rechazar la afirmación del fabricante sin una fuerte evidencia contradictoria, así
que una formulación del problema apropiada es probar H0: 1.5 con Ha: 1.5. Considérese una regla de decisión basada en analizar una muestra aleatoria de 32 cigarrillos. Sea
X el contenido de nicotina promedio muestral. Si H0 es verdadera E(X
) 1.5, en tanto
que si H0 es falsa, se espera que
X exceda de 1.5. Una fuerte evidencia contra H0 es proporcionada por un valor de x que exceda considerablemente de 1.5. Por consiguiente se podría
utilizar
X como un estadístico de prueba junto con la región de rechazo x 1.6.
Tanto en el ejemplo de tarjetas de circuito como en el de contenido de nicotina, la selección del estadístico de prueba y la forma de la región de rechazo tienen sentido intuitivamente. Sin embargo, la selección del valor de corte utilizado para especificar la región de
rechazo es un tanto arbitraria. En lugar de rechazar H0: p 0.10 a favor de Ha: p 0.10
cuando x 15, se podría utilizar la región de rechazo x 14. En esta región, H0 no sería
rechazada si se observaran 15 tarjetas defectuosas, mientras que esta ocurrencia conduciría
al rechazo de H0 si se emplea la región inicialmente sugerida. Asimismo, se podría utilizar
la región de rechazo x 1.55 en el problema de contenido de nicotina en lugar de la región
x 1.60.
Errores en la prueba de hipótesis
La base para elegir una región de rechazo particular radica en la consideración de los errores que se podrían presentar al sacar una conclusión. Considérese la región de rechazo
x 15 en el problema de tarjetas de circuito. Aun cuando H0: p 0.10 sea verdadera,
podría suceder que una muestra inusual dé por resultado x 13, de modo que H0 sea erróneamente rechazada. Por otra parte, aun cuando Ha: p 0.10 sea verdadera, una muestra
inusual podría dar x 20, en cuyo caso H0 no sería rechazada, de nueva cuenta una conclusión incorrecta. Por lo tanto es posible que H0 pueda ser rechazada cuando sea verdadera o que H0 no pueda ser rechazada cuando sea falsa. Estos posibles errores no son
consecuencia de una región de rechazo tontamente seleccionada. Cualquiera de estos dos
errores podría presentarse cuando se emplea la región x 14, o cuando se utiliza cualquier otra región.
www.FreeLibros.me
c8_p284-324.qxd
288
3/12/08
CAPÍTULO 8
4:17 AM
Page 288
Pruebas de hipótesis basadas en una sola muestra
DEFINICIÓN
Un error de tipo I consiste en rechazar la hipótesis nula cuando es verdadera.
Un error de tipo II implica no rechazar H0 cuando H0 es falsa.
En el problema de contenido de nicotina, un error de tipo I consiste en rechazar la afirmación del fabricante de que 1.5 cuando en realidad es cierta. Si se emplea la región de
rechazo x 1.6 podría suceder que x 1.63 aun cuando 1.5, con el resultado de un
error de tipo I. Alternativamente, puede ser que H0 sea falsa y no obstante x 1.52, lo que
conduciría a que H0 no sea rechazada (un error de tipo II).
En el mejor de todos los mundos posibles, se podrían desarrollar procedimientos de
prueba en los cuales ningún tipo de error es posible. Sin embargo, este ideal puede ser alcanzado sólo si la decisión se basa en el examen de toda la población. La dificultad con la
utilización de un procedimiento basado en datos muestrales es que debido a la variabilidad
del muestreo, el resultado podría ser una muestra no representativa. Aun cuando E(X
) ,
el valor observado x puede diferir sustancialmente de (por lo menos si n es pequeño). Por
consiguiente cuando 1.5 en la situación de la nicotina, x puede ser mucho más grande
que 1.5 y el resultado sería el rechazo erróneo de H0. Alternativamente, puede ser que 1.6
y no obstante que se observe una x mucho más pequeña que este valor, lo que conduce a un
error de tipo II.
En lugar de demandar procedimientos sin errores, habrá que buscar procedimientos
con los cuales sea improbable que ocurra cualquier tipo de error. Es decir, un buen procedimiento es uno con el cual la probabilidad de cometer cualquier tipo de error es pequeña.
La selección de un valor de corte en una región de rechazo particular fija las probabilidades
de errores de tipo I y tipo II. Estas probabilidades de error son tradicionalmente denotadas
por y , respectivamente. Como H0, especifica un valor único del parámetro, existe un solo valor de . Sin embargo, existe un valor diferente de por cada valor del parámetro compatible con Ha:
Ejemplo 8.1
Se sabe que un cierto tipo de automóvil no sufre daños visibles el 25% del tiempo en pruebas de choque a 10 mph. Se ha propuesto un diseño de defensa modificado en un esfuerzo
por incrementar este porcentaje. Sea p la proporción de todos los choques a 10 mph con esta nueva defensa en los que no producen daños visibles. Las hipótesis a ser tratadas son H0:
p 0.25 (ninguna mejora contra Ha: p 0.25. La prueba se basará en un experimento que
implica n 20 choques independientes con prototipos del nuevo diseño. Intuitivamente, H0
deberá ser rechazada si un número sustancial de los choques no muestra daños. Considérese el siguiente procedimiento de prueba:
Estadístico de prueba: X número de choques sin daños visibles
Región de rechazo: R8 {8, 9, 10, . . . , 19, 20}; es decir, rechazar H0 si x 8,
donde x es el valor observado del estadístico de prueba.
Esta región de rechazo se llama de cola superior y se compone de sólo grandes valores del
estadístico de prueba.
Cuando H0 es verdadera, la distribución de probabilidad de X es binomial con n 20
y p 0.25. Entonces
P(error de tipo I) P(H0 es rechazada cuando es verdadera)
P(X 8 cuando X Bin(20, 0.25)) 1 – B(7; 20, 0.25)
1 0.898 0.102
Es decir, cuando H0 en realidad es verdadera, aproximadamente el 10% de todos los experimentos compuestos de 20 choques darían por resultado que H0 fuera rechazada incorrectamente (un error de tipo I).
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:17 AM
Page 289
8.1 Hipótesis y procedimientos de prueba
289
En contraste con , no hay una sola . En su lugar, hay una diferente por cada p diferente que exceda de 0.25. Por consiguiente hay un valor de con p 0.3 (en cuyo caso
X Bin(20, 0.3), otro valor de con p 0.5 y así sucesivamente. Por ejemplo,
(0.3) P(error de tipo II cuando p 0.3)
P(H0 no es rechazada cuando es falsa porque p 0.3)
P(X 7 cuando X Bin(20, 0.3)) B(7; 20, 0.3) 0.772
Cuando p es en realidad 0.3 y no 0.25 (un “pequeño” alejamiento de H0), ¡aproximadamente el 77% de todos los experimentos de este tipo darían por resultado que H0 fuera incorrectamente rechazada!
La tabla adjunta muestra para valores seleccionados de p (cada uno calculado para
la región de rechazo R8). Claramente, disminuye conforme el valor de p se aleja hacia la
derecha del valor nulo 0.25. Intuitivamente, mientras más grande es el alejamiento de H0,
menos probable es que dicho alejamiento no sea detectado.
p
(p)
0.3
0.4
0.5
0.6
0.7
0.8
0.772
0.416
0.132
0.021
0.001
0.000
El procedimiento de prueba propuesto sigue siendo razonable para poner a prueba la
hipótesis nula más realista de que p 0.25. En este caso, ya no existe una sola , sino que
hay una por cada p que sea cuando mucho de 0.25: (0.25), (0.23), (0.20), (0.15) y así
sucesivamente. Es fácil verificar, no obstante, que (p) (0.25) 0.102 si p 0.25. Es
decir, el valor más grande de ocurre con el valor límite 0.25 entre H0 y Ha. Por consiguiente si es pequeña para la hipótesis nula simplificada, también igual o más pequeña para la
H0 realista.
■
Ejemplo 8.2
Se sabe que el tiempo de secado de un cierto tipo de pintura en condiciones de prueba especificadas está normalmente distribuido con valor medio de 75 min y desviación estándar
de 9 min. Algunos químicos propusieron un nuevo aditivo para reducir el tiempo de secado.
Se cree que los tiempos de secado con este aditivo permanecerán normalmente distribuidos
con 9. Debido al gasto asociado con el aditivo, la evidencia deberá sugerir fuertemente una mejora en el tiempo de secado promedio antes de que se adopte semejante conclusión. Sea
el tiempo de secado promedio verdadero cuando se utiliza el aditivo. Las
hipótesis apropiadas son H0; 75 contra Ha: 75. Sólo si H0 puede ser rechazada será declarado exitoso y utilizado.
Los datos experimentales tienen que estar compuestos de tiempos de secado de n 25
especímenes de prueba. Sean X1, . . . , X25 los 25 tiempos de secado, una muestra aleatoria
de tamaño 25 de una distribución normal con valor medio y desviación estándar 9.
El tiempo de secado medio muestral X
tiene entonces una distribución normal con valor
esperado X y desviación estándar X /n 9/25 1.80. Cuando H0 es verdadera, X 75, así que un valor x un poco menor que 75 no contradeciría fuertemente a
H0. Una región razonable de rechazo tiene la forma
X c, donde el valor de corte c es adecuadamente seleccionado. Considere la opción c 70.8, de modo que el procedimiento de
prueba se componga del estadístico de prueba
X y una región de rechazo x 70.8. Debido a
que la región de rechazo se compone de sólo valores pequeños del estadístico de prueba, se
dice que ésta es de cola pequeña. El cálculo de y ahora implica una estandarización de
rutina de
X seguida por una referencia a las probabilidades normales estándar de la tabla A.3:
P(error de tipo I) P(H0 es rechazada cuando es verdadera)
P(X
70.8 cuando X
normal con X 75, X 1.8)
70.81.8 75 ( 2.33) 0.01
www.FreeLibros.me
c8_p284-324.qxd
290
3/12/08
CAPÍTULO 8
4:17 AM
Page 290
Pruebas de hipótesis basadas en una sola muestra
(72) P(error de tipo II cuando 72)
P(H0 no es rechazada cuando es falsa porque 72)
P(X
70.8 cuando X
1
normal con X 72 y X 1.8)
70.81.8 72 1 ( 0.67) 1 0.2514 0.7486
(70) 1 70.8 70 0.3300
1.8
(67) 0.0174
Con el procedimiento de prueba especificado, sólo el 1% de todos los experimentos realizados como se describió darán por resultado que H0 sea rechazada cuando en realidad es verdadera. No obstante, la probabilidad de un error de tipo II es muy grande cuando 72
(sólo un pequeño alejamiento de H0), un poco menor cuando 70 y bastante pequeño
cuando 67 (un alejamiento muy sustancial de H0). Estas probabilidades de error se ilustran en la figura 8.1. Obsérvese que se calcula con la distribución de probabilidad del estadístico de prueba cuando H0 es verdadera, en tanto que la determinación de requiere
conocer la distribución del estadístico cuando H0 es falsa.
Área sombreada 0.01
73
75
70.8
a)
Área sombreada (72)
72
75
70.8
b)
Área sombreada (70)
70
70.8
c)
75
Figura 8.1 y ilustradas para el ejemplo 8.2: a) la distribución de X
cuando 75 (H0 verdadera); b) la distribución de X
cuando 72 (H0 falsa); c) la distribución de X
cuando 70
(H0 falsa).
Como en el ejemplo 8.1, si se considera la hipótesis nula más realista
75, existe
una por cada valor de parámetro con el cual H0 es verdadera: (75), (75.8), (76.5), y
así sucesivamente. Es fácil verificar que (75) es la más grande de todas estas probabilidades de error de tipo I. Enfocándose en el valor límite equivale a trabajar explícitamente con
el “peor caso”.
■
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:17 AM
Page 291
8.1 Hipótesis y procedimientos de prueba
291
La especificación de un valor de corte para la región de rechazo en los ejemplos que
se acaban de considerar fue algo arbitraria. El uso de R8 {8, 9, . . . , 20} en el ejemplo 8.1
dio por resultado 0.102, (0.3) 0.772 y (0.5) 0.132. Muchos pensarán que estas
probabilidades de error son intolerablemente grandes. Quizá puedan reducirse si se cambia
el valor de corte.
Ejemplo 8.3
(continuación
del ejemplo
8.1)
Utilice el mismo experimento y el estadístico de prueba X como previamente se describió en el problema de la defensa de automóvil pero ahora considere la región de rechazo R9 {9, 10, . . . , 20}. Como X sigue teniendo una distribución binomial con
parámetros n 20 y p,
P(H0 es rechazada cuando p 0.25)
P(X 9 cuando X Bin(20, 0.25)) 1 – B(8; 20, 0.25) 0.041
La probabilidad de error de tipo I se redujo con el uso de la nueva región de rechazo. Sin
embargo, se pagó un precio por esta reducción:
(0.3) P(H0 no es rechazada cuando p 0.3)
P(X 8 cuando X Bin(20, 0.3)) B(8; 20, 0.3) 0.887
(0.5) B(8; 20, 0.5) 0.252
Ambas son más grandes que las probabilidades de error correspondientes 0.772 y 0.132
para la región R8. En retrospectiva, no es sorprendente; se calcula sumando las probabilidades de los valores estadísticos de prueba en la región de rechazo, en tanto que es la probabilidad de que X quede en el complemento de la región de rechazo. Al hacerse más
pequeña la región de rechazo debe reducirse al mismo tiempo que se incrementa con
cualquier valor alternativo fijo del parámetro.
■
Ejemplo 8.4
(continuación
del ejemplo
8.2)
El uso del valor de corte c 70.8 en el ejemplo de secado de la pintura dio por resultado
un valor de muy pequeño (0.01) pero grande. Considere el mismo experimento y pruebe el estadístico de prueba
X con la nueva región de rechazo x 72. Como X
sigue siendo
normalmente distribuida con valor medio X y X 1.8,
P(H0 es rechazada cuando es verdadera)
P(X
72 cuando X
N(75, 1.82))
72 75
(1.67) 0.0475 0.05
1.8
(72) P(H0 no es rechazada cuando 72)
P(X
72 cuando X
es una variable aleatoria normal con media de 72 y desviación estándar de 1.8)
72 72
1 (0) 0.5
1.8
72 70
0.1335
1.8
1
(70) 1
(67) 0.0027
El cambio del valor de corte agrandó la región de rechazo (incluye más valores de x y el resultado es una reducción de por cada fija menor que 75. Sin embargo, en esta nueva
región se ha incrementado desde el valor previo 0.01 hasta aproximadamente 0.05. Si una
probabilidad de error de tipo I así de grande puede ser tolerada, se prefiere la segunda re■
gión (c 72) a la primera (c 70.8) debido a las más pequeñas.
Los resultados de estos ejemplos pueden ser generalizados de la siguiente manera.
www.FreeLibros.me
c8_p284-324.qxd
292
3/12/08
CAPÍTULO 8
4:17 AM
Page 292
Pruebas de hipótesis basadas en una sola muestra
PROPOSICIÓN
Supóngase que un experimento y un tamaño de muestra están fijos y que se selecciona un estadístico de prueba. Entonces si se reduce el tamaño de la región de rechazo
para obtener un valor más pequeño de se obtiene un valor más grande de con cualquier valor de parámetro particular compatible con Ha.
Esta proposición expresa que una vez que el estadístico de prueba y n están fijos, no existe
una región de rechazo que haga que al mismo tiempo y sean pequeños. Se debe seleccionar una región para establecer un compromiso entre y .
Debido a las indicaciones sugeridas para especificar H0 y Ha, casi siempre un error
de tipo I es más serio que uno de tipo II (esto en general se puede lograr mediante la selección apropiada de las hipótesis). El método seguido por la mayoría de los practicantes
de la estadística es especificar el valor más grande de que pueda ser tolerado y encontrar
una región de rechazo que tenga valor de en lugar de cualquier otro más pequeño. Esto
hace a tan pequeño como sea posible sujeto al límite en . El valor resultante de
a menudo se conoce como nivel de significación de la prueba. Niveles tradicionales
de significación son 0.10, 0.05 y 0.01, aunque el nivel en cualquier problema particular dependerá de la seriedad de un error de tipo I: mientras más serio es este error, más pequeño
deberá ser el nivel de significación. El procedimiento de prueba correspondiente se llama
prueba de nivel (p. ej., prueba de nivel 0.05 o prueba de nivel 0.01). Una prueba con nivel de significación es una donde la probabilidad de error de tipo I se controla al nivel
especificado.
Ejemplo 8.5
Considere la situación previamente mencionada en la cual era el contenido de nicotina
promedio verdadero de los cigarrillos marca B. El objetivo es probar H0: 1.5 contra Ha:
1.5 con base en una muestra aleatoria X1, X2, . . . , X32 de contenido de nicotina. Suponga que se sabe que la distribución del contenido de nicotina es normal con 0.20. Entonces
X está normalmente distribuida con valor medio X y desviación estándar X
0.20/ 3
2 0.0354.
En lugar de utilizar X
X suponiendo que H0
como estadístico de prueba, se estandariza
es verdadera.
Estadístico de prueba:
Z
X 1.5
X 1.5
0.0354
/n
Z expresa la distancia entre X
y su valor esperado cuando H0 es verdadera como algún número de desviaciones estándar. Por ejemplo, z 3 resulta de una x que es 3 desviaciones
estándar más grande de lo que se habría esperado si H0 fuera verdadera.
Rechazar H0 cuando x excede “considerablemente” de 1.5 equivale a rechazar H0
cuando z excede “considerablemente” de cero. Es decir, la forma de la región de rechazo es
z c. Determínese ahora c de modo que 0.05. Cuando H0 es verdadera, Z tiene una
distribución estándar normal. Por consiguiente
P(error de tipo I) P(rechazar H0 cuando H0 es verdadera)
P(Z c cuando Z N(0, 1))
El valor de c debe capturar el área de la cola superior 0.05 bajo la curva z. O de la sección
4.3 o directamente de la tabla A.3, c z0.05 1.645.
Obsérvese que z 1.645 equivale a x 1.5 (0.0354)(1.645), es decir, x 1.56.
Entonces es la probabilidad de que X
1.56 y puede ser calculada con cualquier mayor que 1.5.
■
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:17 AM
Page 293
8.1 Hipótesis y procedimientos de prueba
EJERCICIOS
293
Sección 8.1 (1-14)
1. Por cada una de las siguientes aseveraciones, exprese si es
una hipótesis estadística legítima y por qué:
a. H: 100
b. H: ~
x 45
c. H: s 0.20
d. H: 1/2 1
e. H:
X
Y5
f. H: 0.01 donde es el parámetro de una distribución
exponencial utilizada para modelar la vida útil de un
componente.
2. Para los siguientes pares de aseveraciones, indique cuáles
no satisfacen las reglas de establecer hipótesis y por qué
(los subíndices 1 y 2 diferencian las cantidades de dos poblaciones o muestras diferentes).
a. H0: 100, Ha: 100
b. H0: 20, Ha: 20
c. H0: p 0.25, Ha: p 0.25
d. H0: 1 2 25, Ha: 1 2 100
e. H0: S 21 S 22, Ha: S 21 S 22
f. H0: 120, Ha: 150
g. H0: 1/2 1, Ha: 1/2 1
h. H0: p1 p2 0.1, Ha: p1 p2 0.1
3. Para determinar si las soldaduras de las tuberías en una
planta de energía nuclear satisfacen las especificaciones, se
selecciona una muestra aleatoria de soldaduras y se realizan
pruebas en cada una de las soldaduras. La resistencia de la
soldadura se mide como la fuerza requerida para romperla.
Suponga que las especificaciones indican que la resistencia
media de las soldaduras deberá exceder de 100 lb/pulg2; el
equipo de inspección decide probar H0: 100 contra Ha:
100. Explique por qué podría ser preferible utilizar
esta Ha en lugar de 100.
4. Sea el nivel de radioactividad promedio verdadero (picocuries por litro). Se considera que el valor 5 pCi/L es la línea divisoria entre agua segura e insegura. ¿Recomendaría
probar H0: 5 contra Ha: 5 o H0: 5 contra Ha:
5? Explique su razonamiento. [Sugerencia: Piense en
las consecuencias de un error de tipo I o de un error de tipo
II con cada posibilidad.]
5. Antes de aprobar un gran pedido de fundas de polietileno
para un tipo particular de cable de energía submarino relleno de aceite a alta presión, una compañía desea contar con
evidencia conclusiva de la desviación estándar verdadera
del espesor de la funda es de menos de 0.05 mm. ¿Qué hipótesis deberán ser probadas y por qué? En este contexto,
¿Cuáles son los errores de tipo I y II?
6. Muchas casas viejas cuentan con sistemas eléctricos que utilizan fusibles en lugar de cortacircuitos. Un fabricante de fusibles de 40 amp desea asegurarse de que el amperaje medio
al cual se queman sus fusibles es en realidad de 40. Si el amperaje medio es menor que 40, los clientes se quejarán porque
los fusibles tienen que ser reemplazados con demasiada frecuencia. Si el amperaje medio es de más de 40, el fabricante
podría ser responsable de los daños que sufra un sistema eléctrico a causa del funcionamiento defectuoso de los fusibles.
Para verificar el amperaje de los fusibles, se selecciona e inspecciona una muestra de fusibles. Si tuviera que realizarse
una prueba de hipótesis con los datos resultantes, ¿Qué hipó-
tesis nula y alternativa sería de interés para el fabricante? Describa los errores de tipo I y II en el contexto de este problema.
7. Se toman muestras de agua utilizada para enfriamiento al momento de ser descargada por una planta de energía en un río.
Se ha determinado que en tanto la temperatura media del agua
descargada sea cuando mucho de 150°F, no habrá efectos negativos en el ecosistema del río. Para investigar si la planta
cumple con los reglamentos que prohíben una temperatura
media por encima de 150° del agua de descarga, se tomarán al
azar 50 muestras de agua y se registrará la temperatura de cada muestra. Los datos resultantes se utilizarán para probar la
hipótesis H0: 150° contra Ha: 150°. En el contexto
de esta situación, describa los errores de tipo I y tipo II. ¿Qué
tipo de error consideraría más serio? Explique.
8. Un tipo regular de laminado está siendo utilizado por un fabricante de tarjetas de circuito. Un laminado especial ha sido desarrollado para reducir el alabeo. El laminado regular
será utilizado en una muestra de especímenes y el laminado
especial en otra muestra y se determinará entonces la cantidad de alabeo en cada espécimen. El fabricante cambiará
entonces al laminado especial sólo si puede demostrar que
la cantidad de alabeo promedio verdadera de dicho laminado es menor que la del laminado regular. Formule las hipótesis pertinentes y describa los errores de tipo I y de tipo II
en el contexto de esta situación.
9. Dos compañías diferentes han solicitado proporcionar el
servicio de televisión por cable en una cierta región. Sea p
la proporción de todos los suscriptores potenciales que
favorecen a la primera compañía sobre la segunda. Considere probar H0: p 0.5 contra Ha: p 0.5 basado en una
muestra aleatoria de 25 individuos. Sea X el número en
la muestra que favorece a la primera compañía y x el valor
observado de X.
a. ¿Cuál de las siguientes regiones de rechazo es más apropiada y por qué?
R1 {x: x 7 o x
R3 {x: x 17}
18}, R2 {x: x 8},
b. En el contexto de este problema, describa cuáles son los
errores de tipo I y de tipo II.
c. ¿Cuál es la distribución de probabilidad del estadístico
de prueba X cuando H0 es verdadera? Úsela para calcular la probabilidad de un error de tipo I.
d. Calcule la probabilidad de un error de tipo II en la región
seleccionada cuando p 0.3, otra vez cuando p 0.4 y
también con p 0.6 y p 0.7.
e. Utilizando la región seleccionada, ¿qué concluiría si 6 de
los 25 individuos encuestados favorecen a la compañía 1?
10. Una mezcla de cenizas combustibles pulverizadas y cemento
Portland utilizada para rellenar con lechada deberá tener
una resistencia a la compresión de más de 1300 KN/m2.
La mezcla no será utilizada a menos que la evidencia experimental indique concluyentemente que la especificación de
resistencia ha sido satisfecha. Suponga que la resistencia a
la compresión de especímenes de esta muestra está normalmente distribuida con 60. Sea la resistencia a la compresión promedio verdadera.
www.FreeLibros.me
c8_p284-324.qxd
294
3/12/08
CAPÍTULO 8
4:17 AM
Page 294
Pruebas de hipótesis basadas en una sola muestra
a. ¿Cuáles son las hipótesis nula y alternativa apropiadas?
b. Sea X
la resistencia a la compresión promedio muestral
de n 20 especímenes seleccionados al azar. Considere el procedimiento de prueba con estadístico de prueba
X
y región de rechazo x 1331.26. ¿Cuál es la distribución de probabilidad del estadístico cuando H0 es verdadera? ¿Cuál es la probabilidad de un error de tipo I para
el procedimiento de prueba?
c. ¿Cuál es la distribución de probabilidad del estadístico
de prueba cuando 1350? Utilizando el procedimiento de prueba de la parte (b), ¿cuál es la probabilidad de
que la mezcla será juzgada insatisfactoria cuando en realidad 1350 (un error de tipo II)?
d. ¿Cómo cambiaría el procedimiento de prueba de la parte (b) para obtener una prueba con nivel de significación
de 0.05? ¿Qué impacto tendría este cambio en la probabilidad de error de la parte (c)?
e. Considere el estadístico de prueba estandarizado Z
(X
) (X
1300)/(/n
1300)/13.42. ¿Cuáles son los
valores de Z correspondientes a la región de rechazo de
la parte (b)?
11. La calibración de una báscula tiene que ser verificada pesando 25 veces un espécimen de prueba de 10 kg. Suponga
que los resultados de diferentes pesadas son independientes
entre sí y que el peso en cada ensayo está normalmente distribuido con 0.200 kg. Sea la lectura de peso promedio verdadero en la báscula.
a. ¿Qué hipótesis deberá poner a prueba?
b. Suponga que la báscula tiene que ser recalibrada si o
x 10.1032 o x 9.8968. ¿Cuál es la probabilidad de
que se realice la recalibración cuando en realidad no es
necesaria?
c. ¿Cuál es la posibilidad de que la recalibración sea
considerada innecesaria cuando en realidad 10.1?
¿Cuándo 9.8?
d. Sea z (x 10)/(/n
). ¿Con qué valor de c la región
de rechazo de la parte (b) equivale a la región de “dos
colas” o z c o z c?
e. Si el tamaño de muestra fue de sólo 10 y no de 25, ¿cómo
modificaría el procedimiento de la parte (d) de modo que
0.05?
f. Utilizando la prueba de la parte (e), ¿qué concluiría basado en los siguientes datos muestrales:
9.981 10.006 9.857 10.107 9.888
9.728 10.439 10.214 10.190 9.793
g. Exprese de nuevo el procedimiento de prueba de la parte (b) en función del estadístico de prueba estandarizado
Z (X
10)/(/n).
12. Un nuevo diseño del sistema de frenos de un cierto tipo de
carro ha sido propuesto. Para el sistema actual, se sabe que la
distancia de frenado promedio verdadera a 40 mph en condiciones específicas es de 120 pies. Se propone que el nuevo
diseño sea implementado sólo si los datos muestrales indican fuertemente una reducción de la distancia de frenado
promedio verdadera del nuevo diseño.
a. Defina el parámetro de interés y formule las hipótesis
pertinentes.
b. Suponga que la distancia de frenado del nuevo sistema
está normalmente distribuido con 10. Sea X
la distancia de frenado promedio de una muestra de 36 observaciones. ¿Cuáles de las siguientes regiones de rechazo
es apropiada: R1 {x: x 124.80}, R2 {x: x
115.20}, R3 = {x: o x 125.13 o x 114.87}?
c. ¿Cuál es el nivel de significación de la región apropiada
de la parte (b)? ¿Cómo cambiaría la región para obtener
una prueba con 0.001?
d. ¿Cuál es la probabilidad de que el nuevo diseño no sea
implementado cuando la distancia de frenado promedio
verdadera sea en realidad de 115 pies y la región apropiada de la parte (b) sea utilizada?
e. Sea Z (X
). ¿Cuál es el nivel de signifi 120)/(/n
cación de la región de rechazo {z: z 2.33}? ¿Para la
región {z: z 2.88}?
13. Sean X1, . . . , Xn una muestra aleatoria de una distribución
de población normal con un valor conocido de .
a. Para probar las hipótesis H0: 0, contra Ha: 0
(donde 0 es un número fijo), demuestre que la prueba con
el estadístico
X y región de rechazo x 0 2.33/n
tiene un nivel de significación de 0.01.
b. Suponga que se utiliza el procedimiento de la parte (a)
para probar H0: 0 contra Ha: 0. Si 0 100,
n 25 y 5, ¿cuál es la probabilidad de cometer un
error de tipo I cuando 99? ¿Cuándo 98? En general, ¿qué se puede decir sobre la probabilidad de un
error de tipo I cuando el valor real de es menor que
0? Verifique su aseveración.
14. Reconsidere la situación del ejercicio 11 y suponga que la
región de rechazo es {x: x 10.1004 o x 9.8940}
{z: z 2.51 o z 2.65}.
a. ¿Cuál es para este procedimiento?
b. ¿Cuál es cuando 10.1? ¿Cuándo 9.9? ¿Es
ésta deseable?
8.2 Pruebas sobre una media de población
La discusión general en el capítulo 7 de intervalos de confianza para una media de población se enfocó en tres casos diferentes. A continuación se desarrollan procedimientos para
estos mismos tres casos.
Caso I: Una población normal con
conocida
Aun cuando la suposición de que el valor de es conocido rara vez se cumple en la práctica, este caso proporciona un buen punto de partida debido a la facilidad con que los
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:17 AM
Page 295
8.2 Pruebas sobre una media de población
295
procedimientos generales y sus propiedades pueden ser desarrollados. La hipótesis nula en
los tres casos propondrá que tiene un valor numérico particular, el valor nulo, el cual será denotado por 0. Sean X1, . . . , Xn una muestra aleatoria de tamaño n de la población
normal. Entonces la media muestral X
tiene una distribución normal con valor esperado
X y desviación estándar X /n. Cuando H0 es verdadera X 0. Considérese ahora el estadístico Z obtenido estandarizando X
de conformidad con la suposición de
que H0 es verdadera:
Z
X
0
/n
Al sustituir la media muestral calculada x se obtiene z, la distancia entre x y 0 expresada
en “unidades de desviación estándar”. Por ejemplo, si la hipótesis nula es H0: 100,
X /n
10/2
5 2.0 y x 103, entonces el valor estadístico de prueba es z
(103 – 100)/2.0 1.5. Es decir, el valor observado de x es 1.5 desviaciones estándar (de
X)
más grande de lo que se espera sea cuando H0 es verdadera. El estadístico Z es una medida
natural de la distancia
X, el estimador de y su valor esperado cuando H0 es verdadera. Si
esta distancia es demasiado grande en una dirección consistente con Ha, la hipótesis nula deberá ser rechazada.
Supóngase primero que la hipótesis alternativa tiene la forma Ha: 0. Entonces
un valor de x menor que 0 indudablemente no apoya a Ha. Tal x corresponde a un valor negativo de z (puesto que x 0 es negativa y el divisor de /n es positivo). Del mismo
modo, un valor de x que exceda de 0 por sólo una pequeña cantidad (correspondiente a z
la cual es positiva aunque pequeña) no sugiere que H0 deberá ser rechazada a favor de Ha.
El rechazo de H0 es apropiado sólo cuando x excede considerablemente de 0, es decir,
cuando el valor de z es positivo y grande. En suma, la región de rechazo apropiada basada
en el estadístico de prueba Z en lugar de
X tiene la forma z c.
Como se discutió en la sección 8.1, el valor de corte c deberá ser elegido para controlar la probabilidad de un error de tipo I al nivel deseado. Esto es fácil de lograr porque la
distribución del estadístico de prueba Z cuando H0 es verdadera es la distribución normal estándar (es por eso que 0 se restó al estandarizar). El valor c de corte requerido es el valor
crítico z que captura el área de la cola superior bajo la curva z. Como ejemplo, sea c
1.645, el valor que captura el área de cola 0.05 (z0.05 1.645). Entonces,
P(error de tipo I) P(H0 es rechazada cuando H0 es verdadera)
P(Z 1.645 cuando Z N(0, 1)) 1 (1.645) 0.05
Más generalmente, la región de rechazo z z tiene un probabilidad de error de tipo I . El
procedimiento de prueba es de cola superior porque la región de rechazo se compone de sólo valores grandes del estadístico de prueba.
Un razonamiento análogo para la hipótesis alternativa Ha: 0 sugiere una región
de rechazo de la forma z c, donde c es un número negativo adecuadamente seleccionado
(x aparece muy debajo de 0 si y sólo si z es bastante negativo). Como Z tiene una distribución normal estándar cuando H0 es verdadera, con c z da P(error de tipo I) . Esta
es una prueba de cola inferior. Por ejemplo, z0.10 1.28 implica que la región de rechazo
z 1.28 especifica una prueba con nivel de significación de 0.10.
Por último, cuando la hipótesis alternativa es Ha: 0, H0 deberá ser rechazada si
x está muy lejos a ambos lados de 0. Esto equivale a rechazar H0 si z c o si z c. Supóngase que se desea 0.05. Entonces,
0.05 P(Z c o Z c cuando Z tiene una distribución normal estándar)
(c) 1 (c) 2[1 (c)]
Por consiguiente c es tal que 1 (c), el área bajo la curva z a la derecha de c, es 0.025 (¡y
no 0.05!). De acuerdo con la sección 4.3 o la tabla A.3, c 1.96 y la región de rechazo
www.FreeLibros.me
c8_p284-324.qxd
296
3/12/08
CAPÍTULO 8
4:17 AM
Page 296
Pruebas de hipótesis basadas en una sola muestra
z
1.96 o z 1.96. Con cualquier , la región de rechazo de dos colas z
z/2 o
z z/2 tiene una probabilidad de error de tipo I (puesto que el área /2 está capturada
debajo de cada una de las dos colas de la curva z). De nueva cuenta, la razón clave para utilizar el estadístico de prueba estandarizado Z es que como Z tiene una distribución conocida cuando H0 es verdadera (estándar normal), es fácil de obtener una región de rechazo con
probabilidad de error de tipo I mediante un valor crítico apropiado.
El procedimiento de prueba en el caso I se resume en el cuadro adjunto y las regiones
de rechazo correspondientes se ilustran en la figura 8.2.
Hipótesis nula: H0: 0
Valor del estadístico de prueba:
x 0
z
/n
Hipótesis alternativa
Región de rechazo para la prueba de nivel
Ha: 0
Ha: 0
Ha: 0
z z (prueba de cola superior)
z z (prueba de cola inferior)
z z/2 o z z/2 (prueba de dos colas)
o
Curva z (distribución de probabilidad del estadístico de prueba Z cuando H0 es verdadera)
Área total sombreada
P(error de tipo I)
Área sombreada
P(error de tipo I)
0
z
Área sombreada
/2
z
0
Región de rechazo: z z
Región de rechazo: z
a)
z
b)
Área sombreada
/2
z /2
z /2
0
Región de rechazo:
z z /2 o z z/2
c)
Figura 8.2 Regiones de rechazo para pruebas z : a) prueba de cola superior; b) prueba de
cola inferior; c) prueba de dos colas.
Se recomienda utilizar la siguiente secuencia de pasos cuando se prueben hipótesis con respecto a un parámetro.
1. Identificar el parámetro de interés y describirlo en el contexto de la situación del problema.
2. Determinar el valor nulo y formular la hipótesis nula.
3. Formular la hipótesis alternativa apropiada.
4. Dar la fórmula para el valor calculado del estadístico de prueba (sustituyendo el valor
nulo y los valores conocidos de cualquier otro parámetro, pero no aquellos de cualquier
cantidad basada en una muestra).
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:17 AM
Page 297
8.2 Pruebas sobre una media de población
297
5. Establecer la región de rechazo para el nivel de significación seleccionado .
6. Calcular cualquier cantidad muestral necesaria, sustituir en la fórmula para el estadístico de prueba y calcular dicho valor.
7. Decidir si H0 debe ser rechazada y expresar esta conclusión en el contexto del problema.
La formulación de hipótesis (pasos 2 y 3) deberá ser realizada antes de examinar los datos.
Ejemplo 8.6
Un fabricante de sistemas rociadores utilizados como protección contra incendios en edificios de oficinas afirma que la temperatura de activación del sistema promedio verdadera es
de 130°. Una muestra de n 9 sistemas, cuando se somete a prueba, da una temperatura de
activación promedio muestral de 131.08°F. Si la distribución de los tiempos de activación
es normal con desviación estándar de 1.5°F, ¿contradicen los datos la afirmación del fabricante a un nivel de significación 0.01?
1. Parámetro de interés: temperatura de activación promedio verdadera.
2. Hipótesis nula: H0: 130 (valor nulo 0 130).
3. Hipótesis alternativa: Ha: 130 (un alejamiento del valor declarado en una u otra dirección es de interés).
4. Valor de estadístico de prueba:
x 0
x 130
z
/n
1.5/n
5. Región de rechazo: La forma de Ha implica el uso de una prueba de dos colas con región de rechazo o de z z0.005 o z z0.005. De acuerdo con la sección 4.3 o la tabla
A.3. z0.005 2.58, así que se rechazaría H0 si z 2.58 o z 2.58.
6. Sustituyendo n 9 y x 131.08,
z
1.08
131.08 130
2.16
0.5
1.5/9
Es decir, la media muestral observada es de un poco más de 2 desviaciones estándar sobre el valor que era de esperarse si H0 fuera verdadera.
7. El valor calculado z 2.16 no queda en la región de rechazo (2.58 2.16 2.58), así
que H0 no puede ser rechazada al nivel de significación de 0.01. Los datos no apoyan fuertemente la afirmación de que el promedio verdadero difiere del valor de diseño de 130. ■
y determinación del tamaño muestral Las pruebas z para el caso 1 se encuentran entre
las pocas en estadística para las cuales existen fórmulas simples para , la probabilidad de
un error de tipo II. Considérese en primer lugar la prueba de cola superior con región de rechazo z z. Esta equivale a x 0 z /n
, por lo que H0 no será rechazada si x
0 z /n
. Si ahora denota un valor particular de que exceda el valor nulo 0.
Entonces,
( ) P(H0 es no rechazada cuando
P(X
0 z /n cuando
P
X
/n
z
z
0
/n
)
)
0
cuando
/n
www.FreeLibros.me
c8_p284-324.qxd
298
3/12/08
CAPÍTULO 8
4:17 AM
Page 298
Pruebas de hipótesis basadas en una sola muestra
Conforme se incrementa 0 se vuelve más negativa, de modo que ( ) será pequeña cuando excede 0 en gran medida (porque el valor con el que se evalúa será
entonces bastante negativo). Las probabilidades de error para las pruebas de cola inferior
y de dos colas se derivan de manera análoga.
Si es grande, la probabilidad de un error de tipo II puede ser grande con un valor alternativo de que sea de interés particular para un investigador. Supóngase que se fija y
que también se especifica para semejante valor alternativo. En el ejemplo de los sistemas
rociadores, los oficiales de la compañía podrían considerar 132 como un alejamiento
muy sustancial de H0: 130 y desear por consiguiente (132) 0.10 además de
0.01. Más generalmente, considérense las dos restricciones P(error de tipo I) y ( )
para , y especificadas. Entonces para una prueba de cola superior, el tamaño de
muestra n debe ser elegido para satisfacer
z
0
/n
Esto implica que
z
valor z crítico que captura
z 0
el área de cola inferior
/n
Es fácil resolver esta ecuación para el tamaño de muestra n deseado. Un argumento paralelo da el tamaño de muestra necesario para las pruebas de cola inferior y de dos colas como
se resume en el siguiente cuadro.
Probabilidad de error de tipo II ( )
para una prueba de nivel
Hipótesis
alternativa
0
/n
1 z 0
/n
0
z/2
z/2 0
/n
/n
Ha: 0
z
Ha: 0
Ha: 0
donde (z) función de distribución acumulativa normal estándar.
El tamaño de muestra n con el cual una prueba de nivel también tiene ( )
con el valor alternativo es
¨ (z z)
«
0
«
n©
« (z/2 z)
«
ª
0
Ejemplo 8.7
2
para una prueba de una cola
(superior o inferior)
para una prueba de dos colas
(una solución aproximada)
2
Sea la vida promedio verdadera de la banda de rodamiento de un cierto tipo de llanta.
Considere poner a prueba H0: 30 000 contra Ha: 30 000 basado en un tamaño de
muestra n 16 de una distribución de población normal con 1500. Una prueba con
0.01 requiere z z0.01 2.33. La probabilidad de cometer un error de tipo II cuando
31 000 es
(31 000) 2.33
30 000 31 000
( 0.34) 0.3669
1500/16
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:17 AM
Page 299
8.2 Pruebas sobre una media de población
299
Como z0.1 1.28, el requerimiento de que el nivel de prueba 0.01 también tenga (31 000)
0.1 necesita
n
1500(2.33 1.28)
30 000 31 000
( 5.42) 29.32
2
2
El tamaño de muestra debe ser un entero, por lo tanto se deberán utilizar n 30 llantas. ■
Caso II: Pruebas con muestras grandes
Cuando el tamaño de muestra es grande, la pruebas z en el caso I son fáciles de modificar
para dar procedimientos de prueba válidos sin requerir una distribución de población normal o conocida. El resultado clave se utilizó en el capítulo 7 para justificar intervalos de
confianza para muestra grande: Un tamaño de muestra grande n implica que la variable estandarizada
Z
X
S/n
tiene aproximadamente una distribución normal estándar. La sustitución del valor nulo
en lugar de da el estadístico de prueba
Z
0
X
0
S/n
la que tiene aproximadamente una distribución normal estándar cuando H0 es verdadera. El
uso de las regiones de rechazo dadas previamente para el caso I (p. ej., z z cuando la hipótesis alternativa es Ha: 0) produce entonces procedimientos de prueba con los cuales el nivel de significación es aproximadamente (y no exactamente) . Se utilizará de nuevo
la regla empírica n 40 para caracterizar un tamaño de muestra grande.
Ejemplo 8.8
Se utiliza un penetrómetro cónico dinámico (DCP, por sus siglas en inglés) para medir la resistencia de un material a la penetración (mm/golpe), a medida que el cono es insertado en
pavimento o subrasante. Suponga que para una aplicación particular, se requiere que el valor penetración cónica dinámica promedio verdadera para un cierto tipo de pavimento sea
menor que 30. El pavimento no será utilizado a menos que exista evidencia concluyente de
que la especificación fue satisfecha. Formule y pruebe las hipótesis apropiadas utilizando
los datos siguientes (“Probabilistic Model for the Analysis of Dynamic Cone Penetrometer
Test Values in Pavement Structure Evaluation”, J. of Testing and Evaluation, 1999: 7-14:
14.1
14.5
15.5
16.0
16.0
16.7
16.9
17.1
17.5
17.8
17.8
18.1
18.2
18.3
18.3
19.0
19.2
19.4
20.0
20.0
20.8
20.8
21.0
21.5
23.5
27.5
27.5
28.0
28.3
30.0
30.0
31.6
31.7
31.7
32.5
33.5
33.9
35.0
35.0
35.0
36.7
40.0
40.0
41.3
41.7
47.5
50.0
51.0
51.8
54.4
55.0
57.0
La figura 8.3 muestra un resumen descriptivo obtenido con MINITAB. La penetración cónica dinámica media muestral es menor que 30. Sin embargo, existe una cantidad sustancial
de variación en los datos (coeficiente de variación muestral s/ x 0.4265), de modo que
la media sea menor que el valor de corte de la especificación de diseño puede ser una consecuencia simplemente de la variabilidad muestral. Obsérvese que el histograma no se asemeja en absoluto a una curva normal (y una curva de probabilidad normal no exhibe un
patrón lineal), aunque las pruebas z con muestras grandes no requieren una distribución de
población normal.
www.FreeLibros.me
c8_p284-324.qxd
300
3/12/08
CAPÍTULO 8
4:17 AM
Page 300
Pruebas de hipótesis basadas en una sola muestra
Figura 8.3 Resumen descriptivo generado por MINITAB para los datos de penetración de cono
dinámico del ejemplo 8.8.
1.
valor de penetración cónica dinámica promedio verdadero
2. H0: 30
3. Ha: 30 (por consiguiente el parámetro no será utilizado a menos que la hipótesis
nula sea rechazada).
x 30
4. z
s/n
5. Una prueba con nivel de significación de 0.05 rechaza a H0 cuando z 1.645 (una
prueba de cola inferior).
6. Con n 52, x 28.76 y s 12.2647,
z
28.76 30
1.24
0.73
12.2647/52
1.701
7. Como 0.73 1.645, H0 no puede ser rechazada. No se cuenta con evidencia precisa para concluir que 30; el uso del pavimento no se justifica.
■
La determinación de y el tamaño de muestra necesario para estas pruebas con muestra grande pueden basarse en la especificación de un valor plausible de o en el uso de la
formulación para el caso I (aun cuando se utilice s en la prueba) o en el uso de las curvas
que se introducirán en breve en conexión con el caso III.
Caso III: Una distribución de población normal
Cuando n es pequeño, el teorema del límite central (TLC) ya no puede ser invocado para
justificar el uso de una prueba con muestra grande. Esta misma dificultad se presenta al obtener un intervalo de confianza con muestra pequeña (IC) para en el capítulo 7. El método
utilizado aquí es el mismo que el usado allí. Se supondrá que la distribución de población es
por lo menos aproximadamente normal y se describirán los procedimientos de prueba cuya
validez se fundamenta en esta suposición.
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:17 AM
Page 301
8.2 Pruebas sobre una media de población
301
Si un investigador tiene una buena razón para creer que la distribución de población es bastante subnormal, se puede utilizar una prueba libre de distribución del capítulo 15. Alternativamente, un estadístico puede ser consultado en cuanto a procedimientos válidos para
familias específicas de distribuciones de población, aparte de la familia normal. O se puede
desarrollar un procedimiento bootstrap.
Se utilizó el resultado clave en el cual están basadas las pruebas con una media de población normal en el capítulo 7 para derivar el intervalo de confianza t para una muestra: Si
X1, X2 . . . , Xn es una muestra aleatoria de una distribución normal, la variable estandarizada
X
T
S/n
tiene una distribución t con n – 1 grados de libertad (gl). Considérese poner a prueba H0:
0 contra Ha: 0 utilizando el estadístico de prueba T (X
). Es decir,
0)/(S/n
el estadístico de prueba resulta de estandarizar
X conforme a la suposición de que H0 es verdadera (utilizando S/n
, la desviación estándar estimada de
X en lugar de /n
). Cuando
H0 es verdadera, el estadístico de prueba tiene una distribución t con n – 1 grados de libertad. El conocimiento de la distribución del estadístico de prueba cuando H0 es verdadera (la
“distribución nula”) permite construir una región de rechazo para la cual la probabilidad de
error de tipo I se controla al nivel deseado. En particular, el uso del valor crítico t de cola
superior t, n1 para especificar la región de rechazo t t, n1 implica que
P(error de tipo I) P(H0 es rechazada cuando es verdadera)
P(T t, n1 cuando T tiene una distribución t con n – 1
grados de libertad)
El estadístico de prueba es en realidad el mismo del caso de muestra grande pero se
designa T para recalcar que distribución nula es una distribución t con n – 1 grados de libertad en lugar de la distribución estándar normal (z). La región de rechazo para la prueba t difiere de aquella para la prueba z sólo en que un valor crítico t, n1 reemplaza al valor crítico
za. Comentarios similares se aplican a alternativas para las cuales una prueba de cola inferior o de dos colas es apropiada.
Prueba t con una muestra
Hipótesis nula: H0: 0
x 0
Valor estadístico de prueba: t
s/n
Región de rechazo para una prueba de nivel
t t,n1 (cola superior)
t t,n1 (cola inferior)
Hipótesis alternativa
Ha: 0
Ha: 0
Ha: 0
Ejemplo 8.9
o
t
t/2,n1 o t t/2,n1 (dos colas)
Un entorno de trabajo bien diseñado y seguro puede contribuir en gran medida a incrementar
la productividad. Es especialmente importante que a los trabajadores no se les pida realizar tareas, tales como izar cosas, que excedan sus capacidades. Los datos adjuntos sobre peso máximo de izamiento (MAWL, por sus siglas en inglés, en kg) para una frecuencia de cuatro
izamientos/min fueron reportados en el artículo “The Effects of Speed, Frequency, and Load
on Measured Hand Forces for a Floor-to-Knuckle Lifting Task” (Ergonomics, 1992: 833-843);
se seleccionaron al azar sujetos de una población de varones saludables de 18 a 30 años de
edad. Suponiendo que el peso máximo de izamiento está normalmente distribuido ¿sugieren
los datos siguientes que el peso máximo de izamiento medio de la población excede de 25?
25.8
36.6
26.3
21.8
27.2
Efectúe una prueba con un nivel de significación de 0.05.
www.FreeLibros.me
c8_p284-324.qxd
302
3/12/08
CAPÍTULO 8
4:17 AM
Page 302
Pruebas de hipótesis basadas en una sola muestra
1.
peso de izamiento máximo medio de la población
2. H0: 25
3. Ha: 25
x 25
4. t
s/n
5. Rechazar H0 si t
t, n1 t0.05,4 2.132.
6. xi 137.7 y x2i 3911.97, con las cuales x 27.54, s 5.47, y
t
2.54
27.54 25
1.04
2.45
5.47/5
Los datos de salida de MINITAB adjuntos resultado de una solicitud para una prueba t con
una muestra son los mismos valores calculados (El valor P se discutió en la sección 8.4).
Prueba de mu 25.00 vs mu 25.00
Variable
N
Media
Peso máximo de izamiento 5
27.54
DesvEstand
5.47
Media SE
2.45
T Valor P
1.04
0.18
7. Como 1.04 no queda en la región de rechazo (1.04 2.132), H0 no puede ser rechazada
a un nivel de significación de 0.05. Aún es plausible que sea (cuando mucho) de 25. ■
y determinación del tamaño de muestra El cálculo de con el valor alternativo en
el caso I se realizó expresando la región de rechazo en función de x (p. ej., x 0 z /n
)
y luego restando para estandarizar correctamente. Un método equivalente implica observar
que cuando , el estadístico de prueba Z (X
) sigue teniendo una distri 0)/(/n
bución normal con varianza 1, pero ahora el valor medio de Z es ( 0)/(/n
). Es decir,
cuando , el estadístico de prueba sigue teniendo una distribución normal pero no la distribución normal estándar. Por eso, ( ) es un área bajo la curva normal correspondiente al
valor medio ( 0)/(/n) y varianza 1. Tanto como implican trabajar con variables normalmente distribuidas.
El cálculo de () para prueba t es mucho menos directo. Esto es porque la distribución del estadístico de prueba T (X
0)/(S/n) es bastante complicado cuando H0 es
falsa y Ha es verdadera. Por consiguiente, en una prueba de cola superior, determinar
() P(T t,n1 cuando
en lugar de
0)
implica integrar una desagradable función de densidad. Esto debe hacerse numéricamente,
pero por fortuna, ya fue realizado por estadísticos investigadores tanto para pruebas t de una
cola como de dos colas. Los resultados se resumen en gráficas de que aparecen en la tabla A.17. Existen cuatro juegos de gráficas, correspondientes a pruebas de una cola a nivel
0.05 y nivel 0.01 y pruebas de dos colas a los mismos niveles.
Para entender cómo se utilizan estas gráficas, obsérvese primero que tanto como el
tamaño de muestra n en el caso I son función no sólo de la diferencia absoluta °0 °
sino de d °0 °/. Supóngase, por ejemplo, que °0 ° 10. Este alejamiento de H0 será mucho más fácil de descubrir ( más pequeña) cuando 2, en cuyo caso
están a 5 desviaciones estándar de población una de otra, que cuando 10. El
0 y
hecho de que para la prueba t dependa de d y no sólo de °0 ° es desafortunado,
puesto que para utilizar las gráficas se debe tener alguna idea del valor verdadero de . Una
suposición conservadora (grande) para dará por resultado un valor conservador (grande)
de ( ) y una estimación conservadora del tamaño de muestra necesario para y ( )
prescritas.
Con la alternativa y el valor de seleccionados, se calcula d y su valor se localiza
sobre el eje horizontal del conjunto de curvas pertinente. El valor de es la altura de la curva con n 1 grados de libertad por encima del valor de d (es necesaria una interpolación
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:17 AM
Page 303
8.2 Pruebas sobre una media de población
303
1
Curva para n 1 grados de libertad
cuando
'
0
d
Valor de d correspondiente a
Figura 8.4
' alternativa especificada
Curva típica de la prueba t.
visual si n – 1 no es un valor para el cual la curva correspondiente aparece), como se ilustra en la figura 8.4.
En lugar de fijar n (es decir, n – 1, y por consiguiente la curva particular en donde se
lee ) se podría prescribir tanto (0.05 o 0.01 en este caso) y un valor de para las y
seleccionadas. Después de calcular d, se localiza el punto (d, ) en el conjunto de gráficas
pertinentes. La curva debajo y más próxima a este punto da n 1 y por consiguiente n (de
nuevo con frecuencia se requiere interpolación).
Ejemplo 8.10
Se supone que la caída de voltaje promedio verdadera entre el colector y el emisor de transistores bipolares de compuerta aislados de un cierto tiempo es cuando mucho de 2.5 volts.
Un investigador selecciona una muestra de n 10 de esos transistores y utiliza los voltajes
resultantes para probar H0: 2.5 contra Ha: 2.5 por medio de una prueba t con
nivel de significación 0.0.5. Si la desviación estándar de la distribución de voltaje es
0.100, ¿qué tan probable es que H0 no será rechazada cuando en realidad 2.6? Con
d °2.5 2.6°/0.100 1.0, el punto sobre la curva con 9 grados de libertad para una
prueba de una cola con 0.05 por encima de 1.0 tiene aproximadamente 0.1 de altura,
por lo tanto 0.1. El investigador podría pensar que este es un valor de demasiado
grande con semejante alejamiento sustancial de H0 y puede que desee tener 0.05 con
este valor alternativo de . Como d 1.0, el punto (d, ) (1.0, 0.05) debe ser localizado. Este punto se aproxima mucho a la curva de 14 grados de libertad, por lo tanto con n
15 se obtendrá tanto 0.05 como 0.05 cuando el valor de es 2.6 y 0.10. Un
valor más grande de daría una más grande para esta alternativa y un valor alternativo de
más cercano a 2.5 también daría por resultado un valor incrementado de .
■
La mayoría de los programas de computadora estadísticos también calcularán probabilidades de error de tipo II y determinarán tamaños de muestra necesarios. Como un ejemplo,
se le pide a MINITAB que realice los cálculos del ejemplo 8.10. Sus cálculos están basados
en la potencia, la cual es simplemente 1 . Se desea que sea pequeña, lo cual equivale
a solicitar que la potencia de la prueba sea grande. Por ejemplo, 0.05 corresponde a un
valor de 0.95 de potencia. Los datos de salida de MINITAB se dan a continuación.
Power and Sample Size
Testing mean null (versus null)
Calculating power for mean null 0.1
Alpha 0.05 Sigma 0.1
Sample
Size
10
Power
0.8975
www.FreeLibros.me
c8_p284-324.qxd
304
3/12/08
CAPÍTULO 8
4:17 AM
Page 304
Pruebas de hipótesis basadas en una sola muestra
Power and Sample Size
1-Sample t Test
Testing mean null (versus null)
Calculating power for mean null 0.1
Alpha 0.05 Sigma 0.1
Sample
Size
13
Target
Power
0.9500
Actual
Power
0.9597
Obsérvese en la segunda parte de los datos de salida que el tamaño de muestra necesario para
obtener una potencia de 0.95 ( 0.05) para una prueba de cola superior con 0.05 cuando
0.1 y es 0.1 más grande que 0 es de sólo n 13, mientras que las curvas dieron 15.
Cuando está disponible, este tipo de software es más confiable que las curvas.
EJERCICIOS
Sección 8.2 (15-34)
15. Sea el estadístico de prueba Z con una distribución normal
estándar cuando H0 es verdadera. Dé el nivel de significación en cada una de las siguientes situaciones:
a. Ha: 0, región de rechazo z 1.88
b. Ha: 0, región de rechazo z 2.75
c. Ha: 0, región de rechazo z 2.88 o z 2.88
16. Sea el estadístico de prueba T con una distribución t cuando H0 es verdadera. Dé el nivel de significación en cada una
de las situaciones:
a. Ha: 0, grados de libertad 15, región de rechazo
t 3.733
b. Ha: 0, n 24, región de rechazo t 2.500
c. Ha: 0, n 31, región de rechazo t 1.697 o
t 1.697
17. Responda las siguientes preguntas en relación con el problema de las llantas en el ejemplo 8.7.
a. Si x 30 960 y se utiliza una prueba de nivel 0.01,
¿cuál es la decisión?
b. Si utiliza una prueba de nivel 0.01, ¿cuál es (30 500)?
c. Si se utiliza una prueba de nivel 0.01 y también se requiere (30 500), ¿cuál es la más pequeña con la cual
H0 puede ser rechazada (con base en n 16)?
18. Reconsidere la situación de secado de pintura del ejemplo
8.2, en el cual el tiempo de secado para un espécimen de
prueba está normalmente distribuido con 9. Las hipótesis H0: 75 contra Ha: 75 tienen que ser probadas
con una muestra aleatoria de n 25 observaciones.
a. ¿A cuántas desviaciones estándar (de
X) por debajo del
valor nulo se encuentra x 72.3?
b. Si x 72.3, ¿cuál es la conclusión si utiliza 0.01?
c. ¿Cuál es para el procedimiento de prueba que rechaza
H0, cuando z 2.88?
d. Con el procedimiento de prueba de la parte (c), ¿cuál es
(70)?
e. Si se utiliza el procedimiento de prueba (c), ¿qué tamaño
de muestra n es necesario para garantizar (70) 0.01?
f. Si se utiliza un prueba de nivel 0.01 con n 100, ¿cuál
es la probabilidad de un error de tipo I cuando 76?
19. Se determinó el punto de fusión de cada una de las 16
muestras de una cierta marca de aceite vegetal hidrogenado
y el resultado fue x 94.32. Suponiendo que la distribución del punto de fusión es normal con 1.20.
a. Probar H0: 95 contra Ha: 95 por medio de una
prueba de dos colas de nivel 0.01.
b. Si se utiliza una prueba de nivel 0.01, ¿cuál es (94), la
probabilidad de un error de tipo II cuando 94?
c. ¿Qué valor de n es necesario para garantizar que (94)
0.1 cuando 0.01?
20. Se anuncia que focos de un cierto tipo duran un promedio
de 750 horas. El precio de estos focos es muy favorable por
lo que un cliente potencial ha decidido continuar con un
convenio de compra hasta que concluyentemente se demuestre que la duración promedio verdadera es menor que
la anunciada. Se seleccionó una muestra de 50 focos, se determinó la duración de cada uno y se probaron las hipótesis
apropiadas con MINITAB y se obtuvieron los siguientes resultados adjuntos.
Variable N
Mean StDev SEMean
ZP-Value
lifetime 50 738.44 38.20
5.40 2.14
0.016
¿Qué conclusión sería apropiada para un nivel de significación de 0.05? ¿Un nivel de significación de 0.01? ¿Qué nivel de significación y conclusión recomendaría?
21. Se supone que el diámetro promedio verdadero de cojinetes de bolas de un cierto tipo es de 0.5 pulg. Se realizará
una prueba t con una muestra para ver si este es el caso.
¿Qué conclusión es apropiada en cada una de las siguientes situaciones?
a. n 13, t 1.6, 0.05
b. n 13, t 1.6, 0.05
c. n 25, t 2.6, 0.01
d. n 25, t 3.9
22. El artículo “The Foremans View of Quality Control” (Quality Engr. 1990: 257-280) describe una investigación de pesos de recubrimiento de grandes tuberías resultantes de un
proceso de galvanizado. Los estándares de producción demandan un peso promedio verdadero de 200 lb por tubería.
El resumen y diagrama de caja descriptivos adjuntos fueron
producidos por MINITAB.
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:18 AM
Page 305
8.2 Pruebas sobre una media de población
Variable N
Mean Median TrMean StDev SEMean
ctg wt
30 206.73 206.00 206.81
6.35
1.16
Variable
ctg wt
Min
193.00
Max
Q1
218.00 202.75
Q3
212.00
Peso de recubrimiento
190
200
210
220
a. ¿Qué sugiere el diagrama de caja sobre el estado de la
especificación de peso de recubrimiento promedio?
b. Una gráfica de probabilidad normal de los datos resultó
bastante recta. Use los datos de salida descriptivos para
probar las hipótesis apropiadas.
23. El ejercicio 36 del capítulo 1 dio n 26 observaciones sobre
tiempo de escape (seg) de trabajadores petroleros en un ejercicio simulado, con media y desviación estándar muestrales
de 370.69 y 24.36, respectivamente. Suponga que los investigadores creyeron de antemano que el tiempo de escape promedio verdadero sería cuando mucho de 6 min. ¿Contradicen
los datos esta creencia anticipada? Suponiendo normalidad,
pruebe las hipótesis apropiadas mediante un nivel de significación de 0.05.
305
27. La identificación automática de los límites de estructuras
significativas en una imagen médica es un área de investigación continua. El artículo “Automatic Segmentation of
Medical Images Using Image Registration: Diagnostic and
Simulation Applications” (J. of Medical Engr. and Tech.,
2005: 53-63) discutió una nueva técnica, realizar la identificación mencionada. Una medida de la precisión de la región
automática es el desplazamiento lineal promedio (ALD, por
sus siglas en inglés). El artículo dio las siguientes observaciones de desplazamiento lineal promedio con una muestra
de 49 riñones (unidades de dimensiones en pixeles).
1.38
0.39
1.30
1.10
0.82
0.59
1.11
0.44
0.70
0.57
0.65
1.06
0.51
0.34
1.09
0.46
0.43
0.99
0.41
1.04
1.25
0.75
0.54
0.62
0.56
0.58
0.85
0.38
0.66
0.83
1.00
0.56
0.66
0.45
1.44
1.28
0.58
1.05
0.64
0.54
0.52
1.28
0.51
0.64
0.82
0.45
0.83
0.58
0.51
24. Reconsidere las observaciones muestrales sobre viscosidad
estabilizada de especímenes de asfalto introducidos en el
ejercicio 46 del capítulo 1 (2781, 2900, 3013, 2856 y 2888).
Suponga que para una aplicación particular, se requiere que
la viscosidad promedio verdadera sea de 3000. ¿Parece haber sido satisfecho este requerimiento? Formule y pruebe
las hipótesis apropiadas.
a. Resuma y describa los datos.
b. ¿Es plausible que el desplazamiento lineal promedio esté por lo menos normalmente distribuido? ¿Se debe suponer normalidad antes de calcular un intervalo de
confianza para el desplazamiento lineal promedio verdadero o probar las hipótesis en cuanto a desplazamiento
lineal promedio? Explique.
c. Los autores comentaron que en la mayoría de los casos
el desplazamiento lineal promedio es mejor que o del orden de 1.0. ¿Proporcionan en realidad los datos una
fuerte evidencia para concluir que el desplazamiento lineal promedio en estas circunstancias es menor que 1.0?
Efectúe una prueba apropiada de hipótesis.
d. Calcule un límite de confianza superior para el desplazamiento lineal promedio utilizando un nivel de confianza de 95% e interprete este límite.
25. El porcentaje deseado de SiO2 en un cierto tipo de cemento
aluminoso es de 5.5. Para comprobar si el porcentaje promedio verdadero es de 5.5 en una instalación de producción particular, se analizaron 16 muestras independientemente
obtenidas. Suponga que el porcentaje de SiO2 en una muestra está normalmente distribuido con 0.3 y que x 5.25.
a. ¿Indica esto concluyentemente que el porcentaje promedio verdadero difiere de 5.5? Realice el análisis siguiendo la secuencia de pasos sugerida en el texto.
b. Si el porcentaje promedio verdadero es 5.6 y se utiliza una prueba de nivel 0.01 con n 16, ¿cuál es
la probabilidad de descubrir este alejamiento de H0?
c. ¿Qué valor de n se requiere para satisfacer 0.01 y
(5.6) 0.01?
28. La cirugía menor de caballos en condiciones de campo requiere un anestésico de corta duración confiable que produzca una buena relajación muscular, cambios cardiovasculares
y respiratorios mínimos y una rápida y tranquila recuperación
con un mínimo de efectos secundarios de modo que los caballos puedan ser dejados sin atención. El artículo “A Field Trial
of Ketamine Anestesia in the Horse” (Equine Vet. J., 1984:
176-179) reporta que con una muestra de n 73 caballos a
los cuales se les administró ketamina en ciertas condiciones,
el tiempo de reclinación lateral (echado) promedio muestral
fue de 18.86 min y la desviación estándar de 8.6 min. ¿Sugieren estos datos que el tiempo de reclinación lateral promedio
verdadera en estas condiciones es menor que 20 min? Pruebe
las hipótesis apropiadas a un nivel de significación de 0.10.
26. Para obtener información sobre las propiedades de resistencia a la corrosión de un cierto tipo de tubo de acero, se enterraron 45 especímenes en el suelo durante un periodo de
2 años. Se midió entonces la penetración máxima (en mils)
en cada espécimen y se obtuvo una penetración promedio
muestral de x 52.7 y una desviación estándar muestral
de s 4.8. Los tubos se fabricaron con la especificación de que la penetración promedio verdadera sea cuando
mucho de 50 mils. Se utilizarán a menos que se pueda demostrar concluyentemente que la especificación no ha sido
satisfecha. ¿Qué concluiría?
29. Se determinó la cantidad de desgaste en una flecha (0.0001
pulg) después de un kilometraje fijo para cada uno de n 8
motores de combustión interna con cojinetes de plomo al
cobre y se obtuvo x 3.72 y s 1.25.
a. Suponiendo que la distribución del desgaste de la flecha
es normal con media , use la prueba a un nivel de 0.05
para probar H0: 3.50 contra Ha: 3.50.
b. Con 1.25, ¿cuál es la probabilidad de error de tipo
II ( ) de la prueba con la 4.00 alternativa?
30. La ración dietética diaria recomendada de zinc entre varones de
más de 50 años es de 15 mg/día. El artículo “Nutrient Intakes
www.FreeLibros.me
c8_p284-324.qxd
306
3/12/08
CAPÍTULO 8
4:18 AM
Page 306
Pruebas de hipótesis basadas en una sola muestra
and Dietary Patterns of Older Americans: A National Study”
(J. Gerontology, 1992: M145-150) reporta los siguientes datos
de ingesta con una muestra de varones de 65-74 años, n 115,
x 11.3 y s 6.43. ¿Indican estos datos que la ingesta de zinc
diaria promedio en la población de todos los varones de 65-74
años queda por debajo de la ración recomendada?
31. En un experimento diseñado para medir el tiempo necesario
para que los ojos de un inspector se acostumbren a la cantidad de luz reducida para una inspección penetrante, el tiempo promedio muestral para n 9 inspectores fue de 6.32 seg
y la desviación estándar muestral fue de 1.65 seg. Previamente se supuso que el tiempo de adaptación promedio fue por lo
menos de 7 seg. Suponiendo que el tiempo de adaptación está normalmente distribuido, ¿contradicen los datos la creencia anticipada? Use la prueba t con 0.1.
32. Se seleccionó una muestra de 12 detectores de radón de un
cierto tipo y cada uno se expuso a 100 pCi/l de radón. Las
lecturas resultantes fueron las siguientes:
105.6
100.1
90.9
105.0
91.2
99.6
96.9
107.7
96.5
103.3
91.3
92.4
a. ¿Sugieren estos datos que la lectura media de la población en estas condiciones difieren de 100? Formule y
pruebe las hipótesis apropiadas con 0.05.
b. Suponga que antes del experimento, se supuso un valor de 7.5. ¿Cuántas determinaciones tendrían que
ser apropiadas para obtener 0.10 con la alternativa
95 ?
33. Demuestre que con cualquier 0, cuando la distribución
de la población es normal y conocida, la prueba de dos
colas satisface (0 ) (0 ), de modo que ( )
sea simétrica con respecto a 0.
34. Para un valor alternativo fijo, demuestre que ( ) A 0
a medida que n A con una prueba z de una cola o de dos
colas en el caso de una distribución de población normal
con conocida.
8.3 Pruebas relacionadas con una proporción de población
Sea p la proporción de individuos u objetos en una población que poseen una propiedad especial (p. ej., carros con transmisión manual o fumadores que fuman cigarrillos con fitro). Si
un individuo u objeto con la propiedad es etiquetado como éxito (E), entonces p es la proporción de población de éxitos. Las pruebas relacionadas con p se basarán en una muestra aleatoria de tamaño n de la población. Siempre que n sea pequeño con respecto al tamaño de la
población, X (el número de éxitos en la muestra) tiene (aproximadamente) una distribución
binomial. Además, si n es grande, tanto X como el estimador p̂ X/n están normalmente distribuidos. Primero se consideran pruebas con muestras grandes basadas en este último hecho
y luego se acude al caso de muestra pequeña que usa directamente la distribución binomial.
Pruebas con muestra grande
Las pruebas con muestra grande relacionadas con p son un caso especial de los procedimientos
con muestra grande para un parámetro . Sea ˆ un estimador de que es (por lo menos aproximadamente) insesgado y que tiene aproximadamente una distribución normal. La hipótesis nula tiene la forma H0: 0, donde 0 denota un número (el valor nulo) apropiado al contexto del
problema. Suponga que cuando H0 es verdadero, la desviación estándar de ˆ, ˆ, no implica parámetros desconocidos. Por ejemplo, si y ˆ
X, ˆ X /n
, la cual no implica
parámetros sólo si se conoce el valor de . Al estandarizar ˆ conforme a la suposición de que H0
es verdadera (de modo que E( ˆ) 0 se obtiene un estadístico de prueba con muestra grande):
ˆ
0
Estadístico de prueba: Z
ˆ
Si la hipótesis alternativa es Ha: 0, la región de rechazo z z especifica una prueba de
cola superior cuyo nivel de significancia es aproximadamente . Las otras dos alternativas,
Ha: 0 y Ha: 0, se someten a prueba z de cola inferior y a una prueba z de dos colas, respectivamente.
En el caso p, ˆ no implicará parámetros desconocidos cuando H0 es verdadera,
aunque esto es atípico. Cuando ˆ no implica parámetros desconocidos, a menudo es posible utilizar una desviación estándar estimada S ˆ en lugar de ˆ y seguir teniendo Z aproximadamente normalmente distribuida cuando H0 es verdadera (porque n es grande cuando
s ˆ ˆ con la mayoría de las muestras). La prueba con muestra grande de la sección previa
da un ejemplo de esto porque casi siempre es desconocida, se utiliza s ˆ s X s/n
en
lugar de /n
en el denominador de z.
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:18 AM
Page 307
307
8.3 Pruebas relacionadas con una proporción de población
El estimador p̂ X/n es (E( p̂) p), insesgado y su distribución es aproximadamente normal y su desviación estándar es p̂ p
(1
)/
pn. Estos hechos se utilizaron en la
sección 7.2 para obtener un intervalo de confianza para p. Cuando H0 es verdadera E( p̂)
p0 y p̂ p
01
(
p0/n
), así que p̂ no implica parámetros desconocidos. Se desprende entonces que cuando n es grande y H0 es verdadera, el estadístico de prueba
Z
p̂ p0
p01
)
(
p0/n
tiene aproximadamente una distribución normal estándar. Si la hipótesis alternativa es Ha:
p p0 y se utiliza la región de rechazo de cola superior z z, entonces
P(error de tipo I) P(H0 es rechazada cuando es verdadera)
P(Z z cuando Z tiene aproximadamente una distribución
normal estándar)
Por consiguiente el nivel de significación deseado se obtiene utilizando el valor crítico que
capture área crítica en la cola superior de la curva z. Las regiones de rechazo para las otras
dos hipótesis alternativas, cola inferior para Ha: p p0 y dos colas para Ha: p p0 se justifica de manera análoga.
Hipótesis nula:
H0: p p0
Valor estadístico de prueba: z
Hipótesis alternativa
p̂ p0
p01
(
p0/n
)
Región de rechazo
Ha: p p0
z
Ha: p p0
z z (cola inferior)
Ha: p p0
o
z (cola superior)
z
z/2 o z z/2 (dos colas)
Estos procedimientos de prueba son válidos siempre que np0
Ejemplo 8.11
10 y n(1 – p0)
10.
Información reciente sugiere que la obesidad es un problema creciente en Estados Unidos
entre grupos de todas las edades. La Prensa Asociada (9 de octubre de 2002) reportó que
1276 individuos en una muestra de 4115 adultos fueron encontrados obesos (un índice de
masa corporal de más de 30; este índice mide el peso con respecto a la estatura). Una encuesta realizada en 1998 basada en la autoevaluación de las personas reveló que el 20% de
los estadounidenses adultos se autoconsideraron obesos. ¿Sugieren los datos más recientes
que la proporción verdadera de adultos obesos es más de 1.5 veces el porcentaje de la encuesta de autoevaluación? Realice una prueba de hipótesis utilizando un nivel de significación de 0.10.
1. p la proporción de todos los adultos estadounidenses obesos.
2. Decir que el porcentaje actual es 1.5 veces el porcentaje de autoevaluación equivale a
aseverar que el porcentaje actual es de 30%, de donde se deduce la hipótesis nula como
H0: p 0.30.
3. La frase “más que” en la descripción del problema implica que la hipótesis alternativa
es Ha: p 0.30.
4. Como np0 4115(0.3) 10 y nq0 4115(0.7) 10, ciertamente la prueba con muestra grande puede ser utilizada. El valor estadístico de prueba es
z ( p̂ 0.3)/(0
.3
)(
0.7
)/n
www.FreeLibros.me
c8_p284-324.qxd
308
3/12/08
CAPÍTULO 8
4:18 AM
Page 308
Pruebas de hipótesis basadas en una sola muestra
5. La forma de Ha implica que una prueba de cola superior es apropiada: rechazar H0 si
z z0.10 1.28.
6. p̂ 1276/4115 0.310, de donde se obtiene z (0.310 0.3)/(0
.3
)(
0.
7)
/4
11
5
0.010/0.0071 1.40.
7. Como 1.40 excede el valor crítico 1.28, z queda en la región de rechazo. Esto justifica
el rechazo de la hipótesis nula. Con un nivel de significación de 0.10 parece que más del
30% de los estadounidenses son obesos.
■
y determinación de tamaño de muestra Cuando H0 es verdadera, el estadístico de prueba Z tiene aproximadamente una distribución normal estándar. Supóngase ahora que H0 no
es verdadera y que p p. Entonces Z sigue teniendo aproximadamente una distribución
normal (porque es una función lineal de p̂), pero su valor medio y varianza ya no son 0 ni
1, respectivamente. En su lugar,
p p0
p(1 p)/n
E(Z) p1
V(Z) p (1 p )/n
(
p
/n
)
0
0
0
0
La probabilidad de un error de tipo II con una prueba de cola superior es (p) con un
valor especificado de , esta ecuación se resuelve para el tamaño de muestra n como en la
sección 8.2. En el recuadro adjunto se dan expresiones generales para (p) y n.
(p)
Hipótesis alternativa
1
(
p/n
)
p pp(1zp
)
p/n
Ha: p p0
Ha: p p0
1
Ha: p p0
0
0
0
1
(
p/n
)
p pp(1zp
)
p/n
0
0
0
z p1
(
p/n
)
p pp
(
1
)
p/n
0
/2
0
0
z p1
(
p/n
)
p pp
(
1
)
p/n
0
/2
0
0
El tamaño de muestra n con el cual la prueba de nivel también satisface (p)
es
(
p0) z p(
1
)
p 2
¨ z p01
«
p p0
«
n ©
(
p0) z p(
1
)
p 2
« z/2 p01
«
p
p
ª
0
Ejemplo 8.12
prueba de una cola
prueba de dos colas (una
solución aproximada)
Un servicio de mensajería anuncia que por lo menos el 90% de todos los paquetes llevados
a su oficina alrededor de las 9 A.M. para entrega en la misma ciudad son entregados alrededor del mediodía de ese mismo día. Sea p la proporción verdadera de dichos paquetes que
son entregados como se anuncia y considere las hipótesis H0: p 0.9 contra Ha: p 0.9.
Si sólo el 80% de los paquetes son entregados como se anuncia, ¿qué tan probable es que
una prueba de nivel 0.01 basada en n 225 paquetes detectará tal alejamiento de H0? ¿Cuál
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:18 AM
Page 309
8.3 Pruebas relacionadas con una proporción de población
309
debe ser el tamaño de muestra para garantizar que (0.8) 0.01? Con 0.01, p0 0.9,
p 0.8 y n 225,
0.9 0.8 2.33(0
.9
)(
0.1
)/225
(0
.8
)(
0
.2
)/
2
2
5
1 (2.00) 0.0228
(0.8) 1
Así pues la probabilidad de que H0 sea rechazada si se realiza la prueba cuando p 0.8 es
0.9772, aproximadamente el 98% de todas las muestras darán por resultado el rechazo correcto de H0.
Con z z 2.33 en la fórmula del tamaño de muestra se obtiene
n
.1
) 2.33(0
.8
)(
0.2
) 266
2.33(0.9)(00.8
0.9
2
■
Pruebas con muestra pequeña
Los procedimientos de prueba cuando el tamaño de muestra n es pequeño están basados directamente en la distribución binomial en lugar de la aproximación normal. Considérese la
hipótesis Ha: p p0 y de nuevo sea X el número de éxitos en la muestra. Entonces X es el
estadístico de prueba y la región de rechazo de cola superior tiene la forma x c. Cuando
H0 es verdadera, X tiene una distribución binomial con parámetros n y p0, por lo tanto
P(error de tipo I) P(H0 es rechazada cuando es verdadera)
P(X c cuando X Bin(n, p0))
1 – P(X c – 1 cuando X Bin(n, p0))
1 – B(c – 1; n, p0)
A medida que el valor crítico c disminuye, más valores x están incluidos en la región de rechazo y P(error de tipo I) se incrementa. Como X tiene una distribución de probabilidad discreta, casi nunca es posible hallar un valor de c con el cual P(error de tipo I) sea exactamente
el nivel de significación deseado (p. ej., 0.05 o 0.01). En su lugar, se utiliza la región de
rechazo más grande de la forma {c, c 1, . . . , n} que satisface 1 – B(c 1; n, p0) .
Sea p un valor alternativo de p(p p0). Cuando p p, X Bin(n, p),
por lo tanto
(p) P(error de tipo II cuando p p)
P(X c cuando X Bin(n, p)) B(c – 1; n, p)
Es decir, (p) es el resultado de un cálculo de probabilidad binomial directo. El tamaño de
muestra n necesario para garantizar que una prueba de nivel tiene una especificada con
valor alternativo particular p debe ser determinado mediante ensayo y error utilizando la
función de distribución acumulativa binomial.
Los procedimientos de prueba para Ha: p p0 y para Ha: p p0 se construyen de manera similar. En el primer caso, la región de rechazo apropiada tiene la forma x c (una
prueba de cola inferior). El valor crítico c es el número más grande que satisface B(c; n, p0)
. La región de rechazo cuando la hipótesis alternativa es Ha: p p0 se compone tanto
de valores x grandes como pequeños.
Ejemplo 8.13
Un fabricante de plástico desarrolló un nuevo tipo de bote de plástico para la basura y propone venderlo con una garantía incondicional de seis años. Para ver si esto es económicamente
factible, 20 botes prototipo se someten a una prueba acelerada de duración para simular seis
años de uso. La garantía propuesta se modificará sólo si los datos muestrales sugieren fuertemente que menos de 90% de los botes sobrevivirían el periodo de seis años. Sea p la proporción de todos los botes que sobreviven la prueba acelerada. Las hipótesis pertinentes son H0:
www.FreeLibros.me
c8_p284-324.qxd
310
3/12/08
CAPÍTULO 8
4:18 AM
Page 310
Pruebas de hipótesis basadas en una sola muestra
p 0.9 contra Ha: p 0.9. La decisión se basará en el estadístico de prueba X, el número de
entre los 20 que sobreviven. Si el nivel de significación es 0.05, c debe satisfacer B(c;
20, 0.9) 0.05. De acuerdo con la tabla A.1, B(15; 20, 0.9) 0.043, mientras que B(16; 20,
0.9) 0.133. La región de rechazo apropiada es por consiguiente x 15. Si la prueba acelerada da por resultado x 14, H0 sería rechazada a favor de Ha y se modificaría la garantía
propuesta. La probabilidad de un error de tipo II con el valor alternativo p 0.8 es
(0.8) P(H0 no es rechazada cuando X Bin(20, 0.8))
P(X 16 cuando X Bin(20, 0.8))
1 – B(15; 20, 0.8) 1 0.370 0.630
Es decir, cuando p 0.8, el 63% de todas las muestras compuestas de n 20 botes darían
por resultado que H0 no sea incorrectamente rechazada. Esta probabilidad de error es alta porque 20 es un tamaño de muestra pequeño y p 0.8 se acerca al valor nulo p0 0.9.
■
EJERCICIOS
Sección 8.3 (35-44)
35. Los registros estatales de verificación de emisiones indican
que de todos los vehículos verificados durante el año anterior, el 70% pasaron en el primer intento. Una muestra de
200 carros probados en un condado particular durante el
año en curso da 124 que pasaron en la prueba inicial. ¿Sugiere esto que la proporción verdadera en este condado durante el año en curso difiere de la proporción a nivel estatal
previa? Pruebe las hipótesis pertinentes con 0.05.
36. Un fabricante de baterías de níquel-hidrógeno selecciona al
azar 100 placas de níquel para probar las celdas, someterlas a
ciclos un número especificado de veces y concluye que 14 de
ellas se ampollan.
a. ¿Proporciona esto una evidencia precisa para concluir
que más de 10% de todas las placas se ampollan en tales circunstancias? Formule y pruebe las hipótesis apropiadas con un nivel de significación de 0.05. Al llegar a
su conclusión, ¿qué tipo de error pudo haber cometido?
b. Si es realmente el caso de que el 15% de todas las placas
se ampollan en estas circunstancias y se utiliza un tamaño de muestra de 100, ¿qué tan probable es que la hipótesis nula de la parte (a) no sea rechazada por la prueba
de nivel 0.05? Responda esta pregunta para un tamaño de
muestra de 200.
c. ¿Cuántas placas tendrían que ser probadas para tener
(0.15) 0.10 para la prueba de la parte (a)?
37. Una muestra aleatoria de 150 donaciones recientes en un
cierto banco de sangre revela que 82 fueron de sangre tipo
A. ¿Sugiere esto que el porcentaje de donaciones tipo A difiere de 40%, el porcentaje de la población que tiene sangre
tipo A? Realice una prueba de las hipótesis apropiadas utilizando un nivel de significación de 0.01. ¿Habría sido diferente su conclusión si se hubiera utilizado un nivel de
significación de 0.05?
38. Se sabe que aproximadamente 2/3 de todos los seres humanos tienen un ojo o pie derecho dominante. ¿Existe también
dominio del lado derecho en el acto de besar? El artículo
“Human Behavior: Adult Persistence of Head-Turning
Asymmetry” (Nature, 2003: 771) reportó que en una muestra aleatoria de 124 parejas que se besan, ambas personas en
80 de las parejas tendieron a inclinarse más hacia la derecha que hacia la izquierda.
a. Si 2/3 de las parejas que se besan exhiben esta tendencia
de inclinarse hacia la derecha, ¿cuál es la probabilidad de
que el número en una muestra de 124 que lo hacen así difiera del valor esperado en por lo menos lo que en realidad se observó?
b. ¿Sugiere este resultado del experimento que la cifra de
2/3 poco plausible como comportamiento al besarse?
Formule y pruebe las hipótesis apropiadas.
39. Una biblioteca de una universidad realiza un inventario general una vez al año. Debido a las nuevas reglas de colocación
en los estantes instituidos el año anterior, el jefe bibliotecario
cree que puede ser posible ahorrar dinero si pospone el inventario. El bibliotecario decide seleccionar al azar 1000 libros de
la colección de la biblioteca y hacer que los localicen de una
manera preliminar. Si la evidencia indica fuertemente que la
proporción verdadera de libros mal colocados o ilocalizables
es menor que 0.02, entonces el inventario se pospondrá.
a. Entre los 1000 libros buscados, 15 estaban mal colocados o ilocalizables. Pruebe las hipótesis pertinentes y
aconseje al bibliotecario qué hacer (use 0.05).
b. Si la proporción verdadera de libros mal colocados o
perdidos es en realidad de 0.01, ¿cuál es la probabilidad
de que el inventario se realice (innecesariamente)?
c. Si la proporción verdadera es de 0.05, ¿cuál es la probabilidad de que el inventario se posponga?
40. El artículo “Statistical Evidence of Discrimination” (J.
Amer. Stat. Assoc., 1982: 773-783) discute el caso judicial
Swain v. Alabama (1965), en el cual se alegó que existió discriminación en la selección del gran jurado. Datos censuales
sugirieron que el 25% de los eligibles para servir en el gran
jurado eran negros, no obstante una muestra aleatoria de
1050 llamados para servir posiblemente en el jurado sólo
arrojó 177 negros. Con una prueba de nivel 0.01, ¿apoyan
fuertemente estos datos la conclusión de discriminación?
41. Una aerolínea desarrolló un club de viajeros ejecutivos sobre la premisa de que el 5% de sus clientes actuales calificarían para membresía. Una muestra aleatoria de 500
clientes arrojó 40 que calificarían.
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:18 AM
Page 311
8.4 Valores P
a. Con estos datos, pruebe a un nivel de 0.01 la hipótesis
nula de que la premisa de la compañía es correcta contra la alternativa de que no es correcta.
b. ¿Cuál es la probabilidad de que cuando se utiliza la
prueba de la parte (a), la premisa de la compañía será
juzgada correcta cuando en realidad el 10% de todos los
clientes actuales califican?
42. Cada uno de un grupo de 20 tenistas intermedios recibe dos
raquetas, una con cuerdas de nylon y la otra con cuerdas de
tripa sintética. Tras de varias semanas de jugar con las dos
raquetas, a cada jugador se le pide que manifieste una preferencia por uno de los dos tipos de cuerdas. Sea p la proporción de todos los jugadores que preferirían las de tripa a
las de nylon y sea X el número de jugadores en la muestra
que prefieren las de tripa. Como las cuerdas de tripa son
más caras, considere la hipótesis nula de que cuando mucho
el 50% de todos los jugadores prefieren las cuerdas de tripa. Se simplifica esto a H0: p 0.5, planificando rechazar
H0 sólo si la evidencia muestral favorece fuertemente las
cuerdas de tripa.
a. ¿Cuáles de las regiones de rechazo {15, 16, 17, 18, 19,
20}, {0, 1, 2, 3, 4, 5} o {0, 1, 2, 3, 17, 18, 19, 20} es más
apropiada y por qué las otras dos no son apropiadas?
b. ¿Cuál es la probabilidad de un error de tipo I para la región
seleccionada de la parte (a)? ¿Especifica la región una
prueba de nivel 0.05? ¿Es la mejor prueba de nivel 0.05?
c. Si el 60% de todos los fanáticos prefieren las cuerdas de
tripa, calcule la probabilidad de un error de tipo II utilizando la región apropiada de la parte (a). Repita si el
80% de todos los fanáticos prefieren las cuerdas de tripa.
311
d. Si 13 de los 20 jugadores prefieren las cuerdas de tripa,
¿Deberá ser rechazada H0 si se utiliza un nivel de significación de 0.10?
43. Un fabricante de artículos de plomería desarrolló un nuevo tipo de llave de agua sin empaques. Sea P P(una llave seleccionada al azar de este tipo desarrollará una fuga dentro de 2
años en uso normal). El fabricante decidió proseguir con la
producción a menos que se pueda determinar que p es demasiado grande; el valor límite aceptable de p se especifica como
0.10. El fabricante decide someter a n de estas llaves a una
prueba acelerada (simulando de manera aproximada dos años
de uso normal). Con X el número entre las n llaves que desarrollan fugas antes de que concluya la prueba, la producción
arrancará a menos que la X observada sea demasiado grande.
Se decidió que si p 0.10, la probabilidad de no proseguir deberá ser cuando mucho de 0.10, en tanto que si p 0.30 la probabilidad de proseguir deberá ser cuando mucho de 0.10. ¿Se
puede utilizar n 10? ¿n 20? ¿n 25? ¿Cuál es la región
de rechazo apropiada con la n seleccionada y cuáles son las
probabilidades de error reales cuando se utiliza esta región?
44. Científicos piensan que los robots desempeñarán un rol crucial en fábricas en las siguientes décadas. Suponga que en
un experimento para determinar si el uso de robots para instalar cables de computadora es factible, se utilizó un robot
para ensamblar 500 cables. Se examinaron los cables y se
encontraron 15 defectuosos. Si los ensambladores humanos
tienen una proporción de cables defectuosos de 0.035
(3.5%), ¿Apoyan estos datos la hipótesis de que la proporción de cables defectuosos es menor con robots que con humanos? Use un nivel de significación de 0.01.
8.4 Valores P
Una forma de reportar el resultado de un análisis de hipótesis es decir simplemente si la hipótesis nula fue rechazada a nivel de significación específico. Por consiguiente un investigador podría afirmar que si H0 fue rechazada a nivel de significación de 0.05 o que el uso de una prueba
de nivel 0.01 dio por resultado no rechazar H0. Este tipo de afirmación es un tanto inadecuada
porque no dice nada sobre si la conclusión es un tanto dudosa o bastante precisa. Una dificultad
relacionada es que semejante reporte traslada el nivel de significación a otros tomadores de
decisiones. En muchas situaciones en las que hay que tomar una decisión, los individuos pueden
tener diferentes puntos de vista en cuanto a las consecuencias de un error de tipo I o de tipo II.
Cada individuo desearía entonces seleccionar su propio nivel de significación —algunos seleccionarían 0.05, otros 0.01 y así sucesivamente— y llegar a un conclusión por lo tanto. Esto conduciría a que algunos individuos rechacen H0 en tanto que otros concluirían que los datos
no muestran una contradicción suficientemente fuerte en contra de H0 para justificar su rechazo.
Ejemplo 8.14
Se sabe que el tiempo promedio verdadero para el alivio inicial del dolor de un analgésico
éxito en ventas es de 10 min. Sea el tiempo promedio verdadero para el alivio del dolor
de un analgésico recién desarrollado por una compañía. Ésta desea producir y comercializar este analgésico sólo si proporciona un alivio más rápido que el que más se vende, así
que desea probar H0: 10 contra Ha: 10. Sólo si la evidencia experimental conduce al rechazo de H0 se introducirá el nuevo analgésico. Tras de ponderar la seriedad relativa de cada tipo de error, se debe acordar un solo nivel de significación y tomar la decisión
de —rechazar H0 e introducir o no el analgésico— a ese nivel.
Suponga que el nuevo analgésico ha sido introducido. La compañía apoya su afirmación de alivio más rápido declarando que, con base en un análisis de datos experimentales,
www.FreeLibros.me
c8_p284-324.qxd
312
3/12/08
CAPÍTULO 8
4:18 AM
Page 312
Pruebas de hipótesis basadas en una sola muestra
H0: 10 fue rechazada a favor de Ha: 10 utilizando un nivel de significación
0.10. Cualquier individuo que considere cambiar a este nuevo analgésico naturalmente desearía sacar sus propias conclusiones en cuanto a la validez de la afirmación. Los individuos
que están satisfechos con el analgésico que más se vende considerarían un error de tipo I (al
concluir que el nuevo producto proporciona un alivio más rápido cuando en realidad no
lo hace) tan serio que desearían utilizar 0.05, 0.01, o incluso niveles más pequeños.
Desafortunadamente, la naturaleza de la afirmación de la compañía evita que un individuo
llegue a una conclusión a semejante nivel. La compañía ha impuesto su propia selección
de nivel de significación en otros. El reporte podría haber sido elaborado en una manera que
permitiera a cada individuo flexibilidad al sacar una conclusión a un nivel personalmente seleccionado.
■
Un valor P transmite mucha información sobre la fuerza de la evidencia en contra de
H0 y permite que un individuo saque una conclusión a cualquier nivel específico . Antes
de dar una definición general, considérese cómo la conclusión en un problema de prueba de
hipótesis depende del nivel seleccionado .
Ejemplo 8.15
El problema de contenido de nicotina discutido en el problema 8.5 implicó probar H0: 1.5
contra Ha: 1.5. Debido a la desigualdad presente en Ha, la región de rechazo es de cola superior, con H0 rechazada si z z. Suponga que z 2.10. La tabla adjunta muestra la región
de rechazo con cada uno de cuatro niveles diferentes junto con la conclusión resultante.
Nivel de
significación
Región de rechazo
0.05
0.025
0.01
0.005
z
z
z
z
1.645
1.96
2.33
2.58
Conclusión
Rechazar H0
Rechazar H0
No rechazar H0
No rechazar H0
Curva normal estándar (z)
Área
sombreada 0.0179
0
2.10 z calculada
a)
Curva z
Curva z
Área
sombreada
0
b)
2.10
z
Área
sombreada
0
c)
2.10
z
Figura 8.5 Relación entre y área de cola capturada z : a) área de cola capturada por z calculada;
b) cuando 0.0179, z 2.10 y H0 es rechazada; c) cuando 0.0179, z 2.10 y H0 no es
rechazada.
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:18 AM
Page 313
8.4 Valores P
313
Con un nivel relativamente grande, el valor crítico z no está muy alejado en la cola superior; 2.10 excede el valor crítico y por lo tanto H0 es rechazada. Sin embargo, a medida
que disminuye, el valor crítico se incrementa. Con pequeño, el valor critico z es grande, 2.10 es menor que z y H0 no es rechazada.
Recuérdese que con una prueba z de cola superior, es exactamente el área debajo de
la curva z a la derecha del valor crítico z. Es decir, una vez que se especifica , se selecciona el valor crítico para capturar área de cola superior . La tabla A.3 muestra que el área
a la derecha de 2.10 es 0.0179. Con un nivel más grande que 0.0179 corresponde a z
2.10. Una menor que 0.0179 requiere del uso de un valor crítico de z que exceda 2.10. La
decisión sobre un nivel particular de depende de cómo el nivel seleccionado se compara con el área de cola capturada por el valor z calculado. Esto se ilustra en la figura 8.5. Obsérvese en particular que 0.0179, el área de cola capturada, es el nivel más pequeño al cual
H0 sería rechazada, porque con cualquier nivel más pequeño se obtiene un valor crítico z
que excede de 2.10, de modo que 2.10 no se encuentra en la región de rechazo.
■
En general, supóngase que se ha determinado la distribución de probabilidad de un estadístico de prueba cuando H0 es verdadera. Entonces, con un nivel especificado, la región
de rechazo se determina encontrando un valor o valores críticos que capturen área de cola
(de cola superior, inferior o de dos colas, cualquiera que sea apropiada) bajo la curva de
distribución de probabilidad. El valor más pequeño con el cual H0 sería rechazada es el
área de cola capturada por el valor calculado del estadístico de prueba. Este valor más pequeño es el valor P.
DEFINICIÓN
El valor P (o nivel de significación observado) es el nivel de significación más pequeño al cual H0 sería rechazada cuando se utiliza un procedimiento de prueba especificado con un conjunto de datos dado. Una vez que se ha determinado el valor P, la
conclusión a un nivel particular resulta de comparar el valor P con :
1. Valor P rechazar H0 al nivel .
2. Valor P no rechazar H0 al nivel .
Se acostumbra llamar significativos a los datos cuando H0 es rechazada y no significativos de lo contrario. El valor P es entonces el nivel más pequeño al cual los datos son significativos. Una manera fácil de visualizar la comparación del valor P con el nivel
seleccionado es trazar una imagen como la de la figura 8.6. El cálculo del valor P depende
de si la prueba es de cola superior, inferior o de dos colas. No obstante, una vez calculada,
la comparación con no depende de qué tipo de prueba se utilizó.
Valor P nivel más pequeño al cual
H0 puede ser rechazada
0 b)
a)
1
Figura 8.6 Comparación de y el valor P : a) rechazar H0 cuando queda aquí; b) no rechazar H0
cuando queda aquí.
Ejemplo 8.16
(continuación
del ejemplo
8.14)
Supóngase que cuando se analizaron los datos de un experimento que implican el nuevo
analgésico, el valor P para probar H0: 10 contra Ha: 10 se calculó como 0.0384.
Como 0.05 es más grande que el valor P (0.05 queda en el intervalo (a) de la figura 8.6)
www.FreeLibros.me
c8_p284-324.qxd
314
3/12/08
CAPÍTULO 8
4:18 AM
Page 314
Pruebas de hipótesis basadas en una sola muestra
H0 sería rechazada por cualquiera que realice la prueba al nivel 0.05. Sin embargo, al nivel
0.01, H0 no sería rechazada porque 0.01 es más pequeño que el nivel más pequeño (0.0384)
al cual H0 puede ser rechazada.
■
Los programas de computadora más utilizados incluyen automáticamente un valor P
cuando se analiza una hipótesis. Se puede sacar una conclusión directamente de los datos de
salida, sin referencia a una tabla de valores críticos.
Una definición alternativa útil equivalente a la que se acaba de dar es como sigue:
DEFINICIÓN
El valor P es la probabilidad calculada suponiendo que H0 es verdadera, de obtener
un valor estadístico de prueba por lo menos tan contradictorio a H0 como el valor que
en realidad se obtuvo. Mientras más pequeño es el valor de P, más contradictorios son
los datos a H0.
Por consiguiente si z 2.10 para una prueba z de cola superior, el valor P P(Z 2.10
cuando H0 es verdadera) 1 (2.10) 0.0179 como antes. Mucho ojo: ¡el valor de P
no es la probabilidad de que H0 sea verdadera, ni es una probabilidad de error!
Valores P para pruebas z
El valor P para una prueba z (una basada en un estadístico de prueba cuya distribución,
cuando H0 es verdadera, es por lo menos aproximadamente estándar normal) es fácil de
determinar a partir de la información de la tabla A.3. Considérese una prueba de cola superior y sea z el valor calculado del estadístico de prueba Z. La hipótesis nula es rechazada si z
z y el valor P es el más pequeño para el cual este es el caso. Como z
se incrementa a medida que disminuye, el valor P es el valor de con el cual z z. Es
decir, el valor P es exactamente el área capturada por el valor calculado z en la cola superior de la curva normal estándar. El área acumulativa correspondiente es (z), así que en
este caso valor P 1 (z).
Un argumento análogo para una prueba de cola inferior demuestra que el valor P es el
área capturada por el valor calculado z en la cola inferior de la curva normal estándar. Se debe
tener más cuidado en el caso de una prueba de dos colas. Supóngase primero que z es
positivo. Entonces el valor P es el valor de que satisface z z/2 (es decir, z calculado
valor crítico de cola superior). Esto dice que el área capturada en la cola superior es la mitad del valor P, de modo que valor P 2[1 (z)]. Si z es negativo, el valor P es el con
el cual z z/2, o, de forma equivalente, z z/2, así que valor P 2[1 (z)]. Como –z °z° cuando z es negativo, valor P 2[1 (°z°)] con z positivo o negativo.
¨ 1 (z)
«
Valor P: P © (z)
«
ª 2[1 (°z°)]
para una prueba de cola superior
para una prueba de cola inferior
para una prueba de dos colas
Cada una de éstas es la probabilidad de obtener un valor por lo menos tan extremo como el
que se obtuvo (suponiendo que H0 es verdadera). Los tres casos se ilustran en la figura 8.7.
El siguiente ejemplo ilustra el uso de la aproximación del valor P a la prueba de hipótesis por medio de una secuencia de pasos modificados con respecto a la secuencia previamente recomendada.
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:18 AM
Page 315
8.4 Valores P
315
Curva z
Valor P = área en la cola superior
1. Prueba de cola superior
Ha contiene la desigualdad >
= 1 – Φ(z)
0
z calculada
Curva z
Valor P = área en cola inferior
2. Prueba de cola inferior
= Φ(z)
Ha contiene la desigualdad <
0
z calculada
Valor P = suma del área en dos colas = 2[1 – Φ(|z|)]
Curva z
3. Prueba de dos colas
Ha contiene la desigualdad
0
z, −z calculada
Figura 8.7
Ejemplo 8.17
Determinación del valor P para una prueba z.
El espesor objetivo de obleas de silicio utilizadas en cierto tipo de circuito integrado es de
245 m. De una muestra de 50 obleas, cada una con un espesor determinado, se obtiene una
media de espesor de 246.18 m y una desviación estándar de 3.60 m. ¿Sugieren estos datos que el espesor de oblea promedio verdadero es algún otro diferente del valor objetivo?
1. Parámetro de interés:
2. Hipótesis nula:
H0:
3. Hipótesis alternativa:
espesor de oblea promedio verdadero
245
Ha:
245
4. Fórmula para el valor del estadístico de prueba:
5. Cálculo del valor del estadístico de prueba:
z
x 245
z
s/n
246.18 245
2.32
3.60/50
6. Determinación del valor P: Como la prueba es de dos colas,
Valor P 2(1 (2.32)) 0.0204
7. Conclusión: Con un nivel significativo de 0.01, H0 no sería rechazada puesto que 0.0204
0.01. A este nivel de significación, existe suficiente evidencia para concluir que el espesor promedio verdadero difiere del valor objetivo.
■
Valores P para pruebas t
Así como el valor P para una prueba z es un área de curva z, el valor P para una prueba t será un área de curva t. La figura 8.8 en la siguiente página ilustra los tres casos diferentes. El
número de grados de libertad para la prueba t con una muestra es n – 1.
www.FreeLibros.me
c8_p284-324.qxd
316
3/12/08
CAPÍTULO 8
4:18 AM
Page 316
Pruebas de hipótesis basadas en una sola muestra
Curva t para grados de libertad pertinentes
Valor P = área en cola superior
1. Prueba de cola superior
Ha contiene la desigualdad >
0
t calculada
Curva t para grados de libertad pertinentes
Valor P = área en cola inferior
2. Prueba de cola inferior
Ha contiene la desigualdad <
0
t calculada
Valor P = suma del área en dos colas
Curva t para grados de libertad pertinentes
3. Prueba de dos colas
Ha contiene la desigualdad
0
t, −t calculada
Figura 8.8
Valores P para pruebas t.
La tabla de valores críticos t previamente utilizada para intervalos de confianza y
predicción no contienen suficiente información sobre cualquier distribución t particular
que permita la determinación precisa de áreas deseadas. Así que se ha incluido otra tabla
t en la tabla A.8, una que contiene una tabulación de áreas de cola superior de curva t. Cada columna de la tabla es para un número diferente de grados de libertad y las filas son
para valores calculados del estadístico de prueba t que van desde 0.0 hasta 4.0 en incrementos de 0.1. Por ejemplo, el número 0.074 aparece en la intersección de la fila 1.6 y la
columna de 8 grados de libertad, por lo que el área bajo la curva de 8 grados de libertad
a la derecha de 1.6 (un área de cola superior) es 0.074. Como las curvas t son simétricas,
0.074 también es el área bajo la curva de 8 grados de libertad a la izquierda de 1.6 (un
área de cola inferior).
Supóngase, por ejemplo, que una prueba de H0: 100 contra Ha: 100 está basada en la distribución t de 8 grados de libertad. Si el valor calculado del estadístico de prueba es t 1.6, entonces el valor P para esta prueba de cola superior es 0.074. Como 0.074
excede de 0.05, H0 no podría ser rechazada a un nivel de significación de 0.05. Si la hipótesis alternativa es Ha: 100 y una prueba basada en 20 grados de libertad da t 3.2,
entonces la tabla A.8 muestra que el valor P es el área de cola inferior capturada 0.002. La
hipótesis nula puede ser rechazada al nivel 0.05 o 0.01. Considérese probar H0: 1 2 0
contra Ha: 1 2 0, la hipótesis nula afirma que las medias de las dos poblaciones son
idénticas, en tanto que la hipótesis alternativa afirma que son diferentes sin especificar una
dirección de alejamiento de H0. Si una prueba t está basada en 20 grados de libertad y t
3.2, entonces el valor P para esta prueba de dos colas es 2(0.002) 0.004. Este también sería el valor P para t 3.2. El área de cola se duplica porque los valores tanto más grandes que 3.2 como más pequeños que 3.2 contradicen más a H0 que lo que se calculó
(valores alejados en una u otra cola de la curva t).
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:18 AM
Page 317
8.4 Valores P
Ejemplo 8.18
EJERCICIOS
317
En el ejemplo 8.9, se realizó una prueba de H0: 25 contra Ha: 25 basada en 4 grados
de libertad. El valor calculado de t fue 1.04. Si se examina la columna de 4 grados de libertad de
la tabla A.8 hacia abajo hasta la fila 1.0, se ve que el ingreso es 0.187, así que el valor P
0.187. Este valor P es claramente más grande que cualquier nivel de significación (0.01,
0.05 e incluso 0.10), por lo que no hay razón para rechazar la hipótesis nula. Los datos de salida obtenidos con MINITAB del ejemplo 8.9 incluyen un valor P 0.18. Los valores P obtenidos con programas de computadora serán más precisos que los obtenidos de la tabla A.8
puesto que los valores de t que aparecen en la tabla son precisos sólo a décimos de dígito. ■
Sección 8.4 (45-60)
45. ¿Con cuál de los valores P dados sería rechazada la hipótesis nula cuando se realiza una prueba de nivel 0.05?
a. 0.001 b. 0.021 c. 0.078
d. 0.047 e. 0.148
46. Se dan pares de valores P y niveles de significación, . Para cada par, diga si el valor P observado conduciría al rechazo de H0 en el nivel de significación dado.
a. Valor P 0.084, 0.05
b. Valor P 0.003, 0.001
c. Valor P 0.498, 0.05
d. Valor P 0.084, 0.10
e. Valor P 0.039, 0.01
f. Valor P 0.218, 0.10
47. Sea el tiempo medio de reacción a un cierto estímulo. Para una prueba z con muestra grande de H0: 5 contra Ha:
5, halle el valor P asociado con cada uno de los valores dados del estadístico de prueba z
a. 1.42 b. 0.90 c. 1.96 d. 2.48 e. 0.11
48. Se supone que llantas de un cierto tipo recién compradas están infladas a una presión de 30 lb/pulg2. Sea la presión promedio verdadera. Halle el valor P asociado con cada valor
estadístico z dado para probar H0: 30 contra Ha: 30.
a. 2.10 b. 1.75 c. 0.55 d. 1.41 e. 5.3
49. Dé tanta información como pueda sobre el valor P de una
prueba t en cada una de las siguientes situaciones:
a. Prueba de cola superior, gl 8, t 2.0
b. Prueba de cola inferior, gl 11, t 2.4
c. Prueba de dos colas, gl 15, t 1.6
d. Prueba de cola superior, gl 19, t 0.4
e. Prueba de cola superior, gl 5, t 5.0
f. Prueba de dos colas, gl 40, t 4.8
50. La pintura utilizada para trazar rayas en carreteras debe reflejar suficiente luz para que sea claramente visible de noche. Sea la lectura de reflectómetro promedio verdadera
de un tipo de pintura considerada. Una prueba de H0:
20 contra Ha: 20 se basará en una muestra aleatoria de
tamaño n de una distribución de población normal. ¿Qué
conclusión es apropiada en cada una de las siguientes situaciones?
a. n 15, t 3.2, 0.05
b. n 9, t 1.8, 0.01
c. n 24, t 0.2
51. Sea la concentración de receptor de suero en todas las
mujeres embarazadas. Se sabe que el promedio de todas
las mujeres es de 5.63. El artículo “Serum Transferrin Receptor for the Detection of Iron Deficiency in Pregnancy”
(Amer. J. Clinical Nutr., 1991: 1077-1081) reporta que el
valor P 0.10 para una prueba de H0: 5.63 contra Ha:
5.63 basada en n 176 mujeres embarazadas. Con un
nivel de significación de 0.01, ¿qué concluiría?
52. El artículo “Analysis of Reserve and Regular Bottlings: Why
Pay for a Difference Only the Critics Claim to Notice?”
(Chance, verano de 2005, págs. 9-15) reportó sobre un experimento para investigar si los catadores de vino podían distinguir entre vinos de reserva más caros y sus contrapartes
regulares. El vino fue presentado a los catadores en cuatro recipientes marcados A, B, C y D con dos de ellos conteniendo
el vino de reserva y los otros dos el vino regular. Cada catador
seleccionó al azar tres de los recipientes, degustó los vinos seleccionados e indicó cual de los tres creía era diferente de los
otros dos. De los n 855 ensayos de degustación, 346 dieron
por resultado la distinción correcta (o el de reserva que difería
de los dos vinos regulares o el vino regular que difería de dos
reservas). ¿Proporciona esto evidencia contundente para concluir que los catadores de este tipo tienen una cierta capacidad
para distinguir entre vinos de reserva y regulares? Formule y
pruebe las hipótesis pertinentes con el método del valor P. ¿Se
siente particularmente impresionado con la capacidad de los
catadores de distinguir entre los dos tipos de vino?
53. Un fabricante de aspirina llena los frascos por peso en lugar
de por conteo. Como cada frasco debe contener 100 tabletas, el peso promedio por tableta deberá ser de 5 granos. Cada una de las 100 tabletas tomada de un lote muy grande es
pesada, y el resultado es un peso promedio muestral por tableta de 4.87 granos y una desviación estándar muestral de
0.35 granos. ¿Proporciona esta información una fuerte evidencia para concluir que la compañía no está llenando sus
frascos como lo anuncia? Pruebe las hipótesis con 0.01
calculando primero el valor P y luego comparándolo con el
nivel de significación especificado.
54. Debido a la variabilidad en el proceso de fabricación, el
punto de cadencia de una muestra de acero suave sometida
a un esfuerzo creciente normalmente diferirá del punto de
cadencia teórico. Sea p la proporción de muestras que ceden antes de su punto de cadencia teórico. Si basándose en
www.FreeLibros.me
c8_p284-324.qxd
318
3/12/08
CAPÍTULO 8
4:18 AM
Page 318
Pruebas de hipótesis basadas en una sola muestra
una muestra se concluye que más del 20% de todos los especímenes ceden antes del punto teórico, el proceso de producción tendrá que ser modificado.
a. Si 15 de 60 especímenes ceden antes del punto teórico,
¿cuál es el valor P cuando se utiliza la prueba apropiada
y qué le aconsejaría hacer a la compañía?
b. Si el porcentaje verdadero de “cadencias tempranas” es en
realidad de 50% (de modo que el punto teórico sea la mediana de la distribución de cadencia) y se utiliza una
prueba de nivel 0.01, ¿cuál es la probabilidad de que la
compañía concluya que es necesario modificar el proceso?
55. Muchos consumidores están recurriendo a los productos genéricos como una forma de reducir el costo de los medicamentos recetados. El artículo “Commercial Information on
Drugs: Confusing to the Physician?” (J. of Drug Issues,
1988: 245-257) da los resultados de una encuesta de 102
doctores. Sólo 47 de los encuestados conocían el nombre
genérico de la metadona. ¿Proporciona esto una fuerte evidencia para concluir que menos de la mitad de todos los
médicos conocen el nombre genérico de la metadona? Realice una prueba de hipótesis utilizando un nivel de significación de 0.01 y el método del valor P.
56. Se obtuvo una muestra aleatoria de especímenes de suelo y
se determinó la cantidad (%) de materia orgánica presente
en él por cada espécimen y se obtuvieron los datos adjuntos
(tomados de “Engineering Properties of Soil”, Soil Science,
1998: 93-102).
1.10 5.09 0.97 1.59 4.60 0.32 0.55 1.45
0.14 4.47 1.20 3.50 5.02 4.67 5.22 2.69
3.98 3.17 3.03 2.21 0.69 4.47 3.31 1.17
0.76 1.17 1.57 2.62 1.66 2.05
Los valores de la media muestral, desviación estándar
muestral y error estándar (estimado) de la media son 2.481,
1.616 y 0.295, respectivamente. ¿Sugieren estos datos que
el porcentaje promedio verdadero de materia orgánica presente en el suelo es algún otro diferente de 3%. Realice una
prueba de la hipótesis apropiada a un nivel de significación
de 0.10 determinando primero el valor P. ¿Sería diferente
su conclusión si se hubiera usado 0.05? [Nota: Una
curva de probabilidad normal de los datos muestra un patrón aceptable a la luz del tamaño de muestra razonablemente grande.]
57. Los tiempos de la primera activación de los aspersores con
una serie de pruebas con sistemas aspersores de prevención
utilizando una espuma que forma una película acuosa fueron (en seg)
27 41 22 27 23 35 30 33 24 27 28 22 24
(véase “Use of AFFF in Sprinkler Systems”, Fire Technology,
1976: 5. El sistema se diseñó de modo que el tiempo de activación promedio verdadero sea cuando mucho de 25 seg en tales condiciones. ¿Contradicen los datos fuertemente la validez
de esta especificación de diseño? Prueba las hipótesis pertinentes a nivel de significación de 0.05 con el método del valor P.
58. Se diseñó una pluma de modo que el promedio verdadero
de duración en condiciones controladas (implicando el uso de
una máquina de escribir) sea por lo menos de 10 horas. Se
seleccionó una muestra aleatoria de 18 plumas, se determinó
la duración de cada una y una curva de probabilidad normal
de los datos resultantes apoya el uso de una prueba t con
una muestra.
a. ¿Qué hipótesis deberá ser probada si los investigadores
creen a priori que la especificación de diseño ha sido satisfecha?
b. ¿Qué conclusión es apropiada si se prueban las hipótesis de la parte (a), t 2.3 y 0.05?
c. ¿Qué conclusión es apropiada si se prueban las hipótesis de la parte (a), t 1.8 y 0.01?
d. ¿Qué se deberá concluir si se prueban las hipótesis de la
parte (a) y t 3.6?
59. Un espectrofotómetro utilizado para concentración de CO
[ppm (partes por millón) por volumen] se somete a prueba en
cuanto a precisión tomando lecturas de un fabricado (llamado
gas span) en el cual la concentración de CO se controla con
precisión a 70 ppm. Si las lecturas sugieren que el espectrofotómetro no está funcionando apropiadamente, la concentración
medida en muestras de gas span está normalmente distribuida.
Con base en las seis lecturas —85, 77, 82, 68, 72 y 69— ¿es
necesaria una recalibración? Realice una prueba de las hipótesis pertinentes utilizando el método del valor P con 0.05.
60. La conductividad relativa de un semiconductor está determinada por la cantidad de impurezas “adicionadas” al dispositivo durante su fabricación. Se tiene que utilizar un
diodo de silicio para propósitos específicos requiere un voltaje de corte promedio de 0.60 V y si éste no se alcanza, la
cantidad de impurezas debe ser ajustada. Se seleccionó una
muestra de diodos y se determinó el voltaje de corte. Los
datos de salida adjuntos obtenidos con SAS son el resultado de una solicitud de probar las hipótesis apropiadas.
N
15
Mean
0.0453333
Std Dev
0.0899100
T
1.9527887
Prob°T°
0.0711
[Nota: SAS prueba explícitamente H0: 0, así que para
probar H0: 0.60, el valor nulo 0.60 debe ser restado de
cada xi; la media reportada es entonces el promedio de los
valores (xi 0.60). También, el valor P de SAS siempre es
para una prueba de dos colas.] ¿Qué se concluiría con un nivel de significación de 0.01? ¿de 0.05? ¿de 0.10?
8.5 Algunos comentarios sobre la selección de una prueba
Una vez que el experimentador ha decidido sobre la cuestión de interés y el método de obtención de datos (el diseño del experimento), la construcción de una prueba apropiada se
compone de tres pasos distintos:
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:18 AM
Page 319
8.5 Algunos comentarios sobre la selección de una prueba
319
1. Especificar un estadístico de prueba (la función de los valores observados que servirá
para tomar una decisión).
2. Decidir sobre la forma general de la región de rechazo (típicamente rechazar H0 con valores apropiadamente grandes del estadístico de prueba, rechazar con valores apropiadamente pequeños o rechazar con valores pequeños o grandes).
3. Seleccionar el valor o valores críticos numéricos específicos que separarán la región de
rechazo de la región de aceptación (obteniendo la distribución del estadístico de prueba
cuando H0 es verdadera y luego seleccionar un nivel de significación).
En los ejemplos presentados hasta ahora, se realizaron los pasos 1 y 2 en una manera ad hoc
mediante intuición. Por ejemplo, cuando la población subyacente se supuso normal con media y conocida, se procedió desde X
hasta el estadístico de prueba estandarizada
X
0
/n
Para probar H0: 0 contra Ha: 0, la intuición sugirió entonces rechazar H0 cuando z era grande. Por último, se determinó el valor crítico especificando el nivel de significación y utilizando el hecho de que Z tiene una distribución normal estándar cuando H0
es verdadera. La confiabilidad de la prueba para tomar la decisión correcta puede ser evaluada estudiando probabilidades de error de tipo II.
Los temas que tienen que ser considerados al realizar los pasos 1-3 comprenden las
preguntas:
Z
1. ¿Cuáles son las implicaciones y consecuencias prácticas de seleccionar un nivel de
significación particular una vez que se han determinado los demás aspectos de una
prueba?
2. ¿Existe un principio general, que no dependa de la intuición, que pueda ser utilizado para obtener buenos o mejores procedimientos de prueba?
3. Cuando dos o más pruebas son apropiadas en una situación dada, ¿cómo se comparan
las pruebas para decidir cuál deberá ser utilizada?
4. Si una prueba se deriva con arreglo a suposiciones específicas sobre la distribución o población muestreada, ¿cómo funcionará la prueba cuando se violan las suposiciones?
Significación estadística contra práctica
Aunque el proceso de llegar a una decisión utilizando la metodología de probar hipótesis clásicas implica seleccionar un nivel de significación y luego rechazar o no rechazar
H0, a ese nivel , reportando simplemente el nivel utilizado y la decisión alcanzada da
un poco de la información contenida en los datos muestrales. En especial, cuando los resultados de un experimento han de ser comunicados a una gran audiencia, el rechazo de H0
a nivel de 0.05 será mucho más convincente si el valor observado del estadístico de prueba excede en gran medida el valor crítico de 5% que si apenas excede ese valor. Esto
es precisamente lo que condujo a la noción de valor P como una forma de reportar significación sin imponer una particular a otros que pudieran desear sacar sus propias
conclusiones.
Incluso si se incluye un valor P en un resumen de resultados, sin embargo, puede
haber dificultad al interpretar este valor y al tomar una decisión. Esto es porque un valor
P pequeño, el que ordinariamente indicaría significación estadística es que sugeriría
fuertemente el rechazo de H0 a favor de Ha, puede ser el resultado de un tamaño de muestra
grande en combinación con un alejamiento de H0 que tiene poca significación práctica.
En muchas situaciones experimentales, sólo valdría la pena detectar los alejamientos de
H0 de gran magnitud, en tanto que un alejamiento pequeño de H0 tendría poca significación práctica.
www.FreeLibros.me
c8_p284-324.qxd
320
3/12/08
CAPÍTULO 8
4:18 AM
Page 320
Pruebas de hipótesis basadas en una sola muestra
Considérese como ejemplo probar H0: 100 contra Ha: 100 donde es la media de una población normal con 10. Supóngase que un valor verdadero de 101 no
representaría un alejamiento serio de H0 en el sentido de no rechazar H0 cuando 101
sería un error relativamente costoso. Con tamaño de muestra razonablemente grande n, esta conduciría a un valor x próximo a 101, así que no se desearía esta evidencia muestral
para argumentar fuertemente a favor del rechazo de H0 cuando x 101 es observado. Para
varios tamaños muestrales, la tabla 8.1 registra tanto el valor P cuando x 101 y también
la probabilidad de no rechazar H0 al nivel 0.01 cuando 101.
La segunda columna en la tabla 8.1 muestra que incluso con tamaños de muestra moderadamente grandes, el valor P de x 101 argumenta fuertemente a favor del rechazo de
H0, en tanto que el valor x observado sugiere que en términos prácticos el valor verdadero
de difiere poco del valor nulo 0 100. La tercera columna señala que incluso cuando
existe poca diferencia práctica entre la verdadera y el valor nulo, con un nivel de significación fijo un tamaño de muestra grande casi siempre conduce al rechazo de la hipótesis nula a ese nivel. Resumiendo, se debe tener un especial cuidado al interpretar evidencia
cuando el tamaño de muestra es grande, puesto que cualquier alejamiento pequeño de H0
con toda seguridad será detectado por una prueba, aunque semejante alejamiento puede tener poca significación práctica.
Tabla 8.1
Una ilustración del efecto del tamaño de muestra en los valores P y 
n
Valor P cuando x 101
(101) prueba de
nivel 0.01
25
100
400
900
1600
2500
10 000
0.3085
0.1587
0.0228
0.0013
0.0000335
0.000000297
7.69 1024
0.9664
0.9082
0.6293
0.2514
0.0475
0.0038
0.0000
El principio de razón de verosimilitudes
Sean x1, x2, . . . , xn las observaciones en una muestra aleatoria de tamaño n de una distribución de probabilidad f(x; ). La distribución conjunta evaluada con estos valores muestrales
es el producto f(x1, ) f(x2; ) . . . f(xn; ). Como en la discusión de estimación de máxima verosimilitud, la función de verosimilitud es esta distribución conjunta considerada
como una función de . Considérese probar H0: está en "0 contra Ha: está en "a, donde
"0 y "a están desarticuladas (por ejemplo, H0: 100 contra Ha: 100. El principio
de razón de verosimilitudes para la construcción de una prueba prosigue como sigue:
1. Determinar el valor más grande de verosimilitud para cualquier en "0 (determinando
la estimación de máxima verosimilitud dentro de "0 y sustituyendo de vuelta en la función de verosimilitud).
2. Determinar el valor más grande de la probabilidad de que cualquier en "a.
3. Formar la razón
(x1, . . . , xn)
verosimilitud máxima para en "0
verosimilitud máxima para en "a
La razón (x1 . . . , xn) se llama valor estadístico de razón de verosimilitud. El procedimiento de prueba consiste en rechazar H0 cuando esta razón es pequeña. Es decir, se elige una
constante k y H0 es rechazada si (x1, . . . , xn) k. Así pues H0 es rechazada cuando el
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:18 AM
Page 321
Ejercicios suplementarios
321
denominador de excede en gran medida al numerador, lo que indica que los datos son mucho más compatibles con Ha que con H0.
La constante k se selecciona para que dé el tipo de probabilidad de error de tipo I deseado. Con frecuencia la desigualdad k puede ser manipulada para que produzca una
condición equivalente más simple. Por ejemplo, para probar H0: 0 contra Ha: 0
en el caso de normalidad, k equivale a t c. Por consiguiente, con c t,n1, la prueba de razón de verosimilitud es la prueba t con una muestra.
El principio de razón de verosimilitud también se aplica cuando las Xi tienen diferentes distribuciones e incluso cuando son dependientes, aunque la función de verosimilitud
puede ser complicada en tales casos. Muchos de los procedimientos de prueba que se presentarán en capítulos subsiguientes se obtienen a partir del principio de razón de verosimilitud.
Estas pruebas a menudo reducen al mínimo entre todas las pruebas que tienen el nivel
deseado, así que verdaderamente son pruebas mejores. Para más detalles y algunos ejemplos
resueltos, remítase a una de las referencias que aparecen en la bibliografía del capítulo 6.
Una limitación práctica para el uso del principio de razón de verosimilitud es que, para construir el estadístico de prueba de razón de verosimilitud, la forma de la distribución de
probabilidad de donde proviene la muestra debe ser especificada. Para derivar la prueba t a
partir del principio de razón de verosimilitud, el investigador debe asumir una función de distribución de probabilidad normal. Si un investigador desea asumir que la distribución es simétrica pero no desea que sea específica con respecto a su forma exacta (tal como normal,
uniforme o Cauchy), en ese caso el principio falla porque no existe una forma de escribir una
función de distribución de probabilidad conjunta válida al mismo tiempo para todas las distribuciones simétricas. En el capítulo 15, se presentarán varios procedimientos de prueba libres de distribución, llamados así porque la probabilidad de un error de tipo I es controlado
simultáneamente para muchas distribuciones subyacentes diferentes. Estos procedimientos
son útiles cuando el investigador tiene un conocimiento limitado de la distribución subyacente. Se dirá más sobre las cuestiones 3 y 4 listadas al principio de esta sección.
EJERCICIOS
Sección 8.5 (61-62)
61. Reconsidere el problema de secado de pintura discutido en
el ejemplo 8.2. Las hipótesis fueron H0: 75 contra Ha:
75, suponiendo que el valor de es 9.0. Considere el
valor alternativo 74, el que en el contexto del problema presumiblemente no sería un alejamiento prácticamente
significativo de H0.
a. Con una prueba de nivel 0.01, calcule para esta alternativa con tamaños de muestra n 100, 900 y 2500.
b. Si el valor observado de
X es x 74, ¿qué puede decir
sobre el valor P resultante cuando n 2500? ¿Son los
datos estadísticamente significativos con cualquiera de
los valores estándar de ?
c. ¿Realmente preferiría utilizar un tamaño de muestra de
2500 junto con una prueba de nivel 0.01 (haciendo caso
omiso del costo de semejante experimento)? Explique.
62. Considere la prueba de nivel 0.01 con muestra grande en la
sección 8.3 para probar H0: p 0.2 contra Ha: p 0.2.
a. Para el valor alternativo p 0.21, calcule (0.21) con tamaños de muestra n 100, 2500, 10 000, 40 000 y 90 000.
b. Para p̂ x/n 0.21, calcule el valor P cuando n 100,
2500, 10 000 y 40 000.
c. En la mayoría de las situaciones, sería razonable utilizar
una prueba de nivel 0.01 junto con un tamaño de muestra de 40 000 ¿Por qué sí o por qué no?
EJERCICIOS SUPLEMENTARIOS (63-85)
63. Una muestra de 50 lentes utilizados en anteojos da un espesor
medio muestral de 3.05 mm y una desviación estándar muestral de 0.34 mm. El espesor promedio verdadero deseado de
los lentes es de 3.20 mm. ¿Sugieren los datos fuertemente que
el espesor promedio verdadero de los lentes es algún otro diferente del deseado? Haga la prueba con 0.05.
64. En el ejercicio 63, suponga que el experimentador creía
antes de recopilar los datos que el valor de era aproximadamente de 0.30. Si el experimentador deseaba que la
probabilidad de un error de tipo II fuera 0.05 cuando
3.00, ¿Era innecesariamente grande un tamaño de muestra
50?
www.FreeLibros.me
c8_p284-324.qxd
322
3/12/08
CAPÍTULO 8
4:18 AM
Page 322
Pruebas de hipótesis basadas en una sola muestra
65. Se especificó que un cierto tipo de hierro debía contener 0.85 g
de silicio por cada 100 g de hierro (0.85%). Se determinó el
contenido de silicio de cada uno de los 25 especímenes seleccionados al azar y se obtuvieron los siguientes resultados con
MINITAB con una prueba de las hipótesis apropiadas.
Variable
sil cont
N
25
Mean
0.8880
StDev
0.1807
SE Mean
0.0361
T
1.05
P
0.30
a. ¿Qué hipótesis se probaron?
b. ¿A qué conclusión llegaría con un nivel de significación
de 0.05 y por qué? Responda la misma pregunta para un
nivel de significación de 0.10.
66. Un método de enderezar alambre antes de enrollarlo para fabricar resortes se llama “enderezado con rodillos”. El artículo
“The Effect of Roller and Spinner Wire Straightening on Coiling Performance and Wire Properties” (Springs 1987: 27-28)
reporta sobre las propiedades de la tensión de alambre. Suponga que se selecciona una muestra de 16 alambres y
cada uno se somete a prueba para determinar su resistencia a
la tensión (N/mm2). La media y desviación estándar muestrales resultantes son 2160 y 30, respectivamente.
a. La resistencia media a la tensión de resortes hechos mediante una máquina enderezadora rotatoria es de 2150
N/mm2. ¿Qué hipótesis deberán ser probadas para determinar si la resistencia media a la tensión del método de
rodillos excede de 2150?
b. Suponiendo que la distribución de la resistencia a la tensión es aproximadamente normal, ¿qué estadístico de
prueba utilizaría para probar la hipótesis de la parte (a)?
c. ¿Cuál es el valor del estadístico de prueba con estos datos?
d. ¿Cúal es el valor P con el valor del estadístico de prueba calculado en la parte (c)?
e. Con una prueba de nivel 0.05, ¿a qué conclusión llegaría?
67. En el artículo “A Rapid Method to Determine Total Phosphorus in Soils” (Soil Sci. Amer. J., 1988: 1301-1304). Suponga que se analiza una muestra de 11 especímenes de
suelo, cada uno con un contenido de fósforo verdadero
de 548 mg/kg, con el nuevo método. La media y desviación
estándar muestrales resultantes del nivel de fósforo son 587
y 10, respectivamente.
a. ¿Existe evidencia de que el nivel de fósforo medio reportado por el nuevo método difiere significativamente
del valor verdadero de 548 mg/kg? Use 0.05.
b. ¿Qué suposiciones debe hacer para que la prueba de la
parte (a) sea apropiada?
68. El artículo “Orchard Floor Management Utilizing Soil Applied Coal Dust for Frost Protection” (Agri. and Forest Meteorology, 1988: 71-82) reporta los siguientes valores de
flujo de calor a través del suelo de ocho solares cubiertos
con polvo de hulla.
34.7
35.4
34.7
37.7
32.5
28.0
18.4
24.9
El flujo de calor medio a través del suelo en solares cubiertos
sólo con césped es de 29.0. Suponiendo que la distribución
del flujo de calor es aproximadamente normal, ¿sugieren los
datos que el polvo de hulla es eficaz para incrementar el flujo
medio de calor sobre el del césped? Pruebe las hipótesis
apropiadas con 0.05.
69. El artículo “Caffeine Knowledge Attitudes, and Consumption in Adult Women” (J. of Nutrition Educ., 1992: 179-184)
reporta los siguientes datos sobre consumo diario de cafeína
con una muestra de mujeres adultas n 47, x 215 mg,
s 235 mg y rango 5-1176.
a. ¿Parece plausible que la distribución de la población de
consumo diario de cafeína sea normal? ¿Es necesario
suponer una distribución de población normal para probar hipótesis por lo que se refiere al valor del consumo
medio de la población? Explique su razonamiento.
b. Suponga que previamente se creía que el consumo medio era cuando mucho de 200 mg. ¿Contradicen los datos dados esta creencia previa? Pruebe las hipótesis
apropiadas a nivel de significación de 0.10 e incluya un
valor P en su análisis.
70. Los datos de salida adjuntos se obtuvieron cuando se utilizó MINITAB para probar las hipótesis apropiadas con respecto al tiempo de activación promedio verdadero con base
en los datos del ejercicio 57. Use esta información para llegar a una conclusión a un nivel de significación de 0.05 y
también a un nivel de 0.01.
TEST OF MU 25.000 VS MU G.T. 25.000
N
MEAN STDEV SE MEAN
T P VALUE
time 13 27.923 5.619
1.559 1.88
0.043
71. Se supone que la resistencia a la ruptura promedio verdadera de aislantes de cerámica de un cierto tipo es por lo menos de 10 lb/pulg2. Se utilizará para una aplicación
particular a menos que los datos muestrales indiquen concluyentemente que esta especificación ha sido satisfecha.
Una prueba de hipótesis con 0.01 tiene que basarse en
una muestra aleatoria de diez aislantes. Suponga que la distribución de resistencia a la ruptura es normal con desviación estándar desconocida.
a. Si la desviación estándar es de 0.80, ¿qué tan probable
es que los aislantes serán juzgados satisfactorios cuando
la resistencia a la ruptura promedio verdadera es en realidad de sólo 9.5? ¿Sólo de 9.0?
b. ¿Qué tamaño de muestra sería necesario para tener un
75% de posibilidad de detectar que la resistencia a la
ruptura promedio verdadera es de 9.5 cuando la desviación estándar verdadera es de 0.80?
72. Las observaciones adjuntas sobre tiempo de permanencia
de llamas (seg) en tiras de ropa de dormir de niños tratada
aparecieron en el artículo “An Introduction to Some Precision and Accuracy of Measurement Problems” (J. of Testing
and Eval., 1982: 132-140). Suponga que se había asignado
por mandato un tiempo de permanencia de llamas promedio
verdadero de cuando mucho 9.75. ¿Sugieren los datos que
esta condición no se ha cumplido? Realice una prueba apropiada después de investigar la plausibilidad de las suposiciones que fundamentan su método de inferencia.
9.85
9.94
9.88
9.93
9.85
9.95
9.75
9.75
9.95
9.77
9.83
9.93
9.67
9.92
9.92
9.87
9.74
9.89
9.67
9.99
73. La incidencia de un cierto tipo de cromosoma defectuoso en
la población de varones adultos estadounidenses se cree que
es de 1 en 75. Una muestra aleatoria de 800 individuos en
www.FreeLibros.me
c8_p284-324.qxd
3/12/08
4:18 AM
Page 323
Ejercicios suplementarios
74.
75.
76.
77.
instituciones penitenciarias estadounidenses revela que 16 tienen tales defectos. ¿Se puede concluir que la proporción de
incidencia de este defecto entre los prisioneros difiere de la
proporción supuesta para toda la población de varones adultos?
a. Formule y pruebe las hipótesis pertinentes con 0.05.
¿Qué tipo de error podría haber cometido al llegar a una
conclusión?
b. ¿Qué valor P está asociado con esta prueba? Basado en
este valor P, ¿podría H0 ser rechazada a un nivel de significación de 0.20?
En una investigación de la toxina producida por una cierta
serpiente venenosa, un investigador preparó 26 frascos, cada
uno con 1 g de la toxina y luego determinó la cantidad de
antitoxina necesaria para neutralizar la toxina. Se encontró
que la cantidad promedio muestral de antitoxina necesaria
era de 1.89 mg y la desviación estándar muestral era de
0.42. Una investigación previa indicó que la cantidad neutralizante promedio verdadero fue de 1.75 mg/g de toxina.
¿Contradicen estos datos nuevos el valor sugerido por la investigación previa? Pruebe las hipótesis relevantes usando
un valor aproximado de P. ¿Depende la validez de su análisis de cualquier suposición sobre la distribución de la población de cantidad neutralizante? Explique
La resistencia a la compresión no restringida promedio
muestral de 45 especímenes de un tipo particular de ladrillos
resultó ser de 3107 lb/pulg2 y la desviación estándar muestral de 188. La distribución de la resistencia a la compresión
no restringida puede ser un tanto asimétrica. ¿Indican los resultados fuertemente que la resistencia a la compresión no
restringida promedio verdadera es menor que el valor de diseño de 3200? Haga la prueba con 0.001.
Para probar la habilidad de un mecánico automotriz de
identificar problemas simples en motores, se llevó un automóvil con un problema de esos a 72 talleres de reparación
diferentes. Sólo 42 de los 72 mecánicos que revisaron el
carro identificaron correctamente el problema. ¿Indica esto fuertemente que la proporción verdadera de mecánicos
que pudieron identificar este problema es menor que 0.75.
Calcule el valor P y concluya como corresponda.
Cuando X1, X2, . . . , Xn son variables de Poisson independientes, cada una con parámetro y n es grande, la media
muestral X
tiene aproximadamente una distribución normal
con E(X
) y 2 V(X
) /n. Esto implica que
Z
X
/n
tiene aproximadamente una distribución normal estándar.
Para probar H0: 0, se puede reemplazar con 0 en la
ecuación para Z para obtener un estadístico de prueba. Normalmente se prefiere este estadístico a estadístico de muestra grande con denominador S/n (cuando las Xi son
Poisson) porque está explícitamente hecho a la medida de la
suposición de Poisson. Si el número de solicitudes de consultoría recibidas por un cierto estadístico durante una semana de trabajo de cinco días tiene una distribución de
Poisson y el número total de solicitudes de consultoría durante un periodo de 36 semanas es de 160, ¿sugiere esto que
el número promedio de solicitudes semanales excede de
4.0? Haga la prueba con 0.02.
323
78. Un artículo en el ejemplar del 11 de noviembre de 2005 del
Tribune de San Luis Obispo reportó que los investigadores
que realizan compras aleatorias en tiendas Wal-Mart en
California encontraron que los escáneres dan el precio
equivocado 8.3% del tiempo. Suponga que esto se basó en
200 compras. El National Institute for Standards and Technology comenta que a la larga cuando mucho dos de 100 artículos deberán tener precios incorrectamente escaneados.
a. Desarrolle un procedimiento de prueba con un nivel de
significación de (aproximadamente) 0.05 y luego realizar la prueba para decidir si la referencia de comparación del NIST no se cumple.
b. Con el procedimiento de prueba empleado en (a), ¿cuál
es la probabilidad de decidir que la referencia de comparación del NIST ha sido satisfecho cuando en realidad
la proporción de errores es de 5%?
79. Un fabricante de tinas calientes anuncia que con su equipo
de calefacción, se puede alcanzar una temperatura de 100°F
en aproximadamente 15 min. Se selecciona una muestra
aleatoria de 32 tinas y se determina el tiempo necesario para alcanzar una temperatura de 100°F con cada tina caliente. El tiempo promedio y la desviación estándar muestrales
son de 17.5 y 2.2 min, respectivamente. ¿Siembran estos
datos alguna duda sobre la afirmación de la compañía?
Calcule el valor P y utilícelo para llegar a una conclusión al
nivel 0.05 (suponga que la distribución del tiempo de calentamiento es aproximadamente normal).
80. El capítulo 7 presentó un intervalo de confianza para la
varianza 2 de una distribución de población normal. El resultado clave allí fue que la variable aleatoria 2 (n 1)S 2/ 2
tiene una distribución chi cuadrada con n – 1 grados de libertad. Considere la hipótesis nula H0: 2 20 (de forma
equivalente 0). Entonces cuando H0 es verdadera, el estadístico de prueba 2 (n 1) S 2/ 20 tiene una distribución
chi cuadrada con n – 1 grados de libertad. Si la alternativa
pertinente es Ha: 2 20, rechazar H0 si (n 1)s 2/ 20
2
,n1
da una prueba con nivel de significación . Para garantizar características razonablemente uniformes en una aplicación particular, se desea que la desviación estándar verdadera
del punto de ablandamiento de un cierto tipo de alquitrán de
petróleo sea cuando mucho de 0.50°C. Se determinaron los
puntos de ablandamiento de diez diferentes especímenes y se
obtuvo una desviación estándar muestral de 0.58°C. ¿Contradice esto fuertemente la especificación de uniformidad?
Pruebe las hipótesis apropiadas con 0.01.
81. Remitiéndose al ejercicio 80, suponga que un investigador
desea probar H0: 2 0.04 contra Ha: 2 0.04 basado en
una muestra de 21 observaciones. El valor calculado de
20s2/0.04 es 8.58. Ponga límites en el valor P y luego llegue
a una conclusión al nivel 0.01.
82. Cuando la distribución de la población es normal y n grande, la desviación estándar muestral S tiene aproximadamente una distribución normal con E(S) y V(S) 2/(2n).
Ya se sabe que en este caso, con cualquier n, X
es normal
con E(X
) y V(X
) 2/n.
a. Suponiendo que la distribución subyacente es normal,
¿cuál es un estimador aproximadamente insesgado del
percentil 99 2.33 ?
www.FreeLibros.me
c8_p284-324.qxd
324
3/12/08
CAPÍTULO 8
4:18 AM
Page 324
Pruebas de hipótesis basadas en una sola muestra
b. Cuando las Xi son normales, se puede demostrar que X
y S son variables aleatorias independientes (una mide
la ubicación mientras que la otra mide la dispersión).
Use esto para calcular V( ˆ) y ˆ para el estimador ˆ de
la parte (a). ¿Cuál es el error estándar estimado ˆ ˆ ?
c. Escriba un estadístico para probar H0: 0 que tiene
aproximadamente una distribución estándar normal cuando H0 es verdadera. Si el pH del suelo está normalmente distribuido en una cierta región y 64 muestras de suelo
dan x 6.33, s 0.16, ¿proporciona esto una fuerte
evidencia para concluir que cuando mucho el 99% de todas las muestras posibles tendrían un pH de menos de
6.75? Pruebe con 0.01.
83. Sean X1, X2, . . . , Xn una muestra aleatoria de una distribución
exponencial con parámetro . En ese caso se puede demostrar
que 2Xi tiene una distribución chi cuadrada con 2
(primero muestre que 2Xi tiene una distribución chi cuadrada con 2)
a. Use este hecho para obtener un estadístico de prueba y
región de rechazo que juntos especifiquen una prueba a
nivel para H0: 0 contra cada una de las tres alternativas comúnmente encontradas. [Sugerencia: E(Xi)
1/, de modo que 0 equivale a 1/ 0.]
b. Suponga que se prueban diez componentes idénticos
que tienen un tiempo exponencialmente distribuido hasta la falla. Los tiempos de falla resultantes son
95
16
11
3
42
71
225
64
87
123
promedio verdadera es menor que el valor previamente
afirmado de 75.
84. Suponga que la distribución de la población es normal con
conocida. Sea de modo que 0 . Para probar H0:
0 contra Ha: 0, considere la prueba que rechaza H0 si z z o z z-, donde el estadístico de prueba
es Z (X
0)/(/n).
a. Demuestre que P(error de tipo I) .
b. Deduzca una expresión para ( ). [Sugerencia: Exprese la prueba en la forma “rechazar H0 si x c1 o c2.”]
c. Sea 0. ¿Con qué valores de (con respecto a ) será (0 ) (0 )?
85. Luego de un periodo de aprendizaje una organización realiza un examen que debe ser pasado para ser elegible para
membresía. Sea p P(aprendiz seleccionada al azar pasa el
examen). La organización desea un examen que la mayoría
mas no todos deberá ser capaz de pasar, por lo que decide
que p 0.90 es deseable. Para un examen particular, las hipótesis pertinentes son H0: p 0.90 contra la Ha: p 0.90.
Suponga que diez personas hacen el examen y sea X el
número que pasa el examen.
a. ¿Especifica la región de cola inferior (0, 1, . . . , 5) una
prueba de nivel 0.01?
b. Demuestre que aun cuando Ha es bilateral, ninguna
prueba de dos colas es una prueba de nivel 0.01.
c. Trace una gráfica de (p) como función de p para esta
prueba. ¿Es esto deseable?
Use el procedimiento de prueba de la parte (a) para decidir si los datos sugieren fuertemente que la vida útil
Bibliografía
Véanse las bibliografías al final de los capítulos 6 y 7.
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:20 AM
9
Page 325
Inferencias basadas
en dos muestras
INTRODUCCIÓN
Los capítulos 7 y 8 presentaron intervalos de confianza (IC) y procedimientos de prueba de hipótesis para una sola media , una sola proporción p y una sola varianza 2.
En este capítulo se amplían estos métodos a situaciones que implican las medias, las
proporciones y las varianzas de dos distribuciones de población diferentes. Por
ejemplo, sea 1 la dureza Rockwell promedio verdadera de especímenes de acero
térmicamente tratados y 2 la dureza promedio verdadera de especímenes laminados en frío. Entonces es posible que un investigador desee utilizar muestras de observaciones de dureza de cada tipo de acero como base para calcular una estimación de
intervalo de 1 2, la diferencia entre las dos durezas promedio verdaderas. Como
otro ejemplo, sea p1 la proporción verdadera de celdas de níquel-cadmio manufacturadas en las condiciones de producción actuales defectuosas a causa de cortos
internos y sea p2 la proporción verdadera de celdas con cortos internos producidas en
condiciones de operación modificadas. Si el razonamiento en cuanto a las condiciones
modificadas es reducir la proporción de celdas defectuosas, un ingeniero de calidad
desearía utilizar información muestral para probar la hipótesis nula H0: p1 p2 0
(es decir, p1 p2) contra la hipótesis alternativa Ha: p1 p2 0 (es decir, p1 p2).
325
www.FreeLibros.me
c9_p325-368.qxd
326
3/12/08
CAPÍTULO 9
4:20 AM
Page 326
Inferencias basadas en dos muestras
9.1 Pruebas z e intervalos de confianza para una diferencia
entre dos medias de población
Las inferencias discutidas en esta sección se refieren a una diferencia 1 2 entre las medias de dos distribuciones de población diferentes. Un investigador podría, por ejemplo, desear probar hipótesis con respecto a la diferencia entre resistencias a la ruptura promedio
verdaderas de dos tipos distintos de cartón corrugado. Una de esas hipótesis formularía que
1 2 0, es decir, que 1 2. Alternativamente, puede ser apropiado estimar 1 2
calculando un intervalo de confianza de 95%. Tales inferencias están basadas en una muestra
de observaciones de resistencia de cada tipo de cartón.
Suposiciones básicas
1. X1, X2, . . . , Xm es una muestra aleatoria de una población con media
za 21.
2. Y1, Y2, . . . , Yn es una muestra aleatoria de una población con media
22.
1
2
y varian-
y varianza
3. Las muestras X y Y son independientes entre sí.
Y, la diferencia entre las medias muestrales corresEl estimador natural de 1 2 es X
pondientes. El estadístico de prueba resulta de estandarizar este estimador, así que se requieren expresiones para el valor esperado y la desviación estándar de X
Y.
PROPOSICIÓN
El valor esperado de X
Y es 1 2, así que X
Y es un estimador insesgado de
.
La
desviación
estándar
de
X
Y
es
1
2
XY
21
2
2
m
n
Comprobación Estos dos resultados dependen de las reglas de valor esperado y varianza
presentados en el capítulo 5. Como el valor esperado de una diferencia es la diferencia de
valores esperados,
E(X
Y) E(X
) E(Y) 1 2
Como las muestras X y Y son independientes, X
y Y son cantidades independientes, así que
la varianza de la diferencia es la suma de V(X
) y V(Y):
V(X
Y) V(X
) V(Y)
22
21
m
n
La desviación estándar de X
Y es la raíz cuadrada de esta expresión.
■
Si se piensa en 1 2 como un parámetro de , entonces su estimador es ˆ X
Y
con desviación estándar ˆ dada por la proposición. Cuando tanto 21 como 22 tienen valores conocidos, el estadístico de prueba tendrá la forma ( ˆ valor nulo)/ ˆ; esta forma de un estadístico de prueba se utilizó en varios problemas de una muestra en el capítulo anterior. Las
varianzas muestrales deben ser utilizadas para estimar ˆ cuando 21 y 22 son desconocidas.
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:20 AM
Page 327
9.1 Pruebas z e intervalos de confianza para una diferencia entre dos medias de población
327
Procedimientos de prueba para poblaciones normales
con varianzas conocidas
En los capítulos 7 y 8, el primer intervalo de confianza y procedimiento de prueba para una
media de población se basaron en la suposición de que la distribución de la población era
normal con el valor de la varianza de la población 2 conocido por el investigador. Asimismo, primero se supone que las distribuciones de población son normales y que los valores
tanto de 21 como de 22 son conocidos. En breve se presentarán situaciones en las cuales una
o estas dos suposiciones pueden ser eximidas.
Como las distribuciones de población son normales, tanto X
como Y tienen distribuciones
normales. Esto implica que X
Y está normalmente distribuida con valor esperado 1 2 y
desviación estándar XY dada en la proposición precedente. Al estandarizar X
Y se
obtiene la variable normal estándar
Z
X
Y (1 2)
(9.1)
21 22
n
m
En un problema de prueba de hipótesis, la hipótesis nula formulará que 1 2 tiene un valor específico. Si 0 denota este valor nulo, se tiene H0: 1 2 0. Con frecuencia
0 0, en cuyo caso H0 dice que 1 2. Al reemplazar 1 2 en la expresión (9.1) con
el valor nulo 0 se obtiene un estadístico de prueba. El estadístico de prueba Z se obtiene
estandarizando X
Y de conformidad con la suposición de que H0 es verdadera, así que en
este caso tiene una distribución estándar normal. Considérese la hipótesis alternativa Ha: 1
2 0. Un valor x y que excede considerablemente de 0 (el valor esperado de X
Y cuando H0 es verdadera) proporciona evidencia en contra de H0 y a favor de Ha. Tal valor
de x y corresponde a un valor positivo y grande de z. Por consiguiente H0 deberá ser rechazada a favor de Ha si z es mayor que o igual a un valor crítico apropiadamente seleccionado. Como el estadístico de prueba Z tiene una distribución normal estándar cuando H0
es verdadera, la región de rechazo de cola superior z z produce una prueba con nivel de
significación (probabilidad de error de tipo I) . Las regiones de rechazo para Ha: 1 2
0 y Ha: 1 2 0 que producen pruebas con nivel de significación deseado son
la de cola inferior y la de dos colas, respectivamente.
Hipótesis nula: H0: 1 2 0
x y 0
Valor estadístico de prueba: z 2
1
2
2
n
m
Hipótesis alternativa
Región de rechazo para prueba con nivel
Ha: 1 2 0
z
Ha: 1 2 0
z z (cola inferior)
Ha: 1 2 0
o
z
z (cola superior)
z/2 o
z z/2 (dos colas)
Como éstas son pruebas z, se calcula un valor P como se hizo para las pruebas z en el
capítulo 8 (p. ej., valor P 1 (z) para una prueba de cola superior).
Ejemplo 9.1
Un análisis de una muestra aleatoria compuesta de m 20 especímenes de acero laminado
en frío para determinar resistencias a la cedencia dio por resultado una resistencia promedio muestral de x 29.8 klb/pulg2. Una segunda muestra aleatoria de n 25 especímenes
www.FreeLibros.me
c9_p325-368.qxd
328
3/12/08
CAPÍTULO 9
4:20 AM
Page 328
Inferencias basadas en dos muestras
de acero galvanizado bilaterales dio una resistencia promedio muestral de y 34.7 klb/pulg2.
Suponiendo que las dos distribuciones de resistencia a la cedencia son normales con 1 4.0
y 2 5.0 (sugeridas por una gráfica en el artículo “Zinc-Coated Sheet Steel: An Overview”, Automotive Engr., diciembre de 1984: 39-43), ¿indican los datos que las resistencias
a la cedencia promedio verdaderas 1 y 2 son diferentes? Realice una prueba a un nivel de
significación 0.01.
1. El parámetro de interés es 1
deras de los dos tipos de acero.
2. La hipótesis nula es H0:
1
3. La hipótesis alternativa es Ha:
ferentes.
2,
la diferencia entre las resistencias promedio verda-
2
0.
1
2
0; si Ha es verdadera, entonces
1
y
2
son di-
4. Con 0 0, el valor estadístico de prueba es
z
x y
21
22
m
n
5. La desigualdad en Ha implica que la prueba es de dos colas. Con 0.01, /2 0.005
y z/2 z0.005 2.58. H0 será rechazada si z 2.58 o si z 2.58.
6. Sustituyendo m 20, x 29.8, 21 16.0, n 25, y 34.7 y 22 25.0 en la
fórmula para z se obtiene
z
29.8 34.7
4.90
3.66
16.0
25.0
1.34
20
25
Es decir, el valor observado de x y está a más de tres desviaciones estándar por debajo
de lo que era de esperarse si H0 fuera verdadera.
7. Como 3.66 2.58, z queda en la cola inferior de la región de rechazo, H0 es por
consiguiente rechazada al nivel 0.01 en favor de la conclusión de que 1 2. Los
datos muestrales sugieren fuertemente que la resistencia a la cedencia promedio
verdadera de acero laminado en frío difiere de la de acero galvanizado. El valor P con
esta prueba de dos colas es 2(1 (3.66)) 2(1 1) 0, de modo que H0 debe ser
rechazada a cualquier nivel de significación razonable.
■
Utilización de una comparación para identificar causalidad
A los investigadores a menudo les interesa comparar o los efectos de dos tratamientos diferentes en una respuesta o la respuesta después de un tratamiento con la respuesta después
de ningún tratamiento (tratamiento vs. control). Si los individuos u objetos que van a ser utilizados en la comparación no son asignados por los investigadores a las dos diferentes condiciones, se dice que el estudio es observacional. La dificultad de sacar conclusiones
basadas en un estudio observacional es que aunque el análisis estadístico puede indicar una
diferencia significativa de respuesta entre los dos grupos, la diferencia puede deberse a algunos factores subyacentes que no habían sido controlados en lugar de ser el resultado de
cualquier diferencia en los tratamientos.
Ejemplo 9.2
Una carta que apareció en el Journal of the American Medical Association (19 de mayo de
1978) reporta que de 215 médicos que se graduaron en Harvard y murieron entre noviembre
de 1974 y octubre de 1977, 125 en servicio de tiempo completo vivieron un promedio de 48.9
años después de su graduación, en tanto que 90 con afiliaciones académicas vivieron un
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:20 AM
Page 329
9.1 Pruebas z e intervalos de confianza para una diferencia entre dos medias de población
329
promedio de 43.2 años después de su graduación. ¿Sugieren estos datos que la vida media
después de la graduación de doctores en práctica completa excede la vida media de aquellos
que tienen afiliación académica (de ser así, aquellos estudiantes que se “mueren por obtener
una afiliación académica” pueden estar más cerca de la verdad de lo que realmente piensan,
en otras palabras, es “publicar o perecer” realmente “publicar o perecer”)?
Sea 1 el número promedio verdadero de años vividos después de la graduación de
médicos en práctica completa y 2 la misma cantidad para los médicos con afiliaciones académicas. Suponga que los 125 y los 90 médicos son muestras aleatorias de las poblaciones 1
y 2, respectivamente (lo cual puede no ser razonable si hay razón para creer que los graduados
de Harvard poseen características especiales que los diferencia de todos los demás médicos, en
este caso las inferencias se limitarían sólo a las “poblaciones Harvard”). La carta de donde se
tomaron los datos no dio información sobre varianzas, de modo que como ilustración supóngase que 1 14.6 y 2 14.4. Las hipótesis son H0: 1 2 0 contra Ha: 1 2 0,
de modo que 0 es cero. El valor calculado del estadístico de prueba es
z
48.9 43.2
2
2
(14.6)
(14.4)
125
90
5.70
1.7
0
.3
20
2.85
El valor P para una prueba de cola superior es 1 (2.85) 0.0022. A un nivel de significación de 0.01, H0 es rechazada (porque valor P) a favor de la conclusión de que
1 2 0 ( 1 2). Esto es compatible con la información reportada en la carta.
Estos datos se derivaron de un estudio observacional retrospectivo; el investigador
no comenzó seleccionando una muestra de doctores y asignando algunos al tratamiento de
“afiliación académica” y a los demás al tratamiento de “práctica de tiempo completo”, sino
que en su lugar identificó miembros de los dos grupos reflexionando (¡mediante obituarios!) hasta observando registros pasados. ¿Puede ser el resultado estadísticamente significativo atribuido en realidad a una diferencia en el tipo de práctica médica después de la
graduación, o existe algún otro factor subyacente (p. ej., edad al momento de la graduación, regímenes de ejercicio, etc.) que pudieran proporcionar también una explicación factible para la diferencia? Se han utilizado estudios observacionales para argumentar en
cuanto a un vínculo causal entre el tabaquismo y el cáncer de pulmón. Existen muchos estudios que demuestran que la incidencia de cáncer de pulmón es significativamente más alta entre fumadores que entre no fumadores. No obstante, los individuos habían decidido si
convertirse en fumadores mucho antes de que los investigadores aparecieran en la escena
y factores para tomar esta decisión pueden haber desempeñado un rol causal en la aparición de cáncer de pulmón.
■
Cuando investigadores asignan sujetos a los dos tratamientos de una manera aleatoria
se obtiene un experimento controlado aleatorizado. Cuando se observa significación estadística en semejante experimento, el investigador y otras partes interesadas tendrán más
confianza en la conclusión de que la diferencia en la respuesta ha sido provocada por una
diferencia en los tratamientos. Un ejemplo muy famoso de este tipo de experimento y conclusión es el experimento de la vacuna Salk contra la polio descrito en la sección 9.4. Estos
temas son discutidos con mayor amplitud en los libros (no matemáticos) de Moore y de
Freedman y colaboradores, incluidos en las referencias del capítulo 1.
y opción de tamaño de muestra
La probabilidad de un error de tipo II es fácil de calcular cuando ambas distribuciones de
población son normales con valores conocidos de 1 y 2. Considérese el caso en el cual la
hipótesis alternativa es Ha: 1 2 0. Sea un valor de 1 2 que excede 0 (un
valor con el cual H0 es falsa). La región de rechazo de cola superior z
z puede ser
www.FreeLibros.me
c9_p325-368.qxd
330
3/12/08
CAPÍTULO 9
4:20 AM
Page 330
Inferencias basadas en dos muestras
reexpresada en la forma x y 0 z XY. Por consiguiente la probabilidad de un error
de tipo II cuando 1 2 es
() P(no rechazar H0 cuando 1 2 )
P(X
Y 0 z XY cuando 1 2 )
Cuando 1 2 , X
Y está normalmente distribuida con valor medio y desviación estándar XY (la misma desviación estándar como cuando H0 es verdadera); con estos valores para estandarizar la desigualdad entre paréntesis se obtiene .
Hipótesis alternativa
() P(error de tipo II cuando 1 2 )
Ha: 1 2 0
z
Ha: 1 2 0
1 z
Ha: 1 2 0
z/2
0
0
0
0
z/2
donde XY (
21m
/)
(22n
/)
Ejemplo 9.3
(continuación
del ejemplo
9.1)
Suponga que cuando 1 y 2 (las resistencias a la cedencia promedio verdaderas de los dos
tipos de acero) difieren cuando mucho en 5, la probabilidad de detectar tal alejamiento de
H0 debe ser de 0.90. ¿Satisface esta condición una prueba a nivel 0.01 con tamaños de muestra m 20 y n 25? El valor de con estos tamaños de muestra (el denominador de z) se
calculó previamente como 1.34. La probabilidad de un error de tipo II con la prueba a nivel
0.01 de dos colas cuando 1 2 5 es
(5) 2.58
50
1.34
2.58
50
1.34
( 1.15) ( 6.31) 0.1251
Es fácil verificar que también (5) 0.1251 (porque la región de rechazo es simétrica).
Por consiguiente, la probabilidad de detectar tal alejamiento es 1 (5) 0.8749. Como
este valor es un poco menor que 0.9, se deberán utilizar tamaños de muestra un poco más
grandes.
■
Como en el capítulo 8, se pueden determinar tamaños de muestra m y n que satisfagan
tanto P(error de tipo I) un especificado y P(error de tipo II cuando 1 2 )
una especificada. Para una prueba de cola superior, la igualación de la expresión previa
para () al valor especificado de da
21
22
( 0)2
m
n
(z z)2
Cuando los dos tamaños de muestra son iguales, esta ecuación da
mn
( 21 22)(z z)2
( 0)2
Estas expresiones también son correctas para una prueba de cola inferior, en tanto es
reemplazada por /2 para una prueba de dos colas.
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:20 AM
Page 331
9.1 Pruebas z e intervalos de confianza para una diferencia entre dos medias de población
331
Pruebas con muestra grande
Las suposiciones de distribuciones de población normal y los valores conocidos de 1 y 2
son innecesarias cuando ambos tamaños de muestra son grandes. En este caso, el teorema del
límite central garantiza que X
Y tenga de manera aproximada una distribución normal independientemente de las distribuciones de población subyacentes. Además, con S 21 y S 22 en
lugar de 21 y 22 en la expresión (9.1) se obtiene una variable cuya distribución es aproximadamente normal estándar:
X
Y (1 2)
Z
SmSn
2
1
2
2
Al reemplazar 1 2 con 0 se obtiene un estadístico de prueba con muestra grande,
el valor esperado de X
Y cuando H0 es verdadera. Este estadístico Z tiene aproximadamente una distribución normal estándar cuando H0 es verdadera. Si se utilizan valores críticos
z como antes se obtienen pruebas al nivel .
El uso del valor estadístico de prueba
x y 0
z 2
s1
s22
m
n
junto con las regiones de rechazo de colas superior, inferior y de dos colas antes formuladas basadas en valores críticos z da pruebas con muestra grande cuyos niveles de
significación son aproximadamente . Estas pruebas son apropiadas de modo normal si
tanto m 40 como n 40. Un valor P se calcula en forma exacta como se hizo en
pruebas z previas.
Ejemplo 9.4
Al seleccionar concreto azufrado para la construcción de carreteras en regiones que experimentan heladas intensas, es importante que el concreto seleccionado tenga un valor bajo de
conductividad térmica para reducir al mínimo los daños subsiguientes provocados por cambios de temperatura. Suponga que se están considerando dos tipos de concreto, uno agregado escalonado y uno agregado sin finos, para una carretera. La tabla 9.1 resume datos de un
experimento realizado para comparar los dos tipos de concreto. ¿Sugiere esta información
que la conductividad promedio verdadera del concreto graduado excede la del concreto sin
finos? Realice una prueba con 0.01.
Tabla 9.1
Tipo
Graduado
Sin finos
Datos para el ejemplo 9.4
Tamaño de muestra Conductivad promedio muestral Desviación estándar muestral
42
42
0.486
0.359
0.187
0.158
Sean 1 y 2 la conductividad térmica promedio verdadera del concreto agregado
escalonado y sin finos, respectivamente. Las dos hipótesis son H0: 1 2 0 contra Ha:
z0.01 2.33. Se calcula
1 2 0 será rechazada si z
z
0.486 0.359
(0.14827)(0.14528)
2
www.FreeLibros.me
2
0.127
3.36
0.0378
c9_p325-368.qxd
332
3/12/08
CAPÍTULO 9
4:20 AM
Page 332
Inferencias basadas en dos muestras
Como 3.36 2.33, H0 es rechazada a un nivel de significación de 0.01. Alternativamente,
el valor P para una prueba z de cola superior es
Valor P 1 (z) 1 (3.36) 0.0004
H0 deberá ser rechazada no sólo para una prueba con 0.01 sino también con 0.001
o cualquier nivel que exceda de 0.0004. Los datos sustentan fuertemente la conclusión de
que la conductividad térmica promedio verdadera del concreto graduado sí excede la del
concreto sin finos.
■
Intervalos de confianza para 1 – 2
Cuando ambas distribuciones de población son normales la estandarización de X
Y da
una variable aleatoria Z con distribución normal estándar. Como el área bajo la curva z entre
z/2 y z/2 es 1 , se desprende que
P
z/2
X
Y (1 2)
12
22
n
m
z/2 1
La manipulación de las desigualdades entre paréntesis para aislar
ción de probabilidad equivalente
21
2
2 1 2 X
Y z/2
m
n
P X
Y z/2
1
2
da la formula-
21
2
2 1
m
n
Esto implica que un intervalo de confianza de 100(1 )% para 1 2 tiene un límite
inferior x y z/2 XY y uno superior x y z/2 XY, donde XY es la expresión
de la raíz cuadrada. Este intervalo es un caso especial de la fórmula general ˆ ! z/2 ˆ.
Si tanto m como n son grandes, el teorema del límite central implica que este intervalo
es válido incluso sin la suposición de población normal; en este caso, el intervalo de confianza es aproximadamente de 100(1 )%. Además, el uso de las varianzas muestrales S 21 y S 22 en
la variable estandarizada Z da un intervalo válido en el cual s 21 y s 22 reemplazan a 21 y 22.
Siempre que m y n son grandes, un intervalo de confianza para
de confianza de aproximadamente 100(1 )% es
s2
s2
x y ! z/2 1 2
m
n
1
2
con un nivel
donde da el límite inferior y el límite superior del intervalo. Un límite de confianza superior o inferior también puede ser calculado reteniendo el signo apropiado
( o ) reemplazando z/2 con z.
Una regla empírica estándar para caracterizar tamaños de muestra tan grandes es m 40 y
n 40.
Ejemplo 9.5
Un experimento realizado para estudiar varias características de pernos de anclaje arrojó 78
observaciones de resistencia al esfuerzo cortante (klb) de pernos de 3/8 pulg de diámetro y
88 observaciones de resistencia de pernos de pulg de diámetro. A continuación se dan
cantidades obtenidas con MINITAB y en la figura 9.1 se presenta una gráfica de caja comparativa. Los tamaños de muestra, las medias y las desviaciones estándar muestrales concuerdan con los valores dados en el artículo “Ultimate Load Capacities of Expansion
Anchor Bolts”, (J. Energy Engr., 1993: 139-158). Los resúmenes sugieren que la diferencia
principal entre las dos muestras es donde están centradas.
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:21 AM
Page 333
9.1 Pruebas z e intervalos de confianza para una diferencia entre dos medias de población
Diam
variable 3/8
N
78
Media
4.250
Mediana
4.230
MediaTr
4.238
Diam
variable 3/8
Mín
1.634
Máx
7.327
Q1
3.389
Q3
5.075
Diam
variable 1/2
N
88
Media
7.140
Mediana
7.113
MediaTr
7.150
Diam
variable 1/2
Mín
2.450
Máx
11.343
Q1
5.965
Q3
8.447
Figura 9.1
333
DesvEs
1.300
MediaSE
0.147
DesvEs
1.680
MediaSE
0.179
Gráfica de caja comparativa de los datos de resistencia al esfuerzo cortante.
Calcule ahora un intervalo de confianza para la diferencia entre la resistencia al esfuerzo
cortante promedio verdadera de pernos de 3/8 pulg ( 1) y la resistencia al esfuerzo cortante promedio verdadera de pernos de 1/2 pulg ( 2) con un nivel de confianza de 95%:
4.25 7.14 ! (1.96)
(1.68)2
(1.30)2
2.89 ! (1.96)(0.2318)
88
78
2.89 ! 0.45 ( 3.34, 2.44)
Es decir, con confianza de 95%, 3.34 1 2 2.44. Por consiguiente se puede
estar altamente confiado en que la resistencia al esfuerzo cortante verdadera de los pernos
de 1/2 pulg excede la de los pernos de 3/8 pulg entre 2.44 klb y 3.34 klb. Obsérvese que si
se redesignan de modo que 1 se refiera a pernos de 1/2 pulg y 2 a pernos de 3/8 pulg, el
intervalo de confianza ahora está centrado en 2.89 y el valor de 0.45 se sigue restando y
sumando para obtener los límites de confianza. El intervalo resultante es (2.44, 3.34) y la
interpretación es idéntica a la del intervalo previamente calculado.
■
Si las varianzas de 21 y 22 son por lo menos aproximadamente conocidas y el investigador utiliza tamaños de muestra iguales, entonces el tamaño de muestra común n que da
un intervalo de 100(1 )% de ancho w es
n
4z2/2( 21 22)
w2
la que normalmente tiene que ser redondeada a un entero.
www.FreeLibros.me
c9_p325-368.qxd
334
3/12/08
CAPÍTULO 9
EJERCICIOS
4:21 AM
Page 334
Inferencias basadas en dos muestras
Sección 9.1 (1-16)
1. Un artículo que apareció en el ejemplar de noviembre de
1983 del Consumer Reports comparó varios tipos de baterías. Las duraciones promedio de baterías AA alcalinas Duracell y alcalinas Eveready Energizer se dieron como 4.1
horas y 4.5 horas, respectivamente. Suponga que éstas son
las duraciones promedio de la población.
a. Sea X
la duración promedio muestral de 100 baterías Duracell y Y la duración promedio muestral de 100 baterías
Eveready. ¿Cuál es el valor medio X
Y (es decir, donde
está centrada la distribución de X
Y)? ¿Cómo depende su respuesta de los tamaños de muestra especificados?
b. Suponga que la desviación estándar de la población de
duración es de 1.8 horas para baterías Duracell y de 2.0
horas para baterías Eveready. Con los tamaños de muestra dados en el inciso a), ¿cuál es la varianza del estadístico X
Y y cuál es su desviación estándar?
c. Con los tamaños de muestra dados en el inciso a) trace
la curva de distribución aproximada de X
Y (incluya
una escala de medición sobre el eje horizontal). ¿Sería la
forma de la curva necesariamente la misma con tamaños
de muestra de 10 baterías de cada tipo? Explique.
2. Sean 1 y 2 las duraciones de la banda de rodamiento promedio verdaderas de dos marcas competidoras de neumáticos radiales P205/65R15. Pruebe H0: 1 2 0 contra
Ha: 1 2 0 a un nivel 0.05 con los siguientes datos:
m 45, x 42 500, s1 2200, n 45, y 40 400, y
s2 1900.
3. Sea 1 la duración de la banda de rodamiento promedio verdadera de una marca premium de neumático radial P205/65R15
y sea 2 la duración de la banda de rodamiento promedio verdadera de una marca económica de un neumático de la misma
medida. Pruebe H0: 1 2 5000 contra Ha: 1 2
5000 a un nivel 0.01 con los siguientes datos: m 45, x
42 500, s1 2200, n 45, y 36 800, y s2 1500.
4. a. Use los datos del ejercicio 2 para calcular un intervalo
de 95% para 1 2. ¿Sugiere el intervalo resultante
que 1 2 ha sido estimado con precisión?
b. Use los datos del ejercicio 3 para calcular un límite de
confianza superior de 95% para 1 2.
5. Las personas que padecen el síndrome de Reynaud están propensas a sufrir un deterioro repentino de la circulación sanguínea en los dedos de las manos y de los pies. En un experimento
para estudiar el grado de este deterioro, cada uno de los sujetos sumergió un dedo índice en agua y se midió la producción
de calor resultante (cal/cm2/min). Con m 10 sujetos con el
síndrome, la producción de calor promedio fue x 0.64, y con
n 10 sin el síndrome, la producción promedio fue de 2.05.
Sean 1 y 2 las producciones de calor promedio verdaderas
de los tipos de sujetos. Suponga que las dos distribuciones de
producción de calor son normales con 1 0.2 y 2 0.4.
a. Considere probar H0: 1 2 1.0 contra Ha: 1
2 1.0 a un nivel 0.01. Describa en palabras qué dice Ha y luego realice la prueba.
b. Calcule el valor P para el valor de Z obtenido en el inciso a)
c. ¿Cuál es la probabilidad de un error de tipo II cuando la
diferencia entre 1 y 2 es 1 2 1.2?
d. Suponiendo que m n, ¿qué tamaños de muestra se
requieren para asegurar que 0.1 cuando 1 2
1.2?
6. Un experimento para comparar la resistencia de adhesión a la
tensión de un mortero modificado con un polímero de látex
(mortero de cemento Portland al cual se le agregan emulsiones de polímero de látex durante la mezcla con la de un mortero no modificado dio por resultado x 18.12 kgf/cm2 para
el mortero modificado (m 40) y y 16.87 kgf/cm2 para el
mortero no modificado (n 32). Sean 1 y 2 las resistencias de adhesión a la tensión promedio verdaderas para los
morteros modificado y no modificado, respectivamente. Suponga que ambas distribuciones de la resistencia de adhesión
son normales.
a. Suponiendo que 1 1.6 y 2 1.4, pruebe H0:
1 2 0 contra Ha: 1 2 0 a un nivel 0.01.
b. Calcule la probabilidad de un error de tipo II para la
prueba del inciso a) cuando 1 2 1.
c. Suponga que el investigador decidió utilizar una prueba
a un nivel 0.05 y deseaba 0.10 cuando 1 2 1.
Si m 40, ¿qué valor de n es necesario?
d. ¿Cómo cambiaría el análisis y conclusión del inciso a) si
1 y 2 fueran desconocidas pero s1 1.6 y s2 1.4?
7. ¿Se aburren más fácil los estudiantes universitarios que sus
contrapartes femeninas? Esta pregunta se examinó en el artículo “Boredom in Young Adults-Gender and Cultural
Comparisons” (J. of Cross-Cultural Psych., 1991: 209-223).
Los autores aplicaron una escala llamada Boredom Proneness
Scale a 97 estudiantes universitarios y a 148 estudiantes universitarias. ¿Apoyan los datos adjuntos la hipótesis de investigación de que la calificación media de tendencia al aburrimiento
es más alta para hombres que para mujeres? Pruebe las hipótesis apropiadas con nivel de significación de 0.05.
Género
Tamaño de
muestra
Media
muestral
DE
muestral
Hombres
Mujeres
97
148
10.40
9.26
4.83
4.68
8. Se realizaron pruebas de resistencia a la tensión en dos grados diferentes de alambrón (“Fluidized Bed Patenting of
Wire Rods”, Wire J., junio de 1977: 56-61) y se obtuvieron
los datos adjuntos.
Grado
AISI 1064
AISI 1078
Tamaño de
muestra
Media
muestral
(kg/mm2)
DE
muestral
m 129
n 129
x 107.6
y 123.6
s1 1.3
s2 2.0
a. ¿Proporcionan los datos evidencia precisa para concluir
que la resistencia promedio verdadera del grado 1078
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:21 AM
Page 335
9.1 Pruebas z e intervalos de confianza para una diferencia entre dos medias de población
excede la del grado 1064 en más de 10 kg/mm2? Pruebe
las hipótesis apropiadas con el método del valor P.
b. Estime la diferencia entre resistencias promedio verdaderas para los dos grados en una forma que proporcione
información sobre precisión y confiabilidad.
9. El artículo “Evaluation of a Ventilation Strategy to Prevent
Barotrauma in Patients at High Risk for Acute Respiratory
Distress Syndrome” (New Engl. J. of Med., 1998: 355-358)
reportó sobre un experimento en el cual 120 pacientes con
características clínicas similares fueron divididos al azar en
un grupo de control y un grupo de tratamiento, cada uno
compuesto de 60 pacientes. La permanencia en la unidad de
cuidados intensivos media y la desviación estándar muestrales para el grupo de tratamiento fueron 19.9 y 39.1, respectivamente, en tanto que estos valores para el grupo de
control fueron 13.7 y 15.8.
a. Calcule una estimación puntual de la diferencia entre la
permanencia en la unidad de cuidados intensivos promedio verdadera para los grupos de tratamiento y control.
¿Sugiere esta estimación que existe una diferencia significativa entre las permanencias promedio verdaderas en
las dos condiciones?
b. Responda la pregunta planteada en el inciso a) realizando una prueba formal de hipótesis. ¿Es diferente el resultado de lo que había conjeturado en el inciso a)?
c. ¿Parece que la permanencia en la unidad de cuidados
intensivos de pacientes a los que se les administró tratamiento de ventilación está normalmente distribuida?
Explique su razonamiento.
d. Estime el tiempo de permanencia promedio verdadero
de pacientes a los que se les administró tratamiento de
ventilación en una forma que dé información sobre precisión y confiabilidad.
10. Se realizó un experimento para comparar la tenacidad a la fractura de acero maraging de alta pureza con 18% de níquel con
acero de pureza comercial del mismo tipo (Corrosion Science,
1971: 723-736). Con m 32 especímenes la tenacidad promedio muestral fue x 65.6 para el acero de alta pureza, en
tanto que para n 38 especímenes de acero comercial
y 59.8. Como el acero de alta pureza es más caro, su uso en
ciertas aplicaciones se justifica sólo si su tenacidad a la fractura supera la del acero de pureza comercial en más de 5. Suponga que ambas distribuciones de tenacidad son normales.
a. Suponiendo que 1 1.2 y 2 1.1, pruebe las hipótesis pertinentes con 0.001.
b. Calcule para la prueba realizada en el inciso a) cuando 1 2 6.
11. Se determinó el nivel de plomo en la sangre con una muestra de 152 trabajadores de desechos peligrosos de 20 a 30
años de edad y también con una muestra de 86 trabajadoras
y el resultado fue una media ! un error estándar de 5.5 ! 0.3
para los hombres y de 3.8 ! 0.2 para las mujeres (“Temporal Changes in Blood Lead Levels of Hazardous Waste Workers in New Jersey, 1984-1987”, Environ. Monitoring and
Assessment, 1993: 99-107). Estime la diferencia entre niveles
de plomo en sangre promedio verdaderos para trabajadores
y trabajadoras en una forma que proporcione información
sobre confiabilidad y precisión.
335
12. La tabla adjunta contiene datos sobre resistencia a la compresión (N/mm2) de especímenes de concreto hechos con
una mezcla de cenizas combustibles pulverizadas (“A Study
of Twenty-Five-Year-Old Pulverized Fuel Ash Concrete
Used in Foundation Structures”. Proc. Inst. Civ. Engrs.,
marzo de 1985: 149-165):
Edad
(días)
Tamaño
muestral
Media
muestral
DE
muestral
7
28
68
74
26.99
35.76
4.89
6.43
Calcule e interprete un intervalo de confianza de 99% para
la diferencia entre resistencia a 7 días promedio verdadera y
resistencia a 28 días promedio verdadera.
13. Un ingeniero mecánico desea comparar las propiedades de
resistencia de vigas de acero con vigas similares hechas
de una aleación particular. Se probará el mismo número de
vigas, n, de cada tipo. Cada viga se colocará en posición horizontal con un apoyo en cada extremo y aplicará una fuerza de 2500 lb en el centro y se medirá la deflexión. Por
experiencias pasadas con las mismas vigas, el ingeniero desea suponer que la desviación estándar verdadera de la
deflexión de ambos tipos de viga es de 0.05 pulg. Como
la aleación es más cara, el ingeniero desea probar a un nivel
de 0.01 si su deflexión promedio es más pequeña que la de
la viga de acero. ¿Qué valor de n es apropiado si la probabilidad de error de tipo II deseado es de 0.05 cuando la diferencia de deflexión promedio verdadera favorece la
aleación por 0.04 pulgadas?
14. Se determinó el nivel de actividad de oxidasa monoamina
(MAO, por su siglas en inglés) en plaquetas sanguíneas
(nm/mg proteína/h) para cada individuo en una muestra
de 43 esquizofrénicos crónicos y el resultado fue x 2.69
y s1 2.30, así como también para 45 sujetos normales y
el resultado fue y 6.35 y s2 4.03. ¿Sugieren fuertemente estos datos que la actividad de MAO promedio verdadera en sujetos normales es más de dos veces que el nivel de
actividad en esquizofrénicos? Derive un procedimiento
de prueba y realice una prueba con 0.01. [Sugerencia:
H0 y Ha en este caso tienen una forma diferente de los tres
casos estándar. Si 1 y 2 se refieren a la actividad de MAO
promedio verdadera para sujetos esquizofrénicos y normales, respectivamente, considere el parámetro 21 2.
Escriba H0 y Ha en función de , estime y derive ˆ ˆ (“Reduced Monoamine Oxidase Activity in Blood Platelets from
Schizophrenic Patients”, Nature, 28 de julio, 1972: 225226).]
15. a. Demuestre que para la prueba de cola superior con 1 y
2 conocidas a medida que m o n se incrementa, disminuye cuando 1 2 0.
b. En el caso de tamaños de muestra iguales (m n) y
fijo, ¿qué le sucede al tamaño de muestra necesario n a
medida que disminuye, donde es la probabilidad de
error de tipo II deseada con una alternativa fija?
16. Para decidir si dos tipos diferentes de acero tienen los mismos valores de tenacidad a la fractura promedio verdaderos,
se probaron n especímenes de cada tipo y se obtuvieron los
www.FreeLibros.me
c9_p325-368.qxd
336
3/12/08
CAPÍTULO 9
4:21 AM
Page 336
Inferencias basadas en dos muestras
piadas, suponiendo que los datos se basaron en n 100.
Luego repita el cálculo con n 400. ¿Es el valor P pequeño con n 400 indicativo de una diferencia que tenga significación práctica? Se sentiría satisfecho con sólo el
reporte del valor P? Comente brevemente.
siguientes resultados:
Tipo
Promedio muestral
DE muestral
1
2
60.1
59.9
1.0
1.0
Calcule el valor P para la prueba z con dos muestras apro-
9.2 Prueba t con dos muestras e intervalo de confianza
Normalmente un investigador no conoce los valores de las varianzas de la población. En la
sección previa, se ilustró por lo que se refiere a muestras grandes el uso de un procedimiento de prueba y un intervalo de confianza en el cual se utilizaron las varianzas muestrales en
lugar de las varianzas de la población. En realidad, con muestras grandes, el teorema del límite central permite utilizar estos métodos incluso cuando las dos poblaciones de interés no
son normales.
No obstante, existen muchos problemas en los cuales por lo menos un tamaño de
muestra es pequeño y los valores de la varianza de la población son desconocidos. Sin el
teorema del límite central, se procede haciendo suposiciones específicas sobre las distribuciones de población subyacentes. El uso de procedimientos inferenciales que se desprenden
de estas suposiciones se limita entonces a situaciones en las que las suposiciones se satisfacen por lo menos de forma aproximada.
SUPOSICIONES
Ambas poblaciones son normales, de modo que X1, X2, . . . , Xm es una muestra aleatoria de una distribución normal y también lo es Y1, . . . , Yn (con las X y Y independientes entre sí). La factibilidad de estas suposiciones puede ser juzgada
construyendo una curva de probabilidad normal de las xi y otra de las yi.
El estadístico de prueba y la fórmula del intervalo de confianza están basados en la misma variable estandarizada en la sección 9.1, pero la distribución pertinente ahora es t en lugar de z.
TEOREMA
Cuando ambas distribuciones de población son normales, la variable estandarizada
T
X
Y (1 2)
S 21
S 22
n
m
(9.2)
tiene aproximadamente una distribución t con grados de libertad estimado a partir
de los datos como sigue
s 21
s 22 2
[(es1)2 (es2)2]2
m
n
2 2
2
2
(s 1/m)
(s 2/n)
(es1)4
( es2) 4
m 1
n1
m1
n1
donde
es1
s1
s
, es2 2
m
n
(redondear al entero más cercano hacia abajo).
La manipulación de T en un enunciado de probabilidad para aislar 1 2 da un intervalo de confianza, en tanto que al reemplazar 1 2 con el valor nulo 0 se obtiene un
estadístico de prueba.
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:21 AM
Page 337
9.2 Prueba t con dos muestras e intervalo de confianza
337
Procedimientos t con dos muestras
El intervalo de confianza t con dos muestras para 1
de 100(1 )% es entonces
s2
s21
x y ! t/2,
2
m
n
2 con nivel de confianza
Se puede calcular un límite de confianza unilateral como se describió con anterioridad.
La prueba t con dos muestras para probar H0: 1 2 0 es como sigue:
x y 0
Valor estadístico de prueba: t 2
s1
s2
2
m
n
Hipótesis alternativa
Región de rechazo con una prueba a nivel aproximado
Ha: 1 2 0
t
Ha: 1 2 0
t t,
(cola inferior)
t
o
Ha: 1 2 0
o
t,
t/2,
(cola superior)
t t/2,
(dos colas)
Se puede calcular un valor P como se describió en la sección 8-4 para la prueba con
una muestra.
Ejemplo 9.6
El volumen de huecos en una tela afecta las propiedades de comodidad, inflamabilidad y
aislantes. La permeabilidad de una tela se refiere a la accesibilidad de los espacios huecos
al flujo de un gas o líquido. El artículo “The Relationship Between Porosity and Air Permeability of Woven Textile Fabrics” (J. of Testing and Eval., 1997: 108-114) contiene información resumida sobre permeabilidad al aire (cm3/cm2/s) de varios tipos diferentes de tela.
Considere los siguientes datos sobre dos tipos diferentes de tela de tejido ordinario:
Tipo de tela
Algodón
Triacetato
Tamaño de muestra
Media muestral
Desviación estándar de muestra
10
10
51.71
136.14
0.79
3.59
Suponiendo que la distribuciones de porosidad de ambos tipos de tela son normales, calcule
un intervalo de confianza para la diferencia entre la porosidad promedio verdadera de la tela
de algodón y la de la tela de acetato, utilizando un intervalo de confianza de 95%. Antes de
que se pueda seleccionar un valor crítico t apropiado, se debe determinar el número de grados de libertad.
0.6241
12.8881 2
1.8258
10
10
gl
9.87
2
2
(0.6241/10)
(12.8881/10)
0.1850
9
9
Así pues se utiliza 9; la tabla A.5 del apéndice da t0.025,9 2.262. El intervalo resultante es
51.71 136.14 ! (2.262)
10
10
0.6241
12.8881
84.43 ! 2.63
( 87.06, 81.80)
Con un alto grado de confianza, se puede decir que la porosidad promedio verdadera de especímenes de tela de triacetato excede la de los especímenes de algodón entre 81.80 y
87.06 cm3/cm2/s.
■
www.FreeLibros.me
CAPÍTULO 9
4:21 AM
Page 338
Inferencias basadas en dos muestras
Ejemplo 9.7
El deterioro de muchas redes de tuberías municipales a través del país es una preocupación
creciente. Una tecnología propuesta para rehabilitar las tuberías utiliza un forro flexible insertado en las tuberías existentes. El artículo “Effect of Welding on a High-Density Polyethylene Liner” (J. of Materials in Civil Engr., 1996: 94-100 reportó los siguientes datos
de resistencias a la tensión (lb/pulg2) de especímenes de forro cuando se utilizó cierto proceso de fusión y cuando este proceso no se utilizó.
Sin fusión
2748
3149
m 10
3027
n8
Fusionado
2700
2655
3257
3213
x 2902.8
3356
3359
y 3108.1
2822
2511
3220
2753
s1 277.3
3297
3125
s2 205.9
2910
2889
2902
La figura 9.2 muestra curvas de probabilidad normal generadas por MINITAB. El patrón lineal de cada una confirma la suposición de que las dos distribuciones de resistencia a la tensión en ambas condiciones son normales.
Curva de probabilidad normal
Curva de probabilidad normal
0.999
0.999
0.99
0.95
0.99
0.95
Probabilidad
338
3/12/08
Probabilidad
c9_p325-368.qxd
0.80
0.50
0.20
0.05
0.01
0.001
0.80
0.50
0.20
0.05
0.01
0.001
2480
2580
2680
2780
2880
2980
3080
3180
3280
no fusionado
Figura 9.2
2880
2980
3080
3180
3280
3380
fusionado
Curvas de probabilidad normal generadas por MINITAB con los datos de resistencia a la tensión.
Los autores del artículo afirman que el proceso de fusión incrementó la resistencia a la
tensión promedio. El mensaje de la gráfica comparativa de la figura 9.3 no es del todo claro.
Realice una prueba de hipótesis para ver si los datos confirman esta conclusión.
Tipo 2
Tipo 1
Resistencia
2500 2600 2700 2800 2900 3000 3100 3200 3300 3400
Figura 9.3
Gráfica de caja comparativa de los datos de resistencia a la tensión.
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:21 AM
Page 339
9.2 Prueba t con dos muestras e intervalo de confianza
339
1. Sea 1 la resistencia a la tensión promedio verdadera de especímenes cuando se utiliza
el tratamiento de no fusión y 2 la resistencia a la tensión promedio verdadera cuando
se utiliza el tratamiento de fusión.
2. H0: 1 2 0 (ninguna diferencia en las resistencias a la tensión promedio verdaderas
con los dos tratamientos).
3. Ha: 1 2 0 (la resistencia a la tensión promedio verdadera del tratamiento sin fusión
es menor que la del tratamiento de fusión, de modo que la conclusión de
los investigadores es correcta).
4. El valor nulo es 0 0, de modo que el estadístico de prueba es
t
x y
s 21
s 22
m
n
5. A continuación se calcula tanto el valor estadístico de prueba como el número de grados de libertad para la prueba:
t
2902.8 3108.1
205.3
1.8
113.97
(277.3)2
(205.9)2
10
8
Con s 21/m 7689.529 y s22/n 5299.351,
168 711 003.7
(7689.529 5299.351)2
15.94
2
2
10 581 747.35
(7689.529) /9 (5299.351) /7
así, la prueba se basará en 15 grados de libertad.
6. La tabla A.8 del apéndice muestra que el área bajo la curva t con 15 grados de libertad a la
derecha de 1.8 es 0.046, de modo que el valor P para una prueba de cola inferior también
es 0.046. Los siguientes datos generados por MINITAB resumen todos los cálculos:
T muestreados para no fusión vs fusionada
N
sin fusión 10
fusionado
8
Media
2903
3108
DesvEs
277
206
EE de la media
88
73
IC para mu no fusionado-mu fusionado: ( 488, 38)
Prueba T mu no fusionada = mu fusionada (vs ): T 1.80 P 0.046 DF 15
7. Con un nivel de significación de 0.05, apenas si se puede rechazar la hipótesis nula a favor de la hipótesis alternativa, lo que confirma la conclusión expresada en el artículo.
No obstante, alguien que demande evidencia más contundente podría seleccionar
0.01, un nivel con el cual H0 no puede ser rechazada.
Si la pregunta planteada hubiera sido si la fusión incrementó la resistencia promedio verdadera en más de 100 lb/pulg2, entonces las hipótesis pertinentes habrían sido H0: 1 2 100
contra Ha: 1 2 100; es decir, el valor nulo habría sido 0 100.
■
Procedimientos t agrupados
De la suposición de que no sólo las dos distribuciones de población son normales sino que
también tienen varianzas iguales ( 21 22), se deriva la alternativa de los procedimientos t
con dos muestras. Es decir, las dos curvas de distribución de población se suponen normales con dispersiones iguales, la única diferencia entre ellas sería donde están centradas.
www.FreeLibros.me
c9_p325-368.qxd
340
3/12/08
CAPÍTULO 9
4:21 AM
Page 340
Inferencias basadas en dos muestras
Sea
2
la varianza de población común. Luego, estandarizando X
Y se obtiene
Z
X
X
Y (1 2)
Y (1 2)
1
1
2
2
2
m
n
m
n
cuya distribución es normal estándar. Antes de que esta variable pueda ser utilizada como base
para hacer inferencias con respecto a 1 2, se debe estimar la varianza común a partir de los
datos muestrales. Un estimador de 2 es S12, la varianza de las m observaciones en la primera
muestra y otro es S22, la varianza de la segunda muestra. Intuitivamente, se obtiene un mejor estimador que cualquier varianza muestral individual al combinar las dos varianzas muestrales.
Un primer intento podría ser utilizar (S12 S22)/2, el promedio ordinario de las dos varianzas
muestrales. No obstante, si m n, entonces la primera muestra contiene más información sobre 2 que la segunda y un comentario análogo es válido si m n. El siguiente promedio ponderado de las dos varianzas muestrales, llamado estimador agrupado (es decir, combinado)
de 2, se ajusta a cualquier diferencia que exista entre los dos tamaños de muestra:
Sp2
n1
m1
S12
S22
mn2
mn2
La primera muestra contribuye con m 1 grados de libertad a la estimación de 2 y la segunda con n 1 grados de libertad, para un total de m n 2 grados de libertad. La teoría estadística dice que si S 2P reemplaza a 2 en la expresión para Z, la variable estandarizada
resultante tiene una distribución t basada en m n 2 grados de libertad. Del mismo modo que las variables estandarizadas con anterioridad se utilizaron como base para derivar intervalos de confianza y procedimientos de prueba, esta variable t conduce de inmediato al
intervalo de confianza t agrupado para estimar 1 2 y a la prueba t agrupada para probar hipótesis con respecto a una diferencia entre las medias.
En el pasado, muchos estadísticos recomendaban estos procedimientos t agrupados
sobre los procedimientos t con dos muestras. La prueba t agrupada, por ejemplo, puede derivarse del principio de razón de verosimilitud, mientras que la prueba t con dos muestras no
es una prueba de razón de verosimilitud. Además, el nivel de significación para la prueba t
agrupada es exacta, en tanto que sólo es aproximada para la prueba t con dos muestras. Sin
embargo, investigaciones recientes han demostrado que aunque la prueba t agrupada supera por poco el desempeño de la prueba t con dos muestras (las más pequeñas con el mismo nivel ) cuando 21 22, la primera prueba puede llevar fácilmente a conclusiones
erróneas si se aplica cuando las varianzas son diferentes. Comentarios análogos se aplican
al comportamiento de los dos intervalos de confianza. Es decir, los procedimientos t agrupados no violan la suposición de varianza igual.
Se ha sugerido que se podría realizar una prueba preliminar de H0: 21 22 y utilizar
un procedimiento t agrupado si esta hipótesis nula no es rechazada. Desafortunadamente, la
“prueba F” usual de varianzas iguales (sección 9.5) es bastante sensible a la suposición de
distribuciones de población normales, mucho más que los procedimientos t. Por consiguiente, se recomienda el método conservador de utilizar procedimientos t con dos muestras
a menos que exista evidencia realmente contundente para proceder de otra manera, en particular cuando los dos tamaños de muestra son diferentes.
Probabilidades de error de tipo II
La determinación de probabilidades de error de tipo II (o de forma equivalente, potencia
1 ) con la prueba t con dos muestras es complicada. Parece que no existe una forma simple de utilizar las curvas de la tabla A.17. La versión más reciente de MINITAB (Versión
14) calculará la potencia para la prueba t agrupada pero no para la prueba t con dos muestras. Sin embargo, la página de inicio del Departamento de Estadística de la UCLA
(http://www.stat.ucla.edu) permite el acceso a una calculadora de potencia que llevará a
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:21 AM
Page 341
9.2 Prueba t con dos muestras e intervalo de confianza
341
cabo esto. Por ejemplo, se especificó m 10, n 8, 1 300 y 2 225 (estos son los
tamaños de muestra del ejemplo 9.7, cuyas desviaciones estándar muestrales son algo más
pequeñas que estos valores de 1 y 2) y demandan la potencia de una prueba con nivel de
0.05 de dos colas de H0: 1 2 0 cuando 1 2 100, 250 y 500. Los valores de la
potencia obtenidos son 0.1089, 0.4609 y 0.9635 (correspondientes a 0.89, 0.54 y 0.04),
respectivamente. En general, disminuirá a medida que se incrementan los tamaños de
muestra, a medida que se incrementa y a medida que 1 2 se aleja de 0. El programa
también calculará los tamaños de muestra necesarios a fin de obtener un valor específico de
potencia para un valor particular de 1 2.
EJERCICIOS
Sección 9.2 (17-35)
17. Determine el número de grados de libertad para la prueba t
con dos muestras o el intervalo de confianza en cada una de
las siguientes situaciones:
a. m 10, n 10, s1 5.0, s2 6.0
b. m 10, n 15, s1 5.0, s2 6.0
c. m 10, n 15, s1 2.0, s2 6.0
d. m 12, n 24, s1 5.0, s2 6.0
18. Sean 1 y 2 las densidades promedio verdaderas de dos tipos diferentes de ladrillos. Suponiendo normalidad de las
dos distribuciones de densidad, pruebe H0: 1 2 0
contra Ha: 1 2 0 con los siguientes datos: m 6,
x 22.73, s1 0.164, n 5, y 21.95 y s2 0.240.
19. Suponga que 1 y 2 son distancias de detención medias
verdaderas a 50 mph de carros de cierto tipo equipados con
dos tipos diferentes de sistemas de frenos. Use la prueba t
con dos muestras a un nivel de significación de 0.01 para
probar H0: 1 2 10 contra Ha: 1 2 10 con
los siguientes datos: m 6, x 115.7, s1 5.03, n 6,
y 129.3 y s2 5.38.
20. Use los datos del ejercicio 19 para calcular un intervalo de
confianza de 95% para la diferencia entre la distancia
de detención promedio verdadera de carros equipados con el
sistema 1 y carros equipados con el sistema 2. ¿Sugiere
el intervalo que está disponible información precisa sobre el
valor de esta diferencia?
21. Se requieren técnicas no invasivas cuantitativas para la valoración rutinaria de neuropatías periféricas, tales como el síndrome de túnel carpiano (CTS, por sus siglas en inglés). El
artículo “A Gap Detection Tactility Test for Sensory Deficits
Associated with Carpal Tunnel Syndrome” (Ernonomics,
1995: 2588-2601) reportó sobre una prueba que implicaba detectar una pequeña grieta en una superficie en otras circunstancias lisa tentando con un dedo; esto funcionalmente se asemeja
a muchas actividades táctiles relacionadas con el trabajo, tal
como detectar rasguños o defectos superficiales. Cuando no se
permitía tentar con los dedos, el umbral de detección de grietas promedio muestral con m 8 sujetos normales fue de 1.71
mm, y la desviación estándar de la muestra fue 0.53 y con
n 10 sujetos con el síndrome de túnel carpiano, la media y
desviación estándar muestrales fueron 2.53 y 0.87, respectivamente. ¿Sugieren estos datos que el umbral de detección de
grietas promedio verdadero de sujetos con CTS excede el
de sujetos normales? Formule y pruebe las hipótesis pertinentes utilizando un nivel de significación de 0.01.
22. La prueba de esfuerzo cortante sesgado es ampliamente
aceptada para evaluar la adhesión de materiales de reparación resinosos para concreto; utiliza especímenes cilíndricos de dos mitades idénticas adheridas a 30°. El artículo
“Testing the Bond Between Repair Materials and Concrete Substrate” (ACI Materials J., 1996: 553-558) reportó
que para 12 especímenes preparados utilizando un cepillo
de alambre, la resistencia al esfuerzo cortante media
(N/mm2) y la desviación estándar fueron de 19.20 y 1.58,
respectivamente, mientras que para 12 especímenes cincelados a mano fueron de 23.13 y 4.01. ¿Parece ser diferente la resistencia promedio verdadera con los dos métodos
diferentes de preparación de la superficie? Formule y
pruebe las hipótesis pertinentes con un nivel de significación
de 0.05. ¿Qué está suponiendo sobre las distribuciones del
esfuerzo cortante?
23. Se están utilizando forros internos fusibles con creciente
frecuencia para soportar la tela externa y mejorar la forma
y caída de varias piezas de ropa. El artículo “Compatibility of Outer and Fusible Interlining Fabrics in Tailored
Garments” (Textile Res. J., 1997: 137-142) dio los datos
adjuntos sobre extensibilidad (%) a 100 g/cm tanto de especímenes de telas de alta calidad (A) como especímenes
de telas de baja calidad (B).
A 1.2
1.9
0.8
B 1.6
0.9
1.3
2.0
1.5
0.7
2.1
1.7
1.1
1.0
1.6
1.6
2.1
1.7
1.8
2.3
1.5
1.7 1.1 0.9 1.7
1.4 1.3 1.9 1.6
2.0
1.3 1.0 2.6
a. Construya curvas de probabilidad normal para verificar
la factibilidad con ambas muestras seleccionadas de distribuciones de población normales.
b. Construya una gráfica comparativa. ¿Sugiere ésta que
existe una diferencia entre la extensibilidad promedio
verdadera de especímenes de tela de alta calidad y la de
especímenes de baja calidad?
c. La media y desviación estándar muestrales de la muestra de alta calidad son 1.508 y 0.444, respectivamente
y las de la muestra de baja calidad son 1.588 y 0.530.
Use la prueba t con dos muestras para decidir si la extensibilidad promedio verdadera difiere para los dos
tipos de tela.
24. Los daños en uvas a causa de la depredación de pájaros es
un problema serio para los viticultores. El artículo
www.FreeLibros.me
c9_p325-368.qxd
342
3/12/08
CAPÍTULO 9
4:21 AM
Page 342
Inferencias basadas en dos muestras
“Experimental Method to Investigate and Monitor Bird Behavior and Damage to Vineyards” (Amer. J. of Enology and
Viticulture, 2004: 288-291) reportó sobre un experimento
que implica una mesa alimentadora de pájaros, un video del
tiempo transcurrido y alimentos artificiales. Se recopiló información para dos especies de pájaros diferentes tanto en
el sitio experimental como en un entorno de viñedo natural.
Considere los siguientes datos de tiempo (s) empleado en
una sola visita al lugar.
Especie
Ubicación
n
Mirlos
Mirlos
Silverreyes
Silverreyes
Experim.
Natural
Experim.
Natural
65
50
34
46
x EE de la media
13.4
9.7
49.4
38.4
2.05
1.76
4.78
5.06
25. El dolor de espalda baja (DEB) es un serio problema de salud en muchos entornos industriales. El artículo “Isodynamic Evaluation of Trunk Muscles and Low-Back Pain
Among Workers in a Steel Factory” (Ergnomics, 1995:
2107-2117) reportó los datos adjuntos sobre rango lateral
de movimiento (grados) para una muestra de trabajadores
sin antecedentes de dolor de espalda baja y otra muestra con
antecedentes de esta dolencia.
Tamaño de Media
DE
muestra muestral muestral
Sin DEB (dolor espalda baja)
Con DEB
28
31
91.5
88.3
Tipo
1
2
N
20
20
Media
17.49900000
16.90000000
Varianzas
Desigual
Igual
a. Calcule un límite de confianza superior para el tiempo
promedio verdadero que los mirlos emplean en una sola
visita en el lugar experimental.
b. ¿Parece que el tiempo promedio empleado por los mirlos en el lugar experimental excede el tiempo promedio
verdadero que los pájaros de este tipo emplean en el lugar natural? Pruebe las hipótesis apropiadas.
c. Calcule la diferencia entre el tiempo promedio verdadero que los mirlos emplean en el lugar natural y el tiempo promedio verdadero que los silverreyes emplean en
el lugar natural y hágalo de modo que informe sobre
confiabilidad y precisión.
[Nota: Todas las medianas muestrales reportadas en el artículo parecían significativamente más pequeñas que las
medias, lo que sugiere una asimetría sustancial de la distribución de la población. Los autores en realidad utilizaron el
procedimiento de prueba libre de distribución presentado en
la sección 2 del capítulo 15.]
Condición
dos con aluminio de aleación y otra muestra con aluminio
EC. ¿Sugieren los datos adjuntos obtenidos con SAS que la
caída de potencial promedio verdadera de conexiones de
aleación (tipo I) es más alta que las conexiones EC (como
se manifestó en el artículo)? Realice la prueba apropiada
con un nivel de significación de 0.01. Al llegar a su conclusión, ¿qué tipo de error podría haber cometido? [Nota: SAS
reporta el valor P para una prueba de dos colas.]
5.5
7.8
Calcule un intervalo de confianza de 90% para la diferencia
entre el grado de movimiento lateral medio de la población para las dos condiciones. ¿El intervalo sugiere que el movimiento lateral medio difiere en las dos condiciones? ¿Es diferente el
mensaje si se utiliza un intervalo de confianza de 95%?
26. El artículo “The Influence of Corrosion Inhibitor and Surface Abrasión on the Failure of Aluminum-Wired Twist-on
Connections” (IEEE Trans. on Components Hybrids, and
Manuf. Tech., 1984: 20-25) reportó datos sobre mediciones
de caída potencial para una muestra de conectores alambra-
Dev est.
0.55012821
0.48998389
T
3.6362
3.6362
DF
37.5
38.0
Error est
0.12301241
0.10956373
Prob °T°
0.0008
0.0008
27. Se piensa que el codo de tenista es molestado por el impacto experimentado cuando se golpea la pelota. El artículo
“Forces on the Hand in the Tennis One-Handed Backhand”
(Intl. J. of Sport Biomechanics, 1991: 282-292) reportó la
fuerza (N) en la mano exactamente después del impacto en
un golpe de revés con una mano de seis jugadores avanzados y de ocho intermedios.
Tipo de
jugador
Tamaño de
muestra
Media
muestral
DE
muestral
6
8
40.3
21.4
11.3
8.3
1. Avanzado
2. Intermedio
En su análisis de los datos, los autores supusieron que ambas distribuciones de fuerza eran normales. Calcule un intervalo de confianza de 95% para la diferencia entre fuerza
promedio verdadera de jugadores avanzados ( 1) y fuerza promedio verdadera de jugadores intermedios ( 2).
¿Proporciona su intervalo evidencia contundente para
concluir que las dos son diferentes? ¿Habría alcanzado
la misma conclusión calculando un intervalo de confianza
para 2 1 (es decir, invirtiendo los subíndices 1 y 2 en
los dos tipos de jugadores)? Explique.
28. A medida que la población envejece existe una creciente
preocupación sobre lesiones relacionadas con accidentes
que sufren las personas de edad. El artículo “Age and Gender Differences in Single-Step Recovery from a Forward
Fall” (J. of Gerontology, 1999: M44-M50) reportó sobre un
experimento en el cual el ángulo de inclinación máximo, lo
más lejos que un sujeto es capaz de inclinarse y aún enderezarse en un solo paso, se determinó tanto para una muestra
de mujeres jóvenes (21-29 años) y una muestra de mujeres
mayores (67-81 años). Las siguientes observaciones son
consistentes con los datos que aparecen en el artículo:
MJ: 29, 34, 33, 27, 28, 32, 31, 34, 32, 27
MM: 18, 15, 23, 13, 12
¿Sugieren los datos que el ángulo de inclinación máximo promedio de mujeres mayores es más de 10 grados menor que el
de mujeres jóvenes? Formule y pruebe las hipótesis pertinentes a nivel de significación de 0.10 obteniendo un valor P.
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:21 AM
Page 343
9.2 Prueba t con dos muestras e intervalo de confianza
29. El artículo “Effect of Internal Gas Pressure on the Compression Strength of Beverage Cans and Plastic Bottles” (J.
Testing and Evaluation, 1993: 129-131) incluye los datos
adjuntos sobre resistencia a la compresión (lb) para una
muestra de latas de aluminio de 12 oz de refresco de fresas
llenas y otra muestra de latas de refresco de cola llenas.
¿Sugieren los datos que la carbonatación extra de la cola da
por resultado una resistencia a la compresión más alta? Base
su respuesta en un valor P. ¿Qué suposiciones son necesarias para su análisis?
Bebida
Tamaño de
muestra
Media
muestral
DE
muestral
15
15
540
554
21
15
Fresa
Cola
30. El artículo “Flexure of Concrete Beams Reinforced with
Advanced Composite Orthogrids” (J. of Aerospace Engr.,
1997: 7-15) dio los datos adjuntos sobre carga última (kN)
de dos tipos diferentes de vigas.
Tamaño de Media
muestra muestral
Tipo
Malla de fibra de vidrio
Malla de carbono
comercial
26
26
33.4
42.8
DE
muestral
2.2
4.3
a. Suponiendo que las distribuciones subyacentes son normales, calcule e interprete un intervalo de confianza
de 99% para la diferencia entre carga promedio verdadera para las vigas de fibra de vidrio y la de vigas con fibra de carbono.
b. ¿Da el límite superior del intervalo que calculó en el inciso a) un límite de confianza de 99% para la diferencia
entre las dos ? Si no, calcule tal límite. ¿Sugiere fuertemente que la carga promedio verdadera de la vigas de
fibra de carbono es más grande que la de las vigas de fibra de vidrio? Explique.
31. Remítase al ejercicio 33 en la sección 7.3. El artículo citado también dio las siguientes observaciones sobre el grado
de polimerización de especímenes con concentración de
tiempos de viscosidad en un rango más alto:
429
430
430
431
436
440
441
445
446
447
437
a. Trace una gráfica de caja comparativa para las dos
muestras y comente sobre cualquier característica interesante.
b. Calcule un intervalo de confianza de 95% para la diferencia entre el grado promedio verdadero de polimerización del rango medio y del rango alto. ¿Sugiere el
intervalo que 1 y 2 pueden en realidad ser diferentes?
Explique su razonamiento.
32. El artículo citado en el ejercicio 34 en la sección 7.3 dio los
siguientes datos sobre límites de esfuerzo proporcional de especímenes construidos con dos tipos diferentes de madera:
Tipo de
madera
Encino rojo
Abeto Douglas
343
Tamaño de
muestra
Media
muestral
DE
muestral
14
10
8.48
6.65
0.79
1.28
Suponiendo que ambas muestras se seleccionaron de distribuciones normales, realice una prueba de hipótesis para
decidir si el límite de esfuerzo proporcional promedio verdadero de juntas de encino rojo excede el de juntas de abeto Douglas por más de 1 MPa.
33. El artículo “The Effects of Low-Fat, Plan-Based Dietary Intervention on Body Weight, Metabolism, and Insulin Sensitivity in Postmenopausal Women” (Amer. J. of Med., 2005:
991-997) reportó sobre los resultados de un experimento en
el cual la mitad de un grupo de 64 mujeres posmenopáusicas
con sobrepeso fueron asignadas al azar a una dieta vegetariana particular y la otra mitad recibió una dieta basada en las
recomendaciones del National Cholesterol Education Program. La pérdida de peso media muestral de aquellas que llevaron la dieta vegetariana fue de 5.8 kg y la desviación
estándar muestral fue de 3.2, en tanto que para aquellas que
llevaron la dieta de control, la pérdida de peso media y la desviación estándar fueron de 3.8 y 2.8, respectivamente. ¿Parece que la pérdida de peso promedio verdadera con la dieta
vegetariana excede la de la dieta de control por más de 1 kg?
Realice una prueba de hipótesis apropiada a un nivel de significación de 0.05 basado en el cálculo de un valor P.
34. Considere la variable t agrupada
Y) (1 2)
T (X
1
1
Sp
m
n
la cual tiene una distribución t con m n 2 grados de libertad cuando ambas distribuciones de población son normales con 1 2 (véase la subsección Procedimientos t
agrupados para una descripción de Sp).
a. Use esta variable t para obtener una fórmula de intervalo de confianza t agrupado para 1 2.
b. Se seleccionó una muestra de humificadores ultrasónicos de una marca particular para la cual las observaciones de producción máxima de humedad (oz) en una
cámara controlada fueron 14.0, 14.3, 12.2 y 15.1. Una
muestra de una segunda marca arrojó los valores de producción 12.1, 13.6, 11.9 y 11.2 (“Multiple Comparisons
of Means Using Simultaneous Confidence Intervals”,
J. of Quality Technology, 1989: 232-241). Use la fórmula de t agrupada del inciso a) para calcular la diferencia
entre producciones promedio verdaderas de las dos marcas con un intervalo de confianza de 95 por ciento.
c. Calcule la diferencia entre las dos utilizando el intervalo t para dos muestras discutido en esta sección y
compárelo con el intervalo del inciso b).
35. Remítase al ejercicio 34. Describa la prueba t agrupada para probar H0: 1 2 0 cuando ambas distribuciones de
población son normales con 1 2. Luego utilice este
procedimiento de prueba para probar las hipótesis sugeridas
en el ejercicio 33.
www.FreeLibros.me
c9_p325-368.qxd
344
3/12/08
CAPÍTULO 9
4:21 AM
Page 344
Inferencias basadas en dos muestras
9.3 Análisis de datos apareados
En las secciones 9.1 y 9.2, se consideró probar en busca de una diferencia entre dos medias
1 y 2. Se hizo utilizando los resultados de una muestra aleatoria X1, X2, . . . , Xm de la distribución con media 1 y una muestra completamente independiente (de las X) Y1, . . . , Yn
de la distribución con media 2. Es decir, o se seleccionaron m individuos de la población
1 y n individuos diferentes de la población 2 o m individuos (u objetos experimentales) recibieron un tratamiento y otro conjunto de n individuos recibieron el otro tratamiento. En
contraste, existen varias situaciones experimentales en las cuales hay sólo un conjunto de n
individuos u objetos experimentales y se realizan dos observaciones de cada individuo u objeto y el resultado es apareado natural de valores.
Ejemplo 9.8
Las trazas de metales presentes en el agua potable afectan el sabor y las concentraciones
inusualmente altas plantean un riesgo para la salud. El artículo “Trace Metals of South Indian River” (Envir. Studies, 1982: 62-66) reporta sobre un estudio en el cual se seleccionaron seis lugares en el río (seis objetos experimentales) y se determinó la concentración de
zinc (mg/l) tanto en el agua superficial como en la del fondo en cada lugar. Los seis pares
de observaciones aparecen en la tabla adjunta. ¿Sugieren los datos que la concentración promedio verdadera en el agua del fondo excede la del agua de la superficie?
Ubicación
1
2
3
4
5
6
Concentración de zinc en
el agua del fondo ( x)
0.430
0.266
0.567
0.531
0.707
0.716
Concentración de zinc en
el agua de la superficie (y)
0.415
0.238
0.390
0.410
0.605
0.609
Diferencia
0.015
0.028
0.177
0.121
0.102
0.107
La figura 9.4 a) muestra una curva de estos datos. A primera vista, parece haber poca diferencia entre las muestras x y y. De lugar en lugar, existe mucha variación en cada muestra y
parece como si cualquier diferencia entre las muestras puede ser atribuida a esta variabilidad. No obstante, cuando las observaciones están identificadas por lugar, como en la figura
9.4 b), emerge una vista diferente. En cada lugar, la concentración en el fondo excede la
concentración en la superficie. Esto se confirma por el hecho de que todas las diferencias
x y que aparecen en la fila inferior de la tabla son positivas. Un análisis correcto de estos
datos se enfoca en estas diferencias.
x
y
Ubicación x
Ubicación y
0.2
0.3
0.4
2
2
0.5
a)
1
0.6
4 3
3 41
0.7
0.8
56
56
b)
Figura 9.4 Gráfica de los datos pareados del ejemplo 9.8. a) observaciones no identificadas por
ubicación; b) observaciones identificadas por ubicación.
www.FreeLibros.me
■
c9_p325-368.qxd
3/12/08
4:21 AM
Page 345
9.3 Análisis de datos apareados
SUPOSICIONES
345
Los datos se componen de n pares independientemente seleccionados (X1, Y1),
(X2, Y2), . . . , (Xn Yn), con E(Xi) 1 y E(Yi) 2. Sean Di X1 Y1, D2 X2 Y2,
. . . , Dn Xn Yn, de modo que las Di son las diferencias dentro de los pares. En ese
caso se supone que las Di casi siempre están distribuidas con valor medio D y
varianza D2 (normalmente esto es una consecuencia de que las Xi y Yi mismas están
normalmente distribuidas).
De nuevo interesa probar las hipótesis con respecto a la diferencia 1 2. El denominador de la prueba t con dos muestras se obtuvo suponiendo muestras independientes y
aplicando la regla V(X
Y) V(X
) V(Y). Sin embargo, con datos apareados, las observaciones X y Y dentro de cada par a menudo no son independientes, de modo que X
y Y no
son independientes entre sí. Por consiguiente, se debe abandonar la prueba t con dos muestras y buscar un método de análisis alternativo.
Prueba t con datos apareados
Como los pares diferentes son independientes, las Di son independientes entre sí. Sea D
X Y, donde X y Y son la primera y segunda observaciones, respectivamente, dentro de un
par arbitrario. Entonces la diferencia esperada es
D E(X Y) E(X) E(Y) 1 2
(la regla de valores esperados utilizada aquí es válida aun cuando X y Y sean dependientes).
Por consiguiente, cualquier hipótesis con respecto a 1 2 puede ser parafraseada como una
hipótesis con respecto a la diferencia media D. Pero como las Di constituyen una muestra
aleatoria normal (de diferencias) con media D, las hipótesis con respecto a D se prueban por
medio de una prueba t con una muestra. Es decir, para probar hipótesis con respecto a 1
2 cuando los datos están apareados, se forman las diferencias D1, D2, . . . , Dn y se realiza
una prueba t con una muestra (basada en n 1 grados de libertad) de las diferencias.
Prueba t con datos apareados
Hipótesis nula:
H0: D 0 (donde D X Y es la diferencia entre la primera
y segunda observaciones dentro de un par y D
1 2)
Valor estadístico de prueba: t
d 0
sD /n
(donde d y sD son la media y desviación
estándar muestrales, respectivamente, de
las di)
Hipótesis alternativa
Región de rechazo para una prueba a nivel
Ha: D 0
t
Ha: D 0
t t,n1
Ha: D 0
o t
t,n1
t/2,n1 o t t/2,n1
Se puede calcular un valor P como se hizo en pruebas t anteriores.
Ejemplo 9.9
Los desórdenes musculoesqueléticos del cuello y hombro son comunes entre empleados de
oficina que realizan tareas repetitivas mediante pantallas de visualización. El artículo “Upper-Arm Elevation During Office Work” (Ergonomics, 1996: 1221-1230) reportó sobre un estudio para determinar si condiciones de trabajo más variadas habrían tenido algún impacto
www.FreeLibros.me
346
3/12/08
CAPÍTULO 9
4:21 AM
Page 346
Inferencias basadas en dos muestras
en el movimiento del brazo. Los datos adjuntos se obtuvieron con una muestra de n 16
sujetos. Cada observación es la cantidad de tiempo, expresada como una proporción de
tiempo total observado, durante el cual la elevación del brazo fue de menos de 30°. Las dos
mediciones de cada sujeto se obtuvieron con una separación de 18 meses. Durante este periodo, las condiciones de trabajo cambiaron y se permitió que los sujetos realizaran una variedad
más amplia de tareas. ¿Sugieren estos datos que el tiempo promedio verdadero durante el cual
la elevación es de menos de 30° luego del cambio difiere de lo que era antes del mismo?
Sujeto
Antes
Después
Diferencia
1
81
78
3
2
87
91
4
3
86
78
8
4
82
78
4
5
90
84
6
6
86
67
19
7
96
92
4
8
73
70
3
Sujeto
Antes
Después
Diferencia
9
74
58
16
10
75
62
13
11
72
70
2
12
80
58
22
13
66
66
0
14
72
60
12
15
56
65
9
16
82
73
9
La figura 9.5 muestra una curva de probabilidad normal de las 16 diferencias; el patrón seguido por la curva es bastante recto, lo que afirma la suposición de normalidad. En la figura 9.6 aparece una gráfica de caja de estas diferencias; la gráfica de caja se encuentra
considerablemente a la derecha de cero, lo que sugiere que quizá D 0 (observe también
que 13 de las 16 diferencias son positivas y sólo dos son negativas).
Curva de probabilidad normal
0.999
0.99
0.95
Probabilidad
c9_p325-368.qxd
0.80
0.50
0.20
0.05
0.01
0.001
–10
0
10
20
Dif
Prueba W de normalidad
R:
0.9916
valor p (aprox.): > 0.1000
Promedio 6.75
Desv. Estd 8.23408
Núm. de datos 16
Figura 9.5
Curva de probabilidad normal generada por MINITAB de las diferencias en el ejemplo 9.9.
Diferencia
–10
Figura 9.6
0
10
20
Gráfica de caja de la diferencia en el ejemplo 9.9.
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:21 AM
Page 347
9.3 Análisis de datos apareados
347
Utilice ahora la secuencia de pasos recomendada para probar las hipótesis apropiadas.
1. Sea D la diferencia promedio verdadera entre el tiempo de elevación antes del cambio
de las condiciones de trabajo y el tiempo después del cambio.
2. H0: D 0 (no existe diferencia entre el tiempo promedio verdadero antes del cambio y el
tiempo promedio verdadero después del cambio)
3. Ha: D 0
4. t
d 0
d
sD /n
sD /n
5. n 16, di 108, d 2i 1746, de donde d 6.75, sD 8.234, y
t
6.75
3.28 3.3
8.234/16
6. La tabla A.8 del apéndice muestra que el área a la derecha de 3.3 bajo la curva t con
15 grados de libertad es 0.002. La desigualdad de Ha implica que la prueba de dos
colas es apropiada, de modo que el valor P es aproximadamente 2(0.002) 0.004
(MINITAB da 0.0051).
7. Como 0.004 0.01, la hipótesis nula puede ser rechazada a un nivel de significación de
0.05 o 0.01. Parece que la diferencia promedio verdadera entre los tiempos es algún
valor distinto de cero; es decir, el tiempo promedio verdadero después del cambio es
diferente del de antes del cambio.
■
Cuando el número de pares es grande, la suposición de distribución de diferencia normal no es necesaria. El límite del teorema central valida la prueba z resultante.
Un intervalo de confianza para D
En la misma forma en que el intervalo t para una media de población única está basada en
la variable t, T (X
)/(S/n
), un intervalo de confianza t para D( 1 2) está basado en el hecho de que
T
D D
SD /n
tiene una distribución t con n 1 grados de libertad. La manipulación de la variable t, como en derivaciones previas de intervalos de confianza, produce el siguiente intervalo de
confianza de 100(1 )%:
El intervalo de confianza t apareado para D es
! t/2,n1 sD /n
d
Al retener el signo pertinente y al reemplazar t/2 con t se obtiene un límite de confianza unilateral.
Cuando n es pequeño, la validez de este intervalo requiere que la distribución de diferencias
sea por lo menos aproximadamente normal. Con n grande, el límite del teorema central
garantiza que el intervalo z resultante es válido sin ninguna restricción en la distribución de
diferencias.
www.FreeLibros.me
348
3/12/08
CAPÍTULO 9
4:21 AM
Page 348
Inferencias basadas en dos muestras
Ejemplo 9.10
La adición de imágenes médicas computarizadas a una base de datos promete proporcionar
grandes recursos para médicos. Sin embargo, existen otros métodos de obtener tal información, de modo que el tema de eficiencia de acceso tiene que ser investigado. El artículo “The
Comparative Effectiveness of Conventional and Digital Image Libraries” (J. of Audiovisual
Media in Medicine, 2001: 8-15) reportó sobre un experimento en el cual a 11 profesionistas médicos expertos en la computadora se les tomó el tiempo tanto mientras recuperaban
una imagen de una biblioteca de diapositivas y mientras recuperaban la misma imagen
de una base de datos de una computadora con conexión a la Web.
Sujeto:
1
Diapositiva: 30
Digital:
25
Diferencia:
5
2
35
16
19
3
40
15
25
4
25
15
10
5
20
10
10
6
30
20
10
7
35
7
28
8
62
16
46
9
40
15
25
10
51
13
38
11
25
11
14
12
42
19
23
13
33
19
14
Sea D la diferencia media verdadera entre el tiempo de recuperación de diapositivas (s)
y el tiempo de recuperación digital. El uso de un intervalo de confianza t apareado para estimar D requiere que la distribución de diferencia sea por lo menos aproximadamente normal. La configuración lineal de los puntos en la curva de probabilidad normal generada por
MINITAB (figura 9.7) valida la suposición de normalidad. (Aparecen sólo 9 puntos debido
a empates en las diferencias.)
0.999
0.99
0.95
Probabilidad
c9_p325-368.qxd
0.80
0.50
0.20
0.05
0.01
0.001
5
15
25
35
45
Dif
Promedio: 20.5385
Desv. Estd.: 11.9625
N: 13
Figura 9.7
Prueba W de normalidad
R:
0.9724
Valor P (aprox.): > 0.1000
Curva de probabilidad normal de las diferencias en el ejemplo 9.10.
Las cantidades pertinentes son di 267, d i2 7201, de donde d 20.5, sD 11.96.
El valor t crítico requerido para un intervalo de confianza de 95% es t0.025,12 2.179 y el
intervalo de confianza de 95% es
sD
11.96
d ! t/2,n1 n 20.5 ! (2.179)
20.5 ! 7.2 (13.3, 27.7)
13
Se puede tener una plena confianza (al nivel de confianza de 95%) de que 13.3 D 27.7.
Este intervalo es bastante ancho, una consecuencia derivada del hecho de que la desviación
estándar muestral es relativamente grande en relación con la media muestral. Se requeriría
un tamaño de muestra mucho más grande que 13 para calcular con mayor precisión. Observe, sin embargo, que 0 queda muy afuera del intervalo, lo que sugiere que D 0; esto se
confirma con una prueba formal de hipótesis.
■
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:21 AM
Page 349
9.3 Análisis de datos apareados
349
Datos apareados y procedimientos t con dos muestras
Considérese el uso de la prueba t de datos apareados con dos muestras. Los numeradores de
los dos estadísticos de prueba son idénticos, puesto que d di/n [(xi yi)]/n
(xi)/n (yi)/n x y. La diferencia entre los estadísticos se debe por completo a los
denominadores. Cada estadístico de prueba se obtiene estandarizando X
Y ( D
). Pero
en la presencia de dependencia la estandarización t con dos muestras es incorrecta. Para ver
esto, recuérdese de la sección 5.5 que
V(X ! Y) V(X) V(Y) ! 2 Cov(X, Y)
La correlación entre X y Y es
(X
) V
(Y
)]
Corr(X, Y) Cov(X, Y)/[V
Se desprende que
V(X Y) 21 22 212
Aplicando ésta a X
Y se obtiene
V(X
Y
) V(D
) V
V(Di)
21 22 212
1
Di
n
n
n
La prueba t con dos muestras está basada en la suposición de independencia, en cuyo
caso # 0. Pero en muchos experimentos apareados, habrá una fuerte dependencia positiva entre X y Y (X grande asociada con Y grande), de modo que # será positiva y la varianza
de X
Y será más pequeña que 21/n 22/n. Por lo tanto siempre que haya dependencia
positiva dentro de los pares, el denominador del estadístico t apareado deberá ser más pequeño para t de la prueba con muestras independientes. Con frecuencia la t con dos muestras se aproximará mucho más a cero que la t apareada, subestimando considerablemente la
significación de los datos.
Asimismo, cuando los datos están apareados, el intervalo de confianza t apareado normalmente será más angosto que el intervalo de confianza t para dos muestras (incorrecto). Esto es
porque en general existe mucho menos variabilidad en las diferencias que en los valores x y y.
Experimentos apareados contra no apareados
En los ejemplos, se obtuvieron datos apareados con dos observaciones del mismo sujeto
(ejemplo 9.9) u objeto experimental (localización en el ejemplo 9.8). Aun cuando esto no
puede hacerse, se pueden obtener datos apareados con dependencia dentro de pares emparejando individuos u objetos en relación con una o más características que se piensa influyen en las respuestas. Por ejemplo, en un experimento médico para comparar la eficacia de
dos medicamentos para bajar la presión sanguínea, el presupuesto del experimentador permitiría el tratamiento de 20 pacientes. Si se seleccionan 10 al azar para tratamiento con el
primer medicamento y se seleccionan otros 10 independientemente para tratamiento con
el segundo medicamento, el resultado es un experimento con muestras independientes.
No obstante, el experimentador, sabiendo que la edad y el peso influyen en la presión
sanguínea, podría decidir crear pares de pacientes de modo que dentro de cada uno de los
pares resultantes, la edad y el peso fueran aproximadamente iguales (aunque pudiera haber
diferencias apreciables entre los pares). Entonces cada medicamento sería administrado a un
paciente diferente dentro de cada par para un total de 10 observaciones de cada medicamento.
Sin este emparejamiento (o “bloqueo”), podría parecer que un medicamento sobrepasa el
desempeño de otro simplemente porque los pacientes en una muestra pesaban menos y eran
más jóvenes y por tanto más susceptibles a reducir su presión sanguínea que los pacientes más
www.FreeLibros.me
c9_p325-368.qxd
350
3/12/08
CAPÍTULO 9
4:21 AM
Page 350
Inferencias basadas en dos muestras
pesados y de más edad presentes en la segunda muestra. Sin embargo, hay un precio que pagar
por el emparejamiento, un número de grados de libertad más pequeño para el análisis apareado, así que hay que preguntarse cuándo se debe preferir un experimento sobre el otro.
No existe una respuesta directa y precisa a esta pregunta, pero sí algunas recomendaciones útiles. Si se tiene una opción entre dos pruebas t que son válidas (y realizadas al mismo nivel de significación ), se deberá preferir la prueba que tenga el número más grande
de grados de libertad. La razón de esto es que un número más grande de grados de libertad
significa una más pequeña con cualquier valor alternativo fijo del parámetro o parámetros.
Esto es, con un error de probabilidad de error de tipo I, la probabilidad de un error de tipo
II se reduce al incrementarse los grados de libertad.
Sin embargo, si las unidades experimentales son bastante heterogéneas en su respuesta, será difícil detectar diferencias pequeñas pero significativas entre dos tratamientos. Esto
en esencia es lo que aconteció en el conjunto de datos en el ejemplo 9.8; con ambos “tratamientos” (agua del fondo y agua superficial), existe una gran variabilidad entre lugares, lo
que tiende a enmascarar diferencias en tratamientos dentro de los lugares. Si existe una alta
correlación positiva dentro de unidades experimentales o sujetos, la varianza de D
X
Y
será mucho más pequeña que la varianza no apareada. Debido a que esto reduce la varianza, será más fácil detectar una diferencia con muestras apareadas que con muestras independientes. Los pros y los contras de aparear ahora se resumen como sigue.
1. Si existe una gran heterogeneidad entre unidades experimentales y una gran correlación dentro de unidades experimentales (# grande positiva), entonces la pérdida
de grados de libertad será compensada por la precisión incrementada asociada con
el apareamiento, así que se prefiere un experimento apareado a un experimento
con muestras independientes.
2. Si las unidades experimentales son relativamente homogéneas y la correlación
dentro de los pares no es grande, la ganancia en precisión a causa del apareamiento será superada por la disminución de grados de libertad, así que se deberá utilizar un experimento con muestras independientes.
Desde luego, normalmente los valores de 21, 22, y # no serán conocidos con precisión, así que se requerirá que un investigador haga una apreciación educada sobre si se
obtiene la situación 1 o la 2. En general, si el número de observaciones obtenidas es grande, entonces una pérdida de grados de libertad (p. ej., de 40 a 20) no será seria; pero si el
número es pequeño, entonces la pérdida (por ejemplo, de 16 a 8) debido al apareamiento
puede ser seria si no es compensada por la precisión incrementada. Consideraciones similares son válidas cuando se elige entre dos tipos de experimentos para estimar 1 2 con
un intervalo de confianza.
EJERCICIOS
Sección 9.3 (36-46)
36. Considere los datos adjuntos sobre carga de ruptura (kg/25
mm de ancho) de varias telas tanto desgastadas como no desgastadas (“The Effect of Wet Abrasive Wear on the Tensile
Properties of Cotton and Polyester-Cotton Fabrics”, J. Testing
and Evaluation, 1993: 84-93). Use la prueba t apareada, como
lo hicieron los autores del citado artículo, para probar H0:
D 0 contra Ha: D 0 a un nivel de significación de 0.01.
Tela
1
NG 36.4
G
28.5
2
3
4
5
6
7
8
55.0
20.0
51.5
46.0
38.7
34.5
43.2
36.5
48.8
52.5
25.6
26.5
49.8
46.5
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:21 AM
Page 351
9.3 Análisis de datos apareados
37. Se ha identificado cromo hexavalente como carcinógeno inhalado y como una toxina presente en el aire de interés en
varios lugares diferentes. El artículo “Airborne Hexavalent
Chromium in Southwestern Ontario” (J. of Air and Waste
Mgmnt. Assoc., 1997: 905-910) reportó los datos adjuntos
tanto de concentración bajo techo como al aire libre (nanogramos/m3) para una muestra de casas seleccionadas al azar
en cierta región.
Casa
1
2 3
4
5
6
7
8
9
Bajo techo 0.07 0.08 0.09 0.12 0.12 0.12 0.13 0.14 0.15
Intemperie 0.29 0.68 0.47 0.54 0.97 0.35 0.49 0.84 0.86
Casa
Bajo techo
Intemperie
10 11 12 13 14 15 16 17
0.15 0.17 0.17 0.18 0.18 0.18 0.18 0.19
0.28 0.32 0.32 1.55 0.66 0.29 0.21 1.02
a. Construya una gráfica de caja comparativa de esfuerzos
pico para los dos tipos de concreto y comente sobre
cualquier característica interesante.
b. Estime la diferencia entre esfuerzos pico promedio verdaderos de los dos tipos de concreto en una forma que
transmita información sobre precisión y confiabilidad.
Asegúrese de verificar la factibilidad de cualquier suposición requerida en su análisis. ¿Parece factible que los
esfuerzos pico promedio verdaderos para los dos tipos de
concreto sean idénticos? ¿Por que sí o por qué no?
39. Científicos e ingenieros con frecuencia desean comparar
dos técnicas diferentes de medir o determinar el valor de
una variable. En tales situaciones, el interés se concentra en
probar si la diferencia media en las mediciones es cero. El
artículo “Evaluation of the Deuterium Dilution Technique
Against the Test Weighing Procedure for the Determination
of Breast Milk Intake” (Amer. J. Clinical Nutr., 1983: 9961003) reporta los datos adjuntos sobre la cantidad de leche
ingerida por cada uno de 14 infantes seleccionados al azar
Casa
Infante
Bajo techo
Intemperie
18 19 20 21 22 23 24 25
0.20 0.22 0.22 0.23 0.23 0.25 0.26 0.28
1.59 0.90 0.52 0.12 0.54 0.88 0.49 1.24
Bajo techo
Intemperie
26 27 28 29 30 31 32 33
0.28 0.29 0.34 0.39 0.40 0.45 0.54 0.62
0.48 0.27 0.37 1.26 0.70 0.76 0.99 0.36
Casa
a. Calcule un intervalo de confianza para la diferencia de
media de población entre concentraciones bajo techo y a
la intemperie utilizando un nivel de confianza de 95% e
interprete el intervalo resultante.
b. Si la 34a fuera seleccionada al azar de la población, ¿entre qué valores pronosticaría que quede la diferencia de
concentraciones?
38. Se sacaron especímenes de concreto con proporciones variables de altura a diámetro de varias posiciones en el cilindro original tanto de una mezcla de concreto de resistencia
normal como de una mezcla de alta resistencia. Se determinó el esfuerzo pico (MPa) de cada mezcla y se obtuvieron los siguientes datos (“Effect of Length on Compressive
Strain Softening of Concrete”, J. of Engr. Mechanics,
1997: 25-35):
Condición de prueba
Normal
Alta
1
42.8
90.9
2
55.6
93.1
3
49.0
86.3
4
48.7
90.3
5
44.1
88.5
Condición de prueba
Normal
Alta
6
55.4
88.1
Normal
Alta
11
46.8
88.2
7
50.1
93.2
8
45.7
90.8
9
51.4
90.1
10
43.1
92.6
Condición de prueba
12
46.7
88.6
13
47.7
91.0
351
14
45.8
90.0
15
45.4
90.1
Método isotópico
Método de ponderación
Diferencia
1
2
1509
1498
11
1418
1254
164
3
4
1561 1556
1336 1565
225
9
Infante
Método isotópico
Método de ponderación
Diferencia
5
6
2169
2000
169
1760
1318
442
7
8
1098 1198
1410 1129
312
69
Infante
Método isotópico
Método de ponderación
Diferencia
9
10
11
1479
1342
137
1281
1124
157
1414
1468
54
Infante
Método isotópico
Método de ponderación
Diferencia
12
13
14
1954
1604
350
2174
1722
452
2058
1518
540
a. ¿Es factible que la distribución de la población de las diferencias sea normal?
b. ¿Parece que la diferencia promedio verdadera entre valores de ingesta medidos con los dos métodos es algún
valor diferente de cero? Determine el valor P de la
prueba y utilícelo para llegar a una conclusión a nivel
de significación de 0.05.
40. La lactancia estimula una pérdida temporal de masa ósea
para proporcionar cantidades de calcio adecuadas para la
producción de leche. El artículo “Bone Mass Is Recovered
from Lactation to Postweaning in Adolescent Mothers with
Low Calcium Intakes” (Amer. J. Clinical Nutr., 2004; 13221326) dio los siguientes datos sobre contenido total de minerales en los huesos del cuerpo (TBBMC, por sus siglas en
inglés) (g) para una muestra tanto durante la lactancia (L)
como en el periodo de posdestete (P).
www.FreeLibros.me
c9_p325-368.qxd
352
3/12/08
CAPÍTULO 9
4:21 AM
Page 352
Inferencias basadas en dos muestras
Sujeto
1
2
3
4
5
6
7
8
9
10
L 1928 2549 2825 1924 1628 2175 2114 2621 1843 2541
P 2126 2885 2895 1942 1750 2184 2164 2626 2006 2627
a. ¿Sugieren los datos que el contenido total de minerales en
los huesos del cuerpo durante el posdestete excede el de la
etapa de lactancia por más de 25 g? Formule y pruebe las
hipótesis apropiadas utilizando un nivel de significación de
0.05 [Nota: La curva de probabilidad normal apropiada
muestra algo de curvatura pero no suficiente para sembrar
dudas sustanciales sobre una suposición de normalidad.]
b. Calcule un límite de confianza superior utilizando un nivel
de confianza de 95% para la diferencia promedio verdadera
entre TBBMC durante el posdestete y durante la lactancia.
c. ¿Conduce el uso (incorrecto) de la prueba t con dos
muestras para probar las hipótesis sugeridas en a) a la
misma conclusión a la que se llegó allí? Explique.
41. En un experimento diseñado para estudiar los efectos de nivel de iluminación en el desempeño de una tarea (“Performance of Complex Tasks Under Different Levels of
Illumination”, J. Illuminating Eng., 1976: 235-242), se requirió que sujetos insertaran una cánula de punta fina en los
ojillos de diez agujas en rápida sucesión con un bajo nivel
de iluminación con un fondo negro y un nivel de iluminación más alto con un fondo blanco. Cada valor de dato es el
tiempo (s) requerido para completar la tarea.
Sujeto
Negro
Blanco
1
2
3
4
5
25.85
18.23
28.84
20.84
32.05
22.96
25.74
19.68
20.89
19.50
6
7
8
9
41.05
24.98
25.01
16.61
24.96
16.07
27.47
24.59
Sujeto
Negro
Blanco
¿Indican los datos que el nivel de iluminación más alto reduce por más de 5 s el tiempo de terminación de la tarea
promedio verdadero? Pruebe las hipótesis apropiadas utilizando el método del valor P.
42. Se ha estimado que entre 1945 y 1971, nacieron 2 millones de
niños de madres tratadas con dietilestibrestrol (DES, por sus
siglas en inglés) un estrógeno no esteroidal recomendado para el mantenimiento del embarazo. La FDA (Federal Drug
Administration) vetó este medicamento en 1971 porque investigaciones indicaron que había una conexión con la incidencia
de cáncer cervical. El artículo “Effects of Prenatal Exposure
to Diethylstilbestrol (DES) on Hemispheric Laterality and
Spatial Ability in Human Males” (Hormones and Behavior,
1992: 62-75) discutió un estudio en el cual 10 varones expuestos a DES y sus hermanos no expuestos fueron sometidos a
varias pruebas. Estos son los datos sobre los resultados de una
prueba de habilidad espacial: x 12.6 (expuestos), y 13.7,
y error estándar de la diferencia media 0.5. Pruebe a un nivel de 0.05 para ver si la exposición tiene que ver con la habilidad espacial reducida mediante la obtención del valor P.
43. La enfermedad de Cushing se caracteriza por debilidad
muscular debido a una disfunción de la suprarrenal y pitui-
taria. Para administrar un tratamiento eficaz, es importante
detectar la enfermedad de Cauchy en la niñez tan pronto como sea posible. La edad al inicio de los síntomas y la edad
en el momento del diagnóstico en 15 niños que padecen
la enfermedad aparecieron en el artículo “Treatment of Cushings Disease in Childhood and Adolescence by Transphenoidal Microadenomectomy” (New Engl. J. of Med., 1984:
889). A continuación se dan los valores de las diferencias de
edades al principio de los síntomas y la edad en el momento del diagnóstico:
24
12
55
15
30
60
14
21
48
12
25
53
61
69
80
a. ¿Siembra una fuerte duda la curva de probabilidad normal adjunta sobre la normalidad aproximada de la distribución de diferencias de la población?
Diferencia
–10
–20
–30
–40
–50
–60
–70
–80
–1.5
–0.5
0.5
1.5
Percentil z
b. Calcule un límite de confianza de 95% inferior para la
diferencia media de la población e interprete el límite
resultante.
c. Suponga que ya se habían calculado las diferencias (edad
al momento del diagnóstico) (edad al inicio de los síntomas). ¿Cuál sería un límite de confianza superior de 95%
para la diferencia media de la población correspondiente?
44. El ejemplo 7.11 aportó datos sobre el módulo de elasticidad
obtenido un minuto después de cargar con una configuración de especímenes de madera. El artículo citado también
aportó los valores del módulo de elasticidad obtenidos cuatro semanas después de cargar los mismos especímenes de
madera. A continuación se presentan los datos.
Observación
1 min
4 semanas
Diferencia
1
10 490
9 110
1380
2
16 620
13 250
3370
3
17 300
14 720
2580
4
15 480
12 740
2740
5
12 970
10 120
2850
6
17 260
14 570
2690
7
13 400
11 220
2180
8
13 900
11 100
2800
9
13 630
11 420
2210
10
13 260
10 910
2350
11
14 370
12 110
2260
12
11 700
8 620
3080
13
15 470
12 590
2880
14
17 840
15 090
2750
15
14 070
10 550
3520
16
14 760
12 230
2530
Calcule e interprete un límite de confianza superior para la
diferencia promedio verdadera entre el módulo después de
1 minuto y el módulo después de 4 semanas; primero compruebe la factibilidad de cualquier suposición necesaria.
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:21 AM
Page 353
9.4 Inferencias sobre una diferencia entre proporciones de población
a. Estime la diferencia en la resistencia promedio verdadera en las dos condiciones secas en una forma que dé información sobre confiabilidad y precisión e interprete la
estimación. ¿Qué sugiere la estimación sobre cómo se
compara la resistencia promedio verdadera en condiciones húmedas y en condiciones secas en el laboratorio?
b. Verifique la plausibilidad de cualquier suposición que
fundamente su análisis de (a).
45. El artículo “Slender High-Strength RC Columns Under Eccentric Compression” (Magazine of Concrete Res., 2005: 361370) dio los datos adjuntos sobre resistencia de cilindros
(MPa) de varios tipos de columnas curadas tanto en condiciones húmedas como en condiciones secas en el laboratorio.
Tipo
H:
LS:
H:
LS:
1
2
3
4
5
6
82.6
86.9
87.1
87.3
89.5
92.0
88.8
89.3
94.3
91.4
80.0
85.9
7
8
9
10
11
12
86.7
89.4
92.5
91.8
97.8
94.3
90.4
92.0
94.6
93.1
91.6
91.3
353
46. Construya un conjunto de datos apareados para el cual t ,
de modo que los datos sean altamente significativos cuando
se utilice el análisis correcto, aunque t para la prueba t con
dos muestras esté bastante cerca de cero, de tal suerte que el
análisis incorrecto dé un resultado insignificante.
9.4 Inferencias sobre una diferencia entre proporciones
de población
Después de presentar métodos para comparar las medias de dos poblaciones diferentes, ahora se presta atención a la comparación de dos proporciones de población. Un individuo u objeto se considera como éxito E si él/ella/ello posee alguna característica de interés (alguien
que se graduó de una universidad, un refrigerador con hacedor de cubos de hielo, etc.) Sea
p1 la proporción de éxitos (E) en la población #1
p2 la proporción de éxitos (E) en la población #2
Alternativamente, p1(p2) pueden ser consideradas como la probabilidad de que un individuo
u objeto seleccionado al azar de la primera (segunda) población sea un éxito.
Supóngase que se selecciona un tamaño de muestra m de la primera población e independientemente, se selecciona una muestra de tamaño n de la segunda. Sea X el número de
éxitos (E) en la primera muestra y Y el número de éxitos (E) en la segunda. La independencia de las dos muestras implica que X y Y son independientes. Siempre que las dos muestras sean mucho más pequeñas que los tamaños de población correspondientes, se puede
considerar que las distribuciones de X y Y son binomiales.
El estimador obvio de p1 p2, la diferencia en las proporciones de la población, es la
diferencia correspondiente en las proporciones muestrales X/m Y/n. Con p̂1 X/m y
p̂2 Y/n, el estimador de p1 p2 se expresa como p̂1 p̂2.
PROPOSICIÓN
Sean X
Bin(m, p1) y Y
Bin(n, p2) con X y Y variables independientes. Entonces
E( p̂1 p̂2) p1 p2
de modo que p̂1 p̂2 sea un estimador insesgado de p1 p2 y
p1q1
p2q2
V( p̂1 p̂2)
(donde qi 1 pi)
m
n
(9.3)
Comprobación Como E(X) mp1 y E(Y) np2,
X
Y
1
1
1
1
E
E(X) E(Y) mp1 np2 p1 p2
m
n
m
n
m
n
Como V(X) mp1q1, V(Y) np2q2 y X y Y son independientes,
V
X
Y
X
Y
1
1
m n V m V n m V(X) n V(Y)
2
www.FreeLibros.me
2
p1q1
p2q2
m
n
■
c9_p325-368.qxd
354
3/12/08
CAPÍTULO 9
4:21 AM
Page 354
Inferencias basadas en dos muestras
Primero se abordarán situaciones en las que tanto m como n son grandes. Entonces
como las distribuciones de p̂1 y p̂2 son aproximadamente normales, la distribución del estimador p̂1 p̂2 también es normal en forma aproximada. Al estandarizar p̂1 p̂2 se obtiene
una variable Z cuya distribución es aproximadamente normal estándar.
Z
p̂1 p̂2 ( p1 p2)
p1q1
p2q2
m
n
Procedimiento de prueba con muestra grande
Análogamente a la hipótesis para 1 2, la hipótesis nula más general que un investigador podría considerar sería de la forma H0: p1 p2 0, donde 0 es de nuevo un número
especificado. Aunque para medias de población el caso 0 0 no presentó dificultades, para
proporciones de población los casos 0 0 y 0 0 deben ser considerados por separado.
Como la mayoría de los problemas reales de esta clase implican 0 0 (es decir, la hipótesis nula p1 p2), se abordará este caso. Cuando H0: p1 p2 0 es verdadera, sea p el valor
común de p1 y p2 (y del mismo modo para q). Entonces la variable estandarizada
Z
p̂1 p̂2 0
1
1
pq
m
n
(9.4)
tiene aproximadamente una distribución estándar normal cuando H0 es verdadera. Sin embargo, esta Z no sirve como estadístico de prueba porque el valor de p es desconocido, H0
afirma sólo que existe un valor común de p, pero no dice cuál es ese valor. Al reemplazar p
y q en (9.4) por estimadores apropiados se obtiene un estadístico de prueba.
Suponiendo que p1 p2 p, en lugar de muestras de tamaño m y n de dos poblaciones diferentes (dos distribuciones binomiales distintas), en realidad se tiene una sola muestra de tamaño m n de una población con proporción p. El número total de individuos en
esta muestra combinada que tiene la característica de interés es X Y. El estimador de p es
entonces
p̂
m
n
XY
p̂1
p̂
mn
mn 2
mn
(9.5)
La segunda expresión para p̂ muestra que en realidad es un promedio ponderado de los estimadores p̂1 y p̂2 obtenidos con las dos muestras. Si se utiliza p̂ y q̂ 1 p̂ en lugar de p y
q en (9.4) se obtiene un estadístico de prueba cuya distribución es aproximadamente normal
estándar cuando H0 es verdadera.
Hipótesis nula:
H0: p1 p2 0
Valor estadístico de prueba (muestras grandes): z
p̂1 p̂2
1
1
p̂q̂
m
n
Hipótesis alternativa
Región de rechazo para una prueba a nivel aproximado
Ha: p1 p2 0
z
Ha: p1 p2 0
z z
Ha: p1 p2 0
o z
z
z/2 o z z/2
Se calcula un valor P del mismo modo que para pruebas z previas.
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:21 AM
Page 355
9.4 Inferencias sobre una diferencia entre proporciones de población
Ejemplo 9.11
355
Algunos acusados en procesos criminales se declaran culpables y son sentenciados sin un
juicio en tanto que otros que se declaran inocentes de manera subsecuente son encontrados
culpables y entonces son sentenciados. En años recientes, los eruditos en leyes han especulado en cuanto si las sentencias de aquellos que se declaran culpables difieren en severidad
de las sentencias de aquellos que se declaran inocentes y subsecuentemente son juzgados
culpables. Considere los datos adjuntos sobre acusados de robo en el condado de San Francisco, todos con antecedentes penales previos (“Does It Pay to Plead Guilty? Differential
Sentencing and the Functioning of Criminal Courts”, Law and Society Rev., 1981-1982: 4569). ¿Sugieren estos datos que la proporción de todos los acusados en estas circunstancias
que se declaran culpables y son enviados a prisión difiere de la proporción que son enviados a prisión después de declararse inocentes y que son encontrados culpables?
Declaración
Número de encontrados culpables
Número de sentenciados a prisión
Proporción muestral
Culpable
No culpable
m 191
x 101
p̂1 0.529
n 64
y 56
p̂2 0.875
Sean p1 y p2 las dos proporciones de población. Las hipótesis de interés son H0: p1
p2 0 contra Ha: p1 p2 0. Al nivel 0.01, H0 debe ser rechazada si z z0.005 2.58 o si
z 2.58. La estimación combinada de la proporción de éxitos común es p̂ (101
56)/(191 64) 0.616. El valor del estadístico de prueba es
z
0.529 0.875
1
1
(0.616) (0.384)
191
64
0.346
4.94
0.070
Como 4.94 2.58, H0 debe ser rechazada.
El valor P para una prueba z de dos colas es
Valor P 2[1 (z)] 2[1 (4.94)] 2[1 (3.49)] 0.0004
Una tabla normal estándar más extensa da valor P 0.0000006. Este valor P es tan minúsculo que a cualquier nivel razonable , H0 deberá ser rechazada. Los datos sugieren
fuertemente que p1 p2 y, en particular, que declararse culpable al inicio puede ser una
buena estrategia por lo que se refiere a evitar el encarcelamiento.
El artículo citado también reporta datos sobre acusados en varios otros condados. Los
autores dividieron los datos por tipo de crimen (robo con allanamiento de morada o robo) y
por naturaleza de antecedentes previos (ninguno, alguno pero sin prisión y prisión). En todos
los casos, la conclusión fue la misma. Entre los acusados encontrados culpables, aquellos que
se declararon así tuvieron menos probabilidades de ser sentenciados a prisión
■
Probabilidades de error de tipo II y tamaños de muestra
En este caso la determinación de es un poco más tediosa de lo que fue para otras pruebas
con muestra grande. La razón es que el denominador de Z es una estimación de la desviación
estándar de p̂ p̂2, suponiendo que p1 p2 p. Cuando H0 es falsa, p̂1 p̂2 debe ser reestandarizada por medio de
p̂ p̂
1
2
m
n
p1q1
www.FreeLibros.me
p2q2
(9.6)
c9_p325-368.qxd
356
3/12/08
CAPÍTULO 9
4:21 AM
Page 356
Inferencias basadas en dos muestras
La forma de implica que no es una función de sólo p1 p2, de modo que se la denota
como (p1, p2).
( p1, p2)
Hipótesis alternativa
1
1
z p
q
m n (p1 p2)
1
1
z/2 p
q
m n (p1 p2)
1
1
z p
q
(p1 p2)
m
n
Ha: p1 p2 0
Ha: p1 p2 0
1
Ha: p1 p2 0
1
1
z/2 p
q
m n (p1 p2)
donde p (mp1 np2)/(m n), q (mq1 nq2)/(m n), y (9.6) da .
Comprobación Para la prueba de cola superior (Ha: p1 p2 0),
(p1, p2) P p̂1 p̂2 z
p̂q̂
m
n
1
P (p̂1 p̂2 (p1 p2))
1
z
(p p )
p̂q̂
m
n
1
1
1
2
Cuando m y n son grandes
p̂ (mp̂1 np̂2)/(m n) (mp1 np2)/(m n) p
y q̂ q, la cual da la expresión previa (aproximada) para (p1, p2).
■
Alternativamente, para p1 especificada, p2 con p1 p2 d, se pueden determinar los
tamaños de muestra necesarios para obtener (p1, p2) . Por ejemplo, para la prueba de
cola superior, se iguala z al argumento de () (es decir, lo que está entre paréntesis) en
el recuadro siguiente. Si m n, existe una expresión simple para el valor común.
En el caso m n, la prueba a nivel tiene una probabilidad de error de tipo II con
valores alternativos de p1, p2 con p1 p2 d cuando
z (p
1
p2(q
)1
q2/2
) zp1
q1
p2
q2
n
2
d
2
(9.7)
Para una prueba de cola superior o inferior, con /2 reemplazando a para una prueba de dos colas.
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:21 AM
Page 357
9.4 Inferencias sobre una diferencia entre proporciones de población
Ejemplo 9.12
357
Una de las aplicaciones verdaderamente impresionantes de la estadística ocurrió en conexión con el diseño de experimento y análisis de la vacuna Salk contra la polio en 1954. Una
parte del experimento se enfocó en la eficacia de la vacuna en el combate de la polio paralítica. Debido a que se pensó que sin un grupo de control de niños, no habría una base sólida para evaluar la vacuna, se decidió administrar la vacuna a un grupo y una inyección
placebo (visualmente indistinguible de la vacuna pero que no tiene ningún efecto) a un grupo de control. Por razones éticas y también porque se pensaba que el conocimiento de la administración de la vacuna podría afectar el tratamiento y diagnóstico, el experimento se
llevó a cabo de una manera doblemente a ciegas. Es decir, ninguno de los individuos que
recibieron inyecciones ni los que la administraron en realidad sabían quién estaba recibiendo la vacuna y quién estaba recibiendo el placebo (las muestras fueron numéricamente codificadas); recuerde que en ese momento no estaba del todo claro si la vacuna era
benéfica.
Sean p1 y p2 las probabilidades de que un niño contraiga polio paralítica en las condiciones de control y tratamiento, respectivamente. El objetivo era probar H0: p1 p2 0 contra Ha: p1 p2 0 (la alternativa afirma que es menos probable que un niño vacunado
contraiga polio que un niño no vacunado). Suponiendo que el valor verdadero de p1 es 0.0003
(un coeficiente de incidencia de 30 por cada 100 000), la vacuna sería una mejora significativa si el coeficiente de incidencia se reducía a la mitad, es decir, p2 0.00015. Con una prueba a un nivel 0.05, sería entonces razonable requerir tamaños de muestra con los cuales
0.1 cuando p1 0.0003 y p2 0.00015. Si se suponen tamaños de muestra iguales, el
tamaño n se obtiene con (9.7) como
n
2
[1.645(0
(0.
.5
)(
0.
00
04
5)
(1
.9
99
55
) 1.28(0
.0
00
15
)(
0.
99
98
5)
00
03
)(
0.
99
97
)]
(0.0003 0.00015)2
[(0.0349 0.0271)/0.00015]2 171 000
Los datos reales para este experimento son los siguientes. Se utilizaron tamaños de
muestra de aproximadamente 200 000. El lector puede verificar con facilidad que z 6.43,
un valor muy significativo. ¡La vacuna fue un rotundo éxito!
Placebo:
Vacuna:
m 201 229, x número de casos de polio paralítica 110
n 200 745, y 33
■
Intervalo de confianza con muestra grande para p1 – p2
Como con las medias, muchos problemas de dos muestras implican el objetivo de comparación
mediante pruebas de hipótesis, pero en ocasiones una estimación de intervalo para p1 p2 es
apropiada. Tanto p̂1 X/m y p̂2 Y/n tienen distribuciones aproximadamente normales cuando tanto m como n son grandes. Si se identifica con p1 p2, entonces ˆ p̂1 p̂2 satisface
las condiciones necesarias a fin de obtener un intervalo de confianza para muestra grande. En
particular, la desviación estándar estimada de ˆ es (p̂
1q̂1m
/
)
p̂
( q̂
. El intervalo ˆ !
2 /n
2 )
z/2 ˆ ˆ de 100(1 )% se vuelve entonces
p̂1 p̂2 ! z/2
m
n
p̂1q̂1
p̂2 q̂2
Obsérvese que la desviación estándar estimada de p̂1 p̂2 (la expresión de la raíz cuadrada)
es diferente aquí de lo que fue para probar hipótesis cuando 0 0.
Investigaciones recientes han demostrado que el nivel de confianza para el intervalo de
confianza tradicional que se acaba de dar en ocasiones se desvía sustancialmente del nivel
nominal (el nivel que se piensa se va obtener cuando se utiliza un valor crítico z particular,
p. ej., 95% cuando z/2 1.96). Se dice que la mejora sugerida es agregar un éxito y una
www.FreeLibros.me
c9_p325-368.qxd
358
3/12/08
CAPÍTULO 9
4:21 AM
Page 358
Inferencias basadas en dos muestras
falla a cada una de las muestras y luego reemplazar las p̂ y q̂ en la fórmula anterior por
~
p y q~ donde ~
p1 (x 1)/(m 2), etc. Este intervalo también puede ser utilizado cuando
los tamaños de muestra son bastante pequeños.
Ejemplo 9.13
Los autores del artículo “Adjuvant Radiotherapy and Chemotherapy in Node-Positive Premenopausal Women with Breast Cancer” (New Engl. J. of Med., 1997: 956-962) reportó los
resultados de un experimento diseñado para comparar el tratamiento de pacientes con cáncer con sólo quimioterapia con un tratamiento combinado de quimioterapia y radiación. De
las 154 pacientes que recibieron el tratamiento de sólo quimioterapia, 76 sobrevivieron por
lo menos 15 años, en tanto que 98 de las 164 pacientes que recibieron el tratamiento híbrido
sobrevivieron por lo menos ese número de años. Con p1 denotando la proporción de todas las
mujeres que, cuando fueron tratadas con sólo quimioterapia, sobreviven por lo menos 15
años y p2 denotando la proporción análoga para el tratamiento híbrido, p̂1 76/154 0.494
y 98/164 0.598. Un intervalo de confianza para la diferencia entre proporciones basadas
en la fórmula tradicional con un nivel de confianza de aproximadamente 99% es
(0.494)(0.506) (0.598)(0.402)
0.104 ! 0.143 (
154
164
0.494 0.598 ! (2.58)
0.247, 0.039)
Al nivel de confianza de 99%, es factible que 0.247 p1 p2 0.039. Este intervalo es
ancho de manera razonable, un reflejo del hecho de que los tamaños de muestra no son terriblemente grandes para este tipo de intervalo. Obsérvese que 0 es uno de los valores factibles
de p1 p2, lo que sugiere que ningún tratamiento puede ser juzgado superior al otro. Con
p~1 77/156 0.494, q~1 79/156 0.506, p~2 0.596, q~2 0.404 con base en tamaños de
muestra de 156 y 166, respectivamente, el intervalo “mejorado” aquí es idéntico al intervalo anterior.
■
Inferencias basadas en muestras pequeñas
En ocasiones una inferencia con respecto a p1 p2 es posible que tenga que basarse en
muestras donde por lo menos un tamaño de muestra es pequeño. Los métodos apropiados
para tales situaciones no son directos como aquellos para muestras grandes y existe más
controversia entre estadísticos en cuanto a los procedimientos recomendados. Una prueba
utilizada con frecuencia, llamada prueba de Fisher-Irwin, se basa en la distribución hipergeométrica. Su amigable estadístico vecino puede ser consultado para más información.
EJERCICIOS
Sección 9.4 (47-56)
47. ¿Es menos probable que alguien que cambia de marca por
cuestiones financieras permanezca leal, que alguien que
cambia sin pensar en cuestiones financieras? Sean p1 y p2
las proporciones verdaderas de los que cambian a cierta
marca con o sin pensar en cuestiones financieras, respectivamente, que después repiten una compra. Pruebe H0:
p1 p2 0 contra Ha: p1 p2 0 con 0.01 y los
siguientes datos:
m 200 número de éxitos 30
n 600 número de éxitos 180
(Datos similares aparecen en “Impact of Deals and Deal Retraction on Brand Switching”, J. Marketing, 1980: 62-70.)
48. Una muestra de 300 residentes adultos urbanos de un estado particular reveló que 63 estaban a favor de incrementar
el límite de velocidad en las autopistas de 55 a 65 mph, en
tanto que una muestra de 180 residentes rurales arrojó que
75 estaban a favor del incremento. ¿Indican estos datos que
el sentimiento en cuanto a incrementar el límite de velocidad es diferente en los dos grupos de residentes?
a. Pruebe H0: p1 p2 contra Ha: p1 p2 con 0.05,
donde p1 se refiere a la población urbana.
b. Si las proporciones verdaderas que favorecen el incremento en realidad son p1 0.20 (urbanos) y p2 0.40
(rurales), ¿cuál es la probabilidad de que H0 sea rechazada si se utiliza una prueba a nivel 0.05 con m 300,
n 180?
49. Se cree que la portada y la naturaleza de la primera pregunta en encuestas por correo influyen en la proporción de respuestas. El artículo “The Impact of Cover Design and First
Questions on Response Rates for a Mail Survey of Skydivers” (Leisure Sciences, 1991: 67-76) puso a prueba esta
teoría experimentando con diferentes diseños de portadas.
Una era simple, la otra utilizaba la imagen de un paracaidista.
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:21 AM
Page 359
9.4 Inferencias sobre una diferencia entre proporciones de población
Los investigadores especularon que la proporción de respuestas sería más baja con la portada simple.
Portada
Simple
Paracaidista
Número enviado
Número regresado
207
213
104
109
¿Confirman estos datos la hipótesis de los investigadores?
Pruebe la hipótesis pertinente con 0.10 calculando primero un valor P.
50. ¿Consideran los maestros que su trabajo es remunerativo y
satisfactorio? El artículo “Work-Related Attitudes” (Psychological Reports, 1991: 443-450) reporta los resultados de
una encuesta de 395 maestros de primaria y 266 maestros
de preparatoria. De los maestros de primaria, 224 dijeron
que estaban muy satisfechos con su trabajo, en tanto que 126
de los maestros de preparatoria estaban muy satisfechos
con su trabajo. Calcule las diferencias entre la proporción de
todos los maestros de primaria que están satisfechos y todos
los maestros de preparatoria que están satisfechos calculando e interpretando un intervalo de confianza.
51. Olestra es un sustituto de grasa aprobado por la FDA para
usarse en bocadillos. Como ha habido reportes anecdóticos
de problemas gastrointestinales asociados con el consumo de
olestra, se realizó un experimento de control con placebo doblemente a ciegas aleatorizado para comparar las papas fritas
con olestra con las regulares. con respecto a síntomas gastrointestinales (“Gastrointestinal Symptoms Following Consumption of Olestra on Regular Triglyceride Potato Chips”, J. of the
Amer. Med. Assoc., 1998: 150-152). Entre 529 individuos en el
grupo de control con las papas regulares 17.6% experimentaron un evento gastrointestinal adverso, en tanto que entre los
563 individuos en el grupo de tratamiento con papas olestra,
el 15.8% experimentó dicho evento.
a. Realice una prueba de hipótesis al nivel de significación
de 5% para decidir si la proporción de incidencia de problemas gastrointestinales en aquellos que consumen papas con olestra de acuerdo con el régimen experimental
difiere de la proporción de incidencia con el tratamiento
de control con papas regulares.
b. Si los porcentajes verdaderos con los dos tratamientos
fueron 15% y 20%, respectivamente, ¿qué tamaños de
muestra (m n) serían necesarios para detectar semejantes diferencias con probabilidad de 0.90?
52. Cada vez se presta más atención a la radiación ionizante como un método para preservar productos hortícolas. El artículo “The Influence of Gamma-Irradiation on the Storage Life
of Red Variety Garlic” (J. of Food Processing and Preservation, 1983: 179-183) reporta que 153 de 180 bulbos de ajo
irradiados estaban en condición de ser vendidos (sin retoños,
sin podredumbre o ablandamiento externos) 240 días después del tratamiento, en tanto que sólo 119 de 180 bulbos no
tratados estaban vendibles después de este lapso de tiempo.
¿Sugieren estos datos que la radiación ionizante es benéfica
por lo que se refiere a su condición para ser vendidos?
53. En investigaciones médicas, la proporción p1/p2 a menudo es de más interés que la diferencia p1 p2 (p. ej., ¿qué tan
probable es que los individuos que recibieron el tratamiento 1
359
se recuperen como aquellos que recibieron el tratamiento 2?)
Sea ˆ p̂1/p̂2. Cuando tanto m como n son grandes, el estadístico ln( ˆ) tiene aproximadamente una distribución normal
con valor medio aproximado ln() y desviación estándar
aproximada [(m x)/(mx) (n y)/(ny)]1/2.
a. Use estos datos para obtener una fórmula para intervalo
de confianza de 95% de muestra grande para calcular el
ln() y luego un intervalo de confianza para mismo.
b. Regrese a los datos de ataque cardiaco del ejemplo 1.3 y
calcule un intervalo de valores factibles de al nivel de
confianza de 95%. ¿Qué sugiere este intervalo sobre la
eficacia del tratamiento con aspirina?
54. En ocasiones algunos experimentos que implican éxitos o fallas
se realizan en pares o de una manera antes/después. Suponga
que antes de un discurso político importante dado por un candidato político, se seleccionan n individuos y se les preguntó si
están a favor del candidato (E) o no (F). Luego después del discurso a las mismas n personas se les hizo la misma pregunta.
Las respuestas pueden ser ingresadas en una tabla como sigue:
Después
E
F
E
X1
X2
F
X3
X4
Antes
donde X1 X2 X3 X4 n. Sean p1, p2, p3 y p4 las cuatro probabilidades de las celdas, de modo que p1 P(E antes y E después), y así sucesivamente. Se desea probar la
hipótesis de que la proporción de simpatizantes (E) después
del discurso no se ha incrementado contra la alternativa de
que sí se ha incrementado.
a. Formule las dos hipótesis de interés en función de p1, p2,
p3 y p4.
b. Construya un estimador de la diferencia antes/después
en probabilidades de éxito.
c. Cuando n es grande, se puede demostrar que la variable
aleatoria (Xi Xj)/n tiene de manera aproximada una
distribución normal con varianza dada por [pi pj
(pi pj)2]/n. Use esto para construir un estadístico de
prueba con aproximadamente una distribución estándar
normal cuando H0 es verdadera (el resultado se llama
prueba de McNemar).
d. Si x1 350, x2 150, x3 200 y x4 300, ¿qué concluye?
55. Se han utilizado dos tipos diferentes de aleación, A y B, para fabricar especímenes experimentales de un pequeño eslabón sometido a tensión utilizado en una aplicación de
ingeniería. Se determinó la resistencia última (klb/pulg2)
de cada espécimen y los resultados se resumen en la distribución de frecuencia adjunta.
26 – 30
30 – 34
34 – 38
38 – 42
www.FreeLibros.me
A
B
6
12
15
7
m 40
4
9
19
10
n 42
c9_p325-368.qxd
360
3/12/08
CAPÍTULO 9
4:21 AM
Page 360
Inferencias basadas en dos muestras
Calcule un intervalo de confianza de 95% para la diferencia
entre las proporciones verdaderas de todos los especímenes
de aleaciones A y B que tienen una resistencia última de por
lo menos 34 klb/pulg2.
muestra iguales de las dos poblaciones. ¿Con qué valor de
n( m) tendrá el intervalo resultante un ancho de cuando mucho 0.1 independientemente de los resultados del muestreo?
56. Con la fórmula tradicional, se tiene que construir un intervalo de confianza de 95% para p1 p2 con base en tamaños de
9.5 Inferencias sobre dos varianzas de población
De vez en cuando se requieren métodos de comparar dos varianzas de población (o desviaciones estándar), aunque tales problemas surgen con mucho menor frecuencia que aquellos que
implican medias o proporciones. Para el caso en que las poblaciones investigadas son normales, los procedimientos están basados en una nueva familia de distribuciones de probabilidad.
La distribución F
La distribución de probabilidad F tiene dos parámetros, denotados por 1 y 2. El parámetro
1 se conoce como numerador de número de grados de libertad y 2 es el número de denominador de grados de libertad; en este caso 1 y 2 son enteros positivos. Una variable aleatoria
que tiene una distribución F no puede asumir un valor negativo. Como la función de densidad
es complicada y no será utilizada en forma explícita, se omite la fórmula. Existe una importante conexión entre una variable F y variables ji al cuadrado. Si X1 y X2 son variables aleatorias ji cuadradas independientes con 1 y 2 grados de libertad, respectivamente, entonces la
variable aleatoria
F
X1/
X2/
1
(9.8)
2
se puede demostrar que la razón de las dos variables ji cuadradas divididas entre sus respectivos grados de libertad tiene una distribución F.
La figura 9.8 ilustra la gráfica de una función de densidad F típica. Análoga a la notación t, y 2, , se utiliza F, , para el punto sobre el eje que captura del área bajo la
curva de densidad F, con 1 y 2 grados de libertad en la cola superior. La curva de densidad
no es simétrica; así que parecería que tanto los valores críticos de cola superior como los de
cola inferior deben ser tabulados. Esto no es necesario, debido a la siguiente propiedad.
1
2
Curva de densidad F con
1 y 2 grados de libertad
Área sombreada
f
F, 1, 2
Curva de densidad F y valor crítico.
Figura 9.8
F1,
,
1
2
1/F,
,
2
1
www.FreeLibros.me
(9.9)
c9_p325-368.qxd
3/12/08
4:21 AM
Page 361
9.5 Inferencias sobre dos varianzas de población
361
La tabla A.9 del apéndice da F, , con 0.10, 0.05, 0.01 y 0.001 y varios valores
de 1 (en diferentes columnas de la tabla) y 2 (en diferentes grupos de filas de la tabla). Por
ejemplo, F0.05,6,10 3.22 y F0.05,10,6 4.06. Para obtener F0.95,6,10, el número que captura
0.95 del área a su derecha (y por tanto 0.05 a la izquierda) bajo la curva F con 1 6 y
2 10, se utiliza (9.9): F0.95,6,10 1/F0.05,10,6 1/4.06 0.246.
1
2
Métodos inferenciales
Un procedimiento de prueba de hipótesis por lo que se refiere a la razón 21/ 22 así como
también un intervalo de confianza para esta razón están basados en el siguiente resultado.
TEOREMA
Sea X1, . . . , Xm una muestra aleatoria de una distribución normal con varianza 21, sea
Y1, . . . , Yn otra muestra aleatoria (independiente de las Xi) de una distribución normal
con varianza 22, y sean S 21 y S 22 las dos varianzas muestrales. Entonces la variable
aleatoria
F
S 21/ 21
S 22/ 22
(9.10)
tiene una distribución F con 1 m 1 y 2 n 1.
Este teorema se obtiene al combinar (9.8) con el hecho de que cada una de las variables
(m 1)S 21/ 21 y (n 1)S 22/ 22 tienen una distribución ji cuadrada con m 1 y n 1 grados de libertad, respectivamente (véase la sección 7.4). Como F incluye una razón en lugar
de una diferencia, el estadístico de prueba es la razón de varianzas muestrales. La pretensión de que 21 22 es entonces rechazada si la razón difiere en gran medida de 1.
Prueba F para igualdad de varianzas
Hipótesis nula:
H0: 21 22
Valor estadístico de prueba: f s 21/s 22
Hipótesis alternativa
Región de rechazo para una prueba de nivel
Ha: 21 22
f
Ha:
21
22
Ha: 21 22
F,m1,n1
f F1,m1,n1
o f
F/2,m1,n1 o f F1/2,m1,n1
Como los valores críticos se tabulan sólo para 0.10, 0.05, 0.01 y 0.001, la prueba de dos colas se realiza sólo a los niveles 0.20, 0.10, 0.02 y 0.002. Con software
estadístico se obtienen otros valores críticos F.
Ejemplo 9.14
Con base en los datos reportados en un artículo de 1979 que apareció en el Journal of Gerontology (“Serum Ferritin in an Elderly Population”, págs. 521-524), los autores concluyeron
que la distribución de ferritina en los adultos mayores tenía un varianza más pequeña en los
adultos jóvenes (la ferritina en suero se utiliza para diagnosticar deficiencia de hierro). Para
una muestra de 28 varones adultos mayores, la desviación estándar de ferritina en suero (mg/l)
fue s1 52.6; para 26 adultos jóvenes, la desviación estándar fue s2 84.2. ¿Confirman estos
datos la conclusión tal como se aplicó a hombres?
www.FreeLibros.me
c9_p325-368.qxd
362
3/12/08
CAPÍTULO 9
4:21 AM
Page 362
Inferencias basadas en dos muestras
Sean 21 y 22 las varianzas de las distribuciones de ferritina en suero para adultos mayores y adultos jóvenes, respectivamente. Se desea probar H0: 21 22 contra Ha: 21 22.
Al nivel 0.01, H0 será rechazada si f F0.99,27,25. Para obtener el valor crítico, se requiere
F0.01,25,27. En la tabla A.9 del apéndice, F0.01,25,27 2.54, por lo tanto F0.99,27,25 1/2.54
0.394. El valor calculado de F es (52.6)2/(84.2)2 0.390. Como 0.390 0.394, H0 es
rechazada al nivel 0.01 en favor de Ha, ya que la variabilidad parece ser más grande en adultos jóvenes que en adultos mayores.
■
Valores P para pruebas F
Recuérdese que el valor P para una prueba t de cola superior es el área bajo la curva t pertinente (aquella con un grado de libertad apropiado) a la derecha de la t calculada. Del mismo modo, el valor P para una prueba F de cola superior es el área bajo la curva F con grados
de libertad apropiados en el numerador y denominador a la derecha de la f calculada. La figura 9.9 ilustra esto para una prueba basada en 1 4 y 2 6,
Curva F con
v1 = 4, v2 = 6
Área sombreada = valor P
= 0.025
f = 6.23
Figura 9.9
Valor P para una prueba F de cola superior.
La tabulación de áreas de cola superior bajo una curva F es mucho más tediosa que
para curvas t porque dos grados de libertad están implicados. Con cada combinación de 1
y 2, la tabla F da sólo cuatro valores críticos que capturan las áreas 0.10, 0.05, 0.01 y 0.001.
La figura 9.10 muestra lo que se puede decir sobre el valor P según donde quede f con respecto a los cuatro valores críticos.
v1
v2
6
0.10
0.05
0.01
0.001
1 . . .
4
. . .
3.18
4.53
9.15
21.92
valor P > 0.10
0.01 < valor P < 0.05 0.001 < valor P < 0.01
valor P < 0.001
0.05 < valor P < 0.10
Figura 9.10
Obtención de información sobre el valor P en la tabla F para un prueba F de cola superior.
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:21 AM
Page 363
9.5 Inferencias sobre dos varianzas de población
363
Por ejemplo, para una prueba con 1 4 y 2 6,
f 5.70
0.01 valor P 0.05
valor P 0.10
f 25.03 valor P 0.001
f 2.16
Sólo si f es igual a un valor tabulado se obtiene un valor P exacto (p. ej., si f 4.53, entonces el valor P 0.05). Una vez que se sabe que 0.01 valor P 0.05, H0 sería rechazada
a un nivel de significación de 0.05, pero no a un nivel de 0.01. Cuando el valor P 0.001,
H0 deberá ser rechazada a cualquier nivel de significación razonable.
Todas las pruebas F discutidas en capítulos subsiguientes serán de cola superior. Sin
embargo, si una prueba F de cola inferior es apropiada, entonces (9.9) deberá ser utilizada
para obtener valores críticos de cola inferior de modo que se pueda establecer un límite o límites en el valor P. En el caso de una prueba de dos colas, el límite o límites de una prueba de una cola deberán ser multiplicados por 2. Por ejemplo, si f 5.82 cuando 1 4 y
2 6, entonces puesto que 5.82 queda entre los valores críticos 0.05 y 0.01, 2(0.01) valor P 2(0.05), es decir 0.02 valor P 0.10, H0 sería rechazada si 0.10 pero no si
0.01. En este caso, no se puede decir con base en la tabla qué conclusión es apropiada
cuando 0.05 (puesto que no se sabe si el valor P es más pequeño o más grande que
éste). Sin embargo, el software estadístico muestra que el área a la derecha de 5.82 bajo esta curva F es 0.029, de modo que el valor P es 0.058 y que por consiguiente la hipótesis nula no debe ser rechazada al nivel 0.05 (0.058 es el más pequeño con el cual H0 puede ser
rechazada y el seleccionado es más pequeño que éste). Varios programas de computadora estadísticos, desde luego, proporcionan un valor P exacto para cualquier prueba F.
Intervalo de confianza para 1/2
El intervalo de confianza para 21/ 22 se basa en el reemplazo de F en el enunciado de probabilidad
P(F1/2,
1, 2
F F/2,
)1
1, 2
con la variable F (9.10) y en la manipulación de las desigualdades para aislar 21/ 22. Se obtiene un intervalo para 1/ 2 al tomar la raíz cuadrada de cada límite. Los detalles se dejan
para un ejercicio.
EJERCICIOS
Sección 9.5 (57-64)
57. Obtenga o calcule las siguientes cantidades:
a. F0.05,5,8
b. F0.05,8,5
c. F0.95,5,8
d. F0.95,8,5
e. El percentil 99 de la distribución F con 1 10, 2 12
f. El percentil uno de la distribución F con 1 10, 2 12
g. P(F 6.16) para 1 6, 2 4
h. P(0.177 F 4.74) para 1 10, 2 5
58. Dé tanta información como pueda sobre el valor P de la
prueba F en cada una de las siguientes situaciones:
a. 1 5, 2 10, prueba de cola superior, f 4.75
b. 1 5, 2 10, prueba de cola superior, f 2.00
c. 1 5, 2 10, prueba de dos colas, f 5.64
d. 1 5, 2 10, prueba de cola inferior, f 0.200
e. 1 35, 2 20, prueba de cola superior, f 3.24
59. Regrese a los datos sobre ángulo de inclinación máximo dados en el ejercicio 28 de este capítulo. Realice una prueba
con nivel de significación de 0.10 para ver si las desviaciones estándar de población de los dos grupos de edad son diferentes (las curvas de probabilidad normal confirman la
suposición de normalidad necesaria).
60. Remítase al ejemplo 9.7. ¿Sugieren los datos que la desviación estándar de la distribución de resistencia de especímenes sometidos a un proceso de fusión es más pequeña que
la de especímenes no sometidos a un proceso de fusión?
Realice una prueba de significación con 0.01 obteniendo
tanta información como pueda sobre el valor P.
61. El toxafen es un insecticida que ha sido identificado como
contaminante en el ecosistema de los Grandes Lagos. Para
investigar el efecto de la exposición al toxafen en animales,
a grupos de ratas se les administró toxafen en su dieta. El
artículo “Reproduction Study of Toxaphene in the Rat”
www.FreeLibros.me
c9_p325-368.qxd
364
3/12/08
CAPÍTULO 9
4:21 AM
Page 364
Inferencias basadas en dos muestras
(J. of Environ. Sci. Health, 1988: 101-126) reporta aumentos de peso (en gramos) de ratas a las que se les administró
una dosis baja (4 ppm) y de ratas de control cuya dieta no
incluía el insecticida. La desviación estándar de muestra de
23 ratas hembra de control fue de 32 g y de 20 ratas hembra sometidas a dosis bajas fue de 54 g. ¿Sugieren estos datos que existe más variabilidad en los incrementos de peso
a dosis bajas que en los incrementos de peso en las ratas de
control? Suponiendo normalidad, realice una prueba de hipótesis con un nivel de significación de 0.05.
62. En un estudio de deficiencia de cobre en ganado, se determinaron los valores de cobre ( g Cu/100 ml de sangre) tanto para ganado apacentado en un área donde se sabe que
existen anomalías bien definidas provocadas por molibdeno
(valores de contenido del metal que exceden el rango normal de variación regional) y para ganado apacentado en área
sin anómala. (“An Investigation into Copper Deficiency in
Cattle in the Southern Pennines”, J. Agricultural Soc. Cambridge, 1972: 157-163), con el resultado s1 21.5 (m 48)
en la condición anómala y s2 19.45 (n 45) para la
condición no anómala. Pruebe en cuanto a igualdad contra desigualdad de varianzas de población a un nivel de significación de 0.10 utilizando el método del valor P.
63. El artículo “Enhancement of Compressive Properties of
Failed Concrete Cylinders with Polymer Impregnation” (J.
Testing and Evaluation, 1977: 333-337) reporta los siguientes datos sobre módulo de compresión impregnado (lb/pulg2 106) cuando se utilizaron dos polímeros diferentes
para reparar grietas en concreto que falló.
Epoxy
Prepolímero MMA
1.75
1.77
2.12
1.59
2.05
1.70
1.97
1.69
Obtenga un IC del 90% para el radio de varianzas para el
primer uso del método sugerido en el texto para obtener una
fórmula general para el intervalo de confianza.
64. Reconsidere los datos del ejemplo 9.6 y calcule un límite de
confianza superior de 95% para la razón de la desviación
estándar de la distribución de porosidad en triacetato a la de
de la distribución de porosidad en algodón.
EJERCICIOS SUPLEMENTARIOS (65-93)
65. Los datos adjuntos sobre resistencia a la compresión (lb) de
cajas de 12 10 8 pulg aparecieron en el artículo “Compression of Single-Wall Corrugated Shipping Containers
Using Fixed and Floating Test Platens” (J. Testing and Evaluation, 1992: 318-320). Los autores manifestaron que
encontraron que la diferencia entre la resistencia a la compresión utilizando un método de platinas fijas y flotantes es
pequeña comparada con la variación normal de la resistencia a la compresión entre cajas idénticas. ¿Está de acuerdo?
¿Su análisis se basa en cualquier suposición?
Método
Tamaño de
muestra
Media
muestral
DE
muestral
Fijo
Flotante
10
10
807
757
27
41
66. Los autores del artículo “Dynamics of Canopy Structure
and Light Interception in Pinus elliotti, North Florida”
(Ecological Monographs, 1991: 33-51) idearon un experimento para determinar el efecto de un fertilizante en un área
cubierta de hojas. Se dispuso de varios solares para el estudio y se seleccionó al azar la mitad para fertilizarlos. Para
asegurarse de que los solares que iban a recibir el fertilizante y los de control fueran iguales antes de comenzar el
experimento se registró la densidad de árboles (el número
de árboles por hectárea) en ocho solares que iban a ser fertilizados y en ocho solares de control y se obtuvieron los
resultados siguientes generados por MINITAB.
Solares fertilizados
1024
1216
1216
1312
1312
992
1280
1120
Solares de control
1104
1376
1072
1280
1088
1120
1328
1200
Muestra T para fertilizados y de control
N
fertilizado 8
control
8
Media
1184
1196
DevEst
126
118
EE de la Media
44
42
IC de 95% para mu ferlizado-mu de control:
(-144, 120)
a. Construya una gráfica de caja comparativa y comente
sobre cualquier característica interesante.
b. ¿Concluiría que existe una diferencia significativa en la
densidad de árboles media en los solares fertilizados y de
control? Use 0.05.
c. Interprete el intervalo de confianza dado.
67. ¿Se ve afectada la proporción de respuestas a cuestionarios
si se incluye un incentivo por responder junto con el cuestionario? en un experimento, de 110 cuestionarios sin incentivo 75 fueron regresados, en tanto que 98 cuestionarios
que incluían la oportunidad de ganar un premio de lotería
dieron por resultado 66 respuestas (“Charities, No; Lotteries, No; Cash, Yes”, Public Opinion Quarterly, 1996: 542562). ¿Sugieren estos datos que la inclusión de un incentivo
incrementa la probabilidad de una respuesta? Formule y
pruebe las hipótesis pertinentes a un nivel de significación
de 0.10 utilizando el método del valor P.
68. Los datos adjuntos se obtuvieron en un estudio para evaluar el
potencial de licuefacción en una planta de energía nuclear
propuesta (“Cyclic Strenghts Compared for Two Sampling
Techniques”, J. Geotechnical Division, Amer. Soc. Civil
Engrs. Proceedings, 1981: 563-576). Antes de probar la
resistencia cíclica, se recopilaron muestras de suelo mediante un método de jarro y un método de bloque y se
obtuvieron los siguientes valores observados de densidad
en seco (lb/pie3).
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:21 AM
Page 365
Ejercicios suplementarios
Muestreo con jarro
101.1
99.5
109.1
105.1
100.3
99.6
111.1
98.7
104.1
104.5
102.6
103.3
107.6
103.3
110.0
105.7
101.7
102.1
98.1
108.9
98.4
103.3
105.4
104.3
Muestreo con bloque 107.1
103.3
97.9
105.0
104.6
103.2
98.0
100.1
96.9
97.9
98.2
Calcule e interprete un intervalo de confianza de 95% para
la diferencia entre densidades en seco promedio verdaderas
para los dos métodos de muestreo.
69. El artículo “Quantitative MRI and Electrophysiology of
Preoperative Carpal Tunnel Syndrome in a Female Population” (Ergonomics, 1997: 642-649) reportó que (473.3,
1691.9) era un intervalo de confianza de 95% con muestra
grande para la diferencia entre el volumen del músculo ténar (mm3) en personas que padecen el síndrome de túnel
carpiano y el volumen promedio verdadero en personas que
no padecen el síndrome. Calcule un intervalo de confianza
de 90% para esta diferencia.
70. Los siguientes datos de resistencia a la flexión (lb-pulg/pulg) de juntas se tomaron del artículo “Bending Strength
of Corner Joints Constructed with Injection Molded Splines” (Forest Products J., abril de 1997: 89-92).
Tipo
Tamaño de Media
DE
muestra muestral muestral
Sin recubrimiento lateral
Con recubrimiento lateral
10
10
80.95
63.23
9.59
5.96
a. Calcule un límite de confianza inferior de 95% para la resistencia promedio verdadera de juntas con recubrimiento lateral.
b. Calcule un límite de predicción inferior de 95% para la
resistencia de una sola junta con recubrimiento lateral.
c. Calcule un intervalo que, con confianza de 95%, incluye
los valores de resistencia de por lo menos 95% de la población de todas las juntas con recubrimientos laterales.
d. Calcule un intervalo de confianza de 95% para la diferencia entre las resistencias promedio verdaderas de los
dos tipos de juntas.
71. Se realizó un experimento para comparar varias propiedades
de hilo terminado retorcido de algodón/poliéster con suavizante únicamente e hilo terminado con suavizante más 5%
de resina DP (“Properties of a Fabric Made with Tandem
Spun Yarns”, Textile Res. J., 1996: 607-611). Una característica importante en particular de telas es su durabilidad; es
decir, su capacidad de resistir el desgaste. Para una muestra de
40 especímenes tratado con suavizante, la resistencia a la
abrasión por flexión media (ciclos) en la dirección de relleno del hilo fue de 3975.0, con una desviación estándar de
245.1. Otra muestra de especímenes tratados con suavizante
y resina dieron una media y desviación estándar de 2795.0 y
293.7, respectivamente. Calcule un intervalo de confianza
con nivel de confianza de 99% para la diferencia entre resistencias a la abrasión promedio verdaderas para los dos tipos
365
de telas. ¿Proporciona su intervalo evidencia convincente de
que las resistencias promedio verdaderas difieren para los
dos tipos de tela? ¿Por qué sí o por qué no?
72. El descarrilamiento de un tren de carga provocado por la catastrófica falla de la chumacera de la armadura de un motor
de tracción motivó un estudio reportado en el artículo “Locomotive Traction Motor Armature Bearing Life Study”
(Lubrication Engr. agosto de 1997: 12-19). Se seleccionó
una muestra de 17 motores de tracción con alto kilometraje
y se determinó la penetración de cono (mm/10) tanto en la
chumacera de piñón como en la chumacera de la armadura
del conmutador y se obtuvieron los siguientes datos:
Motor
Conmutador
Piñón
1
211
226
2
273
278
3
305
259
4
258
244
5
270
273
6
209
236
11
262
288
12
291
242
Motor
Conmutador
Piñón
7
223
290
8
288
287
9
296
315
10
233
242
Motor
Conmutador
Piñón
13
278
278
14
275
208
15
210
281
16
272
274
17
264
268
Calcule la diferencia media de la población entre la penetración en la chumacera de la armadura del conmutador y la
penetración en la chumacera de piñón y hágalo de manera
que permita obtener información sobre confiabilidad y precisión de la estimación. [Nota: Una curva de probabilidad
normal valida la suposición de normalidad necesaria.] ¿Diría que la diferencia media de la población ha sido estimada con precisión? ¿Difiere la media de la población para los
dos tipos de chumaceras? Explique.
73. La “cabezabilidad” es la capacidad de una pieza cilíndrica
de permitir que se le dé la forma de la cabeza de un perno,
tornillo u otra parte formada en frío sin rotura. El artículo
“New Methods for Assessing Cold Heading Quality” (Wire
J. Intl., octubre de 1996: 66-72) describe el resultado de una
prueba de impacto de cabezabilidad aplicada a 30 especímenes de acero muerto al aluminio y a 30 especímenes de
acero muerto al silicio. El número de clasificación de cabezabilidad medio para los especímenes de acero fue de 6.43
y la media para los especímenes de aluminio fue de 7.09.
Suponga que las desviaciones estándar fueran de 1.08 y
1.19, respectivamente. ¿Está de acuerdo con los autores del
artículo de que la diferencia en las clasificaciones de cabezabilidad es significativa al nivel de 5% (suponiendo que las
dos distribuciones de cabezabilidad son normales?
74. El artículo “Two Parameters Limiting the Sensitivity of Laboratory Tests of Condoms as Viral Barriers” (J. of Testing and
Eval., 1996: 279-286) reportó que, en los condones de la marca A, entre 16 rasgaduras producidas por una aguja, la longitud media de las rasgaduras fue de 74.0 m, en tanto que para
las 14 rasgaduras producidas en la marca B, la longitud media
fue de 61.0 m (determinadas con un microscopio luminoso
y micrografos de exploración de electrones. Suponga que las
www.FreeLibros.me
c9_p325-368.qxd
366
3/12/08
4:21 AM
Page 366
Inferencias basadas en dos muestras
CAPÍTULO 9
desviaciones estándar son 14.8 y 12.5, respectivamente (consistentes como los rangos muestrales dados en el artículo).
Los autores comentaron que el condón de la marca B más
grueso mostró una longitud de rasgadura media más pequeña
que el condón de la marca A más delgado. ¿Es en realidad esta diferencia estadísticamente significativa? Formule las hipótesis apropiadas y pruebe a un nivel 0.05.
75. Se requiere información sobre la postura de la mano y las
fuerzas generadas por los dedos durante la manipulación de
varios objetos cotidianos para diseñar prótesis de alta tecnología para la mano. El artículo “Grip Posture and Forces
During Holding Cylindrical Objects with Circular Grips”
(Ergonomics, 1996: 1163-1176) reportó que para una muestra de 11 mujeres, la fuerza de opresión con cuatro dedos
(N) fue de 98.1 y la desviación estándar fue de 14.2. Para
una muestra de 15 hombres, la media y la desviación estándar fueron de 129.2 y 39.1, respectivamente.
a. Una prueba realizada para ver si las fuerzas promedio verdaderas para los dos géneros eran diferentes dio por resultado t 2.51 y valor P 0.019. ¿Da el procedimiento de
prueba apropiado descrito en este capítulo este valor de t
y el valor P establecido?
b. ¿Existe evidencia sustancial para concluir que la fuerza
promedio verdadera para hombres excede la de la fuerza de mujeres por más de 25 N? Formule y pruebe las
hipótesis pertinentes.
76. El artículo “Pine Needles as Sensors of Atmospheric Pollution” (Environ. Monitoring, 1982: 273-286) reportó sobre el
uso de análisis de actividad de neutrones para determinar
concentración de contaminantes en hojas de pino. De acuerdo con los autores del artículo, “Estas observaciones indican
fuertemente que para aquellos elementos bien determinados
mediante procedimientos analíticos, la distribución de concentración es lognormal. Por consiguiente, en pruebas de significación se utilizarán logaritmos de concentraciones”. Los
datos dados se refieren a concentración de bromo en hojas de
pino tomadas del sitio cercano a una planta de vapor alimentada con petróleo y de un sitio relativamente limpio. Los valores dados a continuación son medias y desviaciones
estándar de las observaciones logarítmicas transformadas.
Sitio
Tamaño de
muestra
Planta de vapor
Limpia
8
9
Concentración
log media
Desv. est. de
concentración
media
18.0
11.0
4.9
4.6
Sea *1 la concentración log promedio verdadera en el primer sitio y defínase *2 análogamente para el segundo sitio.
a. Use la prueba t agrupada (basada en la suposición de
normalidad y desviaciones estándar iguales) para decidir
un nivel de significación de 0.05 si las dos medias de
distribución de concentración son iguales.
b. Si *1 y *2, las desviaciones estándar de las dos distribuciones log de concentración, no son iguales, ¿serían
1 y
2, las medias de las distribuciones de concentración, las mismas si *1 *2 ? Explique su razonamiento.
77. La exposición a largo plazo de trabajadores textiles al polvo
de algodón emitido durante el procesamiento puede producir
problemas de salud sustanciales, de modo que los investiga-
dores textiles han estado investigando métodos que reduzcan
los riesgos al mismo tiempo que preserven propiedades
importantes de las telas. Los datos adjuntos de resistencia cohesiva de primera torsión (kN·m/kg) en especímenes producidos con cinco múltiplos de torsión diferentes se tomaron
del artículo “Heat Treatment of Cotton Effect on Endotoxin
Content, Fiber and Yarn Properties, and Processability” (Textile Research, J., 1996: 727-738).
Torsión múltiple
1.054 1.141 1.245 1.370 1.481
Resistencia de control 0.45
Resistencia en caliente 0.51
0.60
0.59
0.61
0.63
0.73
0.73
0.69
0.74
Los autores del artículo citado manifestaron que la resistencia de especímenes tratados resultó ser un poco más alta en
promedio la de especímenes de control. ¿Es la diferencia
estadísticamente significativa? Formule y pruebe las hipótesis pertinentes con 0.05 calculando el valor P.
78. Los datos adjuntos sobre la razón de resistencia con respecto al área de sección transversal de los extensores de la rodilla se tomaron del artículo “Knee Extensor and Knee
Flexor Strength: Cross Sectional Area Ratios in Young and
Elderly Men” (J. of Gerontology, 1992: M204-M210).
Tamaño de
muestra
Grupo
Jóvenes
13
Hombres mayores 12
Media
muestral
Error
estándar
7.47
6.71
0.22
0.28
¿Sugieren estos datos que la razón promedio verdadera para jóvenes excede aquella para hombres mayores? Realice
una prueba de hipótesis apropiada con 0.05. Asegúrese de formular cualquier suposición necesaria para su análisis.
79. Los datos adjuntos sobre tiempo de respuesta aparecieron
en el artículo “The Extinguishment of Fires Using LowFlow Water Hose Streams-Part II” (Fire Technology, 1991:
291-320).
Buena visibilidad
Mala visibilidad
0.43 1.17 0.37 0.47 0.68 0.58 0.50 2.75
1.47 0.80 1.58 1.53 4.33 4.23 3.25 3.22
Los autores analizaron los datos con una prueba t agrupada.
¿Parece justificado el uso de esta prueba? [Sugerencia: Verifique en cuanto a normalidad. Las anotaciones normales con n
8 son 1.53, 0.89, 0.49, 0.15, 0.15, 0.49, 0.89 y 1.53.]
80. Comúnmente se utiliza cemento acrílico para hueso en la
artroplastia total de articulaciones como un material que
permite la transferencia suave de cargas de una prótesis
metálica a una estructura ósea. El artículo “Validation of
the Small-Punch Test as a Technique for Characterizing the
Mechanical Properties of Acrylic Bone Cement” (J. of
Engr. in Med., 2006: 11-21) dio los siguientes datos sobre
fuerza de ruptura (N):
Temp.
Media
n
x
s
22$
Seca
6
170.60
39.08
37$
Seca
6
325.73
34.97
22$
Húmeda
6
366.36
34.82
37$
Húmeda
6
306.09
41.97
www.FreeLibros.me
c9_p325-368.qxd
3/12/08
4:21 AM
Page 367
Ejercicios suplementarios
Suponga que todas las distribuciones de población son
normales.
a. Estime la diferencia entre fuerza de ruptura promedio
verdadera en un medio seco a 37° y hágalo de una forma que dé información sobre precisión y confiabilidad.
Luego interprete su estimación.
b. Estime la diferencia entre la fuerza a la ruptura promedio
verdadera en un medio seco a 37° y la fuerza promedio verdadera a la misma temperatura en un medio húmedo y
hágalo de modo que obtenga información sobre precisión
y confiabilidad. Luego interprete su estimación.
c. ¿Existe una fuerte evidencia para concluir que la fuerza
promedio verdadera en un medio seco a la temperatura
más alta excede aquella a la temperatura más baja por más
de 100 N?
81. En un experimento para comparar resistencias de apoyo de
clavijas insertadas en dos tipos diferentes de soportes de montaje, una muestra de 14 observaciones de límite de esfuerzo
de soportes de montaje de encino rojo dieron por
resultado una media y desviación estándar de 8.48 MPa y
0.79 MPa, respectivamente, en tanto que una muestra de 12
observaciones cuando se utilizaron soportes de montaje de
abeto Douglas dieron una media de 9.36 y una desviación
estándar de 1.52 (“Bearing Strength of White Oak Pegs in
Red Oak and Douglas Fir Timbers”, J. of Testing and Evaluation, 1998, 109-114). Considere probar si o no los límites
de esfuerzo promedio verdaderos son idénticos para los dos
tipos de soporte de montaje. Compare los grados de libertad
y valores P para las pruebas t agrupadas y no agrupadas.
82. ¿Cómo se compara la absorción de energía con el consumo
de energía? Un aspecto de este tema se consideró en el artículo “Measurement of Total Energy Expenditure by the
Doubly Labelled Water Method in Professional Soccer Players” (J. of Sports Sciences, 2002: 391-397), el cual contiene los datos adjuntos (MJ/día)
Jugador
1
2
3
4
5
6
7
Consumo
14.4
12.1
14.3
14.2
15.2
15.5
17.8
Absorción
14.6
9.2
11.8
11.6
12.7
15.0
16.3
Pruebe si existe una diferencia significativa entre absorción
y consumo. ¿Depende la conclusión de si se utiliza un nivel
de significación de 0.05, 0.01 o 0.001?
83. Un experimentador desea obtener un intervalo de confianza
para la diferencia entre resistencia a la ruptura promedio
verdadera para cables fabricados por la compañía I y la
compañía II. Suponga que la resistencia a la ruptura está
normalmente distribuida para ambos tipos de cable con
2
2
1 30 lb/pulg y 2 20 lb/pulg .
a. Si los costos dictan que el tamaño de muestra para el cable de tipo I deberá ser tres veces el tamaño de muestra
para el cable de tipo II, ¿cuántas observaciones se requieren si el intervalo de confianza de 99% no debe ser
más ancho que 20 lb/pulg2?
b. Suponga que se tienen que hacer un total de 400 observaciones. ¿Cuántas de ellas deberán ser hechas en muestras de cable de tipo I si el ancho del intervalo resultante
tiene que ser mínimo?
367
84. En el artículo “Development Rates and a Temperatura-Dependent Model of Pales Weevil” (Environ. Entomology,
1987: 956-962) se describe un experimento para determinar
los efectos de la temperatura en la sobrevivencia de huevos
de insectos. A 11°C, 73 de 91 huevos sobrevivieron hasta la
siguiente etapa de desarrollo. A 30°C, 102 de 110 huevos
sobrevivieron. ¿Sugieren los resultados de este experimento
que la tasa de sobrevivencia (proporción de sobrevivencia)
difiere para las dos temperaturas? Calcule el valor P y utilícelo para probar las hipótesis apropiadas.
85. Los meseros en restaurantes han empleado varias estrategias para incrementar las propinas. Un artículo en el ejemplar del 5 de septiembre de 2005 del The New Yorker
reportó que “En un estudio una mesera recibió 50% más en
propinas cuando se presentó con su nombre que cuando no
lo hizo”. Considere los siguientes datos (ficticios) sobre la
cantidad de propina como un porcentaje de la cuenta.
Presentación:
m 50
Sin presentación:
n 50
x 22.63
y 14.15
s1 7.82
s2 6.10
¿Sugieren estos datos que una presentación incrementa las
propinas en promedio en más de 50%. Formule y pruebe
las hipótesis pertinentes. [Sugerencia: Considere el parámetro 1 1.5 2.]
86. El artículo “Quantitative Assessment of Glenohumeral Translation in Baseball Players” (The Amer. J. of Sports Med.,
2004: 1711-1715) consideró varios aspectos de movimiento
del hombro para una muestra de pitcheres (lanzadores) y otra
muestra de jugadores de campo (“glenohumeral” que se refiere a la articulación entre el húmero (bola) y el glenoide
(cuenca). Los autores amablemente proporcionaron los siguientes datos sobre traslación anteroposterior (mm), una
medida de la extensión del movimiento anterior y posterior,
tanto del brazo dominante como del brazo no dominante.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
Media
de
Pos Dom Tr Pos ND Tr Pit Dom Tr Pit ND Tr
30.31
32.54
27.63
24.33
44.86
40.95
30.57
26.36
22.09
23.48
32.62
30.62
31.26
31.11
39.79
33.74
28.07
28.75
28.50
29.84
31.93
29.32
26.70
26.71
34.68
34.79
30.34
26.45
29.10
28.87
28.69
21.49
25.51
27.59
31.19
20.82
22.49
21.01
36.00
21.75
28.74
30.31
31.58
28.32
27.89
27.92
32.55
27.22
28.48
27.85
29.56
28.86
25.60
24.95
28.64
28.58
20.21
21.59
28.58
27.15
33.77
32.48
31.99
29.46
32.59
32.48
27.16
21.26
32.60
31.61
29.30
27.46
29.4463
29.2137
30.7112
26.6447
5.4655
4.7013
3.3310
3.6679
a. Estime la diferencia promedio verdadera de traslación
entre los brazos dominante y no dominante de lanzadores en una forma que aporte información sobre confiabilidad y precisión e interprete la estimación resultante.
b. Repita (a) para jugadores de campo.
c. Los autores afirmaron que los “lanzadores mostraron
una mayor diferencia en la traslación anteroposterior de
www.FreeLibros.me
c9_p325-368.qxd
368
3/12/08
CAPÍTULO 9
4:21 AM
Page 368
Inferencias basadas en dos muestras
lado a lado de sus hombros en comparación con los jugadores de campo”. ¿Está de acuerdo? Explique.
87. Suponga que se tiene que realizar una prueba al nivel 0.05
de H0: 1 2 0 contra Ha: 1 2 0, suponiendo
1
2 10 y normalidad para ambas distribuciones,
utilizando tamaños de muestra iguales (m n). Evalúe la
probabilidad de un tipo de error II cuando 1 2 1 y n
25, 100, 2500 y 10 000. ¿Puede pensar en problemas reales
en los cuales la diferencia 1 2 1 tiene poca significación práctica? ¿Serían deseables tamaños de muestra de
n 10 000 en tales problemas?
88. Los siguientes datos se refieren a la cuenta de bacterias
transportadas por el aire (número de colonias/pie3) tanto para m 8 cuartos de hospital alfombrados como para n 8
cuartos no alfombrados (“Microbial Air Sampling in a Carpeted Hospital”, J. Environmental Health, 1968: 405). ¿Parece haber una diferencia en el conteo de bacterias
promedio verdadero entre cuartos alfombrados y no alfombrados?
Alfombrado
11.8 8.2
7.1 13.0 10.8 10.1 14.6 14.0
No alfombrado 12.1 8.3 3.8 7.2 12.0 11.1 10.1 13.7
Suponga que posteriormente se dio cuenta que los cuartos
alfombrados estaban en un hospital de veteranos, en tanto
que los no alfombrados estaban en un hospital infantil. ¿Sería capaz de evaluar el efecto del alfombrado? Comente.
89. Investigadores enviaron 5000 currículos en respuesta a
anuncios de trabajo que aparecieron en el Boston Globe y el
Chicago Tribune. Los currículos eran idénticos excepto que
2500 de ellos tenían apellidos “que sonaban a apellidos de
persona blanca”, tales como Brett y Emily, en tanto que los
otros 2500 tenían nombres “que sonaban a persona negra”
tales como Tamika y Rasheed. Los currículos del primer tipo produjeron 250 respuestas y los del segundo tipo sólo
167 respuestas (estos números son muy consistentes con la
información que apareció en un reporte del 15 de enero
de 2003 de la Associated Press). ¿Sugieren fuertemente
estos datos que un currículo con un apellido “negro” es menos
probable que dé por resultado una respuesta que un currículo
con un apellido de “blanco”?
90. La prueba de McNemar, desarrollada en el ejercicio 54,
también puede ser utilizada cuando los individuos son reunidos en pares para obtener n pares y luego un miembro de
cada par recibe el tratamiento 1 y el otro el tratamiento 2.
Luego X1 es el número de pares en los que ambos tratamientos fueron exitosos y asimismo para X2, X3, X4. El estadístico
de prueba para comprobar la eficacia de los dos tratamientos
está dado por (X2 X3)/(X
2
X3,
) el cual tiene aproximadamente una distribución normal estándar cuando H0 es
verdadera. Úselo para probar si la ergotamina es efectiva en
el tratamiento de dolores de cabeza de migraña.
Ergotamina
Placebo
E
F
E
F
44
46
34
30
Los datos son ficticios, pero la conclusión concuerda con la
del artículo “Controlled Clinical Trial of Ergotamine Tartrate” (British Med. J., 1970: 325-327).
91. El artículo “Evaluating Variability in Filling Operations”
(Food Tech., 1984: 51-55) describe dos operaciones de llenado diferentes utilizadas en una planta empacadora de carne molida. Ambas operaciones de llenado se ajustaron para
llenar paquetes con 1400 g de carne molida. En una muestra aleatoria de tamaño 30 tomada de cada operación de llenado, las medias y desviaciones estándar resultantes fueron
1402.24 g y 10.97 g para la operación 1 y 1419.63 g y 9.96
g para la operación 2.
a. ¿Con un nivel de significación de 0.05, ¿existe suficiente evidencia que indique que el peso medio verdadero de
los paquetes difiere para las dos operaciones?
b. ¿Sugieren los datos de la operación 1 que el peso medio
verdadero de los paquetes producidos por la operación 1
es más grande por más de 1400 g? Use un nivel de significación de 0.05.
92. Sea X1, . . . , Xm una muestra aleatoria de una distribución de
Poisson con parámetro 1 y sea Y1, . . . , Yn una muestra aleatoria de otra distribución de Poisson con parámetro 2. Se desea probar H0: 1 2 0 contra una de las tres alternativas
estándar. Como
para una distribución de Poisson,
cuando m y n son grandes se puede utilizar la prueba z con
muestra grande de la sección 9.1. Sin embargo, el hecho de
que V(X
) /n sugiere que se debe utilizar un denominador
diferente al estandarizar X
Y. Desarrolle un procedimiento de prueba con muestra grande apropiado para este problema y luego aplíquelo a los siguientes datos para probar si las
densidades de plantas de una especie particular son iguales
en dos regiones diferentes (donde cada observación es el número de plantas encontradas en un cuadrante de muestreo localizado al azar con área de 1 m2, así que en la región 1 hubo
40 cuadrantes en los que se observó una planta, etcétera):
Frecuencia
Región 1
Región 2
0
1
2
3
4
5
6
7
28
14
40
25
28
30
17
18
8 2
49 2
1
1
1
1
m 125
n 140
93. Remitiéndose al ejercicio 92, desarrolle una fórmula para el
intervalo de confianza con muestra grande para 1 2.
Calcule el intervalo para los datos dados allí utilizando un
nivel de confianza de 95%.
Bibliografía
Véase la bibliografía al final del capítulo 7.
www.FreeLibros.me
c10_p369-396.qxd
3/12/08
4:23 AM
Page 369
10 Análisis de la varianza
INTRODUCCIÓN
Al estudiar los métodos de análisis de datos cuantitativos, primero se trataron problemas que implican una sola muestra de números y luego se abordó el análisis comparativo de dos muestras diferentes. En problemas de una muestra, los datos se
componían de observaciones sobre respuestas de individuos u objetos experimentales seleccionados de una sola población. En problemas de dos muestras, las dos
muestras se tomaron de dos poblaciones diferentes y los parámetros de interés fueron las medias de la población o bien se aplicaron dos tratamientos distintos a unidades experimentales (individuos u objetos) seleccionados de una sola población; en el
último caso, los parámetros de interés fueron las medias de tratamiento verdaderas.
El análisis de la varianza, o más brevemente, ANOVA, se refiere en general a
un conjunto de situaciones experimentales y procedimientos estadísticos para el análisis de respuestas cuantitativas de unidades experimentales. El problema ANOVA
más simple se conoce indistintamente como unifactorial, de clasificación única o
ANOVA unidireccional e implica el análisis de datos muestreados de más de dos poblaciones (distribuciones) numéricas o de datos de experimentos en los cuales se utilizaron más de dos tratamientos. La característica que diferencia los tratamientos o
poblaciones una de otra se llama factor en estudio y los distintos tratamientos o poblaciones se conocen como niveles del factor. Ejemplos de tales situaciones incluyen
los siguientes:
1. Un experimento para estudiar los efectos de cinco marcas diferentes de gasolina
con respecto a la eficiencia de operación de un motor automotriz (mpg).
2. Un experimento para estudiar los efectos de la presencia de cuatro soluciones
azucaradas diferentes (glucosa, sucrosa, fructosa y una mezcla de las tres) en
cuanto a crecimiento de bacterias.
369
www.FreeLibros.me
c10_p369-396.qxd
370
3/12/08
CAPÍTULO 10
4:23 AM
Page 370
Análisis de la varianza
3. Un experimento para investigar si la concentración de madera dura en la pulpa (%)
afecta la resistencia a la tensión de bolsas hechas de la pulpa.
4. Un experimento para decidir si la densidad de color de un espécimen de tela depende de la cantidad de tinte utilizado.
En 1) el factor de interés es la marca de la gasolina y existen cinco niveles diferentes del factor. En 2) el factor es el azúcar con cuatro niveles (o cinco, si se utiliza una solución de control que no contenga azúcar). Tanto en 1) como en 2), el factor es de
naturaleza cualitativa y los niveles corresponden a posibles categorías del factor. En 3)
y 4), los factores son concentración de madera dura y cantidad de tinte, respectivamente; estos dos factores son de naturaleza cuantitativa, por lo que los niveles identifican
diferentes ajustes del factor. Cuando el factor de interés es cuantitativo, también se
pueden utilizar técnicas estadísticas de análisis de regresión (discutido en los capítulos
12 y 13) para analizar los datos.
Este capítulo se enfoca en el ANOVA unifactorial. La sección 10.1 presenta la
prueba F para probar la hipótesis nula de que las medias de la población o tratamiento son idénticas. La sección 10.2 considera un análisis adicional de los datos cuando H0
ha sido rechazada. La sección 10.3 se ocupa de algunos otros aspectos del ANOVA unifactorial. El capítulo 11 introduce experimentos ANOVA que implican más de un factor.
10.1 ANOVA unifactorial
El ANOVA unifactorial se enfoca en la comparación de más de dos medias de población o
tratamiento. Sean
I el número de poblaciones o tratamientos que se están comparando.
1 la media de la población 1 o la respuesta promedio verdadera cuando se aplica
el tratamiento 1.
I la media de la población I o la respuesta promedio verdadera cuando se aplica el
tratamiento I.
Las hipótesis pertinentes son
H0: 1 2 · · · I
contra
Ha: por lo menos dos de las i son diferentes.
Si I 4, H0 es verdadera sólo si las cuatro i son idénticas. Ha sería verdadera, por ejemplo, si 1 2 3 4, si 1 3 4 2, o si las cuatro i difieren una de otra.
Una prueba de estas hipótesis requiere que se tenga disponible una muestra aleatoria
de cada población o tratamiento.
Ejemplo 10.1
El artículo “Compression of Single-Wall Corrugated Shipping Containers Using Fixed and
Floating Test Platens” (J. Testing and Evaluation, 1992: 318-320) describe un experimento en el cual se compararon varios tipos diferentes de cajas con respecto a resistencia a la
www.FreeLibros.me
c10_p369-396.qxd
3/12/08
4:23 AM
Page 371
10.1 ANOVA unifactorial
371
compresión (lb). La tabla 10.1 presenta los resultados de un experimento ANOVA unifactorial que implica I 4 tipos de cajas (las medias y desviaciones estándar muestrales concuerdan con los valores dados en el artículo).
Tabla 10.1 Datos y cantidades resumidas para el ejemplo 10.1
Tipo de caja
Resistencia a la compresión (lb)
1
2
3
4
655.5
789.2
737.1
535.1
788.3
772.5
639.0
628.7
734.3
786.9
696.3
542.4
Media muestral
DE muestral
699.4
774.8
727.1
520.0
713.00
756.93
698.07
562.02
46.55
40.34
37.20
39.87
Gran media
682.50
721.4
686.1
671.7
559.0
679.1
732.1
717.2
586.9
Con i denotando la resistencia a la compresión promedio verdadera de las cajas de tipo
i (i 1, 2, 3, 4), la hipótesis nula es H0: 1 2 3 4. La figura 10.1a) muestra una
gráfica de caja comparativa para las cuatro muestras. Existe una cantidad sustancial de traslape entre las observaciones de los primeros tres tipos de cajas, pero las resistencias a la
compresión del cuarto tipo parecen considerablemente más pequeñas que para los demás tipos. Esto sugiere que H0 no es verdadera. La gráfica de caja que aparece en el figura 10.1b)
está basada en agregar 120 a cada observación en la cuarta muestra (y así se obtiene una media de 682.02 y la misma desviación estándar) y las demás observaciones no cambian. Ya
no es obvio si H0 es verdadera o falsa. En situaciones como ésta, se requiere un procedimiento de prueba formal.
1
2
3
4
550
650
600
700
750
a)
1
2
3
4
630
660
690
720
750
780
b)
Figura 10.1
Gráficas de caja para el ejemplo 10.1: a) datos originales; b) datos modificados. ■
www.FreeLibros.me
c10_p369-396.qxd
372
3/12/08
CAPÍTULO 10
4:23 AM
Page 372
Análisis de la varianza
Notación y suposiciones
En problemas de dos muestras se utilizaron las letras X y Y para diferenciar las observaciones en una muestra de aquellas en la otra. Como esto es engorroso con tres o más muestras,
se acostumbra utilizar una sola letra con dos subíndices. El primero identifica el número de
la muestra, correspondiente a la población o tratamiento que se está muestreando y el segundo denota la posición de la observación dentro de dicha muestra. Sean
Xi,j la variable aleatoria (va) que denota la medición j-ésima tomada en la población
i-ésima o la medición tomada en la unidad experimental j-ésima que recibe el
tratamiento i-ésimo.
xi,j el valor observado de Xi,j cuando se realiza el experimento.
Los datos observados normalmente se muestran en una tabla rectangular, tal como la
tabla 10.1. En ella las muestras de las diferentes poblaciones aparecen en filas distintas de
la tabla y xi,j es el número j-ésimo en la fila i-ésima. Por ejemplo x2,3 786.9 (la tercera observación de la segunda población) y x4,1 535.1. Cuando no hay ambigüedad, se escribirá
xij en lugar de xi,j (p. ej., si se realizaron 15 observaciones en cada uno de los 12 tratamientos,
x112 podría significar x1,12 o x11,2). Se supone que las Xij dentro de cualquier muestra particular
son independientes, una muestra aleatoria de la distribución de población o tratamiento
i-ésima, y que las diferentes muestras son independientes entre sí.
En algunos experimentos, diferentes muestras contienen distintos números de observaciones. Aquí se abordará el caso de tamaños de muestra iguales; la generalización en
cuanto a tamaños de muestra desiguales aparece en la sección 10.3. Sea J el número de observaciones en cada muestra (J 6 en el ejemplo 10.1). El conjunto de datos se compone
de IJ observaciones. Las medias de muestra individual serán denotadas por X
XI.
1, X
2, . . . ,
Es decir,
J
Xij
X
i
j1
i 1, 2, . . . , I
J
El punto en lugar del segundo subíndice significa que se sumaron todos los valores de dicho subíndice al mismo tiempo que se mantuvo fijo el valor del otro subíndice y la raya horizontal indica división entre J para obtener un promedio. Asimismo, el promedio de todas
las observaciones IJ, llamada gran media, es
I
X
J
Xij
i1 j1
IJ
Con los datos de resistencia en la tabla 10.1, x1 713.00, x2 756.93, x3 698.07,
x4 562.02 y x 682.50. Además, sean S 21, S 22, . . . , S 2I las varianzas muestrales:
J
(Xij X
i) 2
S 2i
j1
i 1, 2, . . . , I
J1
De acuerdo con el ejemplo 10.1, s1 46.55, s21 2166.90, y así sucesivamente.
SUPOSICIONES
La población o tratamiento I son normales con la misma varianza 2, es decir, cada
Xij está normalmente distribuida con
E(Xij) i
V(Xij) 2
www.FreeLibros.me
c10_p369-396.qxd
3/12/08
4:23 AM
Page 373
10.1 ANOVA unifactorial
373
Las desviaciones estándar de la muestra I en general difieren un poco aun cuando las
correspondientes sean idénticas. En el ejemplo 10.1, la más grande entre s1, s2, s3 y s4
es aproximadamente 1.25 veces la más pequeña. Una regla empírica preliminar es que si la s
más grande no es mucho más de dos veces la más pequeña, es razonable suponer 2 iguales.
En capítulos previos, se sugirió un diagrama de probabilidad normal para verificar en
cuanto a normalidad. Los tamaños de muestra individuales en ANOVA típicamente son
demasiado pequeños como para que los distintos diagramas I sean informativos. Se puede
construir un solo diagrama restando x1 de cada observación en la primera muestra, x2
de cada observación en la segunda y así sucesivamente y luego dibujando estas desviaciones IJ contra los percentiles z. La figura 10.2 da ese diagrama para los datos del ejemplo
10.1. La linealidad de la gráfica confirma fuertemente la suposición de normalidad.
Desviación
50
0
–50
Percentil z
–1.4
Figura 10.2
–0.7
0
0.7
1.4
Diagrama de probabilidad normal basado en los datos del ejemplo 10.1.
Si la suposición de normalidad o la suposición de varianzas iguales se supone infactible, habrá que emplear un método de análisis distinto de la prueba F usual. Búsquese por
favor asesoría experta en tales situaciones (en la sección 10.3 se sugiere una posibilidad, una
transformación de datos).
El estadístico de prueba
Si H0 es verdadera, las J observaciones en cada muestra provienen de una distribución normal con el mismo valor medio , en cuyo caso las medias muestrales x1, . . . , xI deberán
ser razonablemente parecidas. El procedimiento de prueba se basa en comparar una medida de diferencias entre las xi (variación “entre muestras”) con una medida de variación
calculada desde adentro de cada una de las muestras.
DEFINICIÓN
El cuadrado de la media de tratamientos está dado por
CMTr
J
[(X
1 X
)2 (X
2 X
)2 (X
I X
)2]
I1
J
I1
(X
i X
)2
i
y el cuadrado de la media de error es
CME
S 21 S 22 S 2I
I
El estadístico de prueba para ANOVA unifactorial es F CMTr/CME.
www.FreeLibros.me
c10_p369-396.qxd
374
3/12/08
CAPÍTULO 10
4:23 AM
Page 374
Análisis de la varianza
La terminología “cuadrado de la media” se explicará en breve. Obsérvese que se utilizan
X
y S 2 mayúsculas, de modo que CMTr y CME se definen como estadísticos. Se seguirá la tradición y también se utilizarán CMTr y CME (en lugar de cmtr y cme) para denotar los
valores calculados de estos estadísticos. Cada S 2i evalúa la variación dentro de una muestra
particular, así que CME es una medida de variación dentro de muestras.
¿Qué clase de valor de F proporciona evidencia en pro o en contra de H0? Si H0 es
verdadera (todas las i son iguales), los valores de las medias muestrales individuales deberán estar próximos entre sí y por consiguiente próximos a la gran media, con el resultado de
un valor pequeño de CMTr. Sin embargo, si las i son bastante diferentes, algunas xi s
difieren un poco de x. De modo que el valor de CMTr es afectado por el estado de H0 (verdadera o falsa). Este no es el caso con CME, porque las s2i dependen sólo del valor subyacente de 2 y no de donde están centradas las diversas distribuciones. El siguiente recuadro
presenta una propiedad importante de E(CMTr) y E(CME), los valores esperados de estos
dos estadísticos.
PROPOSICIÓN
Cuando H0 es verdadera
E(CMTr) E(CME) 2
mientras que cuando H0 es falsa
E(CMTr) E(CME) 2
Es decir, ambos estadísticos son insesgados para estimar la varianza de población común 2 cuando H0 es verdadera, pero CMTr tiende a sobreestimar 2 cuando H0 es
falsa.
El insesgamiento de CME es una consecuencia de E(S 2i ) 2 si H0 es verdadera o falsa.
Cuando H0 es verdadera, cada X
i tiene el mismo valor medio y varianza 2/J de modo que
(X
i X
)2/(I 1), la “varianza muestral” de las X
i , estima 2/J insesgadamente; multiplicando ésta por J se obtiene CMTr como un estimador insesgado de 2 misma. Las X
i
tienden a dispersarse más cuando H0 es falsa que cuando es verdadera y tiende a inflar el
valor de CMTr en este caso. Por consiguiente, un valor de F que excede en gran medida a 1,
correspondiente a CMTr mucho más grande que CME, provoca una duda considerable sobre H0. La forma de la región de rechazo es f c. La c de corte debe ser seleccionada para
que dé P(F c cuando H0 es verdadera) , el nivel de significación deseado. Por consiguiente, se requiere la distribución de F cuando H0 es verdadera.
Distribuciones F y la prueba F
En el capítulo 9, se introdujo una familia de distribuciones de probabilidad llamada distribuciones F en conexión con una proporción en la cual existe un número de grados de libertad (gl) asociado con el numerador y otro número de grados de libertad asociado con el
denominador. Sean 1 y 2 el número de grados de libertad asociado con el numerador y denominador, respectivamente, para una variable con una distribución F. Tanto 1 como 2 son
enteros positivos. La figura 10.3 ilustra una curva de densidad F y el valor crítico de cola
superior correspondiente, F, , . La tabla A.9 da estos valores críticos para 0.10, 0.05,
0.01 y 0.001. Los valores de 1 están identificados con diferentes columnas de la tabla y las
filas con varios valores de 2. Por ejemplo, el valor crítico F que captura un área de cola superior de 0.05 bajo la curva con 1 4 y 2 6 es F0.05,4,6 4.53 en tanto que F0.05,6,4 6.16.
El resultado teórico clave es que el estadístico de prueba F tiene una distribución F cuando
H0 es verdadera.
1
2
www.FreeLibros.me
c10_p369-396.qxd
3/12/08
4:23 AM
Page 375
10.1 ANOVA unifactorial
375
Curva F con 1 y 2 grados de libertad
Área sombreada
F , 1, 2
Figura 10.3
TEOREMA
Ejemplo 10.2
(continuación
del ejemplo
10.1)
Una curva F y valor crítico F,
1, 2
.
Sea F CMTr/CME el estadístico de prueba en un problema de ANOVA unifactorial que implica poblaciones o tratamientos I con una muestra aleatoria de J observaciones de cada uno. Cuando H0 es verdadera y la suposición básica de esta sección se
satisface, F tiene una distribución F con 1 I 1 y 2 I(J 1). Con f denotando el valor calculado de F, la región de rechazo f F,I1,I(J1) especifica entonces
una prueba con nivel de significación . Remítase a la sección 9.5 para ver cómo se
obtiene información sobre el valor P para pruebas F.
El razonamiento para 1 I 1 es que aunque CMTr está basada en las I desviaciones X
X, . . . ,
XI
X, (X
X) 0, de modo que sólo I 1 de éstas son libre1
i
mente determinadas. Como cada muestra contribuye con J 1 grados de libertad a CME y
estas muestras son independientes, 2 (J 1) (J 1) I(J 1).
Los valores de I y J con los datos de resistencia son 4 y 6, respectivamente, de modo
que grados de libertad I 1 3 asociados con el numerador y grados de libertad
I(J 1) 20 asociados con el denominador. A un nivel de significación de 0.05, H0:
1 2 3 4 será rechazada en favor de la conclusión de que por lo menos dos i
son diferentes si f F0.05,3,20 3.10. La gran media es x xij /(IJ) 682.50
CMTr
6
[(713.00 682.50)2 (756.93 682.50)2
41
(698.07 682.50)2 (562.02 682.50)2] 42 455.86
CME
1
[(46.55)2 (40.34)2 (37.20)2 (39.87)2] 1691.92
4
f CMTr/CME 42 455.86/1691.92 25.09
Como 25.09 3.10, H0 es resonantemente rechazada a un nivel de significación de 0.05.
La resistencia a la compresión promedio verdadera sí parece depender del tipo de caja. En
realidad, valor P área bajo la curva F a la derecha de 25.09 0.000. H0 sería rechazada
a cualquier nivel de significación razonable.
■
Sumas de los cuadrados
La introducción de las sumas de los cuadrados facilita el desarrollo de una apreciación intuitiva para el razonamiento que fundamenta los ANOVA unifactoriales y multifactoriales.
Sea xi la suma (no el promedio, puesto que no hay raya) de las xij con i fija (suma de los
números en la i-ésima fila de la tabla) y x denota la suma de todas las xij (el gran total).
www.FreeLibros.me
c10_p369-396.qxd
376
3/12/08
CAPÍTULO 10
4:23 AM
Page 376
Análisis de la varianza
DEFINICIÓN
La suma total de los cuadrados (STC), la suma de los cuadrados del tratamiento
(STC) y la suma de los cuadrados del error (SCE) están dadas por
I
STC
J
I
i1 j1
I
STC
i1 j1
J
(xi x)2
i1 j1
I
SCE
J
(xij x)2 x2ij
J
(xij xi)2
i1 j1
1
J
I
x2i
i1
1 2
x
IJ
1 2
x
IJ
J
donde xi xij
j1
I
x
J
xij
i1 j1
La suma de los cuadrados STC aparece en el numerador de F y SCE lo hace en el denominador; la razón para definir la STC se pondrá de manifiesto en breve.
Las expresiones a la extrema derecha de STC y STC son convenientes si los cálculos
de ANOVA se realizan a mano, aunque la amplia disponibilidad de programas estadísticos hace que esto sea innecesario. Tanto STC como STC implican x2 /(IJ) (el cuadrado del gran
total dividido entre IJ), lo que normalmente se llama factor de corrección para la media
(FC). Una vez que se calcula el factor de corrección, la STC se obtiene elevando al cuadrado
cada número que aparece en la tabla, sumando los cuadrados y restando el factor de corrección. STC se obtiene al elevar al cuadrado cada total de fila, sumándolos, dividiendo entre J y
restando el factor de corrección.
Una fórmula para calcular SCE es una consecuencia de una relación simple entre las
tres sumas de cuadrados.
Identidad fundamental
STC STC SCE
(10.1)
Por consiguiente, si se calculan dos cualesquiera de las sumas de los cuadrados, la tercera
se obtiene con (10.1); STC y STC son las más fáciles de calcular y en ese caso SCE STC
STC. La comprobación se desprende de elevar al cuadrado ambos lados de la relación
xij x (xij xi) (xi x)
(10.2)
y sumando todas las i y j. Esto da la STC a la izquierda y STC y SCE como los dos términos extremos a la derecha. Es fácil ver que el término del producto cruz es cero.
La interpretación de la identidad fundamental es una importante ayuda para entender
el ANOVA. STC mide la variación total de los datos: la suma de todas las desviaciones al
cuadrado con respecto a la gran media. La identidad dice que esta variación total puede ser
dividida en dos partes. SCE mide la variación que estaría presente (en las filas) aun cuando
H0 fuera verdadera y es por consiguiente la parte de la variación total que no es explicada
por la veracidad o la falsedad de H0. STC es la cantidad de variación (entre filas) que pueden ser explicadas por las posibles diferencias en las i. Si la variación explicada es grande
con respecto a la variación no explicada, entonces H0 es rechazada en favor de Ha:
www.FreeLibros.me
c10_p369-396.qxd
3/12/08
4:23 AM
Page 377
10.1 ANOVA unifactorial
377
Una vez que STC y SCE se calculan, cada uno se divide por su número de grados de
libertad asociado para obtener un cuadrado de la media (media en el sentido de promedio).
Entonces F es la proporción de los dos cuadrados de la media.
CMTr
STC
I1
CME
SCE
I(J 1)
F
CMTr
CME
(10.3)
Con frecuencia, los cálculos se resumen en un formato tabular, llamado tabla ANOVA, como se ilustra en la tabla 10.2. Las tablas producidas por programas estadísticos comúnmente incluyen una columna de valor P a la derecha de f.
Ejemplo 10.3
TABLA 10.2
Tabla ANOVA
Origen de
la variación
Grados de
libertad
Tratamientos
Error
Total
I1
I(J 1)
IJ 1
Suma de
los cuadrados
Cuadrado de la media
CMTr STCr/(I 1)
CME SCE/[I(J 1)]
STC
SCE
STC
f
CMTr/CME
Los datos adjuntos se obtuvieron con un experimento que compara el grado de manchado
de telas copolimerizadas con tres mezclas diferentes de ácido metracrílico (datos similares
aparecieron en el artículo “Chemical Factors Affecting Soiling and Soil Release from Cotton
DP Fabric”, American Dyestuff Reporter, 1983: 25-30).
xi
Mezcla 1
Mezcla 2
Mezcla 3
0.56
0.72
0.62
1.12
0.69
1.08
0.90
0.87
1.07
1.07
0.78
0.99
0.94
0.91
0.93
4.59
3.97
4.69
x 13.25
xi
0.918
0.794
0.938
Sea i el grado de manchado promedio verdadero de manchado cuando se utiliza una mezcla i (i 1, 2, 3). La hipótesis nula H0: 1 2 3 manifiesta que el grado de manchado promedio verdadero es idéntico con las tres mezclas. Se realizará una prueba a un nivel
de significación de 0.01 para ver si H0 deberá ser rechazada a favor de la aseveración de
que el grado de manchado promedio verdadero no es el mismo con todas las mezclas. Como I 1 2 e I(J 1) 12, el valor crítico F de la región de rechazo es F0.01,2,12 6.93.
Elevando al cuadrado cada una de las 15 observaciones y sumando se obtiene
x 2ij (0.56)2 (1.12)2 (0.93)2 12.1351. Los valores de las tres sumas de los
cuadrados son
STC 12.1351 (13.25)2/15 12.1351 11.7042 0.4309
STCr
1
[(4.59)2 (3.97)2 (4.69)2] 11.7042
5
11.7650 11.7042 0.0608
SCE 0.4309 0.0608 0.3701
El resto de los cálculos se ilustra en la tabla ANOVA adjunta. Como f 0.99 no es
por lo menos F0.01,2,12 6.93. H0 no es rechazada a un nivel de significación de 0.01.
www.FreeLibros.me
c10_p369-396.qxd
378
3/12/08
CAPÍTULO 10
4:23 AM
Page 378
Análisis de la varianza
Parece que las mezclas son indistinguibles con respecto al grado de manchado (F0.10,2,12
2.8 valor P 0.10).
Origen de la variación
Grados de
libertad
Suma de
los cuadrados
Cuadrado
de la media
Tratamientos
Error
Total
2
12
14
0.0608
0.3701
0.4309
0.0304
0.0308
f
0.99
■
Cuando la prueba F hace que H0 sea rechazada, con frecuencia al experimentador le
interesará realizar un análisis más amplio para decidir cuáles de las i difieren de cuáles
otras. El procedimiento para hacer esto se llama procedimientos de comparación múltiple y
en las dos secciones siguientes se describen varios.
EJERCICIOS
Sección 10.1 (1-10)
1. En un experimento para comparar las resistencias a la tensión de I 5 tipos diferentes de alambre de cobre, se utilizaron J 4 muestras de cada tipo. Las estimaciones entre
muestras y dentro de muestras de 2 se calcularon como
CMTr 2673.3 y CME 1094.2, respectivamente.
a. Use la prueba F a un nivel de 0.05 para probar H0: 1
2 3 4 5 contra Ha: por lo menos dos i son
desiguales.
b. ¿Qué se puede decir sobre el valor P para la prueba?
2. Suponga que las observaciones de resistencia a la compresión del cuarto tipo de caja del ejemplo 10.1 hubieran sido
655.1, 748.7, 662.4, 679.0, 706.9 y 640.0 (obtenidas sumando 120 a cada x4j previa). Suponiendo que las observaciones
restantes no cambian, realice una prueba F con 0.05.
3. Se determinó el rendimiento en lúmenes de cada uno de
I 3 marcas diferentes de focos de luz blanca de 60 watts,
con J 8 focos de cada marca probados. Las sumas de
los cuadrados se calcularon como SCE 4773.3 y
STC 591.2. Formule las hipótesis de interés (incluidas
definiciones en palabras de los parámetros) y use la prueba
F de ANOVA ( 0.05) para decidir si existen diferencias
en los rendimientos de lúmenes promedio verdaderos entre
las tres marcas de este tipo de foco obteniendo tanta información como sea posible sobre el valor P.
4. En un estudio para evaluar los efectos de la infección de
malaria en mosquitos huésped (“Plasmodium Cynomolgi:
Effects of Malaria Infection on Laboratory Flight Performance of Anopheles Stephensi Mosquitos”, Experimental
Parasitology, 1977: 397-404), mosquitos fueron alimentados
con macacos de la India infecciosos y no infecciosos. Subsecuentemente se midió la distancia que volaban durante 24 horas por medio de un molino de vuelo. Los mosquitos se
dividieron en cuatro grupos de ocho cada uno: macacos infecciosos y sporozites presentes (IRS), macacos infecciosos
y oocitos presentes (IRD), macaco infeccioso y ninguna infección desarrollada (IRN) y no infecciosos (C). Los valores
son x1 4.39 (IRS), x2 4.52 (IRD), x3 5.49 (IRN),
2
x4 6.36 (C), x 5.19 y x ij 911.91. Use la prueba
F ANOVA a un nivel de 0.05 para determinar si existen diferencias entre los tiempos de vuelo promedio verdaderos
con los cuatro tratamientos.
5. Considere los siguientes datos del módulo de elasticidad
( 106 lb/pulg2) de madera de tres grados diferentes (en concordancia con los valores que aparecen en el artículo, “Bending Strength and Stiffness of Second-Growth: Douglas-Fir
Dimension Lumber” (Forest Products J., 1991: 35-43), excepto que los tamaños de muestra allí eran más grandes):
Grado
J
xi
si
1
2
3
10
10
10
1.63
1.56
1.42
0.27
0.24
0.26
Use estos datos y nivel de significación de 0.01 para probar
la hipótesis nula de no diferencia en el módulo de media de
elasticidad para los tres grados.
6. El artículo, “Origin of Precambrian Iron Formations”
(Econ. Geology, 1964: 1025-1057) reporta los siguientes
datos sobre Fe total para cuatro tipos de formación de hierro
(1 carbonato, 2 silicato, 3 magnetita, 4 hematita).
1: 20.5 28.1 27.8 27.0 28.0
25.2 25.3 27.1 20.5 31.3
2: 26.3 24.0 26.2 20.2 23.7
34.0 17.1 26.8 23.7 24.9
3: 29.5 34.0 27.5 29.4 27.9
26.2 29.9 29.5 30.0 35.6
4: 36.5 44.2 34.1 30.3 31.4
33.1 34.1 32.9 36.3 25.5
Analice con una prueba F de varianza a un nivel de significación de 0.01 y resuma los resultados en una tabla ANOVA.
www.FreeLibros.me
c10_p369-396.qxd
3/12/08
4:23 AM
Page 379
10.2 Comparaciones múltiples en ANOVA
7. En un experimento para investigar el desempeño de cuatro
marcas diferentes de bujías destinadas para usarse en una
motocicleta de dos tiempos de 125 cc, se probaron cinco
bujías de cada marca y el número de millas (a una velocidad constante) hasta que se observó una falla. Aquí se da la
tabla ANOVA parcial para los datos. Llene las entradas que
faltan, formule las hipótesis pertinentes y realice una prueba para obtener tanta información como sea posible sobre el
valor P.
Origen de Grados de
Suma de Cuadrado de
la variación libertad los cuadrados la media
Marca
Error
Total
f
14 713.69
379
¿Tiene algún efecto la variación de la longitud de placas en
la rigidez axial promedio verdadera? Formule y pruebe las
hipótesis pertinentes mediante un análisis de varianza con
0.01. Muestre sus resultados en una tabla ANOVA.
[Sugerencia: x 2ij 5 241, 420.79.]
9. Se analizaron seis muestras de cada uno de cuatro tipos de
crecimiento de granos de cereal en una región para determinar el contenido de tiamina y se obtuvieron los siguientes
resultados (g/g):
Trigo
Cebada
Maíz
Avena
5.2
6.5
5.8
8.3
4.5
8.0
4.7
6.1
6.0
6.1
6.4
7.8
6.1
7.5
4.9
7.0
6.7
5.9
6.0
5.5
5.8
5.6
5.2
7.2
310 500.76
8. Un estudio de las propiedades de armaduras conectadas con
placas metálicas para soportar techos (“Modeling Joints
Made with Light-Gauge Metal Connector Plates”, Forest
Products J., 1979: 39-44) dio las siguientes observaciones
de índice de rigidez axial (klb/pulg) de tramos de placa de
4, 6, 8, 10 y 12 pulg.
4: 309.2 409.5 311.0 326.5 316.8
349.8 309.7
6: 402.1 347.2 361.0 404.5 331.0
348.9 381.7
8: 392.4 366.2 351.0 357.1 409.9
367.3 382.0
10: 346.7 452.9 461.4 433.1 410.6
384.2 362.6
12: 407.4 441.8 419.9 410.7 473.4
441.2 465.8
¿Sugieren estos datos que por lo menos dos de los granos
difieren con respecto al contenido de tiamina promedio
verdadero? Use un nivel 0.05 con base en el método
del valor P.
10. En ANOVA unifactorial con tratamientos I y observaciones
J por cada tratamiento, sea (1/I)i.
a. Exprese E(X
) en función de . [Sugerencia: X
(1/I)X
i]
2
b. Calcule E(X
i). [Sugerencia: Con cualquier variable
2
aleatoria Y, E(Y ) V(Y) [E(Y)]2.]
2
c. Calcule E(X
).
d. Calcule E(STCr)y luego demuestre que
E(CMTr) 2
J
(i )2
I1
e. Con el resultado del inciso d) ¿cuál es E(CMTr) cuando
H0 es verdadera? Cuando H0 es falsa, ¿se compara
E(CMTr) con 2?
10.2 Comparaciones múltiples en ANOVA
Cuando el valor calculado del estadístico F en un ANOVA unifactorial no es significativo, el
análisis se termina porque no han identificado diferencias entre las i. Pero cuando H0 es
rechazada, el investigador normalmente deseará saber cuáles de las i son diferentes una de
otra. Un método de realizar este análisis se llama procedimiento de comparaciones múltiples.
Varios de tales procedimientos más frecuentemente utilizados están basados en la siguiente idea central. Primero se calcula un intervalo de confianza para cada diferencia i j
con i j. Por consiguiente si I 4, los seis intervalos de confianza requeridos serían para
1 2 (pero no para 2 1), 1 3, 1 4, 2 3, 2 4 y 3 4. Entonces si el intervalo para 1 2 no incluye 0, se concluye que 1 y 2 difieren significativamente una de otra, si el intervalo sí incluye 0, se considera que las dos no difieren de
manera significativa. Si se sigue la misma línea de razonamiento para cada uno de los
demás intervalos, finalmente se es capaz de juzgar si cada par de difieren o no en forma
significativa una de otra.
Los procedimientos basados en esta idea difieren en el método utilizado para calcular
los varios intervalos de confianza. Aquí se presenta un método popular que controla el nivel de confianza simultáneo para todos los intervalos I(I 1)/2 calculados.
www.FreeLibros.me
c10_p369-396.qxd
380
3/12/08
CAPÍTULO 10
4:23 AM
Page 380
Análisis de la varianza
Procedimiento de Tukey (el método T )
El procedimiento de Tukey implica utilizar otra distribución de probabilidad llamada distribución de rango estudentizado. La distribución depende de dos parámetros: un m grado
de libertad asociado con el numerador y un grado de libertad asociado con el denominador .
Sea Q,m,v el valor crítico de cola superior de la distribución de rango estudentizado con m
grados de libertad asociados con el numerador y grados de libertad asociados con el denominador (análogo a F, , . En la tabla A.10 se dan valores de Q,m, .
1
PROPOSICIÓN
2
Con la probabilidad 1 ,
X
M
E
/J i j
i X
j Q,I,I(J1) C
Xi
Xj Q,I,I(J1) C
M
E
/J
(10.4)
Para cada i y j (i 1, . . . , I y j 1, . . . , I) con i j.
Obsérvese que los grados de libertad asociados con el numerador para el valor crítico Q es I,
el número de medias de la población o tratamiento que se están comparando y no I 1 como en la prueba F. Cuando las xi, xj y CME se sustituyen en (10.4), el resultado es
un conjunto de intervalos de confianza con nivel de confianza simultáneo de 100(1 )%
para todas las diferencias de la forma i j con i j. Cada intervalo que no incluye 0
da lugar a la conclusión de que los valores correspondientes de i y j difieren significativamente uno de otro.
Como en realidad no interesan los límites inferior y superior de los diversos intervalos sino sólo cuál incluye 0 y cuál no, mucha de la aritmética asociada con (10.4) puede ser
evitada. El siguiente recuadro da detalles y describe cómo se pueden identificar las diferencias de modo visual con un “patrón de subrayado”.
Método T para identificar i significativamente diferentes
Se selecciona , se extrae Q,I,I(J1) de la tabla A.10 y se calcula w Q,I,I(J1)
C
M
E
/J. Luego se hace una lista de las medias muestrales en orden creciente y se
subrayan los pares que difieren menos de w. Cualquier media muestral no subrayada
por la misma raya corresponde a un par de medias de población o tratamiento juzgadas significativamente diferentes.
Supóngase, por ejemplo, que I 5 y que
x2 x5 x4 x1 x3
Entonces
1. Considere en primer lugar la media más pequeña x2. Si x5 x2 w, prosiga al paso 2.
Sin embargo, si x5 x2 w, conecte estas primeras dos medias con un segmento de
línea. Luego si es posible extienda este segmento de línea más a la derecha de la xi más
grande que difiera de x2 en menos de w (de modo que la línea pueda conectar dos, tres
o incluso más medias).
2. Ahora siga con x5 y otra vez extienda el segmento de línea hasta la derecha de la xi más
grande que difiera de x5 en menos de w (puede que sea posible trazar esta línea o alternativamente puede que subraye sólo dos medias o tres o incluso las cuatro medias restantes).
3. Continúe con x4 y repita y finalmente continúe con x1.
www.FreeLibros.me
c10_p369-396.qxd
3/12/08
4:23 AM
Page 381
10.2 Comparaciones múltiples en ANOVA
381
Para resumir, comenzando en cada media que aparece en la lista ordenada, un segmento de
línea se extiende tan lejos a la derecha como sea posible en tanto que la diferencia entre las
medias sea menor que w. Es fácil verificar que un intervalo particular de la forma (10.4)
contendrá 0 si y sólo si el par correspondiente de medias muestrales está subrayado por el
mismo segmento de línea.
Ejemplo 10.4
Se realizó un experimento para comparar cinco marcas diferentes de filtros de aceite para
automóviles con respecto a su capacidad de atrapar materia extraña. Sea i la cantidad promedio verdadera de material atrapado por filtros marca i (i 1, . . . , 5) en condiciones controladas. Se utilizó una muestra de nueve filtros de cada marca y se obtuvieron las siguientes
cantidades medias muestrales: x1 14.5, x2 13.8, x3 13.3, x4 14.3 y x5 13.1. La
tabla 10.3 es una tabla ANOVA que resume la primera parte del análisis.
Tabla 10.3 Tabla ANOVA para el ejemplo 10.4
Origen de la variación
Grados de
libertad
Suma de
los cuadrados
Cuadrado
de la media
Tratamientos (marcas)
Error
Total
4
40
44
13.32
3.53
16.85
3.33
0.088
f
37.84
Como F0.05,4,40 2.61, H0 es rechazada (decisivamente) a un nivel de 0.05. Ahora utilice el
procedimiento de Tukey para buscar diferencias significativas entre las i. En la tabla A.10
del apéndice, Q0.05,5,40 4.04 (el segundo subíndice de Q es I y no I 1 como en F), por lo
tanto w 4.040.088/9 0.4. Después de ordenar las cinco medias muestrales en orden
creciente, un segmento de línea puede conectar a las dos más pequeñas porque difieren por
menos de 0.4. No obstante, este segmento no puede ser extendido más a la derecha puesto
que 13.8 13.1 0.7 0.4. Moviéndose una media a la derecha, el par x3 y x2 no puede ser subrayado porque estas medias difieren por más de 0.4. De nuevo moviéndose a la
derecha, la siguiente media, 13.8, no puede ser conectada a algo que esté más a la derecha.
Las dos últimas medias pueden ser subrayadas con el mismo segmento de línea.
x5
13.1
x3
13.3
x2
13.8
x4
14.3
x1
14.5
Así pues las marcas 1 y 4 no son significativamente diferentes una de otra, pero sí son más
altas de manera significativa que las otras tres marcas en sus contenidos promedio verdaderos. La marca 2 es significativamente mejor que la 3 y 5 pero peor que la 1 y 4 y las marcas
3 y 5 no difieren en modo significativo.
Si x2 14.15 en lugar de 13.8 con el mismo valor w calculado, entonces la configuración de medias subrayadas sería
x5
13.1
Ejemplo 10.5
x3
13.3
x2
14.15
x4
14.3
x1
14.5
■
Un biólogo deseaba estudiar los efectos del etanol en el periodo de sueño. Se seleccionó una
muestra de 20 ratas equiparadas por edad y otras características y a cada rata se le administró una inyección oral con una concentración particular de etanol por peso corporal. Luego
se registró el periodo de sueño de movimiento rápido de ojos (REM, por sus siglas en inglés) de cada rata durante 24 horas, con los siguientes resultados:
www.FreeLibros.me
c10_p369-396.qxd
382
3/12/08
CAPÍTULO 10
4:23 AM
Page 382
Análisis de la varianza
Tratamiento (concentración de etanol)
0 (control)
1 g/kg
2 g/kg
4 g/kg
88.6
63.0
44.9
31.0
73.2
53.9
59.5
39.6
91.4
69.2
40.2
45.3
68.0
50.1
56.3
25.2
75.2
71.5
38.7
22.7
xi
xi
396.4
307.7
239.6
163.8
79.28
61.54
47.92
32.76
x 1107.5 x 55.375
¿Indican los datos que el periodo de sueño REM depende de la concentración de etanol?
(Este ejemplo está basado en el experimento reportado en “Relationship of Ethanol Blood
Level to REM and Non-REM Sleep Time and Distribution in the Rat”, Life Sciences, 1978:
839-846.)
Las xi difieren sustancialmente una de otra, aunque también existe una gran cantidad
de variabilidad dentro de cada muestra, por lo que para responder la pregunta con precisión
se debe realizar el ANOVA. Con x 2ij 68 697.6 y el factor de corrección x2 /(IJ)
(1107.5)2/20 61 327.8, las fórmulas dan
STC 68 697.6 61 327.8 7369.8
1
STCr [(396.40)2 (307.70)2 (239.60)2 (163.80)2] 61 327.8
5
67 210.2 61 327.8 5882.4
y
SCE 7369.8 5882.4 1487.4
La tabla 10.4 es una tabla ANOVA SAS. La última columna da el valor P como 0.0001.
Con un nivel de significación de 0.05, se rechaza la hipótesis nula H0: 1 2 3 4,
puesto que valor P 0.0001 0.05 . Parece que el periodo de sueño REM depende del
nivel de concentración.
Tabla 10.4 Tabla ANOVA obtenida con SAS
Análisis de procedimientos de varianza
Variable dependiente: Tiempo
Suma de
Cuadrado de
Origen
GL
cuadrados
la media
Valor F
Modelo
3
5882.35750
1960.78583
21.09
Error
16
1487.40000
92.96250
Corregido
Total
19
7369.75750
Pr F
0.0001
Existen I 4 tratamientos y 15 grados de libertad asociados con el error, por lo tanto Q0.05,4,16 4.05 y w 4.0593.0
/5
17.47. Ordenando las medias y subrayándolas se
obtiene
x4
32.76
x3
47.92
x2
61.54
x1
79.28
La interpretación de este subrayado debe hacerse con cuidado, puesto que parece que se ha
concluido que los tratamientos 2 y 3 no difieren, 3 y 4 no difieren y no obstante 2 y 4 sí
lo hacen. La forma sugerida de expresar esto es decir que aunque la evidencia permite concluir que los tratamientos 2 y 4 difieren uno de otro, no se ha demostrado que alguno es
www.FreeLibros.me
c10_p369-396.qxd
3/12/08
4:23 AM
Page 383
10.2 Comparaciones múltiples en ANOVA
383
significativamente diferente del 3. El tratamiento 1 tiene un periodo de sueño REM promedio verdadero más alto de manera significativa que cualquiera de los demás tratamientos.
La figura 10.4 muestra resultados obtenidos con SAS a partir de la aplicación del procedimiento de Tukey.
Alfa 0.05 gl 16 CME 92.9625
Valor crítico de rango estudentizado 4.046
Diferencia mínima significante 17.446
Medias con el mismo tipo no son significativamente diferentes.
Agrupación Tukey
A
Media
79.280
N
5
B
B
B
61.540
5
1 gm/kg
47.920
5
2 gm/kg
32.760
5
4 gm/kg
C
C
C
Figura 10.4
Tratamiento
0(control)
Método de Tukey realizado con SAS.
■
Interpretación de en el método de Tukey
Previamente se manifestó que el método de Tukey controla el intervalo de confianza simultáneo. Entonces ¿qué significa “simultáneo” en este caso? Calcúlese un intervalo de confianza de 95% para una media de población basada en una muestra de dicha población y
luego un intervalo de confianza de 95% para una proporción de población p basado en otra
muestra seleccionada independientemente de la primera. Antes de obtener los datos, la probabilidad de que el primer intervalo incluya es de 0.95 y ésta también es la probabilidad
de que el segundo intervalo incluya p. Como las dos muestras se seleccionan de manera
independiente una de otra, la probabilidad de que ambos intervalos incluyan los valores de los
parámetros respectivos es (0.95)(0.95) (0.95)2 0.90. Por consiguiente, el nivel de confianza simultáneo o conjunto para los dos intervalos es aproximadamente de 90%, si se
calculan pares de intervalos una y otra vez con muestras independientes, a la larga aproximadamente 90% de las veces el primer intervalo capturará y el segundo incluirá p. Asimismo, si se calculan tres intervalos de confianza basados en muestras independientes, el nivel
de confianza simultáneo será de 100(0.95)3% 86%. Claramente, a medida que se incrementa el número de intervalos, el nivel de confianza simultáneo de que todos los intervalos
capturen sus respectivos parámetros se reducirá.
Ahora supóngase que se desea mantener el nivel de confianza simultáneo en 95%. Entonces para dos muestras independientes, el nivel de confianza individual para cada una tendría que ser de 1000.95% 97.5%. Mientras más grande es el número de intervalos, más
alto tendría que ser el nivel de confianza individual para mantener el nivel simultáneo en 95%.
El truco en relación con los intervalos Tukey es que no están basados en muestras independientes, CME aparece en todos y varios intervalos comparten las mismas xi (p. ej., en el
caso I 4, tres intervalos diferentes utilizan x1). Esto implica que no existe un argumento de
probabilidad directo para discernir el intervalo de confianza simultáneo de los niveles de confianza individuales. No obstante, se puede demostrar que si se utiliza Q0.05, el nivel de confianza simultáneo se controla a 95%, en tanto que si se utiliza Q0.01 se obtiene un nivel simultáneo
de 99%. Para obtener un nivel simultáneo de 95%, el nivel individual de cada intervalo debe
ser considerablemente más grande que 95%. Expresado en una forma un poco diferente, para
obtener una proporción de error de 5% asociada con un experimento o familia, la proporción
de error por comparación o individual para cada intervalo debe ser considerablemente más pequeña que 0.05. MINITAB le pide al usuario que especifique la proporción de error asociado
con la familia (p. ej., 5%) y luego incluye en los datos de salida la proporción de error individual (véase el ejercicio 16).
www.FreeLibros.me
c10_p369-396.qxd
384
3/12/08
CAPÍTULO 10
4:23 AM
Page 384
Análisis de la varianza
Intervalos de confianza para
otras funciones paramétricas
En algunas situaciones, se desea un intervalo de confianza para una función de las i más
complicada que una diferencia i j. Sea cii, donde las ci son constantes. Una fun1
1
ción como esa es 2 (1 2) 3 (3 4 5), la cual en el contexto del ejemplo 10.4
mide la diferencia entre el grupo compuesto de las dos primeras marcas y la de las últimas
tres. Como las Xij están normalmente distribuidas con E(Xij) i y V(Xij) 2, ˆ ici X
i
está normalmente distribuida, insesgada para , y
2 2
V( ˆ ) V( ci X
Xi)
c
i) c2i V(
J i i
i
i
La estimación de 2 mediante CME y la formación de ˆ ˆ da por resultado una variable t
( ˆ )/ˆ ˆ, la cual puede ser manipulada para obtener el siguiente intervalo de confianza de
100(1 )% para cii:
ci xi ! t/2,I(J1)
Ejemplo 10.6
(continuación
del ejemplo
10.4)
c2i
CME
J
(10.5)
La función paramétrica para comparar las primeras dos marcas de filtro de aceite (tienda)
1
1
con las últimas tres marcas (nacionales) es 2 (1 2) 3 (3 4 5), con la cual
c2i
2 2 3 3 3 6
1
2
1
2
1
2
1
1
2
2
5
1
1
Con ˆ 2 (x1 x2) 3 (x3 x4 x5) 0.583 y CME 0.088, un intervalo de
95% es
0.583 ! 2.0215(0
.0
8
8
)/[(6
)(9
)] 0.583 ! 0.182 (0.401, 0.765)
■
En ocasiones se realiza un experimento para comparar cada uno de varios tratamientos “nuevos” con un tratamiento de control. En tales situaciones, una técnica de comparaciones múltiples llamada método de Dunnett es apropiada.
EJERCICIOS
Sección 10.2 (11-21)
11. En un experimento para comparar las proporciones de cobertura de cinco marcas diferentes de pintura amarilla de látex para interiores disponibles en un área particular se
utilizaron 4 galones (J 4) de cada pintura. Las proporciones de cobertura promedio verdaderas (pies2/gal) de las
cinco marcas fueron x1 462.0, x2 512.8, x3 437.5,
x4 469.3 y x5 532.1. Se encontró que el valor calculado de F es significativo a un nivel de 0.05. Con CME
272.8 use el procedimiento de Tukey para investigar diferencias significativas en las proporciones de cobertura
promedio verdaderas entre marcas.
12. En el ejercicio 11 suponga x3 427.5. Ahora, ¿cuáles proporciones de cobertura promedio verdaderas difieren significativamente una de otra? Asegúrese de utilizar el método
de subrayar para ilustrar sus conclusiones y escriba un párrafo que resuma sus resultados.
13. Repita el ejercicio 12 suponiendo que x2 502.8 además
de x3 427.5.
14. Use el procedimiento de Tukey con los datos del ejercicio 4
para identificar diferencias en los tiempos de vuelo promedio verdaderos entre los cuatro tipos de mosquitos.
15. Use el procedimiento de Tukey con los datos del ejercicio 6 para identificar diferencias en el Fe total promedio
verdadero entre los cuatro tipos de formaciones (use
CME 15.64).
16. Reconsidere los datos de rigidez axial dados en el ejercicio 8.
Los siguientes son datos ANOVA obtenidos con MINITAB.
Análisis de varianza para rigidez
Longitud GL
SC
CM
F
de origen 4
43993
10998
10.48
Error
30
31475
1049
Total
34
75468
Nivel
4
6
8
10
12
N
7
7
7
7
7
Media
333.21
368.06
375.13
407.36
437.17
DesvEst
36.59
28.57
20.83
44.51
26.00
DesvEst agrupada 32.39
Comparaciones por pares de Tukey
Tasa de error grupal 0.0500
Tasa de error individual 0.00693
www.FreeLibros.me
P
0.000
c10_p369-396.qxd
3/12/08
4:23 AM
Page 385
10.3 Más sobre ANOVA unifactorial
Valor crítico 4.10
Intervalos para (media de nivel de columna)
(media de nivel de fila)
4
6
8
10
6
85.0
15.4
8
92.1
8.3
57.3
43.1
10
124.3
23.9
89.5
10.9
82.4
18.0
12
154.2
53.8
119.3
18.9
112.2
11.8
80.0
20.4
a. ¿Es factible que las varianzas de las cinco distribuciones
de rigidez axial sean idénticas? Explique.
b. Use los resultados (sin referencia a la tabla F) para probar las hipótesis pertinentes.
c. Use los intervalos de Tukey dados en los resultados para determinar cuáles medias difieren y construya el patrón
de subrayado correspondiente.
17. Remítase al ejercicio 5. Calcule un intervalo de confianza t
1
de 95% con 2 (1 2) 3.
18. Considere los datos adjuntos sobre crecimiento de plantas
después de la aplicación de diferentes tipos de la hormona del
crecimiento.
Hormona
1 13 17
7 14
2 21 13 20 17
3 18 15 20 17
4
7 11 18 10
5
6 11 15
8
a. Realice una prueba F al nivel 0.05.
b. ¿Qué sucede cuando se aplica el procedimiento de Tukey?
19. Considere una experimento ANOVA unifactorial en el cual
I 3, J 5, x1 10, x2 12 y x3 20. Encuentre un
valor de SCE con el cual f F0.05,2,12 de modo que H0:
385
1 2 3 sea rechazada, aunque cuando se aplica el
procedimiento de Tukey se puede decir que ninguna de las
i difieren significativamente una de otra.
20. Remítase al ejercicio 19 y suponga x1 10, x2 15 y
x3 20. ¿Puede hallar ahora un valor de SCE que produzca semejante contradicción entre la prueba F y el procedimiento de Tukey?
21. El artículo “The Effect of Enzyme Inducing Agents on the
Survival Times of Rats Exposed to Lethal Levels of Nitrogen
Dioxide” (Toxicology and Applied Pharmacology, 1978: 169174) reporta los siguientes datos sobre tiempos de sobrevivencia de ratas expuestas a bióxido de nitrógeno (70 ppm) vía
diferentes regímenes de inyección. Hubo J 14 ratas en cada grupo.
Régimen
1.
2.
3.
4.
5.
6.
Control
3-Metilcolantreno
Alilisopropilacetamida
Fenobarbital
Clorpromacina
Ácido p-Aminobenzoico
xi(min)
si
166
303
266
212
202
184
32
53
54
35
34
31
a. Pruebe las hipótesis nulas de que el tiempo de sobrevivencia promedio verdadero no depende del régimen de
inyección contra la alternativa de que existe alguna dependencia en el régimen de inyección con 0.01.
b. Suponga que se calculan intervalos de confianza de
100(1 )% para k funciones paramétricas diferentes
con el mismo conjunto de datos ANOVA. Entonces es fácil verificar que el nivel de confianza simultáneo es por
lo menos de 100(1 k)%. Calcule intervalos de confianza con nivel de confianza simultáneo por lo menos
1
de 98% para 1 5 (2 3 4 5 6) y
1
4 (2 3 4 5) 6.
10.3 Más sobre ANOVA unifactorial
A continuación se considera con brevedad algunos temas adicionales relacionados con
ANOVA unifactorial. Éstos incluyen una descripción alternativa de los parámetros modelo,
para la prueba F, la relación de la prueba con los procedimientos previamente considerados, la transformación de datos, un modelo de efectos aleatorios y las fórmulas para el caso
de tamaños de muestra desiguales.
El modelo ANOVA
Las suposiciones de ANOVA unifactorial pueden ser descritas sucintamente por medio de
la “ecuación modelo”
Xij i ij
donde ij representa una desviación aleatoria de la población o de la media de tratamiento verdadera i. Se supone que las ij son variables aleatorias independientes normalmente distribuidas (lo que implica que las Xij también lo son) con E(ij) 0 [de modo que E(Xij) i]
www.FreeLibros.me
c10_p369-396.qxd
386
3/12/08
CAPÍTULO 10
4:23 AM
Page 386
Análisis de la varianza
y V(ij) 2 [de donde V(Xij) 2 para todas las i y j]. Una descripción alternativa de
ANOVA unifactorial dará una idea adicional y sugerirá generalizaciones apropiadas de modelos que implican más de un factor. Defínase el parámetro como
1
I
I
i
i1
y los parámetros 1, . . . , I como
i i
(i 1, . . . , I)
Entonces la media del tratamiento i se escribe como i, donde representa la respuesta total promedio verdadera en el experimento y i es el efecto, medido como un alejamiento
de , debido al i-ésimo tratamiento. Mientras que inicialmente se tenían parámetros I, ahora
se tienen parámetros I 1 (, 1, . . . , I). Sin embargo, como i 0 (el alejamiento promedio de la respuesta media total es cero) sólo si I de estos parámetros están determinados de
manera independiente, así que existen muchos parámetros independientes como los hubo antes. En función de y las i, el modelo se vuelve
Xij i ij
(i 1, . . . , I,
j 1, . . . , J)
En el capítulo 11, se desarrollarán modelos análogos para ANOVA multifactorial. La afirmación de que las i son idénticas es equivalente a la igualdad de las i y como i 0,
la hipótesis nula se vuelve
H0: 1 2 I 0
En la sección 10.1, se manifestó que CMTr es un estimador insesgado de 2 cuando
H0 es verdadera aunque de lo contrario tiende a sobrestimar 2. Más precisamente,
E(CMTr) 2
J
2i
I1
Cuando H0 es verdadera, 2i 0 o E(CMTr) 2 (CME es insesgada sea H0 o no verdadera). Si 2i se utiliza como medida del grado al cual H0 es falsa, entonces un valor más
grande de 2i provocará una mayor tendencia de que CMTr sobrestime 2. En el siguiente
capítulo, se utilizarán fórmulas para cuadrados de las medias esperadas en modelos multifactoriales a fin de sugerir cómo formar proporciones F para probar varias hipótesis.
Con cualquier variable aleatoria, Y, E(Y 2)
Comprobación de la fórmula para E(CMTr)
V(Y) [E(Y)]2, por lo tanto
E(STCr) E
J X
1
i
1
J
1
J
2
i
1
1 2
X
J
IJ
1
E(X 2i) IJ E(X 2)
i
1
{V(Xi) [E(Xi)]2} IJ {V(X) [E(X)]2}
i
1
{J 2 [J( i)]2} IJ [IJ 2 (IJ)2]
i
I 2 IJ2 2J i J 2i 2 IJ2
i
(I 1) J
2
i
2i
i
(puesto que i 0)
El resultado se deriva entonces de la relación CMTr STCr/(I 1).
www.FreeLibros.me
■
Page 387
10.3 Más sobre ANOVA unifactorial
387
para la prueba F
Considérese un conjunto de valores de parámetro 1, 2, . . . , I con los cuales H0 no es verdadera. La probabilidad de un error de tipo II, , es la probabilidad de que H0 no sea rechazada cuando ese conjunto es el conjunto de valores verdaderos. Se podría pensar que
tendría que ser determinada por separado por cada configuración diferente de i. Afortunadamente, como para la prueba F depende de las i y 2 sólo mediante 2i / 2, se puede
evaluar al mismo tiempo para muchas alternativas diferentes. Por ejemplo, 2i 4 para
cada uno de los siguientes conjuntos de i con los cuales H0 es falsa, así que es idéntica
para las tres alternativas:
1. 1 1, 2 1, 3 1, 4 1
2. 1 2
, 2 2
, 3 0, 4 0
3. 1 3
, 2 1
/3
, 3 1
/3
, 4 1
/3
La cantidad J 2i / 2 se llama parámetro de no centralidad para ANOVA unidireccional (debido a que H0 es falsa el estadístico de prueba tiene una distribución F no centralizada con éste como uno de sus parámetros) y es una función decreciente del valor de
este parámetro. Por lo tanto, con valores fijos de 2 y J, es más probable que la hipótesis nula sea rechazada para alternativas alejadas de H0 ( 2i grande) que para alternativas próximas a H0. Con un valor fijo de 2i , se reduce a medida que el tamaño de muestra J en
cada tratamiento se incrementa y aumenta a medida que la varianza 2 se incrementa (puesto que una variabilidad subyacente más grande dificulta detectar cualquier alejamiento dado
con respecto a H0).
Como el cálculo a mano de y la determinación del tamaño de muestra para la prueba F son bastante difíciles (como en el caso de pruebas t), los estadísticos han construido
conjuntos de curvas donde se puede obtener . En las figuras 10.5* y 10.6* se muestran conjuntos de curvas para 1 3 y 1 4 grados de libertad asociados con el numerador, respectivamente. Una vez que se especifican los valores de 2 y las i para los cuales se desea
, éstos se utilizan para calcular el valor de , donde 2 (J/I) 2i / 2. Luego se localiza
el valor en conjunto de curvas apropiado sobre el eje horizontal, se sube hasta la
7
6
9
8
10
15
1 3
12
0.97
0.96
0.95
0.94
0.92
0.90
60
20 30
0.98
60
20 30
12 15
9 10
8
7
6
0.99
2
4:23 AM
3/12/08
Potencia 1
c10_p369-396.qxd
0.05
0.01
0.80
0.70
0.60
0.50
0.40
0.30
0.10
1
2
(con 0.01) 1
Figura 10.5
3
2
(con 0.05)
3
Curvas de potencia para la prueba F ANOVA (
4
1
5
3).
* Tomada de E. S. Pearson y H. O. Hartley “Charts of the Power Function for Analysis of Variance Tests, Derived
from the Non-Central F Distribution”, Biometrika, vol. 38, 1951: 112, con el permiso de Biometrika Trustees.
www.FreeLibros.me
c10_p369-396.qxd
CAPÍTULO 10
4:23 AM
Page 388
Análisis de la varianza
8
10
15
6
12
2 0 30
60
7
1 4
9
0.97
0.96
0.95
0.94
0.92
0.90
30 60
1 5 20
1 0 12
8
9
6 7
0.98
2
0.99
Potencia 1
388
3/12/08
0.01
0.05
0.80
0.70
0.60
0.50
0.40
0.30
0.10
1
(con 0.01)
Figura 10.6
2
1
% (con 0.05)
3
2
3
4
Curvas de potencia para la prueba F ANOVA (
1
5
4).
curva asociada con los 2 grados de libertad asociados con el error y se localiza el valor de
la potencia sobre el eje vertical. Finalmente, 1 potencia.
Ejemplo 10.7
Se tienen que investigar los efectos de cuatro tratamientos térmicos diferentes en el punto
de cedencia (tons/pulg2) de lingotes de acero. Un total de ocho lingotes se fundirán utilizando cada tratamiento. Suponga que la desviación estándar verdadera del punto de cedencia
con cualquiera de los cuatro tratamientos es 1. ¿Qué tan probable es que H0 no será rechazada a un nivel de 0.05 si tres de los tratamientos tienen el mismo punto de cedencia esperado y el otro tiene un punto de cedencia esperado que es 1 ton/pulg2 más grande que el
valor común de los otros tres (es decir, la cuarta cedencia está en promedio a 1 desviación
estándar por encima de aquellas con los primeros tres tratamientos)?
1
Suponga que 1 2 3 y 4 1 1, (i)/4 1 4 . Entonces 1
1
1
1
3
1 4 , 2 4 , 3 4 , 4 4 por lo tanto
2
8
4
4 4 4 4 2
1
2
1
2
1
2
3
2
3
y 1.22. Los grados de libertad son 1 I 1 3 y 2 I(J 1) 28, si se interpola visualmente entre 2 20 y 2 30 se obtiene una potencia 0.47 y 0.53. Esta
es algo grande, así que se podría incrementar el valor de J. ¿Cuántos lingotes de cada tipo
se requerirían para dar 0.05 para la alternativa considerada? Probando diferentes valores de J, se puede verificar que J 24 satisfará el requerimiento, pero cualquier J más pequeño no lo hará.
■
Como una alternativa del uso de curvas de potencia, el programa estadístico SAS incluye una función que calcula el área acumulada bajo una curva F no centralizada (se ingresa F, grados de libertad asociados con el numerador, grados de libertad asociados con el
denominador y 2) y esta área es . La versión 14 de MINITAB hace esto y también algo
un tanto diferente. Se le pide al usuario que especifique la diferencia máxima entre las i y
no entre las medias individuales. Por ejemplo, se podría desear calcular la potencia de la prueba cuando I 4, 1 100, 2 101, 3 102 y 4 106. Entonces la diferencia máxima
es 106 100 6. Sin embargo, la potencia no sólo depende de esta diferencia máxima sino
www.FreeLibros.me
c10_p369-396.qxd
3/12/08
4:23 AM
Page 389
10.3 Más sobre ANOVA unifactorial
389
de los valores de todas las i . En esta situación MINITAB calcula el valor de potencia más
pequeño posible sujeto a 1 100 y 4 106, lo cual ocurre cuando las otras dos i se encuentran a la mitad entre 100 y 106. Si esta potencia es de 0.85, entonces se puede decir que
la potencia es de por lo menos 0.85 y es cuando mucho de 0.15 cuando las dos están separadas por 6 (el tamaño de muestra común, y también deben ser especificados). El programa determinará también el tamaño de muestra común si la diferencia máxima y la
potencia mínima están especificadas.
Relación de la prueba F con la prueba t
Cuando el número de tratamientos o poblaciones es I 2, todas las fórmulas y resultados
conectados con la prueba F siguen teniendo sentido, así que se puede utilizar ANOVA para
probar H0: 1 2 contra Ha: 1 2. En este caso, también se puede utilizar una prueba
t con dos muestras de dos colas. En la sección 9.3, se mencionó la prueba t agrupada, la cual
requiere varianzas iguales, como alternativa del procedimiento t con dos muestras. Se puede demostrar que la prueba F ANOVA unifactorial y la prueba t agrupada de dos colas son
equivalentes; con cualquier conjunto de datos dado, los valores P para las dos pruebas serán idénticos, así que se llegará a la misma conclusión con cualquier prueba.
La prueba t con dos muestras es más flexible que la prueba F cuando I 2 por dos razones. En primer lugar, es válida sin la suposición de que 1 2; en segundo lugar, puede
ser utilizada para probar Ha: 1 2 (una prueba t de cola superior) o Ha 1 2 así como también Ha: 1 2. En el caso de I 3, desafortunadamente no existe un procedimiento de prueba general que tenga buenas propiedades sin la suposición de varianzas iguales.
Tamaños de muestra desiguales
Cuando los tamaños de muestra de cada población o tratamiento no son iguales, sean J1,
J2, . . . , JI los I tamaños de muestra y sea n iJi el número total de observaciones. El recuadro adjunto da fórmulas ANOVA y el procedimiento de prueba.
STC
STCr
I Ji
I Ji
1
(Xij X
)2 X 2ij X 2
i1 j1
i1 j1
n
I Ji
I
1
1
(X
i X
)2 X 2i X 2
i1 Ji
i1 j1
SCE
n
Ji
I
(Xij X
i)2 STC STCr
i1 j1
gl n 1
gl I 1
gl (Ji 1) n I
Valor estadístico de prueba:
f
CMTr
CME
Región de rechazo:
Ejemplo 10.8
f
donde CMTr
STCr
I1
CME
SCE
nI
F,I1,nI
El artículo “On the Development of a New Approach for the Determination of Yield
Strength in Mg-based Alloys” (Light Metal Age, octubre de 1998: 51-53) presentó los siguientes datos sobre módulo elástico (GPa) obtenidos por medio de un nuevo método ultrasónico con especímenes de cierta aleación producida mediante tres procesos de fundición
diferentes.
www.FreeLibros.me
c10_p369-396.qxd
390
3/12/08
CAPÍTULO 10
4:23 AM
Page 390
Análisis de la varianza
Moldeado permanente
Fundición a troquel
Moldeado en yeso
45.5 45.3 45.4 44.4 44.6 43.9 44.6 44.0
44.2 43.9 44.7 44.2 44.0 43.8 44.6 43.1
46.0 45.9 44.8 46.2 45.1 45.5
Ji
xi
xi
8
8
6
22
357.7
352.5
273.5
983.7
44.71
44.06
45.58
Sean 1, 2 y 3 los módulos elásticos promedio verdaderos con los tres procesos diferentes en las circunstancias dadas. Las hipótesis pertinentes son H0: 1 2 3 contra Ha:
por lo menos dos de las i son diferentes. El estadístico de prueba es, desde luego,
F CMTr/CME, basado en I 1 2 grados de libertad asociados con el numerador y
n I 22 3 19 grados de libertad asociados con el denominador. Las cantidades pertinentes incluyen
x2ij 43 998.73
CF
983.72
43 984.80
22
STC 43 998.73 43 984.80 13.93
STCr
273.52
357.72
352.52
43 984.80 7.93
8
8
6
SCE 13.93 7.93 6.00
Los cálculos restantes se muestran en la tabla ANOVA adjunta. Como F0.001,2,19 10.16
12.56 f, el valor P es más pequeño que 0.001. Por consiguiente, la hipótesis nula deberá ser rechazada a cualquier nivel de significación razonable; existe evidencia convincente para concluir que el módulo elástico promedio verdadero en cierta forma depende de qué
proceso de fundición se utilice.
Origen de la variación
Tratamientos
Error
Total
Grados de
Suma de
libertad los cuadrados
2
19
21
7.93
6.00
13.93
Cuadrado
de la media
3.965
0.3158
f
12.56
■
Existe más controversia entre estadísticos con respecto a qué procedimiento de comparaciones múltiples utilizar cuando los tamaños de muestra son desiguales que los que existen en
el caso de tamaños de muestra iguales. El procedimiento que aquí se presenta lo recomienda el excelente libro Beyond ANOVA: Basics of Applied Statistics (véase la bibliografía del
capítulo) para usarse cuando los I tamaños de muestra J1, J2, . . . , JI están razonablemente
cerca uno de otro (“desequilibrio leve”). Modifica el método de Tukey por medio de promedios
de pares 1/Ji s en lugar de 1/J.
Sea
wij Q,I,nI
J
J
2
CME 1
1
i
j
Entonces la probabilidad es aproximadamente 1 de que
X
i X
j wij i j X
i X
j wij
con dada i y j (i 1, . . . , I y j 1, . . . , I) con i j.
www.FreeLibros.me
c10_p369-396.qxd
3/12/08
4:23 AM
Page 391
10.3 Más sobre ANOVA unifactorial
391
El nivel de confianza simultáneo de 100(1 )% es sólo aproximado y no exacto ya que
se determinó con tamaños de muestra iguales. El método de subrayado puede seguir siendo
utilizado, pero ahora el factor wij utilizado para decidir si xi y xj. pueden ser conectadas dependerá de Ji y Jj.
Ejemplo 10.9
(continuación
del ejemplo
10.8)
Los tamaños de muestra para los datos de módulo elástico fueron J1 8, J2 8, J3 6
e I 3, n I 19, CME 0.316. Un nivel de confianza de 95% simultáneo requiere
Q0.05,3,19 3.59, de donde
w12 3.59
1
0.316 1
0.713,
8
2
8
w13 0.771
w23 0.771
Como x1 x2 44.71 44.06 0.65 w12, 1 y 2 se consideran no significativamente diferentes. El esquema de subrayado adjunto muestra que en apariencia 1 y 3 difieren
de manera significativa, como lo hacen 2 y 3.
2. A troquel
44.06
1. Permanente
3. Yeso
44.71
■
45.58
Transformación de datos
El uso de métodos ANOVA puede ser invalidado por diferencias sustanciales en las varianzas 21, . . . , 2I (las que hasta ahora han sido supuestas iguales con valor común de 2). En
ocasiones sucede que V(Xij) 2i g(i), una función conocida de i (de modo que cuando
H0 es falsa, las varianzas no son iguales). Por ejemplo, si Xij tiene una distribución de Poisson
con parámetro i (aproximadamente normal si i 10), entonces i i y 2i i, de modo
que g(i) i es la función conocida. En tales casos, a menudo se pueden transformar las
Xij en h(Xij) de modo que tengan varianzas iguales de manera aproximada (al mismo tiempo que las variables transformadas permanecen aproximadamente normales) y luego se puede utilizar la prueba F con las observaciones transformadas. La idea clave al seleccionar una
transformación h(·) es que con frecuencia V[h(Xij)] V(Xij) [h(i)]2 g(i) [h(i)]2.
Se desea determinar la función h(·) con la cual g(i) [h(i)]2 c (una constante) con
cada i.
PROPOSICIÓN
Si V(Xij) g(i), una función conocida de i, entonces una transformación de h(Xij)
que “estabilice la varianza” de modo que V[h(Xij)] sea aproximadamente la misma
con cada i está dada por h(x) & [g(x)] 1/2 dx.
En el caso Poisson, g(x) x, de modo que h(x) deberá ser proporcional a x 1/2 dx
2x . Así pues los datos Poisson deberán ser cambiados a h(xij) xij antes del análisis.
1/2
Un modelo de efectos aleatorios
Se ha supuesto que los problemas unifactoriales considerados hasta ahora son ejemplos de
un modelo ANOVA de efectos fijos. Con esto se quiere decir que los niveles elegidos del
factor en estudio son los únicos considerados pertinentes por el experimentador. El modelo
de efectos fijos unifactorial es
Xij i ij
www.FreeLibros.me
i 0
(10.6)
c10_p369-396.qxd
392
3/12/08
CAPÍTULO 10
4:23 AM
Page 392
Análisis de la varianza
donde las ij son aleatorias y tanto como las i son parámetros fijos cuyos valores son
desconocidos.
En algunos problemas unifactoriales, los niveles particulares estudiados por el experimentador se seleccionan, mediante diseño o mediante muetreo, de una gran población
de niveles. Por ejemplo, para estudiar los efectos en tiempo de desempeño de una tarea por
la utilización de diferentes operarios en una máquina particular, se podría seleccionar una
muestra de cinco operarios de un gran conjunto de operarios. Asimismo, se podría estudiar
el efecto del pH del suelo en la cosecha de plantas de maíz utilizando suelos con cuatro valores de pH específicos seleccionados de entre los muchos niveles de pH posibles. Cuando
los niveles utilizados se seleccionan al azar de entre una gran población de niveles posibles,
se dice que el factor es aleatorio y no fijo, y el modelo de efectos fijos (10.6) ya no es apropiado. Un modelo de efectos aleatorios se obtiene reemplazando las i fijas en (10.6) por
variables aleatorias. La descripción del modelo resultante es
Xij Ai ij
V(ij) 2
con E(Ai) E(ij) 0
V(Ai) 2A
(10.7)
todas las Ai y ij normalmente distribuidas e independientes una de otra.
La condición E(Ai) 0 en (10.7) es similar a la condición i 0 en (10.6); manifiesta
que el efecto esperado o promedio del i-ésimo nivel medido como un alejamiento de es cero.
Para el modelo de efectos aleatorios (10.7), la hipótesis de ningunos efectos debido a
los diferentes niveles es H0: A2 0, la cual expresa que los diferentes niveles del factor contribuyen con nada a la variabilidad de la respuesta. Aunque las hipótesis en los modelos de
efectos fijos unifactoriales y aleatorios son diferentes, se prueban en exactamente la misma
manera, formando F CMTr/CME y rechazando H0, si f F,I1,nI. Esto se justifica de
manera intuitiva al observar que E(CME) 2 (como para efectos fijos), mientras que
E(CMTr) 2
1
n
I1
J 2i
n
2
A
(10.8)
donde J1, J2, . . . , JI son los tamaños de muestra y n Ji. El factor entre paréntesis en el
lado derecho de (10.8) es no negativo, de modo que de nuevo E(CMTr) 2 si H0 es verdadera y E(CMTr) 2 si H0 es falsa.
Ejemplo 10.10
El estudio de fuerzas y esfuerzos no destructivos en materiales aporta información importante para el diseño de ingeniería eficiente. El artículo “Zero-Force Travel-Time Parameters
for Ultrasonic Head-Waves in Railroad Rail” (Materials Evaluation, 1985: 854-858) reporta sobre un estudio de tiempo de recorrido de cierto tipo de onda que produce el esfuerzo
longitudinal de rieles utilizados en vías de ferrocarril. Se realizaron tres mediciones en cada uno de seis rieles seleccionados al azar de una población de rieles. Los investigadores utilizaron ANOVA de efectos aleatorios para decidir si algo de la variación del tiempo de
recorrido podía ser atribuido a la “variabilidad entre rieles”. Los datos se dan en la tabla
adjunta (cada valor, en nanosegundos, se obtuvo de restar 36.1 de la observación original)
junto con la tabla ANOVA derivada. El valor de la proporción F es altamente significativo,
así que H0: A2 0 es rechazada a favor de que la conclusión de que las diferencias entre
rieles provocan la variabilidad del tiempo de recorrido.
www.FreeLibros.me
c10_p369-396.qxd
3/12/08
4:23 AM
Page 393
10.3 Más sobre ANOVA unifactorial
393
xi
1: 55
53
54
162
2: 26
37
32
95
3: 78
91
85
254
4: 92
100
96
288
5: 49
51
50
150
6: 80
85
83
248
x 1197
Origen de
la variación
Grados de
Suma de
Cuadrado de
libertad los cuadrados
la media
Tratamientos
Error
Total
EJERCICIOS
5
12
17
9310.5
194.0
9504.5
1.6
59.5
53.3
56.8
63.1
3.8
55.2
59.1
52.8
54.5
6.0
51.7
48.8
53.9
49.0
58.7
10.2 44.6 48.5 41.0 47.3 46.1
Use la prueba F al nivel 0.05 para probar en cuanto a
cualquier diferencia en la cosecha promedio verdadera debido a los distintos niveles de salinidad.
23. Aplique el método de Tukey modificado a los datos del ejercicio 22 para identificar diferencias significativas entre las i.
24. La siguiente tabla ANOVA parcial se tomó del artículo
“Perception of Spatial Incongruity” (J. Nervous and Mental
Disease, 1961: 222) en el cual se evaluaron y compararon
las habilidades de tres grupos diferentes de identificar una
incongruencia perceptiva. Todos los individuos que participaron en el experimento habían estado hospitalizados para
recibir un tratamiento psiquiátrico. Hubo 21 individuos en
el grupo depresivo, 32 en el “otro” grupo funcional y 21 en el
grupo de daño cerebral. Complete la tabla ANOVA y realice una prueba F al nivel 0.01.
Grupos
Error
Total
115.2
■
Sección 10.3 (22-34)
22. Los datos siguientes se refieren a la cosecha de tomates
(kg/parcela) con cuatro niveles de salinidad diferentes; el
nivel de salinidad aquí se refiere a la conductividad eléctrica (CE), donde los niveles seleccionados fueron CE 1.6,
3.8, 6.0 y 10.2 nmhos/cm:
Origen
1862.1
16.17
f
Grados de
Suma de
Cuadrado de
libertad los cuadrados
la media
76.09
1123.14
f
25. Los lípidos aportan mucha de la energía dietética en los
cuerpos de bebés y niños. Existe un interés creciente en la
calidad del suministro de lípido dietético durante la infancia como un importante determinante del crecimiento, desarrollo visual y nervioso y salud a largo plazo. El artículo
“Essential Fat Requirements of Preterm Infants” (Amer. J.
of Clinical Nutrition, 2000: 245S-250S) reportó los siguientes datos sobre grasas polinsaturadas (%) para bebés que
fueron asignados al azar a cuatro regímenes de alimentación diferentes: leche materna, fórmula basada en aceite de
maíz (AM), fórmula basada en aceite de soya (AS) o fórmula basada en aceite de soya y marino (ASM).
Régimen
Leche materna
AM
AS
ASM
Tamaño de
muestra
8
13
17
14
Media
Desv. estándar
muestral
muestral
43.0
42.4
43.1
43.5
1.5
1.3
1.2
1.2
a. ¿Qué suposiciones se deben hacer sobre las cuatro distribuciones de grasa polinsaturada antes de realizar un
ANOVA unifactorial para decidir si existen diferencias
en el contenido de grasa promedio verdadero?
b. Realice la prueba sugerida en el inciso a). ¿Qué se puede decir sobre el valor P?
26. Se analizaron muestras de seis marcas diferentes de margarina dietética/imitación para determinar el nivel de ácidos
grasos polinsaturados fisiológicamente activos (PARFUA,
por sus siglas en inglés, en porcentajes) y se obtuvieron los
siguientes resultados:
www.FreeLibros.me
c10_p369-396.qxd
394
3/12/08
CAPÍTULO 10
Imperial
Parkay
Blue Bonnet
Chiffon
Mazola
Fleischmann’s
4:24 AM
Page 394
Análisis de la varianza
14.1
12.8
13.5
13.2
16.8
18.1
13.6
12.5
13.4
12.7
17.2
17.2
14.4
13.4
14.1
12.6
16.4
18.7
14.3
13.0
14.3
13.9
17.3
18.4
están restringidos por i 0. Con tamaños de muestra desiguales, la restricción más natural es Jii 0. Use esto
para demostrar que
12.3
E(CMTr) 2
18.0
(Los números precedentes son ficticios, aunque las medias
muestrales concuerdan con los datos reportados en el ejemplar de enero de 1975 de Consumer Reports.)
a. Use ANOVA para probar en cuanto a diferencias entre
los porcentajes de ácidos grasos polinsaturados fisiológicamente activos para las distintas marcas.
b. Calcule intervalos de confianza para todas las (i j).
c. Mazola y Fleischmann’s son aceites de maíz, en tanto
que los demás son de soya. Calcule un intervalo de confianza para
(1 2 3 4)
( 6)
5
4
2
[Sugerencia: Modifique la expresión para V( ˆ) que condujo
a (10.5) en la sección previa.]
27. Aun cuando el té es la bebida que más se consume en el
mundo después del agua, se sabe poco sobre su valor nutricional. La folacina es la única vitamina B presente en cualquier cantidad significativa de té y avances recientes en
métodos de ensayo han determinado con precisión el contenido de folacina factible. Considere los datos adjuntos sobre contenido de folacina en especímenes seleccionados al
azar de las cuatro marcas líderes de té verde.
Marca
1
2
3
4
Observaciones
7.9
5.7
6.8
6.4
6.2
7.5
7.5
7.1
6.6
9.8
5.0
7.9
8.6
6.1
7.4
4.5
8.9 10.1 9.6
8.4
5.3 6.1
5.0 4.0
(Los datos están basados en “Folacin Content of Tea”, J.
Amer. Dietetic Assoc., 1983: 627-632.) ¿Sugieren estos datos que el contenido de folacina promedio verdadero es el
mismo para todas las marcas?
a. Realice una prueba con 0.05 con el método del valor P.
b. Evalúe la factibilidad de cualquier suposición requerida
para su análisis en el inciso a).
c. Realice un análisis de comparaciones múltiples para
identificar diferencias significativas entre marcas.
28. Para un ANOVA unifactorial con tamaños de muestra Ji
(i 1, 2, . . . , I) demuestre que STCr Ji(X
X)2
i
2
2
i Ji
X i nX
, donde n Ji.
29. Cuando los tamaños de muestra son iguales (Ji J), los parámetros 1, 2, . . . , I de la parameterización alternativa
1
I1
Ji2i
¿Cuál es E(CMTr) cuando H0 es verdadera? [Esta expresión es correcta si Jii 0 es reemplazada por la restricción i 0 (o por cualquier otra restricción lineal sobre las
i utilizadas para reducir el modelo a I parámetros independientes), pero Jii 0 simplifica el álgebra y produce
estimaciones naturales para los parámetros modelo (en particular ˆ i xi x).]
30. Reconsidere el ejemplo 10.7 que implica una investigación
de los efectos de diferentes tratamientos térmicos sobre el
punto de cedencia de lingotes de acero.
a. Si J 8 y 1, ¿cuál es para una prueba F a un nivel
de 0.05 cuando 1 2, 3 1 1 y 4 1 1?
b. Con la alternativa del inciso a), ¿qué valor de J es necesario para obtener 0.05?
c. Si existen I 5 tratamientos térmicos, J 10 y 1,
¿cuál es para la prueba F a un nivel de 0.05 cuando
cuatro de las i son iguales y la quinta difiere en 1 de las
otras cuatro?
31. Cuando los tamaños de muestra no son iguales, el parámetro de no centralidad es Ji 2i / 2 y 2 (1/I )Ji 2i / 2.
Remitiéndose al ejercicio 22, ¿cuál es la potencia de la
prueba cuando 2 3, 1 2 y 4 2 ?
32. En un experimento para comparar la calidad de cuatro marcas diferentes de cinta de grabar de carrete a carrete, se seleccionaron cinco carretes de 2400 pies de cada marca (A-D) y
se determinó el número de imperfecciones en cada uno.
A:
10
B:
14 12 17
5 12 14
C:
13 18 10 15 18
D:
17 16 12 22 14
9
8
8
Se cree que el número de imperfecciones tiene aproximadamente una distribución Poisson para cada marca. Analice
los datos al nivel 0.01 con objeto de ver si el número esperado de imperfecciones por carrete es el mismo para cada
marca.
33. Suponga que Xij es una variable binomial con parámetros n
y pi (así que es aproximadamente normal cuando npi 5 y
nqi 5). Entonces como i npi, V(Xij) 2i npi(1 pi)
i(1 i /n). ¿Cómo se deberán transformar las Xij de
modo que se estabilice la varianza? [Sugerencia: g(i)
i(1 i /n).]
34. Simplifique E(CMTr) para el modelo de efectos aleatorios
cuando J1 J2 JI J.
www.FreeLibros.me
c10_p369-396.qxd
3/12/08
4:24 AM
Page 395
Ejercicios suplementarios
395
EJERCICIOS SUPLEMENTARIOS (35-46)
35. Se realizó un experimento para comparar las velocidades de
flujo de cuatro tipos diferentes de boquilla.
a. Los tamaños de muestra fueron 5, 6, 7 y 6, respectivamente y los cálculos dieron f 3.68. Formule y pruebe
las hipótesis pertinentes con 0.01.
b. El análisis de los datos con un programa estadístico dio el
valor P 0.029. Al nivel 0.01, ¿qué concluiría y por qué?
36. El artículo “Computer-Assisted Instruction Augmented with
Planned Teacher/Student Contacts” (J. Exp. Educ., invierno,
1980-1981: 120-126) comparó cinco métodos diferentes de
enseñar estadística descriptiva. Los cinco fueron discusión y
conferencia tradicionales (L/D), instrucción con libro de texto programado (R), texto programado con conferencias
(R/L), instrucción con computadora (C) e instrucción con
computadora y conferencias (C/L). Cuarenta y cinco estudiantes fueron asignados al azar, 9 a cada método. Después
de completar el curso, los estudiantes resolvieron un examen de 1 hora. Además, se administró una prueba de retención de 10 minutos 6 semanas después. Los resultados son
los siguientes:
Examen
Marca 1
Marca 2
Marca 3
Marca 4
Marca 5
13.1
16.3
13.7
15.7
13.5
15.0
15.7
13.9
13.7
13.4
14.0
17.2
12.4
14.4
13.2
14.4
14.9
13.8
16.0
12.7
14.0
14.4
14.9
13.9
13.4
11.6
17.2
13.3
14.7
12.3
Media
13.68
15.95
13.67
14.73
13.08
38. Un artículo publicado en el diario científico británico Nature
(“Sucrose Induction of Hepatic Hyperplasia in the Rat”, 25
de agosto de 1972: 461) reporta sobre un experimento en el
cual cada uno de cinco grupos compuestos de seis ratas fue
puesto a dieta con un carbohidrato diferente. Al final del experimento, se determinó el contenido de ADN del hígado de
cada rata (mg/g hígado), con los siguientes resultados:
Carbohidrato
xi
Almidón
Sucrosa
Fructosa
Glucosa
Maltosa
2.58
2.63
2.13
2.41
2.49
Prueba de retención
Método
xi
si
xi
si
L/D
R
R/L
C
C/L
29.3
28.0
30.2
32.4
34.2
4.99
5.33
3.33
2.94
2.74
30.20
28.80
26.20
31.10
30.20
3.82
5.26
4.66
4.91
3.53
La gran media del examen fue 30.82 y la de la prueba de retención fue 29.30.
a. ¿Sugieren estos datos que existe diferencia entre los cinco métodos de enseñanza con respecto a la calificación
del examen media verdadera? Use 0.05.
b. Con un nivel de significación de 0.05, pruebe la hipótesis nula de ninguna diferencia entre las calificaciones de
la prueba de retención media verdadera para los cinco
métodos de enseñanza distintos.
37. Numerosos factores contribuyen al funcionamiento suave
de un motor eléctrico (“Increasing Market Share Through
Improved Product and Process Design: An Experimental
Approach”, Quality Engineering, 1991: 361-369). En particular, es deseable mantener el ruido del motor y vibraciones
a un mínimo. Para estudiar el efecto que la marca de los cojinetes tiene en la vibración del motor, se examinaron cinco
marcas diferentes de cojinetes instalando cada tipo de cojinete en muestras aleatorias distintas de seis motores. Se registró la cantidad de vibración del motor (medida en micrones)
cuando cada uno de los 30 motores estaba funcionando. Los
datos de este estudio se dan a continuación. Formule y pruebe las hipótesis pertinentes a un nivel de significación de 0.05
y luego realice un análisis de comparaciones múltiples si es
apropiado.
Suponiendo también que x 2ij 183.4, ¿indican estos
datos que el tipo de carbohidrato presente en la dieta afecta
el contenido de ADN promedio verdadero? Construya una
tabla ANOVA y use un nivel de significación de 0.05.
39. Remitiéndose al ejercicio 38, construya un intervalo de confianza t para
1 (2 3 4 5)/4
que mide la diferencia entre el contenido de ADN promedio
para la dieta de almidón y el promedio combinado para las
otras cuatro dietas. ¿Incluye cero el intervalo resultante?
40. Remítase al ejercicio 38, ¿cuál es para la prueba cuando
el contenido de ADN promedio verdadero es idéntico para
las tres dietas y queda a 1 desviación estándar () por debajo de este valor común para las otras dos dietas?
41. Se seleccionan al azar cuatro laboratorios (1-4) de una
población grande y a cada uno se le pide que haga tres determinaciones del porcentaje de alcohol metílico en especímenes de un compuesto tomado de un solo lote. Basado en
los datos adjuntos ¿son las diferencias entre los laboratorios
una causa de variación del porcentaje de alcohol metílico?
Formule y pruebe las hipótesis pertinentes con un nivel de
significación de 0.05.
1:
85.06
85.25
84.87
2:
84.99
84.28
84.88
3:
84.48
84.72
85.10
4:
84.10
84.55
84.05
42. La frecuencia de parpadeo crítica (fpc) es la frecuencia más
alta (en ciclos/s) a la que una persona puede advertir el parpadeo en una fuente luminosa parpadeante. A frecuencia
www.FreeLibros.me
c10_p369-396.qxd
396
3/12/08
CAPÍTULO 10
4:24 AM
Page 396
Análisis de la varianza
por encima de la frecuencia de parpadeo crítica, la fuente
luminosa parece ser continua aun cuando en realidad parpadee. Una investigación realizada para ver si la frecuencia de
parpadeo crítica promedio verdadera depende del color del
iris arrojó los siguientes datos (con base en el artículo “The
Effects of Iris Color in Critical Flicker Frequency”, J. General Psych., 1973: 91-95):
Color del iris
Ji
xi
xi
n 19
1. Café
2. Verde
3. Azul
26.8
27.9
23.7
25.0
26.3
24.8
25.7
24.5
8
204.7
25.59
26.4
24.2
28.0
26.9
29.1
25.7
27.2
29.9
28.5
29.4
28.3
5
134.6
26.92
6
169.0
28.17
x 508.3
a. Formule y pruebe las hipótesis pertinentes a un nivel de
significación de 0.05 utilizando la tabla F para obtener
un límite superior y/o inferior del valor P. [Sugerencia:
x 2ij 13 659.67 y CF 13 598.36.]
b. Investigue las diferencias entre colores del iris con respecto a la frecuencia de parpadeo crítica media.
43. Sean c1, c2, . . . , cI los números que satisfacen la expresión
ci 0. Entonces cii c11 cII se llama
contraste en las i. Observe que con c1 1, c2 1,
c3 cI 0, cii 1 2, la cual implica que
toda diferencia tomada por pares entre las i es un contraste (también lo es, p. ej., 1 0.52 0.53). Un método
atribuido a Scheffé da intervalos de confianza simultáneos
con nivel de confianza simultáneo de 100(1 )% para to-
dos los contrastes posibles (¡un número infinito de ellos!).
El intervalo para cii es
ci xi ! (c2i /Ji)1/2 [(I 1) CME F,I1,nI]1/2
Con los datos de la frecuencia crítica de parpadeo del ejercicio
42, calcule los intervalos de Scheffé para los contrastes
1 2, 1 3, 2 3 y 0.5 1 + 0.5 2 3 (este último contraste compara el azul con el promedio del café y el
verde). ¿Que contrastes aparecen significativamente diferentes de 0 y por qué?
44. Cuatro tipos de morteros: mortero de cemento ordinario
(MCO), mortero impregnado de polímero (MIP), mortero
con resina (MR) y mortero con cemento y polímero (MCP),
se sometieron a una prueba de compresión para medir resistencia (MPa). Tres observaciones de resistencia de cada tipo
de mortero se dan en el artículo. “Polymer Mortar Composite Matrices for Maintenance-Free Highly Durable Ferrocement” (J. Ferrocement, 1984: 337-345) y se reproducen
aquí. Construya una tabla ANOVA. Con un nivel de significación de 0.05, determine si los datos sugieren que la resistencia media verdadera no es la misma para los cuatro tipos
de morteros. Si determina que las resistencias medias verdaderas no son iguales, use el método de Tukey para identificar las diferencias significativas.
MCO
MIP
MR
MCP
32.15
126.32
117.91
29.09
35.53
126.80
115.02
30.87
34.20
134.79
114.58
29.80
45. Suponga que las xij están “codificadas” por yij cxij d.
¿Cómo se compara el valor del estadístico F calculado con
las yij con el valor calculado con las xij? Justifique su aseveración.
46. En el ejemplo 10.10, reste xi de cada observación en la
i-ésima muestra (i 1, . . . , 6) para obtener un conjunto de
18 residuos. Luego construya una curva de probabilidad
normal y comente sobre la factibilidad de la suposición
de normalidad.
Bibliografía
Miller, Rupert, Beyond ANOVA: The Basics of Applied Statistics,
Wiley, Nueva York, 1986. Una excelente fuente de información sobre comprobación de suposiciones y métodos de análisis alternativos.
Montgomery, Douglas, Design and Analysis of Experiments (5a.
ed.,) Wiley, Nueva York, 2001. Una presentación muy al día
de modelos y metodología ANOVA.
Neter, John, William Wasserman y Michael Kutner, Applied Linear Statistical Models (4a. ed.,), Irwin, Homewood, IL.,
1996. La segunda mitad de este libro contiene un estudio muy
bien presentado de ANOVA; el nivel es comparable al del
presente texto, aunque la discusión es más amplia lo que hace del libro una excelente referencia.
Ott, R. Lyman y Michael Longnecker. An Introduction to Statistical Methods and Data Analysis (5a. ed.), Duxbury Press,
Belmont, CA, 2001. Incluye varios capítulos sobre metodología ANOVA que puede ser leído con provecho por estudiantes
que desean una exposición no muy matemática; incluye un
capítulo muy bueno sobre varios métodos de comparaciones
múltiples.
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:26 AM
11
Page 397
Análisis de varianza
con varios factores
INTRODUCCIÓN
En el capítulo previo, se utilizó el análisis de la varianza (ANOVA) para probar en
cuanto a igualdad de I medias de población diferentes o las respuestas promedio
verdaderas asociadas con I niveles distintos de un solo factor (alternativamente conocidos como I tratamientos diferentes). En muchas situaciones experimentales,
existen dos o más factores que son de interés simultáneo. Este capítulo amplía los
métodos del capítulo 10 para investigar tales situaciones multifactoriales.
Las dos primeras secciones se concentran en el caso de dos factores de interés.
Se utilizará I para denotar el número de niveles del primer factor (A) y J para denotar
el número de niveles del segundo factor (B). Entonces existen IJ combinaciones posibles
compuestas de un nivel del factor A y uno del factor B; cada una de tales combinaciones se conoce como tratamiento, de ahí que existen IJ tratamientos diferentes. El
número de observaciones realizadas en el tratamiento (i, j) serán denotadas por Kij.
En la sección 11.1, se considera Kij 1. Un caso especial importante de este tipo es
un diseño de bloque aleatorizado, en el cual un solo factor A es de primordial interés pero se crea otro factor, “bloques”, para controlar la variabilidad externa en unidades o sujetos experimentales. En la sección 11.2, se aborda el caso Kij K 1 y
se mencionan brevemente las dificultades asociadas con Kij desiguales.
La sección 11.3 considera experimentos que implican más de dos factores, incluido un diseño de cuadro latino, el cual controla los efectos de dos factores externos que se piensa influyen en la variable de respuesta. Cuando el número de factores
es grande, un experimento compuesto de por lo menos una observación por cada
tratamiento sería caro y consumiría mucho tiempo. Un caso especial importante, el
cual se discute en la sección 11.4, es aquel en el cual existen p factores, cada uno de
los cuales tiene dos niveles. Existen entonces 2p tratamientos diferentes. Se considera
397
www.FreeLibros.me
c11_p397-445.qxd
398
3/12/08
CAPÍTULO 11
4:26 AM
Page 398
Análisis de varianza con varios factores
tanto el caso en el cual las observaciones se realizan en todos estos tratamientos (un diseño completo) y el caso en el cual las observaciones se realizan en sólo un subconjunto de tratamientos (un diseño incompleto).
11.1 ANOVA bifactorial con Kij 1
Cuando el factor A consta de I niveles y el factor B de J niveles, existen IJ combinaciones
diferentes (pares) de niveles de los dos factores, cada uno llamado tratamiento. Con Kij
el número de observaciones en el tratamiento compuesto del factor A al nivel i y del factor
B al nivel j, esta sección se enfoca en el caso Kij 1, de modo que los datos se componen
de IJ observaciones. Primero se discutirá el modelo de efectos fijos, en el cual los únicos niveles de interés con los dos factores son aquellos que en realidad están representados en el
experimento. El caso en el cual un factor es aleatorio se discute con brevedad al final de la
sección.
Ejemplo 11.1
¿Es realmente fácil eliminar manchas en telas producidas por plumas de tinta borrable como la palabra borrable podría implicar? Considere los siguientes datos de un experimento
para comparar tres marcas diferentes de plumas y cuatro tratamientos de lavado distintos
con respecto a su capacidad de eliminar manchas en un tipo particular de tela (basado en “An
Assessment of the Effects of Treatment, Time, and Heat on the Renoval of Erasable Pen
Marks from Cotton and Cotton/Polyester Blend Fabrics”, J. of Testing and Evaluation, 1991:
394-397). La variable de respuesta es un indicador cuantitativo del cambio de color total de
un espécimen de tela; mientras más bajo fue este valor, más manchas fueron eliminadas.
Tratamiento de lavado
1
2
3
4
Marca de pluma
Total
Promedio
0.598
0.345
0.455
1
2
3
0.97
0.77
0.67
0.48
0.14
0.39
0.48
0.22
0.57
0.46
0.25
0.19
2.39
1.38
1.82
Total
2.41
1.01
1.27
0.90
5.59
Promedio
0.803
0.337 0.423 0.300
0.466
¿Existe alguna diferencia en la cantidad de cambio de color promedio verdadero debido a
las diferentes marcas de pluma o a los distintos tratamientos de lavado?
■
Como en el ANOVA unifactorial, se utilizan subíndices dobles para identificar variables aleatorias y valores observados. Sea
Xij la variable aleatoria (va) que denota la medición cuando el factor A se
mantiene al nivel i y el factor B al nivel j.
xij el valor observado de Xij.
Las xij normalmente se presentan en una tabla de dos vías en la cual la i-ésima fila contiene
los valores observados cuando el factor A se mantiene al nivel i y la j-ésima columna contiene los valores observados cuando el factor B se mantiene al nivel j. En el experimento de
la pluma de tinta borrable del ejemplo 11.1, el número de niveles del factor A es I 3, el
número de niveles del factor B es J 4, x13 0.48, x22 0.14, etcétera.
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:26 AM
Page 399
11.1 ANOVA bifactorial con Kij 1
399
En tanto que en el ANOVA unifactorial, lo que interesaba eran las medias que aparecían en las filas y la gran media, en este caso también existe interés en las medias que aparecen en las columnas. Sea
J
Xij
el promedio de las mediciones obtenidas
X
i cuando el factor A se mantiene al nivel i j1
J
I
el promedio de las mediciones obtenidas
Xj cuando el factor B se mantiene al nivel j
Xij
i1
I
I
X
la gran media
J
Xij
i1 j1
IJ
con los valores observados xi, xj y x. Los totales en lugar de los promedios se denotan
omitiendo la raya horizontal (por lo tanto xj ixij, etc.). Intuitivamente, para ver si existe algún efecto debido a los niveles del factor A, se deberán comparar las xi observadas una
con otra y se deberá sacar información de las xj con respecto a los diferentes niveles del
factor B.
El modelo de efectos fijos
Procediendo por analogía con el ANOVA unifactorial, la primera tendencia al especificar un
modelo es hacer ij la respuesta promedio verdadera cuando el factor A se encuentra al
nivel i y el factor B al nivel j, para obtener parámetros medios IJ. En ese caso sea
Xij ij ij
donde ij es la cantidad aleatoria en la cual el valor observado difiere de su expectativa y las
ij se suponen normales e independientes con varianza común 2. Desafortunadamente, no
existe un procedimiento de prueba válido para esta selección de parámetros. La razón es que
conforme a la hipótesis alternativa de interés, las ij son libres de adoptar cualquier valor,
en tanto que 2 puede tener cualquier valor mayor que cero, así que existen IJ 1 parámetros libremente variables. Pero existen sólo IJ observaciones, así que después de utilizar
cada xij como estimación de ij, no hay forma de estimar 2.
Para rectificar este problema de un modelo que tiene más parámetros que valores observados, se debe especificar uno que sea realista y que también implique relativamente pocos
parámetros.
Supóngase la existencia de I parámetros 1, 2, . . . , I y J parámetros 1, 2, . . . ,
J de tal suerte que
Xij i j ij
(i 1, . . . , I,
j 1, . . . , J)
(11.1)
de modo que
ij i j
(11.2)
Incluida 2, ahora hay I J 1 parámetros de modelo, así que si I 3 y J 3, entonces
habrá menos parámetros que observaciones (de hecho, en breve se modificará (11.2) de modo que incluso I 2 y/o J 2 tendrán cabida).
El modelo especificado en (11.1) y (11.2) se llama modelo aditivo porque cada respuesta media ij es la suma de un efecto debido al factor A al nivel i (i) y un efecto debido
www.FreeLibros.me
c11_p397-445.qxd
400
3/12/08
CAPÍTULO 11
4:26 AM
Page 400
Análisis de varianza con varios factores
al factor B al nivel j (). La diferencia entre las respuestas medias con el factor al nivel i
y al nivel i cuando B se mantiene al nivel j es ij ij. Cuando el modelo es aditivo,
ij ij (i j) (i j) i i
la cual es independiente del nivel j del segundo factor. Un resultado similar prevalece para
ij ij’. Así, aditividad significa que la diferencia en las respuestas medias a dos niveles
de uno de los factores es la misma a todos los niveles del otro factor. La figura 11.1a) muestra un conjunto de respuestas medias que satisfacen la condición de aditividad y la figura
11.1b) muestra una configuración no aditiva de respuestas medias.
Respuesta media
Respuesta media
Niveles de B
1
2
3
Niveles de A
a)
Figura 11.1
Ejemplo 11.2
(continuación
del ejemplo
11.1)
4
Niveles de B
1
2
3
Niveles de A
b)
4
Respuestas medias de dos tipos de modelo: a) aditivo; b) no aditivo.
Cuando se grafican las xij de una manera análoga a la de la figura 11.1, se obtiene el resultado mostrado en la figura 11.2. Aunque existe algo de “cruzamiento” en las xij observadas,
la configuración es razonablemente representativa de lo que se esperaría bajo aditividad con
sólo una observación por tratamiento.
Cambio de color
1.0
0.9
Marca 1
Marca 2
0.8
0.7
Marca 3
0.6
0.5
0.4
0.3
0.2
0.1
1
2
3
Tratamiento de lavado
Figura 11.2
Diagrama de los datos del ejemplo 11.1.
www.FreeLibros.me
4
■
c11_p397-445.qxd
3/12/08
4:26 AM
Page 401
11.1 ANOVA bifactorial con Kij 1
401
La expresión (11.2) no describe del todo el modelo final porque las i y las j no están determinadas de forma única. A continuación se dan configuraciones diferentes de las
i y j que dan las mismas ij aditivas.
1 1
2 4
1 1
11 2
12 5
2 2
21 3
22 6
1 2
2 5
1 0
11 2
12 5
2 1
21 3
22 6
Si se resta cualquier constante c de todas las i y se suma a todas las j se obtienen otras
configuraciones correspondientes al mismo modelo aditivo. Esta no singularidad se elimina con el uso del siguiente modelo.
Xij i j ij
I
J
i1
j1
(11.3)
donde i 0, j 0 y las ij se suponen independientes, normalmente distribuidas, con media 0 y varianza común 2.
Esto es análogo a la selección alternativa de parámetros para el método ANOVA unifactorial discutido en la sección 10.3. No es difícil verificar que (11.3) es un modelo aditivo en
el cual los parámetros están determinados de forma única (por ejemplo, para las ij antes
mencionadas, 4, 1 0.5, 2 0.5, 1 1.5 y 2 1.5). Obsérvese que hay
sólo I – 1 i determinadas de manera independiente y J – 1 j independientemente determinadas, así que (incluida ) (11.3) especifica I J – 1 parámetros medios.
La interpretación de los parámetros de (11.3) es directa: es la gran media verdadera (respuesta media promediada a todos los niveles de ambos factores), i es el efecto del
factor A al nivel i (medido como una desviación con respecto a ) y j es el efecto del factor B al nivel j. Estimadores insesgados (y la máxima verosimilitud) de estos parámetros son
ˆ X
ˆ i X
i X
ˆj X
j X
Existen dos hipótesis diferentes de interés en un experimento de dos factores con Kij 1.
La primera, denotada por H0A, establece que los distintos niveles del factor A no tienen efecto en la respuesta promedio verdadera. La segunda, denotada por H0B asevera que el factor
B no tiene ningún efecto.
H0A: 1 2 I 0
contra HaA: por lo menos una i 0
H0B: 1 2 J 0
contra HaB: por lo menos una j 0
(11.4)
(Ningún efecto del factor A implica que todas las i son iguales, así que todas deben ser 0
puesto que suman 0 y asimismo para las j.)
Procedimientos de prueba
La descripción y análisis ahora siguen de cerca a los del ANOVA unifactorial. Las sumas de
los cuadrados pertinentes y los grados de libertad asociados son los siguientes:
www.FreeLibros.me
c11_p397-445.qxd
402
3/12/08
CAPÍTULO 11
4:26 AM
Page 402
Análisis de varianza con varios factores
I
DEFINICIÓN
J
STC
(Xij X
)2
SCA
(X
i X
)2 J (X
i X
)2 gl I 1
gl IJ 1
i1 j1
I
J
I
i1 j1
i1
I
SCB
J
J
(X
j X
)2 I (X
j X
)2 gl J 1
i1 j1
I
SCE
(11.5)
j1
J
(Xij X
i X
j X
)2
gl (I 1)(J 1)
i1 j1
La identidad fundamental es
STC SCA SCB SCE
(11.6)
Existen fórmulas de cálculo para STC, SCA y SCB análogas a las que aparecen en el capítulo 10 para el ANOVA unifactorial. Pero la amplia disponibilidad de programas estadísticos ha vuelto a estas fórmulas casi obsoletas.
La expresión para SCE se obtiene al reemplazar , i y j por sus estimadores en
[Xij ( i j)]2. El grado de libertad asociado con el error es IJ número de parámetros medios estimado IJ [1 (I 1) (J 1)] (I 1)(J 1). Como en el
ANOVA unifactorial, la variación total se divide en una parte (SCE) que no está explicada
por la verdad o falsedad de H0A o H0B y dos partes que pueden ser explicadas por la posible
falsedad de las dos hipótesis nulas.
La teoría estadística ahora estipula que si se forman proporciones F como en el ANOVA
unifactorial, cuando H0A (H0B) es verdadera, la proporción F correspondiente tiene una distribución F con grados de libertad asociados con el numerador I 1 (J 1) y grados de
libertad asociados con el denominador (I 1)(J 1).
Hipótesis
Valor del estadístico de prueba
MCA
MCE
MCB
fB
MCE
fA
H0A contra HaA
H0B contra HaB
Ejemplo 11.3
(continuación
del ejemplo
11.2)
Región de rechazo
fA
F,I1, (I1)(J1)
fB
F,J1, (I1)(J1)
Las x i y x j para los datos de cambio de color se muestran a lo largo de los márgenes derecho e inferior de la tabla de datos dada previamente. La tabla ANOVA adjunta (tabla 11.1)
resume los cálculos adicionales.
Tabla 11.1 Tabla ANOVA para el ejemplo 11.3
Origen de la variación
Factor A (marca)
Factor B
(tratamiento
de lavado)
Error
Total
gl
Suma de cuadrados
Cuadrado de la media
f
I12
SCA 0.1282
MCA 0.0641
fA 4.43
J13
(I 1)(J 1) 6
IJ 1 11
SCB 0.4797
SCE 0.0868
STC 0.6947
MCB 0.1599
MCE 0.01447
fB 11.05
www.FreeLibros.me
4:26 AM
Page 403
11.1 ANOVA bifactorial con Kij 1
403
El valor crítico para probar H0A a un nivel de significación de 0.05 es F0.05,2,6 5.14. Como
4.43 5.14, H0A no puede ser rechazada a un nivel de significación de 0.05. Aparentemente el cambio de color promedio verdadero no depende de la marca de la pluma. Como
F0.05,3,6 4.76 y 11.05 4.76, H0B es rechazada a un nivel de significación de 0.05 a favor
de la aseveración de que el cambio de color varía con el tratamiento de lavado. Un programa de cálculo estadístico da valores P de 0.066 y 0.007 para estas dos pruebas.
■
La factibilidad de las suposiciones de normalidad y varianza constante puede ser investigada de forma gráfica. Se definen los valores pronosticados (también llamados valores
ajustados) x̂ ij ˆ ˆ i ˆ j x # # 1x i # x # # 2 1x # j x # # 2 x i # x # j x # # , y los
residuos (las diferencias entre las observaciones y los valores pronosticados) x ij x̂ ij
x ij x i # x # j x # # . Se puede verificar la suposición de normalidad con un diagrama de
probabilidad normal de los residuos y la suposición de varianza constante con un diagrama
de los residuos contra los valores ajustados. La figura 11.3 muestra estos diagramas para los
datos del ejemplo 11.3.
Diagrama de probabilidad normal de los residuos
99
Residuos contra los valores ajustados
0.15
95
90
80
70
60
50
40
30
20
10
5
0.10
0.05
Residuo
3/12/08
Porcentaje
c11_p397-445.qxd
0.0
0.5
0.10
1
0.2
0.1
0.0
Residuo
0.1
0.2
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
Valor ajustado
a)
Figura 11.3
b)
Diagramas de diagnóstico obtenidos con MINITAB para el ejemplo 11.3.
El diagrama de probabilidad normal es razonablemente recto, de modo que no existe
ninguna razón para cuestionar la normalidad de este conjunto de datos. En el diagrama de
residuos contra valores ajustados, se buscan diferencias en dispersión vertical conforme
se recorre la gráfica horizontalmente de un lado a otro. Por ejemplo, si hubiera un rango angosto de valores ajustados pequeños y un rango amplio de valores ajustados altos, esto
sugeriría que la varianza es más grande con respuestas grandes (esto sucede a menudo y en
ocasiones puede ser remediado reemplazando cada observación por su logaritmo). En este
caso no ocurre semejante problema, así que no existe evidencia en contra de la suposición
de varianza constante.
Cuadrados de la media esperada
La factibilidad de utilizar las pruebas F que se acaban de describir se demuestra calculando
el cuadrado de la media esperada. Luego de algo de álgebra tediosa.
E(MCE) 2 (cuando el modelo es aditivo)
E(MCA) 2
E(MCB) 2
J
I1
I
J1
www.FreeLibros.me
I
2i
i1
J
2j
j1
c11_p397-445.qxd
404
3/12/08
CAPÍTULO 11
4:26 AM
Page 404
Análisis de varianza con varios factores
Cuando H0A es verdadera, MCA es un estimador insesgado de 2, así F es una proporción
de dos estimadores insesgados 2. Cuando H0A es falsa, MCA tiende a sobrestimar 2, de
tal suerte que H0A deberá ser rechazada cuando la proporción FA es demasiado grande. Comentarios similares se aplican a MCB y H0B.
Comparaciones múltiples
Cuando H0A o H0B han sido rechazadas, se puede utilizar el procedimiento de Tukey para
identificar diferencias significativas entre los niveles del factor investigado. Los pasos en el
análisis son idénticos a aquellos para un ANOVA unifactorial:
1. Para comparar niveles del factor A, se obtiene Q,I,(I1)(J1).
Para comparar niveles del factor B, se obtiene Q,J,(I1)(J1).
2. Se calcula
w Q (desviación estándar estimada de las medias
muestrales comparadas)
¨ Q,I (I1)(J1) M
C
E
/J
para comparaciones del factor A
©
ª Q,J (I1)(J1) M
C
E
/I para comparaciones del factor B
(porque, p. ej., la desviación estándar de X
i es /J ).
3. Se ordenan las medias muestrales en orden creciente, se subrayan los pares que difieren
menos de w y se identifican los pares no subrayados por la misma línea como correspondientes a niveles significativamente diferentes del factor dado.
Ejemplo 11.4
(continuación
del ejemplo
11.3)
La identificación de diferencias significativas entre los cuatro tratamientos de lavado requiere
Q0.05,4,6 4.90 y w 4.90 (0.01447)/3 0.340. Las cuatro medias muestrales correspondientes al factor B (promedios en columnas) ahora aparecen en orden creciente y cualquier par que difiere por menos de 0.340 aparece subrayado por un segmento de línea:
x4
0.300
x2
0.337
x3
0.423
x1
0.803
Parece que el tratamiento de lavado 1 difiere significativamente de los otros tres, aunque no
están identificadas ningunas otras diferencias. En particular, no es aparente cuál entre los
tratamientos 2, 3 y 4 es mejor para eliminar manchas.
■
Experimentos de bloque aleatorizado
Cuando se utiliza el ANOVA unifactorial para probar en cuanto a la presencia de efectos
debidos a los I tratamientos diferentes estudiados, una vez que los IJ sujetos o unidades experimentales han sido seleccionados, el tratamiento se asignará en una forma completamente al azar. Es decir, se deberán seleccionar al azar J sujetos para el primer tratamiento, luego
otra muestra de J sujetos seleccionados al azar de los IJ J sujetos restantes para el segundo tratamiento y así sucesivamente.
Sucede con frecuencia, no obstante, que los sujetos o unidades experimentales exhiban
heterogeneidad con respecto a otras variables que pueden afectar las respuestas observadas.
Cuando este es el caso, la presencia o ausencia de un valor F significativo puede deberse a
esta variación externa y no a la presencia o ausencia de efectos factoriales. Esta fue la razón
para la introducción de un experimento apareado en el capítulo 9. La analogía con un experimento apareado cuando I 2 se llama experimento de bloque aleatorizado. Un factor externo, “bloques”, se construye dividiendo las IJ unidades en J grupos con I unidades
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:26 AM
Page 405
11.1 ANOVA bifactorial con Kij 1
405
en cada grupo. Este agrupamiento o formación de bloques se realiza de tal modo que dentro de cada bloque las I unidades son homogéneas con respecto a otros factores que se piensa afectan las respuestas. Entonces dentro de cada bloque homogéneo, los I tratamientos se
asignan al azar a las I unidades o sujetos presentes en el bloque.
Ejemplo 11.5
Una organización de prueba de productos de consumo deseaba comparar el consumo de
energía anual de cinco marcas diferentes de deshumidificadores. Como el consumo de energía depende del nivel de humedad prevaleciente, se decidió monitorear cada marca a cuatro
niveles distintos desde humedad moderada hasta intensa (formando así un bloque con el nivel de humedad). Dentro de cada nivel, se asignaron las marcas al azar a los cinco lugares
seleccionados. La cantidad resultante de consumo de energía (kWh anuales) aparece en la
tabla 11.2.
Tabla 11.2 Datos de consumo de energía del ejemplo 11.5.
Tratamientos
(marcas)
1
1
2
3
4
5
xj
xj
Bloques (nivel de humedad)
2
3
685
722
733
811
828
792
806
802
888
920
3779
755.80
838
893
880
952
978
4208
841.60
4541
908.20
4
875
953
941
1005
1023
4797
959.40
xi
xi
3190
3374
3356
3656
3749
797.50
843.50
839.00
914.00
937.25
17 325
866.25
Los cálculos ANOVA se resumen en la tabla 11.3
Tabla 11.3 Tabla ANOVA para el ejemplo 11.5
Origen de la variación
gl
Suma de cuadrados
Cuadrados de la media
Tratamientos (marcas)
Bloques
Error
Total
4
3
12
19
53 231.00
116 217.75
1671.00
171 119.75
13,307.75
38,739.25
139.25
f
fA 95.57
fB 278.20
Como F0.05,4,12 3.26 y fA 95.57 3.26, H0 es rechazada en favor de Ha y se concluye que
el consumo de energía sí depende de la marca del humidificador. Para identificar marcas
significativamente diferentes, se utiliza el procedimiento de Tukey, Q0.05,5,12 4.51 y
w 4.511
39.2
5/4
26.6.
x1
797.50
x3
839.00
x2
843.50
x4
914.00
x5
937.25
El subrayado indica que las marcas pueden dividirse en tres grupos con respecto al consumo de energía.
Como el factor de bloque es de interés secundario, no se requiere F0.05,3,12, aun cuando el
valor calculado de FB es con claridad altamente significativo. La figura 11.4 muestra los resultados generados por el software estadístico SAS (Analysis of Small Sample) de ANOVA con
estos datos. Obsérvese que en la primera parte de la tabla ANOVA, la suma de los cuadrados
(SC) para tratamientos (marcas) y bloques (niveles de humedad) se combinan en un sola suma
de los cuadrados “modelo” SC.
www.FreeLibros.me
c11_p397-445.qxd
406
3/12/08
CAPÍTULO 11
4:26 AM
Page 406
Análisis de varianza con varios factores
Analysis of Variance Procedure
Dependent Variable: POWERUSE
Source
DF
Sum of
Squares
Mean
Square
Model
Error
Corrected Total
7
12
19
169448.750
1671.000
171119.750
24206.964
139.250
R-Square
C.V.
F Value
Pr F
173.84
0.0001
Root MSE
POWERUSE Mean
0.990235
1.362242
11.8004
866.25000
Source
DF
Anova SS
Mean Square
F Value
PR F
BRAND
HUMIDITY
4
3
53231.000
116217.750
13307.750
38739.250
95.57
278.20
0.0001
0.0001
Alpha 0.05 df 12 MSE 139.25
Critical Value of Studentized Range 4.508
Minimum Significant Difference 26.597
Means with the same letter are not significantly different.
Tukey Grouping
Mean
N
BRAND
A
A
A
B
B
B
C
937.250
4
5
914.000
843.500
4
4
4
2
839.000
797.500
4
4
3
1
Figura 11.4
Resultados obtenidos con SAS con los datos de consumo de energía.
■
En muchas situaciones experimentales en las que los tratamientos tienen que ser aplicados a sujetos, uno solo de ellos puede recibir todos los I tratamientos. La formación de bloques
se realiza entonces con los sujetos mismos para controlar la variabilidad entre ellos; se dice entonces que cada sujeto actúa como su propio control. Los científicos sociales en ocasiones se
refieren a tales experimentos como diseños de medidas repetidas. Las “unidades” dentro de un
bloque son entonces las distintas “instancias” de aplicación de tratamiento. Del mismo modo,
los bloques se consideran como lapsos de tiempo, ubicaciones u observadores diferentes.
Ejemplo 11.6
Los datos que aparecen en la tabla 11.4 se tomaron del artículo “Compounding of Discriminative Stimuli from the Same and Different Sensory Modalities” (J. Experimental Analysis Behavior, 1971: 337-342). La respuesta de las ratas se mantuvo mediante programas de
reforzamiento de intervalo fijo en la presencia de un tono o dos luces distintas. Las luces
fueron de moderada (L1) o de baja intensidad (L2). Las observaciones se dan como el número medio de respuestas emitidas por cada sujeto durante presentaciones de estímulos únicos y compuestos durante 4 días.
Tabla 11.4 Datos de respuesta del ejemplo 11.6
Sujeto
Estímulo
1
2
3
4
xi
xi
L1
L2
Tono (T)
L1 L2
L1 T
L2 T
8.0
6.9
9.3
9.2
12.0
9.4
17.3
19.3
18.8
24.9
31.7
33.6
52.0
63.7
60.0
82.4
83.8
96.6
22.0
21.6
28.3
44.9
37.4
40.6
99.3
111.5
116.4
161.4
164.9
180.2
24.83
27.88
29.10
40.35
41.23
45.05
xj
xj
54.8
9.13
145.6
24.27
438.5
73.08
194.8
32.47
833.7
www.FreeLibros.me
34.74
c11_p397-445.qxd
3/12/08
4:26 AM
Page 407
11.1 ANOVA bifactorial con Kij 1
407
Los cálculos ANOVA se resumen en la tabla 11.5.
Tabla 11.5 Tabla ANOVA del ejemplo 11.6
Origen de la variación
gl
Suma de cuadrados
Estímulo (A)
Sujetos (B)
Error
Total
5
3
15
23
1428.28
13 444.63
780.65
15 653.56
Cuadrado de la media
285.66
4481.54
52.04
f
fA 5.49
fB 86.12
Como F0.05,5,15 2.90 y 5.49 2.90, se concluye que existen diferencias en las respuestas
promedio verdaderas asociadas con los diferentes estímulos. Para el procedimiento de Tukey, w 4.59 5
2.0
4/4
16.56.
x1
24.83
x2
27.88
x3
x4
x5
29.10 40.35 41.23
x6
45.05
Por lo tanto L1 como L2 son significativamente distintas de L2 T y no existen otras diferencias significativas entre los estímulos.
■
En la mayoría de los experimentos de bloques aleatorizados en los cuales los sujetos se desempeñan como bloques, los sujetos que en realidad participan en el experimento se
seleccionan de una gran población. Los sujetos contribuyen entonces con efectos aleatorios
en lugar de fijos. Esto no afecta el procedimiento de comparar tratamientos cuando Kij 1
(una observación por “celda” como en esta sección), pero el procedimiento cambia si Kij
K 1. En breve se considerarán dos modelos de factor en los cuales los efectos son aleatorios.
Más sobre formación de bloques Cuando I 2, se puede utilizar la prueba F o la prueba t
de diferencias apareadas para analizar los datos. La conclusión resultante no dependerá de
2
cuál procedimiento se utilice, puesto que T 2 F y t /2,
F,1, .
Al igual que con la formación de pares, la formación de bloques implica tanto una ganancia como una pérdida potencial de precisión. Si existe una gran cantidad de heterogeneidad en las unidades experimentales, el valor del parámetro de varianza 2 en el modelo
unidireccional será grande. El efecto de la formación de bloques es filtrar la variación representada por 2 en el modelo bidireccional apropiado para un experimento de bloques
aleatorizados. Con las demás cosas iguales, un valor de 2 más pequeño da por resultado
una prueba que es más probable que detecte alejamientos de H0 (es decir, una prueba con
mayor potencia).
Sin embargo, las demás cosas no son iguales aquí, puesto que la prueba F unifactorial
está basada en I(J 1) grados de libertad (gl) en el caso de error, en tanto que la prueba F
bifactorial se basa en (I 1)(J 1) grados de libertad en el caso de error. Pocos grados de
libertad en el caso de error reducen la potencia, en esencia porque el estimador asociado con
el denominador de 2 no es tan preciso. Esta pérdida de grados de libertad puede ser especialmente seria si el experimentador sólo puede permitirse un pequeño número de observaciones. No obstante, si la formación de bloques reduce significativamente la variabilidad,
quizá valdrá la pena la pérdida de grados de libertad.
Modelos de efectos aleatorios
En muchos experimentos, los niveles de un factor utilizados en el experimento, y no los que
interesan al experimentador, se seleccionan de una población mucho más grande de niveles
posibles del factor. En una situación de dos factores, cuando este es el caso para ambos factores, un modelo de efectos aleatorios es apropiado. El caso en el cual los niveles de un
factor son los únicos de interés y los niveles del otro factor se seleccionan de una población
www.FreeLibros.me
c11_p397-445.qxd
408
3/12/08
CAPÍTULO 11
4:26 AM
Page 408
Análisis de varianza con varios factores
de niveles conduce a un modelo de efectos combinados. El modelo de efectos aleatorios
bifactorial cuando Kij 1 es
Xij Ai Bj ij
(i 1, . . . , I,
j 1, . . . , J)
donde las Ai, Bj y ij son variables aleatorias independientes normalmente distribuidas
con media 0 y varianzas 2A, 2B y 2, respectivamente. Las hipótesis de interés son entonces H0A: 2A 0 (el nivel del factor A no contribuye a la variación de la respuesta) contra
HaA: 2A 0 y H0B: 2B 0 contra HaB: 2B 0. En tanto que E(MCE) 2 como antes, los
cuadrados de la media esperados para los factores A y B ahora son
E(MCA) 2 J 2A
E(MCB) 2 I 2B
Por consiguiente, cuando H0A (H0B) es verdadera, FA(FB) sigue siendo la razón de dos estimadores insesgados de 2. Se puede demostrar que una prueba al nivel para H0A contra
HaA aún rechaza H0A si fA F,I1 (I1)(J1) y, asimismo, se utiliza el mismo procedimiento
que antes para decidir entre H0B y HaB.
Para el caso en el cual el factor A es fijo y el B es aleatorio, el modelo combinado es
Xij i Bj ij
(i 1, . . . , I,
j 1, . . . , J)
donde i 0 y las Bj y ij están normalmente distribuidas con media 0 y varianzas 2B y
2, de manera respectiva. Ahora las dos hipótesis nulas son
H0A: 1 I 0
y
H0B: 2B 0
con los cuadrados de la media esperados
E(MCE) 2
E(MCA) 2
J
2i
I1
E(MCB) 2 I 2B
Los procedimientos de prueba para H0A contra HaA y H0B contra HaB son exactamente como
antes. Por ejemplo, en el análisis de los datos de cambio de color en el ejemplo 11.1, si los
cuatro tratamientos de lavado fueron seleccionados al azar, entonces como fB 11.05 y
F0.05,3,6 4.76, H0B: 2B 0 es rechazada a favor de Ha B: 2B 0. Entonces (MCB
MCE)/I 0.0485 da una estimación del “componente de varianza” 2B.
En resumen, cuando Kij 1, aunque las hipótesis y los cuadrados de la media esperados difieren con ambos efectos fijos, los procedimientos de prueba son idénticos.
EJERCICIOS
Sección 11.1 (1-15)
1. Se determinó el número de millas de desgaste útil de la banda de rodamiento (en miles) de neumáticos de cada uno de
cinco marcas diferentes de carros subcompactos (factor A,
con I 5) en combinación con cada una de cuatro marcas
diferentes de neumáticos radiales (factor B, con J 4) y se
obtuvieron IJ 20 observaciones. Se calcularon entonces
los valores SCA 30.6, SCB 44.1 y SCE 59.2. Suponga que un modelo aditivo es apropiado.
a. Pruebe H0: 1 2 3 4 5 0 (no hay diferencias en la vida útil de los neumáticos promedio verdadera a causa de las marcas de los carros) contra Ha:
por lo menos i 0 con una prueba al nivel de 0.05.
b. H0: 1 2 3 4 0 (no hay diferencias en la vida útil de los neumáticos promedio verdadera debido a
las marcas de los neumáticos) contra Ha: por lo menos
una j 0 utilizando una prueba al nivel de 0.05.
2. Se están considerando cuatro recubrimientos diferentes como protección contra corrosión de tubería de metal. Ésta se
enterrará en tres tipos distintos de suelo. Para investigar si
la cantidad de corrosión depende o del recubrimiento o del
tipo de suelo, se seleccionan 12 tramos de tubería. Cada tramo se recubre y se entierra en uno de los tres tipos de suelo durante un tiempo fijo, después del cual se determina la
cantidad de corrosión (profundidad máxima de las picaduras, en 0.0001 pulg) Los datos aparecen en la tabla.
Tipo de suelo (B)
1
2
3
Recubrimiento (A)
1
2
3
4
64
53
47
51
49
51
45
43
50
48
50
52
a. Suponiendo la validez del modelo aditivo realice el análisis ANOVA por medio de una tabla ANOVA para ver si la
cantidad de corrosión depende del tipo de recubrimiento
utilizado o del tipo de suelo. Use 0.05.
ˆ ˆ 1, ˆ 2, ˆ 3, ˆ 4, ˆ 1, ˆ 2 y ˆ 3.
b. Calcule ,
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:27 AM
Page 409
11.1 ANOVA bifactorial con Kij 1
3. El artículo “Adiabatic Humidification of Air with Water in
a Packed Tower” (Chem. Eng. Prog., 1952: 362-370) reporta datos sobre coeficiente de transferencia de calor de una
película de gas (Btu/h pie2 en °F) como una función del gasto de gas (factor A) y gasto de líquido (factor B).
B
1(190)
2(250)
3(300)
4(400)
1(200)
2(400)
A
3(700)
4(1100)
200
278
369
500
226
312
416
575
240
330
462
645
261
381
517
733
a. Después de construir una tabla ANOVA, pruebe al nivel
0.01 tanto la hipótesis de ningún efecto del gasto de gas
contra la alternativa apropiada y la hipótesis de ningún
efecto del gasto de líquido contra la alternativa apropiada.
b. Use el procedimiento de Tukey para investigar diferencias en el coeficiente de transferencia de calor esperado
debido a los diferentes gastos de gas.
c. Repita el inciso b) con gastos de líquido.
4. En un experimento para ver si la cantidad de cobertura de pintura de látex de color azul claro para interiores depende o de
la marca de la pintura o de la marca del rodillo utilizado, se
aplicó un galón de cada una de las cuatro marcas de pintura
utilizando cada una de tres marcas de rodillo y se obtuvieron
los siguientes datos (número de pies cuadrados cubiertos).
Marca de rodillo
1
2
3
1
Marca de 2
pintura
3
4
454
446
439
444
446
444
442
437
451
447
444
443
a. Construya la tabla ANOVA. [Sugerencia: Los cálculos
pueden ser expeditados restando 400 (o cualquier otro
número conveniente) de cada observación. Esto no afecta los resultados finales.]
b. Formule y pruebe las hipótesis apropiadas para decidir
si la marca de la pintura tiene algún efecto en la cobertura. Use 0.05.
c. Repita el inciso b) para la marca de rodillo.
d. Use el método de Tukey para identificar diferencias significativas entre las marcas. ¿Hay alguna marca que parezca claramente preferible a las demás?
5. En un experimento para evaluar el efecto de ángulo de tirón
de la fuerza requerida para separar conectores eléctricos, se
utilizaron cuatro ángulos diferentes (factor A) y cada uno de
una muestra de cinco conectores (factor B) fue jalado una
vez a cada ángulo (“A Mixed Model Factorial Experiment
in Testing Electrical Connectors”, Industrial Quality Control, 1960: 12-16). Los datos aparecen en la tabla adjunta.
B
A
0°
2°
4°
6°
1
2
3
4
5
45.3
44.1
42.7
43.5
42.2
44.1
42.7
45.8
39.6
38.4
42.6
47.9
36.8
38.0
42.2
37.9
45.8
47.2
48.9
56.4
409
¿Sugieren los datos que la fuerza de separación promedio
verdadera es afectada por el ángulo de tirón? Formule y pruebe
las hipótesis a un nivel de 0.01 construyendo primero una tabla ANOVA (STC 396.13, SCA 58.16 y SCB 246.97).
6. Un condado particular emplea tres valuadores que son
responsables de determinar el valor de las propiedades residenciales en el condado. Para ver si estos valuadores difieren
sistemáticamente en sus avalúos, se seleccionan 5 casas y a
cada valuador se le pide que determine el valor de mercado
de cada casa. Con el factor A denotando valuadores (I 3) y
el factor B denotando casas (J 5), suponga SCA 11.7,
SCB 113.5 y SCE 25.6.
a. Pruebe H0: 1 2 3 0 al nivel 0.05 (H0 manifiesta que no existen diferencias sistemáticas entre los valuadores.)
b. Explique por qué se utilizó un experimento de bloques
aleatorizados con sólo 5 casas en lugar de un experimento ANOVA unidireccional que implique un total de 15
casas diferentes con 5 casas distintas valuadas por cada
asesor (un grupo diferente de 5 para cada valuador).
7. El artículo “Rate of Stuttering Adaptation Under Two Electro-Shock Conditions” (Behavior Research Therapy, 1967,
49-54) da calificaciones de adaptación de tres tratamientos
diferentes: 1) ningún choque eléctrico, 2) choque eléctrico
después de cada palabra tartamudeada y 3) choque eléctrico durante cada momento de tartamudeo. Estos tratamientos se utilizaron en cada uno de 18 tartamudos y se obtuvo
STCr 3476.00, STCr 28.78 y SCB1 2977.67.
a. Construya la tabla ANOVA y pruebe a un nivel de 0.05
para ver si la calificación de adaptación promedio depende del tratamiento dado.
b. Juzgando por la proporción F de sujetos (factor B),
¿piensa que la formación de bloques de sujetos fue efectiva en este experimento? Explique.
8. El artículo “Exercise Thermoregulation and Hiperprolactinaemia” (Ergonomics, 2005: 1547-1557) discutió cómo varios aspectos de la capacidad de hacer ejercicio podría
depender de la temperatura del ambiente. Los datos adjuntos sobre pérdida de masa corporal (kg) después de ejercitarse en un ergómetro de ciclos semirrecostado en tres
temperaturas ambiente diferentes (6°, 18° y 30°C) fueron
proporcionados por los autores del artículo.
Sujeto
1
2
3
4
5
6
7
8
9
Frío
Neutro
Caliente
0.4
0.4
1.4
0.2
1.1
1.2
0.7
0.7
0.8
1.2
1.5
0.8
0.4
1.8
1.0
1.0
1.5
0.8
1.6
1.9
1.0
0.7
2.4
1.6
1.4
1.3
1.1
a. ¿Afecta la temperatura la pérdida de masa corporal promedio verdadera? Realice una prueba usando un nivel
de significación de 0.01 (como lo hizo el autor del
artículo citado).
b. Investigue las diferencias significativas entre las temperaturas.
www.FreeLibros.me
c11_p397-445.qxd
410
3/12/08
4:27 AM
Page 410
Análisis de varianza con varios factores
CAPÍTULO 11
c. Los residuos son 0.20, 0.30, 0.40, 0.07, 0.30, 0.00,
0.03, 0.20, 0.14, 0.13, 0.23, 0.27, 0.04, 0.03,
0.27, 0.04, 0.33, 0.10, 0.33, 0.53, 0.67, 0.11,
0.33, 0.27, 0.01, 0.13, 0.24. Úselos como base para
investigar la factibilidad de las suposiciones que fundamentan su análisis en a).
9. El artículo “The Effects of a Pneumatic Stool and a One-Legged Stool on Lower Limb Joint Load and Muscular Activity
During Sitting and Rising” (Ergonomics, 1993: 519-535) da
los datos adjuntos sobre el esfuerzo requerido de un sujeto
para ponerse de pies de cuatro tipos diferentes de bancos (escala de Borg). Realice un análisis de varianza con 0.05
y seguido de un análisis de comparaciones múltiples si es
apropiado.
1
Tipo 2
de
3
banco 4
3
4
Sujeto
5 6
1
2
7
8
9
12
15
12
10
10 7 7 8 9 8 7 9
14 14 11 11 11 12 11 13
13 13 10 8 11 12 8 10
12 9 9 7 10 11 7 8
xi
8.56
12.44
10.78
9.22
10. La resistencia de concreto utilizado en construcciones comerciales tiende a variar de un lote a otro. Por consiguiente, se
“curan” pequeños cilindros de prueba de concreto muestreado de un lote durante periodos hasta de 28 días en ambientes
con temperatura y humedad controladas antes de realizar
mediciones de resistencia. El concreto es entonces “comprado y vendido con base en los cilindros para prueba de resistencia” (ASTM C 31 Standard Test Method for Making
and Curing Concrete Test Specimens in the Field). Se obtuvieron los datos adjuntos con un experimento realizado para comparar tres métodos de curado diferentes con respecto
a resistencia a la compresión (MPa). Analice estos datos.
Lote
Método A
Método B
Método C
1
2
3
4
5
6
7
8
9
10
30.7
29.1
30.0
31.9
30.5
26.9
28.2
32.4
26.6
28.6
33.7
30.6
32.2
34.6
33.0
29.3
28.4
32.4
29.5
29.4
30.5
32.6
30.5
33.5
32.4
27.8
30.7
33.6
29.2
33.2
11. Los “residuos” de un ANOVA bifactorial con Kij 1 son las
cantidades xij (ˆ ˆ i ˆ j). Se puede utilizar un diagrama
de probabilidad normal de estos residuos como verificación de
factibilidad de la suposición de normalidad. Construya el
diagrama con los datos del ejemplo 11.1 y comente.
12. Suponga que en el experimento descrito en el ejercicio 6 las
cinco casas en realidad se seleccionaron al azar de entre
aquellas de una cierta edad y tamaño, de modo que el factor B
es aleatorio y no fijo. Pruebe H0: 2B 0 contra Ha: 2B 0
utilizando una prueba con un nivel de 0.01.
13. a. Demuestre que una constante d puede ser sumada (o restada de) cada xij sin afectar cualquiera de las sumas de
los cuadrados ANOVA.
b. Suponga que cada xij se multiplica por una constante no
cero c. ¿Cómo afecta esto las sumas de los cuadrados
ANOVA? ¿Cómo afecta esto los valores de los estadísticos FA y FB? ¿Qué efecto tiene la “codificación” de los
datos mediante yij cxij d en las conclusiones que se
derivan de los procedimientos ANOVA?
14. Use el hecho de que E(Xij) i j con i j 0
para demostrar que E(X
X) i, de modo que ˆ i
i
Xi
X sea un estimador insesgado para i
15. Las curvas de potencia de las figuras 10.5 y 10.6 pueden ser
utilizadas para obtener P(error de tipo II) para la prueba
F en ANOVA bifactorial. Con valores fijos de 1, 2, . . . ,
I, se calcula la cantidad 2 (J/I)2i / 2. Entonces la cifra correspondiente a 1 I 1 se ingresa en el eje horizontal en el valor de , se lee la potencia en el eje vertical de
la curva marcada 2 (I 1)(J 1) y 1 potencia.
a. En el experimento descrito en el ejercicio 2, determine
cuando 1 4, 2 0, 3 4 2 y 4. Repita con 1 6, 2 0, 3 4 3 y 4.
b. Por simetría, ¿cuál es para la prueba H0B contra HaB en
el ejemplo 11.1 cuando 1 0.3, 2 3 4 0.1
y 0.3?
11.2 ANOVA bifactorial con Kij 1
En la sección 11.1, se analizaron datos derivados de un experimento de dos factores en el cual
había una observación por cada una de las combinaciones IJ de niveles de los dos factores.
Para obtener procedimientos de prueba válidos, se supuso que las ij tienen una estructura
aditiva con ij i j, i j 0. Aditividad significa que la diferencia en las
respuestas promedio verdaderas para dos niveles cualesquiera de los factores es la misma para
cada nivel del otro factor. Por ejemplo, ij ij ( i j) ( i j) i i,
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:27 AM
Page 411
11.2 ANOVA bifactorial con Kij 1
411
independiente del nivel j del segundo factor. Esto se muestra en la figura 11.1a), donde las
líneas que conectan respuestas promedio verdaderas son paralelas.
La figura 11.1b) ilustra un conjunto de respuestas promedio verdaderas que no tienen
estructura aditiva. Las líneas que conectan estas ij no son paralelas, lo que significa que la
diferencia en las respuestas promedio verdaderas para distintos niveles de un factor sí dependen del nivel del otro factor. Cuando la aditividad no prevalece, se dice que hay interacción entre los diferentes niveles de los factores. La suposición de aditividad permitió en la
sección 11.1 obtener un estimador de la varianza del error aleatorio 2 (MCE) que resultó
ser insesgado fuera o no verdadera cualquier hipótesis de interés. Cuando Kij 1 para por
lo menos un par (i, j), se puede obtener un estimador válido de 2 sin suponer aditividad. Al
especificar el modelo apropiado y al derivar procedimientos de prueba, se abordará el caso
Kij K 1, de modo que el número de observaciones por “celda” (por cada combinación
de niveles) es constante.
Parámetros e hipótesis para el modelo
de efectos fijos
En lugar de utilizar las ij como parámetros de modelo, se acostumbra utilizar un conjunto
equivalente que revela con más claridad el rol de interacción. Sean
1
IJ i j ij
i
1
J j ij
j
1
I i ij
(11.7)
Por consiguiente es la respuesta esperada promedio a todos los niveles de ambos factores
(la gran media verdadera), i es la respuesta esperada promediada a todos los niveles del segundo factor cuando el primer factor A se mantiene en el nivel i y asimismo para .j.
DEFINICIÓN
i i efecto del factor A al nivel i
j j efecto del factor B al nivel j
interacción entre el factor A al
ij ij ( i j)
nivel i y el factor B al nivel j
(11.8)
de donde
ij i j
(11.9)
ij
El modelo es aditivo si y sólo si todas las ij 0. Las ij se conocen como parámetros de
interacción. Las i se llaman efectos principales para el factor A y las j son los efectos
principales para el factor B. Aunque existen I i, J i e IJ ij además de , las condiciones i 0, j 0, j ij 0 con cualquier i y i ij 0 cualquier j [todas en virtud de
(11.7) y (11.8)] implican que sólo IJ de estos nuevos parámetros están independientemente
determinados: , I 1 de las i, J 1 de las j e (I 1)(J 1) de las ij.
Ahora hay tres conjuntos de hipótesis que se considerarán:
0 para todas las i, j
contra
Ha AB:
H0A: 1
I 0
contra
Ha A:
por lo menos una i 0
H0B: 1
J 0
contra
HaB:
por lo menos una j 0
H0AB:
ij
www.FreeLibros.me
por lo menos una
ij
0
c11_p397-445.qxd
412
3/12/08
CAPÍTULO 11
4:27 AM
Page 412
Análisis de varianza con varios factores
Normalmente primero se prueba la hipótesis de no interacción H0AB. Si H0AB no es rechazada, entonces se prueban las otras dos hipótesis para ver si los efectos principales son significativos. Si H0AB es rechazada y H0A se prueba y no es rechazada, el modelo resultante
ij j ij no se presta para la interpretación directa. En ese caso, es mejor construir una figura similar a la figura 11.1b) para tratar de visualizar una forma en la cual interactúan los factores.
El modelo y los procedimientos de prueba
Ahora se utilizan subíndices triples tanto para variables aleatorias como para valores observados, con Xijk y xijk refiriéndose a la k-ésima observación (replicación) cuando el factor A
está al nivel i y el B al factor j. El modelo es entonces
Xijk i j
i 1, . . . , I,
ij
ijk
(11.10)
j 1, . . . , J, k 1, . . . , K
donde las ij son independientes y normalmente distribuidas, cada una con media 0 y
varianza 2.
De nueva cuenta un punto en lugar de un subíndice denota suma de todos los valores
del subíndice y una raya horizontal indica promedio. Por consiguiente, Xij es el total de todas las K observaciones realizadas para el factor A al nivel i y el factor B al nivel j [todas las
observaciones en las celdas (i, j)] y X
ij, es el promedio de estas K observaciones.
Para probar las hipótesis de interés, de nuevo se emplean sumas de cuadrados.
DEFINICIÓN
STC (Xijk X
)2
gl IJK 1
SCE (Xijk X
ij)2
gl IJ(K 1)
SCA (X
i X
)2
gl I 1
SCB (X
j X
)2
gl J 1
i
i
i
i
j
j
j
j
k
k
k
k
SCAB (X
ij X
i X
j X
)2
i
j
gl (I 1)(J 1)
k
La identidad fundamental es
STC SCA SCB SCAB SCE
SCAB se conoce como interacción de las sumas de cuadrados.
La variación total se divide por consiguiente en cuatro partes; no explicada (SCE, la cual
estaría presente si o no cualquiera de las tres hipótesis nula era verdadera) y en tres partes
que pueden ser explicadas por la verdad o falsedad de las tres H0. Cada uno de los cuatro
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:27 AM
Page 413
11.2 ANOVA bifactorial con Kij 1
413
cuadrados de la media se define como MC SC/gl. Los cuadrados de la media esperados
sugieren que cada conjunto de hipótesis deberá ser probado utilizando la proporción apropiada de cuadrados de la media con MCE en el denominador:
E(MCE) 2
E(MCA) 2
E(MCB) 2
E(MCAB) 2
JK
I1
IK
J1
I
2i
i1
J
2j
j1
K
(I 1)(J 1)
I
J
i1 j1
2
ij
Se puede demostrar que cada una de las tres proporciones de cuadrados de la media tiene
una distribución F cuando la H0 apropiada es verdadera, lo cual da los siguientes procedimientos de prueba a nivel .
Hipótesis
Ejemplo 11.7
H0A
contra
HaA
H0B
contra
HaB
H0AB contra
HaAB
Valor estadístico de prueba
MCA
fA
MCE
MCB
fB
MCE
MCAB
fAB
MCE
Región de rechazo
fA
F,I1,IJ(K1)
fB
F,J1,IJ(K1)
fAB
F,(I1)(J1),IJ(K1)
Se está considerando plantar tres variedades diferentes de jitomates (Harvester, Posa Early
Dwarf e Ife Núm. 1) y cuatro densidades de plantas distintas (10, 20, 30 y 40 mil plantas
por hectárea) en una región particular. Para ver si la variedad o la densidad de plantación
afecta la cosecha, se utiliza cada combinación de variedad y densidad de plantación en tres
parcelas diferentes y las cosechas obtenidas aparecen en la tabla 11.6 (con base en el artículo
“Effects of Plant Density on Tomato Yields in Western Nigeria”, Experimental Agriculture,
1976: 43-47).
Tabla 11.6 Datos de cosecha del ejemplo 11.7
Variedad
10 000
Densidad de plantación
20 000
30 000
40 000
xi
xi
11.33
12.21
18.13
H
Ife
P
10.5 9.2 7.9
8.1 8.6 10.1
16.1 15.3 17.5
12.8 11.2 13.3
12.7 13.7 11.5
16.6 19.2 18.5
12.1 12.6 14.0
14.4 15.4 13.7
20.8 18.0 21.0
10.8 9.1 12.5
11.3 12.5 14.5
18.4 18.9 17.2
136.0
146.5
217.5
xj
xj
103.3
11.48
129.5
14.39
142.0
15.78
125.2
13.91
500.00
13.89
En este caso, I 3, J 4 y K 3, para un total de IJK 36 observaciones. Como antes,
los resultados del análisis se resumen en una tabla ANOVA (tabla 11.7).
www.FreeLibros.me
414
3/12/08
CAPÍTULO 11
4:27 AM
Page 414
Análisis de varianza con varios factores
Tabla 11.7 Tabla ANOVA para el ejemplo 11.7
Origen de
la variación
gl
Variedades
Densidad
Interacción
Error
Total
2
3
6
24
35
Suma de cuadrados
Cuadrado de la media
327.60
86.69
8.03
38.04
460.36
f
fA 103.02
fB 18.18
fAB
0.84
163.8
28.9
1.34
1.59
Como F0.01,6,24 3.67 y fAB 0.84 no es 3.67, H0AB no puede ser rechazada al nivel 0.01,
de ahí que se concluye que los efectos de interacción no son significativos. Ahora la presencia o ausencia de efectos principales pueden ser investigadas. Como F0.01,2,24 5.61 y
fA 103.02 5.61, H0A es rechazada al nivel 0.01 a favor de la conclusión de que las diferentes variedades no afectan las cosechas promedio verdaderas. Asimismo, fB 18.18
4.72 F0.01,3,24, así que se concluye que la cosecha promedio verdadera también depende
de la densidad de plantación.
La figura 11.5 muestra el diagrama de interacción. Se observan las líneas casi paralelas de las tres variedades de jitomate, en concordancia con la prueba F que no muestra una
interacción significativa. La cosecha de Pusa Early Dwarf parece estar significativamente
por encima de las cosechas de las otras dos variedades y esto concuerda con la F altamente significativa asociada con las variedades. Además, las tres variedades muestran el mismo
patrón en el cual la cosecha se incrementa conforme la densidad también lo hace, pero disminuye más allá de 30 000 por hectárea. Esto sugiere que si se siembran más semillas se incrementará la cosecha pero a la larga la sobrepoblación hace que se reduzca la cosecha.
En este ejemplo uno de los factores es cuantitativo y éste es naturalmente el factor utilizado como eje horizontal en el diagrama de interacción. En el caso en que ambos factores
son cuantitativos, la selección del eje horizontal sería arbitraria, pero se da el caso de dos
diagramas tratados de la misma manera. En realidad, MINITAB dispone de una opción que
permite incluir ambos diagramas en la misma gráfica.
H
Variedad
Ife
P
20
18
Media
c11_p397-445.qxd
16
14
12
10
10000
20000
30000
40000
Densidad
Figura 11.5
Diagrama de interacción de MINITAB para los datos de la cosecha de jitomate.
Para verificar la factibilidad de las suposiciones de normalidad y varianza constante
se pueden construir diagramas similares a aquellos de la sección 11.1. Defínanse los valores pronosticados (valores ajustados) como las medias de celdas x̂ ijk xij, así que los residuos, las diferencias entre las observaciones y los valores pronosticados, son x ijk x ij.. El
diagrama normal de los residuos es la figura 11.6a) y el diagrama de los residuos contra los
valores ajustados es la figura 11.6b). El diagrama normal es suficientemente recto por lo que
no hay que preocuparse por la suposición de normalidad. El diagrama de residuos contra los
www.FreeLibros.me
3/12/08
4:27 AM
Page 415
11.2 ANOVA bifactorial con Kij 1
415
valores ajustados tiene una dispersión bastante uniforme vertical, así que no hay por qué
preocuparse sobre la suposición de varianza constante.
Diagrama normal de probabilidad de los residuos
(la respuesta es cosecha)
99
95
90
80
70
60
50
40
30
20
10
5
Residuos contra los valores ajustados
(la respuesta es cosecha)
2
1
Residuo
Porcentaje
c11_p397-445.qxd
0
1
2
1
3
2
1
0
Residuo
1
2
a)
Figura 11.6
3
10
12
14
16
18
Valor ajustado
20
b)
Diagramas obtenidos con MINITAB para verificar las suposiciones para el ejemplo 11.7.
■
Comparaciones múltiples
Cuando la hipótesis de no interacción H0AB no es rechazada y por lo menos una de las dos
hipótesis nulas de efecto principal es rechazada, se puede utilizar el método de Tukey para
identificar diferencias significativas en los niveles. Para identificar diferencias entre las i
cuando H0A es rechazada,
1. Se obtiene Q,I,IJ(K1), donde el segundo subíndice I identifica el número de niveles que
se están comparando y el tercero se refiere al número de grados de libertad en cuanto al
error.
2. Se calcula w QM
C
E
/(
JK
), donde JK es el número de observaciones promediadas
para obtener cada una de las xi en el paso 3.
3. Se ordenan las xi desde la más pequeña hasta la más grande, se subrayan todos los pares que difieren por menos de w. Los pares no subrayados corresponden a niveles del factor A significativamente diferentes.
Para identificar niveles diferentes del factor B cuando H0B es rechazada, se reemplaza el segundo subíndice en Q por J, se reemplaza JK por IK en w, y se reemplaza xi por xj.
Ejemplo 11.8
(continuación
del ejemplo
11.7)
Para el factor A (variedades), I 3, así que 0.01 e IJ(K 1) 24, Q0.01,3,24 4.55.
Entonces w 4.551.5
9
/1
2
1.66, así que después de ordenar y subrayar se obtiene
x1
11.33
x2
12.21
x3
18.13
Las variedades Harvester e Ife no parecen diferir significativamente una de otra en cuanto a
algún efecto en la cosecha promedio verdadera, pero ambas difieren de la variedad Pusa.
Para el factor B (densidad), J 4 así que Q0.01,4,24 4.91 y w 4.911.5
9
/9
2.06.
x1
11.48
x4
13.91
x2
14.39
x3
15.78
www.FreeLibros.me
c11_p397-445.qxd
416
3/12/08
CAPÍTULO 11
4:27 AM
Page 416
Análisis de varianza con varios factores
Por lo tanto, con un coeficiente de error experimental de 0.01, el cual es bastante conservador, sólo la densidad más baja parece diferir de manera significativa de todas las demás. Incluso con 0.05 (de modo que w 1.64), las densidades 2 y 3 no pueden ser juzgadas
significativamente diferentes una de otra en cuanto a su efecto en la cosecha.
■
Modelos con efectos combinados y aleatorios
En algunos problemas, es posible que los niveles de uno u otro factor hayan sido seleccionados de una gran población de niveles posibles, así que los efectos contribuidos por el factor son aleatorios en lugar de fijos. Como en la sección 11.1, si ambos factores contribuyen
con efectos aleatorios, el modelo se conoce como modelo de efectos aleatorios, en tanto que
si un factor es fijo y el otro aleatorio, resulta un modelo de efectos combinados. Ahora se
considerará el análisis de un modelo de efectos combinados en el cual el factor A (filas) es
el factor fijo y el factor B (columnas) es el factor aleatorio. El caso en el cual ambos factores son aleatorios se aborda en el ejercicio 26.
DEFINICIÓN
El modelo de efectos combinados cuando el factor A es fijo y el B es aleatorio es
Xijk i Bj Gij ijk
i 1, . . . , I, j 1, . . . , J, k 1, . . . , K
Aquí y i son constantes con i 0 y las Bj, Gij y ijk son variables aleatorias independientes normalmente distribuidas con valor esperado 0 y varianzas 2B , 2G y 2, respectivamente.*
H0A: 1 2 I 0
contra
Ha A: por lo menos una i 0
0
contra
Ha B: B2 0
H0G: G2 0
contra
Ha G: G2 0
H0B:
B2
Se acostumbra probar H0A y H0B sólo si la hipótesis de no interacción H0G no puede ser
rechazada.
Las sumas pertinentes de cuadrados y cuadrados de la media requeridas para los procedimientos de prueba se definen y calculan con exactitud como en el caso de efectos fijos.
Los cuadrados de la media esperados para el modelo fijo son
E(MCE) 2
JK
2i
I1
E(MCB) 2 K 2G IK 2B
E(MCA) 2 K 2G
y
E(MCAB) 2 K 2G
Por consiguiente, para probar la hipótesis de no intervención la razón fAB MCAB/MCE
es de nuevo apropiada, con H0G rechazada si fAB F,(I1)(J1),IJ(K1). Sin embargo, para probar H0A contra HaA, los cuadrados de la media esperados sugieren que aunque el numerador
de la razón F deberá seguir siendo MCA, el denominador deberá ser MCAB en lugar de
MCE. MCAB también es el denominador de la razón F para probar H0B.
*
Esto se conoce como modelo “no restringido”. Un modelo “restringido” alternativo requiere iGij 0 por cada
j (de ahí que las Gij ya no son independientes). Los cuadrados de la media esperados y las razones F apropiadas
para probar ciertas hipótesis dependen de la selección del modelo. La opción preestablecida de MINITAB produce resultados para el modelo no restringido.
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:27 AM
Page 417
11.2 ANOVA bifactorial con Kij 1
417
Para probar H0A contra HaA (los factores A fijo, B aleatorio) el valor del estadístico de
prueba es fA MCA/MCAB y la región de rechazo es fA F,I1,(I1)(J1). La prueba
de H0B contra HaB utiliza fB MCB/MCAB y la región de rechazo es fB
F,J1,(I1)(J1).
Ejemplo 11.9
Un ingeniero de procesos ha identificado dos causas potenciales de vibración de motores eléctricos, el material utilizado para la carcasa del motor (factor A) y el proveedor de cojinetes utilizados en el motor (factor B). Los datos adjuntos sobre la cantidad de vibración (micrones) se
obtuvieron con un experimento en el cual se construyeron motores con carcasas de acero, aluminio y plástico y cojinetes suministrados por cinco proveedores seleccionados al azar.
Proveedor
Material
Acero
Aluminio
Plástico
1
2
3
4
5
13.1 13.2
15.0 14.8
14.0 14.3
16.3 15.8
15.7 16.4
17.2 16.7
13.7 14.3
13.9 14.3
12.4 12.3
15.7 15.8
13.7 14.2
14.4 13.9
13.5 12.5
13.4 13.8
13.2 13.1
Sólo los tres materiales para carcasas utilizados en el experimento se están considerando para usarse en la producción, de ahí que el factor A es fijo. Sin embargo, los cinco proveedores fueron seleccionados al azar de una población mucho más grande, de modo que el factor
B es aleatorio. Las hipótesis nulas pertinentes son
H0A: 1 2 3 0
H0B: B2 0
H0AB: G2 0
En la figura 11.7 aparecen los resultados generados por MINITAB. La columna de valor P
en la tabla ANOVA indica que las últimas dos hipótesis nulas deberán ser rechazadas a un
nivel de significación de 0.05. Los diferentes materiales para carcasas por sí mismos no parecen afectar la vibración, pero la interacción entre el material y el proveedor es una causa
significativa de la variación de la vibración.
Factor
casmater
source
Type
fixed
random
Source
casmater
source
casmater*source
Error
Total
Source
1
2
3
4
Levels
3
5
DF
2
4
8
15
29
Values
1
1
SS
0.7047
36.6747
11.6053
1.6700
50.6547
Variance
component
casmater
source
casmater*source
Error
1.2863
0.6697
0.1113
Error
term
3
3
4
2
2
3
3
MS
0.3523
9.1687
1.4507
0.1113
4
5
F
0.24
6.32
13.03
P
0.790
0.013
0.000
Expected Mean Square for Each Term
(using unrestricted model)
(4) 2(3) Q[1]
(4) 2(3) 6(2)
(4) 2(3)
(4)
Figura 11.7 Resultados obtenidos con la opción “balanced ANOVA” de MINITAB con
los datos del ejemplo 11.9.
■
Cuando por lo menos dos de las Kij son desiguales, los cálculos ANOVA son mucho
más complejos que en el caso Kij K, y existe controversia en cuanto a cuáles procedimientos de prueba deben ser utilizados. Una de las referencias del capítulo puede ser consultada
para más información.
www.FreeLibros.me
c11_p397-445.qxd
418
3/12/08
CAPÍTULO 11
EJERCICIOS
4:27 AM
Page 418
Análisis de varianza con varios factores
Sección 11.2 (16-26)
16. En un experimento para valuar los efectos de tiempo de fraguado (factor A) y tipo de mezcla (factor B) en la resistencia a la
compresión de cubos de cemento endurecido, se utilizaron tres
tiempos de fraguado diferentes en combinación con cuatro
mezclas distintas, con tres observaciones obtenidas para cada
una de las 12 combinaciones de mezcla-tiempo de fraguado.
Las sumas de cuadrados resultantes fueron SCA 30 763.0,
SCB 34 185.6, SCE 97 436.8 y STC 205 966.6.
a. Construya una tabla ANOVA.
b. Pruebe al nivel 0.05 la hipótesis nula H0AB: todas las
ij 0 (ninguna interacción de factores) contra HaAB:
por lo menos una ij 0.
c. Pruebe al nivel 0.05 la hipótesis nula H0A: 1 2 3
0 (efectos principales del factor A ausentes) contra
HaA: por lo menos una i 0.
d. Pruebe H0B: 1 2 3 4 0 contra HaB: por lo
menos una j 0 utilizando una prueba al nivel 0.05.
e. Los valores de xi fueron x1 4010.88, x2 4029.10
y x3 3960.02. Use el procedimiento de Tukey para investigar diferencias significativas entre los tres tiempos
de fraguado.
17. El artículo “Towards Improving the Properties of Plaster
Moulds and Castings” (J. of Engr. Manuf., 1991: 265-269)
describe varios ANOVA realizados para estudiar cómo la
cantidad de fibra de carbono y las adiciones de arena afectan las diversas características del proceso de moldeo.
A continuación se dan datos sobre dureza de la pieza moldeada y resistencia del molde húmedo.
Adición
de arena
(%)
Adición
de fibra
de carbono
(%)
Dureza
de la pieza
fundida
Resistencia
de molde
húmedo
0
0
15
15
30
30
0
0
15
15
30
30
0
0
15
15
30
30
0
0
0
0
0
0
0.25
0.25
0.25
0.25
0.25
0.25
0.50
0.50
0.50
0.50
0.50
0.50
61.0
63.0
67.0
69.0
65.0
74.0
69.0
69.0
69.0
74.0
74.0
72.0
67.0
69.0
69.0
74.0
74.0
74.0
34.0
16.0
36.0
19.0
28.0
17.0
49.0
48.0
43.0
29.0
31.0
24.0
55.0
60.0
45.0
43.0
22.0
48.0
a. Un ANOVA para la resistencia del molde húmedo da SCArena 705, SCFibra 1278, SCE 843 y STC 3105.
Pruebe en busca de cualesquiera otros efectos con 0.05.
b. Realice un ANOVA de las observaciones de dureza de la
pieza moldeada con 0.05.
c. Trace una gráfica de la dureza media muestral con el porcentaje de arena con niveles diferentes de fibra de carbono.
¿Es el diagrama consistente con su análisis en el inciso b)?
18. Los datos adjuntos se obtuvieron con un experimento para investigar si el rendimiento con cierto proceso químico
dependía de la formulación de una mezcla de entrada particular o de la velocidad del mezclador.
Velocidad
60
70
80
1
189.7
188.6
190.1
185.1
179.4
177.3
189.0
193.0
191.1
2
165.1
165.9
167.6
161.7
159.8
161.6
163.3
166.6
170.3
Formulación
Un programa estadístico dio SC(Forma) 2253.44,
SC(Velocidad) 230.81, SC(Forma*Velocidad) 18.58 y
SCE 71.87.
a. ¿Parece haber interacción entre los factores?
b. ¿Parece que el rendimiento depende de la formulación o
la velocidad?
c. Estime los efectos principales.
d. Los valores ajustados son x̂ijk ˆ ˆ i ˆ j ˆij y los
residuos son xijk x̂ijk. Verifique que los residuos sean
0.23, 0.87, 0.63, 4.50, 1.20, 3.30, 2.03, 1.97, 0.07,
1.10, 0.30, 1.40, 0.67, 1.23, 0.57, 3.43, 0.13 y 3.57.
e. Construya un diagrama de probabilidad normal con los
residuos dados en el inciso d). ¿Parecen estar normalmente distribuidas las ijk?
19. La tabla de datos adjuntos da observaciones sobre acidez total de muestras de carbón de tres tipos diferentes, con las determinaciones obtenidas con tres concentraciones distintas
de NaOH etanólico (“Chemistry of Brown Coals”, Australian J. Applied Science. 1958: 375-379).
Tipo de carbón
0.404N
Conc. de
0.626N
NaOH
0.786N
Morwell
Yallourn
Maddingley
8.27, 8.17
8.03, 8.21
8.60, 8.20
8.66, 8.61
8.42, 8.58
8.61, 8.76
8.14, 7.96
8.02, 7.89
8.13, 8.07
a. Suponiendo que ambos efectos son fijos, construya una
tabla ANOVA, pruebe en cuanto a la presencia de interacción y luego en cuanto a la presencia de efectos principales por cada factor (todo a un nivel de 0.01).
b. Use un procedimiento de Tukey para identificar diferencias significativas entre los tipos de carbón.
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:27 AM
Page 419
11.3 ANOVA con tres factores
20. Se midió la corriente (en A) necesaria para producir un
cierto nivel de brillo en un tubo de televisión para dos tipos
diferentes de vidrio y tres tipos distintos de fósforo y se obtuvieron los datos adjuntos (“Fundamentals of Analysis of
Variance”, Industrial Quality Control, 1956: 5-8).
Tipo de fósforo
Tipo de 1
vidrio 2
1
2
3
280, 290, 285
230, 235, 240
300, 310, 295
260, 240, 235
270, 285, 290
220, 225, 230
Suponiendo que ambos factores son fijos, pruebe H0AB contra
HaAB al nivel 0.01. Entonces si H0AB no puede ser rechazada,
pruebe los dos conjuntos de hipótesis de efecto principal.
21. En un experimento para investigar el efecto del “factor cemento” (número de sacos de cemento por yarda cúbica) en
la resistencia a la flexión del concreto resultante (“Studies of
Flexural Strength of Concrete, Part 3: Effects of Variation in
Testing Procedure”, Proceedings ASTM, 1957: 1127-1139),
se utilizaron I 3 valores de factor diferentes, se seleccionaron J 5 lotes distintos de cemento y se vaciaron K 2 vigas con cada combinación de factor cemento/lote. Las sumas
de cuadrados incluyen SCA 22 941.80, SCB 22 765.53,
SCE 15 253.50 y STC 64 954.70. Construya la tabla
ANOVA. Entonces suponiendo un modelo combinado con
factor de cemento (A) fijo y lotes (B) aleatorios, pruebe los
tres pares de hipótesis de interés al nivel 0.05.
22. Se realizó un estudio para comparar las vidas útiles de escritura de cuatro marcas premium de plumas. Se pensaba
que la superficie de escritura podría afectar la vida útil, así que
se seleccionaron al azar tres superficies diferentes. Se utilizó una máquina de escritura para que las condiciones permanecieran homogéneas (p. ej., presión constante y un
ángulo fijo). La tabla adjunta muestra las dos vidas útiles
(min) obtenidas con cada combinación de marca-superficie.
Superficie de escritura
1
Marca
2
de pluma 3
4
xj
1
2
3
xi
709, 659
668, 685
659, 685
698, 650
713, 726
722, 740
666, 684
704, 666
660, 645
692, 720
678, 750
686, 733
5413
5621
5564
4112
4227
4122
4137
419
Realice un ANOVA apropiado y exprese su conclusión.
23. Los datos adjuntos se obtuvieron en un experimento para investigar si la resistencia a la compresión de cilindros de concreto depende del tipo de material de remate utilizado o de la
variabilidad de los diferentes lotes (“The Effect of Type of
Capping Material on the Compressive Strength of Concrete
Cylinders”, Proceedings ASTM, 1958: 1166-1186). Cada número es un total de celda (xij) basado en K 3 observaciones.
Lote
1
Material de remate 2
3
1
2
3
4
5
1847
1779
1806
1942
1850
1892
1935
1795
1889
1891
1785
1891
1795
1626
1756
Además de x 2ijk 16 815 853 y x 2ij 50 443 409.
Obtenga la tabla ANOVA y luego pruebe al nivel 0.01 las
hipótesis H0G contra HaG, H0A contra HaA y H0B contra HaB,
suponiendo que el remate es un efecto fijo y los lotes son un
efecto aleatorio.
24. a. Demuestre que E(X
X) i de modo que
Xi
X
i
sea un estimador insesgado de i (en el modelo de efectos fijos).
b. Con ˆij
Xij
Xi
Xj
X, demuestre que ˆij es
un estimador insesgado de ij (en el modelo de efectos
fijos).
25. Demuestre cómo se puede obtener un intervalo de confianza t de 100(1 )% para i i. Luego calcule un intervalo de 95% para 2 3 con los datos del ejercicio 19.
[Sugerencia: Con 2 3, el resultado del ejercicio
24a indica cómo obtener ˆ. Enseguida calcule V( ˆ ) y ˆ y
obtenga una estimación de ˆ con M
C
E
para estimar
(la cual identifica el número de grados de libertad apropiado).]
26. Cuando ambos factores son aleatorios en un experimento
ANOVA bidireccional con K réplicas por cada combinación
de niveles de factor, los cuadrados de la media esperados
E(MCE) 2, E(MCA) 2 KG2 JKA2, E(MCB)
2 KG2 IKB2 y E(MCAB) 2 KG2.
a. ¿Qué razón F es apropiada para probar H0G: G2 0
contra HaG: G2 0?
b. Responda el inciso a) para probar H0A: A2 0 contra
HaA: A2 0 y H0B: B2 0 contra HaB: B2 0.
16 598
11.3 ANOVA con tres factores
Para indicar la naturaleza de los modelos y análisis cuando los experimentos ANOVA implican más de dos factores, aquí se abordará el caso de tres factores fijos: A, B y C. Los
números de niveles de los tres factores se denotarán por I, J y K, respectivamente y Lijk
el número de observaciones realizadas con el factor A al nivel i, el factor B al nivel j y el
www.FreeLibros.me
c11_p397-445.qxd
420
3/12/08
CAPÍTULO 11
4:27 AM
Page 420
Análisis de varianza con varios factores
factor C al nivel k. Como con el ANOVA bifactorial, el análisis es bastante complicado
cuando las Lijk no son iguales, por lo que se hace Lijk L. En ese caso Xijkl y xijkl denotan
el valor observado, antes y después de que se realiza el experimento de la l-ésima réplica
(l 1, 2, . . . , L) cuando los tres factores están fijos en los niveles i, j y k.
Para entender los parámetros que aparecerán en el modelo ANOVA trifactorial, primero recuérdese que en el ANOVA bifactorial con réplicas, E(Xijk) ij i j ij,
donde las restricciones ii jj 0, i ij 0 por cada j y j ij 0 por cada i eran necesarias para obtener un conjunto único de parámetros. Si se utilizan subíndices puntuales
en las ij para denotar el cálculo de promedios (en lugar de suma), entonces
i
1
1
ij i
J j ij
IJ i j
es el efecto del factor A al nivel i promediado a todos los niveles del factor B, mientras que
ij j ij
1
i
I i ij
ij
es el efecto del factor A al nivel i específico del factor B al nivel j. Si el efecto de A al nivel i
depende del nivel de B, entonces existe interacción entre los factores y las ij no son cero.
En particular,
ij j i
(11.11)
ij
Modelo de efectos fijos con tres factores
DEFINICIÓN
El modelo para ANOVA con tres factores con Lijk L es
Xijkl ijk ijkl
i 1, . . . , I,
j 1, . . . , J
k 1, . . . , K,
l 1, . . . , L
(11.12)
donde las ijkl están normalmente distribuidas con media 0 y varianza 2 y
ijk i j k
AB
ij
AC
ik
BC
jk
ijk
(11.13)
Las restricciones necesarias para obtener parámetros singularmente definidos son que la suma para cualquier subíndice de cualquier parámetro a la derecha de (11.13) sea igual a cero.
AC
BC
Los parámetros AB
ij,
ik y
jk se llaman interacciones de dos factores y ijk se llama
interacción de tres factores; las i, j y k son los parámetros de los efectos principales.
A cualquier nivel fijo k del tercer factor, análogo a (11.11),
ijk ik jk k
AB
ij
ijk
es la interacción del i-ésimo nivel de A con el j-ésimo nivel de B específico del k-ésimo
nivel de C, mientras que
ij i j
AB
ij
es la interacción entre A al nivel i y B al nivel j promediada a todos los niveles de C. Si la
interacción de A al nivel i y B al nivel j no depende de k, entonces todas las ijk son iguales
a 0. Por tanto las ijk representan no aditividad de las AB
ij para dos factores a los varios niveles del tercer factor C. Si el experimento incluyó más de tres factores, habría términos de
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:27 AM
Page 421
11.3 ANOVA con tres factores
421
interacción de mayor grado correspondientes con interpretaciones análogas. Obsérvese que
en el argumento previo, si se hubiera considerado fijar el nivel de A o B (en lugar del de C,
como se hizo) y examinando las ijk su interpretación sería la misma, si cualquiera de las interacciones de dos factores dependen del nivel del tercer factor, entonces hay ijk no cero.
Análisis de un experimento con tres factores
Cuando L 1, existe una suma de cuadrados por cada efecto principal, por cada interacción de dos factores y por la interacción de tres factores. Para escribir éstas en una forma
que indique cómo se definen las sumas de cuadrados cuando existen más de tres factores,
obsérvese que cualquiera de los parámetros de modelo en (11.13) puede ser estimado insesgadamente promediando Xijkl para los subíndices apropiados y considerando las diferencias.
Por lo tanto
ˆ X
ˆ i X
i X
ˆ AB
ij X
i X
j X
ij X
ˆijk X
ijk X
ij X
ik X
jk X
i X
j X
k X
con los demás efectos principales y estimadores de interacción obtenidos por simetría.
DEFINICIÓN
Las sumas de cuadrados pertinentes son,
STC (Xijkl X
)2
gl IJKL 1
SCA ˆ 2i JKL (X
i X
)2
gl I 1
i j k l
i j k l
i
2
SCAB ( ˆ AB
ij )
gl (I 1) (J 1)
i j k l
KL(X
Xi
Xj
X)2
ij
i j
SCABC ˆ 2ijk L ˆ 2ijk
i j k l
i j k
SCE (Xijkl X
ijk)2
gl (I 1) (J 1)(K 1)
gl IJK(L 1)
i j k l
con los demás efectos principales y las sumas de cuadrados de interacción de dos factores obtenidos por simetría. STC es la suma de las otras ocho sumas de cuadrados.
Cada suma de cuadrados (excepto STC) cuando se divide entre sus grados de libertad
da un cuadrado de la media. Los cuadrados de la media esperados son
E(MCE) 2
E(MCA) 2
E(MCAB) 2
E(MCABC) 2
JKL
2
I1 i i
KL
(
(I 1)(J 1) i j
AB 2
ij )
L
( )2
(I 1)(J 1)(K 1) i j k ijk
con expresiones similares de los demás cuadrados de la media esperados. El efecto principal y las hipótesis de interacción se prueban formando razones F con MCE en cada denominador.
www.FreeLibros.me
c11_p397-445.qxd
422
3/12/08
CAPÍTULO 11
4:27 AM
Page 422
Análisis de varianza con varios factores
Hipótesis nula
Valor estadístico de prueba
MCA
fA
fA
MCE
H0A: todas las i 0
H0AB: todas las
H0ABC: todas las
AB
ij
0
fAB
MCAB
MCE
fAB
ijk
0
fABC
MCABC
MCE
fABC
Región de rechazo
F,I1,IJK(L1)
F,(I1)(J1),IJK(L1)
F,(I1)(J1)(K1),IJK(L1)
Normalmente las hipótesis de efecto principal se prueban sólo si todas las interacciones no
son significativas.
Este análisis supone que Lijk L 1. Si L 1, entonces como en el caso de dos factores, las interacciones de alto grado deben ser supuestas iguales a 0 para obtener un MCE
que estime 2. Con L 1 y haciendo caso omiso de la suma para el cuarto subíndice l, las
fórmulas anteriores para las sumas de cuadrados continúan siendo válidas y la suma de cuaXijk Xijk en la expresión para ˆ ijk.
drados en cuanto a error es SCE i j k ˆ 2ijk con
Ejemplo 11.10
Las siguientes observaciones (temperatura corporal 100°F) se reportaron en un experimento para estudiar la tolerancia al calor de ganado (“The Significance of the Coat in Heat
Tolerance of Cattle”, Australian J. Agriculture Research, 1959: 744-748). Se realizaron mediciones en cuatro periodos diferentes (factor A, con I 4) en dos razas diferentes de ganado
(factor B, con J 2) que tienen cuatro tipos distintos de pelaje (factor C, con K 4);
L 3 observaciones realizadas por cada una de las 4 2 4 32 combinaciones de
niveles de los tres factores.
B1
B2
C1
C2
C3
C4
C1
C2
C3
C4
A1
3.6
3.8
3.9
3.4
3.7
3.9
2.9
2.8
2.7
2.5
2.4
2.2
4.2
4.0
3.9
4.4
3.9
4.2
3.6
3.7
3.4
3.0
2.8
2.9
A2
3.8
3.6
4.0
3.8
3.9
3.9
2.9
2.9
2.8
2.4
2.2
2.2
4.4
4.4
4.6
4.2
4.3
4.7
3.8
3.7
3.4
2.0
2.9
2.8
A3
3.7
3.9
4.2
3.8
4.0
3.9
2.9
2.7
2.8
2.1
2.0
1.8
4.2
4.4
4.5
4.0
4.6
4.5
4.0
3.8
3.3
2.0
2.4
2.0
A4
3.6
3.5
3.8
3.6
3.7
3.9
2.6
2.9
2.9
2.0
2.0
1.9
4.0
4.1
4.2
4.0
4.4
4.2
3.8
3.7
3.5
2.0
2.2
2.3
La tabla de totales de celda (xijk.) con todas las combinaciones de los tres factores es
B1
B2
xijk
C1
C2
C3
C4
C1
C2
C3
C4
A1
A2
A3
A4
11.3
11.4
11.8
10.9
11.0
11.6
11.7
11.2
8.4
8.6
8.4
8.4
7.1
6.8
5.9
5.9
12.1
13.4
13.1
12.3
12.5
13.2
13.1
12.6
10.7
10.9
11.1
11.0
8.7
7.7
6.4
6.5
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:27 AM
Page 423
423
11.3 ANOVA con tres factores
La figura 11.8 muestra diagramas de las medias de celda correspondientes xijk xijk/3. Se
regresará a estos diagramas después de considerar pruebas de varias hipótesis. La base para
estas pruebas es la tabla ANOVA dada en la tabla 11.8.
x
x
x
x
4.5
C1
C2
C3
C4
3.5
2.5
1.5
B1
B2
B1
Figura 11.8
B2
B1
B2
B1
B2
Diagramas de xijk para el ejemplo 11.10.
Tabla 11.8 Tabla ANOVA para el ejemplo 11.10
Origen
A
B
C
AB
AC
BC
ABC
Error
Total
gl
Suma de cuadrados
I13
J11
K13
(I 1)(J 1) 3
(I 1)(K 1) 9
(J 1)(K 1) 3
(I 1)(J 1)(K 1) 9
IJK(L 1) 64
IJKL 1 95
0.49
6.45
48.93
0.02
1.61
0.88
0.25
2.53
61.16
Cuadrados de la media
0.163
6.45
16.31
0.0067
0.179
0.293
0.0278
0.0395
f
4.13
163.29
412.91
0.17
4.53
7.42
0.704
Como F0.01,9,64 2.70 y fABC MCABC/MCE 0.704 no excede de 2.70, se concluye que las interacciones de tres factores no son significativas. Sin embargo, aunque también
las interacciones AB no son significativas, tanto las interacciones AC como BC así como
también los efectos principales parecen ser necesarios en el modelo. Cuando no existen interacciones ABC o AB, un diagrama de las xijk ( ˆ ijk) por separado para cada nivel de C no
deberá revelar ningunas interacciones sustanciales (si sólo las interacciones ABC son
cero, los diagramas son más difíciles de interpretar: véase el artículo “Two-Dimensional
Plots for Interpreting Interactions in the Three-Factor Analysis of Variance Model”, Amer.
Statistician, mayo de 1979: 63-69).
■
Se pueden construir diagramas de diagnóstico para verificar las suposiciones de normalidad y varianza constante como se describió en secciones previas. Se puede utilizar el procedimiento de Tukey en ANOVA de tres factores (o más). El segundo subíndice en Q es el número
de medias muestrales que se están comparando y el tercero es grados de libertad para error.
También se pueden analizar los modelos con efectos aleatorios y fijos. Las sumas
de cuadrados y grados de libertad son idénticos al caso de efectos fijos, pero los cuadrados de la media esperados son, desde luego, diferentes para los efectos principales
aleatorios o interacciones. Una buena referencia es el libro de Douglas Montgomery
que aparece en la bibliografía del capítulo.
www.FreeLibros.me
c11_p397-445.qxd
424
3/12/08
CAPÍTULO 11
4:27 AM
Page 424
Análisis de varianza con varios factores
Diseños de cuadrados latinos
Cuando varios factores tienen que ser estudiados al mismo tiempo, un experimento en el
cual existe por lo menos una observación por cada combinación posible de niveles se conoce como diseño completo. Si los factores son A, B y C con I, J y K niveles, respectivamente, un diseño completo requiere por lo menos IJK observaciones. Con frecuencia un
experimento de este tamaño es impracticable debido a las restricciones de costo, tiempo o
espacio o literalmente imposible. Por ejemplo, si la variable de respuesta es ventas de un
producto y los factores son configuraciones de exhibición diferentes, distintas tiendas y diferentes periodos, entonces sólo una configuración de exhibición puede ser realísticamente
usada en una tienda dada en un periodo determinado.
Un experimento con tres factores en el cual se realizan menos de IJK observaciones
se llama diseño incompleto. Existen algunos diseños incompletos en los cuales el patrón de
combinaciones de factores es tal que el análisis es directo. Un diseño de tres factores como
ése se llama diseño de cuadrado latino. Es apropiado cuando I J K (p. ej., cuatro configuraciones de exhibición, cuatro tiendas y cuatro lapsos de tiempo) y todos los efectos de
interacción de dos y tres factores se suponen ausentes. Si los niveles del factor A están identificados con las filas de una tabla bidireccional y los niveles de B con las columnas de la
tabla, entonces la característica definitoria de un diseño de cuadrado latino es que cada nivel del factor C aparece exactamente una vez en cada fila y exactamente una vez en cada
columna. La figura 11.9 ilustra ejemplos de cuadrados latinos de 3 3, 4 4 y 5 5. Existen 12 cuadrados latinos diferentes de 3 3 y el número de N N cuadrados latinos distintos se incrementa con rapidez con N (p. ej., cada permutación de las filas de un cuadrado
latino dado produce un cuadrado latino y asimismo en el caso de permutaciones de columnas). Se recomienda que el cuadrado utilizado en realidad en un experimento particular se
elija al azar del conjunto de todos los cuadrados posibles de la dimensión deseada; para más
detalles, consulte una de las referencias del capítulo.
C
1
A 2
3
B
1 2 3
1
2
3
2
3
1
3
1
2
B
C
1
2
3
1
2
A
3
4
3
4
2
1
4
2
1
3
2
1
3
4
Figura 11.9
4
C
1
3
4
2
1
2
A 3
4
5
1
B
2 3
4
5
4
3
1
5
2
3
1
5
2
4
2
5
3
4
1
1
2
4
3
5
5
4
2
1
3
Ejemplos de cuadrados latinos.
Se utilizará la letra N para denotar el valor común de I, J y K. Entonces un diseño
completo con una observación por cada combinación requeriría N 3 observaciones, en tanto
que un cuadrado latino requiere solo N2 observaciones. Una vez que se selecciona un cuadrado particular, el valor de k (el nivel del factor C) queda determinado por completo por
los valores de i y j. Para recalcar esto, se utiliza xij(k) para denotar el valor observado cuando los tres factores están a los niveles i, j y k, respectivamente, con k tomando sólo un valor por cada par i, j. El modelo es entonces
Xij(k) i j k ij(k)
i, j, k 1, . . . , N
donde i j k 0 y las ij(k) son independientes y normalmente distribuidas con media 0 y varianza 2.
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:27 AM
Page 425
11.3 ANOVA con tres factores
425
Se emplea la siguiente notación para los totales y promedios:
Xi Xij(k)
j
X
X
i i
N
Xj Xij(k)
Xk Xij(k)
i
X
Xj j
N
ij
X
Xk k
N
X Xij(k)
i j
X
X 2
N
Obsérvese que aunque Xi.. previamente sugería una suma doble, ahora corresponde a una sola suma para todos los subíndices j (y los valores asociados de k).
DEFINICIÓN
Las sumas de cuadrados para un experimento de cuadrado latino son
STC (Xij(k) X
)2
gl N 2 1
SCA (X
i X
)2
gl N 1
SCB (X
j X
)2
gl N 1
SCC (X
k X
)2
gl N 1
i j
i j
i j
i j
SCE [Xij(k) (ˆ ˆ i ˆj ˆk)]2
i j
(Xij(k) X
i X
j X
k 2X
)2
i j
gl (N 1)(N 2)
STC SCA SCB SCC SCE
Cada cuadrado de la media es, por supuesto, la razón SC/gl. Para probar H0C: 1
2 N 0, el valor estadístico de prueba es fC MCC/MCE, con H0C rechazada
si fC F,N1,(N1)(N2). Las otras dos hipótesis nulas para efectos principales también son
rechazadas si la razón F correspondiente excede de F,N1,(N1)(N2).
Si cualquiera de las hipótesis nulas es rechazada, las diferencias significativas pueden
ser identificadas por medio del procedimiento de Tukey. Después de calcular w
Q,N,(N1)(N2) M
C
E
/N
, los pares de medias muestrales (las xi , xj o xk ) que difieren
por más de w corresponden a diferencias significativas entre los efectos del factor asociado
(las i, j o k).
La hipótesis H0C es con frecuencia la de interés central. Se utiliza un diseño de cuadrado latino para controlar la variación externa de los factores A y B, como se hizo mediante un diseño de bloques aleatorizados en el caso de un factor externo único. Así pues en el
ejemplo de ventas de productos previamente mencionado, la variación debida tanto a las
tiendas como a los lapsos de tiempo es controlada por un diseño de cuadrado latino, lo que
permite que un investigador pruebe en cuanto a la presencia de efectos producidos por las
diferentes configuraciones de exhibición de productos.
Ejemplo 11.11
En un experimento para investigar el efecto de la humedad relativa en la resistencia a la
abrasión de piel recortada de un patrón rectangular (“The abrasion of Leather”, J. Inter. Soc.
Leather Trades’ Chemists, 1946: 287), se utilizó un cuadrado latino de 6 6 para controlar
la posible variabilidad a causa de la posición en las filas o columnas del patrón. Los seis
niveles de humedad relativa estudiadas fueron 1 25%, 2 37%, 3 50%, 4 62%,
5 75% y 6 87% con los siguientes resultados.
www.FreeLibros.me
c11_p397-445.qxd
426
3/12/08
CAPÍTULO 11
4:27 AM
Page 426
Análisis de varianza con varios factores
1
A(filas)
2
3
B(columnas)
4
5
6
xi
6.79
1
3
4
6
5.03
2
5.50
5
1
35.10
2
2
1
5
4.96
4
5.78
3
6
37.35
3
4
6
3
6.34
5
5.31
1
2
39.90
4
1
3
2
6.31
6
5.46
4
5
37.83
5
6
5
1
7.27
3
6.54
2
4
37.89
6
5
2
4
5.93
1
8.02
6
3
38.91
40.98
37.63
35.84
37.94
37.98
7.38
7.15
6.75
8.05
5.65
6.00
xj
5.39
8.16
5.64
6.45
5.44
6.55
36.61
5.01
6.24
7.81
6.05
7.03
5.80
5.06
8.05
5.51
5.96
6.61
Además, x1 46.10, x2 40.59, x3 39.56, x4 35.86, x5 32.23,
x6 32.64, x 226.98. En la tabla 11.9 aparecen más cálculos.
Tabla 11.9 Tabla ANOVA para el ejemplo 11.11
Origen de la variación
A (filas)
B (columnas)
C (tratamientos)
Error
Total
gl
Suma de cuadrados
5
5
5
20
35
2.19
2.57
23.53
3.49
31.78
Cuadrado de la media
0.438
0.514
4.706
0.175
f
2.50
2.94
26.89
Puesto que F0.05,5,20 2.71 y 26.89 2.71, H0C es rechazada en favor de la hipótesis de que
la humedad relativa sí afecta en promedio la resistencia a la abrasión.
Para aplicar el procedimiento de Tukey, w Q0.05,6,20M
C
E
/6 4.450.175/6
0.76. Después de ordenar las xk y subrayarlas se obtiene
75%
87%
62%
50%
37%
25%
5.37
5.44
5.98
6.59
6.77
7.68
En particular, la humedad relativa más baja aparentemente produce una resistencia a la abrasión promedio verdadera más alta de manera significativa que cualquier otra humedad relativa estudiada.
■
EJERCICIOS
Sección 11.3 (27-37)
27. Se estudió el rendimiento de una máquina de extrusión continua que recubre tubos de acero con plástico como una función
del perfil de temperatura del termostato (A, a tres niveles), tipo de plástico (B, a tres niveles) y la velocidad de tornillo
rotatorio que hace que el plástico pase a través del troquel formador de tubos (C, a tres niveles). Hubo dos réplicas (L 2)
con cada combinación de niveles de los factores, lo que produjo un total de 54 observaciones del rendimiento. Las sumas
de cuadrados fueron SCA 14 144.44, SCB 5511.27,
SCC 244 696.39, SCAB 1069.62, SCAC 62.67,
SCBC 331.67, SCE 3127.50 y STC 270 024.33.
a. Construya la tabla ANOVA.
b. Use pruebas F apropiadas para demostrar que ninguna
de las razones F para interacción de dos o tres factores
es significativa al nivel 0.05.
c. ¿Qué efectos principales parecen significativos?
d. Con x1 8242, x2 9732 y x3 11 210, use el procedimiento de Tukey para identificar diferencias significativas entre los niveles del factor C.
28. Para ver si la fuerza de empuje al taladrar es afectada por la
velocidad de taladrado (A), coeficiente de alimentación (B)
o material utilizado (C), se realizó un experimento utilizando tres velocidades, tres coeficientes y dos materiales con dos
muestras (L 2) taladradas con cada combinación de niveles
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:27 AM
Page 427
11.3 ANOVA con tres factores
de los tres factores. Las sumas de cuadrados se calcularon
como sigue: SCA 19 149.73, SCB 2 589 047.62, SCC
157 437.52, SCAB 53 238.21, SCAC 9033.73, SCBC
91 880.04, SCE 56,819.50 y STC 2 983 164.81. Construya la tabla ANOVA e identifique interacciones significativas
con 0.01. ¿Existe algún factor que parezca no tener efecto en la fuerza de empuje? (En otras palabras, ¿parece ser algún factor no significativo en todo efecto en el que aparece?)
29. El artículo “An Analysis of Variance Applied to Screw Machines” (Industrial Quality Control, 1956: 8-9) describe un
experimento para investigar cómo la longitud de barras de
acero se vio afectada por la hora del día (A), el tratamiento
térmico aplicado (B) y la máquina de roscar utilizada (C).
Las tres horas fueron 8:00 A.M., 11:00 A.M. y 3:00 P.M. y hubo tres tratamientos y cuatro máquinas (un experimental
factorial de 3 2 4) y se obtuvieron los datos adjuntos
[codificados como 1000(longitud 4.380), lo cual no afecta el análisis].
B1
C1
C2
C3
C4
A1
6, 9,
1, 3
7, 9,
5, 5
1, 2,
0, 4
6, 6,
7, 3
A2
6, 3,
1, 1
8, 7,
4, 8
3, 2,
1, 0
7, 9,
11, 6
A3
5, 4,
9, 6
10, 11,
6, 4
1, 2,
6, 1
10, 5,
4, 8
SCA 0.22625 SCB 0.000025 SCC 0.0036
SCAB 0.004325 SCAC 0.00065
SCBC 0.000625 STC 0.2384.
a. Construya la tabla ANOVA.
b. Suponga que no existen efectos de interacción en tres direcciones, de modo que MCABC es una estimación válida de 2 y pruebe al nivel 0.05 en cuanto a interacción
y efectos principales.
c. Los promedios de nitrógeno son x1 1.1200, x2
1.3025, x3 1.3875 y x4 1.4300. Use el método de
Tukey para examinar las diferencias de porcentaje N entre los niveles de nitrógeno (Q0.05,4,3 6.82).
31. El artículo “Kolbe-Schmitt Carbonation of 2-Naphthol” (Industrial and Engr. Chemistry: Process and Design Development, 1969: 165-173) presentó los datos adjuntos sobre
porcentaje de rendimiento de ácido BON en función del
tiempo de reacción (1, 2 y 3 horas), temperatura (30, 70 y
100°C) y presión (30, 70 y 100 lb/pulg2). Suponiendo que no
existe interacción de tres factores, de modo que SCE
SCABC proporcione una estimación de 2. MINITAB dio la
tabla ANOVA adjunta. Realice todas las pruebas apropiadas.
C1
B1
C2
C3
A1
68.5
73.0
68.7
A2
74.5
75.0
74.6
A3
70.5
72.5
74.7
C1
B2
C2
C3
A1
72.8
80.1
72.0
A2
72.0
81.5
76.0
A3
69.5
84.5
76.0
C1
B3
C2
C3
A1
72.5
72.5
73.1
A2
75.5
70.0
76.0
A3
65.0
66.5
70.5
B2
C1
A1
C2
C3
C4
4, 6,
0, 1
6, 5,
3, 4
1, 0,
0, 1
4, 5,
5, 4
A2
3, 1,
1, 2
6, 4,
1, 3
2, 0,
1, 1
9, 4,
6, 3
A3
6, 0,
3, 7
8, 7,
10, 0
0, 2,
4, 4
4, 3,
7, 0
Las sumas de los cuadrados incluyen SCAB 1.646,
SCAC 71.021, SCBC 1.542, SCE 447.500 y
STC 1037.833.
a. Construya la tabla ANOVA con estos datos.
b. Pruebe para ver si algunos efectos de interacción son
significativos al nivel 0.05.
c. Pruebe para ver si algunos efectos de interacción son
significativos al nivel 0.05 (es decir, H0A contra HaA, etc.).
d. Use el procedimiento de Tukey para investigar diferencias significativas entre las cuatro máquinas.
30. Se calcularon las siguientes cantidades con un experimento
que implicó cuatro niveles de nitrógeno (A), dos tiempos de
plantación (B) y dos niveles de potasio (C) (“Use and Misuse of Multiple Comparison Procedures”, Agronomy J.,
1977: 205-208). Se realizó sólo una observación (contenido
de N, en porcentaje, de granos de maíz) por cada una de las
16 combinaciones de niveles.
427
Analysis of Variance for Yield
Source
DF
SS
MS
F
time
2 42.112 21.056 8.76
temp
2 110.732 55.366 23.04
press
2 68.136 34.068 14.18
time*temp
4 67.761 16.940 7.05
time*press 4 35.184 8.796 3.66
temp*press 4 136.437 34.109 14.20
Error
8 19.223 2.403
Total
26 479.585
www.FreeLibros.me
P
0.010
0.000
0.002
0.010
0.056
0.001
c11_p397-445.qxd
428
3/12/08
CAPÍTULO 11
4:27 AM
Page 428
Análisis de varianza con varios factores
32. Cuando los factores A y B son fijos pero el factor C es
aleatorio y se utiliza el modelo restringido (véase la nota
del pie de la página 416; existe una complicación técnica
con el modelo no restringido en este caso),
E(MCE) 2
JKL
E(MCA) 2 JL 2AC
2i
I1
IKL
E(MCB) 2 IL 2BC
2j
J1
E(MCC) 2 IJL 2C
E(MCAB) 2 L 2ABC
KL
( AiBj)2
(I 1)(J 1) i j
E(MCAC) 2 JL 2AC
E(MCBC) 2 IL 2BC
E(MCABC) 2 L 2ABC
a. Basado en estos cuadrados de la media esperados, ¿qué
2
0; H0: C2 0;
razones F utilizaría para probar H0: ABC
0
para
todos
los
subíndices
i, j y H0: 1
H0: AB
ij
I 0?
b. En un experimento para valuar los efectos de la edad, el tipo de suelo y el día de la producción en la resistencia a la
compresión de mezclas de cemento/suelo, se utilizaron
dos edades (A), cuatro tipos de suelo (B) y 3 días (C, supuesto aleatorio), con L 2 observaciones realizadas por
cada combinación de niveles de factor. Las sumas
de cuadrados resultantes fueron SCA 14 318.24,
SCB 9656.40, SCC 2270.22, SCAB 3408.93,
SCAC 1442.58, SCBC 3096.21, SCABC 2832.72
y SCE 8655.60. Obtenga la tabla ANOVA y realice todas las pruebas al nivel 0.01.
33. Debido a la variabilidad potencial del envejecimiento causado
por las diferentes piezas fundidas y segmentos en éstas, se utilizó un diseño de cuadrado latino con N 7 para investigar el
efecto del tratamiento térmico en el envejecimiento. Con A
piezas fundidas, B segmentos, C tratamientos térmicos,
los estadísticos resumidos incluyen x 3815.8, x 2i
297 216.90, x 2j 297 200.64, x 2k 297 155.01 y
x 2ij(k) 297 317.65. Obtenga la tabla ANOVA y pruebe al
nivel 0.05 la hipótesis de que el tratamiento térmico no afecta
el envejecimiento.
34. El artículo “The Responsiveness of Food Sales to Shelf
Space Requirements” (J. Marketing Research, 1964: 63-67)
reporta el uso de un diseño de cuadrado latino para investigar el efecto del espacio de anaquel en las ventas de alimentos. El experimento se realizó a lo largo de 6 semanas con
seis tiendas diferentes y se obtuvieron los siguientes resultados sobre ventas de crema en polvo para café (con el índice de espacio de anaquel entre paréntesis):
Semana
1
2
3
Tienda
1
2
3
4
5
6
27 (5)
34 (6)
39 (2)
40 (3)
15 (4)
16 (1)
14 (4)
31 (5)
67 (6)
57 (1)
15 (3)
15 (2)
18 (3)
34 (4)
31 (5)
39 (2)
11 (1)
14 (6)
4
Tienda
1
2
3
4
5
6
35 (1)
46 (3)
49 (4)
70 (6)
9 (2)
12 (5)
Semana
5
28 (6)
37 (2)
38 (1)
37 (4)
18 (5)
19 (3)
6
22 (2)
23 (1)
48 (3)
50 (5)
17 (6)
22 (4)
Construya la tabla ANOVA y formule y pruebe al nivel 0.01
la hipótesis de que el espacio de anaquel no afecta las ventas contra la alternativa apropiada.
35. El artículo “Variation in Moisture and Ascorbic Acid Content
from Leaf to Leaf and Plant to Plant in Turnip Greens” (Southern Cooperative Services Bull., 1951: 13-17) usa un diseño
de cuadrado latino en el cual el factor A es la planta, el factor
B es el tamaño de hoja (desde el más pequeño hasta el más
grande), el factor C (entre paréntesis) es tiempo de pesada y
la variable de respuesta es el contenido de humedad.
Tamaño de hoja (B)
1
2
3
1
2
Planta (A) 3
4
5
6.67 (5)
5.40 (2)
7.32 (3)
4.92 (1)
4.88 (4)
7.15 (4)
4.77 (5)
8.53 (2)
5.00 (3)
6.16 (1)
8.29 (1)
5.40 (4)
8.50 (5)
7.29 (2)
7.83 (3)
Tamaño de hoja (B)
4
5
1
2
Planta (A) 3
4
5
8.95 (3)
7.54 (1)
9.99 (4)
7.85 (5)
5.83 (2)
9.62 (2)
6.93 (3)
9.68 (1)
7.08 (4)
8.51 (5)
Cuando los tres factores son aleatorios, los cuadrados de la
media esperados son E(MCA) 2 NA2 , E(MCB)
2 N B2 , E(MCC) 2 N C2 y E(MCE) 2. Esto implica que las razones F para probar H0A: A2 0, H0B: B2 0
y H0C: C2 0 son idénticas a aquellas para efectos fijos. Obtenga la tabla ANOVA y pruebe al nivel 0.05 para ver si existe alguna variación en el contenido de humedad debido a los
factores.
36. El artículo “An Assessment of the Efects of Treatment, Time
and Heat on the Removal of Erasable Pen Marks from Cotton
and Cotton/Polyester Blend Fabrics” (J. Testing and Eval.,
1991: 394-397) reporta las siguientes sumas de cuadrados
para la variable de respuesta grado de eliminación de marcas:
SCA 39.171, SCB 0.665, SCC 21.508, SCAB
1.432, SCAC 15.953, SCBC 1.382, SCABC 9.016 y
SCE 115.820. Se utilizaron cuatro tratamientos de lavado
diferentes, tres tipos distintos de pluma y seis telas diferentes
en el experimento y se realizaron tres observaciones por cada
combinación de pluma-tela. Analice la varianza con 0.01
por cada prueba y exprese sus conclusiones (suponga efectos
fijos para los tres factores).
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:27 AM
Page 429
11.4 Experimentos 2p factoriales
37. Se realizó un experimento ANOVA con cuatro factores para
investigar los efectos de la tela (A), el tipo de exposición (B),
el nivel de exposición (C) y la dirección de la tela (D) en el
grado de cambio de color en telas expuestas medido por medio de un espectrocolorímetro. Se realizaron dos observaciones por cada una de las tres telas, dos tipos, tres niveles y dos
direcciones con los siguientes resultados: MCA 2207.329,
MCB 47.255, MCC 491.783, MCD 0.044, MCAB
429
15.303, MCAC 275.446, MCAD 0.470, MCBC
2.141, MCBD 0.273, MCCD 0.247, MCABC 3.714,
MCABD 4.072, MCACD 0.767, MCBCD 0.280,
MCE 0.977 y CMT 93.621. (“Accelerated Weathering of
Marine Fabrics”, J. Testing and Eval., 1992: 139-143). Suponiendo efectos fijos con todos los factores, realice un análisis
de varianza con 0.01 con todas las pruebas y resuma sus
conclusiones.
11.4 Experimentos 2p factoriales
Si un experimentador desea estudiar al mismo tiempo el efecto de p factores diferentes en
una variable de respuesta y los factores tienen I1, I2, . . . , Ip niveles, respectivamente, entonces un experimento completo requiere por lo menos I1 I2 Ip observaciones. En tales
situaciones, el experimentador a menudo puede realizar un “experimento de filtración” con
cada factor a sólo dos niveles para obtener información preliminar sobre los efectos del factor. Un experimento en el cual existen p factores, cada uno a dos niveles, se conoce como
experimento 2p factorial. El análisis de los datos de tal experimento es computacionalmente más simple que para experimentos factoriales más generales. Además, un experimento 2p
proporciona un entorno más simple para introducir los importantes conceptos de confusión
y réplicas fraccionarias.
23 experimentos
Como en la sección 11.3, si Xijkl y xijkl se refieren a la observación de l-ésima réplica con los
factores A, B y C a los niveles i, j y k, respectivamente. El modelo en esta situación es
Xijkl i j k
AB
ij
AC
ik
BC
jk
ijk ijkl
(11.14)
con i 1, 2; j 1, 2; k 1, 2; l 1, . . . , n. Las ijkl se suponen independientes, normalmente distribuidas, con media 0 y varianza 2. Como existen sólo dos niveles de cada factor, las condiciones colaterales en relación con los parámetros de (11.14) que especifican de
AB
manera única el modelo simplemente se formulan como 1 2 0, . . . , AB
11
21 0,
AB
AB
AB
AB
AB
AB
0,
0,
0
y
similares.
Estas
condiciones
implican
que
12
22
11
12
21
22
existe sólo un parámetro funcionalmente independiente de cada tipo (por cada efecto prinAB
AB
AB
cipal e interacción). Por ejemplo, 2 1, mientras que AB
21
11,
12
11 y
AB
AB
.
Debido
a
esto,
cada
suma
de
cuadrados
en
el
análisis
tendrá
un
grado
de
libertad.
22
11
Los parámetros del modelo pueden ser estimados sacando promedios para todos los
subíndices de las Xijkl y luego formando combinaciones lineales apropiadas de los promedios. Por ejemplo,
ˆ 1 X
1 X
(X111 X121 X112 X122 X211 X212 X221 X222)
8n
y
ˆ A1B1 X
11 X
1 X
1 X
(X111 X121 X211 X221 X112 X122 X212 X222)
8n
www.FreeLibros.me
c11_p397-445.qxd
430
3/12/08
CAPÍTULO 11
4:27 AM
Page 430
Análisis de varianza con varios factores
Cada estimador es, con excepción del factor 1/(8n), una función lineal de los totales de celda (Xijk ) donde cada coeficiente es 1 o 1, con un número igual de cada uno; tales funciones se llaman contrastes en las Xijk. Además, los estimadores satisfacen las mismas
condiciones colaterales satisfechas por los parámetros mismos. Por ejemplo,
ˆ 1 ˆ 2 X
1 X
X
2 X
X
1 X
2 2X
Ejemplo 11.12
1
1
1
2
1
X
X
X
X
X 0
4n 1
4n 2
8n
4n
4n
En un experimento para investigar las propiedades de resistencia a la compresión de mezclas de cemento-tierra, se utilizaron dos periodos de añejamiento en combinación con temperaturas de añejamiento y dos tierras diferentes. Se hicieron dos réplicas por cada
combinación de niveles de los tres factores y se obtuvieron los siguientes resultados:
Suelo
Añejamiento
Temperatura
1
2
1
1
2
471, 413
485, 552
385, 434
530, 593
2
1
2
712, 637
712, 789
770, 705
741, 806
Los totales de celda calculados son x111 884, x211 1349, x121 1037, x221 1501,
x112 819, x212 1475, x122 1123 y x222 1547, por lo tanto x 9735. Entonces
ˆ 1 (884 1349 1037 1501 819 1475 1123 1547)/16
125.5625 ˆ 2
ˆ A1B1 (884 1349 1037 1501 819 1475 1123 1547)/16
14.5625 ˆ A1B2 ˆ A2B1 ˆ A2B2
Las estimaciones de los demás parámetros se calculan de la misma manera.
■
Análisis de un experimento 23 La razón para calcular estimaciones de parámetro es que
las sumas de cuadrados para los varios efectos son fáciles de obtener a partir de las estimaciones. Por ejemplo,
2
SCA ˆ 2i 4n ˆ 2i 4n[ˆ 21 ( ˆ 1)2] 8nˆ 21
i j k l
i1
y
SCAB ( ˆ AiBj )2
i j k l
2
2n
2
( ˆ AiBj)2 2n[( ˆ A1 B1)2 ( ˆ A1 B1)2 ( ˆ A1 B1)2 ( ˆ A1 B1)2]
i1 j1
8n( ˆ A1 B1)2
Como cada estimación es un contraste en los totales de celda multiplicado por 1/(8n),
cada suma de cuadrados tiene la forma (contraste)2/(8n). Por lo tanto para calcular las diversas sumas de cuadrados, se tienen que conocer los coeficientes (1 o 1) de los contrastes
apropiados. Los signos ( o ) de cada xijk en cada contraste de efecto son más convenientemente mostrados en una tabla. Se utilizará la notación (1) para la condición experimental
i 1, j 1, k 1, a para i 2, j 1, k 1, ab para i 2, j 2, k 1, y así sucesivamente. Si el nivel 1 se considera como “bajo” y el nivel 2 como “alto”, cualquier letra que
aparezca denota un nivel alto del factor asociado. En la tabla 11.10, cada columna da los
signos para un contraste de efecto particular en las xijk asociados con las diferentes conclusiones experimentales.
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:27 AM
Page 431
11.4 Experimentos 2p factoriales
Tabla 11.10
431
Signos para calcular contrastes de efecto
Condición
experimental
Total de
celda
(1)
a
b
ab
c
ac
bc
abc
x111
x211
x121
x221
x112
x212
x122
x222
A
Efecto factorial
C
AB
AC
B
BC
ABC
En cada una de las tres primeras columnas, el signo es si el factor correspondiente
está al nivel alto y si está al nivel bajo. Cada signo que aparece en la columna AB es entonces el “producto” de los signos presentes en las columnas A y B ()() ()()
y ()() ()() y del mismo modo para las columnas AC y BC. Por último, los
signos que aparecen en la columna ABC son los productos de AB con C (o B con AC o A
con BC). Así pues, por ejemplo,
contraste AC x111 x211 x121 x221 x112 x212 x122 x222
Una vez que se calculan los siete contrastes de efecto,
SC(efecto)
(contraste de efecto)2
8n
Incluso con una tabla de signos, el cálculo de los contrastes es tedioso. Una técnica
computacional eficiente, creada por Yates, es la siguiente. Se escriben en una columna los
ocho totales de celda en el orden estándar como aparece en la tabla de signos y se establecen tres columnas adicionales. En cada una de estas tres columnas, las primeras cuatro entradas son las sumas de las entradas 1 y 2, 3 y 4, 5 y 6, 7 y 8 de las columnas previas. Las
últimas cuatro entradas son las diferencias entre las entradas 2 y 1, 4 y 3, 6 y 5 y 8 y 7 de
la columna previa. La última columna contiene entonces x... y los siete contrastes de efecto
en orden estándar. Si se eleva al cuadrado cada contraste y se divide entre 8n se obtienen entonces las siete sumas de cuadrados.
Ejemplo 11.13
Como n 2 , 8n 16, el método de Yates se ilustra en la tabla 11.11.
(continuación del
ejemplo 11.12)
Tabla 11.11 Método de Yates de cálculo
(1) x111
a x211
b x121
ab x221
c x112
ac x212
bc x122
abc x222
884
1349
1037
1501
819
1475
1123
1547
1
2
➛ 2233
➛ 2538
➛ 4771
➛4964
2294
2670
465
464
656
424
929
1080
305
376
1
232
➛➛
xijk
➛➛
Condición de
tratamiento
www.FreeLibros.me
Contraste de efecto SC (contraste)2/16
9735
2009
681
233
193
151
71
231
252 255.06
28 985.06
3 393.06
2 328.06
1 425.06
315.06
3 335.06
292 036.42
c11_p397-445.qxd
432
3/12/08
CAPÍTULO 11
4:27 AM
Page 432
Análisis de varianza con varios factores
Con los datos originales, i j k l x 2ijkl 6 232 289, y
x2
5 923 139.06
16
por lo tanto
STC 6 232 289 5 923 139.06 309 149.94
SCE STC [SCA . . . SCABC] 309 149.94 292 036.42
17 113.52
Los cálculos ANOVA se resumen en la tabla 11.12.
Tabla 11.12
Tabla ANOVA para el ejemplo 11.13
Origen de
la variación
gl
Suma de cuadrados
Cuadrados de la media
f
A
B
C
AB
AC
BC
ABC
Error
Total
1
1
1
1
1
1
1
8
15
252 255.06
28 985.06
2 328.06
3 393.06
1 425.06
315.06
3 335.06
17 113.52
309 149.94
252 255.06
28 985.06
2 328.06
3 393.06
1 425.06
315.06
3 335.06
2 139.19
117.92
13.55
1.09
1.59
0.67
0.15
1.56
La figura 11.10 muestra los resultados generados por SAS para este ejemplo. Sólo los
valores P correspondientes a la edad (A) y temperatura (B) son menores que 0.01, así que
sólo estos efectos son considerados significativos.
Analysis of Variance Procedure
Dependent Variable: STRENGTH
Sum of
Source
DF
Squares
Model
7
292036.4375
Error
8
17113.5000
Corrected Total
15
309149.9375
Mean
Square
41719.4911
2139.1875
F Value
19.50
Pr F
0.0002
R-Square
C.V.
Root MSE
POWERUSE Mean
0.944643
7.601660
46.25135
608.437500
Source
AGE
TEMP
AGE*TEMP
SOIL
AGE*SOIL
TEMP*SOIL
AGE*TEMP*SOIL
Figura 11.10
DF
Anova SS
Mean Square
F Value
Pr F
1
1
1
1
1
1
1
252255.0625
28985.0625
3393.0625
2328.0625
1425.0625
315.0625
3335.0625
252255.0625
28985.0625
3393.0625
2328.0625
1425.0625
315.0625
3335.0625
117.92
13.55
1.59
1.09
0.67
0.15
1.56
0.0001
0.0062
0.2434
0.3273
0.4380
0.7111
0.2471
Resultados obtenidos con SAS con los datos de resistencia del ejemplo 11.13.
■
Experimentos 2p con p 3
Aunque los cálculos cuando p 3 son bastante tediosos, el análisis es igual al del caso de
tres factores. Por ejemplo, si existen cuatro factores A, B, C y D, existen 16 condiciones experimentales diferentes. Las primeras 8 en orden estándar son exactamente las que ya aparecen en lista para un experimento con tres factores. Las segundas 8 se obtienen colocando
www.FreeLibros.me
3/12/08
4:27 AM
Page 433
11.4 Experimentos 2p factoriales
433
la letra d al lado de cada condición en el primer grupo. El método de Yates se inicia entonces calculando totales a través de las réplicas, poniendo en lista estos totales en orden estándar y procediendo como antes, con p factores, la p-ésima columna a la derecha de los totales
de tratamiento dará los contrastes de efecto.
Con p 3, con frecuencia no habrá réplicas del experimento (así que sólo una replica está disponible). Una posible forma de probar hipótesis es suponer que ciertos efectos
de alto grado están ausentes y luego agregar las sumas correspondientes de cuadrados para
obtener un SCE. Tal suposición, sin embargo, puede ser engañosa si no se tiene un conocimiento previo (véase el libro de Montgomery que aparece en la bibliografía del capítulo).
Un método alternativo implica trabajar directamente con los contrastes de efecto. Cada
contraste tiene una distribución normal con la misma varianza. Cuando un efecto particular
está ausente, el valor esperado del contraste correspondiente es 0, pero esto no es así cuando
el efecto está presente. El método de análisis sugerido es construir un diagrama de probabilidad normal de los contrastes de efecto (o, en forma equivalente, las estimaciones de los
parámetros de efecto, puesto que estimación contraste/2p cuando n 1). Los puntos correspondientes a efectos ausentes tenderán a acercarse a una línea recta, mientras que los
puntos asociados con efectos sustanciales en general se alejarán de esta línea.
Ejemplo 11.14
Los datos adjuntos se tomaron del artículo “Quick and Easy Analysis of Unreplicated Factorials” (Technometrics, 1989: 469-473). Los cuatro factores son A resistencia al ácido,
B tiempo, C cantidad de ácido y D temperatura y la variable de respuesta es el
rendimiento de isatina. Las observaciones, en orden estándar, son 0.08, 0.04, 0.53, 0.43,
0.31, 0.09, 0.12, 0.36, 0.79, 0.68, 0.73, 0.08, 0.77, 0.38, 0.49 y 0.23. La tabla 11.13 muestra las estimaciones de efecto como aparecen en el artículo (las cuales utilizaron contraste/8
en lugar de contraste/16).
Tabla 11.13
Estimaciones de efecto para el ejemplo 11.14
Efecto
estimación
A
0.191
B
0.021
AB
0.001
C
0.076
AC
0.034
BC
0.066
ABC
0.149
Efecto
estimación
AD
0.161
BD
0.251
ABD
0.101
CD
0.026
ACD
0.066
BCD
0.124
ABCD
0.019
D
0.274
La figura 11.11 es un diagrama de probabilidad normal de las estimaciones de efecto. Todos los puntos en el diagrama quedan cerca de la misma línea recta, lo que sugiere la ausencia completa de cualquier efecto (en breve se dará un ejemplo en el cual éste no es el caso).
0.3
Estimación de efecto
c11_p397-445.qxd
0.2
0.1
0.0
0.1
0.2
0.3
2
Figura 11.11
1
0
Percentil z
1
2
Diagrama de probabilidad normal de estimaciones de efecto del ejemplo 11.14. ■
www.FreeLibros.me
c11_p397-445.qxd
434
3/12/08
CAPÍTULO 11
4:27 AM
Page 434
Análisis de varianza con varios factores
Los juicios visuales de la desviación con respecto a la derechura en un diagrama de
probabilidad normal son más bien subjetivos. El artículo citado en el ejemplo 11.14 describe
una técnica más objetiva de identificar efectos significativos en un experimento no replicado.
Confusión
A menudo no es posible realizar todas las 2p condiciones experimentales de un experimento 2p factorial en un entorno experimental homogéneo. En tales situaciones, puede ser posible separar las condiciones experimentales en 2r bloques homogéneos (r p), de modo que
existen 2pr condiciones experimentales en cada bloque. Los bloques pueden, por ejemplo,
corresponder a laboratorios diferentes, lapsos de tiempo distintos u operadores o cuadrillas
de trabajo diferentes. En el caso más simple, p 3 y r 1, de modo que existen dos bloques con cada uno compuesto de cuatro de las ocho condiciones experimentales.
Como siempre, la formación de bloques es efectiva al reducir la variación asociada
con fuentes externas. Sin embargo, cuando las 2p condiciones experimentales se colocan en
2r bloques, el precio pagado por esta formación de bloques es que 2r 1 de los efectos de
factor no pueden ser estimados. Esto es porque los 2r 1 efectos de factor (efectos principales y/o interacciones) se mezclan o confunden con los efectos de bloque. La asignación
de condiciones experimentales a bloques normalmente se hace de modo que sólo las interacciones de más alto nivel sean confundidas, mientras que los efectos principales y las interacciones de orden más bajo permanecen estimables y las hipótesis pueden ser probadas.
Para ver cómo se logra la asignación de bloques, considérese primero un experimento
23 con dos bloques (r 1) y cuatro tratamientos por bloque. Supóngase que se selecciona
ABC como el efecto que ha de ser confundido con bloques. Entonces cualquier condición
experimental que tenga un número impar de letras en común con ABC, tal como b (una letra) o abc (tres letras) se coloca en un bloque, mientras que cualquier condición que tenga
un número par de letras en común con ABC (donde 0 es par) va en el otro bloque. La figura 11.12 muestra esta asignación de tratamientos a los dos bloques.
Bloque 1
Bloque 2
(1), ab, ac, bc
a, b, c, abc
Figura 11.12
Confusión de ABC en un experimento 23.
Sin réplicas, los datos de semejante experimento normalmente se analizarían suponiendo que no hubo interacciones de dos factores (aditividad) y utilizando SCE SCAB
SCAC SCBC con 3 grados de libertad (gl) para probar en cuanto a la presencia de efectos principales. Alternativamente, un diagrama de probabilidad normal de contrastes de
efecto o estimaciones de parámetros de efecto podría ser examinado. Con más frecuencia,
no obstante, existen réplicas cuando sólo tres factores están siendo estudiados. Supóngase
que existen u réplicas, que dan un total de 2r · u bloques en el experimento. Entonces después de restar de STC todas las sumas de cuadrados asociadas con efectos no confundidos
con bloques (calculados con el método de Yates), el bloque de la suma de cuadrados se
calcula con los 2r · u totales de bloque y luego se restan para obtener SCE (de modo que existen
2r · u 1 grados de libertad por bloque).
Ejemplo 11.15
El artículo “Factorial Experiments in Pilot Plant Studies” (Industrial and Eng. Chemistry,
1951: 1300-1306) reporta los resultados de un experimento para valuar los efectos de temperatura de reactor (A) rendimiento de gas (B) y concentración de constituyente activo (C)
en la concentración de la solución producto (medida en unidades arbitrarias) en una unidad
de recirculación. Se utilizaron dos bloques, con el efecto ABC confundido con bloques y hubo
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:27 AM
Page 435
11.4 Experimentos 2p factoriales
435
dos réplicas y los resultados aparecen en la figura 11.13. Los cuatro totales de bloque réplica son 288, 212, 88 y 220 con un gran total de 808, por lo tanto
SCBl
(288)2 (212)2 (88)2 (220)2
(808)2
5204.00
4
16
Réplica 1
Bloque 1
(1)
ab
ac
bc
99
52
42
95
Réplica 2
Bloque 2
a
b
c
abc
Bloque 1
18
51
108
35
Figura 11.13
(1)
ab
ac
bc
Bloque 2
46
47
22
67
a
b
c
abc
18
62
104
36
Datos para el ejemplo 11.15.
Las demás sumas de cuadrados se calculan con el método de Yates utilizando los ocho
totales de condición experimental y el resultado es la tabla ANOVA dada como tabla 11.14.
Por comparación con F0.05,1,6 5.99, se concluye que sólo los efectos principales para A y
C difieren significativamente de cero.
Tabla 11.14
Tabla ANOVA para el ejemplo 11.15
Origen de
la variación
gl
Suma de cuadrados
Cuadrados de la media
A
B
C
AB
AC
BC
Bloques
Error
Total
1
1
1
1
1
1
3
6
15
12 996
702.25
2 756.25
210.25
30.25
25
5 204
1 958
23 882
12 996
702.25
2 756.25
210.25
30.25
25
1 734.67
326.33
f
39.82
2.15
8.45
0.64
0.093
0.077
5.32
■
Confusión cuando se utilizan más de dos bloques
En el caso r 2 (cuatro bloques), tres efectos se confunden con bloques. El experimentador
primero selecciona dos efectos definitorios que han de ser confundidos. Por ejemplo, en un
experimento con cinco factores (A, B, C, D y E), las dos interacciones de tres factores BCD
y CDE podrían ser elegidas para confundirse. El tercer efecto confundido es entonces la interacción generalizada de los dos, obtenida escribiendo los dos efectos seleccionados uno
al lado del otro y luego eliminando las letras cualquiera común a ambos: (BCD)(CDE) BE.
Obsérvese que si ABC y CDE se eligen para confundirse, su interacción generalizada es
(ABC)(CDE) ABDE de modo que ningunos efectos principales o interacciones de dos factores se confundan.
Una vez que los dos efectos definitorios hayan sido seleccionados para confundirse, un
bloque se compone de todas las condiciones de tratamiento que tienen un número par de letras en común con ambos efectos definitorios. El segundo bloque se compone de todas las
condiciones que tienen un número par de letras en común con el primer contraste definitorio
y un número impar de letras en común con el segundo contraste y el tercero y cuarto bloques
www.FreeLibros.me
c11_p397-445.qxd
436
3/12/08
CAPÍTULO 11
4:27 AM
Page 436
Análisis de varianza con varios factores
se componen de los contrastes “impar/par” e “impar/impar”. En un experimento con cinco
factores con efectos definitorios ABC y CDE, esto da por resultado la asignación de bloques
como se muestra en la figura 11.14 (con el número de letras en común con cada contraste definitorio que aparece junto a cada condición experimental).
Bloque 2
Bloque 1
(1)
ab
de
acd
ace
bcd
bce
abde
Figura 11.14
(0, 0)
(2, 0)
(0, 2)
(2, 2)
(2, 2)
(2, 2)
(2, 2)
(2, 2)
d
e
ac
bc
abd
abe
acde
bcde
(0, 1)
(0, 1)
(2, 1)
(2, 1)
(2, 1)
(2, 1)
(2, 3)
(2, 3)
Bloque 3
a
b
cd
ce
ade
bde
abcd
abce
(1, 0)
(1, 0)
(1, 2)
(1, 2)
(1, 2)
(1, 2)
(3, 2)
(3, 2)
Bloque 4
c
ad
ae
bd
be
abc
cde
abcde
(1, 1)
(1, 1)
(1, 1)
(1, 1)
(1, 1)
(3, 1)
(1, 3)
(3, 3)
Cuatro bloques en un experimento 25 factorial con efectos definitorios ABC y CDE.
El bloque que contiene (1) se llama bloque principal. Una vez construido, se puede
obtener un segundo bloque seleccionando cualquier condición experimental no incluida en
el bloque principal y obteniendo su interacción generalizada con cada condición presente en el
bloque principal. Se construyen entonces los demás bloques del mismo modo seleccionando primero una condición no incluida en un bloque ya construido y localizando interacciones generalizadas con el bloque principal.
En situaciones experimentales con p 3, a menudo no existe ninguna réplica, así que
las sumas de cuadrados asociadas con interacciones de alto grado no confundidas normalmente se agrupan a fin de obtener una suma de cuadrados para error que pueda ser utilizada en el denominador de los varios estadísticos F. Todos los cálculos de nuevo se realizan
con la técnica de Yates, con SCBI como la suma de las sumas de cuadrados asociadas con
efectos confundidos.
Cuando r 2, primero se selecciona r efectos definitorios que han de ser confundidos con bloques, asegurándose de que ninguno de los efectos elegidos sea la interacción generalizada de cualesquiera otros dos seleccionados. Los 2r r 1 efectos adicionales
confundidos con los bloques son entonces interacciones generalizadas de todos los efectos presentes en el conjunto definitorio (incluidas no sólo las interacciones generalizadas de pares
de efectos sino también conjuntos de tres, cuatro y así sucesivamente). Consúltese el libro de
Montgomery para los detalles.
Réplica fraccionaria
Cuando el número p de factores es grande, incluso una sola réplica de un experimento 2p
puede ser cara y consumidora de tiempo. Por ejemplo, una réplica de un experimento 26 factorial implica una observación por cada una de las 64 condiciones experimentales diferentes. Una estrategia atractiva en tales situaciones es observar sólo una fracción de las 2p
condiciones. Siempre que se tenga cuidado en la elección de la condición que ha de ser observada, aún se puede obtener mucha información sobre efectos de factor.
Supóngase que se decide incluir sólo 2p1 (la mitad) de las 2p condiciones posibles en
el experimento; esto normalmente se conoce como media réplica. El precio pagado por este ahorro es doble. Primero, la información sobre un solo efecto (determinada por las 2p1
condiciones seleccionadas para observación) se pierde por completo para el experimentador
en el sentido de que ninguna estimación razonable del efecto es posible. Segundo, los 2p 2
efectos principales e interacciones se aparean de modo que cualquier efecto en un par particular se confunde con el otro efecto en el mismo par. Por ejemplo, un par como ese puede
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:27 AM
Page 437
11.4 Experimentos 2p factoriales
437
ser {A, BCD}, de modo que las estimaciones del efecto principal A y de la interacción BCD
no son posibles. Es deseable, entonces, seleccionar una media réplica con la cual los efectos
principales y las interacciones de bajo grado sean apareadas (confundidas) sólo con interacciones de alto grado en lugar de una con otra.
El primer paso al seleccionar una media réplica es escoger un efecto definitorio como
el efecto no estimable. Supóngase que en un experimento con cinco factores, ABCDE se elige
como el efecto definitorio. Ahora las 25 32 posibles condiciones de tratamiento se dividen en dos grupos con 16 condiciones cada uno, uno compuesto de todas las condiciones
que tienen un número impar de letras en común con ABCDE y el otro que contiene un número par de letras en común con el contraste definitorio. Entonces cualquier grupo de 16
condiciones se utiliza como media réplica. El grupo “impar” es
a, b, c, d, e, abc, abd, abe, acd, ace, ade, bcd, bce, bde, cde, abcde
Cada efecto principal e interacción diferente de ABCDE se confunde entonces
con su interacción generalizada ABCDE. Por lo tanto (AB)(ABCDE) CDE, de tal
suerte que la interacción AB y la interacción CDE se confunden entre sí. Los pares
alias resultantes son
{A, BCDE}
{B, ACDE}
{C, ABDE}
{D, ABCE}
{E, ABCD}
{AB, CDE}
{AC, BDE}
{AD, BCE}
{AE, BCD}
{BC, ADE}
{BD, ACE}
{BE, ACD}
{CD, ABE}
{CE, ABD}
{DE, ABC}
Obsérvese en particular que cada efecto principal se confunde con una interacción de cuatro factores. Suponiendo que estas interacciones son insignificantes se puede probar en
cuanto a la presencia de efectos principales.
Para seleccionar un cuarto de réplica de un experimento 2p factorial (2p2 de las 2p posibles condiciones de tratamiento), dos efectos definitorios deben ser seleccionados. Estos
dos y su interacción generalizada se transforman en efectos no estimables. En lugar de pares confundidos como en la media réplica, cada efecto restante ahora se confunde con otros
tres efectos, y cada uno es su interacción generalizada con uno de los tres efectos no estimables.
Ejemplo 11.16
El artículo “More on Planning Experiments to Increase Research Efficiency” (Industrial
and Eng. Chemistry, 1970: 60-65) reporta sobre los resultados de un cuarto de réplica de un
experimento 25 en el cual cinco factores fueron A temperatura de condensación, B cantidad de material B, C volumen de solvente, D tiempo de condensación y E cantidad de material E. La variable de respuesta fue el rendimiento del proceso químico. Los
contrastes definitorios seleccionados fueron ACE y BDE, con interacción generalizada
(ACE)(BDE) ABCD. Los 28 efectos principales e interacciones restantes ahora pueden
ser divididos en siete grupos de cuatro efectos cada uno de modo que los efectos dentro
de un grupo no pueden ser valorados por separado. Por ejemplo, las interacciones generalizadas de A con efectos no estimables son (A)(ACE) CE, (A)(BDE) ABDE y
(A)(ABCD) BCD de modo que un grupo alias es {A, CE, ABDE, BCD}. El conjunto completo de grupos alias es
{A, CE, ABDE, BCD}
{B, ABCE, DE, ACD}
{C, AE, BCDE, ABD}
{D, ACDE, BE, ABC}
{E, AC, BD, ABCDE}
{AB, BCE, ADE, CD}
{AD, CDE, ABE, BC}
■
Análisis de una réplica fraccionaria Una vez que se eligen los efectos definitorios para
un cuarto de réplica, se utilizan en la discusión de confusión para dividir las 2p condiciones
de tratamiento en cuatro grupos de 2p2 condiciones cada uno. Entonces se selecciona uno de
los cuatro grupos como el conjunto de condiciones en las cuales los datos serán recolectados. Comentarios similares aplican a una 1/2r réplica de un experimento 2p factorial.
www.FreeLibros.me
c11_p397-445.qxd
438
3/12/08
CAPÍTULO 11
4:27 AM
Page 438
Análisis de varianza con varios factores
Habiendo realizado observaciones para las combinaciones de tratamiento seleccionadas, se construye una tabla de signos similar a la tabla 11.10. La tabla contiene sólo una fila
por cada una de las combinaciones de tratamiento observadas en realidad en lugar de 2p filas
y existe sólo una columna por cada grupo alias (puesto que cada efecto en el grupo tendría
el mismo conjunto de signos en las condiciones de tratamiento seleccionadas para las observaciones). Los signos en cada columna indican como siempre cómo se calculan los contrastes para las diversas sumas de cuadrados. También se puede utilizar el método de Yates, pero
la regla para disponer las condiciones observadas en orden estándar debe ser modificada.
La parte difícil de análisis de réplica fraccionaria en general implica decidir cuál utilizar para la suma de cuadrados para error. Puesto que normalmente no habrá réplica (aunque se podrían observar, por ejemplo, dos réplicas de un cuarto de réplica), algunas sumas
de cuadrados para efectos deben ser agrupadas para obtener una suma de cuadrados para
error. En una media réplica de un experimento 28, por ejemplo, se puede elegir una estructura alias de modo que cada uno de los ocho efectos principales y cada una de las 28 interacciones de dos factores se confundan sólo con interacciones de alto grado y que existan
27 grupos alias adicionales que impliquen sólo interacciones de alto grado. Suponiendo la
ausencia de efectos de interacción de alto grado las 27 sumas de cuadrados resultantes pueden
entonces ser sumadas para dar una suma de cuadrados para error, lo que permite pruebas de
un grado de libertad de todos los efectos principales e interacciones de dos factores. Sin embargo, en muchos casos se pueden obtener pruebas de efectos principales sólo mediante la
agrupación de algunas o todas las sumas de cuadrados asociadas con grupos alias que impliquen interacciones de dos factores y las interacciones de dos factores correspondientes no
pueden ser investigadas.
Ejemplo 11.17
(continuación del
ejemplo 11.16)
El conjunto de condiciones de tratamiento seleccionadas y los resultados del cuarto de réplica del experimento 25 fueron
e
ab
ad
bc
cd
ace
bde
abcde
23.2
15.5
16.9
16.2
23.8
23.4
16.8
18.1
La tabla de signos abreviada se muestra en la tabla 11.15.
Con SCA denotando la suma de cuadrados para los efectos en el grupo alias {A, CE,
ABDE, BCD}
SCA
Tabla 11.15
e
ab
ad
bc
cd
ace
bde
abcde
( 23.2 15.5 16.9 16.2 23.8 23.4 16.8 18.1)2
4.65
8
Tabla de signos para el ejemplo 11.17
A
B
C
D
E
AB
AD
Asimismo SCB 53.56, SCC 10.35, SCD 0.91, SCE 10.35 (el diferencia esta
cantidad de la suma de cuadrados para error SCE), SCAB 6.66 y SCAD 3.25 y se obtiene STC 4.65 53.56 3.25 89.73. Para probar en cuanto a efectos principales, se utiliza SCE SCAB SCAD 9.91 con 2 grados de libertad. La tabla ANOVA
aparece en la tabla 11.16.
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:27 AM
Page 439
11.4 Experimentos 2p factoriales
Tabla 11.16
439
Tabla ANOVA para el ejemplo 11.17
Origen
gl
Suma de cuadrados
Cuadrados de la media
A
B
C
D
E
Error
Total
1
1
1
1
1
2
7
4.65
53.56
10.35
0.91
10.35
9.91
89.73
4.65
53.56
10.35
0.91
10.35
4.96
f
0.94
10.80
2.09
0.18
2.09
Como F0.05,1,2 18.51, ninguno de los cinco efectos principales puede ser juzgado significativo. Desde luego, con sólo dos grados de libertad para error, la prueba no es muy poderosa (es decir, es bastante probable que no detecte la presencia de efectos). El artículo de
Industrial and Engineering Chemistry de donde se tomaron los datos en realidad daba una
estimación independiente del error estándar de los efectos de tratamiento basado en experiencias previas, de modo que utilizó un análisis algo diferente. El análisis aquí realizado
fue sólo para propósitos ilustrativos, puesto que en general se desearía mucho más de 2 grados de libertad para error.
■
Como una alternativa de las pruebas F basadas en el agrupamiento de suma de cuadrados para obtener SCE, se puede examinar un diagrama de probabilidad normal de contrastes de efecto.
Ejemplo 11.18
Se realizó un experimento para investigar la contracción de material plástico utilizado para
fundas de cables de velocímetro (“An Explanation and Critique of Taguchi’s Contribution to
Qualtiy Engineering”, Quality and Reliability Engr., Intl., 1988: 123-131). Los ingenieros
comenzaron con 15 factores: diámetro externo del forro, troquel de forro, material de forro,
velocidad de la línea de forrar, tipo de trenzado del alambre, tensión de trenzado, diámetro
del alambre, tensión del forro, temperatura del forro, material de recubrimiento, tipo de troquel de recubrimiento, temperatura de fusión, empaque de alambrado, método de enfriamiento y velocidad de la línea. Se sospechaba que sólo algunos de estos factores eran importantes,
así que se realizó un experimento de selección en la forma de un factorial 21511 (una 1/211
fracción de un experimento 215 factorial). La estructura alias resultante es bastante complicada, en particular, cada efecto principal se confunde con interacciones de dos factores. La variable de respuesta fue el porcentaje de contracción de un espécimen de cable producido a
niveles diseñados de los factores.
La figura 11.15 muestra un diagrama de probabilidad normal de los contrastes de efecto. Todos excepto dos de los puntos se aproximan bastante a una línea recta. Los puntos
Contraste
0
0.8
G Diámetro de alambre
1.6
E Tipo de trenzado de alambre
Percentil z
1.6
Figura 11.15
0.8
0
0.8
1.6
Diagrama de probabilidad normal de contrastes del ejemplo 11.18.
www.FreeLibros.me
c11_p397-445.qxd
440
3/12/08
CAPÍTULO 11
4:27 AM
Page 440
Análisis de varianza con varios factores
discrepantes corresponden a los efectos E tipo de trenzado de alambre y G diámetro
del alambre, lo que sugiere que dos factores son los únicos que afectan la cantidad de contracción.
■
No se discutieron los temas de experimentación factorial, confusión y réplica fraccional que involucran a muchos modelos y técnicas. Se debe consultar la bibliografía del capítulo para obtener más información.
EJERCICIOS
Sección 11.4 (38-49)
38. Los datos adjuntos se obtuvieron con un experimento para
estudiar la naturaleza de dependencia de la corriente de soldar en los tres factores: voltaje de soldar, velocidad de alimentación del alambre y distancia de la punta del cautín a
la pieza de trabajo. Hubo dos niveles de cada factor (un experimento 23) con dos réplicas por cada combinación de niveles (los promedios a través de las réplicas concuerdan con
los valores dados en el artículo “A Study on Prediction of
Welding Current in Gas Metal Arc Welding”, J. Engr. Manuf., 1991: 64-69). Los dos primeros números dados son
para tratamiento (1), los dos siguientes para a y así sucesivamente en orden estándar: 200.0, 204.2, 215.5, 219.5,
272.7, 276.9, 299.5, 302.7, 166.6, 172.6, 186.4, 192.0,
232.6, 240.8, 253.4, 261.6.
a. Verifique que las sumas de cuadrados son las que se dan
en la tabla ANOVA adjunta generada por MINITAB.
b. ¿Cuáles efectos parecen ser importantes y por qué?
Analysis of Variance for current
Source
DF
SS
MS
F
P
Volt
1 1685.1 1685.1 102.38 0.000
Speed
1 21272.2 21272.2 1292.37 0.000
Dist
1 5076.6 5076.6 308.42 0.000
Volt*speed
1
36.6
36.6
2.22 0.174
Volt*dist
1
0.4
0.4
0.03 0.877
Speed*dist
1
109.2
109.2
6.63 0.033
Volt*speed*dist 1
23.5
23.5
1.43 0.266
Error
8
131.7
16.5
Total
15 28335.3
39. Los datos adjuntos se obtuvieron con un experimento 23
con tres réplicas por combinación de tratamientos diseñado
para estudiar los efectos de concentración de detergente (A),
concentración de carbonato de sodio (B) y concentración de
celulosa carboximetilo de sodio (C) en el poder limpiador
de una solución en pruebas de lavado (un número grande indica un mejor poder limpiador que uno pequeño):
Niveles de factor
A
B
C
Condición
Observaciones
1
2
1
2
1
2
1
2
1
1
2
2
1
1
2
2
1
1
1
1
2
2
2
2
(1)
a
b
ab
c
ac
bc
abc
106, 93, 116
198, 200, 214
197, 202, 185
329, 331, 307
149, 169, 135
243, 247, 220
255, 230, 252
383, 360, 364
a. Tras obtener los totales de celda xijk, calcule estimacioAC
nes de 1, AC
11 y
21.
b. Use los totales de celda junto con el método de Yates para calcular los contrastes de efecto y las sumas de cuadrados. Luego construya una tabla ANOVA y pruebe
todas las hipótesis apropiadas con 0.05.
40. En un estudio de procesos utilizados para eliminar impurezas de artículos de celulosa (“Optimization of Rope-Range
Bleaching of Cellulosic Fabrics”, Textile Research J., 1976:
493-496), se obtuvieron los siguientes datos con un experimento 24 que implica el proceso de desencolado. Los cuatro factores fueron concentración de enzima (A), pH (B),
temperatura (C) y tiempo (D).
% de almidón
en peso
Tratamiento
Enzima
(g/L)
pH
(1)
a
b
ab
c
ac
bc
abc
d
ad
bd
abd
cd
acd
bcd
abcd
0.50
0.75
0.50
0.75
0.50
0.75
0.50
0.75
0.50
0.75
0.50
0.75
0.50
0.75
0.50
0.75
6.0
6.0
7.0
7.0
6.0
6.0
7.0
7.0
6.0
6.0
7.0
7.0
6.0
6.0
7.0
7.0
Temp. Tiempo 1a.
2a.
(°C)
(hr) réplica réplica
60.0
60.0
60.0
60.0
70.0
70.0
70.0
70.0
60.0
60.0
60.0
60.0
70.0
70.0
70.0
70.0
6
6
6
6
6
6
6
6
8
8
8
8
8
8
8
8
9.72
9.80
10.13
11.80
12.70
11.96
11.38
11.80
13.15
10.60
10.37
11.30
13.05
11.15
12.70
13.20
13.50
14.04
11.27
11.30
11.37
12.05
9.92
11.10
13.00
12.37
12.00
11.64
14.55
15.00
14.10
16.12
a. Use el algoritmo de Yates para obtener sumas de cuadrados y la tabla ANOVA.
b. ¿Parecen estar presentes efectos de interacción de segundo, tercero y cuarto grados? Explique su razonamiento.
¿Qué efectos principales parecen ser significativos?
41. En el ejercicio 39, suponga que se utilizó una baja temperatura del agua para obtener los datos. Se repite entonces todo el experimento con una temperatura del agua más alta
para obtener los datos siguientes. Use el algoritmo de Yates
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:27 AM
Page 441
11.4 Experimentos 2p factoriales
con el conjunto completo de observaciones para obtener las
sumas de cuadrados y la tabla ANOVA y luego pruebe las hipótesis apropiadas al nivel 0.05.
Condición
Observaciones
d
ad
bd
abd
cd
acd
bcd
abcd
144, 154, 158
239, 227, 244
232, 242, 246
364, 362, 346
194, 162, 203
284, 295, 291
291, 287, 297
411, 406, 395
lizados en el primer bloque [el que contiene el tratamiento (1)] y qué tratamientos se asignan al segundo bloque?
b. En un experimento para investigar la retención de niacina en vegetales en función de la temperatura de cocción
(A) tamaño de cedazo (B), tipo de procesamiento (C) y
tiempo de cocción (D), cada factor se mantuvo a dos niveles. Se utilizaron dos bloques, con la asignación de
bloques como se da en el inciso a) para confundir sólo la
interacción ABCD con los bloques. Use el procedimiento de Yates para obtener la tabla ANOVA para los datos
adjuntos.
Tratamiento
(1)
a
b
ab
c
ac
bc
abc
42. Los siguientes datos de consumo de energía en un horno
eléctrico (kW consumidos por tonelada de producto fundido) se obtuvieron con un experimento factorial 24 con tres
réplicas (“Studies on a 10-cwt Arc Furnace”, J. Iron and
Steel Institute, 1956: 22). Los factores fueron la naturaleza del techo A (bajo, alto), el ajuste de energía B (bajo, alto), chatarra utilizada C (tubo, placa) y carga D (700 lb,
1000 lb).
Tratamiento
Tratamiento
xijklm
(1)
a
b
ab
c
ac
bc
abc
866, 862, 800
946, 800, 840
774, 834, 746
709, 789, 646
1017, 990, 954
1028, 906, 977
817, 783, 771
829, 806, 691
d
ad
bd
abd
cd
acd
bcd
abcd
xijklm
988, 808, 650
966, 976, 876
702, 658, 650
784, 700, 596
922, 808, 868
1056, 870, 908
798, 726, 700
752, 714, 714
Construya la tabla ANOVA y pruebe todas las hipótesis de
interés con 0.01.
43. El artículo “Statistical Design and Analysis of Qualification
Test Program for a Small Rocket Engine” (Industrial Quality
Control, 1964: 14-18) presenta datos derivados de un experimento para valuar los efectos de vibración (A), ciclaje de
temperatura (B) ciclaje de altitud (C) y temperatura para ciclaje de altitud y encendido (D) sobre duración del empuje.
Aquí se da un subconjunto de los datos. (En el artículo, hubo cuatro niveles de D en lugar de sólo dos.) Use el método
de Yates para obtener sumas de cuadrados y la tabla
ANOVA. Luego suponga que no existen interacciones de
tres y cuatro factores, agrupe las sumas de cuadrados correspondientes para obtener una estimación de 2 y pruebe todas
las hipótesis apropiadas al nivel 0.05.
D2
D1
|
A1
A2
B1
B2
B1
B2
||
|
C1
C2
C1
C2
21.60
21.09
21.60
19.57
21.60
22.17
21.86
21.85
11.54
11.14
11.75
11.69
11.50
11.32
9.82
11.18
44. a. En un experimento 24, suponga que se van a utilizar dos
bloques y que se decide confundir la interacción ABCD
con el efecto de bloque. ¿Qué tratamientos deben ser rea-
441
xijkl
Tratamiento
xijkl
91
85
92
94
86
83
85
90
d
ad
bd
abd
cd
acd
bcd
abcd
72
78
68
79
69
75
72
71
c. Suponga que no existen efectos de tres vias, de modo
que las sumas de cuadrados asociadas pueden ser combinadas para estimar 2 y realice todas las pruebas apropiadas al nivel 0.05.
45. a. Se realizó un experimento para investigar los efectos en
la sensibilidad al audio de resistencia variable (A), dos
capacitancias (B, C) e inductancia de una bobina (D) en
una parte de un circuito de televisión. Si se utilizaron
cuatro bloques con cuatro tratamientos por bloque y los
efectos definitorios para confusión fueron AB y CD,
¿cuáles tratamientos aparecieron en cada bloque?
b. Suponga que se realizaron dos réplicas del experimento
descrito en el inciso a) y se obtuvieron los datos adjuntos. Obtenga la tabla ANOVA y pruebe todas las hipótesis pertinentes al nivel 0.01.
Tratamiento
xijkl1
xijkl2
Tratamiento
xijkl1
xijkl2
(1)
a
b
ab
c
ac
bc
abc
618
583
477
421
601
550
505
452
598
560
525
462
595
589
484
451
d
ad
bd
abd
cd
acd
bcd
abcd
598
587
480
462
603
571
502
449
585
541
508
449
577
552
508
455
46. En un experimento que implica cuatro factores (A, B, C y
D) y cuatro bloques, demuestre que por lo menos un efecto
principal o un efecto de interacción de dos factores debe ser
confundido con el efecto de bloque.
47. a. En un experimento de siete factores (A, . . . ,G), suponga que
en realidad se realiza un cuarto de réplica. Si los efectos definitorios son ABCDE y CDEFG, ¿cuál es el tercer efecto no
estimable y qué tratamientos están en el grupo que
contiene (1)? ¿Cuáles son los grupos alias de los siete efectos principales?
www.FreeLibros.me
c11_p397-445.qxd
442
3/12/08
CAPÍTULO 11
4:27 AM
Page 442
Análisis de varianza con varios factores
b. Si el cuarto de réplica se tiene que realizar con cuatro bloques (con ocho tratamientos por bloque), ¿cuáles son los
bloques si los efectos a ser confundidos son ACF y BDG?
48. Suponga que en el problema de empuje de cohete del ejercicio 43, estaban disponibles suficientes recursos para sólo
una media réplica del experimento 24.
a. Si el efecto ABCD se elige como el efecto definitorio para la réplica y el grupo de ocho tratamientos para el que
se obtienen los datos incluye el tratamiento (1), ¿qué otros
tratamientos están en el grupo observado y en cuáles son
los pares alias?
b. Suponga que los resultados del experimento del inciso a)
son los que se dan a continuación (dados en orden estándar después de eliminar la mitad no observada). Suponiendo que las interacciones de dos y tres factores son
insignificantes, pruebe al nivel 0.05 en cuanto a la presencia de efectos principales. También, construya un diagrama de probabilidad normal.
19.09 20.11 21.66 20.44
13.72 11.26 11.72 12.29
49. Una media réplica de un experimento 25 para investigar el
efecto del tiempo de tratamiento térmico (A), tiempo de temple (B), tiempo de estirado (C), posición de los serpentines
calentadores (D) y posición de medición (E) en la dureza de
piezas fundidas de acero, dio los datos adjuntos. Construya
la tabla ANOVA y (suponiendo que las interacciones de segundo grado y grado más alto son insignificantes) pruebe al
nivel 0.01 en cuanto a la presencia de efectos principales.
Construya también un diagrama de probabilidad normal.
Tratamiento
Observación
Tratamiento
Observación
70.4
72.1
70.4
67.4
68.0
73.8
67.0
67.8
acd
ace
ade
bcd
bce
bde
cde
abcde
66.6
67.5
64.0
66.8
70.3
67.9
65.9
68.0
a
b
c
d
e
abc
abd
abe
EJERCICIOS SUPLEMENTARIOS (50-61)
50. Los resultados de un estudio de la efectividad del secado en
tendero en la suavidad de telas se resumieron en el artículo
“Line-Dried vs. Machine-Dried Fabrics: Comparison of
Appearance, Hand, and Consumer Acceptance” (Home
Econ. Research J., 1984: 27-35). Se dieron calificaciones
de suavidad para nueve tipos distintos de telas y cinco métodos de secado diferentes: 1) secado en máquina, 2) secado colgado, 3) secado colgado seguido por 15 min de
secado en centrífuga, 4) secado colgado con suavizante y 5)
secado colgado con movimiento de aire. Considerando los
diferentes tipos de tela como bloques, construya una tabla
ANOVA. Con un nivel de significación de 0.05, pruebe para ver si hay diferencia entre la calificación de suavidad media según los métodos de secado.
Método de secado
Crepé
Doble punto
Asargada
Asargada combinada
Tela Tela esponja
Paño fino
Lencería para sábanas
Pana
Mezclilla
1
2
3
4
5
3.3
3.6
4.2
3.4
3.8
2.2
3.5
3.6
2.6
2.5
2.0
3.4
2.4
1.3
1.5
2.1
1.3
1.4
2.8
3.6
3.8
2.9
2.8
2.7
2.8
2.8
2.4
2.5
2.4
3.1
1.6
2.0
1.5
2.1
1.7
1.3
1.9
2.3
3.1
1.7
1.6
1.9
2.2
1.8
1.6
51. La absorción de agua de dos tipos de mortero utilizado para
reparar cemento dañado se discutió en el artículo “Polymer
Mortar Composite Matrices for Maintenance-Free, Highly
Durable Ferrocement” (J. Ferrocement, 1984: 337-345). Se
sumergieron especímenes de mortero para cemento común
(MCO) y mortero para cemento con polímero (MCP) du-
rante lapsos de tiempo variables (5, 9, 24 o 48 horas) y se
registró la absorción de agua (% por peso). Con el tipo de mortero como factor A (con dos niveles) y el periodo de inmersión como factor B (con cuatro niveles), se realizaron tres
observaciones por cada combinación de nivel de factor. Se utilizaron datos incluidos en el artículo para calcular las sumas de
cuadrados, las cuales fueron SCA 322.667, SCB 35.623,
SCAB 8.557 y STC 372.113. Use esta información para
construir una tabla ANOVA. Pruebe las hipótesis apropiadas a
un nivel de significación de 0.05.
52. Se dispuso de cuatro parcelas para un experimento a fin de
comparar la acumulación de tréboles con cuatro tipos de sembrado (“Performance of Overdrilled Red Clover with Different Sowing Rates and Initial Grazing Managements”, N.
Zeal. J. Exp. Ag., 1984: 71-81). Como las cuatro parcelas
habían sido rozadas de forma diferente antes del experimento y se pensaba que esto podía afectar la acumulación de tréboles, se utilizó un experimento de bloques aleatorizados con
los cuatro tipos de rozado probados en una sección de cada
parcela. Use los datos dados para probar la hipótesis nula de
ninguna diferencia en la acumulación de trébol media verdadera (kg DM/ha) con los distintos tipos de sembrado.
Coeficiente de sembrado (kg/ha)
Parcela
1
2
3
4
3.6
6.6
10.2
13.5
1155
123
68
62
2255
406
416
75
3505
564
662
362
4632
416
379
564
53. En proceso de control químico automático, la velocidad con
la cual los objetos colocados sobre una banda transportadora
pasan a través de un rociado químico (velocidad de banda,
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:27 AM
Page 443
443
Ejercicios suplementarios
la cantidad de químico rociado (volumen rociado) y la marca del químico utilizado (marca) son factores que pueden
afectar la uniformidad del recubrimiento aplicado. Se condujo un experimento 23 replicado en un esfuerzo por incrementar la uniformidad del recubrimiento. En la tabla
siguiente, los valores altos de la variable de respuesta están
asociados con la alta uniformidad superficial:
Uniformidad
superficial
Volumen Velocidad
Réplica Réplica
Corrida de rocío de banda Marca
1
2
1
2
3
4
5
6
7
8
40
25
30
50
45
25
30
52
36
28
32
48
43
30
29
49
Analice estos datos y exponga sus conclusiones.
54. Plantas de energía de carbón utilizadas en la industria eléctrica han captado la atención del público debido a los problemas ambientales asociados con los desechos sólidos
generados por la combustión a gran escala (“Fly Ash Binders in Stabilization of FGD Wastes”, J. of Environmental
Engineering, 1998: 43-49). Se realizó un estudio para analizar la influencia de tres factores: tipo de aglutinante (A),
cantidad de agua (B) y escenario de disposición en la tierra
(C), que afectan ciertas características de lixiviación de los
desechos sólidos derivados de la combustión. Cada factor se
estudió a dos niveles. Se realizó un experimento 23 no replicado y se midió un valor de respuesta EC50 (la concentración efectiva, en mg/L, que reduce 50% de la luz en un
bioensayo de luminiscencia) por cada combinación de niveles de factor. Los datos experimentales se dan en la siguiente tabla:
Corrida
1
2
3
4
5
6
7
8
A
Factor
B
C
Respuesta
EC50
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
23 100
43 000
71 400
76 000
37 000
33 200
17 000
16 500
rro extraído de muestras de caolín (“Factorial Experiments
in the Development of a Kaolin Bleaching Process Using
Thiourea in Sulphuric Acid Solutions”, Hydrometallurgy,
1997: 181-197). Los factores y sus niveles aparecen en la siguiente tabla:
Factor
Descripción
Unidades
Nivel
bajo
Nivel
alto
A
B
C
D
H2SO4
Thiourea
Temperatura
Tiempo
M
g/l
°C
min.
0.10
0.0
70
30
0.25
5.0
90
150
Los datos derivados de un experimento 24 no replicado se dan
en la tabla siguiente.
Hornada
de prueba
(1)
a
b
ab
c
ac
bc
abc
Hornada
de prueba
7
11
7
12
21
41
27
48
d
ad
bd
abd
cd
acd
bcd
abcd
Extracción
de hierro
(%)
28
51
33
57
70
95
77
99
a. Calcule estimaciones de los efectos principales y los efectos de interacción de dos factores para este experimento.
b. Cree un diagrama de probabilidad de los efectos. ¿Cuáles efectos parecen ser importantes?
56. Se han utilizado diseños factoriales en la silvicultura para
valuar los efectos de varios factores en el comportamiento
de crecimiento de árboles. En el experimento, los investigadores pensaban que los retoños de abetos sanos debían abotonar más pronto que los retoños de abetos muertos
(“Practical Analysis of Factorial Experiments in Forestry”,
Canadian J. of Forestry, 1995: 446-461). Además, antes de
plantarlos, los retoños fueron expuestos a tres niveles de pH
para ver si este factor tenía algún efecto en la captación de
virus por las raíces. La tabla siguiente muestra datos de un
experimento de 2 3 para estudiar ambos factores.
pH
Muerto
Salud
Realice un ANOVA apropiado y exprese sus conclusiones.
55. Las impurezas en la forma de óxidos de hierro reducen el
valor económico y la utilidad de minerales industriales, tales como caolines, en las industrias de la cerámica y de procesamiento de papel. Se realizó un experimento 24 para
valuar los efectos de cuatro factores en el porcentaje de hie-
Extracción
de hierro
(%)
Saludable
3
5.5
1.2, 1.4,
1.0, 1.2,
1.4
1.4, 1.6,
1.6, 1.6,
1.4
0.8, 0.6,
0.8, 1.0,
0.8
1.0, 1.2,
1.2, 1.4,
1.4
7
1.0, 1.0,
1.2, 1.4,
1.2
1.2, 1.4,
1.2, 1.2,
1.4
La variable de respuesta es una calificación promedio de
cinco botones de un retoño. Las calificaciones son 0 (botón
no abierto) 1 (botón parcialmente abierto) y 2 (botón totalmente abierto). Analice estos datos.
www.FreeLibros.me
c11_p397-445.qxd
444
3/12/08
CAPÍTULO 11
4:27 AM
Page 444
Análisis de varianza con varios factores
57. Una propiedad de las bolsas de aire automotrices que contribuye a su capacidad de absorber energía es la permeabilidad
(pie3/pie2/min) del material tejido utilizado para construir las
bolsas de aire. Entender cómo la permeabilidad es influenciada por varios factores es importante para incrementar la efectividad de las bolsas de aire. En un estudio, se analizaron los
efectos de tres factores, cada uno a tres niveles. (“Analysis of
Fabrics used in Passive Restraint Systems-Airbags”, J. of the
Textile Institute, 1996: 554-571):
A (Temperatura): 8°C, 50°C, 75°C
B (Denier de la tela): 420-D, 630-D, 840-D
C (Presión del aire): 17.2 kPa, 34.4 kPa, 103.4 kPa
estos niveles. Las sumas calculadas de los cuadrados son
SCA 6.94, SCB 5.61, SCC 12.33, SCAB 4.05,
SCAC 7.32, SCBC 15.80, SCE 14.40 y STC 70.82.
Construya la tabla ANOVA y realice pruebas apropiadas a
un nivel de significación de 0.05.
59. Se estudió la resistencia de adhesión cuando se monta un circuito integrado en un sustrato de vidrio metalizado como una función del factor A tipo de adhesivo, factor B tiempo de curado
y factor C material conductor (cobre y níquel). Los datos se
dan a continuación junto con una tabla ANOVA generada por
MINITAB. ¿Qué conclusiones puede sacar de los datos?
Cobre
1
Tiempo de curado
2
3
Temperatura 8°
Denier
17.2
Presión
34.4
420-D
73
80
35
433
125
111
157
155
91
98
234
233
1
103.4
332
322
288
271
477
464
Adhesivo
630-D
840-D
Temperatura 50°
17.2
Presión
34.4
103.4
420-D
52
51
16
12
96
100
125
118
72
78
149
155
281
264
169
173
338
350
Denier
17.2
Presión
34.4
103.4
420-D
37
31
30
41
102
98
95
106
91
100
170
160
276
281
213
211
307
311
630-D
840-D
Temperatura 75°
630-D
840-D
3
Níquel
1
Adhesivo
Denier
Analice estos datos y exprese sus conclusiones (suponga
que todos los factores son fijos).
58. Un ingeniero químico ha realizado un experimento para estudiar los efectos de los factores fijos en la presión de la tina
(A), tiempo de cocción de la pulpa (B) y concentración de
madera dura (C) en la resistencia del papel. El experimento
implicó dos presiones, cuatro tiempos de cocción, tres concentraciones y dos observaciones con cada combinación de
2
2
3
72.7
80.0
77.8
75.3
77.3
76.5
74.6
77.5
78.5
81.1
80.9
82.6
80.0
82.7
84.6
78.3
83.9
85.0
1
2
3
74.7
77.4
79.3
77.8
77.2
78.4
75.7
78.2
78.8
75.4
84.5
77.5
77.2
74.6
83.0
83.9
89.4
81.2
Analysis of Variance for strength
Source
DF
SS
MS
Adhesive
2 101.317 50.659
Curetime
2 151.317 75.659
Conmater
1
0.722 0.722
Adhes*curet
4
30.526 7.632
Adhes*conm
2
8.015 4.008
Curet*conm
2
5.952 2.976
Adh*curet*conm
4
33.298 8.325
Error
18 139.515 7.751
Total
35 470.663
F
6.54
9.76
0.09
0.98
0.52
0.38
1.07
P
0.007
0.001
0.764
0.441
0.605
0.687
0.398
60. El artículo “Food Consumption and Energy Requirements of
Captive Bald Eagles” (J. Wildlife Mgmt., 1982: 646-654) investigó la ingesta de energía diaria bruta media (la variable de
respuesta) con diferentes tipos de dieta (factor A, con tres
niveles) y temperatura (factor B, con tres niveles). Se utilizaron las cantidades resumidas dadas en el artículo para generar
datos y los resultados fueron SCA 18 138, SCB 5182,
SCAB 1737, STC 36 348 y grados de libertad para
error 36. Construya una tabla ANOVA y pruebe las hipótesis pertinentes.
61. Análogo a un cuadrado latino, se puede utilizar un diseño
de cuadrado greco-latino cuando se sospecha que tres factores externos pueden afectar las variables de respuesta y
los cuatro factores (los tres externos y el de interés) tienen
el mismo número de niveles. En un cuadrado latino, cada
nivel del factor de interés (C) aparece una vez en cada fila
(con cada nivel de A) y una vez en cada columna (con cada
www.FreeLibros.me
c11_p397-445.qxd
3/12/08
4:27 AM
Page 445
Bibliografía
nivel de B). En un cuadrado greco-latino, cada nivel del factor
D aparece una vez en cada fila, en cada columna y también
con cada nivel del tercer factor externo C. Alternativamente,
se puede utilizar el diseño cuando los cuatro factores son de
igual interés, el número de niveles de cada uno es N y están disponibles recursos para sólo N2 observaciones. Un cuadrado de
de 5 5 se ilustra en a) con (k, l) en cada celda que denota el
k-ésimo nivel de C y el l-ésimo nivel de D. En b) se presentan
datos de pérdida de peso en barras de silicio utilizadas para
material semiconductor como una función del volumen de grabado al agua fuerte (A), color del ácido nítrico en solución de
grabado (B), tamaño de las barras (C) y tiempo en la solución
de grabado (D) (de “Applications of Analytic Techniques to the
Semiconductor Industry”, Fourteenth Midwest Quality Control Conference, 1959).
Sea Xij(kl) la pérdida de peso observada cuando el factor
A está al nivel i, B está al nivel j, C está al nivel k y D está
al nivel l. Suponiendo que no hay interacción entre los factores, la suma total de cuadrados STC (con N2 1 grados
de libertad) puede ser dividida en SCA, SCB, SCC, SCD y
SCE. Dé expresiones para estas sumas de cuadrados, incluidas las fórmulas, obtenga la tabla ANOVA de los datos dados y pruebe cada una de las cuatro hipótesis de efecto
principal con 0.05.
(C, D)
A
1
B
3
2
4
445
5
1
(1, 1) (2, 3) (3, 5)
(4, 2) (5, 4)
2
(2, 2) (3, 4) (4, 1)
(5, 3) (1, 5)
3
(3, 3) (4, 5) (5, 2)
(1, 4) (2, 1)
4
(4, 4) (5, 1) (1, 3)
(2, 5) (3, 2)
5
(5, 5) (1, 2) (2, 4)
(3, 1) (4, 3)
a)
65
82
108
101
126
84 109
73
97
83
105 129
89
89
52
119
72
76
117
84
97
59
94
78
106
b)
Bibliografía
Box, George, William Hunter y Stuart Hunter, Statistics for Experimenters (2a. ed.), Wiley, Nueva York, 2006. Contiene un
caudal de sugerencias e ideas sobre análisis de datos basados
en la extensa experiencia consultora de los autores.
DeVor, R., T. Chang y J. W. Sutherland, Statistical Quality Design and Control, Macmillan, Nueva York, 1992. Incluye un
estudio moderno de experimentos factoriales y factoriales
fraccionarios con un mínimo de matemáticas.
Hocking, Ronald, The Analysis of Linear Models, Brooks/Cole
Pacific Grove, CA, 1985. Un tratamiento muy general de análisis de varianza escrito por una de las autoridades más reconocidas en este campo.
Kleinbaum, David, Lawrence Kupper, Keith Muller y Azhar Nizam, Applied Regression Analysis and Other Multivariable
Methods (3a. ed.) Duxbury Press, Pacific Grove, 1998. Contiene una discusión especialmente buena de problemas aso-
ciados con el análisis de “datos desbalanceados”, es decir, Kij
desiguales.
Kuehl, Robert O., Statistical Principles of Research Design and
Analysis, Wadsworth, Belmont, CA, 1994. Un tratamiento
amplio y actualizado de experimentos diseñados y análisis de
los datos resultantes.
Montgomery, Douglas, Design and Analysis of Experiments (5a.
ed.), Wiley, Nueva York, 2001. Véase la bibliografía del capítulo 10.
Neter, John, William Wasserman y Michael Kutner, Applied Linear Statistical Models (4a. ed.), Irwin, Homewood, IL.,
1996. Véase la bibliografía del capítulo 10.
Vardeman, Stephen, Statistics for Engineering Problem Solving,
PWS, Boston, 1994. Una introducción general para ingenieros, con mucha metodología descriptiva e inferencial para datos derivados de experimentos diseñados.
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
12
4:30 AM
Page 446
Regresión lineal simple
y correlación
INTRODUCCIÓN
En los problemas de dos muestras discutidos en el capítulo 9, interesaba comparar
valores de parámetros para la distribución x y la distribución y. Incluso cuando las observaciones se aparearon, no se trató de utilizar sobre una de las variables al estudiar
la otra variable. Éste es precisamente el objetivo del análisis de regresión, explotar la
relación entre dos (o más) variables de modo que se pueda obtener información sobre una de ellas mediante el conocimiento de los valores de la otra u otras.
Gran parte de las matemáticas se dedica a estudiar variables que están determinísticamente relacionadas. Decir que x y y están relacionadas de esta manera significa que una vez conocido el valor de x, el valor de y queda completamente
especificado. Por ejemplo, supóngase que se decide rentar una vagoneta por un día
y la renta es de $25.00 más $0.30 por milla recorrida. Si x el número de millas recorridas y y el cargo de la renta, entonces y 25 0.3x. Si se recorren 100 millas (x 100), entonces y 25 + 0.3(100) 55. Como otro ejemplo, si la velocidad
inicial de una partícula es v0 y experimenta una aceleración constante a, entonces la
1
distancia recorrida y v0 x 2 ax2, donde x tiempo.
Existen muchas variables x y y que parecerían estar relacionadas entre sí, pero
no de una forma determinística. Un ejemplo conocido para muchos estudiantes es el
de las variables x promedio de calificaciones de preparatoria (GPA, por sus siglas
en inglés) y y GPA universitario. El valor de y no puede ser determinado sólo con
el conocimiento de x, y dos estudiantes diferentes podrían tener el mismo valor x
pero tener valores y muy distintos. No obstante, existe la tendencia de que aquellos
estudiantes que tienen promedio de calificaciones de preparatoria alto (bajo) también tienen un promedio de calificaciones universitario alto (bajo). El conocimiento
del promedio de calificaciones de preparatoria de un estudiante es bastante útil ya
que permite predecir cómo se desempeñará en la universidad.
446
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:30 AM
Page 447
12.1 Modelo de regresión lineal simple
447
Otros ejemplos de variables relacionadas de una forma no determinística incluyen x edad de un niño y y tamaño del vocabulario de ese niño, x tamaño de
un motor en centímetros cúbicos y y eficiencia de combustible de un automóvil
equipado con dicho motor y x fuerza de tensión aplicada y y cantidad de alargamiento en una tira de metal.
El análisis de regresión es la parte de la estadística que se ocupa de investigar
la relación entre dos o más variables relacionadas en una forma no determinística. En
este capítulo, se generaliza la relación lineal determinística y 0 1x a una relación
probabilística lineal, se desarrollan procedimientos para hacer inferencias sobre los parámetros del modelo y se obtiene una medida cuantitativa (el coeficiente de correlación)
del grado al cual las dos variables están relacionadas. En el siguiente capítulo, se considerarán técnicas para validar un modelo particular y para investigar relaciones no lineales
y relaciones que implican más de dos variables.
12.1 Modelo de regresión lineal simple
La relación matemática determinística más simple entre dos variables x y y es una relación
lineal y 0 1x.. El conjunto de pares (x, y) para los cuales y 0 1x determina
una línea recta con pendiente 1 e intersección en y 0.* El objetivo de esta sección es
desarrollar un modelo probabilístico lineal.
Si las dos variables no están determinísticamente relacionadas, entonces con un valor
fijo de x, el valor de la segunda variable es aleatorio. Por ejemplo, si se está investigando la
relación entre la edad de un niño y el tamaño del vocabulario y se decide seleccionar un niño
de x 5.0 años de edad, entonces antes de hacer la selección, el tamaño del vocabulario es
una variable aleatoria Y. Después de que un niño particular de 5 años de edad se selecciona
y se somete a prueba, el resultado puede ser un vocabulario de 2000 palabras. Se diría entonces que el valor observado de Y asociado con la fijación de x 5.0 fue y 2000.
Más generalmente, la variable cuyo valor fija el experimentador será denotada por x
y se llamará variable independiente, pronosticadora o variable explicativa. Con x fija, la
segunda variable será aleatoria; esta variable aleatoria y su valor observado se designan Y y
y, respectivamente y se la conoce como variable dependiente o de respuesta.
Normalmente se realizarán observaciones para varios escenarios de la variable independiente. Sean x1, x2, . . . , xn los valores de la variable independiente para la que se realizan
las observaciones y sean Yi y yi, respectivamente, la variable aleatoria y el valor observado
asociado con xi. Los datos bivariantes disponibles se componen entonces de los n pares (x1,
y1), (x2, y2), . . . , (xn, yn). Un primer paso en el análisis de regresión que implica dos variables es construir una gráfica de puntos de los datos observados. En una gráfica como esa,
cada (xi, yi) está representado como un punto colocado en un sistema de coordenadas bidimensional.
* La pendiente de una línea es el cambio en y con un incremento de 1 unidad en x. Por ejemplo, si y 3x 10,
entonces y se reduce en 3 cuando x se incrementa en 1, de modo que la pendiente es 3. La intersección en y
es la altura a la cual la línea cruza el eje vertical y se obtiene haciendo x 0 en la ecuación.
www.FreeLibros.me
448
3/12/08
CAPÍTULO 12
4:30 AM
Page 448
Regresión lineal simple y correlación
Ejemplo 12.1
Los problemas visuales y musculoesqueléticos asociados con el uso de terminales con pantallas de visualización (VDT, por sus siglas en inglés) se han vuelto un tanto comunes en años
recientes. Algunos investigadores se han enfocado en la dirección vertical de la mirada fija
como causa del cansancio e irritación de los ojos. Se sabe que esta relación está estrechamente relacionada con el área de la superficie ocular (OSA, por sus siglas en inglés), así que se
requiere un método de medir el área de la superficie ocular. Los datos representativos adjuntos sobre y OSA (cm2) y x ancho de la fisura palprebal (es decir, el ancho horizontal de
la apertura del ojo (en cm) se tomó del artículo “Analysis of Ocular Surface Area for Comfortable VDT Workstation Layout” (Ergonomics, 1996: 877-884). No se da el orden en el
cual se obtuvieron las observaciones, así que por conveniencia aparecen en orden creciente
de los valores x.
i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
xi
0.40 0.42 0.48 0.51 0.57 0.60 0.70 0.75 0.75 0.78 0.84 0.95 0.99 1.03 1.12
yi
1.02 1.21 0.88 0.98 1.52 1.83 1.50 1.80 1.74 1.63 2.00 2.80 2.48 2.47 3.05
i
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
xi
1.15 1.20 1.25 1.25 1.28 1.30 1.34 1.37 1.40 1.43 1.46 1.49 1.55 1.58 1.60
yi
3.18 3.76 3.68 3.82 3.21 4.27 3.12 3.99 3.75 4.10 4.18 3.77 4.34 4.21 4.92
Por consiguiente, (x1, y1) (0.40, 1.02), (x5, y5) (0.57, 1.52), y así sucesivamente. En la
figura 12.1 se muestra una gráfica de puntos obtenida con MINITAB; se utilizó una opción
que produjo una gráfica de puntos tanto de valores x como de valores y individualmente a lo
largo de los márgenes derecho y superior de la gráfica, lo que facilita visualizar las distribuciones de las variables individuales (los histogramas o gráficas de caja son opciones alternativas). He aquí algunas cosas que hay que tener en cuenta sobre los datos y la gráfica:
•
Varias observaciones tienen valores x idénticos aunque valores y diferentes (p. ej., x8
x9 0.75 pero y8 1.80 y y9 1.74). Por lo tanto, el valor de y no está determinado sólo por x sino también por varios otros factores.
•
Existe una fuerte tendencia de que y se incremente a medida que x lo hace. Es decir, los
valores grandes de OSA tienden a asociarse con valores grandes de ancho de fisura, una
relación positiva entre las variables.
OSA
c12_p446-499.qxd
Ancho asociado
Figura 12.1 Gráfica de puntos obtenida con MINITAB con los datos del ejemplo 12.1, junto
con gráficas de puntos de valores x y y.
www.FreeLibros.me
3/12/08
4:30 AM
Page 449
12.1 Modelo de regresión lineal simple
•
449
Parece que el valor de y podría ser pronosticado a partir de x encontrando una línea que esté razonablemente cerca a los puntos presentes en la gráfica (los autores del artículo citado
superponen tal línea en su gráfica). En otras palabras, existe evidencia de una relación lineal
(aunque no perfecta) sustancial entre las dos variables.
■
Los ejes horizontal y vertical en la gráfica de puntos que aparecen en la gráfica de la
figura 12.1 se cortan en el punto (0, 0). En muchos conjuntos de datos los valores de x o y
o los valores de ambas variables difieren considerablemente de cero con respecto al rango o
rangos de los valores. Por ejemplo, un estudio de cómo la eficiencia de un equipo de aire
acondicionado está relacionada con la temperatura diaria máxima a la intemperie podría implicar observaciones de temperaturas desde 80°F hasta 100°F. Cuando éste es el caso, una
gráfica más informativa mostraría los ejes apropiadamente marcados en algún punto diferente de (0, 0).
Ejemplo 12.2
Los fenómenos de crecimiento y declinación de los bosques por todo el mundo han atraído
un considerable interés del público y la comunidad científica. El artículo “Relationships
Among Crown Condition, Growth, and Stand Nutrition in Seven Northern Vermont Sugarbushes” (Canad. J. of Forest Res., 1995: 386-397) incluye una gráfica de puntos de y declinación de copa media (%), un indicador de la retardación del crecimiento y x pH del
suelo (un pH más alto corresponde a un suelo más ácido), de donde se tomaron las siguientes observaciones:
x
3.3
3.4
3.4
3.5
3.6
3.6
3.7
3.7
3.8
3.8
y
7.3
10.8
13.1
10.4
5.8
9.3
12.4
14.9
11.2
8.0
x
3.9
4.0
4.1
4.2
4.3
4.4
4.5
5.0
5.1
y
6.6
10.0
9.2
12.4
2.3
4.3
3.0
1.6
1.0
La figura 12.2 muestra dos gráficas de puntos de estos datos obtenidas con MINITAB. En
la figura 12.2a), MINITAB seleccionó la escala para ambos ejes. La figura 12.2b) se obtuvo especificando valores mínimo y máximo para x y y, de modo que los ejes se corten aproximadamente en el punto (0, 0). La segunda gráfica está más amontonada que la primera;
tal amontonamiento hace más difícil valorar la naturaleza general de cualquier relación. Por
ejemplo, puede ser más difícil descubrir la curvatura en una gráfica amontonada.
Porcentaje de declinación
Porcentaje de declinación
c12_p446-499.qxd
pH del suelo
a)
Figura 12.2
pH del suelo
b)
Gráficas de puntos obtenidas con MINITAB con los datos del ejemplo 12.2.
www.FreeLibros.me
c12_p446-499.qxd
450
3/12/08
CAPÍTULO 12
4:30 AM
Page 450
Regresión lineal simple y correlación
Los valores grandes de porcentaje de declinación tienden a asociarse con un bajo pH
del suelo, una relación negativa o inversa. Además, las dos variables parecen estar al menos
aproximadamente relacionadas, aunque los puntos se dispersarían en torno a cualquier línea
recta trazada a través de la gráfica.
■
Modelo probabilístico lineal
Para el modelo determinístico y 0 1x, el valor observado de y es una función lineal
de x. La generalización apropiada de esto a un modelo probabilístico supone que el valor
esperado de Y es una función lineal de x, pero que con x fija, la variable Y difiere de su valor esperado en una cantidad aleatoria.
DEFINICIÓN
Modelo de regresión lineal simple
Existen parámetros 0, 1 y 2 de tal suerte que con cualquier valor fijo de la variable independiente x, la variable dependiente está relacionada con x por conducto de la
ecuación de modelo
Y 0 1x
(12.1)
La cantidad en la ecuación de modelo es una variable aleatoria, que se supone está
normalmente distribuida con E() 0 y V() 2.
La variable se conoce como término de error aleatorio o desviación aleatoria en
el modelo. Sin , cualquier par observado (x, y) correspondería a un punto que queda exactamente sobre la línea y 0 1x, llamada línea de regresión (o de población) verdadera. La inclusión del término de error aleatorio permite que (x, y) quede o por encima de
la línea de regresión verdadera (cuando 0) o por debajo (cuando 0). Los puntos (x1,
y1), . . . , (xn, yn) provenientes de n observaciones independientes se dispersarán entonces en
torno a la línea de regresión verdadera, como se ilustra en la figura 12.3. En ocasiones, la
conveniencia del modelo de regresión lineal simple puede ser sugerida por consideraciones
teóricas (p. ej., existe una relación lineal exacta entre las dos variables, con representando
el error de medición). Con mucha más frecuencia, no obstante, la racionalidad del modelo
es indicada por una gráfica de puntos que exhibe un patrón lineal sustancial (como en la figura 12.1).
y
(x1, y1)
¡1
¨
©
ª
¨
©
ª
Línea de regresión verdadera
y 0 1x
¡2
(x2, y2)
x
x1
Figura 12.3
x2
Puntos correspondientes a observaciones del modelo de regresión lineal simple.
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:30 AM
Page 451
12.1 Modelo de regresión lineal simple
451
Las implicaciones de la ecuación del modelo (12.1) se entienden mejor con la ayuda
de la siguiente notación. Sea x* un valor particular de la variable independiente x y
Yx* el valor esperado (o media) de Y cuando x x*
2
Yx*
la varianza de Y cuando x x*
La notación alternativa es E(Y°x*) y V(Y°x*). Por ejemplo, si x esfuerzo aplicado
(kg/mm2) y y tiempo para la fractura (h), entonces Y20 denotaría el valor esperado de
tiempo para la fractura cuando se aplica un esfuerzo de 20 kg/mm2. Si se piensa en una población completa de pares (x, y), entonces Yx* es la media de todos los valores y con los
2
cuales x x* y Yx*
es una medida de cuántos de estos valores de y se dispersan en torno
al valor medio. Si por ejemplo, x edad de un niño y y tamaño del vocabulario, entonces Y5 es el tamaño del vocabulario promedio de todos los niños de 5 años que hay en la
2
población y Y5
describe la cantidad de variabilidad del tamaño del vocabulario de esta parte de la población. Una vez que se fija x, la única aleatoriedad del lado derecho de la ecuación del modelo (12.1) se encuentra en el error aleatorio y su valor medio y varianza son
0 y 2, respectivamente, cualquiera que sea al valor de x. Esto implica que
Yx* E(0 1x* ) 0 1x* E() 0 1x*
2
Yx*
V(0 1x* ) V(0 1x*) V() 0 2 2
Reemplazando x* en Yx* por x se obtiene la relación Yx 0 1x, la cual expresa que el valor medio de Y, en lugar de Y misma, es una función lineal de x. La línea de regresión lineal verdadera y 0 1x es por consiguiente la línea de valores medios; su
altura por encima de cualquier valor x es el valor esperado de Y para ese valor de x. La pendiente 1 de la línea de regresión verdadera se interpreta como el cambio esperado de Y asociado con el incremento en una unidad del valor de x. La segunda relación manifiesta que la
cantidad de variabilidad en la distribución de valores Y es la misma con cada valor diferente de x (homogeneidad de varianza). En el ejemplo que implica la edad de un niño y el tamaño de su vocabulario, el modelo implica que el tamaño del vocabulario promedio cambia
de manera lineal con la edad (afortunadamente 1 es positiva) y que la cantidad de variabilidad del tamaño del vocabulario a cualquier edad particular es la misma que a cualquier otra
edad. Por último, con x fija, Y es la suma de una constante 0 1x y una variable aleatoria normalmente distribuida así que por sí misma tiene una distribución normal. Estas propiedades se ilustran en la figura 12.4. El parámetro de varianza 2 determina el grado al cual
cada curva normal se dispersa en torno a su valor medio (la altura de la línea). Cuando 2
Media normal 0
desviación estándar
0
a)
y
0 1x3
0 1x2
0 1x1
Línea y 0 1x
x
x1
Figura 12.4
x2
b)
x3
a) Distribución de '; b) distribución de Y con diferentes valores de x.
www.FreeLibros.me
c12_p446-499.qxd
452
3/12/08
CAPÍTULO 12
4:30 AM
Page 452
Regresión lineal simple y correlación
es pequeña, un punto observado (x, y) normalmente quedará bastante cerca de la línea de regresión verdadera, mientras que las observaciones pueden desviarse considerablemente de
sus valores esperados (correspondientes a puntos alejados de la línea) cuando 2 es grande.
Ejemplo 12.3
Supóngase que el modelo de regresión lineal simple con una línea de regresión verdadera
y 65 1.2x y 8 describe la relación entre el esfuerzo aplicado x y el tiempo para la
falla y. Entonces con cualquier valor fijo x* de esfuerzo, el tiempo para la falla tiene una
distribución normal con valor medio de 65 1.2x* y desviación estándar 8. En general,
en la población compuesta de todos los puntos (x, y), la magnitud de una desviación típica
con respecto a la línea de regresión verdadera es aproximadamente 8. Con x 20, Y tiene
un valor medio Y·20 65 1.2(20) 41, por lo tanto
P(Y 50 cuando x 20) P Z
50 41
1 (1.13) 0.1292
8
La probabilidad de que el tiempo para la falla exceda de 50 cuando se aplica un esfuerzo de
25 es, debido a que Y·25 35,
P(Y 50 cuando x 25) P Z
50 35
1 (1.88) 0.0301
8
Estas probabilidades se ilustran como las áreas sombreadas en la figura 12.5.
P(Y 50 cuando x 20) 0.1292
y
P(Y 50 cuando x 25) 0.0301
50
41
35
Línea de regresión verdadera
y 65 1.2x
x
20
Figura 12.5
25
Probabilidades basadas en el modelo de regresión lineal simple.
Supóngase que Y1 denota una observación del tiempo para la falla realizada con x 25
y que Y2 denota una observación independiente realizada con x 24. Entonces Y1 Y2 está
normalmente distribuida con valor medio E(Y1 Y2) 1 1.2, varianza V(Y1 Y2)
2 2 128 y desviación estándar 1
28 11.314. La probabilidad de que Y1 exceda a
Y2 es
P(Y1 Y2 0) P Z
0 ( 1.2)
P(Z 0.11) 0.4562
11.314
Es decir, aun cuando se espera que Y disminuya a medida que x se incrementa en una unidad, es probable que Y en x 1 sea más grande que la Y observada en x.
■
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:30 AM
Page 453
453
12.1 Modelo de regresión lineal simple
EJERCICIOS
Sección 12.1 (1-11)
1. La relación de eficiencia de un espécimen de acero sumergido en un tanque para fosfatizar es el peso del recubrimiento de fosfato dividido entre la pérdida de metal (ambos
en mg/pie2). El artículo “Statistical Process Control of a
Phosphate Coating Line” (Wire J. Intl., mayo de 1997:
78-81) dio los datos adjuntos sobre la temperatura del tanque (x) y relación de eficiencia (y):
Temp.
170
Relación 0.84
172 173
1.31 1.42
174
1.03
174
1.07
175 176
1.08 1.04
Temp.
177
Relación 1.80
180 180
1.45 1.60
180
1.61
180
2.13
180 181
2.15 0.84
Temp.
181
Relación 1.43
182 182
0.90 1.81
182
1.94
182
2.68
184 184
1.49 2.52
Temp.
185
Relación 3.00
186 188
1.87 3.08
a. Construya gráficas de tallo y hojas tanto de la relación
de temperatura como la relación de eficiencia y comente características interesantes.
b. ¿Está el valor de la relación de eficiencia determinado
por completo y de forma única por la temperatura del
tanque? Explique su razonamiento.
c. Construya una gráfica de puntos de los datos. ¿Parece que
la relación de eficiencia podría ser pronosticada muy bien
por el valor de la temperatura? Explique su razonamiento.
2. El artículo “Exhaust Emissions from Four-Stroke Lawn Mower Engines” (J. of the Air and Water Mgmnt. Assoc., 1997:
945-952) reportó datos de un estudio en el cual se utilizó una
mezcla de gasolina básica y una gasolina reformulada. Considere las siguientes observaciones sobre antigüedad (años)
y emisiones de NOx (g/kWh):
Motor
Antigüedad
Básica
Reformulada
1
0
1.72
1.88
2
0
4.38
5.93
3
2
4.06
5.54
4
11
1.26
2.67
5
7
5.31
6.53
Motor
Antigüedad
Básica
Reformulada
6
16
0.57
0.74
7
9
3.37
4.94
8
0
3.44
4.89
9
12
0.74
0.69
10
4
1.24
1.42
Construya gráficas de puntos de emisiones de NOx contra
antigüedad. ¿Cuál parece ser la naturaleza de la relación entre estas dos variables? [Nota: Los autores del artículo citado comentaron sobre la relación.]
3. A menudo surgen datos bivariantes cuando se utilizan dos
técnicas diferentes de medir la misma cantidad. Como
ejemplo, las observaciones adjuntas de x concentración
de hidrógeno (ppm) por medio de un método de cromatografía de gases y y concentración mediante un nuevo método de sensor se leyeron en una gráfica que aparece en el
artículo “A New Method to Measure the Diffusible Hydrogen Content in Steel Weldments Using a Polymer Electrolyte-Based Hydrogen Sensor” (Welding Res., julio de 1997:
251s-256s).
x
47
62
65
70
70
78
95
100 114 118
y
38
62
53
67
84
79
93
106 117 116
x
124 127 140 140 140 150 152 164 198 221
y
127 114 134 139 142 170 149 154 200 215
Construya una gráfica de puntos. ¿Parece haber una fuerte
relación entre los dos tipos de mediciones de concentración?
¿Parece que los métodos miden aproximadamente la misma
cantidad? Explique su razonamiento.
4. Un estudio para valorar la capacidad de sistemas de humedecimiento de suelos mediante flujo subsuperficial para eliminar la demanda de oxígeno bioquímico (BOD, por sus
siglas en inglés) y varios otros constituyentes químicos dio
los datos adjuntos sobre x carga masiva de BOD (kg/ha/d)
y y eliminación masiva de BOD (kg/ha/d) (“Subsurface
Flow Wetlands-A Performance Evaluation”, Water Envir.
Res., 1995. 244-247).
x
3 8 10 11 13 16 27 30 35 37 38 44 103 142
y
4 7
8
8 10 11 16 26 21
9 31 30
75 90
a. Construya gráficas de caja tanto de carga masiva como
de eliminación masiva y comente sobre cualquier característica interesante.
b. Construya una gráfica de puntos de los datos y comente
sobre cualquier característica importante.
5. El artículo “Objective Measurement of the Stretchability of
Mozzarella Cheese” (J. of Texture Studies, 1992: 185-194)
reportó sobre un experimento para investigar la variación
del comportamiento del queso mozzarella con la temperatura. Considere los datos adjuntos sobre x temperatura
y y alargamiento (%) en el momento de la falla del queso. [Nota: Los investigadores eran italianos y utilizaron queso
mozzarella real, no el pobre primo ampliamente disponible
en Estados Unidos.]
x
59
63
68
72
74
78
83
y
118
182
247
208
197
135
132
a. Construya una gráfica de puntos en la cual los ejes se
corten en (0, 0). Marque 0, 20, 40, 60, 80 y 100 en el eje
horizontal y 0, 50, 100, 150, 200 y 250 en el eje vertical.
b. Construya una gráfica de puntos en la cual los ejes se
corten en (55, 100), como se hizo en el citado artículo.
¿Parece ser preferible esta gráfica a la del inciso a)? Explique su razonamiento.
c. ¿Qué sugieren las gráficas de los incisos a) y b) sobre la
naturaleza de la relación entre las dos variables?
6. Un factor en la presencia del codo de tenista, una dolencia
que provoca terror en el corazón de todos los verdaderos tenistas, es la vibración inducida por el impacto del sistema
raqueta y brazo al contacto con la pelota. Es bien sabido que
la probabilidad de sufrir de codo de tenista depende de
www.FreeLibros.me
c12_p446-499.qxd
454
3/12/08
CAPÍTULO 12
4:30 AM
Page 454
Regresión lineal simple y correlación
varias propiedades de la raqueta utilizada. Considere la gráfica de puntos de x frecuencia de resonancia de la raqueta (Hz) y y suma de la aceleración pico a pico (una
característica de la vibración del brazo, en m/s/s) de n 23
raquetas diferentes (“Transfer of Tennis Racket Vibrations
into the Human Forearm”, Medicine and Science in Sports
and Exercise, 1992: 1134-1140). Discuta características interesantes de los datos y la gráfica de puntos.
y
38
36
34
32
30
28
26
24
22
100 110 120 130 140 150 160 170 180 190
x
7. El artículo “Some Field Experience in the Use of an Accelerated Method in Estimating 28-Day Strength of Concrete”
(J. Amer. Concrete Institute, 1969: 895) consideró regresar y resistencia estándar después de 28 días de curado
(lb/pulg2) contra x resistencia acelerada (lb/pulg2). Suponga que la ecuación de la línea de regresión verdadera es
y 1800 1.3x.
a. ¿Cuál es el valor esperado de la resistencia después de
28 días cuando la resistencia acelerada 2500?
b. ¿Cuánto se debe esperar que cambie la resistencia después de 28 días cuando la resistencia acelerada se incrementa en una lb/pulg2?
c. Responda el inciso b) para un incremento de 100 lb/pulg2.
d. Responda el inciso b) para una reducción de 100
lb/pulg2.
8. Recurriendo al ejercicio 7, suponga que la desviación estándar de la desviación aleatoria es de 350 lb/pulg2.
a. ¿Cuál es la probabilidad de que el valor observado de la
resistencia después de 28 días excederá de 5000 lb/pulg2
cuando el valor de la resistencia acelerada es de 2000?
b. Repita el inciso a) con 2500 en lugar de 2000.
c. Considere hacer dos observaciones diferentes de resistencia después de 28 días, la primera con una resistencia
acelerada de 2000 y la segunda con x 2500. ¿Cuál es
la probabilidad de que la segunda observación excederá la
primera por más de 1000 lb/pulg2?
d. Sean Y1 y Y2 las observaciones de resistencia después de 28
días cuando x x1 y x x2, respectivamente. ¿Por cuánto tendría que exceder x2 a x1 para que P(Y2 Y1) 0.95?
9. La velocidad de flujo y (m3/min) en un dispositivo utilizado
para medir la calidad del aire depende de la caída de presión
x (pulg. de agua) a través del filtro del dispositivo. Suponga
que con valores de x entre 5 y 20, las dos variables están relacionadas de acuerdo con el modelo de regresión lineal simple con línea de regresión verdadera y 0.12 0.095x.
a. ¿Cuál es el cambio esperado de la velocidad de flujo
asociado con un incremento de una pulg en la caída de
presión? Explique.
b. ¿Qué cambio de la velocidad de flujo se puede esperar
cuando la caída de presión se reduce en cinco pulg?
c. ¿Cuál es la velocidad de flujo esperada con una caída de
presión de 10 pulg? ¿Una caída de presión de 15 pulg?
d. Suponga 0.025 y considere una caída de presión de
10 pulg. ¿Cuál es la probabilidad de que el valor observado de la velocidad de flujo excederá de 0.835?, ¿que
la velocidad de flujo observada excederá de 0.840?
e. ¿Cuál es la probabilidad de que una observación de la
velocidad de flujo cuando la caída de presión es de 10
pulg excederá una observación de la velocidad de flujo
cuando la caída de presión es de 11 pulg?
10. Suponga que el costo esperado de una serie de producción
está relacionado con el tamaño de la serie por conducto de la
ecuación y 4000 10x. Sea Y una observación sobre el
costo de una serie. Si el tamaño de las variables y el costo están relacionados de acuerdo con el modelo de regresión lineal
simple, podría ser el caso que P(Y 5500 cuando x 100)
0.05 y P(Y 6500 cuando x 200) 0.10? Explique.
11. Suponga que en cierto proceso químico el tiempo de reacción y (h) está relacionado con la temperatura (°F) en la cámara en la cual la reacción ocurre de acuerdo con el modelo
de regresión lineal simple con la ecuación y 5.00 0.01x
y 0.075.
a. ¿Cuál es el cambio esperado del tiempo de reacción con
un incremento de un °F de la temperatura? ¿Con un incremento de 10°F de la temperatura?
b. ¿Cuál es el tiempo de reacción cuando la temperatura es
de 200°F? ¿Cuando la temperatura es de 250°F?
c. Suponga que se realizan cinco observaciones independientemente del tiempo de reacción, cada una para una
temperatura de 250°F. ¿Cuál es la probabilidad de que
las cinco observaciones resulten entre 2.4 y 2.6 h?
d. ¿Cuál es la probabilidad de que dos tiempos de reacción
independientemente observados a temperaturas con 1°
de diferencia son tales que el tiempo a la temperatura
más alta excede el tiempo a la temperatura más baja?
12.2 Estimación de parámetros de modelo
Se supondrá en ésta y en las siguientes secciones que las variables x y y están relacionadas
de acuerdo con el modelo de regresión lineal simple. Un investigador casi nunca conocerá
los valores de 0, 1 y 2. En cambio, estará disponible una muestra de datos compuesta de n
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:30 AM
Page 455
12.2 Estimación de parámetros de modelo
455
pares observados (x1, y1), . . . , (xn, yn), con la cual los parámetros de modelo y la línea
de regresión verdadera pueden ser estimados. Se supone que estas observaciones se obtuvieron
independientemente una de otra. Es decir, yi es el valor observado de una variable aleatoria Yi,
donde Yi 0 1xi i y las n desviaciones, 1, 2, . . . , n son variables independientes.
La independencia de Y1, Y2, . . . , Yn se desprende de la independencia de las i .
De acuerdo con el modelo, los puntos observados estarán distribuidos en torno a la
línea de regresión verdadera de una manera aleatoria. La figura 12.6 muestra una gráfica
típica de pares observados junto con dos candidatos para la línea de regresión estimada,
y a0 a1x y y b0 b1x. Intuitivamente, la línea y a0 a1x no es una estimación
razonable de la línea verdadera y 0 1x, porque si y a0 a1x fuera la línea verdadera, los puntos observados con toda seguridad habrían quedado más cerca de esta línea. La
línea y b0 b1x es una estimación más factible porque los puntos observados están dispersos más cerca de esta línea.
y
y b0 b1x
y a0 a1x
x
Figura 12.6
Dos estimaciones diferentes de la línea de regresión verdadera.
La figura 12.6 y la discusión anterior sugieren que la estimación de y 0 1x
deberá ser una línea que en cierto sentido se ajuste mejor a los puntos de los datos observados. Esto es lo que motiva el principio de los mínimos cuadrados, que puede ubicarse hasta el matemático alemán Gauss (1777-1855). De acuerdo con este principio, una línea
proporciona un buen ajuste para los datos si las distancias verticales (desviaciones) de los
puntos observados a la línea son pequeñas (véase la figura 12.7). La medida de la bondad
del ajuste es la suma de los cuadrados de estas desviaciones. La línea de mejor ajuste es entonces la que tiene la suma más pequeña posible de desviaciones al cuadrado.
Principio de los mínimos cuadrados.
La desviación vertical del punto (xi, yi) con respecto a la línea y b0 b1x es
la altura del punto altura de la línea yi (b0 b1xi)
La suma de las desviaciones verticales al cuadrado de los puntos (x1, y1), . . . , (xn, yn)
a la línea es entonces
n
f(b0, b1) [yi (b0 b1xi)]2
i=1
Las estimaciones puntuales de 0 y 1, denotadas por ˆ 0 y ˆ 1 llamadas estimaciones
de mínimos cuadrados, son aquellos valores que reducen al mínimo a f(b0, b1). Es
decir, ˆ 0 y ˆ 1 son tales que f(ˆ 0, ˆ 1) f(b0, b1) con cualesquier b0 y b1. La línea de
regresión estimada o línea de mínimos cuadrados es entonces la línea cuya ecuación es y ˆ 0 ˆ 1x.
www.FreeLibros.me
456
3/12/08
CAPÍTULO 12
4:30 AM
Page 456
Regresión lineal simple y correlación
y
Tiempo hasta la falla (hr)
c12_p446-499.qxd
80
y b0 b1x
60
40
20
x
10
20
30
40
Esfuerzo aplicado (kg/mm2)
Figura 12.7
Desviaciones de los datos observados con respecto a la línea y b0 b1x.
Los valores minimizantes de b0 y b1 se encuentran tomando las derivadas parciales de
f(b0, b1) con respecto tanto a b0 como b1, igualándolas a cero [análogamente a f(b) 0 en
cálculo univariante] y resolviendo las ecuaciones
,f(b0, b1)
2(yi b0 b1xi)( 1) 0
,b0
,f(b0, b1)
2(yi b0 b1xi)( xi) 0
,b1
La cancelación del factor 2 y reordenando se obtiene el siguiente sistema de ecuaciones,
llamado ecuaciones normales.
nb0 ( xi )b1 yi
( xi )b0 ( x2i )b1 xi yi
Las ecuaciones normales son lineales en las dos incógnitas b0 y b1. Siempre que por lo menos dos de las xi sean diferentes, las estimaciones de los mínimos cuadrados son la única solución de este sistema.
La estimación de los mínimos cuadrados del coeficiente de pendiente 1 de la línea
de regresión verdadera es
(xi x)(yi y) Sxy
b1 ˆ 1
Sxx
(xi x)2
(12.2)
Las fórmulas de cálculo para el numerador y denominador de ˆ 1 son
Sxy xiyi ( xi)( yi)/n
Sxx x2i ( xi )2/n
La estimación de los mínimos cuadrados de la intersección 0 de la línea de regresión
verdadera es
b0 ˆ 0
yi ˆ 1 xi
n
y ˆ 1x
(12.3)
Las fórmulas de cómputo para Sxy y Sxx requieren sólo los estadísticos resumidos xi, yi,
x2i, xiyi (y2i se requerirá en breve) y reducir al mínimo los efectos de redondeo. Al
calcular ˆ 0 se utilizan dígitos adicionales en ˆ 1 porque, si x es grande en magnitud, el
redondeo afectará la respuesta final. Se hace hincapié en que antes de calcular ˆ 1 y ˆ 0 se
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:30 AM
Page 457
12.2 Estimación de parámetros de modelo
457
deberá examinar una gráfica para ver si un modelo probabilístico lineal es factible. Si los puntos no tienden a aglomerarse en torno a una línea recta con aproximadamente el mismo grado
de dispersión de todas las x, se deberán investigar otros modelos. En la práctica, las gráficas y cálculos de regresión normalmente se realizan con un programa de cómputo estadístico.
Ejemplo 12.4
El concreto sin finos, hecho de un agregado grueso uniformemente graduado y una pasta de
cemento y agua, es benéfico en áreas propensas a lluvias intensas debido a sus excelentes
propiedades de drenaje. El artículo “Pavement Thickness Design for No-Fines Concrete
Parking Lots” (J. of Transportation Engr., 1995: 476-484) empleó un análisis de mínimos
cuadrados al estudiar cómo y porosidad (%) está relacionada con x peso unitario (pcf)
en especímenes de concreto. Considere los siguientes datos representativos, mostrados en
formato tabular conveniente para calcular los valores de los estadísticos resumidos:
x2
xy
y2
Obs
x
y
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
99.0
101.1
102.7
103.0
105.4
107.0
108.7
110.8
112.1
112.4
113.6
113.8
115.1
115.4
120.0
28.8
27.9
27.0
25.2
22.8
21.5
20.9
19.6
17.1
18.9
16.0
16.7
13.0
13.6
10.8
9 801.00
10 221.21
10 547.29
10 609.00
11 109.16
11 449.00
11 815.69
12 276.64
12 566.41
12 633.76
12 904.96
12 950.44
13 248.01
13 317.16
14 400.00
2851.20
2820.69
2772.90
2595.60
2403.12
2300.50
2271.83
2171.68
1916.91
2124.36
1817.60
1900.46
1496.30
1569.44
1296.00
829.44
778.41
729.00
635.04
519.84
462.25
436.81
384.16
292.41
357.21
256.00
278.89
169.00
184.96
116.64
Suma
1640.1
299.8
179 849.73
32 308.59
6430.06
Por lo tanto x 109.34, y 19.986667 y
S
32 308.59 (1640.1)(299.8)/15
ˆ 1 xy
Sxx
179 849.73 (1640.1)2/15
471.542
0.90473066 0.905
521.196
ˆ 0 19.986667 ( 0.90473066)(109.34) 118.909917 118.91
Se estima que el cambio de porosidad esperado asociado con un incremento de un pcf en el
peso unitario es de 0.905% (una reducción de 0.905%). La ecuación de la línea de regresión estimada (línea de mínimos cuadrados) es entonces y 118.91 0.905x. La figura
12.8 generada por el programa estadístico S-Plus, muestra que la línea de mínimos cuadrados proporciona un excelente resumen de la relación entre las dos variables.
www.FreeLibros.me
c12_p446-499.qxd
CAPÍTULO 12
4:30 AM
Page 458
Regresión lineal simple y correlación
Porosidad
458
3/12/08
Peso unitario
Figura 12.8 Gráfica de puntos de los datos del ejemplo 12.4 con la línea de cuadrados
mínimos superpuesta, obtenida con S-Plus.
■
La línea de regresión estimada puede ser utilizada de inmediato para dos propósitos
diferentes. Con un valor fijo de x, x*, ˆ 0 ˆ 1x* (la altura de la línea sobre x*) da 1) una estimación puntual del valor esperado de Y cuando x x* o 2) una predicción puntual del valor Y que dará por resultado una nueva observación realizada con x x*.
Ejemplo 12.5
Remítase a los datos de peso unitario-porosidad dados en el ejemplo anterior. Una estimación puntual de la porosidad promedio verdadera de todos los especímenes cuyo peso unitario es 110 es
ˆ Y110 ˆ 0 ˆ 1(110) 118.91 0.905(110) 19.4%
Si se tiene que seleccionar un solo espécimen cuyo peso unitario es de 110 pcf, 19.4% también es una predicción puntual de la porosidad de este espécimen.
■
La línea de mínimos cuadrados no deberá ser utilizada para predecir un valor de x mucho más allá del rango de los datos, como x 90 o x 135 en el ejemplo 12.4. El peligro
de extrapolación es que la relación ajustada (una línea en este caso) puede no ser válida
con tales valores de x. (En el ejemplo precedente, x 135 da ŷ 3.3, un valor obviamente ridículo de porosidad, pero la extrapolación no siempre dará por resultado semejantes inconsistencias.)
Estimación de 2 y
El parámetro 2 determina la cantidad de variabilidad, inherente en el modelo de regresión.
Un valor grande de 2 conducirá a (xi, yi) observados que están bastante dispersos en torno
a la línea de regresión verdadera, mientras que 2 sea pequeña los puntos observados tenderán a quedar cerca de la línea verdadera (véase la figura 12.9). Se utilizará una estimación
de 2 en fórmulas de intervalos de confianza (IC) y procedimientos de prueba de hipótesis
presentados en las dos secciones siguientes. Como la ecuación de la línea verdadera es desconocida, la estimación se basa en el grado al cual las observaciones muestrales se desvían
de la línea estimada. Muchas desviaciones grandes (residuos) sugieren un valor grande de
2, mientras que las desviaciones de pequeña magnitud sugieren que 2 es pequeña.
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:30 AM
Page 459
12.2 Estimación de parámetros de modelo
459
y Ventas de producto
y Alargamiento
0 1x
0 1x
x Fuerza de tensión
x Gastos de publicidad
a)
b)
Figura 12.9
DEFINICIÓN
Muestra típica con 2: a) pequeña; b) grande.
Los valores ajustados (o pronosticados) ŷ1, ŷ2, . . . , ŷn se obtienen sustituyendo sucesivamente x1, . . . , xn en la ecuación de la línea de regresión estimada ŷ1 ˆ 0
ˆ
1x1, ŷ2 ˆ 0 ˆ 1x2, . . . , ŷn ˆ 0 ˆ 1xn. Los residuos son las desviaciones verticales y1 ŷ1, y2 ŷ2, . . . , yn ŷn con respecto a la línea estimada.
En palabras, el valor pronosticado ŷi es el valor de y pronosticado o esperado cuando se utiliza la línea de regresión estimada con x xi; ŷi es la altura de la línea de regresión estimada por encima del valor xi con el cual se realizó la i-ésima observación. El residuo yi ŷi es
la diferencia entre la yi observada y la ŷi pronosticada. Si todos los residuos son pequeños,
entonces mucha de la variabilidad en los valores y observados parece deberse a la relación
lineal entre x y y, mientras que muchos residuos grandes sugieren un poco de variabilidad
inherente en y con respecto a la cantidad debida a la relación lineal. Suponiendo que la línea
en la figura 12.7 es la línea de mínimos cuadrados, los residuos están identificados por segmentos de línea verticales que parten de los puntos observados a la línea. Cuando se obtiene
la línea de regresión estimada vía el principio de mínimos cuadrados, la suma de los residuos
en teoría debe ser de cero. En la práctica, la suma puede desviarse un poco de cero debido al
redondeo.
Ejemplo 12.6
La alta densidad de población de Japón ha provocado un sinnúmero de problemas de consumo de recursos. Una dificultad especialmente seria tiene que ver con la eliminación de desechos. El artículo “Innovative Sludge Handling Through Pelletization Thickening” (Water
Research, 1999: 3245-3252) reportó la intervención de una nueva máquina de compresión
para procesar lodos de albañal. Una parte importante de la investigación implicó relacionar
el contenido de humedad de gránulos comprimidos (y, en %) con la velocidad de filtración
de la máquina (x, en kg-DS/m/h). Los siguientes datos se tomaron de una gráfica incluida
en el artículo:
x
125.3
98.2
201.4
147.3
145.9
124.7
112.2
120.2
161.2
178.9
y
77.9
76.8
81.5
79.8
78.2
78.3
77.5
77.0
80.1
80.2
x
159.5
145.8
75.1
151.4
144.2
125.0
198.8
132.5
159.6
110.7
y
79.9
79.0
76.7
78.2
79.5
78.1
81.5
77.0
79.0
78.6
www.FreeLibros.me
c12_p446-499.qxd
460
3/12/08
CAPÍTULO 12
4:30 AM
Page 460
Regresión lineal simple y correlación
Las cantidades resumidas pertinentes (estadísticos resumidos) son xi 2817.9, yi
1574.8, x2i 415 949.85, xiyi 222 657.88 y y2i 124 039.58, de donde x 140.895,
y 78.74, Sxx 18 921.8295 y Sxy 776.434. Por lo tanto
776.434
ˆ 1
0.04103377 0.041
18 921.8295
ˆ 0 78.74 (0.04103377)(140.895) 72.958547 72.96
por lo que la ecuación de la línea de mínimos cuadrados es ŷ 72.96 0.041x. Para precisión numérica, los valores ajustados se calcularon con ŷi 72.958547 0.04103377xi:
ŷ1 72.958547 0.04103377(125.3) 78.100, y1 ŷ1
0.200, etcétera.
Un residuo positivo corresponde a un punto en la gráfica de puntos que queda sobre la línea de
mínimos cuadrados, en tanto que un residuo negativo resulta de un punto localizado debajo
de la línea. Todos los valores pronosticados (ajustes) y residuos aparecen en la tabla adjunta.
Obs
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Filtrado
Contenido en húmedo
Ajuste
Residuo
125.3
98.2
201.4
147.3
145.9
124.7
112.2
120.2
161.2
178.9
159.5
145.8
75.1
151.4
144.2
125.0
198.8
132.5
159.6
110.7
77.9
76.8
81.5
79.8
78.2
78.3
77.5
77.0
80.1
80.2
79.9
79.0
76.7
78.2
79.5
78.1
81.5
77.0
79.0
78.6
78.100
76.988
81.223
79.003
78.945
78.075
77.563
77.891
79.573
80.299
79.503
78.941
76.040
79.171
78.876
78.088
81.116
78.396
79.508
77.501
0.200
0.188
0.277
0.797
0.745
0.225
0.063
0.891
0.527
0.099
0.397
0.059
0.660
0.971
0.624
0.012
0.384
1.396
0.508
1.099
■
Casi de la misma forma en que las desviaciones de la media en una situación de una
muestra se combinaron para obtener la estimación s2 (xi x)2/(n 1), la estimación de
2 en un análisis de regresión se basa en elevar al cuadrado y sumar los residuos. Se continuará utilizando el símbolo s2 para esta varianza estimada, así que no hay que confundirla
con la s2 previa.
DEFINICIÓN
La suma de cuadrados del error (o de forma equivalente, suma de cuadrados residuales) denotada por SCE, es
SCE (yi ŷi)2 [yi ( ˆ 0 ˆ 1xi)]2
y la estimación de 2 es
ˆ 2 s2
SCE
n2
www.FreeLibros.me
(yi ŷi)2
n2
c12_p446-499.qxd
3/12/08
4:30 AM
Page 461
12.2 Estimación de parámetros de modelo
461
El divisor n 2 en s2 es el número de grados de libertad (gl) asociado con la estimación (o,
en forma equivalente, con la suma de cuadrados del error). Esto es porque para obtener s2, primero se deben estimar los parámetros 0 y 1, lo que hace que se pierdan 2 grados de libertad
(exactamente como hubo de ser estimada en problemas de una muestra, con el resultado
de una varianza estimada basada en n 1 grados de libertad). Reemplazando cada yi en la
fórmula para s2 con la variable aleatoria Yi se obtiene el estimador S2. Se puede demostrar que
S2 es un estimador insesgado de 2 (aunque el estimador S no es insesgado para ).
Ejemplo 12.7
(continuación
del ejemplo
12.6)
Previamente se calcularon los residuos de los datos de contenido de humedad-velocidad de
filtración. La suma de cuadrados del error correspondiente es
SCE ( 0.200)2 ( 0.188)2 . . . (1.099)2 7.968
La estimación de 2 es entonces ˆ 2 s2 7.968/(20 2) 0.4427 y la desviación estándar estimada es ˆ s 0
.4427 0.665. De manera aproximada, 0.665 es la magnitud
de una desviación típica con respecto a la línea de regresión estimada.
■
El cálculo de SCE con la fórmula definitoria implica mucha aritmética tediosa porque
primero se deben calcular los valores pronosticados y residuos. La siguiente fórmula de
cómputo no requiere estas cantidades.
SCE y2i ˆ 0 yi ˆ 1 xi yi
Esta expresión se obtiene al sustituir ŷi ˆ 0 ˆ 1xi en (yi ŷi)2, elevar al cuadrado el
sumando, realizar la suma y continuarla hasta los tres términos resultantes y simplificar. La
fórmula de cálculo es especialmente sensible a los efectos de redondeo en ˆ 0 y ˆ 1, así que
conservar tantos dígitos como sea posible en cálculos intermedios protegerá contra errores
de redondeo.
Ejemplo 12.8
El artículo “Promising Quantitative Nondestructive Evaluation Techniques for Composite
Materials” (Materials Evaluation, 1985: 561-565) reporta sobre un estudio para investigar
cómo la propagación de una onda de esfuerzo ultrasónica a través de una sustancia depende de las propiedades de ésta. Los datos adjuntos sobre resistencia a la fractura (x, como porcentaje de resistencia a la tensión última) y atenuación (y, en neper/cm, la disminución de
la amplitud de la onda de esfuerzo) en compuestos de poliéster reforzados con fibra de vidrio se tomaron de una gráfica que aparece en el artículo. El patrón lineal sustancial que
aparece en la gráfica de puntos sugiere el modelo de regresión lineal simple.
x
12
30
36
40
45
57
62
67
71
78
93
94
100
105
y
3.3
3.2
3.4
3.0
2.8
2.9
2.7
2.6
2.5
2.6
2.2
2.0
2.3
2.1
Las cantidades resumidas necesarias son n 14, x i 890, x 2i 67 182,
yi 37.6, y2i 103.54 y xiyi 2234.30, de donde Sxx 10 603.4285714, Sxy
155.98571429, ˆ 1 0.0147109 y ˆ 0 3.6209072. La fórmula de cálculo para SCE da
SCE 103.54 (3.6209072)(37.6) ( 0.0147109)(2234.30)
0.2624532
www.FreeLibros.me
c12_p446-499.qxd
462
3/12/08
CAPÍTULO 12
4:30 AM
Page 462
Regresión lineal simple y correlación
por lo tanto s2 0.2624532/12 0.0218711 y s 0.1479. Cuando ˆ 0 y ˆ 1 se redondean a
tres cifras decimales en la fórmula de cálculo para SCE, el resultado es
SCE 103.54 (3.621)(37.6) ( 0.015)(2234.30) 0.905
■
la cual es más de tres veces el valor correcto.
Coeficiente de determinación
La figura 12.10 muestra tres gráficas de puntos diferentes de datos bivariantes. En las tres
gráficas, las alturas de los distintos puntos varían sustancialmente, lo que indica que existe
mucha variabilidad en los valores y observados. Todos los puntos en la primera gráfica quedan exactamente en una línea recta. En este caso, toda la variación (100%) de y puede ser
atribuida al hecho de que x y y están linealmente relacionadas en combinación con la variación de x. Los puntos en la figura 12.10b) no quedan exactamente en una línea, pero su
variabilidad se compara a la variabilidad total de y, las desviaciones con respecto a la línea
de cuadrados mínimos son pequeñas. Es razonable concluir en este caso que una gran parte de la variación de y observada puede ser atribuida a la relación lineal aproximada entre
las variables postuladas por el modelo de regresión lineal simple. Cuando la gráfica de puntos es como la de la figura 12.10c), existe una variación sustancial en torno a la línea de mínimos cuadrados con respecto a la variación total de y, así que el modelo de regresión simple
no explica la variación de y relacionando y con x.
y
y
y
x
a)
x
b)
x
c)
Figura 12.10 Utilización del modelo para explicar la variación de y : a) datos con los cuales toda la
variación es explicada; b) datos con los cuales la mayor parte de la variación es explicada; c) datos con
los cuales poca variación es explicada.
La suma de cuadrados SCE del error puede ser interpretada como una medida de
cuánta variación de y permanece sin ser explicada por el modelo, es decir, cuánta no puede
ser atribuida a una relación lineal. En la figura 12.10a), SCE 0, y no existe ninguna variación no explicada, en tanto ésta sea pequeña con los datos de la figura 12.10b) y mucho
más grande en la figura 12.10c). La suma total de los cuadrados da una medida cuantitativa de la cantidad de variación total en los valores y observados
STC Syy (yi y)2 y2i ( yi)2/n
La suma total de los cuadrados es la suma de las desviaciones al cuadrado con respecto a la media muestral de los valores y observados. Por consiguiente, se resta el mismo número y de cada yi presente en STC, mientras que SCE implica restar cada valor diferente
pronosticado ŷi de la yi correspondiente observada. Así como SCE es la suma de desviaciones al cuadrado con respecto a la línea de cuadrados mínimos y ˆ 0 ˆ 1x, STC es la
suma de desviaciones al cuadrado con respecto a la línea horizontal a la altura y (en tal caso
las desviaciones verticales son yi y), como se ilustra en la figura 12.11. Además, como la
suma de desviaciones al cuadrado con respecto a la línea de mínimos cuadrados es más
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:30 AM
Page 463
12.2 Estimación de parámetros de modelo
463
y
y
Línea horizontal a la altura y
Línea de mínimos cuadrados
y
x
x
a)
b)
Figura 12.11 Sumas de cuadrados ilustradas: a) SCE suma de desviaciones cuadráticas en torno
a la línea de mínimos cuadrados; b) STC suma de desviaciones al cuadrado en torno a la línea
horizontal.
pequeña que la suma de desviaciones al cuadrado con respecto a cualquier otra línea. SCE
STC a menos que la recta horizontal sea la recta de mínimos cuadrados. La razón
SCE/STC es la proporción de variación total que no puede ser explicada por el modelo de
regresión lineal simple y 1 SCE/STC (un número entre 0 y 1) es la proporción de variación de y observada y explicada por el modelo.
DEFINICIÓN
El coeficiente de determinación, denotado por r2, está dado por
r2 1
SCE
STC
Se interpreta como la proporción de variación y observada que puede ser explicada
por el modelo de regresión lineal simple (atribuida a una relación lineal aproximada
entre y y x).
Mientras más alto es el valor de r2, más exitoso es el modelo de regresión lineal simple
al explicar la variación de y. Cuando se realiza un análisis de regresión mediante un programa
de cómputo estadístico, r2 o 100r2 (el porcentaje de variación explicado por el modelo) es una
parte prominente de los resultados. Si r2 es pequeño, un analista normalmente deseará buscar
un modelo alternativo (como un modelo no lineal o un modelo de regresión múltiple que implique más de una sola variable independiente) que explique con más eficacia la variación de y.
Ejemplo 12.9
(continuación
del ejemplo
12.4)
La gráfica de puntos de los datos de concreto sin finos que aparece en la figura 12.8 ciertamente pretende un valor de r2 muy alto. Con
ˆ 0 118.909917
ˆ 1 0.90473066
xiyi 32 308.59
y2i
yi 299.8
6430.06
se tiene
STC 6430.06
299.82
438.057333 438.06
15
SCE 6430.06 (118.909917)(299.8) ( 0.90473066)(32 308.59)
11.4388 11.44
El coeficiente de determinación es entonces
r2 1
11.44
1 0.026 0.974
438.06
www.FreeLibros.me
Page 464
Regresión lineal simple y correlación
Esto es, 97.4% de la variación de la porosidad observada es atribuible a (puede ser explicada
por) la relación lineal aproximada entre la porosidad y el peso unitario, un resultado muy impresionante. (¡Muchos científicos sociales morirían por un valor de r2 muy por encima de 0.5!)
La figura 12.12 muestra resultados parciales generados por MINITAB con los datos
de porosidad-peso unitario de los ejemplos 12.4 y 12.9; el programa también proporciona
los valores y residuos pronosticados si se los solicita, así como también otra información.
Los formatos utilizados por otros programas difieren un poco de los de MINITAB, pero
el contenido de la información es muy similar. En la sección 12.3 se discuten cantidades
tales como las desviaciones estándar, relaciones t y la tabla ANOVA.
The regression equation is
porosity 119 0.905 unitwt
ˆ0
ˆ1
Predictor
Coef
t-ratio
±Stdev
Constant
118.910 ±± 4.499
26.43
unitwt
0.90473 @ 0.04109
22.02
100r 2
s 0.9380
R-sq 97.4% @±
R-sq(adj) 97.2%
Analysis of Variance
SOURCE
Regression
Error
Total
Figura 12.12
DF
1
13
14
p
0.000
0.000
SCE
@
±
±
±
±
CAPÍTULO 12
4:30 AM
±
464
3/12/08
@
c12_p446-499.qxd
SS
MS
F
426.62
426.62
484.84
11.44
0.88
438.06 @±±±±±±± STC
p
0.000
Resultados obtenidos con MINITAB para la regresión de los ejemplos 12.4 y 12.9.
■
El coeficiente de determinación se escribe en una forma un poco diferente al introducir una tercera suma de cuadrados, suma de cuadrados debido a la regresión, SCR–dada
por SCR STC SCE. La suma de cuadrados debido a la regresión se interpreta como la
cantidad de variación total que es explicada por el modelo. En tal caso se tiene
r 2 1 SCE/STC (STC SCE)/STC SCR/STC
la relación de la variación explicada a la variación total. La tabla ANOVA que aparece en la
figura 12.12 muestra que SCR 426.62 de donde r2 426.62/438.06 0.974.
Terminología y alcance del análisis de regresión
El término análisis de regresión lo introdujo por primera vez Francis Galton a finales del siglo XIX en conexión con su trabajo sobre la relación entre la estatura del padre x y la estatura del hijo y. Después de recopilar varios pares (xi, yi), Galton utilizó el principio de
mínimos cuadrados para obtener la ecuación de la línea de regresión estimada con el objetivo de utilizarla para predecir la estatura del hijo a partir de la estatura del padre. Al utilizar la línea derivada, Galton encontró que si la estatura del padre era por encima del
promedio, era de esperarse que la estatura del hijo también fuera por encima del promedio,
pero no tanto como el padre. Asimismo, el hijo de un padre con una estatura más corta que
el promedio también tendría una estatura más corta que el promedio, pero no tanto como el
padre. Por lo tanto, la estatura pronosticada de un hijo era “llevada de vuelta” hacia la media; porque regresión significa una ida o venida. Galton adoptó la terminología línea de regresión. Este fenómeno de ser llevado de vuelta hacia la media ha sido observado en muchas
otras situaciones (p. ej., promedios de bateo de un año al otro en el béisbol) y se llama efecto de regresión.
La discusión hasta ahora ha supuesto que la variable independiente está bajo el
control del investigador, así que sólo la variable dependiente Y es aleatoria. Este no fue,
sin embargo, el caso con el experimento de Galton: las estaturas de los padres no fueron
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:30 AM
Page 465
465
12.2 Estimación de parámetros de modelo
preseleccionadas, sino que en su lugar tanto X como Y fueron aleatorias. Se pueden aplicar
métodos y conclusiones de análisis de regresión tanto cuando los valores de la variable independiente se fijan de antemano y cuando son aleatorios, pero como las derivaciones e
interpretaciones son más directas en el primer caso, se continuará trabajando explícitamente con él. Para más comentarios, véase el excelente libro de John Neter y colaboradores,
citado en la bibliografía del capítulo.
EJERCICIOS
Sección 12.2 (12-29)
12. El ejercicio cuatro dio datos sobre carga masiva de x
BOD y eliminación masiva de y BOD. Valores de cantidades resumidas pertinentes son
xi 517
yi 346
x2i 39 095
2
yi 17 454
xiyi 25 825
n 14
a. Obtenga una ecuación de la línea de mínimos cuadrados.
b. Pronostique el valor de la eliminación masiva de BOD
de una sola observación realizada cuando la carga masiva de BOD es de 35, y calcule el valor del residuo correspondiente.
c. Calcule SCE y luego una estimación puntual de .
d. ¿Qué proporción de la variación observada de la eliminación puede ser explicada por la relación lineal aproximada entre las dos variables?
e. Los últimos dos valores de x, 103 y 142, son mucho más
grandes que los demás. ¿Cómo se ven afectados la ecuación de la línea de mínimos cuadrados y el valor de r2
por la supresión de las dos observaciones correspondientes de la muestra? Ajuste los valores dados de las
cantidades resumidas y use el hecho de que el nuevo valor de SCE es 311.79.
13. Los datos adjuntos sobre x densidad de corriente
(mA/cm2) y y tasa de deposición ( m/min) aparecieron
en el artículo “Plating of 60/40 Tin/Lead Solder for Head
Termination Metallurgy” (Plating and Surface Finishing, enero de 1997: 38-40). ¿Está de acuerdo con la afirmación del
autor del artículo de que “se obtuvo una relación lineal a partir de la tasa de deposición de estaño-plomo como una función
de la densidad de corriente?” Explique su razonamiento.
x
20
40
60
80
y
0.24
1.20
1.71
2.22
14. Remítase a los datos de relación de temperatura del tanqueeficiencia dada en el ejercicio uno.
a. Determine la ecuación de la línea de regresión estimada.
b. Calcule una estimación puntual de la relación eficiencia
promedio verdadera cuando la temperatura del tanque es
de 182.
c. Calcule los valores de los residuos con la línea de cuadrados mínimos de las cuatro observaciones con las cuales
la temperatura es de 182. ¿Por qué no todas tienen el mismo signo?
d. ¿Qué proporción de la variación observada en la relación de eficiencia puede ser atribuida a la relación de regresión lineal simple entre las dos variables?
15. Se determinaron valores de módulo de elasticidad (MDE, la
relación de esfuerzo, es decir, fuerza por unidad de área
a deformación por unidad de longitud, en GPa) y resistencia a la flexión (una medida de la capacidad para resistir una
falta de flexibilidad, en MPa) con una muestra de vigas de
concreto de un cierto tipo, y se obtuvieron los siguientes datos (tomados de una gráfica que aparece en el artículo “Effects of Aggregates and Microfillers on the Flexural
Properties of Concrete”, Magazine of Concrete Research,
1997: 81-98):
MDE
29.8
Resistencia 5.9
33.2
7.2
33.7 35.3 35.5 36.1 36.2
7.3 6.3 8.1 6.8 7.0
MDE
36.3
Resistencia 7.6
37.5
6.8
37.7 38.7 38.8 39.6 41.0
6.5 7.0 6.3 7.9 9.0
MDE
42.8
Resistencia 8.2
42.8
8.7
43.5 45.6 46.0 46.9 48.0
7.8 9.7 7.4 7.7 9.7
MDE
49.3
Resistencia 7.8
51.7
7.7
62.6 69.8 79.5 80.0
11.6 11.3 11.8 10.7
a. Construya una gráfica de tallo y hojas de los valores de
MDE y comente sobre cualquier característica interesante.
b. ¿En el valor de resistencia se determina completa y únicamente por el valor del MDE? Explique.
c. Use los resultados adjuntos generados por MINITAB
para obtener la ecuación de la línea de mínimos cuadrados para predecir resistencia a partir del módulo de elasticidad y luego para predecir resistencia de una viga
cuyo módulo de elasticidad es de 40. ¿Se sentiría cómodo si utiliza la línea de mínimos cuadrados para predecir resistencia cuando el módulo de elasticidad es de
100? Explique.
Predictor
Constant
mod elas
Coef
3.2925
0.10748
Stdev
0.6008
0.01280
s 0.8657
Rsq 73.8%
Rsq
t-ratio
5.48
8.40
p
0.000
0.000
(adj) 72.8%
Analysis of Variance
SOURCE
Regression
Error
Total
DF
1
25
26
SS
52.870
18.736
71.605
MS
52.870
0.749
F
70.55
p
0.000
d. ¿Cuáles son los valores de SCE, STC y el coeficiente
de determinación? ¿Sugieren estos valores que el modelo de regresión lineal simple describe de forma efectiva
la relación entre las dos variables? Explique.
www.FreeLibros.me
c12_p446-499.qxd
466
3/12/08
CAPÍTULO 12
4:30 AM
Page 466
Regresión lineal simple y correlación
16. El artículo “Characterization of Highway Runoff in Austin,
Texas, Area” (J. of Envir. Engr., 1998: 131-137) incluye
una gráfica de puntos junto con una línea de cuadrados
mínimos, de x volumen de precipitación pluvial (m3) y
y volumen de escurrimiento (m3) en un lugar particular.
Los valores adjuntos se tomaron de la gráfica.
x
5
12
14
17
23
30
40
47
y
4
10
13
15
15
25
27
46
x
55
67
72
81
96
112
127
y
38
46
53
70
82
99
100
a. ¿Apoya una gráfica de puntos de los datos el uso del modelo de regresión lineal simple?
b. Calcule estimaciones puntuales de la pendiente e intersección de la línea de regresión de la población.
c. Calcule una estimación puntual del volumen de escurrimiento promedio verdadero cuando el volumen de
precipitación pluvial es de 50.
d. Calcule una estimación puntual de la desviación estándar .
e. ¿Qué proporción de la variación observada del volumen
de escurrimiento puede ser atribuida a la relación de regresión lineal simple entre el escurrimiento y la precipitación pluvial?
17. En el artículo “Use of Fly Ash or Silica Fume to Increase the
Resistance of Concrete to Feed Acids” (Magazine of Concrete Research, 1997: 337-344) se reportó una regresión de
y contenido de calcio (g/L) en x material disuelto
(mg/cm2). La ecuación de la línea de regresión estimada fue
y 3.678 0.144x, con r2 0.860 basada en n 23.
a. Interprete la pendiente estimada 0.144 y el coeficiente
de determinación 0.860.
b. Calcule una estimación puntual del contenido de calcio
promedio verdadero cuando la cantidad de material disuelto es de 50 mg/cm2.
c. El valor de la suma total de cuadrados fue STC 320.398.
Calcule una estimación de la desviación estándar debido al error en el modelo de regresión lineal simple.
18. Los siguientes estadísticos resumidos se obtuvieron con un
estudio que utilizó análisis de regresión para investigar la
relación entre la deflexión y la temperatura superficial del
pavimento en varios lugares de una carretera estatal. He aquí
x temperatura (°F) y y factor de ajuste por deflexión
(y 0):
xi 1425 yi 10.68
x2i 139 037.25 xiyi 987.645
y2i 7.8518
n 15
(Se realizaron más de 15 observaciones en el estudio; la referencia es “Flexible Pavement Evaluation and Rehabilitation”, Transportation Eng. J., 1977: 75-85.)
a. Calcule ˆ 1, ˆ 0 y la ecuación de la línea de regresión estimada. Trace la línea estimada.
b. ¿Cuál es la estimación del cambio esperado del factor de
ajuste por deflexión cuando la temperatura se incrementa en 1°F?
c. Suponga que la temperatura se midió en °C en lugar de en
°F? ¿Cuál sería la línea de regresión estimada? Respon-
da el inciso b) para un incremento de 1°C. [Sugerencia:
°F (9/5)°C 32; ahora sustituya las “viejos valores x”
en función de los “nuevos valores x”.]
d. Si una temperatura superficial de 200°F fuera posible,
¿utilizaría la línea estimada del inciso a) a fin de predecir el factor de deflexión para esta temperatura? ¿Por
qué sí o por qué no?
19. Los siguientes datos son representativos de los reportados
en el artículo (“An Experimental Correlation of Oxides of
Nitrogen Emissions from Power Boilers Base on Field Data” (J. Eng. for Power, julio de 1973: 165-170), con x tasa de liberación debido a área de quemador (MBtu/h pie2) y
y tasa de emisión de NOX (ppm):
x
100
125
125
150
150
200
200
y
150
140
180
210
190
320
280
x
250
250
300
300
350
400
400
y
400
430
440
390
600
610
670
a. Suponiendo que el modelo de regresión lineal simple es
válido, obtenga la estimación de mínimos cuadrados de
la línea de regresión verdadera.
b. ¿Cuál es la estimación de la tasa de emisión de NOX esperada cuando la tasa de liberación debido al área del
quemador es igual a 225?
c. Estime la cantidad en la cual espera que cambie la tasa
de emisiones de NOX cuando la tasa de liberación debido al área del quemador disminuye en 50.
d. ¿Utilizaría la línea de regresión estimada para predecir
la tasa de emisión con una tasa de liberación de 500?
¿Por qué sí o por qué no?
20. Varios estudios han demostrado que los líquenes (ciertas
plantas compuestas de un alga y un hongo) son excelentes
bioindicadores de la contaminación del aire. El artículo
“The Epiphytic Lichen Hypogymnia Physodes as a Biomonitor of Atmospheric Nitrogen and Sulphur Deposition in
Norway” (Envir. Monitoring and Assessment, 1993: 27-47)
da los siguientes datos (tomados de una gráfica) sobre x
deposición de x NO3 en húmedo (g N/m2) y y N de liquen (% de peso en seco):
x
0.05
0.10
0.11
0.12
0.31
0.37
0.42
y
0.48
0.55
0.48
0.50
0.58
0.52
1.02
x
0.58
0.68
0.68
0.73
0.85
0.92
y
0.86
0.86
1.00
0.88
1.04
1.70
El autor utilizó regresión lineal simple para analizar los datos. Use los resultados obtenidos con MINITAB para responder las siguientes preguntas:
a. ¿Cuáles son las estimaciones de mínimos cuadrados de
0 y 1?
b. Pronostique el N de liquen con un valor de deposición
de NO3 de 0.5.
c. ¿Cuál es la estimación de ?
d. ¿Cuál es el valor de la variación total y cuánta de ella
puede ser explicada por la relación de modelo?
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:30 AM
Page 467
12.2 Estimación de parámetros de modelo
The regression equation is lichen
N 0.365 0.967 no3 depo
Predictor
Constant
no3 depo
Coef
0.36510
0.9668
Stdev
0.09904
0.1829
s 0.1932
R-sq 71.7%
t–ratio
3.69
5.29
p
0.004
0.000
R-sq (adj) 69.2%
Analysis of Variance
SOURCE
Regression
Error
Total
DF
1
11
12
SS
1.0427
0.4106
1.4533
MS
1.0427
0.0373
F
27.94
b. Calcule el valor de la suma total de los cuadrados. ¿Explica el modelo de regresión lineal la variación de la tasa
de emisiones? Justifique su aseveración.
24. Los datos adjuntos se tomaron de una gráfica que apareció
en el artículo “Reactions on Painted Steel Under the Influence of Sodium Chloride, and Combinations Thereof” (Ind.
Engr. Chem. Prod. Res. Dev. 1985: 375-378). La variable independiente es la tasa de deposición de SO2 (mg/m2/d) y la
variable independiente es pérdida de peso de acero (g/m2).
P
0.000
21. El ángulo de recuperación de arrugas y la resistencia a la
tensión son las dos características más importantes para evaluar el desempeño de tela de algodón entrelazada. Un incremento en el ángulo de entrelazado, determinado por la
absorbencia de una banda de éster carboxilo, mejora la resistencia a las arrugas de la tela (a expensas de la reducción de
la resistencia mecánica). Los datos adjuntos sobre x absorbencia y y resistencia al ángulo de arrugamiento se tomaron de una gráfica incluida en el artículo “Predicting the
Performance of Durable Press Finished Cotton Fabric with
Infrared Spectroscopy” (Textile Res. J., 1999: 145-151).
x 0.115 0.126 0.183 0.246 0.282 0.344 0.355 0.452 0.491 0.554 0.651
25.
y
26.
334 342 355 363 365 372 381 392 400 412 420
27.
He aquí los resultados obtenidos con MINITAB.
Predictor
Constant
absorb
Coef
321.878
156.711
S = 3.60498
SE Coef
2.483
6.464
R-Sq = 98.5%
Source
Regression
Residual Error
Total
DF
1
9
10
SS
7639.0
117.0
7756.0
T
129.64
24.24
P
0.000
0.000
R-Sq(adj) = 98.3%
MS
7639.0
13.0
F
587.81
P
0.000
28.
a. ¿Parece ser apropiado el modelo de regresión lineal simple? Explique.
b. ¿Qué ángulo de resistencia a las arrugas pronosticaría
para un espécimen de tela cuya absorbencia es de 0.300?
c. ¿Cuál sería la estimación del ángulo de resistencia a las
arrugas cuando la absorbencia es de 0.300?
22. a. Use las cantidades del ejercicio 18 para estimar la desviación estándar de la desviación aleatoria en el modelo de regresión lineal simple.
b. Basado en las cantidades del ejercicio 18, ¿qué proporción de la variación del factor de ajuste por deflexión
puede ser explicado por la relación de regresión lineal
simple entre el factor de ajuste y la temperatura?
23. a. Obtenga la SCE con los datos del ejercicio 19 a partir de
la fórmula definitoria [SCE (yi ŷi)2] y compare
con el valor calculado con la fórmula de cómputo.
467
29.
x
14
18
40
43
45
112
y
280
350
470
500
560
1200
a. Construya una gráfica de puntos. ¿Parece razonable la
regresión lineal simple en esta situación?
b. Calcule la ecuación de la línea de regresión estimada.
c. ¿Qué porcentaje de la variación observada en la pérdida de
peso del acero puede ser atribuido a la relación de modelo
en combinación con la variación de la tasa de deposición?
d. Debido a que el valor x más grande en la muestra excede en gran medida a los demás, esta observación puede
haber influido mucho al determinar la ecuación de la línea estimada. Elimine esta observación y recalcule la
ecuación. ¿Difiere la nueva ecuación sustancialmente de
la original (podría considerar valores pronosticados)?
Compruebe que b1 y b0 de las expresiones (12.2) y (12.3)
satisfacen las ecuaciones normales.
Demuestre que el “punto de promedios” ( x, y ) queda en la
línea de regresión estimada.
Suponga que un investigador cuenta con datos sobre la cantidad de espacio de anaquel x dedicado a la exhibición de un
producto particular y a ingresos por ventas y de ese producto. Es posible que el investigador desee adoptar un modelo
para el cual la línea de regresión verdadera pase a través de
(0, 0). El modelo apropiado es Y 1x . Suponga que
(x1, y1), . . . , (xn, yn) son pares observados generados con
este modelo y deduzca el estimador de mínimos cuadrados
de 1. [Sugerencia: Escriba la suma de desviaciones al cuadrado como una función de bI, un valor de prueba y use el
cálculo para determinar el valor minimizante de bI.]
a. Considere los datos del ejercicio 20. Suponga que en lugar de la línea de mínimos cuadrados que pasa por los
puntos (x1, y1), . . . , (xn, yn), se desea que pase por (x1
x, y1), . . . , (xn x, yn). Construya una gráfica con los
puntos (xi, yi) y luego con los puntos (xi x, yi). Use las
gráficas para explicar intuitivamente cómo están relacionadas entre sí las dos líneas de mínimos cuadrados.
b. Suponga que en lugar del modelo Yi 0 1xi
i (i 1, . . . , n), se desea ajustar un modelo de la forma Yi *0 *1(xi x) i (i 1, . . . , n). ¿Cuáles
son los estimadores de mínimos cuadrados de *0 y *1,
y cómo están relacionados con ˆ 0 y ˆ 1?
Considere los siguientes tres conjuntos de datos, en los cuales las variables de interés son x distancia de la casa al
trabajo y y tiempo para recorrer la distancia de la casa
al trabajo. Basado en una gráfica de puntos y los valores de
s y r2, ¿en qué situación la regresión lineal simple sería más
(menos) efectiva y por qué?
www.FreeLibros.me
c12_p446-499.qxd
468
3/12/08
CAPÍTULO 12
Conjunto de datos
4:30 AM
Page 468
Regresión lineal simple y correlación
1
2
3
x
y
x
y
x
y
15
16
17
18
19
20
42
35
45
42
49
46
5
10
15
20
25
50
16
32
44
45
63
115
5
10
15
20
25
50
8
16
22
23
31
60
Sxx
Sxy
ˆ 1
ˆ 0
STC
SCE
17.50
29.50
1.685714
13.666672
114.83
65.10
1270.8333
2722.5
2.142295
7.868852
5897.5
65.10
1270.8333
1431.6667
1.126557
3.196729
1627.33
14.48
12.3 Inferencias sobre el parámetro de pendiente 1
En virtualmente todo el trabajo inferencial realizado hasta ahora, la noción de variabilidad
de muestreo ha sido persistente. En particular, las propiedades de las distribuciones de
muestreo de varios estadísticos han sido la base para desarrollar fórmulas de intervalo de confianza y métodos de prueba de hipótesis. La idea clave en este caso es que el valor de virtualmente cualquier cantidad calculada a partir de datos muestrales, el valor de virtualmente
cualquier estadístico, va a variar de una muestra a otra.
Ejemplo 12.10
Reconsidere los datos sobre x tasa de liberación debido al área del quemador y y tasa
de emisiones de NOX del ejercicio 12.19 en la sección previa. Existen 14 observaciones,
realizadas con los valores x: 100, 125, 125, 150, 150, 200, 200, 250, 250, 300, 300, 350, 400
y 400, respectivamente. Suponga que la pendiente e intersección de la línea de regresión
verdadera son 1 1.70 y 0 50 con 35 (consistente con los valores ˆ 1 1.7114,
ˆ 0 45.55, s 36.75). Se procede a generar una muestra de desviaciones aleatorias
~1, . . . , ~14 con respecto a una distribución normal con media 0 y desviación estándar 35 y
luego se sumó ~i a 0 1xi para obtener 14 valores y correspondientes. Se realizaron entonces los cálculos de regresión para obtener la pendiente, la intersección y la desviación
estándar estimadas. Este proceso se repitió un total de 20 veces y los valores resultantes se
dan en la tabla 12.1.
Tabla 12.1 Resultados de simulación del ejemplo 12.10
ˆ 1
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
1.7559
1.6400
1.4699
1.6944
1.4497
1.7309
1.8890
1.6471
1.7216
1.7058
ˆ 0
s
60.62
49.40
4.80
41.95
5.80
70.01
95.01
40.30
42.68
63.31
43.23
30.69
36.26
22.89
36.84
39.56
42.37
43.71
23.68
31.58
ˆ 1
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
1.7843
1.5822
1.8194
1.6469
1.7712
1.7004
1.6103
1.6396
1.7857
1.6342
ˆ 0
s
67.36
28.64
83.99
32.03
52.66
58.06
27.89
24.89
77.31
17.00
41.80
32.46
40.80
28.11
33.04
43.44
25.60
40.78
32.38
30.93
Claramente existe variación en los valores de la pendiente y la intersección estimadas,
así como también la desviación estándar estimada. La ecuación de la línea de cuadrados mínimos varía por lo tanto de una muestra a la siguiente. La figura 12.13 muestra una gráfica
de puntos de las pendientes estimadas así como también gráficas de la línea de regresión
verdadera y las 20 líneas de regresión muestrales.
www.FreeLibros.me
3/12/08
4:30 AM
Page 469
12.3 Inferencias sobre el parámetro de pendiente 1
1.5
1.6
1.7
1.8
469
1.9
Pendiente
1
a)
600
500
400
Y
c12_p446-499.qxd
300
200
100
100
150
200
250
X
300
350
400
Línea de regresión verdadera
Líneas de cuadrados mínimos simulados
b)
Figura 12.13 Resultados de simulación del ejemplo 12.10: a) gráfica de puntos de pendientes
estimadas; b) gráficas de la línea de regresión verdadera y 20 líneas de mínimos cuadrados obtenidas
con S-Plus.
■
La pendiente 1 de la línea de regresión de la población es el cambio promedio verdadero en la variable dependiente y asociada con un incremento de una unidad en la variable independiente x. La pendiente de la línea de mínimos cuadrados ˆ 1, da una estimación
puntual de 1. Del mismo modo que un intervalo de confianza para y los procedimientos
para probar hipótesis con respecto a se basaron en propiedades de la distribución de muestreo de X
, las inferencias adicionales sobre 1 están basadas en considerar a ˆ 1 como un
estadístico e investigar su distribución de muestreo.
Se supone que los valores de las xi se eligen antes de realizar el experimento, así que
sólo las Yi son aleatorias. Los estimadores (estadísticos, y por lo tanto variables aleatorias)
de 0 y 1 se obtienen reemplazando yi por Yi en (12.2) y (12.3):
ˆ 1
ˆ 0
(xi x)(Yi Y )
(xi x)2
Yi ˆ i xi
www.FreeLibros.me
n
c12_p446-499.qxd
470
3/12/08
CAPÍTULO 12
4:30 AM
Page 470
Regresión lineal simple y correlación
Asimismo, el estimador de 2 se obtiene al reemplazar cada yi en la fórmula para s2 por la
variable aleatoria Yi:
ˆ 2 S 2
Y 2i ˆ 0 Yi ˆ 1 xiYi
n2
El denominador de ˆ 1, Sxx (xi x)2, depende sólo de las xi y no de las Yi, así que es una
constante. Entonces como (xi x)Y
Y (xi x)
Y 0 0, el estimador de la pendiente se escribe como
ˆ 1
(xi x)Yi
Sxx
ciYi
donde ci (xi x)/Sxx
Es decir, ˆ 1 es una función lineal de variables aleatorias independientes Y1, Y2, . . . , Yn,
cada una de las cuales está normalmente distribuida. Invocando las propiedades de una función lineal de variables aleatorias discutidas en la sección 5.5 conduce a los siguientes
resultados.
1. El valor medio de ˆ 1 es E(ˆ 1) ˆ 1, así que ˆ 1, es un estimador insesgado
de 1 (la distribución de ˆ 1 siempre está centralizada en el valor de 1).
2. La varianza y desviación estándar de ˆ 1 son
1
V(ˆ 1) 2ˆ
1
2
Sxx
ˆ
1
S
xx
(12.4)
donde Sxx (xi x)2 x 2i (xi)2/n. Reemplazando por su estimación s da
una estimación para ˆ (la desviación estándar estimada, es decir, el error estándar estimado, de ˆ 1):
1
sˆ
1
s
S
xx
(Esta estimación también puede ser denotada por ˆ ˆ .)
3. El estimador ˆ 1 tiene una distribución normal (porque es una función lineal de variables aleatorias independientes).
1
De acuerdo con (12.4), la varianza de ˆ 1 es igual a la varianza 2 del término de error aleatorio, o, en forma equivalente, de cualquier Yi, dividida entre (xi x)2. Como (xi x)2
mide la dispersión de las xi en torno a x, se concluye que si realizan observaciones a valores xi que están bastante dispersos se obtiene un estimador más preciso del parámetro de
pendiente (varianza más pequeña de ˆ 1), mientras que los valores de xi muy cercanos entre
sí implican un estimador altamente variable. Desde luego, si las xi están demasiado dispersas, un modelo lineal puede no ser apropiado a lo largo del rango de observación.
Muchos procedimientos inferenciales previamente discutidos se basaron en estandarizar un estimador restando primero su valor medio y luego dividiéndolo entre su desviación
estándar estimada. En particular, los procedimientos de prueba y un intervalo de confianza
para media de una población normal utilizaron el hecho de que la variable estandarizada
(X
)/(S/n), es decir, (X
)/Sˆ , tenía una distribución t con n 1 grado de libertad.
Un resultado similar en este caso abre la puerta a más inferencias sobre 1.
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:30 AM
Page 471
12.3 Inferencias sobre el parámetro de pendiente 1
TEOREMA
471
La suposición del modelo de regresión lineal simple implica que la variable estándar
ˆ 1
ˆ 1 1
1
S /S
xx
S ˆ
T
1
tiene una distribución t con n 2 grados de libertad.
Un intervalo de confianza para 1
Como en la derivación de intervalos de confianza previos, se inicia con el enunciado de probabilidad
P t/2,n2
ˆ 1 1
t/2,n2 1
S ˆ
1
La manipulación de las desigualdades entre los paréntesis para aislar 1 y la sustitución de
las estimaciones en lugar de los estimadores da la fórmula del intervalo de confianza.
Un intervalo de confianza de 100(1 )% para la pendiente 1 de la línea de regresión verdadera es
ˆ 1 ! t/2,n2 s ˆ
1
Este intervalo tiene la misma forma general de muchos de los intervalos previos. Está centrado en la estimación puntual del parámetro y la cantidad que se extiende a cada lado de la
estimación depende del nivel de confianza deseado (a través del valor crítico t) y de la cantidad de variabilidad del estimador ˆ 1 (a través de s ˆ , el cual tenderá a ser más pequeño
cuando existe poca variabilidad en la distribución de ˆ 1 y grande de lo contrario).
1
Ejemplo 12.11
Las variaciones del peso de mampostería de ladrillos de arcilla tienen implicaciones no sólo
para diseño estructural y acústico sino también para el diseño de sistemas de calefacción,
ventilación y aire acondicionado. El artículo “Clay Brick Masonry Weight Variation” (J. of
Architectural Engr., 1996: 135-137) incluye una gráfica de puntos de y densidad de mortero en seco (lb/pie3) contra x contenido de aire del mortero (%) para una muestra de especímenes de mortero, de donde se tomaron los siguientes datos representativos:
x
5.7
6.8
9.6
10.0
10.7
12.6
14.4
15.0
15.3
y
119.0
121.3
118.2
124.0
112.3
114.1
112.2
115.1
111.3
x
16.2
17.8
18.7
19.7
20.6
25.0
y
107.2
108.9
107.8
111.0
106.2
105.0
La gráfica de puntos de estos datos en la figura 12.14 ciertamente sugiere la pertinencia del
modelo de regresión lineal simple; parece haber una sustancial relación lineal negativa entre el contenido de aire y la densidad, una en la cual la densidad tiende a incrementarse a
medida que se incrementa el contenido de aire.
www.FreeLibros.me
c12_p446-499.qxd
472
3/12/08
CAPÍTULO 12
4:30 AM
Page 472
Regresión lineal simple y correlación
Densidad
125
115
105
Contenido de aire
5
15
Figura 12.14
25
Gráfica de puntos de los datos del ejemplo 12.11.
Los valores de los estadísticos resumidos requeridos para calcular las estimaciones de
los mínimos cuadrados son
xi 218.1
yi 1693.6
xiyi 24 252.54
x 2i 3577.01
y2i 191 672.90
con las cuales se obtuvieron Sxy 372.404, Sxx 405.836, ˆ 1 0.917622, ˆ 0
126.248889, STC 454.1693, SCE 112.4432 y r 2 1 112.4432/454.1693 0.752.
Aproximadamente 75% de la variación de la densidad observada puede ser atribuido a la
relación de modelo de regresión lineal simple entre la densidad y el contenido de aire. El
grado de libertad debido al error es 15 2 13, para obtener s2 112.4432/13 8.6495
y s 2.941.
La desviación estándar estimada de ˆ 1 es
s ˆ
1
s
S
xx
2.941
4
0
5
.8
3
6
0.1460
El valor crítico total t para un nivel de confianza de 95% es t0.025,13 2.160. El intervalo de
confianza es
0.918 ! (2.160)(0.1460) 0.918 ! 0.315 ( 1.233, 0.603)
Con un alto grado de confianza, se estima que una disminución promedio de la densidad
de entre 0.603 lb/pie3 y 1.233 lb/pie3 está asociada con 1% de incremento del contenido de
aire (por lo menos con valores de contenido de aire entre aproximadamente 5% y 25%, correspondientes a los valores x en una muestra). El intervalo es razonablemente angosto, lo
que indica que la pendiente de la línea de población fue estimada con precisión. Obsérvese que
el intervalo incluye sólo valores negativos, así que se puede estar seguro de la tendencia de
la densidad a disminuir conforme el contenido de aire se incrementa.
Examinando los resultados obtenidos con SAS de la figura 12.15, se encuentra el valor de s ˆ bajo Estimaciones de parámetro como el segundo número en la columna Error estándar. Todos los programas estadísticos más ampliamente utilizados incluyen este error
estándar estimado para el estadístico ˆ 0 con el cual se puede calcular la intersección 0 de
la línea de regresión de la población.
1
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:30 AM
Page 473
12.3 Inferencias sobre el parámetro de pendiente 1
473
Dependent Variable: DENSITY
Analysis of Variance
Source
Model
Error
C Total
DF
1
13
14
Sum of Squares
341.72606
112.44327
454.16933
Root MSE
Dep Mean
C.V.
2.94100
112.90667
2.60481
Mean Square
341.72606
8.64948
Prob F
0.0001
F Value
39.508
R-square
Adj R-sq
0.7524
0.7334
Parameter Estimates
Variable
DF
Parameter
Estimate
INTERCEP
AIRCONT
1
1
126.248889
0.917622
Obs
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Standard
Error
T for H0:
Parameter 0
Prob °T°
2.25441683
0.14598888
56.001
6.286
0.0001
0.0001
Dep Var
DENSITY
119.0
121.3
118.2
124.0
112.3
114.1
112.2
115.1
111.3
107.2
108.9
107.8
111.0
106.2
105.0
Predict
Value
121.0
120.0
117.4
117.1
116.4
114.7
113.0
112.5
112.2
111.4
109.9
109.1
108.2
107.3
103.3
Sum of Residuals
Sum of Squared Residuals
Predicted Resid SS (Press)
Figura 12.15
Residual
2.0184
1.2909
0.7603
6.9273
4.1303
0.5869
0.8351
2.6154
0.9093
4.1834
1.0152
1.2894
2.8283
1.1459
1.6917
0
112.4433
146.4144
Resultados obtenidos con SAS con los datos del ejemplo 12.11.
■
Procedimientos de prueba de hipótesis
Como antes, la hipótesis nula en una prueba con respecto a 1 será un enunciado de igualdad. El valor nulo (valor de 1 alegado verdadero por la hipótesis nula) será denotado por
10 (léase “beta uno cero”, no “beta diez”). El estadístico de prueba se obtiene reemplazando 1 en la variable estandarizada T por el valor nulo 10, es decir, estandarizando el estimador de 1 conforme a la suposición de que H0 es verdadera. El estadístico de prueba tiene
por lo tanto una distribución t con n 2 grados de libertad cuando H0 es verdadera, así que
la probabilidad de error de tipo I permanece al nivel deseado utilizando un valor crítico t
apropiado.
El par de hipótesis más comúnmente encontrado en torno a 1 es H0: 1 0 contra
Ha: 1 0. Cuando esta hipótesis nula es verdadera, Yx 0 independiente de x, así que
el conocimiento de x no da información sobre el valor de la variable dependiente. Una prueba de estas dos hipótesis a menudo se conoce como prueba de utilidad del modelo de regresión lineal simple. A menos que n sea demasiado pequeño, H0 será rechazada y la utilidad
del modelo confirmada con precisión cuando r2 es razonablemente grande. El modelo de regresión lineal simple no deberá ser utilizado para más inferencias (estimaciones del valor
medio o predicciones de valores futuros) a menos que la prueba de la utilidad del modelo
dé por resultado el rechazo de H0 con un apropiadamente pequeño.
www.FreeLibros.me
c12_p446-499.qxd
CAPÍTULO 12
4:30 AM
Page 474
Regresión lineal simple y correlación
Hipótesis nula:
H0:
1 10
Valor estadístico de prueba: t
ˆ 1 10
sˆ
1
Región de rechazo para una prueba a nivel
Hipótesis alternativa
Ha:
Ha:
Ha:
1 10
1 10
1 10
t t,n2
t t,n2
o t t/2,n2 o
t
t/2,n2
Se puede calcular un valor P basado en n 2 grados de libertad como previamente se
hizo con pruebas t en los capítulos 8 y 9.
La prueba de utilidad del modelo es la prueba de H0: 1 0 contra Ha: 1 0,
en cuyo caso el valor estadístico de prueba es la relación t t ˆ 1/sˆ .
1
La limpieza del metal o aleación de aluminio fundida antes de vaciar una pieza está determinada principalmente por el contenido de hidrógeno e inclusiones del metal fundido. El
artículo “Effect of Melt Cleanliness on the Properties of an A1-10 Wt Pct Si-10 Vol Pct
SiC(p) Composite” (Metallurgical Trans., 1993: 1631-1645) reporta sobre un estudio en el
cual varias propiedades de tensión se relacionaron con x fracción volumétrica de óxidos/inclusiones (%). Aquí se presentan datos (leídos en una gráfica) sobre y alargamiento (%)
de barras de prueba. Los autores afirman que la gráfica de puntos muestra una relación lineal y dan la ecuación de la línea de mínimos cuadrados. Utilice los resultados de la figura
12.16 generados por MINITAB y realice la prueba de utilidad de modelo a un nivel de significación 0.01
x
0.10
0.16
0.31
0.37
0.37
0.46
0.50
0.50
0.60
0.70
y
0.96
1.10
0.80
0.84
0.77
0.87
0.60
0.87
0.60
0.61
x
0.75
0.80
0.90
1.00
1.07
1.08
1.11
1.30
1.37
1.54
y
0.70
0.41
0.40
0.41
0.45
0.59
0.25
0.25
0.08
0.10
The regression equation is
elon 1.07 0.649 volfrac
t
sˆ
Coef
1.06930
0.64884
s 0.1049
Stdev
0.04966
0.05840
R-sq 87.3%
t-ratio
21.53
11.11
@±
Predictor
Constant
volfrac
±
±
1
±
Ejemplo 12.12
@±
±
474
3/12/08
ˆ
1
s ˆ1
P
0.000
0.000
@±
Valor P
para la prueba de
utilidad del modelo
R-sq(adj) 86.6%
Analysis of Variance
SOURCE
Regression
Error
Total
DF
1
18
19
Figura 12.16
SS
1.3583
0.1981
1.5564
MS
1.3583
0.0110
F
123.42
P
0.000
Resultados obtenidos con MINITAB del ejemplo 12.12.
El parámetro de interés es 1, el cambio esperado del porcentaje de alargamiento asociado con 1% de incremento de la fracción volumétrica de óxidos/inclusiones. H0: 1 0
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:30 AM
Page 475
12.3 Inferencias sobre el parámetro de pendiente 1
475
será rechazada a favor de Ha: 1 0 si la relación t ˆ 1/sˆ satisface o t t/2,n2
t0.005,18 2.878 o t 2.878. De acuerdo con la figura 12.16, ˆ 1 0.64884 y
sˆ 0.05840, y
1
1
t
0.64884
11.11
0.05840
(también en la salida de resultados)
Con claridad, 11.11 2.878, de modo que H0 es resonantemente rechazada. De manera alternativa, el valor P es dos veces el área capturada bajo la curva t de 18 grados de libertad a la izquierda de 11.11. MINITAB da un valor P 0.000, de modo que H0 deberá ser
rechazada a cualquier nivel razonable. Esta confirmación de la utilidad del modelo
de regresión lineal simple permite calcular varias estimaciones y predicciones como se describe en la sección 12.4.
■
Regresión y ANOVA
La descomposición de la suma total de los cuadrados (yi y )2 en una parte SCE, la cual
mide la variación no explicada y una parte SCR, que mide la variación explicada por la relación lineal, hace recordar el ANOVA unidireccional. De hecho, la hipótesis nula H0: 1 0
puede ser probada contra Ha: 1 0 con una tabla ANOVA (tabla 12.2) y rechazando H0 si
f F,1,n2.
Tabla 12.2 Tabla ANOVA para regresión lineal simple
Origen de la variación
gl
Suma de cuadrados
Cuadrado de la media
f
Regresión
1
SCR
SCR
SCR
SCE/(n 2)
Error
n2
SCE
Total
n1
STC
s2
SCE
n2
La prueba F da exactamente el mismo resultado que la prueba t de utilidad del modelo t2 f y t 2/2,n2 F,1,n2. Virtualmente todos los programas de computadora que cuentan
con opciones de regresión incluyen tal tabla ANOVA en los resultados. Por ejemplo, la figura 12.15 muestra los resultados obtenidos con SAS con los datos de mortero del ejemplo
12.11. La tabla ANOVA en la parte superior de los resultados tiene f 39.508 con un valor
P de 0.0001 para la prueba de utilidad de modelo. La tabla de estimaciones de parámetro da
t 6.286 con P 0.0001 y (6.286)2 39.51.
EJERCICIOS
Sección 12.3 (30-43)
30. Reconsidere la situación descrita en el ejercicio 7, en el cual
x resistencia acelerada del concreto y y resistencia después de 28 días de curado. Suponga que el modelo de regresión lineal simple es válida con x entre 1000 y 4000 y que
1 1.25 y 350. Considere un experimento en el cual
n 7 y los valores x a los cuales se realizan las observaciones son x1 1000, x2 1500, x3 2000, x4 2500,
x5 3000, x6 3500 y x7 4000.
a. Calcule ˆ , la desviación estándar de ˆ 1.
b. ¿Cuál es la probabilidad de que la pendiente estimada
basada en las observaciones esté entre 1.00 y 1.50?
c. Suponga que también es posible hacer una sola observación con cada uno de los n 11 valores x1 2000,
1
x2 2100, . . . , x11 3000. Si un objetivo importante
es estimar 1 con tanta precisión como sea posible,
¿se preferiría el experimento con n 11 a uno con
n 7?
31. Reconsidere las cantidades resumidas dadas en el ejercicio 18
para la regresión de y factor de deflexión en x temperatura.
a. Calcule la desviación estándar estimada sˆ .
b. Calcule un intervalo de confianza de 95% para 1, el
cambio esperado del factor de deflexión asociado con un
incremento de 1°F de la temperatura.
www.FreeLibros.me
1
c12_p446-499.qxd
476
3/12/08
CAPÍTULO 12
4:30 AM
Page 476
Regresión lineal simple y correlación
32. El ejercicio 16 de la sección 12.2 dio datos sobre x volumen de precipitación pluvial y y volumen de escurrimiento (ambos en m3). Use los resultados adjuntos obtenidos con
MINITAB para decidir si existe una relación lineal útil entre
la precipitación pluvial y el escurrimiento y luego calcule un
intervalo de confianza para el cambio promedio verdadero
del volumen de escurrimiento asociado con 1 m3 de incremento del volumen de precipitación pluvial.
The regression equation is
runoff 1.13 0.827 rainfall
Predictor
Constant
rainfall
s 5.240
Coef
1.128
0.82697
Stdev
2.368
0.03652
R-sq 97.5%
t-ratio
0.48
22.64
p
0.642
0.000
R-sq(adj) 97.3%
33. El ejercicio 15 de la sección 12.2 incluyó resultados generados por MINITAB de módulo de elasticidad con una regresión de resistencia a la flexión de vigas de concreto.
a. Úselos para calcular el ancho de intervalo de confianza
de 95% para la pendiente 1 de la línea de regresión de
la población e interprete el intervalo resultante.
b. Suponga que previamente se creía que cuando el módulo de elasticidad se incrementa en 1 GPa, el cambio promedio verdadero asociado de la resistencia a la flexión
era cuando mucho de 0.1 MPa. ¿Contradicen los datos
esta creencia? Formule y pruebe las hipótesis pertinentes.
34. Remítase a los resultados generados por MINITAB del ejercicio 20, en los cuales x NO3 deposición en húmedo y
y liquen N (%).
a. Realice la prueba de utilidad de modelo al nivel 0.01,
utilizando el método de región de rechazo.
b. Repita el inciso a) con el método del valor P.
c. Suponga que previamente se creía que cuando la deposición en húmedo de NO3 se incrementa en 0.1 g N/m2, el
cambio asociado del liquen N esperado es por lo menos
de 0.15%. Realice una prueba de hipótesis al nivel 0.01
para decidir si los datos contradicen esta creencia previa.
35. ¿Cómo afecta la aceleración lateral (fuerzas laterales experimentadas en las vueltas que en gran medida están bajo el
control del conductor) las náuseas percibidas por los pasajeros de un autobús? El artículo “Motion Sickness in Public
Road Transport: The Effect of Driver, Route, and Vehicle”
(Ergonomics, 1999: 1646-1664) reportó datos sobre x
dosis de mareo provocado por el movimiento (calculado de
acuerdo con una norma británica para evaluar movimientos
similares en el mar) y y náusea reportada (%). Las cantidades pertinentes son
xi 222.1, yi 193, x2i 3056.69,
xi yi 2759.6, y2i 2975
n 17,
Los valores de dosis en la muestra oscilaron entre 6.0 y 17.6.
a. Suponiendo que el modelo de regresión lineal simple es
válido para relacionar estas dos variables (esto es apoyado por los datos sin procesar), calcule e interprete un estimador del parámetro de pendiente que dé información
sobre la precisión y confiabilidad de la estimación.
b. ¿Parece haber una relación lineal útil entre estas dos variables? Responda la pregunta empleando el método del
valor P.
c. ¿Sería sensible utilizar el modelo de regresión lineal
simple como base para predecir el % de náuseas cuando
la dosis 5.0? Explique su razonamiento.
d. Cuando se utilizó MINITAB para ajustar el modelo de
regresión lineal simple a los datos sin procesar, la observación (6.0, 2.50) fue señalada como que posiblemente
tiene un impacto sustancial en el ajuste. Elimine esta observación de la muestra y recalcule la estimación del inciso a). Basado en esto, ¿parece ejercer la observación
una influencia indebida?
36. Se produce una bruma (gotas transportadas por el aire o
aerosoles) cuando se utilizan fluidos para remover metales
en operaciones de maquinado para enfriar y lubricar la herramienta y la pieza de trabajo. La generación de bruma es
una preocupación para la OSHA, la que recientemente ha
reducido sustancialmente la norma del lugar de trabajo. El
artículo “Variables Affecting Mist Generation from Metal
Removal Fluids” (Lubrication Engr., 2002: 10-17) dio los
datos adjuntos sobre x velocidad de flujo de fluido de un
aceite soluble al 5% (cm/s) y y la cantidad de gotas de
bruma con diámetro menor que 10 m (mg/m3):
x
y
89
177
189
354
362
442
965
0.40 0.60 0.48 0.66 0.61 0.69 0.99
a. Los investigadores realizaron un análisis de regresión lineal simple para relacionar las dos variables. ¿Apoya la
gráfica de puntos esta estrategia?
b. ¿Qué proporción de la variación observada de la bruma
puede ser atribuida a la relación de regresión lineal simple entre velocidad y bruma?
c. A los investigadores les interesaba particularmente el
impacto en la bruma de la velocidad creciente de 100 a
1000 (un factor de 10 correspondiente a la diferencia entre los valores x más pequeños y más grandes presentes
en la muestra). Cuando x se incrementa de esta manera,
¿existe evidencia sustancial de que el incremento promedio verdadero de y es menor que 0.6?
d. Estime el cambio promedio verdadero de la bruma asociado con un incremento de 1 cm/s en la velocidad y hágalo de modo que dé información sobre precisión y
confiabilidad.
37. La obtención de imágenes por medio de resonancia magnética (MRI, por sus siglas en inglés) está bien establecida como
una herramienta para medir velocidades de la sangre y flujos
de volúmenes. El artículo “Correlation Analysis of Stenotic
Aortic Valve Flow Patterns Using Phase Constrast MRI”, citado en el ejercicio 1.67, propuso utilizar esta metodología
para determinar el área valvular en pacientes con estenosis
aórtica. Los datos adjuntos sobre velocidad pico (m/s) derivados de exámenes de 23 pacientes en dos planos diferentes
se tomaron de una gráfica que aparece en el artículo citado.
Nivel--: 0.60 0.82 0.85 0.89 0.95 1.01 1.01 1.05
Nivel--: 0.50 0.68 0.76 0.64 0.68 0.86 0.79 1.03
Nivel--: 1.08 1.11 1.18 1.17 1.22 1.29 1.28 1.32
Nivel--: 0.75 0.90 0.79 0.86 0.99 0.80 1.10 1.15
Nivel--: 1.37 1.53 1.55 1.85 1.93 1.93 2.14
Nivel--: 1.04 1.16 1.28 1.39 1.57 1.39 1.32
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:30 AM
Page 477
12.4 Inferencias sobre Yx* y predicción de valores Y futuros
38.
39.
40.
41.
a. ¿Parece haber alguna diferencia entre la velocidad promedio verdadera en los dos planos distintos? Realice
una prueba de hipótesis apropiada (como lo hicieron los
autores del artículo).
b. Los autores del artículo también analizaron el Nivel-velocidad contra Nivel-velocidad. La intersección y la pendiente estimadas resultantes son 0.14701 y 0.65393 con
errores estándar estimados correspondientes de 0.07877
y 0.05947, coeficiente de determinación de 0.852 y
s 0.110673. El artículo incluyó un comentario de
que esta regresión mostraba evidencias de una fuerte
relación lineal pero una pendiente de regresión muy
por debajo de 1. ¿Está de acuerdo?
Remítase a los datos sobre x tasa de liberación y y tasa
de emisión de NOX dados en el ejercicio 19.
a. ¿Especifica el modelo de regresión lineal simple una relación útil entre las dos tasas? Use el procedimiento de
prueba apropiado para obtener información sobre el valor P y luego saque una conclusión a nivel de significación de 0.01.
b. Calcule un intervalo de confianza de 95% para cambio
esperado de tasa de emisiones con un incremento de 10
MBtu/h-pie2 en la tasa de liberación.
Realice la prueba de utilidad de modelo por medio del método ANOVA con los datos de contenido de humedad-tasa
de filtración del ejemplo 12.6. Verifique que da un resultado
equivalente al de la prueba t.
Use las reglas del valor esperado para demostrar que ˆ 0 es
un estimador insesgado de 0 (suponiendo que ˆ 1 es un estimador insesgado de 1).
a. Verifique que E( ˆ 1) 1 con las reglas de valor esperado del capítulo 5.
477
b. Use las reglas de varianza del capítulo 5 para verificar la
expresión para V( ˆ 1) dada en esta sección.
42. Verifique que si cada xi se multiplica por una constante positiva c y cada yi se multiplica por otra constante positiva d,
el estadístico t para probar H0: 1 0 contra Ha: 1 0 no
cambia de valor (el valor de ˆ 1 cambiará, lo que demuestra
que la magnitud de ˆ 1 no es indicativo por sí mismo de la
utilidad del modelo).
43. La probabilidad de un error de tipo II con la prueba t para
H0: 1 10 se calcula del mismo modo que para las pruebas t del capítulo 8. Si el valor alternativo de 1, denotado
por 1, el valor de
°10 1°
d
n1
x i2 ( xi)2/n
se calcula primero, luego se ingresa al conjunto apropiado
de curvas de la tabla A.17 del apéndice por el eje horizontal en el valor de d y se lee en la curva de n 2 grados
de libertad. Un artículo que apareció en el Journal of Public
Health Engineering reporta los resultados de un análisis de
regresión basado en n 15 observaciones en las cuales x
temperatura de aplicación de filtro (°C) y y % de eficiencia de eliminación de BOD. Las cantidades calculadas incluyen xi 402, x2i 11 098, s 3.725 y ˆ 1
1.7035. Considere probar a un nivel de 0.01 H0: 1 1, la
que manifiesta que el incremento esperado en el % de eliminación de BOD es 1 cuando la temperatura de aplicación
del filtro se incrementa 1°C, contra la alternativa Ha: 1 1.
Determine P (error de tipo II) cuando 1 2, 4.
12.4 Inferencias sobre Yx* y predicción de valores Y futuros
Sea x* un valor específico de la variable independiente x. Una vez que ˆ 0 y ˆ 1 han sido calculadas, ˆ 0 ˆ 1x* puede ser considerada como una estimación puntual de Yx* (el valor esperado o el valor promedio esperado de Y cuando x x*) o como una predicción del valor Y que
resultará de una sola observación realizada cuando x x*. La estimación puntual o predicción por sí misma no da información sobre qué tan precisamente Yx* ha sido estimada o Y
ha sido pronosticada. Esto se remedia desarrollando un intervalo de confianza para Yx* y
un intervalo de predicción (IP) para un solo valor de Y.
Antes de obtener datos muestrales, tanto ˆ 0 como ˆ 1 están sujetas a variabilidad de
muestreo, es decir, ambos son estadísticos cuyos valores variarán de muestra en muestra.
Supóngase, por ejemplo que 0 50 y 1 2. Entonces una primera muestra de pares
(x, y) podría dar ˆ 0 52.35, ˆ 1 1.895, una segunda muestra podría dar ˆ 0 46.52,
ˆ 1 2.056 y así sucesivamente. Se desprende que Ŷ ˆ 0 ˆ 1x* misma cambia de valor
de muestra en muestra, así que es un estadístico. Si la intersección y la pendiente de la línea de la población son los valores antes mencionados 50 y 2, de manera respectiva, y
x* 10, entonces este estadístico está tratando de estimar el valor 50 2(10) 70. La estimación con una primera muestra podría ser 52.35 1.895(10) 71.30, con una segunda
muestra podría ser 46.52 2.056(10) 67.08 y así sucesivamente. Del mismo modo que
un intervalo de confianza para 1 estaba basado en propiedades de la distribución de muestreo de ˆ 1, un intervalo de confianza para un valor y medio en regresión está basado en propiedades de la distribución de muestreo del estadístico ˆ 0 ˆ 1x*.
www.FreeLibros.me
c12_p446-499.qxd
478
3/12/08
CAPÍTULO 12
4:30 AM
Page 478
Regresión lineal simple y correlación
La sustitución de la expresión para ˆ 0 y ˆ 1 en ˆ 0 ˆ 1x* seguida por algunas manipulaciones algebraicas conduce a la representación de ˆ 0 ˆ 1x* como una función lineal
de las Yi:
n
n
(x* x)(xi x)
1
ˆ 0 ˆ 1x*
Yi diYi
2
(xi x)
i1 n
i1
Los coeficientes d1, d2, . . . , dn en esta función lineal implica las xi y x*, las cuales son fijas. La aplicación de las reglas de la sección 5.5 a esta función lineal da las siguientes propiedades.
Sea Ŷ ˆ 0 ˆ 1x*, donde x* es algún valor fijo de x. Entonces
1. El valor medio de Ŷ es
E(Ŷ) E(ˆ 0 ˆ 1x*) ˆ ˆ x* 0 1x*
0
1
Así pues ˆ 0 ˆ 1x* es un estimador insesgado de 0 1x* (es decir, de Yx*).
2. La varianza de Ŷ es
2
V(Ŷ ) Ŷ 2
1
n
(x* x)2
(x* x)2
1
2
2
2
Sxx
x i ( xi) /n
n
y la desviación estándar Ŷ es la raíz cuadrada de esta expresión. La desviación
estándar estimada de ˆ 0 ˆ 1x*, denotada por sŶ o sˆ ˆ x*, se obtiene al reemplazar
por su estimación s:
0
sŶ sˆ ˆ x* s
0
1
1
(x* x )
1n
S
2
xx
3. Ŷ tiene una distribución normal.
La varianza de ˆ 0 ˆ 1x* es más pequeña cuando x* x y se incrementa a medida que x*
de aleja de x en una u otra dirección. Por consiguiente, la estimación de Yx* es más precisa cuando x* está cerca del centro de las xi que cuando está lejos de los valores x a los cuales se realizaron las observaciones. Esto implicará tanto que el intervalo de confianza como
el intervalo de predicción sean más angostos con una x* cerca de x que con una x* lejos
de x. La mayoría de los programas de computadora dan tanto ˆ 0 ˆ 1x* como sˆ ˆ x* con
cualquier x* especificada.
0
1
Inferencias sobre Y·x*
Así como los procedimientos inferenciales para 1 se basaron en la variable t obtenida estandarizando 1, una variable t obtenida estandarizando ˆ 0 ˆ 1x* conduce a un intervalo
de confianza y procedimientos de prueba en este caso.
TEOREMA
La variable
T
ˆ 0 ˆ 1x* (0 1x*)
Sˆ ˆ x*
0
1
Ŷ (0 1x*)
S Ŷ
tiene una distribución t con n 2 grados de libertad.
www.FreeLibros.me
(12.5)
c12_p446-499.qxd
3/12/08
4:30 AM
Page 479
12.4 Inferencias sobre Yx* y predicción de valores Y futuros
479
Como para 1 en la sección previa, un enunciado de probabilidad que implica esta variable estandarizada puede ser manipulado para que dé un intervalo de confianza para Yx*.
Un intervalo de confianza de 100(1 )% para Yx*, el valor esperado de Y cuando x x* es
ˆ 0 ˆ 1x* ! t/2,n2 sˆ ˆ x* ŷ ! t/2,n2 sŶ
0
(12.6)
1
Este intervalo de confianza está centrado en la estimación puntual de Yx* y se extiende a
cada lado en una cantidad que depende del nivel de confianza y del grado de variabilidad
del estimador en el cual está basada la estimación puntual.
Ejemplo 12.13
La corrosión de varillas de refuerzo de acero es el problema de durabilidad más importante
de estructuras de concreto reforzadas. La carbonatación del concreto ocurre a consecuencia de
una reacción química que reduce el pH lo suficiente para iniciar la corrosión de las varillas
de refuerzo. A continuación se dan datos representativos sobre x profundidad de carbonatación (mm) y y resistencia (MPa) para una muestra de especímenes testigo tomados
de un edificio particular (tomados de una gráfica que aparece en el artículo “The Carbonation of Concrete Structures in the Tropical Environment of Singapore”, Magazine of Concrete Res., 1996: 293-300).
x
8.0
15.0
16.5
20.0
20.0
27.5
30.0
30.0
35.0
y
22.8
27.2
23.7
17.1
21.5
18.6
16.1
23.4
13.4
x
38.0
40.0
45.0
50.0
50.0
55.0
55.0
59.0
65.0
y
19.5
12.4
13.2
11.4
10.3
14.1
9.7
12.0
6.8
Figura 12.17 Gráfica de puntos generada por MINITAB con intervalos de confianza e intervalos de
predicción con los datos del ejemplo 12.13.
www.FreeLibros.me
c12_p446-499.qxd
480
3/12/08
CAPÍTULO 12
4:30 AM
Page 480
Regresión lineal simple y correlación
Una gráfica de puntos de los datos (véase la figura 12.17) apoya fuertemente el uso del modelo de regresión lineal simple. Las siguientes son cantidades pertinentes:
xi 659.0
yi 293.2
x 2i 28 967.50
xiyi 9293.95
ˆ 1 0.297561
x 36.6111
ˆ 0 27.182936
r 0.766
Sxx 4840.7778
y2i 5335.76
SCE 131.2402
s 2.8640
2
Calcúlese ahora un intervalo de confianza, utilizando un nivel de confianza de 95%, para la resistencia media de todos los especímenes testigo que tienen una profundidad de carbonatación
de 45 mm, es decir, un intervalo de confianza para 0 1(45). El intervalo está centrado en
ŷ ˆ 0 ˆ 1(45) 27.18 0.2976(45) 13.79
La desviación estándar estimada del estadístico Ŷ es
sŶ 2.8640
1
(45 36.6111)2
0.7582
18
4840.7778
El valor crítico t de 16 grados de libertad para un intervalo de confianza de 95% es 2.120,
con el cual se determina que el intervalo deseado es
13.79 ! (2.120)(0.7582) 13.79 ! 1.61 (12.18, 15.40)
La angostura de este intervalo sugiere que se tiene información razonablemente precisa sobre el valor medio que se está estimando. Recuerde que si recalcula este intervalo para muestra tras muestra, a la larga aproximadamente 95% de los intervalos calculados incluirían
0 1(45). Sólo se puede esperar que este valor medio quede en el intervalo que se calculó.
La figura 12.18 muestra resultados MINITAB obtenidos por una solicitud de ajustar
el modelo de regresión lineal simple y calcular intervalos para el valor medio de resistencia
a profundidades de 45 mm y 35 mm. Los intervalos aparecen en la parte inferior de los resultados; obsérvese que el segundo intervalo es más angosto que el primero, porque 35 está
mucho más cerca de x que 45. La figura 12.17 muestra 1) curvas correspondientes a los límites de confianza con cada valor x diferente y 2) límites de predicción que se discutirán en
breve. Obsérvese cómo las curvas se alejan cada vez más a medida que x se aleja de x.
The regression equation is strength 27.2 0.298 depth
Predictor
Constant
depth
s 2.864
Coef
Stdev
27.183
0.29756
R-sq 76.6%
t-ratio
p
1.651
16.46
0.04116
7.23
R-sq(adj) 75.1%
0.000
0.000
Analysis of Variance
SOURCE
DF
SS
MS
F
p
Regression
Error
Total
1
16
17
428.62
131.24
559.86
428.62
8.20
52.25
0.000
Fit
13.793
Stdev.Fit
0.758
95.0% C.I.
(12.185, 15.401)
95.0% P.I.
(7.510, 20.075)
Fit
16.768
Stdev.Fit
0.678
95.0% C.I.
(15.330, 18.207)
95.0% P.I.
(10.527, 23.009)
Figura 12.18
Resultados de regresión obtenidos con MINITAB con los datos del ejemplo 12.13.
■
En algunas situaciones, se desea un intervalo de confianza no sólo para un valor x sino para dos o más valores x. Supóngase que un investigador desea un intervalo de
confianza tanto para Yv como para Yw, donde y w son dos valores diferentes de la variable independiente. Es tentador calcular el intervalo (12.6) primero con x y luego con
x w. Supóngase que se utiliza 0.05 en cada cálculo para obtener dos intervalos de
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:30 AM
Page 481
12.4 Inferencias sobre Yx* y predicción de valores Y futuros
481
95%. Luego, si las variables implicadas al calcular los dos intervalos fueran independientes
una de otra, el intervalo de confianza conjunto sería (0.95) (0.95) 0.90.
Sin embargo, los intervalos no son independientes porque se utilizan las mismas ˆ 0,
ˆ
1 y S en cado uno. Por consiguiente, no se puede aseverar que el intervalo de confianza conjunto para los dos intervalos sea exactamente de 90%. Se puede demostrar, no obstante, que
si el intervalo de confianza de 100(1 )% (12.6) se calcula tanto con x como con
x w para obtener intervalos de confianza conjuntos para Yv y Yw, entonces, el nivel de
confianza conjunto en el par de intervalos resultante es por lo menos de 100(1 2)%. En
particular, si se utiliza 0.05 se obtiene un intervalo de confianza conjunto de por lo menos 90%, en tanto que si se utiliza 0.01 se obtiene un nivel de confianza de por lo
menos 98%. Para muestra, en el ejemplo 12.13, un intervalo de confianza de 95% para Y45
fue (12.185, 15.401) y un intervalo de confianza de 95% para Y35 fue (15.330, 18.207). El
nivel de confianza simultáneo o conjunto para las dos proposiciones 12.185 Y45
15.401 y 15.330 Y35 18.207 es por lo menos de 90%.
La validez de estos intervalos de confianza conjuntos o simultáneos se fundamenta en
un resultado de probabilidad llamado desigualdad de Bonferroni, así que los intervalos de
confianza conjuntos se conocen como intervalos de Bonferroni. El método es fácil de generalizar para que dé intervalos conjuntos para k diferentes Y·x. Utilizando el intervalo
(12.6) por separado primero con x x*1 , luego con x x*2 , . . . y finalmente con x x*k se
obtiene un conjunto de k intervalos de confianza con los cuales el nivel de confianza simultáneo o conjunto está garantizado que sea de por lo menos 100(1 k)%.
Las pruebas de hipótesis con respecto a 0 1x* están basadas en el estadístico de
prueba T obtenido reemplazando 0 1x* en el numerador de (12.5) por el valor nulo
de 0. Por ejemplo, H0: 0 1(45) 15 en el ejemplo 12.13 expresa que cuando la profundidad de carbonatación es de 45, la resistencia esperada (es decir, promedio verdadera)
es de 15. El valor estadístico de prueba es entonces t [ˆ 0 ˆ 1(45) 15]/sˆ ˆ (45) y la
prueba es de cola superior, inferior o de dos colas de acuerdo con la desigualdad en Ha.
0
1
Intervalo de predicción para un valor futuro de Y
Análogo al intervalo de confianza (12.6) para Yx*, con frecuencia se desea obtener un intervalo de valores factibles para el valor de Y asociado con alguna observación futura cuando la variable independiente tiene el valor x*. Para muestra, en el ejemplo en el cual el
tamaño del vocabulario y está relacionado con la edad x de un niño, con x 6 años (12.6)
daría un intervalo de confianza para el tamaño de vocabulario promedio verdadero de todos
los niños de 6 años. Alternativamente, se podría desear un intervalo de valores posibles
para el tamaño del vocabulario de un niño particular de 6 años.
Un intervalo de confianza se refiere a un parámetro, o característica de una población,
cuyo valor es fijo pero desconocido. En contraste, un valor futuro de Y no es un parámetro
sino una variable aleatoria; por eso se hace referencia a un intervalo de valores factibles
para un valor Y futuro como intervalo de predicción en lugar de intervalo de confianza. El
error de estimación es 0 1x* ( ˆ 0 ˆ 1x*), una diferencia entre una cantidad fija
(pero desconocida) y una variable aleatoria. El error de predicción es Y ( ˆ 0 ˆ 1x*),
una diferencia entre dos variables aleatorias. Existe por lo tanto más incertidumbre en la
predicción que en la estimación, así que un intervalo de predicción será más ancho que un
intervalo de confianza. Como el valor futuro Y es independiente de las Yi observadas,
V[Y ( ˆ 0 ˆ 1x*)] varianza del error de predicción
V(Y) V( ˆ ˆ x*)
0
2 2
2 1
www.FreeLibros.me
1
(x* x)2
1
Sxx
n
(x* x)2
1
Sxx
n
c12_p446-499.qxd
482
3/12/08
CAPÍTULO 12
4:30 AM
Page 482
Regresión lineal simple y correlación
Además, como E(Y) 0 1x* y E(ˆ 0 ˆ 1x*) 0 1x*, el valor esperado del error
de predicción es E(Y (ˆ 0 ˆ 1x*)) 0. Se puede demostrar entonces que la variable estandarizada
T
Y ( ˆ 0 ˆ 1x*)
1
(x* x)2
S 1
n
Sxx
tiene una distribución t con n 2 grados de libertad. Sustituyendo esta T en la proposición
de probabilidad P( t/2,n2 T t/2,n2) 1 y manipulándola para aislar Y entre las
dos desigualdades se obtiene el siguiente intervalo.
Un intervalo de predicción de 100(1 )% para una observación Y futura que
se va a realizar cuando x x* es
(x* x)2
1
ˆ 0 ˆ 1x* ! t/2,n2 s 1
Sxx
n
(12.7)
ˆ 0 ˆ 1x* ! t/2,n2 s2
s2
ˆ ˆ
x*
0
1
ŷ ! t/2,n2 s
sŶ
2
2
La interpretación del nivel de predicción de 100(1 )% es idéntico al de los niveles de
confianza previos, si se utiliza (12.7) repetidamente, a la larga los intervalos resultantes en
realidad contendrán los valores y observados el 100(1 )% del tiempo. Obsérvese que el
1 debajo de la raíz cuadrada inicial hace que el intervalo de predicción (12.7) sea más ancho que el intervalo de confianza (12.6), aun cuando ambos intervalos estén centrados en
ˆ 0 ˆ 1x*. Además, a medida que n A , el ancho del intervalo de confianza tiende a cero,
en tanto que el ancho del intervalo de predicción no (porque incluso con el perfecto conocimiento de 0 y 1, seguirá habiendo incertidumbre en la predicción).
Ejemplo 12.14
Regrese a los datos de profundidad de carbonatación del ejemplo 12.13 y calcule un intervalo de predicción de 95% para un valor de resistencia que resultaría de seleccionar un solo
espécimen testigo cuya profundidad de carbonatación es de 45 mm. Cantidades pertinentes
del ejemplo son
ŷ 13.79
s Ŷ 0.7582
s 2.8640
Con un nivel de predicción de 95% basado en n 2 16 grados de libertad, el valor crítico es 2.120, exactamente el que se utilizó antes para un nivel de confianza de 95%. El intervalo de predicción es entonces
13.79 ! (2.120)(2
.8
6
4
0
)2
(0
.7
5
8
2
)2 13.79 ! (2.120)(2.963)
13.79 ! 6.28 (7.51, 20.07)
Valores posibles para una sola observación de resistencia cuando la profundidad es de 45
mm son (al nivel de predicción de 95%) entre 7.51 MPa y 20.07 MPa. El intervalo de confianza de 95% para una resistencia media cuando la profundidad es de 45 fue (12.18, 15.40).
El intervalo de predicción es mucho más ancho debido a los (2.8640)2 extra bajo la raíz cuadrada. La figura 12.18, los resultados MINITAB del ejemplo 12.13, muestran este intervalo
así como también el intervalo de confianza.
■
La técnica Bonferroni puede ser empleada como en el caso del intervalo de confianza. Si se calcula un intervalo de predicción de 100(1 )% para cada uno de k valores diferentes de x, el nivel de predicción simultánea o conjunta para los k intervalos es por lo
menos de 100(1 k)%.
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:30 AM
Page 483
12.4 Inferencias sobre Yx* y predicción de valores Y futuros
EJERCICIOS
483
Sección 12.4 (44-56)
44. El ajuste del modelo de regresión lineal simple a las n 27
observaciones de x módulo de elasticidad y y resistencia a la flexión dados en el ejercicio 15 de la sección 12.2
dio por resultado ŷ 7.592, sŶ 0.179 cuando x 40 y
ŷ 9.741, sŶ 0.253 con x 60.
a. Explique por qué sŶ es más grande cuando x 60 que
cuando x 40.
b. Calcule un intervalo de confianza con un nivel de confianza de 95% para la resistencia promedio verdadera de
todas las vigas cuyo módulo de elasticidad es de 40.
c. Calcule un intervalo de predicción con un nivel de 95%
para la resistencia de una sola viga cuyo módulo de elasticidad es 40.
d. Si se calcula un intervalo de confianza de 95% para la
resistencia promedio verdadera cuando el módulo de
elasticidad es de 60, ¿cuál será el nivel de confianza simultáneo tanto para este intervalo como para el intervalo calculado en el inciso b)?
45. Reconsidere los datos de contenido de humedad-tasa de filtración introducidos en el ejemplo 12.6 (véase también el
ejemplo 12.7).
a. Calcule un intervalo de confianza de 90% para 0
1251, el contenido de humedad promedio verdadera
cuando la tasa de filtración es 125.
b. Pronostique el valor del contenido de humedad con un
solo experimento en el cual la tasa de filtración es de
125 utilizando un nivel de predicción de 90%. ¿Cómo se
compara este intervalo al intervalo del inciso a)? ¿Por
qué es éste el caso?
c. ¿Cómo se compararían los intervalos de los incisos a) y
b) con un intervalo de confianza y un intervalo de predicción cuando la tasa de filtración es de 115? Responda sin calcular en realidad estos nuevos intervalos.
d. Interprete las hipótesis H0: 0 1251 80 y H0: 0
1251 80, y luego realice una prueba a un nivel de
significación de 0.01.
46. El artículo “The Incorporation of Uranium and Silver by Hydrothermally Synthesized Galena” (Econ. Geology, 1964:
1003-1024) reporta sobre la determinación de contenido de
plata de cristales de galena desarrollados en un sistema hidrotérmico cerrado dentro de un rango de temperatura. Con x
temperatura de cristalización en °C y y Ag2S en mol%, los
datos son los siguientes:
x
398 292 352 575 568 450 550 408 484 350 503 600 600
y
0.15 0.05 0.23 0.43 0.23 0.40 0.44 0.44 0.45 0.09 0.59 0.63 0.60
con los cuales xi 6130, x 2i 3 022 050, yi 4.73,
y 2i 2.1785, xiyi 2418.74, ˆ 1 0.00143, ˆ 0 0.311
y s 0.131.
a. Estime el contenido de plata promedio verdadero cuando la temperatura es de 500°C utilizando un intervalo de
confianza de 95 por ciento.
b. ¿Cómo se compararía el ancho de un intervalo de confianza de 95% para el contenido de plata promedio verdadero cuando la temperatura es de 400°C con el ancho
del intervalo del inciso a)? Responda sin calcular este
nuevo intervalo.
c. Calcule un intervalo de confianza de 95% para el cambio promedio verdadero del contenido de plata con un
incremento de 1°C de la temperatura.
d. Suponga que previamente se creía que cuando la temperatura de cristalización era de 400°C, el contenido de
plata promedio verdadero sería de 0.25. Realice una
prueba a un nivel de significación de 0.05 para decidir si
los datos muestrales contradicen esta creencia previa.
47. El modelo de regresión lineal simple se ajusta muy bien a los
datos de precipitación pluvial y volumen de escurrimiento dados en el ejercicio 16 de la sección 12.2. La ecuación de la
línea de cuadrados mínimos es ŷ 1.128 0.82697x,
r 2 0.975 y s 5.24.
a. Use el hecho de que sŶ 1.44 cuando el volumen de la
precipitación pluvial es de 40 m3 para predecir el escurrimiento en una forma que transmita información sobre
confiabilidad y precisión. ¿Sugiere el intervalo resultante que se dispone de información precisa sobre el valor
de escurrimiento con esta futura observación? Explique
su razonamiento.
b. Calcule un intervalo de precisión para escurrimiento
cuando la precipitación pluvial es de 50 utilizando el
mismo nivel de predicción del inciso a). ¿Qué se puede
decir sobre el nivel de predicción simultáneo para los
dos intervalos que calculó?
48. El resumidero en un colector pluvial es la superficie de contacto entre el escurrimiento superficial y el conductor de
desagüe. El inserto del resumidero es un dispositivo que mejora las propiedades supresoras de contaminantes de éste. El
artículo “An Evaluation of the Urban Stormwater Pollutant
Removal Efficiency of Catch Basin Inserts” (Water Envir.
Res., 2005- 500-510) reportó pruebas de varios insertos en
condiciones controladas en las que el flujo de entrada es
muy parecido al que se puede esperar en el campo. Considere los siguientes datos, tomados de una gráfica que aparece
en el artículo, para un tipo particular de inserto sobre x cantidad filtrada (miles de litros) y y % total de sólidos suspendidos eliminados.
x 23 45 68 91 114 136 159 182 205 228
y 53.3 26.9 54.8 33.8 29.9 8.2 17.2 12.2 3.2 11.1
En resumen las cantidades son
xi 1251, x 2i 199 365, yi 250.6, y 2i 9 249.36,
xiyi 21 904.4
a. ¿Avala la gráfica de puntos la selección del modelo de
regresión simple? Explique.
b. Obtenga la ecuación de la línea de mínimos cuadrados.
c. ¿Qué proporción de la variación observada en el % de
eliminación puede ser atribuida a la relación de modelo?
d. ¿Especifica el modelo de regresión lineal simple una relación útil? Realice una prueba de hipótesis apropiadas
con un nivel de significación de 0.05.
e. ¿Existe una fuerte evidencia para concluir que por lo
menos existe 2% de reducción de la eliminación de sólidos suspendidos promedio verdadera con un incremento de 10 000 litros de la cantidad filtrada? Pruebe las
hipótesis apropiadas con 0.05.
www.FreeLibros.me
c12_p446-499.qxd
484
3/12/08
CAPÍTULO 12
4:30 AM
Page 484
Regresión lineal simple y correlación
f. Calcule e interprete un intervalo de confianza de 95%
para el % eliminado promedio verdadero cuando la cantidad filtrada es de 100 000 litros. ¿Cómo se compara este
intervalo con respecto al ancho cuando la cantidad filtrada es de 200 000 litros?
g. Calcule e interprete un intervalo de predicción de 95%
para % eliminado cuando la cantidad filtrada es de 100 000
litros. ¿Cómo se compara este intervalo en cuanto al ancho con el intervalo de confianza calculado en f) y con
intervalo de predicción cuando la cantidad filtrada es de
200 000 litros?
49. Le informan que un intervalo de confianza de 95% para el
contenido de plomo esperado cuando el flujo de tráfico es de
15, basado en una muestra de n 10 observaciones es
(462.1, 597.7). Calcule un intervalo de confianza de 99% para
el contenido de plomo esperado cuando el tráfico es de 15.
50. Se han utilizado aleaciones de silicio-germanio en ciertos
tipos de celdas solares. El artículo “Silicon-Germanium
Films Deposited by Low-Frequency Plasma-Enhanced
Chemical Vapor Deposition” (J. of Materials Res., 2006:
88-104) reportó sobre un estudio de varias propiedades estructurales y eléctricas. Considere los datos adjuntos sobre
x concentración de Ge en fase sólida (desde 0 hasta 1) y
y posición de nivel Fermi (eV).
x
y
0 0.42 0.23 0.33 0.62 0.60 0.45 0.87 0.90 0.79 1
1
1
0.62 0.53 0.61 0.59 0.50 0.55 0.59 0.31 0.43 0.46 0.23 0.22 0.19
Una gráfica de puntos muestra una relación lineal sustancial. He aquí una salida MINITAB de un ajuste de cuadrados mínimos. [Nota: Existen varias inconsistencias entre los
datos dados en el artículo, la gráfica que allí aparece y la información resumida sobre un análisis de regresión.]
The regression equation is
Fermi pos = 0.7217 – 0.4327 Ge conc
S = 0.0737573
R-Sq = 80.2%
Analysis of Variance
Source
DF
Regression
Error
Total
1
11
12
R-Sq(adj) = 78.4%
SS
MS
F
P
0.241728
0.059842
0.301569
0.241728
0.005440
44.43
0.000
a. Obtenga una estimación de intervalo del cambio esperado
en la posición del nivel Fermi asociado con un incremento
de 0.1 en la concentración de Ge e interprete su estimación.
b. Obtenga una estimación de intervalo para la posición
media del nivel Fermi cuando la concentración es de 0.50
e interprete su estimación.
c. Obtenga un intervalo de valores factibles para la posición que resulta de una sola observación que ha de realizarse cuando la concentración es de 0.50, interprete su
intervalo y compare con el intervalo de b).
d. Obtenga intervalos de confianza simultáneos para la posición esperada cuando la concentración es de 0.3, 0.5 y
0.7; el intervalo de confianza conjunto deberá ser por lo
menos de 97%.
51. Remítase al ejemplo 12.12 en el cual x fracción volumétrica de óxidos/inclusiones y y % de alargamiento.
a. MINITAB dio sˆ 0ˆ 1(0.40) 0.0311 y sˆ0ˆ 1(1.20) 0.0352.
¿Por qué la primera desviación estándar estimada es más
pequeña que la segunda?
b. Use los resultados obtenidos con MINITAB de ejemplo
para calcular un intervalo de confianza de 95% para el
% de alargamiento esperado cuando la fracción volumétrica es 0.40.
c. Use los resultados obtenidos con MINITAB para calcular un intervalo de predicción de 95% para un solo valor
de % de alargamiento que ha de ser observado cuando la
fracción volumétrica es 1.20.
52. El grabado con plasma es esencial en la transferencia de patrones de líneas finas en procesos de semiconductores de
corriente. El artículo “Ion Beam-Assisted Etching of Aluminum with Chlorine “ (J. Electrochem. Soc., 1985: 20102012) da los datos adjuntos (tomados de una gráfica)
sobre flujo de cloro (x, en SCCM) a través de una tobera
utilizado en el mecanismo de grabado y en la velocidad de
grabado (y, en 100 A/min).
x
y
1.5
1.5
2.0
2.5
2.5
3.0
3.5
3.5
4.0
23.0 24.5 25.0 30.0 33.5 40.0 40.5 47.0 49.0
Las cantidades resumidas son xi 24.0, yi 312.5,
x 2i 70.50, xiyi 902.25, y2i 11 626.75, ˆ 0
6.448718, ˆ 1 10.602564.
a. ¿Especifica el modelo de regresión lineal simple una relación útil entre el flujo de cloro y la velocidad de grabado?
b. Estime el cambio promedio verdadero en la velocidad
de grabado asociado con un incremento de 1 SCCM en
la velocidad de flujo utilizando un intervalo de confianza de 95% e interprete el intervalo.
c. Calcule un intervalo de confianza de 95% para Y3.0, la
velocidad de grabado promedio verdadera cuando el flujo 3.0 ¿Ha sido estimado con precisión este promedio?
d. Calcule un intervalo de precisión de 95% para una sola
observación futura de velocidad de grabado que se realizará cuando el flujo 3.0. ¿Es probable que sea precisa la observación?
e. ¿Serían los intervalos de confianza y predicción de 95%
cuando el flujo 2.5 más ancho o más angosto que los
intervalos correspondientes de los incisos c) y d)? Responda sin que en realidad calcule los intervalos.
f. ¿Recomendaría calcular un intervalo de predicción de
95% para un flujo de 6.0? Explique.
53. Considere los siguientes cuatro intervalos basados en los
datos del ejemplo 12.4 (sección 12.2):
a. Un intervalo de confianza de 95% para la porosidad media cuando el peso unitario es de 110.
b. Un intervalo de confianza de 95% para la porosidad
cuando el peso unitario es de 110.
c. Un intervalo de confianza de 95% para la porosidad media cuando el peso unitario es de 115.
d. Un intervalo de confianza de 95% para la porosidad
cuando el peso unitario es de 115.
Sin calcular alguno de estos intervalos, ¿qué se puede decir
sobre sus anchos uno con respecto al otro?
54. La declinación de los abastos de agua en ciertas áreas de
Estados Unidos ha creado la necesidad de incrementar el
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:30 AM
Page 485
485
12.5 Correlación
conocimiento de las relaciones entre factores económicos
tales como rendimiento de cosechas y factores hidrológicos y
de suelos. El artículo “Variability of Soil Water Properties
and Crop Yield in a Sloped Watershed” (Water Resources
Bull., 1988: 281-288) da datos sobre cosechas de sorgo (y,
en g/m-surco) y distancia pendiente arriba (x, en m) en una
cuenca inclinada. En la tabla adjunta se dan observaciones
seleccionadas.
x
0
10
20
30
45
50
70
y
500
590
410
470
450
480
510
x
80
100
120
140
160
170
190
y
450
360
400
300
410
280
350
a. Construya una gráfica de puntos. ¿Parece ser factible este
modelo de regresión lineal simple?
b. Realice una prueba de la utilidad del modelo.
c. Estime el rendimiento promedio verdadero cuando la
distancia pendiente arriba es de 75 dando un intervalo de
valores factibles.
55. Verifique que en realidad V( ˆ 0 ˆ 1x) está dada por la expresión que aparece en el texto. [Sugerencia: V(diYi)
d 2i V(Yi).]
56. El artículo (“Bone Density and Insertion Torque as Predictors of Anterior Cruciate Ligament Graft Fixation Strength”
The Amer. J. of Sports Med., 2004: 1421-1429) dio los datos
adjuntos sobre par de torsión de inserción máximo (N · m) y
carga de cedencia (N), donde ésta mide la resistencia del injerto, correspondientes a 15 especímenes diferentes.
Torsión 1.8
Carga 491
2.2
477
1.9
598
1.3
361
2.1
605
2.2
671
1.6
466
Torsión 1.2
Carga 384
1.8
422
2.6
554
2.5
577
2.5
642
1.7
348
1.6
446
2.1
431
a. ¿Es posible que la carga de cedencia esté normalmente
distribuida?
b. Estime la carga de cedencia promedio verdadera calculando un intervalo de confianza de 95% e interprételo.
c. Los siguientes son resultados obtenidos con MINITAB
para la regresión de la carga de cedencia generada por el
momento de torsión. ¿Especifica el modelo de regresión
lineal simple una relación útil entre las variables?
Predictor
Constant
Torque
S = 73.2141
Coef
152.44
178.23
SE Coef
91.17
45.97
R–Sq = 53.6%
T
1.67
3.88
P
0.118
0.002
R–Sq(adj) = 50.0%
Source
DF
SS
MS
F
P
Regression
1
80554 80554 15.03 0.002
Residual Error 13
69684
5360
Total
14 150238
d. Los autores del artículo citado expresan: “Por consiguiente, no se puede sino concluir que los métodos basados en análisis de regresión simple no son clínicamente
suficientes para predecir la resistencia de fijación individual”. ¿Está de acuerdo? [Sugerencia: Considere predecir la carga de cedencia cuando el momento de torsión
es de 2.0.]
12.5 Correlación
Existen muchas situaciones en las que el objetivo al estudiar el comportamiento conjunto de
dos variables es ver si están relacionadas, en lugar de utilizar una para predecir el valor de la
otra. En esta sección, primero se desarrolla el coeficiente de correlación muestral r como
una medida de qué tan fuerte es la relación entre dos variables x y y en un muestra y luego
se relaciona r con el coeficiente de correlación # definido en el capítulo 5.
Coeficiente de correlación muestral r
Dados n pares de observaciones (x1, y1), (x2, y2), . . . , (xn, yn), es natural hablar de que x
y y tienen una relación positiva si las x grandes se aparean con y grandes y las x pequeñas
con y pequeñas. Asimismo, si las x grandes se aparean con y pequeñas y las x pequeñas
con y grandes, entonces se implica una relación negativa entre las variables. Considérese
la cantidad
n
n
Sxy (xi x)(yi y) xi yi
i1
i1
n
n
x y n
i
i1
i
i1
Entonces si la relación es fuertemente positiva, una xi por encima de la media x tenderá a aparearse con una yi por encima de la media y, de modo que (xi x)(yi y) 0 y este producto
también será positivo siempre que tanto xi como yi estén por debajo de sus medias respectivas.
De este modo una relación positiva implica que Sxy será positiva. Un argumento análogo demuestra que cuando la relación es negativa, Sxy será negativa, puesto que la mayoría de los productos (xi x)(yi y) seguirán siendo negativos. Esto se ilustra en la figura 12.19.
www.FreeLibros.me
c12_p446-499.qxd
486
3/12/08
CAPÍTULO 12
4:30 AM
Page 486
Regresión lineal simple y correlación
y
y
x
a)
x
b)
Figura 12.19 a) Gráfica de puntos con Sxy positiva; b) gráfica de puntos con Sxy negativa [ significa
(xi x )( yi y ) 0; y significa (xi x )( yi y ) 0].
Aunque Sxy parece ser una medida factible de la fuerza de una relación, aún no se sabe
qué tan positiva o negativa pueda ser. Por desgracia, Sxy tiene un serio defecto: Si se cambian las unidades de medición de x o y, se puede hacer que Sxy sea arbitrariamente grande
en magnitud o arbitrariamente próxima a cero. Por ejemplo, si Sxy 25 cuando x se
mide en metros, en ese caso Sxy 25 000 cuando x se mide en milímetros y 0.025 cuando
x está expresada en kilómetros. Una condición razonable para imponer cualquier medida de
qué tan fuerte es la relación entre x y y es que la medida calculada no deberá depender
de las unidades particulares utilizadas para medirlas. Esta condición se cumple modificando
Sxy para obtener el coeficiente de correlación muestral.
DEFINICIÓN
El coeficiente de correlación muestral para los pares n (x1, y1), . . . , (xn, yn) es
r
Ejemplo 12.15
Sxy
(x
i
x)
(y
i
y)
2
2
Sxy
(12.8)
S
xx
S
yy
Una evaluación precisa de la productividad del suelo es crítica para una planificación racional del uso del suelo. Desafortunadamente, como el autor del artículo “Productivity Ratings
Based on Soil Series” (Prof. Geographer, 1980: 158-163) argumenta, no es fácil obtener un
índice de productividad del suelo aceptable. Una dificultad es que la productividad está determinada en parte por el tipo de cosecha y la relación entre el rendimiento de dos cosechas
diferentes plantadas en el mismo suelo puede no ser muy fuerte. Como ilustración, el artículo
presenta los datos adjuntos sobre una cosecha de maíz x y una cosecha de cacahuates y
(mT/Ha) para ocho tipos diferentes de suelo.
x
2.4
3.4
4.6
3.7
2.2
3.3
4.0
2.1
y
1.33
2.12
1.80
1.65
2.00
1.76
2.11
1.63
Con xi 25.7, yi 14.40, x 2i 88.31, xiyi 46.856 y y2i 26.4324,
Sxx 88.31
(25.7)2
88.31 82.56 5.75
8
Syy 26.4324
Sxy 46.856
de donde
r
(14.40)2
0.5124
8
(25.7)(14.40)
0.5960
8
0.5960
5
.7
5
0
.5
1
2
4
www.FreeLibros.me
0.347
■
c12_p446-499.qxd
3/12/08
4:30 AM
Page 487
12.5 Correlación
487
Propiedades de r
Las propiedades más importantes de r son las siguientes:
1. El valor de r no depende de cuál de las dos variables estudiadas es x y cual es y.
2. El valor de r es independiente de las unidades en las cuales x y y estén medidas.
3. 1 r 1
4. r 1 si y sólo si todos los pares (xi, yi) quedan en una línea recta con pendiente positiva
y r 1 si y sólo si los pares (xi, yi) quedan en una línea recta con pendiente negativa.
5. El cuadrado del coeficiente de correlación muestral da el valor del coeficiente de determinación que resultaría de ajustar el modelo de regresión lineal simple, en símbolos
(r)2 r2.
La propiedad 1 contrasta con lo que sucede en el análisis de regresión, donde virtualmente todas las cantidades de interés (la pendiente estimada, la intersección y estimada,
s2, etc.) dependen de cuál de las variables sea tratada como la variable dependiente. Sin embargo, la propiedad 5 demuestra que la proporción de variación de la variable dependiente
explicada al ajustar el modelo de regresión lineal simple no depende de cuál variable desempeñe este rol.
La propiedad 2 equivale a decir que r no cambia si cada xi es reemplazada por cxi y si
cada yi es reemplazada por dyi (un cambio en la escala de medición), así como también si cada xi es reemplazada por xi a y yi por yi b (lo que cambia la ubicación de cero en el
eje de medición). Esto implica, por ejemplo, que r es el mismo si la temperatura se mide en
°F o °C.
La propiedad 3 dice que el valor máximo de r, correspondiente al grado más grande
posible de relación positiva, es r 1, mientras que la relación más negativa está identificada con r 1. De acuerdo con la propiedad 4, las correlaciones positivas y negativas más
grandes se obtienen sólo cuando todos los puntos quedan a lo largo de una línea recta. Cualquier otra configuración de puntos, aun cuando la configuración sugiere una relación determinística entre las variables, dará un valor r menor que 1 en magnitud absoluta. Por
consiguiente, r mide el grado de relación lineal entre las variables. Un valor de r cercano a
0 no es evidencia de la falta de una fuerte relación, sino sólo de la ausencia de una relación
lineal, de modo que tal valor de r debe ser interpretado con precaución. La figura 12.20 ilustra varias configuraciones de puntos asociadas con valores diferentes de r.
a) r cerca de 1
b) r cerca de 1
c) r cerca de 0, ninguna
relación aparente
d) r cerca de 0, relación
no lineal
Figura 12.20
Gráficas de puntos con valores diferentes de r.
www.FreeLibros.me
c12_p446-499.qxd
488
3/12/08
CAPÍTULO 12
4:31 AM
Page 488
Regresión lineal simple y correlación
Una pregunta frecuentemente planteada es “Cuándo se puede decir que existe una correlación fuerte entre las variables y cuándo es débil? Una regla empírica notable es decir
que la correlación es débil si 0 °r° 0.5, fuerte si 0.8 °r° 1, y moderada de lo contrario. Puede sorprender que r 0.5 se considere débil, pero r2 0.25 implica que en una
regresión de y en x, solo 25% de la variación de y observada sería explicada por el modelo.
En el ejemplo 12.15, la correlación entre la cosecha de maíz y la cosecha de cacahuates se
describiría como débil.
Coeficiente de correlación de una población
e inferencias sobre correlación
El coeficiente de correlación r mide qué tan fuerte es la relación entre x y y en la muestra
observada. Se puede pensar que los pares (xi, yi) se sacaron de una población de pares bivariantes, con f(x, y) como la distribución de probabilidad conjunta de (Xi, Yi). En el capítulo 5,
el coeficiente de correlación #(X, Y) se definió como
Cov(X, Y)
(X, Y)
X Y
donde
Cov(X, Y )
{
(x X)(y Y)p(x, y)
x y
(X, Y ) discreto
(x X)(y Y)f(x, y) dx dy
(X, Y ) continuo
Si se considera que f(x, y) describe la distribución de pares de valores dentro de toda la población, # se transforma en una medida de qué tan fuertemente están relacionadas x y y en
la población. Propiedades de # análogas a aquellas para r se dieron en el capítulo 5.
El coeficiente de correlación de la población # es un parámetro o característica de la
población, exactamente como lo son x, y, X y Y, así que se puede utilizar el coeficiente de correlación muestral para hacer varias inferencias sobre #. En particular, r es una estimación puntual de # y el estimador correspondiente es
ˆ R
Ejemplo 12.16
(Xi X
)(Yi Y)
(X
i
(Y
i
)
X
)
Y
2
2
En algunos lugares, existe una fuerte asociación entre las concentraciones de dos contaminantes diferentes. El artículo “The Carbon Component of the Los Angeles Aerosol: Source
Apportionment and Contributions to the Visibility Budget” (J. Air Pollution Control Fed.,
1984: 643-650) reporta los datos adjuntos sobre concentración de ozono x (ppm) y concentración de carbono secundaria y (g/m3).
x
0.066
0.088
0.120
0.050
0.162
0.186
0.057
0.100
y
4.6
11.6
9.5
6.3
13.8
15.4
2.5
11.8
x
0.112
0.055
0.154
0.074
0.111
0.140
0.071
0.110
y
8.0
7.0
20.6
16.6
9.2
17.9
2.8
13.0
x 2i
Las cantidades resumidas son n 16, xi 1.656, yi 170.6,
0.196912, xi yi
20.0397 y y2i 2253.56, de donde
20.0397 (1.656)(170.6)/16
r
0
0
.6
)2/1
6
2
2
5
3
.5
6
(
17
.1
9
6
9
1
2
(1
.6
5
6
)2/1
6
2.3826
0.716
(0.1597)(20.8456)
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:31 AM
Page 489
12.5 Correlación
489
La estimación puntual del coeficiente de correlación de la población # entre la concentración de ozono y la concentración de carbono secundaria es ˆ r 0.716.
■
Los intervalos de muestra pequeña y los procedimientos de prueba presentados en los
capítulos 7-9 se basaron en la suposición de normalidad de la población. Para probar las hipótesis sobre # se debe hacer una suposición análoga sobre la distribución de los pares de
valores (x, y) en la población. Ahora se supone que tanto X como Y son aleatorias, mientras
que una gran parte del trabajo de regresión se realizó con x fija:
SUPOSICIÓN
La distribución de probabilidad conjunta de (X, Y) está especificada por
f (x, y)
1
e[((x )/ ) 2(x )(y )/ ((y )/ ) ]/[2(1 )]
2 121
2
2
1
1
2
1
2
1
2
2
2
2
' x '
' y '
(12.9)
donde 1 y 1 son la desviación estándar y media de X, y 2 y 2 son la desviación
estándar y media de Y; f(x, y) se conoce como distribución de probabilidad normal
bivariante.
La distribución normal bivariante es obviamente un tanto complicada, pero para los
propósitos de este libro sólo se debe tener un conocimiento casual de varias de sus propiedades. La superficie determinada por f(x, y) se extiende por completo sobre el plano x,
y [f(x, y) 0] con apariencia de montículo o campana tridimensional, como se ilustra en
la figura 12.21. Si se rebana la superficie con cualquier plano perpendicular al plano x, y,
y se examina la curva dibujada en el “plano de corte”, el resultado es una curva normal. Más
precisamente, si X x, se puede demostrar que la distribución (condicional) de Y es normal
con media Yx 2 12/1 2x/1 y varianza (1 2) 22. Éste es exactamente el
modelo utilizado en la regresión lineal simple con 0 2 12/1, 1 2/1
y 2 (1 2) 22 independiente de x. La implicación es que si los pares observados
(xi, yi) en realidad se toman de una distribución normal bivariante, entonces el modelo de
regresión lineal simple es una forma apropiada de estudiar el comportamiento de Y con x
fija. Si # 0, entonces Yx 2 independiente de x; en realidad, cuando # 0 la función
de densidad de probabilidad conjunta f(x, y) de (12.9) puede ser factorizada en una parte que
comprende sólo x una parte que abarca sólo y, lo que implica que X y Y son variables independientes.
f (x, y)
y
x
Figura 12.21
Gráfica de la función de densidad de probabilidad normal bivariante.
Suponer que los pares se tomaron de una distribución normal bivariante permite probar
hipótesis sobre # y construir un intervalo de confianza. No existe una forma completamente
satisfactoria de verificar la factibilidad de la suposición de normalidad bivariante. Una verificación parcial implica construir dos gráficas de probabilidad normales distintas, una para las xi
www.FreeLibros.me
c12_p446-499.qxd
490
3/12/08
CAPÍTULO 12
4:31 AM
Page 490
Regresión lineal simple y correlación
de muestra y otra para las yi de muestra, puesto que la normalidad bivariante implica que las
distribuciones marginales tanto de X como de Y son normales. Si cualquiera de las gráficas
se aparta sustancialmente de un patrón de línea recta, no se deberán utilizar los siguientes
procedimientos inferenciales cuando el tamaño de muestra n es pequeño.
Prueba en cuanto a la ausencia de correlación
Cuando H0: # 0 es verdadera, el estadístico de prueba
T
Rn
2
1
R2
tiene una distribución t con n 2 grados de libertad.
Hipótesis alternativa
Región de rechazo para una prueba a nivel
Ha:
0
t
Ha:
0
t
Ha:
0
t
t,n2
t,n2
t/2,n2 o t
t/ 2,n2
Un valor P basado en n 2 grados de libertad puede ser calculado como previamente se describió.
Ejemplo 12.17
Los efectos neurotóxicos del manganeso son bien conocidos y normalmente son provocados por la prolongada exposición ocupacional durante largos lapsos de tiempo. En los campos de higiene ocupacional e higiene ambiental, la relación entre la peroxidación de lípidos, la
cual es responsable del deterioro de los alimentos y de los daños de tejidos vivos, y la exposición ocupacional no ha sido previamente reportada. El artículo “Lipid Peroxidation in
Workers Exposed to Manganese” (Scand. J. Work and Environ. Health, 1996: 381-386) reportó datos sobre x concentración de manganeso en sangre (ppb) y y concentración
(mol/L) de malondialdehído, el cual es el producto estable de la peroxidación de lípidos,
tanto para una muestra de 22 trabajadores expuestos a manganeso como para una muestra
de control de 45 individuos. El valor de r para la muestra de control fue de 0.29, por lo que
t
(0.29)45
2
2.0
1
(0
.2
9
)2
El valor P correspondiente para una prueba t de dos colas basada en 43 grados de libertad
es aproximadamente de 0.052 (el artículo citado reportó sólo que el valor P 0.05). No se
desearía rechazar la aseveración de que # 0 al nivel de significación de 0.01 o 0.05. Para
la muestra de trabajadores expuestos, r 0.83 y t 6.7, existe una clara evidencia de que
hay una relación lineal en toda la población de trabajadores expuestos de la cual se seleccionó la muestra.
■
Como # mide el grado al cual existe una relación lineal entre las dos variables en
la población, la hipótesis nula H0; # 0 manifiesta que no existe tal relación de población.
En la sección 12.3 se utilizó la relación t ˆ 1/sˆ para probar en cuanto a una relación lineal
entre las dos variables en el contexto de análisis de regresión. Resulta que los dos procedimientos de prueba son completamente equivalentes porque rn
2/ 1
r 2 ˆ 1/sˆ .
Cuando radica sólo en valorar la fuerza de cualquier relación lineal en lugar de ajustarse a
un modelo y utilizarlo para estimar o predecir, la fórmula del estadístico de prueba que se
acaba de presentar requiere menos cálculos que la relación t.
1
1
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:31 AM
Page 491
12.5 Correlación
491
Otras inferencias sobre
El procedimiento para H0: # #0 cuando #0 0 no es equivalente a cualquier procedimiento de análisis de regresión. El estadístico de prueba se basa en una transformación de R llamada transformación de Fisher.
PROPOSICIÓN
Cuando (X1, Y1), . . . , (Xn, Yn) es una muestra de una distribución normal bivariante, la
variable aleatoria
1R
1
ln
1R
2
V
(12.10)
tiene aproximadamente una distribución normal con media y varianza
V
1
1
ln
2
1
2V
1
n3
El razonamiento para la transformación es obtener una función de R que tenga una varianza independiente de #; éste no sería el caso con R misma. Además, no se deberá utilizar la
transformación si n es bastante pequeña, puesto que la aproximación no será válida.
El estadístico de prueba para probar H0: # #0 es
V
Z
Hipótesis alternativa
1
ln[(1 0)/(1 0)]
2
1/n
3
Región de rechazo para una prueba a nivel
Ha:
0
z
Ha:
0
z
z
Ha:
0
oz
z/2 o z
z
z/2
Se puede calcular un valor P del mismo modo que para pruebas z previas.
Ejemplo 12.18
El artículo “Size Effect in Shear Strength of Large Beams-Behavior and Finite Element Modelling” (Mag. of Concrete Res., 2005: 497-509) reportó sobre un estudio de varias características de grandes vigas de concreto reforzado bajas y profundas probadas hasta la falla.
Considere los siguientes datos sobre x resistencia de cubo y y resistencia de cilindro
en ambos MPa:
x
55.10
44.83
46.32
51.10
49.89
45.20
48.18
46.70
54.31
41.50
y
49.10
31.20
32.80
42.60
42.50
32.70
36.21
40.40
37.42
30.80
x
47.50
52.00
52.25
50.86
51.66
54.77
57.06
57.84
55.22
y
35.34
44.80
41.75
39.35
44.07
43.40
45.30
39.08
41.89
Entonces Sxx 367.74, Syy 488.54, Sxy 322.37, de donde r 0.761. ¿Proporciona
este valor una fuerte evidencia para concluir que las dos medidas de resistencia están por lo
menos moderada y positivamente relacionadas?
www.FreeLibros.me
c12_p446-499.qxd
492
3/12/08
CAPÍTULO 12
4:31 AM
Page 492
Regresión lineal simple y correlación
La interpretación previa de correlación positiva moderada fue 0.5 # 0.8, así que
se desea probar H0: # 0.5 contra Ha: # 0.5. El valor calculado de V es entonces
v 0.5 ln
1 0.761
1 0.761 0.999,
y
0.5 ln
1 0.5
1 0.5 0.549
Por consiguiente z (0.999 0.549) 19
3 1.80. El valor P para una prueba de cola
superior es 0.0359. La hipótesis nula por consiguiente puede ser rechazada a un nivel de significación de 0.05 pero no al nivel de 0.01. El último resultado en algo más sorprendente a
la luz de la magnitud de r, pero cuando n es pequeño, puede resultar un parámetro r
razonablemente grande aun cuando # no sea del todo sustancial. A nivel de significación de
0.01, la evidencia de una correlación moderadamente positiva no es convincente.
■
Para obtener un intervalo de confianza para #, primero se deriva un intervalo para
1
V 2 ln[(1 )/(1 )]. Estandarizando V, escribiendo una proposición de probabilidad
y manipulando las desigualdades resultantes se obtiene
z/2
z/2
v
,v
(12.11)
n
3
n
3
como intervalo de 100(1 )% para V, donde v 2 ln[(1 r)/(1 r)]. Este intervalo
puede entonces ser manipulado para dar un intervalo de confianza para #.
1
Un intervalo de confianza de 100(1 )% para # es
e2c 1
e
1
2c1
1
e2c 1
2
,
e2c 1
2
donde c1 y c2 son los puntos extremos izquierdo y derecho, respectivamente, del intervalo (12.11).
Ejemplo 12.19
El artículo “A Study of a Partial Nutrient Removal System for Wastewater Treatment Plants”
(Water Research, 1972: 1389-1397) reporta sobre un método de eliminación de nitrógeno
que implica el tratamiento del sobrenadante de un digestor aeróbico. Tanto el nitrógeno total afluente x (mg/L) como el porcentaje de nitrógeno eliminado se registraron durante
20 días, con los siguientes estadísticos resultantes xi 285.90, x 2i 4409.55, yi
690.30, y 2i 29 040.29 y xi yi 10 818.56. El coeficiente de correlación muestral entre
el nitrógeno afluente y el porcentaje de nitrógeno eliminado es r 0.733 y se obtiene
n 0.935. Con n 20, un intervalo de confianza de 95% para V (0.935 1.96/1
7, 0.935
7) (0.460, 1.410) (c1, c2). El intervalo de 95% para # es
1.96/1
e2(0.46) 1 e2(1.41) 1
,
(0.43, 0.89)
2(0.46)
1 e2(1.41) 1
e
■
En el capítulo 5, se advirtió que un valor grande del coeficiente de correlación (cercano a 1 o 1) implica sólo asociación y no causalidad. Esto es válido tanto para # como r.
EJERCICIOS
Sección 12.5 (57-67)
57. El artículo “Behavioural Effects of Mobile Telephone Use
During Simulated Driving” (Ergonomics, 1995: 2536-2562)
reportó que para una muestra de 20 sujetos experimentales,
el coeficiente de correlación muestral con x edad y y
tiempo desde que el sujeto obtuvo una licencia de manejo
(años) fue 0.97. ¿Por qué piensa que el valor de r se aproxima
tanto a uno? (Los autores del artículo dieron una explicación.)
58. El Turbine Oil Oxidation Test (TOST) y el Rotating Bomb
Oxidation Test (RBOT) son dos procedimientos diferentes
de evaluar la estabilidad ante la oxidación de aceites para
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:31 AM
Page 493
12.5 Correlación
turbina de vapor. El artículo “Dependence of Oxidation Stability of Steam Turbine Oil on Base Oil Composition” (J. of
the Society of Tribologists and Lubrication Engrs., octubre de 1997: 19-24) reportó las observaciones adjuntas sobre
x tiempo para realizar TOST (h) y y tiempo para realizar RBOT (min) con 12 especímenes de aceite.
TOST
RBOT
4200
370
3600
340
3750
375
3675
310
4050
350
2770
200
TOST
RBOT
4870
400
4500
375
3450
285
2700
225
3750
345
3300
285
a. Calcule e interprete el valor del coeficiente de correlación muestral (como lo hicieron los autores del artículo).
b. ¿Cómo se vería afectado el valor de r si se hubiera hecho
x tiempo para realizar RBOT y y tiempo para realizar TOST?
c. ¿Cómo se vería afectado el valor de r si el tiempo para
realizar RBOT estuviera expresado en horas?
d. Construya gráficas de probabilidad normal y comente.
e. Realice una prueba de hipótesis para decidir si el tiempo para realizar RBOT y el tiempo para realizar TOST
están linealmente relacionados.
59. La tenacidad y fibrosidad de los espárragos son determinantes importantes de su calidad. Éste fue el enfoque de un estudio reportado en “Post-Harvest Glyphosphate Application
Reduces Toughening, Fiber Content, and Lignification of
Stored Asparagus Spears” (J. of the Amer. Soc. of Horticultural Science, 1988: 569-572). El artículo reportó los datos
adjuntos (tomados de una gráfica) sobre x fuerza cortante (kg) y y porcentaje de peso de fibra en seco.
x
46
48
55
57
60
72
81
85
94
y
2.18 2.10 2.13 2.28 2.34 2.53 2.28 2.62 2.63
x
109
y
2.50 2.66 2.79 2.80 3.01 2.98 3.34 3.49 3.26
121
132
137
148
149
184
185 187
xi 1950, x 2i 251 970,
yi 47.92, y2i 130.6074, xiyi 5530.92
n 18,
a. Calcule el valor del coeficiente de correlación muestral.
Basado en este valor, ¿cómo describiría la naturaleza de
la relación entre las dos variables?
b. Si un primer espécimen tiene un valor más grande de
fuerza cortante que un segundo espécimen, ¿qué tiende a
ser cierto del porcentaje de peso de fibra en seco para los
dos especímenes?
c. Si la fuerza cortante se expresa en libras, ¿qué le pasa al
valor de r? ¿Por qué?
d. Si el modelo de regresión lineal simple fuera ajustado a
estos datos, ¿qué proporción de la variación observada
en porcentaje de peso de fibra en seco podría ser explicada por la relación de modelo?
e. Realice una prueba a un nivel de significación de 0.01
para decidir si existe una asociación lineal positiva entre
las dos variables.
60. El artículo “A Dual-Buffer Titration Method for Lime Requirement of Acid Mine-soils” (J. of Environ. Qual., 1988:
452-456) reporta sobre los resultados de un estudio en rela-
493
ción con la reforestación del suelo en sitios de restauración
de minas. Con x KCl aluminio extraíble y y cantidad de
cal requerida para llevar el pH del suelo a 7.0, los datos que
aparecen en el artículo dieron por resultado las siguientes
cantidades resumidas: n 24, x 48.15, x2
155.4685, y 263.5, y2 3750.53 y xy 658.455.
Realice una prueba a un nivel de significación de 0.01 para
ver si el coeficiente de correlación de la población es un valor diferente de 0.
61. Los autores del artículo “Objective Effects of a Six Months’
Endurance and Strength Training Program in Outpatients
with Congestive Heart Failure” (Medicine and Science in
Sports and Exercise, 1999: 1102-1107) presentó un análisis
de correlación para investigar la relación entre el nivel de
lactato máximo x y la resistencia muscular y. Los datos adjuntos se tomaron de una gráfica incluida en el artículo.
x
400
750
770
800
850
1025
1200
y
3.80
4.00
4.90
5.20
4.00
3.50
6.30
x
1250
1300
1400
1475
1480
1505
2200
y
6.88
7.55
4.95
7.80
4.45
6.60
8.90
Sxx 36.9839, Syy 2 628 930.357, Sxy 7377.704. Una
gráfica de puntos muestra un patrón lineal.
a. Realice una prueba para ver si existe una correlación
positiva entre el nivel de lactato máximo y la resistencia
muscular en la población de la cual se seleccionaron estos datos.
b. Si se tuviera que realizar un análisis de regresión para predecir resistencia a consecuencia del nivel de lactato, ¿qué
proporción de variación observada en la resistencia podría
ser atribuida a la relación lineal aproximada? Responda la
pregunta análoga si se utiliza regresión para predecir el
nivel de lactato a partir de la resistencia, y responda ambas preguntas sin que realice ningún cálculo de regresión.
62. Se conjetura que el contenido de hidrógeno es un factor importante en la porosidad de piezas fundidas de aleación de
aluminio. El artículo “The Reduced Pressure Test as a Measuring Tool in the Evaluation of Porosity/Hydrogen Content
in A1-7 Wt Pct Si-10 Vol Pct SiC(p) Metal Matrix Composite” (Metallurgical Trans., 1993: 1857-1868) da los datos
adjuntos sobre x contenido y y porosidad al gas para
una técnica de medición particular.
x
0.18 0.20 0.21 0.21 0.21 0.22 0.23
y
0.46
0.70
0.41
0.45
0.55
0.44
0.24
x
0.23
0.24
0.24
0.25
0.28
0.30
0.37
y
0.47
0.22
0.80
0.88
0.70
0.72
0.75
MINITAB da los siguientes resultados en respuesta al comando de CORRELATION:
Correlation of Hydrcon and
Porosity 0.449
a. Pruebe a un nivel de 0.05 para ver si el coeficiente de correlación de la población difiere de 0.
b. Si se hubiera realizado un análisis de regresión lineal
simple, ¿qué porcentaje de la variación observada en la
porosidad podría ser atribuida a la relación de modelo?
www.FreeLibros.me
c12_p446-499.qxd
494
3/12/08
4:31 AM
Page 494
Regresión lineal simple y correlación
CAPÍTULO 12
63. Se investigaron las propiedades físicas de seis muestras de
tela retardante a las llamas en el artículo “Sensory and Physical Properties of Inherently Flame-Retardant Fabrics” (Textile
Research, 1984: 61-68. Use los datos adjuntos y un nivel de
significación de 0.05 para determinar si existe una relación lineal entre la rigidez x (mg-cm) y espesor y (mm). ¿Es sorprendente el resultado de la prueba a la luz del valor de r?
x
7.98
24.52
12.47
6.92
24.11
35.71
y
0.28
0.65
0.32
0.27
0.81
0.57
64. El artículo “Increases in Steroid Binding Globulins Induced
by Tamoxifen in Patients with Carcinoma of the Breast”
(J. Endocrinology, 1978: 219-226) reporta datos sobre los
efectos de la droga tamoxifeno en el cambio del nivel de
globulina afín al cortisol (CBG, por sus siglas en inglés,
cortisol-binding globulin) de pacientes durante el tratamiento. Con la edad x y CBG y, los valores resumidos son
n 26, xi 1613, (xi x)2 3756.96, yi 281.9,
(yi y)2 465.34 y xiyi 16 731.
a. Calcule un intervalo de confianza de 90% para el coeficiente de correlación verdadero #.
b. Pruebe H0: # 0.5 contra Ha: # 0.5 al nivel de 0.05.
c. En un análisis de regresión de y en relación con x, ¿qué
proporción de la variación del cambio del nivel de globulina afín al cortisol podría ser explicado por la variación de la edad del paciente dentro de la muestra?
d. Si decide realizar un análisis de regresión con la edad
como variable dependiente, ¿qué proporción de la variación de la edad es explicable por la variación del
BCG?
65. El artículo “Chronological Trend in Blood Lead Levels” (N.
Engl. J. Med., 1983: 1373-1377) da los siguientes datos sobre y promedio del nivel de plomo en la sangre de niños
blancos de seis meses a cinco años y x cantidad de plomo utilizado en la producción de gasolina (en 1000 toneladas) durante diez periodos de seis meses:
x
48
59
79
80
95
y
9.3
11.0
12.8
14.1
13.6
x
95
97
102
102
107
y
13.8
14.6
14.6
16.0
18.2
a. Construya gráficas de probabilidad normales distintas
para x y y. ¿Piensa que es razonable suponer que los pares (x, y) provienen de una población normal bivariante?
b. ¿Proporcionan los datos suficiente evidencia para concluir que existe una relación lineal entre el nivel de plomo en la sangre y la cantidad de plomo utilizado en la
producción de gasolina? Use 0.01.
66. Considere una serie de tiempo, es decir, una secuencia de
observaciones X1, X2, . . . obtenidas durante el transcurso
del tiempo, con valores observados x1, x2, . . . , xn. Suponga
que la serie no muestra tendencia hacia arriba o hacia abajo durante el transcurso del tiempo. Un investigador con
frecuencia deseará saber qué tan fuertemente están relacionados los valores en la serie separados por un número especificado de unidades de tiempo. El coeficiente de autocorrelacion
muestral correspondiente a un retardo r1 es simplemente el
valor del coeficiente de correlación muestral r de los pares
(x1, x2), (x2, x3), . . . , (xn1, xn), es decir, pares de valores separados por una unidad de tiempo. Asimismo, el coeficiente de autocorrelación muestral correspondiente a dos
retardos r2 es r para los n 2 pares (x1, x3), (x2, x4), . . . ,
(xn2, xn).
a. Calcule los valores de r1, r2 y r3 para los datos de temperatura del ejercicio 82 del capítulo 1 y comente.
b. Análogo al coeficiente de correlación de la población #,
sean #1, #2, . . . los coeficientes de autocorrelación teóricos o de largo plazo con los varios retardos. Si todos estos # son 0, no existe relación (lineal) con cualquier
retraso. En este caso, si n es grande, cada Ri tiene aproximadamente una distribución normal con media 0 y desviación estándar 1/
n y los Ri diferentes son casi
independientes. Por consiguiente H0: #i 0 puede ser rechazada a un nivel de significación de aproximadamente
0.05 si ri 2/
n o ri 2/n. ¿Si n 100 y r1
0.16, r2 0.09 y r3 0.15, existe alguna evidencia
de autocorrelación teórica con los primeros tres retrasos?
c. Si prueba simultáneamente la hipótesis nula del inciso b)
con más de un retraso, ¿por qué podría desear incrementar la constante de corte 2 en la región de rechazo?
67. Se recopiló una muestra de n 500 pares (x, y) y se realizó una prueba de H0: # 0 contra Ha: # 0. El valor P
resultante se calculó como 0.00032.
a. ¿Qué conclusión sería apropiada a nivel de significación
de 0.001?
b. ¿Indica este pequeño valor P que existe una relación
muy fuerte entre x y y (un valor de # que difiera considerablemente de 0)? Explique.
c. Suponga ahora que una muestra de n 10 000 pares
(x, y) dio por resultado r 0.022. Pruebe H0: # 0 contra Ha: # 0 a un nivel de 0.05. ¿Es el resultado estadísticamente significativo? Comente sobre la significación
práctica de su análisis.
EJERCICIOS SUPLEMENTARIOS (68-87)
68. El avalúo de un almacén puede parecer sencillo en comparación con otras asignaciones de avalúo. El avalúo de un
almacén implica comparar una edificación que es principalmente un armazón abierto con otros edificios semejantes.
Sin embargo, sigue habiendo varios atributos de un almacén
que están posiblemente relacionados con el valor apreciado.
El artículo “Challenges In Appraising ‘Simple’ Warehouse
Properties” (Donald Sonneman, The Appraisal Journal,
abril de 2001, 174-178) dio los datos adjuntos sobre la altura del armazón (pies), el cual determina qué tan alto pueden
ser apilados los productos almacenados y el precio de venta
($) por pie cuadrado.
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:31 AM
Page 495
Ejercicios suplementarios
diente y, así que el modelo de regresión es %DAA 0 1x
. Después de estimar los coeficientes de regresión, se puede sustituir y* 2.01 en la ecuación estimada y luego resolverla para una predicción de edad x̂. Este uso “inverso” de
la línea de regresión se llama “calibración”. Un intervalo
de predicción para edad con nivel de predicción aproximadamente de 100(1 )% es x̂ ! t(2,n2 SE donde
Altura: 12
14
14
15
15
16
18
22
22
24
Precio: 35.53 37.82 36.90 40.00 38.00 37.50 41.00 48.50 47.00 47.50
Altura del
armazón:
24
26 26
27
28
30
30
33 36
Precio de venta: 46.20 50.35 49.13 48.07 50.90 54.78 54.32 57.17 57.45
a. ¿Es el caso que la altura del armazón y el precio de venta
están “determinísticamente” relacionados, es decir, que el
precio de venta está determinado por completo y únicamente por la altura del armazón? [Sugerencia: Examine
los datos.]
b. Construya una gráfica de puntos de los datos. ¿Qué sugieren?
c. Determine la ecuación de la línea de mínimos cuadrados.
d. Dé una predicción puntual del precio cuando la altura
del armazón es de 27 pies y calcule el residuo correspondiente.
e. ¿Qué porcentaje de la variación observada del precio de
venta puede ser atribuido a la relación lineal aproximada entre la altura del armazón y el precio?
69. Remítase al ejercicio previo, el cual dio datos sobre alturas
de armazones para una muestra de almacenes y los precios de
venta correspondientes.
a. Estime el cambio promedio verdadero del precio de venta asociado con un pie de incremento de la altura del armazón y hágalo de modo que dé información sobre la
precisión de la estimación.
b. Estime el precio de venta verdadero de todos los almacenes cuya altura de armazón es de 25 pies y hágalo de modo que dé información sobre la precisión de la estimación.
c. Pronostique el precio de venta de un solo almacén cuya
altura de armazón es de 25 pies y hágalo de modo que
dé información sobre la precisión de la predicción. ¿Cómo se compara esta predicción con la estimación de b)?
d. Sin calcular ningún intervalo, ¿cómo se compararía el
ancho de un intervalo de predicción de 95% con el precio de venta cuando la altura del armazón es de 25 pies
con el ancho de un intervalo de 95% cuando la altura es de
30 pies? Explique su razonamiento.
e. Calcule e interprete el coeficiente de correlación muestral.
70. Con frecuencia, a los científicos forenses les interesa realizar alguna clase de medición en un cuerpo (vivo o muerto)
y luego utilizarla como base para inferir algo sobre la edad
del cuerpo. Considere los datos adjuntos sobre edad (años) y
% de ácido aspértico D (de aquí en adelante %DAA) de una
pieza dental particular (“An Improved Method for Age at
Death Determination from the Measurements of D-Aspertic
Acid in Dental Collagen”, Archaeometry, 1990: 61-70.)
Edad:
9
10 11 12 13 14 33 39 52 65 69
%DAA: 1.13 1.10 1.11 1.10 1.24 1.31 2.25 2.54 2.93 3.40 4.55
Suponga que una pieza dental de otro individuo tiene
2.01%DAA. ¿Podría ser que el individuo tenga menos de
22 años? Esta pregunta era pertinente para considerar si el
individuo podía o no ser sentenciado a cadena perpetua por
homicidio.
Una estrategia aparentemente sensible es retroceder la
edad en %DAA y entonces calcular un intervalo de predicción para la edad cuando %DAA 2.01. No obstante, es
más natural en este caso considerar la edad como la variable independiente x y el %DDA como la variable depen-
495
SE
s
ˆ1
1
(x̂ x )2 1/2
1
n
Sxx
Calcule este intervalo de predicción para y* 2.01 y luego
aborde la pregunta previamente planteada.
71. Los datos adjuntos sobre x tasa de consumo de diesel medida por el método pesaje de drenaje y y tasa medida por
el método de trazado de intervalo de confianza, ambos en
g/h, se tomaron de una gráfica incluida en el artículo “A
New Measurement Method of Diesel Engine Oil Consumption Rate” (J. Society Auto Engr., 1985: 28-33).
x
4 5
8 11 12 16 17 20 22 28 30 31 39
y
5 7 10 10 14 15 13 25 20 24 31 28 39
a. Suponiendo que x y y están relacionadas por el modelo
de regresión lineal simple, realice una prueba para decidir si es factible que en promedio el cambio de la tasa
medida por el método de trazado de intervalo de confianza sea idéntico al cambio de la tasa medido mediante el método de pesaje de drenaje.
b. Calcule e interprete el valor del coeficiente de correlación muestral.
72. Los resultados SAS que aparecen en la siguiente página están basados en datos tomados del artículo “Evidence for
and the Rate of Denitrification in the Arabian Sea” (Deep
Sea Research, 1978: 431-435). Las variables estudiadas son
x nivel de salinidad (%) y y nivel de nitrato (M/L).
a. ¿Cuál es el tamaño de muestra n? [Sugerencia: Busque
los grados de libertad para SCE.]
b. Calcule una estimación puntual del nivel de nitrato esperado cuando el nivel de salinidad es de 35.5.
c. ¿Parece haber una relación lineal útil entre las dos variables?
d. ¿Cuál es el valor del coeficiente de correlación muestral?
e. ¿Utilizaría el modelo de regresión lineal simple para
sacar conclusiones cuando el nivel de salinidad es de 40?
73. La presencia de carburos de aleación duros en aleaciones de
hierro blanco al alto cromo produce una excelente resistencia a la abrasión, lo que las hace apropiadas para el manejo
de materiales en las industrias mineras y de procesamiento de
materiales. Los datos adjuntos sobre x contenido de austenita retenido (%) y y pérdida por desgaste abrasivo (mm3)
en prueba de desgaste de alfileres con granate como el abrasivo se tomaron de una gráfica que aparece en el artículo
“Microstructure-Property Relationships in High Chromium
White Iron Alloys” (Intl. Materials Reviews, 1996: 59-82).
x
4.6
y
0.66 0.92 1.45 1.03 0.70 0.73 1.20 0.80 0.91
x
38.8 48.2 63.5 65.8 73.9 77.2 79.8 84.0
y
1.19 1.15 1.12 1.37 1.45 1.50 1.36 1.29
www.FreeLibros.me
17.0 17.4 18.0 18.5 22.4 26.5 30.0 34.0
c12_p446-499.qxd
496
3/12/08
CAPÍTULO 12
4:31 AM
Page 496
Regresión lineal simple y correlación
Resultados obtenidos con SAS para el ejercicio 72
Dependent Variable: NITRLVL
Analysis of Variance
Source
Model
Error
C Total
DF
1
6
7
Root MSE
Dep Mean
C.V.
Sum of Squares
Mean Square
64.49622
6.11253
70.60875
1.00933
26.91250
3.75043
SS Resid
F Value
64.49622
1.01875
R-square
Adj R-sq
Prob F
63.309
0.0002
0.9134
0.8990
Parameter Estimates
Variable
DF
Parameter
Estimate
Standard
Error
T for HO:
Parameter 0
Prob :T:
INTERCEP
SALINITY
1
1
326.976038
8.403964
37.71380243
1.05621381
8.670
7.957
0.0001
0.0002
Use los datos y los resultados obtenidos con SAS proporcionados a continuación para responder las siguientes preguntas.
a. ¿Qué proporción de la variación observada de pérdida
por desgaste puede ser atribuida a la relación de modelo
de regresión lineal simple?
b. ¿Cuál es el valor del coeficiente de correlación muestral?
c. Pruebe la utilidad del modelo de regresión lineal simple
con 0.01.
d. Estime la pérdida por desgaste promedio verdadera
cuando el contenido es de 50% y hágalo de modo que dé
información sobre confiabilidad y precisión.
e. ¿Qué valor de pérdida por desgaste predeciría cuando el
contenido es de 30% y cuál es valor del residuo correspondiente?
74. Los datos adjuntos se leyeron en una gráfica de puntos del
artículo “Urban Emissions Measured with Aircraft” (J. of
the Air and Waste Mgmt. Assoc., 1998: 16-25). La variable
de respuesta es NOy y la variable explicativa es CO.
CO
NOy
50
2.3
60
4.5
95
4.0
108
3.7
CO
NOy
210
5.4
214
7.2
315
13.8
720
32.1
135
8.2
a. Adapte un modelo apropiado a los datos y juzgue la utilidad del modelo.
b. Pronostique el valor de NOy que se obtendría al realizar una observación más cuando CO es 400 y hágalo
de modo que dé información sobre precisión y confiabilidad. ¿Parece que el NOy puede ser pronosticado con
precisión? Explique.
Resultados obtenidos con SAS para el ejercicio 73
Dependent Variable: ABRLOSS
Analysis of Variance
Source
DF
Sum of Squares
Mean Square
F Value
Prob F
Model
Error
C Total
1
15
16
0.63690
0.61860
1.25551
0.63690
0.04124
15.444
0.0013
Root MSE
Dep Mean
C.V.
0.20308
1.10765
18.33410
R-square
Adj R-sq
0.5073
0.4744
Parameter Estimates
Variable
DF
Parameter
Estimate
INTERCEP
AUSTCONT
1
1
0.787218
0.007570
Standard
Error
T for H0:
Parameter 0
Prob °T°
0.09525879
0.00192626
8.264
3.930
0.0001
0.0013
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:31 AM
Page 497
Ejercicios suplementarios
c. El valor más grande de CO es mucho más grande que
los demás valores. ¿Ha tenido esta observación un impacto sustancial en la ecuación adaptada?
75. Se estudió la relación entre la velocidad (pies/s) y la cadencia al correr (número de pasos/s) entre corredoras de maratón. Las cantidades resumidas resultantes fueron n 11,
(velocidad) 205.4, (velocidad)2 3880.08, (cadencia) 35.16, (cadencia)2 112.681 y (velocidad/cadencia) 660.130.
a. Calcule la ecuación de la recta de mínimos cuadrados
que utilizaría para predecir la cadencia a partir de la velocidad.
b. Calcule la ecuación de la recta de mínimos cuadrados
que utilizaría para predecir la velocidad a partir de la cadencia.
c. Calcule el coeficiente de determinación para la regresión de la cadencia basada en la velocidad del inciso a)
y para la regresión de la velocidad basada en la cadencia
del inciso b). ¿Cómo están relacionadas?
76. “Mezclabilidad de modos” se refiere a cuánto de la propagación de grietas es atribuible a los tres modos de fractura convencionales de abertura, deslizamiento o desgarro. Para
problemas de aviones, sólo los dos primeros modos están
presentes y el ángulo de mezclabilidad de modos mide el
grado al cual la propagación se debe a deslizamiento en oposición a abertura. El artículo “Increasing Allowable Flight
Loads by Improved Structural Modeling” (AIAA J., 2006:
376-381) dio los siguientes datos sobre x ángulo de mezclabilidad de modos (grados) y y tenacidad a la fractura
(N/m) de paneles utilizados en la construcción de aviones.
x
16.52 17.53 18.05 18.50 22.39 23.89 25.50
24.89
y
609.4 443.1 577.9 628.7 565.7 711.0 863.4
956.2
x
23.48 24.98 25.55 25.90 22.65 23.69 24.15
24.54
679.5 707.5 767.1 817.8 702.3 903.7 964.9 1047.3
a. Obtenga la ecuación de la recta de regresión estimada y
discuta el grado al cual el modelo de regresión lineal
simple es una forma razonable de relacionar la tenacidad
a la fractura con el ángulo de mezclabilidad de modos.
b. ¿Sugieren los datos que el cambio promedio de la tenacidad a la fractura asociado con un incremento de un
grado del ángulo de mezclabilidad de modos excede de
50 N/m? Realice una prueba apropiada de hipótesis.
c. Para propósitos de estimación con precisión de la pendiente de la recta de regresión de la población, ¿hubiera
sido preferible realizar observaciones a los ángulos 16,
16, 18, 18, 20, 20, 20, 20, 22, 22, 22, 22, 24, 24, 26 y 26
(de nuevo un tamaño de muestra de 16)? Explique su razonamiento.
d. Calcule una estimación de tenacidad a la fractura promedio verdadera y también una predicción de tenacidad
a la fractura tanto para un ángulo de 18 grados como para
un ángulo de 22 grados y hágalo de modo que dé información sobre confiabilidad y precisión y luego interprete y compare las estimaciones y predicciones.
77. El artículo “Photocharge Effects in Dye Sensitized Ag[Br,I]
Emulsions at Millisecond Range Exposures” (Photographic
Sci. and Engr., 1981: 138-144) da los datos adjuntos sobre
497
x % de absorción de luz a 5800 A y y fotovoltaje
máximo.
78.
x
4.0
8.7
12.7
19.1
21.4
y
0.12
0.28
0.55
0.68
0.85
x
24.6
28.9
29.8
30.5
y
1.02
1.15
1.34
1.29
a. Construya una gráfica de puntos de estos datos. ¿Qué
sugieren?
b. Suponiendo que el modelo de regresión lineal simple es
apropiado, obtenga la ecuación de la recta de regresión
estimada.
c. ¿Qué proporción de la variación observada del fotovoltaje
máximo puede ser explicado por la relación de modelo?
d. Pronostique el fotovoltaje máximo cuando el % de absorción es de 19.1 y calcule el valor del residuo correspondiente.
e. Los autores del artículo manifiestan que existe una relación lineal útil entre el % de absorción y el fotovoltaje
máximo. ¿Está de acuerdo? Realice una prueba formal.
f. Dé una estimación del cambio del fotovoltaje máximo
esperado asociado con un incremento de 1% de la absorción de luz. Su estimación deberá informar sobre la precisión de la estimación.
g. Repita el inciso f) del valor esperado del fotovoltaje
máximo cuando el % de absorción de luz es de 20.
En la sección 12.4, se presentó una fórmula para V(ˆ0 ˆ 1x*)
y un intervalo de confianza para 0 1x*. Considerando
x* 0 se obtiene 2ˆ y un intervalo de confianza para 0.
Use los datos del ejemplo 12.11 para calcular la desviación
estándar estimada de ˆ 0 y un intervalo de confianza de 95%
para la intersección y de la línea de regresión verdadera.
Demuestre que SCE Syy ˆ 1Sxy, la cual da una fórmula
alternativa para SCE.
Suponga que x y y son variables positivas y que una muestra de n pares da r 1. Si el coeficiente de correlación
muestral se calcula para los pares (x, y2), ¿será el valor resultante también aproximadamente 1? Explique.
Sean sx y sy las desviaciones estándar muestrales de las x y y
observadas, respectivamente [así que s 2x (xi x)2/
(n 1) y asimismo para s 2y ].
a. Demuestre que una expresión alternativa para la línea de
regresión estimada y ˆ 0 ˆ 1x es
0
79.
y
80.
81.
y y r
sy
sx
(x x)
b. Esta expresión para la línea de regresión puede ser interpretada como sigue. Suponga r 0.5. ¿Cuál es entonces
la y pronosticada con una x situada a una desviación estándar (sx unidades) sobre la media de las xi? Si r fuera
una, la predicción sería para que y quede a una desviación estándar sobre su media y, pero como r 0.5, se
pronostica una y que está a sólo 0.5 desviaciones estándar (0.5sy unidad) sobre y. Con los datos del ejercicio 64
para un paciente cuya edad está a una desviación estándar
por debajo de la edad promedio en la muestra, ¿a cuántas
desviaciones estándar se pronostica que esté el CBG
www.FreeLibros.me
c12_p446-499.qxd
498
3/12/08
CAPÍTULO 12
4:31 AM
Page 498
Regresión lineal simple y correlación
pronosticado del paciente por encima o por debajo del
CBG promedio para la muestra?
82. Verifique que el estadístico t de prueba para probar H0:
1 0 en la sección 12.3 es idéntico al estadístico t en la
sección 12.5 para probar H0: # 0.
83. Use la fórmula para calcular SCE para comprobar que r2
1 SCE/STC.
84. En la biofiltración de aguas residuales, se hace que el aire
descargado por una planta de tratamiento pase a través de una
membrana porosa húmeda que disuelve los contaminantes en
el agua y los transforma en productos inocuos. Los datos adjuntos sobre x temperatura de entrada (°C) y y eficiencia de eliminación (%) fueron la base para una gráfica de
puntos que apareció en el artículo “Treatment of Mixed
Hydrogen Sulfide and Organic Vapors in a Rock Medium
Biofilter” (Water Environment Research, 2001: 426-435).
¿Qué impacto tiene esta observación adicional en la
ecuación de la línea de mínimos cuadrados y los valores
de s y r2?
85. Los procesos normales de incubación en acuacultura inevitablemente producen tensión en los peces, la cual puede impactar negativamente el crecimiento, reproducción y calidad
de la carne y susceptibilidad a enfermedades. Tal tensión
se pone de manifiesto en los elevados y sostenidos niveles
de corticosteroides. El artículo “Evaluation of Simple Instruments for the Measurement of Blood Glucosa and
Lactate and Plasma Protein as Stress Indicators in Fish”
(J. of the World Aquaculture Society, 1999: 276-284) describió un experimento en el cual los peces se sometieron a un
protocolo de tensión y luego se suspendió y se sometieron a
prueba en varias ocasiones después de que se aplicó el protocolo. Los datos adjuntos sobre x tiempo (min) y y nivel de glucosa en sangre (mmol/L) se leyeron en la gráfica.
Temp
% de eliminación
Obs
Temp
% de eliminación
x
Obs
y
4.0 3.6 3.7 4.0 3.8 4.0 5.1 3.9 4.4 4.3 4.3 4.4
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
7.68
6.51
6.43
5.48
6.57
10.22
15.69
16.77
17.13
17.63
16.72
15.45
12.06
11.44
10.17
9.64
98.09
98.25
97.82
97.82
97.82
97.93
98.38
98.89
98.96
98.90
98.68
98.69
98.51
98.09
98.25
98.36
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
8.55
7.57
6.94
8.32
10.50
16.02
17.83
17.03
16.18
16.26
14.44
12.78
12.25
11.69
11.34
10.97
98.27
98.00
98.09
98.25
98.41
98.51
98.71
98.79
98.87
98.76
98.58
98.73
98.45
98.37
98.36
98.45
x
29
y
5.8 4.3 5.5 5.6 5.1 5.7 6.1 5.1 5.9 6.8 4.9 5.7
Las cantidades calculadas son xi 384.26, yi
3149.04, x 2i 5099.2412, xiyi 37 850.7762 y y 2i
309 892.6548.
a. Sugieren una gráfica de puntos de los datos la pertinencia del modelo de regresión lineal simple?
b. Ajuste el modelo de regresión lineal simple, obtenga una
predicción puntual de la eficiencia de eliminación cuando la temperatura 10.50 y calcule el valor del residuo
correspondiente.
c. Aproximadamente, ¿cuál es el tamaño de una desviación típica de puntos en la gráfica con respecto a la línea
de mínimos cuadrados?
d. ¿Qué proporción de la variación observada de la eficiencia de eliminación puede ser atribuida a la relación de
modelo?
e. Estime el coeficiente de pendiente de modo que informe
sobre confiabilidad y precisión e interprete su estimación.
f. Comunicación personal con los autores del artículo reveló que no hubo ninguna observación adicional que no
estuvo incluida en su gráfica de puntos: (6.53, 96.55).
2
2
30
5
34
7
36
12
40
13
41
17
44
18
56
23
56
24
57
26
60
28
60
Use los métodos desarrollados en este capítulo para analizar
los datos y escriba un breve reporte que resuma sus conclusiones (suponga que los investigadores están particularmente interesados en el nivel de glucosa 30 min después de la
tensión).
86. El artículo “Evaluating the BOD POD for Assessing Body
Fat in Collegiate Football Players” (Medicine and Science
in Sports and Exercise, 1999: 1350-1356) reporta sobre un
nuevo dispositivo de desplazamiento de aire para medir la
grasa corporal. El procedimiento acostumbrado utiliza dispositivo hidrostático de pesar, el cual mide el porcentaje de
masa corporal por medio del desplazamiento del agua. Los
siguientes son datos representativos tomados de una gráfica
que aparece en el artículo.
BOD 2.5 4.0 4.1 6.2 7.1
HW
7.0 8.3
9.2
9.3 12.0 12.2
8.0 6.2 9.2 6.4 8.6 12.2 7.2 12.0 14.9 12.1 15.3
BOD 12.6 14.2 14.4 15.1 15.2 16.3 17.1 17.9 17.9
HW
14.8 14.3 16.3 17.9 19.5 17.5 14.3 18.3 16.2
a. Use varios métodos para decidir si es posible que las dos
técnicas midan o promedien la misma cantidad de grasa.
b. Use los datos para desarrollar una forma de predecir un
peso hidróstatico a partir de una medición BOD POD e
investigue la efectividad de tales predicciones.
87. Reconsidere la situación del ejercicio 73, en el cual x
contenido de austenita retenida utilizando un abrasivo de
granate y y pérdida por desgaste abrasivo se relacionaron
vía el modelo de regresión lineal simple Y 0 1x .
Suponga que con un segundo tipo de abrasivo, estas variables también están relacionadas vía el modelo de regresión
lineal simple Y 0 1x y que V(') 2 para ambos tipos de abrasivo. Si el conjunto de datos se compone
www.FreeLibros.me
c12_p446-499.qxd
3/12/08
4:31 AM
Page 499
Bibliografía
de n1 observaciones del primer abrasivo y n2 del segundo
y si SCE1 y SCE2 denotan las dos sumas de cuadrados debido al error, entonces una estimación agrupada de 2 es
ˆ 2 (SCE1 SCE2)/(n1 n2 4). Sean SCx1 y SCx2
(xi x)2 con los datos del primero y segundo abrasivos,
respectivamente. Una prueba de H0: 1 1 0 (pendientes iguales) está basada en el estadístico
ˆ 1 ˆ1
T
ˆ
499
Cuando H0 es verdadera, T tiene una distribución t con
n1 n2 4 gl. Suponga 15 observaciones usando la elasticidad abrasiva alternativa dada por SCx2 7152.5578, ˆ1
0.006845, y SCE2 0.51350. Usando esto junto con los
datos del ejercicio 73, realice una pueba en el nivel 0.05
para ver si el cambio previsto por pérdida en el desgaste
asociado a 1% de incremento en el contenido de austerita
es idéntico para los dos tipos de abrasivo.
SCSC
1
x1
1
x2
Bibliografía
Draper, Norman y Harry Smith, Applied Regression Analysis
(3a. ed.). Wiley, Nueva York, 1999. El libro más completo y
autorizado sobre análisis de regresión actualmente en proceso de impresión.
Neter, John, Michael Kutner, Christopher Nachsheim y William
Wasserman, Applied Linear Statistical Models (4a. ed.). Irwin,
Homewood, IL., 1996. Los primeros 15 capítulos constituyen
un estudio extremadamente fácil de leer e informativo de análisis de regresión.
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
13
4:33 AM
Page 500
Regresión múltiple
y no lineal
INTRODUCCIÓN
El modelo probabilístico estudiado en el capítulo 12 especificó que el valor observado de la variable dependiente Y se desviaba de la función de regresión lineal Yx
0 1x en una cantidad aleatoria. Aquí se consideran dos formas de generalizar el
modelo de regresión lineal simple. La primera es sustituir 0 1x con una función
no lineal de x, y la segunda es usar una función de regresión que comprenda más de
una sola variable independiente. Después de ajustar una función de regresión de la
forma seleccionada a la información dada, por supuesto que es importante tener métodos para hacer inferencias acerca de los parámetros del modelo seleccionado. No
obstante, antes de usar estos métodos el analista de datos debe evaluar primero la
validez del modelo seleccionado. En la sección 13.1 se estudian estos métodos, con
base principalmente en un análisis gráfico de los residuos (las y observadas menos las
pronosticadas), para verificar lo apropiado del modelo ajustado.
En la sección 13.2 se consideran funciones de regresión no lineales de una sola variable independiente x que son “intrínsecamente lineales”. Con esto se quiere
decir que es posible transformar una o las dos variables para que la relación entre las
nuevas variables sea lineal. Se obtiene una clase alternativa de relaciones no lineales
con el uso de funciones de regresión con polinomios de la forma Yx 0 1x
2x2 k x k; estos modelos con polinomios son el tema de la sección 13.3. El
análisis de regresión múltiple comprende la construcción de modelos para relacionar
y con dos o más variables independientes. El interés principal de la sección 13.4 está en la interpretación de varios modelos de regresión múltiple y en entender y usar
la salida de regresión de varios paquetes estadísticos de computadoras. La última sección del capítulo examina algunas extensiones y dificultades de hacer modelos de regresión múltiple.
500
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:33 AM
Page 501
13.1 Aptitud y verificación del modelo
501
13.1 Aptitud y verificación del modelo
Una gráfica de los pares observados (xi, yi) es un primer paso necesario para decidir la forma de una relación matemática entre x y y. Es posible adaptar numerosas funciones distintas a la recta (y b0 b1x) a los datos, usando ya sea el principio de mínimos cuadrados
u otro método apropiado. Una vez que una función de la forma seleccionada se haya ajustado, es importante verificar el ajuste del modelo para ver si en verdad es apropiado. Una
forma de estudiar el ajuste es sobreponer una gráfica de la función de mejor ajuste sobre la
gráfica de puntos de los datos. No obstante, cualquier inclinación o curvatura de la función
de mejor ajuste puede ocultar algunos aspectos del ajuste que deben investigarse. Además,
la escala en el eje vertical puede hacer difícil evaluar el grado al que los valores observados
se desvían de las funciones de mejor ajuste.
Residuos y residuos estandarizados
Un método más eficaz de evaluar la exactitud del modelo es calcular los valores ajustados
o pronosticados ŷi y los residuos ei yi ŷi y luego trazar varias funciones de estas cantidades calculadas. A continuación se examinan las gráficas para confirmar la selección de
modelo o para indicaciones de que el modelo no es apropiado. Suponga que el modelo
de regresión lineal simple es correcto, y sea y ˆ 0 ˆ 1x la ecuación de la línea de regresión. Entonces el i-ésimo residuo es ei yi (ˆ 0 ˆ 1xi). Para deducir propiedades de los
residuos, se representa con ei Yi Ŷi el i-ésimo residuo como una variable aleatoria (va)
(antes que en realidad se hagan observaciones). Entonces
E(Yi Ŷi) E(Yi) E(ˆ 0 ˆ 1xi) 0 1xi (0 1xi) 0
(13.1)
Debido a que Ŷi ( ˆ 0 ˆ 1xi) es una función lineal de las Yj, así lo es Yi Ŷi (los coeficientes dependen de las xj). Así, la normalidad de las Yj implica que cada residuo está normalmente distribuido. También se puede demostrar que
V(Yi Ŷi) 2 1
1
(x x)2
i
Sxx
n
(13.2)
Si se sustituye 2 con s2 y se toma la raíz cuadrada de la ecuación (13.2) resulta la desviación estándar estimada de un residuo.
Se estandariza ahora cada residuo al restar el valor medio (cero) y luego dividir entre
la desviación estándar estimada.
Los residuos estandarizados están dados por
e*i
yi ŷi
1
(x x)2
s 1 i
n
Sxx
i 1, . . . , n
(13.3)
Si, por ejemplo, un residuo estandarizado particular es 1.5, entonces el residuo en sí es 1.5
desviaciones estándares (estimadas) mayor de lo que se esperaría por ajustar el modelo correcto. Nótese que las varianzas de los residuos difieren entre sí. Si n es razonablemente
grande, no obstante, el término entre paréntesis rectangulares (13.2) será alrededor de 1, de
modo que algunas fuentes usan ei /s como el residuo estandarizado. El cálculo de las e*i
www.FreeLibros.me
c13_p500-567.qxd
502
3/12/08
CAPÍTULO 13
4:33 AM
Page 502
Regresión múltiple y no lineal
puede ser tedioso, pero los paquetes computarizados de estadísticas de más uso dan estos
valores de manera automática y (previa solicitud) pueden construir varias gráficas donde
esos valores están comprendidos.
Ejemplo 13.1
El ejercicio 19 del capítulo 12 presentó datos acerca x tasa de liberación debido a área del
quemador y y tasa de emisión de NOx. Aquí se reproducen los datos y los valores ajustados, residuos y residuos estandarizados. La línea de regresión estimada es y 45.55
1.71x y r2 0.961. Observe que los residuos estandarizados no son un múltiplo constante
de los residuos (es decir, e*i ei /s).
xi
yi
ŷi
ei
e*i
100
125
125
150
150
200
200
250
250
300
300
350
400
400
150
140
180
210
190
320
280
400
430
440
390
600
610
670
125.6
168.4
168.4
211.1
211.1
296.7
296.7
382.3
382.3
467.9
467.9
553.4
639.0
639.0
24.4
28.4
11.6
1.1
21.1
23.3
16.7
17.7
47.7
27.9
77.9
46.6
29.0
31.0
0.75
0.84
0.35
0.03
0.62
0.66
0.47
0.50
1.35
0.80
2.24
1.39
0.92
0.99
■
Gráficas de diagnóstico
Las gráficas básicas que numerosos expertos en estadística recomiendan para una evaluación de la validez y utilidad de un modelo son las siguientes:
1. e*i (o ei) sobre el eje vertical contra xi en el eje horizontal
2. e*i (o ei) sobre el eje vertical contra ŷi en el eje horizontal
3. ŷi sobre el eje vertical contra yi en el eje horizontal
4. Una gráfica de probabilidad normal de los residuos estandarizados
Las gráficas 1 y 2 se denominan gráficas de residuos (contra la variable independiente y
valores ajustados, respectivamente), en tanto que la gráfica 3 está ajustada contra valores observados.
Si la gráfica 3 da puntos cercanos a la recta de 45° [pendiente 1 que pasa por (0, 0)],
entonces la función de regresión estimada da predicciones precisas de los valores que se observan en realidad. Así, la gráfica 3 proporciona una evaluación visual de la efectividad del
modelo para hacer predicciones. Siempre que el modelo sea correcto, ninguna gráfica de residuos debe exhibir formas distintas. Los residuos deben estar distribuidos al azar alrededor
de 0 según una distribución normal, de manera que con excepción de unos cuantos, todos
los residuos estandarizados deben encontrarse entre 2 y 2 (es decir, todos excepto unos
cuantos a no más de dos desviaciones estándares de su valor esperado de 0). La gráfica de
residuos estandarizados contra ŷ es en realidad una combinación de las otras dos gráficas,
mostrando implícitamente la forma en que varían los residuos con x y cómo se comparan
los valores ajustados con valores observados. Esta última gráfica es la que se recomienda
con más frecuencia para análisis de regresión múltiple. La gráfica 4 permite al analista evaluar la factibilidad de la suposición de que tiene una distribución normal.
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:34 AM
Page 503
13.1 Aptitud y verificación del modelo
Ejemplo 13.2
(continuación
del ejemplo
13.1)
503
La figura 13.1 presenta una gráfica de puntos de los datos y las cuatro gráficas recomendadas. La gráfica de ŷ en función de y confirma la impresión dada por r 2 de que x es eficaz en
la predicción de y y también indica que no hay y observada para la que el valor predicho esté muy lejos de la marca. Ambas gráficas de residuos no muestran una figura poco común
ni valores discrepantes. Hay un residuo estandarizado que está ligeramente fuera del intervalo (2, 2), pero esto no es sorprendente en una muestra de tamaño 14. La gráfica de probabilidad normal de los residuos estandarizados es razonablemente recta. En resumen, las
gráficas no dejan remordimiento acerca de lo apropiado de una relación lineal sencilla o el
ajuste a la información dada.
e*
y
2.0
700
1.0
570
440
0.0
y 45.55 1.71x
Residuos
estandarizados
vs. yˆ
1.0
310
y vs. x
2.0
180
50
x
50
180
310
ŷ
100
440
330
660
yˆ
e*
2.0
580
1.0
0.0
240
Residuos
estandarizados
vs. x
1.0
yˆ vs. y
2.0
100
x
y
100
340
680
40
240
400
e*
1.0
0.0
1.0
2.0
Gráfica de probabilidad normal
3.0
percentil z
2.0 1.0
Figura 13.1
0.0
1.0
2.0
Gráfica para los datos del ejemplo 13.1.
■
Dificultades y soluciones
Aun cuando se espera que nuestro análisis dé gráficas como las de la figura 13.1, con gran
frecuencia dichas gráficas sugerirán una o más de las siguientes dificultades:
www.FreeLibros.me
c13_p500-567.qxd
504
3/12/08
CAPÍTULO 13
4:34 AM
Page 504
Regresión múltiple y no lineal
1. Una relación probabilística no lineal entre x y y es apropiada.
2. La varianza de (y de Y) no es una 2 constante sino que depende de x.
3. El modelo seleccionado se ajusta bien a los datos, excepto para unos pocos valores discrepantes de datos o resultados aislados, que pueden haber tenido gran influencia en la
selección de la función de mejor ajuste.
4. El término de error no tiene una distribución normal.
5. Cuando el subíndice i indica el orden de las observaciones en tiempo, las i exhiben dependencia en el tiempo.
6. Una o más variables independientes relevantes se han omitido del modelo.
La figura 13.2 presenta gráficas de residuos correspondientes a los elementos 1–3, 5
y 6. En el capítulo 4, se estudiaron figuras en gráficas de probabilidad normales que arrojan
duda sobre la suposición de una distribución normal básica. Nótese que los residuos de los
datos de la figura 13.2d), con el punto circulado incluido, por sí mismos no sugerirían un
análisis ulterior, pero cuando se ajusta una nueva recta con ese punto borrado, la nueva recta difiere considerablemente de la recta original. Este tipo de conducta es más difícil de
identificar en regresión múltiple. Lo más probable es que surja cuando haya un solo punto(s) de dato (o muy pocos) con valor(es) variable(s) independiente(s) muy alejados del resto
de los datos.
A continuación se indica brevemente de qué soluciones se dispone para los tipos de
dificultades. Para un análisis más completo debe consultarse una o más de las referencias
sobre análisis de regresión. Si la gráfica de residuos se ve como el de la figura 13.2a), que
exhibe una figura curva, entonces puede ajustarse una función no lineal de x.
e*
e*
2
2
x
2
x
2
a)
b)
y
e*
2
x
x
2
c)
d)
e*
e*
2
Orden de las
observaciones
en tiempo
Variable
independiente
omitida
2
e)
f)
Figura 13.2 Gráficas que indican anormalidad en datos: a) relación no lineal; b) varianza no
constante; c) observación discrepante; d) observación con gran influencia; e) dependencia en
errores; f) variable omitida.
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:34 AM
Page 505
13.1 Aptitud y verificación del modelo
505
La gráfica de residuos de la figura 13.2b) sugiere que, aun cuando puede ser razonable una relación de línea recta, la suposición de que V(Yi) 2 para cada i es de dudosa validez. Cuando las suposiciones del capítulo 12 son válidas, se puede demostrar que entre
todos los estimados insesgados de 0 y 1, los estimadores de cuadrados mínimos ordinarios tienen varianza mínima. Estos estimadores dan igual valor a cada (xi, Yi). Si la varianza de Y aumenta con x, entonces las Yi para xi grandes deben tener menos valor que aquellas
con xi pequeñas. Esto sugiere que 0 y 1 deben estimarse al minimizar
fw(b0, b1) wi[yi (b0 b1xi)]2
(13.4)
donde las wi son valores que decrecen con xi creciente. La reducción al mínimo de la expresión (13.4) da estimaciones de cuadrados mínimos ponderados. Por ejemplo, si la desviación estándar de Y es proporcional a x (para x 0), es decir, V(Y) kx2, entonces se puede
demostrar que los valores wi 1/x2i dan mejores estimadores de 0 y 1. Los libros de John
Neter y otros y de S. Chatterjee y Bertram Price contienen más detalle (vea la bibliografía
del capítulo). Los cuadrados mínimos ponderados los emplean con frecuencia expertos en
econometría (economistas que usan métodos estadísticos) para estimar parámetros.
Cuando las gráficas u otra evidencia sugieren que el conjunto de datos contiene resultados aislados o puntos que tienen gran influencia en el ajuste resultante, un posible método es omitir estos puntos aislados y recalcular la ecuación de regresión estimada. Es seguro
que esto sería correcto si se encontrara que los resultados aislados aparecieron por errores
al registrar valores de datos o de errores experimentales. Si no se puede hallar una causa para los resultados aislados, es deseable informar la ecuación estimada con y sin haber omitido los resultados aislados. Otro método adicional es retener posibles resultados aislados
pero sólo para usar un principio de estimación que pone relativamente menos peso a valores aislados del que da el principio de cuadrados mínimos. Uno de estos principios es el
MAD (minimizar desviaciones absolutas), que selecciona ˆ0 y ˆ1 para minimizar °yi
(b0 b1xi)°. A diferencia de las estimaciones de cuadrados mínimos, no hay fórmulas exactas para las estimaciones MAD; sus valores deben hallarse con el uso de procedimientos
computacionales iterativos. Estos procedimientos también se usan cuando se sospecha que
las i tienen una distribución que no es normal y que, en cambio, tiene “colas pesadas” (lo
cual hace más probable para la distribución normal que valores discrepantes entren en la
muestra); los procedimientos de regresión robustos son aquellos que producen estimaciones
confiables para una amplia variedad de distribuciones de error subyacentes. Los estimadores de cuadrados mínimos no son robustos en la misma forma que la media muestral X
no
es un estimador robusto para .
Cuando una gráfica sugiere dependencia del tiempo en los términos de error, un análisis apropiado puede comprender una transformación de las y o un modelo que en forma explícita incluya una variable de tiempo. Por último, una gráfica como la de la figura 13.2f), que
presenta un patrón en los residuos cuando se traza contra una variable omitida, sugiere que debe considerarse un modelo de regresión múltiple que incluya la variable previamente omitida.
EJERCICIOS
Sección 13.1 (1-14)
1. Suponga que las variables x distancia de viaje al trabajo y
y tiempo de viaje al trabajo están relacionadas de acuerdo
con el modelo de regresión lineal simple con 10.
a. Si se hacen n 5 observaciones en los valores x de
x1 5, x2 10, x3 15, x4 20 y x5 25, calcule las
desviaciones estándar de los cinco residuos correspondientes.
b. Repita el inciso a) para x1 5, x2 10, x3 15, x4
20 y x5 50.
c. ¿Qué implican los resultados de los incisos a) y b) acerca de la desviación de la línea estimada de la observación hecha en el valor x máximo muestreado?
2. Los valores x y residuos estandarizados para los datos de
flujo de cloro/(velocidad de grabado), del ejercicio 52 (sección 12.4), se muestran en la tabla siguiente. Construya
una gráfica de residuos estandarizada y comente sobre su
aspecto.
www.FreeLibros.me
c13_p500-567.qxd
506
3/12/08
4:34 AM
Page 506
Regresión múltiple y no lineal
CAPÍTULO 13
x
1.50
1.50
2.00
2.50
2.50
e*
0.31
1.02
1.15
1.23
0.23
x
3.00
3.50
3.50
4.00
e*
0.73
1.36
1.53
0.07
3. El ejemplo 12.6 presentó los residuos de una regresión lineal simple de contenido de humedad y sobre la rapidez de
filtración x.
a. Trace los residuos en función de x. ¿La gráfica resultante sugiere que una función de regresión de línea recta
es una opción razonable de modelo? Explique su razonamiento.
b. Usando s 0.665, calcule los valores de los residuos estandarizados. ¿Es e*i ei /s para i 1, . . . , n, o no
están las e*i cerca de ser proporcionales a las ei?
c. Trace los residuos estandarizados en función de x. ¿Difiere esta gráfica significativamente en su aspecto general con respecto a la gráfica del inciso a)?
4. La resistencia al desgaste de ciertos componentes de reactores nucleares hechos de Zircaloy-2 se determina en parte
por las propiedades de la capa de óxido. La siguiente información aparece en un artículo que propuso un nuevo método de prueba no destructivo para vigilar el grosor de la capa
(“Monitoring of Oxide Layer Thickness on Zircaloy-2 by
the Eddy Current Test Method”, J. of Testing and Eval.,
1987: 333-336). Las variables son x grosor de la capa de
óxido (m) y y respuesta de la corriente parásita o turbulenta (unidades arbitrarias).
x
0
7
17
114
133
y
20.3
19.8
19.5
15.9
15.1
x
142
190
218
237
285
y
14.7
11.9
11.5
8.3
6.6
a. Los autores resumieron la relación al dar la ecuación de
la recta de cuadrados mínimos como y 20.6 0.047x.
Calcule y trace los residuos en función de x y luego comente sobre lo apropiado del modelo de regresión lineal
simple.
b. Use s 0.7921 para calcular los residuos estandarizados
de una regresión lineal simple. Construya una gráfica de
residuos estandarizada y comente. También construya
una gráfica de probabilidad normal y comente.
5. Cuando desciende la temperatura del aire, el agua de un río
se hace muy fría y se forman cristales de hielo. Este hielo
puede afectar de manera significativa la hidráulica de un
río. El artículo “Laboratory Study of Anchor Ice Growth”
(J. of Cold Regions Engr., 2001: 60-66) describió un experimento en el que el grosor del hielo (mm) se estudió como
función del tiempo transcurrido (h) bajo condiciones especificadas. La información siguiente se leyó de una gráfica
del artículo: n 33; x 0.17, 0.33, 0.50, 0.67, . . . , 5.50;
y 0.50, 1.25, 1.50, 2.75, 3.50, 4.75, 5.75, 5.60, 7.00, 8.00,
8.25, 9.50, 10.50, 11.00, 10.75, 12.50, 12.25, 13.25, 15.50,
15.00, 15.25, 16.25, 17.25, 18.00, 18.25, 18.15, 20.25,
19.50, 20.00, 20.50, 20.60, 20.50, 19.80.
a. El valor r2 resultante de un ajuste de cuadrados mínimos
es 0.977. Interprete este valor y comente sobre lo apropiado de suponer una relación lineal aproximada.
b. Los residuos, escritos en el mismo orden que los valores x,
son:
1.03
0.59
0.14
0.67
0.24
0.92
0.13
0.93
1.02
0.43
1.35
0.45
0.04
1.09
1.01
0.78
0.06
0.36
0.66
1.75
0.68
0.62
1.92
0.09
3.14
0.11
0.94
0.78
1.33
0.21
0.80
0.35
0.10
Dibuje los residuos contra el tiempo transcurrido. ¿Qué sugiere la gráfica?
6. Los datos siguientes sobre x densidad verdadera (kg/mm3)
y y contenido de humedad (% en seco) se leyeron de una
gráfica en el artículo “Physical Properties of Cumin Seed”
(J. Agric. Engr. Res., 1996: 93-98).
x
7.0
9.3
13.2
16.3
19.1
22.0
y
1046
1065
1094
1117
1130
1135
La ecuación de la recta de mínimos cuadrados es y
1008.14 6.19268x (esto difiere ligeramente de la ecuación dada en el artículo); s 7.265 y r2 0.968.
a. Realice una prueba de la utilidad del modelo y comente.
b. Calcule los valores de los residuos y dibuje los residuos
en función de x. ¿La gráfica sugiere que una función de
regresión lineal es inapropiada?
c. Calcule los valores de los residuos estandarizados y trácelos en función de x. ¿Hay algunos residuos estandarizados
inusualmente grandes (positivos o negativos)? ¿Esta gráfica da el mismo mensaje que la del inciso b) con respecto a lo apropiado de una función de regresión lineal?
7. El artículo “Effects of Gamma Radiation on Juvenile and
Mature Cuttings of Quaking Aspen” (Forest Science, 1967:
240-245) publica los datos siguientes sobre el tiempo de exposición a la radiación (x, en kr/(16 h) y peso seco de raíces
(y, en mg 101).
x
0
2
4
6
8
y
110
123
119
86
62
a. Construya una gráfica de puntos. ¿La gráfica sugiere
que es apropiada una relación probabilística lineal?
b. Una regresión lineal resulta en la recta de mínimos
cuadrados y 127 6.65x, con s 16.94. Calcule los
residuos y residuos estandarizados y luego construya
gráficas de residuos. ¿Qué sugieren estas gráficas? ¿Qué
tipo de función debe dar un mejor ajuste a los datos de
lo que da una recta?
8. El registro continuo de la pulsación cardiaca se puede usar
para obtener información acerca del nivel de intensidad de
ejercicios o esfuerzo físico durante una participación deportiva, trabajo u otras actividades diarias. El artículo “The Relationship between Heart Rate and Oxygen Uptake During
Non-Steady State Exercise” (Ergonomics, 2000: 15781592) publicó un estudio para investigar el uso de la respuesta del ritmo cardiaco (x, como porcentaje del ritmo máximo)
para predecir la toma de oxígeno (y, como porcentaje de
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:34 AM
Page 507
13.1 Aptitud y verificación del modelo
toma máxima) durante el ejercicio. La información siguiente es de una gráfica del artículo.
HR
43.5 44.0 44.0 44.5 44.0 45.0 48.0 49.0
VO2
22.0 21.0 22.0 21.5 25.5 24.5 30.0 28.0
HR
49.5 51.0 54.5 57.5 57.7 61.0 63.0 72.0
VO2
32.0 29.0 38.5 30.5 57.0 40.0 58.0 72.0
Use un paquete computacional de estadística para efectuar
un análisis de regresión lineal simple, poniendo particular
atención a la presencia de cualesquiera observaciones poco
comunes o que influyan.
9. Considere los siguientes cuatro conjuntos de datos (x, y);
los tres primeros tienen los mismos valores de x, de modo
que estos valores aparecen sólo una vez. (Frank Anscombe,
“Graphs in Statistical Analysis”, Amer. Statistician, 1973:
17-21):
Conjunto
de datos
1–3
1
2
3
4
4
Variable
x
y
y
y
x
y
10.0
8.0
13.0
9.0
11.0
14.0
6.0
4.0
12.0
7.0
5.0
8.04
6.95
7.58
8.81
8.33
9.96
7.24
4.26
10.84
4.82
5.68
9.14
8.14
8.74
8.77
9.26
8.10
6.13
3.10
9.13
7.26
4.74
7.46
6.77
12.74
7.11
7.81
8.84
6.08
5.39
8.15
6.42
5.73
8.0
8.0
8.0
8.0
8.0
8.0
8.0
19.0
8.0
8.0
8.0
507
11. a. Exprese el i-ésimo residuo Yi Ŷi, donde Ŷi ˆ 0 ˆ 1xi
en la forma cjYj, una función lineal de las Yj. A continuación use reglas de varianza para verificar que V(Yi Ŷi)
está dada por la expresión (13.2).
b. Se puede demostrar que Ŷi y Yi Ŷi (el i-ésimo valor pronosticado y residuo) son independientes entre sí. Use este hecho, la relación Yi Ŷi (Yi Ŷi), y la expresión
para V(Ŷ) de la sección 12.4 para otra vez verificar la expresión (13.2).
c. Cuando xi se aleja de x, ¿qué ocurre a V(Ŷ i) y a V(Yi Ŷi)?
12. a. ¿Podría una regresión lineal tener los residuos 23, 27,
5, 17, 8, 9 y 15? ¿Por qué sí o por qué no?
b. ¿Podría una regresión lineal resultar en residuos 23,
27, 5, 17, 8, 12 y 2 correspondientes a los valores
x de 3, 4, 8, 12, 14, 20 y 25? ¿Por qué sí o por qué
no? [Sugerencia: Vea el ejercicio 10.]
13. Recuerde que ˆ 0 ˆ 1x tiene una distribución normal con
valor esperado 0 1x y varianza
2
(x x )2
1
n
(xi x )2
de modo que
6.58
5.76
7.71
8.84
8.47
7.04
5.25
12.50
5.56
7.91
6.89
Para cada uno de estos cuatro conjuntos de datos, los valores de las estadísticas de resumen xi, x2i , yi, y2i y xi yi
son prácticamente idénticos, de modo que todas las cantidades calculadas de estos cinco serán idénticas en esencia
para los cuatro conjuntos: la recta de cuadrados mínimos
(y 3 0.05x), SCE, s2, r2, intervalos t, estadísticas t, etc.
Las estadísticas de resumen no dan una forma de distinguir
entre los cuatro conjuntos de datos. Con base en una gráfica de puntos y una gráfica de residuos para cada conjunto,
comente sobre lo apropiado o no de ajustar un modelo de línea recta; incluya en sus comentarios cualesquiera sugerencias específicas sobre cómo es que un “análisis de línea
recta” podría modificarse o calificarse.
10. a. Demuestre que ni1 ei 0 cuando las ei son los residuos de una regresión lineal simple.
b. Los residuos de una regresión lineal simple, ¿son independientes entre sí, están positivamente correlacionados, o negativamente correlacionados? Explique.
c. Demuestre que ni1 xiei 0 para los residuos de una regresión lineal simple. (Este resultado junto con el inciso a)
muestra que hay dos restricciones lineales en las ei, resultando en una pérdida de 2 grados de libertad cuando
se usa el cuadrado de los residuos para estimar 2.)
d. ¿Es cierto que ni1 e*i 0? Dé una prueba o un ejemplo contrario.
Z
ˆ 0 ˆ 1x (0 1x)
1
(x x)2 1/2
n
(xi x)2
tiene una distribución normal estándar. Si S S
C
E
/(n
2)
se sustituye por , la variable resultante tiene una distribución t con n 2 grados de libertad. Por analogía, ¿cuál es
la distribución de cualquier residuo estandarizado en particular? Si n 25, ¿cuál es la probabilidad de que un residuo estandarizado en particular caiga fuera del intervalo
(2.50, 2.50)?
14. Si hay al menos un valor de x en el que más de una observación se haya hecho, hay un procedimiento formal de
prueba para probar
H0: Yx 0 1x para algunos valores 0, 1 (la función
de regresión verdadera es lineal)
en función de
Ha: H0 no es verdadera (la función de regresión verdadera
no es lineal)
Suponga que se hacen observaciones en x1, x2, . . . , xc. Denote con Y11, Y12, . . . , Y1n1 las n1 observaciones cuando x
x1; . . . ; Yc1, Yc2, . . . , Ycn denota las nc observaciones cuando
x xc. Con n ni (el número total de observaciones),
SCE tiene n 2 grados de libertad. Se descompone SCE en
dos partes, SCEP (error puro) y SCFA (falta de ajuste) como sigue:
c
SCEP (Yij Yi)2
i
j
Y 2ij niY i
2
SCFA SCE SCEP
Las ni observaciones en xi contribuyen con ni 1 grados
de libertad a SCEP, de modo que el número de grados de libertad para SCEP es i(ni 1) n c y los grados de
libertad para SCFA es n 2 (n c) c 2. Sea
www.FreeLibros.me
c13_p500-567.qxd
508
3/12/08
CAPÍTULO 13
4:34 AM
Page 508
Regresión múltiple y no lineal
MCEP SCEP/(n c) y MCFA SCFA/(c 2). Entonces se puede demostrar que mientras E(MCEP) 2 ya sea
que H0 sea o no verdadera, E(MCFA) 2 si H0 es verdadera y E(MCFA) 2 si H0 es falsa.
MCFA
Estadística de prueba: F
MCEP
Región de rechazo: f
F,c-2,n-c
Los datos siguientes provienen del artículo “Changes in
Growth Hormona Status Related to Body Weight of Growing Cattle” (Growth, 1977: 241-247), con x peso corporal y y rapidez de eliminación metabólica/peso corporal.
x
110
110
110
230
230
230
360
y
235
198
173
174
149
124
115
x
360
360
360
505
505
505
505
y
130
102
95
122
112
98
96
(Así, c 4, n1 n2 3, n3 n4 4.)
a. Pruebe H0 contra Ha al nivel 0.05 usando la prueba de
falta de ajuste que se acaba de describir.
b. Una gráfica de puntos de los datos, ¿sugiere que la relación entre x y y es lineal? ¿Cómo se compara esto con el
resultado del inciso a)? (Una función de regresión no lineal se utilizó en el artículo.)
13.2 Regresión con variables transformadas
La necesidad de un modelo alternativo para el modelo probabilístico lineal Y 0 1x
puede ser sugerida ya sea por un argumento teórico o al examinar gráficas de diagnóstico
desde un análisis de regresión lineal. En cualquiera de estos casos, es deseable escoger un
modelo cuyos parámetros se puedan estimar con facilidad. Una clase importante de estos modelos se especifica por medio de funciones que sean “intrínsecamente lineales”
DEFINICIÓN
Una función que relacione y con x es intrínsecamente lineal si por medio de una
transformación de x y/o y, la función se puede expresar como y 0 1x, donde
x la variable independiente transformada y y la variable dependiente transformada.
En la tabla 13.1 se dan cuatro de las funciones intrínsecamente lineales más útiles. En cada
caso, la transformación apropiada es o bien una transformación logarítmica, ya sea de logaritmos de base 10 o naturales (base e), o una transformación recíproca. Unas gráficas representativas de las cuatro funciones aparecen en la figura 13.3.
Tabla 13.1 Funciones intrínsecamente lineales útiles*
Función
a. Exponencial: y ex
b. Potencia: y x
c. y log(x)
d. Recíproca: y
1
x
Transformación(es) para linealizar
Forma lineal
y ln(y)
y log(y), x log(x)
x log(x)
1
x
x
y ln() x
y log() x
y x
y x
*Cuando aparece log(), se pueden usar logaritmos de base 10 o de base e.
Para una relación de función exponencial, sólo y se transforma para alcanzar linealidad, mientras que, para una relación de función de potencia, tanto x como y se transforman.
Debido a que la variable x está en el exponente de una relación exponencial, y crece (si
0) o decrece (si 0) en forma mucho más rápida cuando x aumenta más de lo que
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:34 AM
Page 509
13.2 Regresión con variables transformadas
y
y
0
y
509
y
0
1
0
0 1
x
x
a)
y
x
y
y
y
0
0
0
0
x
Figura 13.3
c)
x
b)
0
0
x
x
d)
x
Gráficas de las funciones intrínsecamente lineales dadas en la tabla 13.1.
es el caso para la función de potencia, aun cuando en un breve intervalo de valores de x puede ser difícil distinguir entre las dos funciones. Ejemplos de funciones que no son intrínsecamente lineales son y ex y y x.
Las funciones intrínsecamente lineales llevan de manera directa a modelos probabilísticos que, aun cuando no son lineales en x como función, tienen parámetros cuyos valores se estiman con facilidad usando mínimos cuadrados ordinarios.
DEFINICIÓN
Un modelo probabilístico que relaciona Y a x es intrínsecamente lineal si, por medio de una transformación en Y y/o x, se puede reducir a un modelo probabilístico lineal Y 0 1x .
Los modelos probabilísticos intrínsecamente lineales que corresponden a las cuatro funciones de la tabla 13.1 son los siguientes:
a. Y ex , un modelo multiplicativo exponencial, de modo que ln(Y) Y 0
1x con x x, 0 ln(), 1 y ln().
b. Y x , un modelo multiplicativo de potencia, de modo que log(Y) Y 0
1x con x log(x), 0 log(), 1 y log().
c. Y log(x) , de modo que x log(x) linealiza de inmediato el modelo.
d. Y 1/x , de modo que x 1/x da un modelo lineal.
Los modelos aditivos exponencial y de potencia, Y ex y Y x , no son intrínsecamente lineales. Nótese que a) y b) requieren una transformación en Y y, como resultado, una transformación en la variable de error . De hecho, si tiene una distribución
lognormal (véase capítulo 4) con E() e /2 y V() 2 independientes de x, entonces los
modelos transformados para a) y b) van a satisfacer todas las suposiciones del capítulo 12
con respecto al modelo probabilístico lineal; esto a su vez implica que todas las inferencias
para los parámetros del modelo transformado con base en estas suposiciones será válido. Si
2 es pequeña, Yx ex en a) y x en b).
2
www.FreeLibros.me
c13_p500-567.qxd
510
3/12/08
CAPÍTULO 13
4:34 AM
Page 510
Regresión múltiple y no lineal
La ventaja principal de un modelo intrínsecamente lineal es que los parámetros 0 y
1 del modelo transformado se pueden estimar de inmediato, con el uso del principio de
mínimos cuadrados, con sólo sustituir x y y en las fórmulas estimadoras:
xi yi xi yi /n
ˆ 1
(xi )2 (xi )2/n
(13.5)
ˆ x
y
i
1
i
y ˆ 1x
ˆ 0
n
Los parámetros del modelo original no lineal se pueden estimar entonces al transformar de
nuevo ˆ 0 y/o ˆ 1 si es necesario. Una vez calculado el intervalo de predicción para y cuando x x*, la inversión de la transformación da un intervalo de predicción (IP) para y
misma. En los casos a) y b), cuando 2 es pequeña, un intervalo de confianza (IC) para Yx*
resulta de tomar los antilogaritmos de los límites del IC por 0 1x* (estrictamente hablando, tomar antilogaritmos da un IC por la mediana de la distribución Y, es decir, por
~ . Debido a que la distribución lognormal está sesgada de manera positiva,
~; las
Yx*
2
dos son aproximadamente iguales si es cercana a 0.)
Ejemplo 13.3
La ecuación de Taylor para la duración y de herramientas como función del tiempo de corte x indica que xy c k o bien, lo que es equivalente, que y x. El artículo “The Effect
of Experimental Error on the Determination of Optimum Metal Cutting Conditions”
(J. Eng. for Industry, 1967: 315-322) observa que la relación no es exacta (determinista) y
que los parámetros y deben ser estimados a partir de los datos. Así, un modelo apropiado es el modelo multiplicativo de potencia Y x , que el autor ajustó a los datos que
aparecen a continuación y que constan de las observaciones de la duración de 12 herramientas de carburo (tabla 13.2). Además de los valores x, y, x y y, se dan los valores transformados pronosticados ( ŷ) y los valores pronosticados en la escala original (ŷ, después de
transformar de nuevo).
Tabla 13.2 Datos para el ejemplo 13.3
1
2
3
4
5
6
7
8
9
10
11
12
x
y
x ln(x)
y ln(y)
ŷ
ŷ e ŷ
600.
600.
600.
600.
500.
500.
500.
500.
400.
400.
400.
400.
2.3500
2.6500
3.0000
3.6000
6.4000
7.8000
9.8000
16.5000
21.5000
24.5000
26.0000
33.0000
6.39693
6.39693
6.39693
6.39693
6.21461
6.21461
6.21461
6.21461
5.99146
5.99146
5.99146
5.99146
0.85442
0.97456
1.09861
1.28093
1.85630
2.05412
2.28238
2.80336
3.06805
3.19867
3.25810
3.49651
1.12754
1.12754
1.12754
1.12754
2.11203
2.11203
2.11203
2.11203
3.31694
3.31694
3.31694
3.31694
3.0881
3.0881
3.0881
3.0881
8.2650
8.2650
8.2650
8.2650
27.5760
27.5760
27.5760
27.5760
Las estadísticas de resumen para ajustar una línea recta a los datos transformados son xi
74.41200, yi 26.22601, xi 2 461.75874, yi 2 67.74609 y xi yi 160.84601, de
modo que
(160.84601) (74.41200)(26.22601)/12
ˆ 1
5.3996
461.75874 (74.41200)2/12
26.22601 ( 5.3996)(74.41200)
ˆ 0
35.6684
12
Los valores estimados para y , los parámetros del modelo de función de potencia, son
ˆ ˆ1 5.3996 y ˆ eˆ 3.094491530 1015. Entonces, la función de regresión
0
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:34 AM
Page 511
13.2 Regresión con variables transformadas
511
estimada es ˆ Yx 3.094491530 1015 x 5.3996. Para recapturar la ecuación de Taylor (estimada), se establece y 3.094491530 1015 x 5.3996, de donde xy0.185 740.
La figura 13.4a) da una gráfica de los residuos estandarizados de la regresión lineal
usando variables transformadas (para las que r 2 0.922); no hay patrón aparente en la gráfica, aun cuando un residuo estandarizado es un poco grande, y los residuos se ven como
deben para una regresión lineal simple. La figura 13.4b) presenta una gráfica de ŷ en función de y, que indica predicciones satisfactorias sobre la escala original.
Para obtener un intervalo de confianza para la duración mediana de la herramientas
cuando el tiempo de corte es 500, se transforma x 500 a x 6.21461. Entonces ˆ 0
ˆ 1x 2.1120 y un intervalo de confianza de 95% para 0 1(6.21461) es (de la sección
12.4) 2.1120 ! (2.228)(0.0824) (1.928, 2.296). El intervalo de confianza de 95% para
˜ Y500 se obtiene entonces al tomar los antilogaritmos: (e1.928, e2.296) (6.876, 9.930). Se puede verificar con facilidad que para los datos transformados s2 ˆ 2 0.081. Debido a que
esto es muy pequeño, (6.876,9.930) es un intervalo aproximado para Y500.
y
e*
3.0
30.0
2.0
24.0
1.0
18.0
0.0
12.0
1.0
6.0
2.0
x'
6.0
6.2
a)
y
6.4
8.0
16.0
24.0
b)
32.0
40.0
Figura 13.4 a) Residuos estandarizados en función de x del ejemplo 13.3; b) ŷ en función de y del
ejemplo 13.3
■
Ejemplo 13.4
En el artículo “Ethylene Synthesis in Lettuce Seeds: Its Physiological Significance” (Plant
Physiology, 1972: 719-722), el contenido de etileno en semillas de lechuga (y, en nl/g peso en seco) se estudió como función de la exposición de tiempo (x, en min) a un absorbente de etileno. La figura 13.5 presenta una gráfica de puntos de los datos y una gráfica de los
e*
3.0
y
400
2.0
300
1.0
200
0.0
100
1.0
0
x
0.0
20
40
60
a)
80
100
2.0
x
0.0
20
40
60
b)
80
100
Figura 13.5 a) Gráfica de puntos; b) gráfica de residuos de regresión lineal para los datos del
ejemplo 13.4.
www.FreeLibros.me
c13_p500-567.qxd
512
3/12/08
CAPÍTULO 13
4:34 AM
Page 512
Regresión múltiple y no lineal
residuos generados de una regresión lineal de y en x. Ambas gráficas muestran un fuerte patrón curvado, que sugiere que es apropiada una transformación para alcanzar linealidad.
Además, una regresión lineal da predicciones negativas para x 90 y x 100.
El autor no dio ningún argumento para un modelo teórico, pero esta gráfica de y
ln(y) en función de x muestra una fuerte relación lineal, que sugiere que una función exponencial dará un buen ajuste a los datos. La tabla 13.3 muestra los valores de datos y otra información de una regresión lineal de y en x. Las estimaciones de parámetros del modelo
Tabla 13.3 Datos para el ejemplo 13.4
x
y
y ln(y)
ŷ
ŷ e ŷ
2
10
20
30
40
50
60
70
80
90
100
408
274
196
137
90
78
51
40
30
22
15
6.01
5.61
5.28
4.92
4.50
4.36
3.93
3.69
3.40
3.09
2.71
5.876
5.617
5.294
4.971
4.647
4.324
4.001
3.677
3.354
3.031
2.708
353.32
275.12
199.12
144.18
104.31
75.50
54.64
39.55
28.62
20.72
15.00
lineal son ˆ 1 0.0323 y ˆ 0 5.941, con r 2 0.995. La función de regresión estimada
para el modelo exponencial es
ˆ Yx e ˆ e ˆ x 380.32e 0.0323x. Los valores pronosticados ŷi se pueden obtener entonces por sustitución de xi (i 1, . . . , n) en ˆ Yx o bien al calcular ŷi e ŷ, donde las ŷi son las predicciones del modelo transformado de línea recta. La
figura 13.6 presenta tanto una gráfica de e* en función de x (los residuos estandarizados
de una regresión lineal) y una gráfica de ŷ en función de y. Estas gráficas apoyan la elección de
un modelo exponencial.
0
1
i
e*
yˆ
2.0
320
1.0
240
0.0
160
1.0
80
2.0
x
0.0
20
40
60
a)
80
100
0
y
0.0
80
160
240
b)
320
Figura 13.6 Gráfica de a) residuos estandarizados (después de transformar) en función de x; b) ŷ en
función de y para datos del ejemplo 13.4
■
Al analizar datos transformados, se deben recordar los puntos siguientes:
1. Estimar 1 y 0 como en (13.5) y luego transformar de nuevo, para obtener estimaciones
de los parámetros originales, no es equivalente a usar el principio de mínimos cuadrados
directamente en el modelo original. Así, para el modelo exponencial, se podría estimar
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:34 AM
Page 513
13.2 Regresión con variables transformadas
513
y al minimizar (yi ex )2. Sería necesario un cálculo iterativo. Las estimaciones
resultantes no serían iguales a ˆ eˆ y ˆ ˆ 1.
Si el modelo seleccionado no es intrínsecamente lineal, el método resumido en (13.5)
no se puede usar. En lugar de esto, tendrían que aplicarse mínimos cuadrados (o algún
otro procedimiento ajustado) al modelo no transformado. Por tanto, para el modelo
exponencial aditivo Y ex , los cuadrados mínimos comprenderían minimizar
(yi ex )2. Tomando derivadas parciales con respecto a y resulta en dos ecuaciones normales no lineales en y ; estas ecuaciones deben resolverse entonces usando un
procedimiento iterativo.
Cuando el modelo lineal transformado satisface todas las suposiciones mencionadas en
el capítulo 12, el método de mínimos cuadrados da las mejores estimaciones de los parámetros transformados. No obstante, las estimaciones de los parámetros originales pueden no ser los mejores en ningún sentido, aun cuando sean razonables. Por ejemplo, en
el modelo exponencial, el estimador ˆ eˆ no será insesgado, aun cuando será el estimador de de máxima verosimilitud si el error variable está normalmente distribuido.
Usando mínimos cuadrados de manera directa (sin transformar) podría dar mejores estimaciones, aun cuando los cálculos serían bastante tediosos.
Si se ha hecho una transformación en y y se desea usar las fórmulas estándar para probar hipótesis o construir intervalos de confianza (IC), debe estar distribuida al menos
aproximadamente en forma normal. Para verificar esto, deben comprobarse los residuos de
la regresión transformada.
Cuando y es transformada, el valor r 2 de la regresión resultante se refiere a una variación
en las yi explicada por el modelo de regresión transformado. Aun cuando un alto valor
de r 2 aquí indica un buen ajuste del modelo no lineal original estimado para las yi observadas, r 2 no se refiere a las observaciones originales. Quizá la mejor forma de evaluar la
calidad del ajuste es calcular los valores pronosticados ŷi , usando el modelo transformado, convirtiéndolos de nuevo a la escala y original para obtener ŷi, y luego trazar ŷ en
función de y. Un buen ajuste se hace entonces evidente por puntos cercanos a la recta de
45°. Se podría calcular SCE (yi ŷi)2 como una medida numérica de la bondad
de ajuste. Cuando el modelo era lineal, se compara esto con STC (yi y )2, la variación total alrededor de la recta horizontal a una altura y, lo cual llevó a r2. En el caso no
lineal, sin embargo, no es necesariamente informativo medir la variación total en esta forma, de modo que un valor r2 no es tan útil como en el caso lineal.
i
0
2.
i
3.
0
4.
5.
Métodos más generales de regresión
Hasta este punto se ha supuesto que Y f(x) (un modelo aditivo) o que Y f(x) (un
modelo multiplicativo). En el caso del modelo aditivo, Yx f(x), de modo que estimar la
función de regresión f(x) equivale a estimar la curva de valores medios de y. En ocasiones,
una gráfica de puntos de los datos sugiere que no hay una expresión matemática sencilla para f(x). Los expertos en estadística han creado recientemente algunos métodos más flexibles
que permiten modelar una amplia variedad de patrones usando el mismo procedimiento
apropiado. Uno de estos métodos es el LOWESS (o LOESS), que es una abreviatura de locally weighted scatter plot smoother (suavizador de gráficas de puntos localmente ponderado). Denote con (x*, y*) uno de los n pares particulares (x, y) de la muestra. El valor ŷ
correspondiente a (x*, y*) se obtiene al ajustar una recta usando sólo un porcentaje especificado de los datos (por ejemplo 25%) cuyos valores x son más cercanos a x*. Además, en
lugar de usar mínimos cuadrados “ordinarios”, que da un valor igual a todos los puntos, los
que tienen valores x más cercanos a x* tienen más valor que los valores x que están más alejados. La altura de la recta resultante arriba de x* es el valor ajustado ŷ*. Este proceso se repite para cada uno de los n puntos, de modo que n líneas diferentes se ajustan (es seguro que
el lector no desearía hacer esto manualmente). Por último, los puntos ajustados se enlazan
para obtener una curva LOWESS.
www.FreeLibros.me
CAPÍTULO 13
4:34 AM
Page 514
Regresión múltiple y no lineal
Ejemplo 13.5
Por lo general, no es factible pesar grandes animales muertos y encontrados en zonas silvestres, de modo que es mejor tener un método para estimar el peso a partir de diversas características de un animal que se puedan determinar con facilidad. MINITAB tiene un conjunto
de datos en memoria que consisten en diversas características para una muestra de n 143
osos salvajes. La figura 13.7a) muestra una gráfica de puntos de y peso en función de
x distancia alrededor del pecho (circunferencia del pecho). A primera vista, parece como
si una sola línea obtenida de cuadrados mínimos ordinarios resumiría de manera eficaz el
patrón. La figura 13.7b) muestra que la curva LOWESS producida por MINITAB, usando
un espacio de 50% [el ajuste en (x*, y*), está determinada por el 50% más cercano de la
muestra]. La curva parece estar formada por dos segmentos de recta unidos arriba de aproximadamente x 38. La línea más inclinada a la derecha de 38, que indica el peso, tiende
a aumentar con más rapidez como lo hace la circunferencia para círculos mayores a 38 pulgadas.
500
400
Peso
514
3/12/08
300
200
100
0
20
30
40
Circunferencia en el pecho
a)
50
20
30
40
Circunferencia en el pecho
b)
50
500
400
Peso
c13_p500-567.qxd
300
200
100
0
Figura 13.7
Gráfica de puntos de MINITAB y curva LOWESS para datos del peso de osos.
www.FreeLibros.me
■
c13_p500-567.qxd
3/12/08
4:34 AM
Page 515
13.2 Regresión con variables transformadas
515
Es complicado hacer otras inferencias (por ejemplo, obtener un intervalo de confianza para un valor y medio) con base en este tipo general de modelo de regresión. La técnica
de instrucciones preliminares mencionada antes se puede usar para este fin.
Regresión logística
El modelo sencillo de regresión lineal es apropiado para relacionar una variable cuantitativa
de respuesta y a una pronosticadora cuantitativa x. Suponga que y es una variable dicotómica con valores posibles 1 y 0 correspondientes a éxito y fracaso. Sea p P(S) P(y 1).
Con frecuencia, el valor de p dependerá del valor de alguna variable cuantitativa x. Por
ejemplo, la probabilidad de que un auto necesita servicio de cierta clase dentro de la garantía bien podría depender de la distancia total recorrida por el vehículo, o la probabilidad de
evitar una infección de cierto tipo podría depender de la dosis en una vacuna. En lugar de usar
sólo el símbolo p para la probabilidad de éxito, ahora se usa p(x) para resaltar la dependencia
de esta probabilidad del valor de x. La ecuación de regresión lineal simple Y 0 1x
ya no es apropiada, porque tomar el valor medio de cada lado de la ecuación da
Yx 1 p(x) 0 (1 p(x)) p(x) 0 1x
Mientras que p(x) es una probabilidad y por tanto debe estar entre 0 y 1, 0 1x no necesitan estar en este rango.
En lugar de hacer que el valor medio de y sea una función lineal de x, ahora se considera un modelo en el que alguna función del valor medio de y es una función lineal de x. En
otras palabras, se hace que p(x) sea una función de 0 1x en lugar de 0 1x misma.
Una función que se ha encontrado muy útil en numerosas aplicaciones es la función logit
(de unidad logarítmica)
p(x)
e x
1 e x
0
1
0
1
La figura 13.8 muestra una gráfica de p(x) para valores particulares de 0 y 1 con 1 0.
Cuando x aumenta, la probabilidad de éxito se incrementa. Para 1 negativa, la probabilidad
de éxito sería una función decreciente de x.
p(x)
1.0
.5
0
10
20
30
Figura 13.8
40
50
60
70
80
x
Gráfica de una función logit.
Regresión logística significa suponer que p(x) está relacionada a x por la función logit. Álgebra sencilla muestra que
p(x)
e x
1 p(x)
0
www.FreeLibros.me
1
c13_p500-567.qxd
516
3/12/08
CAPÍTULO 13
4:34 AM
Page 516
Regresión múltiple y no lineal
La expresión del lado izquierdo recibe el nombre de razón de ventaja. Si, por ejemplo,
p(60)
3, entonces cuando x 60 un éxito tiene tres veces más probabilidad que un
1 p(60)
fracaso. Ahora se ve que el logaritmo de la probabilidad es una función lineal de la pronosticadora. En particular, el parámetro de pendiente 1 es el cambio en las probabilidades logarítmicas asociadas con un aumento de 1 unidad en x. Esto implica que la probabilidad en
sí cambia por el factor multiplicativo e cuando x aumenta en 1 unidad.
El ajuste de la regresión logística a los datos muestrales requiere que se estimen los
parámetros 0 y 1. Por lo general esto se hace usando la técnica de máxima verosimilitud
descrita en el capítulo 6. Los detalles son muy complicados, pero por fortuna los paquetes de
computación de estadística más populares harán esto previa solicitud y dan indicaciones
cuantitativas y gráficas de qué tan bien ajusta el modelo.
1
Ejemplo 13.6
A continuación se presentan los datos sobre temperatura en lanzamientos, y la incidencia de
falla de sellos anulares en 24 lanzamientos antes del desastre del Challenger de enero de 1986.
Temperatura
Falla
Temperatura
Falla
Temperatura
Falla
53
56
57
63
66
67
67
67
Sí
Sí
Sí
No
No
No
No
No
68
69
70
70
70
70
72
73
No
No
No
Sí
Sí
Sí
No
No
75
75
76
76
78
79
80
81
No
Sí
No
No
No
No
No
No
La figura 13.9 muestra una salida JMP para un análisis de regresión logística. Se ha seleccionado denotar con p la probabilidad de falla. Hubo la tendencia de que ocurrieran fallas a
temperaturas más bajas y éxitos a temperaturas más altas, de modo que la gráfica de p̂
Figura 13.9
Salida de regresión logística de JMP.
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:34 AM
Page 517
13.2 Regresión con variables transformadas
517
decrece cuando la temperatura aumenta. La estimación de 1 es ˆ 1 0.1713, y la desviación estándar estimada de ˆ1 es sˆ 0.08344. Siempre que n sea suficientemente grande, y
se supone que éste es el caso, ˆ1 tiene aproximadamente una distribución normal. Si 1 0
(la temperatura no afecta la probabilidad de falla de sello anular), z ˆ 1/sˆ tiene casi una
distribución normal estándar. El valor de esta razón z es 2.05, y el valor P para una prueba de dos colas es 0.0404 (el doble del área capturada bajo la curva z a la izquierda de
2.05). JMP publica el valor de una estadística de prueba ji cuadrada, que es z2, y el valor
P de ji cuadrada difiere del de z sólo por el redondeo. Por cada 1 grado de aumento en temperatura, la probabilidad de falla disminuye en un factor de casi 0.84. La temperatura en
el lanzamiento para la misión Challenger era de sólo 31°F. Como este valor es mucho menor que cualquier temperatura de la muestra, es riesgoso extrapolar la relación estimada.
Con todo, parece que para una temperatura así de baja, la falla de anillos anulares es casi
segura.
■
1
1
EJERCICIOS
15.
Sección 13.2 (15-25)
A nadie que le gusten las tortillas le gustan los pedacitos de
tortilla pastosos, de modo que es importante hallar características del proceso de producción que produzcan pedacitos
de tortilla con una textura atractiva. Los siguientes datos sobre x tiempo de freír (segundos) y y contenido de humedad (%) aparecieron en el artículo “Thermal and Physical
Properties of Tortilla Chips as a Function of Frying Time”
(J. of Food Processing and Preservation, 1995: 175-189).
x
5
10
15
20
25
30
45
60
y
16.3
9.7
8.1
4.2
3.4
2.9
1.9
1.3
a. Construya una gráfica de puntos de y en función de x y
comente.
b. Construya una gráfica de puntos de los pares (ln(x),
ln(y)) y comente.
c. ¿Qué relación probabilística entre x y y sugiere la figura
lineal de la gráfica del inciso b)?
d. Pronostique el valor del contenido de humedad cuando
el tiempo de freír es 20, en una forma que lleve información acerca de la confiabilidad y precisión.
e. Analice los residuos de ajustar el modelo de regresión lineal simple a los datos transformados y comente.
16. Las cuerdas de fibra de poliéster se usan cada vez más como componentes de líneas de amarre para estructuras de
mar adentro en aguas profundas. Los autores del artículo
“Quantifying the Residual Creep Life of Polyester Mooring
Ropes” (Intl. J. of Offshore and Polar Exploration, 2005:
223-228) utilizaron los datos siguientes como base para estudiar la forma en que el tiempo para falla (h) dependía de
la carga (% de carga de ruptura):
Carga: 77.7
77.8
Tiempo: 5.067 552.056
77.9
77.8
127.809 7.611
85.5
0.124
85.5
0.077
Carga: 89.2
Tiempo: 0.008
89.3
0.013
73.1
49.439
85.5
0.503
89.2
0.362
85.5
9.930
Carga: 89.2
Tiempo: 0.677
85.5
5.322
89.2
0.289
82.3
53.079
82.0
7.625
82.3
155.299
Se ajustó una regresión lineal de log(tiempo) en función de
la carga. Los investigadores estuvieron particularmente interesados en estimar la pendiente de la recta de regresión
verdadera al relacionar estas variables. Investigue la calidad
del ajuste, estime la pendiente, y pronostique el tiempo para falla cuando la carga es 80 en una forma que lleve información acerca de la confiabilidad y precisión.
17. Los datos siguientes sobre rapidez de combustión de la masa
x y longitud de flama y es representativa de los que aparecieron en el artículo “Some Burning Characteristics of Filter Paper” (Combustion Science and Technology, 1971: 103-120):
|
|
x
y
x
y
|
|
1.7
2.2
2.3
2.6
2.7
3.0
3.2
1.3
1.8
1.6
2.0
2.1
2.2
3.0
3.3
4.1
4.3
4.6
5.7
6.1
2.6
4.1
3.7
5.0
5.8
5.3
a. Estime los parámetros de un modelo de función de potencia.
b. Construya gráficas de diagnóstico para verificar si una
función de potencia es una opción apropiada de modelo.
4
4
c. Pruebe H0: 3 contra Ha: 3 , usando una prueba
de nivel 0.05.
d. Pruebe la hipótesis nula que expresa que la longitud media de la flama, cuando la rapidez de combustión es 5.0,
es el doble que la longitud media de flama cuando la rapidez de combustión es 2.5, contra la alternativa de que
éste no es el caso.
18. Las fallas de turbinas de gas de aviones debidas a un alto ciclo de fatiga es un problema muy extendido. El artículo
“Effect of Crystal Orientation on Fatigue Failure of Single
Crystal Nickel Base Turbine Blade Superalloys (J. of Engineering for Gas Turbines and Power, 2002: 161-176) dio
los datos siguientes y ajuste de un modelo de regresión no
lineal para pronosticar la amplitud de deformación de ciclos
hasta que ocurra una falla. Ajuste un modelo apropiado, investigue la calidad del ajuste, y pronostique la amplitud de
los ciclos hasta que ocurra una falla y sean 5000.
www.FreeLibros.me
c13_p500-567.qxd
518
3/12/08
CAPÍTULO 13
4:34 AM
Page 518
Regresión múltiple y no lineal
Obs
Ciclos
Amplit.
p/falla de deform.
1
2
3
4
5
6
7
8
9
10
1326
1593
4414
5673
29516
26
843
1016
3410
7101
0.01495
0.01470
0.01100
0.01190
0.00873
0.01819
0.00810
0.00801
0.00600
0.00575
Obs
11
12
13
14
15
16
17
18
19
Ciclos Amplit.
p/falla de deform.
7356
7904
79
4175
34676
114789
2672
7532
30220
0.00576
0.00580
0.01212
0.00782
0.00596
0.00600
0.00880
0.00883
0.00676
19. Se realizaron pruebas de resistencia térmica para estudiar la
relación entre temperatura y duración de alambre esmaltado de poliéster (“Thermal Endurance of Polyester Enameled Wires Using Twisted Wire Specimens”, IEEE Trans.
Insulation, 1965: 38-44), que dieron por resultado los datos
siguientes.
Temp.
Duración
Temp.
Duración
Temp.
Duración
|
|
|
|
|
|
200
200
200
200
200
200
5933
5404
4947
4963
3358
3878
220
220
220
220
220
220
1561
1494
747
768
609
777
240
240
240
240
240
240
258
299
209
144
180
184
a. Una gráfica de puntos de los datos ¿sugiere una relación
probabilística lineal entre duración y temperatura?
b. ¿Qué modelo está implicado por una relación lineal entre ln(duración) esperada y 1/temperatura? ¿Aparece
una gráfica de puntos de los datos transformados consistente con esta relación?
c. Estime los parámetros del modelo sugerido en el inciso b). ¿Qué duración se pronosticaría para una temperatura de 220?
d. Debido a que hay múltiples observaciones en cada valor x,
el método del ejercicio 14 se puede usar para probar la
hipótesis nula que expresa que el modelo sugerido en el
inciso b) es correcto. Realice la prueba al nivel 0.01.
20. El ejercicio 14 presentó datos sobre el peso corporal x y la rapidez de eliminación metabólica/peso corporal y. Considere
las siguientes funciones intrínsecamente lineales para especificar la relación entre las dos variables: a) ln(y) en función de
x, b) ln(y) en función de ln(x), c) y en función de ln(x), d) y
en función de 1/x, y e) ln(y) en función de 1/x. Use cualesquiera gráficas de diagnóstico apropiados y análisis para decidir cuáles de estas funciones seleccionaría para especificar
un modelo probabilístico. Explique su razonamiento.
21. Una gráfica del artículo “Thermal Conductivity of Polyethylene: The Effects of Crystal Size, Density, and Orientation on the Thermal Conductivity” (Polymer Eng. and
Science, 1972: 204-208) sugiere que el valor esperado de
conductividad térmica y es una función lineal de 104 1/x,
donde x es el grosor laminar.
x
y
|
|
240
410
460
490
520
590
745
8300
12.0
14.7 14.7 15.2 15.2 15.6
16.0
18.1
a. Estime los parámetros de la función de regresión y la
función de regresión en sí.
b. Pronostique el valor de conductividad térmica cuando el
grosor laminar sea de 500 Å.
22. En cada uno de los casos siguientes, decida si la función dada es intrínsecamente lineal. Si es así, identifique x y y, y
luego explique la forma en que un término de error aleatorio se puede introducir para dar un modelo probabilístico
intrínsecamente lineal.
a. y 1/( x)
b. y 1/(1 ex)
c. y ee (una curva Gompertz)
d. y ex
x
23. Suponga que x y y están relacionadas de acuerdo con un
modelo exponencial probabilístico Y ex , con V()
una constante independiente de x (como fue el caso en el
modelo lineal sencillo Y 0 1x ). ¿Es V(Y) una
constante independiente de x [como fue el caso para Y
0 1x , donde V(Y) 2]? Explique su razonamiento. Trace una figura de una gráfica de puntos prototipo que
resulte de este modelo. Conteste las mismas preguntas para
el modelo de potencia Y x .
24. La cifosis es una grave flexión hacia adelante de la espina
dorsal que se presenta después de una cirugía espinal correctiva. Un estudio realizado para determinar factores de
riesgo por la cifosis informó de las edades siguientes (meses) de 40 personas en el momento de la operación; las primeras 18 personas tenían cifosis, no así las 22 restantes.
Con cifosis
12
82
121
15
91
128
42
96
130
52
105
139
59
114
139
73
120
157
Sin cifosis
1
22
97
151
1
31
112
159
2
37
118
177
8
61
127
206
11
72
131
18
81
140
Utilice la regresión logística generada por MINITAB que
aparece a continuación, para determinar si la edad parece
tener un impacto significativo en la presencia de cifosis.
25. Los siguientes datos resultaron de un estudio encargado por
una gran empresa de consultoría de administración, para investigar la relación entre la cantidad de experiencia en el
trabajo (meses) para un consultor subalterno y la probabilidad de que el consultor sea capaz de realizar cierto trabajo
complejo.
Éxito
8
26
13
28
14
29
18
30
20
32
21
21
22
25
Fracaso
4
13
5
15
6
18
6
19
7
20
9
23
10
27
11
11
Interprete la regresión logística generada por MINITAB y
trace una gráfica de la probabilidad estimada de rendimiento en el trabajo como función de la experiencia.
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:34 AM
Page 519
13.3 Regresión con polinomios
519
Tabla de regresión logística para el ejercicio 24
Predictor
Constant
age
Coef
0.5727
0.004296
StDev
0.6024
0.005849
Z
0.95
0.73
P
0.342
0.463
Odds Ratio
95% Lower
CI Upper
1.00
0.99
1.02
Odds Ratio
95% Lower
CI Upper
1.19
1.05
1.36
Tabla de regresión logística para el ejercicio 25
Predictor
Constant
age
Coef
3.211
0.17772
StDev
1.235
0.06573
Z
2.60
2.70
P
0.009
0.007
13.3 Regresión con polinomios
Los modelos no lineales, pero intrínsecamente lineales de la sección 13.2, comprendían funciones de la variable independiente x que eran estrictamente crecientes o estrictamente decrecientes. En numerosas situaciones, ya sea de un razonamiento teórico o de otro tipo, una
gráfica de puntos sugiere que la verdadera función de regresión Yx tiene uno o más
picos o valles, es decir, al menos un mínimo o máximo relativos. En tales casos, una función con polinomios y 0 1x k x k puede dar una aproximación satisfactoria
a la verdadera función de regresión.
DEFINICIÓN
La ecuación del modelo de regresión con polinomios de grado k es
Y 0 1x 2x2 k xk
(13.6)
donde es una variable aleatoria normalmente distribuida con
0
2 2
(13.7)
De (13.6) y (13.7), se deduce de inmediato que
Yx 0 1x kxk
2
Yx
2
(13.8)
En otras palabras, el valor esperado de Y es una función con polinomios de k-ésimo grado
de x, mientras que la varianza de Y, que controla la dispersión de valores observados alrededor de la función de regresión, es la misma para cada valor de x. Se supone que los pares
observados (x1, y1), . . . , (xn, yn) se generaron de manera independiente del modelo (13.6).
La figura 13.10 ilustra un modelo cuadrático y cúbico.
y
y
x
a)
Figura 13.10
x
b)
a) Modelo de regresión cuadrático; b) modelo de regresión cúbico.
www.FreeLibros.me
c13_p500-567.qxd
520
3/12/08
CAPÍTULO 13
4:34 AM
Page 520
Regresión múltiple y no lineal
Estimación de parámetros usando mínimos cuadrados
Para estimar 0, 1, . . . , k, considere una función de regresión de ensayo y b0 b1x
bkxk. Entonces la bondad de ajuste de esta función a los datos observados se puede
evaluar al calcular la suma de desviaciones al cuadrado
n
f (b0, b1, . . . , bk) [yi (b0 b1xi b2x 2i bkx ik )]2
(13.9)
i1
Según el principio de mínimos cuadrados, las estimaciones ˆ 0, ˆ 1, . . . , ˆ k son los valores
de b0, b1, . . . , bk que minimizan la expresión (13.9). Debe observarse que cuando x1, x2, . . . ,
xn son todas diferentes, hay un polinomio de grado n 1 que se ajusta a los datos perfectamente, de modo que el valor minimizador de (13.9) es 0 cuando k n 1. No obstante,
en casi todas las aplicaciones, el modelo con polinomios (13.6) con k grande es bastante
irreal, y en la mayor parte de aplicaciones k 2 (cuadrático) o k 3 (cúbico) es apropiado.
Para hallar los valores minimizadores en (13.9), se toman las k 1 derivadas parciales ,f/,b0, ,f/,b1, . . . , ,f/,bk y se igualan a 0, lo cual produce el sistema de ecuaciones
normales para las estimaciones. Debido a que la función de ensayo b0 b1x bkxk
es lineal en b0, . . . , bk (aunque no en x), las k 1 ecuaciones normales son lineales en las
incógnitas:
b0 n b1 xi b2 x 2i bk x ki yi
b0 xi b1 x 2i b2 x 3i bk x ik1 xiyi
k
b0 x ki b1 x ik1 bk x2k
i x i yi
(13.10)
Todos los paquetes de computadora estándar de estadística resolverán de manera automática las ecuaciones de (13.10) y darán las estimaciones junto con otra gran cantidad de información.*
Ejemplo 13.7
El artículo “Residual Stresses and Adhesion of Thermal Spray Coatings” (Surface Engineering, 2005: 35-40) consideró la relación entre el grosor (m) de capas de NiCrAl depositadas en sustrato de acero inoxidable y la resistencia a la adherencia (MPa). Los datos que
aparecen a continuación se interpretaron de una gráfica del artículo antes citado.
|
Resistencia |
Grosor
|
Resistencia |
Grosor
220
220
220
220
370
370
370
370
440
440
24.0
22.0
19.1
15.5
26.3
24.6
23.1
21.2
25.2
24.0
440
440
680
680
680
680
860
860
860
860
21.7
19.2
17.0
14.9
13.0
11.8
12.2
11.2
6.6
2.8
La gráfica de puntos de la figura 13.11a) apoya la selección del modelo de regresión cuadrático. La figura 13.11b) contiene una salida de MINITAB de un ajuste de este modelo. Los
coeficientes estimados de regresión son
ˆ 0 14.521
ˆ 1 0.04323
ˆ 2 0.00006001
* En la sección 13.4 se estudia que la regresión con polinomios es un caso especial de regresión múltiple, de modo que en general se usa un comando apropiado para este último trabajo.
www.FreeLibros.me
3/12/08
4:34 AM
Page 521
13.3 Regresión con polinomios
521
de los que la función estimada de regresión es
y 14.521 0.04323x 0.00006001x2
La sustitución de valores de x sucesivos 220, 220, . . . , 860 y 860 en esta función da los valores pronosticados ŷ1 21.128, . . . , ŷ20 7.321 y los residuos y1 ŷ1 2.872, . . . ,
y20 ŷ20 4.521 resultan de sustracción. La figura 13.12 muestra una gráfica de los residuos estandarizados en función de ŷ y también una gráfica de probabilidad normal de los
residuos estandarizados, los cuales validan el modelo cuadrático.
30
25
Strength
c13_p500-567.qxd
20
15
10
5
0
0
200
400
600
Thickness
800
1000
a)
The regression equation is
strength = 14.5 + 0.0432 thickness - 0.000060 thicksqd
Predictor
Constant
thickness
thicksqd
Coef
14.521
0.04323
-0.00006001
S = 3.26937
SE Coef
4.754
0.01981
0.00001786
R-Sq = 78.0%
T
3.05
2.18
-3.36
P
0.007
0.043
0.004
R-Sq(adj) = 75.4%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
2
17
19
SS
643.29
181.71
825.00
MS
321.65
10.69
F
30.09
P
0.000
Predicted Values for New Observations
New
Obs
1
2
Fit
21.136
10.704
SE Fit
1.167
1.189
95% CI
(18.674, 23.598)
( 8.195, 13.212)
95% PI
(13.812, 28.460)
( 3.364, 18.043)
Values of Predictors for New Observations
New
Obs
1
2
thickness
500
800
thicksqd
250000
640000
b)
Figura 13.11
lo cuadrático.
a) Gráfica de puntos de datos del ejemplo 13.7 b) Salida MINITAB del ajuste del mode-
www.FreeLibros.me
CAPÍTULO 13
4:34 AM
Page 522
Regresión múltiple y no lineal
Residuo en función de los valores ajustados
Grfic a de probabilidad normal de residuos
99
Residuo estandarizado
522
3/12/08
Porcentaje
c13_p500-567.qxd
90
50
10
1
–2
–1
0
1
Residuo estandarizado
Figura 13.12
2
1
0
–1
–2
8
2
12
16
Valor ajustado
20
24
Gráfica de diagnóstico para ajuste de modelo cuadrático a datos del ejemplo 13.7. ■
ˆ 2 y R2
Para hacer inferencias adicionales acerca de los parámetros de la función de regresión, debe estimarse la varianza de error 2. Con ŷi ˆ 0 ˆ 1xi ˆ k x ik,, el residuo i-ésimo
es yi ŷi y la suma del cuadrado de residuos (suma de los cuadrados del error) es SCE
(yi ŷi)2. La estimación de 2 es entonces
ˆ 2 s2
SCE
CME
n (k 1)
(13.11)
donde el denominador n (k 1) se usa porque k 1 grados de libertad se pierden al estimar 0, 1, . . . , k.
Si de nuevo se hace STC (yi y)2, entonces SCE/STC es la proporción de la variación total en las yi observadas que no es explicada por el modelo con polinomios. La cantidad 1 SCE/STC, la proporción de variación explicada por el modelo, recibe el nombre
de coeficiente de determinación múltiple y se denota con R2.
Suponga que se considera ajustar un modelo cúbico a los datos del ejemplo 13.7. Debido a que el modelo cúbico incluye el cuadrático como un caso especial, el ajuste de un
cúbico será al menos tan bueno como el ajuste a un cuadrático. En forma más general, con
SCEk suma de los cuadrados del error de un polinomio de k-ésimo grado, SCEk SCEk
y R2k R2k siempre que k k. Como el objetivo del análisis de regresión es hallar un modelo que sea sencillo (con relativamente pocos parámetros) y que dé un buen ajuste a los datos, un polinomio de grado superior puede no especificar un modelo mejor que un modelo
de grado inferior a pesar de su mayor valor de R2. Para equilibrar el costo de usar más parámetros contra la ganancia en R2, muchos expertos en estadística usan el coeficiente ajustado de determinación múltiple
R2 ajustada 1
SCE
(n 1)R2 k
n1
n (k 1) STC
n1k
(13.12)
La R2 ajustada iguala hacia arriba la proporción de variación no explicada [porque la razón
(n 1)/(n k 1) excede de 1], que resulta en R2 ajustada R2. Entonces, si R22 0.66,
R23 0.70 y n 10, entonces
R22 ajustada
9(0.66) 2
0.563
10 3
ajustada R23
9(0.70) 3
0.550
10 4
de modo que la pequeña ganancia en R2, al pasar de un modelo cuadrático a uno cúbico, no
es suficiente para compensar el costo de sumar un parámetro extra al modelo.
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:34 AM
Page 523
13.3 Regresión con polinomios
Ejemplo 13.8
(Continúa del
ejemplo 13.7)
523
SCE y STC se encuentran por lo general en salidas de computadora en una tabla ANOVA.
La figura 13.11b) da SCE 181.71 y STC 825.00, para los datos de resistencia a la
adherencia, de donde R2 1 181.71/825.00 0.780 (alternativamente, R2 SCR/STC
643.29/825.00 0.780). Así, 78.0% de la variación observada en resistencia a la adherencia se puede atribuir a la relación del modelo. R2 ajustada 0.754, es sólo un pequeño
cambio hacia abajo en R2. Las estimaciones de 2 y son
SCE
181.71
ˆ 2 s 2
10.69
n (k 1)
20 (2 1)
ˆ s 3.27
■
Además de calcular R2 y ajustar R2, se deben examinar las gráficas de diagnóstico
usuales para determinar si son válidas las suposiciones del modelo o si puede ser apropiada
una modificación.
Intervalos estadísticos y procedimientos de prueba
Debido a que las yi aparecen en las ecuaciones normales (13.10) sólo en el lado derecho y
en forma lineal, las estimaciones resultantes ˆ 0, . . . , ˆ k son por sí mismas funciones lineales de las yi. En esta forma, los estimadores son funciones lineales de las Yi, de modo que
cada ˆ i tiene una distribución normal. También se puede demostrar que cada ˆ i es un estimador insesgado de i.
La desviación estándar del estimador ˆ i se denota con ˆ . Esta desviación estándar
tiene la forma
i
expresión complicada que comprende todas las
xj , x 2j , . . . , y x jk
ˆ
i
Por fortuna, la expresión dentro de llaves se ha programado en todos los paquetes computarizados de estadística que se usan con más frecuencia. La desviación estándar estimada de
ˆ i, sˆ , resulta de sustituir s en lugar de en la expresión para ˆ . Estas desviaciones estándar estimadas sˆ , sˆ , . . . , y sˆ aparecen en la salida de todos los paquetes de estadística citados líneas antes. Se denota con Sˆ el estimador de ˆ , es decir, la variable aleatoria cuyo
valor observado es sˆ . Entonces se puede demostrar que la variable estandarizada
ˆ i i
T
(13.13)
Sˆ
i
i
0
k
1
i
i
i
i
tiene una distribución t basada en n (k 1) grados de libertad. Esto lleva a los procedimientos inferenciales siguientes.
Un intervalo de confianza (IC) 100(1 )% para i, el coeficiente de xi de la función
de regresión con polinomios, es
ˆ i ! t/2,n(k1) sˆ
i
Una prueba de H0: i i0 está basada en el valor estadístico t
ˆ i0
t i
sˆ
La prueba está basada en n (k 1) grados de libertad y es de cola superior, cola inferior, o de dos colas, según si la desigualdad Ha es , o .
i
Una estimación puntual de Yx es decir, de 0 1x kxk, es ˆ Yx ˆ 0
ˆ 1x ˆ k x k. La desviación estándar estimada del estimador correspondiente es más
bien complicado. Numerosos paquetes de computadora darán esta desviación estándar
www.FreeLibros.me
c13_p500-567.qxd
524
3/12/08
CAPÍTULO 13
4:34 AM
Page 524
Regresión múltiple y no lineal
estimada para cualquier valor de x cuando un usuario lo pida. Esto, junto con una variable
t estandarizada apropiada, se puede usar para justificar los procedimientos siguientes.
Se denota con x* un valor especial de x. Un intervalo de confianza (IC) 100(1 a)%
para Yx* es
Desv. Est. estimada de
ˆ Yx* ! t/2,n(k1)
ˆ Yx*
Con Ŷ ˆ0 ˆ1x* ˆk(x*)k, ŷ denotando el valor calculado deŶ para los datos dados y sŶ denotando la desviación estándar estimada de la estadística Ŷ, la fórmula para el intervalo de confianza es muy semejante a la del caso de regresión lineal
simple:
ŷ ! t/2,n(k1) sŶ
Un intervalo de predicción 100(1 a)% para un valor y futuro a observar cuando
x x* es
Desv. Est. estimada 2 1/2
ˆ Yx* ! t/2,n(k1) s2
ŷ ! t/2,n(k1) s2
sŶ2
ˆ Yx*
de
Ejemplo 13.9
(Continúa del
ejemplo 13.8)
La figura 13.11b) muestra que ˆ 2 0.00006001 y sˆ 0.00001786 (de la columna de
coeficientes SE al principio de la salida). La hipótesis nula H0: 2 0 dice que mientras la
pronosticadora lineal x se retenga en el modelo, la pronosticadora cuadrática x2 no proporciona información útil adicional. La alternativa relevante es Ha: 2 0 y la estadística de
prueba es T ˆ 2/Sˆ , con valor calculado 3.36. La prueba está basada en n (k 1)
17 grados de libertad. Al nivel de significación de 0.05, la hipótesis nula es rechazada porque 3.36 2.110 t0.025,17. La inclusión de la pronosticadora cuadrática se justifica.
La misma conclusión resulta de comparar el valor P reportado de 0.004 al nivel escogido de
significación de 0.05.
La salida de la figura 13.11b) también contiene información de estimación y predicción para x 500 y para x 800. En particular, para x 500,
ŷ ˆ 0 ˆ 1(500) ˆ 2(500)2 Ajuste 21.136
2
2
sŶ Desv. Est. estimada de Ŷ SE Ajuste 1.167
de la cual un intervalo de confianza de 95% para resistencia media cuando el grosor es 500
es 21.136 ! (2.110)(1.167) (18.67, 23.60). Un intervalo de predicción de 95% para la resistencia que resulta de una sola adherencia cuando el grosor es 500 es 21.136 !
(2.110)[(3.27)2 (1.167)2]1/2 (13.81, 28.46). Como ya se dijo antes, el intervalo de predicción es considerablemente más ancho que el intervalo de confianza porque s es grande en
comparación con el ajuste del error estándar (SE).
■
Centrado de valores x
Para el modelo cuadrático con función de regresión Yx 0 1x 2x2, los parámetros
0, 1 y 2 caracterizan el comportamiento de la función cerca de x 0. Por ejemplo, 0 es
la altura a la que la función de regresión cruza el eje vertical x 0, mientras que 1 es la
primera derivada de la función en x 0 (rapidez de cambio instantánea de Yx en x 0).
Si todas las xi están lejos de 0, no se puede tener información precisa acerca de los valores
de estos parámetros. Sea x promedio de las xi para las que se toman observaciones, y considere el modelo
Y *0 *1 (x x ) *2 (x x )2
(13.14)
En el modelo (13.14), Yx *0 *1 (x x) *2 (x x) , y los parámetros ahora describen el comportamiento de la función de regresión cerca del centro x de los datos.
Para estimar los parámetros de (13.14), simplemente se resta x de cada xi para obtener xi xi x, y luego se usan las xi en lugar de las xi. Un beneficio importante de esto es
2
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:34 AM
Page 525
13.3 Regresión con polinomios
525
que los coeficientes de b0, . . . , bk de las ecuaciones normales (13.10) serán de magnitud
mucho menor de lo que sería el caso si se usaran las xi originales. Cuando el sistema se resuelve en computadora, este centrado protege contra cualquier error de redondeo que pueda resultar.
Ejemplo 13.10
El artículo “A Method for Improving the Accuracy of Polynomial Regression Analysis”
(J. Quality Technology, 1971: 149-155) informa acerca de los datos siguientes sobre x
temperatura de cura (°F) y y resistencia máxima al corte de un compuesto de caucho (en
libras por pulgada cuadrada), con x 297.13:
x
x
y
|
|
|
280
284
292
295
298
305
308
315
17.13
13.13
5.13
2.13
0.87
7.87
10.87
17.87
770
800
840
810
735
640
590
560
Un análisis de computadora dio los resultados que se ilustran en la tabla 13.4.
Tabla 13.4 Coeficientes estimados y desviaciones estándar para el ejemplo 13.10
Parámetro
0
1
2
Estimado
DE estimada
26 219.64
189.21
0.3312
11 912.78
80.25
0.1350
Parámetro
Estimado
DE estimada
*0
*1
*2
759.36
7.61
0.3312
23.20
1.43
0.1350
La función de regresión estimada usando el modelo original es y 26 219.64
189.21x 0.3312x2, mientras que el modelo centrado de la función es y 759.36
7.61(x 297.13) 0.3312(x 297.13)2. Estas funciones estimadas son idénticas; la única diferencia es que se han estimado parámetros diferentes para los dos modelos. Las desviaciones estándar estimadas indican con claridad que *0 y *1 se han estimado con más
precisión que 0 y 1. Los parámetros cuadráticos son idénticos (2 *2 ), como se puede
ver al comparar el término x2 en (13.14) con el modelo original. Otra vez se destaca aquí
que un beneficio importante del centrado es la ganancia en precisión computacional, no sólo en modelos cuadráticos sino de orden superior.
■
El libro de Neter y otros, que aparece en la bibliografía del capítulo, es una buena
fuente de más información acerca de una regresión con polinomios.
EJERCICIOS
Sección 13.3 (26-35)
26. Además de una regresión lineal de densidad verdadera sobre el contenido de humedad, el artículo citado en el ejercicio 6 consideró una regresión cuadrática de densidad por
volumen contra el contenido de humedad. A continuación
aparecen datos de una gráfica del artículo, junto con una salida MINITAB del ajuste cuadrático.
The regression equation is
bulkdens 403 16.2 moiscont 0.706 contsqd
Predictor
Coef
StDev
T
P
Constant
403.24
36.45
11.06
0.002
moiscont
16.164
5.451
2.97
0.059
contsqd
0.7063
0.1852
3.81
0.032
S 10.15 R-Sq 93.8% R-Sq(adj) 89.6%
Analysis of Variance
Source
DF
SS
MS
F
P
Regression
2 4637.7 2318.9 22.51 0.016
Residual Error
3
309.1
103.0
Total
5 4946.8
(continúa en la parte superior de la siguiente columna)
Analysis of Variance
Obs moiscont bulkdens
Fit
1
7.0
479.00 481.78
2
10.3
503.00 494.79
3
13.7
487.00 492.12
4
16.6
470.00 476.93
5
19.8
458.00 446.39
6
22.0
412.00 416.99
Fit
491.10
StDev
St
Fit Residual Resid
9.35
2.78 0.70
5.78
8.21 0.98
6.49
5.12 0.66
6.10
6.93 0.85
5.69
11.61 1.38
8.75
4.99 0.97
StDev
Fit
95.0% CI
95.0% PI
6.52 (470.36, 511.83) (452.71, 529.48)
a. La gráfica de puntos de los datos, ¿parece consistente
con el modelo de regresión cuadrático?
b. ¿Qué proporción de variación observada en densidad se
puede atribuir a la relación del modelo?
c. ¿Parece útil el modelo cuadrático? Realice una prueba al
nivel 0.05 de significación.
www.FreeLibros.me
c13_p500-567.qxd
526
3/12/08
CAPÍTULO 13
4:34 AM
Page 526
Regresión múltiple y no lineal
d. La última línea de la salida es de una información de petición de estimación y predicción cuando el contenido de
humedad es 14. Calcule un intervalo de predicción de 99%
para densidad cuando el contenido de humedad sea de 14.
e. ¿El predictor cuadrático parece dar información útil?
Pruebe las hipótesis apropiadas al nivel 0.05 de significación.
27. Los datos siguientes sobre y concentración de glucosa
(g/l), y x tiempo de fermentación (días) para una mezcla
particular de licor de malta, se leyeron de una gráfica de
puntos del artículo “Improving Fermentation Productivity
with Reverse Osmosis” (Food Tech., 1984: 92-96):
x
y
||
1
2
3
4
5
6
7
8
74
54
52
51
52
53
58
71
a. Verifique que una gráfica de puntos de los datos sea consistente con la selección de un modelo de regresión cuadrático.
b. La ecuación de regresión cuadrática estimada es y
84.482 15.875x 1.7679x2. Pronostique el valor de
concentración de glucosa para un tiempo de fermentación de 6 días, y calcule el residuo correspondiente.
c. Usando SCE 61.77, ¿qué proporción de variación observada se puede atribuir a la relación de regresión cuadrática?
d. Los n 8 residuos estandarizados basados en el modelo cuadrático son 1.91, 1.95, 0.25, 0.58, 0.90, 0.04,
0.66 y 0.20. Construya una gráfica de los residuos
estandarizados contra x y una gráfica de probabilidad normal. ¿Estas gráficas muestran algunas características
problemáticas?
e. La desviación estándar estimada de ˆ Y6, es decir, ˆ 0
ˆ 1(6) ˆ 2(36), es 1.69. Calcule un intervalo de confianza de 95% para Y6.
f. Calcule un intervalo de predicción de 95% para una observación de concentración de glucosa hecha después de
6 días de tiempo de fermentación.
28. La viscosidad (y) de un aceite se midió con un cono y un viscosímetro de plato a seis velocidades de cono diferentes (x).
Se supuso que un modelo de regresión cuadrático era
apropiado, y la función de regresión estimada resultante de
las n 6 observaciones fue
y 113.0937 3.3684x 0.01780x
misma clase, por ejemplo, menos costos de producción y
aplicación, versatilidad y rendimiento a altas temperaturas.
Los datos siguientes sobre x viscosidad (MPa s) y y
derrame libre (%) se obtuvieron de una gráfica del artículo
“Processing of Zero-Cement Self-Flow Alumina Castables”
(The Amer. Ceramic Soc. Bull., 1998: 60-66):
x
351
367
373
400
402
456 484
y
a. Estime Y75, la viscosidad esperada cuando la velocidad
es 75 rpm.
b. ¿Qué viscosidad se pronosticaría para una velocidad de
cono de 60 rpm?
c. Si y2i 8 386.43, yi 210.70, xiyi 17 002.00,
y x 2i yi 1 419 780, calcule SCE [ y2i ˆ 0yi
ˆ
1xiyi ˆ 2 x 2i yi], s 2 y s.
d. Del inciso c), STC 8386.43 (210.0)2/6 987.35.
Usando el SCE calculado en el inciso c), ¿cuál es el valor calculado de R2?
e. Si la desviación estándar estimada de ˆ 2 es sˆ 2
0.00226, pruebe H0: 2 0 contra Ha: 2 0 al nivel
0.01, e interprete el resultado.
29. En años recientes se han investigado de manera extensa los
productos moldeables refractarios de alta alúmina por sus
importantes ventajas sobre otros ladrillos refractarios de la
83
79
75
70
43
22
2
y
x
y
2
81
Los autores del artículo científico citado relacionaron estas
dos variables usando un modelo de regresión cuadrático. La
función de regresión estimada es y 295.96 2.1885x
0.0031662x2.
a. Calcule los valores y residuos pronosticados, y luego
SCE y s2.
b. Calcule e interprete el coeficiente de determinación
múltiple.
c. La desviación estándar (DE) de ˆ2 es s ˆ 0.0004835.
¿El predictor cuadrático pertenece al modelo de regresión?
d. La desviación estándar (DE) estimada de ˆ 1 es 0.4050.
Use esto y la información en c) para obtener los intervalos de confianza conjuntos para los coeficientes de regresión cuadrática y lineal con un nivel de confianza
conjunto de (al menos) 95 por ciento.
e. La desviación estándar estimada de ˆ Y400 es 1.198. Calcule un intervalo de confianza de 95% para un derrame libre
promedio cuando la viscosidad 400 y también un intervalo de predicción de 95% para derrame libre que
resulte de una sola observación hecha cuando la viscosidad es 400, y compare los intervalos.
30. El artículo “A Simulation-Based Evaluation of Three Cropping Systems on Cracking-Clay Soils in a Summer Rainfall
Environment” (Agricultural Meteorology, 1976: 211-229)
propone un modelo cuadrático para la relación entre el índice (x) de suministro de agua y la producción (y) de trigo.
A continuación aparecen datos representativos y la generada por MINITAB:
x
1.2
1.3
1.5
1.8
2.1
2.3
2.5
||
||
790
950
740
1230
1000
1465
1370
2.9
3.1
3.2
3.3
3.9
4.0
4.3
1420
1625
1600
1720
1500
1550
1560
The regression equation is
yield 252 1000 index 135 indexsqd
Predictor
Constant
Index
Indexsqd
Coef
251.6
1000.1
135.44
Stdev
285.1
229.5
41.97
t-ratio
0.88
4.36
3.23
p
0.396
0.001
0.008
s 135.6 R-sq 85.3% R-sq(adj) 82.6%
Analysis of Variance
SOURCE
Regression
Error
Total
DF
2
11
13
SS
1170208
202228
1372435
MS
585104
18384
F
31.83
p
0.000
a. Interprete el valor del coeficiente de determinación
múltiple.
b. Calcule un intervalo de confianza de 95% para el coeficiente del predictor cuadrático.
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:34 AM
Page 527
13.3 Regresión con polinomios
c. La desviación estándar estimada de ˆ 0 ˆ 1x ˆ 2x2
cuando x 2.5 es 53.5. Pruebe H0: Y2.5 1500 contra
Ha: Y2.5 1500 usando 0.01.
d. Obtenga un intervalo de predicción de 95%, para producción de trigo cuando el índice de abastecimiento de
agua es 2.5, usando la información dada en el inciso c).
31. La información siguiente se obtuvo de un estudio de cierto
método para preparar alcohol puro de corrientes de refinería (“Direct Hydration of Olefins”, Industrial and Eng.
Chemistry, 1961: 209-211). La variable independiente x es
la velocidad de espacio horario en volumen, y la variable
dependiente y es la cantidad de conversión de isobutileno.
x
y
|
|
1
1
2
4
4
4
6
23.0
24.5
28.0
30.9
32.0
33.6
20.0
a. Suponiendo que un modelo probabilístico cuadrático
sea apropiado, estime la función de regresión.
b. Determine los valores y residuos pronosticados, y construya una gráfica de residuos. ¿La gráfica se ve aproximadamente como se esperaba cuando el modelo cuadrático
es correcto? ¿La gráfica indica que cualquier observación
había tenido una gran influencia en el ajuste? ¿La gráfica de puntos identifica un punto que tenga gran influencia? Si es así, ¿cuál punto?
c. Obtenga s2 y R2. ¿El modelo cuadrático da un buen ajuste a los datos?
d. En el ejercicio 11, se observó que el valor pronosticado
Ŷj y el residuo Yj Ŷj son independientes entre sí, de modo que 2 V(Yj) V(Ŷj) V(Yj Ŷj). Una salida
impresa de computadora da las desviaciones estándar
estimadas de los valores pronosticados como 0.955,
0.955, 0.712, 0.777, 0.777, 0.777 y 1.407. Use estos valores junto con s2 para calcular la desviación estándar
estimada de cada residuo. Luego calcule los residuos estandarizados y dibújelos en función de x. ¿La gráfica se
ve muy semejante a la gráfica del inciso b)? Suponga el
lector que había estandarizado los residuos usando sólo
s en el denominador. ¿Los valores resultantes diferirían
mucho de los valores correctos?
e. Usando información dada en el inciso d), calcule un intervalo de predicción de 90% para conversión de isobutileno
cuando la velocidad de espacio horario en volumen es 4.
32. La información siguiente es un subconjunto de datos obtenidos en un experimento para estudiar la relación entre el
pH del suelo x y y A1. La concentración /EC (“Root Responses of Three Gramineae Species to Soil Acidity in an
Oxisol and an Ultisol”, Soil Science, 1973: 295-302):
x
y
x
y
x
y
|
|
|
|
|
|
4.01
4.07
4.08
4.10
4.18
1.20
0.78
0.83
0.98
0.65
4.20
4.23
4.27
4.30
4.41
0.76
0.40
0.45
0.39
0.30
4.45
4.50
4.58
4.68
4.70
4.77
0.20
0.24
0.10
0.13
0.07
0.04
Se propuso un modelo cúbico en el artículo, pero la versión
de MINITAB empleada por el autor del presente texto re-
527
chazó incluir el término x3 en el modelo, expresando que
“x3 está altamente correlacionada con otros variables predictores”. Para solucionar esto, x 4.3456 se restó de cada
valor x para obtener x x x. Se requirió entonces una
regresión cúbica para ajustar el modelo teniendo la función
de regresión
y *0 *1x *2(x)2 *3(x)3
Dio por resultado la siguiente salida de computadora:
Parámetro
Estimado
DE estimada
*0
*1
*2
*3
0.3463
1.2933
2.3964
2.3968
0.0366
0.2535
0.5699
2.4590
a. ¿Cuál es la función de regresión estimada para el modelo “centrado”?
b. ¿Cuál es el valor estimado del coeficiente 3 en el modelo “no centrado” con función de regresión y 0
1x 2x2 3x3? ¿Cuál es la estimación de 2?
c. Usando el modelo cúbico, ¿qué valor de y se pronosticaría cuando el pH del suelo es de 4.5?
d. Realice una prueba para determinar si el término cúbico
debe ser retenido en el modelo.
33. En numerosos problemas de regresión con polinomios, en
lugar de ajustar una función de regresión “centrada” usando x x x, la precisión en computadoras se puede mejorar si se usa una función de la variable independiente
estandarizada x (x x )/sx, donde sx es la desviación estándar de las xi. Considere ajustar la función de regresión
cúbica y *0 *1x *2(x)2 *3(x)3 a los siguientes
datos, que resultan de un estudio de la relación entre eficiencia de empuje y de cohetes impulsores supersónicos y
el ángulo x de semidivergencia de la nariz del cohete (“More on Correlating Data”, CHEMTECH, 1976: 266-270):
x
y
|
|
5
10
15
20
25
30
35
0.985 0.996 0.988 0.962 0.940 0.915 0.878
Parámetro
Estimado
DE estimada
*0
*1
*2
*3
0.9671
0.0502
0.0176
0.0062
0.0026
0.0051
0.0023
0.0031
a. ¿Qué valor de y se pronosticaría cuando el ángulo de semidivergencia sea 20? ¿Y cuando x 25?
b. ¿Cuál es la función de regresión estimada ˆ0 ˆ1 x
ˆ 2 x 2 ˆ 3 x 3 para el modelo “no estandarizado”?
c. Use una prueba de nivel 0.05 para determinar si el término cúbico debe borrarse del modelo.
d. ¿Qué se puede decir acerca de la relación entre las SCE
y las R2 para modelos estandarizados y no estandarizados? Explique.
e. La SCE para el modelo cúbico es 0.00006300, mientras
que para un modelo cuadrático la SCE es 0.00014367.
Calcule la R2 para cada modelo. ¿La diferencia entre las
dos sugiere que el término cúbico debe ser borrado?
www.FreeLibros.me
c13_p500-567.qxd
528
3/12/08
CAPÍTULO 13
4:34 AM
Page 528
Regresión múltiple y no lineal
34. La información siguiente resultó de un experimento para
evaluar el potencial de tierras sin quemar de una mina de
carbón, como medio para el crecimiento de plantas. Las
variables son x cationes extraíbles de ácido y y acidez
intercambiable/(capacidad total de intercambio de cationes)
(“Exchangeable Acidity in Unburnt Colliery Spoil”, Nature, 1969: 161):
x
y
x
y
|
|
|
|
23
5
16
26
1.50
1.46
1.32
1.17
58
67
81
96
0.91
0.78
0.69
0.52
30
38
52
0.96 0.78 0.77
100
113
0.48 0.55
La estandarización de la variable independiente x para
obtener x (x x)/sx, y el ajuste de la función de regresión y *0 *1x *2(x)2, dieron la siguiente salida de
computadora.
Parámetro
Estimado
DE estimada
*0
*1
*2
0.8733
0.3255
0.0448
0.0421
0.0316
0.0319
a. Estime Y50.
b. Calcule el valor del coeficiente de determinación múltiple (vea el ejercicio 28c)).
c. ¿Cuál es la función de regresión estimada ˆ 0 ˆ 1x
ˆ 2x2 usando la variable x no estandarizada?
d. ¿Cuál es la desviación estándar estimada de ˆ 2 calculada en el inciso c)?
e. Realice una prueba usando las estimaciones estandarizadas para determinar si el término cuadrático debe retenerse en el modelo. Repita usando las estimaciones no
estandarizadas. ¿Difieren sus conclusiones?
35. El artículo “The Respiration in Air and in Water of the Limpets Patella caerulea and Patella lusitanica” (Comp. Biochemistry and Physiology, 1975: 407-411) propuso un
sencillo modelo de potencia para la relación entre el ritmo
de respiración y y la temperatura x para P. caerulea en aire.
No obstante, una gráfica de ln(y) en función de x muestra
una figura curva. Ajuste el modelo cuadrático de potencia
Y ex x a los datos siguientes.
2
x
y
|
|
10
15
20
25
30
37.1
70.1
109.7
177.2
222.6
13.4 Análisis de regresión múltiple
En regresión múltiple, el objetivo es construir un modelo probabilístico que relacione una
variable dependiente y a más de una variable independiente o predictores. Represente con k
el número de variables predictores (k 2) y denote estos predictores por x1, x2, . . . , xk. Por
ejemplo, al tratar de predecir el precio de venta de una casa, se podría tener
k 3 con x1 tamaño (pie2), x2 edad (años) y x3 número de habitaciones.
DEFINICIÓN
La ecuación general del modelo de regresión múltiple aditivo es
Y 0 1x1 2x2 kxk
(13.15)
donde E() 0 y V() 2. Además, para fines de prueba de hipótesis y calcular intervalos de confianza o intervalos de predicción, se supone que está normalmente
distribuida.
Sean x*1, x*2, . . . , x*k valores particulares de x1, . . . , xk. Entonces (13.15) implica que
x*,...,x* 0 1x*1 kx*k
1
k
(13.16)
En esta forma, así como 0 1x describe el valor medio Y como función de x en regresión
lineal simple, la verdadera función de regresión (o población) 0 1x1 kxk da
el valor esperado de Y como función de x1, . . . , xk. Las i son los verdaderos coeficientes
de regresión (o población). El coeficiente de regresión 1 se interpreta como el cambio esperado en Y asociado con un aumento de una unidad en x1 mientras x2, . . . , xk se mantengan fijos. Interpretaciones análogas se cumplen para 2, . . . , k.
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:34 AM
Page 529
13.4 Análisis de regresión múltiple
529
Modelos con interacción
y predictores cuadráticos
Si un investigador ha obtenido observaciones en y, x1 y x2, un modelo posible es Y 0
1x1 2x2 . No obstante, se pueden construir otros modelos al formar predictores y
funciones matemáticas de x1 y/o x2. Por ejemplo, con x3 x21 y x4 x1x2, el modelo
Y 0 1x1 2 x2 3 x3 4 x4
tiene la forma general de (13.15). En general, no es sólo permisible para algunos predictores ser funciones matemáticas de otras sino también que, con frecuencia, sean altamente deseables en el sentido de que el modelo resultante pueda ser mucho más exitoso para explicar
la variación en y que cualquier otro modelo sin estas pronosticadoras. Esta discusión también muestra que la regresión con polinomios es ciertamente un caso especial de regresión
múltiple. Por ejemplo, el modelo cuadrático Y 0 1x 2x2 tiene la forma de
(13.15) con k 2, x1 x y x2 x2.
Para el caso de dos variables independientes, x1 y x2, hay cuatro modelos útiles de regresión múltiple.
1. El modelo de primer orden:
Y 0 1x1 2x2
2. El modelo de segundo orden sin interacción:
Y 0 1x1 2 x2 3 x21 4 x 22
3. El modelo con predictores de primer orden e interacción:
Y 0 1x1 2 x2 3 x1x2
4. El modelo de segundo orden completo o cuadrático completo:
Y 0 1x1 2 x2 3 x 21 4 x22 5 x1x2
La comprensión de las diferencias entre estos modelos es un primer paso importante en la
construcción de modelos de regresión realistas a partir de las variables independientes bajo
estudio.
El modelo de primer orden es la generalización más fácil de regresión lineal simple.
Expresa que para un valor fijo de cualquiera de las dos variables, el valor esperado de Y es
una función lineal de la otra variable y que el cambio esperado en Y para un aumento unitario en x1 (x2) es 1 (2) independiente del nivel de x2 (x1). Entonces, si se dibuja la función de regresión como una función de x1 para diversos valores diferentes de x2, se obtiene
como contornos de la función de regresión un conjunto de rectas paralelas, como se ve en
la figura 13.13a). La función y 0 1x1 2x2 especifica un plano en espacio tridimensional; el primer modelo dice que cada uno de los valores observados de la variable dependiente corresponde a un punto que se desvía verticalmente de este plano en una cantidad
aleatoria .
Según el modelo de segundo orden sin interacción, si x2 es fija, el cambio esperado en
Y para un aumento de 1 unidad en x1 es
0 1(x1 1) 2x2 3(x1 1)2 4 x 22
(0 1x1 2x2 3 x 21 4 x 22) 1 3 23 x1
Debido a que este cambio esperado no depende de x2, los contornos de la función de regresión para diferentes valores de x2 son todavía paralelos entre sí. No obstante, la dependencia del cambio esperado en el valor de x1 significa que los contornos son ahora curvas en
lugar de rectas. Esto se ve en la figura 13.13b). En este caso, la superficie de regresión ya
no es un plano en espacio tridimensional sino que es una superficie curvada.
www.FreeLibros.me
c13_p500-567.qxd
530
3/12/08
CAPÍTULO 13
4:34 AM
Page 530
Regresión múltiple y no lineal
Los contornos de la función de regresión para el modelo de primer orden con interacción son rectas no paralelas. Esto es porque el cambio esperado en Y cuando x1 se aumenta
en 1 es
0 1(x1 1) 2x2 3(x1 1)x2 (0 1x1 2x2 3 x1x2) 1 3 x2
Este cambio esperado depende del valor de x2, de modo que cada línea de contorno debe tener una pendiente diferente, como se ve en la figura 13.13c). La palabra interacción refleja
el hecho de que un cambio esperado en Y, cuando una variable aumenta en valor, depende
del valor de la otra variable.
Por último, para el modelo completo de segundo orden, el cambio esperado en Y cuando x2 se mantiene fijo mientras x1 aumenta en 1 unidad es 1 3 23x1 5x2, que es una
función de x1 y de x2. Esto implica que los contornos de la función de regresión son curvos
y no paralelos entre sí, como se ilustra en la figura 13.13d).
E(Y )
E(Y )
10
10
5
x1
0
x2 1
x2 2
x2 1
x2 2
x2 3
5
x2 3
0
5
15
a) E(Y ) 1 0.5x1 x2
x1
15
b) E(Y ) 1 0.5x1 0.25x21 x2 0.5x22
5
E(Y )
E(Y )
15
x2 3
20
10
x2 2
10
5
x2 3
30
x2 2
x2 1
x2 1
x1
0
5
15
c) E(Y ) 1 0.5x1 x2 x1x2
Figura 13.13
x1
0
10
1
2
3
d) E(Y ) 1 0.5x1 0.25x21 x2 0.5x22 x1x2
Contornos de cuatro funciones de regresión diferentes.
Similares consideraciones aplican a modelos construidos a partir de más de dos variables independientes. En general, la presencia de términos de interacción en el modelo implica que el cambio esperado en y depende no sólo de la variable que se aumenta o
disminuye sino también de los valores de algunas de las variables fijas. Al igual que en
ANOVA, es posible tener términos de interacción de avance más elevado (por ejemplo
x1x2x3), lo que hace más difícil la interpretación del modelo.
Nótese que si el modelo contiene predictores de interacción o cuadráticos, la interpretación genérica de una i dada previamente no es aplicable por lo general. Esto es porque
entonces no es posible aumentar xi en 1 unidad y mantener fijos los valores de todos los otros
predictores.
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:34 AM
Page 531
531
13.4 Análisis de regresión múltiple
Modelos con predictores
para variables categóricas
Hasta este punto se ha considerado explícitamente la inclusión de sólo variables predictores cuantitativos (numéricos) en un modelo de regresión múltiple. Con el uso de codificación numérica sencilla, las variables cualitativas (categóricas), por ejemplo, material para
cojinetes (aluminio o cobre/plomo) o tipo de madera (pino, roble, o nogal), también se pueden incorporar en un modelo. Hay que enfocarse primero en el caso de una variable dicotómica, una con sólo dos categorías posibles, hombre o mujer, de manufactura norteamericana
o extranjera, etc. Con cualquiera de estas variables, se asocia una variable indicadora x o
imaginaria cuyos posibles valores 0 y 1 indican qué categoría es relevante para cualquier
observación particular.
Ejemplo 13.11
El artículo “Estimating Urban Travel Times: A comparative Study” (Trans. Res., 1980: 173175) describió un estudio que relacionaba la variable dependiente y tiempo de viaje entre lugares en cierta ciudad y la variable independiente x2 distancia entre lugares. Dos
tipos de vehículos, autos de pasajeros y camiones, se emplearon en el estudio. Sea
x1
{
1 si el vehículo es un camión
0 si el vehículo es un auto de pasajeros
Un posible modelo de regresión múltiple es
Y 0 1x1 2x2
El valor medio de tiempo de viaje depende de si un vehículo es un auto o un camión:
tiempo medio 0 2x2
tiempo medio 0 1 2x2
cuando x1 0 (autos)
cuando x1 1 (camiones)
El coeficiente 1 es la diferencia en tiempos medios entre camiones y autos con la distancia mantenida fija; si 1 0, a los camiones les tomará más tiempo en promedio recorrer
cualquier distancia particular que a los autos.
Una segunda posibilidad es un modelo con un predictor de interacción:
Y 0 1x1 2x2 3 x1x2
Ahora los tiempos medios para los dos tipos de vehículos son
tiempo medio 0 2x2
tiempo medio 0 1 (2 3)x2
cuando x1 0
cuando x1 1
Para cada modelo, la gráfica del tiempo medio contra distancia es una recta para cualquiera de
los dos tipos de vehículo, como se ilustra en la figura 13.14. Las dos rectas son paralelas
Media y
Media y
(x 1
0
+
1
0
+
+
x2
2
(x 1
=1
)
(x 1
)
=0
x2
2
0
+
1
+
( 2
0
+
1)
)x 2
3
x2
+ 2
(x 1
x2
a)
=
=0
)
x2
b)
Figura 13.14 Funciones de regresión para modelos con una variable imaginaria (x1) y una variable cuantitativa x2: a) sin interacción; b) interacción.
www.FreeLibros.me
c13_p500-567.qxd
532
3/12/08
CAPÍTULO 13
4:34 AM
Page 532
Regresión múltiple y no lineal
para el primer modelo (sin interacción), pero en general tendrán diferentes pendientes cuando el segundo modelo es correcto. Para este último modelo, el cambio en tiempo medio de
viaje asociado con un aumento de una milla en distancia depende de qué tipo de vehículo se trata, las dos variables “tipo de vehículo” y “tiempo de viaje” interactúan. De hecho, los
datos recolectados por los autores del artículo citado líneas antes sugirieron la presencia de
interacción.
■
Se podría pensar que la forma de manejar una situación de tres categorías es definir
una sola variable numérica con valores codificados, como por ejemplo 0, 1 y 2 correspondientes a las tres categorías. Esto es incorrecto, porque impone un orden en las categorías
que no está necesariamente implicado por el contexto del problema. El método correcto para incorporar tres categorías es definir dos variables imaginarias diferentes. Suponga, por
ejemplo, que y es la vida útil de cierta herramienta de corte, x1 es la velocidad de corte y que
hay tres marcas de herramienta que se investigan. Entonces, sea
x2
{
1 si se usa la herramienta marca A
0 de otro modo
x3
{
1 si se usa la herramienta marca B
0 de otro modo
Cuando se hace una observación en una herramienta marca A, x2 1 y x3 0, mientras que
para una herramienta marca B, x2 0 y x3 1. Una observación hecha en una herramienta marca C tiene x2 x3 0 y no es posible que x2 x3 1 porque una herramienta no
puede ser al mismo tiempo marca A y marca B. El modelo sin interacción tendría sólo las
pronosticadoras x1, x2 y x3. El siguiente modelo con interacción permite que el cambio medio en duración, asociado con un aumento de una unidad en velocidad, dependa de la marca de herramienta:
Y 0 1x1 2x2 3 x3 4 x1x2 5 x1x3
La construcción de una imagen como la figura 13.14, con una gráfica para cada uno de los
tres pares posibles (x2, x3), da tres líneas no paralelas (a menos que 4 5 0).
En forma más general, incorporar una variable categórica con c posibles categorías en
un modelo de regresión múltiple requiere el uso de c 1 variables indicadoras (por ejemplo, cinco marcas de herramientas necesitarían usar cuatro variables indicadoras). Entonces,
incluso una variable categórica puede sumar numerosos predictores a un modelo.
Estimación de parámetros
Los datos en regresión lineal simple constan de n pares (x1, y1), . . . , (xn, yn). Suponga que
un modelo de regresión múltiple contiene dos variables predictores, x1 y x2. Entonces, el
conjunto de datos estará formado por n tripletas (x11, x21, y1), (x12, x22, y2), . . . , (x1n, x2n, yn).
Aquí el primer subíndice de x se refiere al predictor y el segundo al número de observación. Más generalmente, con k predictores, los datos constan de n (k 1) múltiplos (x11,
x21, . . . , xk1, y1), (x12, x22, . . . , xk2, y2), . . . , (x1n, x2n, . . . , xkn, yn), donde xij es el valor
del i-ésimo predictor xi asociado con el valor observado yj. Se supone que las yj han sido observadas independientemente entre sí de acuerdo con el modelo (13.15). Para estimar los
parámetros 0, 1, . . . , k usando el principio de mínimos cuadrados, forme la suma de
desviaciones cuadradas de las y j observadas desde una función de ensayo
y b0 b1x1 bkxk:
f (b0, b1, . . . , bk) [yj (b0 b1x1j b2 x2j bkxkj)]2
(13.17)
j
Las estimaciones de mínimos cuadrados son los valores de las bi que minimizan f(b0, . . . ,
bk). Si se toma la derivada parcial de f con respecto a cada una de las bi (i 0, 1, . . . , k)
y se igualan a cero todas las parciales, se obtiene el siguiente sistema de ecuaciones normales:
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:34 AM
Page 533
13.4 Análisis de regresión múltiple
533
b0 n b1 x1j b2 x2j bk xkj yj
b0 x1j b1 x 21 j b2 x1j x2j bk x1j xkj x1jyj
(13.18)
b0 xkj b1 x1j xkj bk1 xk1, j xkj bk x 2kj xkjyj
Estas ecuaciones son lineales en las incógnitas b0, b1, . . . , bk. Al resolver (13.18) se obtienen
las estimaciones de mínimos cuadrados ˆ 0, ˆ 1, . . . , ˆ k. Esto se hace mejor si se utiliza
el paquete de software de estadística.
Ejemplo 13.12
El artículo “How to Optimize and Control the Wire Bonding Process: Part II” Solid State
Technology, Jan. 1991: 67-72) describió un experimento realizado para evaluar el impacto de
las variables x1 fuerza (gm), x2 potencia (mW), x3 temperatura (°C) y x4 tiempo
(ms) en y resistencia de pegamento al corte (gm). Los datos siguientes* se generaron para ser consistentes con la información dada en el artículo:
Observación
Fuerza
Potencia
Temperatura
Tiempo
Resistencia
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
30
40
30
40
30
40
30
40
30
40
30
40
30
40
30
40
25
45
35
35
35
35
35
35
35
35
35
35
35
35
60
60
90
90
60
60
90
90
60
60
90
90
60
60
90
90
75
75
45
105
75
75
75
75
75
75
75
75
75
75
175
175
175
175
225
225
225
225
175
175
175
175
225
225
225
225
200
200
200
200
150
250
200
200
200
200
200
200
200
200
15
15
15
15
15
15
15
15
25
25
25
25
25
25
25
25
20
20
20
20
20
20
10
30
20
20
20
20
20
20
26.2
26.3
39.8
39.7
38.6
35.5
48.8
37.8
26.6
23.4
38.6
52.1
39.5
32.3
43.0
56.0
35.2
46.9
22.7
58.7
34.5
44.0
35.7
41.8
36.5
37.6
40.3
46.0
27.8
40.3
* Del libro Statistics Engineering Problem Solving, de Stephen Vardeman, una excelente exposición del área cubierta en este libro, aunque a un nivel un tanto más alto.
www.FreeLibros.me
c13_p500-567.qxd
534
3/12/08
CAPÍTULO 13
4:34 AM
Page 534
Regresión múltiple y no lineal
Un paquete computarizado de estadística dio los siguientes estimados de mínimos cuadrados:
ˆ 0 37.48
ˆ 1 0.2117
ˆ 2 0.4983
ˆ 3 0.1297
ˆ 4 0.2583
Entonces se estima que 0.1297 gm es el cambio promedio en resistencia asociado con un
aumento de un grado en temperatura, cuando los otros predictores se mantienen fijos; los
otros coeficientes estimados se interpretan de un modo semejante.
La ecuación estimada de regresión es
y 37.48 0.2117x1 0.4983x2 0.1297x3 0.2583x4
Una predicción puntual de resistencia que resulta de una fuerza de 35 gm, potencia de 75 mW,
temperatura de 200° y tiempo de 20 ms es
ŷ 37.48 (0.2117)(35) (0.4983)(75) (0.1297)(200) (0.2583)(20)
38.41 gm
Ésta también es una estimación puntual del valor medio de resistencia para los valores especificados de fuerza, potencia, temperatura y tiempo.
■
ˆ 2 y R2
Al sustituir los valores de los predictores desde las observaciones sucesivas, en la ecuación para la regresión estimada, se tienen los valores pronosticados o ajustados ŷ1, ŷ2, .
. . , ŷn. Por ejemplo, como los valores de los cuatro predictores para la última observación
en el ejemplo 13.12 son 35, 75, 200 y 20, respectivamente, el correspondiente valor pronosticado es ŷ30 38.41. Los residuos son las diferencias y1 ŷ1, . . . , yn ŷn. El último residuo del ejemplo 13.12 es 40.3 38.41 1.89. Cuanto más cerca de 0 se encuentren
los residuos, mejor será el trabajo que haga la ecuación estimada para predecir los valores y
correspondientes a valores de los predictores de la muestra.
Por lo que se refiere a regresión lineal simple y regresión con polinomios, la estimación de 2 está basada en la suma de residuos al cuadrado:
SCE (yj ŷj)2 [yj (ˆ 0 ˆ 1x1j ˆ kxkj)]2
Una fórmula eficiente de cálculo para suma de los cuadrados del error (SCE) se emplea en
casi todos los paquetes computarizados de estadística. Como se han estimado k 1 parámetros (0, 1, . . . , k), se pierden k 1 grados de libertad, de modo que n (k 1)
grados de libertad están asociados con una SCE, y
ˆ 2 s 2
SCE
CME
n (k 1)
Con STC (yi y )2, la proporción de variación total explicada por el modelo de regresión múltiple es R2 1 SCE/STC, el coeficiente de determinación múltiple. Al igual
que en una regresión con polinomios, es frecuente que R2 sea ajustada para el número de parámetros del modelo por la fórmula
R2a [(n 1)R2 k]/[n (k 1)]
La raíz cuadrada positiva del coeficiente de determinación múltiple se denomina coeficiente de correlación múltiple R. Se puede demostrar que R es el coeficiente de correlación muestral r entre las yj observadas y las ŷj pronosticadas (es decir, usando xj ŷj en
la fórmula para r resulta r R).
Ejemplo 13.13
Unos investigadores llevaron a cabo un estudio para ver la forma en que diversas características del concreto se ven afectadas por x1 % de piedra caliza en polvo y x2 proporción
de agua y cemento; dicho estudio dio por resultado los datos que aparecen a continuación (“Durability of Concrete with Addition of Limestone Powder”, Magazine of Concrete
Research, 1996; 131-137).
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:34 AM
Page 535
13.4 Análisis de regresión múltiple
535
x1
x2
x1x2
Resist. a la compr. de 28 días (MPa)
Adsorción (%)
21
21
7
7
28
0
14
14
14
0.65
0.55
0.65
0.55
0.60
0.60
0.70
0.50
0.60
13.65
11.55
4.55
3.85
16.80
0.00
9.80
7.00
8.40
33.55
47.55
35.00
35.90
40.90
39.10
31.55
48.00
42.30
y 39.317, STC 278.52
8.42
6.26
6.74
6.59
7.28
6.90
10.80
5.63
7.43
y 7.339, STC 18.356
Considere primero la resistencia a la compresión como la variable dependiente y. El ajuste
del modelo de primer orden da por resultado
y 84.82 0.1643x1 79.67x2
SCE 72.25 (gl 6)
R 2 0.741
R2a 0.654
mientras que si se incluye un predictor de interacción dará
y 6.22 5.779x1 51.33x2 9.357x1x2
SCE 29.35 (gl 5)
R2 0.895
R2a 0.831
Con base en este último ajuste, una predicción para la resistencia a la compresión cuando el
porcentaje de piedra caliza es 14 y la proporción de agua y cemento 0.60 es
ŷ 6.22 5.779(14) 51.33(0.60) 9.357(8.4) 39.32
Un ajuste de toda la relación cuadrática da por resultado que prácticamente no hay cambio
en el valor de R2. No obstante, cuando la variable dependiente es la adsorción, se obtienen
los siguientes resultados: R2 0.747 cuando se usan sólo dos pronosticadoras, 0.802 cuando se agrega el predictor de interacción, y 0.889 cuando se usan los cinco predictores para toda la relación cuadrática.
■
En general, ˆ 1 se puede interpretar como una estimación del cambio promedio en y
asociado con un aumento de una unidad en xi mientras se mantengan fijos los valores de todos los otros predictores. A veces, sin embargo, es difícil y hasta imposible aumentar el valor de un predictor al tiempo que se mantienen fijos todos los otros. En situaciones como
éstas, hay una interpretación alternativa de los coeficientes de regresión estimados. En síntesis, supóngase que k 2, y se denota con ˆ 1 la estimación de 1 en la regresión de y en
los dos predictores x1 y x2. Entonces
1. Haga regresión de y contra sólo x2 (una regresión lineal simple) y denote por g1, g2, . . . ,
gn los residuos resultantes. Estos residuos representan variación en y después de eliminar
o ajustar los efectos de x2.
2. Haga regresión de x1 contra x2 (esto es, considere x1 como la variable independiente en
esta regresión lineal simple), y denote los residuos por f1, . . . , fn. Estos residuos representan variación en x1 después de eliminar o ajustar los efectos de x2.
Ahora considere trazar los residuos de la primera regresión contra los de la segunda; esto
es, dibuje los pares (f1, g1), . . . , (fn, gn). El resultado se denomina gráfica parcial de residuos o gráfica ajustada de residuos. Si ha de ajustarse una recta de regresión a los puntos de esta gráfica, la pendiente resulta ser exactamente ˆ 1 (además, los residuos de esta
www.FreeLibros.me
c13_p500-567.qxd
536
3/12/08
CAPÍTULO 13
4:34 AM
Page 536
Regresión múltiple y no lineal
recta son exactamente los residuos e1, . . . , en de la regresión múltiple de y en x1 y x2). Entonces, ˆ1 se puede interpretar como los cambios estimados en y asociados con un aumento
de una unidad en x1 después de eliminar o ajustar los efectos de cualesquier otros predictores del modelo. La misma interpretación se cumple para otros coeficientes estimados, cualquiera que sea el número de predictores del modelo (no hay algo especial acerca de k 2;
el argumento anterior sigue válido si se hace regresión de y contra todos los predictores que
no sean x1 en el paso 1 y se hace regresión de x1 contra los otros k 1 predictores del paso 2).
Como ejemplo, suponga que y es el precio de venta de un edificio de departamentos
y que los predictores son números de departamento, antigüedad, tamaño de lote, número de
espacios de estacionamiento y área total del edificio (pie2). Puede no ser razonable
aumentar el número de departamentos sin incrementar también el área total. No obstante, si
ˆ 5 16.00, entonces se puede decir que un aumento de $16 en el precio de venta está asociado con cada pie cuadrado extra de área total, después de ajustar los efectos de los otros
cuatro predictores.
Una prueba de utilidad de modelo
Con datos multivariados, no hay una representación preliminar análoga a una gráfica de puntos para indicar si un modelo particular de regresión múltiple se juzgará como útil. El valor de
R2 ciertamente comunica un mensaje preliminar, pero este valor es a veces engañoso porque
puede estar fuertemente inflado si se usa un número grande de predictores (k grande) con respecto al tamaño muestral n (esta es la razón fundamental que hay detrás de ajustar R2).
La prueba de la utilidad de un modelo en regresión lineal simple comprendió la hipótesis nula H0: 1 0, según la cual no hay relación útil entre y y el predictor individual x.
Aquí se considera la afirmación de que 1 0, 2 0, . . . , k 0, que dice que no hay
relación útil entre y y cualquiera de los k predictores. Si al menos una de estas no es 0,
el(los) predictor(es) correspondiente(s) es(son) útil(es). La prueba está basada en un estadístico que tiene una distribución F particular cuando H0 es verdadera.
Hipótesis nula:
H0: 1 2 k 0
Hipótesis alternativa: Ha: al menos una i 0
Valor estadístico de prueba*: f
(i 1, . . . , k)
R2/k
(1 R )/[n (k 1)]
(13.19)
2
SCR/k
SCE/[n (k 1)]
RMC
CME
donde SCR suma de cuadrados de regresión STC – SCE
Región de rechazo para una prueba de nivel :
f
F,k,n(k1)
Excepto para un múltiplo constante, el estadístico de prueba aquí es R2/(1 R2), que es la
razón entre una variación explicada y una no explicada. Si la proporción de variación explicada es alta con respecto a la no explicada, naturalmente se rechazaría H0 y se confirmaría la
utilidad del modelo. No obstante, si k es grande con respecto a n, el factor [(n (k 1)/k]
reducirá considerablemente a f.
Ejemplo 13.14
Volviendo a los datos de resistencia de pegamento al corte del ejemplo 13.12, se ajustó un
modelo con k 4 predictores, de manera que las hipótesis relevantes son
H0: 1 2 3 4 0
Ha: al menos una de estas cuatro no es 0
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:34 AM
Page 537
13.41 Análisis de regresión múltiple
537
La figura 13.15 muestra la generación impresa del paquete de estadística JMP. Los valores
de s (error de raíz cuadrática media), R2 y R2 ajustada ciertamente sugieren un modelo útil.
El valor de la razón F de utilidad del modelo es
f
0.713959/4
R2/k
15.60
0.286041/(30 5)
(1 R2)/[n (k 1)]
Este valor también aparece en la columna “F Ratio” de la tabla ANOVA de la figura 13.15.
El máximo valor crítico F para grado de libertad de numerador 4 y denominador 25 en la
tabla A.9 del apéndice es 6.49, que captura un área de cola superior de 0.001. De aquí el
valor P 0.001. La tabla ANOVA de la salida impresa del JMP muestra que el valor
P 0.0001. Este es un resultado muy significativo. La hipótesis nula debería ser rechazada a cualquier nivel razonable de significación. La conclusión es que hay una relación lineal
útil entre y y al menos uno de los cuatro predictores del modelo. Esto no significa que los
cuatro predictores sean útiles; un poco más adelante se tratará más de esto.
Figura 13.15
Salida de regresión múltiple del JMP para los datos del ejemplo 13.14.
■
Inferencias en regresión múltiple
Antes de construir hipótesis y los IC y hacer predicciones, uno debería primeramente examinar gráficas de diagnóstico para ver si el modelo necesita modificación o si hay valores
aislados en los datos. Las gráficas recomendadas son residuos (estandarizados) en función
de cada variable independiente, residuos en función de ŷ, ŷ en función de y, y una gráfica de
www.FreeLibros.me
c13_p500-567.qxd
538
3/12/08
CAPÍTULO 13
4:34 AM
Page 538
Regresión múltiple y no lineal
probabilidad normal de los residuos estandarizados. Los problemas potenciales están sugeridos por los mismos patrones estudiados en la sección 13.1. De particular importancia es la
identificación de observaciones que tengan una gran influencia en el ajuste. En la sección
siguiente, se describen varias herramientas de diagnóstico apropiadas para este trabajo.
Debido a que cada ˆ i es una función lineal de las yi, la desviación estándar de cada ˆ i
es el producto de y una función de las xij, de modo que se obtiene una estimación sˆ al
sustituir s con . La función de las xij es bastante complicada, pero todos los paquetes computarizados estándar de regresión calculan y muestran las sˆ . Las inferencias respecto a una
sola i están basadas en la variable estandarizada
i
i
T
ˆ i i
Sˆ
i
que tiene una distribución t con n (k 1) grados de libertad.
La estimación puntual de Yx*, . . . , x*, el valor esperado de Y cuando x1 x*1, . . . , xk
x*k , es ˆ Yx*, . . . , x* ˆ 0 ˆ 1x*1 ˆ k x*k . La desviación estándar estimada del estimador correspondiente es de nuevo una expresión complicada que comprende la muestra de las
xij. No obstante, los mejores paquetes de estadística computarizados la calcularán cuando se
les indique. Las inferencias alrededor de Yx*, . . . , x* están basadas en estandarizar su estimador para obtener una variable t que tenga n (k 1) grados de libertad.
1
k
k
1
1
k
1. Un intervalo de confianza 100(1 )% para i, el coeficiente de xi en la función
de regresión, es
ˆ i ! t/2,n(k1) sˆ
i
2. Una prueba para H0: i i0 utiliza el valor estadístico t de t (ˆi i0)/sˆ basado en n (k 1) grados de libertad. La prueba es de cola superior, cola inferior,
o de dos colas, según si Ha contiene la desigualdad , o .
i
3. Un intervalo de confianza 100(1 )% para Yx*, . . .,x* es
1
k
ˆ Yx*, . . .,x* ! t/2,n(k1) {desviación estándar estimada de
ˆ Yx*, . . .,x*}
1
k
1
k
ŷ ! t/2,n(k1) sŶ
donde Ŷ es el estadístico ˆ 0 ˆ 1x*1 ˆ k x*k y ŷ es el valor calculado de Ŷ.
4. Un intervalo de confianza 100(1 )% para un valor futuro de y es
ˆ Yx*, . . .,x* ! t/2,n(k1) {s2 (desviación estándar estimada de
ˆ Yx*, . . .,x*)2}1/2
1
k
1
k
ŷ ! t/2,n(k1) s2
sŶ2
Los intervalos simultáneos, para los que la confianza simultánea o nivel de predicción es controlado, se pueden obtener al aplicar la técnica de Bonferroni.
Ejemplo 13.15
La adsorción de suelo y sedimento, la magnitud a la que se recolectan productos químicos
en forma condensada en la superficie, es una importante característica que influye sobre la
efectividad de plaguicidas y diversos productos químicos agrícolas. El artículo “Adsorption
of Phosphate, Arsenate, Methanearsonate, and Cacodylate by Lake and Stream Sediments:
Comparisons with Soils” (J. of Environ. Qual., 1984: 499-504) da la información siguiente
(tabla 13.5) en y índice de adsorción de fosfato, x1 cantidad de hierro extraíble y x2
cantidad de aluminio extraíble.
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:34 AM
Page 539
13.4 Análisis de regresión múltiple
539
Tabla 13.5 Datos para el ejemplo 13.15
Observación
1
2
3
4
5
6
7
8
9
10
11
12
13
x1
Hierro
extraíble
x2
Aluminio
extraíble
y
Índice de
adsorción
61
175
111
124
130
173
169
169
160
244
257
333
199
13
21
24
23
64
38
33
61
39
71
112
88
54
4
18
14
18
26
26
21
30
28
36
65
62
40
El artículo propuso el modelo
Y 0 1x1 2x2
Un análisis de computadora dio la información siguiente:
Parámetro i
0
1
2
R2 0.948
Estimación ˆ i
DE sˆ estimada
i
7.351
0.11273
0.34900
R2 ajustada 0.938
3.485
0.02969
0.07131
s 4.379
ˆ Y160,39 ŷ 7.351 (0.11273)(160) (0.34900)(39) 24.30
DE estimada de ˆ Y160,39 sŶ 1.30
Un intervalo de confianza de 99% para 1, el cambio en adsorción esperada asociado con
un aumento de una unidad en hierro extraíble mientras el aluminio extraíble se mantiene fijo,
requiere t0.005,13(21) t0.005,10 3.169. El intervalo de confianza es
0.11273 ! (3.169)(0.02969) 0.11273 ! 0.09409 (0.019, 0.207)
De modo semejante, un intervalo de 99% para 2 es
0.34900 ! (3.169)(0.07131) 0.34900 ! 0.22598 (0.123, 0.575)
La técnica de Bonferroni implica que el nivel de confianza simultáneo para ambos intervalos es al menos de 98%.
Un intervalo de confianza de 95% para Y160,39, la adsorción esperada cuando el hierro extraíble 160 y el aluminio extraíble 39, es
24.30 ! (2.228)(1.30) 24.30 ! 2.90 (21.40, 27.20)
Un intervalo de predicción de 95% para un valor futuro de adsorción a observar cuando
x1 160 y x2 39 es
24.30 ! (2.228){(4.379)2 (1.30)2}1/2 24.30 ! 10.18 (14.12, 34.48)
■
Es frecuente que la hipótesis de interés tenga la forma H0: i 0 para una i particular. Por ejemplo, después de ajustar el modelo de cuatro pronosticadoras del ejemplo 13.12,
www.FreeLibros.me
c13_p500-567.qxd
540
3/12/08
CAPÍTULO 13
4:34 AM
Page 540
Regresión múltiple y no lineal
el investigador podría desear probar H0: 4 0. Según H0, mientras los predictores x1, x2 y
x3 continúen en el modelo, x4 no contiene información útil acerca de y. El valor del estadístico de prueba es la razón t ˆi/sˆ . Numerosos paquetes computarizados de estadística presentan la razón t y el correspondiente valor P para cada uno de los predictores incluidos en
el modelo. Por ejemplo, la figura 13.15 muestra que mientras la potencia, temperatura y
tiempo se retengan en el modelo, el predictor x1 fuerza se puede eliminar.
i
Una prueba F para un grupo de predictores La prueba de utilidad F del modelo era
apropiada para probar si hay información útil acerca de la variable dependiente en cualquiera de los k predictores (es decir, si 1 k 0). En muchas situaciones, uno
construye primero un modelo que contenga k predictores y luego desea saber si cualquiera de los predictores de un subconjunto particular da información útil acerca de Y. Por
ejemplo, un modelo a usar para predecir calificaciones de examen de estudiantes podría incluir un grupo de variables secundarias, como son ingreso familiar y niveles de educación,
y también algunas variables escolares características como el tamaño del grupo y gasto por
alumno. Una hipótesis interesante es que los predictores escolares característicos pueden
omitirse del modelo.
Los predictores se marcan como x1, x2, . . . , xl, xl1, . . . , xk, de modo que sea la última k l que se están considerando omitir del modelo. Entonces se desea probar
H0: l1 l2 k 0
(de modo que el modelo “reducido” Y 0 1x1 lxl es correcto)
contra
Ha: al menos una entre l1, . . . , k no es 0
(de modo que en el modelo “completo” Y 0 1x1 kxk , al
menos uno de los últimos k l predictores proporciona información útil)
La prueba se realiza al ajustar tanto el modelo completo como el reducido. Debido a que el
modelo completo contiene no sólo los predictores del modelo reducido sino también algunos predictores adicionales, debe ajustar los datos al menos tan bien como el modelo reducido. Esto es, si se hace que SCEk sea la suma de residuos al cuadrado para el modelo
completo y SCEl sea la suma correspondiente para el modelo reducido, entonces SCEk
SCEl.* Intuitivamente, si SCEk es mucho mayor que SCEl, el modelo completo da un ajuste mucho mejor que el modelo reducido; el estadístico de prueba apropiado debe depender
entonces de la reducción SCEl SCEk en variación inexplicada. El procedimiento formal es
SCEk variación inexplicada para el modelo completo
SCEl variación inexplicada para el modelo reducido
Valor de estadístico de prueba: f
Región de rechazo:
f
(SCEl SCEk)/(k l)
SCEk /[n (k 1)]
(13.20)
F,kl,n(k1)
* En general, las estimaciones ˆ 0, ˆ 1, . . . , ˆ l serán diferentes para los modelos completo y reducido, de modo que,
también en general, deben ejecutarse dos regresiones múltiples diferentes para obtener SCEl y SCEk. No obstante, si las variables aparecen en el orden sugerido, casi todos los paquetes de software dan una tabla ANOVA de
“sumas secuenciales de cuadrados”, para el modelo completo, que se pueden usar para evitar ajustar el modelo
reducido.
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:34 AM
Page 541
13.4 Análisis de regresión múltiple
Ejemplo 13.16
541
La información de la tabla 13.6 se tomó del artículo “Applying Stepwise Multiple Regression Analysis to the Reaction of Formaldehyde with Cotton Cellulose” (Textile Research J.,
1984: 157-165). La variable dependiente y es una capacidad durable de planchado, una medida cuantitativa de resistencia a las arrugas. Las cuatro variables independientes empleadas
en el proceso de construcción del modelo son x1 concentración de HCHO (formaldehído), x2 razón de catalizador, x3 temperatura de curado y x4 tiempo de curado.
Tabla 13.6 Datos para el ejemplo 13.16
Observación
x1
x2
x3
x4
y
Observación
x1
x2
x3
x4
y
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
8
2
7
10
7
7
7
5
4
5
8
2
4
6
10
4
4
4
7
4
7
13
4
7
1
10
4
10
7
13
100
180
180
120
180
180
140
160
140
100
140
100
180
120
180
1
7
1
5
5
1
1
7
3
7
3
3
3
7
3
1.4
2.2
4.6
4.9
4.6
4.7
4.6
4.5
4.8
1.4
4.7
1.6
4.5
4.7
4.8
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
4
4
10
5
8
10
2
6
7
5
8
4
6
4
7
10
13
10
4
13
1
13
13
1
13
1
1
1
1
10
160
100
120
100
140
180
140
180
120
140
160
180
160
100
100
5
7
7
1
1
1
1
7
7
1
7
7
1
1
7
4.6
4.3
4.9
1.7
4.6
2.6
3.1
4.7
2.5
4.5
2.1
1.8
1.5
1.3
4.6
Considere el modelo completo formado por k 14 predictores: x1, x2, x3, x4, x5 x21,
. . . , x8 x24, x9 x1x2, . . . , x14 x3 x4 (todos los predictores de primero y
segundo órdenes). ¿Se justifica la inclusión de predictores de segundo orden? Esto es, ¿debe usarse el modelo reducido formado sólo por los predictores x1, x2, x3 y x4 (l 4)? A continuación se presenta la salida que resulta de ajustar los dos modelos:
Parámetro
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
R2
SCE
Estimación para
modelo reducido
0.9122
0.16073
0.21978
0.011226
0.10197
—
—
—
—
—
—
—
—
—
—
0.692
17.4951
Estimación para
modelo completo
8.807
0.1768
0.7580
0.10400
0.5052
0.04393
0.035887
0.00003271
0.01646
0.00588
0.002702
0.01178
0.0006547
0.00242
0.002526
0.921
4.4782
www.FreeLibros.me
c13_p500-567.qxd
542
3/12/08
CAPÍTULO 13
4:34 AM
Page 542
Regresión múltiple y no lineal
Las hipótesis a probar son
H0: 5 6 14 0
en función de
Ha: al menos una entre 5, . . . , 14 no es 0
Con k 14 y l 4, el valor crítico de F para una prueba 0.01 es F0.01,10,15 3.80. El
valor del estadístico de prueba es
f
1.3017
(17.4951 4.4782)/10
4.36
0.2985
4.4782/15
Como 4.36 3.80, H0 es rechazada. La conclusión es que el modelo apropiado debe incluir
al menos uno de los predictores de segundo orden.
■
Evaluación de la adecuación del modelo
Los residuos estandarizados en regresión múltiple resultan de dividir cada uno de los residuos entre su desviación estándar estimada; la fórmula para estas desviaciones estándar es
considerablemente más complicada que en el caso de regresión lineal simple. Se recomienda una gráfica de probabilidad normal de los residuos estandarizados como base para validar la suposición de normalidad. Las gráficas de residuos estandarizados en función
de cada predictor y en función de ŷ no deberían mostrar un patrón discernible. Las gráficas de residuos ajustadas también pueden ser útiles en este trabajo. El libro de Neter y otros
es una referencia sumamente útil.
Ejemplo 13.17
La figura 13.16 muestra una gráfica de probabilidad normal de los residuos estandarizados
para los datos de adsorción y el modelo ajustado dado en el ejemplo 13.15. La rectitud de
la gráfica arroja poca duda sobre la suposición de que la desviación aleatoria está normalmente distribuida.
Residuo estandarizado
1.5
0.5
–0.5
–1.5
–2.5
Percentil z
–2
–1
0
1
2
Figura 13.16 Una gráfica de probabilidad normal de los residuos estandarizados para los datos
y modelo del ejemplo 13.15.
La figura 13.17 muestra las otras gráficas sugeridas para los datos de adsorción. Dado
que hay sólo 13 observaciones en el conjunto de datos, no hay mucha evidencia de un patrón en ninguna de las tres primeras gráficas que no sea la irregularidad. El punto situado en
la parte inferior de cada una de estas tres gráficas corresponde a la observación con el residuo grande. Un poco más adelante se dirá más acerca de estas observaciones. Por ahora, no
hay razón obligatoria para tomar una acción correctiva.
www.FreeLibros.me
c13_p500-567.qxd
3/12/08
4:34 AM
Page 543
13.4 Análisis de regresión múltiple
Residuo estandarizado
Residuo estandarizado
1.5
1.5
0.5
0.5
–0.5
–0.5
–1.5
–1.5
–2.5
Hierro
50
150
250
–2.5
350
Aluminio
0
50
a)
100
b)
y pronosticada
Residuo estandarizado
1.5
60
50
40
0.5
–0.5
30
20
10
–1.5
–2.5
543
y pronosticada
0
10
20
30
40
50
60
c)
0
Adsorción
0
10 20 30 40 50 60 70
d)
Figura 13.17 Gráficas de diagnóstico para los datos de adsorción: a) residuos estandarizados en función
de x1; b) residuos estandarizados en función de x2; c) residuos estandarizados en función de ŷ; d) ŷ en función de y.
■
EJERCICIOS
Sección 13.4 (36-54)
36. La salud cardiorrespiratoria es ampliamente reconocida como un componente importante del bienestar físico general.
La medición directa de la inhalación máxima de oxígeno
(VO2 máx) es la mejor medida individual de esta salud, pero la medición directa es lenta y costosa. Por tanto, es deseable tener una ecuación de predicción para el VO2 máx en
términos de cantidades que se puedan obtener con facilidad.
Considere las variables
y VO2 máx (l/min)
x1 peso (kg)
x2 edad (años)
x3 tiempo necesario para caminar 1 milla (min)
x4 ritmo cardiaco el final de la caminata (pulsaciones/min)
He aquí un posible modelo, para estudiantes de sexo masculino, consistente con la información dada en el artículo
“Validation of the Rockport Fitness Walking Test in College Males and Females” (Research Quarterly for Exercise
and Sport, 1994: 152-158):
Y 5.0 0.01x1 0.05x2 0.13x3 0.01x4
0.4
a. Interprete 1 y 3.
b. ¿Cuál es el valor esperado de VO2 máx cuando el peso
es de 76 kg, 20 años de edad, el tiempo de caminata es
de 12 minutos y el ritmo cardiaco es de 140 p/min?
c. ¿Cuál es la probabilidad de que VO2 máx sea entre 1.00
y 2.60 para una sola observación hecha cuando los valores de los predictores son como se expresa en el inciso b)?
37. Una compañía de transporte por carretera consideró un modelo de regresión múltiple, para relacionar la variable dependiente y tiempo total de viaje diario para uno de sus
conductores (horas), con los predictores x1 distancia recorrida (millas) y x2 número de entregas hechas. Supóngase que la ecuación del modelo es
Y 0.800 0.060x1 0.900x2
a. ¿Cuál es el valor medio de tiempo de viaje cuando la distancia recorrida es de 50 millas y se hacen tres entregas?
b. ¿Cómo se interpretaría 1 0.060, el coeficiente del
predictor x1? ¿Cuál es la interpretación de 2
0.900?
c. Si 0.5 horas, ¿cuál es la probabilidad de que el tiempo de viaje sea a lo sumo de 6 horas cuando se hacen tres
entregas y la distancia recorrida sea de 50 millas?
www.FreeLibros.me
c13_p500-567.qxd
544
3/12/08
CAPÍTULO 13
4:34 AM
Page 544
Regresión múltiple y no lineal
38. Sea y duración de un cojinete, x1 viscosidad de aceite,
y x2 carga. Supóngase que el modelo de regresión múltiple que relaciona duración con viscosidad y carga es
Y 125.0 7.75x1 0.0950x2 0.0090x1x2
a. ¿Cuál es el valor medio de la duración cuando la viscosidad es 40 y la carga es 1100?
b. Cuando la viscosidad es de 30, ¿cuál es el cambio en la duración media asociado con un aumento de uno en carga?
Cuando la viscosidad es de 40, ¿cuál es el cambio en la duración media asociado con un incremento de uno en carga?
39. Sea y ventas de un restaurante de comida rápida (miles
de dólares), x1 número de restaurantes competidores a
una milla a la redonda, x2 población dentro de una milla
de radio (miles de personas) y x3 es una variable indicadora
igual a uno si el restaurante tiene una ventanilla para automovilistas y 0 si no la tiene. Suponga que el modelo de regresión verdadero es
Y 10.00 1.2x1 6.8x2 15.3x3
a. ¿Cuál es el valor medio de ventas cuando el número de
restaurantes competidores es dos, hay 8000 habitantes
en un radio de una milla, y el restaurante tiene una ventanilla para automovilistas?
b. ¿Cuál es el valor medio de ventas de un restaurante sin
ventanilla para automovilistas, que tiene tres restaurantes
competidores y 5000 habitantes en un radio de una milla?
c. Interprete 3.
40. El artículo “Readability of Liquid Crystal Displays: A Response Surface” (Human Factors, 1983: 185-190) utilizó un
modelo de regresión múltiple con cuatro variables independientes para estudiar la precisión en nitidez de pantallas de
cristal líquido. Las variables fueron
y porcentaje de error de cuatro dígitos para sujetos que
ven una pantalla de cristal líquido
x1 nivel de luz de fondo (de 0 a 122 cd/m2)
x2 cuerda subtendida de carácter (de 0.025° a 1.34°)
x3 ángulo de visión (de 0° a 60°)
x4 nivel de luz ambiental (de 20 a 1500 lux)
El ajuste del modelo a los datos fue Y 0 1x1
2x2 3 x3 4 x4 . Los coeficientes estimados resultantes fueron ˆ 0 1.52, ˆ 1 0.02, ˆ 2 1.40, ˆ 3 0.02
y ˆ 4 0.0006.
a. Calcule una estimación de porcentaje de error esperado
cuando x1 10, x2 0.5, x3 50 y x4 100.
b. Estime el porcentaje de error medio asociado con un nivel
de luz de fondo de 20, cuerda subtendida de carácter de
0.5, ángulo de visión de 10 y nivel de luz ambiental de 30.
c. ¿Cuál es el cambio esperado y estimado en error porcentual, cuando el nivel de luz ambiental se aumenta en una
unidad mientras que todas las otras variables se mantienen
fijas en los valores dados en el inciso a)? Conteste para un
aumento de 100 unidades en nivel de luz ambiental.
d. Explique por qué las respuestas del inciso c) no dependen de los valores fijos de x1, x2 y x3. ¿Bajo qué condiciones habría tal dependencia?
e. El modelo estimado se basó en n 30 observaciones,
con STC 39.2 y SCE 20.0. Calcule e interprete el
coeficiente de determinación múltiple, y luego realice la
prueba de utilidad del modelo usando 0.05.
41. La capacidad de ecologistas para identificar regiones de máxima riqueza de especies podría tener un impacto en la preservación de la diversidad genética, que es una meta importante
de la Estrategia Mundial de Conservación. El artículo “Prediction of Rarities from Habitat Variables: Coastal Plain
Plants on Nova Scotian Lakeshores” (Ecology, 1992: 18521859) utilizó una muestra de n 37 lagos para obtener la
ecuación estimada de regresión
y 3.89 0.033x1 0.024x2 0.023x3
0.0080x4 0.13x5 0.72x6
donde y riqueza de especies, x1 área de cuenca de captación de aguas, x2 anchura de la orilla, x3 drenaje deficiente (%), x4 color del agua (total de unidades de
color), x5 arena (%) y x6 alcalinidad. El coeficiente
de determinación múltiple se informó como R2 0.83.
Realice una prueba de utilidad de modelo.
42. Una investigación de un proceso de fundición a presión produjo los datos siguientes sobre x1 temperatura de horno,
x2 tiempo de cierre de matriz y y diferencia en temperatura en la superficie de la matriz (”A Multiple-Objective
Decision-Making Approach for Assessing Simultaneous
Improvement in Die Life and Casting Quality in a Die Casting Process”, Quality Engineering, 1994: 371-383).
x1
x2
y
x1
x2
y
|
|
|
|
|
|
1250
1300
1350
1250
1300
6
7
6
7
6
80
95
101
85
92
1250
1300
1350
1350
8
8
7
8
87
96
106
108
A continuación aparece la