TABLA A.2 Distribución normal acumulativa (continuación)
0
z
z
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.0
0.1
0.2
0.3
0.4
.5000
.5398
.5793
.6179
.6554
.5040
.5438
.5832
.6217
.6591
.5080
.5478
.5871
.6255
.6628
.5120
.5517
.5910
.6293
.6664
.5160
.5557
.5948
.6331
.6700
.5199
.5596
.5987
.6368
.6736
.5239
.5636
.6026
.6406
.6772
.5279
.5675
.6064
.6443
.6808
.5319
.5714
.6103
.6480
.6844
.5359
.5753
.6141
.6517
.6879
0.5
0.6
0.7
0.8
0.9
.6915
.7257
.7580
.7881
.8159
.6950
.7291
.7611
.7910
.8186
.6985
.7324
.7642
.7939
.8212
.7019
.7357
.7673
.7967
.8238
.7054
.7389
.7704
.7995
.8264
.7088
.7422
.7734
.8023
.8289
.7123
.7454
.7764
.8051
.8315
.7157
.7486
.7794
.8078
.8340
.7190
.7517
.7823
.8106
.8365
.7224
.7549
.7852
.8133
.8389
1.0
1.1
1.2
1.3
1.4
.8413
.8643
.8849
.9032
.9192
.8438
.8665
.8869
.9049
.9207
.8461
.8686
.8888
.9066
.9222
.8485
.8708
.8907
.9082
.9236
.8508
.8729
.8925
.9099
.9251
.8531
.8749
.8944
.9115
.9265
.8554
.8770
.8962
.9131
.9279
.8577
.8790
.8980
.9147
.9292
.8599
.8810
.8997
.9162
.9306
.8621
.8830
.9015
.9177
.9319
1.5
1.6
1.7
1.8
1.9
.9332
.9452
.9554
.9641
.9713
.9345
.9463
.9564
.9649
.9719
.9357
.9474
.9573
.9656
.9726
.9370
.9484
.9582
.9664
.9732
.9382
.9495
.9591
.9671
.9738
.9394
.9505
.9599
.9678
.9744
.9406
.9515
.9608
.9686
.9750
.9418
.9525
.9616
.9693
.9756
.9429
.9535
.9625
.9699
.9761
.9441
.9545
.9633
.9706
.9767
2.0
2.1
2.2
2.3
2.4
.9772
.9821
.9861
.9893
.9918
.9778
.9826
.9864
.9896
.9920
.9783
.9830
.9868
.9898
.9922
.9788
.9834
.9871
.9901
.9925
.9793
.9838
.9875
.9904
.9927
.9798
.9842
.9878
.9906
.9929
.9803
.9846
.9881
.9909
.9931
.9808
.9850
.9884
.9911
.9932
.9812
.9854
.9887
.9913
.9934
.9817
.9857
.9890
.9916
.9936
2.5
2.6
2.7
2.8
2.9
.9938
.9953
.9965
.9974
.9981
.9940
.9955
.9966
.9975
.9982
.9941
.9956
.9967
.9976
.9982
.9943
.9957
.9968
.9977
.9983
.9945
.9959
.9969
.9977
.9984
.9946
.9960
.9970
.9978
.9984
.9948
.9961
.9971
.9979
.9985
.9949
.9962
.9972
.9979
.9985
.9951
.9963
.9973
.9980
.9986
.9952
.9964
.9974
.9981
.9986
3.0
3.1
3.2
3.3
3.4
.9987
.9990
.9993
.9995
.9997
.9987
.9991
.9993
.9995
.9997
.9987
.9991
.9994
.9995
.9997
.9988
.9991
.9994
.9996
.9997
.9988
.9992
.9994
.9996
.9997
.9989
.9992
.9994
.9996
.9997
.9989
.9992
.9994
.9996
.9997
.9989
.9992
.9995
.9996
.9997
.9990
.9993
.9995
.9996
.9997
.9990
.9993
.9995
.9997
.9998
3.5
3.6
.9998
.9998
.9998
.9998
.9998
.9999
.9998
.9999
.9998
.9999
.9998
.9999
.9998
.9999
.9998
.9999
.9998
.9999
.9998
.9999
Estadística
para
ingenieros
Estadística
para
ingenieros
William Navidi
Colorado School of Mines
Traducción
Ana Elizabeth García Hernández
Profesora de Estadística
Universidad Iberoamericana, Ciudad de México
Revisión técnica
Nicolás Gómez Castillo
Profesor de Matemáticas Aplicadas
(Probabilidad y Estadística, Series de tiempo)
Universidad Iberoamericana, Ciudad de México
MÉXICO • BOGOTÁ • BUENOS AIRES • CARACAS • GUATEMALA • LISBOA
MADRID • NUEVA YORK • SAN JUAN • SANTIAGO
AUCKLAND • LONDRES • MILÁN • MONTREAL • NUEVA DELHI
SAN FRANCISCO • SINGAPUR • SAN LOUIS • SIDNEY • TORONTO
Director Higher Education: Miguel Ángel Toledo Castellanos
Director editorial: Ricardo A. del Bosque Alayón
Editor sponsor: Pablo Eduardo Roig Vázquez
Editora de desarrollo: Paula Montaño González
Supervisor de producción: Zeferino García García
ESTADÍSTICA PARA INGENIEROS
Prohibida la reproducción total o parcial de esta obra,
por cualquier medio, sin la autorización escrita del editor.
DERECHOS RESERVADOS © 2006 respecto a la primera edición en español por
McGRAW-HILL/INTERAMERICANA EDITORES, S.A. DE C.V.
A subsidiary of The McGraw-Hill Companies, Inc.
Prolongación Paseo de la Reforma 1015, Torre A
Piso 17, Colonia Desarrollo Santa Fe,
Delegación Álvaro Obregón
C. P. 01376, México, D. F.
Miembro de la Cámara Nacional de la Industria Editorial Mexicana, Reg. Núm. 736
ISBN 970-10-5629-9
Traducido de la primera edición de: STATISTICS FOR ENGINEERS AND SCIENTISTS
Copyright © 2006 by The McGraw-Hill Companies, Inc. All rights reserved.
ISBN 0-07-255160-7
1234567890
09875432106
Impreso en México
Printed in Mexico
Para Catherine, Sarah y Thomas
ACERCA DEL AUTOR
William Navidi es profesor de Matemáticas y Ciencias de la Computación en la Escuela de
Minas de Colorado. Obtuvo la licenciatura en Matemáticas por el New College, la maestría
en Matemáticas por la Universidad Estatal de Michigan y el doctorado en Estadística por la
Universidad de California, en Berkeley. El profesor Navidi ha escrito más de 50 artículos de
investigación, tanto en teoría estadística como en una vasta gama de aplicaciones, entre éstas
se incluyen Redes Computacionales, Epidemiología, Biología Molecular, Ingeniería Química
y Geofísica.
viii
CONTENIDO BREVE
Prefacio xv
Reconocimientos a revisores y colaboradores
Características clave xxiii
1
Muestreo y estadística descriptiva
2
Probabilidad
3
Propagación de errores
4
Distribuciones comúnmente usadas
5
Intervalos de confianza
6
Pruebas de hipótesis
7
Correlación y regresión lineal simple
8
Regresión múltiple
9
Experimentos factoriales
1
50
157
Apéndice A: Tablas
192
300
368
475
556
623
10 Control estadístico de calidad
723
763
Apéndice B: Derivadas parciales
Apéndice C: Bibliografía
787
789
Respuestas a los ejercicios impares
Índice
xix
792
859
ix
CONTENIDO
Prefacio xv
Reconocimientos a revisores
y colaboradores xix
Características clave xxiii
Capítulo 1
Muestreo y estadística descriptiva
1.1
1.2
1.3
3.4
1
Introducción 1
Muestreo 3
Resumen estadístico 13
Resúmenes gráficos 25
Capítulo 2
Probabilidad 50
Introducción 50
2.1 Ideas básicas 50
2.2 Métodos de conteo (opcional) 62
2.3 Probabilidad condicional
e independencia 69
2.4 Variables aleatorias 88
2.5 Funciones lineales de variables
aleatorias 111
2.6 Variables aleatorias con distribución
conjunta (opcional) 120
Capítulo 3
Propagación de errores 157
Introducción 157
3.1 Error de medición 157
3.2 Combinaciones lineales
de las mediciones 163
3.3 Incertidumbres para funciones
de una medición 173
Incertidumbres para funciones
de varias mediciones 179
Capítulo 4
Distribuciones comúnmente usadas 192
Introducción 192
4.1 Distribución de Bernoulli 192
La distribución binomial 195
La distribución de Poisson 206
Algunas otras distribuciones
discretas 220
4.5 Distribución normal 231
4.6 Distribución lognormal 244
4.7 La distribución exponencial 250
4.8 Las distribuciones gamma
y de Weibull 259
4.9 Gráficas de probabilidad 265
4.10 El teorema del límite central 270
4.11 Simulación 281
4.2
4.3
4.4
Capítulo 5
Intervalos de confianza 300
Introducción 300
5.1 Intervalos de confianza para la
media poblacional con muestras
grandes 301
5.2 Intervalos de confianza para
proporciones 315
5.3 Intervalos de confianza para la
media poblacional con muestras
pequeñas 321
5.4 Intervalos de confianza para la
diferencia entre dos medias 331
xi
xii
5.5
5.6
5.7
5.8
Contenido
Intervalos de confianza para la
diferencia entre dos proporciones
Intervalos de confianza para la
diferencia entre dos medias
con pequeñas muestras 339
Intervalos de confianza con datos
apareados 346
Uso de simulación para construir
intervalos de confianza 351
Capítulo 6
Pruebas de hipótesis 368
Introducción 368
6.1 Pruebas de hipótesis para la
media poblacional con muestras
grandes 368
6.2 Concluir a partir de las pruebas
de hipótesis 377
6.3 Pruebas de hipótesis para la
proporción poblacional 385
6.4 Pruebas de hipótesis para la
media poblacional con muestras
pequeñas 390
6.5 Pruebas de hipótesis para la
diferencia entre dos medias
con muestras grandes 395
6.6 Pruebas de hipótesis para
la diferencia entre dos
proporciones 401
6.7 Pruebas de hipótesis para la
diferencia entre dos medias
con muestras pequeñas 407
6.8 Pruebas de hipótesis con datos
apareados 415
6.9 Pruebas de hipótesis con
distribuciones libres 420
6.10 La prueba Ji cuadrada 429
6.11 La prueba F para la igualdad
de varianzas 439
6.12 Prueba de nivel fijo 443
335
6.13 Potencia 449
6.14 Pruebas múltiples 458
6.15 Uso de la simulación para realizar
pruebas de hipótesis 462
Capítulo 7
Correlación y regresión lineal simple 475
Introducción 475
7.1 Correlación 475
7.2 La recta de mínimos cuadrados 492
7.3 Incertidumbres en los coeficientes
de mínimos cuadrados 508
7.4 Comprobación de supuestos y
transformación de datos 527
Capítulo 8
Regresión múltiple 556
Introducción 556
8.1 El modelo de regresión múltiple
8.2 Confusión y colinealidad 574
8.3 Selección de modelos 583
556
Capítulo 9
Experimentos factoriales 623
Introducción 623
9.1 Experimentos de un solo factor 623
9.2 Comparaciones apareadas en los
experimentos de un solo factor 646
9.3 Experimentos de dos factores 659
9.4 Diseños de bloque completamente
aleatorios 683
9.5 Experimentos factoriales 2p 693
Capítulo 10
Control estadístico de calidad
Introducción 723
10.1 Ideas básicas 723
723
Contenido
10.2
10.3
10.4
10.5
Diagramas de control para variables 726
Diagramas de control para atributos 746
El diagrama CUSUM 751
Capacidad del proceso 755
Apéndice A: Tablas
763
Apéndice B: Derivadas parciales
Apéndice C: Bibliografía 789
Respuestas a los ejercicios impares
Índice 859
787
792
xiii
PREFACIO
MOTIVACIÓN
La idea de realizar este libro surgió de pláticas entre los profesores de estadística e ingeniería
de la Escuela de Minas de Colorado respecto de nuestro curso de “Introducción a la estadística para ingenieros”. Nuestros profesores de ingeniería pensaban que los estudiantes necesitaban cubrir ampliamente el tema de propagación del error, así como un mayor énfasis en las
habilidades en el ajuste de modelos. Los profesores de estadística creían que los estudiantes
necesitaban estar más conscientes de algunos puntos importantes en la práctica de la estadística, como la comprobación de los supuestos del modelo y del uso de la simulación.
Mi punto de vista es que un libro introductorio a la estadística para ingenieros y científicos debe ofrecer todos estos temas con cierta profundidad. Además, debe ser lo suficientemente flexible para permitir diferentes elecciones del material que debe cubrirse, ya que hay
muchas formas para diseñar un curso exitoso de introducción a la estadística. Finalmente, éste debe proporcionar ejemplos que presenten ideas importantes en contextos reales. De acuerdo con lo anterior, el libro tiene las siguientes características:
•
El libro es flexible en su presentación de probabilidad, ello permite a los profesores elegir la profundidad y extensión de la cobertura de este tema.
•
El libro contiene muchos ejemplos en contexto real y con conjuntos de datos actuales; lo
anterior motiva a los estudiantes y muestra la interrelación entre la industria y la investigación científica.
•
El libro contiene muchos ejemplos con resultados obtenidos mediante computadora y
ejercicios adecuados para resolverse con algún software estadístico.
•
El libro proporciona una extensa cobertura de la propagación del error.
•
El libro presenta una espléndida introducción a los métodos de simulación y a la estimación bootstrap, incluyendo aplicaciones para comprobar supuestos de normalidad, cálculo de probabilidades, estimación del sesgo, cálculo de intervalos de confianza y pruebas
de hipótesis.
•
El libro proporciona una mayor cobertura en los procedimientos de diagnóstico del modelo lineal que la que se encuentra en la mayoría de los textos introductorios. Ésta incluye material acerca del diagnóstico de la gráfica de los residuales, transformación de
variables y principios de selección de variables en los modelos multivariados.
•
El libro cubre los temas introductorios usuales, tales como estadística descriptiva, probabilidad, intervalos de confianza, pruebas de hipótesis, regresión lineal, experimentos factoriales y control estadístico de calidad.
NIVEL MATEMÁTICO
La mayor parte del libro será matemáticamente accesible a todas las personas que hayan estudiado un semestre de cálculo. Las excepciones son la propagación multivariada del error, que
xv
xvi
Prefacio
requiere derivadas parciales y las distribuciones de probabilidad conjunta, que requieren de integración múltiple. Estos temas se los puede saltar en una primera lectura, si así lo desea.
USO DE LA COMPUTADORA
En los últimos 20 años el desarrollo de computadoras rápidas y baratas ha revolucionado la
práctica de la estadística; efectivamente, ésta es una de las razones principales del porqué los
métodos estadísticos han estado penetrando cada vez más en el trabajo científico. Los científicos y los ingenieros actuales no sólo deben ser expertos en el manejo de paquetes de software, sino que también deben contar con la habilidad para concluir a partir de los resultados
computacionales y expresar estas conclusiones en palabras. De acuerdo con esto, el libro contiene ejercicios y ejemplos que requieren la interpretación, así como la generación de resultados por computadora, especialmente en los capítulos de modelos lineales y experimentos
factoriales.
La disponibilidad actual de computadoras y de paquetes computacionales estadísticos
también ha producido un importante beneficio en la educación, al hacer accesibles los métodos de simulación a los estudiantes de los cursos de introducción. La simulación hace que los
principios fundamentales de la estadística revivan. El material de simulación que aquí se presenta está diseñado para reforzar algunas ideas estadísticas básicas e introducir a los estudiantes en algunos de los usos de esta poderosa herramienta.
CONTENIDO
El capítulo 1 cubre el muestreo y la estadística descriptiva. La razón por la que los métodos
estadísticos funcionan es que las muestras, cuando se toman en forma adecuada, semejan a la
población. Por consiguiente, el capítulo 1 empieza con la descripción de algunas formas de
tomar muestras válidas. En la segunda parte del capítulo se analiza la estadística descriptiva.
El capítulo 2 trata la probabilidad. Existe una gran discrepancia en las preferencias de
los profesores acerca de qué tanto y tan profundamente se debe cubrir este tema. Por lo tanto, se ha tratado de hacer este capítulo lo más flexible posible. Los resultados principales se
deducen de axiomas, demostrando la mayoría de ellos. Esto último permitirá a los profesores
establecer un enfoque matemático riguroso. Por otra parte, he intentado mostrar cada resultado con uno o dos ejemplos, en donde sea posible un contexto científico que esté diseñado para presentar la intuición que se encuentra detrás del resultado. Por tanto, los profesores que
prefieran un enfoque más informal se pueden dedicar a los ejemplos más que a las demostraciones.
En el capítulo 3 se presenta el tema de la propagación del error, que algunas veces se
llama “análisis del error” o, por los estadísticos, “el método delta”. La cobertura es más amplia que en la mayoría de los textos, pero el tema es tan importante que pensé que era útil. La
presentación está diseñada para permitir que los profesores ajusten la cantidad de temas que
debe cubrir de acuerdo con las necesidades del curso.
En el capítulo 4 se presentan muchas de las funciones de distribución de probabilidad
comúnmente usadas en la práctica. También se tratan las gráficas de probabilidad y el teorema del límite central. En la última sección se presentan los métodos de simulación para evaluar los supuestos de normalidad, cálculo de probabilidades y estimación de sesgo.
Los capítulos 5 y 6 tratan los intervalos de confianza y las pruebas de hipótesis, respectivamente. Se hace énfasis en el enfoque del P-valor para las pruebas de hipótesis, pero tam-
Prefacio
xvii
bién se presentan pruebas de nivel-fijo y el cálculo de la potencia. El problema de pruebas
múltiples se trata con cierta profundidad. También se presentan métodos de simulación para
calcular intervalos de confianza y realizar pruebas de hipótesis.
En el capítulo 7 se trata la correlación y la regresión lineal simple. He trabajado arduamente para enfatizar que los modelos lineales sólo son apropiados cuando la relación entre las
variables es lineal. Este punto es muy importante ya que con frecuencia ingenieros y científicos lo ignoran (sin mencionar a los estadísticos). No es difícil encontrar en la bibliografía
científica ajustes lineales y coeficientes de correlación resumidos en gráficas que presentan
una curvatura evidente o en las cuales la pendiente de la recta se ve afectada mediante algunos puntos influyentes. Por tanto, en este capítulo se incluye una larga sección para comprobar los supuestos del modelo y la transformación de variables.
En el capítulo 8 se trata el tema de la regresión múltiple. Se hace un énfasis especial en
los métodos de selección de modelo, ya que la selección de variables que se incluirán en el
modelo constituye un paso esencial en muchos análisis de la vida real. También el tema de la
confusión se trata cuidadosamente.
En el capítulo 9 se analizan algunos diseños experimentales y los métodos que comúnmente se aplican para analizar sus datos. Los métodos de análisis de varianza en uno y dos
sentidos junto con el diseño de bloques completamente aleatorios y los diseños factoriales 2p
se tratan con amplitud.
En el capítulo 10 se presenta el tema del control de calidad estadístico, se analizan los
diagramas CUSUM, la capacidad del proceso y se concluye con una breve descripción de la
calidad con six-sigma.
MATERIAL RECOMENDADO
El libro contiene suficiente material para un curso de un año. Si se requiriera un curso de un
semestre, hay varias opciones. En nuestro curso de tres horas en la Escuela de Minas de Colorado cubrimos el total de los primeros cuatro capítulos, excepto las distribuciones conjuntas, la exponencial, la gamma y de Weibull. Después se cubren los temas de intervalos de
confianza y las pruebas de hipótesis en los capítulos 5 y 6, tocando rápidamente los métodos
de dos muestras y los cálculos de potencia y se omiten los métodos de distribución libre y las
pruebas de Ji cuadrada y F. Terminamos cubriendo todo el material posible, que el tiempo restante permita, sobre correlación y regresión lineal simple del capítulo 7.
Se puede planear un curso con un sentido diferente que incluya más material de probabilidad, invirtiendo más tiempo en los métodos de dos muestras y de potencia y reduciendo
la cobertura de la propagación del error, simulación o regresión. Hay muchas otras opciones;
por ejemplo, se puede elegir incluir material de experimentos factoriales en lugar de algunos
de los temas anteriores. En el manual del profesor que está disponible en el centro de aprendizaje en línea (Online Learning Center) en www.mhhe.com/navidi se puede encontrar una
variedad de enfoques y duración de cursos.
AGRADECIMIENTOS
Estoy en deuda con muchas de las personas que contribuyeron en cada etapa del desarrollo.
Mis colegas de la división de ingeniería en la Escuela de Minas de Colorado fueron pacientes y generosos al ayudarme a evaluar los caminos en los que las ideas estadísticas interactúan con la práctica de la ingeniería; Terry Parker merece mención especial por esto. Otros
xviii
Prefacio
colegas, que impartieron clases y estudiantes que estudiaron en borradores del manuscrito encontraron muchos errores y me hicieron sugerencias muy valiosas. En particular, Barbara
Moskal y Gus Greivel enseñaron varias veces con el manuscrito en evolución, lo que fue de
ayuda y apoyo durante todo el tiempo; asimismo, Melissa Laeser encontró muchos conjuntos
de datos interesantes en fuentes publicadas. Mike Colagrosso, de la Escuela de Minas de Colorado, desarrolló algunos applets excelentes, así como Chris Boisclair y el equipo en sistemas de enlace. Jessica Kohlschmidt, de la Universidad Estatal de Ohio, desarrolló diapositivas
en PowerPoint para complementar el texto y Jackie Miller, también de la Universidad Estatal
de Ohio, encontró muchos errores en todo el manuscrito e hizo valiosas sugerencias para mejorarlo.
El personal de McGraw-Hill fue muy capaz y de gran apoyo. La gerente del proyecto,
Peggy Selle, siempre fue paciente y cooperadora. La correctora del manuscrito, Lucy Mullins,
también merece mi agradecimiento. La orientación de los editores de desarrollo, Maja Lorkovich, Kate Scheinman, Lisa Kalner-Williams y Debra Matteson, mejoraron considerablemente el producto final. Aprecio profundamente la paciencia y la fe de mi editora-patrocinadora,
Suzanne Jeans, y de la editora, Betsy Jones, quienes finalmente lograron que se realizara este proyecto.
William Navidi
RECONOCIMIENTOS
A REVISORES
Y COLABORADORES
Este texto refleja las contribuciones generosas de más de un centenar de profesores de estadística y de sus estudiantes, quienes, a través de numerosas evaluaciones, encuestas y pruebas en clase, nos ayudaron a comprender cómo cubrir sus necesidades y cómo mejorar cuando
no lo lográbamos. Las ideas de estos profesores y sus estudiantes están inmersas en todo el
libro, desde su contenido y organización hasta sus complementos.
El autor y el equipo del área de ingeniería de McGraw-Hill estamos agradecidos con
aquéllos por sus atentos comentarios y contribuciones durante el desarrollo del texto, de sus
complementos y de los recursos multimedia.
Sabri Abou-Ward
University of Toronto, Canada
Jeff Arthur
Oregon State University
Georgiana Baker
University of South Carolina
Barb Barnet
University of Wisconsin, Platteville
Samantha Bates
Virginia Polytechnic Institute
Beno Benhabib
University of Toronto, Canada
L. Bernaards
University of California, Los Angeles
Mary Besterfield-Saore
University of Pittsburgh
J. D. Bhattacharyya
Iowa State University
Amy Biesterfeld
University of Colorado, Boulder
Rick Bilonick
Carnegie Mellon University
Peter Bloomfield
North Carolina State University
Saul Blumenthal
Ohio State University
Robert J. Boik
Montana State University
Tamara Bowcutt
California State University at Chico
Donald Boyd
Montana State University
Raymond Brown
Drexel University
Ronald B. Bucinell
Union College
Karen M. Bursic
University of Pittsburgh
John Butler
California Polytechnic State University,
San Luis Obispo
M. Jaya Chandra
Pennsylvania State University
Huann-Shen Chen
Michigan Technological University
xix
xx
Reconocimientos a revisores y colaboradores
Nicolas Christou
University of California, Los Angeles
Dave Goldsman
Georgia Institute of Technology
Dave Clark
Kettering University
Pierre Goovaerts
University of Michigan
Peyton Cook
University of Tulsa
Canan Bilen Green
North Dakota State University
William Cooper
University of Minnesota
Trevor Hale
Ohio University
Casey Cremins
University of Maryland
Dan Dalthorp
Cornell University
Jim Handley
Montana Tech of the
University of Montana
Valentin Deaconu
University of Nevada, Reno
Darinka Dentcheva
Stevens Institute of Technology
Art Diaz
San Jose State University
Don Edwards
University of Toronto, Canada
Judith Ekstrand
San Francisco State University
Timothy C. Elston
North Carolina State University
Randy Eubank
Texas A&M University
Thomas Z. Fahidy
University of Waterloo, Canada
Nasser Fard
Northeastern University
James Higgins
Kansas State University
David Hoeppener
University of Utah
Carol O’Connor Holloman
University of Louisville
Joseph Horowitz
University of Massachusetts, Amherst
Wei-Min Huang
Lehigh University
Norma Hubele
Arizona State University
Floyd Hummel
Pennsylvania State University
Wafik Iskander
West Virginia University
Roger Johnson
South Dakota School of Mines
and Technology
Steve From
University of Nebraska at Omaha
Scott Jordan
Arkansas Tech University
Gary Gadbury
University of Missouri, Rolla
Kailash Kapur
University of Washington
Pierre Gharghouri
Ryerson University, Canada
David Kender
Wright State University
Sampson Gholston
University of Alabama
Kim Wee Kong
Multimedia University, Malaysia
Robert Gilbert
The University of Texas at Austin
Ravindra Khattree
Oakland University
Reconocimientos a revisores y colaboradores
Vadim Khayms
Stanford University
James Maneval
Bucknell University
Claire Komives
San Jose State University
Munir Mahmood
Rochester Institute of Technology
Thomas Koon
Binghamton University
Glen Marotz
University of Kansas
Milo Koretsky
Oregon State University
Roger Korus
University of Idaho
Timothy Matis
New Mexico State University
Tomasz Kozubowski
University of Nevada, Reno
Megan Meece
University of Florida
Gary Kretchik
University of Alaska, Anchorage
Vivien Miller
Mississippi State University
Hillel Kumin
University of Oklahoma
Bradley Mingels
University of Massachusetts, Lowell
Samuel Labi
Purdue University
Satya Mishra
University of South Alabama
Robert Lacher
South Dakota State University
N. N. Murulidhar
National Institute of Technology, India
John Lawson
Brigham Young University
Stephen Lee
University of Idaho
Steve Ng Hoi-Kow
Hong Kong Institute of Vocational
Education, Hong Kong
Marvin Lentner
Virgina Polytechnic Institute
Liza Levina
University of Michigan
Quingchong John Liu
Oakland University
xxi
Laura McSweeney
Fairfield University
Zulkifli Mohd Nopiah
Universiti Kebangsaan Malaysia, Malaysia
Bob O’Donnell
Oregon State University
Nancy Olmstead
Milwaukee School of Engineering
Graham Lord
Princeton University
K. P. Patil
Veermeeta Jijabai Technological
Institute, India
Arthur Lubin
Illinois Institute of Technology
Arunkumar Pennathur
University of Texas at El Paso
Zhen Luo
Pennsylvania State University
Joseph Petrucelli
Worcester Polytechnic University
James Lynch
University of South Carolina
Elizabeth Podlaha
Louisiana State University
Peter MacDonald
McMaster University, Canada
Michael Pore
The University of Texas at Austin
xxii
Reconocimientos a revisores y colaboradores
Jeffrey Proehl
Dartmouth College
Jery Stedinger
Cornell University
Jorge Prozzi
The University of Texas at Austin
Frank E. Stratton
San Diego State University
D. Ramachandran
California State University at Sacramento
John Ting
University of Massachusetts, Lowell
Amelia Regan
University of California, Irvine
Gilberto Urroz
Utah State University
Larry Ringer
Texas A&M University
Margot Vigeant
Bucknell University
Iris V. Rivero
Texas Tech University
Joseph G. Voelkel
Rochester Institute of Technology
Timothy Robinson
University of Wyoming
Natascha Vukasinovic
Utah State University
Derrick Rollins
Iowa State University
Amy Wagler
Oklahoma State University
Andrew Ross
Lehigh University
Tse-Wei Wang
University of Tennessee, Knoxville
Manual Rossetti
University of Arkansas
Bill Warde
Oklahoma State University
V. A. Samaranayake
University of Missouri, Rolla
Simon Washington
University of Arizona
Doug Schmucker
Valaparaiso University
Daniel Weiner
Boston University
David Schrady
Naval Postgraduate School
Alison Weir
University of Toronto at
Mississauga, Canada
Neil Schwertman
California State University, Chico
Nong Shang
Rensselaer Polytechnic Institute
Galit Shmueli
Carnegie Mellon University
Ruey-Lin Sheu
National Cheng Kung University, Taiwan
Tony Smith
University of Pennsylvania
Bruce Westermo
San Diego State University
Grant Willson
The University of Texas at Austin
Jae Yoon
Old Dominion University
Ali Zargar
San Jose State University
Características clave
Resumen del contenido
Este libro permite cubrir el material de una forma
flexible ya que hay muchas maneras de diseñar un
curso exitoso de introducción a la estadística.
• Cobertura flexible de probabilidad
dirigida a las diferentes necesidades de los cursos. Permite el enfoque matemático riguroso,
los principales resultados son deducidos de
axiomas al proporcionar demostraciones en la
mayoría de ellos. Por otra parte, cada resultado
se muestra con uno o dos ejemplos para motivar intuitivamente la comprensión. Los profesores que prefieran un enfoque más informal
pueden, por tanto, dedicarse a los ejemplos en
lugar de las demostraciones y omitir las secciones opcionales.
• Cobertura extensa de propagación del error,
algunas veces se llama “análisis de errores” o
“el método delta”, se trata en un capítulo exclusivo del tema. La cobertura es más minuciosa
que en la mayoría de los textos. El formato es
flexible con el propósito de que la cantidad del
material se adapte a las necesidades del curso.
• Una sólida introducción a los métodos de
simulación y a la estimación bootstrap
se presenta en las secciones finales de los
capítulos 4, 5 y 6.
• Cobertura extensa de los procedimientos
de diagnóstico del modelo lineal
en el capítulo 7, se incluye una gran sección de
la comprobación de supuestos del modelo y de
la transformación de variables. El capítulo enfatiza que los modelos lineales sólo son apropiados cuando la relación entre las variables es lineal. Este punto es el más importante, ya que
con frecuencia se ignora en la práctica de ingenieros y científicos (sin mencionar a los estadísticos).
Capítulo 1
Muestreo y estadística descriptiva 1
Capítulo 2
Probabilidad 50
2.1 Ideas básicas 50
2.2 Métodos de conteo (opcional) 62
2.3 Probabilidad condicional e independencia 69
2.4 Variables aleatorias 88
2.5 Funciones lineales de variables aleatorias 111
2.6 Variables aleatorias con distribución conjunta (opcional) 120
Capítulo 3
Propagación de errores 157
3.1 Error de medición 157
3.2 Combinaciones lineales de las mediciones 163
3.3 Incertidumbres para funciones de una medición 173
3.4 Incertidumbres para funciones de varias mediciones 179
Capítulo 4
Distribuciones comúnmente usadas 192
4.11 Simulación 281
•
•
•
•
•
Uso de la simulación para calcular una probabilidad
Cálculo de medias y varianzas
Usos de la simulación en análisis de confiabilidad
Uso de la simulación para calcular sesgamiento
La estimación autosuficiente
Capítulo 5
Intervalos de confianza 300
5.8 Uso de simulación para construir intervalos de confianza
351
• Intervalos de confianza usando estimación bootstrap
• Uso de simulación para evaluar intervalos de confianza
Capítulo 6
Pruebas de hipótesis 368
6.15 Uso de la simulación para realizar pruebas de hipótesis
462
• Pruebas de hipótesis con intervalos de confianza de estimación bootstrap
• Pruebas aleatorias
• Uso de simulación para calcular la potencia
Capítulo 7
Correlación y regresión lineal simple 475
7.4 Comprobación de supuestos y transformación de datos
•
•
•
•
•
•
•
•
•
527
La gráfica de los residuos contra valores ajustados
Transformación de variables
Determinación de la transformación que se aplicará
Las transformaciones no siempre funcionan
Las gráficas de los residuales con sólo pocos puntos pueden ser difíciles de interpretar
Puntos atípicos e influyentes
Otros métodos para transformar variables
Pruebas de independencia y normalidad
Modelos empíricos y leyes físicas
Capítulo 8
Regresión múltiple 556
Capítulo 9
Experimentos factoriales 623
Capítulo 10
Control estadístico de calidad 723
Características clave
El artículo “Virgin Versus Recycled Wafers for Furnace Qualification: Is the Expense
Justified?” (V. Czitrom y J. Reece, en Statistical Case Studies for Industrial Process Improvement, ASA y SIAM, 1997:87-104) describe un proceso para el crecimiento de una capa delgada de dióxido de silicio sobre placas de silicio que se usan en la fabricación de semiconductores. La tabla 1.6 presenta las mediciones del espesor, en angstroms (Å), de la capa de
óxido para 24 placas. Se hicieron nueve mediciones en cada placa. Las placas se fabricaron
en dos corridas distintas, con 12 placas por cada corrida.
Conjuntos de datos
del mundo real
Con un enfoque fresco del tema, el autor usa datos del mundo real actuales para motivar a los
estudiantes mostrando una conexión con la industria y la investigación.
TABLA 1.6 Espesor de las capas de óxido de silicio en placas de silicio
Placa
Espesor (Å)
Corrida 1
1
2
3
4
5
6
7
8
9
10
11
12
90.0
91.8
90.3
92.6
91.1
76.1
92.4
91.3
96.7
92.0
94.1
91.7
92.2
94.5
91.1
90.3
89.8
90.2
91.7
90.1
93.7
94.6
91.5
97.4
94.9
93.9
93.3
92.8
91.5
96.8
91.6
95.4
93.9
93.7
95.3
95.1
92.7
77.3
93.5
91.6
91.5
84.6
91.1
89.6
87.9
94.0
92.8
96.7
91.6
92.0
87.2
92.7
90.6
93.3
88.0
90.7
90.4
89.3
93.4
77.5
88.2
89.9
88.1
91.7
93.1
95.7
92.4
95.8
92.0
90.1
92.2
91.4
82.0
98.2
96.0
87.9
92.8
93.3
90.1
91.9
94.5
89.3
95.5
93.6
88.9
92.5
92.4
90.9
100.3
95.2
88.7
92.9
92.6
91.7
97.9
95.7
90.5
95.2
94.3
91.3
92.7
94.5
89.4
94.5
95.4
artículo “Seismic
90.5 22. El 95.2
93.1 Hazard in Greece Based on Different Strong Ground Motion Parameters” (S. Koutrakis, G. Karakaisis y
Corrida 2
1
2
3
4
5
6
7
8
9
10
11
12
93.0
91.4
91.9
90.6
93.1
90.8
88.0
88.3
94.2
101.5
92.8
92.1
99.9
90.6
91.8
91.3
91.8
91.5
91.8
96.0
92.2
103.1
90.8
93.4
93.6
92.2
92.8
94.9
94.6
91.5
90.5
92.8
95.8
103.2
92.2
94.0
89.0
91.9
96.4
88.3
88.9
91.5
90.4
93.7
92.5
103.5
91.7
94.7
93.6
92.4
93.8
87.9
90.0
94.0
90.3
89.6
91.0
96.1
89.0
90.8
90.9
87.6
86.5
92.2
97.9
91.0
91.5
89.6
91.4
102.5
88.5
92.1
89.8
92.4Es de interés
93.0 la duración de los “fuertes movimientos de tierra”, que es el tiempo en que la aceleración de la tierra exce1997.
88.9
90.9
92.8
de un valor específico. En cada episodio las mediciones de la duración de temblores fuertes de tierra se hicieron en una o más
92.7
90.9
92.8
ubicaciones. La tabla SE22 de la página 618 presenta cada uno de 121 temblores medidos, los datos con el tiempo de duración
90.7
91.3
93.6
y (en segundos) durante los cuales la aceleración de la tierra excedió el doble de la aceleración de la gravedad. La magnitud m
92.1
91.6
98.4
del
sismo,
la
distancia
92.1
91.8
94.0 d (en km) de la medición desde el epicentro, y los dos indicadores del tipo de suelo s1 y s2, definidos de
la siguiente
manera:
89.4
93.2
93.9 s1 ⫽ 1 si el suelo consta de depósitos aluviales blandos, s1 ⫽ 0 de otra manera, y s2 ⫽ 1 si el suelo consta
de
rocas
terciarias
90.2
95.3
93.0 o más viejas, s2 ⫽ 0 de otra manera. Los casos donde tanto s1 ⫽ 0 como s2 ⫽ 0 corresponden a condiciones93.6
intermedias
del suelo. El artículo presenta mediciones repetidas en algunas ubicaciones que no se incluyen aquí.
92.8
91.0
102.0
106.7
105.4
87.5
93.8
91.4
91.2 TABLA
92.3SE22 Datos
91.1 para el ejercicio 22
cols., en Journal of Earthquake Engineering, 2002:75-109) presenta un estudio de episodios sísmicos en Grecia durante 1978-
y
m
d
s1
s2
y
m
d
s1
s2
y
m
d
s1
s2
8.82
6.4
30
17.19
5.14
0.05
20.00
12.04
0.87
0.62
8.10
1.30
11.92
3.93
2.00
0.43
14.22
0.06
1.48
3.27
6.36
0.18
0.31
1.90
0.29
6.26
3.44
2.32
1.49
2.85
0.01
9.34
10.47
5.9
5.5
4.9
5.8
6.1
5.0
4.8
5.4
5.8
5.6
5.7
5.4
5.4
6.5
6.5
5.2
5.1
5.2
5.0
4.5
4.7
4.7
6.3
5.4
5.4
5.0
5.4
6.4
6.6
6.6
9
10
14
16
31
65
11
12
34
5
65
27
31
20
72
27
12
14
19
12
12
5
9
4
5
4
1
86
116
117
1
0
1
0
1
1
0
1
0
0
0
0
1
1
1
0
1
1
1
1
0
1
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
1
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
1
0
4.31
28.27
17.94
3.60
7.98
16.23
3.67
6.44
10.45
8.32
5.43
4.78
2.82
3.51
13.92
3.96
6.91
5.63
0.10
5.10
16.52
19.84
1.65
1.75
6.37
2.78
2.14
0.92
3.18
1.20
4.37
1.02
0.71
4.27
3.25
0.90
0.37
21.07
0.04
15.30
5.3
6.6
6.9
5.4
5.3
6.2
6.6
5.2
5.3
5.5
5.2
5.5
5.5
5.7
5.8
6.1
5.4
5.3
5.2
4.8
5.5
5.7
5.4
5.4
6.5
4.9
5.2
5.2
4.8
5.0
4.7
5.0
4.8
6.3
5.4
4.7
5.0
6.4
6.4
6.6
6
31
33
6
12
13
85
21
11
22
49
1
20
22
34
44
16
6
21
16
15
50
27
30
90
8
22
29
15
19
5
14
4
9
4
4
4
78
105
82
0
1
0
0
1
0
1
0
0
1
0
0
0
0
1
0
0
1
1
1
1
1
1
0
1
0
0
0
0
0
0
0
1
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
1
0
1
0
1
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
1
1
0
1
1
1
1
5.74
5.13
3.20
7.29
0.02
7.03
2.17
4.27
2.25
3.10
6.18
4.56
0.94
2.85
4.21
1.93
1.56
5.03
0.51
13.14
8.16
10.04
0.79
0.02
0.10
5.43
0.81
0.73
11.18
2.54
1.55
0.01
0.21
0.04
0.01
1.19
2.66
7.47
30.45
12.78
5.6
6.9
5.1
5.2
6.2
5.4
5.1
5.2
4.8
5.5
5.2
5.5
5.0
4.6
4.7
5.7
5.0
5.1
4.9
5.6
5.5
5.1
5.4
5.4
6.5
5.2
4.6
5.2
5.0
4.5
4.7
4.5
4.8
4.5
4.5
4.7
5.4
6.4
6.6
6.6
15
128
13
19
68
10
45
18
14
15
13
1
6
21
20
39
44
2
14
5
12
28
35
32
61
9
9
22
8
6
13
17
5
3
1
3
1
104
51
65
0
1
0
1
1
0
0
1
0
0
0
0
0
1
1
1
1
1
1
1
1
1
0
1
0
0
0
0
0
0
0
0
0
1
1
1
1
0
1
1
0
0
0
0
0
0
1
0
1
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
1
0
1
0
0
0
0
0
0
0
Las 12 placas en cada corrida eran de varios tipos y se procesaron en
diferentes
4.08
5.2 posi-7
ciones en el horno. El propósito en la recopilación de datos fue determinar15.90
si el espesor
la
6.9 de105
15
capa de óxido se afectaba ya sea por el tipo de placa o por la posición en el6.04
horno. 5.8
Por tanto,
0.15
4.9
16
éste fue un experimento factorial, con los factores, tipo de placa y posición en el horno y co6.2
75
mo resultado el espesor de la capa de óxido. El experimento se diseñó de 5.06
tal manera
que no
0.01
6.6
119
se supuso ninguna diferencia sistemática entre las capas de una corrida a otra.
pa4.13 El primer
5.1
10
so en el análisis fue construir un diagrama de caja para los datos de cada corrida
con
0.02
5.3 el pro22
4.5 de las
12
pósito de ayudar a determinar si esta condición se satisfacía realmente y2.14
si ninguna
4.41
5.2
17
observaciones se debía eliminar. Los resultados se presentan en la figura 1.17.
Con los datos de la tabla SE22 construya un modelo lineal para pronosticar la duración y a partir de alguna o de todas las
variables m, d, s1 y s2. Asegúrese de considerar las transformaciones de las variables, así como las potencias de y las interacciones entre las variables independientes. Describa sus pasos para construir su modelo. Realice una gráfica de residuos contra
valores ajustados para comprobar que su modelo satisface los supuestos necesarios. Además, observe que los datos se presentan en orden cronológico, al leer hacia abajo en las columnas. Realice una gráfica para determinar si se debe incluir al tiempo
como una variable independiente.
Características clave
Resultados de
computadora
El libro contiene ejercicios y ejemplos que requieren la interpretación y la generación de resultados
por medio de computadora.
12. El siguiente resultado MINITAB presenta los resultados de una prueba de hipótesis para una media poblacional m.
One-Sample Z: X
Test of mu = 73.5 vs not = 73.5
The assumed standard deviation = 2.3634
Variable
X
N
145
Mean
73.2461
StDev
2.3634
SE Mean
0.1963
95% CI
(72.8614, 73.6308)
Z
−1.29
P
0.196
a) ¿Es ésta una prueba de una cola o de dos colas?
b) ¿Cuál es la hipótesis nula?
c) ¿Cuál es el P-valor?
d) Utilice el resultado y una tabla adecuada para calcular el P-valor para la prueba de H0: m ⱖ 73.6 contra H1: m ⬍ 73.6
e) Utilice el resultado y una tabla adecuada para calcular un intervalo de confianza de 99% para m.
7. En un estudio de la función pulmonar de niños, el volumen de aire exhalado por la fuerza en un segundo se llama FEV1. (FEV1
es el volumen de expiración forzada en un segundo.) Se hicieron mediciones en un grupo de niños cada año durante dos años.
Se ajustó a un modelo lineal para pronosticar los FEV1 de estos años como una función del FEV1 (en litros) del último año, el
sexo del niño (0 ⫽ masculino, 1 ⫽ femenino), la estatura del niño (en m), y la presión atmosférica ambiental (en mm). El siguiente resultado de MINITAB presenta los resultados de ajuste del modelo
FEV1 ⫽ β0 ⫹ β1 Último FEV1 ⫹ β2 Sexo ⫹ β3 Estatura ⫹ β4 Presión ⫹ ε
The regression equation is
FEV1 = –0.219 + 0.779 Last FEV – 0.108 Gender + 1.354 Height – 0.00134 Pressure
Predictor
Constant
Last FEV
Gender
Height
Pressure
Coef
–0.21947
0.779
–0.10827
1.3536
–0.0013431
S = 0.22039
SE Coef
0.4503
0.04909
0.0352
0.2880
0.0004722
T
–0.49
15.87
–3.08
4.70
–2.84
P
0.627
0.000
0.002
0.000
0.005
R–Sq = 93.5%
R–Sq(adj) = 93.3%
DF
4
160
164
MS
27.826
0.048572
Analysis of Variance
Source
Regression
Residual Error
Total
SS
111.31
7.7716
119.08
F
572.89
P
0.000
a) Pronostique el FEV1 para un niño con estatura de 1.4 m, si la medida se tomó a presión de 730 mm y la medición del último año fue 2.113 L.
b) Si dos niñas difieren en estatura por 5 cm, ¿qué tanto esperaría que sus mediciones de FEV1 difieran; los otros conceptos
siguen igual?
c) Se estima que el término constante β0 es negativo, pero el FEV1 debe ser siempre positivo. ¿Algo está erróneo? Explique.
d ) El responsable de este experimento quiere rediseñar el algoritmo que registra las mediciones electrónicamente con el fin de
ajustar la presión atmosférica automáticamente. Se fija un barómetro al dispositivo para registrar la presión. Utilice el resultado anterior de MINITAB para determinar cómo calcular un valor FEV1 ajustado como función del valor FEV1 medido y de la presión.
Complementos de aprendizaje
para los estudiantes
CD-ROM con
recursos para los
estudiantes
Empaquetado gratis con cada libro nuevo, este CD proporciona todos los conjuntos de datos del texto, así como applets
basados en el contenido del texto para
reforzar un entendimiento visual de la
estadística.
• Todos los conjuntos de datos se
pueden descargar en diferentes formatos:
• ASCII delimitado con comas
• ASCII delimitado con tabuladores
• MINITAB
• Excel
• SAS
• SPSS
• TI-89
• Applets de Java, creados específicamente para los cálculos de este curso,
proporcionan ejercicios interactivos
basados en el contenido del texto, lo
que permite a los estudiantes modificar las variables y explorar escenarios
de “¿Qué sucede si?”. También se incluyen en la suite de applet los
applets de simulación, que refuerzan la excelente cobertura de texto de
los métodos de simulación. Los applets
permiten que los estudiantes vean los
ejemplos de simulación del texto en
acción y que modifiquen los parámetros para una mayor exploración.
• Una guía a la simulación con MINITAB preparada por el autor donde se
describe cómo se pueden implementar
en MINITAB los ejemplos de simulación en el texto.
• Herramientas y recursos, que incluye un vínculo al centro de aprendizaje
del libro, ofrece en línea recursos para
el profesor y el estudiante en
www.mhhe.com/navidi.
Materiales de apoyo
Esta obra cuenta con interesantes
complementos que fortalecen los procesos de
enseñanza-aprendizaje, así como la evaluación
de éstos. Mismos que se otorgan a profesores
que adopten este texto para sus cursos.
Para obtener más información y conocer la
política de entrega de estos materiales,
contacte a su representante de McGraw-Hill o
envíe un correo electrónico a
marketinghe@mcgraw-hill.com
TABLA A.2 Distribución normal acumulativa (tabla z)
z
0
z
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
–3.6
–3.5
–3.4
–3.3
–3.2
.0002
.0002
.0003
.0005
.0007
.0002
.0002
.0003
.0005
.0007
.0001
.0002
.0003
.0005
.0006
.0001
.0002
.0003
.0004
.0006
.0001
.0002
.0003
.0004
.0006
.0001
.0002
.0003
.0004
.0006
.0001
.0002
.0003
.0004
.0006
.0001
.0002
.0003
.0004
.0005
.0001
.0002
.0003
.0004
.0005
.0001
.0002
.0002
.0003
.0005
–3.1
–3.0
–2.9
–2.8
–2.7
.0010
.0013
.0019
.0026
.0035
.0009
.0013
.0018
.0025
.0034
.0009
.0013
.0018
.0024
.0033
.0009
.0012
.0017
.0023
.0032
.0008
.0012
.0016
.0023
.0031
.0008
.0011
.0016
.0022
.0030
.0008
.0011
.0015
.0021
.0029
.0008
.0011
.0015
.0021
.0028
.0007
.0010
.0014
.0020
.0027
.0007
.0010
.0014
.0019
.0026
–2.6
–2.5
–2.4
–2.3
–2.2
.0047
.0062
.0082
.0107
.0139
.0045
.0060
.0080
.0104
.0136
.0044
.0059
.0078
.0102
.0132
.0043
.0057
.0075
.0099
.0129
.0041
.0055
.0073
.0096
.0125
.0040
.0054
.0071
.0094
.0122
.0039
.0052
.0069
.0091
.0119
.0038
.0051
.0068
.0089
.0116
.0037
.0049
.0066
.0087
.0113
.0036
.0048
.0064
.0084
.0110
–2.1
–2.0
–1.9
–1.8
–1.7
.0179
.0228
.0287
.0359
.0446
.0174
.0222
.0281
.0351
.0436
.0170
.0217
.0274
.0344
.0427
.0166
.0212
.0268
.0336
.0418
.0162
.0207
.0262
.0329
.0409
.0158
.0202
.0256
.0322
.0401
.0154
.0197
.0250
.0314
.0392
.0150
.0192
.0244
.0307
.0384
.0146
.0188
.0239
.0301
.0375
.0143
.0183
.0233
.0294
.0367
–1.6
–1.5
–1.4
–1.3
–1.2
.0548
.0668
.0808
.0968
.1151
.0537
.0655
.0793
.0951
.1131
.0526
.0643
.0778
.0934
.1112
.0516
.0630
.0764
.0918
.1093
.0505
.0618
.0749
.0901
.1075
.0495
.0606
.0735
.0885
.1056
.0485
.0594
.0721
.0869
.1038
.0475
.0582
.0708
.0853
.1020
.0465
.0571
.0694
.0838
.1003
.0455
.0559
.0681
.0823
.0985
–1.1
–1.0
–0.9
–0.8
–0.7
.1357
.1587
.1841
.2119
.2420
.1335
.1562
.1814
.2090
.2389
.1314
.1539
.1788
.2061
.2358
.1292
.1515
.1762
.2033
.2327
.1271
.1492
.1736
.2005
.2296
.1251
.1469
.1711
.1977
.2266
.1230
.1446
.1685
.1949
.2236
.1210
.1423
.1660
.1922
.2206
.1190
.1401
.1635
.1894
.2177
.1170
.1379
.1611
.1867
.2148
–0.6
–0.5
–0.4
–0.3
–0.2
.2743
.3085
.3446
.3821
.4207
.2709
.3050
.3409
.3783
.4168
.2676
.3015
.3372
.3745
.4129
.2643
.2981
.3336
.3707
.4090
.2611
.2946
.3300
.3669
.4052
.2578
.2912
.3264
.3632
.4013
.2546
.2877
.3228
.3594
.3974
.2514
.2843
.3192
.3557
.3936
.2483
.2810
.3156
.3520
.3897
.2451
.2776
.3121
.3483
.3859
–0.1
–0.0
.4602
.5000
.4562
.4960
.4522
.4920
.4483
.4880
.4443
.4840
.4404
.4801
.4364
.4761
.4325
.4721
.4286
.4681
.4247
.4641
TABLA A.3 Puntos porcentuales superiores para la distribución t de Student
a
0
t
A
v
0.40
0.25
0.10
0.05
0.025
0.01
0.005
0.001
0.0005
1
2
3
4
5
0.325
0.289
0.277
0.271
0.267
1.000
0.816
0.765
0.741
0.727
3.078
1.886
1.638
1.533
1.476
6.314
2.920
2.353
2.132
2.015
12.706
4.303
3.182
2.776
2.571
31.821
6.965
4.541
3.747
3.365
63.657
9.925
5.841
4.604
4.032
318.309
22.327
10.215
7.173
5.893
636.619
31.599
12.924
8.610
6.869
6
7
8
9
10
0.265
0.263
0.262
0.261
0.260
0.718
0.711
0.706
0.703
0.700
1.440
1.415
1.397
1.383
1.372
1.943
1.895
1.860
1.833
1.812
2.447
2.365
2.306
2.262
2.228
3.143
2.998
2.896
2.821
2.764
3.707
3.499
3.355
3.250
3.169
5.208
4.785
4.501
4.297
4.144
5.959
5.408
5.041
4.781
4.587
11
12
13
14
15
0.260
0.259
0.259
0.258
0.258
0.697
0.695
0.694
0.692
0.691
1.363
1.356
1.350
1.345
1.341
1.796
1.782
1.771
1.761
1.753
2.201
2.179
2.160
2.145
2.131
2.718
2.681
2.650
2.624
2.602
3.106
3.055
3.012
2.977
2.947
4.025
3.930
3.852
3.787
3.733
4.437
4.318
4.221
4.140
4.073
16
17
18
19
20
0.258
0.257
0.257
0.257
0.257
0.690
0.689
0.688
0.688
0.687
1.337
1.333
1.330
1.328
1.325
1.746
1.740
1.734
1.729
1.725
2.120
2.110
2.101
2.093
2.086
2.583
2.567
2.552
2.539
2.528
2.921
2.898
2.878
2.861
2.845
3.686
3.646
3.610
3.579
3.552
4.015
3.965
3.922
3.883
3.850
21
22
23
24
25
0.257
0.256
0.256
0.256
0.256
0.686
0.686
0.685
0.685
0.684
1.323
1.321
1.319
1.318
1.316
1.721
1.717
1.714
1.711
1.708
2.080
2.074
2.069
2.064
2.060
2.518
2.508
2.500
2.492
2.485
2.831
2.819
2.807
2.797
2.787
3.527
3.505
3.485
3.467
3.450
3.819
3.792
3.768
3.745
3.725
26
27
28
29
30
0.256
0.256
0.256
0.256
0.256
0.684
0.684
0.683
0.683
0.683
1.315
1.314
1.313
1.311
1.310
1.706
1.703
1.701
1.699
1.697
2.056
2.052
2.048
2.045
2.042
2.479
2.473
2.467
2.462
2.457
2.779
2.771
2.763
2.756
2.750
3.435
3.421
3.408
3.396
3.385
3.707
3.690
3.674
3.659
3.646
35
40
60
120
∞
0.255
0.255
0.254
0.254
0.253
0.682
0.681
0.679
0.677
0.674
1.306
1.303
1.296
1.289
1.282
1.690
1.684
1.671
1.658
1.645
2.030
2.021
2.000
1.980
1.960
2.438
2.423
2.390
2.358
2.326
2.724
2.704
2.660
2.617
2.576
3.340
3.307
3.232
3.160
3.090
3.591
3.551
3.460
3.373
3.291
Capítulo
1
Muestreo y
estadística descriptiva
Introducción
La recopilación y el análisis de datos son fundamentales en la ciencia e ingeniería. Al analizar
los datos recopilados en experimentos, los científicos descubren los principios que gobiernan
el mundo físico y los ingenieros aprenden cómo diseñar nuevos productos y procesos importantes. Una dificultad muy importante que se presenta con los datos científicos es que éstos se
encuentran sujetos a variaciones aleatorias o incertidumbre. Es decir, cuando se repiten las mediciones científicas cada vez salen un poco diferentes. Lo anterior plantea un problema: ¿cómo se pueden obtener conclusiones de los resultados de un experimento cuando éstos pueden
ser diferentes? Para analizar esta pregunta, es esencial contar con cierto conocimiento estadístico. La estadística se dedica a la recopilación, el análisis y la interpretación de datos con incertidumbre. Los métodos de la estadística permiten que los científicos e ingenieros diseñen
experimentos válidos y obtengan conclusiones confiables a partir de datos obtenidos.
Aunque nuestro interés en este libro es tratar con las aplicaciones de la estadística en la
ciencia y en la ingeniería, cabe mencionar que el análisis y la interpretación de datos son cada vez más importantes en todos los aspectos de la vida moderna. Para bien o para mal, se están recopilando enormes cantidades de datos con nuestras opiniones y estilos de vida, con
fines que van desde la creación de campañas de mercadotecnia más eficaces hasta el desarrollo de políticas sociales diseñadas para mejorar nuestro estilo de vida. Casi a diario, los artículos que se publican en los periódicos pretenden explicar las tendencias sociales o económicas
a través del análisis de datos. Por tanto, un conocimiento básico de estadística es necesario no
sólo para ser un científico o ingeniero eficiente, sino también para ser un miembro bien informado de la sociedad.
La idea básica
La idea básica que yace en todos los métodos estadísticos de análisis de datos es inferir respecto de una población por medio del estudio de una muestra relativamente pequeña elegida de
1
2
CAPÍTULO 1
Muestreo y estadística descriptiva
ésta. Como ejemplo, considere una máquina que hace varillas de acero para su uso en dispositivos ópticos de almacenamiento. La especificación del diámetro de las varillas es 0.45 ⫾
0.02 cm. En la última hora, la máquina ha hecho mil varillas. El ingeniero que supervisa la
calidad quiere saber cuántas de estas varillas satisfacen la especificación. No tiene tiempo para medir todas. En este contexto, toma una muestra aleatoria de 50 varillas, las mide y encuentra que 46 de éstas (92%) satisfacen la especificación del diámetro. De acuerdo con lo
anterior, no es probable que la muestra de 50 varillas represente perfectamente a la población
de mil. La proporción de buenas varillas en la población probablemente es un poco diferente
que la proporción de la muestra de 92%. En este sentido, lo que el ingeniero debe conocer es
la probabilidad de que esa diferencia sea grande. Por ejemplo, ¿es admisible que los porcentajes de población sean superiores a 95%? ¿y de 98%? ¿O menores de 90%?, ¿o de 85%?
He aquí algunas preguntas específicas que el ingeniero podría responder con base en los
datos de la muestra:
1.
2.
3.
El ingeniero necesita calcular la magnitud de la diferencia probable entre las proporciones de la muestra y de la población. ¿Qué tan grande es una diferencia típica para esta
clase de muestra?
Asimismo, necesita llevar una bitácora con los porcentajes de varillas aceptables fabricadas en la última hora. Después de que ha observado que 92% de las varillas de la muestra estaba bien, indicará los porcentajes de las varillas aceptables en la población como
un intervalo de la forma 92% ⫾ x%, donde x es un número calculado para tener una confianza razonable de que los porcentajes reales de la población están en este intervalo.
¿Cómo se debe calcular x?
Por último, quiere estar muy seguro de que el porcentaje de varillas buenas es de al menos 90%; en otro caso detendrá el proceso para recalibrarlo. ¿Qué seguridad puede tener
de que al menos 90% de las mil varillas está bien?
Gran parte de este libro está dedicada a solucionar preguntas semejantes. La primera de éstas
requiere del cálculo de una desviación estándar, que se analizará en los capítulos 2 y 4. La segunda pregunta requiere de la construcción de un intervalo de confianza, ello se aprenderá en
el capítulo 5. La tercera invoca una prueba de hipótesis, que se estudiará en el capítulo 6.
Los capítulos restantes del libro cubren otros temas importantes. Por ejemplo, el ingeniero de nuestro ejemplo querrá saber cómo está relacionada la fuerza de tensión con la cantidad de carbono en las varillas de acero. Esta clase de problemas se puede tratar con los
métodos de correlación y regresión, que se presentan en los capítulos 7 y 8. Podría también
ser importante determinar cómo ajustar el proceso de fabricación respecto de algunos factores, con el fin de producir resultados óptimos. Esto último requiere del diseño de experimentos factoriales, que se analizarán en el capítulo 9. Definitivamente, el ingeniero necesitará
desarrollar un plan para controlar la calidad del producto que se fabrica en el proceso. En el
capítulo 10 se presenta el tema control de la calidad, donde los métodos estadísticos se usan
para mantener la calidad en un contexto industrial.
Los temas que se han mencionado son métodos que se dedican a obtener conclusiones
a partir de datos. Estos métodos constituyen el campo de la estadística inferencial. Antes de
que se analicen estos temas, se aprenderá más acerca de los métodos de recopilación de datos y a resumir claramente la información básica que contienen. Éstos son los temas de muestreo y estadística descriptiva, que se tratan en lo que resta de este capítulo.
1.1
1.1
Muestreo
3
Muestreo
Como se ha mencionado, los métodos estadísticos están basados en la idea de analizar una
muestra tomada de una población. Para trabajar con esta idea, la muestra se debe elegir de
manera adecuada. Por ejemplo, digamos que se quiere conocer la estatura de los estudiantes
de la Escuela de Minas, de Colorado, al considerar una muestra de 100 estudiantes. ¿Cómo
se deben elegir los 100 estudiantes que se medirían? Algunos métodos son malos. Por ejemplo, elegir a los estudiantes de las listas del fútbol americano y de los equipos de basquetbol
daría como resultado una muestra que indudablemente no representaría la distribución de estatura de la población de estudiantes. Usted podría pensar que sería razonable usar alguna
muestra convenientemente obtenida; por ejemplo, todos los estudiantes que viven en cierta
área o todos aquellos que se inscribieron en el curso de estadística para la ingeniería. Después
de todo, no hay razón para pensar que la estatura de estos estudiantes debiera ser diferente de
la estatura, en general, de los estudiantes. Sin embargo, muestras así no son ideales, porque
pueden volverse engañosas en formas no previstas. Los mejores métodos del muestreo implican el muestreo aleatorio. Hay muchos métodos diferentes del muestreo aleatorio, el básico
es el muestreo aleatorio simple.
Para entender la naturaleza de una muestra aleatoria simple, piense en una lotería. Imagine que se han vendido diez mil billetes y que se eligen cinco ganadores. ¿Cuál es la manera
más justa de elegir a los ganadores? Es colocar todos los boletos en un recipiente, mezclarlos
y extraer cinco de ellos uno tras otro. Los boletos premiados constituyen una muestra aleatoria simple de la población de diez mil billetes de la lotería. Cada boleto es igualmente probable de ser uno de los cinco boletos extraídos. Es importante indicar que cada conjunto de
cinco boletos que se puede formar del total tiene la misma probabilidad de ser el grupo que
se extrae. Esta idea constituye la base de la definición de una muestra aleatoria simple.
Resumen
Una población representa la colección completa de elementos o resultados de la
información buscada.
Una muestra constituye un subconjunto de una población, que contiene elementos
o resultados que realmente se observan.
Una muestra aleatoria simple de tamaño n es una muestra elegida por un método
en el que cada colección de n elementos de la población tiene la misma
probabilidad de formar la muestra, de la misma manera que en una lotería.
Debido a que una muestra aleatoria simple es similar a una lotería, con frecuencia se
puede tomar la muestra con el mismo método que el que se usa en muchas loterías: con un
generador de números aleatorios de una computadora. Suponga que hay N elementos en la
población y que se le asigna a cada elemento de la población un entero entre 1 y N. Después
se genera una lista de enteros aleatorios entre 1 y N y se eligen los elementos correspondientes
de la población para que formen la muestra aleatoria simple, precisamente como en la lotería.
4
Ejemplo
1.1
CAPÍTULO 1
Muestreo y estadística descriptiva
Una maestra de educación física quiere estudiar los niveles de condición física de los estudiantes en su universidad. Hay 20 000 estudiantes inscritos y desea tomar una muestra de tamaño 100 para hacerles una prueba de sus condiciones físicas. Obtiene una lista de todos los
estudiantes, numerada del 1 al 20 000. Usa un generador de números aleatorios de la computadora que genera 100 enteros aleatorios entre el total de números y después invita a los 100
estudiantes, a quienes corresponden dichos números, a que participen en el estudio. ¿Ésta es
una muestra aleatoria simple?
Solución
Sí, ésta es una muestra aleatoria simple. Observe que es similar a una lotería en la que cada
estudiante tiene un boleto y se sacan 100 de éstos.
Ejemplo
1.2
Una ingeniero que supervisa la calidad quiere inspeccionar rollos de papel tapiz para obtener
información acerca de la tasa de fallas que tiene la imprenta. Decide tomar una muestra de 50
rollos de la producción de un día. Cada hora durante cinco horas, toma los diez últimos rollos
producidos y cuenta el número de fallas de cada uno. ¿Ésta es una muestra aleatoria simple?
Solución
No. No todo subconjunto de 50 rollos de papel tapiz tiene la misma probabilidad de pertenecer a la muestra. Para formar una muestra aleatoria simple, la ingeniero necesitaría asignar un
número a cada rollo producido durante el día y después generar números aleatorios para determinar con qué rollos se forma la muestra.
En algunos casos, es difícil o imposible extraer una muestra de una manera realmente
aleatoria. En esta situación, lo mejor que se puede hacer es seleccionar los elementos de la
muestra por algún método conveniente. Por ejemplo, imagine que un ingeniero civil acaba de
recibir una remesa de mil bloques de hormigón, que pesan aproximadamente 50 libras cada
uno. Los bloques se han entregado en una gran pila. El ingeniero quiere investigar la fuerza
de compresión de los bloques midiendo las fuerzas en una muestra de diez bloques. Para tomar una muestra aleatoria simple se requeriría sacar bloques del centro y de la parte inferior
de la pila, lo que puede ser muy difícil. Por esta razón, el ingeniero puede tomar una muestra
simplemente tomando diez bloques de la parte superior de la pila. Una muestra así se llama
muestra de conveniencia.
Definición
Una muestra de conveniencia es una muestra que no se extrae por un método
aleatorio bien definido.
El problema con las muestras de conveniencia es que podrían diferir sistemáticamente
de la población en alguna forma. Por esta razón, tales muestras no se deben usar, excepto en
situaciones donde no es viable tomar una muestra aleatoria. Cuando se necesita tomar una
1.1
Muestreo
5
muestra de conveniencia, es importante pensar en todas las formas en las que aquélla podría
diferir sistemáticamente de la población. Si es razonable pensar que no existe una diferencia
sistémica importante, entonces puede ser aceptable tratar la muestra de conveniencia como si
fuera una muestra aleatoria simple. Respecto de los bloques de hormigón, si el ingeniero está seguro de que los bloques superiores en la pila no difieren sistemáticamente en alguna forma importante del resto, entonces puede tratar la muestra de conveniencia como una muestra
aleatoria simple. Sin embargo, si es posible que los bloques en diferentes lugares de la pila
hayan sido hechos con diferentes cantidades de mezclas o que puedan tener diferentes tiempos de cocido o diferentes temperaturas, entonces una muestra de conveniencia podría dar resultados falsos.
Algunas personas piensan que una muestra aleatoria simple es garantía de que refleja
perfectamente a su población. Esto no es cierto. Las muestras aleatorias simples siempre son
diferentes de sus poblaciones en algunos aspectos y en ocasiones podrían ser considerablemente diferentes. Dos muestras diferentes de la misma población también serán diferentes entre sí. Este fenómeno se conoce como variación del muestreo. Esta última constituye una de
las razones por la que los experimentos científicos tienen resultados diferentes cuando se repiten, aun cuando las condiciones parecen ser idénticas.
Ejemplo
1.3
Un inspector de calidad prueba 40 pernos de una gran remesa y mide la longitud de cada uno.
Descubre que 34 de ellos (85%) cubre la especificación de longitud. Llega entonces a la conclusión de que exactamente 85% de los pernos de la remesa satisfacen la especificación. Por
otra parte, el supervisor del inspector concluye que la proporción de pernos buenos está cerca de 85% con cierta probabilidad, pero que no es exactamente igual. ¿Cuál es la conclusión
correcta?
Solución
Debido a la variación del muestreo, las muestras aleatorias simples no reflejan a la población
perfectamente. Sin embargo, con frecuencia están bastante cerca. Por tanto, resulta adecuado
inferir que la proporción de pernos buenos en la remesa esté cerca de la proporción de muestra, que es de 85%, con cierta probabilidad. Sin embargo, no es probable que la proporción
de población sea igual a 85 por ciento.
Ejemplo
1.4
Continuando con el ejemplo 1.3, otra inspectora repite el estudio con una muestra aleatoria
simple diferente de 40 pernos. Descubre que 36 de ellos, 90%, son buenos. El primer inspector afirma que ella debió haber cometido algún error, ya que sus resultados mostraban que
85% y no 90% de los pernos son buenos. ¿Tiene razón?
Solución
No, él no tiene razón. Es la variación del muestreo en acción. Dos muestras diferentes de la
misma población serán diferentes entre sí y de la población.
Ya que las muestras aleatorias simples no reflejan a sus poblaciones perfectamente,
¿por qué es importante que el muestreo sea aleatorio? La ventaja de una muestra aleatoria
simple es que no hay ningún mecanismo sistémico que la haga poco representativa. Las dife-
6
CAPÍTULO 1
Muestreo y estadística descriptiva
rencias entre la muestra y su población son atribuibles completamente a la variación aleatoria. Debido a que la teoría matemática sobre la variación aleatoria se comprende bien, se pueden usar modelos matemáticos para estudiar la relación entre muestras aleatorias simples y
sus poblaciones. En general, para una muestra que no fue seleccionada de forma aleatoria, no
existe una teoría disponible que describa los mecanismos que causaron que la muestra difiera de su población. Por tanto, con frecuencia las muestras que no fueron obtenidas aleatoriamente son difíciles de analizar de manera confiable.
En los ejemplos 1.1 a l.4, las poblaciones constaban de elementos físicos reales: estudiantes de una universidad, bloques de concreto de una pila, pernos de una remesa. Estas poblaciones se denominan poblaciones tangibles. Este tipo de poblaciones son siempre finitas.
Después de que se muestrea un elemento, el tamaño de población disminuye en 1. En principio, uno podría en algunos casos regresar el elemento muestreado a la población, con oportunidad de muestrearlo nuevamente, pero esto rara vez se hace en la práctica.
En ingeniería es frecuente que los datos sean producto de mediciones realizadas durante un experimento científico, más que por muestreo de una población tangible. Tomando un
ejemplo simple, imagine que un ingeniero mide la longitud de una varilla cinco veces, haciendo las mediciones en la forma más cuidadosa posible con condiciones idénticas. No importa
qué tan cuidadosamente se hayan hecho las mediciones, diferirán un poco una de otra, debido a la variación en el proceso de medición que no se puede controlar o predecir. Esto último
da como resultado que con frecuencia sea adecuado considerar estos datos como una muestra aleatoria simple de una población. En estos casos, la población consta de todos los valores que posiblemente pueden haber sido observados. Esta población se denomina población
conceptual, ya que no consta de elementos reales.
Una muestra aleatoria simple puede consistir de valores obtenidos en un proceso en
condiciones experimentales idénticas. En este caso, la muestra proviene de una población que consta de todos los valores posibles que se han observado. A este tipo
de población se le denomina población conceptual.
El ejemplo 1.5 implica una población conceptual.
Ejemplo
1.5
Un geólogo pesa una roca varias veces en una balanza analítica. Cada vez, la balanza da una
lectura ligeramente diferente. ¿Bajo qué condiciones se pueden considerar estas lecturas como una muestra aleatoria simple? ¿Cuál es la población?
Solución
Si las características físicas de la balanza permanecen iguales cada vez que se pesa, se puede
considerar que las mediciones se hacen bajo condiciones idénticas, entonces las lecturas se
pueden considerar como una muestra aleatoria simple. La población es conceptual. Consta de
todas las lecturas que la balanza en principio podría producir.
Observe que en el ejemplo 1.5, son las características físicas del proceso de medición
las que determinan si los datos constituyen una muestra aleatoria simple. En general, cuando
se decide si un conjunto de datos se puede considerar una muestra aleatoria simple, es muy
1.1
Muestreo
7
útil tener una comprensión del proceso que generó los datos. Algunas veces los métodos estadísticos pueden ayudar, especialmente cuando la muestra es grande, pero el conocimiento
del mecanismo que produjo los datos es más importante.
Ejemplo
1.6
Se ha diseñado un nuevo proceso químico que se supone tendrá una producción más alta de
cierta sustancia química que durante el proceso anterior. Para investigar los resultados de este proceso, lo realizamos 50 veces y registramos los 50 resultados. ¿Bajo qué condiciones sería razonable considerar lo anterior como una muestra aleatoria simple? Describa algunas
condiciones bajo las cuales puede no resultar adecuado considerar esto último como una
muestra aleatoria simple.
Solución
Para responder a esto, primero debemos especificar la población. La población es conceptual
y consta del conjunto de todos los resultados que se obtienen de este proceso, así como de las
veces que se realizó. Lo que hemos llevado a cabo es un muestreo de los 50 primeros resultados del proceso. Si y sólo si estamos seguros de que los primeros 50 resultados se han generado en condiciones idénticas y que no difieren en ninguna forma sistémica de los resultados
de futuras realizaciones, podremos tratarlos como una muestra aleatoria simple.
Sin embargo, sea cauteloso. Hay muchas condiciones por las que 50 resultados podrían
dejar de ser una muestra aleatoria simple. Por ejemplo, con procesos químicos, algunas veces
se da el caso de que realizaciones con resultados altos son seguidas de realizaciones con resultados bajos y viceversa. A veces los resultados tienden a aumentar con el tiempo, conforme los ingenieros de proceso aprenden por la experiencia cómo hacer funcionar el proceso de
manera más eficiente. En estos casos, los resultados no se han generado bajo las mismas condiciones y no constituyen una muestra aleatoria simple.
El ejemplo 1.6 muestra nuevamente que un buen conocimiento de la naturaleza del proceso en estudio es importante para determinar si los datos se pueden considerar como muestra aleatoria simple. Los métodos estadísticos algunas veces se usan para mostrar que un
conjunto de datos dado no representa necesariamente una muestra aleatoria simple. Por ejemplo, a veces las condiciones experimentales cambian gradualmente con el tiempo. Un método
simple, pero efectivo para detectar esta condición, es realizar una gráfica con las observaciones en el orden en que se tomaron. Una muestra aleatoria simple no debe mostrar ningún patrón o tendencia obvia.
La figura 1.1 presenta las gráficas de tres muestras en el orden en que se tomaron. La
gráfica de la figura 1.1a muestra un patrón oscilatorio. La gráfica en la figura 1.1b muestra
una tendencia creciente. Ninguna de estas muestras se debe tratar como muestra aleatoria simple. La gráfica en la figura 1.1c no parece mostrar ningún patrón o tendencia obvia. Podría ser
apropiado tratar estos datos como una muestra aleatoria simple. Sin embargo, antes de tomar
esa decisión, es aún importante pensar acerca del proceso que produjo estos datos, ya que puede haber cuestiones que no son evidentes en la gráfica (véase el ejemplo 1.7).
A veces la pregunta respecto de si un conjunto de datos es una muestra aleatoria simple, depende de la población en estudio. Se puede dar el caso para el cual una gráfica pueda
parecer buena, aun cuando los datos no sean una muestra aleatoria simple. En el ejemplo 1.7
se da un caso.
8
CAPÍTULO 1
0
10
20
30
40
Número de medición
a)
Muestreo y estadística descriptiva
50 0
10
20
30
40
Número de medición
b)
50
0
10
20
30
40
Número de medición
c)
50
FIGURA 1.1 Tres gráficas de valores observados contra el orden en que se hicieron. a) Los valores indican un patrón definido en el tiempo. Esta no es una muestra aleatoria simple. b) Los valores muestran una tendencia en el tiempo. Esta no
es una muestra aleatoria simple. c) Los valores no muestran un patrón o tendencia. Puede ser adecuado tratar estos datos como una muestra aleatoria simple.
Ejemplo
1.7
Un nuevo proceso químico se realiza diez veces cada mañana durante cinco días consecutivos. Una gráfica de los resultados en el orden en que aparecieron no presenta ningún patrón
o tendencia obvia. Si el nuevo proceso se pone en producción, haciéndolo funcionar diez horas todos los días, desde las 7 a.m. hasta las 5 p.m. ¿Es razonable considerar que los 50 resultados sean una muestra aleatoria simple? ¿Qué ocurre si el proceso está siempre funcionando
por la mañana?
Solución
Debido a que se intenta poner en funcionamiento el nuevo proceso tanto durante la mañana
como en la tarde, la población consta de todos los resultados que alguna vez se observarán,
incluyendo tanto las realizaciones por la mañana como por la tarde. La muestra se toma sólo
de la parte de la población de los resultados matutinos; por tanto, no es una muestra aleatoria
simple. Hay muchas cosas que podrían estar equivocadas si esto se usa como una muestra
aleatoria simple. Por ejemplo, las temperaturas ambientales pueden ser diferentes entre la mañana y la tarde, ello podría afectar los resultados.
Si el proceso funcionara sólo por la mañana, entonces la población constaría sólo de resultados matutinos. Debido a que la muestra no presenta ningún patrón o tendencia obvia,
bien podría ser apropiado considerarla como muestra aleatoria simple.
Independencia
Se dice que los elementos en una muestra son independientes si al conocer los valores de algunos de ellos no ayuda a predecir los valores de los otros. Con una población finita y tangible, los elementos en una muestra aleatoria simple no son estrictamente independientes, ya
que cuando se extrae cada elemento, la población cambia. Este cambio puede ser importante
cuando la población es pequeña. Sin embargo, cuando la población es muy grande, este cambio resulta insignificante y los elementos se pueden tratar como si fueran independientes.
1.1
Muestreo
9
Para ilustrar esta idea, imagine que se toma una muestra aleatoria simple de dos elementos de la población
0
0
1
1
Para la primera extracción, los números 0 y 1 son igualmente probables. Pero el valor del segundo elemento está evidentemente influido por el primero; si el primero es 0, es más probable que el segundo sea l y viceversa. Por tanto, los elementos de la muestra son dependientes.
Ahora suponga que sacamos una muestra de tamaño 2 de esta población:
Un millón 0 's
Un millón 1 's
Nuevamente en la primera extracción, los números 0 y 1 son igualmente probables. Pero a diferencia del ejemplo anterior, también estos dos valores permanecen casi de la misma manera
en la segunda extracción, sin que importe lo que sucede en la primera extracción. Con poblaciones grandes, los elementos de la muestra son para todos los propósitos prácticos independientes.
Es razonable preguntarse qué tan grande debe ser una población para que los elementos en una muestra aleatoria simple se traten como independientes. Una regla general señala
que cuando se toma una muestra de una población finita, los elementos se pueden tratar como independientes en tanto la muestra consista de 5% o menos de la población.
Curiosamente, es posible hacer que una población se comporte como si fuera infinitamente grande, reemplazando cada elemento después de que se ha muestreado. Este método
se denomina muestreo con reemplazo. Con este método la población es exactamente la misma en cada extracción y los elementos muestreados son realmente independientes.
Con una población conceptual, se requiere que los elementos de la muestra se produzcan en condiciones experimentales idénticas. En particular, ningún valor de muestra puede influir en las condiciones bajo las cuales se producen los otros. Por tanto, los elementos en una
muestra aleatoria simple de una población conceptual se pueden tratar como independientes.
Podemos pensar que una población conceptual es infinita, o de manera equivalente que los
elementos se muestrean con reemplazo.
Resumen
Los elementos en una muestra son independientes si el conocimiento de algunos
de los valores de los elementos no ayuda a predecir los valores de los otros.
Los elementos en una muestra aleatoria simple se pueden tratar como independientes en muchos casos que se encuentran en la práctica. Ocurre una excepción
cuando la población es finita y la muestra consiste de una parte importante (más
de 5%) de la población.
10
CAPÍTULO 1
Muestreo y estadística descriptiva
Otros métodos de muestreo
Además del muestreo aleatorio simple, existen otros métodos de muestreo que son útiles en
diversas situaciones. En el muestreo ponderado a algunos elementos se les da una mayor
oportunidad que a los otros para ser seleccionados, de la misma manera que en una lotería en
la que algunas personas tienen más boletos que otros. En el muestreo aleatorio estratificado, la población se divide en subpoblaciones, llamadas estratos y se extrae una muestra aleatoria simple de cada estrato. En el muestreo agrupado, los elementos se extraen de la población
en grupos o conglomerados. El muestreo agrupado es útil cuando la población es demasiado
grande y se encuentra extendida de tal forma que es posible tomar una muestra aleatoria simple. Por ejemplo, muchos de los organismos del gobierno estadounidense usan muestreo agrupado para muestrear a la población de los Estados Unidos para medir factores sociológicos,
como ingresos y número de desempleados. Una buena fuente de información acerca de métodos de muestreo es Cochran (1977).
El muestreo aleatorio simple no es el único método válido de muestreo aleatorio. Pero
es el más importante y se le prestará la mayor parte de la atención. Por el momento, a menos
que se indique otra cosa, se considerará que los términos “muestra” y “muestreo aleatorio”
significan “muestra aleatoria simple”.
Tipos de experimentos
Hay muchas clases de experimentos que se pueden usar para generar datos. Describiremos
brevemente algunos de ellos. En un experimento de una-muestra, hay sólo una población de
interés y se extrae únicamente una muestra de ésta. Por ejemplo, imagine que se ha diseñado
un proceso para producir polietileno que se usará para hacer tubos. En este contexto, un experimento mediante el cual se producen algunas muestras de polietileno y se mide la fuerza
de tensión de cada una constituye un experimento de una-muestra. Se considera que las fuerzas medidas representan una muestra aleatoria simple de una población conceptual de todas
las fuerzas posibles que se pueden observar en las muestras fabricadas por este proceso. Los
experimentos del tipo una-muestra se pueden usar para determinar si un proceso satisface
cierta norma; por ejemplo, si tienen la fuerza suficiente para una aplicación dada.
En un experimento de muestras-múltiples, hay dos o más poblaciones de interés y se
toma una muestra de cada población. Por ejemplo, si están compitiendo algunos procesos para ser considerados en la fabricación de polietileno y se miden las fuerzas de tensión en una
muestra de los elementos de cada proceso, se entiende que éste es un experimento de muestras-múltiples. A cada proceso le corresponde una población distinta y a las mediciones hechas sobre los elementos de un proceso dado se les considera una muestra aleatoria simple de
esa población. El propósito habitual de los experimentos de muestras-múltiples es hacer comparaciones entre las poblaciones. En este ejemplo, el propósito podría ser que se determine el
proceso que produce la mayor fuerza o que se determine si hay alguna diferencia en las fuerzas en el polietileno que se produjo mediante los diferentes procesos.
En muchos experimentos de muestras-múltiples, las poblaciones se distinguen entre sí
al cambiar uno o más factores que pueden afectar el resultado. A estos experimentos se les
llama experimentos factoriales. Por ejemplo, G. Fredrickson, en su tesis de maestría en la
Escuela de Minas, de Colorado, midió la dureza ante el impacto de la muesca Charpy V para
un importante número de soldaduras. Cada soldadura estaba hecha de uno de dos tipos de me-
1.1
Muestreo
11
tales base y se había medido su dureza a diferentes temperaturas. Éste fue un experimento factorial con dos factores: el metal base y la temperatura. Los datos consistían de varias mediciones de la dureza hechas con combinaciones del metal base y la temperatura. En un
experimento factorial, cada combinación de los factores para los cuales se recopilan datos define una población y se extrae una muestra aleatoria simple de cada población. El propósito
de un experimento factorial es determinar cómo afecta el resultado al cambiar los niveles de
los factores. En su experimento, Fredrickson encontró que para cada tipo de metal base, la dureza no es afectada por la temperatura a menos que esta última estuviese en un nivel muy bajo, debajo de ⫺100°C. Conforme la temperatura se reducía de ⫺100ºC a ⫺200°C, la dureza
bajaba uniformemente.
Tipos de datos
Cuando se asigna una cantidad numérica a cada elemento de una muestra, al conjunto de valores resultante se le llama numérico o cuantitativo. En algunos casos, los elementos de la
muestra son puestos en categorías. Entonces los datos son categóricos o cualitativos. En el
ejemplo 1.8 se presenta un caso.
Ejemplo
1.8
En el artículo “Hysteresis Behavior of CFT Column to H-Beam Connections with External TStiffeners and Penetrated Elements” (C. Kang, K. Shin y colaboradores, Engineering Structures, 2001:1194-1201) se reportaron los resultados de las pruebas de carga cíclicas en una
columna tubular llena de concreto (CFT) para conexiones soldadas de vigas-H. Se cargaron
algunos especímenes de prueba hasta que fallaron. Algunas fallas ocurrieron en la unión soldada; otras ocurrieron al doblarse la viga misma. Para cada muestra se registró la posición de
la falla, junto con el par de torsión aplicado en la falla [en kilonewton-metros (kN ⋅ m)]. Los
resultados para las primeras cinco muestras fueron los siguientes:
Muestra
Par de torsión
(kN . m)
Posición
de la falla
1
2
3
4
5
165
237
222
255
194
Soldadura
Viga
Viga
Viga
Soldadura
¿Qué datos son numéricos y cuáles categóricos?
Solución
Los pares de torsión, en la columna de en medio, son datos numéricos. Las posiciones de la
falla, en la columna de la derecha, son datos categóricos.
12
CAPÍTULO 1
Muestreo y estadística descriptiva
Ejercicios para la sección 1.1
1. Cada uno de los siguientes procesos implica el muestreo de
una población. Defina la población y diga si es tangible o
conceptual.
a) Se recibe una remesa de pernos de un distribuidor. Para
verificar si la remesa es aceptable respecto de la fuerza
de corte, un ingeniero selecciona diez pernos, uno tras
otro, del recipiente para probarlos.
b) La resistencia de cierto resistor se mide cinco veces con
el mismo óhmetro.
c) Un estudiante de posgrado que se especializa en ciencia
ambiental forma parte de un equipo de estudio que está
evaluando el riesgo para la salud humana de cierto contaminante presente en el agua de la llave en su pueblo.
Una parte del proceso de evaluación implica calcular la
cantidad de tiempo que las personas que viven en ese
pueblo está en contacto con el agua de la llave. El estudiante convence a los residentes del pueblo para que lleven una agenda mensual, detallando la cantidad de
tiempo que están en contacto con el agua de la llave día
con día.
d) Se hacen ocho soldaduras con el mismo proceso y se
mide la fuerza en cada una.
e) Un ingeniero responsable del control de calidad tiene
que calcular el porcentaje de piezas fabricadas defectuosas en determinado día. A las 2:30 de la tarde muestrea
las últimas 100 piezas fabricadas.
2. Si usted quisiera calcular la altura media de todos los estudiantes en una universidad, ¿cuál de las siguientes estrategias de muestreo sería la mejor? ¿Por qué? Observe que
ninguno de los métodos son realmente muestras aleatorias
simples.
i) Medir la estatura de 50 estudiantes que se encuentran en
el gimnasio durante el juego de basquetbol en la escuela.
ii) Medir la estatura de todos los especialistas en ingeniería.
iii) Medir la estatura de los estudiantes, eligiendo el primer
nombre de cada página de la guía telefónica del campus
universitario.
3. Verdadero o falso:
a) Una muestra aleatoria simple garantiza que refleja exactamente a la población de la que se extrajo.
b) Una muestra aleatoria simple está libre de cualquier tendencia sistémica en diferir de la población de la que se
extrajo.
4. Una ingeniera de control de calidad extrae una muestra
aleatoria simple de 50 anillos-O de un lote de varios miles.
Mide el espesor de cada uno y descubre que 45 de ellos,
90%, cumple con cierta especificación. ¿Cuál de los siguientes enunciados es correcto?
i) La proporción de anillos-O en el lote completo que
cumple con la especificación probablemente es igual a
90 por ciento.
ii) La proporción de anillos-O en el lote completo que
cumple con la especificación probablemente está cerca
de representar 90%, pero probablemente no es igual al
total.
5. Se ha usado durante mucho tiempo un proceso para la fabricación de botellas de plástico y se sabe que 10% de éstas se
encuentra defectuoso. Se está probando un nuevo proceso
que, se supone, reduce la proporción de defectos. En una
muestra aleatoria simple de 100 botellas producidas con el
nuevo proceso, diez estaban defectuosas.
a) Uno de los ingenieros sugiere que la prueba demuestra
que el nuevo proceso no es mejor que el proceso anterior, ya que la proporción de defectos es la misma. ¿Es
ésta una conclusión justificada? Explique.
b) Suponga que hubieran sido solamente nueve las botellas
defectuosas de la muestra de 100. ¿Esto habría probado
que el nuevo proceso es mejor? Explique.
c) ¿Qué resultado presenta pruebas más evidentes de que
el nuevo proceso es mejor: encontrar nueve botellas defectuosas en la muestra o encontrar dos botellas defectuosas en la muestra?
6. Con referencia al ejercicio 5. Verdadero o falso:
a) Si la proporción de defectos en la muestra es menor a
10%, es confiable concluir que el nuevo proceso es mejor.
b) Si la proporción de defectos en la muestra es sólo ligeramente menor a 10%, la diferencia bien podría ser completamente atribuible a la variación del muestreo y no es
confiable concluir que el nuevo proceso es mejor.
c) Si la proporción de defectos en la muestra es mucho menor a 10%, es muy poco probable que la diferencia sea
atribuible completamente a la variación del muestreo,
por lo que es confiable llegar a la conclusión de que el
nuevo proceso es mejor.
d) No importa qué tan pocos defectos aparezcan en la
muestra, el resultado bien podría ser completamente
atribuible a la variación del muestreo, por lo que no es
confiable concluir que el nuevo proceso es mejor.
7. Para determinar si una muestra se debe tratar como una
muestra aleatoria simple, ¿qué es más importante: un buen
conocimiento de la estadística o un buen conocimiento del
proceso que produce los datos?
1.2
1.2
13
Resumen estadístico
Resumen estadístico
Con frecuencia una muestra constituye una larga lista de números. Para ayudar a que las características de una muestra sean evidentes, se calcula el resumen estadístico. Las dos cantidades más usadas en el resumen estadístico son la media de la muestra y la desviación
estándar de la muestra. La primera indica el centro de los datos y la segunda señala cómo
están distribuidos los datos.
Media muestral
La media muestral también se llama “media aritmética”, o, simplemente, “promedio”. Representa la suma de los números en la muestra, dividido entre la cantidad total de números que hay.
Definición
Sea Xl, . . . , Xn una muestra. La media muestral es
n
X=
1
Xi
n i=1
(1.1)
—
Observe que se acostumbra usar una letra con una barra encima de ésta (por ejemplo X ) para denotar la media de una muestra. También observe que la media muestral tiene las mismas
unidades que los valores de la muestra Xl, . . . , Xn.
Ejemplo
1.9
Una muestra aleatoria simple de cinco hombres se elige de entre una gran población de hombres y se mide su estatura. Las cinco cifras de estatura (en pulgadas) son 65.51, 72.30, 68.31,
67.05 y 70.68. Encuentre la media muestral.
Solución
Usamos la ecuación (1.1). La media muestral es
X=
1
(65.51 + 72.30 + 68.31 + 67.05 + 70.68) = 68.77 pulgadas.
5
Desviación estándar
He aquí dos series de datos: 28, 29, 30, 31, 32 y 10, 20, 30, 40, 50. Ambas tienen la misma
media de 30. Pero obviamente difieren en una manera importante que no es captada por la media: la segunda serie es mucho más dispersa que la primera. La desviación estándar es una
cantidad que mide el grado de dispersión en una muestra.
Sea Xl, . . . , Xn una muestra. La idea básica detrás de la desviación estándar es que cuando la dispersión es grande, los valores de la muestra tenderán a alejarse de su media, pero
14
CAPÍTULO 1
Muestreo y estadística descriptiva
cuando la dispersión es pequeña, los valores tenderán a acercarse a su media. En este contexto, el primer paso en el cálculo de la desviación estándar es calcular las distancias (también
llamadas desviaciones) de cada valor de la muestra a la media de la muestra. Las desviacio—
—
nes son (X1 ⫺ X ), . . . , (Xn ⫺ X ). Ahora algunas de estas desviaciones son positivas y otras
negativas. Las desviaciones grandes, tanto negativas como positivas, son indicadores de la
dispersión. Para hacer todas las desviaciones positivas se elevan al cuadrado, con lo que se
—
—
obtienen las desviaciones al cuadrado (X1 ⫺ X )2, . . . , (Xn ⫺ X )2. A partir de las desviaciones al cuadrado se puede calcular una medida de la dispersión llamada la varianza muestral.
Ésta constituye el promedio de las desviaciones al cuadrado, excepto que lo dividimos entre n ⫺ 1 en lugar de n. Se acostumbra denotar a la varianza muestral con s2.
Definición
Sea Xl, . . . , Xn una muestra. La varianza muestral es la cantidad
n
1
s2 =
(Xi − X)2
n − 1 i=1
Una fórmula equivalente, que puede ser más fácil de calcular, es
n
1
2
2
2
s =
X − nX
n − 1 i=1 i
(1.2)
(1.3)
Mientras que la varianza muestral es una cantidad importante, tiene una seria desventaja
como una medida de la dispersión. Sus unidades no son las mismas que las unidades de los valores de la muestra; éstas tienen unidades al cuadrado. Para obtener una medida de la dispersión
cuyas unidades sean las mismas que las de los valores de la muestra, simplemente se toma la
raíz cuadrada de la varianza. Esta cantidad se denomina desviación estándar muestral. Se
acostumbra denotar a la desviación estándar muestral por la letra s (la raíz cuadrada de s2).
Definición
Sea Xl, . . . , Xn una muestra. La desviación estándar muestral es la cantidad
n
1
s=
(Xi − X)2
n − 1 i=1
Una fórmula equivalente, que puede ser más fácil de calcular, es
n
1
2
s=
X 2 − nX
n − 1 i=1 i
(1.4)
(1.5)
La desviación estándar muestral constituye la raíz cuadrada de la varianza muestral.
1.2
Resumen estadístico
15
Es natural preguntarse por qué la suma de las desviaciones al cuadrado se divide entre
n ⫺ 1 en lugar de n. El propósito de calcular la desviación estándar muestral es calcular la
cantidad de la dispersión en la población de la cual se extrajo aquélla. Por tanto, idealmente
se calcularían las desviaciones de la media de todos los elementos de la población, en vez de
las desviaciones de la media de la muestra. Sin embargo, la media de la población generalmente no se conoce, por lo que en su lugar se usa la media de la muestra. Es un hecho matemático que las desviaciones alrededor de la media muestral tienden a ser un poco más
pequeñas que las desviaciones alrededor de la media poblacional y que al dividir entre n ⫺ 1
en vez de n proporciona la rectificación correcta.
Ejemplo
1.10
Encuentre la varianza muestral y la desviación estándar muestral para los datos de las estaturas del ejemplo 1.9.
Solución
—
Primero se calculará la varianza muestral usando la ecuación (1.2). La media muestral es X ⫽
68.77 (véase el ejemplo 1.9). La varianza muestral es, por tanto,
s2 =
1
[(65.51 − 68.77)2 + (72.30 − 68.77)2 + (68.31 − 68.77)2
4
+ (67.05 − 68.77)2 + (70.68 − 68.77)2 ] = 7.47665
Por otra parte, se puede usar la ecuación (1.3):
s2 =
1
[65.512 + 72.302 + 68.312 + 67.052 + 70.682 − 5(68.772 )] = 7.47665
4
La desviación estándar muestral es la raíz cuadrada de la varianza muestral:
√
s = 7.47665 = 2.73
¿Qué le pasaría a la media, a la varianza y a la desviación estándar muestrales si la estatura de los estudiantes en el ejemplo 1.9 fuera medida en centímetros en vez de pulgadas?
Denotemos la estatura en pulgadas por Xl, X2, X3, X4, X5 y la estatura en centímetros por Yl,
Y2, Y3, Y4, Y5. Entonces, la relación entre las Xi y las Yi está dada por Yi ⫽ 2.54 Xi. Si regresa
al ejemplo 1.9, convierte a centímetros y calcula la media muestral, encontrará que las medias
—
—
de la muestra en centímetros y en pulgadas están relacionadas por la ecuación Y ⫽ 2.54 X .
Por consiguiente, si multiplicamos cada elemento de la muestra por una constante, la media
de la muestra se multiplica por la misma constante. En cuanto a la varianza de la muestra, se
—
—
encontrará que las desviaciones están relacionadas por la ecuación (Yi ⫺ Y ) ⫽ 2.54 (Xi ⫺ X ).
Por tanto, sY2 ⫽ 2.542sX2 y sY ⫽ 2.54sX.
¿Qué sucede si cada hombre en la muestra utilizó zapatos que elevaron su estatura dos
pulgadas? Entonces cada estatura de la muestra aumenta dos pulgadas y la media de la muestra también en esa proporción. En general, si se agrega una constante a cada elemento de la
muestra, la media de la muestra aumenta (o disminuye) en la misma constante. Sin embargo,
las desviaciones no cambian, por lo que la varianza y la desviación estándar de la muestra no
se ven afectadas.
16
CAPÍTULO 1
Muestreo y estadística descriptiva
Resumen
Si Xl, . . . , Xn es una muestra y Yi ⫽ a ⫹ bXi, donde a y b son constantes, entonces
—
Y ⫽ a ⫹ bX .
Si Xl, . . . , Xn es una muestra y Yi ⫽ a ⫹ bXi, donde a y b son constantes, entonces
sY2 ⫽ b2sX2 , y sY ⫽ |b|sX.
—
Datos atípicos
A veces una muestra puede contener algunos puntos que son mucho más grandes o pequeños
que el resto. Estos puntos se llaman datos atípicos. Véase la figura 1.2 como ejemplo. A veces los datos atípicos son resultado de errores al ingresar datos; por ejemplo, un punto decimal perdido puede dar como resultado un valor que es de un orden de magnitud diferente del
resto. Los datos atípicos se deben examinar siempre y cualquiera de ellos que se encuentre es
resultado de un error que se debe corregir o eliminar. Aunque no todos los datos atípicos son
errores. A veces una población podría contener algunos valores que son muy diferentes del
resto y los datos atípicos en la muestra reflejan este hecho.
Atípico
FIGURA 1.2 Conjunto de datos que contiene un dato atípico.
Los datos atípicos representan un verdadero problema para los analistas de datos. Como consecuencia de lo anterior, cuando las personas ven datos atípicos en sus datos, tratan de
encontrar una razón o un pretexto para eliminarlos. Sin embargo, un dato atípico no se debe
eliminar, a menos que se tenga la seguridad de que es resultado de un error. Cabe señalar que,
si una población realmente contiene datos atípicos y son eliminados de la muestra, esta última no caracterizará correctamente a la población.
Mediana muestral
La mediana, al igual que la media, representa una medida de tendencia central de los datos.
Para calcular la mediana de una muestra, ordene los valores del más pequeño al más grande.
La mediana es el número de en medio. Si el tamaño de la muestra es un número par, se acostumbra tomar a la mediana muestral como el promedio de los dos números de en medio.
Definición
Si n números están ordenados del más pequeño al más grande:
n—
⫹
1.
Si n es impar, la mediana muestral es el número en la posición —
——
2
Si n es par, la mediana muestral representa el promedio de los números en las
n y—
n ⫹ 1.
posiciones —
2
2
1.2
Ejemplo
1.11
Resumen estadístico
17
Encuentre la mediana muestral para los datos de la estatura en el ejemplo 1.9.
Solución
Las cifras de los cinco casos de estatura, en orden creciente, son 65.51, 67.05, 68.31, 70.68,
72.30. La mediana muestral es el número de en medio, que es 68.31.
La mediana se usa con frecuencia como una medida de tendencia central para muestras
que contienen datos atípicos. Con el propósito de saber por qué, considere que la muestra
consta de los valores 1, 2, 3, 4 y 20. La media es 6 y la mediana es 3. Es razonable pensar que
la mediana es más representativa de la muestra que la media. Véase la figura 1.3.
Mediana Media
FIGURA 1.3 Cuando una muestra contiene datos atípicos, la mediana podría ser más
representativa de la muestra que la media.
La media recortada
De la misma manera que la mediana, la media recortada es una medida de tendencia central
que se diseñó para que no esté afectada por datos atípicos. La media recortada se calcula al
arreglar los valores de la muestra en orden, “recortar” un número igual a partir de cada extremo y calcular la media de los restantes. Si se “recorta” el p% de los datos de cada extremo,
la media recortada resultante se denomina “media recortada un p%”. No existe fórmula ni fácil ni difícil para saber cuántos valores se deben recortar. Las más comunes son las medias
recortadas al 5, 10 y 20%. Observe que la mediana se puede pensar como una forma extrema
de la media recortada, obtenida de recortar todo, excepto uno o dos valores de en medio de la
muestra.
Debido a que el número de puntos de datos recortados debe ser un número entero, en
muchos casos es imposible recortar los porcentajes exactos que se piden de los datos. Si el tamaño muestral se denota por n y se desea recortar un p%, el número de datos a ser recortados es np/100. Si éste no es un número entero, lo más sencillo que se debe hacer cuando se
calcula manualmente es redondear al número entero más cercano y recortar esa cantidad.
Ejemplo
1.12
En el artículo “Evaluation of Low-Temperature Properties of HMA Mixtures” (P. Sebaaly, A.
Lake y J. Epps, en Journal of Transportation Engineering, 2002:578-583) se midieron los siguientes valores de la tensión de fractura (en megapascales) para una muestra de 24 mezclas
de asfalto mezclado caliente (HMA).
30
75
79
80
80
105
126
138
149
179
179
191
223
232
232
236
240
242
245
247
254
274
384
470
18
CAPÍTULO 1
Muestreo y estadística descriptiva
Calcule la media, mediana y las medias recortadas a 5, 10 y 20 por ciento.
Solución
La media se encuentra promediando los 24 números, con base en ello se obtiene un valor de
195.42. La mediana es el promedio del 12avo. y 13avo. números, que es (191 ⫹ 223)/2 ⫽
207.00. Para calcular la media recortada a 5%, debemos eliminar 5% de los datos de cada extremo. Se obtienen (0.05)(24 ) ⫽ 1.2 observaciones. Redondeamos 1.2 a 1 y recortamos una
observación de cada extremo. La media recortada a 5% constituye el promedio de los 22 números restantes:
75 + 79 + · · · + 274 + 384
= 190.45
22
Para calcular la media recortada a 10%, redondee (0.1)(24) ⫽ 2.4 a 2. Elimine dos observaciones de cada extremo y después determine el promedio de las 20 restantes:
79 + 80 + · · · + 254 + 274
= 186.55
20
Para calcular la media recortada a 20%, redondee (0.2)(24) ⫽ 4.8 a 5. Elimine cinco observaciones de cada extremo y después determine el promedio de las 14 restantes:
105 + 126 + · · · + 242 + 245
= 194.07
14
La moda y el rango
La moda y el rango son resúmenes estadísticos de uso limitado, pero que en ocasiones se
aprecian visualmente. La moda muestral es el valor que tiene más frecuencia en una muestra.
Si algunos valores tienen una frecuencia igual, cada uno representa una moda. El rango es la
diferencia entre los valores más grandes y más pequeños en una muestra. Es una medida de
la dispersión, pero rara vez se usa, porque depende solamente de los dos valores extremos y
no proporciona ninguna información acerca del resto de la muestra.
Ejemplo
1.13
Encuentre las modas y el rango para la muestra del ejemplo 1.12.
Solución
Hay tres modas: 80, 179 y 232. Cada uno de estos valores aparece dos veces y ningún otro
valor aparece más de una vez. El rango es 470 ⫺ 30 ⫽ 440.
Cuartiles
La mediana divide la muestra a la mitad. Los cuartiles la dividen tanto como sea posible en
cuartos. Una muestra tiene tres de aquéllos. Existen diferentes formas de calcular cuartiles, pero todas dan aproximadamente el mismo resultado. El método más simple cuando se calcula
1.2
Resumen estadístico
19
manualmente es el siguiente: Sea n el tamaño de la muestra. Ordene los valores de la muestra
del más pequeño al más grande. Para encontrar el primer cuartil, calcule el valor 0.25(n ⫹ 1).
Si éste es un entero, entonces el valor de la muestra en esa posición es el primer cuartil. Si no,
tome entonces el promedio de los valores de la muestra de cualquier lado de este valor. El tercer cuartil se calcula de la misma manera, excepto que se usa el valor 0.75(n ⫹ 1). El segundo cuartil usa el valor 0.5(n ⫹ 1). El segundo cuartil es idéntico a la mediana. Observe que
algunos software usan métodos ligeramente diferentes para calcular cuartiles, por lo que sus
resultados no pueden ser exactamente los mismos que los obtenidos por el método que aquí
se describió.
Ejemplo
1.14
Encuentre el primer y tercer cuartil de los datos que se refieren al asfalto en el ejemplo 1.12.
Solución
El tamaño de la muestra es n ⫽ 24. Para encontrar el primer cuartil, calcule (0.25)(25) ⫽ 6.25.
Por tanto, el primer cuartil se encuentra determinando el promedio del 6o. y 7o. puntos de datos, cuando la muestra se arregla en orden creciente. Se obtiene (105 ⫹ 126)/2 ⫽ 115.5. Para encontrar el tercer cuartil, calcule (0.75)(25) ⫽ 18.75. Promediamos los puntos de los datos
18avo. y 19avo., con lo que se obtiene (242 ⫹ 245)/2 ⫽ 243.5.
Percentiles
El p-ésimo percentil de una muestra, para un número p entre 0 y 100, divide a la muestra tanto como sea posible, el p% de los valores de la muestra es menor que el p-ésimo percentil y
el (100 ⫺ p)% son mayores. Hay muchas maneras para calcular los percentiles; con todas se
obtienen resultados similares. Aquí se describe un método similar al método descrito para calcular cuartiles. Ordene los valores de la muestra del más pequeño al más grande y después
calcule la cantidad (p/100)(n ⫹ 1), donde n es el tamaño de la muestra. Si esta cantidad es un
entero, el valor de la muestra en esta posición es el p-ésimo percentil. Por otro lado, promedie los dos valores de la muestra en cualquier lado. Observe que el primer cuartil es el 25avo.
percentil, la mediana es el 50avo. percentil y el tercer cuartil es el 75avo. percentil. Algunos
software usan métodos ligeramente diferentes para el cálculo de los percentiles, así que sus
resultados podrían ser un poco diferentes de los obtenidos por este método.
Los percentiles con frecuencia se usan para interpretar puntajes de exámenes estandarizados. Por ejemplo, si a una estudiante se le informa que su puntaje en un examen de ingreso a la universidad está en el 64avo. percentil, esto significa que 64% de los estudiantes que
presentaron el examen obtuvo puntajes inferiores.
Ejemplo
1.15
Encuentre el 65avo. percentil de los datos del caso de asfalto en el ejemplo 1.12.
Solución
El tamaño de la muestra es n ⫽ 24. Para encontrar el 65avo. percentil, calcule (0.65)(25) ⫽ 16.25.
Por tanto, el 65avo. percentil se encuentra al determinar el promedio del 16avo. y 17avo. puntos
de datos, cuando la muestra se arregla en orden creciente. Se obtiene (236 ⫹ 240)/2 ⫽ 238.
20
CAPÍTULO 1
Muestreo y estadística descriptiva
En la práctica, con frecuencia un resumen estadístico como se ha descrito aquí se calcula en computadora, usando un software estadístico. El resumen estadístico de datos se conoce como estadística descriptiva porque describe los datos. Presentamos un ejemplo del
cálculo del resumen estadístico del software MINITAB. Después mostraremos cómo se pueden usar estas estadísticas para descubrir algunas características importantes de los datos.
Para su tesis doctoral, J. Yanowitz, de la Escuela de Minas, de Colorado, investigó los
factores que afectan las emisiones de un vehículo diesel, obtuvo datos acerca de la emisión
de partículas (EP) para una muestra de 138 vehículos conducidos en bajas altitudes (cerca del
nivel del mar) y para una muestra de 62 vehículos conducidos a grandes altitudes (aproximadamente a una milla del nivel del mar). Todos los vehículos se fabricaron entre 1991 y 1996.
Las muestras contenían proporciones parecidas de vehículos de bajo y alto kilometraje. Los
datos, en unidades de gramos de partículas por galón de combustible consumido, se presentan en las tablas 1.1 y 1.2. A grandes altitudes, la presión barométrica es más baja, así la razón de eficiencia aire/combustible también es más baja. Por esta razón se pensó que la
emisión de partículas podría ser mayor a grandes a altitudes. Nos gustaría comparar las muestras para determinar si los datos apoyan este supuesto. Es difícil hacer esto con sólo examinar los datos de las tablas. Calcular el resumen estadístico de los datos hace el trabajo mucho
más fácil. La figura 1.4 presenta el cálculo con MINITAB de este resumen estadístico para
ambas muestras.
TABLA 1.1 Emisión de partículas (EP) (en g/gal) para 138 vehículos conducidos a altitud baja
1.50
0.87
1.12
1.25
3.46
1.11
1.12
0.88
1.29
0.94
0.64
1.31
2.49
1.48
1.06
1.11
2.15
0.86
1.81
1.47
1.24
1.63
2.14
6.64
4.04
2.48
2.98
7.39
2.66
11.00
4.57
4.38
0.87
1.10
1.11
0.61
1.46
0.97
0.90
1.40
1.37
1.81
1.14
1.63
3.67
0.55
2.67
2.63
3.03
1.23
1.04
1.63
3.12
2.37
2.12
2.68
1.17
3.34
3.79
1.28
2.10
6.55
1.18
3.06
0.48
0.25
0.53
3.36
3.47
2.74
1.88
5.94
4.24
3.52
3.59
3.10
3.33
4.58
6.73
7.82
4.59
5.12
5.67
4.07
4.01
2.72
3.24
5.79
3.59
3.48
2.96
5.30
3.93
3.52
2.96
3.12
1.07
5.30
5.16
7.74
5.41
3.40
4.97
11.23
9.30
6.50
4.62
5.45
4.93
6.05
5.82
10.19
3.62
2.67
2.75
8.92
9.93
6.96
5.78
9.14
10.63
8.23
6.83
5.60
5.41
6.70
5.93
4.51
9.04
7.71
7.21
4.67
4.49
4.63
2.80
2.16
2.97
3.90
TABLA 1.2 Emisión de partículas (EP) (en g/gal) para 62 vehículos conducidos a gran altitud
7.59
6.28
6.07
5.23
5.54
3.46
2.44
3.01
13.63
13.02
23.38
9.24
3.22
2.06
4.04
17.11
12.26
19.91
8.50
7.81
7.18
6.95
18.64
7.10
6.04
5.66
8.86
4.40
3.57
4.35
3.84
2.37
3.81
5.32
5.84
2.89
4.68
1.85
9.14
8.67
9.52
2.68
10.14
9.20
7.31
2.09
6.32
6.53
6.32
2.01
5.91
5.60
5.61
1.50
6.46
5.29
5.64
2.07
1.11
3.32
1.83
7.56
1.2
21
Resumen estadístico
Descriptive Statistics: LowAltitude, HiAltitude
Variable
N
Mean
SE Mean
TrMean
StDev
LoAltitude
138
3.715
0.218
3.526
2.558
HiAltitude
62
6.596
0.574
6.118
4.519
Minimum
Q1
Median
Q3
Maximum
LoAltitude
0.250
1.468
3.180
5.300
11.230
HiAltitude
1.110
3.425
5.750
7.983
23.380
Variable
FIGURA 1.4 Resultados arrojados por MINITAB que presenta la estadística descriptiva
para los datos de EP de las tablas 1.1 y 1.2.
En la figura 1.4, la letra “N” denota el tamaño muestral. Enseguida está la media muestral. La siguiente cantidad (SE Mean) es el error estándar de la media. Este último es igual
a la desviación estándar dividido entre la raíz cuadrada del tamaño muestral. Ésta es una cantidad que no se usa mucho como una estadística descriptiva, aunque es muy importante en
aplicaciones como la construcción de intervalos de confianza y pruebas de hipótesis, que se
presentarán en los capítulos 5 y 6. Enseguida del error estándar de la media está la media recortada al 5% (TrMean) y la desviación estándar. Por último, en el segundo bloque de resultados se proporciona el mínimo, mediano y máximo, así como el primer y tercer cuartiles (Ql
y Q3). Se observa que los valores de los cuartiles producidos por el software son ligeramente diferentes de los valores que se calcularían con los métodos que hemos descrito. Esto no es
sorprendente, debido a que hay diferentes maneras de calcular estos valores. Las diferencias
no son lo suficientemente grandes para que tengan alguna importancia práctica.
El resumen estadístico indica muchas diferencias en las emisiones de EP entre los vehículos de gran y baja altura. Primero, observe que la media es efectivamente más grande para vehículos a gran altura que para vehículos de baja altura (6.60 contra 3.71), lo que apoya
la hipótesis de que las emisiones tienden a ser mayores a grandes altitudes. Ahora observe que
el valor máximo para vehículos en grandes altitudes (23.38) es mucho más grande que el valor máximo para vehículos a baja altitud (11.23). Esto muestra que hay uno o más vehículos
a grandes altitudes, cuyas emisiones son mayores que la más alta de los vehículos de bajas altitudes. ¿La diferencia en las medias de las emisiones podía ser atribuible totalmente a estos
vehículos? Para contestar esto, compare las medianas, el primero y el tercer cuartil y la media recortada. Estos estadísticos no están muy afectados por algunos valores grandes, todos
son notablemente más grandes para los vehículos a grandes altitudes. Por tanto, podemos concluir que los vehículos a grandes altitudes no sólo tienen emisiones muy grandes, también en
general tienen emisiones más grandes que los vehículos a baja altitud. Por último, observe que
la desviación estándar es más grande para vehículos a grandes altitudes, lo que indica que los
valores para vehículos a grandes altitudes están más dispersos que los de los vehículos a bajas altitudes. Al menos algo de la diferencia en la dispersión se debe a uno o más vehículos a
gran altitud con emisiones muy altas.
22
CAPÍTULO 1
Muestreo y estadística descriptiva
Resumen estadístico para datos categórico
Con datos categóricos, a cada elemento de la muestra se le asigna una categoría en lugar de
un valor numérico. Es necesario trabajar con datos categóricos y resúmenes numéricos. Los
dos más comunes son las frecuencias y las proporciones muestrales (algunas veces llamadas frecuencias relativas). La frecuencia para una categoría dada es sólo el número de elementos de la muestra que cae dentro de esa categoría. La proporción muestral es la frecuencia
dividida entre el tamaño de la muestra.
Ejemplo
1.16
Un proceso fabrica cojinetes de cigüeñal para un motor de combustión interna. Los cojinetes,
cuyo espesor está entre 1.486 y 1.490 mm, se clasifican para ajustar, ello significa que satisfacen la especificación. Los cojinetes más gruesos se rectifican y los más angostos se descartan. En una muestra de mil cojinetes, 910 se ajustaron, 53 se rectificaron y 37 se descartaron.
Encuentre las frecuencias y las proporciones muestrales.
Solución
Las frecuencias son 910, 53 y 37. Las proporciones muestrales son 910/1 000 ⫽ 0.910,
53/1 000 ⫽ 0.053 y 37/1 000 ⫽ 0.037.
Estadística muestral y parámetros poblacionales
Cada uno de los estadísticos de la muestra que hemos analizado tiene una contraparte en la
población. Esto es fácil de ver cuando la población es finita. Por ejemplo, para una población
finita de valores numéricos, la media de la población es sólo el promedio de todos los valores de la población; la mediana es el valor de en medio, o el promedio de los dos valores de
en medio, y así sucesivamente. En efecto, cualquier resumen numérico que se usa para una
muestra se puede usar para una población finita, con sólo aplicar los métodos de cálculo a los
valores de la población en lugar de a los valores de la muestra. Existe una pequeña excepción
para la varianza de la población cuando se divide entre n en lugar de n ⫺1. Existe una diferencia en la terminología que se usa para los resúmenes numéricos de las poblaciones con la
que se usan para las muestras. Los resúmenes numéricos de una muestra se llaman estadísticos, mientras que los resúmenes numéricos de una población se llaman parámetros. Por supuesto, en la práctica, nunca se observa toda la población por lo que los parámetros de
población no se pueden calcular directamente. En cambio, los estadísticos de la muestra se
usan para calcular los valores de los parámetros de la población.
Los métodos para calcular los estadísticos de la muestra requieren que la muestra sea
finita. Por tanto, cuando una población contiene un número infinito de valores, los métodos
para calcular los estadísticos de una muestra no se pueden aplicar para calcular los parámetros de una población. Para poblaciones infinitas, los parámetros como la media y la varianza se calculan con procedimientos que generalizan los métodos usados para calcular las
estadísticas de una muestra y que implican sumas infinitas o integrales. Describiremos estos
procedimientos en el capítulo 2.
1.2
Resumen estadístico
23
Resumen
Un resumen numérico de una muestra se llama estadístico.
Un resumen numérico de una población se llama parámetro.
Con frecuencia los estadísticos se usan para estimar los parámetros.
Ejercicios para la sección 1.2
1. Verdadero o falso: para cualquier lista de números, la mitad
de ellos estará debajo de la media.
2. ¿Es la media de la muestra siempre el valor que ocurre con
más frecuencia? Si es así, explique por qué. Si no, dé un
ejemplo.
3. ¿Es la media de la muestra siempre igual a uno de los valores que está en la muestra? Si es así, explique por qué. Si
no, dé un ejemplo.
4. ¿La mediana de la muestra siempre es igual a uno de los valores de la muestra? Si es así, explique por qué. Si no, dé un
ejemplo.
5. Encuentre un tamaño de la muestra para el cual la mediana
siempre sea igual a uno de los valores en la muestra.
6. En cierta compañía, cada trabajador recibió un aumento de
$50 por semana. ¿Cómo afecta esto la media de los sueldos? ¿Y la desviación estándar de los sueldos?
a) Encuentre la media de la muestra de los puntajes de
Apgar.
b) Encuentre la desviación estándar de la muestra de los
puntajes de Apgar.
c) Encuentre la mediana muestral de los puntajes de
Apgar.
d) ¿Cuál es el primer cuartil de los puntajes?
e) ¿Qué proporción de puntajes es más grande que la media?
f) ¿Qué proporción de puntaje es mayor en una desviación
estándar que la media?
g) ¿Qué proporción de puntaje está dentro de una desviación estándar de la media?
9. Una clase de estadística con 40 estudiantes realizó una
prueba. El puntaje posible más alto era de cuatro puntos.
Diez estudiantes obtuvieron cuatro puntos, 12 lograron tres
puntos, ocho alcanzaron dos puntos, seis se beneficiaron
con un punto y cuatro obtuvieron cero puntos. Calcule la
media, la mediana y la desviación estándar de los puntajes.
7. En otra compañía, cada trabajador recibió un aumento de
5%. ¿Cómo afecta esto la media de los sueldos? ¿Y la desviación estándar de los sueldos?
10. Otra clase de estadística de 60 estudiantes realizó la misma
prueba. En este clase, 15 estudiantes obtuvieron cuatro puntos, 18 alcanzaron tres puntos, 12 lograron dos puntos, nueve obtuvieron un punto y seis resultaron con cero puntos.
Calcule la media, la mediana y la desviación estándar de los
puntajes.
8. El puntaje de Apgar se usa para evaluar reflejos y respuestas de recién nacidos. A cada bebé un profesional de la medicina le asigna un puntaje y los valores posibles son
enteros entre cero y diez. Se toma una muestra de mil bebés
nacidos en cierto condado y el número con cada puntaje es
el siguiente:
11. En otra clase de estadística, el número total de estudiantes no
se conoce. En esta clase, 25% obtuvo cuatro puntos, 30% alcanzó tres puntos, 20% se benefició con dos puntos, 15% logró un punto y 10% resultó con cero puntos.
Puntaje
Puntaje 0 1 2 3 4 5 6
7
8
9 10
Número 1 3 2 4 25 35 198 367 216 131 18
Número
de bebés
a) ¿Es posible calcular la media de los puntajes para esta
clase? Si es así, calcúlela. Si no, explique por qué.
b) ¿Es posible calcular la mediana de los puntajes para esta
clase? Si es así, calcúlela. Si no, explique por qué.
c) ¿Es posible calcular la desviación estándar de la muestra de los puntajes para esta clase? Si es así, calcúlela. Si
no, explique por qué.
24
CAPÍTULO 1
Muestreo y estadística descriptiva
12. Cada uno de los 16 estudiantes mide la circunferencia de
una pelota de tenis por cuatro métodos diferentes, éstos fueron:
g) Sin que nada cambie ¿es preferible un método de medición que tenga una desviación estándar más pequeña o
uno con una desviación estándar más grande? ¿O no importa? Explique.
Método A: Estimar la circunferencia a simple vista.
Método B: Medir el diámetro con una regla y después calcular la circunferencia.
Método C: Medir la circunferencia con una regla y cuerda.
Método D: Medir la circunferencia haciendo rodar la pelota a lo largo de una regla.
Los resultados (en cm) son los siguientes, en orden creciente para cada método:
Método A: 18.0, 18.0, 18.0, 20.0, 22.0, 22.0, 22.5, 23.0,
24.0, 24.0, 25.0, 25.0, 25.0, 25.0, 26.0, 26.4.
Método B: 18.8, 18.9, 18.9, 19.6, 20.1, 20.4, 20.4, 20.4,
20.4, 20.5, 21.2, 22.0, 22.0, 22.0, 22.0, 23.6.
Método C: 20.2, 20.5, 20.5, 20.7, 20.8, 20.9, 21.0, 21.0,
21.0, 21.0, 21.0, 21.5, 21.5, 21.5, 21.5, 21.6.
Método D: 20.0, 20.0, 20.0, 20.0, 20.2, 20.5, 20.5, 20.7,
20.7, 20.7, 21.0, 21.1, 21.5, 21.6, 22.1, 22.3.
a) Calcule la media de las mediciones para cada método.
b) Calcule la mediana de las mediciones para cada método.
c) Calcule la media recortada a 20% de las mediciones para cada método.
d) Calcule el primero y el tercer cuartil para cada método.
e) Calcule la desviación estándar de las mediciones para
cada método.
f) ¿En qué método es la desviación estándar más grande?
¿Por qué se esperaría que este método tenga la desviación estándar más grande?
13. Con referencia al ejercicio 12.
a) Si las mediciones para uno de los métodos se convirtieran a pulgadas (1 pulgada ⫽ 2.54 cm), ¿cómo afectaría
esto la media? ¿Y la mediana? ¿Y los cuartiles? ¿Y la
desviación estándar?
b) Si los estudiantes midieran nuevamente la pelota, usando una regla marcada en pulgadas, ¿los efectos sobre la
media, la mediana, los cuartiles y la desviación estándar
serían los mismos que los del inciso a)? Explique.
14. Una lista de diez números tiene una media de 20, una mediana de 18 y una desviación estándar de 5. El número más
grande en la lista es 39.27. Accidentalmente, este número se
cambia a 392.7.
a) ¿Cuál es el valor de la media después del cambio?
b) ¿Cuál es el valor de la mediana después del cambio?
c) ¿Cuál es el valor de la desviación estándar después del
cambio?
15. ¿Por qué nadie habla del cuarto cuartil? ¿O lo hacen?
16. En cada uno de los siguientes conjuntos de datos, diga si el
dato atípico parece ser atribuible a un error, o si se podría
suponer que es correcto.
a) Una roca se pesa cinco veces. Las lecturas en gramos
son 48.5, 47.2, 4.91, 49.5, 46.3.
b) Un sociólogo muestrea cinco familias en cierto pueblo y
registra sus ingresos anuales. Los ingresos son $34 000,
$57 000, $13 000, $12 00 000, $62 000.
1.3
1.3
Resúmenes gráficos
25
Resúmenes gráficos
Diagramas de tallo y hoja
La media, mediana y la desviación estándar son resúmenes numéricos de una muestra o de una
población. Los resúmenes gráficos también se usan para ayudar a visualizar una lista de números. El resumen gráfico del que hablaremos primero es el diagrama de tallo y hoja. Una gráfica de tallos y hojas constituye una manera simple de resumir un conjunto de datos.
Como ejemplo, los datos de la tabla 1.3 tratan del géiser Old Faithful en el parque nacional Yellowstone. Este géiser alterna periodos de erupción, que duran normalmente de 1.5
a cuatro minutos, con espacios de tiempo de inactividad, que son considerablemente más
grandes. La tabla 1.3 presenta la duración, en minutos, de 60 periodos de inactividad. La lista se presenta en orden numérico.
TABLA 1.3 Duración (en minutos) de los periodos de inactividad del géiser Old Faithful
42
55
68
75
80
84
45
55
69
75
80
84
49
56
70
76
80
85
50
56
71
76
81
86
51
57
72
76
82
86
51
58
73
76
82
86
51
60
73
76
82
88
51
66
74
79
83
90
53
67
75
79
83
91
53
67
75
80
84
93
La figura 1.5 presenta un diagrama de tallos y hojas de los datos de géiser. Cada elemento de la muestra se divide en dos partes: un tallo, que consta de uno o dos dígitos que están en
el extremo izquierdo, y la hoja, que consta del siguiente dígito significativo. En los datos del
géiser, el tallo es el dígito de las decenas y las hojas, una unidad. Cada renglón del diagrama
de tallos y hojas contiene todos los elementos de la muestra con un tallo dado. El diagrama de
tallos y hojas es una forma compacta de representar los datos. También indica un poco su forma. Para los datos de géiser podemos ver que relativamente hay pocas duraciones en el intervalo 60-69 minutos, comparado con los intervalos 50-59, 70-79 u 80-89 minutos.
Stem
4
5
6
7
8
9
Leaf
259
0111133556678
067789
01233455556666699
000012223344456668
013
FIGURA 1.5 Gráfica de tallo y hojas para los datos del géiser de la tabla 1.3.
Cuando hay un gran número de elementos en la muestra con el mismo tallo, con frecuencia se necesita asignar más de un renglón a ese tallo. Por ejemplo, la figura 1.6 presenta
una gráfica de tallos y hojas generada por computadora, con el software MINITAB, para los
datos EP de la tabla 1.2 de la sección 1.2. La columna de en medio, que tiene los 0, 1 y 2,
contiene los tallos, que son los dígitos de las decenas. A la derecha de los tallos están las hojas, que son los dígitos para cada uno de los elementos de la muestra. Como consecuencia de
que muchos números son menores de 10, al tallo 0 se le deben asignar varios renglones, cin-
26
CAPÍTULO 1
Muestreo y estadística descriptiva
Stem-and-leaf of HiAltitude
Leaf Unit = 1.0
4
19
(14)
29
15
8
7
4
4
3
1
1
0
0
0
0
0
1
1
1
1
1
2
2
N = 62
1111
222222223333333
44445555555555
66666666777777
8889999
0
233
7
89
3
FIGURA 1.6 Diagrama de tallos y hojas de los datos de EP de la tabla 1.2 de la sección 1.2
generado por MINITAB.
co en este caso. Específicamente, el primer renglón tiene los elementos de la muestra cuyos
dígitos son 0 o 1, el renglón siguiente tiene los elementos cuyos dígitos son 2 o 3, y así sucesivamente. Por consistencia, a todos los tallos se les asignan varios renglones del mismo modo, aunque sean pocos valores para los tallos 1 y 2, tallos que se podían haber hecho en pocos
renglones.
El resultado de la figura 1.6 contiene una columna de frecuencia acumulada a la izquierda del diagrama de tallos y hojas. La parte superior de esta columna proporciona un recuento del número de elementos en o arriba del renglón actual y la parte más baja de la columna
proporciona un recuento del número de elementos en o debajo del renglón actual. Después
del renglón que contiene a la mediana mostrada entre paréntesis, se encuentra el recuento de
elementos en este renglón.
Una buena característica de los diagramas de tallo y hojas es que exhiben todos los valores de la muestra. Se puede reconstruir la muestra totalmente a partir de un diagrama de tallo y hojas, con una excepción importante: el orden con el cual se muestrearon los elementos
no se puede determinar.
Diagramas de puntos
Un diagrama de puntos es un gráfico que se puede usar para tener una impresión aproximada
de la forma de una muestra. Es útil cuando el tamaño de la muestra no es demasiado grande
y cuando la muestra contiene algunos valores repetidos. La figura 1.7 presenta un diagrama
de puntos para los datos del géiser de la tabla 1.3. Para cada valor de la muestra se dibuja una
columna vertical de puntos, con el número de puntos de la columna igual al número que aparece el valor en la muestra. El diagrama de puntos da una buena indicación de dónde se concentran los valores de la muestra y dónde hay separaciones. Por ejemplo, es evidente que en
la figura 1.7 la muestra no tiene ningún periodo de inactividad entre los 61 y 65 minutos de
duración.
Los diagramas de tallo y hojas y los diagramas de puntos son buenos métodos para revisar una muestra informalmente y se pueden dibujar bastante rápido con lápiz y papel. Sin
1.3
40
50
60
70
80
Resúmenes gráficos
90
27
100
FIGURA 1.7 Diagrama de puntos para los datos del géiser de la tabla 1.3.
embargo, éstos rara vez se usan en presentaciones formales. Los gráficos comúnmente usados en las presentaciones formales son los histogramas y el diagrama de caja, que trataremos
a continuación.
Histogramas
Un histograma es una gráfica que da una idea de la “forma” de una muestra, indicando las
regiones donde los puntos de la muestra están concentrados y las regiones donde son escasos.
Construiremos un histograma para las emisiones EP de 62 vehículos conducidos en una gran
altitud, presentadas en la tabla 1.2 en la sección 1.2. El rango de la muestra va desde un mínimo 1.11 a un máximo de 23.38, en unidades de gramos de emisiones por galón de combustible. El primer paso es construir la tabla de frecuencias, que se muestra en la tabla l.4.
TABLA 1.4 Tabla de frecuencias para las emisiones EP de 62 vehículos
conducidos a mayor altitud
Intervalo de clase
(g/gal)
1–< 3
3–< 5
5–< 7
7–< 9
9–< 11
11–< 15
15–< 25
Frecuencia
12
11
18
9
5
3
4
Frecuencia
relativa
0.194
0.177
0.290
0.145
0.081
0.048
0.065
Densidad
0.0970
0.0885
0.1450
0.0725
0.0405
0.0120
0.0065
Los intervalos en la columna de la izquierda se llaman intervalos de clase. Dividen la
muestra en grupos. La notación 1⫺< 3, 3⫺< 5 y así sucesivamente, indica que un punto que
está en el límite entrará en la clase de su derecha. Por ejemplo, un valor de la muestra igual a
3 entrará en la clase 3⫺< 5, y no en la 1⫺< 3.
No hay ninguna regla ni difícil ni fácil respecto de cómo escoger los puntos finales de
los intervalos de clase. En general, es bueno tener más intervalos en vez de menos, pero es
también bueno tener un número grande de puntos de la muestra en los intervalos. Llegar al
balance adecuado es una cuestión de criterio y de ensayo y error. En muchos casos es razonable tomar el número de intervalos de clase aproximadamente igual a la raíz cuadrada del tamaño de la muestra. Para los datos EP, los intervalos de clase de dos unidades funcionan bien,
excepto para valores más grandes (por ejemplo, mayores que 11), donde los datos se reducen.
Por tanto, se han agrupado los valores entre 11 y 15 respecto de una clase y todos los valores
superiores a 15 en otra clase.
En la columna “Frecuencia”, en la tabla 1.4, se presentan los números de puntos de datos que están en cada uno de los intervalos de clase. En la columna “Frecuencia relativa” se
presentan las frecuencias divididas entre el número total de puntos de datos, que para estos
28
CAPÍTULO 1
Muestreo y estadística descriptiva
datos es de 62. La frecuencia relativa de un intervalo de clase es la proporción de puntos de datos que están en el intervalo. Observe que debido a que cada punto de los datos está exactamente en un intervalo de clase, las frecuencias relativas deben sumar l. Por último, en la
columna “Densidad” se presenta la frecuencia relativa dividida entre el ancho de clase. Por
ejemplo, en el primer renglón la frecuencia relativa es 0.194 y el ancho de clase es 2 (3 ⫺ 1
⫽ 2). Por tanto, la densidad es 0.194/2 ⫽ 0.0970. La última clase tiene un ancho de 10 y una
frecuencia relativa de 0.065, por lo que su densidad es 0.065/10 ⫽ 0.0065. El propósito de la
densidad es ajustar la frecuencia relativa con el ancho de la clase. Sin que nada cambie, las
clases anchas tienden a contener más elementos de la muestra que las clases más angostas y,
por consiguiente, tienden a tener frecuencias relativas más grandes. Al dividir la frecuencia
relativa entre el ancho de la clase se ajusta esta tendencia. La densidad representa la frecuencia relativa por unidad.
La figura 1.8 presenta el histograma para la tabla 1.4. Las unidades en el eje horizontal
son las unidades de los datos, en este caso g/galón. Cada intervalo de clase se representa por
un rectángulo. La altura de cada rectángulo es la densidad de la muestra en ese intervalo de
clase, que está dado en la cuarta columna de la tabla 1.4. El área de cada rectángulo es, por
tanto, la frecuencia relativa del intervalo de clase, que se encuentra en la tercera columna de
la tabla 1.4. Debido a que las frecuencias relativas suman 1, el área bajo todo el histograma debe ser igual a 1.
0.15
Densidad
0.1
0.05
0
1
3
5
7 9 11
15
Emisiones (g/galón)
25
FIGURA 1.8 Histograma para las emisiones de EP para vehículos a gran altitud. La tabla de frecuencias se presenta en la tabla 1.4.
Ejemplo
1.17
Use el histograma de la figura 1.8 para determinar la proporción de los vehículos en la muestra con emisiones entre 7 y 11 g/galón.
Solución
La proporción representa el área bajo el histograma entre 7 y 11. Ésta se encuentra sumando
las áreas cubiertas por los rectángulos de los dos intervalos de clase. El resultado es
(2)(0.0725) ⫹ (2)(0.0405) ⫽ 0.226. Observe que este resultado también se puede obtener de
la tabla de frecuencias. La proporción de puntos de datos con valores entre 7 y 9 es 0.145 y la
proporción entre 9 y 11 es 0.081. La proporción entre 7 y 11 es, por tanto, igual a 0.145 ⫹
0.081 ⫽ 0.226.
1.3
Ejemplo
1.18
Resúmenes gráficos
29
Use el histograma para calcular la proporción de vehículos en la muestra con emisiones entre 6 y 10 g/galón.
Solución
El histograma no da la respuesta exacta, ya que los valores 6 y 10 no son los puntos finales
de los intervalos de clase. Calculamos la proporción calculando el área bajo el histograma entre los valores 6 y 10. Éste consta de la mitad del área del rectángulo en el intervalo de 5 a 7,
más todo el rectángulo en el intervalo de 7 a 9, más la mitad del rectángulo en el intervalo de
9 a 11. El área es (1)(0.1450) ⫹ (2)(0.0725) ⫹ (1)(0.0405) ⫽ 0.3305.
Ejemplo
1.19
¿Cuál es la densidad de la muestra en 6 g/galón?
Solución
La densidad es la altura del histograma en ese punto. Esta altura es 0.1450.
Resumen
Para construir un histograma:
Elija los puntos límite para los intervalos de clase.
Calcule las frecuencias y las frecuencias relativas para cada clase.
Calcule la densidad para cada clase, de acuerdo con la fórmula.
frecuencia relativa
Densidad = ———————————
intervalo de clase
Dibuje un rectángulo para cada clase, cuya altura sea igual a la densidad.
Anchos de clase iguales
La mayoría de los software estadísticos dibujan histogramas y dan la opción de especificar los
intervalos de clase o de tener el software elegido para usted. Cuando se pide elegir intervalos
de clase, la mayoría de softwares los hacen todos con el mismo ancho. Por ejemplo, la figura 1.9 presenta un histograma de los datos de la figura 1.8, con los intervalos de clase escogidos por MINITAB. Este último elige todos los intervalos con una anchura de dos.
Para muchos conjuntos de datos, las anchuras de clases son iguales. Pero para datos como éstos, con varios datos atípicos que se estiran a la derecha, los anchos de clases iguales
son menos deseables. Para comprender por qué, considere que sólo siete puntos de datos de los
62 tienen valores superiores a 11. En la figura 1.9, más de la mitad de los intervalos de clase
están dedicados a estos siete puntos y forman una cadena de pequeños rectángulos de diferentes tamaños. Estos rectángulos tienen mucha estructura visual, que distrae de la parte más importante de la estructura en la que está la mayor parte de los datos a la izquierda. Por otra
CAPÍTULO 1
Muestreo y estadística descriptiva
0.15
0.1
Densidad
30
0.05
0
1
3
5
7
9
11
13 15
17 19 21
23 25
Emisiones (g/galón)
FIGURA 1.9 Histograma para los datos de la figura 1.8, con anchos de clase iguales como
los elige MINITAB.
parte, el histograma en la figura 1.8 agrupa estos siete puntos en dos intervalos de clase, ello
ofrece una apariencia más suave y permite apreciar mejor, a simple vista, la estructura del
conjunto de datos como un todo.
El histograma, la media muestral y la varianza
Tanto la media como la varianza de la muestra tienen interpretaciones físicas con respecto al
histograma. Imagine que el histograma de la figura 1.8 es una placa delgada que se sostiene
sobre el eje horizontal. Suponga que la masa de cada rectángulo es proporcional a su área. La
componente horizontal del centro de masa es el punto sobre el eje de x donde el histograma
se balancearía si se apoyara allí. Para encontrar la componente horizontal del centro de masa
del histograma, se trataría a cada rectángulo como si su masa estuviese concentrada en su
punto medio. Se multiplicaría el punto medio de cada rectángulo por su área y al sumar los
productos se obtiene el centro de masa. Los puntos medios de los rectángulos son los puntos
medios de los intervalos de clases y las áreas representan las frecuencias relativas (véase la
tabla 1.4). Por tanto, el centro de masa del histograma en la figura 1.8 está dado por
(2)(0.194) ⫹ (4)(0.177) ⫹ . . . ⫹ (20)(0.065) ⫽ 6.730
(1.6)
Este valor está bastante cerca de la media de la muestra, que es 6.596, como lo mostró el resultado de MINITAB (figura 1.4, en la sección 1.2). Para relacionar el centro de masa con la
media de la muestra, observe que si cada elemento de la muestra tuviera un valor igual a la mitad de su intervalo de clase, entonces la expresión (1.6) sería igual a la media muestral. Por
consiguiente, el centro de masa del histograma es una aproximación a la media muestral. Entre
1.3
Resúmenes gráficos
31
más angosto sean los rectángulos, más cerca de cada elemento de la muestra estará el centro
de su intervalo de clase y más cerca del centro de masa del histograma estará la media de la
muestra.
Con el propósito de desarrollar una interpretación física para la varianza de la muestra,
imagine una varilla sólida que pasa verticalmente a través del centro de masa del histograma
(media de la muestra). Ahora imagine que toma la varilla y que curva al histograma alrededor de ella. A mayor extensión del histograma, sería más difícil darle vuelta. La cantidad física que mide la dificultad para darle vuelta es el momento de inercia. Para cada rectángulo
en el histograma, el momento de inercia con respecto al centro de masa está dado por el cuadrado de la distancia del punto medio del rectángulo al centro de masa, multiplicado por el
área del rectángulo. El momento de inercia para todo el histograma es la suma de los momentos de los rectángulos, que es
(2 ⫺ 6.730)2(0.194) ⫹ (4 ⫺ 6.730)2(0.177) ⫹ . . . ⫹ (20 ⫺ 6.730)2(0.065) ⫽ 20.25
(1.7)
Este valor está cerca de la varianza de la muestra, que es 20.42. [La varianza de la muestra se
puede encontrar en los resultados arrojados por MINITAB (figura 1.4, de la sección 1.2) al
elevar al cuadrado la desviación estándar, que es 4.519.] Si el valor de cada elemento de la
muestra fuera exactamente igual al punto medio de su intervalo de clase, la ecuación (1.7) daría exactamente la varianza muestral. Es decir, el momento de inercia del histograma con respecto al centro de masa es una aproximación de la varianza muestral. Entre más angostos sean
los rectángulos, la aproximación será más cercana.
El hecho de que la media y la varianza de la muestra correspondan a propiedades físicas del histograma es muy útil. En el capítulo 2 se desarrollarán métodos para calcular la media y la varianza poblacional para una población infinita al representar a la población con una
curva y calculando el centro de masa y el momento de inercia.
Simetría y sesgo
Un histograma es perfectamente simétrico si su mitad derecha es una imagen de espejo de su
mitad izquierda. Los histogramas que no son simétricos se llaman sesgados. En la práctica,
ninguna muestra de datos tiene un histograma perfectamente simétrico; todos presentan algún
grado de sesgadura. En un histograma sesgado, un lado, o una cola, es más largo que el otro.
Un histograma con una cola larga a la derecha se dice que está sesgado a la derecha o positivamente sesgado. Un histograma largo con una cola larga a la izquierda se dice que está
sesgado a la izquierda o negativamente sesgado. Aunque existe un método matemático formal para medir el sesgo de un histograma, rara vez se usa; en lugar de eso las personas juzgan el grado de sesgadura informalmente al mirar el histograma. La figura 1.10 presenta
algunos histogramas para muestras de datos hipotéticas. Observe que para que un histograma
esté sesgado a la derecha (figura 1.10c), la media es mayor que la mediana, porque más de la
mitad de los datos estarán a la izquierda del centro de masa. Del mismo modo, la media es
menor que la mediana para un histograma sesgado a la izquierda (figura 1.10a). El histograma para los datos de EP (figura 1.8) está sesgado a la derecha. La media de la muestra es
6.596, que es mayor que la mediana de la muestra de 5.75.
32
CAPÍTULO 1
Media
a)
Muestreo y estadística descriptiva
Mediana
Media Mediana
Mediana
b)
Media
c)
FIGURA 1.10 a) Histograma sesgado a la izquierda, la media es menor que la mediana. b) Histograma casi simétrico, la media y la mediana son aproximadamente iguales. c) Histograma sesgado a la derecha, la media es más grande que la mediana.
Histogramas unimodales y bimodales
Se ha usado el término “moda” para referirnos al valor que ocurre con más frecuencia en una
muestra. Este término también se usa en histogramas y otras curvas para referirse a un pico o
máximo local. Un histograma es unimodal si tiene solamente un pico, o moda, y bimodal si
tiene evidentemente dos modas distintas. En principio, un histograma puede tener más de dos
modas, pero esto no ocurre a menudo en la práctica. Los histogramas de la figura 1.10 son todos unimodales. La figura 1.11 presenta un histograma bimodal para una muestra hipotética.
FIGURA 1.11 Histograma bimodal.
En algunos casos, un histograma bimodal indica que la muestra se puede dividir en dos
submuestras que son diferentes entre sí, en alguna manera científica. A cada muestra corresponde una de las modas. Como ejemplo, la tabla 1.5 presenta la duración de los 60 periodos
de inactividad del géiser Old Faithful (originalmente presentadas en la tabla 1.3). Junto con
las duraciones del periodo de inactividad, en minutos, la duración de la erupción inmediatamente precedida por un periodo de inactividad se clasifica como breve (menos de tres minutos) o como larga (más de tres minutos).
1.3
33
Resúmenes gráficos
TABLA 1.5 Duración de los periodos de inactividad (en minutos) y de las erupciones previas del géiser Old
Faithful
Inactividad
Erupción
Inactividad
Erupción
76
Larga
90
Larga
80
Larga
42
Breve
Inactividad
Erupción
Inactividad
Erupción
45
Breve
84
Larga
88
Larga
70
Larga
84
Larga
91
Larga
51
Breve
79
Larga
50
Breve
51
Breve
80
Larga
60
Larga
93
Larga
79
Larga
49
Breve
86
Larga
55
Breve
53
Breve
82
Larga
71
Larga
76
Larga
82
Larga
75
Larga
67
Breve
58
Breve
51
Breve
73
Larga
81
Larga
74
Larga
76
Larga
67
Larga
76
Larga
75
Larga
82
Larga
68
Larga
83
Larga
80
Larga
84
Larga
86
Larga
76
Larga
56
Breve
53
Breve
72
Larga
55
Breve
80
Larga
86
Larga
75
Larga
73
Larga
69
Larga
51
Breve
75
Larga
56
Breve
57
Larga
85
Larga
66
Breve
83
Larga
0.10
0.10
0.04
0.08
0.08
0.03
0.02
0.01
0
Densidad
0.05
Densidad
Densidad
La figura 1.12a presenta un histograma para las 60 duraciones. La figura 1.12b y c presenta histogramas para las duraciones de inactividad seguidas de erupciones breves y largas,
respectivamente. El histograma para todas las duraciones es bimodal. Los histogramas para
las duraciones seguidas de erupciones breves o largas son ambos unimodales y sus modas forman las dos modas del histograma para toda la muestra.
0.06
0.04
0.02
40 45 50 55 60 65 70 75 80 85 90 95
Duración (minutos)
a)
0
0.06
0.04
0.02
40 45 50 55 60 65 70 75 80 85 90 95
Duración (minutos)
b)
0
40 45 50 55 60 65 70 75 80 85 90 95
Duración (minutos)
c)
FIGURA 1.12 a) Histograma para las 60 duraciones de la tabla 1.5. Este histograma es bimodal. b) Histograma para las
duraciones de la tabla 1.5 que siguen a las erupciones breves. c) Histograma para las duraciones en la tabla 1.5 que siguen
a las erupciones largas. Tanto los histogramas para las duraciones seguidas de erupciones breves como para los que le siguen erupciones largas son unimodales, pero las modas están en lugares diferentes. Cuando las dos muestras se combinan,
el histograma es bimodal.
CAPÍTULO 1
Muestreo y estadística descriptiva
Resumen
Los histogramas tienen las propiedades siguientes:
El área de cada rectángulo representa la proporción de la muestra que está en el
intervalo de clase correspondiente.
La altura de cada rectángulo representa la densidad de la muestra en el intervalo
de clase correspondiente.
El área total bajo el histograma es igual a 1.
La media muestral es casi igual al centro de masa del histograma. La
aproximación se hace más cercana cuando se hacen rectángulos más angostos.
La varianza muestral es aproximadamente igual al momento de inercia del
histograma con respecto a su centro de masa. La aproximación es más cercana
cuando se hacen rectángulos más angostos.
Haciendo las alturas iguales a las frecuencias
En este libro se usa el término “histograma” para referirse a una gráfica en la que las alturas
de los rectángulos representan las densidades (así las áreas representan las frecuencias relativas). Sin embargo, algunas personas dibujan histogramas con las alturas de los rectángulos
iguales a las frecuencias. En efecto, éste es el método usual en muchos software. El hacer las
alturas iguales a las frecuencias (o a las frecuencias relativas) puede producir una imagen distorsionada de los datos. Por ejemplo, la figura 1.13 presenta un histograma para los datos de
EP en los que las alturas son iguales a las frecuencias, usando los mismos intervalos de clase
que se muestran en el histograma de la figura 1.8. Este histograma exagera visualmente la
proporción de vehículos en las dos clases más grandes. La razón de esto es que dichos intervalos de clase son más amplios que el resto y el histograma no se ajusta a ese dato.
20
15
Frecuencia
34
10
5
0
1
3
5
7 9 11
15
Emisiones (g/galón)
25
FIGURA 1.13 Histograma para la muestra de la tabla 1.4, con las alturas iguales a las frecuencias. El rectángulo grande sobre el intervalo 15-25 es engañoso; en efecto, solamente 6.5% de la
muestra está en ese intervalo. Compárelo con el histograma dibujado correctamente en la figura
1.8 de la página 28.
1.3
Resúmenes gráficos
35
Si todos los intervalos de clase tienen el mismo ancho, entonces el histograma tendrá la
misma forma si las alturas representan las densidades o las frecuencias. En este caso, hacer
las alturas iguales a las frecuencias no es engañoso. Sin embargo, cuando se desea hacer intervalos de clase de anchos diferentes, es importante que las alturas de los rectángulos sean
iguales a las densidades y no a las frecuencias o las frecuencias relativas.
Por último, se indica que cuando las alturas sean iguales a las frecuencias o a las frecuencias relativas, el área total de los rectángulos no es en general igual a 1. Si todos los intervalos de clase tienen el mismo ancho, entonces la media muestral estará aproximadamente
en el centro de masa; de otra forma generalmente no estará.
Diagramas de caja
Un diagrama de caja constituye una gráfica que incluye la mediana, el primero y el tercer
cuartil y cualquier dato atípico que se presente en una muestra. Los diagramas de caja son fáciles de comprender, pero hay una pequeña terminología asociada con ellos. El rango intercuartil es la diferencia entre el tercer y el primer cuartil. Observe que debido a que 75% de los
datos son menores que el tercer cuartil y que 25% de los datos son menores que el primer cuartil, la mitad de los datos está entre el primero y el tercer cuartil. Por tanto, el rango intercuartil
representa la distancia necesaria para atravesar la mitad de los datos de en medio.
Se ha definido a los datos atípicos como puntos que son inusualmente grandes o pequeños. Si denota IQR el rango intercuartil, entonces con el propósito de dibujar diagramas de
caja, cualquier punto que está a más de 1.5 IQR por arriba del tercer cuartil, o que está a más
de 1.5 IQR por debajo del primer cuartil, se considera un dato atípico. Algunos textos definen a un punto que está a más de 3 IQR del primero o del tercer cuartil como un dato atípico extremo. Estas definiciones de datos atípicos son sólo convenciones para el dibujo de los
diagramas de caja y no se necesitan usar en otras situaciones.
La figura 1.14 presenta un diagrama de caja para algunos datos hipotéticos. El diagrama consta de una caja cuyo lado inferior es el primer cuartil y el lado superior es el tercer
cuartil. La mediana se dibuja como una línea horizontal. Los datos “atípicos” se grafican por
separado y se indican con cruces en la figura. Los que se extienden desde la parte superior a
la inferior de la caja son líneas verticales llamadas “bigotes”. Éstos terminan en los puntos
más extremos que no son atípicos.
Punto de datos más
grandes a una distacia de
1.5 IQR del tercer cuartil
Tercer cuartil
Mediana
Primer cuartil
Punto de datos más
pequños a una distancia de
1.5 IQR del primer cuartil
FIGURA 1.14 Anatomía de un diagrama de caja.
Atípicos
CAPÍTULO 1
Muestreo y estadística descriptiva
Además de cualquier dato atípico, un diagrama de caja está formado por cuatro partes:
las dos partes de la caja separadas por la línea de la mediana y los dos “bigotes”. Nuevamente, aparte de los datos atípicos, cada una de estas cuatro partes representa una cuarta parte de
los datos. Por tanto, el diagrama de caja indica la longitud de un intervalo para cada cuarta
parte de datos y de esta manera se puede usar para determinar las regiones en las que hay mayor y menor densidad de valores de la muestra.
Pasos para la construcción de un diagrama de caja
Calcule la mediana, el primero y tercer cuartil de la muestra. Indique éstos con
líneas horizontales. Dibuje líneas verticales para completar la caja.
Encuentre el valor de la muestra más grande que no esté a más de 1.5 IQR arriba
del tercer cuartil y el valor de la muestra más pequeño que no esté a más de 1.5
IQR debajo del primer cuartil. Extienda líneas verticales (“bigotes”) desde las
líneas de los cuartiles a estos puntos.
Puntos a más de 1.5 IQR arriba del tercer cuartil, o a más de 1.5 IQR por debajo
del primer cuartil, se denominan datos atípicos. Dibuje cada dato atípico por
separado.
La figura 1.15 presenta un diagrama de caja para los datos del géiser que se presentó en
la tabla 1.5. Primero observe que no hay ningún dato atípico en estos datos. Al comparar las
cuatro partes del diagrama de caja, se puede decir que los valores de la muestra tienen casi la
misma densidad de valores entre la mediana y el tercer cuartil y menos densidad entre la mediana y el primer cuartil. El “bigote” más bajo es un poco más largo que el superior, lo que
indica que los datos tienen la cola inferior ligeramente más larga que la cola superior. Como
consecuencia de que la distancia entre la mediana y el primer cuartil es más grande que la que
existe entre la mediana y el tercer cuartil y debido a que la cuarta parte inferior de los datos
produce un “bigote” más largo que la cuarta parte superior, este diagrama de caja indica que
los datos están sesgados a la izquierda.
100
90
Duración (minutos)
36
80
70
60
50
40
FIGURA 1.15 Diagrama de caja para los datos de los periodos de inactividad del Old Faithful
que se presentaron en la tabla 1.5.
1.3
Resúmenes gráficos
37
Se presentó un histograma para estos datos en la figura 1.12a. El histograma presenta
una impresión más general de la dispersión de los datos. En forma importante, el histograma
indica que los datos son bimodales, lo que un diagrama de caja no puede hacer.
Diagramas de caja comparativos
Una ventaja muy importante de los diagramas de caja es que se pueden presentar varios juntos, ello permite la fácil comparación visual de las características de varias muestras. Las tablas 1.1 y 1.2 (en la sección 1.2) presentan datos de emisiones de EP para vehículos
conducidos en grandes y bajas altitudes. La figura 1.16 presenta una comparación de los dos
diagramas de caja de estas dos muestras.
25
Emisiones (g/galón)
20
15
10
5
0
Altitud baja
Altitud superior
FIGURA 1.16 Diagramas de caja comparativos para los datos de emisiones de EP para vehículos conducidos en altitudes grandes contra bajas.
Los diagramas de caja comparativos en la figura 1.16 muestran que los vehículos conducidos a baja altitud tienden a tener emisiones inferiores. Además, hay algunos datos atípicos entre los datos para los vehículos en grandes altitudes, cuyos valores son superiores que
cualquiera de los valores para los vehículos de baja altitud (también hay un valor de baja altitud que apenas reúne las condiciones necesarias para considerarlo un dato atípico). Se concluye que a grandes altitudes, los vehículos tienen emisiones mayores en general y que
cuando consideramos los datos atípicos es mucho mayor. La caja para vehículos a grandes altitudes es un poco más grande y el “bigote” inferior es un poco más largo que para vehículos
a baja altitud. Se concluye que además de los datos atípicos, la dispersión en los valores es ligeramente más grande para los vehículos a grandes altitudes y mucho más grande cuando se
considera a los datos atípicos.
En la figura 1.4 (en la sección 1.2) se comparan los valores de algunos estadísticos descriptivos numéricos para estas dos muestras y se obtienen algunas conclusiones similares a
las anteriores. La naturaleza visual de los diagramas de caja de la figura 1.16 hace las comparaciones de las características de las muestras mucho más fácil.
38
CAPÍTULO 1
Muestreo y estadística descriptiva
Se ha mencionado que es importante examinar a los datos atípicos para determinar si
son resultado de errores y, en tal caso, eliminarlos. Para identificar a los datos atípicos, pueden ser útiles los diagramas de caja. El siguiente ejemplo proporciona un caso.
El artículo “Virgin Versus Recycled Wafers for Furnace Qualification: Is the Expense
Justified?” (V. Czitrom y J. Reece, en Statistical Case Studies for Industrial Process Improvement, ASA y SIAM, 1997:87-104) describe un proceso para el crecimiento de una capa delgada de dióxido de silicio sobre placas de silicio que se usan en la fabricación de semiconductores. La tabla 1.6 presenta las mediciones del espesor, en angstroms (Å), de la capa de
óxido para 24 placas. Se hicieron nueve mediciones en cada placa. Las placas se fabricaron
en dos corridas distintas, con 12 placas por cada corrida.
TABLA 1.6 Espesor de las capas de óxido de silicio en placas de silicio
Placa
Espesor (Å)
Corrida 1
1
2
3
4
5
6
7
8
9
10
11
12
90.0
91.8
90.3
92.6
91.1
76.1
92.4
91.3
96.7
92.0
94.1
91.7
92.2
94.5
91.1
90.3
89.8
90.2
91.7
90.1
93.7
94.6
91.5
97.4
94.9
93.9
93.3
92.8
91.5
96.8
91.6
95.4
93.9
93.7
95.3
95.1
92.7
77.3
93.5
91.6
91.5
84.6
91.1
89.6
87.9
94.0
92.8
96.7
91.6
92.0
87.2
92.7
90.6
93.3
88.0
90.7
90.4
89.3
93.4
77.5
88.2
89.9
88.1
91.7
93.1
95.7
92.4
95.8
92.0
90.1
92.2
91.4
82.0
87.9
90.1
89.3
88.9
90.9
88.7
91.7
90.5
91.3
89.4
90.5
98.2
92.8
91.9
95.5
92.5
100.3
92.9
97.9
95.2
92.7
94.5
95.2
96.0
93.3
94.5
93.6
92.4
95.2
92.6
95.7
94.3
94.5
95.4
93.1
Corrida 2
1
2
3
4
5
6
7
8
9
10
11
12
93.0
91.4
91.9
90.6
93.1
90.8
88.0
88.3
94.2
101.5
92.8
92.1
99.9
90.6
91.8
91.3
91.8
91.5
91.8
96.0
92.2
103.1
90.8
93.4
93.6
92.2
92.8
94.9
94.6
91.5
90.5
92.8
95.8
103.2
92.2
94.0
89.0
91.9
96.4
88.3
88.9
91.5
90.4
93.7
92.5
103.5
91.7
94.7
93.6
92.4
93.8
87.9
90.0
94.0
90.3
89.6
91.0
96.1
89.0
90.8
90.9
87.6
86.5
92.2
97.9
91.0
91.5
89.6
91.4
102.5
88.5
92.1
89.8
88.9
92.7
90.7
92.1
92.1
89.4
90.2
92.8
102.0
87.5
91.2
92.4
90.9
90.9
91.3
91.6
91.8
93.2
95.3
93.6
106.7
93.8
92.3
93.0
92.8
92.8
93.6
98.4
94.0
93.9
93.0
91.0
105.4
91.4
91.1
Las 12 placas en cada corrida eran de varios tipos y se procesaron en diferentes posiciones en el horno. El propósito en la recopilación de datos fue determinar si el espesor de la
capa de óxido se afectaba ya sea por el tipo de placa o por la posición en el horno. Por tanto,
éste fue un experimento factorial, con los factores, tipo de placa y posición en el horno y como resultado el espesor de la capa de óxido. El experimento se diseñó de tal manera que no
se supuso ninguna diferencia sistemática entre las capas de una corrida a otra. El primer paso en el análisis fue construir un diagrama de caja para los datos de cada corrida con el propósito de ayudar a determinar si esta condición se satisfacía realmente y si ninguna de las
observaciones se debía eliminar. Los resultados se presentan en la figura 1.17.
1.3
Resúmenes gráficos
39
110
Espesor (angstroms)
105
100
95
90
85
80
75
Corrida 1
Corrida 2
FIGURA 1.17 Diagramas de caja comparativos para los datos del espesor de la capa de óxido.
Los diagramas de caja muestran que había algunos datos atípicos en cada corrida. Observe que, aparte de estos datos atípicos, no hay ninguna diferencia sorprendente entre las
muestras y, por tanto, ninguna prueba de alguna diferencia sistemática entre las corridas. La
siguiente tarea es inspeccionar los datos atípicos, para determinar cuál, si hay alguno, se debe eliminar. Al examinar los datos de la tabla 1.6, se observa que las ocho mediciones más
grandes en dos corridas ocurrieron en una sola placa: la número 10.
Se determinó entonces que esta placa se había contaminado con un residuo de la película, lo que ocasionó grandes mediciones del espesor. Por tanto, sería apropiado eliminar estas mediciones. En el experimento real, los ingenieros tenían a su disposición datos de algunas
otras corridas y, por razones técnicas, decidieron eliminar toda la corrida, en vez de analizar
una corrida a la que le faltaba una placa. En la corrida 1 se encontró que las tres mediciones
más bajas se habían dado por un calibrador descompuesto y, por tanto, se eliminaron adecuadamente. No se pudo determinar ninguna causa para los dos datos atípicos restantes de la corrida 1, así que permanecieron en el análisis.
Datos multivariados
A veces los elementos de una población pueden tener algunos valores asociados entre sí. Por
ejemplo, imagine que elige una muestra aleatoria de días y determine el promedio de la temperatura y de la humedad para cada día. Cada día la población proporciona dos valores, la
temperatura y la humedad. Por tanto, la muestra aleatoria constaría de pares de números. Si
las precipitaciones también se midieran todos los días, la muestra constaría de tripletes. En
principio, se podría medir todos los días cualquier número de cantidades, lo que produciría
una muestra en la que cada elemento representa una lista de números.
Los datos para cada elemento que constan de más de un valor se llaman datos multivariados. Cuando cada elemento es un par de valores, se dice que los datos son bivariados.
Uno de los resúmenes gráficos más útiles por los datos bivariados numéricos es el diagrama
de dispersión. Si los datos constan de pares arreglados (xl, y1), . . . , (xn, yn), entonces un diagrama de dispersión se construye sólo al trazar cada punto en un sistema coordenado bidi-
40
CAPÍTULO 1
Muestreo y estadística descriptiva
80
80
75
75
Intensidad producida (ksi)
Intensidad producida (ksi)
mensional. Los diagramas de dispersión también se pueden usar para resumir los datos multivariados cuando cada elemento consta de más de dos valores. Simplemente se construirían
diagramas de dispersión distintos para cada par de valores.
El siguiente ejemplo muestra la utilidad de los diagramas de dispersión. El artículo “Advances in Oxygen Equivalence Equations for Predicting the Properties of Titanium Welds”
(D. Harwig, W. Ittiwattana y H. Castner, The Welding Journal, 200l:l26s-136s) presenta los
datos con respecto a la composición química y las características de la intensidad de diferentes soldaduras de titanio. La figura 1.18 presenta dos diagramas de dispersión. La figura 1.18a
constituye un diagrama de la intensidad producida [en miles de libras por pulgada cuadrada
(ksi)] contra el contenido de carbono (en %) para algunas de estas soldaduras. La figura 1.18b
representa un diagrama de la intensidad producida (en ksi) contra el contenido de nitrógeno
(en %) para las mismas soldaduras.
70
65
60
55
50
70
65
60
55
0.01
0.015
0.02
0.025
Contenido de carbono (%)
a)
0.03
50
0
0.02
0.04
0.06
Contenido de nitrógeno (%)
b)
0.08
FIGURA 1.18 a) Un diagrama de dispersión que muestra que no existe mucha relación entre el contenido de carbono y la
intensidad producida para determinado grupo de soldaduras. b) Un diagrama de dispersión que muestra que para estas mismas soldaduras el contenido de nitrógeno más alto está relacionado con la mayor intensidad producida.
La gráfica de la intensidad producida contra contenido de nitrógeno (figura 1.18b)
muestra con cierta claridad la estructura, los puntos parecen estar siguiendo una recta desde
la parte izquierda más baja a la parte derecha superior. De este modo, la gráfica muestra una
relación entre el contenido de nitrógeno y la intensidad producida: las soldaduras con más alto contenido de nitrógeno tienden a tener una mayor intensidad producida. Este diagrama de
dispersión podría conducir a que los investigadores intenten predecir la intensidad a partir del
contenido de nitrógeno o que traten de aumentar el contenido de nitrógeno para incrementar
la intensidad. (El hecho de que exista una relación en la gráfica de dispersión no garantiza que
estos intentos tengan éxito, como se analizará en la sección 7.1.) Por otra parte, no parece haber mucha estructura en la gráfica de dispersión de la intensidad producida contra el contenido de carbono y, por tanto, no hay evidencia de que exista una relación entre estas dos
cantidades. Esta gráfica de dispersión desanimaría a los investigadores a tratar de predecir la
intensidad a partir del contenido de carbono.
1.3
Resúmenes gráficos
41
Ejercicios para la sección 1.3
1. Parte de un estudio de control de calidad tuvo como objetivo mejorar una línea de producción, se midieron los pesos
(en onzas) de 50 barras de jabón. Los resultados son los siguientes, ordenados del más pequeño al más grande.
11.6
14.3
15.8
16.5
17.7
12.6
14.3
15.9
16.6
18.1
12.7
14.6
15.9
17.0
18.3
12.8
14.8
16.1
17.1
18.3
13.1
15.1
16.2
17.3
18.3
13.3
15.2
16.2
17.3
18.5
13.6
15.6
16.3
17.4
18.5
13.7
15.6
16.4
17.4
18.8
13.8
15.7
16.5
17.4
19.2
14.1
15.8
16.5
17.6
20.3
a) Construya un diagrama de tallos y hojas para estos datos.
b) Construya un histograma para estos datos.
c) Construya un diagrama de puntos para estos datos.
d) Construya un diagrama de caja para estos datos. ¿El diagrama de caja indica datos atípicos?
2. Siguiendo una lista del número de sitios de residuos peligrosos en cada uno de los 50 estados federales de los Estados Unidos en abril de 1995. Los datos se tomaron de The
World Almanac and Book of Facts 1996 (World Almanac
Books, Mahwah, NJ, 1996). La lista se ha ordenado numéricamente.
1
10
13
19
38
2
10
13
20
39
3
10
14
22
40
4
11
15
23
55
4
11
16
24
58
5
11
17
25
77
6
12
17
29
81
8
12
18
30
96
8
12
18
33
102
9
12
19
37
107
a) Construya un diagrama de tallos y hojas para estos datos.
b) Construya un histograma para estos datos.
c) Construya un diagrama de puntos para estos datos.
d) Construya un diagrama de caja para estos datos. ¿El diagrama de caja muestra algún dato atípico?
3. Con referencia a la tabla 1.2 (p. 20). Construya un diagrama de tallos y hojas con uno de los dígitos como tallo (para valores iguales o superiores a 10, el tallo tendrá dos
dígitos) y el dígito de las decenas como hoja. ¿Cuántos tallos hay (asegúrese de incluir tallos deshojados)? ¿Cuáles
son algunas de las ventajas y desventajas de este diagrama,
comparado con el de la figura 1.6 (p. 26 )?
4. Se estudiaron dos métodos de recuperación de proteína. Se
hicieron trece corridas usando cada método y se registró la
parte de proteína recuperada para cada corrida. Los resultados son los siguientes:
Método 1
Método 2
0.32
0.35
0.37
0.39
0.42
0.47
0.51
0.58
0.60
0.62
0.65
0.68
0.75
0.25
0.40
0.48
0.55
0.56
0.58
0.60
0.65
0.70
0.76
0.80
0.91
0.99
a) Construya un histograma para los resultados de cada
método.
b) Construya diagramas de caja para comparar los dos métodos.
c) Usando los diagramas de caja, ¿qué diferencias se observan entre los resultados de los dos métodos?
5. Cada uno de los 32 estudiantes, que forman dos secciones
de laboratorio con 16 estudiantes cada una, calculó la circunferencia de una pelota de tenis a simple vista. Aquí se
muestran los resultados, en centímetros. (Los resultados para el primer grupo de estudiantes también se muestran en el
ejercicio 12 de la sección 1.2.)
Grupo 1
18.0
18.0
18.0
20.0
22.0
22.0
22.5
23.0
24.0
24.0
25.0
25.0
25.0
25.0
26.0
26.4
Grupo 2
15.0
18.0
18.0
19.0
19.0
19.0
19.0
19.5
20.0
20.0
20.0
20.0
20.0
22.0
24.0
25.0
42
CAPÍTULO 1
Muestreo y estadística descriptiva
a) Construya un histograma para cada grupo.
0.4
b) Construya diagramas de caja comparativos para los dos
grupos.
6. Dibuje un histograma para el cual:
a) La media es más grande que la mediana.
0.3
Densidad
c) Usando diagramas de caja, ¿qué diferencias se pueden
ver entre los resultados del primero y del segundo grupo?
0.35
0.25
0.2
0.15
0.1
b) La media es menor que la mediana.
c) La media es aproximadamente igual a la mediana.
7. El siguiente histograma presenta la distribución de la presión sanguínea sistólica para una muestra de mujeres. Use
éste para responder las siguientes preguntas:
a) ¿Es el porcentaje de mujeres con presión sanguínea superior a 130 mm cercano a 25, 50 o 75%?
b) ¿En qué intervalo hay más mujeres: 130-135 o 140-150
mm?
c) En el intervalo 125-130 mm, la altura del histograma es
de 0.024. ¿Qué porcentaje de mujeres tenía presión sanguínea en este intervalo?
0.05
0
0
1
2
4
6
Plata (ppm)
9. Una muestra de 100 hombres tiene una estatura promedio
de 70 pulgadas y una desviación estándar de 2.5 pulgadas.
Una muestra de 100 mujeres tiene una estatura promedio de
64 pulgadas y desviación estándar de 2.5 pulgadas. Si se
combinan ambas muestras, la desviación estándar de la estatura de las 200 personas será ____________________
i) menor que 2.5 pulgadas
ii) mayor que 2.5 pulgadas
iii) igual a 2.5 pulgadas
iv) no se puede decir a partir de la información dada.
0.04
0.035
(Sugerencia: No realice ningún cálculo. Sólo trate de dibujar histogramas para cada muestra por separado, y después
para la muestra combinada.)
Densidad
0.03
0.025
0.02
10. Los siguientes son diagramas de caja que comparan la carga [en coulombs entre mol (C/mol) × 10⫺25] a pH 4.0 y a
pH 4.5 para un conjunto de proteínas (del artículo “Optimal
Synthesis of Protein Purification Processes”, E. VasquezAlvarez, M. Leinqueo y J. Pinto, en Biotechnology Progress
2001:685-695). Verdadero o falso:
0.015
0.01
0.005
0
90
100
110
120
130
140
150
160
Presión sanguínea (mm)
a) La mediana de la carga para el pH 4.0 es mayor que el
75avo. percentil de la carga para el pH 4.5.
b) Aproximadamente 25% de las cargas para el pH 4.5 son
menores que la carga más pequeña en el pH 4.0.
8. El siguiente histograma presenta las cantidades de plata [en
partes por millón (ppm)] encontradas en una muestra de rocas. Falta un rectángulo del histograma. ¿Cuál es su altura?
c) Cerca de la mitad de los valores de la muestra para el pH
4.0 están entre 2 y 4.
d) Hay una proporción mayor de valores fuera de la caja
para el pH 4.0 que para el pH 4.5.
1.3
e) Ambas muestras están sesgadas a la derecha.
f) Ambas muestras contienen datos atípicos.
43
11. Los siguientes son resúmenes estadísticos para dos conjuntos de datos, A y B.
12
Mínimo
1er. cuartil
Mediana
3er. cuartil
Máximo
10
8
Carga
Resúmenes gráficos
A
B
0.066
1.42
2.60
6.02
10.08
⫺2.235
5.27
8.03
9.13
10.51
a) Calcule los rangos intercuartiles tanto para A como para B.
6
b) ¿Los resúmenes estadísticos para A proporcionan suficiente información para construir un diagrama de caja?
Si es así, construya el diagrama de caja. Si no, explique
por qué.
4
2
0
pH = 4.0
pH = 4.5
c) ¿Los resúmenes estadísticos para B proporcionan la suficiente información para construir un diagrama de caja?
Si es así, construya el diagrama de caja. Si no, explique
por qué.
12. Relacione cada histograma con el diagrama de caja que representa el mismo conjunto de datos.
a)
b)
c)
d)
(1)
(2)
(3)
(4)
13. Refiérase a los datos de asfalto en el ejemplo 1.12 (p. 17).
a)
b)
c)
d)
Construya un diagrama de caja para los datos de asfalto.
¿Qué valores, si los hay, son atípicos?
Construya una gráfica de puntos para los datos de asfalto.
Con el fin de construir diagramas de caja, se define un dato atípico como un punto cuya distancia al cuartil más cercano es
mayor a 1.5 IQR. Una definición más general y menos precisa es que un dato atípico es cualquier punto que está separado
de la mayor parte de los datos. ¿Hay puntos en el conjunto de datos del asfalto que son datos atípicos bajo esta definición
más general, pero no bajo la definición del diagrama de caja? ¿Si es así, cuáles son?
44
CAPÍTULO 1
Muestreo y estadística descriptiva
12
10
10
8
8
6
6
4
4
2
2
0
y
y
12
0
2
4
6
x
a)
8
10
0
12
12
12
10
10
8
8
6
6
y
y
14. Relacione cada diagrama de dispersión con el enunciado que lo describa mejor.
4
4
2
2
0
0
2
4
6
x
c)
8
10
12
0
0
2
4
6
x
b)
8
10
12
0
2
4
6
x
d)
8
10
12
i) La relación entre x y y es casi lineal.
ii) La relación entre x y y no es lineal.
iii) No hay mucho que relacione a x con y.
iv) La relación entre x y y es casi lineal, menos un dato atípico.
15. Para los siguientes datos:
x 1.4 2.4 4.0 4.9 5.7 6.3 7.8 9.0 9.3 11.0
y 2.3 3.7 5.7 9.9 6.9 15.8 15.4 36.9 34.6 53.2
a) Realice una gráfica de dispersión de y contra x. ¿Es la relación entre x y y casi lineal, o no lo es?
b) Calcule el logaritmo natural de cada valor de y. Esto se conoce como hacer una transformación de log de y. Realice una
gráfica de dispersión de ln y contra x. ¿La relación entre x y ln y es casi lineal, o no lo es?
c) En general, es más fácil trabajar con cantidades que tienen una relación lineal aproximada que con cantidades que no tienen una relación lineal. ¿Para estos datos, pensaría que es más fácil trabajar con x y y o con x y ln y? Explique.
Ejercicios adicionales para el capítulo 1
45
Ejercicios adicionales para el capítulo 1
1. Una vendedora convierte los pesos de los paquetes que vende de libras a kilogramos (1 kg ≈ 2.2 lb).
b) Si al lanzar la moneda caen 100 “caras” consecutivas,
¿es razonable concluir que la moneda es deshonesta?
Explique.
a) ¿Cómo afecta esto la media del peso de los paquetes?
b) ¿Cómo afecta esto la desviación estándar de los pesos?
5. El número más pequeño en una lista se cambia de 12.9 a
1.29.
2. Con referencia al ejercicio 1. La vendedora empieza a usar
un empaquetado más pesado, lo que aumenta el peso de cada paquete en 50 gramos.
a) ¿Es posible determinar cuánto cambia la media? Si es
así, ¿en cuánto cambia?
a) ¿Cómo afecta esto a la media del peso de los paquetes?
b) ¿Cómo afecta esto a la desviación estándar de los pesos?
3. Los circuitos integrados constan de canales eléctricos que
están grabados en placas de silicio. Cierta proporción de
circuitos está defectuosa debido al “corte sesgado”, lo que
sucede cuando se graba demasiado material lejos de los canales, ello da como resultado partes no grabadas en las placas, que son demasiado angostas. Se está investigando un
proceso rediseñado que implica presión más baja en la cámara de grabado. El objetivo es reducir la tasa de corte sesgado a menos de 5%. De los primeros 100 circuitos fabricados
por el nuevo proceso, solamente cuatro indican evidencias
de corte sesgado. Verdadero o falso:
a) Debido a que solamente 4% de los 100 circuitos tenían
corte sesgado, se puede concluir que se ha alcanzado el
objetivo.
b) Aunque los porcentajes de la muestra están debajo de
5%, esto podría representar la variación del muestreo, así
que es posible que el objetivo aún no se ha alcanzado.
c) No hay caso en evaluar el nuevo proceso, porque no importa cuál es el resultado, podía sólo atribuirse a la variación del muestreo.
d) Si muestreamos un número lo suficientemente grande
de circuitos y si los porcentajes de circuitos defectuosos
están suficientemente por abajo de 5%, entonces es razonable concluir que se ha alcanzado el objetivo.
4. Se lanza una moneda dos veces y cae “cara” ambas veces.
Alguien dice: “Hay algo deshonesto en esta moneda. Se supone que una moneda cae cara sólo la mitad de las veces y
no siempre.”
a) ¿Es razonable concluir que la moneda es deshonesta?
Explique.
b) ¿Es posible determinar cuánto cambia la mediana? Si es
así, ¿en cuánto cambia? ¿Qué pasa si la lista consta de
solamente dos números?
c) ¿Es posible determinar cuánto cambia la desviación estándar? Si es así, ¿cuánto cambia?
6. Hay 15 números en una lista y el número más pequeño se
cambia de 12.9 a 1.29.
a) ¿Es posible determinar cuánto cambia la media? Si es
así, ¿cuánto cambia?
b) ¿Es posible determinar el valor de la media después del
cambio? Si es así, ¿cuál es el valor?
c) ¿Es posible determinar cuánto cambia la mediana? Si es
así, ¿cuánto cambia?
d) ¿Es posible determinar cuánto cambia la desviación estándar? Si es así, ¿cuánto cambia?
7. Hay 15 números en una lista y la media es 25. El número
más pequeño en la lista se cambia de 12.9 a 1.29.
a) ¿Es posible determinar cuánto cambia la media? Si es
así, ¿cuánto cambia?
b) ¿Es posible determinar el valor de la media después del
cambio? Si es así, ¿cuál es el valor?
c) ¿Es posible determinar cuánto cambia la mediana? Si es
así, ¿cuánto cambia?
d) ¿Es posible determinar cuánto cambia la desviación estándar? Si es así, ¿cuánto cambia?
8. El artículo “The Selection of Yeast Strains for the Production of Premium Quality South African Brandy Base Products” (C. Steger y M. Lambrechts, Journal of Industrial
Microbiology and Biotechnology, 2000:431-440) presenta
información detallada acerca de la composición compuesta
volátil de la base de vinos hechos para cada una de las 16
46
CAPÍTULO 1
Muestreo y estadística descriptiva
1
clases de levadura seleccionadas. Las siguientes son las
concentraciones de ésteres totales (en mg/L) en cada uno de
los vinos.
Densidad
284.34 173.01 229.55 312.95 215.34 188.72
144.39 172.79 139.38 197.81 303.28 256.02
658.38 105.14 295.24 170.41
0.8
a) Calcule la media de la concentración.
0.6
0.4
0.2
b) Calcule la mediana de la concentración.
0
c) Calcule el primer cuartil de las concentraciones.
⫺3
⫺1
0
10 20
d) Calcule el tercer cuartil de las concentraciones.
e) Construya un diagrama de caja para las concentraciones. ¿Qué características revela?
i) La media es más grande que la mediana.
1
3
40
60
0.04
0.03
Densidad
9. Con respecto a los datos que se representan en el siguiente
diagrama de caja, ¿cuál de los enunciados siguientes es verdadero?
0
a)
0.02
0.01
ii) La media es menor que la mediana.
iii) La media es aproximadamente igual a la mediana.
0
b)
0.2
Densidad
0.15
0.1
0.05
0
10. Verdadero o falso: en cualquier diagrama de caja,
1
b) La longitud de los “bigotes” podría ser más grande que
1.5 IQR, donde el IQR es el rango intercuartil.
0.8
c) La longitud de los “bigotes” podría ser menor que 1.5
IQR, donde el IQR es el rango intercuartil.
0.6
d) Los valores en los extremos de los “bigotes” son siempre valores del conjunto de datos que se usan para construir el diagrama de caja.
11. Para cada uno de los histogramas siguientes, determine si el
eje vertical ha sido etiquetado correctamente.
Densidad
a) La longitud de los “bigotes” es igual a 1.5 IQR, donde
el IQR es el rango intercuartil.
0
4
c)
6 7 8
0.4
0.2
0
⫺1.5
⫺0.5
0 0.5
d)
1.5
Ejercicios adicionales para el capítulo 1
12. En el artículo “Occurrence and Distribution of Ammonium
in Iowa Groundwater” (K. Schilling, Water Environment
Research, 2002:177-186), se midieron concentraciones de
amonio (en mg/L) en un total de 349 pozos aluviales en el
estado de Iowa. La media de la concentración fue de 0.27,
la mediana fue de 0.10 y la desviación estándar fue de 0.40.
Si se dibujara un histograma con estas 349 mediciones,
i) estaría sesgado a la derecha.
ii) estaría sesgado a la izquierda.
iii) sería aproximadamente simétrico.
15. El artículo “Computing and Using Rural versus Urban
Measures in Statistical Applications” (C. Goodall, K. Kafadar y J. Tukey, The American Statistician, 1998:101-111)
analiza los métodos para medir el grado a los cuales los
condados de los Estados Unidos son urbanos más que rurales. La siguiente tabla de frecuencias presenta las frecuencias de población de los condados de los Estados Unidos.
Las poblaciones están en la escala log2; por consiguiente, el
primer intervalo contiene condados cuyas poblaciones son
al menos de 26 ⫽ 64, pero menores que 212.4 ⫽ 5 404 y así
sucesivamente.
iv) su forma no se podría determinar sin conocer las frecuencias relativas.
log2 de la
población
Intersección
15avo.
50avo.
85avo.
A
B
27.5
24.5
37.5
26.5
40.0
36.0
a) Si se hubiera dibujado un histograma para las velocidades de vehículos que pasan a través de la intersección A,
¿pensaría que está sesgado a la izquierda, sesgado a la
derecha, o casi simétrico? Explique.
b) Si se hubiera dibujado un histograma para las velocidades de vehículos que pasan a través de la intersección B,
¿pensaría que está sesgado a la izquierda, sesgado a la
derecha, o casi simétrico? Explique.
14. La frecuencia acumulada y la frecuencia relativa acumulada
para un intervalo de clase dado son las sumas de las frecuencias y las frecuencias relativas, respectivamente, sobre todas
las clases, incluyendo la clase dada. Por ejemplo, si hay cinco clases, con frecuencias 11, 7, 3, 14 y 5, las frecuencias
acumulativas serían 11, 18, 21, 35 y 40, y las frecuencias relativas acumulativas serían 0.275, 0.450, 0.525, 0.875 y
1.000. Construya una tabla para presentar las frecuencias,
las frecuencias relativas y las frecuencias relativas acumuladas, para los datos del ejercicio 1 de la sección 1.3, usando
los intervalos de clase 11 ⫺< 12, 12 ⫺< 13, . . . , 20 ⫺< 21.
Núm. de
condados
6.0–< 12.4
12.4–< 13.1
13.1–< 13.6
13.6–< 14.0
14.0–< 14.4
14.4–< 14.8
14.8–< 15.3
15.3–< 16.0
16.0–< 17.0
17.0–< 23.0
13. En el artículo “Vehicle-Arrival Characteristics at Urban Uncontrolled Intersections” (V. Rengaraju y V. Rao, Journal of
Transportation Engineering, 1995:317-323) se presentan
los datos sobre las características de tráfico en diez cruceros
en Madras, India. Una de las características medidas fueron
las velocidades de los vehículos que se desplazaban por los
cruceros. La tabla siguiente da 15avo., 50avo. y 85avo. percentiles de la velocidad (en km/h) para dos cruceros.
Percentil
47
305
294
331
286
306
273
334
326
290
323
a) Construya un histograma a partir de la tabla de frecuencias.
b) Calcule la proporción de condados cuyas poblaciones
son mayores a cien mil.
c) ¿Está el histograma sesgado a la izquierda, a la derecha,
o casi simétrico?
d) Construya un histograma usando las poblaciones reales
en vez de su logaritmo. ¿Por qué piensa usted que el artículo transformó las poblaciones a la escala logarítmica?
16. El artículo “Hydrogeochemical Characteristics of Groundwater in a Mid-Western Coasta1 Aquifer System” (S. Jeen,
J. Kim y colaboradores, Geosciences Journal, 2001:339-348)
presenta las mediciones de las propiedades de algunas
aguas subterráneas poco profundas en cierto sistema de
acuífero de Corea. Las siguientes son las mediciones de la
conductividad eléctrica (en microsiemens por centímetro)
para 23 muestras de agua.
2099
1265
488
461
528
375
200
500
2030 1350 1018 384
424 789
810 522
215 486
257 557
a) Encuentre la media.
b) Encuentre la desviación estándar.
1499
513
260
48
CAPÍTULO 1
Muestreo y estadística descriptiva
c) Encuentre la mediana.
d) Construya una gráfica de puntos.
e) Encuentre la media recortada a 10%.
f) Encuentre el primer cuartil.
g) Encuentre el tercer cuartil.
d) Aproxime el tercer cuartil del número de acciones poseídas encontrando el punto para el cual 75% del área
está a la izquierda.
e) Aproxime la media del número de acciones poseídas
calculando el centro de masa del histograma.
f) Aproxime la varianza del número de acciones poseídas
calculando el momento de inercia con respecto a la media, bajo el supuesto de que toda la masa de un rectángulo está concentrada en su punto medio.
h) Encuentre el rango intercuartil.
i) Construya un diagrama de caja.
j) ¿Cuáles puntos, si los hay, son atípicos?
k) Si se hubiera construido un histograma, ¿estaría sesgado a la izquierda, sesgado a la derecha, o casi simétrico?
17. La falta de agua ha sido tradicionalmente una preocupación
muy importante en las Islas Canarias. Los derechos sobre el
agua se dividen en acciones, que son posesión privada. El
artículo “The Social Construction of Scarcity. The Case of
Water in Tenerife (Canary Islands)” (F. Aguilera-Klink, E.
Pérez-Moriana, y J. Sánchez-García, Ecological Economics, 2000:233-245) analiza que la extensión de muchas de
las acciones están concentradas entre pocos propietarios. La
tabla siguiente presenta el número de propietarios que poseen diferentes números de acciones. (Había 15 propietarios
que poseían 50 acciones o más; que se han omitido.) Observe que es posible poseer un número no entero de acciones;
por ejemplo, el intervalo 2⫺< 3 contiene 112 personas que
poseían al menos dos pero menos de tres acciones.
Número de
acciones
0–< 1
1–< 2
2–< 3
3–< 4
4–< 5
5–< 10
10–< 15
15–< 20
20–< 25
25–< 30
30–< 50
Número de
propietarios
18
165
112
87
43
117
51
32
10
8
8
a) Construya un histograma para estos datos.
b) Aproxime la mediana del número de acciones poseídas
encontrando el punto para el cual las áreas de cualquier
lado son iguales.
c) Aproxime el primer cuartil del número de acciones poseídas encontrando el punto para el cual 25% del área
está a la izquierda.
18. El informe del editor, en noviembre de 2003, de la edición
de Technometrics proporciona la siguiente información respecto de la cantidad de tiempo que le toma revisar artículos
que fueron presentados para su publicación durante 2002.
Para propósitos computacionales, interprete la última categoría (> 9) como 9 ⫺< 15.
Tiempo
(meses)
0–< 1
1–< 2
2–< 3
3–< 4
4–< 5
5–< 6
6–< 7
7–< 8
8–< 9
>9
Número de
artículos
45
17
18
19
12
14
13
22
11
18
a) Construya un histograma para estos datos.
b) Aproxime la mediana del tiempo de revisión encontrando el punto para el cual las áreas en cualquier lado son
iguales.
c) Aproxime el primer cuartil de los tiempos de revisión,
encontrando el punto para el cual 25% del área está a la
izquierda.
d) Aproxime el tercer cuartil del tiempo de revisión encontrando el punto para el que 75% del área está a la izquierda.
e) Aproxime la media del tiempo de revisión calculando el
centro de masa del histograma.
f) Aproxime la varianza del tiempo de revisión, calculando
el momento de inercia con respecto a la media, suponiendo que toda la masa de un rectángulo está concentrada en su punto medio.
Ejercicios adicionales para el capítulo 1
19. En el artículo “The Ball-on-Three-Ball Test for Tensile
Strength: Refined Methodology and Results for Three Hohokam Ceramic Types” (M. Beck, American Antiquity,
2002:558-569) se analiza la resistencia de la cerámica antigua. Se evaluaron algunas muestras de cada uno de tres tipos de cerámica. Las cargas (en kg) requeridas para romper
las muestras son las que aparecen en la tabla de la siguiente
columna.
a) Construya diagramas de caja comparativos para las tres
muestras.
b) ¿Cuántos datos atípicos contiene cada muestra?
c) Comente acerca de las características de las tres muestras.
Tipo de cerámica
Cargas (kg)
Sacaton
15, 30, 51, 20, 17, 19, 20,
34, 17, 15, 23, 19, 15, 18,
16, 22, 29, 15, 13, 15
Planicie del río Gila
27, 18, 28, 25, 55, 21, 18,
34, 23, 30, 20, 30, 31, 25,
28, 26, 17, 19, 16, 24, 19,
9, 31, 19, 27, 20, 45, 15
Casa Grande
20, 16, 20, 36, 27, 35,
66, 15, 18, 24, 21, 30,
20, 24, 23, 21, 13, 21
49
Capítulo
2
Probabilidad
Introducción
El desarrollo de la teoría de la probabilidad fue financiada por apostadores en el siglo XVII,
quienes contrataron a algunos matemáticos famosos para que calculasen la probabilidad correcta de ciertos juegos de azar. Con el tiempo, la gente se dio cuenta de que los procesos científicos también son azarosos y desde entonces se han empleado métodos de probabilidad para
estudiar el entorno físico.
Actualmente, la probabilidad constituye una gran rama de las matemáticas. Existen muchos libros al respecto y numerosos investigadores han dedicado bastante de su tiempo con el
propósito de ampliar su desarrollo. En este capítulo se presenta una introducción de los conceptos de probabilidad más relevantes para el estudio de la estadística.
2.1
Ideas básicas
Para realizar un estudio sistemático de probabilidad, se necesita cierta terminología. Un experimento constituye un proceso con un resultado que no se puede predecir certeramente con
anterioridad. El hecho de lanzar una moneda al aire, arrojar un dado, medir el diámetro de un
perno, pesar los contenidos de una caja de cereal, o medir la resistencia de una cuerda de pescar, son ejemplos de experimentos. Con la finalidad de analizar un experimento en términos
probabilísticos, se debe especificar sus posibles resultados.
Definición
Al conjunto de todos los posibles resultados de un experimento se le llama espacio
muestral.
Al lanzar al aire una moneda se puede utilizar el conjunto {“caras”, “cruces”} como el
espacio muestral. Para arrojar un dado de seis caras, se puede usar al conjunto {1, 2, 3, 4, 5,
6}. Estos espacios muestrales son finitos. Algunos experimentos tienen espacios muestrales
50
2.1
Ideas básicas
51
con un número infinito de resultados. Por ejemplo, imagine que un buril con diámetro de 10
mm hace perforaciones en una lámina de metal. Debido a las variaciones en el ángulo de la
perforación y a los pequeños movimientos en la lámina de metal, los diámetros de los agujeros varían entre 10 y 10.2 mm. Por tanto, para el experimento de perforación sería razonable
un espacio muestral que esté en el intervalo (10.0, 10.2), o en notación de conjuntos, {x | 10.0
< x < 10.2}. Obviamente, este conjunto contiene un número infinito de resultados.
En muchos experimentos se puede escoger entre diversos espacios muestrales. Por
ejemplo, suponga un proceso que produce clavos de acero cuyas longitudes varían entre 5.20
y 5.25 cm. Una opción obvia para el espacio muestral de la longitud de un clavo sería el conjunto {x | 5.20 < x < 5.25}. Sin embargo, si el objetivo fuera simplemente determinar si el clavo es demasiado corto, demasiado largo o está dentro de ciertos límites específicos, una buena
elección sería que el espacio muestral fuera {demasiado corto, demasiado largo, dentro de las
especificaciones}.
Con frecuencia, al estudiar experimentos, se está interesado en un subconjunto particular de resultados. Por ejemplo, se puede tener interés en la probabilidad de que un dado caiga en un número par. El espacio muestral para el experimento es {1, 2, 3, 4, 5, 6} y el
correspondiente a que caiga en un número par es el subconjunto {2, 4, 6}. En el ejemplo del
buril usado para perforar, se puede tener interés en la probabilidad de que un hueco tenga un
diámetro menor a 10.1 mm. Esto último corresponde al subconjunto {x | 10.0 < x < 10.1}.
Existe un nombre especial para el subconjunto de un espacio muestral:
Definición
Un subconjunto de un espacio muestral se denomina evento.
Observe que para cualquier espacio muestral, el conjunto vacío 0/ es un evento, como lo es
todo el espacio muestral. Se dice que un evento ocurrió si el resultado del experimento es alguno de los resultados en el evento. Por ejemplo, si un dado cae en el número 2, habrán ocurrido los eventos {2, 4, 6} y {1, 2, 3}, junto con cualquier otro evento que contenga el
resultado “2”.
Ejemplo
2.1
Un ingeniero eléctrico tiene en su mano dos cajas de resistores, cada una con cuatro de éstos.
Los resistores de la primera caja están etiquetados con 10 Ω (ohms), pero, de hecho, sus resistencias son de 9, 10, 11 y 12 Ω. Los resistores de la segunda caja tienen la etiqueta de 20
Ω, pero sus resistencias son de 18, 19, 20 y 21 Ω. El ingeniero elige un resistor de cada caja
y determina la resistencia de cada uno.
Sea A el evento para el cual el primer resistor tiene una resistencia mayor a 10, sea B el
evento en el que el segundo resistor tiene una resistencia menor a 19 y sea C el evento en el cual
la suma de las resistencias es igual a 28. Determine un espacio muestral para este experimento y especifique los subconjuntos que corresponden a los eventos A, B y C.
Solución
Un buen espacio muestral es el conjunto de pares ordenados en el que el primer elemento representa la resistencia del primer resistor y el segundo elemento constituye la del segundo resistor. Se denotará a este espacio muestral con S .
52
CAPÍTULO 2
Probabilidad
S = {(9, 18), (9, 19), (9, 20), (9, 21), (10, 18), (10, 19), (10, 20), (10, 21),
(11, 18), (11, 19), (11, 20), (11, 21), (12, 18), (12, 19), (12, 20), (12, 21)}
Los eventos A, B y C están dados por
g
y
A = {(11, 18), (11, 19), (11, 20), (11, 21), (12, 18), (12, 19), (12, 20), (12, 21)}
B = {(9, 18), (10, 18), (11, 18), (12, 18)}
C = {(9, 19), (10, 18)}
Combinación de eventos
Con frecuencia se construyen eventos mediante la combinación de eventos más sencillos. Debido a que aquéllos son subconjuntos de espacios muestrales, es usual emplear la notación de
conjuntos para describir los eventos construidos de esta forma. A continuación se repasará la
notación necesaria.
La unión de dos eventos A y B, se denota por A 艛 B, es el conjunto de resultados que
pertenecen ya sea a A o B, o a ambos. Esto es, A 艛 B significa “A o B”. Por tanto, el evento A 艛 B se presenta siempre que ocurre A o B (o ambos).
La intersección de dos eventos A y B se denota como A 傽 B; es decir, constituye el conjunto de resultados que pertenece tanto a A como a B. Por consecuencia, A 傽 B significa
“A y B”. Por consiguiente, el evento A 傽 B se presenta siempre que A y B ocurren.
El complemento de un evento A se denota por Ac, es el conjunto de resultados que no
pertenecen a A. Es decir, Ac significa “no A”. Por consiguiente, el evento Ac se presenta
siempre que no ocurra A.
Los eventos se pueden mostrar gráficamente con los diagramas de Venn. La figura 2.1
muestra los eventos A 艛 B, A 傽 B y B 傽 Ac.
A
B
a)
A
B
b)
B
A
c)
FIGURA 2.1 Diagramas de Venn que muestran varios eventos: a) A ∪ B, b) A ∩ B, c) B ∩ Ac.
Ejemplo
2.2
Con referencia al ejemplo 2.1, determine a B 艛 C y A 傽 Bc.
Solución
El evento B 艛 C contiene todos los resultados que pertenecen a B o a C, o a ambos. Por tanto,
2.1
Ideas básicas
53
B 艛 C ⫽ {(9, 18), (10, 18), (11, 18), (12, 18), (9, 19)}
El evento Bc contiene los resultados en el espacio muestral que no pertenecen a B. De ahí que
el evento A 傽 Bc contenga los resultados que pertenecen a A y no pertenecen a B. Por consiguiente,
A 傽 Bc ⫽ {(11, 19), (11, 20), (11, 21), (12, 19), (12, 20), (12, 21)}
Eventos mutuamente excluyentes
Existen ciertos eventos que nunca se presentan simultáneamente. Por ejemplo, es imposible
que una moneda que se arroje al aire caiga a la vez en “cruz” y “cara”, al igual que un clavo
de acero sea al mismo tiempo demasiado largo y corto. A eventos de este tipo se les llama
mutuamente excluyentes.
Definición
Se dice que los eventos A y B son mutuamente excluyentes si no tienen resultados en común.
De forma más general, se dice que una colección de eventos A1, A2, . . . , An es
mutuamente excluyente si dos de ellos no tienen resultados en común.
El diagrama de Venn en la figura 2.2 muestra eventos mutuamente excluyentes.
A
B
FIGURA 2.2 Los eventos A y B son mutuamente excluyentes.
Ejemplo
2.3
Con referencia al ejemplo 2.1, si se realiza el experimento, ¿es posible que los eventos A y B
ocurran al mismo tiempo? ¿Qué pasa con B y C? ¿A y C? ¿Qué par de eventos es mutuamente excluyente?
Solución
Si el resultado es (11, 18) o (12, 18), entonces tanto el evento A como el B ocurren. Si el resultado es (10, 18), entonces ocurren los eventos B y C. Es imposible que ocurran al mismo tiempo A y C, ya que estos eventos son mutuamente excluyentes al no tener ningún resultado en
común.
54
CAPÍTULO 2
Probabilidad
Probabilidades
Todo evento en un espacio muestral tiene una probabilidad de ocurrir. Intuitivamente, la probabilidad es una medida cuantitativa de qué tan probable es que ocurra un evento. Formalmente hablando, hay varias interpretaciones de la probabilidad; la primera que se adoptará es
que la probabilidad de un evento representa la proporción de veces que se presentaría el evento a largo plazo, si el experimento se repitiera una y otra vez.
Con frecuencia se usa la letra P para representar la probabilidad. Por tanto, cuando se
lanza una moneda al aire la notación “P(“cara”) ⫽ 1/2” significa que la probabilidad de que
la moneda caiga en “cara” es igual a 1/2.
Resumen
Dado un experimento y cualquier evento A:
La expresión P(A) denota la probabilidad de que ocurra el evento A.
P(A) constituye la proporción de veces que se presenta el evento A en el tiempo, si
es que el experimento se realizara una y otra vez.
En muchas situaciones, la única forma de calcular la probabilidad de un evento es repetir el experimento muchas veces y determinar la proporción de veces que ocurre. Por ejemplo, si se deseara calcular la probabilidad de que un tablero de circuitos impresos fabricado
por cierto proceso esté defectuoso, usualmente se necesitaría producir cierta cantidad de tableros y probarlos para determinar la proporción de los defectuosos. En algunos casos, las
probabilidades se pueden determinar si se conoce la naturaleza física del experimento. Por
ejemplo, si se sabe que la forma de un dado es casi igual a la de un cubo perfecto y que su
masa está distribuida aproximadamente en forma homogénea, se puede suponer que cada una
de sus seis caras tiene la misma probabilidad de salir cuando se lanza el dado.
Una vez que se han encontrado las probabilidades de ciertos eventos mediante el conocimiento científico o la experiencia, se puede calcular matemáticamente las probabilidades de
otros eventos. Por ejemplo, si se ha calculado a través de la experimentación que la probabilidad de que un tablero de circuitos impresos esté defectuoso es de 0.10, se puede calcular que
la probabilidad de que un tablero no esté defectuoso es de 0.90. Como otro ejemplo, suponga que los clavos de acero producidos por determinado proceso no cumplen con la longitud
especificada, ya sea porque son demasiado cortos o demasiado largos. Al medir gran cantidad
de clavos, se calculó que la probabilidad de que uno de ellos sea demasiado corto es de 0.02
y que la probabilidad de que otro sea demasiado largo es de 0.03. Entonces puede calcularse
que la probabilidad de que un clavo no cumpla con la especificación es de 0.05.
En la práctica, los científicos e ingenieros calculan las probabilidades de ciertos eventos con base en el conocimiento científico y la experiencia, y posteriormente utilizan reglas
matemáticas para calcular las estimaciones de las probabilidades de otros eventos. En el resto de esta sección y en la sección 2.2, se explican algunas de estas reglas y se muestra cómo
utilizarlas.
Axiomas de la probabilidad
El tema de la probabilidad se basa en tres reglas de sentido común, conocidas como axiomas.
Éstas son:
2.1
55
Ideas básicas
Axiomas de la probabilidad
1. Sea S un espacio muestral. Entonces P(S ) ⫽ 1.
2. Para cualquier evento A, 0 ≤ P(A) ≤ 1.
3. Si A y B son eventos mutuamente excluyentes, entonces P(A 艛 B) ⫽ P(A) ⫹ P(B).
De forma más general, si A1, A2, . . . son eventos mutuamente excluyentes, entonces P(A1 艛 A2 艛 . . . ) ⫽ P(A1) ⫹ P(A2) ⫹ . . .
Si se piensa un poco, es fácil ver que los tres axiomas en realidad concuerdan con el sentido
común. El primero establece que el resultado de un experimento siempre está en el espacio
muestral. Esto es obvio, puesto que, por definición, el espacio muestral contiene todos los resultados posibles del experimento. El segundo dice que la frecuencia a largo plazo de cualquier
evento siempre se encuentra entre 0 y 100%. Un ejemplo que demuestra al tercer axioma, que
ya se analizó anteriormente, es el del proceso que produce clavos de acero, en donde la probabilidad de que un clavo sea demasiado corto es de 0.02 y la de que un clavo es demasiado largo es de 0.03. El tercer axioma establece que la probabilidad de que el clavo sea demasiado
corto o muy largo es 0.02 ⫹ 0.03 ⫽ 0.05.
Ahora se presentan dos reglas sencillas que son útiles para calcular probabilidades. Estas reglas son intuitivamente obvias y también pueden comprobarse a través de los axiomas.
Las demostraciones se encuentran al final de la sección.
Para cualquier evento A,
P(Ac) ⫽ 1 ⫺ P(A)
(2.1)
Si 0/ denota el espacio vacío, entonces
P(0/ ) ⫽ 0
(2.2)
La ecuación (2.1) establece que la probabilidad de que un evento no ocurra es igual a 1 menos la probabilidad de que ocurra. Por ejemplo, si existe una probabilidad de 40% de que llueva, hay una probabilidad de 60% de que no llueva. La ecuación (2.2) establece que es
imposible que un experimento no tenga ningún resultado.
Ejemplo
2.4
El objetivo de una prueba de tiro consiste de un blanco rodeado por dos anillos concéntricos.
Se dispara un proyectil hacia el objetivo. La probabilidad de que pegue en el blanco es de
0.10, la de que atine en el anillo interior es de 0.25 y la de que acierte en el anillo exterior es
de 0.45. ¿Cuál es la probabilidad de que el proyectil haga blanco en el objetivo? ¿Cuál es la
probabilidad de que no pegue en este último?
Solución
Pegar en el blanco, acertar en el anillo interior y atinar en el anillo exterior son eventos mutuamente excluyentes, ya que es imposible que más de uno de éstos ocurra a la vez. Por tanto, utilizando el axioma 3,
56
CAPÍTULO 2
Probabilidad
P(pega en el objetivo) ⫽ P(blanco) ⫹ P(anillo interior) ⫹ P(anillo exterior)
⫽ 0.10 ⫹ 0.25 ⫹ 0.45
⫽ 0.80
Ahora se puede calcular la probabilidad de que el proyectil no pegue en el objetivo utilizando la ecuación (2.1):
P(no pega en el objetivo) ⫽ 1 ⫺ P(pega en el objetivo)
⫽ 1 ⫺ 0.80
⫽ 0.20
Ejemplo
2.5
La siguiente tabla presenta las probabilidades del número de veces en que el sistema de cierta computadora se “caerá” en el transcurso de una semana. Sea A el evento de que haya más
de dos “caídas” durante la semana, y B el evento de que el sistema se “caerá” por lo menos
una vez. Determine el espacio muestral. Después precise los subconjuntos del espacio muestral que corresponden a los eventos A y B. Posteriormente determine P(A) y P(B).
Número de casos
Probabilidad
0
1
2
3
4
0.60
0.30
0.05
0.04
0.01
Solución
El espacio muestral del experimento es el conjunto {0, 1, 2, 3, 4}. Los eventos son A ⫽ {3,
4} y B ⫽ {1, 2, 3, 4}. Para encontrar P(A), advierta que A constituye el evento en que se presenten tres “caídas” o que haya cuatro “caídas”. Los eventos “que se presenten tres caídas” y
“que ocurran cuatro caídas” son mutuamente excluyentes. Por tanto, mediante el axioma tres,
se concluye que
P(A) ⫽ P(ocurran tres “caídas” o se presenten cuatro “caídas”)
⫽ P(ocurran tres “caídas”) ⫹ P(sucedan cuatro “caídas”)
⫽ 0.04 ⫹ 0.01
⫽ 0.05
Se calculará P(B) en dos formas. Primero, observe que Bc es el evento de que no haya ninguna caída. Por tanto, utilizando la ecuación (2.1),
P(B) ⫽ 1 ⫺ P(Bc)
⫽ 1 ⫺ P(no ocurran “caídas”)
⫽ 1 ⫺ 0.60
⫽ 0.40
2.1
57
Ideas básicas
En la segunda forma para calcular P(B), observe que B es el evento de que haya una “caída”
o de que sucedan dos o que ocurran tres “caídas” o haya cuatro de éstas. Estos eventos son
mutuamente excluyentes. Por consiguiente, utilizando el axioma tres, se concluye que
P(B) ⫽ P(una “caída”) ⫹ P(dos “caídas”) ⫹ P(tres “caídas”) ⫹ P(cuatro “caídas”)
⫽ 0.30 ⫹ 0.05 ⫹ 0.04 ⫹ 0.01
⫽ 0.40
En el ejemplo 2.5 se calcularon las probabilidades de los eventos A ⫽ {3, 4} y B ⫽ {1,
2, 3, 4} al sumar las probabilidades de los resultados de cada uno de los eventos: P(A) ⫽ P(3)
⫹ P(4) y P(B) ⫽ P(1) ⫹ P(2) ⫹ P(3) ⫹ P(4). En general, este método funciona. Dado que
cualesquiera dos resultados en un espacio muestral son mutuamente excluyentes, la probabilidad de que cualquier evento contenga un número finito de resultados se puede determinar
mediante la suma de las probabilidades de los resultados que incluyen al evento.
Si A es un evento y A = {E1, E2, . . . , En}, entonces
P(A) ⫽ P(E1) ⫹ P(E2) ⫹ . . . ⫹ P(En)
(2.3)
Espacios muestrales con resultados igualmente probables
En algunos experimentos se puede construir un espacio muestral en el cual todos los resultados sean igualmente probables. Un ejemplo sencillo es el lanzamiento de un dado, en el cual
el espacio muestral es {1, 2, 3, 4, 5, 6} y cada uno de estos resultados tiene una probabilidad
de 1/6. Otro tipo de experimento que tiene resultados igualmente probables es la selección
aleatoria de un elemento a partir de una población de elementos. Se puede suponer que los
elementos en la población son los resultados en un espacio muestral y que cada elemento tiene la misma probabilidad de ser seleccionado.
Una población a partir de la cual se muestrea un elemento en forma aleatoria constituye un espacio muestral con resultados igualmente probables.
Si un espacio muestral contiene N resultados igualmente probables, la probabilidad de
cada resultado es 1/N. Esto es así porque la probabilidad de todo el espacio muestral debe ser
1 y esta probabilidad se divide equitativamente entre los N resultados. Si A representa un
evento que contiene k resultados, entonces se puede determinar P(A) mediante la suma de las
probabilidades de los k resultados, de tal forma que P(A) ⫽ k/N.
Si S es un espacio muestral que contiene N resultados igualmente probables y si A
es un evento que contiene k resultados, entonces
k
P(A) ⫽ —
N
(2.4)
58
Ejemplo
2.6
CAPÍTULO 2
Probabilidad
Un troquel de extrusión se utiliza para producir varillas de aluminio. Existen ciertas especificaciones para la longitud y diámetro de las varillas. Para cada una de éstas, la longitud puede
ser demasiado corta, demasiado larga o estar bien y el diámetro se puede clasificar en muy delgado, muy grueso o estar bien. En una población de mil varillas, el número de ellas en cada
clase es:
Diámetro
Longitud
Muy delgado
Está bien
Muy grueso
Demasiado corta
10
3
5
Está bien
38
900
4
Demasiado larga
2
25
13
Se toma una varilla aleatoriamente a partir de esta población. ¿Cuál es la probabilidad de que
sea demasiado corta?
Solución
Se considera que cada una de las mil varillas representa un resultado en un espacio muestral.
Cada uno de los mil resultados tiene la misma probabilidad. Se resolverá el problema contando el número de resultados que corresponde al evento. El número de varillas que son demasiado cortas es 10 ⫹ 3 ⫹ 5 ⫽ 18. Dado que el número total de varillas es mil,
P(demasiado corta) ⫽ —18
——
1 000
Regla de la suma
Si A y B son eventos mutuamente excluyentes, entonces P(A 艛 B) ⫽ P(A) ⫹ P(B). Esta regla se puede generalizar para abarcar el caso en el que A y B no sean mutuamente excluyentes. En el ejemplo 2.7 se muestra este razonamiento.
Ejemplo
2.7
Con referencia al ejemplo 2.6, si se selecciona aleatoriamente una varilla, ¿cuál es la probabilidad de que sea demasiado corta o demasiado gruesa?
Solución
Primero, se resolverá este problema al contar el número de resultados que corresponde al
evento. En la siguiente tabla se circuló la cantidad de varillas que son demasiado gruesas y el
número de varillas que son muy cortas aparecen en rectángulos. Observe que hay cinco varillas que son muy cortas y demasiado gruesas.
2.1
59
Ideas básicas
Diámetro
Longitud
Muy delgado
Está bien
Muy grueso
Demasiado corta
10
3
5
Está bien
38
900
4
Demasiado larga
2
25
13
De los mil resultados, el número de varillas que son demasiado cortas o muy gruesas es 10 ⫹
3 ⫹ 5 ⫹ 4 ⫹ 13 ⫽ 35. Por consiguiente,
35—
P(demasiado corta o muy gruesa) ⫽ ——
1 000
Ahora se resolverá el problema de tal forma que conduzca a un método más general. En el espacio muestral hay 10 ⫹ 3 ⫹ 5 ⫽ 18 varillas que son demasiado cortas y 5 ⫹ 4 ⫹ 13 ⫽ 22
varillas muy gruesas. Pero si se trata de encontrar el número de varillas que sean demasiado
cortas o muy gruesas al sumar 18 ⫹ 22, se obtiene un número muy grande (40 en vez de 35).
La razón es que hay cinco varillas que son demasiado cortas y muy gruesas y éstas se cuentan dos veces. No obstante, se puede resolver el problema al sumar 18 y 22, pero entonces se
le debe restar cinco para corregir el doble conteo.
Se replantea este razonamiento al utilizar probabilidades:
P(demasiado ⫽ —18
——,
corta) 1 000
P(demasiado corta
o muy gruesa)
22
P(muy ⫽ ——
—,
gruesa)
1 000
5
P(demasiado corta ⫽ ——
—
y muy gruesa)
1 000
⫽
P(demasiado
corta)
⫹
P(muy
gruesa)
⫺
P(demasiado corta
y muy gruesa)
⫽
—18
——
1 000
⫹
—22
——
1 000
⫺
5—
——
1 000
⫽
—35
——
1 000
El método del ejemplo 2.7 es válido para cualesquiera dos eventos en un espacio muestral. En general, para determinar la probabilidad de que ocurran cualesquiera de los dos eventos, se suman las probabilidades de los eventos y después se resta la probabilidad de que ambos
ocurran.
Resumen
Sean A y B cualesquiera eventos, entonces
P(A 艛 B) ⫽ P(A) ⫹ P(B) ⫺ P(A 艚 B)
(2.5)
Una prueba de este resultado, basada en los axiomas, se encuentra al final de esta sección. Observe que si A y B son mutuamente excluyentes, entonces P(A 傽 B) ⫽ 0, por lo que, en este
caso, la ecuación (2.5) se reduce al axioma 3.
60
Ejemplo
2.8
CAPÍTULO 2
Probabilidad
En un proceso que fabrica latas de aluminio, la probabilidad de que una lata tenga alguna fisura en su costado es de 0.02, la de que otra la tenga en la tapa es de 0.03 y de que una más presente una fisura en el costado y en la tapa es de 0.01. ¿Cuál es la probabilidad de que al elegir
una lata en forma aleatoria tenga una fisura? ¿Cuál es la probabilidad de que no la tenga?
Solución
Se tiene que P(fisura en el costado) ⫽ 0.02, P(fisura en la tapa) ⫽ 0.03 y P(fisura en el costado y en la tapa) ⫽ 0.01. Ahora P(fisura) ⫽ P(fisura en el costado o fisura en la tapa). Usando la ecuación (2.5),
P(fisura en el costado o fisura en la tapa) ⫽ P(fisura en el costado) ⫹ P(fisura en la tapa)
⫺P(fisura en el costado y fisura en la tapa)
⫽ 0.02 ⫹ 0.03 ⫺ 0.01
⫽ 0.04
Para determinar la probabilidad de que una lata no tenga ninguna fisura, se calcula
P(ninguna fisura) ⫽ 1 –P(fisura) ⫽ 1 – 0.04 ⫽ 0.96
Demostración de P(Ac) = 1 – P(A)
Sea S un espacio muestral y A un evento. Entonces A y Ac son mutuamente excluyentes;
por tanto, por el axioma 3,
P(A 艛 Ac) ⫽ P(A) ⫹ P(Ac)
Pero A 艛 Ac ⫽ S , y por el axioma 1, P(S ) ⫽ 1. Por consiguiente,
P(A 艛 Ac) ⫽ P(S ) ⫽ 1
Se sigue que P(A) ⫹ P(Ac) ⫽ 1, entonces P(Ac) ⫽ 1 – P(A).
Demostración de P(0/ ) = 0
Sea S un espacio muestral. Entonces 0/ ⫽ S c. Por consecuencia, P(0/ ) ⫽ 1 ⫺ P(S ) ⫽
1 ⫺ 1 ⫽ 0.
Prueba de P(A 艛 B) = P(A) + P(B) – P(A 傽 B)
Sean A y B cualesquiera dos eventos. La clave de la demostración es escribir A 艛 B como
la unión de tres eventos mutuamente excluyentes: A 傽 Bc, A 傽 B y Ac 傽 B.
A 艛 B ⫽ (A 傽 Bc) 艛 (A 傽 B) 艛 (Ac 傽 B)
La siguiente figura ilustra la ecuación (2.6).
(2.6)
=
A
B
僔
A
僔
A
B
61
Ideas básicas
2.1
B
A
B
Por el axioma 3,
P(A 艛 B) ⫽ P(A 傽 Bc) ⫹ P(A 傽 B) ⫽ P(Ac 傽 B)
(2.7)
Ahora A ⫽ (A 傽 Bc) 艛 (A 傽 B) y B ⫽ (Ac 傽 B) 艛 (A 傽 B). Por tanto,
P(A) ⫽ P(A 傽 Bc) ⫹ P(A 傽 B)
(2.8)
P(B) ⫽ P(Ac 傽 B) ⫹ P(A 傽 B)
(2.9)
y
Al sumar las ecuaciones (2.8) y (2.9) se obtiene
P(A) ⫹ P(B) ⫽ P(A 傽 Bc) ⫹ P(Ac 傽 B) ⫹ 2P(A 傽 B)
(2.10)
Al comparar las ecuaciones (2.10) y (2.7) se demuestra que
P(A) ⫹ P(B) ⫽ P(A 艛 B) ⫹ P(A 傽 B)
(2.11)
De ahí que P(A 艛 B) ⫽ P(A) ⫹ P(B) – P(A 傽 B).
Ejercicios para la sección 2.1
1. La probabilidad de que un microcircuito esté defectuoso es
0.08. ¿Cuál es la probabilidad de que no presente defectos?
2. Un dado-octaedro (de ocho caras) tiene el número 1 pintado en dos de sus caras, el 2 en tres de sus caras, el 3 en dos
de sus caras y el 4 en una cara. Se lanza el dado. Suponga
que cada cara tiene la misma probabilidad de salir.
a) Determine el espacio muestral de este experimento.
b) Determine P(número par).
c) Si el dado estuviera cargado de tal forma que la cara con
el número 4 tuviera el doble de probabilidad de salir que
cada una de las otras siete caras, ¿cambiaría esto al espacio muestral? Explique.
d) Si el dado estuviera cargado de manera que la cara con
el número 4 tuviera el doble de probabilidad de salir que
cada una de las otras siete caras, ¿cambiaría esto el valor de P(número par)? Explique.
3. Sesenta por ciento de las grandes compras hechas a un vendedor de computadoras son PC, 30% son portátiles y 10%
son accesorios, como impresoras. Como parte de una auditoría, se elige una muestra aleatoria del registro de una compra.
a) ¿Cuál es la probabilidad de que se trate de una computadora personal?
b) ¿Cuál es la probabilidad de que se trate de una computadora personal o de una portátil?
4. Una unidad producida en cierto proceso tiene una probabilidad de 0.10 de que sea defectuosa. Verdadero o falso:
a) Si se toma una muestra de 100 unidades, exactamente
10 de ellas serán defectuosas.
b) Si se toma una muestra de 100 unidades, el número de
unidades defectuosas será aproximadamente 10, pero no
exactamente 10.
c) A medida que se toman más y más unidades, la proporción de unidades defectuosas se acercará a 10 por ciento.
62
CAPÍTULO 2
Probabilidad
5. Un ingeniero que vigila el control de calidad toma una
muestra de 100 unidades fabricadas por determinado proceso y encuentra que 15 de ellas son defectuosas. Verdadero o
falso.
a) La probabilidad de que una unidad fabricada por este
proceso esté defectuosa es 0.15.
8. El cuerpo humano puede contener uno o dos antígenos, A y
B. A la sangre que contiene sólo el antígeno A se le denomina tipo A, a la que contiene sólo el B se le conoce como tipo
B, a la que contiene a ambos se le llama tipo AB y a la sangre que no contiene ninguno se le denomina tipo O. En cierto banco de sangre, 35% de los donantes de sangre tiene el
tipo de sangre A, 10% el tipo B y 5% el tipo AB.
b) La probabilidad de que una unidad fabricada por este
proceso esté defectuosa se aproxima a 0.15, pero no es
exactamente igual a 0.15.
6. Un sistema contiene dos componentes, A y B. El sistema
funcionará siempre y cuando A o B funcionen. La probabilidad de que A funcione es 0.95, que B funcione es 0.90 y que
ambos funcionen es 0.88. ¿Cuál es la probabilidad de que el
sistema funcione?
a) ¿Cuál es la probabilidad que se elija aleatoriamente a un
donante de sangre de tipo O?
b) Un receptor con sangre tipo A puede recibir sin ningún peligro de un donante sangre que no tenga el antígeno B.
¿Cuál es la probabilidad de que un donante elegido aleatoriamente pueda donar al receptor con sangre tipo A?
9. Verdadero o falso: Si A y B son mutuamente excluyentes,
7. Un sistema contiene dos componentes, A y B. El sistema sólo funcionará si ambos funcionan. La probabilidad de que A
funcione es 0.98, que B funcione es 0.95 y que A o B funcionen es 0.99. ¿Cuál es la probabilidad de que el sistema
funcione?
2.2
a)
b)
c)
d)
P (A ∪ B) = 0
P (A ∩ B) = 0
P (A ∪ B) = P (A ∩ B)
P (A ∪ B) = P (A) + P (B)
Métodos de conteo*
Cuando se calculan probabilidades, algunas veces se necesita determinar el número de resultados en un espacio muestral. En esta sección se describirán diversos métodos con ese propósito. La regla básica, que se conoce como principio fundamental de conteo, se presenta
por medio del ejemplo 2.9.
Ejemplo
2.9
Cierto tipo de automóvil se encuentra disponible en tres colores: rojo, azul o verde, y puede
tener un motor grande o pequeño. ¿De cuántas maneras puede un comprador elegir un automóvil?
Solución
Hay tres opciones de color y dos opciones de motor. Una lista completa de las opciones se
muestra en la siguiente tabla de 3 × 2. El número total de opciones es (3)(2) ⫽ 6.
Rojo
Azul
Verde
Grande
Rojo, grande
Azul, grande
Verde, grande
Pequeño
Rojo, pequeño
Azul, pequeño
Verde, pequeño
* Esta sección es opcional.
2.2
Métodos de conteo
63
Al generalizar el ejemplo 2.9, si hay n1 elecciones de color y n2 elecciones de motor,
una lista completa de elecciones se puede escribir como una tabla n1 × n2, por lo que el número total de elecciones es n1n2.
Si una operación se puede realizar en n1 maneras y si para cada una de esas maneras
se puede realizar una segunda operación en n2 maneras, entonces el número total de
maneras en que se realizan las dos operaciones es n1n2.
Este razonamiento del principio fundamental del conteo de estados se puede ampliar
para cualquier número de operaciones.
El principio fundamental del conteo
Suponga que se pueden realizar k operaciones. Si hay n1 maneras de realizar la primera operación y si para cada una de esas maneras hay n2 maneras de realizar la segunda operación y si para cada una de esas elecciones de esas maneras de realizar las
dos primeras operaciones hay n3 maneras de realizar la tercera operación y así sucesivamente, entonces el número total de maneras de realizar la secuencia de las k operaciones es n1n2 . . . nk.
Ejemplo
2.10
Cuando se hace un pedido de cierto tipo de computadora, hay tres elecciones de disco duro,
cuatro de la cantidad de memoria, dos de la tarjeta de video y tres de monitor. ¿En cuántas
maneras se puede solicitar una computadora?
Solución
El número total es (3)(4)(2)(3) ⫽ 72.
Permutaciones
Una permutación constituye un ordenamiento de un conjunto de elementos. Por ejemplo, hay
seis permutaciones de las letras A, B, C: ABC, ACB, BAC, BCA, CAB y CBA. Con solamente tres elementos, es fácil determinar el número de permutaciones, sólo con hacer una lista de
todas ellas. Pero con un gran número de elementos esto último no sería factible. El principio
fundamental del conteo se puede usar para determinar el número de permutaciones de cualquier conjunto de elementos. Por ejemplo, se puede determinar el número de permutaciones
de un conjunto de tres elementos de la siguiente manera. Hay tres elecciones para colocar el
primer elemento. Después de que se hace la elección, hay dos elecciones restantes para el elemento del segundo lugar. Entonces queda una elección para el elemento del último lugar. Por
tanto, el número total de maneras de ordenar tres objetos es (3)(2)(1) ⫽ 6. Este razonamiento se puede generalizar. El número de permutaciones de un conjunto de n elementos es
n(n − 1)(n − 2) · · · (3)(2)(1)
Éste es el producto de los enteros del 1 al n. Este producto se puede escribir con el símbolo
n!, que se lee “n factorial”.
64
CAPÍTULO 2
Probabilidad
Definición
Para cualquier entero positivo n, n! ⫽ n(n ⫺ l)(n ⫺ 2) . . . (3)(2)(1).
También se define a 0! ⫽ 1.
El número de permutaciones de n objetos es n!
Ejemplo
2.11
Cinco personas están en la hilera de un cine. ¿En cuántas maneras diferentes se pueden ordenar?
Solución
El número de permutaciones de un conjunto de cinco personas es 5! ⫽ (5)(4)(3)(2)(1) ⫽ 120.
A veces se está interesado en contar el número de permutaciones de los subconjuntos de
cierto tamaño elegidos de un conjunto más grande. Lo anterior se muestra en el ejemplo 2.12.
Ejemplo
2.12
Cinco salvavidas están disponibles para la guardia de un sábado por la tarde. Hay tres estaciones salvavidas. ¿De cuántas maneras se pueden elegir y organizar los tres salvavidas entre
las estaciones?
Solución
Se usa el principio fundamental del conteo. Hay cinco maneras de elegir a un salvavidas para
que ocupe la primera estación, luego cuatro de elegir a un salvavidas para que ocupe la segunda estación y por último tres para elegir un salvavidas que ocupe la tercera estación. El número total de permutaciones de los tres salvavidas elegidos entre los cinco es (5)(4)(3) ⫽ 60.
El razonamiento usado para resolver el ejemplo 2.12 se puede generalizar. El número
de permutaciones de k objetos elegidos de un grupo de n objetos es
(n)(n − 1) · · · (n − k + 1)
Esta expresión se puede simplificar utilizando la notación factorial:
n(n − 1) · · · (n − k + 1)(n − k)(n − k − 1) · · · (3)(2)(1)
(n − k)(n − k − 1) · · · (3)(2)(1)
n!
=
(n − k)!
(n)(n − 1) · · · (n − k + 1) =
2.2
Métodos de conteo
65
Resumen
El número de permutaciones de k objetos elegidos de un grupo de n elementos es
n!
.
(n − k)!
Combinaciones
En algunos casos, cuando se elige un conjunto de elementos de un conjunto más grande, no
se tiene en cuenta el orden de los elementos elegidos; sólo se consideran los elementos que se
eligen. Por ejemplo, puede que no importe qué salvavidas ocupe cada estación; puede que sólo sea importante la elección de tres salvavidas. A cada grupo distinto de elementos que se
puede seleccionar, sin importar el orden, se le llama combinación. A continuación se mostrará cómo determinar el número de combinaciones de k elementos elegidos de un conjunto de
n objetos. Se mostrará el razonamiento con el resultado del ejemplo 2.12. En ese ejemplo se
mostró que hay 60 permutaciones de tres elementos elegidos entre cinco. Al denotar a los elementos por A, B, C, D, E, en la figura 2.3 se presenta una lista de las 60 permutaciones.
ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE
ACB ADB AEB ADC AEC AED BDC BEC BED CED
BAC BAD BAE CAD CAE DAE CBD CBE DBE DCE
BCA BDA BEA CDA CEA DEA CDB CEB DEB DEC
CAB DAB EAB DAC EAC EAD DBC EBC EBD ECD
CBA DBA EBA DCA ECA EDA DCB ECB EDB EDC
FIGURA 2.3 Las 60 permutaciones de tres elementos elegidos entre cinco.
Las 60 permutaciones de la figura 2.3 están ordenadas en diez columnas de seis permutaciones cada una. Dentro de cada columna, los tres elementos son los mismos y la columna
contiene las seis permutaciones diferentes de esos tres elementos. Por tanto, cada columna representa una combinación distinta de tres elementos elegidos entre cinco y hay diez combinaciones de ese tipo. Por tanto, la figura 2.3 muestra que el número de combinaciones de tres
elementos elegido entre cinco se puede encontrar al dividir el número de permutaciones de
los tres elementos elegidos, o sea 5!/(5 ⫺ 3)!, por el número de permutaciones de los tres
elementos, que es 3! En resumen, el número de combinaciones de los tres elementos elegidos es
5!
.
3!(5 − 3)!
Con frecuencia el número de combinaciones de k elementos elegidos de n se denota por
n
el símbolo
. El razonamiento utilizado para deducir el número de combinaciones de los
k
n
.
tres elementos elegidos se puede generalizar para deducir una expresión para
k
66
CAPÍTULO 2
Probabilidad
Resumen
El número de combinaciones de k elementos elegidos de un grupo de n elementos es
n
n!
(2.12)
=
k
k!(n − k)!
Ejemplo
2.13
A cierto evento asisten 30 personas y se elegirá aleatoriamente a cinco para recibir premios.
Estos últimos son iguales, así que el orden en que se elige a las personas no es importante.
¿Cuántos grupos diferentes de cinco personas se puede elegir?
Solución
En virtud de que el orden de las cinco personas elegidas no es importante, se tiene que calcular el número de combinaciones de cinco elegidas entre 30. Esto es
30!
30
=
5
5!25!
(30)(29)(28)(27)(26)
=
(5)(4)(3)(2)(1)
= 142,506
Elegir una combinación de k elementos de un conjunto de n divide a los n elementos en
dos subconjuntos: k que fueron elegidos y n ⫺ k que no fueron elegidos. A veces un conjunto se divide en más de dos subconjuntos. Por ejemplo, suponga que en una clase de 12 estudiantes se asignará un proyecto a los estudiantes para trabajar en equipos. Se formarán tres
equipos, que constarán de cinco, cuatro y tres estudiantes. Se puede calcular el número de maneras en las que se formarán los equipos del siguiente modo. Se considera el proceso para dividir la clase en tres equipos como una secuencia de dos operaciones. La primera operación
es seleccionar una combinación de cinco estudiantes para formar el equipo de cinco. La segunda consiste en elegir una combinación de cuatro estudiantes entre los siete restantes, para
formar el equipo de cuatro. El equipo de tres automáticamente constará de los tres estudiantes que quedan.
El número de maneras de realizar la primera operación es
12
12!
=
5
5!7!
Después de que se ha realizado la primera operación, el número de las maneras de realizar la
segunda operación es
7
7!
=
4!3!
4
Por tanto, el número total de maneras de realizar la secuencia de las dos operaciones es
12!
12! 7!
=
= 27,720
5!7! 4!3!
5!4!3!
2.2
Métodos de conteo
67
Observe que el numerador en la respuesta final es el factorial del tamaño total del grupo,
mientras que el denominador constituye el producto de los factoriales de los tamaños de los
equipos elegidos de éste. Esto último es válido en general.
Resumen
El número de maneras de dividir un grupo de n elementos en grupos de k1, . . . , kr
elementos, donde k1 ⫹ . . . ⫹ kr ⫽ n, es
n!
(2.12)
k1 ! · · · kr !
Ejemplo
2.14
Se lanza un dado 20 veces. En virtud de que en tres de las tiradas salió el número 1, en cinco
el 2, en cuatro el 3, en dos el 4 y en tres el 6, ¿cuántos arreglos diferentes de resultados hay?
Solución
Hay 20 resultados. Están divididos en seis grupos; a saber, el grupo de tres resultados en los
que salió 1, el de cinco en los que salió 2 y así sucesivamente. El número de maneras de dividir los 20 resultados en seis grupos de tamaños específicos es
20!
= 1.955 × 1012
3!5!4!2!3!3!
Cuando un espacio muestral consta de resultados igualmente probables, la probabilidad
de un evento se puede encontrar al dividir el número de resultados en el evento entre el número total de resultados en el espacio muestral. A veces se pueden usar las reglas de conteo
para calcular estos números, como se muestra en el siguiente ejemplo:
Ejemplo
2.15
En una caja de pernos se encuentran ocho gruesos, cinco medianos y tres angostos. Una caja
de tuercas contiene seis que ajustan con los pernos gruesos, cuatro que ajustan con los pernos
medianos y dos que ajustan con los pernos angostos. Se elige aleatoriamente un perno y una
tuerca, ¿cuál es la probabilidad de que la tuerca ajuste con el perno?
Solución
El espacio muestral consta de todos los pares de tuercas y pernos y cada par es igualmente
probable de ser elegido. El evento de que la tuerca ajuste con el perno corresponde al conjunto de todos los pares que ajustan de tuercas y pernos. Por tanto,
número de pares de tuercas y pernos que se ajustan
P(tuerca ajusta con perno) ⫽ ——————————————————————————————————
número de pares de tuercas y pernos
Hay 6 ⫹ 4 ⫹ 2 ⫽ 12 tuercas y 8 ⫹ 5 ⫹ 3 ⫽ 16 pernos. Por tanto,
Número de pares de tuercas y pernos ⫽ (12)(16) ⫽ 192
68
CAPÍTULO 2
Probabilidad
El número de pares que se ajusta se encuentra al sumar el número de pares de tuercas y pernos gruesos, el de pares de tuercas y pernos medianos y el de pares de tuercas y pernos angostos. Estos números son
Número de pares de tuercas y pernos gruesos ⫽ (6)(8) ⫽ 48
Número de pares de tuercas y pernos medianos ⫽ (4)(5) ⫽ 20
Número de pares de tuercas y pernos angostos ⫽ (2)(3) ⫽ 6
Por tanto,
48 ⫹ 20 ⫹ 6
P(tuercas que ajustan a los pernos) ⫽ —————————— ⫽ 0.3854
192
Ejercicios para la sección 2.2
1. Las moléculas de ADN constan de secuencias químicamente enlazadas a las bases adenina, guanina, citosina y tiamina, denotadas por A, G, C y T. Una secuencia de tres bases
se llama codón.
a) ¿Cuántos codones diferentes hay?
b) Las bases A y G son purinas, mientras que las C y T son
pirimidínicas. ¿Cuántos codones hay cuya primera y
tercera bases son purinas y cuya segunda base es una pirimidínica?
c) ¿Cuántos codones constan de tres bases diferentes?
2. Un ingeniero químico está diseñando un experimento para
determinar el efecto de temperatura, la razón de activación
y el tipo de catalizador en la producción de reacción dada.
Quiere estudiar cinco temperaturas diferentes de reacción,
dos razones de activación distintas y cuatro catalizadores
diferentes. Si cada operación del experimento implica la
elección de una temperatura, una razón de activación y un
catalizador, ¿cuántas operaciones diferentes son posibles?
3. Diez ingenieros han solicitado un puesto administrativo en
una gran empresa. Se seleccionará a cuatro de ellos como
finalistas para el puesto. ¿De cuántas maneras se puede hacer esta selección?
4. Un comité de ocho personas debe elegir un presidente, un
vicepresidente y un secretario. ¿De cuántas maneras se puede hacer esta selección?
5. Una prueba consta de 15 preguntas. Diez son preguntas verdadero-falso y cinco son de elección múltiple que tienen
cuatro opciones cada una. Un estudiante debe seleccionar
una respuesta para cada pregunta. ¿De cuántas maneras se
puede hacer esta prueba?
6. En cierto estado, las placas constan de tres letras seguidas
de tres números.
a) ¿Cuántas placas diferentes se pueden hacer?
b) ¿Cuántas placas diferentes se pueden hacer de tal forma
que ninguna letra o número aparezca más de una vez?
c) Una placa se elige aleatoriamente. ¿Cuál es la probabilidad de que ninguna letra o número aparezca más de
una vez?
7. Una contraseña de computadora consta de ocho caracteres.
a) ¿Cuántas contraseñas diferentes son posibles si cada caracter puede ser cualquier letra minúscula o dígito?
b) ¿Cuántas contraseñas diferentes son posibles si cada caracter puede ser cualquier letra minúscula o dígito y al
menos un caracter debe ser un dígito?
c) Un sistema de computadora requiere que las contraseñas
contengan al menos un dígito. Si se generan ocho caracteres aleatoriamente y cada uno es igualmente probable
de ser cualesquiera de las 26 letras o de los diez dígitos,
¿cuál es la probabilidad de que se genere una contraseña válida?
8. Una compañía ha contratado a 15 nuevos empleados y debe
asignar seis al turno matutino, cinco al vespertino y cuatro al
nocturno. ¿De cuántas maneras se puede hacer la asignación?
9. Un cajón en un tocador contiene ocho calcetines azules y
seis blancos. Un segundo cajón contiene cuatro calcetines
azules y dos calcetines blancos. Se elige un calcetín de cada cajón. ¿Cuál es la probabilidad de que combinen?
10. Un cajón contiene seis calcetines rojos, cuatro verdes y dos
negros. Se elige dos calcetines aleatoriamente. ¿Cuál es la
probabilidad de que combinen?
2.3
2.3
Probabilidad condicional e independencia
69
Probabilidad condicional e independencia
Un espacio muestral contiene todos los resultados posibles de un experimento. A veces se obtiene algo de información adicional acerca de un experimento que indica que los resultados
provienen de cierta parte del espacio muestral. En este caso, la probabilidad de un evento está basada en los resultados de esa parte del espacio muestral. Una probabilidad que se basa en
una parte de un espacio muestral se llama probabilidad condicional. Se analizará esta idea
a través de algunos ejemplos.
En el ejemplo 2.6 (en la sección 2.1) se analizó una muestra de mil varillas de aluminio. Para cada varilla, la longitud se clasifica como demasiado corta, demasiado larga o está
bien y el diámetro se clasifica como muy delgado, muy grueso o está bien. Esas mil varillas
constituyen un espacio muestral en el que cada varilla tiene la misma probabilidad de ser seleccionada. El número de varillas en cada categoría se presenta en la tabla 2.1. De las mil varillas, 928 satisfacen la especificación de diámetro. Por tanto, si se selecciona una varilla,
P(diámetro está bien) ⫽ 928/1 000 ⫽ 0.928. A esta circunstancia se le llama probabilidad
incondicional, ya que se basa en todo el espacio muestral. Ahora suponga que se toma una
varilla, se mide su longitud y se encuentra que satisface la especificación. ¿Cuál es la probabilidad de que el diámetro también satisfaga la especificación? La clave para calcular esta probabilidad es darse cuenta de que el saber que la longitud satisface la especificación reduce el
espacio muestral del que se seleccionó la varilla. La tabla 2.2 presenta esta idea. Una vez que
se conoce que se satisface la especificación de la longitud, se sabe que esa varilla será una de
las 942 en el espacio muestral que se presenta en la tabla 2.2.
TABLA 2.1 Espacio muestral que contiene mil varillas de aluminio
Diámetro
Longitud
Muy delgado
Está bien
Muy grueso
Demasiado corta
10
3
5
Está bien
38
900
4
Demasiado larga
2
25
13
TABLA 2.2 Espacio muestral reducido que contiene 942 varillas
de aluminio que satisfacen la especificación de la longitud
Diámetro
Longitud
Muy delgado
Está bien
Muy grueso
Demasiado corta
—
—
—
Está bien
38
900
4
Demasiado larga
—
—
—
De las 942 varillas de este espacio muestral, 900 satisfacen la especificación del diámetro. Por tanto, si se sabe que la varilla satisface la especificación de longitud, la probabilidad
70
CAPÍTULO 2
Probabilidad
de que la varilla satisfaga la especificación del diámetro es: 900/942. Se dice que la probabilidad condicional de que la varilla satisfaga la especificación de un diámetro dado que satisface la especificación de longitud es igual a 900/942 y se escribe P(diámetro está bien⏐longitud
está bien) ⫽ 900/942 ⫽ 0.955. Observe que la probabilidad condicional P(diámetro está
bien⏐longitud está bien) es diferente de la probabilidad incondicional P(diámetro está bien),
que se calculó para todo el espacio muestral (tabla 2.1) de 0.928.
Ejemplo
2.16
Calcule la probabilidad condicional P(diámetro está bien⏐longitud demasiado larga). ¿Ésta es
la misma que la probabilidad incondicional P(diámetro está bien)?
Solución
La probabilidad condicional P(diámetro está bien⏐longitud demasiado larga) se calcula bajo
la suposición de que la varilla es demasiado larga. Esto último reduce el espacio muestral a
los 40 elementos que se muestran en negritas en la tabla siguiente.
Diámetro
Longitud
Muy delgado
Está bien
Muy grueso
Demasiado corta
10
3
5
Está bien
38
900
4
Demasiado larga
2
25
13
De los 40 resultados, 25 satisfacen la especificación de diámetro. Por tanto
P(diámetro está bien ⏐ longitud demasiado larga) =
25
= 0.625
40
La probabilidad incondicional P(diámetro está bien) se calcula con base en todos los mil resultados en el espacio muestral y es igual a 928/1 000 ⫽ 0.928. En este caso, la probabilidad
condicional es diferente de la probabilidad incondicional.
Se analizará la solución del ejemplo 2.16 detenidamente. Se encuentra que
P(diámetro está bien ⏐ longitud demasiado larga) =
25
40
En la respuesta 25/40, el denominador, 40, representa el número de resultados que satisfacen
la condición de que la varilla es demasiado larga, mientras que el numerador, 25, representa el
número de resultados que satisfacen ambas condiciones, que la varilla es demasiado larga y
que su diámetro está bien. Si dividimos tanto al numerador como al denominador de esta respuesta entre el número de resultados en todo el espacio muestral, que es de mil, se obtiene
2.3
71
Probabilidad condicional e independencia
P(diámetro está bien ⏐ longitud demasiado larga) =
25/1 000
40/1 000
Ahora 40/1 000 representa la probabilidad de que se satisface la condición de que la varilla
es demasiado larga. Esto es,
P(longitud demasiado larga) =
40
1 000
La cantidad 25/1 000 representa la probabilidad de que se satisfacen tanto la condición de que
la varilla es demasiado larga y de que el diámetro está bien. Esto es,
P(diámetro está bien y longitud demasiado larga) =
25
1 000
Ahora se puede expresar la probabilidad condicional como
P(diámetro está bien y longitud
demasiado larga)
P(diámetro está bien ⏐ longitud demasiado larga) ⫽ ——————————————————
P(longitud demasiado larga)
Este razonamiento se puede ampliar para construir una definición de la probabilidad
condicional que es válida para cualquier espacio muestral.
Definición
Sean A y B eventos con P(B) ⫽ 0. La probabilidad condicional de A dado B es
P (A|B) =
P (A ∩ B)
P (B)
(2.14)
La figura 2.4 presenta diagramas de Venn para ilustrar la idea de la probabilidad condicional.
A
B
a)
A
B
b)
FIGURA 2.4 a) El diagrama representa la probabilidad incondicional
P(A). P(A) se muestra al considerar el evento A en proporción con todo el espacio muestral, el cual se representa por el rectángulo. b) El
diagrama representa la probabilidad condicional P(A|B). Puesto que se
sabe que ocurre el evento B, ahora éste será el espacio muestral. Para
que el evento A ocurra, el resultado debe estar en la intersección A ∩
B. Por tanto, la probabilidad condicional P(A|B) se muestra al considerar la intersección A ∩ B en proporción con todo el evento B.
72
CAPÍTULO 2
Ejemplo
2.17
En referencia al ejemplo 2.8 de la sección 2.1, ¿cuál es la probabilidad de que una lata tenga
una fisura en el costado, dado que tiene una fisura en la tapa?
Probabilidad
Solución
Se tiene que P(fisura en la tapa) ⫽ 0.03 y que P(fisura en el costado y fisura en la tapa) ⫽
0.01, utilizando la ecuación (2.14),
P(fisura en el costado y fisura en la tapa)
P(fisura en el costado ⏐ fisura en la tapa) ⫽ —————————————————————————
P(fisura en la tapa)
=
0.01
0.03
= 0.33
Ejemplo
2.18
Con referencia al ejemplo 2.8 (en la sección 2.1), ¿cuál es la probabilidad de que una lata tenga una fisura en la tapa, dado que tiene una fisura en el costado?
Solución
Se tiene que P(fisura en el costado) ⫽ 0.02 y que P(fisura en el costado y fisura en la tapa)
⫽ 0.01. Utilizando la ecuación (2.14),
P(fisura en la tapa y fisura en el costado)
P(fisura en la tapa ⏐ fisura en el costado) ⫽ —————————————————————————
P(fisura en el costado)
=
0.01
0.02
= 0.5
Los resultados de los ejemplos 2.17 y 2.18 muestran que en general, P(A⏐B) ⫽ P(B⏐A).
Eventos independientes
Algunas veces el conocimiento de que un evento ha ocurrido no cambia la probabilidad de
que ocurra otro. En este caso las probabilidades condicional e incondicional son las mismas
y se dice que los eventos son independientes. A continuación se presenta un ejemplo.
Ejemplo
2.19
Si una varilla de aluminio se selecciona del espacio muestral que se presenta en la tabla 2.1,
determine P(demasiado larga) y P(demasiado larga⏐muy angosta). ¿Estas probabilidades son
diferentes?
2.3
73
Probabilidad condicional e independencia
Solución
40
P(demasiado larga) ⫽ ——————⫽ 0.040
1 000
P(demasiado larga y muy angosta)
P(demasiado larga⏐muy angosta) ⫽ ————————————————————
P(muy angosta)
=
2/1 000
50/1 000
= 0.040
La probabilidad condicional y la probabilidad incondicional son las mismas. La información de
que la varilla es muy angosta no cambia la probabilidad de que la varilla es demasiado larga.
El ejemplo 2.19 muestra que el conocimiento de que un evento ocurre a veces no cambia la probabilidad de que ocurra otro evento. En estos casos, se dice que los dos eventos son
independientes. El evento de que una varilla es demasiada larga y el evento de que una varilla es muy angosta son independientes. A continuación se presenta una definición más precisa del término, tanto en palabras como en símbolos.
Definición
Dos eventos A y B son independientes si la probabilidad de cada uno es la misma si
ocurren o no los demás eventos.
En símbolos: si P(A) ⫽ 0 y P(B) ⫽ 0, entonces A y B son independientes si
P(B⏐A) ⫽ P(B)
o, de manera equivalente,
P(A⏐B) ⫽ P(A)
(2.15)
Si P(A) ⫽ 0 o P(B) ⫽ 0, entonces A y B son independientes.
Si A y B son independientes, entonces los siguientes pares de eventos son también independientes: A y Bc, Ac y B y Ac y Bc. La prueba de este hecho se deja como ejercicio.
El concepto de independencia se puede ampliar para más de dos eventos:
Definición
Los eventos Al, A2, . . . , An son independientes si la probabilidad de cada uno permanece igual no importando lo que ocurre con los otros.
En símbolos: los eventos Al, A2, . . . , An son independientes si para cada Ai, y cada
colección Ajl, Aj2, . . . , Ajm de eventos con P(Ajl 艚 . . . 艚 Ajm) ⫽ 0,
P(Ai⏐Ajl 艚 . . . 艚 Ajm) ⫽ P(Ai)
(2.16)
74
CAPÍTULO 2
Probabilidad
La regla de la multiplicación
Algunas veces se conoce P(A⏐B) y se desea encontrar P(A 傽 B). Se puede obtener un resultado que sea útil para este propósito al multiplicar ambos lados de la ecuación (2.14) por P(B).
Esto conduce a la regla de la multiplicación.
Si A y B son dos eventos con P(B) ⫽ 0, entonces
P(A 艚 B) ⫽ P(B) P(A ⏐ B)
(2.17)
Si A y B son dos eventos con P(A) ⫽ 0, entonces
P(A 艚 B) ⫽ P(A) P(B ⏐ A)
(2.18)
Si P(A) ⫽ 0 y P(B) ⫽ 0, entonces tanto la ecuación (2.17) como la (2.18) son válidas.
Cuando dos eventos son independientes, entonces P(A⏐B) ⫽ P(A) y P(A⏐B) ⫽ P(B),
así la regla de la multiplicación se simplifica:
Si A y B son eventos independientes, entonces
P(A 艚 B) ⫽ P(A) P(B)
(2.19)
Este resultado se puede ampliar para cualquier número de eventos. Si A1, A2, . . . , An
son eventos independientes, entonces para cada colección Ajl, Aj2, . . . , Ajm de eventos
P(Aj1 艚 Aj2 艚 . . . 艚 Ajm) ⫽ P(Aj1) P(Aj2) . . . P(Ajm)
(2.20)
P(A1 艚 A2 艚 . . . 艚 An) ⫽ P(A1) P(A2) . . . P(An)
(2.21)
En particular,
Ejemplo
2.20
Un vehículo tiene dos motores: uno principal y otro auxiliar. El componente del motor falla sólo si fallan ambos motores. La probabilidad de que el motor principal falle es de 0.05 y la de
que el motor auxiliar falle es de 0.10. Suponga que los motores principal y auxiliar funcionan
de manera independiente. ¿Cuál es la probabilidad de que el componente del motor falle?
Solución
La probabilidad de que el componente del motor falle es la probabilidad de que ambos motores fallen. Por tanto,
P(componente del motor falla) ⫽ P(motor principal falla y motor auxiliar falla)
Puesto que los motores son independientes, se puede usar la ecuación (2.19):
2.3
Probabilidad condicional e independencia
75
P(motor principal falla y motor auxiliar falla) ⫽ P(motor principal falla)P(motor auxiliar falla)
⫽ (0.10)(0.05)
⫽ 0.005
Ejemplo
2.21
Un sistema contiene dos componentes, A y B. Ambos componentes deben funcionar para que
el sistema trabaje. La probabilidad de que el componente A falle es de 0.08 y de que el B lo
haga es de 0.05. Suponga que los dos componentes funcionan de manera independiente, ¿cuál
es la probabilidad de que el sistema funcione?
Solución
La probabilidad de que el sistema funcione es la probabilidad de que ambos componentes
funcionen. Por tanto,
P(funciona el sistema) ⫽ P(funciona A y funciona B)
Puesto que los componentes funcionan de manera independiente,
P(funciona A y funciona B) ⫽ P(A funciona)P(B funciona)
⫽ [1 ⫺ P(falla A)][1 ⫺ P(falla B)]
⫽ (1 ⫺ 0.08)(1 ⫺ 0.05)
⫽ 0.874
Ejemplo
2.22
De los microprocesadores fabricados mediante cierto proceso, 20% está defectuoso. Se elige
aleatoriamente cinco de aquéllos. Suponga que funcionan independientemente, ¿cuál es la
probabilidad de que todos funcionen?
Solución
Para i ⫽ 1, . . . , 5, sea que Ai denote el evento de que el i-ésimo microprocesador funcione.
Entonces
P(los 5 funcionan) = P (A1 ∩ A2 ∩ A3 ∩ A4 ∩ A5 )
= P (A1 )P (A2 )P (A3 )P (A4 )P (A5 )
= (1 − 0.20)5
= 0.328
Ejemplo
2.23
En el ejemplo 2.22, ¿cuál es la probabilidad de que al menos uno de los microprocesadores
funcione?
Solución
La manera más fácil de resolver este problema es observar que
P(al menos uno funciona) ⫽ 1 ⫺ P(todos están defectuosos)
Ahora, denotando a Di como el evento que el i-ésimo microprocesador es defectuoso,
76
CAPÍTULO 2
Probabilidad
P(todos están defectuosos) ⫽ P(D1 傽 D2 傽 D3 傽 D4 傽 D5)
⫽ P(D1)P(D2)P(D3)P(D4)P(D5)
⫽ (0.20)5
⫽ 0.0003
Por tanto, P(al menos uno funciona) ⫽ 1 ⫺ 0.0003 ⫽ 0.9997.
Las ecuaciones (2.19) y (2.20) indican cómo calcular las probabilidades cuando se sabe que los eventos son independientes, pero no son generalmente de mucha ayuda para determinar si dos eventos son realmente independientes. En la mayoría de los casos, la mejor
manera de determinar si los eventos son independientes es comprendiendo el proceso que los
produce. He aquí algunos ejemplos:
Se tira dos veces un dado. Es razonable creer que el resultado de la segunda tirada no
se vea afectado por el resultado de la primera. Por tanto, conocer el resultado de la primera tirada no ayuda a predecir el resultado de la segunda. Las dos tiradas son independientes.
Cierta reacción química se realiza dos veces, utilizando equipos diferentes cada vez. Es
razonable creer que el producto de una reacción no afectará la producción de la otra. En
este caso los productos son independientes.
Una reacción química se realiza dos veces sucesivamente, utilizando el mismo equipo.
En este caso, no es sensato suponer que las producciones son independientes. Por ejemplo, una producción baja en la primera realización podría indicar que hay más residuos
de lo normal. Lo anterior podría tender a hacer que la producción en la siguiente realización fuese más alta. Por tanto, conocer la primera producción puede ayudar a predecir la producción en la segunda realización.
Los elementos en una muestra aleatoria simple se pueden tratar como independientes,
a menos que la población sea finita y la muestra consista de más de 5% de la población
(véase el análisis de independencia en la sección 1.1).
Ley de la probabilidad total
La ley de la probabilidad total se muestra en la figura 2.5. Un espacio muestral contiene los
eventos Al, A2, A3 y A4. Éstos son mutuamente excluyentes, ya que dos no coinciden. Son también exhaustivos, ello significa que su unión abarca todo el espacio muestral. Cada resultado
en este espacio pertenece a uno y sólo uno de los eventos Al, A2, A3, A4.
El evento B es cualquier evento. En la figura 2.5, cada uno de los eventos Ai que intersectan a B, forman los eventos A1 傽 B, A2 傽 B, A3 傽 B y A4 傽 B. Es obvio de la figura 2.5
que los eventos A1 傽 B, A2 傽 B, A3 傽 B y A4 傽 B son mutuamente excluyentes y que abarcan
a B. Cada resultado en B pertenece a uno y sólo uno de los eventos A1 傽 B, A2 傽 B, A3 傽 B
y A4 傽 B. Por lo que
B ⫽ (A1 傽 B) 艛 (A2 傽 B) 艛 (A3 傽 B) 艛 (A4 傽 B)
2.3
77
Probabilidad condicional e independencia
B
A2
A1
A2 ∩ B
A1 ∩ B
A3 ∩ B
A4 ∩ B
A4
A3
FIGURA 2.5 Los eventos Al, A2, A3, A4 mutuamente excluyentes y exhaustivos dividen
al evento B en subconjuntos mutuamente excluyentes.
el cual es la unión de los eventos mutuamente excluyentes. Por tanto,
P (B) = P (A1 ∩ B) + P (A2 ∩ B) + P (A3 ∩ B) + P (A4 ∩ B)
Debido a que P (Ai ∩ B) = P (B|Ai )P (Ai ),
P (B) = P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) + P (B|A3 )P (A3 ) + P (B|A4 )P (A4 )
(2.22)
La ecuación (2.22) es un caso especial de la ley de la probabilidad total, restringida al caso
donde hay cuatro eventos mutuamente excluyentes y exhaustivos. La intuición detrás de la ley
de la probabilidad total es muy simple. Los eventos Al, A2, A3, A4 parten al evento en B piezas. La probabilidad de B se encuentra sumando las probabilidades de todas las piezas.
Se podría dibujar nuevamente la figura 2.5 para tener cualquier número de eventos Ai.
Esto conduce al caso general de la ley de la probabilidad total.
Ley de la probabilidad total
Si Al, . . . , An son eventos mutuamente excluyentes y exhaustivos y B es cualquier
evento, entonces
P (B) = P (A1 ∩ B) + · · · + P (An ∩ B)
(2.23)
De manera equivalente, si P(Ai) ⫽ 0 para cada Ai,
P (B) = P (B|A1 )P (A1 ) + · · · + P (B|An )P (An )
Ejemplo
2.24
(2.24)
Clientes que compran cierta marca de automóvil pueden pedir un motor en cualquiera de tres
tamaños. De todos los automóviles vendidos, 45% tiene el motor más pequeño, 35% tamaño
mediano y 20% más grande. Los automóviles en una prueba de emisiones dentro de los dos
años de su compra fallan 10% con el motor más pequeño, mientras que 12% de los de tamaño
mediano y 15% de los de motor más grande. ¿Cuál es la probabilidad de que un automóvil elegido aleatoriamente pueda fallar en una prueba de emisiones dentro de los dos primeros años?
78
CAPÍTULO 2
Probabilidad
Solución
Sea B el evento de que un automóvil falle en una prueba de emisiones dentro de los dos primeros años. Sea A1 el evento que es un automóvil con un motor pequeño, A2 el evento que un
automóvil tiene un motor mediano y A3 el evento que un automóvil tiene un motor grande.
Entonces
P (A1 ) = 0.45
P (A2 ) = 0.35
P (A3 ) = 0.20
La probabilidad de que un automóvil falle una prueba, dado que tiene un motor pequeño, es
de 0.10. Es decir, P(B⏐A1) ⫽ 0.10. De manera similar, P(B⏐A2) ⫽ 0.12 y P(B⏐A3) ⫽ 0.15.
Por la ley de probabilidad total (ecuación 2.24).
P (B) = P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) + P (B|A3 )P (A3 )
= (0.10)(0.45) + (0.12)(0.35) + (0.15)(0.20)
= 0.117
A veces problemas como los del ejemplo 2.24 se resuelven con el uso de diagramas de árbol. La figura 2.6 presenta un diagrama de árbol para el ejemplo 2.24. Hay tres ramas principales en el árbol, que corresponde a los tres tamaños de motor. Las probabilidades de los tamaños
de motor se colocan en sus ramas respectivas. Al final de cada rama principal están dos ramas
secundarias, que representan los eventos de falla y no falla. Las probabilidades condicionales de
falla y no falla, dado el tamaño del motor, se colocan en las ramas secundarias. Al multiplicar a
lo largo de cada una de las ramas que corresponden al evento B ⫽ falla, se obtienen las probabilidades P(B⏐Ai)P(Ai). Al sumar estas probabilidades se obtiene P(B), como se quería.
Regla de Bayes
Si A y B son dos eventos, se ha visto que en general P(A⏐B) ⫽ P(B⏐A). La regla de Bayes
proporciona una fórmula que permite calcular una de las probabilidades condicionales si se
conoce la otra. Para ver cómo funciona, suponga que se conoce P(B⏐A) y que se desea calcular P(A⏐B). Se inicia con la definición de probabilidad condicional (ecuación 2.14):
P (A|B) =
P (A ∩ B)
P (B)
Ahora se utiliza la ecuación (2.18) en la que se sustituye P(B⏐A)P(A) por P(A 傽 B):
P (A|B) =
P (B|A)P (A)
P (B)
(2.25)
La ecuación (2.25) es esencialmente la regla de Bayes. Cuando se escribe la regla de Bayes, la
expresión P(B) del denominador se reemplaza con una expresión más complicada obtenida
por lo general de la ley de la probabilidad total. De modo específico, puesto que los eventos
A y Ac son mutuamente excluyentes y exhaustivos, la ley de la probabilidad total muestra que
P (B) = P (B|A)P (A) + P (B|Ac )P (Ac )
(2.26)
Al sustituir en el lado derecho de la ecuación (2.26) a P(B) de la ecuación (2.25) se obtiene
la regla de Bayes. También se puede obtener una versión más general de la regla de Bayes al
2.3
P(B ∩ A1) = P(B|A1)P(A1) = 0.045
No
falla
P( B c
|A )
1 =
0.90
Pe
q
P(
A
1)
ue
ño
0.4
5
10
= 0.
A
1)
|
B
P(
a
Fall
=
79
Probabilidad condicional e independencia
12
= 0.
|A 2)
B
(
P
a
Fall
P(A2) = 0.35
Mediano
P(B ∩ A2) = P(B|A2)P(A2) = 0.042
No
falla
P( B c
|A )
2 =
0.88
an
de
)=
A3
Gr
P(
0.2
0
15
= 0.
|A 3)
B
(
P
a
Fall
P(B ∩ A3) = P(B|A3)P(A3) = 0.030
No
falla
P( B c
|A )
3 =
0.85
FIGURA 2.6 Diagrama de árbol para la solución del ejemplo 2.24.
considerar una colección A1, . . . , An de eventos mutuamente excluyentes y exhaustivos y utilizando la ley de la probabilidad total sustituyendo a P(B) con la expresión del lado derecho
de la ecuación (2.24).
La regla de Bayes
Caso especial: Sean A y B eventos con P(A) ⫽ 0, P(Ac) ⫽ 0 y P(B) ⫽ 0. Entonces
P (A|B) =
P (B|A)P (A)
P (B|A)P (A) + P (B|Ac )P (Ac )
(2.27)
Caso general: Sean A1, . . . , An eventos mutuamente excluyentes y exhaustivos con
P(Ai) ⫽ 0 para cada Ai. Sea B cualquier evento con P(B) ⫽ 0. Entonces
P (B|Ak )P (Ak )
P (Ak |B) = n
i=1 P (B|Ai )P (Ai )
(2.28)
En el ejemplo 2.25 se muestra cómo se puede usar la regla de Bayes para descubrir un
importante y sorprendente resultado en el campo de las pruebas médicas.
80
Ejemplo
2.25
CAPÍTULO 2
Probabilidad
La proporción de personas en una comunidad que tienen cierta enfermedad es 0.005. Está disponible una prueba para diagnosticar la enfermedad. Si una persona la padece, la probabilidad
de que la prueba dé una señal positiva es 0.99. Si una persona no está enferma, la probabilidad de que la prueba dé una señal positiva es 0.01. Si una persona sale positiva en la prueba,
¿cuál es la probabilidad de que la persona realmente esté enferma?
Solución
Sea D el evento de que la persona realmente está enferma y sea ⫹ el evento que la prueba sale positiva. Se desea encontrar P(D⏐⫹). Se dan las probabilidades siguientes:
P (D) = 0.005
P (+|D) = 0.99
P (+|D c ) = 0.01
Al utilizar la regla de Bayes (ecuación 2.27),
P (D|+) =
=
P (+|D)P (D)
P (+|D)P (D) + P (+|D c )P (D c )
(0.99)(0.005)
(0.99)(0.005) + (0.01)(0.995)
= 0.332
En el ejemplo 2.25 sólo aproximadamente un tercio de las personas que resulta positivo en el examen, realmente padece la enfermedad. Observe que la prueba es bastante exacta;
clasifica correctamente a 99% de las personas tanto enfermas como no enfermas. La razón por
la que una proporción grande de pruebas resulta positiva cuando en realidad se está libre de la
enfermedad es que la enfermedad es rara: sólo 0.5% de la población la padece. Debido a que
cierta cantidad de enfermedades son raras, muchas pruebas médicas resultarán positivas cuando en realidad son falsos positivos, aun cuando la prueba es bastante exacta. Por esta razón,
cuando una prueba sale positiva se hace generalmente una segunda prueba antes de que se
confirme el diagnóstico.
Ejemplo
2.26
Con referencia al ejemplo 2.24, se elige aleatoriamente un registro de una prueba de emisiones con falla. ¿Cuál es la probabilidad de que éste sea un automóvil con un motor pequeño?
Solución
Sea B el evento que un automóvil falla en una prueba de emisiones. Sea A1 el evento que un
automóvil tiene un motor pequeño, A2 el evento de que lo tiene mediano y A3 que su motor
es grande. Se desea encontrar P(A1⏐B). Las siguientes probabilidades están dadas en el ejemplo 2.24:
P (A1 ) = 0.45
P (B|A1 ) = 0.10
P (A2 ) = 0.35
P (B|A2 ) = 0.12
P (A3 ) = 0.20
P (B|A3 ) = 0.15
2.3
Probabilidad condicional e independencia
81
Por la regla de Bayes,
P (A1 |B) =
=
P (B|A1 )P (A1 )
P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) + P (B|A3 )P (A3 )
(0.10)(0.45)
(0.10)(0.45) + (0.12)(0.35) + (0.15)(0.20)
= 0.385
Aplicación al análisis de confiabilidad
El análisis de confiabilidad constituye la rama de la ingeniería que se dedica al cálculo de las
tasas de fallas de los sistemas. Mientras que algunos problemas en el análisis de confiabilidad
requieren de métodos matemáticos avanzados, hay muchos problemas que se pueden resolver
con los métodos que se han aprendido hasta ahora. Se inicia con un ejemplo que muestra el
cálculo de confiabilidad de un sistema que consiste de dos componentes conectados en serie.
Ejemplo
2.27
Un sistema contiene dos componentes, A y B, conectados en serie como se muestra en el diagrama siguiente.
A
B
El sistema funcionará sólo si ambos componentes funcionan. La probabilidad de que A funcione está dada por P(A) ⫽ 0.98 y la probabilidad de que B funciona está dada por P(B) ⫽
0.95. Suponga que A y B funcionan de manera independiente. Determine la probabilidad de
que el sistema funciona.
Solución
Debido a que el sistema funcionará sólo si ambos componentes funcionan, se tiene que
P(sistema funciona) = P (A ∩ B)
= P (A)P (B) por la suposición de independencia
= (0.98)(0.95)
= 0.931
El ejemplo 2.28 muestra el cálculo de confiabilidad de un sistema que consta de dos
componentes conectados en paralelo.
Ejemplo
2.28
Un sistema contiene dos componentes, C y D, conectados en paralelo como se muestra en el
diagrama siguiente.
82
CAPÍTULO 2
Probabilidad
C
D
El sistema funcionará si alguno, C o D funcionan. La probabilidad de que C funcione es 0.90
y la de que D lo haga es 0.85. Suponga que C y D funcionan de manera independiente. Determine la probabilidad de que el sistema funcione.
Solución
Debido a que el sistema funcionará mientras que cualesquiera de los dos componentes funcione, se tiene que
P(sistema funciona) = P (C ∪ D)
= P (C) + P (D) − P (C ∩ D)
= P (C) + P (D) − P (C)P (D)
por la suposición de independencia
= 0.90 + 0.85 − (0.90)(0.85)
= 0.985
Con frecuencia la confiabilidad de sistemas más complejos se puede determinar al descomponer al sistema en una serie de subsistemas, cada uno contiene componentes conectados
en serie o en paralelo. El ejemplo 2.29 muestra el método.
Ejemplo
2.29
La tesis “Dynamic, Single-stage, Multiperiod, Capacitated Production Sequencing Problem
with Multiple Parallel Resources” (D. Ott, tesis de maestría, Escuela de Minas, de Colorado,
1998) describe un método de producción utilizado en la fabricación de latas de aluminio. El
siguiente diagrama esquemático, ligeramente simplificado, muestra el proceso.
Llenado
F
C
A
B
Taza
Lavado
D
E
Impresión
G
H
Despaletizado Llenado
La entrada inicial al proceso consta de hojas de aluminio enrolladas, aproximadamente 0.25
mm de espesor. En un proceso que se conoce como “hacer formas de taza”, se desenrollan estas hojas y se les da forma, en cuerpos de lata, que son cilindros cerrados en la parte inferior
y abiertos en la parte superior. Después, estos cuerpos de lata se lavan y se envían a la impresión, donde se imprime la etiqueta sobre la lata. En la práctica hay varias impresoras en una
línea; el diagrama presenta una línea con tres de aquéllas. El impresor deposita las latas en
paletas, que son estructuras de madera que sostienen 7 140 latas cada una. El siguiente paso
es llenar las latas. Algunas líneas de llenado pueden aceptar latas directamente de las paletas,
2.3
Probabilidad condicional e independencia
83
pero otras sólo las aceptan de los recipientes de las latas, que son grandes contenedores que
tienen aproximadamente cien mil latas cada uno. Para usar estas líneas de llenado, las latas se
deben transportar de las paletas a los recipientes de las latas, en un proceso que se llama despaletizado. En la práctica hay varias líneas de llenado; el diagrama presenta un caso donde
hay dos líneas de llenado, una que aceptará latas de las paletas y la otra aceptará latas que no
provienen de las paletas. En el proceso de llenado de latas, éstas se llenan y se les coloca la
tapa. Después se empaquetan las latas y se envían a los distribuidores.
Se desea calcular la probabilidad de que el proceso funcione un día sin falla. Suponga
que el proceso de hacer la lata tiene una probabilidad de 0.995 de funcionar con éxito en un
día. Puesto que este componente se denota por “A” en el diagrama, se expresa esta probabilidad como P(A) ⫽ 0.995. Suponga que las otras componentes del proceso tienen las siguientes probabilidades de funcionar con éxito durante un periodo de un día: P(B) ⫽ 0.99, P(C) ⫽
P(D) ⫽ P(E) ⫽ 0.95, P(F) ⫽ 0.90, P(G) ⫽ 0.90, P(H) ⫽ 0.98. Suponga que los componentes funcionan de manera independiente. Determine la probabilidad de que el proceso funcione con éxito en un día.
Solución
Es posible resolver este problema observando que todo el proceso se puede descomponer en
subsistemas, cada uno de éstos consta de sistemas compuestos sólo en serie o en paralelo. Específicamente, el subsistema 1 consiste de los componentes hacer la lata y lavar, que están conectadas en serie; el subsistema 2 consiste de las impresoras que están conectadas en paralelo;
el subsistema 3 consiste de líneas de llenado, que están conectadas en paralelo, con una de las
dos líneas que consta de dos componentes conectados en serie.
Se calculan las probabilidades del funcionamiento con éxito para cada subsistema, denotando las probabilidades con p1, p2 y p3.
P ( subsistema 1 funciona) = p1 = P (A ∩ B)
= P (A)P (B)
= (0.995)(0.990)
= 0.985050
P ( subsistema 2 funciona) = p2 = 1 − P ( subsistema 2 falla)
= 1 − P (C c ∩ D c ∩ E c )
= 1 − P (C c )P (D c )P (E c )
= 1 − (0.05)3
= 0.999875
El subsistema 3 funciona si F funciona, o si tanto G como H funcionan. Por tanto,
P ( subsistema 3 funciona) = p3 = P (F ∪ (G ∩ H ))
= P (F ) + P (G ∩ H ) − P (F ∩ G ∩ H )
= P (F ) + P (G)P (H ) − P (F )P (G)P (H )
= (0.90) + (0.90)(0.98) − (0.90)(0.90)(0.98)
= 0.988200
84
CAPÍTULO 2
Probabilidad
Todo el proceso consta de tres subsistemas conectados en serie. Por tanto, para que el proceso funcione, los tres subsistemas deben funcionar. Se concluye que
P(funciona el sistema) ⫽ P(los sistemas 1, 2 y 3 todos funcionan)
= p 1 p2 p3
= (0.985050)(0.999875)(0.988200)
= 0.973
Se advierte que la suposición de que los componentes funcionan independientemente es
crucial en las soluciones de los ejemplos 2.27, 2.28 y 2.29. Cuando no se satisface esta suposición, puede ser muy difícil hacer que los cálculos tengan una precisión confiable. Si se usa
la suposición de independencia sin justificación, los cálculos pueden tener una confiabilidad
engañosa.
Ejercicios para la sección 2.3
1. Una caja contiene diez fusibles. Ocho de ellos están tasados
en 10 amperes (A) y los otros dos están tasados en 15 A. Se
seleccionan dos fusibles aleatoriamente.
a) ¿Cuál es la probabilidad de que el primer fusible esté tasado en 15 A?
b) ¿Cuál es la probabilidad de que el segundo fusible esté
tasado en 15 A, dado que el primer fusible esté tasado en
10 A?
c) ¿Cuál es la probabilidad de que el segundo fusible esté tasado en 15 A, dado que el primer fusible lo esté en 15 A?
2. Con referencia al ejercicio 1, se seleccionan aleatoriamente
fusibles de la caja, uno tras otro, hasta que se selecciona uno
de 15 A.
a) ¿Cuál es la probabilidad de que los primeros dos fusibles sean ambos de 10 A?
b) ¿Cuál es la probabilidad de que un total de dos fusibles
sean elegidos de la caja?
c) ¿Cuál es la probabilidad de que más de tres fusibles sean
elegidos de la caja?
3. Un día de graduación de una gran universidad, se selecciona aleatoriamente a un graduado. Sea A el evento que el estudiante está por terminar la carrera de ingeniería y sea B el
evento que el estudiante tomó un curso de cálculo en la universidad. ¿Qué probabilidad es mayor, P(A⏐B) o P(B⏐A)?
Explique.
4. En el artículo “Integrating Risk Assessment and Life Cycle
Assessment: A Case Study of Insulation” (Y. Nishioka, J.
Levy y colaboradores, Risk Analysis, 2002:1003-1017) se
calcula que 5.6% de cierta población tiene asma y que un asmático tiene 0.027 probabilidad de sufrir un ataque en un día
dado. Se elige aleatoriamente a una persona de esta población. ¿Cuál es la probabilidad de que esta persona tenga un
ataque asmático en ese día?
5. Los pozos de petróleo perforados en la región A tienen una
probabilidad de 0.2 de producir. Los pozos perforados en la
región B tienen una probabilidad de 0.09. Se perfora un pozo en cada región. Suponga que los pozos producen de manera independiente.
a) ¿Cuál es la probabilidad de que ambos pozos produzcan?
b) ¿Cuál es la probabilidad de que ninguno produzca?
c) ¿Cuál es la probabilidad de que al menos uno produzca?
6. De todas las fallas de un tipo determinado de unidad de disco duro de computadora, se determina que 20% de éstos tiene dañado sólo el sector que contiene la tabla de asignación
de archivos, en 70% sólo los sectores no esenciales están
dañados y en 10% tanto el sector de asignación como uno o
más sectores no esenciales están dañados. Se selecciona
aleatoriamente una unidad de disco dañada y se examina.
a) ¿Cuál es la probabilidad de que el sector de asignación
esté dañado?
b) ¿Cuál es la probabilidad de que un sector no esencial esté dañado?
c) Si se encuentra que la unidad de disco tiene un sector de
asignación dañado, ¿cuál es la probabilidad de que algunos sectores no esenciales también estén dañados?
2.3
d) Si se encuentra que la unidad de disco tiene un sector no
esencial dañado, ¿cuál es la probabilidad de que el sector de asignación también esté dañado?
e) Si se encuentra que la unidad de disco tiene un sector de
asignación dañado, ¿cuál es la probabilidad de que ningún sector no esencial esté dañado?
f) Si se encuentra que la unidad de disco tiene un sector no
esencial dañado, ¿cuál es la probabilidad de que el sector de asignación no está dañado?
7. En el proceso de producción de válvulas de motor, éstas se
someten a un primer rectificado. Las válvulas cuyos espesores están dentro de la especificación se encuentran listas
para la instalación. Las válvulas cuyos espesores están arriba de la especificación se rectifican, mientras que aquellas
cuyos espesores están por debajo se desechan. Suponga que
después del primer rectificado, 70% de las válvulas satisface la especificación, 20% es nuevamente rectificado y 10%
se desecha. Además, suponga que de las válvulas que son
nuevamente rectificadas, 90% satisface la especificación y
10% se desecha.
a) Determine la probabilidad de que una válvula se rectifique sólo una vez.
b) Dado que una válvula se hace sólo una vez, ¿cuál es la
probabilidad de que se deseche?
85
Probabilidad condicional e independencia
9. Un sistema de aspersión automático especial tiene dos tipos
diferentes de dispositivos de activación para cada regadera.
Un tipo tiene una confiabilidad de 0.9; es decir, la probabilidad de que se active cuando debe el aspersor es 0.9. El otro
tipo, que opera independientemente del primer tipo, tiene
una confiabilidad de 0.8. Si se dispara cualquier dispositivo,
el aspersor se activará. Suponga que empieza un fuego cerca de una regadera.
a) ¿Cuál es la probabilidad de que la regadera se active?
b) ¿Cuál es la probabilidad de que la regadera no se active?
c) ¿Cuál es la probabilidad de que ambos dispositivos de
activación trabajen adecuadamente?
d) ¿Cuál es la probabilidad de que sólo el dispositivo con
0.9 de confiabilidad trabaje adecuadamente?
10. Una cadena de restaurantes de comida rápida tiene 600 negocios en los Estados Unidos. En la tabla siguiente se clasifican las ciudades por el tamaño y la ubicación y presenta el
número de restaurantes en ciudades para cada categoría. Se
elige aleatoriamente un restaurante de los 600 para hacer
una prueba de mercado de un nuevo estilo de pollo.
Región
Población de la ciudad
NE
SE
SO
NO
d) Dado que una válvula se desecha, ¿cuál es la probabilidad de que se rectifique dos veces?
Debajo de 50 000
30
35
15
5
50 000-500 000
60
90
70
30
e) Determine la probabilidad de que la válvula satisfaga la
especificación (después de la primera o de la segunda
rectificación).
Arriba de 500 000
150
25
30
60
f) Dado que una válvula satisface la especificación (después de la primera o segunda rectificación), ¿cuál es la
probabilidad de que se haya rectificado dos veces?
a) Si el restaurante está ubicado en una ciudad con una población de arriba de 500 000, ¿cuál es la probabilidad de
que esté en el noreste?
g) Dado que una válvula satisface la especificación, ¿cuál
es la probabilidad de que se haya rectificado una vez?
b) Si el restaurante está ubicado en el sureste, ¿cuál es la
probabilidad de que esté en una ciudad que tenga una
población debajo de 50 000?
8. Sarah y Thomas tiran un dado cada uno. Quien obtenga el
número más alto gana; si ambos tiran el mismo número de
veces, ninguno gana.
c) Si el restaurante está ubicado en el suroeste, ¿cuál es la
probabilidad de que esté en una ciudad que tenga una
población de 500 000 o menos?
c) Determine la probabilidad de que se deseche una válvula.
a) ¿Cuál es la probabilidad de que Thomas gane?
b) Si Sarah tira un 3, ¿cuál es la probabilidad de que gane?
c) Si Sarah tira un 3, ¿qué probabilidad hay de que Thomas
gane?
d) Si Sarah gana, ¿cuál es la probabilidad de que Thomas
haya tirado un 3?
e) Si Sarah gana, ¿cuál es la probabilidad de que Sarah haya tirado un 3?
d) Si el restaurante está ubicado en una ciudad con una población de 500 000 o menos, ¿cuál es la probabilidad
que esté en el suroeste?
e) Si el restaurante está ubicado en el sur (ya sea en el SE
o en el SO), ¿cuál es la probabilidad de que esté en una
ciudad con una población de 50 000 o más?
11. Las centrales nucleares tienen componentes superfluos en
sistemas importantes para reducir la probabilidad de fallas
86
CAPÍTULO 2
Probabilidad
catastróficas. Suponga que una planta tiene dos sistemas de
medición del nivel de refrigerante en el núcleo del reactor y
que cada sistema de medición tiene una probabilidad de
0.01 de fallar. Suponga que una causa potencial para que el
sistema de medición falle es que los cables eléctricos que
conducen del centro a la sala de control donde se ubican los
sistemas de medición podrían quemarse. Alguien desea calcular la probabilidad de que ambos sistemas fallen y hace el
cálculo siguiente:
P(ambos sistemas ⫽ P(el primer sistema
de medición fallan)
de medición falla)
×
P(el segundo sistema
de medición falla)
⫽ (0.01)(0.01)
⫽ 0.0001
a) ¿Qué suposición se debe hacer en este cálculo?
b) Explique por qué esta suposición probablemente no está justificada en este caso.
c) ¿Es la probabilidad 0.0001 posiblemente demasiado alta o demasiado baja? Explique.
12. Con referencia al ejercicio 11, ¿es posible que la probabilidad de que fallen ambos sistemas de medición sea más
grande de 0.01? Explique.
13. Un lote de diez componentes contiene tres que están defectuosos. Se extraen aleatoriamente dos componentes y se
evalúan. Sea A el evento de que el primer componente extraído esté defectuoso y sea B el evento de que el segundo
también lo esté.
a) Determine P(A).
b) Determine P(B|A).
c) Determine P(A 艚 B).
d) Determine P(Ac 艚 B).
e) Determine P(B).
f) ¿Son A y B independientes? Explique.
14. Un lote de mil componentes contiene 300 que están defectuosos. Se sacan aleatoriamente dos componentes y se evalúan. Sea A el evento de que el primer componente extraído
esté defectuoso y sea B el evento de que el segundo también
lo esté.
a) Determine P(A).
b) Determine P(B|A).
c) Determine P(A 艚 B).
d) Determine P(Ac 艚 B).
e) Determine P(B).
f) Determine P(A|B).
g) ¿Son A y B independientes? ¿Es razonable tratar a A y a
B como si fueran independientes? Explique.
15. En un lote de n componentes, 30% está defectuoso. Se extraen aleatoriamente dos componentes y se evalúan. Sea A
el evento de que el primer componente extraído esté defectuoso y sea B el evento de que el segundo también lo esté.
¿Para qué tamaño de lote n serán A y B cercanamente independientes: n ⫽ 10 o n ⫽ 10 000? Explique.
16. Dos inspectores de calidad supervisan fallas en artículos. Si
se encuentra una, será detectada por el primer inspector con
una probabilidad de 0.9 y por el segundo con probabilidad
0.7. Suponga que los inspectores trabajan en forma independiente.
a) Si un artículo tiene una falla, ¿cuál es la probabilidad de
que la detecten ambos inspectores?
b) Si un artículo tiene una falla, ¿cuál es la probabilidad de
que la detecte al menos uno de los dos inspectores?
c) Suponga que el segundo inspector revisa solamente los
artículos que han sido aprobados por el primer inspector. Si un artículo tiene una falla, ¿cuál es la probabilidad de que el segundo inspector la detecte?
17. Con referencia al ejercicio 16, suponga que ambos inspectores supervisan cada artículo y que si uno no tiene falla,
entonces ningún inspector la detectará.
a) Suponga que la probabilidad de que un artículo tenga falla es 0.10. Si un artículo es aprobado por el primer inspector, ¿cuál es la probabilidad de que tenga en realidad
falla?
b) Suponga que la probabilidad de que un artículo tenga falla es 0.10. Si un artículo es aprobado por ambos inspectores, ¿cuál es la probabilidad de que tenga en realidad
una falla?
18. Un programa de control de calidad en una línea de montaje
de botellas de plástico implica inspeccionar botellas terminadas para detectar fallas, como huecos microscópicos. La
proporción de botellas que tiene tal falla en realidad es de sólo 0.0002. Si una botella tiene una falla, la probabilidad es
0.995 de que no pasará la inspección. Si una botella no tiene falla, la probabilidad es 0.99 de que pasará la inspección.
a) Si una botella no pasa la inspección, ¿cuál es la probabilidad de que tiene falla?
2.3
b) ¿Cuál de las siguientes es la interpretación más correcta
de la respuesta del inciso a)?
i) La mayoría de las botellas que no pasan la inspección
no tienen falla.
ii) La mayoría de las botellas que pasan la inspección
tienen falla.
c) Si una botella pasa la inspección, ¿cuál es la probabilidad de que no tenga falla?
Probabilidad condicional e independencia
87
c) Si tres componentes están conectados en serie y cada
uno tiene probabilidad p de fallar, ¿cuál debe ser el valor de p para que la probabilidad de que el sistema funcione sea 0.90?
21. Un sistema contiene dos componentes, C y D, conectados
en paralelo como se muestra en el diagrama.
C
d) ¿Cuál de las siguientes es la interpretación más correcta
de la respuesta del inciso c)?
i) La mayoría de las botellas que no pasan la inspección
tienen falla.
D
ii) La mayoría de las botellas que aprueban la inspección no tienen falla.
Suponga que C y D funcionan de manera independiente.
Para que el sistema funcione, deben funcionar C o D.
e) Explique por qué una probabilidad pequeña en el inciso
a) no es un problema, tan grande como una gran probabilidad del inciso c).
a) Si la probabilidad de que C falle es 0.08 y la probabilidad de que D falle es 0.12, encuentre la probabilidad de
que el sistema funcione.
19. Con referencia al ejemplo 2.25 (p. 80).
a) Si a un hombre le sale la prueba negativa, ¿cuál es la
probabilidad de que en realidad esté enfermo?
b) Para muchas pruebas médicas, es un procedimiento
usual repetir la prueba cuando sale positiva. Si las pruebas que se repiten son independientes, ¿cuál es la probabilidad de que a un hombre le resulten positivas dos
pruebas sucesivas si él está enfermo?
c) Suponiendo que las pruebas repetidas son independientes, ¿cuál es la probabilidad de que a un hombre le salgan positivas dos pruebas sucesivas si no tiene la
enfermedad?
d) Si a un hombre le salen positivas dos pruebas sucesivas,
¿cuál es la probabilidad de que tenga la enfermedad?
20. Un sistema contiene dos componentes, A y B, conectados
en serie, como se muestra en el diagrama.
A
B
Suponga que A y B funcionan de manera independiente. Para que el sistema funcione, ambos componentes deben funcionar.
a) Si la probabilidad de que A falle es 0.05 y la probabilidad de que B falle es 0.03, determine la probabilidad de
que el sistema funcione.
b) Si tanto A como B tienen probabilidad p de fallar, ¿cuál
debe ser el valor de p para que la probabilidad de que el
sistema funcione sea 0.90?
b) Si tanto C como D tienen probabilidad p de fallar, ¿cuál
debe ser el valor de p para que la probabilidad de que el
sistema funcione sea 0.99?
c) Si tres componentes están conectados en paralelo, funcionan de manera independiente y cada uno tiene una
probabilidad p de fallar, ¿cuál debe ser el valor de p para que la probabilidad de que el sistema funcione sea
0.99?
d) Si los componentes funcionan independientemente y cada componente tiene una probabilidad de fallar de 0.5,
¿cuál es el número mínimo de componentes que se debe conectar en paralelo para que la probabilidad de que
el sistema funcione sea de al menos 0.99?
22. Un sistema consta de cuatro componentes conectados, como se muestra en el diagrama siguiente.
A
B
C
D
Suponga que A, B, C y D funcionan de manera independiente. Si las probabilidades de que A, B, C y D fallen son 0.10,
0.05, 0.10 y 0.20, respectivamente, ¿cuál es la probabilidad
de que el sistema funcione?
23. Si A y B son eventos independientes, pruebe que los siguientes pares de eventos son independientes: Ac y B, A y Bc
y Ac y Bc.
88
2.4
CAPÍTULO 2
Probabilidad
Variables aleatorias
En muchos casos es deseable asignar un valor numérico a cada resultado de un experimento.
Esta asignación se llama variable aleatoria. Para aclarar la idea se presenta un ejemplo. Suponga que un ingeniero eléctrico tiene seis resistores a la mano. Tres de ellos tienen etiqueta
de 10 Ω y los otros tres tienen etiqueta de 20 Ω. El ingeniero quiere conectar un resistor de
10 Ω y un resistor de 20 Ω en serie, para crear una resistencia de 30 Ω. Ahora se supone que,
en efecto, los tres resistores etiquetados con 10 Ω tienen las resistencias reales de 9, 10 y 11 Ω
y que los tres resistores etiquetados con 20 Ω tienen las resistencias reales de 19, 20 y 21 Ω.
El proceso para seleccionar un resistor de cada tipo es un experimento cuyo espacio muestral
consta de nueve resultados igualmente probables. El espacio muestral se presenta en la tabla
siguiente.
Resultado
Probabilidad
(9, 19)
(9, 20)
(9, 21)
(10, 19)
(10, 20)
(10, 21)
(11, 19)
(11, 20)
(11, 21)
1/9
1/9
1/9
1/9
1/9
1/9
1/9
1/9
1/9
Ahora lo que es importante para el ingeniero de este experimento es la suma de las dos
resistencias, en vez de sus valores individuales. Por tanto, se asigna a cada resultado un número igual a la suma de las dos resistencias seleccionadas. Esta asignación se representa por
la letra X y se presenta en la tabla siguiente.
Resultado
X
Probabilidad
(9, 19)
(9, 20)
(9, 21)
(10, 19)
(10, 20)
(10, 21)
(11, 19)
(11, 20)
(11, 21)
28
29
30
29
30
31
30
31
32
1/9
1/9
1/9
1/9
1/9
1/9
1/9
1/9
1/9
La función X, que asigna un valor numérico a cada resultado en el espacio muestral, es
una variable aleatoria.
2.4
Variables aleatorias
89
Una variable aleatoria asigna un valor numérico a cada resultado en un espacio
muestral.
Se acostumbra denotar a las variables aleatorias con letras mayúsculas. Las letras X, Y y Z se
usan con más frecuencia.
Se puede calcular las probabilidades para las variables aleatorias de una manera obvia.
En el ejemplo anterior, el evento X ⫽ 29 corresponde al evento {(9, 20), (10, 19)} del espacio muestral. Por tanto, P(X ⫽ 29) ⫽ P [{(9, 20), (10, 19)}] ⫽ 2/9.
Ejemplo
2.30
Haga una lista de los valores posibles de la variable aleatoria X y determine la probabilidad
para cada uno de ellos.
Solución
Los valores posibles son 28, 29, 30, 31 y 32. Para encontrar la probabilidad de uno de estos
valores, se suman las probabilidades de los resultados en el espacio muestral que corresponden al valor. Los resultados están en la tabla siguiente.
X
P(X = x)
28
29
30
31
32
1/9
2/9
3/9
2/9
1/9
La tabla de probabilidades del ejemplo 2.30 contiene toda la información necesaria para calcular cualquier probabilidad que considere a la variable aleatoria X. Observe que los resultados del espacio muestral no se presentan en la tabla. Cuando se conocen las probabilidades
en relación con una variable aleatoria, generalmente no se piensa en el espacio muestral: sólo se concentra uno en las probabilidades.
Hay dos tipos importantes de variables aleatorias: discretas y continuas. Una variable
aleatoria discreta es aquella cuyos valores posibles forman un conjunto discreto; en otras palabras, los valores se pueden ordenar y existen separaciones entre los valores adyacentes. La
variable aleatoria X, que se acaba de describir, es discreta. En contraparte, los valores posibles de una variable aleatoria continua siempre están contenidos en un intervalo; es decir, son
todos los puntos entre dos números. Se proporcionan definiciones precisas de estas clases de
variables aleatorias posteriormente en esta sección.
A continuación se presentan más ejemplos de variables aleatorias.
Ejemplo
2.31
Con frecuencia los chips de computadora tienen imperfecciones en su superficie. Para cierto
tipo de chip de computadora, 9% no tiene imperfecciones, 22% contiene una imperfección,
26% presenta dos imperfecciones, 20% contiene tres imperfecciones, 12% tiene cuatro im-
90
CAPÍTULO 2
Probabilidad
perfecciones y 11% presenta cinco imperfecciones. Sea Y el número de imperfecciones en un
chip elegido aleatoriamente. ¿Cuáles son los valores posibles de Y? ¿Y es discreto o continuo?
Determine P(Y ⫽ y) para cada valor posible y.
Solución
Los valores posibles para Y son los enteros 0, 1, 2, 3, 4 y 5. La variable aleatoria Y es discreta, ya que solamente toma valores enteros. A 9% de los resultados en el espacio muestral se
le asigna el valor 0. Por tanto, P(Y ⫽ 0) ⫽ 0.09. Similarmente P(Y ⫽ 1) ⫽ 0.22, P(Y ⫽ 2) ⫽
0.26, P(Y ⫽ 3) ⫽ 0.20, P(Y ⫽ 4) ⫽ 0.12 y P(Y ⫽ 5) ⫽ 0.11.
Ejemplo
2.32
Cierto tipo de disco magnético debe funcionar en un ambiente donde está expuesto a gases
corrosivos. Se sabe que 10% de estos discos tiene tiempos de vidas menores que o iguales a
100 horas, 50% lo tiene mayor a 100 horas, pero menor o igual a 500, y 40% incluye tiempos superiores a 500 horas. Sea Z el número de horas en tiempo de vida de un disco elegido
aleatoriamente. ¿Z es continua o discreta? Determine P(Z ≤ 500). ¿Se pueden calcular todas
las probabilidades para Z? Explique.
Solución
El tiempo de vida de un componente no está limitado a una lista de valores discretamente espaciados; Z es continua. De todos los componentes, 60% tiene vidas menores o iguales a 500
horas. Por tanto, P(Z ≤ 500) ⫽ 0.60. No se tiene la información suficiente para calcular todas
las probabilidades para Z. Se pueden calcular algunas de ellas; por ejemplo, P(Z ≤ 100) ⫽
0.10, P(100 < Z ≤ 500) ⫽ 0.50 y P(Z > 500) ⫽ 0.40. Pero no se sabe, por ejemplo, la proporción de componentes que tiene tiempos de vida entre 100 y 200 horas, o entre 200 y 300 horas,
así que no se puede encontrar la probabilidad de que la variable aleatoria Z tenga cualquiera
de estos intervalos. Para calcular todas las probabilidades de Z, se necesitaría calcular la probabilidad para cada intervalo posible; por ejemplo, P(200 < Z ≤ 300), P(200 < Z ≤ 201), P(200
< Z ≤ 200.1) y así sucesivamente. Se verá cómo se puede hacer lo anterior en esta sección,
cuando se analicen las variables aleatorias continuas.
Variables aleatorias y poblaciones
Con frecuencia es útil pensar en un valor de una variable aleatoria como que se ha seleccionado de una población. Por ejemplo, considere la variable aleatoria Y descrita en el ejemplo
2.31. Observar un valor para esta variable aleatoria es como seleccionar un valor de una población que consta de los enteros 0, 1, 2, 3, 4 y 5, en las proporciones siguientes: 0’s, 9%; 1’s,
22%; 2’s, 26%; 3’s, 20%; 4’s, 12%; y 5’s, 11%. Para una variable aleatoria continua es adecuado imaginar una población infinita que contiene a todos los valores posibles de la variable
aleatoria. Por ejemplo, para la variable aleatoria Z del ejemplo 2.32 se podría imaginar una
población que contenga a todos los números positivos, con 10% de los valores de población
menores o iguales a 100, 50% superiores a 100 pero menores o iguales a 500, y 40% mayores a 500. La proporción de valores de la población en cualquier intervalo sería igual a la probabilidad de que la variable Z está en ese intervalo.
Los métodos para trabajar con variables aleatorias son diferentes para variables aleatorias discretas y continuas. Se inicia con las variables aleatorias discretas.
2.4
Variables aleatorias
91
Variables aleatorias discretas
Se inicia con la definición de una variable aleatoria discreta.
Definición
Una variable aleatoria es discreta si sus valores posibles constituyen un conjunto discreto. Lo anterior significa que si los valores posibles se ordenan, hay una separación entre cada valor y el próximo. El conjunto de valores posibles podría ser infinito; por ejemplo, el conjunto de todos los enteros o el conjunto de todos los enteros positivos.
Es común que los valores posibles de una variable aleatoria discreta sean un conjunto
de enteros. Para cualquier variable aleatoria discreta, si se especifica la lista de sus valores posibles junto con la probabilidad que tiene la variable aleatoria en cada uno de estos valores,
entonces se ha descrito completamente a la población a partir de la cual se seleccionó a la variable aleatoria. Esto se ilustra con un ejemplo.
El número de fallas en un alambre de cobre de 1 pulg de longitud, fabricado en proceso específico, varía de alambre en alambre. En conjunto, 48% de los alambres producidos no
tiene falla, 39% presenta una, 12% fue detectado con dos y 1% tiene tres. Sea X el número de
fallas en una pieza de alambre seleccionada aleatoriamente. Entonces
P (X = 0) = 0.48
P (X = 1) = 0.39
P (X = 2) = 0.12
P (X = 3) = 0.01
La lista de valores posible 0, 1, 2, 3, junto con las probabilidades para cada uno, proporciona
una descripción completa de la población de la que se tomó a X. Esta descripción se conoce
como función de masa de probabilidad.
Definición
La función de masa de probabilidad de una variable aleatoria discreta X es la función
p(x) ⫽ P(X ⫽ x). A veces a la función de masa de probabilidad se le llama distribución
de probabilidad.
Por tanto, para la variable aleatoria X que representa el número de fallas en una longitud de alambre, p(0) ⫽ 0.48, p(l) ⫽ 0.39, p(2) ⫽ 0.12, p(3) ⫽ 0.01 y p(x) ⫽ 0 para cualquier
valor de x diferente de 0, 1, 2 o 3. Observe que si se suman los valores de la función de masa de probabilidad sobre todos los valores posibles de X, la suma es igual a 1. Esto es cierto
para cualquier función de masa de probabilidad. La razón es que al sumar los valores de una
función de masa de probabilidad sobre todos los valores posibles de la variable aleatoria correspondiente, se obtiene la probabilidad de que la variable aleatoria es igual a uno de sus valores posibles y esta probabilidad es siempre igual a 1.
La función de masa de probabilidad se puede representar por un diagrama en el cual se
dibuja una recta vertical para cada uno de los valores posibles de la variable aleatoria. Las alturas de las rectas son iguales a las probabilidades de los valores correspondientes. La inter-
92
CAPÍTULO 2
Probabilidad
pretación física de este diagrama es que cada recta representa una masa igual a su altura. En
la figura 2.7 se muestra un diagrama de la función de masa de probabilidad de la variable aleatoria X.
0.6
Probabilidad
0.5
0.4
0.3
0.2
0.1
0
0
1
2
Número de fallas
3
FIGURA 2.7 Función de masa de probabilidad de X, el número de fallas en una elección aleatoria de una pieza de alambre.
Función de distribución acumulativa
de una variable aleatoria discreta
La función de masa de probabilidad especifica la probabilidad de que una variable aleatoria
sea igual a un valor determinado. La función de distribución acumulativa especifica la probabilidad de que una variable aleatoria sea menor o igual a un valor dado. La función de distribución acumulativa de la variable aleatoria X es la función F(x) ⫽ P(X ≤ x).
Ejemplo
2.33
Sea F(x) la función de distribución acumulativa de la variable aleatoria X que representa el
número de fallas en un alambre elegido aleatoriamente. Determine F(2) y F(1.5).
Solución
Puesto que F(2) ⫽ P(X ≤ 2) se necesita encontrar P(X ≤ 2). Con dicho propósito se suman las
probabilidades de los valores de X que son menores o iguales a 2, a saber, 0, 1 y 2. Por tanto,
F (2) = P (X ≤ 2)
= P (X = 0) + P (X = 1) + P (X = 2)
= 0.48 + 0.39 + 0.12
= 0.99
Ahora F(1.5) ⫽ P(X ≤ 1.5). Por tanto, para calcular F(1.5) se debe sumar las probabilidades para los valores de X que son menores o iguales a 1.5, que son 0 y 1. Por lo que,
2.4
Variables aleatorias
93
F (1.5) = P (X ≤ 1.5)
= P (X = 0) + P (X = 1)
= 0.48 + 0.39
= 0.87
En general, para cualquier variable aleatoria discreta X, la función de distribución acumulativa F(x) se puede calcular sumando las probabilidades de todos los valores posibles de
X que son menores o iguales a x. Observe que F(x) está definido para cualquier número x, no
exactamente para los valores posibles de X.
Resumen
Sea X una variable aleatoria discreta. Entonces
La función de masa de probabilidad de X es la función p(x) ⫽ P(X ⫽ x).
La función de distribución acumulativa de X es la función F(x) ⫽ P(X ≤ x).
F (x) =
p(t) =
P (X = t).
t≤x
x
p(x) =
t≤x
x
P (X = x) = 1, donde la sumatoria se realiza sobre todos los valo-
res posibles de X.
Ejemplo
2.34
Dibuje la función de distribución acumulativa F(x) de la variable aleatoria X que representa
el número de fallas en un alambre elegido aleatoriamente.
Solución
Primero se calcula F(x) para cada uno de los valores posibles de X, que son 0, 1, 2 y 3.
F (0) = P (X ≤ 0) = 0.48
F (1) = P (X ≤ 1) = 0.48 + 0.39 = 0.87
F (2) = P (X ≤ 2) = 0.48 + 0.39 + 0.12 = 0.99
F (3) = P (X ≤ 3) = 0.48 + 0.39 + 0.12 + 0.01 = 1
Para cualquier valor x, se calcula a F(x) sumando las probabilidades de todos los valores posibles de X que son menores o iguales a x. Por ejemplo, si 1 ≤ x < 2, los valores posibles de
X que son menores o iguales a x son 0 y 1, por lo que F(x) ⫽ P(X ⫽ 0) ⫹ P(X ⫽ 1) ⫽ F(1)
⫽ 0.87. Por tanto,
94
CAPÍTULO 2
Probabilidad
⎧
⎪
0
⎪
⎪
⎪
⎪
⎪
⎨ 0.48
F (x) = 0.87
⎪
⎪
⎪
0.99
⎪
⎪
⎪
⎩1
x<0
0≤x<1
1≤x<2
2≤x<3
x≥3
En la figura siguiente se presenta una gráfica de F(x).
1
0.99
0.87
0.48
0
1
2
3
4
Para una variable aleatoria discreta, la gráfica de F(x) consta de una serie de rectas horizontales (llamadas “pasos”) con saltos en cada uno de los valores posibles de X. Observe
que el tamaño del salto en cualquier punto x es igual al valor de la función de masa de probabilidad p(x) ⫽ P(X ⫽ x).
Media y varianza para variables aleatorias discretas
En la sección 1.3 se vio que la media de una muestra es aproximadamente igual a la componente horizontal del centro de masa de un histograma de la muestra, que es el punto en el eje
x en el cual el histograma mantendría el equilibrio si se sostuviera de allí. Por analogía, se define a la media poblacional como la componente horizontal del centro de masa de la gráfica
de su función de masa de probabilidad de una variable aleatoria discreta. La media poblacional de una variable aleatoria X que también se puede llamar esperanza, o valor esperado, de
X y que se denota por µX, por E(X), o simplemente por µ. A veces se puede eliminar la palabra “poblacional” y sólo se hará referencia a la media poblacional como la media.
Ejemplo
2.35
Determine la media de la variable aleatoria X que representa el número de fallas en una pieza de alambre elegida aleatoriamente.
Solución
La media es el centro de masa de la gráfica de la función de masa de probabilidad (figura 2.7).
El centro de masa se calcula multiplicando la altura de cada recta por su valor en el eje horizontal y después se suman los productos. Los valores son 0, 1, 2 y 3. Las alturas son P(X ⫽
0) ⫽ 0.48, P(X ⫽ 1) ⫽ 0.39, P(X ⫽ 2) ⫽ 0.12 y P(X ⫽ 3) ⫽ 0.01. La media es, por tanto,
2.4
95
Variables aleatorias
µX = 0·P (X = 0) + 1·P (X = 1) + 2·P (X = 2) + 3·P (X = 3)
= (0)(0.48) + (1)(0.39) + (2)(0.12) + (3)(0.01)
= 0.6600
En general, la media de una variable aleatoria discreta se encuentra al multiplicar cada
valor posible de la variable aleatoria por su probabilidad y después se suman.
Definición
Sea X una variable aleatoria discreta con función de masa de probabilidad
p(x) ⫽ P(X ⫽ x).
La media de X está dada por
µX =
x
xP (X = x)
(2.29)
donde la sumatoria se hace sobre todos los valores posibles de X.
A veces la media de X se llama esperanza, o valor esperado, de X y también se denota por E(X) o por µ.
En la sección 1.3 se mostró que la varianza de una muestra es aproximadamente igual
al momento de inercia del histograma de la muestra alrededor de la media de la muestra. Se
define a la varianza poblacional de una variable aleatoria discreta como el momento de inercia de la gráfica de su función de masa de probabilidad con respecto a la media poblacional
µ. La varianza poblacional de una variable aleatoria X con frecuencia se denomina simplemente varianza de X. Se puede denotar por σ X2, por V(X), o simplemente por σ 2. Para calcularla se multiplica la altura de cada recta del diagrama de la función de masa de probabilidad
por el cuadrado de su distancia horizontal a la poblacional y después se suman los productos.
Es más fácil de comprender esto cuando se presenta en una fórmula:
σX2 =
(x − µX )2 P (X = x)
x
Realizando un poco de álgebra se puede obtener una fórmula alternativa
σX2 =
x 2 P (X = x) − µ2X
x
Al final de esta sección se presenta una deducción de esta fórmula.
También se define la desviación estándar poblacional como la raíz cuadrada de la varianza poblacional. Se denota a la desviación estándar de la población de una variable aleatoria X por σX o simplemente por σ. Como con la media, a veces se eliminará la palabra
“poblacional” y sólo se denominará a la poblacional y la desviación estándar poblacional como la varianza y la desviación estándar, respectivamente.
96
CAPÍTULO 2
Probabilidad
Resumen
Sea X una variable aleatoria discreta con función de masa de probabilidad
p(x) ⫽ P(X ⫽ x). Entonces
La varianza de X está dada por
σX2 =
(x − µX )2 P (X = x)
(2.30)
Una fórmula alternativa para la varianza está dada por
σX2 =
x 2 P (X = x) − µ2X
(2.31)
x
x
La varianza de X también se puede denotar por V(X) o por σ2.
La desviación estándar es la raíz cuadrada de la varianza: σX =
Ejemplo
2.36
σX2 .
Determine la varianza y la desviación estándar para la variable aleatoria X que representa el
número de fallas de una pieza de alambre elegida aleatoriamente.
Solución
En el ejemplo 2.35 se calculó la media de X con un valor de µX ⫽ 0.6600. Se encuentra la varianza utilizando la ecuación (2.30):
σX2 = (0 − 0.6600)2 P (X = 0) + (1 − 0.6600)2 P (X = 1) + (2 − 0.6600)2 P (X = 2)
+ (3 − 0.6600)2 P (X = 3)
= (0.4356)(0.48) + (0.1156)(0.39) + (1.7956)(0.12) + (5.4756)(0.01)
= 0.5244
√
La desviación estándar es σX = 0.5244 = 0.724.
Ejemplo
2.37
Use la fórmula alternativa, ecuación (2.31), para calcular la varianza de X, del número de fallas de un alambre elegido aleatoriamente.
Solución
En el ejemplo 2.35 se calculó que la media tenía un valor de µX ⫽ 0.6600. La varianza es, por
tanto,
σX2 = 02 P (X = 0) + 12 P (X = 1) + 22 P (X = 2) + 32 P (X = 3) − (0.6600)2
= (0)(0.48) + (1)(0.39) + (4)(0.12) + (9)(0.01) − (0.6600)2
= 0.5244
2.4
Ejemplo
2.38
Variables aleatorias
97
Un resistor en un circuito dado tiene una resistencia en el rango de 99 Ω-101 Ω. Un ingeniero obtiene dos resistores. La probabilidad de que ambos satisfagan la especificación es 0.36,
la probabilidad de que exactamente uno de ellos satisfaga la especificación es 0.48 y la probabilidad de que ninguno de ellos lo haga es 0.16. Sea X el número de resistores que satisface
la especificación. Determine la función de masa de probabilidad, media, varianza y desviación estándar de X.
Solución
La función de masa de la probabilidad es P(X ⫽ 0) ⫽ 0.16, P(X ⫽ 1) ⫽ 0.48, P(X ⫽ 2) ⫽
0.36 y P(X ⫽ x) ⫽ 0 para x ⫽ 0, 1 o 2. La media es
µX = (0)(0.16) + (1)(0.48) + (2)(0.36)
= 1.200
La varianza es
σX2 = (0 − 1.200)2 (0.16) + (1 − 1.200)2 (0.48) + (2 − 1.200)2 (0.36)
= 0.4800
√
La desviación estándar es σX = 0.4800 = 0.693.
Histograma de probabilidad
Cuando los valores posibles de una variable aleatoria discreta están espaciados uniformemente, la función de masa de probabilidad se puede representar por medio de un histograma, con
rectángulos centrados en los valores posibles de la variable aleatoria. El área de un rectángulo
centrado en un valor x es igual a P(X ⫽ x). Este histograma se llama un histograma de probabilidad, ya que las áreas representan probabilidades. En la figura 2.7 se presenta el diagrama de la función de masa de probabilidad de una variable aleatoria X que representa el número
de fallas en un alambre. La figura 2.8 presenta un histograma de probabilidad para esta variable aleatoria.
La probabilidad de que el valor de una variable aleatoria esté en un intervalo específico está dada por el área bajo el histograma de probabilidad. En el ejemplo 2.39 se ilustra la
idea.
Ejemplo
2.39
Determine la probabilidad de que un alambre elegido aleatoriamente tenga más de una falla.
Indique esta probabilidad como un área bajo el histograma de probabilidad.
Solución
Se desea encontrar P(X > 1). Puesto que ningún alambre tiene más de tres fallas, la proporción de que los alambres tengan más de una se puede encontrar al sumar la proporción de que
tengan dos más la proporción de que tengan tres. Simbólicamente, P(X > 1) ⫽ P(X ⫽ 2) ⫹
P(X ⫽ 3). La función de masa de probabilidad especifica que P(X ⫽ 2) ⫽ 0.12 y P(X ⫽ 3)
⫽ 0.01. Por tanto, P(X > 1) ⫽ 0.12 ⫹ 0.01 ⫽ 0.13.
98
CAPÍTULO 2
Probabilidad
0.5
0.4
0.3
0.2
0.1
0
0
1
2
3
FIGURA 2.8 Histograma de probabilidad para X, el número de fallas en una pieza de alambre
elegida aleatoriamente. Compárela con la figura 2.7.
Esta probabilidad está dada por el área bajo el histograma de probabilidad que corresponde a
esos rectángulos centrados en valores superiores a 1 (véase la figura 2.9). Hay dos de estos
rectángulos; sus áreas son P(X ⫽ 2) ⫽ 0.12 y P(X ⫽ 3) ⫽ 0.01. Ésta es otra manera de mostrar que P(X > 1) ⫽ 0.12 ⫹ 0.01 ⫽ 0.13.
0.5
0.4
0.3
0.2
0.1
0
0
1
2
3
FIGURA 2.9 Histograma de probabilidad para X, el número de fallas en una pieza de alambre
elegida aleatoriamente. El área que corresponde a valores de X mayores que 1 está sombreada.
Esta área es igual a P(X > 1).
En el capítulo 4 se verá que las probabilidades para las variables aleatorias discretas se
pueden aproximar a veces calculando el área bajo una curva. Representar las probabilidades discretas con un histograma de probabilidad hará más fácil comprender cómo se hace esto último.
2.4
Variables aleatorias
99
Variables aleatorias continuas
En la tabla 1.4 (en la sección 1.3) se presentaron intervalos de clase para las emisiones, en
gramos de partículas por galón de combustible consumido, de una muestra de 62 vehículos.
Observe que las emisiones constituyen una variable continua, ya que sus valores posibles no
están restringidos a algún conjunto discretamente espaciado. Los intervalos de clase son elegidos para que cada intervalo contenga un número razonablemente grande de vehículos. Si la
muestra fuera más grande, se podrían hacer los intervalos más angostos. En particular, si se
tuviera información sobre toda la población, que contiene millones de vehículos, se podrían
hacer los intervalos extremadamente angostos. El histograma parecería entonces muy suave y
se podría aproximar con una curva, como la que se muestra en la figura 2.10.
FIGURA 2.10 Histograma para una gran población continua que se podría dibujar con
rectángulos extremadamente angostos y debería parecerse a esta curva.
Si se hubiera elegido aleatoriamente un vehículo de esta población para medir sus emisiones, el nivel de emisiones X sería una variable aleatoria. La probabilidad de que X esté entre cualesquiera dos valores a y b es igual al área bajo el histograma entre a y b. Debido a que
el histograma en este caso se representa por una curva, la probabilidad se encontraría mediante el cálculo de una integral.
La variable aleatoria X descrita aquí es un ejemplo de una variable aleatoria continua.
Ésta se define como una variable aleatoria cuyas probabilidades se representan por áreas bajo
una curva. Esta curva se llama función de densidad de probabilidad. Como consecuencia
de que la función de densidad de probabilidad es una curva, los cálculos de las probabilidades
implican integrales, en vez de las sumatorias que se usan en el caso discreto.
Definición
Una variable aleatoria es continua si sus probabilidades están dadas por áreas bajo
una curva. La curva se llama función de densidad de probabilidad para la variable
aleatoria.
A veces la función de densidad de probabilidad se llama distribución de probabilidad.
100
CAPÍTULO 2
Probabilidad
Cálculo de probabilidades con la función
de densidad de probabilidad
Sea X una variable aleatoria continua. Sea la función f(x) la función de densidad de probabilidad de X. Sean a y b cualesquiera dos números, con a < b.
La proporción de la población cuyos valores de X están entre a y b están dados por
b
f
(x)
dx, y el área bajo la función de densidad de probabilidad entre a y b. Ésta es la proa
babilidad de que la variable aleatoria X tome un valor entre a y b. Observe que el área bajo la
curva no depende de si los puntos finales a y b estén incluidos en el intervalo. Por tanto, las
probabilidades que implican a X no dependen de si se incluyen a los puntos finales.
Resumen
Sea X una variable aleatoria continua con función de densidad de probabilidad f(x).
Sean a y b cualesquiera dos números, con a < b. Entonces
b
P (a ≤ X ≤ b) = P (a ≤ X < b) = P (a < X ≤ b) = P (a < X < b) =
f (x) dx
a
Además,
a
P (X ≤ a) = P (X < a) =
P (X ≥ a) = P (X > a) =
f (x) dx
(2.32)
f (x) dx
(2.33)
−∞
∞
a
Si f(x) es la función de densidad de probabilidad de una variable aleatoria X, entonces
el área bajo toda la curva desde ⫺∞ a ∞ es la probabilidad de que el valor de X esté entre ⫺∞
y ∞. Esta probabilidad debe ser igual a 1, ya que el valor de X siempre está entre ⫺∞ y ∞. Por
tanto, el área bajo toda la curva f(x) es igual a 1.
Resumen
Sea X una variable aleatoria continua con función de densidad de probabilidad f(x).
Entonces
∞
−∞
Ejemplo
2.40
f (x) dx = 1
Se perfora un hueco en un componente de una hoja de metal y después se inserta un eje a través del hueco. La holgura del eje es igual a la diferencia entre el radio del hueco y el radio
del eje. Sea X la variable aleatoria que denota a la holgura, en milímetros. La función de densidad de probabilidad de X es
Variables aleatorias
2.4
f (x) =
1.25(1 − x 4 )
0
101
0<x<1
de otro modo
Los componentes con holguras superiores a 0.8 mm se deben desechar. ¿Cuál es la proporción de componentes que serán desechados?
Solución
En la figura 2.11 se presenta la función de densidad de probabilidad de X. Observe que la densidad f(x) es 0 para x ≤ 0 y para x ≥ 1. Esto indica que las holguras siempre están entre 0 y 1
mm. La proporción de componentes que se debe desechar es P(X > 0.8), que es igual al área
bajo la función de densidad de probabilidad a la derecha de 0.8.
1.4
1.2
1
0.8
0.6
0.4
0.2
0
0
0.2
0.4
0.6
0.8
1
FIGURA 2.11 Gráfica de la función de densidad de probabilidad de X, la holgura
de un eje. El área sombreada es igual a P(X > 0.8).
Esta área está dada por
P (X > 0.8) =
=
∞
f (x) dx
0.8
1
0.8
1.25(1 − x 4 ) dx
x5
= 1.25 x −
5
1
0.8
= 0.0819
Función de distribución acumulativa
de una variable aleatoria continua
La función de distribución acumulativa de una variable aleatoria continua X es F(x) ⫽ P(X ≤
x), al igual que para una variable aleatoria discreta. Para esta última, F(x) se puede encontrar
al sumar los valores de la función de masa de probabilidad. Para una variable aleatoria continua, el valor de F(x) se obtiene al integrar la función de densidad de probabilidad. Puesto que
102
CAPÍTULO 2
Probabilidad
F(x) ⫽ P(X ≤ x) y usando la ecuación (2.32) se tiene que F(x) ⫽
la función de densidad de probabilidad.
x
−∞
f (t) dt, donde f(t) es
Definición
Sea X una variable aleatoria continua con función de densidad de probabilidad f(x). La
función de distribución acumulativa de X es la función
x
F (x) = P (X ≤ x) =
Ejemplo
2.41
f (t) dt
(2.34)
−∞
Con referencia al ejemplo 2.40, determine la función de distribución acumulativa F(x) y dibújela.
Solución
La función de densidad de probabilidad X está dada por f(t) ⫽ 0 si t ≤ 0, f(t) ⫽ 1.25(1 – t4) si
0 < t < 1 y f(t) ⫽ 0 si t ≥ l. La función de distribución acumulativa está dada por F(x) ⫽
x
−∞ f (t) dt . Puesto que f(t) está definida por partes en tres intervalos diferentes, el cálculo de
la función de distribución acumulativa implica tres casos distintos.
Si x ≤ 0:
x
F (x) =
=
=0
Si 0 < x < 1:
f (t) dt
−∞
x
0 dt
−∞
x
F (x) =
=
=
f (t) dt
−∞
0
−∞
0
−∞
x
f (t) dt +
f (t) dt
0
x
0 dt +
0
1.25(1 − t 4 ) dt
t5
= 0 + 1.25 t −
5
5
x
= 1.25 x −
5
Si x > 1:
x
0
x
F (x) =
=
f (t) dt
−∞
0
−∞
1
f (t) dt +
0
x
f (t) dt +
f (t) dt
1
2.4
1
0
=
−∞
0 dt +
0
Variables aleatorias
103
x
1.25(1 − t 4 ) dt +
t5
= 0 + 1.25 t −
5
0 dt
1
1
0
+0
= 0+1+0
=1
Por tanto,
⎧
⎪
⎪
⎨
0
x5
F (x) = 1.25 x −
⎪
5
⎪
⎩
1
x≤0
0<x<1
x≥1
Aquí se presenta una gráfica de F(x).
1
0.75
0.50
0.25
0
0.25
0.50
0.75
1
Observe que la función de distribución acumulativa F(x) del ejemplo 2.41 representa
una función continua si su gráfica no presenta ningún salto. Ésta es una característica de las
variables aleatorias continuas. La función de distribución acumulativa de una variable aleatoria continua será continua siempre, mientras que la función de distribución acumulativa de
una variable aleatoria no continua nunca será continua.
Ejemplo
2.42
Con referencia al ejemplo 2.40, use la función de distribución acumulativa para encontrar la
probabilidad de que la holgura del eje es menor a 0.5 mm.
Solución
Sea X la holgura del eje. Se tiene que encontrar P(X ≤ 0.5). Éste es equivalente a encontrar
F(0.5), donde F(x) es la función de distribución acumulativa. Usando los resultados del ejemplo 2.41, F(0.5) ⫽ 1.25(0.5–0.55/5) ⫽ 0.617.
Media y varianza para variables aleatorias continuas
La poblacional y la varianza de una variable aleatoria continua están definidas de la misma
forma que para una variable aleatoria discreta, excepto que se usa la función de densidad de
probabilidad en lugar de la función de masa. Específicamente, si X constituye una variable
104
CAPÍTULO 2
Probabilidad
aleatoria continua, su poblacional se define como el centro de masa de su función de densidad de probabilidad y su poblacional representa el momento de inercia con respecto a un eje
vertical que pasa a través del centro de masa. Las fórmulas son análogas a las ecuaciones de
la (2.29) a la (2.31), con las sumatorias reemplazadas por integrales.
Como en el caso de las variables aleatorias discretas, a veces se eliminará la palabra
“poblacional” y se hará referencia a la media poblacional, a la varianza poblacional y la desviación poblacional sólo como la media, la varianza y la desviación estándar, respectivamente.
Definición
Sea X una variable aleatoria continua con función de densidad de probabilidad f(x).
Entonces la media de X está dada por
∞
µX =
(2.35)
xf (x) dx
−∞
A la media de X algunas veces se le llama esperanza, o valor esperado, de X y se puede denotar también por E(X) o por µ.
Definición
Sea X una variable aleatoria continua con función de densidad de probabilidad f(x).
Entonces
La varianza de X está dada por
σX2 =
∞
−∞
(x − µX )2 f (x) dx
(2.36)
Una fórmula alternativa para la varianza está dada por
σX2 =
∞
−∞
La varianza de X también se puede denotar por V(X) o por σ 2.
La desviación estándar es la raíz cuadrada de la varianza: σX =
Ejemplo
2.43
(2.37)
x 2 f (x) dx − µ2X
σX2 .
Con referencia al ejemplo 2.40, determine la media y la varianza de la holgura.
Solución
En la ecuación (2.35), la media de la holgura está dada por
µX =
=
∞
xf (x) dx
−∞
1
0
x[1.25(1 − x 4 )] dx
2.4
= 1.25
x6
x2
−
2
6
= 0.4167
Variables aleatorias
105
1
0
Una vez que se ha calculado µX ⫽ 0.4167, ahora se puede calcular σ X2. Es más fácil usar la
fórmula alternativa, ecuación (2.37):
σX2 =
=
∞
−∞
1
0
x 2 f (x) dx − µ2X
x 2 [1.25(1 − x 4 )] dx − (0.4167)2
= 1.25
x3
x7
−
3
7
= 0.0645
1
0
− (0.4167)2
Mediana poblacional y percentiles
En la sección 1.2 se definió la mediana de una muestra como el número de en medio, el promedio de los dos números intermedios, cuando los valores de la muestra están ordenados del
más pequeño al más grande. Intuitivamente, la mediana de la muestra constituye el punto que
divide a la muestra por la mitad. La mediana poblacional se define en forma similar. En relación con la función de densidad de probabilidad, la mediana representa el punto para el que
la mitad del área bajo la curva está a la izquierda y la otra mitad a la derecha. En este contexto, si X es una variable aleatoria continua con función de densidad de probabilidad f(x), la mexm
f (x) dx = 0.5.
diana de X es el punto xm que resuelve la ecuación P (X ≤ xm ) = −∞
0 Sea 0 < 100
h Elhp-ésimo il
f
La mediana es un caso especial de un percentil.
p < 100.
percentil
de
una población es el valor xp de forma que el p% de los valores de población sean menores o
iguales a xp. Por tanto, si X es una variable aleatoria continua con función de densidad de probabilidad f(x), el p-ésimo percentil de X es el punto xp que resuelve la ecuación P (X ≤ xp ) =
xp
−∞ f (x) dx = p/100. Observe que la mediana es el 50avo. percentil. La figura 2.12 muestra a la mediana y al 90avo. percentil para una población hipotética.
Área = 0.5
Área = 0.9
xm
x90
a)
b)
FIGURA 2.12 a) La mitad de los valores de la población son menores que la mediana xm.
b) 90% de los valores de población que son menores que el 90avo. percentil x90.
106
CAPÍTULO 2
Probabilidad
Definición
Sea X una variable aleatoria continua con función de masa de probabilidad f(x) y
función de distribución acumulativa F(x).
La mediana de X es el punto
xm que resuelve la ecuación
p
F (xm ) = P (X ≤ xm ) =
xm
−∞
f (x) dx = 0.5.
Si p es cualquier número entre 0 y 100, el p-ésimo percentil es el punto
xp que
p
xp
resuelve la ecuación F (xp ) = P (X ≤ xp ) = −∞
f (x) dx = p/100.
La mediana es el 50avo. percentil.
Se observa que es posible construir variables aleatorias continuas para las cuales hay un
intervalo de puntos que satisfacen la definición de la mediana o de un percentil. Tales variables aleatorias rara vez se encuentran en la práctica.
Ejemplo
2.44
Cierta masa radiactiva emite partículas alfa periódicamente. El tiempo entre emisiones, en segundos, es aleatorio, con función de densidad de probabilidad
f (x) =
0.1e−0.1x
0
x>0
x≤0
Determine la mediana del tiempo entre emisiones. Determine el 60avo. percentil de los tiempos.
Solución
La mediana xm es la solución de
xm
−∞
xm
0
f (x) dx = 0.5. Por tanto, se debe resolver
0.1e−0.1x dx = 0.5
xm
−e−0.1x
1−e
e
0
−0.1xm
−0.1xm
= 0.5
= 0.5
= 0.5
−0.1xm = ln 0.5
0.1xm = 0.6931
xm = 6.931 s
La mitad de los tiempos entre emisiones es menor a 6.931 s y la mitad es más grande.
x60
El 60avo. percentil x60 es la solución de −∞
f (x) dx = 0.6. Al proceder como antes,
se sustituye x60 por xm y 0.6 por 0.5. Con lo que se obtiene
1 − e−0.1x60 = 0.6
e−0.1x60 = 0.4
−0.1x60 = ln 0.4
107
Variables aleatorias
2.4
0.1x60 = 0.9163
x60 = 9.163 s
Sesenta por ciento de los tiempos entre emisiones es menor a 9.163 s y 40% es más grande.
Deducción de la fórmula alternativa para la varianza
Para deducir la ecuación (2.31) se inicia con la ecuación (2.30).
σX2 =
(x − µX )2 P (X = x)
x
Al desarrollar el binomio al cuadrado (x ⫺ µX)2 se obtiene
σ X2 ⫽
(x2 ⫺ 2xµX ⫹ µ X2)P(X ⫽ x)
x
Al distribuir el término P(X ⫽ x) sobre los términos entre paréntesis se tiene que
σX2 =
[x 2 P (X = x) − 2xµX P (X = x) + µ2X P (X = x)]
x
Sumando los términos por separado,
σX2 =
x 2 P (X = x) −
2xµX P (X = x) +
µ2X P (X = x)
x
x
(2.38)
x
Ahora
= x) = 2µX x xP (X = x) = 2µX µX = 2µ2X , y
Now
x 2xµX P (X
2
2
2
2
x µX P (X = x) = µX
x P (X = x) = µX (1) = µX .
Sustituyendo en la ecuación (2.38) se obtiene
σX2 =
x 2 P (X = x) − 2µ2X + µ2X
x
Se concluye que
σX2 =
x
x 2 P (X = x) − µ2X
Para obtener la fórmula alternativa (2.37) a partir de la ecuación (2.36) para la varianza
de una variable aleatoria continua, se pueden usar los mismos pasos; reemplazando 兺x
∞
con 兰⫺∞
, y P(X ⫽ x) con ƒ(x)dx.
Ejercicios para la sección 2.4
1. Determine si cada una de las siguientes variables aleatorias
es discreta o continua.
a) El número de caras en 100 lanzamientos a “cara” o
“cruz” de una moneda.
b) La longitud de una varilla elegida aleatoriamente de la
producción de un día.
c) El puntaje del examen final de un estudiante elegido
aleatoriamente de la clase de estadística de ingeniería
del último semestre.
d) La edad de un estudiante elegido aleatoriamente de la
Escuela de Minas, de Colorado.
108
CAPÍTULO 2
Probabilidad
c) La edad que tendrá un estudiante de la Escuela de Minas, de Colorado, elegida aleatoriamente en su próximo
cumpleaños.
2. La tabla siguiente presenta la función de masa de probabilidad del número de defectos X en un tablero de circuitos
impresos elegido aleatoriamente.
0
0.5
x
p(x)
1
0.3
2
0.1
3
0.1
x
p1 (x)
p2 (x)
p3 (x)
0
1
2
3
4
0.2
0.1
0.1
0.2
0.3
0.2
0.3
0.3
0.4
0.1
0.2
0.2
0.1
0.2
0.1
b) Para la función de masa de probabilidad posible, calcule
µX y σX2 .
a) Determine P(X < 2).
b) Determine P(X ≥ 1).
c) Determine µX.
d) Determine σ X2 .
3. Una compañía de materiales químicos envía cierto disolvente en tambores de diez galones. Sea X el número de tambores pedidos por un cliente elegido aleatoriamente. Suponga
que X tiene la siguiente función de masa de probabilidad:
x
p(x)
1
0.4
2
0.2
3
0.2
4
0.1
5
0.1
a) Determine la media del número de tambores ordenados.
b) Determine la varianza del número de tambores ordenados.
c) Determine la desviación estándar del número de tambores ordenados.
d) Sea Y el número de galones ordenados. Determine la
función de masa de probabilidad de Y.
e) Determine la media del número de galones ordenados.
f) Determine la varianza del número de galones ordenados.
g) Determine la desviación estándar del número de galones
ordenados.
4. Un automóvil viejo con un motor de cuatro cilindros es llevado a un taller para ajustarlo. Sea X el número de cilindros
con compresión baja.
a) ¿Cuál de las tres funciones dadas en la tabla siguiente es
una función de masa de probabilidad posible de X? Explique.
5. Cierto tipo de componente está empaquetado en lotes de
cuatro. Sea X el número de componentes que funcionan
de modo adecuado en un lote elegido de manera aleatoria.
Suponga que la probabilidad de que exactamente x componentes funcionen es proporcional a x; en otras palabras, suponga que la función de masa de probabilidad de X es dada por
p(x) =
cx
0
x = 1, 2, 3, o 4
de otro modo
donde c es una constante.
a) Determine el valor de la constante c para que p(x) sea
una función de masa de probabilidad.
b) Determine P(X ⫽ 2).
c) Determine la media del número de componentes que
funcionan adecuadamente.
d ) Determine la varianza del número de componentes que
funcionan adecuadamente.
e) Determine la desviación estándar del número de componentes que funcionan adecuadamente.
6. El producto de un proceso químico se supervisa continuamente para asegurar que la concentración permanezca dentro de los límites aceptables. Cada vez que la concentración
se sale de los límites, el proceso se detiene y se calibra nuevamente. Sea X el número de veces en una semana dada que
el proceso se calibra nuevamente. La tabla siguiente presenta los valores de la función de distribución acumulativa F(x)
de X.
x
F.x/
0
1
2
3
4
0.17
0.53
0.84
0.97
1.00
2.4
Variables aleatorias
109
a) ¿Cuál es la probabilidad de que el proceso se calibre
nuevamente menos de dos veces durante una semana?
a) ¿Cuál es la probabilidad de que el primer chip elegido
sea aceptable?
b) ¿Cuál es la probabilidad de que el proceso se calibre
nuevamente más de tres veces durante una semana?
b) ¿Cuál es la probabilidad de que el primer chip sea inaceptable y que el segundo sea aceptable?
c) ¿Cuál es la probabilidad de que el proceso se calibre de
nuevo exactamente una vez durante una semana?
c) Sea X el número de chips que se prueba hasta incluir el
primer chip aceptable. Determine P(X ⫽ 3).
d) ¿Cuál es la probabilidad de que el proceso no se calibre
nuevamente durante una semana?
d) Determine la función de masa de probabilidad de X.
e) ¿Cuál es el número más probable de que ocurran nuevas
calibraciones durante una semana?
9. Con referencia al ejercicio 8, sea Y el número de chips probados hasta incluir el segundo chip aceptable.
7. En 100 días diferentes, un ingeniero especializado en el
tránsito de automóviles cuenta el número de éstos que pasan por cierto crucero entre las 5:00 y 5:05 p.m. Los resultados se presentan en la tabla siguiente.
a) ¿Cuál es el valor más pequeño posible de Y?
b) ¿Cuál es la probabilidad de que Y tome ese valor?
c) Sea X el número de chips que se prueba hasta incluir el
primer chip aceptable. Determine P(Y ⫽ 3⏐X ⫽ 1).
d) Determine P(Y ⫽ 3⏐X ⫽ 2).
e) Determine P(Y ⫽ 3).
Número de
automóviles
0
1
2
3
4
5
Número
de días
36
28
15
10
7
4
Proporción
de días
0.36
0.28
0.15
0.10
0.07
0.04
a) Sea X el número de automóviles que pasan por el crucero entre las 5:00 y las 5:05 p.m. en un día elegido aleatoriamente. Alguien sugiere que para cualquier entero
positivo x, la de masa de probabilidad de X es p1(x) ⫽
(0.2)(0.8)x. Usando esta función, calcule P(X ⫽ x) para
valores de x de 0 a 5 inclusive.
b) Otra persona sugiere que para cualquier entero positivo
x, la función de masa de probabilidad es p2(x) ⫽
(0.4)(0.6)x. Usando esta función, calcule P(X ⫽ x) para
valores de x de 0 a 5 inclusive.
c) Compare los resultados de los incisos a) y b) con los datos de la tabla. ¿Cuál función de masa de probabilidad
parece ser el mejor modelo? Explique.
d) Alguien dice que ninguna de las funciones es un buen
modelo ya que ninguna coincide exactamente con los
datos. ¿Esto es correcto? Explique.
8. Se seleccionan aleatoriamente chips de microprocesadores
uno tras otro de una gran población y se prueban para determinar si son aceptables para determinada aplicación. El 90%
de los chips en la población es aceptable.
10. Se seleccionan aleatoriamente tres componentes, uno a la
vez, de un gran lote. Cuando se selecciona cada componente, se prueba. Si pasa la prueba, ocurre un éxito (S); si no
pasa la prueba, ocurre una falla (F). Suponga que 80% de
los componentes del lote conseguirá pasar la prueba. Sea X
el número de éxitos entre los tres componentes seleccionados.
a) ¿Cuáles son los valores posibles para X?
b) Determine P(X ⫽ 3).
c) Al evento de que falle el primer componente y que los
próximos dos pasen con éxito la prueba se denota por
FSS. Determine P(FSS).
d) Determine P(SFS) y P(SSF).
e) Use los resultados de los incisos c) y d) para encontrar
P(X ⫽ 2).
f) Determine P(X ⫽ 1).
g) Determine P(X ⫽ 0).
h) Determine µX.
i) Determine σX2 .
j) Sea Y el número de éxitos si se seleccionan cuatro componentes. Determine P(Y ⫽ 3).
11. La hidrogenación del benceno para el ciclohexano es promovida con un catalizador de níquel dividido en poros finos. El catalizador de partículas se puede considerar como
esferas de diferentes tamaños. Todas las partículas tienen
masas entre 10 y 70 µg. Sea X la masa de una partícula ele-
110
Probabilidad
CAPÍTULO 2
gida aleatoriamente. La función de densidad de probabilidad de X está dada por
f (x) =
x − 10
1 800
0
c) Determine la función de distribución acumulativa del
tiempo entre emisiones.
10 < x < 70
d) Determine la probabilidad de que el tiempo entre emisiones sea menor a diez segundos.
de otro modo
e) Determine la mediana del tiempo entre emisiones.
a) ¿Cuál es la proporción de partículas que tiene una masa
menor a 50 µg?
b) Determine la media de las masas de las partículas.
c) Determine la desviación estándar de las masas de las
partículas.
f) Determine el 90avo. percentil de los tiempos entre emisiones.
14. Un proceso que fabrica anillos de pistón produce anillos cuyos diámetros (en centímetros) varían de acuerdo con la
función de densidad de probabilidad
d) Determine la función de distribución acumulativa de las
masas de las partículas.
e) Determine la mediana de las masas de las partículas.
12. Las especificaciones piden que el espesor de las hojas de aluminio para hacer latas estén entre 8 y 11 milésimos de pulgada. Sea X el espesor de una hoja de aluminio. Suponga
que la función de densidad de probabilidad de X está dada
por
f (x) =
x
54
0
6 < x < 12
de otro modo
f (x) =
3[1 − 16(x − 10)2 ]
0
9.75 < x < 10.25
de otro modo
a) Determine la media del diámetro de los anillos que se
fabrican mediante este proceso.
b) Determine la desviación estándar de los diámetros de
anillos fabricados por este proceso. (Sugerencia: La
ecuación 2.36 puede ser más fácil de usar que la ecuación 2.37.)
c) Determine la función de distribución acumulativa de los
diámetros de los anillos de pistón.
a) ¿Qué proporción de hojas cubrirán con la especificación?
d) ¿Qué proporción de anillos de pistón tiene diámetros
menores a 9.75 centímetros?
b) Determine la media del espesor de una hoja.
e) ¿Qué proporción de anillos de pistón tiene diámetros entre 9.75 y 10.25 centímetros?
c) Determine la varianza del espesor de una hoja.
d) Determine la desviación estándar del espesor de una
hoja.
e) Determine la función de distribución acumulativa del
espesor.
15. Con referencia al ejercicio 14, un proceso competidor produce anillos cuyos diámetros (en centímetros) varían de
acuerdo con la función de densidad de probabilidad
f) Determine la mediana el espesor.
g) Determine el décimo percentil del espesor.
h) Una hoja especial tiene 10 milésimos de pulgada de espesor. ¿Qué proporción de hojas tiene más espesor?
13. Una masa radiactiva emite partículas de tiempo periódicamente. El tiempo entre dos emisiones es aleatorio. Sea T el
tiempo en segundos entre dos emisiones. Suponga que la
función de densidad de probabilidad de T es dada por
f (t) =
0.2e−0.2t
0
t >0
t ≤0
a) Determine la media del tiempo entre emisiones.
b) Determine la desviación estándar del tiempo entre emisiones.
f (x) =
⎧
⎨ 15[1 − 25(x − 10.05)2 ]/4
⎩
0
9.85 < x < 10.25
de otro modo
Las especificaciones pedidas para el diámetro son 10.0±0.1
cm. ¿Qué proceso es mejor, éste o el del ejercicio 14? Explique.
16. Las partículas son un componente muy importante de la
contaminación atmosférica en muchas áreas. Es interesante
estudiar los tamaños de las partículas contaminantes. Sea X
el diámetro, en micrómetros, de una partícula elegida aleatoriamente. Suponga que en cierta área, la función de densidad de probabilidad de X es inversamente proporcional al
volumen de la partícula; es decir, suponga que
2.5
f (x) =
c
x3
0
x≥1
x<1
donde c es una constante.
a) Determine el valor de c para que f(x) sea una función de
densidad de probabilidad.
b) Determine la media del diámetro de la partícula.
c) Determine la función de distribución acumulativa del
diámetro de la partícula.
d) Determine la mediana del diámetro de la partícula.
Funciones lineales de variables aleatorias
111
g) ¿Qué proporción de partículas PM10 son PM2.5?
17. Un científico ecologista está preocupado por la tasa a la que
se absorbe cierta solución tóxica en la piel. Sea X el volumen en microlitros de la solución absorbida por 1 pulg2 de
piel en 1 min. Suponga que la función de densidad de probabilidad
de X se aproxima bien por la función f (x) =
√
2
(2 2π )−1 e−(x−10) /8 , definida de –∞ < x < ∞.
a) Determine la media del volumen absorbido en 1 min.
b) (Difícil.) Determine la desviación estándar del volumen
absorbido en 1 min.
e) El término PM10 se refiere a partículas con diámetros
menores o iguales a 10 µm. ¿Qué proporción de partículas contaminantes son PM10?
f) El término PM2.5 se refiere a partículas con diámetros
menores o iguales a 2.5 µm. ¿Qué proporción de partículas contaminantes son PM2.5?
2.5 Funciones lineales de variables aleatorias
En la práctica con frecuencia se construyen nuevas variables aleatorias realizando operaciones aritméticas con otras variables aleatorias. Por ejemplo, se podría sumar una constante a
una variable aleatoria, multiplicar una variable aleatoria por una constante, o sumar dos o más
variables aleatorias. En esta sección se describe cómo calcular medias y varianzas de variables aleatorias construidas de esta manera y se presentan algunos ejemplos prácticos. La presentación en esta sección es intuitiva. Una presentación más rigurosa se ofrece en la sección
2.6. Quienes deseen este tipo de presentación pueden cubrir la sección 2.6 además de, o en
lugar de, esta sección.
Sumando una constante
Cuando se suma una constante a una variable aleatoria, la media se aumenta por el valor de
la constante, pero la varianza y la desviación estándar son iguales. Por ejemplo, suponga que
las varillas de acero producidas por cierta máquina tienen una media de la longitud de 5.0 pulgadas y una varianza (σ 2 ⫽ 0.003 pulg2). Cada varilla se fija a una base que tiene exactamente 1.0 pulg de longitud. La media de la longitud del montaje será de 5.0 ⫹ 1.0 ⫽ 6.0 pulg.
Debido a que cada longitud se ha aumentado en la misma cantidad, la dispersión en las longitudes no cambia, por lo que la varianza es la misma. Para poner esto en términos estadísticos, sea X la longitud de una varilla elegida aleatoriamente y sea Y ⫽ X ⫹ 1 la longitud del
2
= σX2 . En general, cuando se sumontaje. Entonces µY = µX+1 = µX + 1, y σY2 = σX+1
ma una constante a una variable aleatoria, la media se desplaza en esa constante y la varianza no cambia.
112
CAPÍTULO 2
Probabilidad
Resumen
Si X es una variable aleatoria y b es una constante, entonces
µX+b = µX + b
(2.39)
2
σX+b
= σX2
(2.40)
Multiplicando por una constante
Con frecuencia se tiene que multiplicar una variable aleatoria por una constante. Esto último
se podría hacer, por ejemplo, al convertir a un sistema más conveniente de unidades. Se continúa con el ejemplo de la producción de varillas de acero para mostrar cómo se afecta la media, la varianza y la desviación estándar de una variable aleatoria por la multiplicación de una
constante.
Si medimos las longitudes de las varillas descritas anteriormente en centímetros en vez
de pulgadas, la media de longitud será (2.54 cm/pulg)(5.0 pulg) ⫽ 12.7 cm. En términos estadísticos, sea la variable aleatoria X la longitud en pulgadas de una varilla elegida aleatoriamente y sea Y ⫽ 2.54X la longitud en centímetros. Entonces µY ⫽ 2.54 µX. En general, cuando
una variable aleatoria se multiplica por una constante, su media se multiplica por la misma
constante.
Resumen
Si X es una variable aleatoria y a es una constante, entonces
µaX = aµX
(2.41)
Cuando la longitud X de una varilla se mide en pulgadas, la varianza σX2 debe tener unidades de pulg2. Si Y ⫽ 2.54X es la longitud en centímetros, entonces σY2 debe tener unidades
de cm2. Por tanto, se obtiene σY2 al multiplicar σX2 por 2.542, que es el factor de conversión de
pulg2 a cm2. En general, cuando una variable aleatoria se multiplica por una constante, su varianza se multiplica por el cuadrado de la constante.
Resumen
Si X es una variable aleatoria y a es una constante, entonces
2
σaX
= a 2 σX2
(2.42)
σaX = |a|σX
(2.43)
Si una variable aleatoria se multiplica por una constante y después se suma a otra constante, el efecto sobre la media y la varianza se puede determinar al combinar las ecuaciones
(2.39) y (2.41) y las ecuaciones (2.40) y (2.42). Los resultados se presentan en el resumen siguiente.
2.5
Funciones lineales de variables aleatorias
113
Resumen
Si X es una variable aleatoria y a y b son constantes, entonces
µaX+b = aµX + b
(2.44)
2
σaX+b
= a 2 σX2
(2.45)
σaX+b = |a|σX
(2.46)
Observe que las ecuaciones (2.44) a (2.46) son similares a los resultados para la media y la
desviación estándar de una muestra que se presentaron en la sección 1.2.
Ejemplo
2.45
La molaridad de un soluto en una solución se define como el número de moles de soluto por
litro de solución (1 mol ⫽ 6.02 × 1023 moléculas). Si la molaridad de una solución existente
de ácido sulfúrico concentrado (H2SO4) es X y si una parte de la solución se mezcla con N
partes de agua, la molaridad Y de la solución diluida está dada por Y ⫽ X/(N ⫹ 1). Suponga
que la solución existente se fabricó con un proceso que produce una molaridad con una media de 18 y con una desviación estándar de 0.1. Si a 100 ml de la solución existente se le agregan 300 ml de agua, determine la media y la desviación estándar de la molaridad de la
solución diluida.
Solución
La molaridad de la solución diluida es Y ⫽ 0.25X. La media y la desviación estándar de X son
µX ⫽ 18 y σX ⫽ 0.1, respectivamente. Por tanto,
µY = µ0.25X
= 0.25µX
(utilizando la ecuación 2.41)
= 0.25(18.0)
También,
= 4.5
σY = σ0.25X
= 0.25σX
(utilizando la ecuación 2.43)
= 0.25(0.1)
= 0.025
Medias de combinaciones lineales de variables aleatorias
Considere el caso de sumar dos variables aleatorias. Por ejemplo, suponga que hay dos máquinas que fabrican cierta pieza de metal. La media de la producción diaria de la máquina A
114
CAPÍTULO 2
Probabilidad
es de 100 piezas y la media de la producción diaria de la máquina B es de 150 piezas. Evidentemente la media de la producción diaria de las dos máquinas es de 250 piezas. Poniendo
esto en notación matemática, sea X el número de piezas producidas en un día dado por la máquina A y sea Y el número de piezas producidas en el mismo día por la máquina B. El número total de piezas es X ⫹ Y y se tiene que µX ⫹ Y ⫽ µX ⫹ µY.
Esta idea se generaliza para cualquier número de variables aleatorias.
Si X1, X2,. . . , Xn son variables aleatorias, entonces la media de la suma X1 ⫹ X2 ⫹ . . .
⫹ Xn está dada por
µX1 +X2 + ··· +Xn = µX1 + µX2 + · · · + µXn
(2.47)
La suma X1 ⫹ X2 ⫹ . . . ⫹ Xn es un caso especial de combinación lineal:
Si X1, . . . , Xn son variables aleatorias y c1, . . . , cn son constantes, entonces la variable aleatoria
c1X1 ⫹ . . . ⫹ cnXn
se denomina combinación lineal de X1, . . . , Xn.
Para encontrar la media de una combinación lineal de variables aleatorias, se puede
combinar las ecuaciones (2.41) y (2.47):
Si X y Y son variables aleatorias y a y b son constantes, entonces
µaX+bY = µaX + µbY = aµX + bµY
(2.48)
µc1 X1 +c2 X2 + ··· +cn Xn = c1 µX1 + c2 µX2 + · · · + cn µXn
(2.49)
De forma más general, si X1,X2, . . . , Xn son variables aleatorias y c1,c2, . . . , cn son
constantes, entonces la media de la combinación lineal c1X1 ⫹ c2X2 ⫹ . . . ⫹ cn Xn está dada por
Variables aleatorias independientes
El concepto de independencia para variables aleatorias es exactamente como el concepto de independencia para eventos. Dos variables aleatorias son independientes si se sabe que una de
ellas no afecta las probabilidades de los demás. Cuando dos eventos son independientes, la
probabilidad de que ambos ocurran se encuentra multiplicando las probabilidades para cada
evento (véanse las ecuaciones 2.19 y 2.20 de la sección 2.3). Hay fórmulas similares para variables aleatorias independientes. La notación para estas fórmulas es la siguiente. Sea X una
variable aleatoria y sea S un conjunto de números. La notación “X ∈ S” significa que el valor de la variable aleatoria X está en el conjunto S.
2.5
115
Funciones lineales de variables aleatorias
Definición
Si X y Y son variables aleatorias independientes y S y T son conjuntos de números,
entonces
P (X ∈ S y Y ∈ T ) = P (X ∈ S)P (Y ∈ T )
(2.50)
De forma más general, si X1,X2, . . . , Xn son variables aleatorias independientes y
S1, . . . , Sn son conjuntos, entonces
P (X1 ∈ S1 y X2 ∈ S2 y · · · y Xn ∈ Sn ) =
P (X1 ∈ S1 )P (X2 ∈ S2 ) · · · P (Xn ∈ Sn )
Ejemplo
2.46
(2.51)
Las bandejas de plástico rectangulares para un disco compacto (CD) tienen especificaciones
de longitud y de ancho, sea X la longitud y Y el ancho, cada una se mide al milímetro más cercano, de una bandeja seleccionada aleatoriamente. La de masa de probabilidad de X está dada por P(X ⫽ 129) ⫽ 0.2, P(X ⫽ 130) ⫽ 0.7 y P(X ⫽ 131) ⫽ 0.1. La de masa de probabilidad
de Y está dada por P(Y ⫽ 15) ⫽ 0.6 y P(Y ⫽ 16) ⫽ 0.4. El área de una bandeja está dada por
A ⫽ XY. Suponga que X y Y son independientes. Determine la probabilidad de que el área sea
1 935 mm2.
Solución
El área será igual a 1 935 si X ⫽ 129 y Y ⫽ 15. Por tanto,
P (A = 1 935) = P (X = 129 y Y = 15)
= P (X = 129)P (Y = 15)
= (0.2)(0.6)
ya que X y Y son independientes
= 0.12
Las ecuaciones (2.50) y (2.51) indican cómo calcular probabilidades para variables aleatorias
independientes, pero no son generalmente de mucha ayuda para determinar si las variables
aleatorias son en realidad independientes. En general, la mejor manera de determinar si las
variables aleatorias son independientes es entendiendo el proceso que las generó.
Varianzas de combinaciones lineales de variables
aleatorias independientes
Se ha visto que la media de una suma de variables aleatorias es siempre igual a la suma de las
medias (ecuación 2.47). En general, la fórmula para la varianza de una suma de variables aleatorias es un poco más complicada que esto último. Pero cuando las variables aleatorias son
independientes, el resultado es simple: la varianza de la suma es la suma de las varianzas.
116
CAPÍTULO 2
Probabilidad
Si X1,X2, . . . , Xn son variables aleatorias independientes, entonces la varianza de la
suma X1 ⫹ X2 ⫹ . . . ⫹ Xn está dada por
σX2 1 +X2 + ··· +Xn = σX2 1 + σX2 2 + · · · + σX2 n
(2.52)
Para encontrar la varianza de una combinación lineal de variables aleatorias, se puede
combinar las ecuaciones (2.52) y (2.42):
Si X1, X2, . . . , Xn son variables aleatorias independientes y c1,c2, . . . , cn son constantes, entonces la varianza de la combinación lineal c1X1 ⫹ c2X2 ⫹ . . . ⫹ cnXn está
dada por
σc21 X1 +c2 X2 + ··· +cn Xn = c12 σX2 1 + c22 σX2 2 + · · · + cn2 σX2 n
(2.53)
Dos combinaciones lineales frecuentemente encontradas son la suma y la diferencia de
dos variables aleatorias. Curiosamente, cuando las variables aleatorias son independientes, la
varianza de la suma es igual a la varianza de la diferencia.
Si X y Y son variables aleatorias independientes con las varianzas σX2 y σY2 , entonces
la varianza de la suma X ⫹ Y es
2
σX+Y
= σX2 + σY2
(2.54)
La varianza de la diferencia X – Y es
2
σX−Y
= σX2 + σY2
(2.55)
El hecho de que la varianza de la diferencia es la suma de las varianzas podría parecer contradictorio. Sin embargo, se obtiene de la ecuación (2.53) al hacer c1 ⫽ l y c2 ⫽ ⫺1.
Ejemplo
2.47
Un pistón se coloca dentro de un cilindro. La holgura es la distancia entre el borde del pistón
y la pared del cilindro y es igual a la mitad de la diferencia entre el diámetro del cilindro y el
diámetro del pistón. Suponga que el diámetro del pistón tiene una media de 80.85 cm con una
desviación estándar de 0.02 cm. Suponga que el diámetro del cilindro tiene una media de
80.95 cm con una desviación estándar de 0.03 cm. Determine la media de la holgura. Suponiendo que el pistón y el cilindro se eligen independientemente, determine la desviación estándar de la holgura.
Solución
Sea X1 el diámetro del cilindro y sea X2 el diámetro del pistón. La holgura está dada por C ⫽
0.5X1 ⫺ 0.5X2. Usando la ecuación (2.49), la media del perímetro es
2.5
Funciones lineales de variables aleatorias
117
µC = µ0.5X1 −0.5X2
= 0.5µX1 − 0.5µX2
= 0.5(80.95) − 0.5(80.85)
= 0.050
Puesto que X1 y X2 son independientes, se puede usar la ecuación (2.53) para encontrar la desviación estándar σC:
2
σC = σ0.5X
1 −0.5X2
= (0.5)2 σX2 1 + (−0.5)2 σX2 2
= 0.25(0.02)2 + 0.25(0.03)2
= 0.018
Independencia y muestras aleatorias simples
Cuando se toma una muestra aleatoria simple de valores numéricos de una población, a cada
elemento de la muestra se le puede pensar como una variable aleatoria. Los elementos en una
muestra aleatoria simple se pueden tratar como independientes, excepto cuando la muestra es
una proporción grande (mayor a 5%) de una población finita (véase el análisis de independencia en la sección 1.1). De ahora en adelante, a menos que se indique explícitamente lo contrario, se supondrá que no ocurre esta excepción, por lo que los valores en una muestra
aleatoria simple se pueden tratar como variables aleatorias independientes.
Resumen
Si X1,X2, . . . , Xn es una muestra aleatoria simple, entonces X1,X2, . . . , Xn se puede
tratar como variables aleatorias independientes, todas con la misma distribución.
A veces cuando X1, . . . , Xn son variables aleatorias independientes, todas con la misma distribución, se dice que X1, . . . , Xn son independientes e idénticamente distribuidas (i.i.d).
Media y varianza de una media de la muestra
La combinación lineal frecuentemente encontrada es la media de muestra. Específicamente,
si X1, . . . , Xn es una muestra aleatoria simple de una población con media µ y varianza σ2,
—
entonces la media muestral X es la combinación lineal
X=
1
1
X1 + · · · + Xn
n
n
—
A partir de lo anterior se puede calcular la media y la varianza de X .
µX = µ n1 X1 + ··· + n1 Xn
=
1
1
µX1 + · · · + µXn
n
n
(usando la ecuación 2.49)
118
CAPÍTULO 2
Probabilidad
1
1
µ + ··· + µ
n n
1
= (n)
µ
n
=
=µ
Como se analizó anteriormente, los elementos de una muestra aleatoria simple se pueden tratar como variables independientes aleatorias. Por tanto
σX2 = σ 21 X1 + ··· + 1 Xn
n
n
1
1
= 2 σX2 1 + · · · + 2 σX2 n
n
n
1 2
1 2
= 2σ + ··· + 2σ
n
n
1
2
σ
= (n)
n2
σ2
=
n
(utilizando la ecuación 2.53)
Resumen
Si X1, . . . , Xn es una muestra aleatoria simple de una población con media µ y va—
rianza σ 2, entonces la media muestral X es una variable aleatoria con
—
µX = µ
σ2
σX2 =
n
(2.56)
(2.57)
La desviación estándar de X es
σ
σX = √
n
Ejemplo
2.48
(2.58)
Un proceso que llena botellas de plástico con una bebida tiene una media de volumen de llenado de 2.013 L y una desviación estándar de 0.005 L. Una caja contiene 24 botellas. Suponiendo que las botellas en una caja son una muestra aleatoria simple de botellas llenadas con
este método, determine la media y la desviación estándar del volumen promedio por botella
en una caja.
Solución
Sea que V1, . . . , V24 representen los volúmenes en las 24 botellas en una caja. Ésta es una muestra aleatoria simple de una población con media µ ⫽ 2.013 y desviación estándar σ ⫽ 0.005.
El volumen promedio es V = (V1 + · · · + V24 )/24. Utilizando la ecuación (2.56),
2.5
Funciones lineales de variables aleatorias
119
µV = µ = 2.013
Usando la ecuación (2.58),
σ
σV = √ = 0.001
24
Ejercicios para la sección 2.5
1. Si X y Y son variables aleatorias independientes con medias
µX ⫽ 10.5 y µY ⫽ 5.7 y desviaciones estándares σX ⫽ 0.5 y
σY ⫽ 0.3, determine las medias y las desviaciones estándares de las cantidades siguientes:
a) 2X
b) X ⫺ Y
c) 3X ⫹ 2Y
2. Si un resistor con resistencia R ohms lleva una corriente de
I amperes, la diferencia de potencial a través del resistor, en
volts, está dada por V ⫽ IR. La resistencia de un resistor
elegido aleatoriamente que está etiquetado con 100 Ω tiene
una media de 100 Ω y una desviación estándar de 10 Ω. En
un resistor seleccionado aleatoriamente se establece una corriente de 3 A.
a) Determine µv.
b) Determine σv.
3. El tiempo de vida de cierto foco en una aplicación específica tiene una media de 700 horas y una desviación estándar
de 20 horas. Cuando se funde cada foco, se reemplaza con
un foco nuevo. Determine la media y la desviación estándar
del tiempo que durarán cinco focos.
4. Dos resistores, con resistencias R1 y R2, se conectan en serie. La resistencia combinada R está dada por R ⫽ R1 ⫹ R2.
Suponiendo que R1 tiene una media de 50 Ω y una desviación estándar de 5 Ω y que R2 tiene una media de 100 Ω y
una desviación estándar de 10 Ω.
a) Determine µR.
b) Suponiendo que R1 y R2 son independientes, determine
σR.
b) Determine la desviación estándar del espesor de una
pieza de madera contrachapada.
6. La fabricación de cierto artículo requiere que dos máquinas
funcionen consecutivamente. El tiempo en la primera máquina tiene una media de 10 min y desviación estándar de 2
min. El tiempo en la segunda máquina tiene una media de
15 min y una desviación estándar de 3 min. Suponga que
los tiempos invertidos en las dos máquinas son independientes.
a) Determine la media del tiempo total invertido en las dos
máquinas.
b) Determine la desviación estándar del tiempo total invertido en las dos máquinas.
7. La molaridad de un soluto en una solución está definido como el número de moles de soluto por litro de solución (1
mol ⫽ 6.02 × 1023 moléculas). Si X es la molaridad de una
solución de cloruro de magnesio (MgCl2) y Y es la molaridad de una solución de cloruro férrico (FeCl3), la molaridad
del ion de cloro (Cl⫺) en una solución hecha a partes iguales de la solución, de MgCl2 y FeCl3 está dada por M ⫽ X
⫹ 1.5Y. Suponga que X tiene una media de 0.125 y una desviación estándar 0.05 y que Y tiene una media de 0.350 y
una desviación estándar de 0.10.
a) Determine µM.
b) Suponiendo que X y Y son independientes, determine
σM.
8. Una máquina que llena cajas de cartón con cereal tiene un
peso de llenado cuya media es 12.02 oz, con una desviación
estándar de 0.03 oz. Una caja consta de 12 cajas seleccionadas aleatoriamente del producto de la máquina.
a) Determine la media del peso total de cereal en la caja.
5. Una pieza de madera contrachapada está compuesta de cinco capas. Las capas son una muestra aleatoria simple de una
población cuyos espesores tienen una media de 0.125 pulg
y una desviación estándar de 0.005 pulg.
b) Determine la desviación estándar del peso total del cereal en la caja.
a) Determine la media del espesor de una pieza de madera
contrachapada.
d) Determine la desviación estándar del peso promedio por
caja del cereal en la caja.
c) Determine la media del peso promedio por caja del cereal en la caja.
120
CAPÍTULO 2
Probabilidad
e) ¿Cuántas cajas se deben incluir en una caja para que la
desviación estándar del peso promedio de la caja sea
0.005 oz?
9. Los cuatro lados de un marco de fotografía constan de dos
piezas seleccionadas de una población cuya media de la
longitud es de 30 cm con desviación estándar de 0.1 cm y
dos piezas seleccionadas de una población cuya media de la
longitud es de 45 cm con desviación estándar de 0.3 cm.
a) Determine la media del perímetro.
b) Suponga que las cuatro piezas se eligen independientemente. Determine la desviación estándar del perímetro.
10. Una estación de gasolina percibe $1.60 en ingreso por cada
galón de gasolina regular que vende, $1.75 para cada galón
de gasolina de medio grado y $1.90 para cada galón de gasolina súper. Sea que X1, X2 y X3 indiquen los números de
galones de gasolina regular, de medio grado y súper que se
vendieron en un día. Suponga que X1, X2 y X3 tienen medias
µ1 ⫽ 1 500, µ2 ⫽ 500 y µ3 ⫽ 300 y desviaciones estándares σ1 ⫽ 180, σ2 ⫽ 90 y σ3 ⫽ 40, respectivamente.
a) Determine la media del ingreso diario.
b) Suponiendo que X1, X2 y X3 son independientes. Determine la desviación estándar del ingreso diario.
11. En el artículo “An Investigation of the Ca⫺CO3⫺CaF2⫺
K2SiO3⫺SiO2⫺Fe Flux System Using the Submerged Are
Welding Process on HSLA-100 and AISI-1018 Steels” (G.
Fredrickson, tesis de maestría, Escuela de Minas, de Colorado, 1992), el carbono equivalente p de una soldadura de
metal se definió como una combinación lineal de los por-
2.6
centajes de los pesos de carbono (C), manganeso (Mn), cobre (Cu), cromo (Cr), silicio (Si), níquel (Ni), molibdeno
(Mo), vanadio (V) y boro (B). El carbono equivalente está
dado por
P = C+
Mn + Cu + Cr Si Ni Mo V
+ + +
+ +5B
20
30 60 15 10
Las medias y las desviaciones estándares de los porcentajes
de los pesos de estos elementos químicos se calcularon de
las mediciones en 45 soldaduras de metales producidas con
el metal base de acero HSLA-100. Suponga que las medias
y las desviaciones estándares (DE) son como se muestran
en la tabla siguiente.
C
Mn
Cu
Cr
Si
Ni
Mo
V
B
Media
DE
0.0695
1.0477
0.8649
0.7356
0.2171
2.8146
0.5913
0.0079
0.0006
0.0018
0.0269
0.0225
0.0113
0.0185
0.0284
0.0031
0.0006
0.0002
a) Determine la media del equivalente de carbono de metales de soldadura fabricados con el metal base de acero
HSLA-1000.
b) Suponiendo que los porcentajes de los peso sean independientes, determine la desviación estándar del equivalente de carbono de metales de soldadura fabricados con
el metal base de acero HSLA-1000.
Variables aleatorias con distribución conjunta*
En esta sección se presentan resultados de algunas variables aleatorias en un modo más riguroso que en la sección 2.5. Para las personas que deseen este tipo de presentación pueden cubrir esta sección además, o en lugar, de la sección 2.5.
Se ha dicho que observar un valor de una variable aleatoria es como seleccionar un valor de una población. En algunos casos, los elementos en la población podrían tener algunas
variables aleatorias relacionadas con cada una de ellos. Por ejemplo, imagine elegir aleatoriamente un estudiante de una lista de todos los estudiantes inscritos en una universidad y tomar
datos de su estatura y peso. A cada persona de la población de estudiantes le corresponden
dos variables aleatorias, la altura y el peso. Si también se determinara la edad del estudiante,
* Esta sección es opcional.
Variables aleatorias con distribución conjunta
2.6
121
a cada persona le corresponderían tres variables. En principio, cualquier número de variables
aleatorias se puede relacionar con cada elemento en una población.
Cuando dos o más variables aleatorias están relacionadas con cada elemento de una población, se dice que aquéllas están con distribución conjunta. Si todas son discretas, se dice que son conjuntamente discretas. Si todas son continuas, entonces son conjuntamente
continuas. Se estudiarán estos dos casos por separado.
Variables aleatorias conjuntamente discretas
En el ejemplo 2.46 (de la sección 2.5) se analizaron las longitudes y los anchos de la bandeja de plástico rectangular para un CD que está instalada en una computadora personal. Las
mediciones se redondearon al milímetro más cercano. Sean X la longitud medida y Y el ancho medido. Los valores posibles de X son 129, 130 y 131 y los valores posibles para Y son
15 y 16. Tanto X como Y son discretas, por lo que X y Y son conjuntamente discretas. Hay
seis valores posibles para el par ordenado (X, Y): (129, 15), (129, 16), (130, 15), (130, 16),
(131, 15) y (131, 16). Suponga que las probabilidades de cada uno de estos pares arreglados
son como se muestra en la tabla siguiente.
x
y
P(X = x y Y = y)
129
15
0.12
129
16
0.08
130
15
0.42
130
16
0.28
131
15
0.06
131
16
0.04
La función de masa de probabilidad conjunta representa la función p(x, y) ⫽ P(X ⫽ x y Y
⫽ y). Por lo que, por ejemplo, se tiene p(129, 15) ⫽ 0.12 y p(130, 16) ⫽ 0.28.
A veces se da una función de masa de probabilidad conjunta de dos variables aleatorias,
pero se tiene interés en sólo una de ellas. Por ejemplo, se podría tener interés en la función de
masa de probabilidad de X, la longitud de la bandeja del CD, pero no se tiene interés en el ancho Y. Se puede obtener la función de masa de probabilidad de una de las variables X o Y por
separado sumando los valores adecuados de la función de masa de probabilidad conjunta. Los
ejemplos 2.49 y 2.50 ilustran el método.
Ejemplo
2.49
Determine la probabilidad de que la cubierta del CD tenga una longitud de 129 mm.
Solución
Está claro de la tabla anterior que 12% de las cubiertas del CD en la población tiene una longitud de 129 y un ancho de 15 y que 8% tiene longitud de 129 y ancho de 16.
122
CAPÍTULO 2
Probabilidad
Por tanto, 20% de los elementos en la población tiene longitud de 129. La probabilidad de que
una cubierta de CD tenga longitud de 129 mm es de 0.20. Simbólicamente, se tiene que
P (X = 129) = P (X = 129 y Y = 15) + P (X = 129 y Y = 16)
= 0.12 + 0.08
= 0.20
Ejemplo
2.50
Determine la probabilidad de que una cubierta de CD tenga ancho de 16 mm.
Solución
Se necesita encontrar P(Y ⫽ 16). Se puede encontrar esta cantidad sumando las probabilidades de todos los pares (x, y) para los cuales y ⫽ 16. Se obtiene que
P (Y = 16) = P (X = 129 y Y = 16) + P (X = 130 y Y = 16)
+ P (X = 131 y Y = 16)
= 0.08 + 0.28 + 0.04
= 0.40
Los ejemplos 2.49 y 2.50 muestran que se puede encontrar la función de masa de probabilidad de X (o Y) sumando la función de masa de probabilidad conjunta sobre todos los valores de Y (o X). La tabla 2.3 presenta la función de masa de probabilidad conjunta de X y Y.
La función de masa de probabilidad de X se presenta en la columna más a la derecha y se obtiene sumando a lo largo de los renglones. La función de masa de probabilidad de Y se presenta en el renglón inferior y se obtiene sumando abajo las columnas. Observe que las
funciones de masa de probabilidad de X y de Y se muestran en los márgenes de la tabla. Por
esta razón con frecuencia son llamadas funciones de masa de probabilidad marginal.
TABLA 2.3 Funciones de masa de
probabilidad conjunta y marginal
para la longitud X y el ancho Y de
una cubierta de CD
y
15
16
pX (x)
129
130
131
0.12
0.42
0.06
0.08
0.28
0.04
0.20
0.70
0.10
pY .y/
0.60
0.40
x
Por último, si se suman las funciones de densidad de probabilidad conjunta sobre todos
valores posibles de x y y, se obtiene la probabilidad de que X y Y tomen valores en algún lugar dentro de sus rangos posibles y esta probabilidad es igual a 1.
2.6
Variables aleatorias con distribución conjunta
123
Resumen
Si X y Y son variables aleatorias conjuntamente discretas:
La función de masa de probabilidad conjunta de X y Y es la función
p(x,y) ⫽ P(X ⫽ x y Y ⫽ y)
Las funciones de masa de probabilidad marginal de X y Y se pueden obtener a
partir de la función de masa de probabilidad conjunta como se muestra a
continuación:
pX (x) = P (X = x) =
p(x,y) pY (y) = P (Y = y) =
p(x,y)
y
x
donde las sumatorias se toman sobre todos los valores posibles de Y y de X,
respectivamente.
La función de masa de probabilidad conjunta tiene la propiedad de que
p(x,y) = 1
x
y
donde la suma incluye a todos los valores posibles de X y Y.
Variables aleatorias conjuntamente continuas
Se ha visto que si X es una variable aleatoria continua, se pueden encontrar sus probabilidades al integrar su función de densidad de probabilidad. Se dice que las variables aleatorias X
y Y son conjuntamente continuas si se determinan sus probabilidades al integrar una función con dos variables, denominada función de densidad de probabilidad conjunta de X y
Y. Para determinar la probabilidad de que X y Y tengan ciertos valores en una región, integramos la función de densidad de probabilidad conjunta en esa región tal y como lo muestra el
ejemplo 2.51.
Ejemplo
2.51
Suponga que en cierto tipo de lavadora, tanto el espesor como el diámetro de la cavidad son
diferentes en cada unidad. X representa el espesor en milímetros y Y denota el diámetro de la
cavidad en milímetros, de una lavadora seleccionada aleatoriamente. Suponga que la función
de densidad de la probabilidad conjunta de X y Y está dada por
⎧
⎨ 1 (x + y)
si 1 ≤ x ≤ 2 y 4 ≤ y ≤ 5
f (x,y) = 6
⎩0
de otro modo
Determine la probabilidad de que una lavadora escogida aleatoriamente tenga un espesor entre 1.0 y 1.5 mm y una cavidad con un diámetro entre 4.5 y 5 mm.
Solución
Se necesita encontrar P(1 ≤ X ≤ 1.5 y 4.5 ≤ Y ≤ 5). El rectángulo grande en la figura muestra
la región en la cual la densidad conjunta es positiva. El rectángulo sombreado indica la región
en la que 1 ≤ x ≤ 1.5 y 4.5 ≤ y ≤ 5, en la cual se integrará a la densidad conjunta.
124
CAPÍTULO 2
Probabilidad
5.5
5
y
4.5
4
3.5
0.5
1
1.5
x
2
2.5
Se integra a la función de densidad de probabilidad conjunta en la región indicada:
1.5
P (1 ≤ X ≤ 1.5 y 4.5 ≤ Y ≤ 5) =
1
5
4.5
1
(x + y) dy dx
6
y=5
1.5
y2
xy
+
6
12
1
y=4.5
1.5
x
19
=
+
dx
12 48
1
1
=
4
=
dx
Observe que si se integrara una función de densidad de probabilidad conjunta en todo
el plano, es decir, si los límites fueran de –∞ a ∞ tanto para x como para y, se obtendría la
probabilidad de que X y Y tuvieran valores entre –∞ y ∞, lo que es igual a 1.
Resumen
Si X y Y son variables aleatorias conjuntamente continuas, con una función de densidad de probabilidad conjunta f(x, y) y a < b, c < d, entonces
d
b
P (a ≤ X ≤ b y c ≤ Y ≤ d) =
f (x,y) dy dx
a
c
La función de densidad de probabilidad conjunta tiene la propiedad de que
∞
∞
−∞
−∞
f (x,y) dy dx = 1
2.6
Variables aleatorias con distribución conjunta
125
Se ha visto que si X y Y son variables conjuntamente discretas, la función de masa de
probabilidad de cualquier variable se puede encontrar al sumar la función de masa de probabilidad conjunta en todos los valores de la otra variable. Cuando se calcula de esta forma, a
la función de masa de probabilidad se le llama función de masa de probabilidad marginal. Por
analogía, si X y Y son variables conjuntamente continuas, la función de densidad de probabilidad de cualquier variable se puede determinar al integrar la función de densidad de probabilidad conjunta con respecto a la otra variable. Cuando se calcula de esta manera, a la
función de densidad de probabilidad se le denomina función de densidad de probabilidad
marginal. El ejemplo 2.52 ilustra esta idea.
Ejemplo
2.52
Con referencia al ejemplo 2.51, encuentre la función de densidad de probabilidad marginal
del espesor X de una lavadora. Determine la función de densidad de probabilidad marginal del
diámetro de la cavidad Y de una lavadora.
Solución
Denote a la función de densidad de probabilidad marginal de X por medio de fX(x) y a la función de densidad de probabilidad marginal de Y por fY(y). Entonces
fX (x) =
∞
f (x,y) dy
−∞
5
1
(x + y) dy
6
4
1
9
=
x+
para 1 ≤ x ≤ 2
6
2
=
y
fY (y) =
∞
f (x,y) dx
−∞
2
1
(x + y) dx
1 6
1
3
=
y+
para 4 ≤ y ≤ 5
6
2
=
Resumen
Si X y Y son variables conjuntamente continuas con una función de densidad de probabilidad conjunta f(x,y), entonces las funciones de densidad de probabilidad marginal de X y Y están dadas, respectivamente, por
fX (x) =
∞
−∞
f (x,y) dy
fY (y) =
∞
−∞
f (x,y) dx
126
Ejemplo
2.53
CAPÍTULO 2
Probabilidad
El artículo “Performance Comparison of Two Location Based Routing Protocols for ad Hoc
Networks” (T. Camp, J. Boleng y colaboradores, en Proceedings of the Twenty-first annual
Joint Conference of IEEE Computer and Communications Societies, 2002:1678-1687) describe un modelo del movimiento de una computadora móvil. Suponga que ésta se mueve dentro
de la región A delimitada por el eje x, la recta x ⫽ 1 y la recta y ⫽ x de tal forma que si (X,Y)
representa la posición de la computadora en determinado momento, la función de densidad
conjunta de X y Y está dada por
f (x,y) =
8xy
0
(x,y) ∈ A
(x,y) ∈ A
Encuentre a P(X > 0.5 y Y < 0.5).
Solución
La región A es el triángulo que se muestra en la figura 2.13, donde la región X > 0.5 y Y < 0.5
aparece sombreada. Para determinar a P(X > 0.5 y Y < 0.5), se integra a la densidad conjunta
en la región sombreada.
1
P (X > 0.5 y Y < 0.5) =
0.5
8xy dy dx
0.5
0
y=0.5
1
=
4xy
0.5
2
dx
y=0
1
=
x dx
0.5
= 0.375
1
y=x
y
0.5
0
0
0.5
1
x
FIGURA 2.13 El triángulo representa la región en la cual la densidad conjunta de X y Y
es positiva. Al integrar la densidad conjunta en el cuadrado sombreado, se encuentra la
probabilidad de que el punto (X,Y) se encuentre en el cuadrado sombreado.
Variables aleatorias con distribución conjunta
2.6
Ejemplo
2.54
127
Con referencia al ejemplo 2.53, encuentre las densidades marginales de X y de Y.
Solución
Para calcular a fX(x), la densidad marginal de X, se mantiene constante a x y se integra a la
densidad conjunta a lo largo de la recta vertical que pasa por x, como se muestra en la figura
2.14. La integración se realiza con respecto a y, y los límites de integración son y ⫽ 0 a y ⫽ x.
x
8xy dy
fX (x) =
0
y=x
= 4xy
2
y=0
= 4x 3
para 0 < x < 1
1
y=x
y
0
0
x
1
x
FIGURA 2.14 La densidad marginal fX(x) se calcula al integrar la densidad conjunta
a lo largo de la recta vertical que pasa x.
Para calcular fY(y), la densidad marginal de Y se mantiene constante a y y se integra la densidad conjunta a lo largo de la recta horizontal que pasa por y, como se muestra la figura 2.15.
La integración es con respecto a x y los límites de integración van de x ⫽ y a x ⫽ 1.
1
fY (y) =
8xy dy
y
x=1
2
= 4x y
x=y
= 4y − 4y 3
para 0 < y < 1
128
CAPÍTULO 2
Probabilidad
1
y=x
y
y
0
0
1
x
FIGURA 2.15 La densidad marginal fY(y) se calcula al integrar la densidad conjunta
a lo largo de la recta horizontal que pasa por y.
Más de dos variables aleatorias
Los conceptos de funciones de masa de probabilidad conjunta y funciones de densidad de
probabilidad conjunta se amplían fácilmente a más de dos variables aleatorias. Aquí se presentan las definiciones.
Definición
Si las variables aleatorias X1, . . . , Xn son conjuntamente discretas, la función de
masa de probabilidad es
p(x1 , . . . , xn ) = P (X1 = x1 , . . . , Xn = xn )
Si las variables aleatorias X1, . . . , Xn son conjuntamente continuas, tienen una
función de densidad de probabilidad conjunta f(x1, . . . , xn), donde
b1
bn
P (a1 ≤ X1 ≤ b1 , . . . , an ≤ Xn ≤ bn ) =
an
···
a1
f (x1 , . . . , xn ) dx1 · · · dxn
para cualesquiera constantes a1 ≤ b1, . . . , an ≤ bn.
Medias de funciones de variables aleatorias
Algunas veces se da una variable aleatoria X y se necesita trabajar con una función de X. Si
X es una variable aleatoria y h(X) es una función de X, entonces h(X) es también una variable
aleatoria. Si se desea calcular la media de h(X), se puede hacer utilizando la función de masa
de probabilidad o la función de densidad de probabilidad de X. No es necesario conocer la
función de masa de probabilidad o la función de densidad de probabilidad de h(X).
2.6
Variables aleatorias con distribución conjunta
129
Sea X una variable aleatoria y sea h(X) una función de X, entonces
Si X es discreta con una unción de masa de probabilidad p(x), la media de h(X)
está dada por
µh(X) =
h(x)p(x)
(2.59)
x
donde la suma incluye a todos los valores posibles de X.
Si X es continua con una función de densidad de probabilidad f(x), la media de
h(X) está dada por
µh(X) =
∞
h(x)f (x) dx
−∞
(2.60)
Observe que si se sustituye h(X) ⫽ (X – µx)2 ya sea en la ecuación (2.59) o en la (2.60),
la parte derecha de la ecuación se convierte en una expresión de la varianza de X. Por lo que
2
σX2 = µ(X−µX )2 . Se puede obtener otra expresión de la varianza de X al sustituir h(X) ⫽ X y
restar µ2X en ambos lados de la ecuación. Se concluye que σX2 = µX2 − µ2X .
Ejemplo
2.55
Un motor de combustión interna contiene varios cilindros calibrados en el bloque del motor.
X representa el diámetro del calibre de un cilindro, en milímetros. Suponga que la función de
densidad de probabilidad de X es
f (x) =
10
0
80.5 < x < 80.6
de otro modo
A ⫽ πX2/4 representa el área del calibre. Encuentre la media de A.
Solución
∞
π x2
f (x) dx
−∞ 4
80.6
π x2
(10) dx
=
4
80.5
µA =
= 5 096
La media del área es de 5 096 mm2.
Si h(X) ⫽ aX ⫹ b es una función lineal de X, entonces la media µaX ⫹ b y la varianza
2
σaX+b
se pueden expresar en términos de µX y σX2 . Estos resultados se presentaron en la sección 2.5 de la ecuación (2.44) a la (2.46); aquí se repiten nuevamente.
130
CAPÍTULO 2
Probabilidad
Si X es una variable aleatoria, y a y b son constantes, entonces
µaX+b = aµX + b
(2.61)
2
σaX+b
= a 2 σX2
(2.62)
σaX+b = |a|σX
(2.63)
Las demostraciones de estos resultados se encuentran al final de esta sección.
Si X y Y son variables aleatorias con distribución conjunta y h(X,Y) es una función de
X y Y, entonces se puede calcular la media de h(X,Y) a partir de la función de masa de probabilidad conjunta o la función de densidad de probabilidad conjunta de X y Y.
Si X y Y son variables aleatorias con distribución conjunta y h(X,Y) es una función de
X y Y, entonces
Si X y Y son conjuntamente discretas con una función de masa de probabilidad
conjunta p(x,y)
(2.64)
µh(X,Y ) =
h(x,y)p(x,y)
x
y
donde la sumatoria se realiza sobre todos los valores posibles de X y Y.
Si X y Y son conjuntamente continuas con una función de densidad de probabilidad conjunta f(x,y)
µh(X,Y ) =
Ejemplo
2.56
∞
∞
−∞
−∞
h(x,y)f (x,y) dx dy
(2.65)
El desplazamiento de un pistón en un motor de combustión interna se define como el volumen que la parte superior del pistón mueve desde la parte superior hasta el fondo de su golpe. X representa el diámetro del calibre del cilindro y Y representa la longitud del golpe del
pistón en milímetros. El desplazamiento está dado por D ⫽ πX2Y/4. Suponga que X y Y se
distribuyen conjuntamente con una función de masa de probabilidad conjunta
f (x,y) =
100
0
80.5 < x < 80.6 y 65.1 < y < 65.2
de otro modo
Determine la media de D.
Solución
µD =
∞
∞
−∞
−∞
π x2y
f (x,y) dx dy
4
65.2
=
65.1
131
Variables aleatorias con distribución conjunta
2.6
80.6
80.5
π x2y
(100) dx dy
4
= 331,998
La media del desplazamiento es de 331 998 mm3, o ≈ 332 mL.
Distribuciones condicionales
Si X y Y son variables aleatorias con distribución conjunta, entonces conocer el valor de X
puede cambiar las probabilidades de la variable aleatoria Y. Por ejemplo, X representa la altura en pulgadas y Y representa el peso en libras de un estudiante elegido aleatoriamente. Se
tiene interés en la probabilidad P(Y ≥ 200). Si se conoce la densidad conjunta de X y Y, se
puede determinar esta probabilidad al calcular la densidad marginal de Y. Ahora se ha aprendido que la estatura del estudiante es X ⫽ 78. Evidentemente, saber lo anterior cambia la probabilidad de que Y ≥ 200. Para calcular esta nueva probabilidad, se necesita el concepto de
distribución condicional.
Primero, se analiza el caso en el que X y Y son variables conjuntamente discretas. Sea
x cualquier valor para el cual P(X ⫽ x) > 0. Entonces, la probabilidad condicional de que Y
⫽ y dado X ⫽ x es P(Y ⫽ y|X ⫽ x). Se expresa esta probabilidad condicional en términos de
las funciones de masa de probabilidad conjunta y marginal. Si p(x,y) representa la función de masa de probabilidad conjunta de X y Y, y pX(x) denota la función de masa de probabilidad marginal de X, entonces la probabilidad condicional
P (Y = y | X = x) =
p(x,y)
P (X = x y Y = y)
=
P (X = x)
pX (x)
La función de masa de probabilidad condicional de Y dado X ⫽ x es la probabilidad condicional P(Y ⫽ y|X ⫽ x), considerada como una función de y y x.
Definición
Sean X y Y variables aleatorias conjuntamente discretas, con una función de masa de
probabilidad conjunta p(x,y). Sea pX(x) la de masa de probabilidad marginal de X y sea
x cualquier número para el cual pX(x) > 0.
La función de masa de probabilidad condicional de Y dado X ⫽ x es
pY |X (y | x) =
p(x,y)
pX (x)
(2.66)
Observe que para cualesquiera valores particulares de x y y, el valor de pY|X(y|x) es, de
hecho, la probabilidad condicional P(Y ⫽ y|X ⫽ x).
132
CAPÍTULO 2
Ejemplo
2.57
La tabla 2.3 presenta la función de masa de probabilidad conjunta de la longitud X y ancho Y
de una cubierta de CD. Calcule la función de masa de probabilidad condicional pY|X(y 兩 130).
Probabilidad
Solución
Los posibles valores de Y son y ⫽ 15 y y ⫽ 16. De la tabla 2.3, P(Y ⫽ 15 y X ⫽ 130) ⫽ 0.42,
y P(X ⫽ 130) ⫽ 0.70. Por tanto,
pY |X (15 | 130) = P (Y = 15 | X = 130)
P (Y = 15 y X = 130)
=
P (X = 130)
0.42
=
0.70
= 0.60
El valor de pY|X(16 兩 130) se puede calcular con un cálculo similar. Alternativamente observe
que pY|X(16 兩 130) ⫽ 1–pY|X(15 兩 130), puesto que y ⫽ 15 y y ⫽ 16 son los dos únicos valores
posibles de Y. Por tanto, pY|X(16 兩 130) ⫽ 0.4. La función de masa de probabilidad condicional de Y dado X ⫽ 130 es, por consiguiente, pY|X(15 兩 130) ⫽ 0.60, pY|X(16 | 130) ⫽ 0.40, y
pY|X(y 兩 130) ⫽ 0 para cualquier valor de y diferente a 15 o 16.
La analogía de la función de masa de probabilidad condicional para variables aleatorias
conjuntamente continuas es la función de densidad de probabilidad condicional. La definición de la función de densidad de probabilidad condicional es igual a la de la función de
masa de probabilidad condicional, sólo que las funciones de masa se reemplazan por funciones de densidad.
Definición
Sean X y Y variables aleatorias conjuntamente continuas, con una función de densidad
de probabilidad conjunta f(x,y). Sea fX(x) la función de densidad de probabilidad marginal de X y x cualquier número para el que fX(x) > 0.
La función de densidad de probabilidad condicional de Y dado X ⫽ x es
fY |X (y | x) =
Ejemplo
2.58
f (x,y)
fX (x)
(2.67)
(Continuación del ejemplo 2.51.) La función de densidad de probabilidad conjunta del espesor X y del diámetro de la cavidad Y (ambos en milímetros) de una lavadora elegida aleatoriamente es f(x,y) ⫽ (1/6)(x ⫹ y) para 1 ≤ x ≤ 2 y 4 ≤ y ≤ 5. Encuentre la función de densidad
de probabilidad condicional de Y dado que X ⫽ 1.2. Determine la probabilidad de que el diámetro de la cavidad sea menor o igual a 4.8 mm dado que el espesor mida 1.2 mm.
Solución
En el ejemplo 2.52 se calculan las funciones de densidad de probabilidad marginal
2.6
fX (x) =
Variables aleatorias con distribución conjunta
133
1
fY (y) = (y + 1.5) para 4 ≤ y ≤ 5
6
1
(x + 4.5) para 1 ≤ x ≤ 2
6
La función de densidad de probabilidad condicional de Y dado que X ⫽ 1.2 es
f (1.2, y)
fX (1.2)
⎧
⎪
⎨ (1/6)(1.2 + y)
si 4 ≤ y ≤ 5
= (1/6)(1.2 + 4.5)
⎪
⎩0
de otro modo
⎧
⎪
⎨ 1.2 + y
si 4 ≤ y ≤ 5
5.7
=
⎪
⎩0
de otro modo
fY |X (y | 1.2) =
La probabilidad de que el diámetro de la cavidad sea menor o igual a 4.8 mm dado que el espesor mide 1.2 mm es P(Y ≤ 4.8 兩 X ⫽ 1.2). Esto se determina al integrar fY|X(y 兩 1.2) en la región y ≤ 4.8:
4.8
P (Y ≤ 4.8 | X = 1.2) =
=
−∞
4.8
4
fY |X (y | 1.2) dy
1.2 + y
dy
5.7
= 0.786
Esperanza condicional
La esperanza es otro término para la media. Una esperanza condicional es una esperanza, o
media, que se calcula utilizando una función de masa de probabilidad condicional o función
de densidad de probabilidad condicional. La esperanza condicional de Y dado X ⫽ x se representa por E(Y 兩 X ⫽ x) o µY|X. Lo anterior se ilustra en los ejemplos 2.59 a 2.61.
Ejemplo
2.59
La tabla 2.3 presenta la función de masa de probabilidad conjunta de la longitud X y ancho Y
de una cubierta de CD. Calcule la esperanza condicional E(Y 兩 X ⫽ 130).
Solución
En el ejemplo 2.57 se calculó la función de masa de probabilidad condicional pY|X(y 兩 130). La
esperanza condicional E(Y 兩 X ⫽ 130) se calcula utilizando la definición de la media de una
variable aleatoria discreta y la función de masa de probabilidad condicional. Específicamente,
134
CAPÍTULO 2
Probabilidad
E(Y | X = 130) =
y
y pY |X (y | 130)
= 15 pY |X (15 | 130) + 16 pY |X (16 | 130)
= 15(0.60) + 16(0.40)
= 15.4
Ejemplo
2.60
Con referencia al ejemplo 2.58, determine la esperanza condicional de Y dado que X ⫽ 1.2.
Solución
Ya que X y Y son conjuntamente continuas, utilizamos la definición de la media de una variable aleatoria continua para calcular la esperanza condicional.
∞
E(Y | X = 1.2) =
−∞
5
yfY |X (y | 1.2) dy
y
=
4
1.2 + y
dy
5.7
= 4.5146
Ejemplo
2.61
Con referencia al ejemplo 2.58, determine el valor de µY (a la que se puede nombrar como
media incondicional de Y). ¿Difiere ésta de E(Y 兩 X ⫽ 1.2)?
Solución
El valor de µY se calcula por medio de la función de masa de probabilidad marginal de Y. Por
tanto,
µY =
=
∞
yfY (y) dy
−∞
5
4
1
y (y + 1.5) dy
6
= 4.5139
En este caso, la esperanza condicional difiere ligeramente de la esperanza incondicional.
Variables aleatorias independientes
El concepto de independencia de variables aleatorias es muy parecido al de independencia de
eventos. Dos variables aleatorias son independientes si el conocimiento de una de ellas no
afecta las probabilidades de la otra. Aquí se presenta un concepto de independencia de variables aleatorias en términos de su función de masa de probabilidad conjunta o de su función
de densidad de probabilidad conjunta. Una definición diferente, pero lógicamente equivalente, se presentó en la sección 2.5.
2.6
Variables aleatorias con distribución conjunta
135
Definición
Dos variables aleatorias X y Y son independientes, si se satisface que
Si X y Y son conjuntamente discretas, la función de masa de probabilidad conjunta es igual al producto de las probabilidades marginales:
p(x,y) = pX (x)pY (y)
Si X y Y son conjuntamente continuas, la función de densidad de probabilidad
conjunta es igual al producto de las probabilidades marginales:
f (x,y) = fX (x)fY (y)
Las variables aleatorias X1, . . . , Xn son independientes, si se satisface que
Si X1, . . . , Xn son conjuntamente discretas, la función de masa de probabilidad
conjunta es igual al producto de las probabilidades marginales:
p(x1 , . . . , xn ) = pX1 (x1 ) · · · pXn (xn )
Si X1, . . . , Xn son conjuntamente continuas, la función de densidad de probabilidad conjunta es igual al producto de las probabilidades marginales:
f (x1 , . . . , xn ) = fX1 (x1 ) · · · fXn (xn )
Intuitivamente, cuando dos variables aleatorias son independientes, el conocer el valor
de una de ellas no afecta a la distribución de probabilidad de la otra. En otras palabras, la distribución condicional de Y dado X es la misma que la distribución marginal de Y.
Si X y Y son variables aleatorias independientes, entonces
Si X y Y son conjuntamente discretas y x es un valor para el cual pX(x) > 0, entonces
pY |X (y | x) = pY (y)
Si X y Y son conjuntamente continuas y x es un valor para el cual fX(x) > 0, entonces
fY |X (y | x) = fY (y)
Ejemplo
2.62
La función de masa de probabilidad conjunta de la longitud X y el ancho Y de una bandeja de
CD se encuentran en la tabla 2.3. ¿X y Y son independientes?
Solución
Se debe comprobar si P(X ⫽ x y Y ⫽ y) ⫽ P(X ⫽ x)P(Y ⫽ y) en cada valor de x y y. Se empieza por verificar si x ⫽ 129, y y ⫽ 15:
P (X = 129 y Y = 15) = 0.12 = (0.20)(0.60) = P (X = 129)P (Y = 15)
136
CAPÍTULO 2
Probabilidad
Si se continúa de esta forma, se puede comprobar que P(X ⫽ x y Y ⫽ y) ⫽ P(X ⫽ x)P(Y ⫽
y) para cada valor de x y y. Por consecuencia, X y Y son independientes.
Ejemplo
2.63
(Continuación del ejemplo 2.51.) La función de densidad de probabilidad conjunta del espesor X y del diámetro de la cavidad Y de una lavadora elegida aleatoriamente es f(x,y) ⫽ (1/6)(x
⫹ y) para 1 ≤ x ≤ 2 y 4 ≤ y ≤ 5. ¿X y Y son independientes?
Solución
En el ejemplo 2.52, se calculan las funciones de masa de probabilidad marginal
9
1
3
1
x+
fY (y) =
y+
fX (x) =
6
2
6
2
Evidentemente f(x,y) ⫽ fX(x)fY(y). Por tanto, X y Y no son independientes.
Covarianza
Cuando dos variables aleatorias no son independientes, es útil tener una medida de la intensidad de la relación entre ellas. La covarianza poblacional representa una medida de un cierto
tipo de relación conocida como relación lineal. Usualmente se quita el término “poblacional”
y se le llama simplemente covarianza.
Definición
Sean X y Y variables aleatorias con medias µX y µY. La covarianza de X y Y es
Una fórmula alternativa es
Cov(X,Y ) = µ(X−µX )(Y −µY )
(2.68)
Cov(X,Y ) = µXY − µX µY
(2.69)
La demostración de la equivalencia de estas dos fórmulas se encuentra al final de la sección.
Es importante observar que las unidades de Cov(X,Y) son las unidades de X multiplicadas por
las unidades de Y.
¿Cómo mide la covarianza la intensidad de la relación lineal entre X y Y? La covarianza es la media del producto de las desviaciones (X – µX)(Y – µY). Si se construyera un sistema cartesiano con el origen en (µX, µY), este producto sería positivo en el primero y tercer
cuadrantes y negativo en el segundo y cuarto cuadrantes (véase la figura 2.16). De ahí que si
Cov(X,Y) es positiva, entonces los valores de (X,Y) en el primero y tercer cuadrantes serán
más frecuentes que los valores en el segundo y cuarto cuadrantes. Por consiguiente, en una
muestra aleatoria de puntos, los grandes valores de X tienden a hacer pareja con valores grandes de Y, mientras que los valores pequeños de X se equiparan con valores pequeños de Y
(véase la figura 2.16a). De forma similar, si Cov(X,Y) es negativa, es más probable que los
2.6
Variables aleatorias con distribución conjunta
137
puntos en una muestra aleatoria se encuentren en el segundo y cuarto cuadrantes, de tal forma que los valores grandes de X tenderán a hacer pareja con los valores pequeños de Y (véase la figura 2.16b). Por último, si Cov(X,Y) se aproxima a 0, hay poca tendencia a que valores
grandes de X se equiparen con valores pequeños o grandes de Y (véase la figura 2.16c).
(x ⫺ X)(y ⫺ Y) < 0
(x ⫺ X)(y ⫺ Y) > 0
Y
(x ⫺ X)(y ⫺ Y) < 0
(x ⫺ X)(y ⫺ Y) > 0
(x ⫺ X)(y ⫺ Y) > 0
(x ⫺ X)(y ⫺ Y) < 0
Y
(x ⫺ X)(y ⫺ Y) > 0
(x ⫺ X)(y ⫺ Y) < 0
X
X
a)
b)
(x ⫺ X)(y ⫺ Y) < 0
(x ⫺ X)(y ⫺ Y) > 0
(x ⫺ X)(y ⫺ Y) > 0
(x ⫺ X)(y ⫺ Y) < 0
Y
X
c)
FIGURA 2.16 a) Muestra aleatoria de puntos de una población con covarianza positiva. b) Muestra aleatoria de puntos de
una población con covarianza negativa. c) Muestra aleatoria de puntos de una población con covarianza cercana a 0.
Ejemplo
2.64
Continuando con el ejemplo 2.53, una computadora móvil se mueve en la región A delimitada por el eje x, la recta x ⫽ 1 y la recta y ⫽ x (véase la figura 2.13). Si (X,Y) denota la posición de la computadora en cierto momento, la densidad conjunta de X y Y está dada por
f (x,y) =
8xy
0
(x,y) ∈ A
(x,y) ∈ A
138
CAPÍTULO 2
Probabilidad
Determine a Cov(X,Y).
Solución
Se utilizará la fórmula Cov(X,Y) ⫽ µXY – µXµY (ecuación 2.69). Primero se calcula µXY:
µXY =
∞
∞
−∞
−∞
xyf (x,y) dy dx
Ahora la densidad conjunta es positiva en el triángulo que se muestra
1
y=x
y
0
0
x
1
x
Para calcular la integral en esta región, se fija un valor de x, como se muestra a continuación.
Se calcula la integral interior integrando con respecto a y a lo largo de la recta vertical que pasa por x. Los límites de integración a lo largo de esta recta son de y ⫽ 0 a y ⫽ x. Posteriormente se calcula la integral exterior integrando con respecto a x todos los valores posibles de
x, de manera que los límites de integración en la integral exterior son de x ⫽ 0 a x ⫽ 1.
Por tanto,
1
µXY =
0
=
0
xy(8xy) dy dx
1 x
8x 2 y 2 dy dx
0
0
1
=
x
0
8x 5
dx
3
4
=
9
Para encontrar a µX y µY se utilizan las densidades marginales calculadas en el ejemplo 2.54.
Éstas son
fX (x) =
4x 3
0
fY (y) =
4y − 4y 3
0
0<x<1
de otro modo
0<y<1
de otro modo
Variables aleatorias con distribución conjunta
2.6
139
Ahora se calculará a µX y µY:
µX =
=
=
µY =
=
∞
xfX (x) dx
−∞
1
4x 4 dx
0
4
5
∞
−∞
1
0
yfY (y) dy
4y 2 − 4y 4 dy
8
=
15
4
4
8
4
= 0.01778.
=
Ahora, Cov(X,Y ) = −
9
5
15
225
Ejemplo
2.65
Las inspecciones de control de calidad de entrepaños de madera consisten en contar el número de imperfecciones en la superficie de cada entrepaño. En uno de éstos, de 2 × 8 pies, X es
el número de imperfecciones en la superficie provocadas por una aplicación desigual de la última capa del material de acabado y Y representa el número de imperfecciones en la superficie
debidas a la inclusión de partículas externas en el acabado. La función de masa de probabilidad
conjunta p(x,y) de X y Y se presenta en la siguiente tabla. Las funciones de masa de probabilidad marginal están también en los márgenes de la tabla. Determine la covarianza de X y Y.
y
x
0
1
2
pX (x)
0
1
2
0.05
0.05
0.25
0.10
0.15
0.10
0.20
0.05
0.05
0.35
0.25
0.40
pY .y/
0.35
0.35
0.30
Solución
Se utilizará la fórmula Cov(X,Y) ⫽ µXY – µXµY (ecuación 2.69). Primero se calculará µXY.
µXY =
2
2
xy p(x,y)
x=0 y=0
= (1)(1)(0.15) + (1)(2)(0.05) + (2)(1)(0.10) + (2)(2)(0.05)
= 0.65
(eliminando los términos igual a 0)
140
CAPÍTULO 2
Probabilidad
Se utilizan las marginales para calcular µX y µY:
µX = (0)(0.35) + (1)(0.25) + (2)(0.40) = 1.05
µY = (0)(0.35) + (1)(0.35) + (2)(0.30) = 0.95
Por lo que Cov(X,Y) ⫽ 0.65 – (1.05)(0.95) ⫽ –0.3475.
Correlación
Si X y Y son variables aleatorias conjuntamente distribuidas, la Cov(X,Y) mide la intensidad
de la relación lineal entre ellas. Como se mencionó anteriormente, la covarianza tiene unidades, que son las unidades del producto de las unidades de X por las unidades de Y. Esto es una
seria desventaja en la práctica, ya que no se puede utilizar la covarianza para determinar cuál
de los dos pares de variables aleatorias está más relacionado, dado que las dos covarianzas
tienen diferentes unidades. Lo que se necesita es una medida de la intensidad de una relación
lineal que sea sólo un número. La correlación poblacional representa dicha medida. Usualmente no se emplea el término “poblacional” y se llama simplemente correlación. Representaremos la correlación entre las variables X y Y mediante ρX,Y.
La correlación es una versión ajustada de la covarianza. Específicamente, para calcular
la correlación entre X y Y, primero se debe calcular la covarianza para después deshacerse de
las unidades al dividir entre el producto de la desviación estándar de X y Y. Se puede comprobar mediante métodos avanzados que la correlación se encuentra siempre entre –1 y 1.
Resumen
Sean X y Y variables aleatorias conjuntamente distribuidas con desviaciones estándar
σX y σY. La correlación entre X y Y se denota como ρX,Y y está dada por
ρX,Y =
Cov(X,Y )
σX σY
(2.70)
Para cualesquiera dos variables aleatorias X y Y:
−1 ≤ ρX,Y ≤ 1
Ejemplo
2.66
Con referencia al ejemplo 2.64, encuentre ρX,Y.
Solución
En el ejemplo 2.64 se calcula que Cov(X,Y) ⫽ 0.01778, µX ⫽ 4/5 y µY ⫽ 8/15. Ahora se debe calcular a σX y σY. Con este propósito se utilizan las densidades marginales de X y Y, que
se determinaron en el ejemplo 2.54. Éstas son: fX(x) ⫽ 4x3 para 0 < x < 1 y fY(y) ⫽ 4y–4y3 para 0 < y < 1. Se obtiene
Variables aleatorias con distribución conjunta
2.6
σX2 =
∞
−∞
141
x 2 fX (x) dx − µ2X
2
4
4x dx −
=
5
0
= 0.02667
1
5
σY2 =
∞
−∞
y 2 fY (y) dy − µ2Y
1
=
0
3
4y − 4y
= 0.04889
5
dy −
8
15
2
0.01778
Por lo que ρX,Y = √
= 0.492.
(0.02667)(0.04889)
Ejemplo
2.67
Con referencia al ejemplo 2.65, determine ρX,Y.
Solución
En el ejemplo 2.65 se calcula que Cov(X,Y) ⫽ –0.3475, µX ⫽ 1.05 y µY ⫽ 0.95. Ahora se debe calcular σX y σY. Con ese fin se utilizan las densidades marginales de X y Y, que se encuentran en la tabla del ejemplo 2.65. Se obtiene
σX2 =
2
x 2 pX (x) − µ2X
2
y 2 pY (y) − µ2Y
x=0
= (02 )(0.35) + (12 )(0.25) + (22 )(0.40) − 1.052
= 0.7475
σY2 =
Por lo que
y=0
= (02 )(0.35) + (12 )(0.35) + (22 )(0.30) − 0.952
= 0.6475
−0.3475
= −0.499
ρX,Y = √
(0.7475)(0.6475)
Covarianza, correlación e independencia
Cuando Cov(X,Y) ⫽ ρX,Y ⫽ 0 no hay una relación lineal entre X y Y. En este caso se dice que
X y Y no están correlacionadas. Advierta que si Cov(X,Y) ⫽ 0, entonces éste siempre será
el caso cuando ρX,Y ⫽ 0 y viceversa. Si X y Y son variables aleatorias independientes, enton-
142
CAPÍTULO 2
Probabilidad
ces X y Y nunca estarán correlacionadas, ya que no existe ninguna relación lineal o de otro tipo entre ellos. Matemáticamente es posible construir variables aleatorias que no estén correlacionadas ni sean independientes. Sin embargo, este fenómeno se ve pocas veces en la
práctica.
Resumen
Si Cov(X,Y) ⫽ ρX,Y ⫽ 0, entonces se dice que X y Y no están correlacionadas.
Si X y Y son independientes, entonces X y Y no están correlacionadas.
Matemáticamente es posible que X y Y no estén correlacionadas ni sean independientes. Esto es poco común en la práctica.
Al final de esta sección se encuentra una demostración del hecho de que las variables
aleatorias independientes nunca están correlacionadas. El ejercicio 26 muestra un ejemplo de
variables aleatorias no correlacionadas ni independientes.
Combinaciones lineales de variables aleatorias
En la sección 2.5 se analizó las combinaciones lineales de variables aleatorias. Aquí vemos
de nuevo los resultados e incluimos resultados adicionales de la varianza de una combinación
lineal de variables aleatorias dependientes.
Si X1, . . . , Xn son variables aleatorias y c1, . . . , cn son constantes, entonces a la variable aleatoria
c1X1 ⫹ . . . ⫹ cnXn
se le denomina combinación lineal de X1, . . . , Xn.
Si X1, . . . , Xn son variables aleatorias y c1, . . . , cn son constantes, entonces
µc1 X1 + ··· +cn Xn = c1 µX1 + · · · + cn µXn
σc21 X1 + ··· +cn Xn = c12 σX2 1 + · · · + cn2 σX2 n + 2
n−1
n
ci cj Cov(Xi , Xj )
(2.71)
(2.72)
i=1 j =i+1
Al final de esta sección se encuentran las demostraciones de estos resultados para el caso de
n ⫽ 2. La ecuación (2.72) es el resultado más general referente a la varianza de una combinación lineal de variables aleatorias. Como un caso especial, observe que si X1, . . . , Xn son
independientes, entonces todas las covarianzas son iguales a 0, por lo que el resultado se simplifica en:
2.6
Variables aleatorias con distribución conjunta
143
Si X1, . . . , Xn son variables aleatorias independientes y c1, . . . , cn son constantes, entonces
(2.73)
σc21 X1 + ··· +cn Xn = c12 σX2 1 + · · · + cn2 σX2 n
En particular,
σX2 1 + ··· +Xn = σX2 1 + · · · + σX2 n
(2.74)
Finalmente, se presentan algunos casos especiales de las ecuaciones (2.72) y (2.74) en las
cuales sólo hay dos variables aleatorias:
Si X y Y son variables aleatorias, entonces
2
σX+Y
= σX2 + σY2 + 2 Cov(X,Y )
(2.75)
2
σX−Y
= σX2 + σY2 − 2 Cov(X,Y )
(2.76)
Si X y Y son variables aleatorias independientes, entonces
2
σX+Y
= σX2 + σY2
(2.77)
2
σX−Y
= σX2 + σY2
(2.78)
Observe que la varianza de la diferencia X – Y de dos variables aleatorias independientes es
la suma de las varianzas.
Ejemplo
2.68
(Continuación del ejemplo 2.53.) Suponga que la computadora móvil se mueve verticalmente desde una posición aleatoria (X,Y) al punto (X,0) y posteriormente a lo largo del eje x hacia el origen. Encuentre la media y la varianza de la distancia recorrida.
Solución
La distancia recorrida es la suma X ⫹ Y. Las medias de X y Y se calcularon en el ejemplo
2.64. Éstas son µX ⫽ 4/5 ⫽ 0.800 y µY ⫽ 8/15 ⫽ 0.533. Se calcula
µX+Y = µX + µY
= 0.800 + 0.533
= 1.333
Para calcular σ X2 ⫹ Y se emplea la ecuación (2.75). En el ejemplo 2.64 se calculó que la
Cov(X,Y) ⫽ 0.01778. En el ejemplo 2.66 se calculó σ X2 ⫽ 0.02667 y σ Y2 ⫽ 0.04889. Por consecuencia,
144
CAPÍTULO 2
Probabilidad
2
σX+Y
= σX2 + σY2 + 2 Cov(X,Y )
= 0.02667 + 0.04889 + 2(0.01778)
= 0.1111
Media y varianza de una media muestral
Se repasarán los procedimientos para calcular la media y la varianza de una media muestral
que se presentaron en la sección 2.5. Cuando de una población se extrae una muestra aleatoria simple de valores numéricos, se puede considerar que cada unidad en la muestra constituye una variable aleatoria. A menos que la muestra represente una proporción grande (mayor
que 5%) de la población, se puede tratar a las unidades en la muestra como independientes
(véase en la sección 1.1 el análisis acerca de independencia). A partir de ahora, a menos que
se indique lo contrario, se supondrá que los valores de una muestra aleatoria simple son variables aleatorias independientes
Si X1, . . . , Xn es una muestra aleatoria simple, entonces se puede considerar que
X1, . . . , Xn son variables aleatorias independientes, todas con la misma distribución.
La combinación lineal más frecuente es la media muestral. Específicamente, si X1, . . . , Xn
—
es una muestra aleatoria simple, entonces X1, . . . , Xn son independientes y la media muestral X es
la combinación lineal
X=
1
1
X1 + · · · + Xn
n
n
—
Por tanto, las fórmulas de la media y varianza de X se deducen de las ecuaciones (2.71) y
(2.73), respectivamente, al establecer que c1 ⫽ c2 ⫽ . . . ⫽ cn ⫽ 1/n.
Si X1, . . . , Xn es una muestra aleatoria simple de una población con media µ y
—
varianza σ 2, entonces la media muestral X es una variable aleatoria con
—
µX = µ
σ2
σX2 =
n
(2.79)
(2.80)
La desviación estándar de X es
σ
σX = √
n
Ejemplo
2.69
(2.81)
El artículo “Water Price Influence on Apartment Complex Water Use” (D. Aghte y R. Billings, en Journal of Water Resources Planning and Management, 2002:366-369) analiza el
volumen de agua consumido por los departamentos de 308 complejos habitacionales en Tucson, Arizona.
2.6
Variables aleatorias con distribución conjunta
145
El volumen gastado por departamento durante el verano tuvo una media de 20.4 m3 y una desviación estándar de 11.1 m3. Encuentre la media y la desviación estándar de la media muestral del uso de agua en una muestra de 100 departamentos. ¿Cuántos de éstos se deben incluir
en la muestra para que la media muestral del uso de agua tenga una desviación estándar igual
a 0.5 m3?
Solución
Sean X1, . . . , X100 las cantidades de agua utilizadas en una muestra de 100 departamentos. Por
tanto, X1, . . . , X100 provienen de una población con una media µ ⫽ 20.4 y una desviación es—
tándar σ ⫽ 11.1. Se concluye√
que la media muestral X tiene una media µ —
X ⫽ µ ⫽ 20.4 y una
desviación estándar σX = σ/ 100 = 1.11. Sea n el tamaño de la muestra requerido para que
√
√
σ—
X ⫽ 0.5. Entonces σ/ n = 11.1/ n = 0.5. Al despejar n, se obtiene que n ≈ 493.
Aplicación al manejo de carteras de inversiones
La ecuación (2.72) y sus variantes son determinantes en las finanzas. Suponga que una persona tiene un número fijo de dólares para invertir. Ella puede elegir entre una variedad de inversiones, por ejemplo, acciones, bonos y bienes raíces. Después de un año ella venderá su
inversión; X representa su ganancia (o pérdida). Como no se puede predecir con certeza el valor de X, los economistas lo tratan como una variable aleatoria. La media µX indica la cantidad que se espera que la inversión genere en promedio. La desviación estándar σX refleja la
volatilidad, o riesgo, de la inversión. Si σX es muy pequeña, entonces es casi seguro que la inversión generará una cantidad cercana a la ganancia promedio µX, por lo que el riesgo es bajo. Si σX es grande, la ganancia puede variar ampliamente, por lo que el riesgo es alto. En
general, si dos inversiones tienen la misma ganancia promedio, se prefiere a la que tenga la
menor desviación estándar, puesto que en promedio genera la misma ganancia con un riesgo
menor.
Ejemplo
2.70
Un individuo tiene $200 para invertir. Él invertirá $100 en cada una de dos inversiones. X y Y
denotan las ganancias de las dos inversiones. Suponga que µX ⫽ µY ⫽ $5, σX ⫽ σY ⫽ $2, y
ρX,Y ⫽ 0.5. Encuentre la media y la desviación estándar de la ganancia total de las dos inversiones.
Solución
La ganancia total es X ⫹ Y. La media es
µX+Y = µX + µY
= $5 + $5
= $10
Utilizando la ecuación (2.75), la desviación estándar es σX+Y = σX2 + σY2 + 2 Cov(X,Y ).
Ahora la Cov(X,Y) ⫽ ρX,YσXσY ⫽ (0.5)(2)(2) ⫽ 2. Por consiguiente,
σX+Y = 22 + 22 + 2(2)
= $3.46
146
CAPÍTULO 2
Probabilidad
Es prudente comparar el resultado del ejemplo 2.70 con el resultado que se obtendría si
los $200 se hubieran aplicado en una sola inversión. El ejemplo 2.71 analiza esta posibilidad.
Ejemplo
2.71
Si el individuo del ejemplo 2.70 invirtió los $200 en una de las dos inversiones, encuentre la
media y la desviación estándar de las ganancias.
Solución
Suponga que ese tipo elige un plan de inversión, cuya ganancia de $100 es X (el resultado sería el mismo si se eligiera Y). Como consecuencia de que se invierten $200, en vez de $100,
la ganancia será 2X. La media de la ganancia es
µ2X = 2µX = 2(5) = $10
La desviación estándar es
σ2X = 2σX = 2(2) = $4
Al comparar los resultados de los ejemplos 2.70 y 2.71 se demuestra que las medias de las
ganancias de las dos estrategias de inversión son iguales, pero la desviación estándar (es decir, el riesgo) es menor cuando el capital se divide entre dos inversiones. Éste es el principio
de diversificación. Cuando están disponibles dos inversiones, cuyas ganancias tienen la misma media y el mismo riesgo, siempre es ventajoso dividir el capital entre ambas, en vez de
invertirlo en sólo una de ellas.
Demostración de que µaX + b = aµX + b
Se supone que X es una variable aleatoria continua con función de densidad f(x). Entonces
µaX+b =
=
=a
∞
−∞
∞
(ax + b)f (x) dx (ecuación 2.60)
ax f (x)dx +
−∞
∞
−∞
∞
−∞
x f (x)dx + b
= aµX + b(1)
= aµX + b
b f (x) dx
∞
f (x) dx
−∞
La demostración en el caso que X sea una variable aleatoria discreta es similar, sólo que
las integrales son sustituidas por sumatorias.
Demostración de que µaX + bY = aµX + bµY
Sean X y Y variables conjuntamente continuas con una densidad conjunta f(x,y) y densidades marginales fX(x) y fY(y). Sean a y b constantes, entonces
2.6
µaX+bY =
=
=a
∞
∞
−∞
∞
−∞
∞
Variables aleatorias con distribución conjunta
(ax + by)f (x,y) dx dy
axf (x,y) dx dy +
−∞ −∞
∞
∞
∞
∞
−∞
−∞
∞
xf (x,y) dy dx + b
−∞
−∞ −∞
∞
∞
=a
f (x,y) dy dx + b
x
=a
−∞
∞
−∞
147
−∞
xfX (x) dx + b
∞
byf (x,y) dx dy
∞
yf (x,y) dx dy
∞
f (x,y) dx dy
y
−∞
∞
−∞
−∞
yfY (y) dy
−∞
= aµX + bµY
La demostración en el caso de que X y Y sean variables conjuntamente discretas es
similar, sólo que las integrales son sustituidas por sumatorias.
2
2
Demostración de que aX+b = a2 X
i
(
Se utiliza la notación E(X)h alternativamente
con µX, E(Y) alternativamente con µY y así
sucesivamente. Sea Y ⫽ aX ⫹ b, entonces
2
σaX+b
= σY2
= E(Y 2 ) − µ2Y
= E[(aX + b)2 ] − µ2aX+b
= E(a 2 X 2 + 2abX + b2 ) − (aµX + b)2
= E(a 2 X 2 ) + E(2abX) + E(b2 ) − (aµX + b)2
= a 2 E(X 2 ) + 2abE(X) + b2 − a 2 µ2X − 2abµX − b2
= a 2 [E(X 2 ) − µ2X ]
= a 2 σX2
2
2
2
Demostración de que aX+bY = a2 X + b2 Y + 2ab Cov(X ;Y )
Se utiliza la notación E(X) intercambiable con µX, E(Y) intercambiable con µY y así sucesivamente.
2
σaX+bY
= E[(aX + bY )2 ] − µ2aX+bY
= E(a 2 X 2 + 2abXY + b2 Y 2 ) − µ2aX+bY
= E(a 2 X 2 ) + E(2abXY ) + E(b2 Y 2 ) − (aµX + bµY )2
= a 2 E(X 2 ) + 2abE(XY ) + b2 E(Y 2 ) − a 2 µ2X − 2abµX µY − b2 µ2Y
= a 2 [E(X 2 ) − µ2X ] + b2 [E(Y 2 ) − µ2Y ] + 2ab[E(XY ) − µX µY ]
= a 2 σX2 + b2 σY2 + 2ab Cov(X,Y )
Demostración de la equivalencia de las ecuaciones (2.68) y (2.69)
Se utiliza la notación E(X) alternativamente con µX, E(Y) alternativamente con µY y así
sucesivamente. Se debe demostrar que
E[(X − µX )(Y − µY )] = µXY − µX µY
148
Probabilidad
CAPÍTULO 2
Ahora
E[(X − µX )(Y − µY )] = E(XY − XµY − Y µX + µX µY )
= E(XY ) − E(XµY ) − E(Y µX ) + E(µX µY )
= E(XY ) − µY E(X) − µX E(Y ) + µX µY
= µXY − µY µX − µX µY + µX µY
= µXY − µX µY
Demostración de que si X y Y son independientes entonces X y Y no están
correlacionadas
Sean X y Y variables aleatorias independientes. Se demostrará que µXY ⫽ µXµY, por lo
que Cov(X,Y) ⫽ ρX,Y ⫽ 0. Se supondrá que X y Y son variables conjuntamente continuas
con una densidad conjunta f(x,y) y densidades marginales fX(x) y fY(y). La clave de esta
demostración es el hecho de que dado que X y Y son independientes, f(x,y) ⫽ fX(x)fY(y).
µXY =
=
=
=
∞
∞
−∞
∞
−∞
∞
−∞
∞
−∞
xyf (x,y) dx dy
xy fX (x)fY (y) dx dy
x fX (x) dx
−∞
µX µY
∞
y fY (y) dy
−∞
La demostración en el caso de que X y Y sean variables conjuntamente discretas es
similar, sólo que las integrales son sustituidas por sumatorias.
Ejercicios para la sección 2.6
1. En una muestra de mil pernos seleccionada aleatoriamente,
X es el número de pernos que no tienen la longitud específica y Y el número de pernos que no tienen el diámetro específico. Suponga que la función de masa de probabilidad
conjunta de X y Y está dada por la siguiente tabla.
e) Determine la probabilidad de que todos los pernos de la
muestra satisfagan la especificación de la longitud.
f) Determine la probabilidad de que todos los pernos de la
muestra satisfagan la especificación del diámetro.
g) Determine la probabilidad de que todos los pernos de la
muestra cumplan con ambas especificaciones.
y
x
0
1
2
0
1
2
0.40
0.15
0.10
0.12
0.08
0.03
0.08
0.03
0.01
2. Con referencia al ejercicio 1.
a) Determine la función de masa de probabilidad marginal
ρX(x).
b) Determine la función de masa de probabilidad marginal
ρY(y).
a) Determine P(X ⫽ 0 y Y ⫽ 2).
c) Determine µX.
b) Determine P(X > 0 y Y ≤ 1).
d) Determine µY.
c) Determine P(X ≤ 1).
e) Determine σX.
d) Determine P(Y > 0).
f) Determine σY.
2.6
g) Determine Cov(X,Y).
149
Variables aleatorias con distribución conjunta
b) Determine la función de masa de probabilidad condicional ρX|Y(x 兩 3).
h) Determine ρX,Y.
c) Determine la esperanza condicional E(Y 兩 X ⫽ 2).
i) ¿X y Y son independientes? Explique.
d) Determine la esperanza condicional E(X 兩 Y ⫽ 3).
3. Con referencia al ejercicio 1.
a) Determine la función de masa de probabilidad condicional ρY|X(y 兩 1).
b) Determine la función de masa de probabilidad condicional ρX|Y(x 兩 1).
c) Determine la esperanza condicional E(Y 兩 X ⫽ 1).
d) Determine la esperanza condicional E(X 兩 Y ⫽ 1).
4. Un software puede hacer llamadas a dos subrutinas, A y B.
En una ejecución elegida aleatoriamente, X es el número de
llamadas hechas a la subrutina A y Y representa las llamadas a la subrutina B. La función de masa de probabilidad
conjunta de X y Y está dada por la siguiente tabla.
y
x
1
2
3
1
2
3
0.15
0.10
0.05
0.10
0.20
0.05
0.10
0.15
0.10
a) Determine la función de masa de probabilidad marginal
de X.
b) Determine la función de masa de probabilidad marginal
de Y.
c) ¿X y Y son independientes? Explique.
d ) Determine µX y µY.
e) Determine σX y σY.
7. Con referencia al ejercicio 4, suponga que cada ejecución
de la subrutina A tarda 100 ms y que cada ejecución de la
subrutina B tarda 200 ms.
a) Exprese el número de milisegundos de todas las llamadas hechas a las dos subrutinas en términos de X y Y.
b) Determine el número promedio de milisegundos de todas las llamadas realizadas a las dos subrutinas.
c) Encuentre la desviación estándar del número de milisegundos de todas las llamadas hechas a las dos subrutinas.
8. El número de clientes formados en una caja de supermercado es una variable aleatoria cuya función de masa de probabilidad está dada por la siguiente tabla.
x
p(x)
0
0.10
1
0.25
2
0.30
3
0.20
y
p(y)
1
0.05
2
0.15
3
0.25
4
0.30
a) Determine P(X ⫽ 2 y Y ⫽ 2).
b) Determine P(X ⫽ 2 y Y ⫽ 6).
a) Determine µX ⫹ Y.
c) Determine P(X ⫹ Y ⫽ 4).
6. Con referencia al ejercicio 4.
a) Determine la función de masa de probabilidad condicional ρY|X(y 兩 2).
5
0.15
6
0.10
Sea X el número de clientes formados y Y denota el número total de productos que compran todos los clientes formados. Suponga que el número de productos comprados por
un cliente es independiente del número de productos comprados por cualquier otro cliente.
g) Encuentre ρ(X,Y).
b) Determine σX ⫹ Y.
5
0.05
Para cada cliente, el número de productos que compra constituye una variable aleatoria con una función de masa de
probabilidad
f ) Determine Cov(X,Y).
5. Con referencia al ejercicio 4, el número total de llamadas
hechas a las dos subrutinas es X ⫹ Y.
4
0.10
c) Determine P(Y ⫽ 2).
9. En cierta intersección de una carretera de cuatro carriles,
sólo hay dos para dar vuelta a la izquierda. El A está en el
extremo izquierdo y el B está al lado de él. X representa el
número de vehículos en el carril A, Y representa el número
de vehículos en el carril B, cuando la señal cambia a verde.
Suponga que X y Y tienen una función de masa de probabilidad conjunta p(x, y) dada por la siguiente tabla.
150
Probabilidad
CAPÍTULO 2
y
x
0
1
2
3
4
0
1
2
3
4
0.05
0.05
0.03
0.00
0.00
0.04
0.10
0.05
0.02
0.00
0.01
0.03
0.15
0.08
0.02
0.00
0.02
0.05
0.10
0.05
0.00
0.00
0.02
0.05
0.08
a) Determine la función de masa de probabilidad marginal
de X.
b) Determine la función de masa de probabilidad marginal
de Y.
c) ¿X y Y son independientes? Explique.
d) Determine µX y µY.
a) Determine la función de masa de probabilidad marginal
pX(x).
b) Determine la función de masa de probabilidad marginal
pY(y).
c) Determine µX.
d) Determine µY.
e) Determine σX.
f) Determine σY.
g) Determine Cov(X,Y).
h) Determine ρX,Y.
13. Con referencia al ejercicio 12, Z representa el número total
de vehículos que pasa por la caseta de cobro en un minuto.
a) Determine µZ.
e) Determine σX y σY.
b) Determine σZ.
f) Determine Cov(X,Y).
c) Determine P(Z ⫽ 2).
g) Determine ρ(X,Y).
10. Con referencia al ejercicio 9.
a) Determine la media del número total de vehículos en los
dos carriles.
14. Con referencia al ejercicio 12, suponga que la tarifa para
autos es de $2 y la de camiones es de $5. T representa la
cantidad total de las tarifas pagadas por los vehículos que
pasan por la caseta de cobro en un minuto.
b) Determine la varianza del número total de vehículos en
los dos carriles.
a) Determine µT.
c) Determine la probabilidad de que el número total de vehículos en los dos carriles sea exactamente igual a 6.
c) Determine P(T ⫽ 2).
11. Con referencia al ejercicio 9.
b) Determine σT.
15. Con referencia al ejercicio 12.
a) Determine la función de masa de probabilidad condicional ρY|X(y 兩 3).
b) Determine la función de masa de probabilidad condicional ρX|Y(x 兩 4).
c) Determine la esperanza condicional E(Y 兩 X ⫽ 3).
d) Determine la esperanza condicional E(X 兩 Y ⫽ 4).
12. X representa el número de automóviles y Y el de camiones
que pasan por cierta caseta de cobro en un minuto. La función de masa de probabilidad conjunta de X y Y está dada
en la siguiente tabla:
a) Determine la función de masa de probabilidad condicional ρY|X(y 兩 3).
b) Determine la función de masa de probabilidad condicional ρX|Y(x 兩 1).
c) Determine la esperanza condicional E(Y 兩 X ⫽ 3).
d) Determine la esperanza condicional E(X 兩 Y ⫽ 1).
16. Para variables aleatorias continuas X y Y con una función de
densidad de probabilidad conjunta
f (x,y) =
y
x
0
1
2
0
1
2
3
0.10
0.10
0.05
0.05
0.05
0.10
0.20
0.05
0.05
0.05
0.10
0.10
4xy
0
0<x<1 y 0<y<1
de otro modo
a) Determine P(X < 0.5 y Y > 0.75).
b) Determine las funciones de densidad de probabilidad
marginal fX(x) y fY(y).
c) ¿X y Y son independientes? Explique.
2.6
Variables aleatorias con distribución conjunta
17. Con referencia al ejemplo 2.51 (p. 123).
g(y) =
a) Determine Cov(X,Y).
b) Determine ρX,Y.
f (x,y) =
x+y
0
0<x<1 y 0<y<1
de otro modo
a) Determine P(X ≤ 0.25 y Y ≤ 0.85).
b) Determine Cov(X,Y).
c) Determine ρX,Y.
d) ¿X y Y son independientes? Explique.
a) Determine las funciones de densidad de probabilidad
marginal fX(x) y fY(y).
b) Determine la función de densidad de probabilidad condicional fY|X(y 兩 0.75).
c) Determine la esperanza condicional E(Y 兩 X ⫽ 0.75).
20. Sea X la cantidad de encogimiento (en %) que experimenta
una fibra de cierto tipo elegida aleatoriamente cuando se calienta a una temperatura de 120°C. Y representa el encogimiento adicional (en %) cuando la fibra se calienta a 140°C.
Suponga que la función de densidad de probabilidad conjunta de X y Y está dada por
48xy 2
49
0
b) Determine P(Y > 5.01).
c) Determine P(X < 9.98 y Y > 5.01).
d) Determine µX.
e) Determine µY.
f) Sea A ⫽ XY el área calculada a partir de las mediciones
X y Y. Determine µA.
22. El espesor X de una cuña de madera (en milímetros) tiene
una función de densidad de probabilidad
de otro modo
b) Determine las funciones de densidad de probabilidad
marginal fX(x) y fY(y).
c) ¿X y Y son independientes? Explique.
21. Se mide (en cm) la longitud y ancho de un componente rectangular. Debido a errores en la medición, las medidas son
variables aleatorias. X denota la medida de la longitud y Y
representa la medida del ancho. Suponga que la función de
densidad de probabilidad de X es
10
0
f (x) =
3 3(x − 5)2
−
4
4
0
9.95 < x < 10.05
de otro modo
y que la función de densidad de probabilidad de Y es
4≤x≤6
de otro modo
a) Determine µX.
b) Determine σX2 .
c) Y denota el espesor de una cuña en pulgadas (1 mm ⫽
0.0394 pulgadas). Determine µY y σY2 .
d) Si se seleccionan tres cuñas de manera independiente y
las apilamos una encima de la otra, encuentre la media
y la varianza del espesor total.
23. El tiempo de vida de cierto componente, en años, tiene una
función de densidad de probabilidad
3 < x < 4 y 0.5 < y < 1
a) Determine P(X < 3.25 y Y > 0.8).
f (x) =
4.9 < y < 5.1
de otro modo
a) Determine P(X < 9.98).
19. Con referencia al ejercicio 18.
f (x,y) =
5
0
Suponga que las medidas de X y Y son independientes.
18. Para variables aleatorias continuas X y Y con una función de
densidad de probabilidad conjunta
151
f (x) =
e−x
0
x>0
x≤0
Están disponibles dos de dichos componentes, cuyos tiempos de vida son independientes. Tan pronto como falle el
primer componente, éste se reemplaza por el segundo. X representa el tiempo de vida del primer componente y Y denota el del segundo componente.
a) Determine la función de densidad de probabilidad conjunta de X y Y.
b) Determine P(X ≤ 1 y Y > 1).
c) Determine µX.
d) Determine µX ⫹ Y.
e) Determine P(X ⫹ Y ≤ 2). (Sugerencia: Grafique la región del plano en la que x ⫹ y ≤ 2 y después integre la
función de densidad de probabilidad conjunta en toda
esa región.)
152
CAPÍTULO 2
Probabilidad
24. El número de bytes descargados por segundo en un canal de
información tiene una media de 105 y desviación estándar
de 104. Entre los factores que influyen la razón está la congestión, la cual produce la alternación de periodos de transmisión más rápida o más lenta. X representa el número de
bytes descargados durante un periodo elegido aleatoriamente de cinco segundos.
a) ¿Es razonable suponer que µX ⫽ 5 × 105? Explique.
√
b) ¿Es razonable suponer que σX = 5 × 104? Explique.
25. El artículo “Abyssal Periodities > 3 800 Ma from Southern
West Greenland: Field Relationships, Petrography, Geochronology, Whole-Rock and Mineral Chemistry of Dunite
and Harzburgite Inclusions in the Itsaq Gneiss Complex”
(C. Friend, V. Bennett y A. Nutman, en Contributions to Mineralogy and Petrology, 2002:71-92) describe las composiciones químicas de ciertos minerales en el anterior manto
arqueano. Para cierto tipo de ensamble olivino, el dióxido
de silicio (SiO2) contenido (en peso %) en una roca elegida de
forma aleatoria tiene una media de 40.25 y desviación estándar de 0.36.
a) Encuentre la media y la desviación estándar de la media
de la muestra del SiO2 contenido en una muestra aleatoria de diez rocas.
b) ¿Cuántas rocas debe incluir la muestra para que la desviación estándar de la media de la muestra del SiO2 contenido sea de 0.05?
a) Use la definición de independencia en la página 135 para demostrar que X y Y no son independientes (de hecho,
Y ⫽ |X|, por lo que Y es realmente una función de X).
b) Demuestre que X y Y no están correlacionadas.
27. Una persona tiene $100 para invertir y dos opciones en las
cuales dividirlos. Si ella aplica toda la cantidad en la primera inversión, su ganancia será X, mientras que si ella invierte la cantidad total en la segunda opción, su ganancia será
Y. Tanto X como Y tienen una media de $6 y desviación estándar (riesgo) de $3. La correlación entre X y Y es 0.3.
a) Exprese la cantidad en términos de X y Y si ella invierte
$30 en la primera inversión y $70 en la segunda.
b) Encuentre la ganancia promedio y el riesgo si invierte
$30 en la primera inversión y $70 en la segunda.
c) Encuentre la ganancia promedio y el riesgo, en términos
de K, si ella invierte $K en la primera inversión y $(100
– K) en la segunda.
d) Determine el valor de K que minimice el riesgo en la
parte c).
e) Demuestre que el valor de K que minimiza el riesgo en
el inciso c) es el mismo para cualquier correlación
ρX,Y⫽1.
28. Si X es una variable aleatoria, demuestre que Cov(X, X) ⫽
σ X2 .
29. X y Y son variables aleatorias y a y b son constantes.
a) Demuestre que Cov(aX,bY) ⫽ ab Cov(X,Y).
26. Aquí hay dos variables aleatorias que no están correlacionadas ni son independientes. X y Y tienen la siguiente función
de masa de probabilidad conjunta:
x
y
p.x; y/
−1
0
1
1
0
1
1/3
1/3
1/3
b) Demuestre que si a > 0 y b > 0, entonces ρaX,bY ⫽ ρX,Y.
Concluya que el coeficiente de correlación no se ve
afectado por el cambio en las unidades.
Ejercicios adicionales para el capítulo 2
153
Ejercicios adicionales para el capítulo 2
1. Un sistema consta de cuatro componentes conectados, tal
como se muestra.
A
B
C
D
5. Una cliente recibe un cargamento de diez mil fusibles. Ella
extrae de forma aleatoria tres y los prueba. Si alguno está defectuoso, regresará el cargamento. Si, de hecho, mil están
defectuosos, ¿cuál es la probabilidad de que regrese el cargamento?
6. En cierto tipo de motor de automóvil, la cabeza del cilindro
está sujeta al bloque mediante diez pernos, cada uno debe
experimentar un par de torsión de 60 N ⋅ m. Suponga que los
pares de torsión de los pernos son independientes.
a) Se tiene una probabilidad de 0.99 si cada perno experimenta un par de torsión adecuado, ¿cuál es la probabilidad de que todos los pernos de la cabeza de un cilindro
experimenten pares de torsión adecuados?
Suponga que A, B, C y D funcionan independientemente. Si
las probabilidades de que A, B, C y D fallen son 0.1, 0.2,
0.05 y 0.3, respectivamente, ¿cuál es la probabilidad de que
el sistema funcione?
b) El objetivo es que en 95% de los motores todos sus pernos experimenten pares de torsión adecuados. ¿Cuál debe
ser la probabilidad de que un perno experimente un par de
torsión adecuado para que se alcance este objetivo?
2. Se lanza un dado hasta que aparece el número 6. ¿Cuál es la
probabilidad que se necesiten más de cinco lanzamientos?
3. Las placas de silicón se utilizan en la producción de circuitos integrados. De las placas producidas por determinado
proceso, 10% tiene resistencias menores a la especificación
y 5% tiene resistencias superiores a la especificación.
7. Un mensaje electrónico consiste en una cadena de bits (0s y
1s). El mensaje debe pasar por dos relevadores antes de que
sean recibidos. En cada relevador la probabilidad es de 0.1
de que el bit se regrese antes de que sea relevado (es decir,
que un 1 cambie a 0, o un 0 a 1). Encuentre la probabilidad
de que el valor de un bit recibido en el destino final es igual
al valor del que fue enviado.
a) ¿Cuál es la probabilidad de que la resistencia de una placa elegida de forma aleatoria no satisfaga la especificación?
8. La lectura de un termómetro calibrado en agua helada (temperatura real de 0°C) representa una variable aleatoria con
función de densidad de probabilidad.
b) Si una placa escogida aleatoriamente tiene una resistencia que no cumple con la especificación, ¿cuál es la probabilidad de que tenga una resistencia demasiado baja?
4. Se utilizan dos líneas de producción para empaquetar azúcar en bolsas de 5 kg. La línea 1 produce el doble de bolsas
que la línea 2. Uno por ciento de las bolsas de la línea 1 están defectuosas ya que no cumplen con una especificación
de calidad, mientras que 3% de las bolsas de la línea 2 están defectuosas. Se elige aleatoriamente una bolsa para inspeccionarla.
a) ¿Cuál es la probabilidad de que provenga de la línea 1?
b) ¿Cuál es la probabilidad de que esté defectuosa?
c) Si la bolsa está defectuosa, ¿cuál es la probabilidad de
que venga de la línea 1?
d) Si la bolsa no está defectuosa, ¿cuál es la probabilidad
de que venga de la línea 1?
f (x) =
k(1 − x 2 )
0
−1 < x < 1
de otro modo
donde k es una constante.
a) Determine el valor de k.
b) ¿Cuál es la probabilidad de que el termómetro indique
una temperatura mayor a 0°C?
c) ¿Cuál es la probabilidad de que la lectura esté dentro los
0.25°C de la temperatura real?
d) ¿Cuál es la media de la lectura?
e) ¿Cuál es la mediana de la lectura?
f) ¿Cuál es la desviación estándar?
9. Se lanzan dos dados. En virtud de que salen dos números
diferentes, ¿cuál es la probabilidad de que en uno de los dados salga el número 6?
154
CAPÍTULO 2
Probabilidad
10. En un lote de diez componentes se extrae aleatoriamente dos
para inspección. Suponga que, de hecho, exactamente dos de
los diez componentes del lote están defectuosos. Sea X el
número de componentes extraídos que están defectuosos.
a) Determine P(X ⫽ 0).
b) Determine P(X ⫽ 1).
c) Determine P(X ⫽ 2).
d) Determine la función de masa de probabilidad de X.
e) Determine la media de X.
f) Determine la desviación estándar de X.
11. Un dispositivo eléctrico tiene dos fusibles. Sea que X represente el tiempo de vida del primer fusible y sea que Y denote el del segundo (ambos en años). Suponga que la función
de densidad de probabilidad conjunta de X y Y es
b) ¿Cuál es la probabilidad de que una tabla deslizadora esté defectuosa y se haya fabricado en Canadá?
c) Dado que una tabla deslizadora está defectuosa, ¿cuál es
la probabilidad de que se haya fabricado en Estados
Unidos?
14. El artículo “Traps in Mineral Valuations⎯Proceed With
Care” (W. Lonegan, en Journal of the Australian Institute of
Mining and Metallurgy, 2001:18-22) modela el valor (en
millones de dólares) de un depósito de minerales que aún no
se ha abierto como una variable aleatoria X con una función
de masa de probabilidad p(x) dada por p(10) ⫽ 0.40, p(60)
⫽ 0.50, p(80) ⫽ 0.10 y p(x) ⫽ 0 para valores de x diferentes a 10, 60 u 80.
a) ¿Este artículo considera el valor de un depósito mineral
como una variable aleatoria discreta o continua?
b) Calcule µX.
f (x,y) =
1 −x/2−y/3
e
6
0
x>0 y y>0
de otro modo
c) Calcule σX.
d) El proyecto será rentable si el valor es mayor a $50 millones. ¿Cuál es la probabilidad de que el proyecto sea
rentable?
a) Determine P(X ≤ 2 y Y ≤ 3).
b) Determine la probabilidad de que ambos fusibles duren
al menos tres años.
c) Determine la función de densidad de probabilidad marginal de X.
d) Determine la función de densidad de probabilidad marginal de Y.
e) ¿X y Y son independientes? Explique.
15. Seis recién graduados fueron contratados por una empresa
de ingeniería. A cada uno se le asignó aleatoriamente uno de
los seis cubículos que están en fila al final de la oficina. Dos
de los graduados son Bill y Cathy. ¿Cuál es la probabilidad de
que a ellos se les asigne cubículos adyacentes?
16. Un clóset contiene cuatro pares de zapatos. Si se escogen
aleatoriamente cuatro zapatos, ¿cuál es la probabilidad de
que de los zapatos elegidos no se tenga un par?
12. Sean A y B eventos con P(A) ⫽ 0.3 y P(A ∪ B) ⫽ 0.7.
a) ¿Para qué valor de P(B), A y B serán mutuamente excluyentes?
b) ¿Para qué valor de P(B), A y B serán independientes?
13. Un fabricante de tablas deslizadoras en nieve tiene tres
plantas en Estados Unidos, una en el este, otra en el oeste y
otra en Canadá. Los registros de producción muestran que
cada una de las plantas en Estados Unidos produjo diez mil
tablas deslizadoras el mes pasado, mientras que la planta en
Canadá produjo ocho mil. De las tablas producidas en Canadá el mes pasado, 4% tiene un defecto que provocó que
se deslaminarán prematuramente. Los registros de las plantas de Estados Unidos muestran que 3% de las tablas producidas en el este y 6% de las del oeste también presentan
este defecto.
a) ¿Cuál es la proporción de las tablas fabricadas el mes
pasado que estaban defectuosas?
17. Sean X y Y variables aleatorias independientes con µX ⫽ 2,
σX ⫽ 1, µY ⫽ 2 y σY ⫽ 3. Encuentre las medias y varianzas
de las siguientes cantidades.
a) 3X
b) X ⫹ Y
c) X ⫺ Y
d) 2X ⫹ 6Y
18. Sean X y Y variables aleatorias independientes con µX ⫽ 1,
σX ⫽ 2, µY ⫽ 3, σY ⫽ 1 y ρX,Y ⫽ 0.5. Encuentre las medias
y varianzas de las siguientes cantidades.
a) X ⫹ Y
b) X ⫺ Y
c) 3X ⫹ 2Y
d) 5Y ⫺ 2X
155
Ejercicios adicionales para el capítulo 2
19. Un productor de acero está probando un nuevo aditivo para
fabricar una aleación de acero. La función de masa de probabilidad conjunta de la intensidad de la tensión (en miles
de libras/pulg2) y la concentración aditiva es
tensión
Intensidad de la Tensión
Concentración de
de aditivo
Aditivo
Concentración
0.02
0.04
0.06
0.08
100
100
150
150
200
200
0.05
0.01
0.04
0.04
0.06
0.08
0.08
0.14
0.11
0.10
0.17
0.12
a) ¿Cuáles son las funciones de masa de probabilidad marginal de X (concentración aditiva) y Y (intensidad de la
tensión)?
des fabricadas en la primera etapa, 1% está defectuosa,
mientras que 2% de la segunda y 3% de la tercera están defectuosas.
a) Se extrae una unidad aleatoriamente de la producción
diaria y está defectuosa. ¿Cuál es la probabilidad de que
se haya fabricado durante la primera etapa?
b) Se extrae una unidad aleatoriamente de la producción
diaria y no está defectuosa. ¿Cuál es la probabilidad de
que haya sido fabricada durante la tercera etapa?
23. El artículo “Uncertainty and Climate Change” (G. Heal y B.
Kristöm, en Environmental and Resource Economics, 2002:
3-39) considera tres escenarios, A, B y C, para el impacto
del calentamiento global en el ingreso. Para cada escenario
se especifica una función de masa de probabilidad para la
pérdida de ingreso. Éstas se presentan en la siguiente tabla.
b) ¿X y Y son independientes? Explique.
c) Dado que un especimen tiene una concentración aditiva
de 0.04, ¿cuál es la probabilidad de que la intensidad de
la tensión sea de 150 o mayor?
d) Dado que una especie tiene una concentración aditiva de
0.08, ¿cuál es la probabilidad de que la intensidad de la
tensión sea mayor a 125?
e) Cierta aplicación requiere que la intensidad de la tensión
sea igual o mayor a 175. ¿Qué concentración aditiva debe utilizarse para que la probabilidad de cumplir con esta especificación sea máxima?
20. Con referencia al ejercicio 19.
a) Determine µX.
b) Determine µY.
c) Determine σX.
d) Determine σY.
e) Determine Cov(X,Y).
f) Determine ρX,Y.
21. Con referencia al ejercicio 19.
a) Calcule la función de masa condicional ρY|X(y 兩 0.06).
Probabilidad
Pérdida (%) Escenario A
0
2
5
10
15
20
25
0.65
0
0.2
0
0.1
0
0.05
Escenario B
Escenario C
0.65
0
0.24
0
0.1
0.01
0
0.65
0.24
0.1
0.01
0
0
0
a) Calcule la media y desviación estándar de la pérdida en
el escenario A.
b) Calcule la media y desviación estándar de la pérdida en
el escenario B.
c) Calcule la media y desviación estándar de la pérdida en
el escenario C.
d) En cada escenario, calcule la probabilidad de que la pérdida sea menor a 10 por ciento.
24. Con referencia al ejercicio 23, suponga que las probabilidades de que ocurra cada uno de los tres escenarios son P(A)
⫽ 0.20, P(B) ⫽ 0.30 y P(C) ⫽ 0.50.
b) Calcule la función de masa condicional ρX|Y(x 兩 100).
a) Determine la probabilidad de que ocurra el escenario A
y que la pérdida sea de 5%.
c) Calcule la esperanza condicional E(Y 兩 X ⫽ 0.06).
b) Encuentre la probabilidad de que la pérdida sea de 5%.
d) Calcule la esperanza condicional E(X 兩 Y ⫽ 100).
c) Determine la probabilidad de que suceda el escenario A
dado que la pérdida es de 5%.
22. Cierta planta opera en tres etapas al día. De todas las unidades fabricadas, 50% se produce durante la primera etapa,
30% en la segunda y 20% en la tercera. De todas las unida-
25. Una caja contiene cuatro focos de 75W, tres de 60W y tres
focos fundidos. Se selecciona aleatoriamente dos focos de
156
CAPÍTULO 2
Probabilidad
la caja. Sea X el número de focos seleccionados de 75 W, Y
representa el número de focos seleccionados de 60 W.
a) Determine la función de masa de probabilidad conjunta
de X y Y.
b) Determine µX.
c) Determine µY.
29. Se lanza al aire una moneda de 25 centavos y otra de 5 centavos. La primera tiene una probabilidad de 0.4 de que caiga en “cara” y la segunda tiene una probabilidad de 0.6 de
que caiga “cara”. Sea X ⫽ 1 si la primera moneda cae en
“cara” y sea X ⫽ 0 si cae en “cruz”. Sea Y ⫽ 1 si la moneda de 5 centavos, la segunda, cae en “cara” y Y ⫽ 0 si cae en
“cruz”.
d) Determine σX.
a) Determine la función de masa de probabilidad de X.
e) Determine σY.
b) Determine la función de masa de probabilidad de Y.
f) Determine Cov(X,Y).
c) ¿Es razonable suponer que X y Y son independientes?
¿Por qué?
g) Determine ρX,Y.
26. Una provisión de una solución de ácido clorhídrico (HCl)
distribuida por cierto vendedor contiene pequeñas cantidades de diversas impurezas, incluyendo cobre y níquel. Sea
X la cantidad de cobre y Y representa la cantidad de níquel,
en partes por diez millones, en una botella de la solución seleccionada aleatoriamente. Suponga que la función de densidad de probabilidad conjunta de X y Y está dada por
f (x,y) =
c(x + y)2
0
0<x<1 y 0<y<1
de otro modo
a) Determine el valor de la constante c de tal forma que
f(x,y) sea una función de densidad conjunta.
d) Determine la función de masa de probabilidad conjunta
de X y Y.
30. Se lanzan dos dados. X representa el número que aparece en
el primero y Y el que aparece en el segundo. Encuentre µXY.
31. Una caja contiene tres cartas, 1, 2 y 3. Se eligen aleatoriamente dos de ellas, se reemplaza la primera antes de que
salga la segunda. X representa el número en la primera y Y
representa en la segunda.
a) Determine la función de masa de probabilidad conjunta
de X y Y.
b) Calcule la función de densidad marginal fX(x).
b) Determine la funcione de masa de probabilidad marginal pX(x) y pY(y).
c) Calcule la función de densidad condicional fX|Y(y 兩 x).
c) Determine µX y µY.
d) Calcule la esperanza condicional E(Y 兩 X ⫽ 0.4).
d) Determine µXY.
e) ¿X y Y son independientes? Explique.
e) Determine Cov(X,Y).
27. Con referencia al ejercicio 26.
a) Determine µX.
b) Determine σ X2 .
c) Determine Cov(X,Y).
d) Determine ρX,Y.
28. Se lanza una moneda al aire cinco veces. ¿Qué secuencia es
más probable, HTTHH o HHHHH? ¿O son igualmente probables? Explique.
32. Con referencia al ejercicio 31, suponga que no se reemplaza la primera carta antes de que salga la segunda.
a) Determine la función de masa de probabilidad conjunta
de X y Y.
b) Determine la función de masa de probabilidad marginal
pX(x) y pY(y).
c) Determine µX y µY.
d) Determine µXY.
e) Determine Cov(X,Y).
Capítulo
3
Propagación
de errores
Introducción
La medición es fundamental en el trabajo de investigación. Con frecuencia científicos e ingenieros realizan cálculos con cantidades medidas; por ejemplo, para calcular la densidad de un
objeto se divide una medición de su masa entre la de su volumen, o al calcular el área de un rectángulo se multiplican su longitud y anchura.
Cualquier procedimiento de medición tiene errores. Por consiguiente, en general los valores medidos son algo diferentes de los valores reales. Cuando se realiza un cálculo con mediciones, los errores en éstas producen un error en el valor calculado. Decimos que el error se
propaga de las mediciones al valor calculado. Si se tiene cierto conocimiento con respecto al
tamaño de los errores en las mediciones, como en la longitud y el ancho de un rectángulo,
existen métodos para conocer la magnitud del error en una cantidad calculada como el área.
La propagación de errores trata estos métodos y es el tema de este capítulo.
3.1
Error de medición
Una geóloga pesa una roca en una balanza. Toma cinco mediciones y obtiene los siguientes
datos (en gramos):
251.3
252.5
250.8
251.1
250.4
Todas las mediciones son diferentes y es probable que ninguna sea igual a la masa real de la
roca. A la diferencia entre un valor medido y el valor real se le llama error en el valor medido. Cualquier procedimiento de medición tiene muchas fuentes de error. Por ejemplo, supon157
158
CAPÍTULO 3
Propagación de errores
ga que las mediciones de la roca se leían en una marca en una escala. Si la balanza no estaba
calibrada adecuadamente, cada medición estará lejos de su valor real en cierta cantidad fija.
Por tanto, una calibración imperfecta aporta errores de la misma magnitud en cada medición.
La interpolación entre las marcas de graduación de la escala es otra fuente de error. La magnitud del error debida a la interpolación quizá varíe entre mediciones y es probable que sea
benéfico para algunas mediciones y negativo para otras. Es razonable suponer que a largo plazo el promedio de los errores por interpolación será igual a cero.
En general, se puede pensar que el error de una medición lo integran el error sistemático, o sesgo, y el error aleatorio. El primero representa la parte del error que es igual para
cada medición; el segundo varía entre mediciones y, en promedio, será igual a cero en el largo plazo. Algunas fuentes de error contribuyen con ambos tipos de error, el sesgo y el error
aleatorio. Por ejemplo, considere el error de paralaje. Este último constituye la diferencia en
la posición evidente de la marca cuando se observa desde ángulos diferentes. La magnitud de
este tipo de error en cualquier medición especial depende de la posición del observador con
respecto a la escala. Como consecuencia de que la posición variará un poco entre lecturas, el
paralaje contribuye al error aleatorio. Si el observador tiende a apoyarse en algo de un lado
en vez de otro, el paralaje también contribuirá al sesgo.
Cualquier medición se puede considerar como la suma del valor real más las contribuciones de cada uno de los dos componentes del error:
Valor medido ⫽ Valor real ⫹ sesgo ⫹ error aleatorio
(3.1)
Puesto que parte del error es aleatorio, es adecuado utilizar un modelo estadístico para estudiar los errores de medición. Se modela cada valor medido como una variable aleatoria, tomada de una población de mediciones posibles. La media m de la población representa esa
parte de la medición que es igual para toda medición. Por tanto, m es la suma del valor real
más el sesgo. La desviación estándar s de la población representa la desviación estándar del
error aleatorio. Ésta representa la variación debida al hecho de que cada medición tiene un valor diferente por su error aleatorio. Intuitivamente, s constituye el tamaño de un error aleatorio estándar.
Se tiene interés en dos aspectos del proceso de medición. El primero es su exactitud.
Ésta la determina el sesgo, que es la diferencia entre la media m de la medición y el valor real
de esta última. Entre más pequeño sea el sesgo, más exacto será el proceso de medición. Si la
media m es igual al valor real, el sesgo será igual a 0; en esta tesitura, al proceso de medición
se le llama no sesgado.
El otro aspecto del proceso de medición de interés es la precisión. Ésta constituye el
grado con que tienden a coincidir las mediciones repetidas de la misma cantidad. Si las mediciones repetidas resultan cercanas entre sí todo el tiempo, la precisión es alta. Si son muy
dispersas, la precisión es baja. Por tanto, la precisión se determina mediante la desviación estándar s del proceso de medición. Entre más pequeño sea el valor de s, más preciso será
aquél. Con frecuencia ingenieros y científicos se refieren a s como incertidumbre aleatoria
o incertidumbre estadística del proceso de medición. A s se le llamará en forma más simple incertidumbre.
Cuando se notifica un valor medido, es importante reportar una estimación aproximada
del sesgo y de la incertidumbre de éste, con la finalidad de describir la exactitud y la precisión de la medición. Generalmente es más fácil estimar la incertidumbre que el sesgo. Las figuras 3.1 y 3.2 ilustran el porqué de lo anterior. La figura 3.1 muestra un experimento
Error de medición
3.1
159
Resumen
Un valor medido representa una variable aleatoria con media m y desviación estándar s.
El sesgo en el proceso de medición constituye la diferencia entre la media de las
mediciones y el valor real:
Sesgo ⫽ m ⫺ valor real
La incertidumbre en el proceso de medición es la desviación estándar s.
Entre más pequeño sea el sesgo, más exacto será el proceso de medición.
Entre más pequeña sea la incertidumbre, más preciso será el proceso de medición.
hipotético que implica mediciones repetidas, en condiciones diferentes, donde se considera al
sesgo y la incertidumbre. Los conjuntos de mediciones en las figuras 3.1a y b están bastante cercanos, indicando que la incertidumbre es pequeña. Por su parte, los que corresponden a las figuras 3.1a y c se encuentran centrados cerca del valor real, indicando que el sesgo es pequeño.
Valor real
Valor real
a)
b)
Valor real
Valor real
c)
d)
FIGURA 3.1 a) Tanto el sesgo como la incertidumbre son pequeños. b) El sesgo es grande; la incertidumbre es pequeña. c) El sesgo es pequeño; la incertidumbre es grande. d)
Tanto el sesgo como la incertidumbre son grandes.
Por supuesto, en la vida real no se conoce el valor real que se está midiendo. Por tanto,
los dibujos de las mediciones que se muestran en la figura 3.1 se parecerían a la figura 3.2 (p.
160). Se puede determinar que los conjuntos de mediciones en las figuras 3.2a y b tienen incertidumbre más pequeña. Pero sin información adicional acerca del valor real, no se puede
calcular el sesgo.
Se concluye de las figuras 3.1 y 3.2 que la incertidumbre se puede calcular de las mediciones repetidas, pero para estimar el sesgo, se debe tener información adicional acerca
del valor real. Se puede obtener esta información adicional, por ejemplo, midiendo repetidamente una cantidad usual cuyo valor real se conoce y estimar al sesgo como la diferencia entre el promedio de las mediciones y el valor real conocido. Otra manera para calcular el sesgo
sería comparar el promedio de gran número de mediciones con otra hecha con un proceso más
elaborado para el que se sabe que el sesgo es despreciable. La estimación del sesgo es esencialmente el proceso de calibración, para el cual se necesita información externa al dispositivo de medición.
160
CAPÍTULO 3
Propagación de errores
a)
b)
c)
d)
FIGURA 3.2 Se puede estimar la incertidumbre del conjunto de mediciones repetidas, pero si no se conoce el valor real no es posible calcular el sesgo.
Ejemplo
3.1
Se sabe que una muestra de laboratorio de gas tiene una concentración de monóxido de carbono (CO) de 50 partes por millón (ppm). Se utiliza un espectrómetro para tomar cinco mediciones independientes de esta concentración. Las cinco mediciones, en ppm, son 51, 47, 53,
53 y 48. Estime el sesgo y la incertidumbre en una medición del espectrómetro.
Solución
Se consideran las cinco mediciones como una muestra aleatoria de la población de mediciones
posibles. El sesgo es igual a la media de esta población menos el valor real de 50. La incertidumbre representa la desviación estándar de la población. No se conoce la media ni la desviación estándar de la población, pero éstas se pueden aproximar con la media y la desviación
estándar de la muestra. La media de las cinco mediciones es 50.4. Por tanto, se estima que el
sesgo es de 50.4 ⫺ 50 ⫽ 0.4 ppm. La desviación estándar de las cinco mediciones es 2.8 ppm.
Por consecuencia, se estima que la incertidumbre en cada medición es de 2.8 ppm.
Ejemplo
3.2
Ahora se utiliza un espectrómetro diferente para medir la concentración de CO en otra muestra de gas. La concentración real de esta muestra es desconocida. Se hacen cinco mediciones
(en ppm). Éstas son 62, 63, 61, 62 y 59. Estime la incertidumbre en una medición de este espectrómetro. ¿Se puede estimar el sesgo?
Solución
La incertidumbre en una sola medición se estima con la desviación estándar de la muestra,
que es 1.5 ppm. La media de la muestra es 61.4 ppm, pero para estimar el sesgo se tendría que
restar la concentración real de la media. Debido a que no se conoce la concentración real, no
se puede estimar el sesgo.
En la práctica, las estimaciones aproximadas de la incertidumbre son a veces muy aproximadas. En los ejemplos 3.1 y 3.2 se sugiere estimar la incertidumbre s con la desviación
estándar de la muestra de cinco mediciones. Las estimaciones que se basan en muestras pequeñas parecidas a esta en ocasiones están muy equivocadas. Cuando es posible, es mejor estimar la incertidumbre con base en muestras grandes. Sin embargo, una estimación de una
muestra pequeña es mejor que ninguna.
3.1
Error de medición
161
Resumen
Sean Xl, . . . , Xn mediciones independientes, todas se hacen con el mismo proceso en
la misma cantidad.
La desviación estándar s de la muestra se puede utilizar para estimar la incertidumbre.
Las estimaciones de la incertidumbre con frecuencia son muy aproximadas, especialmente cuando se basan en muestras pequeñas.
—
Si se conoce el valor real, la media de la muestra X se puede utilizar para estimar
—
el sesgo: Sesgo ≈ X , valor real.
Si el valor real no se conoce, el sesgo no se puede estimar a partir de las mediciones repetidas.
Un ejemplo importante de la estimación de sesgo es la calibración de balanzas en supermercados y otros establecimientos comerciales para asegurar que no pesan sistemáticamente de más o de menos los artículos. A este procedimiento le sigue una serie de
comparaciones con patrones externos, comenzando en el ámbito jurisdiccional y terminando
cerca de París, Francia, donde se localiza el patrón mundial final para el peso (técnicamente
la masa). Éste es el prototipo internacional del kilogramo, un cilindro de platino-iridio cuya
masa es por definición exactamente 1 kg. Una réplica del kilogramo se localiza en el Laboratorio Nacional de Normas y Tecnología, en Washington, el cual sirve de patrón para todas las
mediciones de peso en Estados Unidos. El uso de esta réplica, en vez del kilogramo, introduce un sesgo en cada medición de peso en ese país. Comparando la réplica de Estados Unidos
con el kilogramo, el sesgo se ha estimado en ⫺1.9 × 10⫺8 kg. Es decir, la réplica que se encuentra en Estados Unidos parece más ligera que el kilogramo en aproximadamente 19 partes en mil millones. Por esta razón, todas las mediciones de peso que se hacen en el
Laboratorio Nacional de Normas y Tecnología se ajustan hacia arriba en 19 partes en mil millones para compensar. Observe que este factor de ajuste no se podía haber calculado pesando repetidamente la réplica; se requirió comparar con un patrón externo.
De ahora en adelante, a menos que se indique lo contrario, se supondrá que este sesgo
se ha reducido a un nivel despreciable. Se describirán las mediciones en la forma
Valor medido ⫾ s
(3.2)
donde s representa la incertidumbre en el proceso que produjo el valor medido.
La expresión (3.2) tiene la forma a ⫾ b, donde a y b son números. Es importante darse cuenta que las expresiones que contienen el símbolo ⫾ pueden tener muchos significados.
El significado aquí es que a es un valor medido y b constituye la incertidumbre en a. Algunas personas usan a ⫾ b para indicar que b es el valor máximo para el error, o que b es un
múltiplo de la incertidumbre, generalmente dos o tres veces la incertidumbre. Se presentará
incluso otro significado en el capítulo 5, donde se usará la notación a ⫾ b para denotar un intervalo de confianza, que es un intervalo que se calcula de tal forma para que probablemente
contenga al valor real. Siempre que se encuentre con el símbolo ⫾ se debe asegurar que se
comprende el contexto en el cual se utiliza.
162
Ejemplo
3.3
CAPÍTULO 3
Propagación de errores
El espectrómetro del ejemplo 3.1 se ha recalibrado, por lo que se puede suponer que el sesgo
es despreciable. Ahora aquél se utiliza para medir la concentración de CO en otra muestra de
gas. La medición es 55.1 ppm. ¿Cómo se expresaría esta medición?
Solución
A partir de las mediciones repetidas del ejemplo 3.1, la incertidumbre en una medición de este instrumento se estimó de 2.8 ppm. Por tanto, se reporta la concentración de CO en esta
muestra de gas como 55.1 ⫾ 2.8 ppm.
Ejercicios de la sección 3.1
1. Se mide cuatro veces el punto de ebullición del agua. Los
resultados son 110.01°C, 110.02°C, 109.99°C y 110.01°C.
¿Cuál de los siguientes enunciados describe mejor este proceso de medición?
a) Dado que la lectura es de 100 g, exprese la incertidumbre en esta medición, en gramos.
b) Dado que la lectura es de 50 g, exprese la incertidumbre
en esta medición, en gramos.
i. Exacto, pero no preciso.
ii. Preciso, pero no exacto.
iii. Ni exacto ni preciso.
5. Una persona se para sobre una balanza de baño. La lectura
es de 150 lb. Después de que la persona se baja, dicha lectura es de 2 libras.
iv. Tanto exacto como preciso.
2. Se usan dos aparatos para medir el punto de fusión del pamino-benceno. Se toman números iguales de mediciones
en cada uno de los aparatos. El resultado en el primer aparato es 90 ⫾ 1°C y el resultado en el segundo es 90 ⫾ 2°C.
a) ¿Se puede decir qué aparato es más exacto? Si es así, indique cuál. Si no, explique por qué.
b) ¿Se puede decir qué aparato es más preciso? Si es así,
diga cuál. Si no, explique por qué.
3. La longitud de un objeto está dada como 3.21 ⫾ 0.02 cm.
Verdadero o falso:
a) La longitud se midió de 3.21 cm.
b) La longitud real del objeto es de 3.21 cm.
c) El sesgo en la medición es de 0.02 cm.
d ) La incertidumbre en la medición es de 0.02 cm.
4. Para algunos procesos de medición, la incertidumbre es
aproximadamente proporcional al valor de la medición. Por
ejemplo, se dice que cierta balanza tiene una incertidumbre
de ⫾ 2%. Se pesa un objeto en esta balanza.
a) ¿Es posible estimar la incertidumbre en esta medición?
Si es así, estímela. Si no, explique por qué.
b) ¿Es posible estimar el sesgo en esta medición? Si es así,
estímelo. Si no, explique por qué.
6. Una persona sube y baja de una balanza de baño cuatro veces. Las lecturas (en libras) son 148, 151, 150 y 152. Cada
vez que la persona se baja de la balanza, la lectura es de 2
libras.
a) ¿Es posible estimar la incertidumbre en estas mediciones? Si es así, estímela. Si no, explique por qué.
b) ¿Es posible estimar el sesgo en estas mediciones? Si es
así, estímelo. Si no, explique por qué.
7. En un escenario hipotético, el Laboratorio Nacional de Normas y Tecnología ha recibido una nueva réplica del kilogramo. Se pesa cinco veces. Las mediciones son las siguientes,
en unidades de microgramos arriba de 1 kg: 114.3, 82.6,
136.4, 126.8, 100.7.
a) ¿Es posib1e estimar la incertidumbre en estas mediciones? Si es así, estímela. Si no, explique por qué.
3.2
b) ¿Es posible estimar el sesgo en estas mediciones? Si es
así, estímelo. Si no, explique por qué.
8. Ahora se pesa el kilogramo cinco veces en una balanza diferente. Las mediciones son las siguientes, en unidades de
microgramos arriba de 1 kg: 25.6, 26.8, 26.2, 26.8, 25.4.
a) ¿Es posible estimar la incertidumbre en estas mediciones? Si es así, estímela. Si no, explique por qué.
b) ¿Es posible estimar el sesgo en estas mediciones? Si es
así, estímelo. Si no, explique por qué.
9. Un nuevo y desconocido peso se pesa en la misma balanza
que se utilizó en el ejercicio número 8 y la medición es 127
mg arriba de 1 kg. Utilizando la información del ejercicio 8,
¿es posible tener una medición más exacta? Si es así, ¿cuál
es ésta? Si no, explique por qué.
10. El artículo “Calibration of an FTIR Spectrometer” (P. Pankratz, en Statistical Case Studies for Industrial and Process
Improvement, SIAM-ASA, 1997:19-38) describe el uso de
3.2
Combinaciones lineales de las mediciones
163
un espectrómetro para hacer cinco mediciones del contenido de carbono (en ppm) de cierta placa de silicio cuyo contenido real de carbono se sabía que era de 1.1447 ppm. Las
mediciones fueron 1.0730, 1.0825, 1.0711, 1.0870 y
1.0979.
a) ¿Es posible estimar la incertidumbre en estas mediciones? Si es así, estímela. Si no, explique por qué.
b) ¿Es posible estimar el sesgo en estas mediciones? Si es
así, estímelo. Si no, explique por qué.
11. Se midió ocho veces la longitud de una varilla. Las mediciones en centímetros, en el orden en que fueron tomados,
fueron 21.20, 21.22, 21.25, 21.26, 21.28, 21.30, 21.32 y
21.35.
a) ¿Estas mediciones parecen ser una muestra aleatoria de
una población de mediciones posibles? ¿Por qué sí? o
¿Por qué no?
b) ¿Es posible estimar la incertidumbre en estas mediciones? Explique.
Combinaciones lineales de las mediciones
A menudo se suman constantes a las mediciones, se multiplican mediciones por constantes,
o se suman dos o más mediciones. En esta sección se describe cómo se afectan las incertidumbres debido a estas operaciones aritméticas. Puesto que las mediciones son variables aleatorias y las incertidumbres son desviaciones estándar de estas variables aleatorias, los
resultados que se usan para calcular las desviaciones estándar de combinaciones lineales de
variables aleatorias se pueden aplicar para calcular las incertidumbres en combinaciones lineales de las mediciones. Los resultados para variables aleatorias independientes se presentaron en la sección 2.5; los resultados más generales se mostraron en la sección 2.6. Aquí se
aplican estos resultados a las mediciones independientes. Al final se analizan las mediciones
dependientes.
Se empieza por establecer los resultados básicos para calcular las incertidumbres en
combinaciones lineales de mediciones independientes y después se continúa con algunos
ejemplos.
Si X es una medición y c es una constante, entonces
σcX = |c|σX
(3.3)
Si X1, . . . , Xn son mediciones independientes y c1, . . . , cn son constantes, entonces
σc1 X1 + ··· +cn Xn = c12 σX2 1 + · · · + cn2 σX2 n
(3.4)
164
CAPÍTULO 3
Ejemplo
3.4
El radio de un círculo mide 3.0 ⫾ 0.1 cm. Estime la circunferencia y determine la incertidumbre en la estimación.
Propagación de errores
Solución
Sea R el radio del círculo. El valor medido de R es de 3.0 cm y la incertidumbre es la desviación estándar de esta medición, que es sR ⫽ 0.1 cm. La circunferencia está dada por C ⫽ 2πR.
La incertidumbre en C es sC, la desviación estándar de C. Debido a que 2π es una constante,
se tiene
σC = |2π |σR
(utilizando la ecuación 3.3)
= (6.28)(0.1 cm)
= 0.63 cm
La circunferencia es 18.84 ⫾ 0.63 cm.
Ejemplo
3.5
Un artículo se forma al colocar dos componentes, uno detrás de otro. Las longitudes de éstos
se miden de manera independiente, por medio de un proceso que da una medición aleatoria
con incertidumbre 0.1 cm. La longitud del artículo se estima sumando las dos longitudes medidas. Suponga que las mediciones son 4.10 y 3.70 cm. Estime la longitud del artículo y determine la incertidumbre en el cálculo.
Solución
Sea X la longitud medida del primer componente y Y la longitud medida del segundo. La estimación de la longitud es 7.80 cm. La incertidumbre es
σX2 + σY2
= (0.1)2 + (0.1)2
σX+Y =
(utilizando la ecuación 3.4 con c1 ⫽ c2 ⫽ 1)
= 0.14 cm
La estimación de la longitud es 7.80 ⫾ 0.14 cm.
Ejemplo
3.6
Un topógrafo mide el perímetro de un terreno rectangular. Toma medidas de dos lados adyacentes, 50.11 ⫾ 0.05 m y 75.21 ⫾ 0.08 m. Estas mediciones son independientes. Estime el
perímetro del terreno y determine la incertidumbre en la estimación.
Solución
Sean X ⫽ 50.11 y Y ⫽ 75.21 las dos mediciones. El perímetro se estima como P ⫽ 2X ⫹ 2Y
⫽ 250.64 m y la incertidumbre en P es
σP = σ2X+2Y
= 4σX2 + 4σY2
(utilizando la ecuación 3.4)
Combinaciones lineales de las mediciones
3.2
=
165
4(0.05)2 + 4(0.08)2
= 0.19 m
El perímetro es 250.64 ⫾ 0.19 m.
Ejemplo
3.7
En el ejemplo 3.6 el asistente del topógrafo sugiere que se calcule la incertidumbre en P mediante un método diferente. Su razonamiento es que P ⫽ X ⫹ X ⫹ Y ⫹ Y, entonces
σP = σX+X+Y +Y
= σX2 + σX2 + σY2 + σY2
= (0.05)2 + (0.05)2 + (0.08)2 + (0.08)2
= 0.13 m
Éste no concuerda con el valor de 0.19 m calculado en el ejemplo 3.6. ¿Cuál fue la equivocación?
Solución
La equivocación fue que de los cuatro términos de la suma no todos son independientes. Específicamente, X ⫹ X no es la suma de cantidades independientes y tampoco Y ⫹ Y. Con el
fin de utilizar la ecuación (3.4) para calcular la incertidumbre en P, se debe expresar a P como la suma de cantidades independientes; es decir, P ⫽ 2X ⫹ 2Y, como en el ejemplo 3.6.
Mediciones repetidas
Una de las mejores maneras de reducir la incertidumbre es tomar varias mediciones independientes y determinar el promedio de ellas. Las mediciones en este caso son una muestra aleatoria simple de una población y su promedio es la media de la muestra. Los métodos para el
cálculo de la media y de la desviación estándar de una muestra se presentaron en las secciones 2.5 y 2.6. Estos métodos se pueden aplicar para calcular la media y la incertidumbre en
el promedio de las mediciones repetidas independientes.
Si X1, . . . , Xn son mediciones n independientes, cada una con media m e incertidum—
bre s, entonces la media de la muestra X es una medición con media
y con incertidumbre
μX = μ
(3.5)
σ
σX = √
n
(3.6)
Con un poco de paciencia se puede ver por qué son importantes estos resultados para
las aplicaciones. De hecho muestran que si se realizan muchas mediciones independientes de
la misma cantidad, entonces el promedio de éstas tiene la misma media de cada medición in-
166
CAPÍTULO 3
Propagación de errores
dividual, pero la desviación estándar se reduce en un factor igual a la raíz cuadrada del tamaño de la muestra. En otras palabras, el promedio de varias mediciones repetidas tiene la misma exactitud y es más preciso que cualquier única medición.
Ejemplo
3.8
La longitud de un componente se mide con un proceso cuya incertidumbre es de 0.05 cm. Si
se hicieron 25 mediciones independientes y se utiliza el promedio de éstas para estimar la longitud, ¿cuál será la incertidumbre? ¿Cuánto más preciso es el promedio de 25 mediciones que
el de una sola medición?
Solución
√
La incertidumbre en el promedio de 25 mediciones es 0.05/ 25 = 0.01 cm. La incertidumbre en una sola medición es 0.05 cm. La incertidumbre en el promedio de las 25 mediciones
independientes es, por tanto, menor que el de una sola medición por un factor de 5, que es la
raíz cuadrada del número de mediciones que se promedian. Por tanto, el promedio de 25 mediciones independientes es cinco veces más preciso que el de una sola medición.
Ejemplo
3.9
La masa de una roca se midió cinco veces en una balanza cuya incertidumbre no se conoce.
Las cinco mediciones (en gramos) son 21.10, 21.05, 20.98, 21.12 y 21.05. Estime la masa de
la roca y determine la incertidumbre en la estimación.
Solución
—
Sea X el promedio de las cinco mediciones y sea s la desviación estándar de la muestra. Se
—
calcula X ⫽ 21.06 g y s ⫽ 0.0543√g. Utilizando la ecuación (3.6) se estimaría que la longitud del componente es de X ± σ/ 5. No se conoce s, que es la incertidumbre, o la desviación estándar, del proceso de medición. Sin embargo, se puede aproximar a s con s, la
desviación estándar de la muestra√de las cinco mediciones. Por tanto, se estima que la masa
de la roca es de 21.06 ± 0.0543/ 5, o 21.06 ± 0.02 g.
Ejemplo
3.10
En el ejemplo 3.6 dos lados adyacentes de un terreno rectangular se calcularon de X ⫽ 50.11
⫾ 0.05 m y Y ⫽ 75.21 ⫾ 0.08 m. Se supone que el presupuesto para este proyecto es suficiente para hacer 14 mediciones más. Cada lado ya se ha medido una vez. Un ingeniero sugiere asignar las nuevas mediciones a cada lado equitativamente, por lo que éste será medido
ocho veces. Un segundo ingeniero sugiere hacer las 14 mediciones en el lado más largo, ya
que ese lado se mide con incertidumbre más grande. Estime la incertidumbre en el perímetro
bajo cada plan. ¿Con cuál plan se obtiene la incertidumbre más pequeña?
Solución
—
—
Con el primer plan, sea X el promedio de las ocho mediciones del lado más corto y sea Y el
—
—
promedio de las ocho mediciones del lado más largo. El perímetro se estimará con 2X ⫹ 2Y .
La incertidumbre en el perímetro con el primer plan es, por tanto,
3.2
Combinaciones lineales de las mediciones
167
(utilizando la ecuación 3.4)
4σX2 + 4σY2
σX 2
σY 2
= 4 √
+4 √
(utilizando la ecuación 3.6)
8
8
4(0.05)2
4(0.08)2
=
+
8
8
= 0.067 m
σ2X+2Y =
—
Con el segundo plan, el perímetro se estimará con 2X ⫹ 2Y , donde X es una sola medición
—
del lado más corto y Y es el promedio de las 15 mediciones del lado más largo. La incertidumbre en el perímetro con el segundo plan es, por tanto,
σ2X+2Y = 4σX2 + 4σY2
(utilizando la ecuación 3.4)
2
σY
= 4σX2 + 4 √
(utilizando la ecuación 3.6)
15
4(0.08)2
= 4(0.05)2 +
15
= 0.11 m
El primer plan es mejor.
Mediciones repetidas con incertidumbres diferentes
A veces al repetir las mediciones se puede tener incertidumbres diferentes. Esto puede ocurrir, por ejemplo, cuando las mediciones se hacen con instrumentos diferentes. La mejor manera de combinar las mediciones en este caso es con un promedio ponderado, más que con la
media de la muestra. En los ejemplos 3.11 y 3.12 se analiza esta idea.
Ejemplo
3.11
Un ingeniero mide el periodo de un péndulo (en segundos) de 2.0 ⫾ 0.2 s. Se hizo otra medición independiente con un reloj más preciso y el resultado es de 2.2 ⫾ 0.1 s. El promedio
de estas dos mediciones es 2.1 s. Determine la incertidumbre en esta cantidad.
Solución
Sea X la medición con el reloj menos preciso, por lo que X ⫽ 2.0 s, con incertidumbre sX ⫽
0.2 s. Sea Y la medición con el reloj más preciso, por lo que Y ⫽ 2.2 s, con incertidumbre sY
⫽ 0.1 s. El promedio es (1/2)X ⫹ (1/2)Y ⫽ 2.10 y la incertidumbre en este promedio es
σprom =
1 2 1 2
σ + σ
4 X 4 Y
1
1
(0.2)2 + (0.1)2
4
4
= 0.11 s
=
168
Ejemplo
3.12
CAPÍTULO 3
Propagación de errores
En el ejemplo 3.11, otro ingeniero sugiere que debido a que Y es una medición más precisa
que X, podría ser más preciso un promedio ponderado en el cual Y fuera más pesado que X que
el promedio no ponderado. Específicamente, el ingeniero sugiere que al elegir una constante
adecuada c entre 0 y 1, el promedio ponderado cX ⫹ (1 ⫺ c)Y podría tener una incertidumbre más pequeña que el promedio no ponderado (1/2)X ⫹ (1/2)Y que se consideró en el ejemplo 3.11. Expresando la incertidumbre en el promedio ponderado cX ⫹ (1 ⫺ c)Y en función
de c se encuentra el valor de c que minimiza la incertidumbre.
Solución
La incertidumbre en el promedio ponderado es
σ = c2 σX2 + (1 − c)2 σY2
= 0.04c2 + 0.01(1 − c)2
√
= 0.05c2 − 0.02c + 0.01
Ahora se debe encontrar el valor de c que minimiza a s. Esto es equivalente a encontrar el
valor de c que minimice a s2. Al tomar la derivada de s2 ⫽ 0.05c2 ⫺ 0.02c ⫹ 0.01 con respecto a c y se iguala a 0:
dσ 2
= 0.10c − 0.02 = 0
dc
Despejando c, se obtiene
c ⫽ 0.2
Por tanto, el promedio ponderado más preciso es 0.2X ⫹ 0.8Y ⫽ 2.16. La incertidumbre en
esta estimación es
σmejor = (0.2)2 σX2 + (0.8)2 σY2 = (0.2)2 (0.2)2 + (0.8)2 (0.1)2 = 0.09 s
Observe que ésta es menor que la incertidumbre de 0.11 s que se encontró para el promedio
no ponderado que se usó en el ejemplo 3.11.
La razón de los coeficientes X y Y en el mejor promedio ponderado es igual a la razón
de las varianzas de Y y X: sY2/sX2 ⫽ 0.12/0.22 ⫽ 0.25 ⫽ 0.2/0.8 ⫽ c/(1 ⫺ c). Por tanto, se puede
expresar los coeficientes en función de las varianzas: c ⫽ sY2/(sX2 ⫹ sY2) ⫽ 0.2 y 1 ⫺ c ⫽
sX2/(sX2 ⫹ sY2) ⫽ 0.8. Esta relación, en general, es válida.
Resumen
Si X y Y son mediciones independientes de la misma cantidad, con incertidumbres sX
y sY, respectivamente, entonces el promedio ponderado de X y Y con la incertidumbre más pequeña está dado cmejor X ⫹ (1 ⫺ cmejor), Y donde
cmejor =
σY2
σX2 + σY2
1 − cmejor =
σX2
σX2 + σY2
(3.7)
3.2
Combinaciones lineales de las mediciones
169
Combinaciones lineales de mediciones dependientes
Imagine que X y Y son mediciones con incertidumbres sX y sY y se desea calcular la incertidumbre en la suma X ⫹ Y. Si X y Y son dependientes, la incertidumbre en la suma podría ser
más grande o menor que en el caso independiente y no se puede determinar con sólo sX y sY.
Por ejemplo, si errores aleatorios positivos en X tienden a ocurrir al lado de errores aleatorios
negativos en Y, y viceversa, aquéllos tenderán a contrarrestarse cuando se calcula la suma X
⫹ Y, así la incertidumbre en X ⫹ Y será más pequeña que en el caso independiente. Por otro
lado, si los errores aleatorios en X y Y tienden a tener el mismo signo, la incertidumbre en X
⫹ Y será mayor que en el caso independiente.
La cantidad que mide la relación entre los errores aleatorios en X y Y es la covarianza,
que se analizó en la sección 2.6. En general, si X1, . . . , Xn son mediciones y si se conoce la
covarianza de cada par de mediciones, se puede utilizar la ecuación (2.72) (en la sección 2.6)
para calcular la incertidumbre en una combinación lineal de las mediciones.
En la práctica, cuando las mediciones son dependientes, sucede con frecuencia el caso
de que no se conoce lo suficiente acerca de la dependencia para cuantificarla. En estos casos
se puede colocar un límite superior a la incertidumbre de una combinación lineal de las mediciones. Aquí se presenta el resultado; al final de esta sección se encuentra su demostración.
Si Xl, . . . , Xn son mediciones y c1, . . . , cn son constantes, entonces
σc1 X1 + ··· +cn Xn ≤ |c1 |σX1 + · · · + |cn |σXn
(3.8)
La expresión del lado derecho de la desigualdad (3.8) es una estimación conservadora de la
incertidumbre en c1Xl ⫹ . . . ⫹ cnXn.
Ejemplo
3.13
Un topógrafo está midiendo el perímetro de un terreno rectangular. Mide dos lados adyacentes de 50.11 ⫾ 0.05 m y 75.21 ⫾ 0.08 m. Estas mediciones no son necesariamente independientes. Determine con una estimación conservadora la incertidumbre del perímetro del
terreno.
Solución
Sean X1 y X2 las dos mediciones. Las incertidumbres son entonces sX1 ⫽ 0.05 y sX2 ⫽ 0.08
y el perímetro está dado por P ⫽ 2X1 ⫹ 2X2. Utilizando la desigualdad (3.8), se obtiene
σP = σ2X1 +2X2
≤ 2σX1 + 2σX2
= 2(0.05) + 2(0.08)
= 0.26 m
La incertidumbre en el perímetro no es mayor que 0.26 m. En el ejemplo 3.6 se calculó que
la incertidumbre era de 0.19 m cuando X y Y son independientes.
170
CAPÍTULO 3
Propagación de errores
Deducción de la desigualdad c1X1+···+cn Xn ≤ |c1|X1 + · · · + |cn |Xn
Esta deducción requiere material de la sección 2.6. Sean X1, . . . , Xn variables aleatorias y
sean c1, . . . , cn constantes. Utilizando la ecuación (2.72) (de la sección 2.6),
σc21 X1 + ··· +cn Xn
Ahora ρXi ,Xj =
=
c12 σX2 1
+ ··· +
cn2 σX2 n
+2
n−1
n
ci cj Cov(Xi , Xj )
i=1 j =i+1
Cov(Xi , Xj )
. Puesto que |ρXi ,Xj | ≤ 1, por lo que
σXi σXj
|Cov(Xi , Xj )| ≤ σXi σXj
Ya que ci cj Cov(Xi , Xj ) ≤ |ci ||cj ||Cov(Xi , Xj )|, por lo que
Sustituyendo, se obtiene
ci cj Cov(Xi , Xj ) ≤ |ci ||cj |σXi σXj
σc21 X1 + ··· +cn Xn ≤ c12 σX2 1 + · · · + cn2 σX2 n + 2
n−1
n
i=1 j =i+1
|ci ||cj |σXi σXj
(3.9)
Puesto que ci2 = |ci |2 , el lado derecho de la desigualdad (3.9) se puede factorizar:
c12 σX2 1 + · · · + cn2 σX2 n + 2
n−1
n
i=1 j =i+1
|ci ||cj |σXi σXj = (|c1 |σX1 + · · · + |cn |σXn )2
Sustituyendo en la desigualdad (3.9) y tomando raíces cuadradas, se obtiene
σc1 X1 + ··· +cn Xn ≤ |c1 |σX1 + · · · + |cn |σXn
Ejercicios de la sección 3.2
1. Suponga que X y Y son mediciones independientes con incertidumbres sX ⫽ 0.2 y sY ⫽ 0.4. Determine las incertidumbres en las cantidades siguientes:
a) 3X
rra en Estocolmo, Suecia, se estimó de 4.93 ⫾ 0.23 mm durante 1774-1884 y de 3.92 ⫾ 0.19 mm durante 1885-1984.
Estime la diferencia en la media anual de elevación entre estos dos espacios de tiempo y determine la incertidumbre en
el cálculo.
b) X ⫺ Y
2. Una medición del diámetro de un cilindro tiene incertidumbre de 2 mm. ¿Cuántas mediciones se deben hacer para que
se pueda calcular el diámetro con una incertidumbre de sólo 0.5 mm?
4. Un hueco cilíndrico es perforado con un bloque de acero y
se fabrica un pistón cilíndrico que quepa en el hueco. El
diámetro del hueco es 20.00 ⫾ 0.01 cm y el diámetro del
pistón es 19.90 ⫾ 0.02 cm. La holgura es la mitad de la diferencia entre los diámetros. Estime la holgura y determine
la incertidumbre en el cálculo.
3. En el artículo “The World’s Longest Continued Series of
Sea Level Observations” (M. Ekman en Paleogeography,
1988:73-77), la media del nivel anual de elevación de la tie-
5. El ancho y la altura de una pieza de madera de 2 × 4 son en
realidad de 1.5 × 3.5 pulg. Suponga que la incertidumbre en estas cantidades es despreciable. La longitud de una pieza de
c) 2X ⫹ 3Y
3.2
2 × 4 se mide de 72 ⫾ 0.1 pulg. Estime el volumen de la pieza de madera y determine la incertidumbre en el estimación.
6. El periodo
√ T de un péndulo simple está dado por
T = 2π L/g donde L es la longitud del péndulo y g la
aceleración debido a la gravedad. Por tanto, si se miden L y
T, se puede calcular g con g ⫽ 4π2L/T2. Suponga que se sabe que el periodo es T ⫽ 1.5 s con incertidumbre despreciable y que se mide L de 0.559 ⫾ 0.005 m. Estime g y
determine la incertidumbre en la estimación.
7. La ley de Beer-Lambert relaciona la absorbancia A de una
solución con concentración C de una especie en solución
mediante A ⫽ MLC, donde L es la longitud de la trayectoria y M es el coeficiente de absortividad molar. Suponga que
C ⫽ 1.25 mol/cm3 y L ⫽ 1 cm, ambos con incertidumbre
despreciable y que A ⫽ 1.30 ⫾ 0.05. Estime M y determine la incertidumbre en la estimación.
8. En el flujo de Couette, dos placas planas grandes yacen una
encima de otra, separándolas una fina capa de fluido. Si se
aplica una fuerza cortante en la placa superior, la viscosidad
del fluido también produce el movimiento de la placa inferior.
La velocidad V en la placa superior en relación con la placa
inferior está dada por V ⫽ τh/m, donde τ es la fuerza cortante
aplicada a la placa superior, h es el espesor de la capa de fluido y m es la viscosidad del fluido. Suponga que m ⫽ 1.49 Pa⭈s
y h ⫽ 10 mm, ambos con incertidumbre despreciable.
a) Suponga que τ ⫽ 30.0 ⫾ 0.1 Pa. Estime V y determine
la incertidumbre en la estimación aproximada.
b) Si se desea estimar V con una incertidumbre de 0.2
mm/s, ¿cuál debe ser la incertidumbre en τ?
9. De acuerdo con la ley del enfriamiento de Newton, la temperatura T de un cuerpo al tiempo t está dado por T ⫽ Ta ⫹
(T0 ⫺ Ta)e⫺kt, donde Ta es la temperatura ambiente, T0 es la
temperatura inicial y k es la constante de razón de enfriamiento. Para cierto tipo de recipiente de bebida, el valor de
k se sabe que es 0.025 min⫺1.
a) Suponga que Ta ⫽ 36°F exactamente que T0 ⫽ 72.0 ⫾
0.5°F. Estime la temperatura T al tiempo t ⫽ 10 min y
determine la incertidumbre en la estimación.
b) Suponga que T0 ⫽ 72°F exactamente y que Ta ⫽ 36.0 ⫾
0.5°F. Estime la temperatura T al tiempo t ⫽ 10 min y
determine la incertidumbre en la estimación.
10. En el artículo “Influence of Crack Width on Shear Behavior
of SIFCON” (C. Fritz y H. Reinhardt, en High Performance Fiber Reinforced Cement Composites: Proceedings of
the International RILEM/ACI Workshop, 1992), la máxima
Combinaciones lineales de las mediciones
171
tensión de corte τ de un miembro de concreto agrietado está dada por τ ⫽ τ0(1 ⫺ kw), donde τ0 es la tensión de corte
máxima para una grieta de ancho cero, w es el ancho de la
grieta en mm y k es una constante que se estima de los datos experimentales. Suponga que k ⫽ 0.29 ⫾ 0.05 mm⫺1.
Dado que τ0 ⫽ 50 MPa y w ⫽ 1.0 mm, ambos con incertidumbre despreciable, estime τ y determine la incertidumbre
en la estimación.
11. Se hacen nueve mediciones independientes de la longitud
—
de una varilla. El promedio de las nueve mediciones es X
⫽ 5.238 cm y la desviación estándar es s ⫽ 0.081 cm.
a) ¿Está la incertidumbre en el valor 5.238 cm más cerca
de 0.009, 0.027 o 0.081 cm? Explique.
b) Otra varilla se mide una vez con el mismo proceso. La
medición es 5.423 cm. ¿Está la incertidumbre de este
valor más cerca de 0.009, 0.027 o 0.081 cm? Explique.
12. Cierta balanza tiene una incertidumbre de 3 g y un sesgo de
2 g.
a) Se hace una sola medición en esta balanza. ¿Cuáles son
el sesgo y la incertidumbre en esta medición?
b) Se hacen cuatro mediciones independientes en esta balanza. ¿Cuáles son el sesgo y la incertidumbre en el promedio de estas mediciones?
c) Se hacen 400 mediciones independientes en esta balanza. ¿Cuáles son el sesgo y la incertidumbre en el promedio de estas mediciones?
d) Conforme se hacen más mediciones, ¿la incertidumbre se
hace más pequeña, más grande o permanece constante?
e) Conforme se hacen más mediciones, ¿el sesgo se hace
más pequeño, más grande o permanece constante?
13. El volumen de una roca se mide colocándola sobre un cilindro graduado parcialmente lleno de agua y se mide el aumento en el volumen. Se hacen ocho mediciones independientes.
El promedio de las mediciones es 87.0 mL y la desviación estándar es 2.0 mL.
a) Estime el volumen de la roca y determine la incertidumbre en la estimación.
b) Se hacen ocho mediciones adicionales, hasta hacer un total de 16. ¿Cuál es la incertidumbre, aproximadamente,
en el promedio de las 16 mediciones?
c) Aproximadamente ¿cuántas mediciones se necesitarían
para reducir la incertidumbre a 0.4 mL?
14. Un estudiante mide la constante de un resorte k, se carga un
resorte y se mide la elongación. (De acuerdo con la ley de
172
CAPÍTULO 3
Propagación de errores
Hooke, si l es la carga y e la elongación, entonces k ⫽ l/e.)
Suponga que se hacen cinco mediciones independientes y
los valores medidos de k (en N/m) son 36.4, 35.4, 38.6, 36.6
y 38.0.
a) Estime la constante del resorte y determine la incertidumbre en la estimación.
b) Determine un valor aproximado para la incertidumbre
en el promedio de las diez mediciones.
c) ¿Aproximadamente cuántas mediciones se deben hacer
para reducir la incertidumbre a 0.3 N/m?
d) Un segundo resorte, similar al primero, mide la constante del resorte una vez. El valor medido de k es 39.3.
¿Aproximadamente cuál es el valor de la incertidumbre?
15. Cierto proceso químico se opera diez veces a temperatura
de 65°C y diez a 80°C. La producción en cada operación se
midió como un porcentaje de un máximo teórico. Los datos
se presentan en la tabla siguiente.
65◦ C 71.3 69.1 70.3 69.9 71.1 70.7 69.8 68.5 70.9 69.8
80◦ C 90.3 90.8 91.2 90.7 89.0 89.7 91.3 91.2 89.7 91.1
a) Para cada temperatura, estime la media de la producción
y determine la incertidumbre en la estimación.
b) Estime la diferencia entre las medias de las producciones en las dos temperaturas y determine la incertidumbre en la estimación.
16. Se pesa un objeto cuatro veces y los resultados, en miligramos, son 234, 236, 233 y 229. Entonces el objeto se pesa
cuatro veces en una balanza diferente y los resultados, en
miligramos, son 236, 225, 245 y 240. Se usará el promedio
de las ocho mediciones para estimar el peso. Alguien sugiere estimar la incertidumbre en este cálculo de la siguiente
manera: calcule la desviación estándar de las ocho mediciones.√Llame a esta cantidad s. La incertidumbre es entonces
s/ 8. ¿Es esto correcto? Explique.
17. La longitud de un componente se estima por medio de mediciones repetidas.
a) Se hacen diez mediciones independientes con un instru—
mento cuya incertidumbre es 0.05 mm. Sea X el promedio de estas mediciones. Determine la incertidumbre en
—
X.
b) Un nuevo dispositivo de medición, cuya incertidumbre
es de 0.02 mm, está disponible. Se hacen cinco medicio—
nes independientes con este dispositivo. Sea Y el promedio de estas mediciones. Determine la incertidumbre
—
en Y .
c) Con el fin de disminuir la incertidumbre aún más, se de— —
cide combinar las estimaciones de X y Y . Un ingenie—
—
ro sugiere estimar la longitud con (1/2)X ⫹ (1/2)Y . Un
—
segundo ingeniero argumenta que puesto que X está ba—
sado en diez mediciones mientras que Y está basado sólo
—
—
en cinco, una mejor estimación es (10/15)X ⫹ (5/15)Y .
Determine la incertidumbre en cada una de estas estimaciones. ¿Cuál es más pequeña?
d) Determine el valor c de forma que el promedio pondera—
—
do cX ⫹ (1 ⫺ c)Y tenga una incertidumbre mínima.
Determine la incertidumbre de este promedio ponderado.
18. Las longitudes de dos componentes se medirán varias veces. La incertidumbre en cada medición de la longitud del
primer componente es s1 ⫽ 0.02 cm y la incertidumbre en
cada medición de la longitud del segundo componente es s2
—
⫽ 0.08 cm. Sea X el promedio de las mediciones del primer
—
componente y Y el promedio de las mediciones del segundo componente. La longitud total de los dos componentes
— —
se estimará con la cantidad X ⫹ Y .
a) Determine la incertidumbre en la longitud total si el primer componente se mide cuatro veces y el segundo 12
veces.
b) Determine la incertidumbre en la longitud total en función de n si el primer componente se mide n veces y el
segundo componente se mide 16 ⫺ n veces.
c) Determine la mejor manera de asignar 16 mediciones
entre los componentes determinando el valor de n que
minimiza la incertidumbre.
3.3
3.3
Incertidumbres para funciones de una medición
173
Incertidumbres para funciones de una medición
Los ejemplos que se han visto hasta ahora implican calcular incertidumbres en funciones lineales de mediciones. En muchos casos se desea estimar la incertidumbre de una función no
lineal de una medición. Por ejemplo, si el radio R de un círculo mide 5.00 ⫾ 0.01 cm, ¿cuál
es la incertidumbre en el área A? En términos estadísticos, se sabe que la desviación estándar
sR es de 0.01 cm y se debe calcular la desviación estándar de A, donde A es la función de R
dada por A ⫽ πR2.
El tipo del problema que se desea resolver es: dada una variable aleatoria X, con desviación estándar conocida sX y dada una función U ⫽ U(X), ¿cómo se calcula la desviación
estándar sU? Si U es una función lineal, los métodos de la sección 3.2 son aplicables. Si U
no es lineal, aún se puede aproximar sU, multiplicando sX por el valor absoluto de la derivada dU/dX. La aproximación será buena en tanto sX sea pequeña.
Si X es una medida cuya incertidumbre sX es pequeña y si U es una función de X, entonces
σU ≈
dU
σX
dX
(3.10)
En la práctica, se evalúa la derivada dU/dX en la medición observada X.
La ecuación (3.10) se conoce como la fórmula de la propagación de error. Al final de esta
sección se proporciona su demostración.
Las incertidumbres de la propagación de errores
están sólo aproximadas
Las incertidumbres calculadas utilizando la ecuación (3.10) con frecuencia son sólo simples
aproximaciones. Por esta razón, estas incertidumbres se deben expresar con no más de dos dígitos significativos. Efectivamente, algunos autores sugieren utilizar un solo digito significativo.
Las funciones no lineales están sesgadas
Si X es una medición no sesgada de un valor real mX y si la función U ⫽ U(X) es una función
no lineal de X, entonces en la mayoría de los casos U será una estimación sesgada del valor
real U(mX). En la práctica este sesgamiento generalmente se desprecia. Se puede demostrar
con métodos avanzados que el tamaño del sesgamiento depende de manera fundamental de
las magnitudes de sX y de la segunda derivada d2U/dX2. Por tanto, conforme la incertidumbre sX sea pequeña, el sesgamiento en U en general también lo será, excepto en algunas circunstancias bastante inusuales cuando la segunda derivada es muy grande. Por supuesto, si X
es una medición con sesgamiento no despreciable, entonces el sesgamiento en U podría ser
grande. Estas ideas se analizan aún más en el ejercicio 22 de los ejercicios adicionales al final de este capítulo.
174
CAPÍTULO 3
Ejemplo
3.14
El radio R de un círculo mide 5.00 ⫾ 0.01 cm. Estime el área del círculo y determine la incertidumbre.
Propagación de errores
Solución
El área A está dada por A ⫽ πR2. La estimación aproximada de A es π(5.00 cm)2 ⫽ 78.5 cm2.
Ahora, sR ⫽ 0.01 cm y dA/dR ⫽ 2πR ⫽ 10π cm. La incertidumbre en A se puede encontrar
como:
σA =
dA
σR
dR
= (10π cm)(0.01 cm)
= 0.31 cm2
Se estima el área del círculo de 78.5 ⫾ 0.3 cm2.
Ejemplo
3.15
Una roca que se identifica como cuarcita tamaño adoquín tiene una masa m de 674.0 g. Suponga que esta medición tiene una incertidumbre despreciable. El volumen V de la roca se
medirá al colocarla en un cilindro graduado parcialmente lleno de agua y medir el volumen
de agua desplazada. La densidad D de la roca se calculará como D ⫽ m/V. Suponga que el
volumen del agua desplazada es 261.0 ⫾ 0.1 mL. Estime la densidad de la roca y determine
la incertidumbre.
Solución
Sustituyendo V ⫽ 261.0 mL, la estimación de la densidad D es 674.0/261.0 ⫽ 2.582 g/mL.
Tratando a m ⫽ 674.0 como una constante conocida, dD/dV ⫽ ⫺674.0/V2 ⫽ ⫺674.0/(261.0)2
⫽ ⫺0.010 g/mL2. Se sabe que sV ⫽ 0.1 mL. La incertidumbre en D es, por tanto,
σD =
dD
σV
dV
= | − 0.010|(0.1 g/mL)
= 0.001 g/mL
Se estima la densidad de 2.582 ⫾ 0.001 g/mL.
Incertidumbres relativas para funciones de una medición
Se ha estado llamando a la desviación estándar sU de una medición U como la incertidumbre
en U. Un nombre más completo para sU es la incertidumbre absoluta, ya que se expresa con
las mismas unidades que la medición U. A veces se desea expresar la incertidumbre como una
fracción del valor real, la cual (suponiendo que no hay sesgamiento) representa la media de
la medición mU. De hecho se le llama incertidumbre relativa en U. Esta última también se
denomina coeficiente de variación. En la práctica, puesto que mU no se conoce, el valor medido de U se usa en su lugar cuando se calcula la incertidumbre relativa.
3.3
Incertidumbres para funciones de una medición
175
Resumen
Si U es una medición cuyo valor real es mU y cuya incertidumbre es sU, entonces la
incertidumbre relativa en U es la cantidad sU/mU.
La respectiva incertidumbre es un número puro, sin unidades. Con frecuencia se
expresa como porcentaje. En la práctica mU no se conoce, por lo que si el sesgamiento es despreciable, se estima la respectiva incertidumbre con sU/U.
Hay dos maneras de calcular la incertidumbre relativa en una cantidad U. Simplemente con sólo utilizar la ecuación (3.10) para calcular la incertidumbre absoluta sU y dividir entre U. Para desarrollar el segundo método, se calculará la incertidumbre absoluta en ln U:
σln U =
σU
d(ln U )
σU =
dU
U
Esta ecuación muestra que la incertidumbre absoluta en ln U es igual a la incertidumbre relativa en U. Por tanto, la segunda manera de calcular la incertidumbre relativa en U es calcular
ln U y después utilizar la ecuación (3.10) para calcular la incertidumbre absoluta en ln U.
Resumen
Hay dos métodos para aproximar la incertidumbre relativa sU/U de una función U ⫽
U(X):
1. Calcule sU utilizando la ecuación (3.10) y después divida entre U.
2. Calcule ln U y use la ecuación (3.10) para encontrar slnU, que es igual a sU/U.
Ambos métodos funcionan en cada ejemplo, por lo que se puede utilizar el que sea más fácil
para un problema específico. Esta elección generalmente se determina por lo que sea más fácil de calcular, la derivada de U o de ln U.
Ejemplo
3.16
El radio de un círculo mide 5.00 ⫾ 0.01 cm. Estime el área y determine la incertidumbre relativa.
Solución
En el ejemplo 3.14, el área A ⫽ πR2 se estimó de 78.5 ⫾ 0.3 cm2. La incertidumbre absoluta
es, por tanto, sA ⫽ 0.3 cm2 y la incertidumbre relativa es sA/A ⫽ 0.3/78.5 ⫽ 0.004. Por tanto, se puede expresar al área como A ⫽ 78.5 cm2 ⫾ 0.4 por ciento.
Si no se hubiese ya calculado sA, sería más fácil calcular la incertidumbre relativa al
calcular la incertidumbre absoluta en ln A. Puesto que ln A ⫽ ln π ⫹ 2 ln R, d ln A/dR ⫽ 2/R
⫽ 0.4. La incertidumbre relativa en A es
176
CAPÍTULO 3
Propagación de errores
σA
= σln A
A
d ln A
=
σR
dR
= 0.4σR
= (0.4)(0.01)
= 0.4%
Ejemplo
3.17
La aceleración de una masa que desciende en un plano inclinado sin fricción está dada por a
⫽ gsenθ, donde g es la aceleración debida a la gravedad y θ es el ángulo de inclinación del
plano. Suponga que la incertidumbre en g es despreciable. Si θ ⫽ 0.60 ⫾ 0.01 rad, determine la incertidumbre relativa en a.
Solución
La incertidumbre relativa en a es la incertidumbre absoluta en lna. Ahora ln a ⫽ ln g ⫹ ln(senθ), donde ln g es constante. Por tanto, d ln a/dθ ⫽ d ln(senθ)/dθ ⫽ cosθ/senθ ⫽ cotθ ⫽
cot(0.60) ⫽ 1.46. La incertidumbre en θ es sθ ⫽ 0.01. La incertidumbre relativa en a es, por
tanto,
σa
= σln a
a
d ln a
σθ
=
dθ
= (1.46)(0.01)
= 1.5%
Observe que la incertidumbre relativa en a ⫽ gsenθ no depende de la constante g.
Deducción de la fórmula de propagación de errores
Se deduce la fórmula de la propagación de errores para una función no lineal U de una variable aleatoria X aproximándola con una función lineal y después utilizando los métodos
de la sección 3.2. Para encontrar una aproximación lineal a U, se usa una serie de Taylor
aproximada a primer orden. Esto se conoce como linealizando el problema; ésta es una
técnica comúnmente usada en ciencia e ingeniería.
Sea U(X) una función derivable. Sea mX cualquier punto. Entonces si X está cerca de
mX, la serie de Taylor aproximada a primer orden para U(X) es
U (X) − U (μX ) ≈
La derivada dU/dX se evalúa en mX.
dU
(X − μX )
dX
(3.11)
3.3
Incertidumbres para funciones de una medición
177
Ahora sea X una medición y sea U(X) (a la que se llamará U) una cantidad calculada
a partir de X. Sea mX la media de X. Para cualquier medición razonablemente precisa, X
estará bastante cerca de mX para que la aproximación en serie de Taylor sea válida.
Sumando U(mX ) en ambos lados de la ecuación (3.11) se obtiene
U ≈ U (μX ) +
dU
(X − μX )
dX
Multiplicando por dU/dX y arreglando los términos
dU
dU
U ≈ U (μX ) −
μX +
X
dX
dX
Ahora la cantidad dU/dX es una constante, ya que ésta se encuentra evaluada en mX. Por
tanto, la cantidad U(mX) – (dU/dX)mX es también constante. Por tanto, de la ecuación
(2.46) (en la sección 2.5) se tiene que
σU =
dU
σX
dX
Ésta es la fórmula de propagación de errores. Cuando se aplica, se evalúa la derivada
dU/dX en la medición observada X, puesto que no se conoce el valor de mX.
Ejercicios de la sección 3.3
1. Determine la incertidumbre en Y, dado que X ⫽ 4.0 ⫾ 0.4 y
a) Y ⫽ X2
√
b) Y = X
c) Y ⫽ 1/X
d) Y ⫽ ln X
e) Y ⫽ eX
f ) Y ⫽ sen X (X está en unidades de radianes)
2. Dado que X y Y están relacionados por la ecuación dada y
que X ⫽ 2.0 ⫾ 0.2, estime Y y determine la incertidumbre
en la estimación.
a) XY ⫽ 1
b) X/Y ⫽ 2
√
c) X Y = 3
√
d) Y X = 4
3. La aceleración g debida a la gravedad se estima dejando
caer un objeto y se mide el tiempo que le toma recorrer cierta distancia. Suponga que se sabe que la distancia s es exac-
tamente de 5 m y que el tiempo medido es t ⫽ 1.01 ⫾ 0.02
s. Estime g y encuentre la incertidumbre en la estimación.
(Observe que g ⫽ 2s/t2.)
4. La velocidad V del √
sonido en el aire a temperatura T está dado por V = 20.04 T , donde T está medida en grados kelvin (K) y V en m/s. Suponga que T ⫽ 300 ⫾ 0.4 K. Estime
V y determine la incertidumbre en la estimación.
5. El periodo T de un péndulo simple está dado por
√
T = 2π L/g donde L es la longitud del péndulo y g es
la aceleración debida a la gravedad.
a) Suponga que g ⫽ 9.80 m/s2 exactamente y que L ⫽
0.742 ⫾ 0.005 m. Estime T y determine la incertidumbre en la estimación.
b) Suponga que L ⫽ 0.742 m exactamente y que T ⫽ 1.73
⫾ 0.01 s. Estime g y determine la incertidumbre en la
estimación.
6. La altura h de aumento en el vaso capilar del agua en un tubo
de vidrio limpio está dada por h ⫽ k/r, donde r es el radio
del tubo y k es la constante que depende de la temperatura
178
CAPÍTULO 3
Propagación de errores
del agua. Suponga que a una temperatura de 10°C, k ⫽ 7.57
mm2. Suponga que el radio del tubo es 2.0 ⫾ 0.1 mm. Estime h y determine la incertidumbre en la estimación.
a) 37.2 ⫾ 0.1
7. La velocidad de fricción F del agua que fluye a través de un
√
tubo está dada por F = gdh/4l, donde g representa la
aceleración debida a la gravedad, d el diámetro del tubo, l
la longitud del tubo y h la pérdida de carga. Estime F y determine la incertidumbre en la estimación, suponga que g ⫽
9.80 m/s2 exactamente y que
d ) 54.8 ⫾ 0.3
a) d ⫽ 0.15 m y l ⫽ 30.0 m, ambos con incertidumbre despreciable y h ⫽ 5.33 ⫾ 0.02 m.
b) h ⫽ 5.33 m y l ⫽ 30.0 m, ambos con incertidumbre despreciable y d ⫽ 0.15 ⫾ 0.03 m.
c) d ⫽ 0.15 m y h ⫽ 5.33 m, ambos con incertidumbre despreciable y l ⫽ 30.00 ⫾ 0.04 m.
8. El índice de refracción n de una pieza de vidrio está relacionado con el ángulo crítico θ por n ⫽ l/senθ. Suponga que el
ángulo crítico se ha medido de 0.70 ⫾ 0.02 rad. Estime el
índice de refracción y determine la incertidumbre en la estimación.
9. La densidad de una roca será medida colocándola en un cilindro graduado parcialmente lleno de agua y después se mide
el volumen de agua desplazado. La densidad D está dada
por D ⫽ m/(V1 ⫺ V0), donde m es la masa de la roca, V0 es
el volumen inicial del agua y V1 es el volumen del agua más
la roca. Suponga que la masa de la roca es de 750 g, con incertidumbre despreciable y que V0 ⫽ 500.0 ⫾ 0.1 mL y V1
⫽ 813.2 ⫾ 0.1 mL. Estime la densidad de la roca y determine la incertidumbre en la estimación.
10. La conversión de cianuro de amonio en urea es una reacción
de segundo orden. Esto significa que la concentración C de
cianuro de amonio al tiempo t está dado por l/C ⫽ kt ⫹
1/C0, donde C0 es la concentración inicial y que k es la razón constante. Suponga que se sabe que la concentración
inicial es de 0.1 mol/L exactamente. Suponga que el tiempo
se puede medir con incertidumbre despreciable.
b) 8.040 ⫾ 0.003
c) 936 ⫾ 37
12. Convierta las siguientes incertidumbres relativas en incertidumbres absolutas.
a) 48.41 ⫾ 0.3%
b) 991.7 ⫾ 0.6%
c) 0.011 ⫾ 0.9%
d ) 7.86 ⫾ 1%
13. La aceleración g debida a la gravedad se estima dejando
caer un objeto y se mide el tiempo que le toma recorrer cierta distancia. Suponga que se conoce que la distancia s es
exactamente 2.2 m. El tiempo que se mide es t ⫽ 0.67 ⫾
0.02 s. Estime g y determine la incertidumbre relativa en la
estimación. (Observe que g ⫽ 2s/t2.)
14. Con referencia al ejercicio 4, suponga que T ⫽ 298.4 ⫾ 0.2
K. Estime V y determine la incertidumbre relativa en la estimación.
15. Con referencia al ejercicio 5.
a) Suponga que g ⫽ 9.80 m/s2 exactamente y que L ⫽
0.855 ⫾ 0.005 m. Estime T y determine la incertidumbre relativa en la estimación.
b) Suponga que L ⫽ 0.855 m exactamente y que T ⫽ 1.856
⫾ 0.005 s. Estime g y determine la incertidumbre relativa en la estimación.
16. Con referencia al ejercicio 6, suponga que el radio del tubo
es r ⫽ 2.5 ⫾ 0.2 mm y que k ⫽ 7.57 mm2 con incertidumbre despreciable. Estime h y determine la incertidumbre relativa en la estimación.
17. Con referencia al ejercicio 7, estime F y determine la incertidumbre relativa en la estimación, suponga que g ⫽ 9.80
m/s2 exactamente y que
a) Después de 45 minutos se mide la concentración de cianuro de amonio de 0.0811 ⫾ 0.0005 mol/L. Estime la
razón constante k y determine la incertidumbre en la estimación.
a) d ⫽ 0.20 m y l ⫽ 35.0 m, ambos con incertidumbre despreciable y h ⫽ 4.51 ⫾ 0.03 m.
b) Use el resultado del inciso a) para estimar el tiempo en el
que la concentración de cianuro de amonio será de 0.0750
mol/L y determine la incertidumbre en la estimación.
c) d ⫽ 0.20 m y h ⫽ 4.51 m, ambos con incertidumbre despreciable y l ⫽ 35.00 ⫾ 0.4 m.
11. Convierta las siguientes incertidumbres absolutas en incertidumbres relativas.
b) h ⫽ 4.51 m y l ⫽ 35.0 m, ambos con incertidumbre despreciable y d ⫽ 0.20 ⫾ 0.008 m.
18. Con referencia al ejercicio 8, suponga que el ángulo crítico
se midió de 0.90 ⫾ 0.01 rad. Estime el índice de refracción
y determine la incertidumbre relativa en la estimación.
3.4
19. Con referencia al ejercicio 9, suponga que la masa de la roca
es 288.2 g con incertidumbre despreciable, el volumen inicial del agua en el cilindro es 400 ⫾ 0.1 mL y el volumen
de agua más la roca es 516 ⫾ 0.2 mL. Estime la densidad de
la roca y determine la incertidumbre relativa en la estimación.
20. En una operación de una reacción química a cierta temperatura, la concentración C de cierto reactivo al tiempo t está dada por 1/C ⫽ kt ⫹ l/C0, donde C0 es la concentración
inicial y k es la razón constante. Suponga que se sabe que la
concentración inicial es 0.04 mol/L exactamente. Suponga
que el tiempo se mide con incertidumbre despreciable.
3.4
Incertidumbres para funciones de varias mediciones
179
a) Después de 30 s, la concentración C se mide de 0.0038
⫾ 2.0 × 10⫺4 mol/L. Estime la razón constante k y determine la incertidumbre relativa en la estimación.
b) Después de 50 s, la concentración C se mide de 0.0024
⫾ 2.0 × 10⫺4 mol/L. Estime la razón constante k y determine la incertidumbre relativa en la estimación.
c) Denote las estimaciones de la razón constante k en los
incisos a) y
b) por k̂1 y k̂2, respectivamente. La media
geométrica k 1 k 2 se usa como estimación de k. Determine la respectiva incertidumbre en la estimación.
Incertidumbres para funciones
de varias mediciones
Con frecuencia se necesita estimar una cantidad como una función de varias mediciones. Por
ejemplo, se podría medir la masa m y el volumen V de una roca y calcular la densidad como
D ⫽ m/V. En el ejemplo 3.15 se mostró cómo estimar la incertidumbre en D cuando una de
las cantidades, en este caso V, fue medida con incertidumbre mientras que m se trató como
una constante conocida. Sin embargo, en la práctica se podría necesitar estimar la incertidumbre en D cuando tanto m como V se miden con incertidumbre.
En esta sección se aprenderá cómo estimar la incertidumbre en una cantidad que es una
función de varias mediciones inciertas independientes. La fórmula básica está dada aquí.
Si X1,X2, . . . , Xn son mediciones independientes cuyas incertidumbres sX1, sX2, . . . ,
sXn, son pequeñas y si U ⫽ U(X1,X2, . . . , Xn) es una función de X1,X2, . . . , Xn, entonces
∂U 2 2
∂U 2 2
∂U 2 2
(3.12)
σX1 +
σX2 + · · · +
σXn
σU ≈
∂X1
∂X2
∂Xn
En la práctica, se evalúan las derivadas parciales en el punto (X1,X2, . . . , Xn).
La ecuación (3.12) representa la fórmula de propagación de errores multivariada. Es importante observar que es válida sólo cuando las mediciones X1,X2, . . . , Xn son independientes. Una deducción de la fórmula se proporciona al final de la sección. Como en el caso de
una medición, las incertidumbres calculadas con la fórmula de la propagación de errores son
frecuentemente aproximaciones.
Las funciones no lineales de las mediciones son, en general, sesgadas (véase el análisis
con respecto a funciones de una medición en la sección 3.3). Sin embargo, en tanto las mediciones X1, . . . , Xn no estén sesgadas y las incertidumbres sX1, . . . , sXn sean todas pequeñas,
el sesgamiento en U por lo regular será lo suficientemente pequeño para despreciarlo. Excepciones a esta regla son bastante inusuales, pueden ocurrir cuando algunas de las derivadas par-
180
CAPÍTULO 3
Propagación de errores
ciales de segundo o más alto orden de U con respecto a Xi son bastante grandes. Por supuesto, si una o más de las X1, . . . , Xn son considerablemente sesgadas, entonces U podría también estarlo. Estas ideas se exploran aún más en el ejercicio 23 de los ejercicios adicionales
al final de este capítulo.
Ahora se presentan algunos ejemplos que ilustran el uso de la propagación de errores
multivariada.
Ejemplo
3.18
Suponga que la masa de una roca se mide de m ⫽ 674.0 ⫾ 1.0 g y el volumen de la roca se
mide de V ⫽ 261.0 ⫾ 0.1 mL. Estime la densidad de la roca y determine la incertidumbre en
el cálculo en la estimación.
Solución
Sustituyendo m ⫽ 674.0 g y V ⫽ 261.0 mL, la estimación de la densidad D es 674.0/261.0 ⫽
2.582 g/mL. Puesto que D ⫽ m/V, las derivadas parciales de D son
1
∂D
=
= 0.0038 mL−1
∂m
V
−m
∂D
= 2 = −0.0099 g/mL2
∂V
V
La incertidumbre en D es, por tanto,
∂D 2 2
∂D 2 2
σD =
σm +
σV
∂m
∂V
= (0.0038)2 (1.0)2 + (−0.0099)2 (0.1)2
= 0.0040 g/mL
La densidad de la roca es 2.582 ⫾ 0.004 g/mL.
Uno de los beneficios de la fórmula de propagación de errores multivariada es que permite determinar las mediciones que contribuyen más a la incertidumbre en el resultado final.
El ejemplo 3.19 ilustra esto último.
Ejemplo
3.19
La densidad de la roca en el ejemplo 3.18 se estimó otra vez con equipo diferente, con el fin
de mejorar la precisión. ¿Qué mejoraría más la precisión del cálculo de la densidad: reducir
la incertidumbre en el cálculo de la masa a 0.5 g o a 0.05 mL?
Solución
Del ejemplo 3.18, σD = (0.0038)2 σm2 + (−0.0099)2 σV2 . Se ha hecho una elección entre te-
ner sm ⫽ 0.5 y sV ⫽ 0.1, o tener sm ⫽ 1.0 y sV ⫽ 0.05. Los resultados de la primera elección en sD ⫽ 0.002 g/mL, mientras que en la segunda elección en sD ⫽ 0.004 g/mL. Es mejor reducir sm a 0.5 g.
3.4
Ejemplo
3.20
Incertidumbres para funciones de varias mediciones
181
Dos resistores con resistencias R1 y R2 están conectados en paralelo. La resistencia combinada R está dada por R ⫽ (R1R2)/(R1 ⫹ R2). Si R1 mide 100 ⫾ 10 Ω y R2 20 ⫾ 1 Ω, estime R y
determine la incertidumbre en la estimación.
Solución
La estimación de R es (100)(20)/(100 ⫹ 20) ⫽ 16.67 Ω. Para calcular sR, primero se calculan las derivadas parciales de R:
∂R
=
∂R1
∂R
=
∂R2
R2
R1 + R 2
R1
R1 + R 2
2
2
= 0.0278
= 0.694
Ahora sR1 ⫽ 10 Ω y sR2 ⫽ 1 Ω. Por tanto,
σR =
=
∂R
∂R1
2
σR21
+
∂R
∂R2
2
σR22
(0.0278)2 (10)2 + (0.694)2 (1)2
= 0.75
La resistencia combinada es 16.67 ⫾ 0.75 Ω.
Ejemplo
3.21
En el ejemplo 3.20, el resistor de 100 ⫾ 10 Ω se puede reemplazar con uno más costoso de
100 ⫾ 1 Ω. ¿En cuánto se reduciría la incertidumbre en la resistencia combinada por esto último? ¿Es útil hacer el reemplazo?
Solución
Utilizando el método del ejemplo 3.20, la incertidumbre en la resistencia combinada R con el
nuevo resistor sería
(0.0278)2 (1)2 + (0.694)2 (1)2 = 0.69
No hay mucha reducción de la incertidumbre de 0.75 Ω utilizando el resistor viejo. Casi toda la incertidumbre en la resistencia combinada se debe a la incertidumbre en el resistor de
20 Ω. En este contexto, la que se encuentra en el resistor de 100 Ω se puede despreciar para
la mayoría de los propósitos prácticos. Hay muy poco beneficio en reemplazar este resistor.
Observe que en el ejemplo 3.20, un componente (el resistor de 100 Ω) tenía una incertidumbre más grande, tanto en términos absolutos como relativos del valor medido, que el otro.
Aún así, el ejemplo 3.21 mostraba que la incertidumbre en la resistencia combinada estaba
sólo ligeramente afectada por la incertidumbre en este componente. La lección es que no se
182
CAPÍTULO 3
Propagación de errores
puede predecir el impacto de las incertidumbres en las mediciones individuales sobre la incertidumbre en el cálculo final de las magnitudes de las incertidumbres solas. Se debe utilizar la fórmula de propagación de errores.
Incertidumbres para funciones de mediciones dependientes
Si X1, X2, . . . , Xn no son independientes, la incertidumbre en una función U ⫽ U(X1, X2, . . . ,
Xn) se puede estimar si se conoce la covarianza de cada par (Xi, Xj). (La covarianza se analiza en la sección 2.6.) En muchas situaciones, las covarianzas no se conocen. En estos casos,
se puede hacer una estimación conservadora de la incertidumbre en U. Aquí se presenta este
resultado.
Si X1, X2, . . . , Xn son mediciones cuyas incertidumbres sX1, sX2, . . . , sXn, son pequeñas y si U ⫽ U(X1, X2, . . . , Xn) es una función de (X1, X2, . . . , Xn), entonces una
estimación conservadora de sU está dada por
σU ≤
∂U
∂U
∂U
σX2 + · · · +
σXn
σX1 +
∂X1
∂X2
∂Xn
(3.13)
En la práctica se evalúan las derivadas parciales en el punto (X1, X2, . . . , Xn).
La desigualdad (3.13) es válida en casi todas las situaciones prácticas; en principio
puede fallar si algunas de las segundas derivadas parciales de U son muy grandes.
Ejemplo
3.22
Con referencia al ejemplo 3.20, determine una estimación conservadora para la incertidumbre en la resistencia R total si no se sabe si R1 y R2 son independientes.
Solución
Se tiene sR1 ⫽ 10 Ω, sR2 ⫽ 1 Ω, ∂R/∂R1 ⫽ 0.0278, y ∂R/∂R2 ⫽ 0.694. Por tanto,
σR ≤
∂R
∂R
σ R1 +
σ R2
∂R1
∂R2
= (0.0278)(10) + (0.694)(1)
= 0.97
La incertidumbre en la resistencia total se estimó conservadoramente de 0.97 Ω. En el ejemplo 3.20 se calculó la incertidumbre de 0.75 Ω cuando Rl y R2 son independientes.
Incertidumbres relativas para funciones de varias mediciones
En la sección 3.3 se presentaron los métodos para calcular las incertidumbres relativas para
funciones de una variable. Los métodos de cálculo de incertidumbres relativas para las funciones de varias variables son similares.
Incertidumbres para funciones de varias mediciones
3.4
183
Hay dos métodos para aproximar la incertidumbre relativa sU/U en una función U ⫽
U(X1,X2, . . . , Xn):
1. Calcule sU utilizando la ecuación (3.12) y después divida entre U.
2. Calcule ln U y después use la ecuación (3.12) para encontrar slnU que es igual
a sU/U.
Ambos métodos funcionan en cada ejemplo, por tanto se puede utilizar cualquiera de los dos,
el que sea más fácil, para un problema específico. Esta elección se determina generalmente
por lo que sea más fácil para calcular las derivadas parciales de U o de ln U.
Ejemplo
3.23
Dos lados perpendiculares de un rectángulo se miden de X ⫽ 2.0 ⫾ 0.1 cm y Y ⫽ 3.2 ⫾ 0.2
cm. Determine la incertidumbre relativa en el área A ⫽ XY.
Solución
La incertidumbre relativa se calcula fácilmente encontrando la incertidumbre absoluta en ln
A ⫽ ln X ⫹ ln Y. Se inicia calculando las derivadas parciales de ln A:
1
∂ ln A
=
= 0.50
∂X
X
∂ ln A
1
= = 0.31
∂Y
Y
Se ha dado que sX ⫽ 0.1 y sY ⫽ 0.2. La incertidumbre relativa en A es
σA
= σln A =
A
=
∂ ln A
∂X
2
σX2
+
∂ ln A
∂Y
2
σY2
(0.50)2 (0.1)2 + (0.31)2 (0.2)2
= 0.080
La incertidumbre relativa en A es 0.080 u 8%. El área del rectángulo es 6.4 cm2 ⫾ 8%.
Ejemplo
3.24
Una máquina de Atwood consta de dos masas X y Y (X > Y) fijas en los extremos de una cuerda ligera que pasa por una polea ligera sin fricción. Cuando se sueltan las masas, la más grande X se acelera hacia abajo con una aceleración
a=g
X−Y
X+Y
Suponga que X y Y se miden como X ⫽ 100 ⫾ 1 g y Y ⫽ 50 ⫾ 1 g. Suponga que g, la aceleración debida a la gravedad, es conocida con incertidumbre despreciable. Encuentre la incertidumbre relativa en la aceleración a.
184
CAPÍTULO 3
Propagación de errores
Solución
La incertidumbre relativa en a es igual a la incertidumbre absoluta en ln a ⫽ ln g ⫹ ln(X ⫺
Y) ⫺ ln(X ⫹ Y). Tratamos a g como una constante, ya que su incertidumbre es despreciable.
Las derivadas parciales son
1
1
∂ ln a
=
−
= 0.0133
∂X
X−Y
X+Y
∂ ln a
1
1
=−
−
= −0.0267
∂Y
X−Y
X+Y
Las incertidumbres en X y Y son sX ⫽ sY ⫽ 1. La incertidumbre relativa en a es
σa
= σln a =
a
=
∂ ln a
∂X
2
σX2 +
∂ ln a
∂Y
2
σY2
(0.0133)2 (1)2 + (−0.0267)2 (1)2
= 0.030
La incertidumbre relativa en a es 0.030, o 3%. Observe que este valor no depende de g.
Deducción de la fórmula de propagación de errores multivariada
Se deduce la fórmula de propagación de errores para una función no lineal U de una variable aleatoria X al aproximar a la función con una función lineal multivariada (es decir,
al linealizar el problema) y después utilizando los métodos de la sección 3.2. Para encontrar una aproximación lineal para U se usa una aproximación con una serie de Taylor de
primer orden. Sea U ⫽ U(X1,X2, . . . , Xn) una función cuyas derivadas parciales existen.
Sea (m1,m2, . . . , mn) un punto. Entonces si X1,X2, . . . , Xn son cercanas a m1,m2, . . . , mn,
respectivamente, la linealización de U es
∂U
(X1 − μ1 )
∂X1
∂U
∂U
+
(X2 − μ2 ) + · · · +
(Xn − μn )
∂X2
∂Xn
U (X1 , X2 , . . . , Xn ) − U (μ1 , μ2 , . . . , μn ) ≈
Cada derivada parcial se evalúa en el punto (m1, m2, . . . , mn).
Si X1, X2, . . . , Xn son mediciones independientes, la aproximación lineal conduce a
un método para aproximar la incertidumbre en U, dadas las incertidumbres en X1, X2, . . . ,
Xn. La deducción es similar al caso de una variable que se presentó al final de la sección
3.3. Sean m1, m2, . . . , mn las medias de X1, X2, . . . , Xn, respectivamente. Entonces para
cualesquiera mediciones razonablemente precisas, X1, X2, . . . , Xn estarán bastante cerca
de m1, m2, . . . , mn para que la linealización sea válida.
Se puede reescribir la ecuación (3.14) como
3.4
Incertidumbres para funciones de varias mediciones
∂U
∂U
∂U
μ1 −
μ2 − · · · −
μn
U ≈ U (μ1 , μ2 , . . . , μn ) −
∂X1
∂X2
∂Xn
∂U
∂U
∂U
+
X1 +
X2 + · · · +
Xn
∂X1
∂X2
∂Xn
185
(3.15)
Las cantidades ∂U/∂X1, ∂U/∂X2, . . . , ∂U/∂Xn son todas constantes, puesto que se evalúan
en el punto (m1, m2, . . . , mn). Por tanto, la cantidad
U (μ1 , μ2 , . . . , μn ) −
∂U
∂U
∂U
μ1 −
μ2 − · · · −
μn
∂X1
∂X2
∂Xn
también es constante. En este contexto, de la ecuación (2.40) (de la sección 2.5) y de la
ecuación (3.4) (de la sección 3.2) se tiene que
σU ≈
∂U
∂X1
2
∂U 2 2
∂U 2 2
σX2 1 +
σX2 + · · · +
σXn
∂X2
∂Xn
Ejercicios de la sección 3.4
1. Determine la incertidumbre en U, suponiendo que X ⫽ 10.0
⫾ 0.5, Y ⫽ 5 ⫾ 0.1 y
a) U ⫽ XY2
b) U ⫽ X2 ⫹ Y2
c) U ⫽ (X ⫹ Y2)/2
2. Con referencia al ejercicio 8 de la sección 3.2, suponga que
τ ⫽ 30.0 ⫾ 0.1 Pa, h ⫽ 10.0 ⫾ 0.2 mm y m ⫽ 1.49 Pa⋅s con
incertidumbre despreciable.
a) Estime V y determine la incertidumbre en la estimación.
b) ¿Qué proveería una reducción más grande en la incertidumbre en V: reducir la incertidumbre en τ a 0.01 Pa o
reducir la incertidumbre en h a 0.1 mm?
3. Entra aire en un compresor con una presión P1 y sale con
una presión
P2, la presión intermedia está dada por
√
P1 P2 . Suponga que P1 ⫽ 10.1 ⫾ 0.3 MPa y P2 ⫽
20.1 ⫾ 0.4 MPa.
P3 =
4. Una manera de medir el contenido de agua en una tierra es
pesarla antes y después de secarla en un horno. El contenido de agua es W ⫽ (M1 ⫺ M2)/M1, donde M1 es la masa antes de secarla y M2 después de secarla. Suponiendo que M1
⫽ 1.32 ⫾ 0.01 kg y M2 ⫽ 1.04 ⫾ 0.01 kg.
a) Estime W y determine la incertidumbre en la estimación.
b) ¿Qué proveería una reducción más grande en la incertidumbre en W: reducir la incertidumbre en M1 a 0.005 kg
o reducirla en M2 en 0.005 kg?
5. La ecuación de lentes dice que si un objeto se coloca a una
distancia p de una lente y se forma una imagen a una distancia q de aquélla, entonces la longitud focal f satisface la
ecuación 1/f ⫽ 1/p ⫹ 1/q. Suponga p ⫽ 2.3 ⫾ 0.2 cm y q
⫽ 3 ⫾ 0.2 cm.
a) Calcule f y determine la incertidumbre.
b) ¿Qué proveería una reducción más grande en la incertidumbre en f: reducir la incertidumbre en p a 0.1 cm o en
q a 0.1 cm?
a) Estime P3 y determine la incertidumbre en la estimación.
6. La presión P, temperatura T y volumen V de una mol de gas
b) ¿Qué proveería una reducción más grande en la incertidumbre en P3: reducir la incertidumbre en P1 a 0.2 MPa
o reducir la incertidumbre en P2 a 0.2 MPa?
ideal está relacionada con la ecuación PV ⫽ 8.31 T, cuando
P se mide en kilopascales, T se mide en grados Kelvin y V
se mide en litros.
186
CAPÍTULO 3
Propagación de errores
a) Suponga que P ⫽ 242.52 ⫾ 0.03 kPa y V ⫽ 10.103 ⫾
0.002 L. Estime T y determine la incertidumbre en la estimación.
b) Suponga que P ⫽ 242.52 ⫾ 0.03 kPa y T ⫽ 290.11 ⫾
0.02 K. Estime V y determine la incertidumbre en la estimación.
c) Suponga que V ⫽ 10.103 ⫾ 0.002 L y T ⫽ 290.11 ⫾
0.02 K. Estime P y determine la incertidumbre en la estimación.
7. Con referencia al ejercicio 7 en la sección 3.3, suponga que
g ⫽ 9.80 m/s2 exactamente, d ⫽ 0.18 ⫾ 0.02 m, h ⫽ 4.86
⫾ 0.06 m y l ⫽ 32.04 ⫾ 0.01 m. Estime F y determine la
incertidumbre en la estimación.
8. En el artículo “Temperature-Dependent Optical Constants
of Water Ice in the Near Infrared: New Results and Critical
Review of the Available Measurements” (B. Rajaram, D.
Glandorf y colaboradores, en Applied Optics, 2001:44494462), el índice imaginario de refracción del agua congelada se presenta para diferentes frecuencias y temperaturas. A
frecuencia de 372.1 cm⫺1 y temperatura de 166 K, el índice se estima de 0.00116. A la misma frecuencia y a temperatura de 196 K, el índice se estima de 0.00129. La
incertidumbre se reporta de 10⫺4 para cada uno de estos índices. La razón de los índices se estima de 0.00116/0.00129
⫽ 0.899. Determine la incertidumbre en esta razón.
9. Con referencia al ejercicio 10 de la sección 3.2, suponga
que τ0 ⫽ 50 ⫾ 1 MPa, w ⫽ 1.2 ⫾ 0.1 mm y k ⫽ 0.29 ⫾
0.05 mm⫺1.
es una versión ligeramente simplificada del índice en el artículo “A Zooarchaeological Signature for Meat Storage:
Rethinking the Drying Utility Index” (T. Friesen, en American Antiquity, 2001:315-331). Sea m el peso de carne, b el
peso del hueso y g el peso neto de alguna parte del caribú.
El índice de secado de carne y está dado por y ⫽ mb/g. Suponga que para una costilla especial del caribú, se hicieron
las siguientes mediciones (en gramos): g ⫽ 3 867.4 ⫾ 0.3,
b ⫽ 1 037.0 ⫾ 0.2, m ⫽ 2 650.4 ⫾ 0.1.
a) Estime y y determine la incertidumbre en la estimación.
b) ¿Qué proveería una reducción más grande en la incertidumbre en y: reducir la incertidumbre en g a 0.1 g, en b
a 0.1 g, o en m a 0?
12. La resistencia R (en ohms) de un conductor cilíndrico está
dado por R ⫽ kl/d2, donde l es la longitud, d es el diámetro
y k es una constante de proporcionalidad. Suponga que l ⫽
14 ⫾ 0.1 cm y d ⫽ 4.4 ⫾ 0.1 cm.
a) Estime R y determine la incertidumbre en la estimación.
Su respuesta estará en relación con la constante de proporcionalidad k.
b) ¿Qué proveería una reducción más grande en la incertidumbre en R: reducir la incertidumbre en l a 0.05 cm o
en d a 0.05 cm?
13. Un cable cilíndrico de radio R se alarga cuando se somete a
una fuerza de tensión F. Sea L0 la longitud inicial del cable
y L1 la longitud final. El módulo de Young para el material
está dado por
Y =
a) Estime τ y determine la incertidumbre en la estimación.
b) ¿Qué proveería una reducción más grande en la incertidumbre en τ: reducir la incertidumbre en τ0 a 0.1 MPa,
en w a 0.01 mm, o en k a 0.025 mm⫺1?
c) Un nuevo proceso algo más costoso permitiría que tanto τ0 como w sean medidos con incertidumbre despreciable. ¿Vale la pena implementar el proceso? Explique.
10. De acuerdo con la ley de Snell, el ángulo de refracción θ2
de un rayo de luz que viaja en un medio cuyo índice de refracción n está relacionado con el ángulo de incidencia θ1
de un rayo que está viajando en el vacío por medio de la
ecuación senθ1 ⫽ n senθ2. Suponga que θ1 ⫽ 0.3672 ⫾
0.005 rad y θ2 ⫽ 0.2943 ⫾ 0.004 rad. Estime n y determine la incertidumbre en la estimación.
11. Arqueólogos que estudian los métodos de almacenamiento
de carne empleados en el territorio Nunamiut, en Alaska,
han desarrollado un índice de secado de carne. Lo que sigue
F L0
π R 2 (L1 − L0 )
Suponga que F ⫽ 800 ⫾ 1 N, R ⫽ 0.75 ⫾ 0.1 mm, L0 ⫽ 25
⫾ 0.1 mm y L1 ⫽ 30 ⫾ 0.1 mm.
a) Estime Y y determine la incertidumbre en la estimación.
b) De las incertidumbres en F, R, L0 y L1, sólo una tiene
un efecto no despreciable en la incertidumbre en Y.
¿Cuál es?
14. De acuerdo con la ley del enfriamiento de Newton, el tiempo t necesario para que un objeto con una temperatura inicial T0 se enfríe a la temperatura T con una temperatura del
ambiente Ta está dada por
t=
ln(T0 − Ta ) ln(T − Ta )
−
k
k
donde k es una constante. Suponga que para cierto tipo de
recipiente, k ⫽ 0.025 min⫺1. Sea t el número de minutos ne-
3.4
Incertidumbres para funciones de varias mediciones
187
cesario para enfriar el recipiente a 50°F. Suponga que T0 ⫽
70.1 ⫾ 0.2°F y Ta ⫽ 35.7 ⫾ 0.1°F. Estime t y determine la
incertidumbre en la estimación.
20. Con referencia al ejercicio 3, suponga que P1 ⫽ 15.3 ⫾ 0.2
15. Con referencia al ejercicio 14, en un experimento para de-
21. Con referencia al ejercicio 5, suponga que p ⫽ 4.3 ⫾ 0.1
terminar el valor de k, la temperatura T al tiempo t ⫽ 10 min
se mide de T ⫽ 54.1 ⫾ 0.2°F. Suponga que T0 ⫽ 70.1 ⫾
0.2°F y Ta ⫽ 35.7 ⫾ 0.1°F. Estime k y determine la incertidumbre en la estimación.
16. El desplazamiento vertical v de una grieta infiltrada con fibra de concreto en un miembro a una tensión de corte máxima está dada por v ⫽ a ⫹ bw, donde w es el ancho de la
grieta y se estima a y b a partir de los datos como a ⫽ 2.5 ⫾
0.1 mm y b ⫽ 0.05 ⫾ 0.01. Suponga que w ⫽ 1.2 ⫾ 0.1 mm.
a) Estime v y determine la incertidumbre en la estimación.
MPa y P2 ⫽ 25.8 ⫾ 0.1 MPa. Estime P3 y determine la incertidumbre relativa en la estimación.
cm y q ⫽ 2.1 ⫾ 0.2 cm. Estime f y determine la incertidumbre relativa en la estimación.
22. Con referencia al ejercicio 6.
a) Suponga que P ⫽ 224.51 ⫾ 0.04 kPa y V ⫽ 11.237 ⫾
0.002 L. Estime T y determine la incertidumbre relativa
en la estimación.
b) Suponga que P ⫽ 224.51 ⫾ 0.04 kPa y T ⫽ 289.33 ⫾
0.02 K. Estime V y determine la incertidumbre relativa
en la estimación.
b) De las incertidumbres en w, a y b, sólo una tiene un efecto en la incertidumbre no despreciable en v. ¿Cuál es?
c) Suponga que V ⫽ 11.203 ⫾ 0.002 L y T ⫽ 289.33 ⫾
0.02 K. Estime P y determine la incertidumbre relativa
en la estimación.
17. La forma de una bacteria se puede aproximar con un cilin-
23. Con referencia al ejercicio 10, estime n y determine la
dro de radio r y altura h terminado en cada extremo con un
hemisferio. El volumen y el área superficial de la bacteria
están dados por
V = πr 2 (h + 4r/3)
S = 2πr(h + 2r)
Se sabe que la razón R con la que se absorbe una sustancia
química en la bacteria es R ⫽ c (s/V), donde c es una constante de proporcionalidad. Suponga que para cierta bacteria,
r ⫽ 0.9 ⫾ 0.1 mm y h ⫽ 1.7 ⫾ 0.1 mm.
a) ¿Los valores calculados de S y V son independientes?
Explique.
b) Suponiendo que las mediciones de r y h sean independientes, estime R y determine la incertidumbre en la estimación. Su respuesta estará en relación con c.
18. Estime U y determine la incertidumbre respectiva en la estimación, suponiendo que X ⫽ 5 ⫾ 0.2, Y ⫽ 10 ⫾ 0.5 y
√
a) U = X Y
√
b) U = 2Y/ X
c) U = X2 + Y 2
19. Con referencia al ejercicio 8 en la sección 3.2, suponga que
τ ⫽ 35.2 ⫾ 0.1 Pa, h ⫽ 12.0 ⫾ 0.3 mm y m ⫽ 1.49 Pa⋅s con
incertidumbre despreciable. Estime V y determine la incertidumbre relativa en la estimación.
incertidumbre relativa en la estimación, de las siguientes
mediciones: θ1 ⫽ 0.216 ⫾ 0.003 rad y θ2 ⫽ 0.456 ⫾
0.005 rad.
24. Con referencia al ejercicio 12, suponga que l ⫽ 10 cm ⫾
0.5% y d ⫽ 10.4 cm ⫾ 0.5%.
a) Haga una estimación de R y determine la incertidumbre
relativa en la estimación. ¿La incertidumbre relativa depende de k?
b) Suponga que ya sea l o d se puede volver a medir con
una incertidumbre relativa de 0.2%. ¿Cuál se debe volver a medir para dar una mejoría más grande en la incertidumbre relativa de la resistencia?
25. Con referencia al ejercicio 13, suponga que F ⫽ 750 ⫾ 1 N,
R ⫽ 0.65 ⫾ 0.09 mm, L0 ⫽ 23.7 ⫾ 0.2 mm y L1 ⫽ 27.7 ⫾
0.2 mm. Estime Y y determine la incertidumbre relativa en
la estimación.
26. Con referencia al ejercicio 14, suponga que T0 ⫽ 73.1 ⫾
0.1°F, Ta ⫽ 37.5 ⫾ 0.2°F, k ⫽ 0.032 min⫺1 con incertidumbre despreciable y T ⫽ 50°F exactamente. Estime t y determine la incertidumbre relativa en la estimación.
27. Con referencia al ejercicio 17, suponga que para cierta bacteria r ⫽ 0.8 ⫾ 0.1 mm y h ⫽ 1.9 ⫾ 0.1 mm.
a) Estime S y determine la incertidumbre relativa en la estimación.
188
CAPÍTULO 3
Propagación de errores
b) Estime V y determine la incertidumbre relativa en la estimación.
c) Estime R y determine la incertidumbre relativa en la estimación.
d) ¿La incertidumbre relativa en R depende de c?
28. Sean X y Y mediciones independientes y sean c, n y m constantes. Demuestre que la incertidumbre relativa en U ⫽
XnYm es
σU
=
U
n
σX
X
2
+ m
σY
Y
2
Ejercicios adicionales del capítulo 3
1. Suponga que X, Y y Z son mediciones independientes con X
⫽ 25 ⫾ 1, Y ⫽ 5 ⫾ 0.3 y Z ⫽ 3.5 ⫾ 0.2. Determine las incertidumbres en cada una de las cantidades siguientes:
a) X + Y Z
b) X/(Y − Z)
√
c) X Y + eZ
d ) X ln(Y + Z)
2
2. Suponga que X, Y y Z son mediciones independientes y que
la incertidumbre relativa en X es 5%, en Y es 10% y en Z es
15%. Determine la incertidumbre relativa en cada una de las
cantidades siguientes:
a) XY/Z
b) X3/2 (Y Z)1/3
√
c) X3 Z/Y
3. Un artículo se forma colocando dos componentes uno tras
otro. La longitud de cada componente será medido.
a) Si la incertidumbre en la medición de la longitud de cada componente es 0.1 mm, ¿cuál es la incertidumbre en
la longitud combinada de los dos componentes?
b) Si se desea estimar la longitud del artículo con una incertidumbre de 0.05 mm, ¿cuál debe ser la incertidumbre en la medición de cada componente? Suponga que
las incertidumbres en las dos mediciones son iguales.
4. Para algunas mutaciones genéticas, se piensa que la frecuencia del gen mutante en los hombres aumenta linealmente con la edad. Si m1 es la frecuencia a la edad t1 y m2
es la frecuencia a la edad t2, entonces la razón anual de aumento se estima con r ⫽ (m2 ⫺ m1)/(t2 ⫺ t1). En un análisis
de reacciones en la cadena de la polimerasa, la frecuencia en
hombres de 20 años se calculó de 17.7 ⫾ 1.7 por mg de ADN
y la frecuencia en hombres de 40 años se calculó de 35.9 ⫾
5.8 por mg de ADN. Suponga que la edad se mide con incertidumbre despreciable.
a) Estime la razón anual del aumento y determine la incertidumbre en la estimación.
b) Determine la incertidumbre relativa en la estimación de
la razón del aumento.
5. La ecuación de Darcy-Weisbach establece que la potencia
de la capacidad de generación en un sistema hidroeléctrico
que se pierde debido a la pérdida de carga está dada por
P ⫽ ηγQH, donde η es la eficiencia de la turbina, γ la gravedad específica del agua, Q la razón de flujo y H la pérdida de carga. Suponga que η ⫽ 0.85 ⫾ 0.02, H ⫽ 3.71 ⫾
0.10 m, Q ⫽ 60 ⫾ 1 m3/s y γ ⫽ 9 800 N/m3 con incertidumbre despreciable.
a) Estime la pérdida de potencia (las unidades serán watts)
y determine la incertidumbre en la estimación.
b) Determine la incertidumbre relativa en la estimación en
la pérdida de potencia.
c) ¿Qué proveería una reducción más grande en la incertidumbre en P: reducir la incertidumbre en η a 0.01, en H
a 0.05 o en Q a 0.5?
6. Sean A y B dos variantes (alelos) del ADN en cierta ubicación en el genoma. Sea p la proporción de alelos en una población que son del tipo A y q del tipo B. El principio de
equilibrio Hardy-Weinberg establece que la proporción PAB
de organismos que son del tipo AB es igual a pq. En una visión general de población de una especie especial, la proporción de alelos de tipo A se estima de 0.360 ⫾ 0.048 y la
del tipo B se estima independientemente de 0.250 ⫾ 0.043.
a) Estime la proporción de organismos que son de tipo AB
y determine la incertidumbre en la estimación.
b) Determine la incertidumbre relativa en la proporción.
c) ¿Qué proveería una reducción más grande en la incertidumbre en la proporción: reducir la incertidumbre en la
proporción del tipo A a 0.02 o del tipo B a 0.02?
Ejercicios adicionales del capítulo 3
7. La capacidad calorífica de un calorímetro se sabe que es de
189
a) Estime la masa molar del gas desconocido y determine
la incertidumbre en la estimación.
4 kJ/°C, con incertidumbre despreciable. El número de calorías alimentarias (kilocalorías) por gramo de una sustancia está dado por C ⫽ cH(ΔT)/m, donde C es el número de
calorías alimentarias, H la capacidad calorífica del calorímetro, ΔT el aumento en la temperatura en °C causado por
quemar la sustancia en el calorímetro, m la masa de la sustancia en gramos y c ⫽ 0.2390 cal/kJ es el factor de conversión de kilo joules a calorías alimentarias. Una cantidad de
mayonesa con masa 0.40 ⫾ 0.01 g es quemada en un calorímetro. El aumento de la temperatura es 2.75 ⫾ 0.02°C.
11. Un artículo laminado está hecho de seis capas. Las dos ex-
a) Estime el número de calorías alimentarias por gramo de
mayonesa y determine la incertidumbre en la estimación.
12. El artículo “Effect of Varying Solids Concentration and Or-
b) Determine la incertidumbre relativa en el número estimado de calorías alimentarias.
c) ¿Qué proveería una reducción más grande en la incertidumbre en C: reducir la incertidumbre en la masa a
0.005 g o en ΔT a 0.01°C?
8. Se hicieron 22 mediciones independientes de la dureza de
una soldadura, utilizando la balanza A de Rockwell. El promedio fue de 65.52 y la desviación estándar de 0.63.
a) Estime la dureza de esta soldadura y determine la incertidumbre en la estimación.
b) En una sola medición hecha de la dureza de otra soldadura del mismo metal base, la medición es de 61.3.
¿Cuál es la incertidumbre en esta medición?
9. El artículo “Insights into Present-Day Crustal Motion in the
Central Mediterranean Area from GPS Surveys” (M. Anzidei, P. Baldi y colaboradores, en Geophysical Journal International, 2001:98-100) informa que los componentes de la
velocidad de la corteza terrestre en Zimmerwald, Suiza, son
22.10 ⫾ 0.34 mm/año en dirección norte y 14.3 ⫾ 0.32
mm/año en dirección este.
a) Estime la velocidad de la corteza terrestre y determine la
incertidumbre en la estimación.
b) Utilizando la respuesta del inciso (a), estime el número
de años que le tomará a la corteza desplazarse 100 mm
y determine la incertidumbre en la estimación.
10. Si dos gases tienen masas molares M1 y M2, la ley de Graham establece que la razón R de sus tasas de efusión a tra√
vés de una pequeña abertura está dada por R = M1 /M2 .
La tasa de efusión de un gas desconocido que pasa a través
de una pequeña abertura se midió de 1.66 ⫾ 0.03 veces más
grande que la tasa de efusión del dióxido de carbono. La
masa molar de éste se puede tomar igual a 44 g/mol con incertidumbre despreciable.
b) Determine la incertidumbre relativa en la estimación de
la masa molar.
teriores tienen un espesor de 1.25 ⫾ 0.10 mm y las cuatro
interiores tienen un espesor de 0.80 ⫾ 0.05 mm. Suponga
que los espesores de las capas son independientes. Estime
el espesor del artículo y determine la incertidumbre en la estimación.
ganic Loading on the Performance of Temperature Phased
Anaerobic Digestion Process” (S. Vanderburgh y T. Ellis, en
Water Environment Research, 2002:142-148) analiza experimentos para determinar el efecto de la concentración de sólidos en el desarrollo de los métodos de tratamiento para lodos
de agua residuales. En el primer experimento, la concentración de sólidos (en g/L) fue 43.94 ⫾ 1.18. En el segundo,
que era independiente del primero, la concentración era
48.66 ⫾ 1.76. Estime la diferencia en la concentración entre dos experimentos y determine la incertidumbre en la estimación.
13. En el artículo “Measurements of the Thermal Conductivity
and Thermal Diffusivity of Polymer Melts with the ShortHot-Wire Method” (X. Zhang, W. Hendro y colaboradores,
en International Journal of Thermophysics, 2002:10771090), la difusión térmica de un líquido medido por el método transitorio del alambre corto caliente está dado por
λ=
V IA
π la
donde λ es la difusión térmica; V y I el voltaje y la corriente aplicada al alambre caliente, respectivamente; l la longitud del alambre; y A y a las cantidades que implican la
temperatura, cuyos valores se estiman por separado. En este artículo, las incertidumbres relativas de estas cantidades
están dadas de la siguiente manera: V, 0.01%; I, 0.01%; I,
1%; A, 0.1%; a, 1%.
a) Encuentre la incertidumbre relativa en λ.
b) ¿Qué reduciría más la incertidumbre relativa: disminuir
la incertidumbre relativa en l a 0.5 % o reducir las incertidumbres relativas en V, I, y A para cada una a 0?
14. Un cable está formado por varios alambres paralelos. La
fuerza del cable se puede estimar de las intensidades de los
alambres por separado por cualesquiera de los dos métodos.
En el método del cable dúctil, su fuerza se estima como la
suma de las intensidades de los alambres. En el método de
190
CAPÍTULO 3
Propagación de errores
cable quebradizo, su fuerza se estima como la fuerza del
alambre más débil multiplicada por el número de alambres.
Un cable especial está compuesto de 12 alambres. Cuatro
de ellos tienen una fuerza de 6 000 ⫾ 20 lb, cuatro más de
5 700 ⫾ 30 lb y otros cuatro de 6 200 ⫾ 40 lb.
a) Estime la fuerza del cable y determine la incertidumbre
en la estimación, utilizando el método de cable dúctil.
b) Estime la fuerza del cable y determine la incertidumbre
en la estimación, utilizando el método de cable quebradizo.
15. Con referencia al ejercicio 14, un cable está compuesto de
16 alambres. La fuerza de cada uno es 5 000 ⫾ 20 lb.
a) ¿La fuerza estimada del cable será la misma con el método de cable dúctil como con el método de cable quebradizo?
b) ¿La incertidumbre en la fuerza estimada del cable será la
misma con el método de cable dúctil como con el método de cable quebradizo? Explique por qué sí o por qué no.
16. La media de la producción del proceso A se estima de 80 ⫾
5, donde las unidades son el porcentaje de un máximo teórico. La media de la producción del proceso B se estima de
90 ⫾ 3. El aumento relativo obtenido del proceso B se estima de (90 ⫺ 80)/80 ⫽ 0.125. Determine la incertidumbre
en la estimación.
17. La razón de flujo del agua por un tubo cilíndrico está dado
por Q ⫽ πr2v, donde r es el radio del tubo y v es la velocidad de flujo.
a) Suponga que r ⫽ 3.00 ⫾ 0.03 y v ⫽ 4 ⫾ 0.2 m/s. Estime Q y determine la incertidumbre en la estimación.
b) Suponga que r ⫽ 4.00 ⫾ 0.04 m y v ⫽ 2 ⫾ 0.1 m/s. Estime Q y determine la incertidumbre en la estimación.
c) Si r y v no se han medido, pero se sabe que la incertidumbre relativa en r es 1% y que la incertidumbre relativa en v es 5%, ¿es posible calcular la incertidumbre
relativa en Q? Si es así, calcule la incertidumbre relativa.
Si no, explique qué información adicional se necesita.
18. La conversión del ciclobutano (C4H8) a etileno (C2H4) es
una reacción de primer orden. Esto significa que la concentración de ciclobutano al tiempo t está dada por ln C ⫽ ln C0
⫺ kt, donde C es la concentración al tiempo t, C0 es la concentración inicial, t es el tiempo desde que la reacción empezó y k es la razón constante. Suponga que C0 ⫽ 0.2 mol/L
con incertidumbre despreciable. Después de 300 segundos
a temperatura constante, la concentración se mide de C ⫽
0.174 ⫾ 0.005 mol/L. Suponga que el tiempo se puede medir con incertidumbre despreciable.
a) Estime la razón constante k y determine la incertidumbre en la estimación. Las unidades de k serán s⫺1.
b) Determine la incertidumbre relativa en k.
c) La vida media t1/2 de la reacción es el tiempo que se necesita para que la concentración se reduzca a la mitad de
su valor inicial. La vida media está relacionada con la
razón constante por t1/2 ⫽ (ln 2)/k. Utilizando el resultado que encontró en el inciso (a), determine la incertidumbre en la vida media.
d ) Determine la incertidumbre en la vida media.
19. La descomposición del dióxido de nitrógeno (NO2) en mo-
nóxido de nitrógeno (NO) y oxígeno es una reacción de segundo orden. Esto significa que la concentración C de NO2
al tiempo t está dada por 1/C ⫽ kt ⫹ 1/C0, dónde C0 es la
concentración inicial y k es la tasa constante. Suponga que
se sabe que la concentración inicial es exactamente de 0.03
mol/L. Suponga que el tiempo se puede medir con incertidumbre despreciable.
a) Después de 40 s, la concentración C se mide de 0.0023
⫾ 2.0 × 10⫺4 mol/L. Estime la tasa constante k y determine la incertidumbre en la estimación.
b) Después de 50 s, la concentración C se mide de 0.0018
⫾ 2.0 × 10⫺4 mol/L. Estime la tasa constante k y determine la incertidumbre en la estimación.
c) Denote los estimadores de la razón constante k en los incisos a) y b) por k̂1 y k̂2, respectivamente. El promedio
( k̂1 ⫹ k̂2)/2 se usa como un estimador aproximado de k.
Determine la incertidumbre en esta estimación.
d) Determine el valor de c para que el promedio ponderado c k̂1 ⫹ (1 ⫺ c) k̂2 tenga la incertidumbre más pequeña.
20. Dos estudiantes quieren medir la aceleración a de un carro
que baja rodando por un plano inclinado. El carro arranca
desde el reposo y viaja una distancia s hacia abajo del plano. El primer estudiante estima la aceleración al medir la
velocidad instantánea v en cuanto el carro ha viajado s metros y usa la fórmula a ⫽ v2/2s. El segundo estima la aceleración midiendo el tiempo, en segundos, que le toma al
carro viajar los s metros y usa la fórmula a ⫽ 2s/t2. Suponga que s ⫽ 1 m y que tiene una incertidumbre despreciable
en s. Suponga que v ⫽ 3.2 ⫾ 0.1 m/s y que t ⫽ 0.63 ⫾ 0.01
s. Suponga que las mediciones de v y t son independientes.
a) Calcule la aceleración utilizando el método del primer
estudiante. Llame a esta estimación a1. Determine la incertidumbre a1.
Ejercicios adicionales del capítulo 3
b) Determine la aceleración utilizando el método del segundo estudiante. Llame a esta estimación a2. Determine la incertidumbre a2.
c) Encuentre el promedio ponderado de a1 y a2 que tiene la
incertidumbre más pequeña. Encuentre la incertidumbre
de este promedio ponderado.
21. Una pista tiene la forma de un cuadrado limitado con dos lados opuestos por semicírculos. La longitud de un lado del
cuadrado se mide de 181.2 ⫾ 0.1 m.
a) Determine el área del cuadrado y su incertidumbre.
b) Determine el área de uno de los semicírculos y su incertidumbre.
c) Sea S el área del cuadrado como se calculó en el inciso
a) y sea C el área de uno de los semicírculos como se
calcularon en el inciso b). El área encerrada por la pista
es A ⫽ S ⫹ 2C.
Alguien calcula la incertidumbre en A
como σA = σS2 + 4σC2 . ¿es esto correcto? Si es así,
explique por qué. Si no, calcule la incertidumbre en A
correctamente.
22. Si X es una medición no sesgada de un valor real mX y U(X)
es una función no lineal de X, entonces en la mayoría de los
casos U es un estimador sesgado del valor real U(mX). En la
mayoría de los casos se ignora el sesgo. Sin embargo, si es
importante reducir el sesgo, un estimador con corrección de
sesgo es U(X) ⫺ (1/2)(d2U/dX2)sX2 . En general el estimador
con corrección de sesgo es sesgado, pero tiene sesgo menor
que U(X).
191
Suponga que el radio de un círculo se mide de r ⫽ 3.0
⫾ 0.1 cm.
a) Estime el área A y determine la incertidumbre de la estimación, sin corrección de sesgo.
b) Calcule el estimador con corrección de sesgo de A.
c) Compare la diferencia entre el estimador con corrección
de sesgo y el estimador sin corrección de sesgo de la incertidumbre en el estimador sin corrección de sesgo.
¿Es importante la corrección por sesgo en este caso? Explique.
23. Si X1, X2, . . . , Xn son mediciones independientes no sesgadas de los valores reales m1, m2, . . . , mn y U(X1, X2, . . . , Xn)
es una función no lineal de X1, X2, . . . , Xn, entonces, en general, U(X1, X2, . . . , Xn) es un estimador sesgado del valor
real U(m1, m2, . . . , mn). Un estimador con corrección de sesgo es U(X1, X2 , . . . , Xn ) − (1/2) ni=1 (∂ 2 U/∂Xi2 )σX2 .
i
y sale a
Cuando entra aire en un compresor a presión P1 √
presión P2, la presión intermedia está dada por P3 = P1 P2 .
Suponga que P1 ⫽ 8.1 ⫾ 0.1 MPa y P2 ⫽ 15.4 ⫾ 0.2 MPa.
a) Estime P3 y determine la incertidumbre en la estimación, sin corrección de sesgo.
b) Estime P3 con corrección de sesgo.
c) Compare la diferencia entre los estimadores con y sin
corrección de sesgo con la incertidumbre en el estimador sin corrección de sesgo. ¿Es importante, en este caso, la corrección por sesgo? Explique.
Capítulo
4
Distribuciones
comúnmente usadas
Introducción
La inferencia estadística consiste en extraer una muestra de una población y analizar sus datos
con el propósito de aprender acerca de ello. Muchas veces se tiene un conocimiento superficial de la función de masa de probabilidad o de la función de densidad de probabilidad de la
población. En estos casos la función de masa o de densidad de probabilidad se aproxima mediante una de muchas familias comunes de curvas o funciones. En este capítulo se describen
algunas de estas funciones comunes y las condiciones en que es apropiado utilizar cada una.
4.1
Distribución de Bernoulli
Imagine un experimento que tenga dos resultados. Al primero se le llama “éxito” y al otro “fracaso”. La probabilidad de éxito se denota por p. Por consecuencia, la probabilidad de fracaso
es 1 ⫺ p. Lo anterior representa un ensayo de Bernoulli con probabilidad de éxito p. El más
sencillo de este tipo es el lanzamiento al aire de una moneda. Los posibles resultados son “cara” o “cruz”. Si “cara” se define como éxito, entonces p constituye esa probabilidad. En una
moneda, p ⫽ 1/2. Otro ejemplo de ese ensayo es la selección de un componente a partir de
una población de componentes, pero algunos están defectuosos. Si se define como “éxito” a uno
de éstos, entonces p significa la proporción de componentes defectuosos en la población.
Para cualquier ensayo de Bernoulli se define a la variable aleatoria X así: Si el experimento propicia “éxito”, entonces X ⫽ 1. De lo contrario, X ⫽ 0. De ahí que X sea una variable aleatoria discreta, con función de masa de probabilidad p(x) definida por
p(0) ⫽ P(X ⫽ 0) ⫽ 1 ⫺ p
p(1) ⫽ P(X ⫽ 1) ⫽ p
192
4.1
Distribución de Bernoulli
193
p(x) ⫽ 0 para cualquier valor de x diferente a 0 o 1
Se dice que la variable aleatoria X sigue una distribución de Bernoulli con parámetro p. La
notación es X ⬃ Bernoulli(p). La figura 4.1 muestra histogramas de probabilidad para las funciones de masa de probabilidad de Bernoulli(0.5) y de Bernoulli(0.8).
1
1
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0
0
1
a)
0
0
1
b)
FIGURA 4.1 a) Histograma de probabilidad de Bernoulli(0.5). b) Histograma de
probabilidad de Bernoulli(0.8).
Ejemplo
4.1
Cuando se lanza al aire una moneda hay una probabilidad de 0.5 de que caiga en “cara”. Sea
X ⫽ 1 si la moneda cae en “cara” y X ⫽ 0 si cae en “cruz”. ¿Cuál es la distribución de X?
Solución
Puesto que X ⫽ 1 cuando cae “cara”, ésta es resultado de éxito. La probabilidad de éxito,
P(X ⫽ 1), es igual a 0.5. Por tanto, X ⬃ Bernoulli(0.5).
Ejemplo
4.2
Cuando se lanza un dado hay una probabilidad de 1/6 de que salga 6. Sea X ⫽ 1 si el dado
cae seis y X ⫽ 0 en cualquier otro caso. ¿Cuál es la distribución de X?
Solución
La probabilidad de éxito es p ⫽ P(X ⫽ 1) ⫽ 1/6. Por lo que X ⬃ Bernoulli(1/6).
Ejemplo
4.3
Diez por ciento de los componentes fabricados mediante determinado proceso está defectuoso.
Se selecciona un componente aleatoriamente. Sea X ⫽ 1 si el componente está defectuoso y
X ⫽ 0 en cualquier otro caso. ¿Cuál es la distribución de X?
Solución
La probabilidad de éxito es p ⫽ P(X ⫽ 1) ⫽ 0.1. Por lo que X ⬃ Bernoulli(0.1).
194
CAPÍTULO 4
Distribuciones comúnmente usadas
Media y varianza de una variable aleatoria de Bernoulli
Es fácil calcular la media y la varianza de una variable aleatoria Bernoulli. Si X ⬃ Bernoulli(p), entonces, al usar las ecuaciones (2.29) y (2.30) (en la sección 2.4), se calcula
μX = (0)(1 − p) + (1)(p)
=p
σX2 = (0 − p)2 (1 − p) + (1 − p)2 (p)
= p(1 − p)
Resumen
Si X ⬃ Bernoulli(p), entonces
Ejemplo
4.4
mX ⫽ p
(4.1)
sX2 ⫽ p(1 ⫺ p)
(4.2)
Con referencia al ejemplo 4.3, determine mX y sX2 .
Solución
Puesto que X ⬃ Bernoulli(0.1), la probabilidad de éxito p es igual a 0.1. Al usar las ecuaciones (4.1) y (4.2), mX ⫽ 0.1 y sX2 ⫽ 0.1(1 ⫺ 0.1) ⫽ 0.09.
Ejercicios para la sección 4.1
1. Un jugador de basquetbol está a punto de tirar hacia la parte superior del tablero. La probabilidad de que anote el tiro
es de 0.55.
a) Sea X ⫽ 1, si anota el tiro, si no lo hace, X ⫽ 0. Determine la media y la varianza de X.
b) Si anota el tiro, su equipo obtiene dos puntos; si lo falla,
su equipo no recibe puntos. Sea Y el número de puntos
anotados. ¿Tiene una distribución de Bernoulli? Si es
así, encuentre la probabilidad de éxito. Si no, explique
por qué.
c) Determine la media y varianza de Y.
2. En un restaurante de comida rápida, 25% de las órdenes para beber es una bebida pequeña, 35% una mediana y 40%
una grande. Sea X ⫽ 1 si se escoge aleatoriamente una orden de una bebida pequeña y X ⫽ 0 en cualquier otro caso.
Sea Y ⫽ 1 si la orden es una bebida mediana y Y ⫽ 0 en
cualquier otro caso. Sea Z ⫽ 1 si la orden es una bebida pequeña o mediana y Z ⫽ 0 para cualquier otro caso.
a) Sea pX la probabilidad de éxito de X. Determine pX.
b) Sea pY la probabilidad de éxito de Y. Determine pY.
c) Sea pZ la probabilidad de éxito de Z. Determine pZ.
d ) ¿Es posible que X y Y sean iguales a 1?
e) ¿Es pZ ⫽ pX ⫹ pY?
f ) ¿Es Z ⫽ X ⫹ Y? Explique.
4.2
3. Cuando se aplica cierto barniz a una superficie de cerámica, 5% es la probabilidad de que se decolore, 20% de que
se agriete, y 23% de que se decolore o no se agriete, o ambas. Sea X ⫽ 1 si se produce una decoloración y X ⫽ 0 en
cualquier otro caso; Y ⫽ 1 si hay alguna grieta y Y ⫽ 0
en cualquier otro caso; Z ⫽ 1 si hay decoloración o grieta,
o ambas, y Z ⫽ 0 en cualquier otro caso.
a) Sea pX la probabilidad de éxito de X. Determine pX.
b) Sea pY la probabilidad de éxito de Y. Determine pY.
c) Sea pZ la probabilidad de éxito de Z. Determine pZ.
d ) ¿Es posible que X y Y sean igual a 1?
e) ¿Es pZ ⫽ pX ⫹ pY?
f ) ¿Es Z ⫽ X ⫹ Y? Explique.
4. Sean X y Y variables aleatorias de Bernoulli. Sea Z ⫽ X ⫹ Y.
a) Demuestre que si X y Y no pueden ser iguales a 1, entonces Z es variable aleatoria de Bernoulli.
b) Demuestre que si X y Y no pueden ser iguales a 1, entonces pZ ⫽ pX ⫹ pY.
c) Demuestre que si X y Y pueden ser iguales a 1, entonces
Z no es una variable aleatoria de Bernoulli.
5. Se lanza al aire una moneda de 1 y de 5 centavos. Sea X ⫽
1 si sale “cara” en la moneda de 1 centavo y X ⫽ 0 en cualquier otro caso. Sea Y ⫽ 1 si sale “cara” en la moneda de 5
centavos y Y ⫽ 0 en cualquier otro caso. Sea Z ⫽ 1 si sale
“cara” en ambas monedas y Z ⫽ 0 en cualquier otro caso.
4.2
La distribución binomial
195
a) Sea pX la probabilidad de éxito de X. Determine pX.
b) Sea pY la probabilidad de éxito de X. Determine pY.
c) Sea pZ la probabilidad de éxito de X. Determine pZ.
d) ¿Son X y Y independientes?
e) ¿Es pZ ⫽ pXpY?
f ) ¿Es Z ⫽ XY? Explique.
6. Se lanzan dos dados. Sea X ⫽ 1 si sale el mismo número en
ambos y X ⫽ 0 en cualquier otro caso. Sea Y ⫽ 1 si la suma es 6 y Y ⫽ 0 en cualquier otro caso. Sea Z ⫽ 1 si sale el
mismo número en los dados y ambos suman 6 (es decir, que
salga 3 en los dos dados) y Z ⫽ 0 en cualquier otro caso.
a) Sea pX la probabilidad de éxito de X. Determine pX.
b) Sea pY la probabilidad de éxito de Y. Determine pY.
c) Sea pZ la probabilidad de éxito de Z. Determine pZ.
d ) ¿Son X y Y independientes?
e) ¿Es pZ ⫽ pXpY?
f ) ¿Es Z ⫽ XY? Explique.
7. Sean X y Y variables aleatorias de Bernoulli. Sea Z ⫽ XY.
a) Demuestre que Z es una variable aleatoria de Bernoulli.
b) Demuestre que si X y Y son independientes, entonces pZ
⫽ pXpY.
La distribución binomial
Extraer un solo componente de una población y determinar si está o no defectuoso es ejemplo de un ensayo de Bernoulli. En la práctica, es posible extraer varios componentes de una
gran población y contar el número de elementos defectuosos. Esto implica realizar diversos
ensayos de Bernoulli independientes y contar el número de éxitos. El número de éxitos es una
variable aleatoria, que tiene una distribución binomial.
Ahora se presenta una descripción formal de la distribución binomial. Suponga que se
lleva a cabo una serie de n ensayos de Bernoulli, cada uno con la misma probabilidad de éxito p. Además, suponga que los ensayos son independientes; esto es, que el resultado de un ensayo no influye en los resultados de alguno de los otros ensayos. Sea la variable aleatoria X
igual al número de éxitos en n ensayos, entonces X tiene la distribución binomial con parámetros n y p. La notación es X ⬃ Bin(n, p). X es una variable aleatoria discreta y sus posibles
valores son 0, 1, . . . , n.
196
CAPÍTULO 4
Distribuciones comúnmente usadas
Resumen
Si se realiza un total de n ensayos de Bernoulli y si
Los ensayos son independientes
Cada ensayo tiene la misma probabilidad de éxito p
X es el número de éxitos en los n ensayos
entonces X tiene la distribución binomial con parámetros n y p, que se denota como
X ⬃ Bin(n, p).
Ejemplo
4.5
Se lanza al aire diez veces una moneda. Sea X el número de caras que aparecen. ¿Cuál es la
distribución de X?
Solución
Hay diez ensayos de Bernoulli independientes, cada uno con probabilidad de éxito de p ⫽ 0.5.
La variable aleatoria X es igual al número de éxitos en los diez ensayos. Por consiguiente,
X ⬃ Bin(10, 0.5).
Recuerde, de la discusión de independencia en la sección 1.1, que cuando se toma una
muestra de una población finita tangible, es posible tratar a los elementos de la muestra como independientes si es que la población es muy grande en comparación con el tamaño muestral. De lo contrario, los elementos de la muestra no serían independientes. En algunos casos
el objetivo al extraer una muestra suele ser clasificar a cada elemento de la muestra en una de
dos categorías. Por ejemplo, puede extraerse cierto número de elementos de una población y
clasificar a cada uno como defectuoso o no. En estos casos cada elemento de la muestra representa un ensayo de Bernoulli, con una categoría contada como éxito y la otra como fracaso. Cuando la población de elementos es grande comparada con el número de elementos de
la muestra, esos ensayos son independientes y, por razones prácticas, su número de éxitos tiene distribución binomial. Sin embargo, cuando el tamaño de la población no es tan grande, en
comparación con la muestra, los ensayos no son independientes y su número de éxitos no tiene distribución binomial. La regla general es que si el tamaño muestral es de 5% o menos de
la población, se puede emplear la distribución binomial.
Resumen
Suponga que una población finita contiene elementos de dos tipos, éxitos y fracasos, y
que se extrae una muestra aleatoria simple de una población. Entonces, si el tamaño
muestral no es mayor a 5% de aquélla, se puede utilizar la distribución binomial para
modelar el número de éxitos.
4.2
Ejemplo
4.6
La distribución binomial
197
Un lote contiene varios miles de componentes, de éstos 10% están defectuosos. Se extraen
siete componentes de la población. Sea X el número de componentes defectuosos en la muestra. ¿Cuál es la distribución de X?
Solución
Puesto que el tamaño muestral es pequeño en comparación con la población (es decir, menor
a 5%), su número de éxitos representa una distribución binomial. Por tanto, se modela X con
la distribución binomial Bin(7, 0.1).
Función de masa de probabilidad de una
variable aleatoria binomial
Ahora se deducirá la función de masa de probabilidad de una variable aleatoria binomial con un
ejemplo. En una moneda específica existe una probabilidad de 0.6 de que salga “cara”. Se lanza
al aire la moneda tres veces. Sea X el número de caras. Entonces X ⬃ Bin(3, 0.6). Se calculará P(X ⫽ 2).
Hay tres arreglos con dos “caras” en los tres lanzamientos de una moneda, HHT, HTH
y THH. Primero se calcula la probabilidad de HHT. Este evento constituye una secuencia de
eventos independientes: H en el primero, H en el segundo, y T en el tercer lanzamientos, respectivamente. Por separado se conoce las probabilidades de cada uno de ellos:
P(H en el primer lanzamiento) ⫽ 0.6, P(H en el segundo) ⫽ 0.6, P(T en el tercero) ⫽ 0.4
Como consecuencia de que los eventos son independientes, la probabilidad de que todos se
presenten es igual al producto de sus probabilidades (ecuación 2.20 de la sección 2.3). Por
tanto,
P(HHT) ⫽ (0.6)(0.6)(0.4) ⫽ (0.6)2(0.4)1
De forma similar, P(HTH) ⫽ (0.6)(0.4)(0.6) ⫽ (0.6)2(0.4)1 y P(THH) ⫽ (0.4)(0.6)(0.6) ⫽
(0.6)2(0.4)1. Es fácil ver que todos los diferentes arreglos de dos “caras” y una “cruz” tienen
la misma probabilidad. Ahora
P(X ⫽ 2) ⫽ P(HHT o HTH o THH)
⫽ P(HHT) ⫹ P(HTH) ⫹ P(THH)
⫽ (0.6)2(0.4)1 ⫹ (0.6)2(0.4)1 ⫹ (0.6)2(0.4)1
⫽ 3(0.6)2(0.4)1
Al examinar este resultado se observa que el número 3 representa el número de arreglos de
dos éxitos (“cara”) y un fracaso (“cruz”), 0.6 es la probabilidad de éxito p, el exponente 2 es
el número de éxitos, 0.4 es la probabilidad de fracaso 1 ⫺ p y el exponente 1 es el número de
fracasos.
Ahora se puede generalizar este resultado para generar una fórmula de la probabilidad
de x éxitos en n ensayos de Bernoulli independientes con probabilidad de éxito p, en términos de x, n y p. En otras palabras, es posible calcular P(X ⫽ x) donde X ⬃ Bin(n, p). Se puede ver que
198
Distribuciones comúnmente usadas
CAPÍTULO 4
P(X ⫽ x) ⫽ (número de arreglos de x éxitos en n ensayos) ⋅ px(1 ⫺ p)n ⫺ x
(4.3)
Ahora todo lo que se necesita hacer es una expresión del número de arreglos de x éxitos en n
ensayos. Para describir este número, se necesita la notación factorial. Para cualquier entero
positivo n, la cantidad n! (que se lee como “n factorial”) es el número
(n)(n ⫺ 1)(n ⫺ 2) . . . (3)(2)(1)
Asimismo, se define 0! ⫽ 1. El número de arreglos de x éxitos en n ensayos es n!/x!(n ⫺ x)!
(En la sección 2.2 se presentó una deducción de este resultado.) Ahora se puede definir la función de masa de probabilidad para una variable aleatoria binomial.
Si X ⬃ Bin(n, p), la función de masa de probabilidad de X es
⎧
n!
⎪
⎨
p x (1 − p)n−x x = 0, 1, . . . , n
x!(n
− x)!
p(x) = P (X = x) =
⎪
⎩
0
de otro modo
(4.4)
La figura 4.2 muestra los histogramas de probabilidad para las funciones de masa de probabilidad Bin(10, 0.4) y Bin(20, 0.1).
0.3
0.3
0.25
0.25
0.2
0.2
0.15
0.15
0.1
0.1
0.05
0.05
0
0
1
2
3
4
5
a)
6
7
8
9
10
0
0
2
4
6
8
10 12 14 16
18
20
b)
FIGURA 4.2 a) Histograma de probabilidad Bin(10, 0.4). b) Histograma de probabilidad Bin(20, 0.1).
Ejemplo
4.7
Determine la función de masa de probabilidad de la variable aleatoria X si X ⬃ Bin(10, 0.4).
Determine P(X ⫽ 5).
4.2
La distribución binomial
199
Solución
Se emplea la ecuación (4.4) con n ⫽ 10 y p ⫽ 0.4. La función de masa de probabilidad es
⎧
10!
⎪
⎨
(0.4)x (0.6)10−x
x = 0, 1, . . . , 10
x!(10
−
x)!
p(x) =
⎪
⎩
0
de otro modo
P (X = 5) = p(5) =
10!
(0.4)5 (0.6)10−5
5!(10 − 5)!
= 0.2007
Ejemplo
4.8
Se lanza al aire ocho veces un dado. Determine la probabilidad de que no salgan más de dos
números seis.
Solución
Cada lanzamiento del dado es un experimento Bernoulli con una probabilidad de éxito de 1/6.
Sea X el número de seises en los ocho lanzamientos. Entonces X ⬃ Bin(8, 1/6). Se necesita
determinar a P(X ⱕ 2). Con el uso de la función de masa de probabilidad,
P (X ≤ 2) = P (X = 0 o X = 1 o X = 2)
= P (X = 0) + P (X = 1) + P (X = 2)
0 8−0
1 8−1
8!
1
5
1
5
8!
=
+
0!(8 − 0)! 6
6
1!(8 − 1)! 6
6
2 8−2
1
5
8!
+
2!(8 − 2)! 6
6
= 0.2326 + 0.3721 + 0.2605
= 0.8652
La tabla A.1 (en el Apéndice A) presenta probabilidades binomiales de la forma P(X ⱕ x)
para n ⱕ 20 y valores seleccionados de p. Los ejemplos 4.9 y 4.10 muestran el uso de esta
tabla.
Ejemplo
4.9
Una gran compañía industrial hace un descuento en cualquier factura que se pague en un lapso de 30 días. De todas las facturas, 10% recibió el descuento. En una auditoría de la compañía se seleccionó aleatoriamente 12 facturas. ¿Cuál es la probabilidad de que menos de cuatro
de las 12 facturas de la muestra tengan descuento?
Solución
Sea X el número de facturas en la muestra que recibe descuento. Entonces X ⬃ Bin(12, 0.1).
La probabilidad de que menos de cuatro facturas tengan descuento es P(X ⱕ 3). Se consulta
la tabla A.1 con n ⫽ 12, p ⫽ 0.1 y x ⫽ 3. Se encuentra que P(X ⱕ 3) ⫽ 0.974.
200
CAPÍTULO 4
Distribuciones comúnmente usadas
Algunas veces, la mejor manera para calcular la probabilidad de un evento consiste en
estimar la probabilidad de que no ocurra el evento, y después restársela a 1. El ejemplo 4.10
proporciona ejemplo de esto último.
Ejemplo
4.10
Con referencia al ejemplo 4.9, ¿cuál es la probabilidad de que más de una de las 12 facturas
de la muestra tenga descuento?
Solución
Sea X el número de facturas en la muestra que recibe descuento. Se desea calcular la probabilidad P(X ⬎ 1). La tabla A.1 presenta las probabilidades en la forma P(X ⱕ x). Por consecuencia, se observa que P(X ⬎ 1) ⫽ 1 ⫺ P(X ⱕ 1). Consultando la tabla con n ⫽ 12, p ⫽
0.1, x ⫽ 1, se encontró que P(X ⱕ 1) ⫽ 0.659. Por tanto, P(X ⬎ 1) ⫽ 1 ⫺ 0.659 ⫽ 0.341.
Una variable aleatoria binomial constituye la suma
de variables aleatorias de Bernoulli
Suponga que se realiza n ensayos de Bernoulli independientes, cada uno con probabilidad de
éxito p. Sean Y1, . . . , Yn definidas de la siguiente manera: Yi ⫽ 1 si el i-ésimo experimento
da como resultado un éxito, y Yi ⫽ 0, de otro modo. Entonces cada una de las variables aleatorias Yi sigue una distribución Bernoulli(p). Ahora, sea que X represente el número de éxitos
en los n ensayos. Entonces, X ⬃ Bin(n, p). Puesto que cada Yi es 0 o 1, la suma Y1 ⫹ . . . ⫹
Yn es igual al número de los Yi que tienen el valor 1, que es el número de éxitos en los n ensayos. Por tanto, X ⫽ Y1 ⫹ . . . ⫹ Yn. Esto último demuestra que una variable aleatoria binomial se puede expresar como la suma de variables aleatorias de Bernoulli. Dicho en otro
modo, extraer un solo valor de una población Bin(n, p) equivale a extraer una muestra de tamaño n de una población Bernoulli(p), y luego sumar los valores de la muestra.
La media y varianza de una variable aleatoria binomial
Es fácil calcular la media de una variable aleatoria binomial. Por ejemplo, si se lanza al aire
una moneda durante diez veces, se espera ver, en promedio, cinco veces “cara”. El número
cinco proviene de la multiplicación de la probabilidad de éxito (0.5) por el número de experimentos (10). Este método generalmente funciona. Si se realizara n ensayos de Bernoulli, cada uno con una probabilidad de éxito p, el número promedio de éxitos es np. Por consiguiente,
si X ⬃ Bin(n, p), entonces mX ⫽ np. Se puede comprobar esta intuición cuando se observa que
X es la suma de n variables de Bernoulli, cada una con media p. Por tanto, la media de X es la
suma de las medias de variables aleatorias de Bernoulli que la componen, que es igual a np.
Se puede calcular a sX2 al observar que X es la suma de variables aleatorias independientes de Bernoulli y recordando que la varianza de una variable aleatoria Bernoulli p(1 ⫺ p).
Por tanto, la varianza de X es la suma de las varianzas de las variables aleatorias de Bernoulli que la integran, que es igual a np(1 ⫺ p).
4.2
201
La distribución binomial
Resumen
Si X ⬃ Bin(n, p), entonces la media y la varianza de X están dadas por
mX ⫽ np
(4.5)
sX2 ⫽ np(1 ⫺ p)
(4.6)
Con el uso de la función de masa de probabilidad binomial (ecuación 4.4), se puede, en
principio, calcular la media y la varianza de una variable aleatoria binomial mediante las definiciones de la media y la varianza de una variable aleatoria discreta (ecuaciones 2.29 y 2.30
en la sección 2.4). Estas expresiones implican sumatorias que son tediosas de evaluar. Es más
sencillo considerar una variable aleatoria binomial como una suma de variables de Bernoulli
aleatorias independientes.
Uso de una proporción muestral para estimar la probabilidad de éxito
En muchos casos no se conoce la probabilidad de éxito p asociada con cierto ensayo de Bernoulli, y se desea estimar su valor. Una forma natural de esto último consiste en realizar experimentos independientes n y contar el número X de éxitos. Para estimar la probabilidad de
éxito p se calcula la proporción muestral p̂.
número de éxitos
X
—
p̂ ⫽ ——————————
número de ensayos ⫽ n
Esta notación sigue un patrón que es importante conocer. La probabilidad de éxito, que se desconoce, está representada por p. La proporción muestral, la cual se conoce, se representa por
p̂. El “sombrero” (ˆ) indica que p̂ se utiliza para estimar un valor desconocido p.
Ejemplo
4.11
Un ingeniero que supervisa el control de calidad está probando la calibración de una máquina que empaca helado en contenedores. En una muestra de 20 de éstos, tres no están del todo llenos. Estime la probabilidad p de que la máquina no llene bien un contenedor.
Solución
La proporción muestral de contenedores no llenos es p̂ ⫽ 3/20 ⫽ 0.15. Se estima que la probabilidad p de que la máquina no llene bien un contenedor es también igual a 0.15.
Incertidumbre en una proporción muestral
Es importante considerar que la proporción muestral p̂ es sólo una estimación de la probabilidad de éxito p, y que, en general, no es igual a p. Si se tomara otra muestra, probablemente
el valor de p̂ sería diferente. Es decir, hay incertidumbre en p̂. Para que p̂ sea una estimación
útil, se debe calcular su sesgo y su incertidumbre. Ahora se hace esto. Sea n el tamaño muestral y X el número de éxitos, donde X ⬃ Bin(n, p).
202
CAPÍTULO 4
Distribuciones comúnmente usadas
El sesgo es la diferencia m p̂ ⫺ p. En virtud de que p̂ ⫽ X/n, se tiene, a partir de la ecuación (2.41), (de la sección 2.5) que
μX
μp = μX/n =
n
np
=
=p
n
Debido a que m p̂ ⫽ p, p̂ no es sesgado; en otras palabras, su sesgo es 0.
La incertidumbre es la√desviación estándar s p̂. A partir de la ecuación (4.6), la desviación estándar de X es σX = np(1 − p). Puesto que p̂ ⫽ X/n, se tiene a partir de la ecuación
(2.43) (de la sección 2.5) que
σX
σp = σX/n =
n
√
np(1 − p)
p(1 − p)
=
=
n
n
En la práctica, cuando se calcula la incertidumbre de p̂, no se conoce la probabilidad de éxito p, por lo que se le aproxima con p̂.
Resumen
Si X ⬃ Bin(n, p), entonces la proporción muestral p̂ ⫽ X/n se emplea para estimar la
probabilidad de éxito p.
p̂ no sesgado.
La incertidumbre en p̂ es
σp =
p(1 − p)
n
(4.7)
En la práctica, cuando se calcula s p̂ se sustituye p̂ por p, dado que no se conoce p.
Ejemplo
4.12
Un comisionado de seguridad en una gran ciudad quiere estimar la proporción de edificios en
la ciudad que viola los códigos de incendios. Se elige una muestra aleatoria de 40 edificios
para inspeccionarlos, y se descubre que cuatro no cumplen el código de incendios. Estime la
proporción de edificios en la ciudad que violan éste y encuentre la incertidumbre en la estimación.
Solución
Sea p la proporción de edificios en la ciudad que no cumple el código de incendios. El tamaño muestral (número de ensayos) es n ⫽ 40. El número de edificios con violaciones (éxitos)
es X ⫽ 4. Se estima p con la proporción muestral p̂.
p
=
X
4
=
= 0.10
n
40
4.2
La distribución binomial
203
Al usar la ecuación (4.7), la incertidumbre en p̂ es
p(1 − p)
n
σp =
Al sustituir p̂ ⫽ 0.1 por p y 40 por n, se obtiene
σp =
(0.10)(0.90)
40
= 0.047
En el ejemplo 4.12 se obtuvo que la incertidumbre en la proporción muestral era muy
grande. Se puede reducir aquélla al aumentar el tamaño de esta última. El ejemplo 4.13 muestra cómo calcular el tamaño necesario para reducir la incertidumbre a una cantidad específica.
Ejemplo
4.13
En el ejemplo 4.12, ¿cuántos edificios adicionales deben inspeccionarse para que la incertidumbre de la proporción muestral de los edificios que no cumple el código sea sólo de 0.02?
Solución
√
Se necesita determinar el valor de n de tal forma que σp = p(1 − p)/n = 0.02. Al aproximar p con p̂ ⫽ 0.1, se obtiene
σp =
(0.1)(0.9)
= 0.02
n
Al despejar n se tiene que n ⫽ 225. Ya se ha señalado 40 edificios, por lo que ahora se necesita indicar 185 más.
Algunas veces se desea estimar el valor de una función f(p) de una probabilidad de éxito p. En estos casos se estima f(p) con f( p̂), donde p̂ es la proporción muestral. Posteriormente se puede emplear el método de propagación de errores (ecuación 3.10 de la sección 3.3)
para encontrar la incertidumbre en f( p̂).
Ejemplo
4.14
En una muestra de 100 llantas nuevas de automóvil, se descubrió que siete de éstas tienen imperfecciones en el dibujo. Si se seleccionan aleatoriamente cuatro llantas nuevas y se instalan
en un automóvil, estime la probabilidad de que ninguna de ellas tenga alguna imperfección,
y determine la incertidumbre en la estimación.
Solución
Sea p la probabilidad de que una llanta no tenga imperfecciones. Se inicia al calcular la proporción muestral p̂ y determinando su incertidumbre. √
La proporción muestral es p̂ ⫽ 93/100
⫽ 0.93. La incertidumbre en p̂ está dada por σp = p(1 − p)/n. Se sustituye n ⫽ 100 y
p̂ ⫽ 0.93 en p para obtener
204
CAPÍTULO 4
Distribuciones comúnmente usadas
σp =
(0.93)(0.07)
= 0.0255
100
Ahora la probabilidad de que ninguna de las cuatro llantas tenga alguna imperfección es p4.
Lo anterior se estima con p̂4 ⫽ 0.934 ⫽ 0.7481. Se emplea la ecuación (3.10) para calcular la
incertidumbre en p̂4:
σp4 ≈
d 4
p
σp
d
p
= 4
p3 σp
= 4(0.93)3 (0.0255)
= 0.082
Ejercicios para la sección 4.2
1. Sea X ⬃ Bin(8, 0.4). Determine
a) P(X ⫽ 2)
b) P(X ⫽ 4)
c) P(X ⬍ 2)
d ) P(X ⬎ 6)
e) mX
f ) sX2
2. Se toma una muestra de cinco elementos de una población
grande en la cual 10% de los elementos está defectuoso.
a) Determine la probabilidad de que ninguno de los elementos de la muestra esté defectuoso.
b) Determine la probabilidad de que sólo uno de ellos tenga defectos.
c) Determine la probabilidad de que uno o más de los elementos de la muestra estén defectuosos.
d) Determine la probabilidad de que menos de dos elementos de la muestra tenga defectos.
4. En un cargamento grande de llantas de automóvil, 5% tiene
cierta imperfección. Se eligen aleatoriamente cuatro llantas
para instalarlas en el automóvil.
a) ¿Cuál es la probabilidad de que ninguna de las llantas
tenga imperfección?
b) ¿Cuál es la probabilidad de que sólo una de las llantas
tenga imperfección?
c) ¿Cuál es la probabilidad de que una o más de las llantas
tenga imperfección?
5. En un patrón aleatorio de ocho bits utilizado para probar un
microcircuito, cada bit tiene la misma probabilidad de ser 0
o 1. Suponga que los valores de los bits son independientes.
a) ¿Cuál es la probabilidad de que todos los bits sean 1?
b) ¿Cuál es la probabilidad de que exactamente tres de los
bits sean 1?
c) ¿Cuál es la probabilidad de que al menos seis de los bits
sean 1?
d) ¿Cuál es la probabilidad de que al menos dos de los bits
sean 1?
3. Se lanza al aire una moneda diez veces.
a) ¿Cuál es la probabilidad de obtener exactamente tres veces “cara”?
b) Determine la media del número de caras obtenidas.
c) Determine la varianza del número de caras obtenidas.
d ) Determine la desviación estándar del número de caras
obtenidas.
6. Un ingeniero que supervisa el control de calidad, selecciona una muestra aleatoria de 100 varillas de acero de la producción del día, descubre que 92 de ellas satisfacen las
especificaciones.
a) Estime la proporción, de la producción de ese día, que
satisface las especificaciones y determine la incertidumbre en la estimación.
4.2
La distribución binomial
205
b) Estime el número de varillas que se debe seleccionar para reducir la incertidumbre a 1 por ciento.
c) Si la proporción de pernos con defecto en la muestra es
2%, ¿cuál es la probabilidad de que la compañía regrese el cargamento?
7. En una muestra aleatoria de 100 partes ordenadas al vendedor A, 12 estaban defectuosas. En una muestra aleatoria de
200 partes ordenadas al vendedor B, diez estaban defectuosas.
d ) La distribuidora decide que aceptará el cargamento sólo
si ninguno de los elementos de la muestra está defectuoso. ¿Cuál es el número mínimo de elementos que debe
seleccionar si quiere tener una probabilidad no mayor a
0.01 de aceptar el cargamento si es que 20% de los componentes del cargamento tiene defectos?
a) Estime la proporción de partes del vendedor A que están
defectuosas y determine la incertidumbre en la estimación.
b) Estime la proporción de partes del vendedor B que están
defectuosas y encuentre la incertidumbre en la estimación.
c) Estime la diferencia en las proporciones y determine la
incertidumbre en la estimación.
11. Cierto cargamento viene con la garantía de que contiene no
más de 15% de unidades defectuosas. Si la proporción de
unidades defectuosas es mayor a 15%, aquél será regresado.
Se extrae una muestra aleatoria de diez unidades. Sea X el
número de unidades defectuosas en la muestra.
8. De los elementos producidos en determinado proceso, 20%
estaba defectuoso; de ellos, se puede reparar 60 por ciento.
a) Si, de hecho, 15% de las unidades en el cargamento está defectuoso (por lo que apenas el cargamento es aceptable), ¿a qué es igual P(X ⱖ 7)?
a) Determine la probabilidad de que un elemento elegido de
forma aleatoria esté defectuoso y no se pueda reparar.
b) Con base en la respuesta del inciso (a), si 15% de las
unidades del cargamento está defectuoso, ¿siete piezas
defectuosas en una muestra de diez es un número inusualmente grande?
b) Determine la probabilidad de que sólo dos de los 20 elementos seleccionados aleatoriamente esté defectuoso y
no se pueda reparar.
9. De los pernos manufacturados por cierta aplicación, 90%
satisface la longitud especificada y se puede utilizar inmediatamente, 6% está demasiado largo y sólo se puede usar
después de que sea cortado, y 4% está demasiado corto y
debe desecharse.
a) Determine la probabilidad de que un perno seleccionado aleatoriamente se pueda utilizar (inmediatamente o
después de ser cortados).
b) Determine la probabilidad de que menos de nueve de
una muestra de diez pernos se puedan utilizar (inmediatamente o después de ser cortados).
10. Una distribuidora recibe importante cargamento de componentes. A la empresa le gustaría aceptar el cargamento si
10% o menos de los componentes está defectuoso y rechazarlo si más de 10% presenta defecto. Se opta por seleccionar diez de éstos, y regresar el envío si más de uno tiene
defectos.
a) Si la proporción de pernos defectuosos en la muestra es
de hecho 10%, ¿cuál es la probabilidad de que la distribuidora regrese el cargamento?
b) Si la proporción de pernos defectuosos en la muestra es
20%, ¿cuál es la probabilidad de que la empresa regrese
el cargamento?
c) Si se descubre que siete de las diez unidades de la muestra está defectuoso, ¿esto sería una evidencia de que se
debe regresar el cargamento? Explique.
d) Si, de hecho, 15% de las unidades en el cargamento está defectuoso, ¿a qué es igual P(X ⱖ 2)?
e) Con base en la respuesta al inciso (b), si 15% de las unidades del cargamento está defectuoso, ¿dos muestras
defectuosas entre diez sería un número inusualmente
grande?
f ) Si se descubre que dos de las diez unidades de la muestra están defectuosas, ¿ello sería una evidencia de que se
debe regresar el cargamento? Explique.
12. Una compañía aseguradora ofrece descuentos a los propietarios de casas que deseen instalar detectores de humo en
sus hogares. Un representante de la empresa afirma que
80% o más de los asegurados tiene detectores de humo. Usted toma una muestra aleatoria de ocho asegurados. Sea X el
número de éstos en la muestra que tiene detectores de humo.
a) Si exactamente 80% de los asegurados tiene detectores
de humo (por lo que la afirmación del representante es
verdadera, pero apenas), ¿a qué es igual P(X ⱕ 1)?
b) Con base en la respuesta al inciso (a), si 80% de los asegurados tiene detectores de humo, ¿uno de aquéllos en
una muestra de ocho sería un número inusualmente pequeño?
206
CAPÍTULO 4
Distribuciones comúnmente usadas
c) Si se descubre que uno de los ocho asegurados de la
muestra tenía un detector de humo, ¿esto sería una evidencia de que la afirmación es falsa? Explique.
d) Si exactamente 80% de los asegurados tiene detectores
de humo, ¿a qué es igual P(X ⱕ 6)?
e) Con base en la respuesta al inciso (d), si 80% de los asegurados tiene detectores de humo, ¿seis de aquéllos en
una muestra de ocho sería un número inusualmente pequeño?
f ) Si usted descubre que seis de los ocho asegurados de la
muestra tenían detectores de humo, ¿esto sería una evidencia de que la afirmación es falsa? Explique.
13. Unas figurillas de porcelana se venden a 10 dólares si no
tienen imperfección, y a 3 dólares si la presentan. Entre las
figurillas de cierta compañía, 90% no tiene imperfecciones
y 10% sí tiene. En una muestra de 100 figurillas ya vendidas, sea Y el ingreso ganado por su venta y X el número de
éstas que no presenta imperfecciones.
a) Exprese Y como una función de X.
b) Determine mY.
c) Determine sY.
14. El diseño de un sistema requiere la instalación de dos componentes idénticos. El sistema funcionará si al menos uno
4.3
de los componentes lo hace. Un diseño alterno necesita cuatro de estos componentes, y el sistema funcionará si al menos
dos de los cuatro componentes funcionan. Si la probabilidad
de que el componente funcione es de 0.9, y si los componentes funcionan de forma independiente, ¿qué diseño tiene la
mayor probabilidad de funcionar?
16. Con referencia al ejemplo 4.14 estime la probabilidad de
que sólo una de las cuatro llantas tenga alguna imperfección, y determine la incertidumbre en la estimación.
17. Si p es la probabilidad de éxito, a la cantidad p/(1 ⫺ p) se
le llama oportunidad. Ésta se estima en la investigación médica. El artículo “A Study of Twelve Southern California
Communities with Differing Levels and Types of Air Pollution” (J. Peters, E. Avol y colaboradores, en The American
Journal of Respiratory and Critical Care Medicine, 1999:
760-767) presenta una evaluación de la salud respiratoria de
niños del sur de California. Suponga que a 88 infantes, en
una muestra de 612 estudiados, se les diagnosticó bronquitis durante los últimos 12 meses.
a) Estime la proporción p de niños a los que se les ha diagnosticado bronquitis y encuentre la incertidumbre en la
estimación.
b) Estime la oportunidad y determine la incertidumbre en
la estimación.
La distribución de Poisson
La distribución de Poisson se utiliza con frecuencia en el trabajo científico. Una manera de
considerarla es como una aproximación de la distribución binomial cuando n es grande y p es
pequeña. Esto último se muestra con un ejemplo.
Una masa contiene 10 000 átomos de una sustancia radiactiva. La probabilidad de que
cierto átomo decaiga en un periodo de un minuto es de 0.0002. Sea X el número de átomos
que decae en un minuto. Se puede considerar a cada átomo como un ensayo de Bernoulli, en
los que el éxito ocurre si el átomo decae. Por tanto, X es el número de éxitos en 10 000 ensayos
de Bernoulli independientes, cada uno con probabilidad de éxito de 0.0002, de tal forma que la
distribución de X es Bin(10 000, 0.0002). La media de X es mX ⫽ (10 000)(0.0002) ⫽ 2.
Otra masa contiene 5 000 átomos y cada uno de éstos tiene probabilidad de 0.0004 de
decaer en un intervalo de un minuto. Sea Y el número de átomos de esta masa que decae en
un minuto. Siguiendo la lógica del párrafo anterior, Y ⬃ Bin(5 000, 0.0004) y mY ⫽ (5 000)
(0.0004) ⫽ 2.
En cada uno de estos casos, el número de ensayos n y la probabilidad de éxito p son diferentes, pero el número promedio de éxitos, que es igual al producto np, es el mismo. Ahora suponga que se quiere calcular la probabilidad de que sólo tres átomos decaigan en un
4.3
La distribución de Poisson
207
minuto para cada una de estas masas. Mediante la función de masa de probabilidad binomial,
se calcula de la siguiente manera:
P (X = 3) =
10 000!
(0.0002)3 (0.9998)9997 = 0.180465091
3! 9 997!
P (Y = 3) =
5 000!
(0.0004)3 (0.9996)4997 = 0.180483143.
3! 4 997!
Estas probabilidades son casi iguales entre sí. Aunque a partir de la fórmula de la función de masa de probabilidad binomial esto no es obvio, cuando n es grande y p es pequeña
la función de masa depende por completo de la media np, y muy pocos de los valores específicos de n y p. Por consiguiente, se puede aproximar la función de masa binomial con una
cantidad que dependa sólo del producto np. Específicamente, si n es grande y p es pequeña,
y λ ⫽ np, se puede demostrar mediante métodos avanzados que para todas las x,
λx
n!
p x (1 − p)n−x ≈ e−λ
x!(n − x)!
x!
(4.8)
Esto conduce a la definición de una nueva función de probabilidad, denominada función de
masa de probabilidad de Poisson, que se define mediante
p(x) = P (X = x) =
e−λ
0
λx
x!
si x es un entero no negativo
de otro modo
(4.9)
Si X es una variable aleatoria cuya función de masa de probabilidad está dada por la
ecuación (4.9), entonces X sigue una distribución de Poisson con parámetro λ. La notación
es X ⬃ Poisson(λ).
Ejemplo
4.15
Si X ⬃ Poisson(3), calcule P(X ⫽ 2), P(X ⫽ 10), P(X ⫽ 0), P(X ⫽ ⫺ 1) y P(X ⫽ 0.5).
Solución
Cuando se usa la función de masa de probabilidad (4.9), con λ ⫽ 3, se obtiene
32
= 0.2240
2!
310
P (X = 10) = e−3
= 0.0008
10!
30
P (X = 0) = e−3 = 0.0498
0!
P (X = −1) = 0
debido a que ⫺1 no es un entero no negativo,
P (X = 0.5) = 0
debido a que 0.5 no es un entero no negativo
P (X = 2) = e−3
208
CAPÍTULO 4
Ejemplo
4.16
Distribuciones comúnmente usadas
Si X ⬃ Poisson(4), calcule P(X ⱕ 2) y P(X ⬎ 1).
Solución
P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2)
41
42
40
+ e−4 + e−4
0!
1!
2!
= 0.0183 + 0.0733 + 0.1465
= 0.2381
= e−4
Para encontrar P(X ⬎ 1) se escribe
P (X > 1) = P (X = 2) + P (X = 3) + · · ·
Esto último conduce a una suma infinita que es difícil de calcular. En vez de esto, se escribe
P (X > 1) = 1 − P (X ≤ 1)
= 1 − [P (X = 0) + P (X = 1)]
41
40
= 1 − e−4 + e−4
0!
1!
= 1 − (0.0183 + 0.0733)
= 0.9084
Para las masas radiactivas descritas al inicio de esta sección, se utiliza la función de masa de Poisson para aproximar a P(X ⫽ x) o P(Y ⫽ x) sustituyendo a λ ⫽ 2 en la ecuación (4.9).
La tabla 4.1 muestra que la aproximación es excelente.
TABLA 4.1 Ejemplo de una aproximación de Poisson a la función de masa de probabilidad binomial*
x
P(X = x),
X ∼ Bin (10 000, 0.0002)
P(Y = x),
Y ∼ Bin (5 000, 0.0004)
0
1
2
3
4
5
6
7
8
9
0.135308215
0.270670565
0.270697637
0.180465092
0.090223521
0.036082189
0.012023787
0.003433993
0.000858069
0.000190568
0.135281146
0.270670559
0.270724715
0.180483143
0.090223516
0.036074965
0.012017770
0.003430901
0.000856867
0.000190186
Aproximación de Poisson
Poisson (2)
0.135335283
0.270670566
0.270670566
0.180447044
0.090223522
0.036089409
0.012029803
0.003437087
0.000859272
0.000190949
* Cuando n es grande y p pequeña, la función de masa de probabilidad Bin(n, p) también se aproxima mediante la función de masa de probabilidad de Poisson (λ) (ecuación 4.9), con λ ⫽ np. Aquí X ⬃ Bin(10 000, 0.0002) y Y ⬃ Bin(5 000, 0.0004), por lo que λ ⫽ np ⫽ 2, y
la aproximación de Poisson es Poisson(2).
4.3
La distribución de Poisson
209
Resumen
Si X ⬃ Poisson(λ), entonces
X es una variable aleatoria discreta, cuyos posibles valores son enteros no negativos.
El parámetro λ es una constante positiva.
La función de masa de probabilidad de X es
p(x) = P (X = x) =
e−λ
0
λx
x!
si x es un entero no negativo
de otro modo
La función de masa de probabilidad de Poisson se aproxima mucho a la función
de masa de probabilidad binomial cuando n es grande, p es pequeña y λ ⫽ np.
Media y varianza de una variable aleatoria de Poisson
Para calcular la media y la varianza de una variable aleatoria de Poisson, se emplea la función
de masa de probabilidad junto con las definiciones dadas por las ecuaciones (2.29) y (2.30) (de
la sección 2.4). Al final de esta sección se muestran deducciones rigurosas de la media y de la
varianza con este método. Aquí se presenta un enfoque intuitivo. Si X ⬃ Poisson(λ) se puede
considerar a X como una variable aleatoria binomial con n grande, p pequeña y np ⫽ λ. Dado
que la media de una variable aleatoria binomial es np, se tiene que la media de una variable
aleatoria de Poisson es λ. La varianza de una variable aleatoria binomial es np(1 ⫺ p). Puesto
que p es muy pequeña, se puede reemplazar 1 ⫺ p con 1, y concluir que la varianza de una variable aleatoria de Poisson es np ⫽ λ. Observe que esta última es igual a su media.
Resumen
Si X ⬃ Poisson(λ), entonces la media y la varianza de X están dadas por
mX ⫽ λ
(4.10)
sX2 ⫽ λ
(4.11)
La figura 4.3 muestra histogramas de probabilidad para las funciones de masa de probabilidad de Poisson(1) y de Poisson(10).
Uno de los primeros usos industriales de la distribución Poisson se aplicó en la fabricación de cervezas. Un paso fundamental en dicho proceso es la adición de la cultura de la levadura para preparar la malta para la fermentación. Se mantiene a las células vivas de
levadura suspendidas en un medio líquido. Debido a que las células están vivas, su concentración en el medio cambia con el tiempo. Por tanto, antes de que se agregue la levadura, se
necesita calcular la concentración de células de levadura por unidad en el volumen de la suspensión, para asegurarse de que se añadió la cantidad correcta.
210
CAPÍTULO 4
Distribuciones comúnmente usadas
0.35
0.35
0.3
0.3
0.25
0.25
0.2
0.2
0.15
0.15
0.1
0.1
0.05
0.05
0
0
2
4
6
8 10 12 14 16 18 20 22 24
a)
0
0 2 4
6 8 10 12 14 16 18 20 22 24
b)
FIGURA 4.3 a) Histograma de probabilidad de Poisson(1), b) Histograma de probabilidad de Poisson(10).
Hasta principios del siglo XX, lo anterior consistía un problema para los fabricantes de
cerveza. Ellos estimaban la concentración al extraer un pequeño volumen de la suspensión y
contar las células de levadura en ésta utilizando un microscopio. Por supuesto que las estimaciones determinadas así estaban sujetas a la incertidumbre, pero nadie sabía cómo calcular ésta.
Por tanto, nadie sabía en cuánto podía diferir la concentración de la muestra de la concentración verdadera.
William Sealy Gosset, un joven de 25 años, fue contratado por la compañía cervecera
Guinness, de Dublín, Irlanda, y descubrió en 1904 que el número de células de levadura en el
volumen de la suspensión de una muestra seguía una distribución de Poisson. Entonces desarrolló métodos para calcular la incertidumbre. El descubrimiento de Gosset no sólo le permitió a Guinness hacer un producto más consistente, sino que demostró que la distribución de
Poisson puede tener aplicaciones importantes en muchas situaciones. Gosset quería publicar
su resultado, pero sus jefes consideraron que su descubrimiento era información privada y se
lo prohibieron. De todos modos Gosset lo publicó, pero para esconder este hecho a sus jefes,
utilizó el seudónimo “Estudiante”.
En el ejemplo 4.17 se seguirá una lógica de razonamiento que conduce al resultado de
“Estudiante”. Antes de esto, se mencionará que cuatro años después de publicar ese resultado, hizo otro descubrimiento que resolvió uno de los problemas pendientes más importantes
de la estadística, y que ha tenido, desde entonces, una profunda influencia en los trabajos de
casi todos los campos de la ciencia. Ese resultado se analiza en la sección 5.3.
Ejemplo
4.17
Unas partículas (por ejemplo, células de levadura) están suspendidas en un medio líquido con
concentración de diez partículas por mL. Se agita por completo un volumen grande de la suspensión y después se extrae 1 mL. ¿Cuál es la probabilidad de que sólo se extraigan ocho partículas?
4.3
La distribución de Poisson
211
Solución
Siempre y cuando el volumen extraído sea una fracción pequeña del total, la solución a este
problema no depende del volumen total de la suspensión, sino sólo de la concentración de
partículas en éste. Sea V el volumen total de la suspensión, en mL. Entonces, el número total
de partículas en la suspensión es 10V. Considere a cada una de éstas como un ensayo de Bernoulli. Una partícula tiene “éxito” si es retirada. Ahora, se extrae 1 mL del total de V mL. Por
consecuencia, la cantidad que se retirará representa 1/V del total, de ahí que cada partícula
tenga una probabilidad de 1/V de ser retirada. Sea X el número de partículas extraídas. De este modo, X representa el número de éxitos en 10V ensayos de Bernoulli, cada uno con probabilidad de éxito de 1/V. Por tanto, X ⬃ Bin(10V, 1/V). Puesto que V es grande, 10V es grande
y 1/V es pequeño. Por consiguiente, en una aproximación muy cercana, X ⬃ Poisson(10). Se
calcula P(X ⫽ 8) con la función de masa de probabilidad Poisson: P(X ⫽ 8) ⫽ e ⫺ 10108/8! ⫽
0.1126.
En el ejemplo 4.17, λ tenía un valor de 10 ya que el número promedio de partículas en
1 mL de suspensión (el volumen retirado) era 10.
Ejemplo
4.18
Unas partículas están suspendidas en un medio líquido con concentración de seis partículas
por mL. Se agita por completo un volumen grande de la suspensión, y después se extrae 3 mL.
¿Cuál es la probabilidad de que sólo se retiren 15 partículas?
Solución
Sea X el número de partículas extraídas. El número promedio de partículas en un volumen
de 3 mL es 18. Entonces X ⬃ Poisson(18). La probabilidad de que se extraigan sólo 15 partículas es
1815
P (X = 15) = e−18
15!
= 0.0786
Observe que para que las soluciones de los ejemplos 4.17 y 4.18 sean correctas, es importante que la cantidad extraída de la suspensión no sea una fracción demasiado grande del
total. Por ejemplo, si el volumen total en el ejemplo 4.18 fuera de 3 mL, de tal forma que se
extrajera toda la cantidad, se tendría la certeza de que se retiraron las 18 partículas, por lo que
la probabilidad de extraer 15 partículas sería igual a cero.
Ejemplo
4.19
La abuela hornea galletas de chispas de chocolates en grupos de 100. Ella agrega 300 chispas
en la masa. Cuando las galletas están hechas, le ofrece una. ¿Cuál es la probabilidad de que
su galleta no tenga chispas de chocolate?
Solución
Éste es otro caso de partículas en suspensión. Sea X el número de chispas en su galleta. La
media del número de chispas es tres en cada galleta, de forma que X ⬃ Poisson(3). De ahí que
P(X ⫽ 0) ⫽ e ⫺ 330/0! ⫽ 0.0498.
212
Ejemplo
4.20
CAPÍTULO 4
Distribuciones comúnmente usadas
Los nietos de la abuela se han estado quejando de que ella es muy tacaña con las chispas de
chocolate. La abuela acuerda agregar las suficientes chispas a la masa de tal forma que sólo
1% de las galletas no tendrá chispas de chocolate. ¿Cuántas chispas debe incluir en la masa
de 100 galletas para lograr su propósito?
Solución
Sea n el número de chispas que se incluirá en una masa de 100 galletas, y X el número de
chispas en su galleta. La media del número de chispas es 0.01n por cada galleta, por lo que
X ⬃ Poisson(0.01n). Se debe determinar el valor de n para el cual P(X ⫽ 0) ⫽ 0.01. Utilizando la función de masa de probabilidad Poisson(0.01n)
P (X = 0) = e−0.01n
(0.01n)0
0!
= e−0.01n
Al hacer e⫺0.01n ⫽ 0.01, se obtiene que n ≈ 461.
Los ejemplos 4.17 a 4.20 demuestran que para que las partículas se distribuyan uniformemente en un medio, el número de partículas que por casualidad está en una pequeña porción del medio sigue una distribución de Poisson. En estos ejemplos, las partículas eran reales
y el medio era un espacio natural. Sin embargo, existen muchos casos en los que las “partículas” representan eventos y el medio es el tiempo. Anteriormente se vio tal ejemplo, en el
que resulta ser que el número de eventos de decaimiento radiactivo en un intervalo fijo sigue
una distribución de Poisson. Ahora se presenta otro.
Ejemplo
4.21
Suponga que el número de visitas a cierto sitio web durante un intervalo fijo sigue una distribución de Poisson. Suponga que la media de la razón de visitas es de cinco en cada minuto.
Determine la probabilidad de que haya sólo 17 visitas en los siguientes tres minutos.
Solución
Sea X el número de visitas en tres minutos. La media del número de visitas en tres minutos
es (5)(3) ⫽ 15, por lo que X ⬃ Poisson(15). Utilizando la función de masa de probabilidad
de Poisson(15),
1517
17!
= 0.0847
P (X = 17) = e−15
Ejemplo
4.22
En el ejemplo 4.21, sea X el número de visitas en t minutos. Determine la función de masa de
probabilidad de X, en función de t.
4.3
La distribución de Poisson
213
Solución
La media del número de visitas en t minutos es 5t, por lo que X ⬃ Poisson(5t). La función de
masa de probabilidad de X es
p(x) = P (X = x) =
e−5t (5t)x
x!
x = 0, 1, 2, . . .
Uso de la distribución de Poisson para estimar una razón
A menudo se realizan experimentos para estimar una razón λ que represente la media del número de eventos que ocurren en una unidad de tiempo o espacio. En estos experimentos se
cuenta el número de eventos X que ocurre en t unidades, y se estima la razón λ con la cantidad λ̂ ⫽ X/t. (Observe que en virtud de que la cantidad X/t se utiliza para estimar λ, ésta se
denota como λ̂.) Si los números de eventos en intervalos disjuntos son independientes, y si no
es posible que los eventos ocurran simultáneamente, entonces X sigue una distribución de
Poisson. Al proceso que da como resultado dichos eventos se le denomina proceso de Poisson. Puesto que la media del número de eventos que ocurre en t unidades de tiempo o espacio es igual a λt, X ⬃ Poisson(λt).
Resumen
Sea λ la media del número de eventos que ocurre en una unidad de tiempo o espacio.
Sea X el número de eventos que ocurre en t unidades de tiempo o espacio. Entonces si
X ⬃ Poisson(λt), λ se estima con λ̂ ⫽ X/t.
Ejemplo
4.23
Una suspensión contiene partículas en una concentración desconocida de λ por mL. Se agita
por completo la suspensión, y después se extraen 4 mL y se cuentan 17 partículas. Estime λ.
Solución
Sea X ⫽ 17 el número de partículas contadas y t ⫽ 4 mL el volumen extraído de la suspensión. Entonces λ̂ ⫽ X/t ⫽ 17/4 ⫽ 4.25 partículas por mL.
Incertidumbre en la razón estimada
Es importante darse cuenta que la razón estimada o concentración λ̂ sólo representa una estimación de la verdadera razón o concentración λ. En general, λ̂ no es igual a λ. Si se repitiera el experimento, probablemente el valor de λ̂ sería diferente. En otras palabras, hay
incertidumbre en λ̂. Para que λ̂ sea una estimación útil, se debe calcular su sesgo e incertidumbre. Los cálculos son similares a los de la proporción muestral presentados en la sección
4.2. Sea X el número de eventos contados en t unidades de tiempo o espacio, y suponga que
X ⬃ Poisson(λt).
El sesgo es la diferencia m λ̂ ⫺ λ. Dado que λ̂ ⫽ X/t, se tiene a partir de la ecuación
(2.41) (de la sección 2.5) que
214
CAPÍTULO 4
Distribuciones comúnmente usadas
μλ = μX/t =
=
μX
t
λt
=λ
t
Puesto que m λ̂ ⫽ λ, λ̂ no es sesgado.
La incertidumbre es la desviación estándar s λ̂. Dado que λ̂ ⫽ X/t, se tiene a partir de la
ecuación (2.43) (de la sección 2.5) que√s λ̂ ⫽ sX/t. Debido a que X ⬃ Poisson(λt), se tiene a
partir de la ecuación (4.11) que σX = λt. Por consecuencia,
√
σX
λt
λ
=
=
σλ =
t
t
t
En la práctica, no se conoce el valor de λ, por lo que se puede aproximar con λ̂.
Resumen
Si X ⬃ Poisson(λt) se estima la razón λ con
λ=
X
.
t
λ̂ no es sesgado.
La incertidumbre en λ̂ es
σλ =
λ
t
(4.12)
En la práctica se sustituye λ̂ por λ en la ecuación (4.12), ya que no se conoce λ.
Ejemplo
4.24
Se saca una muestra de 5 mL de una suspensión, y se cuenta 47 partículas. Estime la media
del número de partículas por mL y encuentre la incertidumbre en la estimación.
Solución
El número de partículas contadas es X ⫽ 47. El volumen extraído es t ⫽ 5 mL. La media estimada del número de partículas por mL es
La incertidumbre en la estimación es
σλ =
=
λ=
47
= 9.4
5
λ
t
9.4
5
= 1.4
aproximando λ con λ̂ ⫽ 9.4
4.3
Ejemplo
4.25
La distribución de Poisson
215
La masa de cierta sustancia radiactiva emite partículas alfa a razón de λ partículas por segundo. Un físico cuenta 1 594 emisiones en 100 segundos. Estime λ y determine la incertidumbre en la estimación.
Solución
La estimación de λ es λ̂ ⫽ 1 594/100 ⫽ 15.94 emisiones por segundo. La incertidumbre es
σλ =
=
λ
t
15.94
100
aproximando λ con λ̂ ⫽ 15.94
= 0.40
Ejemplo
4.26
En el ejemplo 4.25, ¿durante cuántos segundos deben contarse las emisiones para reducir la
incertidumbre a 0.3 emisiones por segundo?
Solución
√
Se desea encontrar el tiempo t para el cual σλ = λ/t = 0.3. Del ejemplo 4.25, λ̂ ⫽ 15.94.
Al sustituir este valor por λ, se obtiene
15.94
= 0.3
t
σλ =
Al despejar t se tiene que t ⫽ 177 segundos.
Algunas veces se desea estimar una función f(λ) de una razón de Poisson λ. Se estima
f(λ) con f( λ̂). Después se puede emplear el método de propagación de errores (ecuación 3.10
de la sección 3.3) para encontrar la incertidumbre en f( λ̂).
Ejemplo
4.27
El número de imperfecciones en una lámina de aluminio fabricada por determinado proceso
sigue una distribución de Poisson. En una muestra de 100 m2 de aluminio, se encuentran 200
imperfecciones. Estime la probabilidad de que un metro cuadrado de aluminio no tenga imperfecciones y determine la incertidumbre en la estimación.
Solución
Sea λ el número promedio de imperfecciones por metro cuadrado. Se iniciará calculando λ̂ y
su incertidumbre. Se ha observado que X ⫽ 200 imperfecciones en t ⫽ 100 m2 de aluminio.
Por tanto, λ̂ ⫽ 200Ⲑ100 ⫽ 2.00. La incertidumbre en λ̂ es
σλ =
λ
t
216
CAPÍTULO 4
Distribuciones comúnmente usadas
2
100
= 0.1414
aproximando λ con λ̂ ⫽ 2
=
Lo que se desea estimar es la probabilidad de que un metro cuadrado de aluminio no tenga
imperfecciones. Primero se expresa la probabilidad como una función de λ. Con este propósito, Y representa el número de imperfecciones en 1 m2 de lámina de aluminio. Entonces,
Y ⬃ Poisson(λ). Se desea estimar P(Y ⫽ 0). Utilizando la función de masa de probabilidad
de Poisson, esta probabilidad la da
P (Y = 0) =
e−λ λ0
= e−λ
0!
Por tanto, la probabilidad de que un metro cuadrado no tenga imperfecciones se estima con
e⫺ λ̂ ⫽ e⫺2.00 ⫽ 0.1353. Para encontrar la incertidumbre en la estimación, se emplea el método de propagación de errores (ecuación 3.10).
σe−λ ≈
d −λ
σλ
e
d
λ
= −e−λ σλ
= e−2.00 (0.1414)
= 0.0191
Para el caso de las partículas en suspensión, o eventos de decaimiento radiactivo, se conocen los principios fundamentales de la física que rigen estos procesos, donde basándose en los
primeros principios, podría demostrarse que la distribución del número de eventos es de Poisson. Existen muchos casos en los que la evidencia empírica sugiere que la distribución de
Poisson es adecuada, pero las leyes que rigen los procesos no son comprendidas bien para realizar una posible deducción rigurosa. Entre los ejemplos está el número de visitas a un sitio
web, el número de accidentes de tráfico en una intersección y el número de árboles en una
sección del bosque.
Deducción de la media y la varianza de una variable aleatoria de Poisson
Sea X ⬃ Poisson(λ). Se demostrará que mX ⫽ λ y sX2 ⫽ λ. Utilizando la definición de la
media poblacional para una variable aleatoria discreta (ecuación 2.29 de la sección 2.4):
μX =
∞
x=0
∞
xP (X = x)
λx
x!
x=0
0
λ
+
= (0)(e−λ )
0!
=
xe−λ
∞
x=1
xe−λ
λx
x!
4.3
∞
= 0+
=
∞
x=1
e−λ
x=1
∞
=λ
=λ
e−λ
x=1
∞
217
λx
(x − 1)!
λx
(x − 1)!
e−λ
λx−1
(x − 1)!
e−λ
λx
x!
x=0
La distribución de Poisson
−λ x
Ahora la sumatoria ∞
es la suma de la función de masa de probabilidad de
x=0 e λ /x!
−λ x
Poisson(λ) sobre todos sus valores posibles. Por tanto, ∞
x=0 e λ /x! = 1, por lo que,
μX = λ
Se emplea la ecuación (2.31) (de la sección 2.4) para demostrar que sX2 ⫽ λ.
σX2 =
∞
x 2 e−λ
x=0
λx
− μ2X
x!
(4.13)
Al sustituir x(x ⫺ 1) ⫹ x para x2 y λ para mX en la ecuación (4.13), se obtiene
σX2
=
∞
x=0
x(x − 1)e
x
−λ λ
x!
+
∞
xe−λ
x=0
λx
− λ2
x!
(4.14)
−λ x
Ahora, x(x ⫺ 1) ⫽ 0 si x ⫽ 0 o 1, y ∞
x=0 xe λ /x! = μX = λ. Por consiguiente, se puede comenzar por sumar el lado derecho de la ecuación (4.14) en x ⫽ 2, y sustituir λ por
∞
−λ x
x=0 xe λ /x! Se obtiene
σX2
=
=
∞
x=2
∞
x(x − 1)e−λ
e−λ
x=2
= λ2
= λ2
2
∞
x=2
∞
x=0
λx
+ λ − λ2
(x − 2)!
e−λ
λx−2
+ λ − λ2
(x − 2)!
e−λ
λx
+ λ − λ2
x!
= λ (1) + λ − λ2
=λ
λx
+ λ − λ2
x!
218
CAPÍTULO 4
Distribuciones comúnmente usadas
Ejercicios para la sección 4.3
1. Sea X ⬃ Poisson(4). Determine
a) P(X ⫽ 1)
b) P(X ⫽ 0)
c) P(X ⬍ 2)
d ) P(X ⬎ 1)
e) mX
f ) sX
2. La concentración de partículas en una suspensión es 2 por
mL. Se agita por completo la concentración, y posteriormente se extraen 3 mL. Sea X el número de partículas que
son retiradas. Determine
5. El número de mensajes recibidos por el tablero computado
de anuncios es una variable aleatoria de Poisson con una razón media de ocho mensajes por hora.
a) ¿Cuál es la probabilidad de que se reciban cinco mensajes en una hora?
b) ¿Cuál es la probabilidad de que se reciban diez mensajes en 1.5 horas?
c) ¿Cuál es la probabilidad de que se reciban menos de tres
mensajes en 11⁄2 horas?
6. Cierto tipo de tablero de circuitos contiene 300 diodos. Cada uno tiene una probabilidad p ⫽ 0.002 de fallar.
a) P(X ⫽ 5)
a) ¿Cuál es la probabilidad de que fallen exactamente dos
diodos?
b) P(X ⱕ 2)
b) ¿Cuál es la media del número de diodos que falla?
c) P(X ⬎ 1)
c) ¿Cuál es la desviación estándar del número de diodos
que falla?
d) mX
e) sX
3. Suponga que 0.03% de los contenedores plásticos producidos en cierto proceso tiene pequeños agujeros que los dejan
inservibles. X representa el número de contenedores en una
muestra aleatoria de 10 000 que tienen este defecto. Determine
a) P(X ⫽ 3)
b) P(X ⱕ 2)
d) Un tablero funciona si ninguno de sus diodos falla.
¿Cuál es la probabilidad de que funcione un tablero?
e) Se envían cinco tableros a un cliente. ¿Cuál es la probabilidad de que cuatro o más de ellos funcione?
7. Una variable aleatoria X tiene una distribución binomial y
una variable aleatoria Y tiene una distribución de Poisson.
Tanto X como Y tienen medias iguales a 3. ¿Es posible determinar qué variable aleatoria tiene la varianza más grande? Elija una de las siguientes respuestas:
c) P(1 ⱕ X ⬍ 4)
i) Sí, X tiene la varianza más grande.
d ) mX
ii) Sí, Y tiene la varianza más grande.
e) sX
iii) No, se necesita conocer el número de ensayos, n, para X.
4. Uno de cada 5 000 individuos en una población porta cierto gen defectuoso. Se estudia una muestra aleatoria de 1 000
individuos.
a) ¿Cuál es la probabilidad de que sólo uno de los individuos de la muestra porte el gen?
b) ¿Cuál es la probabilidad de que ninguno sea portador?
c) ¿Cuál es la probabilidad de que más de dos individuos
porte el gen?
d ) ¿Cuál es la media del número de individuos de la muestra que porta el gen?
e) ¿Cuál es la desviación estándar del número de individuos portadores de gen?
iv) No, se necesita conocer la probabilidad de éxito, p, para X.
v) No, se necesita conocer el valor de λ para Y.
8. Una química desea estimar la concentración de partículas
que hay en determinada suspensión. Ella extrae 3 mL de la
suspensión y cuenta 48 partículas. Estime la concentración
de partículas por mL y determine la incertidumbre en la estimación.
9. Una microbióloga quiere estimar la concentración de cierto
tipo de bacteria en una muestra de agua tratada. Ella pone
una muestra de 0.5 mL de agua tratada en el vidrio del microscopio y descubre 39 bacterias. Estime la concentración
4.3
La distribución de Poisson
219
de bacterias por mL, en esta agua tratada, y determine la incertidumbre en la estimación.
d ) Si la media de la razón de decaimiento es sólo de una
por segundo, ¿a qué es igual P(X ⱕ 8)?
10. La abuela está probando una nueva receta de pan de pasas.
En cada hornada de la masa de pan salen tres hogazas, y cada una tiene 20 rebanadas de pan.
e) Con base en la respuesta del inciso (d), si la razón de decaimiento promedio es de una partícula por segundo,
¿ocho eventos en diez segundos sería un número inusualmente pequeño?
a) Si ella agrega 100 pasas a una hornada de masa, ¿cuál es
la probabilidad de que una rebanada de pan elegida aleatoriamente no tenga pasas?
f ) Si cuenta ocho eventos de decaimiento en diez segundos, ¿esto sería una evidencia de que debe regresarse el
producto? Explique.
b) Si ella agrega 200 pasas a una hornada de masa, ¿cuál es
la probabilidad de que una rebanada de pan elegida aleatoriamente tenga cinco pasas?
c) ¿Cuántas pasas debe agregar para que la probabilidad de
que una rebanada elegida de forma aleatoria no tenga
pasas sea 0.01?
11. Mamá y la abuela están horneando, cada una, galletas de
chispas de chocolate. Cada una le da dos galletas. Una de las
galletas de mamá tiene 14 chispas de chocolate y la otra tiene 11. Las galletas de la abuela tienen seis y ocho chispas.
a) Estime la media del número de chispas en una de las galletas de mamá.
b) Estime la media del número de chispas en una de las galletas de la abuela.
13. Alguien afirma que cierta suspensión contiene al menos siete partículas por mL. Extrae una muestra de 1 mL de la solución. Sea X el número de partículas en la muestra.
a) Si el número promedio de partículas es exactamente siete por mL (de manera que la afirmación es verdad, pero
apenas), ¿a qué es igual P(X ⱕ 1)?
b) Con base en la respuesta del inciso (a), si la suspensión
contiene siete partículas por mL, ¿una partícula en una
muestra de 1 mL sería un número inusualmente pequeño?
c) Si encuentra una partícula en la muestra, ¿esto sería una
evidencia de que la afirmación es falsa? Explique.
d) Si la media del número de partículas es exactamente 7
por mL, ¿a qué es igual P(X ⱕ 6)?
c) Determine la incertidumbre en la estimación de las galletas de mamá.
e) Con base en la respuesta del inciso (d), si la suspensión
contiene siete partículas por mL, ¿seis partículas en una
muestra de 1 mL sería un número inusualmente pequeño?
d ) Determine la incertidumbre en la estimación de las galletas de la abuela.
f ) Si cuenta seis partículas en la muestra, ¿esto sería una
evidencia de que la afirmación es falsa? Explique.
e) Estime cuántas chispas más en promedio tiene una galleta de mamá en comparación con una galleta de la
abuela. Determine la incertidumbre en la estimación.
12. Usted ha recibido una masa radiactiva de la que se afirma
tiene una media de la razón de decaimiento de al menos una
partícula por segundo. Si la media de la razón de decaimiento es menor a una por segundo, usted puede regresar el
producto para un reembolso. Sea X el número de eventos de
decaimiento que se produce en diez segundos.
a) Si la media de la razón de decaimiento es exactamente
de una por segundo (de tal forma que la afirmación es
verdad, pero apenas), ¿a qué es igual P(X ⱕ 1)?
14. Un físico desea estimar la razón de emisiones de partículas
alfa provenientes de cierta fuente. Él hace dos cuentas. Primero mide la razón fondo contando el número de partículas
que hay durante 100 segundos en ausencia de la fuente.
Cuenta 36 emisiones de fondo. Después, con la fuente presente, cuenta 324 emisiones en 100 segundos. Esto último
representa la suma de las emisiones de la fuente más las
emisiones de fondo.
a) Estime la razón de fondo, en emisiones por segundo, y
determine la incertidumbre en la estimación.
b) Estime la suma de la fuente más la razón de fondo, en
emisiones por segundo, y determine la incertidumbre en
la estimación.
b) Con base en la respuesta del inciso a), si la razón de decaimiento promedio es de una partícula por segundo,
¿un evento en diez segundos sería un número inusualmente pequeño?
c) Estime la razón de emisiones provenientes de la fuente
en partículas por segundo, y determine la incertidumbre en
la estimación.
c) Si usted encuentra un evento de decaimiento en diez segundos, ¿esto sería una evidencia de que debe regresarse el producto? Explique.
d ) ¿Qué da como resultado una menor incertidumbre al estimar la razón de emisiones provenientes de la fuente:
(1) contar las partículas de fondo sólo durante 150 se-
220
CAPÍTULO 4
Distribuciones comúnmente usadas
gundos, así como las partículas de fondo, más las de la
fuente durante 150 segundos, o (2) contar las partículas
de fondo durante 100 segundos, así como las de la fuente más las de fondo durante 200 segundos? Calcule la
incertidumbre en cada caso.
e) ¿Es posible reducir la incertidumbre a 0.03 partículas
por segundo si se mide la razón de fondo sólo durante
4.4
100 segundos? Si es así, ¿cuánto tiempo puede medirse
las partículas de la fuente más las de fondo? Si no, explique por qué.
15. Con referencia al ejemplo 4.27, estime la probabilidad de
que en 1 m2 de aluminio haya una imperfección y determine la incertidumbre en la estimación.
Algunas otras distribuciones discretas
En esta sección se analizan diversas distribuciones discretas que son útiles en varias situaciones.
La distribución hipergeométrica
Cuando una población finita contiene dos tipos de unidades, que pueden ser denominados como éxitos y fracasos, y se extrae una muestra aleatoria simple de la población, cada unidad
representa un ensayo de Bernoulli. A medida que se selecciona cada unidad, la proporción de
éxitos en la población restante disminuye o aumenta, dependiendo si la unidad extraída es
un éxito o fracaso. Por esta razón, los ensayos no son independientes, de ahí que el número
de éxitos en la muestra no siga una distribución binomial. En su lugar, la distribución que describe adecuadamente el número de éxitos en esta situación se llama distribución hipergeométrica.
Como ejemplo, suponga que se tiene un lote de 20 unidades que contiene seis que están defectuosos, y que se extrae aleatoriamente cinco unidades de este lote. Sea X el número
de unidades defectuosas en la muestra. Se calculará P(X ⫽ 2). Con este propósito, primero se
cuenta el número total de los grupos diferentes de cinco unidades que puede extraerse de la
población de 20. (Se hará referencia a cada grupo de cinco unidades como combinación.) El
número de combinaciones de cinco unidades es el número de muestras diferentes que se puede extraer, y cada una es igualmente probable. Después se determinará cuántas de estas combinaciones contienen exactamente dos defectuosas. La probabilidad de que una combinación
de cinco unidades contenga sólo dos defectuosas es el cociente
número de combinaciones de cinco unidades que contienen dos defectuosas
P(X ⫽ 2) ⫽ ——————————————————————————————————
número de combinaciones de cinco unidades que pueden seleccionarse entre 20
En general, el número decombinaciones
de k unidades que se puede elegir de un grupo de
n unidades se denota por n
y
es
igual
a
(véase la deducción de la ecuación 2.12 en la seck
ción 2.2)
n!
n
=
k
k!(n − k)!
Por tanto, el número de combinaciones de cinco unidades que se puede elegir entre 20 es
20!
20
= 15 504
=
5
5!(20 − 5)!
4.4
Algunas otras distribuciones discretas
221
Para determinar el número de combinaciones de cinco que contienen sólo dos defectuosas, se
describe la construcción de dicha combinación como una secuencia de dos operaciones. Primero, se seleccionan dos unidades de las seis defectuosas; segundo, se seleccionan tres unidades de las 14 no defectuosas. El número de combinaciones de dos unidades seleccionadas
entre seis es
6!
6
=
= 15
2
2!(6 − 2)!
y el número de combinaciones de tres unidades elegidas de 14 es
14!
14
=
= 364
3
3!(14 − 3)!
Por tanto, el número total de combinaciones de cinco
que puede componerse
de dos
p
unidades
defectuosas y tres no defectuosas es el producto t 26 14
(ésta
es
una
=
(15)(364)
=
5
460
(
3
aplicación del principio fundamental de conteo; véase la sección 2.2 para un análisis más detallado). Se concluye que
6 14
2
3
P (X = 2) =
20
5
=
5 460
15 504
= 0.3522
Para calcular P(X ⫽ 2) en el ejemplo anterior, fue necesario conocer el número de unidades
en la población (20), el de unidades defectuosas en la población (6) y el de unidades extraídas (5). La función de masa de probabilidad de la variable aleatoria X se determina al utilizar
estos tres parámetros. Específicamente, X tiene una distribución hipergeométrica con los parámetros 20, 6 y 5, ello se denota mediante X ⬃ H(20, 6, 5). Ahora se generalizará esta idea.
Resumen
Suponga una población finita que contiene N unidades, de ellas R son clasificadas como éxitos y N ⫺ R como fracasos. Suponga que se extrae n unidades de esta población,
y sea X el número de éxitos en la muestra. Entonces X sigue la distribución hipergeométrica con los parámetros N, R y n, que se puede denotar como X ⬃ H(N, R, n).
La función de masa de probabilidad de X es
⎧
R N −R
⎪
⎪
⎪
⎪
⎨ x n− x
máx(0, R + n − N ) ≤ x ≤ mín(n, R)
p(x) = P (X = x) =
N
⎪
⎪
⎪
n
⎪
⎩
0
de otro modo
(4.15)
222
Ejemplo
4.28
CAPÍTULO 4
Distribuciones comúnmente usadas
De 50 edificios en un parque industrial, 12 no cumplen el código eléctrico. Si se seleccionan
aleatoriamente diez edificios para inspeccionarlos, ¿cuál es la probabilidad de que exactamente tres de los diez no cumplan el código?
Solución
Sea X el número de edificios seleccionados que violan el código. Entonces, X ⬃ H(50, 12,
10). Se debe determinar P(X ⫽ 3). Utilizando la ecuación (4.15),
12 38
3
7
P (X = 3) =
50
10
=
(220)(12 620 256)
10 272 278 170
= 0.2703
Media y varianza de la distribución hipergeométrica
En el recuadro siguiente se presenta la media y varianza de la distribución hipergeométrica.
Se omiten sus deducciones.
Si X ⬃ H(N, R, n), entonces
μX =
σX2
Ejemplo
4.29
=n
R
N
nR
N
R
1−
N
(4.16)
N −n
N −1
Con referencia al ejemplo 4.28 encuentre la media y la varianza de X.
Solución
X ⬃ H(50, 12, 10), por lo que
μX =
(10)(12)
50
= 2.4000
50 − 10
12
12
1−
σX2 = (10)
50
50
50 − 1
= 1.4890
(4.17)
4.4
Algunas otras distribuciones discretas
223
Comparación con la distribución binomial
Una población de tamaño N contiene R éxitos y N ⫺ R fracasos. Imagine que se toma una
muestra de n unidades de esta población con reemplazo; es decir, cada unidad de la muestra
se regresará a la población después de ser extraída. Entonces, las unidades de la muestra son
resultado de una secuencia de ensayos de Bernoulli independientes, y el número de los éxitos X en la muestra tiene una distribución binomial con n ensayos y probabilidad de éxito
p ⫽ R/N.
En la práctica, rara vez se extraen muestras con reemplazo, debido a que no es necesario extraer la misma unidad dos veces. En su lugar, el muestreo se realiza sin reemplazo, en
el cual cada unidad es eliminada de la población después de que es extraída. Entonces, las unidades de la muestra son resultado de ensayos de Bernoulli dependientes, ya que la población
cambia conforme se extrae cada unidad. Por esta razón, la distribución del número de éxitos,
X, es H(N, R, n) en vez de Bin(n, R/N).
Cuando el tamaño muestral n es pequeño en comparación con el tamaño de la población N (es decir, no mayor a 5%), la diferencia entre el muestreo con o sin reemplazo es poca, y la distribución binomial Bin(n, R/N) es una buena aproximación de la distribución
hipergeométrica H(N, R, n). Observe que la media de H(N, R, n) es nR/N, la misma que la de
Bin(n, R/N). Esto último indica que sea que realice la muestra con o sin reemplazo, la proporción de éxitos de la muestra en promedio es la misma que la de éxitos de la población. La varianza de Bin(n, R/N) es n(R/N)(1 ⫺ R/N) y la varianza de H(N, R, n) se obtiene al multiplicar
esto por el factor (N ⫺ n)/(N ⫺ 1). Observe que cuando n es pequeña en relación con N, este factor se aproxima a 1.
Distribución geométrica
Suponga que se lleva a cabo una secuencia de ensayos de Bernoulli independientes, cada uno
con la misma probabilidad de éxito p. Sea X el número de experimentos hasta incluir el primer éxito. Por tanto, X es una variable aleatoria discreta, la cual tiene una distribución geométrica con parámetro p. Se expresa como X ⬃ Geom(p).
Ejemplo
4.30
Una prueba de resistencia de soldadura consiste en poner carga en uniones soldadas hasta que
se dé una ruptura. Para cierto tipo de soldadura, 80% de las rupturas ocurre en la propia soldadura, mientras que otro 20% se da en las vigas. Se prueba cierto número de soldaduras. Sea
X el número de pruebas, incluyendo la primera prueba que da como resultado la ruptura de la
viga. ¿Cuál es la distribución de X?
Solución
Cada prueba es un ensayo de Bernoulli, con un éxito definido como la ruptura de una viga.
Por consiguiente, la probabilidad de éxito es p ⫽0.2. El número de ensayos incluyendo al
primer éxito tiene una distribución geométrica con parámetro p ⫽0.2. Por consecuencia,
X ⬃ Geom(0.2).
224
CAPÍTULO 4
Ejemplo
4.31
Con referencia al ejemplo 4.30, determine P(X ⫽ 3).
Distribuciones comúnmente usadas
Solución
El evento X ⫽ 3 ocurre cuando los primeros dos ensayos resultan en fracaso y el tercer experimento en éxito. De ahí que
P (X = 3) = P (FFS)
= (0.8)(0.8)(0.2)
= 0.128
El resultado del ejemplo 4.31 se puede generalizar para generar la función de masa de
probabilidad de una variable aleatoria geométrica.
Si X ⬃ Geom(p), entonces la función de masa de probabilidad de X es
p(1 − p)x−1
p(x) = P (X = x) =
0
x = 1, 2, . . .
de otro modo
Media y varianza de una distribución geométrica
En el siguiente recuadro se muestra la media y varianza de la distribución geométrica. Sus deducciones requieren de la manipulación de series infinitas y se omiten.
Si X ⬃ Geom(p), entonces
1
p
(4.18)
1−p
p2
(4.19)
μX =
σX2 =
Ejemplo
4.32
Con referencia al ejemplo 4.30, sea X el número de pruebas hechas incluyendo la primera ruptura de la viga. Determine la media y la varianza de X.
Solución
Puesto que X ⬃ Geom(p), mX ⫽ 1/0.2 ⫽ 5, y sX2 ⫽ (1 ⫺ 0.2)/(0.22) ⫽ 20.
La distribución binomial negativa
La distribución binomial negativa constituye una extensión de la distribución geométrica. Sea
r un entero positivo. Suponga que se realizan ensayos de Bernoulli independientes, cada uno
4.4
Algunas otras distribuciones discretas
225
con probabilidad de éxito p, y X representa el número de ensayos hasta incluir al r-ésimo éxito. Por consecuencia, X tiene una distribución binomial negativa con parámetros r y p. Se
expresa como X ⬃ NB(r, p).
Ejemplo
4.33
(Continuación del ejemplo 4.30.) En una prueba de fuerza de soldadura, 80% de las pruebas
da como resultado ruptura de la soldadura, mientras que otro 20% propicia ruptura de la viga. Sea X el número de pruebas incluyendo la tercera ruptura de la viga. ¿Cuál es la distribución de X? Determine P(X ⫽ 8).
Solución
Dado que X representa el número de ensayos incluyendo al tercer éxito, y puesto que la probabilidad de éxito es p ⫽ 0.2, X ⬃ NB(3, 0.2). Se calculará P(X ⫽ 8) y el método de cálculo conducirá a una deducción de la función de masa de probabilidad de una variable aleatoria
binomial negativa. Debido a que X ⬃ NB(3, 0.2), el evento X ⫽ 8 significa que el tercer éxito
se presentó en el octavo ensayo. Otra forma de decir esto es que hubo exactamente dos éxitos en los primeros siete ensayos y el octavo ensayo fue un éxito. En virtud de que todos los
experimentos son independientes, se tiene que
P(X ⫽ 8) ⫽ P(sólo dos éxitos en los primeros siete ensayos)P(éxitos en el octavo ensayo)
Ahora el número de éxitos en los primeros siete ensayos tiene una distribución Bin(7, 0.2),
por lo que
7
P(exactamente dos éxitos en los primeros siete ensayos) ⫽
(0.2)2 (0.8)5
2
La probabilidad de que el octavo ensayo (o cualquier otro experimento) dé como resultado un
éxito es 0.2. Por tanto,
7
P (X = 8) =
(0.2)2 (0.8)5 (0.2)
2
7
=
(0.2)3 (0.8)5
2
= 0.05505
Se generaliza el resultado del ejemplo 4.33 para construir la función de masa de probabilidad de una variable aleatoria binomial negativa.
Si X ⬃ NB(r, p), entonces la función de masa de probabilidad de X es
⎧
⎪
⎨ x − 1 pr (1 − p)x−r
x = r, r + 1, . . .
r −1
p(x) = P (X = x) =
⎪
⎩0
de otro modo
226
CAPÍTULO 4
Distribuciones comúnmente usadas
Observe que el valor posible más pequeño de X es r, ya que se requiere al menos r ensayos para producir r éxitos. Observe que cuando r ⫽ 1, la distribución binomial negativa es
la misma que la distribución geométrica. En símbolos, NB(1, p) ⫽ Geom(p).
Una variable aleatoria binomial negativa constituye
una suma de variables aleatorias geométricas
Suponga que una secuencia de ocho ensayos de Bernoulli independientes, cada uno con probabilidad de éxito p, aparece de la siguiente manera:
F F S F S F F S
Si X es el número de ensayos incluyendo al tercer éxito, entonces X ⬃ NB(3, p), y para esta
secuencia de experimentos, X ⫽ 8. Se denota el número de ensayos incluyendo al primer éxito por Y1. Para esta secuencia, Y1 ⫽ 3, pero en general Y1 ⬃ Geom(p). Ahora se comienza a
contar, empezando desde el primer ensayo después del primer éxito, incluyendo al segundo
éxito. Este número de ensayos se representa con Y2. Para esta secuencia Y2 ⫽ 2, pero en general Y2 ⬃ Geom(p). Finalmente, se cuenta el número de ensayos, a partir del primer ensayo
después del segundo éxito, incluyendo al tercero. Y3 denota el número de ensayos. Para esta
secuencia Y3 ⫽ 3, pero nuevamente, en general, Y3 ⬃ Geom(p). Es claro que X ⫽ Y1 ⫹ Y2 ⫹
Y3. Más aún, puesto que los experimentos son independientes, Y1, Y2 y Y3 también lo son. Esto demuestra que si X ⬃ NB(3, p), entonces X es la suma de tres variables aleatorias independientes Geom(p). Este resultado se puede generalizar para cualquier entero positivo r.
Resumen
Si X ⬃ NB(r, p), entonces
X = Y1 + · · · + Yr
donde Y1, . . . , Yr son variables aleatorias independientes, cada una con distribución
Geom(p).
Media y varianza de la distribución negativa binomial
Si X ⬃ NB(r, p), entonces X ⫽ Y1 ⫹ . . . ⫹ Yr, donde Y1, . . . , Yr son variables aleatorias independientes, cada una con distribución Geom(p). De ahí que la media de X sea la suma de
las medias de las Y, y la varianza de X sea la suma de las varianzas. Cada Yi tiene una media
1/p y varianza (1 ⫺ p)/p2. Por consiguiente, mX ⫽ r/p y sX2 ⫽ r(1 ⫺ p)/p2.
Resumen
Si X ⬃ NB(r, p), entonces
r
p
r(1 − p)
σX2 =
p2
μX =
(4.20)
(4.21)
4.4
Ejemplo
4.34
Algunas otras distribuciones discretas
227
Con referencia al ejemplo 4.33, determine la media y la varianza de X, donde X representa el
número de pruebas incluyendo la tercera ruptura de la viga.
Solución
Dado que X ⬃ NB(3, 0.2), se tiene que
3
= 15
0.2
3(1 − 0.2)
σX2 =
= 60
0.22
μX =
Distribución multinomial
Un ensayo de Bernoulli representa un proceso que tiene dos posibles resultados. Una generalización del ensayo de Bernoulli constituye el experimento multinomial, que es un proceso
con k resultados, donde k ⱖ 2. Por ejemplo, el lanzamiento de un dado es un experimento multinomial, con seis posibles resultados: 1, 2, 3, 4, 5, 6. Cada resultado de un experimento multinomial tiene una probabilidad de ocurrir. Las probabilidades de los k resultados se representan
como p1, . . . , pk. Por ejemplo, en el lanzamiento de un dado, p1 ⫽ p2 ⫽ . . . ⫽ p6 ⫽ 1/6.
Ahora suponga que se realizan n experimentos independientes multinomiales, cada uno
con los mismos k resultados posibles y con las mismas probabilidades p1, . . . , pk. Se enumeran los resultados 1, 2, . . . , k. Para cada resultado i, Xi representa el número de ensayos que
tiene ese resultado. Entonces X1, . . . , Xk son variables aleatorias discretas. La colección
X1, . . . , Xk tiene una distribución multinomial con parámetros n, p1, . . . , pk. Se expresa como X1, . . . , Xk ⬃ MN(n, p1, . . . , pk). Observe que toda la colección X1, . . . , Xk sigue la distribución multinomial, en vez de sólo una Xi.
Ejemplo
4.35
Se inspeccionan las unidades producidas por una línea de ensamble, y se clasifica cada una
como correspondiente (aceptable), inferior o rechazada. En general, 70% de las unidades son
correspondientes, 20% son inferiores y 10% rechazadas. Suponga que se selecciona de forma
independiente y aleatoria cuatro unidades. Sean X1, X2, X3 los números entre los cuatro eventos correspondientes inferiores y rechazados, respectivamente. ¿Cuál es la distribución de X1,
X2, X3?
Solución
Cada unidad es un ensayo multinomial con tres posibles resultados: correspondiente, inferior
y rechazada. Las probabilidades asociadas con los resultados son p1 ⫽ 0.7, p2 ⫽ 0.2 y p3 ⫽
0.1. Las variables aleatorias X1, X2, X3 se refieren a los números de cada resultado en los cuatro ensayos independientes. Por tanto, X1, X2, X3 ⬃ MN(4, 0.7, 0.2, 0.1).
Para mostrar cómo se calculan las probabilidades de variables aleatorias multinomiales,
se calculará P(X1 ⫽ 2, X2 ⫽ 1 y X3 ⫽ 1), en la que X1, X2, X3 se definieron en el ejemplo 4.35.
228
CAPÍTULO 4
Distribuciones comúnmente usadas
Esto último conduce a una deducción de la función de masa de probabilidad multinomial. Se
comenzará por observar que hay 12 arreglos de dos correspondientes (C), una inferior (D) y
una rechazada (R) entre los cuatro resultados. Aquí se enlistan.
CCDR
DCCR
CCRD
DCRC
CDCR
DRCC
CDRC
RCCD
CRCD
RCDC
CRDC
RDCC
Cada uno de estos 12 arreglos es igualmente probable. Se calcula la probabilidad de CCDR.
El evento CCDR es una secuencia de cuatro resultados: C en el primer ensayo, C en el segundo, D en el tercero y R en el cuarto. Dado que los ensayos son independientes, la probabilidad de la secuencia de resultados es igual al producto de cada una de sus probabilidades.
P(CCDR) ⫽ (0.7)(0.7)(0.2)(0.1) ⫽ (0.7)2(0.2)(0.1)
Puesto que cada uno de los 12 arreglos tiene la misma probabilidad,
P(X1 ⫽ 2, X2 ⫽ 1, X3 ⫽ 1) ⫽ (12)(0.7)2(0.2)(0.1) ⫽ 0.1176
En este cálculo, el número de arreglos era pequeño para contarlos al enlistarlos a todos. En
general, para calcular probabilidades como ésta, se necesita una fórmula. Esta última se encuentra en el siguiente recuadro. En la sección 2.2 se presenta una deducción.
Suponga que se llevan a cabo n experimentos independientes, cada uno tiene k resultados posibles. Sean x1, . . . , xk el número de ensayos con resultados 1, 2, . . . , k, respectivamente. El número de arreglos de los resultados entre los n ensayos es
n!
x1 ! x2 ! · · · xk !
Ahora, se puede especificar la función de masa de probabilidad multinomial.
Si X1, . . . , Xk ⬃ MN(n, p1, . . . , pk), entonces la función de masa de probabilidad de
X1, . . . , Xk es
p(x1 , . . . , xk ) = P (X1 = x1 , . . . , Xk = xk )
⎧
n!
⎪
⎪
p x1 p x2 · · · pkxk
⎨
x1 ! x2 ! · · · xk ! 1 2
=
⎪
⎪
⎩
0
xi = 0, 1, 2, . . . , n
y xi = n
de otro modo
Observe que la distribución multinomial difiere de las otras distribuciones en que estudia diversas variables aleatorias simultáneamente. Este hecho se expresa al afirmar que p(x1, . . . ,
xk) es la función de masa de probabilidad conjunta de X1, . . . , Xk. La sección 2.6 analiza
con más profundidad las funciones de masa de probabilidad conjunta.
4.4
Ejemplo
4.36
Algunas otras distribuciones discretas
229
La alcaptonuria es una enfermedad genética que se caracteriza por carencia de una enzima necesaria para metabolizar al ácido homogentísico. Algunas personas son portadores de aquélla,
lo cual significa que no tienen la enfermedad, sino que pueden transmitirla potencialmente a
sus hijos. De acuerdo con las leyes de la herencia genética, un hijo, cuyos padres son portadores de alcaptonuria, tiene probabilidad de 0.25 de no tener la enfermedad, 0.5 de ser portador
y 0.25 de padecer la enfermedad. En una muestra de diez hijos de portadores de la alcaptonuria, ¿cuál es la probabilidad de que tres no la tengan, cinco sean portadores y dos la padezcan?
Solución
Sean X1, X2, X3 los números entre los diez hijos que no tienen la enfermedad, son portadores
y la padecen, respectivamente. Entonces X1, X2, X3 ⬃ MN(10, 0.25, 0.50, 0.25), por lo que de
la ecuación (4.22) se tiene que
P (X1 = 3, X2 = 5, X3 = 2) =
10!
(0.25)3 (0.50)5 (0.25)2
3! 5! 2!
= (2 520)(0.015625)(0.03125)(0.0625)
= 0.07690
Algunas veces sólo se desea concentrar en uno de los posibles resultados de un experimento multinomial. En esta situación, se puede considerar el resultado de interés como “éxito”, y cualquier otro resultado como “fracaso”. De este modo, es posible ver que el número
de ocurrencias de cualquier resultado particular tiene una distribución binomial.
Si X1, . . . , Xk ⬃ MN(n, p1, . . . , pk), entonces para cada i
X1 ⬃ Bin(n, pi)
Ejemplo
4.37
Con referencia al ejemplo 4.36, determine la probabilidad de que sólo cuatro de los diez hijos no padezcan la enfermedad.
Solución
Sea X el número de hijos que no tiene la enfermedad en una muestra de diez. Entonces
X ⬃ Bin(10, 0.25); por tanto,
P (X = 4) =
10!
(0.25)4 (0.75)6
4! 6!
= 0.1460
230
CAPÍTULO 4
Distribuciones comúnmente usadas
Ejercicios para la sección 4.4
1. Quince automóviles son llevados a una concesionaria para
validar su garantía. Suponga que cinco presentan graves
problemas de motor, mientras que diez tienen problemas sin
importancia. Se eligen aleatoriamente seis automóviles para componerlos. ¿Cuál es la probabilidad de que dos tengan
graves problemas?
2. Un cargamento contiene 40 elementos. Se seleccionará de
forma aleatoria y se probará cinco elementos. Si dos o más
están defectuosos, se regresará el cargamento.
a) Si, de hecho, el cargamento contiene cinco elementos
defectuosos, ¿cuál es la probabilidad de que sean aceptados (no regresados)?
b) Si, de hecho, el cargamento contiene diez elementos defectuosos, ¿cuál es la probabilidad de que se regresen?
i) 0
ii) 1/p
iii) p
iv) 1
v) (1 ⫺ p)/p2
8. Un proceso que llena paquetes se detiene cada vez que se
detecta uno cuyo peso no cumple la especificación. Suponga que cada paquete tiene probabilidad de 0.01 de no cumplir con la especificación y que los pesos de los paquetes
son independientes.
a) Determine el número promedio de paquetes que será llenado antes de que se detenga el proceso.
b) Determine la varianza del número de paquetes que será
llenado antes de que se detenga el proceso.
3. La probabilidad de que una computadora que corre cierto
sistema operativo se descomponga en determinado día es de
0.1. Determine la probabilidad de que la máquina se descomponga por primera vez en el duodécimo día, después de
la instalación del sistema operativo.
c) Suponga que el proceso no se detendrá hasta que se detecten cuatro paquetes, cuyo peso no cumpla con la especificación. Determine la media y la varianza del número
de paquetes que será llenado antes de que se detenga el
proceso.
4. Un semáforo localizado en cierta intersección está en verde
50% de las veces, en ámbar 10% y en rojo 40%. Un automóvil pasa por esta intersección una vez al día. Sea X el número de días que ha transcurrido, incluyendo la primera vez
que el automóvil se topa con una luz roja. Suponga que cada día representa un experimento independiente.
9. En un lote de diez microcircuitos, tres están defectuosos. Se
elige aleatoriamente cuatro microcircuitos para ser probados. Sea X el número de circuitos probados que son defectuosos.
a) Determine P(X ⫽ 3).
b) Determine P(X ⱕ 3).
c) Determine mX.
d) Determine sX2.
5. Con referencia al ejercicio 4. Sea Y el número de días incluyendo el tercer día en que se topa con una luz roja.
a) Determine P(X ⫽ 7).
b) Determine mX.
c) Determine sX2.
6. Con referencia al ejercicio 4, ¿cuál es la probabilidad de
que en una secuencia de diez días, se haya encontrado con
cuatro luces verdes, una ámbar y cinco rojas?
7. Si X ⬃ Geom(p), ¿cuál es el valor más probable de X?
a) Determine P(X ⫽ 2).
b) Determine mX.
c) Determine sX.
10. De los clientes que ordenan cierto tipo de computadora personal, 20% ordena una tarjeta gráfica actualizada, 30% memoria extra, 15% ordena tanto una tarjeta gráfica actualizada como memoria extendida, y 35% no ordena ninguna.
Se eligen de forma aleatoria quince órdenes. Sea X1, X2, X3,
X4, los respectivos números de órdenes en las cuatro categorías dadas.
a) Determine P(X1 ⫽ 3, X2 ⫽ 4, X3 ⫽ 2 y X4 ⫽ 6).
b) Determine P(X1 ⫽ 3).
11. Cierta marca de automóvil viene equipada con un motor en
uno de cuatro tamaños (en litros): 2.8, 3.0, 3.3, o 3.8. El
10% de los clientes ordena el motor de 2.8 litros, 40% de
3.0, 30% de 3.3 y 20% de 3.8. Se selecciona una muestra
aleatoria de 20 órdenes para una auditoría.
4.5
Distribución normal
231
a) ¿Cuál es la probabilidad de que el número de órdenes
para los motores de 2.8, 3.0, 3.3 y 3.8 litros sean 3, 7, 6
y 4, respectivamente?
ratura real 10% de las veces, y lecturas mayores a 0.1°C por
debajo de la temperatura real 20% de las veces.
b) ¿Cuál es la probabilidad de que haya más de diez órdenes de los motores de 3.0 litros?
a) En una serie de diez lecturas independientes, ¿cuál es la
probabilidad de que cinco se encuentren dentro de 0.1°C
de la temperatura real, dos a más de 0.1°C por encima de
ella, y tres a más de 0.1°C debajo de dicho parámetro?
12. Un termopar localizado dentro de cierto medio produce lecturas con margen de 0.1°C de la temperatura real 70% de
las veces, lecturas mayores a 0.1°C por encima de la tempe-
4.5
b) ¿Cuál es la probabilidad de que más de ocho lecturas se
encuentren dentro de 0.1°C de la temperatura real?
Distribución normal
La distribución normal (también conocida como distribución de Gauss) es la distribución
más utilizada en la estadística. Constituye un buen modelo para muchas, aunque no para todas las poblaciones continuas. Parte de esto último se debe al teorema del límite central, que
se analizará en la sección 4.10.
La distribución normal es continua en vez de discreta. La media de una variable aleatoria normal puede tener cualquier valor y la varianza cualquier valor positivo. La función de
densidad de probabilidad de una variable aleatoria normal con media m y varianza s2 está dada por
1
2
2
f (x) = √ e−(x−µ) /2σ
(4.23)
σ 2π
Al final de esta sección se comprueba el hecho de que m y s2 son la media y la varianza, respectivamente. Si X es una variable aleatoria cuya función de densidad de probabilidad
es normal con media m y varianza s2, se expresa como X ⬃ N(m, s2).
Resumen
Si X ⬃ N(m, s2), entonces la media y la varianza de X están dadas por
mX ⫽ m
sX2 ⫽ s 2
La figura 4.4 presenta una gráfica de la función de densidad de probabilidad normal con
media m y desviación estándar s. Algunas veces a la función de densidad de probabilidad normal se le llama curva normal. Observe que ésta es simétrica alrededor de m, de tal forma que
m representa la mediana, así como la media. También, toda población normal se caracteriza por
Aproximadamente 68% de la población se encuentra en el intervalo m ⫾ s.
Aproximadamente 95% de la población se encuentra en el intervalo m ⫾ 2s.
Aproximadamente 99.7% de la población se encuentra en el intervalo m ⫾ 3s.
La proporción de una población normal que se encuentra a cierto número de desviaciones estándar de la media es la misma en cualquier población normal. Por esta razón, cuando
se trabaja con poblaciones normales, se convierte las unidades en las cuales se midió originalmente las unidades de la población a unidades estándar. Estas últimas indican a cuántas
desviaciones estándar se encuentra un dato de la media poblacional.
232
CAPÍTULO 4
Distribuciones comúnmente usadas
≈ 99.7%
≈ 95%
≈ 68%
m ⫺ 3s
m ⫺ 2s
m ⫺ 1s
m
m ⫹ 1s
m ⫹ 2s
m ⫹ 3s
FIGURA 4.4 Función de densidad de probabilidad de una variable aleatoria normal con
media m y varianza s2.
Ejemplo
4.38
Suponga que la estatura en una población de mujeres sigue una curva normal con media m ⫽
64 pulgadas y desviación estándar s ⫽ 3 pulgadas. La estatura de dos mujeres elegidas aleatoriamente es de 67 y 62 pulgadas, respectivamente. Convierta estas estaturas a unidades estándares.
Solución
Una estatura de 67 pulgadas es tres pulgadas mayor que la media de 64, y tres pulgadas es
igual a una desviación estándar. Por tanto, 67 pulgadas es una desviación estándar mayor que
la media y equivalente a una unidad estándar. Una estatura de 62 pulgadas es 0.67 desviaciones estándar menor que la media, por lo que 62 pulgadas es equivalente a ⫺ 0.67 unidades
estándar.
En general, se convierte a unidades estándar al restar la media y dividir entre la desviación estándar. Por consiguiente, si x es una unidad seleccionada de una población normal con
media m y varianza s2, la unidad estándar equivalente a x es el número z, donde
z=
x−μ
σ
(4.24)
Algunas veces, al número z se le denomina “puntaje z” de x, que representa un elemento extraído de una población normal con media 0 y desviación estándar 1. A aquélla se le llama
población normal estándar.
Ejemplo
4.39
Las láminas de aluminio utilizadas para fabricar latas de bebida tienen un espesor (en milésimas de pulgada) que se distribuye normalmente con una media de 10 y desviación estándar
de 1.3. Una lámina particular tiene un espesor de 10.8 milésimas de pulgadas. Determine el
puntaje z.
Solución
La cantidad 10.8 es un dato de una población normal con media m ⫽ 10 y desviación estándar s ⫽ 1.3. Por consecuencia,
4.5
z=
Distribución normal
233
10.8 − 10
1.3
= 0.62
Ejemplo
4.40
Con referencia al ejemplo 4.39, el espesor de cierta lámina tiene un puntaje z de ⫺1.7. Determine el espesor de la lámina en las unidades originales en milésimas de pulgada.
Solución
Usando la ecuación (4.24), sustituyendo ⫺1.7 para z y despejando x. Se obtiene
−1.7 =
x − 10
1.3
Al despejar x se obtiene x ⫽ 7.8. La lámina tiene un espesor de 7.8 milésimas de pulgada.
La proporción de una población normal que se encuentra dentro de un intervalo específico es igual al área que se encuentra debajo de la densidad de probabilidad normal en dicho intervalo. Esto último sugiere que dichas proporciones se calculan al integrar la densidad
de probabilidad normal dada en la ecuación (4.23). Lo que es muy interesante es que las áreas
debajo de esta curva no pueden determinarse mediante el método, enseñado en cálculo elemental, de encontrar la integral de la función y colocar los límites de integración. Lo anterior
se debe a que la integral de esta función es una serie infinita y no puede escribirse con exactitud. En su lugar, las áreas debajo de esta curva deben aproximarse numéricamente.
Las áreas debajo de la curva normal estándar (media 0, varianza 1) se han tabulado extensivamente. Una tabla común, denominada tabla normal estándar, o tabla z, es la tabla
A.2 (en el Apéndice A). Para determinar las áreas debajo de una curva normal con diferentes
media y varianza, se convierten a unidades estándares y se utiliza la tabla z. La tabla A.2 proporciona las áreas en la cola izquierda de la curva para valores de z. Es posible calcular otras
áreas al sustraer o usando el hecho de que el área total debajo de la curva es igual a 1. Ahora
se presentan diversos ejemplos para mostrar el uso de la tabla z.
Ejemplo
4.41
Determine el área debajo de la curva normal a la izquierda de z ⫽ 0.47.
Solución
De la tabla z, el área es de 0.6808. Véase la figura 4.5.
0.6808
0 0.47
FIGURA 4.5 Solución al ejemplo 4.41.
234
CAPÍTULO 4
Ejemplo
4.42
Distribuciones comúnmente usadas
Determine el área debajo de la curva normal y a la derecha de z ⫽ 1.38.
Solución
De la tabla z, el área a la izquierda de z ⫽ 1.38 es de 0.9162. Por tanto, el área a la derecha
es 1 ⫺ 0.9162 ⫽ 0.0838. Véase la figura 4.6.
0.9162
0.0838
0
1.38
FIGURA 4.6 Solución al ejemplo 4.42.
Ejemplo
4.43
Determine el área debajo de la curva normal entre z ⫽ 0.71 y z ⫽ 1.28.
Solución
De la tabla z, el área a la izquierda de z ⫽ 1.28 es de 0.8997. El área a la izquierda de z ⫽
0.71 es de 0.7611. Por consiguiente, el área entre z ⫽ 0.71 y z ⫽ 1.28 es 0.8997 ⫺ 0.7611 ⫽
0.1386. Véase la figura 4.7.
0.8997
0.7611
0.1386
–
0
1.28
=
0 0.71
0 0.71 1.28
FIGURA 4.7 Solución al ejemplo 4.43.
Ejemplo
4.44
¿A qué puntaje z corresponde el 75o. percentil de una curva normal? ¿El 25o. percentil? ¿La
mediana?
Solución
Para responder esta pregunta se utiliza al revés la tabla z. Se necesita encontrar el puntaje z
para el que 75% del área de la curva está a la izquierda. A partir del contenido de la tabla, el
área más cercana a 75% es 0.7486, correspondiente al puntaje z de 0.67. Por tanto, el 75o.
percentil es aproximadamente de 0.67. Por simetría de la curva, el 25o. percentil es z ⫽ ⫺0.67
(esto también puede verse directamente en la tabla). Véase la figura 4.8. La mediana es z ⫽ 0.
4.5
Distribución normal
235
≈ 25%
≈ 75%
0
0.67
⫺0.67
0
FIGURA 4.8 Solución al ejemplo 4.44.
Ejemplo
4.45
Los tiempos de vida de las baterías en cierta aplicación se distribuyen normalmente con media de 50 horas y desviación estándar de cinco horas. Determine la probabilidad de que se elija aleatoriamente una batería que dure entre 42 y 52 horas.
Solución
Sea X el tiempo de vida de una batería elegida aleatoriamente. Entonces X ⬃ N(50, 52). La figura 4.49 muestra la función de densidad de probabilidad de la población N(50, 52). El área
sombreada representa P(42 ⬍ X ⬍ 52), la probabilidad de que una batería seleccionada de
forma aleatoria tenga una duración entre 42 y 52 horas. Para calcular esta área, se hará uso de
la tabla z. Primero se necesita convertir las cantidades 42 y 52 a unidades estándar. Se tiene
z=
42 − 50
= −1.60
5
z=
52 − 50
= 0.40
5
De la tabla z, el área a la izquierda de z ⫽ ⫺1.60 es 0.0548, y el área a la izquierda de z ⫽
0.40 es 0.6554. La probabilidad de que una batería tenga tiempo de vida entre 42 y 52 horas
es 0.6554 ⫺ 0.0548 ⫽ 0.6006.
0.6006
42
z = ⫺1.6
50 52
z = 0.4
FIGURA 4.9 Solución al ejemplo 4.45.
Ejemplo
4.46
Con referencia al ejemplo 4.45, determine el 40o. percentil de los tiempos de vida de las baterías.
Solución
De la tabla z, el área más cercana a 0.4000 es 0.4013, correspondiente al puntaje z de ⫺0.25.
La población de los tiempos de vida tiene una media de 50 y una desviación estándar de 5. El
40o. percentil es el punto 0.25 desviaciones estándar menor a la media. Este valor se determina al convertir el puntaje z en uno nuevo, utilizando la ecuación (4.24):
236
CAPÍTULO 4
Distribuciones comúnmente usadas
−0.25 =
x − 50
5
Al despejar x se tiene que x ⫽ 48.75. El 40o. percentil de los tiempos de vida de las baterías
es de 48.75 horas. Véase la figura 4.10.
≈ 40%
48.75 50
z = ⫺0.25
FIGURA 4.10 Solución al ejemplo 4.46.
Ejemplo
4.47
Un proceso fabrica cojinetes de bolas cuyos diámetros se distribuye normalmente con media
de 2.505 cm y desviación estándar de 0.008 cm. Las especificaciones requieren que el diámetro esté dentro del intervalo 2.5 ⫾ 0.01 cm. ¿Qué proporción de cojinetes de bolas cumple con
la especificación?
Solución
Sea X el diámetro de un cojinete de bolas seleccionado aleatoriamente. Entonces X ⬃
N(2.505, 0.0082). La figura 4.11 presenta la función de densidad de probabilidad de la población N(2.505, 0.0082). El área sombreada representa P(2.49 ⬍ X ⬍ 2.51), que es la proporción de cojinetes de bolas que cumplen con la especificación.
Se calcula los puntajes z de 2.49 y 2.51:
z=
2.49 − 2.505
= −1.88
0.008
z=
2.51 − 2.505
= 0.63
0.008
El área a la izquierda de z ⫽ ⫺1.88 es 0.0301. El área a la izquierda de z ⫽ 0.63 es 0.7357.
El área entre z ⫽ 0.63 y z ⫽ ⫺1.88 es 0.7357 ⫺ 0.0301 ⫽ 0.7056. Aproximadamente 70.56%
de los diámetros satisface la especificación.
0.7056
2.49
z = ⫺1.88
2.505 2.51
z = 0.63
FIGURA 4.11 Solución al ejemplo 4.47.
4.5
Ejemplo
4.48
Distribución normal
237
Con referencia al ejemplo 4.47, el proceso puede recalibrarse para que la media sea igual a
2.5 cm, el centro del intervalo de la especificación. La desviación estándar del proceso sigue
siendo de 0.008 cm. ¿Qué proporción de los diámetros satisface la especificación?
Solución
El método de solución es el mismo que en el ejemplo 4.47. La media es de 2.500 en vez de
2.505. Los cálculos se realizan de la siguiente manera:
z=
2.49 − 2.50
= −1.25
0.008
z=
2.51 − 2.50
= 1.25
0.008
El área a la izquierda de z ⫽ ⫺ 1.25 es 0.1056. El área a la izquierda de z ⫽ 1.25 es 0.8944.
El área entre z ⫽ 1.25 y z ⫽ ⫺ 1.25 es 0.8944 ⫺ 0.1056 ⫽ 0.7888. Véase la figura 4.12. El
recalibrado aumenta a 78.88% la proporción de diámetros que satisface la especificación.
0.7888
2.49
z = ⫺1.25
2.50
2.51
z = 1.25
FIGURA 4.12 Solución al ejemplo 4.48.
Ejemplo
4.49
Con referencia a los ejemplos 4.47 y 4.48, suponga que se ha recalibrado el proceso de tal forma que la media del diámetro mide ahora 2.5 cm. ¿A qué valor debe reducirse la desviación
estándar para que 95% de los diámetros satisfaga la especificación?
Solución
El intervalo de especificación es 2.49 ⫺ 2.51 cm. Se debe encontrar un valor de s para que
este intervalo abarque 95% de la población de diámetros de cojinetes de bolas. Véase la figura 4.13. El puntaje z que tiene 2.5% del área a la izquierda es z ⫽ ⫺ 1.96. El puntaje z que
tiene 2.5% del área a su derecha es z ⫽ 1.96 (esto último se obtiene de la simetría de la curva). De ahí que el límite menor de la especificación, 2.49, tenga un puntaje z de ⫺1.96, mientras que el límite superior de 2.51 tiene un puntaje z de 1.96. Cualesquiera de estos hechos se
puede utilizar para encontrar a s. De la ecuación (4.24),
1.96 =
Al despejar s se tiene que s ⫽ 0.0051 cm.
2.51 − 2.50
σ
238
CAPÍTULO 4
Distribuciones comúnmente usadas
≈ 95%
2.49
z = ⫺1.96
2.50
2.51
z = 1.96
FIGURA 4.13 Solución al ejemplo 4.49. Si s ⫽ 0.0051, entonces 95% de la población
estará entre 2.49 y 2.51.
Estimación de los parámetros de una distribución normal
Los parámetros m y s de una distribución normal representan su media y varianza, respectivamente. Por tanto, si X1, . . . , Xn son una muestra aleatoria de una distribución N(m, s2), m
—
se estima con la media muestral X y s 2 se estima con la varianza muestral s2. Al igual √
que
√
—
con cualquier otra media, la incertidumbre en X es σ/ n, que será reemplazada con s/ n
—
si no se conoce a s. Además, m—
X ⫽ m, por lo que X es un estimador no sesgado de m.
Combinaciones lineales de variables aleatorias
independientes normales
Una de las características más notables de la distribución normal consiste en que las combinaciones lineales de variables aleatorias independientes normales son en sí mismas variables
aleatorias. Para ser más específico, suponga que X1 ⬃ N(m1, s12), X2 ⬃ N(m2, s22), . . . , Xn ⬃
N(mn, sn2) son variables aleatorias independientes normales. Observe que las medias y varianzas de estas variables aleatorias pueden diferir entre sí. Sean c1, c2, . . . , cn constantes. Entonces, la combinación lineal c1X1 ⫹ c2X2 ⫹ . . . ⫹ cnXn es una variable aleatoria distribuida
normalmente. La media y la varianza de la combinación lineal son c1m1 ⫹ c2m2 ⫹ . . . ⫹ cnmn
y c12s12 ⫹ c22 s22 ⫹ . . . ⫹ cn2sn2, respectivamente (véanse las ecuaciones 2.49 y 2.53 en la sección 2.5).
Resumen
Sean X1, X2, . . . , Xn independientes y distribuidas normalmente con medias m1,
m2, . . . , mn y varianzas s 21, s 22 . . . , s 2n. Sean c1, c2, . . . , cn constantes, y sea
c1X1 ⫹ c2X2 ⫹ . . . ⫹ cn Xn una combinación lineal, entonces
c1X1 ⫹ c2X2 ⫹ . . . ⫹ cnXn ⬃ N(c1m1 ⫹ c2m2 ⫹ . . . ⫹ cnmn, c12s12 ⫹ c22 s22 ⫹ . . . ⫹ cn2sn2)
(4.25)
Ejemplo
4.50
En el artículo “Advances in Oxygen Equivalent Equations for Predicting the Properties of
Titanium Welds” (D. Harwig, W. Ittiwattana y H. Castner, en The Welding Journal, 2001:
126s-136s), los autores proponen una ecuación de equivalencia al oxígeno para predecir la re-
4.5
Distribución normal
239
sistencia, ductilidad y dureza de soldaduras hechas casi de titanio puro. La ecuación es E ⫽
2C ⫹ 3.5N ⫹ O, donde E es la equivalencia del oxígeno, y C, N y O las proporciones de peso,
en partes por millón, de carbono, nitrógeno y oxígeno, respectivamente (se omitió un término constante que consiste en el contenido de hierro). Suponga que para un nivel particular de
titanio puro comercial, las cantidades C, N y O son aproximadamante independientes y se distribuyen normalmente con medias mC ⫽ 150, mN ⫽ 200, mO ⫽ 1 500 y desviaciones estándar
sC ⫽ 30, sN ⫽ 60, sO ⫽ 100. Determine la distribución de E. Determine P(E ⬎ 3 000).
Solución
Puesto que E es una combinación lineal de variables aleatorias normales independientes, su
distribución es normal. Ahora se debe determinar la media y la varianza de E. Utilizando la
ecuación (4.25) se calcula
μE = 2μC + 3.5μN + 1μO
= 2(150) + 3.5(200) + 1(1 500)
σE2
= 2 500
= 22 σC2 + 3.52 σN2 + 12 σO2
= 22 (302 ) + 3.52 (602 ) + 12 (1002 )
= 57 700
Se concluye que E ⬃ N(2 500, 57 700).
√
Para calcular P(E ⬎ 3 000), se calcula el puntaje z: z = (3 000 − 2 500)/ 57 700 =
2.08. El área a la derecha de z ⫽ 2.08 debajo de la curva normal es 0.0188. Por tanto, P(E ⬎
3 000) ⫽ 0.0188.
Si X1, X2, . . . , Xn es una muestra aleatoria de cualquier población con media m y va—
2
2
—
rianza s2, entonces la media muestral X tiene una media m—
X ⫽ m y varianza sX ⫽ s /n. Si
—
la población es normal, entonces X también es normal, ya que es una combinación lineal de
X1, . . . , Xn con coeficientes c1 ⫽ . . . ⫽ cn ⫽ 1/n.
Resumen
Sean X1, . . . , Xn independientes y distribuidas normalmente con media m y varianza
s2, entonces
σ2
X ∼ N μ,
(4.26)
n
Otras combinaciones lineales importantes son la suma y resta de dos variables aleatorias. Si X y Y son variables aleatorias independientes, la suma X ⫹ Y y la resta X ⫺ Y son combinaciones lineales. Las distribuciones X ⫹ Y y X ⫺ Y se puede determinar utilizando la
ecuación (4.25) con c1 ⫽ 1, c2 ⫽ 1 para X ⫹ Y y c1 ⫽ 1, c2 ⫽ ⫺ 1 para X ⫺ Y.
240
CAPÍTULO 4
Distribuciones comúnmente usadas
Resumen
Sean X y Y independientes, con X ⬃ N(mX, sX2 ) y Y ⬃ N(mY, sY2), entonces
X ⫹ Y ⬃ N(mX ⫹ mY, sX2 ⫹ sY2)
(4.27)
X ⫺ Y ⬃ N(mX ⫺ mY, sX2 ⫹ sY2)
(4.28)
¿Cómo puede saberse si los datos que se tiene
provienen de una población normal?
En la práctica, a menudo se tiene una muestra de alguna población y se le debe utilizar para
decidir si la distribución de la población se aproxima a la normal. Si la muestra es razonablemente grande, su histograma es buena indicación. Las muestras grandes de poblaciones normales tienen histogramas que se parecen a la función de densidad normal: con un pico en el
centro, y decrecientes más o menos simétricamente en cada lado. Las gráficas de probabilidad, que se analizarán en la sección 4.9, son otra buena forma de determinar si una muestra
grande proviene de una población que es aproximadamente normal. Para muestras pequeñas,
es difícil determinar si la distribución normal es la apropiada. Un hecho importante es éste:
las muestras de poblaciones normales raramente tienen datos atípicos. Por tanto, no se utiliza la distribución normal en conjuntos de datos que tengan valores atípicos. Esto es cierto
cuando el tamaño muestral es pequeño. Infortunadamente, para conjuntos pequeños de datos
que no tienen datos atípicos, es difícil determinar si la población es aproximadamente normal.
En general, se requiere de cierto conocimiento del proceso que generó los datos.
Deducción de la media y varianza de una variable aleatoria normal
Sea X ⬃ N(m, s2). Se demuestra que mX ⫽ m y sX2 ⫽ s2. Empleando la definición de la
media poblacional de una variable aleatoria continua (ecuación 2.35 de la sección 2.4),
∞
1
2
2
√ xe−(x−µ) /2σ dx
µX =
−∞ σ 2π
Se hace la sustitución de z ⫽ (x ⫺ m)/s. Entonces x ⫽ sz ⫹ m y dx ⫽ sdz. Se obtiene
∞
1
2
√ (σ z + µ)σ e−z /2 dz
µX =
−∞ σ 2π
∞
∞
1
1
2
2
√ ze−z /2 dz + µ
√ e−z /2 dz
=σ
2π
2π
−∞
−∞
El cálculo directo demuestra que
∞
−∞
Asimismo,
1
2
√ ze−z /2 dz = 0
2π
4.5
∞
−∞
Distribución normal
241
1
2
√ e−z /2 dz = 1
2π
debido a que es la integral de la función de densidad de probabilidad N(0, 1) sobre todos
sus posibles valores.
Por tanto,
mX ⫽ s(0) ⫹ m(1) ⫽ m
Para demostrar que sX2 ⫽ s2 se utiliza la ecuación (2.36) (de la sección 2.4):
∞
1
2
2
σX2 =
(x − µX )2 √ e−(x−µ) /2σ dx
σ
2π
−∞
Se hace la sustitución de z ⫽ (x ⫺ m)/s. Recuerde que mX ⫽ m. Entonces
∞
1
2
σX2 =
σ 2 z2 √ σ e−z /2 dz
σ 2π
−∞
∞
1
2
√ z2 e−z /2 dz
= σ2
2π
−∞
Al integrar por partes dos veces se demuestra que
∞
1
2
√ z2 e−z /2 dz = 1
2π
−∞
Por consiguiente, sX2 ⫽ s2.
Ejercicios para la sección 4.5
1. Determine el área bajo la curva normal
a) A la derecha de z ⫽ ⫺ 0.85.
b) Entre z ⫽ 0.40 y z ⫽ 1.30.
c) Entre z ⫽ ⫺ 0.30 y z ⫽ 0.90.
d) Desde z ⫽ ⫺ 1.50 hasta z ⫽ ⫺ 0.45.
2. Determine el área bajo la curva normal
a) A la izquierda de z ⫽ 0.56.
b) Entre z ⫽ ⫺ 2.93 y z ⫽ ⫺ 2.06.
c) Entre z ⫽ ⫺ 1.08 y z ⫽ 0.70.
d) Desde z ⫽ 0.96 hasta z ⫽ 1.62.
3. Las puntuaciones de una prueba estandarizada se distribuyen normalmente con media de 480 y desviación estándar
de 90.
a) ¿Cuál es la proporción de puntuaciones mayores a 700?
b) ¿Cuál es el 25o. percentil de las puntuaciones?
c) Si la puntuación de alguien es de 600, ¿en qué percentil
se encuentra?
d) ¿Qué proporción de las puntuaciones se encuentra entre
420 y 520?
4. Suponga que la estatura de mujeres en una población sigue
la curva normal con media de 64.3 pulgadas y desviación
estándar de 2.6 pulgadas.
a) ¿Qué proporción de mujeres tiene estatura entre 60 y 66
pulgadas?
b) La estatura de una mujer es 0.5 de desviación estándar
mayor a la media. ¿Qué proporción de mujeres mide
más que ella?
c) ¿Cuánto mide una mujer cuya estatura se encuentra en
el 90o. percentil?
242
CAPÍTULO 4
Distribuciones comúnmente usadas
d) Se elige aleatoriamente una mujer de esta población.
¿Cuál es la probabilidad de que ella mida más de 67 pulgadas?
e) Se elige aleatoriamente a cinco mujeres de esta población. ¿Cuál es la probabilidad de que sólo una de ellas
mida más de 67 pulgadas?
5. La resistencia de una aleación de aluminio se distribuye
normalmente con media de 10 gigapascales (GPa) y desviación estándar de 1.4 GPa.
a) ¿Cuál es la probabilidad de que una muestra de esta
aleación tenga resistencia mayor a 12 GPa?
b) Determine el primer cuartil de la resistencia de esta
aleación.
c) Determine el 95o. percentil de la resistencia de esta
aleación.
6. En una universidad, las puntuaciones del SAT en matemáticas de una clase de primer año fue de, en promedio, 650 y
tuvo desviación estándar de 100. El máximo puntaje posible es de 800. ¿Es posible que el histograma de las puntuaciones de estos alumnos siga una curva normal? Explique.
7. La penicilina es producida por el hongo Penicillium, que
crece en un caldo, cuyo contenido de azúcar debe controlarse con cuidado. La concentración óptima de azúcar es de
4.9 mg/mL. Si la concentración excede los 6 mg/mL, el
hongo muere y el proceso debe suspenderse todo el día.
a) Si la concentración de azúcar en tandas de caldo se distribuye normalmente con media 4.9 mg/mL y desviación estándar 0.6 mg/mL, ¿en qué proporción de días se
suspenderá el proceso?
b) El distribuidor ofrece vender caldo con una concentración de azúcar que se distribuye normalmente con media de 5.2 mg/mL y desviación estándar de 0.4 mg/mL.
¿Este caldo surtirá efectos con menos días de producción perdida? Explique.
8. Un método de cromatografía utilizado para purificar a una
proteína también destruye parte de ésta, en un proceso denominado desnaturación. Un método particular recupera
una media de 55% (0.55) de la proteína y tiene desviación
estándar de 0.15. La cantidad recuperada se distribuye normalmente.
a) En cierto proceso industrial, no es posible obtener una
recuperación menor a 0.30 más de 5% de las veces. ¿Este proceso cumple con este requisito? Explique.
b) En otro proceso, la recuperación debe ser mayor a 0.50
al menos 95% de las veces. Si la media de la recupera-
ción se distribuye normalmente con una media de 0.60,
¿cuál es el valor más grande que puede tener la desviación estándar para cumplir con este requisito?
9. Se hace una perforación cilíndrica en un molde y se coloca
un pistón cilíndrico en la perforación. La holgura es igual a
la mitad de la diferencia entre los diámetros de la perforación y el pistón. El diámetro de la perforación se distribuye
normalmente con media de 15 cm y desviación estándar de
0.025 cm, y el diámetro del pistón se distribuye con media
14.88 cm y desviación estándar 0.015 cm.
a) Determine la media de la holgura.
b) Determine la desviación estándar de la holgura.
c) ¿Cuál es la probabilidad de que la holgura mida menos
de 0.05 cm?
d ) Determine el 25o. percentil de la holgura.
e) Las especificaciones requieren que la holgura mida entre 0.05 y 0.09 cm. ¿Cuál es la probabilidad de que la
holgura satisfaga la especificación?
f ) Se puede ajustar la media del diámetro de la perforación. ¿A qué valor debe ajustarse para maximizar la probabilidad de que la holgura esté entre 0.05 y 0.09 cm?
10. Los ejes fabricados para el uso de dispositivos de almacenamiento óptico tienen diámetros que se distribuyen normalmente con media m ⫽ 0.652 y desviación estándar s ⫽
0.003 cm. La especificación para el diámetro del eje mide
entre 0.650 ⫾ 0.005 cm.
a) ¿Qué proporción de los ejes fabricados por este proceso
cumple con la especificación?
b) La media del proceso puede ajustarse utilizando calibración. Si se establece que la media mide 0.650 cm, ¿qué
proporción de los ejes cumplirá con la especificación?
c) Si se establece que la media mide 0.650 cm, ¿cuál debe
ser la desviación estándar para que 99% de los ejes cumpla con la especificación?
11. El volumen de latas llenadas por cierta máquina se distribuye con media de 12.05 onzas y desviación estándar de 0.03
onzas.
a) ¿Qué proporción de latas contiene menos de 12 onzas?
b) La media del proceso se puede ajustar utilizando calibración. ¿En qué valor debe fijarse la media para que
99% de las latas contenga 12 onzas o más?
c) Si la media del proceso sigue siendo de 12.05 onzas, ¿en
qué valor debe fijarse la media para que 99% de las latas contenga 12 onzas o más?
4.5
12. Un proceso de recubrimiento de películas genera filmes cuyo espesor se distribuye con media de 110 micrones y desviación estándar de 10 micrones. En cierta aplicación, el
espesor mínimo aceptable es de 90 micrones.
a) ¿Qué proporción de películas estarán demasiado delgadas?
b) ¿A qué valor debe establecerse la media para que sólo
1% de las películas esté muy delgado?
c) Si la media sigue siendo 110, ¿cuál debe ser la desviación estándar para que sólo 1% de las películas sea muy
delgado?
13. Un proceso hilador de fibras produce una fibra cuya resistencia se distribuye con media de 75 N/m2. La resistencia
mínima aceptable es de 65 N/m2.
a) 10% de las fibras producidas mediante el método actual
no cumple con la especificación mínima. ¿Cuál es la
desviación estándar de la resistencia de las fibras en el
proceso actual?
2
b) Si la media sigue siendo de 75 N/m , ¿cuál debe ser la
desviación estándar para que sólo 1% de las fibras no satisfaga la especificación?
c) Si la desviación estándar es de 5 N/m2, ¿en qué valor debe fijarse la media para que sólo 1% de las fibras no satisfaga la especificación?
14. El programa de garantía de calidad de cierto proceso de formulación de un adhesivo consiste en medir qué tanto el adhesivo pega un pedazo de plástico a una superficie de
vidrio. Cuando el proceso funciona correctamente, la fuerza del adhesivo X se distribuye con media de 200 N y desviación estándar de 10 N. Cada hora, usted hace una
medición de la fuerza del adhesivo. Usted debe informar a
su supervisor si su medición indica que el proceso se ha
desviado de su distribución objetivo.
a) Calcule P(X ⱕ 160) bajo el supuesto de que el proceso
está funcionando correctamente.
b) Con base en su respuesta al inciso a), si el proceso funciona bien, ¿una fuerza de 160 N sería inusualmente pequeña? Explique.
c) Si usted observa una fuerza adhesiva de 160 N, ¿esto último sería una evidencia de que el proceso ya no funciona correctamente? Explique.
d) Encuentre P(X ⱖ 203), bajo la suposición de que el proceso está funcionando bien.
e) Con base en su respuesta del inciso d), si el proceso funciona correctamente, ¿sería una fuerza de 203 N inusualmente grande? Explique.
Distribución normal
243
f ) Si usted observa una fuerza adhesiva de 203 N, ¿lo anterior sería una evidencia de que el proceso ya no funciona correctamente? Explique.
g) Encuentre P(X ⱕ 195), bajo la suposición de que el proceso está funcionado bien.
h) Con base en su respuesta del inciso g), si el proceso está funcionando correctamente, ¿sería una fuerza de 195
N inusualmente pequeña? Explique.
i) Si usted observa una fuerza adhesiva de 195 N, ¿esto sería una evidencia de que el proceso ya no funciona correctamente? Explique.
15. Una instalación de luz tiene dos focos. El A es de un tipo
cuya duración se distribuye con media de 800 horas y desviación estándar de 100 horas. El B tiene una duración que
se distribuye con media de 900 horas y desviación estándar
de 150 horas. Suponga que las duraciones de los focos son
independientes.
a) ¿Cuál es la probabilidad de que el foco B dure más que
el A?
b) ¿Cuál es la probabilidad de que el foco B dure 200 horas más que el A?
c) Otra instalación de luz tiene sólo un foco. Se pone uno
del tipo A y cuando se funde se instala otro de tipo B.
¿Cuál es la probabilidad de que la duración total de ambos sea mayor a 2 000 horas?
16. La molaridad de un soluto en solución se define como el número de moles del soluto por litro de solución (1 mol ⫽
6.02 × 1023 moléculas). Si X es la molaridad de una solución
de cloruro de sodio (NaCl) y Y es la molaridad de una solución de carbonato de sodio (Na2CO3), la molaridad del ion
de sodio (Na⫹) en una solución hecha de partes iguales
NaCl y Na2CO3 está dada por M ⫽ 0.5X ⫹ Y. Suponga que
X y Y son independientes y se distribuyen normalmente y
que X tiene media de 0.450 y desviación estándar de 0.050,
y Y tiene media de 0.250 y desviación estándar de 0.025.
a) ¿Cuál es la distribución de M?
b) Determine P(M ⬎ 0.5).
17. Una compañía recibe importante cargamento de pernos. Éstos
se utilizarán en una aplicación que necesita de una torsión
de 100 J. Antes de que se acepte el cargamento, un ingeniero especialista en control de calidad sacará una muestra de
12 pernos y medirá la torsión necesaria para romper a cada
uno de ellos. El cargamento será aceptado si el ingeniero
concluye que menos de 1% de los pernos tiene torsión de
ruptura menor a 100 J.
244
CAPÍTULO 4
Distribuciones comúnmente usadas
a) Si los 12 valores son 107, 109, 111, 113, 113, 114, 114,
115, 117, 119, 122, 124, calcule la media y la desviación
estándar muestral.
b) Suponga que se saca una muestra de 12 valores de una
población normal, y suponga que la media y la desviación estándar muestrales calculadas en el inciso a) son
realmente la media y la desviación estándar de la población. Calcule la proporción de pernos cuya torsión de
ruptura es menor a 100 J. ¿Será aceptado el cargamento?
4.6
c) ¿Qué pasará si los 12 valores hubieran sido 108, 110,
112, 114, 114, 115, 115, 116, 118, 120, 123, 140? Utilice el método descrito en los incisos a) y b) para determinar si el cargamento hubiera sido aceptado.
d) Compare los conjuntos de 12 valores en los incisos a) y
c). ¿En qué muestra los pernos son más resistentes?
e) ¿El método es válido para ambas muestras? ¿Por qué sí
o por qué no?
Distribución lognormal
Para datos que tienen valores atípicos, la distribución normal no es apropiada. La distribución
lognormal, que tiene relación con la distribución normal, es, a menudo, buena opción para
estos conjuntos de datos. La distribución lognormal se deriva de la distribución normal de la
siguiente manera: Si X es una variable aleatoria normal con media m y varianza s2, entonces
la variable aleatoria Y ⫽ eX tiene distribución lognormal con parámetros m y s2. Observe
que si Y tiene una distribución normal con parámetros m y s2, entonces X ⫽ ln Y tiene una
distribución normal con media m y varianza s2.
Resumen
Si X ⬃ N(m, s2), entonces la variable aleatoria Y ⫽ eX tiene distribución lognormal con parámetros m y s2.
Si Y tiene distribución lognormal con parámetros m y s2, entonces la variable aleatoria X ⫽ ln Y tiene la distribución N(m, s2).
La función de densidad de probabilidad de una variable aleatoria lognormal con parámetros m y s2 es
f (x) =
⎧
⎪
⎨
⎪
⎩
1
1
√
exp − 2 (ln x − µ)2
2σ
σ x 2π
si x > 0
0
si x ≤ 0
(4.29)
La figura 4.14 presenta una gráfica de la función de densidad lognormal con parámetros m ⫽ 0 y s ⫽ 1. Observe que la función de densidad está sesgada. Ésta es la razón por la
que se utiliza la distribución lognormal para modelar procesos que tienden a producir ocasionalmente valores grandes o atípicos.
4.6
Distribución lognormal
245
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
5
10
15
FIGURA 4.14 Función de densidad de probabilidad de la distribución lognormal con
parámetros m ⫽ 0 y s ⫽ 1.
Puede demostrarse mediante métodos avanzados que si Y es una variable aleatoria lognormal con parámetros m y s2, entonces la media E(Y) y la varianza V(Y) están dadas por
2
E(Y) ⫽ em ⫹ s /2
2
2
V(Y) ⫽ e2m ⫹ 2s ⫺ e2m ⫹ 2s
(4.30)
Observe que si Y tiene una distribución lognormal, los parámetros m y s2 no se refieren a la
media y varianza de Y, sino que lo hacen a la media y varianza de la variable aleatoria normal ln Y. En la ecuación (4.30) se utiliza la notación E(Y) en vez de mY y V(Y) lugar de sY2,
para evitar confusiones entre m y s.
Ejemplo
4.51
El tiempo de vida de cierto componente sigue una distribución lognormal con parámetros
m ⫽ 1 día y s ⫽ 0.5 días. Determine la media del tiempo de vida de estos componentes. Encuentre la desviación estándar de los tiempos de vida.
Solución
Sea Y el tiempo de vida de un componente
escogido aleatoriamente. La media de2 Y determina-2
2
2(1) ⫹ 2(0.5)
da mediante la ecuación (4.30) es e1 ⫹ 0.5 /2 ⫽ 3.08
⫺ e2(1) ⫹ (0.5)
√ días. La varianza es e
⫽ 2.6948. Por tanto, la desviación estándar es 2.6948 ⫽ 1.64 días.
Para calcular las probabilidades de variables aleatorias lognormales, se saca el logaritmo y se utiliza la tabla z (tabla A.2). Los ejemplos 4.52 y 4.53 ilustran el método.
246
CAPÍTULO 4
Ejemplo
4.52
Con referencia al ejemplo 4.51, encuentre la probabilidad de que un componente dure más de
cuatro días.
Distribuciones comúnmente usadas
Solución
Sea Y el tiempo de vida de un componente seleccionado de forma aleatoria. Se necesita calcular P(Y ⬎ 4). No se puede utilizar la tabla z para Y, debido a que Y no proviene de una población normal. Sin embargo, ln Y proviene de una población normal; específicamente, ln Y
⬃ N(1, 0.52). Se expresa P(Y ⬎ 4) como una probabilidad que implica a ln Y:
P(Y ⬎ 4) ⫽ P(ln Y ⬎ ln 4) ⫽ P(ln Y ⬎ 1.386)
El puntaje z de 1.386 es
1.386 ⫺ 1.000
z ⫽ ———————
0.5
⫽ 0.77
De la tabla z se tiene que P(ln Y ⬎ 1.386) ⫽ 0.2206. (Véase la figura 4.15.) Se concluye que
aproximadamente 22% de los componentes durará más de cuatro días.
0.2206
1.00
1.386
z = 0.77
FIGURA 4.15 Solución al ejemplo 4.52.
Ejemplo
4.53
Con referencia al ejemplo 4.51 determine la mediana de los tiempos de vida. Encuentre el
80o. percentil de los tiempos de vida.
Solución
Sea Y el tiempo de vida de un componente escogido aleatoriamente. Sea M la mediana de los
tiempos de vida. Entonces P(Y ⱕ m) ⫽ 0.5. En logaritmos, se tiene que P(ln Y ⱕ ln m) ⫽ 0.5.
Esto significa que ln m es la mediana de ln Y. Ahora, ln Y ⬃ N(1, 0.52). Por consecuencia, ln
m ⫽ 1, por lo que m ⫽ e1 ⫽ 2.718.
Para encontrar al 80o. percentil, p80, se hace P(Y ⱕ p80) ⫽ 0.80. Por lo que P(ln Y ⱕ ln
p80) ⫽ 0.80. Esto significa que ln p80 es el 80o. percentil de ln Y. Ahora ln Y ⬃ N(1, 0.52). De
la tabla z, el puntaje z del 80o. percentil es 0.84. Por consiguiente, ln p80 ⫽ 1 ⫹ (0.84)(0.5)
⫽ 1.42, de tal forma que p80 ⫽ e1.42 ⫽ 4.14.
4.6
Distribución lognormal
247
Estimación de los parámetros de una distribución lognormal
Si Y es una variable aleatoria cuya distribución es lognormal con parámetros m y s2, entonces m y s2 son la media y la varianza, respectivamente, de ln Y. Por tanto, si Y1, . . . , Yn es
una muestra aleatoria de una población lognormal, primero se transforma a la escala logarítmica, definiendo X1 ⫽ ln Y1 , . . . , Xn ⫽ ln Yn. Ahora X1, . . . , Xn es una muestra aleatoria de
—
N(m, s2). Se estima m con X y s2 con la √
varianza muestral sX2. Al igual que con la media mues—
tral, la incertidumbre en X es σX = σ/ n, y si no se conoce s, se le estima con la desviación estándar muestral sX.
Ejemplo
4.54
Los diámetros (en mm) de las semillas de cierta planta siguen una distribución normal. Una
muestra aleatoria de cinco semillas tiene los diámetros 1.52, 2.22, 2.64, 2.00 y 1.69. Estime
los parámetros m y s.
Solución
Para estimar m y s, se sacan los logaritmos de los cinco valores de la muestra, para obtener
0.419, 0.798, 0.971, 0.693 y 0.525. La media muestral es 0.681 y la desviación estándar
muestral es 0.218. Por consecuencia, se estima que m̂ ⫽ 0.681, ŝ ⫽ 0.218.
¿Cómo puede saberse si los datos provienen
de una población lognormal?
Como se afirmó anteriormente, es muy raro que las muestras provenientes de poblaciones normales contengan datos atípicos. En contraste, las muestras provenientes de poblaciones lognormales a menudo tienen datos atípicos en la cola derecha. Es decir, las muestras contienen
pocos valores que son más grandes que el resto de los datos. Obviamente, esto último se refleja en la larga cola derecha de la función de densidad lognormal (figura 4.14). Para las
muestras con datos atípicos a la derecha, se transforman los datos, sacando el logaritmo natural (o cualquier logaritmo) de cada valor. Luego se intenta determinar si estos logaritmos
vienen de una población normal, graficándolos en un histograma o en una gráfica de probabilidad. En la sección 4.9 se analizarán las gráficas de probabilidad.
Observe que la densidad lognormal tiene sólo una cola larga, a la derecha. Por esta razón, las muestras de poblaciones lognormales tienen datos atípicos a la derecha, pero no a la
izquierda. Por consiguiente, no debe utilizarse la distribución lognormal en muestras con inusualmente muy pocos datos. Además, las poblaciones lognormales sólo tienen valores positivos, por lo que no puede emplearse la distribución lognormal en muestras que contengan
ceros o valores negativos. Por último, es importante observar que la transformación log no
siempre genera una muestra que se aproxima a la normal. Para verificar lo anterior, se tiene
que graficar un histograma o un gráfico de probabilidad (véase la sección 4.9).
La figura 4.16 presenta dos histogramas. El primero muestra la producción mensual de
255 pozos de gas, en unidades de miles de pies cúbicos. El histograma claramente tiene una
larga cola derecha, por lo que se concluye que los datos no provienen de una población normal.
El segundo muestra los logaritmos naturales de las producciones mensuales. Este histograma
se aproxima más a la curva normal, aunque se percibe cierta diferencia con la normalidad.
248
CAPÍTULO 4
Distribuciones comúnmente usadas
0.0025
0.45
0.4
0.35
0.3
0.0015
Densidad
Densidad
0.002
0.001
0.25
0.2
0.15
0.1
0.0005
0.05
0
0
200
400
600
800 1 000 1 200 1 400 1 600
Producción mensual (1 000 pies3)
a)
0
2
3
4
5
6
ln (producción mensual)
7
8
b)
FIGURA 4.16 a) Histograma que muestra la producción mensual de 255 pozos de gas. Tiene una larga cola derecha. b)
Histograma que muestra los logaritmos naturales de las producciones mensuales. La distribución de los datos logarítmicos
se aproxima mucho más a la normal.
Ejercicios para la sección 4.6
1. El tiempo de vida (en días) de cierto componente electrónico que opera en un ambiente a alta temperatura sigue una
distribución lognormal con m ⫽ 1.2 y s ⫽ 0.4.
a) Determine la media del tiempo de vida.
b) Determine la probabilidad de que un componente dure
entre tres y seis días.
c) Determine la mediana del tiempo de vida.
d) Determine al 90o. percentil de los tiempos de vida.
2. Cuando un pesticida entra en contacto con la piel, se absorbe cierto porcentaje de éste. El porcentaje del pesticida que
será absorbido durante cierto espacio de tiempo puede modelarse con una distribución lognormal. Suponga que para
cierto pesticida, la cantidad que es absorbida (en porcentaje) durante un periodo de dos horas sigue una distribución
lognormal con m ⫽ 1.5 y s ⫽ 0.5.
a) Determine la media del porcentaje absorbido.
e) Determine el 75o. percentil del porcentaje absorbido.
f ) Determine la desviación estándar del porcentaje absorbido.
3. El índice de masa corporal (IMC) de una persona se define
como la masa corporal de una persona dividido entre el cuadrado del peso de la persona. El artículo “Influences of Parameter Uncertainties within the ICRP 66 Respiratory Tract
Model: Particle Deposition” (W. Bolch, E. Farfan y colaboradores, en Health Physics, 2001:378-394) establece que el
índice de masa corporal (en kg/m2) en hombres entre 25-34
años sigue una distribución lognormal con parámetros m ⫽
3.215 y s ⫽ 0.157.
a) Determine la media del IMC para hombres entre 25-34
años.
b) Determine la desviación estándar del IMC para hombres
entre 25-34 años.
b) Determine la mediana del porcentaje absorbido.
c) Determine la mediana del IMC para hombres entre 2534 años.
c) Determine la probabilidad de que el porcentaje absorbido sea mayor que 10.
d ) ¿Qué proporción de hombres entre 25-34 años tiene un
IMC menor a 22?
d) Determine la probabilidad de que el porcentaje absorbido sea menor que 5.
e) Encuentre el 75o. percentil de IMC para hombres entre
25-34 años.
4.6
4. El artículo “Stochastic Estimates of Exposure and Cancer
Risk from Carbon Tetrachloride Released to the Air from the
Rocky Flats Plant” (A. Rood, P. McGavran y colaboradores,
en Risk Analysis, 2001:675-695) modela el aumento en el
riesgo de cáncer debido a la exposición al tetracloruro de
carbono como una lognormal con m ⫽ ⫺15. 65 y s ⫽ 0.79.
a) Determine la media del riesgo.
b) Determine la mediana del riesgo.
c) Determine la desviación estándar del riesgo.
d ) Determine el 5o. percentil.
e) Determine el 95o. percentil.
5. El artículo “Withdrawal Strenght of Threaded Nails” (D.
Rammer, S. Winistorfer y D. Bender, en Journal of Structural Engineering, 2001:442-449) describe un experimento
que compara la resistencia final a ser retirados (en N/mm)
de varios tipos de clavos. Para un clavo con rosca anular y
un vástago de diámetro de 3.76 mm introducido en una madera de pinabete, pino y abeto, la resistencia final de retiro
fue modelada como una lognormal con m ⫽ 3.82 y s ⫽
0.219. Para un clavo con rosca en espiral, bajo las mismas
condiciones, la resistencia se modeló como una lognormal
con m ⫽ 3.47 y s ⫽ 0.272.
a) ¿Cuál es la media de la resistencia de retiro para los clavos con rosca anular?
b) ¿Cuál es la media de la resistencia de retiro para los clavos con rosca en espiral?
c) ¿Con qué tipo de clavo es más probable que la fuerza de
retiro sea mayor a 50 N/mm?
Distribución lognormal
249
ii) la media de X siempre es menor que la mediana.
iii) la media puede ser mayor que, menor que, o igual que
la mediana, dependiendo del valor de s.
7. Los precios de acciones u otros instrumentos financieros
con frecuencia se modelan como una distribución lognormal. Un inversionista está considerando comprar acciones
en una de dos compañías, A o B. Hoy el precio de una acción en ambas compañías es de un dólar. Para la A, el valor
de la acción en un año a partir de ahora se modela como una
lognormal con parámetros m ⫽ 0.05 y s ⫽ 0.1. Para la B,
el valor de la acción en un año a partir de ahora se modela
como una lognormal con parámetros m ⫽ 0.02 y s ⫽ 0.2.
a) Determine la media del precio de una acción de la compañía A en un año a partir de ahora.
b) Determine la probabilidad de que el precio de una acción de la compañía A en un año a partir de ahora sea
mayor a $1.20.
c) Determine la media del precio de una acción de la compañía B en un año a partir de ahora.
d ) Determine la probabilidad de que el precio de una acción de la compañía B en un año a partir de ahora sea
mayor a $1.20.
8. Un fabricante afirma que la resistencia a la tensión de cierto compuesto (en MPa) tiene una distribución lognormal
con m ⫽ 5 y s ⫽ 0.5. Sea X la resistencia de una muestra
aleatoria y representativa de este compuesto.
a) Si la afirmación es cierta, ¿a qué es igual P(X ⬍ 20)?
d) ¿Cuál es la probabilidad de que un clavo con rosca en
espiral tenga una resistencia mayor a ser retirado que la
mediana de los clavos con rosca anular?
b) Con base en la respuesta al inciso (a), si la afirmación es
cierta, ¿una resistencia de 20 MPa sería inusualmente
pequeña?
e) Se realiza un experimento en el cual se mide las resistencias a ser retirados de diversos clavos de los dos tipos. Se registra que un clavo tiene resistencia a ser
retirado de 20 N/mm, pero no se sabe el tipo. ¿Piensa
que se trata de un clavo con rosca anular o de un clavo
con rosca en espiral? ¿Por qué? ¿Qué tan seguro está?
c) Si usted observa una resistencia a la tensión de 20 MPa,
¿esto sería una evidencia de que la afirmación es falsa?
Explique.
6. Elija la mejor respuesta, y explique. Si X es una variable
aleatoria con una distribución lognormal, entonces _______
i) la media de X siempre es mayor que la mediana.
d) Si la afirmación es cierta, ¿a qué es igual P(X ⬍ 130)?
e) Con base en la respuesta al inciso d), si la afirmación es
cierta, ¿una resistencia de 130 MPa sería inusualmente
pequeña?
f ) Si usted observa una resistencia a la tensión de 130
MPa, ¿esto sería una evidencia de que la afirmación es
falsa? Explique.
250
4.7
CAPÍTULO 4
Distribuciones comúnmente usadas
La distribución exponencial
La distribución exponencial es una distribución continua que algunas veces se utiliza para
modelar el tiempo que transcurre antes de que ocurra un evento. A menudo, a aquél se le llama tiempo de espera. En algunas ocasiones la distribución exponencial se utiliza para modelar el tiempo de vida de un componente. Asimismo, hay una relación cercana entre la
distribución exponencial y la distribución de Poisson.
La función de densidad de probabilidad de la distribución exponencial tiene un parámetro, que representa una constante positiva λ cuyo valor determina la localización y forma de
la función.
Definición
La función de densidad de probabilidad de la distribución exponencial con parámetro
λ ⬎ 0 es
−λx
λe
x>0
f (x) =
(4.31)
0
x≤0
La figura 4.17 presenta la función de densidad de probabilidad de la distribución exponencial
para varios valores de λ. Si X es una variable aleatoria cuya distribución es exponencial con
parámetro λ, se expresa como X ⬃ Exp(λ).
4
λ=4
3
2
λ=2
1
λ=1
0
0
0.5
1
1.5
2
2.5
3
FIGURA 4.17 Gráficas de la función de densidad de probabilidad exponencial para varios valores de λ.
Es fácil calcular la función de distribución acumulativa de la distribución exponencial.
Para x ⱕ 0, F(x) ⫽ P(X ⱕ x) ⫽ 0. Para x ⬎ 0, la función de distribución acumulativa es
x
F (x) = P (X ≤ x) =
λe−λt dt = 1 − e−λx
0
4.7
La distribución exponencial
251
Resumen
Si X ⬃ Exp(λ), la función de distribución acumulativa de X es
1 − e−λx
x>0
F (x) = P (X ≤ x) =
0
x≤0
(4.32)
La media y la varianza de una variable aleatoria exponencial se pueden calcular mediante la integración por partes. Al final de la sección se muestra las deducciones.
Si X ⬃ Exp(λ), entonces
Ejemplo
4.55
μX =
1
λ
(4.33)
σX2 =
1
λ2
(4.34)
Si X ⬃ Exp(2), encuentre mX, sX2 y P(X ⱕ 1).
Solución
Se calcula mX y sX2 a partir de las ecuaciones (4.33) y (4.34), sustituyendo λ ⫽ 2. Se obtiene
mX ⫽ 0.5, sX2 ⫽ 0.25. Utilizando la ecuación (4.32), se tiene que
P (X ≤ 1) = 1 − e−2(1) = 0.865
Ejemplo
4.56
Con referencia al ejemplo 4.55, determine la mediana de X. Encuentre el 30o. percentil de X.
Solución
Sea m la mediana de X. Entonces P(X ⱕ m) ⫽ 0.5. Mediante la ecuación (4.32) se tiene que
1 ⫺ e⫺2m ⫽ 0.5. Al despejar m, se obtiene que m ⫽ 0.3466.
Sea p30 el 30o. percentil. Entonces P(X ⱕ p30) ⫽ 0.30. Utilizando la ecuación (4.32), se
tiene que 1 ⫺ e⫺2p30 ⫽ 0.30. Al despejar p30 se obtiene que p30 ⫽ 0.1783.
La distribución exponencial y el proceso de Poisson
Se mencionó que algunas veces se utiliza la distribución exponencial para modelar el tiempo
de espera de un evento. Resulta que la distribución exponencial es el modelo correcto para los
tiempos de espera siempre y cuando los eventos sigan un proceso de Poisson. Recuerde de la
sección 4.3 que los eventos que siguen un proceso Poisson con un parámetro de razón λ cuando los números de eventos en intervalos disjuntos son independientes, y el número X de eventos que ocurre en un intervalo con una longitud t tiene una distribución de Poisson con media
252
CAPÍTULO 4
Distribuciones comúnmente usadas
λt, es decir, cuando X ⬃ Poisson(λt). La conexión entre la distribución exponencial y el proceso de Poisson es la siguiente:
Si los eventos siguen un proceso de Poisson con un parámetro de razón λ, y si T representa el tiempo de espera desde cualquier punto inicial hasta el próximo evento,
entonces T ⬃ Exp(λ).
Al final de esta sección se demuestra este hecho.
Ejemplo
4.57
Una masa radiactiva emite partículas de acuerdo con un proceso de Poisson a una media de razón de 15 partículas por minuto. En algún punto inicia un reloj. ¿Cuál es la probabilidad de
que transcurran cinco segundos antes de la siguiente emisión? ¿Cuál es la media del tiempo
de espera hasta que se emite la siguiente partícula?
Solución
El tiempo se medirá en segundos. T denota el tiempo en segundos que transcurre antes de que
se emita la siguiente partícula. La media de la razón de las emisiones es de 0.25 por segundo,
por lo que el parámetro de razón es λ ⫽ 0.25 y T ⬃ Exp(0.25). La probabilidad de que transcurran más de cinco segundos antes de la siguiente emisión es igual a
P (T > 5) = 1 − P (T ≤ 5)
= 1 − (1 − e−0.25(5) )
= e−1.25
= 0.2865
La media del tiempo de espera es μT =
1
= 4.
0.25
Propiedad de falta de memoria
La distribución exponencial tiene una propiedad conocida como falta de memoria, que se
muestra en los ejemplos 4.58 y 4.59.
Ejemplo
4.58
El tiempo de vida de un circuito integrado particular tiene una distribución exponencial con
media de dos años. Encuentre la probabilidad de que el circuito dure más de tres años.
Solución
Sea T el tiempo de vida del circuito. Dado que mT ⫽ 2, λ ⫽ 0.5. Se necesita encontrar P(T > 3).
P (T > 3) = 1 − P (T ≤ 3)
= 1 − (1 − e−0.5(3) )
= e−1.5
= 0.223
4.7
Ejemplo
4.59
La distribución exponencial
253
Con referencia al ejemplo 4.58, suponga que actualmente un circuito tiene cuatro años y aún
funciona. Determine la probabilidad de que funcione tres años más. Compárela con la probabilidad de que un circuito nuevo funcione tres años más, la cual se calculó en el ejemplo 4.58.
Solución
Se pide que el tiempo de vida de un circuito sea más de cuatro años y se tiene que calcular la
probabilidad de que el tiempo de vida sea mayor que 4 ⫹ 3 ⫽ 7 años. La probabilidad está
dada por
P (T > 7 y T > 4)
P (T > 7|T > 4) =
P (T > 4)
Si T ⬎ 7, entonces también T ⬎ 4. Por consecuencia, P(T ⬎ 7 y T ⬎ 4) ⫽ P(T ⬎ 7). De ahí
que
P (T > 7)
P (T > 7|T > 4) =
P (T > 4)
e−0.5(7)
= −0.5(4)
e
= e−0.5(3)
= e−1.5
= 0.223
La probabilidad de que un circuito con cuatro años dure tres años más es la misma probabilidad de que el circuito nuevo dure tres años.
Los ejemplos 4.58 y 4.59 muestran la propiedad de falta de memoria. La probabilidad
de que se tenga que esperar t unidades adicionales, dado que ya se han esperado s unidades,
es la misma que la probabilidad de que se tenga esperar t unidades desde el inicio. La distribución exponencial no “recuerda” cuánto tiempo se ha esperado. En particular, si el tiempo
de vida de un componente sigue una distribución exponencial, entonces la probabilidad de
que un componente que tiene s unidades de tiempo dure t unidades de tiempo adicionales es
la misma que la probabilidad de que un componente nuevo dure t unidades de tiempo. En
otras palabras, un componente cuyo tiempo de vida siga una distribución exponencial no
muestra ningún síntoma de los años o del uso.
Los cálculos en los ejemplos 4.58 y 4.59 se pueden repetir para cualesquiera valores s
y t en lugar de 4 y 3, y para cualquier valor de λ en lugar de 0.5. Ahora, se establece la propiedad de falta de memoria en su forma general:
Propiedad falta de memoria
Si T ⬃ Exp(λ), y t y s son números positivos, entonces
P (T > t + s | T > s) = P (T > t)
254
Ejemplo
4.60
CAPÍTULO 4
Distribuciones comúnmente usadas
El número de visitas a un sitio web sigue un proceso de Poisson con una razón de tres por minuto. ¿Cuál es la probabilidad de que transcurra más de un minuto sin recibir una visita? Si
transcurren dos minutos sin una visita, ¿cuál es la probabilidad que se dé una visita en el siguiente minuto?
Solución
Sea T el tiempo de espera en minutos hasta la siguiente visita. Entonces T ⬃ Exp(3). La probabilidad de que transcurra un minuto sin ninguna visita es P(T ⬎ 1) ⫽ e⫺3(1) ⫽ 0.0498. Debido a la propiedad de falta de memoria, la probabilidad de que pase un minuto adicional sin
ninguna visita, dado que han transcurrido dos minutos sin una visita, es también igual a 0.0498.
Por tanto, la probabilidad de que ocurra una visita en el siguiente minuto es igual a 1 ⫺ 0.0498
⫽ 0.9502.
Uso de la distribución exponencial para estimar una razón
Si X ⬃ Exp(λ), entonces mX ⫽ 1/λ, por lo que λ ⫽ 1/mX. De ahí que X1, . . . , Xn sea una mues—
tra aleatoria de Exp(λ), una estimación razonable de λ es λ̂ ⫽ 1/X .
—
—
Se analizará el sesgo en λ̂ ⫽ 1/X . Al igual que con cualquier media muestral X , m—
X ⫽
—
m, por tanto, X es un estimador no sesgado de m. No obstante, m1/X— ⫽ 1/m, ya que 1/m no es
—
una función lineal de m. Por consecuencia, λ̂ ⫽ 1/X es un estimador sesgado de λ ⫽ 1/m. Utilizando métodos avanzados puede demostrarse que m λ̂ ⬇ λ ⫹ λ/n; de esta forma el sesgo es
aproximadamente λ/n. Por tanto, para una muestra de tamaño n lo suficientemente grande el
sesgo es despreciable, pero puede ser importante cuando el tamaño de aquélla es pequeño.
Se puede estimar la incertidumbre en λ̂ mediante el método de propagación de errores
(ecuación 3.10 de la sección 3.3):
d 1
σ
σλ ≈
dX X X
Para que esta expresión sea útil, es necesario conocer s—
X . Ahora, que la desviación estándar de
una distribución Exp(λ) es s ⫽ 1/λ (lo cual se tiene a partir de la ecuación 4.34; observe que
√
√
la desviación estándar es la misma que la media). Por consiguiente, σX = σ/ n = 1/(λ n).
—
Se puede sustituir λ con el estimador 1/X para obtener
X
σX ≈ √
n
Ahora, se puede estimar la incertidumbre s λ̂:
d 1
σ
σλ ≈
dX X X
=
1 X
√
2
n
X
=
1
√
X n
4.7
255
La distribución exponencial
Esta estimación con el método de propagación de errores es muy bueno cuando el tamaño
muestral es de al menos 20 o algo así. Para tamaños menores de muestra, éste subestima la
incertidumbre.
Resumen
Si X1, . . . , Xn es una muestra aleatoria de Exp(λ)n, entonces el parámetro λ se estima
con
1
(4.35)
λ=
X
Este estimador es sesgado. El sesgo es aproximadamente igual a λ/n. La incertidumbre
en λ̂ se estima con
1
(4.36)
σλ = √
X n
Este estimador de la incertidumbre es razonablemente bueno cuando el tamaño muestral es mayor a 20.
Corrección del sesgo
Dado que m λ̂ ⫽ m1/X— ⬇ λ ⫹ λ/n ⫽ (n ⫹ 1)λ/n, se tiene que mn/(n ⫹ 1)X— ⬇ λ. En otras palabras,
—
—
la cantidad n/[(n ⫹ 1)X ] es un estimador menos sesgado de λ que 1/X . A esto último se le
conoce como estimador con corrección de sesgo.
Ejemplo
4.61
Se toma una muestra aleatoria de tamaño 5 de una distribución Exp(λ). Los valores son 7.71,
1.32, 7.46, 6.53 y 0.44. Encuentre un estimador con corrección de sesgo de λ.
Solución
—
La media muestral es X ⫽ 4.6920. El tamaño muestral es n ⫽ 5. El estimador con corrección
de sesgo de λ es 5/[6(4.6920)] ⫽ 0.178.
Deducción de la media y la varianza de una
variable aleatoria exponencial
Para deducir la ecuación (4.33) se comienza con la ecuación (2.35) (de la sección 2.4):
∞
μX =
xf (x) dx
−∞
Al sustituir la función de densidad de probabilidad exponencial (4.31) para f(x), se obtiene
∞
μX =
λxe−λx dx
0
Al integrar por partes, haciendo u ⫽ x y dy ⫽ λe ⫺ λx se obtiene
∞
∞
−λx
e−λx dx
μX = −xe
+
0
0
(4.37)
256
CAPÍTULO 4
Distribuciones comúnmente usadas
Se evalúa la primera cantidad en el lado derecho de la ecuación (4.37):
−xe
−λx
∞
= lím −xe−λx − 0
x→∞
0
x
eλx
1
= lím − λx
x→∞
λe
=0
= lím −
x→∞
Por consecuencia,
μX =
=
por la regla de L’Hospital
∞
e−λx dx
0
1
λ
Para deducir la ecuación (4.34) se comienza con la ecuación (2.37) (de la sección 2.4):
∞
2
σX =
x 2 f (x) dx − μ2X
−∞
Al sustituir la función de densidad de probabilidad exponencial (4.31) por f(x) y 1/λ por
mX, se obtiene
∞
1
(4.38)
λx 2 e−λx dx − 2
σX2 =
λ
0
∞
Se evalúa la integral 0 λx 2 e−λx dx, utilizando la integración por partes. Al hacer u ⫽ x2
y dy ⫽ λe⫺λx se obtiene
∞
2 −λx
λx e
0
2 −λx
dx = −x e
∞
0
+
∞
2xe−λx dx
0
Se evalúa la primera cantidad en el lado derecho de la ecuación (4.39):
−x 2 eλx
∞
= lím −x 2 e−λx − 0
x→∞
0
x2
x→∞
eλx
2x
= lím − λx
x→∞
λe
2
= lím − 2 λx
x→∞
λ e
=0
= lím −
por la regla de L’Hospital
por la regla de L’Hospital
(4.39)
4.7
La distribución exponencial
257
Por tanto,
0
∞
λx 2 e−λx dx =
∞
2xe−λx dx
0
2 ∞
λxe−λx dx
=
λ 0
2
= μX
λ
1
2
=
λ
λ
2
= 2
λ
Al sustituir en (4.38) se obtiene
1
2
− 2
2
λ
λ
1
= 2
λ
σX2 =
Deducción de la relación entre la distribución exponencial
y el proceso de Poisson
Sea T el tiempo de espera hasta el siguiente evento en un proceso de Poisson con un parámetro de razón λ. Es evidente que T ⬃ Exp(λ) al demostrar que la función de distribución
acumulativa de T es F(t) ⫽ 1 ⫺ e⫺λt, que es la función de distribución acumulativa de
Exp(λ).
Primero, si t ⱕ 0, entonces F(t) ⫽ P(T ⱕ t) ⫽ 0. Ahora t ⬎ 0. Se comienza por calcular P(T ⬎ t). La clave es considerar que T ⬎ t, si y sólo si, no ocurre ningún evento durante las siguientes t unidades de tiempo. Sea X el número de eventos que sucede en las
siguientes t unidades de tiempo. Ahora T ⬎ t si y sólo si X ⫽ 0, por lo que P(T ⬎ t) ⫽ P(X
⫽ 0).
Puesto que X ⬃ Poisson (λt),
P (X = 0) = e−λt
λ0
0!
= e−λt
Por consecuencia, P(T ⬎ t) ⫽ e⫺λt. La función de distribución acumulativa de T es
F(t) ⫽ 0 para t ⱕ 0, y para t ⬎ 0
F (t) = P (T ≤ t)
= 1 − P (T > t)
= 1 − e−λt
Dado que F(t) es la función de distribución acumulativa de Exp(λ), se tiene que
T ⬃ Exp(λ).
258
CAPÍTULO 4
Distribuciones comúnmente usadas
Ejercicios para la sección 4.7
1. T ⬃ Exp(0.45). Determine
a) mT
b) sT2
c) P(T ⬎ 3)
d) La mediana de T
2. El tiempo de vida de un fusible en cierta aplicación tiene
distribución exponencial con media de dos años.
a) ¿Cuál es el valor del parámetro λ?
b) ¿Cuál es la mediana del tiempo de vida de dicho fusible?
c) ¿Cuál es la desviación estándar?
c) Si usted hubiera esperado cinco minutos para que ocurriera la siguiente visita, ¿aún seguiría creyendo en la
afirmación? Explique.
5. Cierto tipo de componente puede ser comprado nuevo o
viejo. El 50% de los componentes nuevos duran más de cinco años, pero sólo 30% de los usados dura más de cinco
años. ¿Sería posible que las duraciones de los componentes
se distribuyan exponencialmente? Explique.
6. Una masa radiactiva emite partículas de acuerdo con un
proceso de Poisson a una razón media de dos por segundo.
Sea T el tiempo de espera, en segundos, entre las emisiones.
a) ¿Cuál es la media del tiempo de espera?
b) ¿Cuál es la mediana del tiempo de espera?
d ) ¿Cuál es el 60o. percentil?
c) Determine P(T ⬎ 2).
e) Determine la probabilidad de que un fusible dure más de
cinco años.
d ) Determine P(T ⬍ 0.1).
f ) Si un fusible tiene un año y aún sigue funcionando,
¿cuál es la probabilidad de que funcione dos años más?
3. Una investigadora de catalizadores afirma que los diámetros, en micrones, de los poros de un nuevo producto que
ella ha fabricado sigue una distribución exponencial con parámetro λ ⫽ 0.25.
a) ¿Cuál es la media del diámetro de los poros?
b) ¿Cuál es la desviación estándar de los diámetros de los
poros?
c) ¿Qué proporción de los poros tiene un diámetro menor
a tres micrones?
d) ¿Qué proporción de los poros tiene un diámetro mayor
a 11 micrones?
e) ¿Cuál es la mediana del diámetro de los poros?
f ) ¿Cuál es el tercer cuartil de los diámetros de los poros?
g) ¿Cuál es el 99o. percentil de los diámetros de los poros?
4. Alguien argumenta que el tiempo de espera, en minutos, entre las visitas a un sitio web tiene una distribución exponencial con parámetro λ ⫽ 1.
a) Sea X el tiempo de espera hasta la siguiente visita. Si la
afirmación es verdadera, ¿a qué es igual P(X ⱖ 5)?
b) Con base en la respuesta al inciso (a), si la afirmación es
verdadera, ¿esperar cinco minutos es un tiempo de espera inusualmente largo?
e) Determine P(0.3 ⬍ T ⬍ 1.5).
f ) Si han transcurrido tres segundos sin que haya ninguna
emisión, ¿cuál es la probabilidad de que haya una emisión dentro del siguiente segundo?
7. Se considera que el número de accidentes de tránsito en
cierta intersección sigue el modelo de un proceso de Poisson con una media de tres accidentes al año.
a) Determine la media del tiempo de espera entre los accidentes.
b) Determine la desviación estándar de los tiempos de espera entre los accidentes.
c) Determine la probabilidad de que transcurra más de un
año entre un accidente y otro.
d) Determine la probabilidad de que transcurra menos de
un mes entre un accidente y otro.
e) Si no ocurre ningún accidente en los últimos seis meses,
¿cuál es la probabilidad de que suceda un accidente durante el siguiente año?
8. La distancia entre imperfecciones consecutivas en un rollo
de lámina de aluminio se distribuye exponencialmente con
una distancia media de 3 m. Sea X la distancia, en metros,
entre las imperfecciones.
a) ¿Cuál es la media del número de imperfecciones por
metro?
b) ¿Cuál es la probabilidad de que cinco metros de aluminio tengan sólo dos imperfecciones?
4.8
9. Una instalación de luz contiene cinco focos. La duración de
cada foco se distribuye exponencialmente con una media
de 200 horas. Cada vez que se funde un foco, éste se reemplaza. Sea T el momento del primer reemplazo del foco. Sea
X1, i ⫽ 1, . . . , 5 la duración de cinco focos. Suponga que
la duración de los focos son independientes.
a) Determine P(X1 ⬎ 100).
b) Determine P(X1 ⬎ 100 y X2 ⬎ 100 y . . . y X5 ⬎ 100).
Las distribuciones gamma y de Weibull
259
d ) Determine P(T ⱕ 100).
e) T es cualquier número positivo. Encuentre P(T ⱕ t),
¿cuál es la función de distribución acumulativa de T?
f ) ¿T tiene una distribución exponencial?
g) Determine la media de T.
h) Si hubiera n focos, y la duración de cada uno se distribuyera exponencialmente con parámetro λ, ¿cuál sería
la distribución de T?
c) Explique por qué el evento T ⬎ 100 es el mismo que {X1
⬎ 100 y X2 ⬎ 100 y . . . y X5 ⬎ 100}.
4.8
Las distribuciones gamma y de Weibull
Las distribuciones gamma y de Weibull son extensiones de la distribución exponencial. Ambas implican una integral conocida como la función gamma. Primero se define la función
gamma y se establecen algunas de sus propiedades.
Definición
Para r ⬎ 0, la función gamma está definida por
∞
Ŵ(r) =
t r−1 e−t dt
(4.40)
0
La función gamma tiene las siguientes propiedades:
1.
2.
3.
Si r es un entero, entonces Γ(r) ⫽ (r ⫺ 1)!
Para cualquier r, Γ(r ⫹ 1) ⫽ rΓ(r).
√
Γ(1/2) ⫽ π .
La distribución gamma
La distribución gamma es una distribución continua, uno de sus propósitos es ampliar la utilidad de la distribución exponencial en el modelado de tiempos de espera. La función de densidad de probabilidad gamma tiene dos parámetros, r y λ, que son constantes positivas.
Definición
La función de densidad de probabilidad de la distribución gamma con parámetros
r ⬎ 0 y λ ⬎ 0 es
⎧ r r−1 −λx
λx e
⎪
⎨
x>0
Ŵ(r)
(4.41)
f (x) =
⎪
⎩
0
x≤0
260
CAPÍTULO 4
Distribuciones comúnmente usadas
Si X es una variable aleatoria cuya función de densidad de probabilidades gamma con
parámetros r y λ, se expresa como X ⬃ Γ(r, λ). Observe que cuando r ⫽ 1, la distribución
gamma es igual a la exponencial. Con símbolos, Γ(1, λ) ⫽ Exp(λ). La figura 4.18 muestra
gráficas de la función de densidad de probabilidad gamma para varios valores de r y λ.
1
0.8
r = 1, λ = 1
0.6
r = 3, λ = 2
0.4
0.2
0
r = 5, λ = 1
0
2
4
6
8
10
12
FIGURA 4.18 Función de densidad de probabilidad gamma para varios valores de r y λ.
Cuando el parámetro r es un entero, la distribución gamma es una extensión directa de la
distribución exponencial. Para ser más específicos, recuerde que si los eventos seguían un proceso de Poisson con parámetro de razón λ, el tiempo de espera hasta que ocurriera un evento
se distribuía como Exp(λ). Si r es cualquier entero positivo, entonces el tiempo de espera hasta que haya ocurrido r eventos se distribuye como Γ(r, λ). Esto puede decirse de otra manera. Sea X1 el tiempo de espera hasta el primer evento, y, para i ⬎ 1, sea X1 el tiempo de espera
entre los eventos i ⫺ 1 e i. El tiempo de espera hasta el r-ésimo evento es la suma de las variables aleatorias independientes X1 ⫹ . . . ⫹ Xr, cada uno de los cuales se distribuye como
Exp(λ).
Resumen
Si X1, . . . , Xn son variables aleatorias independientes, cada una se distribuye como
Exp(λ), entonces la suma X1 ⫹ . . . ⫹ Xr se distribuye como Γ(r, λ).
Dado que la media y la varianza de una variable aleatoria exponencial está dada por 1/λ
y 1/λ2, respectivamente, se puede utilizar el hecho de que una variable aleatoria gamma es la
suma de variables aleatorias exponenciales independientes para calcular la media y la varianza de una variable aleatoria gamma en el caso en que r es un entero. Los resultados se presentan en el siguiente cuadro, y de hecho, son válidos para todos los valores de r y λ.
4.8
Las distribuciones gamma y de Weibull
261
Si X ⬃ Γ(r, λ), entonces
Ejemplo
4.62
μX =
r
λ
(4.42)
σX2 =
r
λ2
(4.43)
Suponga que los tiempos de llegada a una ventanilla de toma de órdenes desde el automóvil sigue un proceso de Poisson con media de razón λ ⫽ 0.2 llegadas por minuto. Sea T el tiempo de
espera hasta la tercera llegada. Determine la media y varianza de T. Encuentre P(T ⱕ 20).
Solución
La variable aleatoria T se distribuye Γ(3, 0.2). Utilizando las ecuaciones (4.42) y (4.43) se
calcula mT ⫽ 3/0.2 ⫽ 15 y sT2 ⫽ 3/(0.22) ⫽ 75. Para calcular P(T ⱕ 20) se sigue la siguiente
lógica: T ⱕ 20 significa que el tercer evento ocurrirá dentro de 20 minutos. Esto es lo mismo
que si se dijera que el número de eventos que ocurren dentro de 20 minutos es mayor que o
igual a tres. Ahora, sea X el número de eventos que ocurren dentro de 20 minutos. Lo que se
ha dicho es que P(T ⱕ 20) ⫽ P(X ⱖ 3). Ahora la media de X es (20)(0.2) ⫽ 4 y X tiene una
distribución de Poisson, por lo que X ⬃ Poisson(4). De ahí que
P (T ≤ 20) = P (X ≥ 3)
= 1 − P (X ≤ 2)
= 1 − [P (X = 0) + P (X = 1) + P (X = 2)]
40
41
42
= 1 − e−4 + e−4 + e−4
0!
1!
2!
= 1 − (e−4 + 4e−4 + 8e−4 )
= 0.7619
El método empleado en el ejemplo 4.62 para determinar a P(T ⱕ 20) se puede utilizar
para determinar la función de distribución acumulativa F(x) ⫽ P(T ⱕ x), cuando T ⬃ Γ(r, λ)
y r es un entero positivo.
Si T ⬃ Γ(r, λ) y r es un entero positivo, la función de distribución acumulativa de T
está dada por
⎧
r−1
⎪
(λx)j
⎨1 −
e−λx
x>0
F (x) = P (T ≤ x) =
(4.44)
j!
j =0
⎪
⎩
0
x≤0
262
CAPÍTULO 4
Distribuciones comúnmente usadas
A una distribución gamma en la cual el parámetro r es un entero positivo se le denomina algunas veces distribución de Erlang. Si r ⫽ k/2 donde k es un entero positivo, a la distribución Γ(r, 1/2) se le llama distribución Ji-cuadrada con k grados de libertad. La
distribución Ji-cuadrada es muy importante en la inferencia estadística. Se analizarán algunos
de sus usos en la sección 6.10.
Distribución de Weibull
La distribución de Weibull constituye una distribución continua que se utiliza en varias situaciones. Una aplicación común es modelar los tiempos de vida de componentes, como cojinetes, cerámica, capacitores y dieléctricos. La función de densidad de probabilidad de Weibull
tiene dos parámetros, ambos constantes positivas, que determinan su localización y forma.
Éstos se representan por α y β. La función de densidad de probabilidad de la distribución de
Weibull es
α α−1 −(βx)α
αβ x e
x>0
f (x) =
(4.45)
0
x≤0
Si X es una variable aleatoria cuya función de densidad de probabilidad de Weibull con
parámetros α y β, se expresa como X ⬃ Weibull(α, β). Observe que cuando α ⫽ 1, la distribución de Weibull es igual que la distribución exponencial con parámetro λ ⫽ β. Con símbolos, Weibull(1, β) ⫽ Exp(β).
La figura 4.19 muestra gráficas de la función de densidad de probabilidad de Weibull(α,
β) para diversas opciones de los parámetros α y β. Al variar los valores de α y β se puede generar gran variedad de curvas. Debido a esto último, se puede construir la distribución de Weibull para que se ajuste a gran variedad de conjuntos de datos. Ésta es la principal razón de la
utilidad de la distribución de Weibull.
2
a = 5, b = 1
1.5
1
a = 1, b = 0.5
0.5
0
0
2
4
a = 5, b = 0.2
6
8
10
FIGURA 4.19 La función de densidad de probabilidad de Weibull para varias elecciones de α y β.
La función de distribución acumulativa de Weibull se puede calcular al integrar la función de densidad de probabilidad:
4.8
F (x) = P (X ≤ x) =
⎧
⎨
⎩
0
x
Las distribuciones gamma y de Weibull
α
αβ α t α−1 e−(βt) dt = 1 − e−(βx)
α
0
x>0
263
(4.46)
x≤0
Esta integral no es tan difícil como parece. Sólo se sustituyen u ⫽ (βt)α y du ⫽ αβαtα ⫺ 1dt.
La media y la varianza de la distribución de Weibull se expresan en términos de la función gamma.
Si X ⬃ Weibull(α, β), entonces
1
1
μX = Ŵ 1 +
β
α
2
1 2
1
2
σX = 2 Ŵ 1 +
− Ŵ 1+
β
α
α
(4.47)
(4.48)
Para el caso especial de que 1/α sea un entero, entonces
2
2
1
1
1
1
2
µX =
!
σX = 2
!−
!
β
α
β
α
α
Si la cantidad 1/α es un entero, entonces 1 ⫹ 1/α y 1 ⫹ 2/α son enteros, por lo que se
puede aplicar la propiedad 1 de la función gamma para calcular exactamente a mX y sX2. Si la
cantidad 1/α es de la forma n/2, en donde n es un entero, entonces, en principio, se puede
calcular exactamente mX y sX2 mediante aplicaciones repetitivas de las propiedades 2 y 3 de la
función gamma. Para otros valores de α, mX y sX2 deben ser aproximadas. Muchos programas
de computación pueden hacer esto.
Ejemplo
4.63
En el artículo “Snapshot: A Plot Showing Program through a Device Development Laboratory” (D. Lambert, J. Landwehr y M. Shyu, en Statistical Case Studies for Industrial Process
Improvement, ASA-SIAM, 1997), los autores sugieren utilizar una distribución de Weibull para
modelar la duración de un proceso de horneado en la fabricación de un semiconductor. Sea T
la duración en horas del proceso de horneado de una muestra elegida aleatoriamente. Si
T ⬃ Weibull(0.3, 0.1), ¿cuál es la probabilidad de que el proceso de horneado dure más de
cuatro horas? ¿Cuál es la probabilidad de que dure entre dos y siete horas?
Solución
Se utiliza la función de distribución acumulativa, ecuación (4.46). Al sustituir 0.3 por α y 0.1
por β, se tiene
P (T ≤ t) = 1 − e−(0.1t)
0.3
En consecuencia,
P (T > 4) = 1 − P (T ≤ 4)
0.3
= 1 − (1 − e−[(0.1)(4)] )
264
CAPÍTULO 4
Distribuciones comúnmente usadas
= e−(0.4)
0.3
= e−0.7597
= 0.468
La probabilidad de que el proceso dure entre dos y siete horas es
P (2 < T < 7) = P (T ≤ 7) − P (T ≤ 2)
0.3
0.3
= (1 − e−[(0.1)(7)] ) − (1 − e−[(0.1)(2)] )
0.3
= e−[(0.1)(2)] − e−[(0.1)(7)]
0.3
0.3
= e−(0.2) − e−(0.7)
0.3
= e−0.6170 − e−0.8985
= 0.132
Ejercicios para la sección 4.8
a) Si T ⬃ Weibull(α, β), encuentre h(t).
1. Sea T ⬃ Γ(4, 0.5).
b) ¿En qué valores de α la función de riesgo aumenta junto con el tiempo? ¿En qué valores de α la función de
riesgo disminuye?
a) Determine mT.
b) Determine sT.
c) Determine P(T ⱕ 1).
c) Si T tiene una distribución exponencial, demuestre que
la función de riesgo es constante.
d ) Determine P(T ⱖ 4).
2. La duración, en años, de un tipo de motor eléctrico pequeño operando en condiciones adversas se distribuye exponencialmente con λ ⫽ 3.6. Cada vez que falla un motor, es
reemplazado por otro del mismo tipo. Determine la probabilidad de que menos de seis motores falle dentro de un año.
3. Sea T ⬃ Weibull(0.5, 3).
5. En el artículo “Parameter Estimation with Only One Complete Failure Observation” (W. Pang, P. Leung y colaboradores, en International Journal of Reliability, Quality, and
Safety Engineering, 2001:109-122), se modela la duración,
en horas, de cierto tipo de cojinete con la distribución de
Weibull con parámetros α ⫽ 2.25 y β ⫽ 4.474 × 10 ⫺ 4.
a) Determine la probabilidad de que un cojinete dure más
de 1 000 horas.
a) Determine mT.
a) Determine sT.
a) Determine P(T ⬍ 1).
b) Determine la probabilidad de que un cojinete dure menos de 2 000 horas.
a) Determine P(T ⬎ 5).
c) Determine la mediana de la duración de un cojinete.
a) Determine P(2 ⬍ T ⬍ 4).
d) La función de riesgo se definió en el ejercicio 4. ¿Cuál
es el riesgo en t ⫽ 2 000 horas?
4. Si T es una variable aleatoria continua que siempre es positiva (como el tiempo de espera), con una función de densidad de probabilidad f(t) y una función de distribución
acumulativa F(t), entonces se define que la función de riesgo es la función
h(t) =
f (t)
1 − F (t)
La función de riesgo es la tasa de fallos por unidad de tiempo, expresada como una proporción de los elementos que
no ha fallado.
6. La duración de cierta batería se modela con la distribución
de Weibull con α ⫽ 2 y β ⫽ 0.1.
a) ¿Qué proporción de baterías durará más de diez horas?
b) ¿Qué proporción de baterías durará menos de cinco horas?
c) ¿Qué proporción de baterías durará más de 20 horas?
d) La función de riesgo se definió en el ejercicio 4. ¿Cuál
es el riesgo en t ⫽ 10 horas?
4.9
7. La duración de un ventilador, en horas, que se usa en un sistema computacional tiene una distribución de Weibull con
α ⫽ 1.5 y β ⫽ 0.0001.
a) ¿Cuál es la probabilidad de que un ventilador dure más
de 10 000 horas?
b) ¿Cuál es la probabilidad de que un ventilador dure menos de 5 000 horas?
c) ¿Cuál es la probabilidad de que un ventilador dure entre
3 000 y 9 000 horas?
8. Alguien sugiere que la duración T (en días) de cierta componente se puede modelar con una distribución de Weibull
con parámetros α ⫽ 3 y β ⫽ 0.01.
a) Si este modelo es correcto, ¿a qué es igual P(T ⱕ 1)?
b) Con base en su respuesta al inciso (a), si el modelo es
correcto, ¿un día sería una duración inusualmente corta?
Explique.
c) Si usted observó que un componente duró un día, ¿consideraría que este modelo es plausible? Explique.
d) Si este modelo es correcto, ¿a qué es igual P(T ⱕ 90)?
4.9
Gráficas de probabilidad
265
e) Con base en su respuesta al inciso (d), si el modelo es
correcto, ¿90 días sería una duración inusualmente corta?, ¿una duración inusualmente larga? Explique.
f ) Si usted observó que un componente duró 90 días, ¿consideraría que este modelo es plausible? Explique.
9. Un sistema consiste de dos componentes conectados en serie. El sistema fallará cuando alguno de los componentes falle. Sea T el momento en el que el sistema falla. Sean X1 y
X2 las duraciones de los dos componentes. Suponga que X1
y X2 son independientes y que cada uno sigue una distribución de Weibull con α ⫽ 2 y β ⫽ 0.2.
a) Determine P(X1 ⬎ 5).
b) Determine P(X1 ⬎ 5 y X2 ⬎ 5).
c) Explique por qué el evento T ⬎ 5 es el mismo que el
evento {X1 ⬎ 5 y X2 ⬎ 5}.
d) Determine P(T ⱕ 5).
e) Sea t cualquier número positivo. Encuentre P(T ⱕ t),
¿cuál es la función de distribución acumulativa de T?
f ) ¿T tiene una distribución de Weibull? Si es así, ¿cuáles
son sus parámetros?
Gráficas de probabilidad
Los científicos e ingenieros trabajan con frecuencia con datos que se pueden considerar como una muestra aleatoria de cierta población. En muchos de dichos casos, es importante determinar una distribución de probabilidad que describa aproximadamente la población. En
algunos casos, el conocimiento del proceso que generó los datos puede orientar la decisión.
No obstante, con mayor frecuencia, la única forma de determinar una distribución apropiada
es examinar la muestra para encontrar una distribución de probabilidad que se ajuste.
Las gráficas de probabilidad son una buena forma para lograrlo. Dada una muestra
aleatoria X1, . . . , Xn, una gráfica de probabilidad puede determinar si es posible que la muestra provenga de alguna población específica. Se presentará la idea que está detrás de las gráficas de probabilidad con un ejemplo simple. Se extrae una muestra aleatoria de tamaño 5 y
se desea determinar si la población de que proviene es normal. La muestra, en orden ascendente, es
3.01,
3.35,
4.79,
5.96,
7.89
Los valores, en orden ascendente, se denotan por X1, . . . , Xn (n ⫽ 5 en este caso). Lo primero que debe hacerse es asignar valores crecientes espaciados uniformemente entre 0 y 1 a Xi.
Hay muchas maneras aceptables de hacer esto; probablemente la más simple es asignar el valor (i ⫺ 0.5)/n a Xi. La siguiente tabla muestra la asignación para determinada muestra.
266
CAPÍTULO 4
Distribuciones comúnmente usadas
i
Xi
(i− 0.5)/5
1
2
3
4
5
3.01
3.35
4.79
5.96
7.89
0.1
0.3
0.5
0.7
0.9
Se elige al valor (i ⫺ 0.5)/n para que refleje la posición de Xi en la muestra ordenada. Existen i ⫺ 1 valores menores que Xi, además de i valores menores que o iguales a Xi. La cantidad (i ⫺ 0.5)/n es un compromiso entre las proporciones (i ⫺ 1)/n e i/n.
El objetivo es determinar si es posible que la muestra provenga de una población normal. La distribución normal más factible es aquella donde la media y desviación estándar son
—
iguales a la media y desviación estándar muestrales. La media muestral es X ⫽ 5.00 y la desviación estándar es s ⫽ 2.00. Por tanto, se determinará si es posible que esta muestra provenga de una distribución N(5, 22). La figura 4.20 es una gráfica de los cinco puntos (Xi, (i ⫺
0.5)/5). Esta curva es la función de distribución acumulativa (fda) F(x) de la distribución
N(5, 22). Recuerde que F(x) ⫽ P(X ⱕ x) donde X ⬃ N(5, 22).
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
⫺2
0
2
Q1 X1
4
6
8
10
12
X3 Q3
FIGURA 4.20 La curva es la fda de N(5, 22). Si los puntos muestrales X1, . . . , Xn provienen
de esta distribución, es probable que estén cerca de la curva.
Se han trazado rectas horizontales a través de los puntos de la muestra. Se denotan los valores x de los puntos de la fda que son atravesados por rectas, en orden ascendente, por Q1, . . . ,
Q5. Ahora, la recta horizontal que pasa por (X1, 0.1) intercepta a la fda en el punto (Q1, 0.1).
Lo anterior significa que la proporción de valores en la población N(5, 22) que es menor que
o igual a Q1 es 0.1. Otra forma de decir esto es que Q1 es el 10o. percentil de la distribución
N(5, 22). Si la muestra X1, . . . , Xn verdaderamente proviene de una distribución N(5, 22),
4.9
267
Gráficas de probabilidad
entonces es razonable pensar que el valor más bajo de la muestra, X1, estará muy cerca del
10o. percentil de la población. De forma intuitiva, la razón de esto último es que se esperaría
que el más bajo de los cinco puntos probablemente proviniera del quinto más bajo, o 20%, de
la población, y que el 10o. percentil se encontrará a la mitad de ese 20% más bajo. Al aplicar
la misma lógica a los puntos restantes, se esperaría que cada Qi se aproximara a su Xi correspondiente.
La gráfica de probabilidad está compuesta por los puntos (Xi, Qi). Puesto que la distribución que generó los Qi era una distribución normal, se le llama gráfica de probabilidad
normal. Si, de hecho, X1, . . . , Xn provienen de la distribución que generó los Qi, los puntos
se deben concentrar en una línea recta. Para construir la gráfica, se deben calcular los Qi. Éstos son los percentiles 100(i ⫺ 0.5)/n de la distribución que se supone generó la muestra. En
este ejemplo, los Qi son el 10, 30, 50, 70 y 90o. percentiles de la distribución N(5, 22). Es posible aproximar estos valores al buscar los puntajes z correspondientes a estos percentiles, y
después convertirlos en nuevos puntajes. En la práctica, los Qi se calculan siempre utilizando
un software computacional. La siguiente tabla muestra los Xi y los Qi para este ejemplo.
i
Xi
Qi
1
2
3
4
5
3.01
3.35
4.79
5.96
7.89
2.44
3.95
5.00
6.05
7.56
La figura 4.21 presenta una gráfica de probabilidad normal para la muestra X1, . . . , X5.
Se traza una línea recta en la gráfica, para que sea más fácil decir si los puntos se aproximan
12
0.999
10
0.99
8
0.95
0.9
0.75
6
0.5
4
0.25
2
0.1
0.05
0.01
0
0.001
⫺2
3
4
5
6
7
8
3
4
5
6
7
8
FIGURA 4.21 Gráficas de probabilidad normal para la muestra X1, . . . , X5. Las gráficas son idénticas, excepto por la escala del eje vertical. Los puntos de la muestra se aproximan a una línea recta, por lo que es factible que provengan de una
población normal.
268
CAPÍTULO 4
Distribuciones comúnmente usadas
o no a una línea recta. Se presenta dos versiones de la gráfica; son idénticas excepto por la escala del eje vertical. En la gráfica de la izquierda, los valores del eje vertical representan los
Qi. En la gráfica de la derecha, los valores del eje vertical representan los percentiles (como
decimales, por lo que 0.1 es el 10o. percentil) de los Qi. Por ejemplo, el 10o. percentil de N(5, 22)
es 2.44, de tal forma que el valor 0.1 en la gráfica de la derecha corresponde al valor 2.44 de
la gráfica de la izquierda. El 50o. percentil, o mediana, es 5, por lo que el valor 0.5 en la gráfica de la derecha corresponde al valor 5 de la gráfica de la izquierda. A menudo, los software
escalan al eje vertical como en la gráfica de la derecha. En la figura 4.21, los puntos de la muestra se aproximan a la recta; por tanto, es muy factible que la muestra provenga de una distribución normal.
Es importante mencionar que a los puntos Q1, . . . , Qn se les denomina cuantiles de la
distribución de la que son generados. Algunas veces, a los puntos X1, . . . , Xn se les llama
cuantiles empíricos. Por esta razón, algunas veces se hace referencia a la gráfica de probabilidad como gráfica cuantil-cuantil, o gráfica QQ.
En este ejemplo, se utiliza una muestra de sólo cinco puntos para que los cálculos sean
claros. En la práctica, las gráficas de probabilidad funcionan mejor con muestras más grandes. Una buena regla general es que se necesiten al menos 30 puntos antes de confiar en una
gráfica de probabilidad. No obstante, las gráficas de probabilidad se pueden utilizar en muestras más pequeñas, pero sólo detectarán desviaciones muy pronunciadas de la normalidad.
La figura 4.22 muestra dos gráficas de probabilidad. La gráfica en la figura 4.22a es de
las producciones mensuales de 225 pozos de gas. Estos datos no se aproximan a una línea recta; por consiguiente, no provienen de una población que se aproxima a la normal. La gráfica
en la figura 4.22b es de los logaritmos naturales de las producciones mensuales. Los datos se
aproximan mucho más a una línea recta, aunque se puede ver cierta desviación de la normalidad. (La figura 4.16 de la sección 4.6 presenta los histogramas de estos datos.)
0.999
0.999
0.99
0.99
0.95
0.9
0.95
0.9
0.75
0.75
0.5
0.5
0.25
0.25
0.1
0.05
0.1
0.05
0.01
0.01
0.001
0.001
0
500
1 000
a)
1 500
3
4
5
b)
6
7
FIGURA 4.22 Dos gráficas de probabilidad normal. (a) Gráfica de producciones mensuales de 225 pozos de gas. Estos datos no se aproximan a una línea recta y, por tanto, no provienen de una población que se aproxima a la normal. (b) Gráfica
de los logaritmos naturales de las producciones mensuales. Estos datos se aproximan mucho más a una línea recta, aunque
se puede ver cierta desviación de la normalidad. Véase en la figura 4.16 los histogramas de estos datos.
269
Gráficas de probabilidad
4.9
Interpretación de las gráficas de probabilidad
Es mejor no utilizar métodos estrictos e inamovibles en el momento de interpretar una gráfica de probabilidad. La rectitud de la gráfica se puede aproximar a simple vista. Cuando se decide si los puntos de una gráfica de probabilidad se aproximan o no a una línea recta, no preste
mucha atención a los puntos en los extremos (superior o inferior) de la muestra, a menos que
estén muy alejados de la recta. Es común que algunos puntos en cualesquiera de los extremos
se desvíen un poco de la recta. Sin embargo, un punto que se aleja demasiado de la recta,
mientras que la mayoría de los otros puntos están cerca, representa un dato atípico y merece
atención.
Ejercicios para la sección 4.9
1. Cada una de las tres muestras fueron graficadas sobre una gráfica de probabilidad normal. Para cada una, diga si la muestra parece provenir de una población aproximadamente normal.
0.999
0.999
0.99
0.95
0.9
0.75
0.5
0.25
0.1
0.05
0.01
0.99
0.95
0.9
0.75
0.5
0.25
0.1
0.05
0.01
0.001
0.001
a)
b)
0.999
0.99
0.95
0.9
0.75
0.5
0.25
0.1
0.05
0.01
0.001
c)
2. Construya una gráfica de probabilidad normal para los datos de las barras de jabón del ejercicio 1 en la sección 1.3.
¿Parece ser que estos datos provienen de una distribución
aproximadamente normal?
3. A continuación se muestran las duraciones (en minutos) de
40 erupciones del geiser Old Faithful en el Parque Nacional
Yellowstone.
4.1
3.8
3.7
3.7
1.8
1.9
3.7
3.8
3.2
4.6
4.3
3.4
1.9
1.8
3.6
4.0
4.6
4.7
3.8
2.3
2.0
1.8
3.8
4.4
4.5
4.6
3.8
4.1
3.9
1.9
2.5
4.3
4.3
3.5
4.5
3.3
2.3
4.0
4.1
2.0
Construya una gráfica de probabilidad normal para estos
datos. ¿Parece ser que estos datos provienen de una distribución aproximadamente normal?
270
CAPÍTULO 4
Distribuciones comúnmente usadas
4. A continuación se muestran las duraciones (en minutos) de
40 intervalos entre las erupciones del geiser Old Faithful en
el Parque Nacional Yellowstone.
91
86
73
79
51
51
67
60
79
85
68
86
53
45
86
71
82
88
72
67
51
51
75
81
76
80
75
76
82
49
66
83
84
82
84
76
53
75
70
55
Construya una gráfica de probabilidad normal para estos
datos. ¿Parece ser que estos datos provienen de una distribución aproximadamente normal?
4.10
5. Construya una gráfica de probabilidad normal para los datos MP de la tabla 1.2. ¿Parece ser que las MP vienen de
una distribución aproximadamente normal?
6. Construya una gráfica de probabilidad normal para los logaritmos de los datos MP en la tabla 1.2. ¿Parece ser que los
logaritmos de los datos MP vienen de una distribución aproximadamente normal?
7. ¿Se puede utilizar la gráfica en el ejercicio 6 para determinar si parece ser que los datos MP vienen de una población
lognormal? Explique.
El teorema del límite central
El teorema del límite central es, por mucho, el resultado más importante en estadística. Muchos de los métodos estadísticos comúnmente empleados basan su validez en este teorema.
El teorema del límite central establece que si se extrae una muestra lo suficientemente grande de una población, entonces la distribución de la media muestral es aproximadamente normal, sin importar de qué tipo de población haya sido extraída la muestra. Esto último permite
calcular las probabilidades de medias muestrales haciendo uso de la tabla z, a pesar de que la
población de la cual se sacó la muestra no sea normal. A continuación se explica lo anterior
con más detalle.
Sea X1, . . . , Xn una muestra aleatoria simple de una población con media m y varianza
—
s2. Sea X ⫽ (X1 ⫹ . . . ⫹ Xn)/n la media muestral. Ahora imagine que se extraen muchas de
esas muestras y se calculan sus medias muestrales. Si se pudiera extraer cada muestra posible
de tamaño n de la población original, y calcular la media muestral para cada una, la colección
resultante sería la población de medias muestrales. Se puede construir la función de densidad
de probabilidad de esta población. También es factible observar que la forma de esta función de
densidad de probabilidad dependería de la forma de la población de la cual se extrajo la muestra. Lo sorprendente es que si el tamaño de ésta es suficientemente grande esto no es así. Si
El teorema del límite central
Sea X1, . . . , Xn una muestra aleatoria simple de una población con media m y varianza s2.
X1 ⫹ . . . ⫹ Xn
—
Sea X ⫽ ———————
la media muestral.
n
Sea Sn ⫽ X1 ⫹ . . . ⫹ Xn la suma de las observaciones muestrales.
Entonces si n es suficientemente grande
σ2
X ∼ N µ,
aproximadamente
(4.49)
n
y
Sn ∼ N(nμ, nσ 2 )
(4.50)
aproximadamente
4.10
El teorema del límite central
271
el tamaño de la población fuera muy grande, la distribución de la media muestral sería aproximadamente normal, sin importar la distribución de la población de la cual se sacó la muestra.
2
2
—
Observe que el teorema del límite central especifica que m—
X ⫽ m y s X ⫽ s /n, lo cual
es válido para cualquier media muestral. La suma de las unidades de la muestra es igual a la
—
media multiplicada por el tamaño muestral, esto es, Sn ⫽ nX . De ahí que mSn ⫽ nm y s2Sn ⫽
n2s2/n ⫽ ns2 (véanse las ecuaciones 2.41 y 2.42 de la sección 2.5).
—
El teorema del límite central establece que X y Sn se distribuyen aproximadamente como normales, si el tamaño muestral n es suficientemente grande. La cuestión natural por preguntar es: ¿Qué tan grande es suficientemente grande? La respuesta depende de la forma de
la población principal. Si se extrae la muestra de una distribución aproximadamente simétrica, la aproximación normal puede ser buena, incluso para un valor muy pequeño de n. No obstante, si la población está demasiado sesgada, puede ser necesaria una n muy grande. La
evidencia empírica sugiere que para la mayoría de las poblaciones, un tamaño de muestra de
30 o más es lo suficientemente grande para que la aproximación normal sea adecuada (véase
la figura 4.23).
Para la mayoría de las poblaciones, si el tamaño muestral es mayor a 30, la aproximación del teorema del límite central es buena.
Ejemplo
4.64
Sea X el número de imperfecciones en una pulgada de un alambre de cobre. La función de
masa de probabilidad de X se muestra en la siguiente tabla.
x
P.X = x/
0
1
2
3
0.48
0.39
0.12
0.01
Se toma una muestra de 100 alambres de esta población. ¿Cuál es la probabilidad de que el
número promedio de imperfecciones por alambre en esta muestra sea menor a 0.5?
Solución
La media del número de imperfecciones en la población es m ⫽ 0.66 y la varianza poblacional es s2 ⫽ 0.5244. Véase en los ejemplos 2.35 y 2.36 (en la sección 2.4) el cálculo de estas
cantidades. X1, . . . , X100 denota el número de imperfecciones en los 100 alambres extraídos
—
de esta población. Se necesita encontrar P(X ⬍ 0.5). Ahora, el tamaño muestral es n ⫽ 100,
que es una muestra grande. Por el teorema del límite central (expresión 4.49) se tiene que
—
X ⬃ N(0.66, 0.005244). Por tanto, el puntaje z es
0.5 − 0.66
= −2.21
z= √
0.005244
—
De la tabla z, el área a la izquierda de ⫺2.21 es 0.0136. Por consecuencia, P(X ⬍ 0.5) ⫽
0.0136, por lo que sólo 1.36% de las muestras de tamaño 100 tendrá menos de 0.5 imperfecciones por alambre. Véase la figura 4.24.
272
Distribuciones comúnmente usadas
CAPÍTULO 4
Población
0.5
1
Tamaño de muestra = 5
2.5
0.4
0.8
2
0.3
0.6
1.5
0.2
0.4
1
0.1
0.2
0.5
0
⫺4
0
⫺2
2
0
4
⫺1
0
1
0
Tamaño de muestra = 5
2
0.35
0
0.5
Tamaño de muestra = 30
12
10
0.3
1.5
0.25
8
0.2
1
6
0.15
4
0.1
0.5
2
0.05
0
⫺1
0
1
2
3
0
⫺1.6
4
⫺0.8
0
0.8
1.6
Valor de la media muestral
Tamaño de muestra = 5
Población
0
6
1.2
2.5
5
1
2
4
0.8
3
0.6
2
0.4
1
0.2
0
⫺0.5
Valor de la media muestral
Valor de la media muestral
Población
Tamaño de muestra = 30
0
1
2
3
4
0
⫺0.6 ⫺0.3
0
0.3 0.6
Valor de la media muestral
Tamaño de muestra = 30
1.5
1
0.5
⫺1
0
1
Valor de la media muestral
0
⫺0.5
0
0.5
Valor de la media muestral
FIGURA 4.23 La gráfica de la extrema izquierda en cada fila es la distribución (función de densidad de probabilidad o función de masa de probabilidad) de una variable aleatoria. Las dos gráficas a la derecha son las distribuciones de la media
muestral (línea continua) para muestras de tamaños 5 y 30, respectivamente, con la curva normal (línea discontinua) sobrepuesta. Fila superior: Dado que la distribución original es aproximadamente simétrica, la aproximación normal es buena
incluso para un tamaño de muestra tan pequeño como cinco. Fila de en medio: La distribución original está algo sesgada.
Aun así, la aproximación normal es razonablemente buena incluso para una muestra de tamaño 5, y muy buena para una
muestra de tamaño 30. Fila inferior: La distribución original está muy sesgada. La aproximación normal no es buena para
una muestra de tamaño 5, pero es razonablemente buena para una muestra de tamaño 30. Observe que dos de las distribuciones originales son continuas y una discreta. El teorema del límite central es válido tanto para las distribuciones continuas
como para las discretas.
4.10
El teorema del límite central
273
0.0136
0.50
z = ⫺2.21
0.66
FIGURA 4.24 Solución al ejemplo 4.64.
Observe que en el ejemplo 4.64 se necesita conocer sólo la media y la varianza de la
población, no la función de masa de probabilidad.
Ejemplo
4.65
En una universidad grande, la media de la edad de los estudiantes es 22.3 años y la desviación estándar es de cuatro años. Se toma una muestra aleatoria de 64 estudiantes. ¿Cuál es la
probabilidad de que la edad promedio de estos estudiantes sea mayor a 23 años?
Solución
—
Sean X1, . . . , X64 las edades de los 64 estudiantes en la muestra. Se desea determinar P(X ⬎
23). Ahora la población de la cual se sacó la muestra tiene una media m ⫽ 22.3 y varianza
s2 ⫽ 16. El tamaño muestral es n ⫽ 64. Por el teorema del límite central (expresión 4.49) se
—
tiene que X ⬃ N(22.3, 0.25). El puntaje z para 23 es
z=
23 − 22.3
√
= 1.40
0.25
—
De la tabla z, el área a la derecha de 1.40 es 0.0808. Por tanto, P(X ⬎ 23) ⫽ 0.0808. Véase
la figura 4.25.
0.0808
22.3
23.0
z = 1.4
FIGURA 4.25 Solución al ejemplo 4.65.
Aproximación normal a la binomial
Recuerde de la sección 4.2, que si X ⬃ Bin(n, p), entonces X ⫽ Y1 ⫹ . . . ⫹ Yn, donde Y1, . . . , Yn
es una muestra de una población de Bernoulli(p). Por consiguiente, X es la suma de los datos
de la muestra. La proporción muestral es
274
CAPÍTULO 4
Distribuciones comúnmente usadas
—
p
=
Y 1 + · · · + Yn
X
=
n
n
que es también la media muestral Y . La población de Bernoulli(p) tiene una media m ⫽ p y
una varianza s2 ⫽ p(1 ⫺ p). Por el teorema del límite central se tiene que si el número de experimentos n es grande, entonces X ⬃ N(np, np(1 ⫺ p)) y p̂ ⬃ N(p, p(1 ⫺ p)/n).
Nuevamente surge la cuestión, ¿qué tan grande es lo suficientemente grande? En el caso binomial, la exactitud de la aproximación normal depende del número promedio de éxitos
np y del número promedio de fracasos n(1 ⫺ p). Entre más grandes sean los valores de np y
n(1 ⫺ p), mejor será la aproximación. Una regla general es utilizar la aproximación normal
cada vez que np ⬎ 5 y n(1 ⫺ p) ⬎ 5. Una regla mejor y más prudente es utilizar la aproximación normal cada vez que np ⬎ 10 y n(1 ⫺ p) ⬎ 10.
Resumen
Si X ⬃ Bin(n, p) y si np ⬎ 10 y n(1 ⫺ p) ⬎ 10, entonces
X ∼ N (np, np(1 − p))
p(1 − p)
p
∼ N p,
n
aproximadamente
(4.51)
aproximadamente
(4.52)
Para mostrar la exactitud de la aproximación normal a la binomial, la figura 4.26 muestra el histograma de probabilidad Bin(100, 0.2) con la función de densidad de probabilidad
N(20, 16) sobrepuesto. Aunque se puede detectar cierto grado de asimetría en la distribución
binomial, la aproximación normal es muy buena.
0.1
0.08
0.06
0.04
0.02
0
0
2
4
6
8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40
FIGURA 4.26 El histograma de probabilidad Bin(100, 0.2), con la función de densidad de probabilidad N(20, 16) sobrepuesta.
4.10
El teorema del límite central
275
Corrección por continuidad
La distribución binomial es discreta, mientras que la distribución normal es continua. La corrección por continuidad es un ajuste, hecho cuando se aproxima una distribución discreta
con una continua, que puede mejorar la exactitud de la aproximación. Para ver cómo funciona, imagine que se lanza al aire una moneda 100 veces. Sea X el número de caras. Entonces
X ⬃ Bin(100, 0.5). Imagine que se desea calcular la probabilidad de que X esté entre 45 y 55.
Esta probabilidad diferirá dependiendo si se incluye o excluye los puntos finales, 45 y 55. La
figura 4.27 ilustra el caso en el que se incluye los puntos finales; es decir, en el que se quiere estimar P(45 ⱕ X ⱕ 55). La probabilidad exacta está dada por el área total de los rectángulos del histograma de probabilidad binomial correspondientes, incluyendo a los enteros 45
y 55. Se sobrepone la curva normal aproximada. Para obtener una mejor aproximación se debe calcular el área bajo la curva normal entre 44.5 y 55.5. En contraste, la figura 4.28 muestra el caso en el que se desea calcular P(45 ⬍ X ⬍ 55). Aquí se incluye los puntos finales. La
probabilidad exacta está dada por el área total de los rectángulos del histograma de probabilidad binomial correspondientes a los enteros 46 al 54. La mejor aproximación normal se encuentra al calcular el área bajo la curva normal entre 45.5 y 54.5.
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
40
45
50
55
60
FIGURA 4.27 Para calcular P(45 ⱕ X ⱕ 55) deben incluirse las áreas de los rectángulos correspondientes a 45 y 55. Para aproximar esta probabilidad con la curva normal, se calcula el área bajo la curva entre 44.5 y 55.5.
En resumen, para aplicar la corrección por continuidad, determine qué rectángulos del
histograma de probabilidad discreta desea incluir, y después calcule el área bajo la curva normal que corresponde a estos rectángulos.
Ejemplo
4.66
Si se lanza al aire una moneda 100 veces, utilice la curva normal para aproximar la probabilidad de que el número de caras esté entre, e incluyendo a, 45 y 55.
276
CAPÍTULO 4
Distribuciones comúnmente usadas
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
40
45
50
55
60
FIGURA 4.28 Para calcular P(45 ⬍ X ⬍ 55) se debe excluir las áreas de los rectángulos
correspondientes a 45 y a 55. Para aproximar esta probabilidad con la curva normal, se
calcula el área bajo la curva entre 45.5 y 54.5.
Solución
La figura 4.27 muestra esta situación. Sea X el número de caras obtenidas. Entonces
X ⬃ Bin(100, 0.5). Al sustituir n ⫽ 100 y p ⫽ 0.5 en la ecuación (4.51) se obtiene la aproximación normal X ⬃ N(50, 25). Puesto que se incluyen los puntos finales 45 y 55, debe calcularse el área bajo la curva normal entre 44.5 y 55.5. Los puntajes z para 44.5 y 55.5 son
z=
44.5 − 50
= −1.1,
5
z=
55.5 − 50
= 1.1
5
De la tabla z se determina que la probabilidad es 0.7286. Véase la figura 4.29.
0.7286
44.5
z = ⫺1.1
50
55.5
z = 1.1
FIGURA 4.29 Solución al ejemplo 4.66.
Ejemplo
4.67
Si se lanza al aire 100 veces una moneda, utilice la curva normal para aproximar la probabilidad de que el número de caras está entre, y excluyendo a, 45 y 55.
4.10
El teorema del límite central
277
Solución
La figura 4.28 muestra esta situación. Sea X el número de “caras” obtenidas. Al igual que en
el ejemplo 4.66, X ⬃ Bin(100, 0.5), y la aproximación normal es X ⬃ N(50, 25). Como consecuencia de que se excluyen los puntos finales 45 y 55, se debe calcular el área bajo la curva normal entre 45.5 y 54.5. Los puntajes z para 45.5 y 54.5 son
z=
45.5 − 50
= −0.9,
5
z=
54.5 − 50
= 0.9
5
De la tabla z se determina que la probabilidad es 0.6318. Véase la figura 4.30.
0.6318
45.5
z = ⫺0.9
50
54.5
z = 0.9
FIGURA 4.30 Solución al ejemplo 4.67.
Ejemplo
4.68
En cierta universidad grande, 25% de los estudiantes tiene más de 21 años de edad. En una
muestra de 400 estudiantes, ¿cuál es la probabilidad de que más de 110 supere los 21 años?
Solución
Sea X el número de estudiantes que tiene más de 21 años. Entonces X ⬃ Bin(400, 0.25). Puede utilizarse la aproximación normal, la cual es X ⬃ N(100, 75). Ya que se desea determinar
la probabilidad de que el número de estudiantes sea mayor que 110, se excluye al valor 110.
Por tanto, se determina P(X ⬎ 110.5). Se calcula el puntaje z para 110.5, el cual es
z=
110.5 − 100
√
= 1.21
75
Utilizando la tabla z se determina que P(X ⬎ 110.5) ⫽ 0.1131. Véase la figura 4.31.
0.1131
100
110.5
z = 1.21
FIGURA 4.31 Solución al ejemplo 4.68.
278
CAPÍTULO 4
Distribuciones comúnmente usadas
Exactitud de la corrección por continuidad
La corrección por continuidad mejora, en la mayoría de los casos, la exactitud de la aproximación normal a la distribución binomial. Sin embargo, para distribuciones binomiales con n
grande y p pequeña, cuando se calcula una probabilidad que corresponda a un área en la cola de la distribución, la corrección por continuidad puede, en algunos casos, reducir en algo la
exactitud de la aproximación normal. Esto resulta del hecho de que la aproximación normal
no es perfecta; no puede explicar un pequeño grado de asimetría en estas distribuciones. En
suma, el uso de la corrección por continuidad hace que la aproximación normal a la distribución binomial sea mejor en la mayoría de los casos, pero no en todos.
Aproximación normal a la de Poisson
Recuerde que si X ⬃ Poisson(λ), entonces X es aproximadamente binomial con n grande y
np ⫽ λ. Recuerde también que mX ⫽ λ y s2X ⫽ λ. De ahí que si λ es suficientemente grande,
es decir, λ ⬎ 10, entonces X es aproximadamente binomial, con np ⬎ 10. Por el teorema del
límite central se tiene que X es también aproximadamente normal, con media y varianza igual
a λ. Por tanto, puede utilizarse la distribución normal para aproximar a la de Poisson.
Resumen
Si X ⬃ Poisson(λ), donde λ ⬎ 10, entonces
X ⬃ N (λ, λ),
aproximadamente
(4.53)
Corrección por continuidad para la distribución de Poisson
Dado que una distribución de Poisson es discreta, la corrección por continuidad puede, en
principio, aplicarse cuando se utiliza la aproximación normal. Para las áreas que incluyen la
parte central de la curva, la corrección por continuidad generalmente mejora la aproximación
normal, pero para las áreas de las colas la corrección por continuidad algunas veces empeora
la aproximación. No se utilizará la corrección por continuidad para la distribución de Poisson.
Ejemplo
4.69
El número de visitas a un sitio web sigue una distribución de Poisson, con una media de 27
visitas por hora. Encuentre la probabilidad de que haya 90 o más visitas durante tres horas.
Solución
Sea X el número de visitas al sitio web en tres horas. La media del número de visitas en tres
horas es 81, por lo que X ⬃ Poisson(81). Utilizando la aproximación normal X ⬃ N(81, 81).
Se desea encontrar P(X ⱖ 90). Se calcula el puntaje z de 90, que es
z=
90 − 81
√
= 1.00
81
Haciendo uso de la tabla z se determina que P(X ⱖ 90) ⫽ 0.1587. Véase la figura 4.32.
4.10
El teorema del límite central
279
0.1587
81
90
z=1
FIGURA 4.32 Solución al ejemplo 4.69.
Ejercicios para la sección 4.10
1. Las bolsas de una mezcla de concreto, etiquetadas con un
peso de 100 libras, tienen por peso una media poblacional
de 100 libras y una desviación estándar poblacional de 0.5
libras.
a) ¿Cuál es la probabilidad de que la media del peso de una
muestra aleatoria de 50 bolsas sea menor a 99.9 libras?
b) Si la media del peso de poblacional aumenta a 100.15 libras, ¿cuál es la probabilidad de que la media del peso
de una muestra de tamaño 50 sea menor a 100 libras?
2. Un libro de 500 páginas tiene 250 hojas de papel. El espesor del papel utilizado para fabricar el libro tiene una media
de 0.08 mm y una desviación estándar de 0.01 mm.
a) ¿Cuál es la probabilidad de que un libro seleccionado
aleatoriamente tenga un espesor mayor a 20.2 mm (sin
incluir las portadas)?
b) ¿Cuál es el 10o. percentil del espesor del libro?
c) Alguien quiere conocer la probabilidad de que una página elegida aleatoriamente tenga un espesor mayor a 0.1
mm. ¿Se tiene la suficiente información para calcular
esta probabilidad? Si es así, calcule la probabilidad. Si
no, explique por qué.
3. Se elige una muestra aleatoria de 100 hombres con una estatura media de 70 pulgadas y una desviación estándar de
2.5 pulgadas. ¿Cuál es la probabilidad de que la estatura
promedio de los hombres de la muestra sea mayor a 69.5
pulgadas?
4. Entre todas las formas de declaración de ingresos para el
pago de impuestos, llenadas en cierto año, la media del impuesto pagado fue de $2 000 y la desviación estándar fue de
$500. Además, en 10% de las formas, el impuesto pagado
fue mayor a $3 000. Se toma una muestra aleatoria de 625
formas de declaración de ingresos para el pago de impuestos.
a) ¿Cuál es la probabilidad de que el impuesto promedio
pagado en las formas de la muestra sea mayor a $1 980?
b) ¿Cuál es la probabilidad de que más de 60 de las formas
de la muestra tenga un impuesto mayor a $3 000?
5. Se extrae una muestra de 225 alambres de la población de
alambres descrita en el ejemplo 4.64 (p. 271). Encuentre la
probabilidad de que menos de 110 de éstos no tengan imperfección.
6. Unos tambores, con una etiqueta de 30 L, son llenados con
una solución proveniente de una tina grande. Se agrega una
cantidad aleatoriamente de la solución en cada tambor con
media de 30.01 L y desviación estándar de 0.1 L.
a) ¿Cuál es la probabilidad de que la cantidad total de la
solución contenida en 50 tambores sea mayor a 1 500 L?
b) Si la cantidad total de la solución en la tina es de 2 401
L, ¿cuál es la probabilidad de que puedan llenarse 80
tambores sin que se acabe la solución?
c) ¿Cuánta solución debe contener la tina para que la probabilidad sea 0.9 de que puedan llenarse 80 tambores
sin que se acabe la solución?
7. Cierto proceso de fabricación de componentes electrónicos
produce partes, 20% de las cuales está defectuoso. Las partes son enviadas en unidades de 400. Los envíos que contienen más de 90 partes defectuosas se puede regresar. Usted
puede suponer que cada envío constituye una muestra aleatoria simple de partes.
a) ¿Cuál es la probabilidad de que se regrese un envío específico?
b) En un día particular se realizaron 500 envíos. ¿Cuál es
la probabilidad de que se regresen 60 o más de éstos?
280
CAPÍTULO 4
Distribuciones comúnmente usadas
c) Se introduce un nuevo proceso de fabricación, el cual se
supone reduce los porcentajes de las partes defectuosas.
El objetivo de la compañía es reducir la probabilidad de
que se regrese un envío a 0.01. ¿Cuál debe ser el porcentaje de partes defectuosas para alcanzar este objetivo?
8. Verdadero o falso:
a) Con una muestra grande, el histograma de la muestra se
parecerá mucho a la curva normal.
b) Con una muestra grande, la función de densidad de probabilidad de la media muestral se parecerá mucho a la
curva normal.
9. La densidad de las partículas en una suspensión es de 50 por
mL. Se extrae un volumen de 5 mL de la suspensión.
a) ¿Cuál es la probabilidad de que el número de partículas
extraídas esté entre 235 y 265?
b) ¿Cuál es la probabilidad de que el número promedio de
partículas por mL en la muestra extraída esté entre 48 y
52?
c) Si se toma una muestra de 10 mL, ¿cuál es la probabilidad de que el número promedio por mL de partículas en
la muestra extraída esté entre 48 y 52?
d ) ¿Qué tan grande debe ser la muestra extraída para que el
número promedio de partículas por mL en la muestra esté entre 48 y 52 con probabilidad de 95%?
10. Un productor de baterías afirma que la duración de cierto tipo de batería tiene una media poblacional de 40 horas y des—
viación estándar de cinco horas. Sea X la duración promedio
de las baterías en una muestra aleatoria simple de tamaño
100.
—
a) Si la afirmación es cierta, ¿cuál es P(X ⱕ 36.7)?
b) Con base en la respuesta al inciso a), si la afirmación es
cierta, ¿una media muestral de 36.7 horas sería una duración inusualmente corta?
c) Si la duración media de la muestra de las 100 baterías
fuera de 36.7 horas, ¿usted creería en la afirmación del
fabricante? Explique.
—
d ) Si la afirmación es cierta, ¿cuál es P(X ⱕ 39.8)?
11. Se ha diseñado un nuevo proceso para fabricar lozas de cerámica. El objetivo es que no haya más de 5% que no sea
satisfactorio debido a defectos en la superficie. Se revisa
una muestra de 1 000 lozas. Sea X el número de lozas no satisfactorio en la muestra.
a) Si 5% de las lozas producidas no es satisfactorio, ¿a qué
es igual P(X ⱖ 75)?
b) Con base en la respuesta al inciso a), si 5% de las lozas
no es satisfactorio, ¿75 no satisfactorias de las 1 000 sería un número inusualmente grande? Explique.
c) Si 75 de las lozas de la muestra no fueran satisfactorias,
¿sería factible que se haya alcanzado el objetivo? Explique.
d) Si 5% de las lozas producidas no es satisfactorio, ¿a qué
es igual P(X ⱖ 53)?
e) Con base en la respuesta al inciso d ), si 5% de las lozas
no es satisfactorio, ¿53 lozas no satisfactorias de las 1 000
sería un número inusualmente grande?
f ) Si 53 de las lozas de la muestra no fueran satisfactorias,
¿sería factible que se haya alcanzado el objetivo? Explique.
12. Fechado radiactivo: El carbono-14 es un isótopo radiactivo
del carbono que decae al emitir una partícula beta. En la atmósfera terrestre, aproximadamente un átomo de carbono
en 1012 es carbono-14. Los organismos vivos intercambian
carbono con la atmósfera, por lo que esta misma tasa es válida para el tejido vivo. Después de que un organismo muere, éste deja de intercambiar carbono con su ambiente, y su
tasa de carbono-14 disminuye exponencialmente con el
tiempo. La tasa a la cual se emite partículas beta desde una
masa dada de carbono es proporcional a la tasa de carbono14, por lo que esta tasa también disminuye con el tiempo.
Al medir la tasa de emisiones beta en una muestra de tejido, se puede estimar el tiempo transcurrido desde la muerte
del organismo. Específicamente, se sabe que t años después
de la muerte, el número de emisiones de partículas beta que
ocurre en un intervalo a partir de 1 g de carbono sigue una
distribución de Poisson con tasa λ ⫽ 15.3e⫺0.0001210t eventos
por minuto. Por tanto, el número de años t transcurridos
desde la muerte de un organismo se puede expresar en términos de λ:
e) Con base en la respuesta al inciso d), si la afirmación es
cierta, ¿una media muestral de 39.8 horas sería una duración inusualmente corta?
ln 15.3 ⫺ ln λ
t ⫽ ———————
0.0001210
f ) Si la media muestral de la duración de las 100 baterías
fuera de 39.8 horas, ¿usted creería en la afirmación del
fabricante? Explique.
Un arqueólogo descubre una pequeña pieza de carbón vegetal
proveniente de un campamento antiguo. El carbón vegetal contiene 1 g de carbono.
4.11
a) El carbón vegetal tiene 11 000 años de antigüedad, lo
que el arqueólogo no sabe. ¿Cuál es el valor verdadero
de la tasa de emisión λ?
b) El arqueólogo planea contar el número X de emisiones
en un intervalo de 25 minutos. Encuentre la media y la
desviación estándar de X.
Simulación
281
d) ¿Qué valor de λ̂ daría como resultado una estimación de
antigüedad de 10 000 años?
e) ¿Qué valor de λ̂ daría como resultado una estimación de
antigüedad de 12 000 años?
f ) ¿Cuál es la probabilidad de que la estimación de antigüedad tenga una corrección de ⫾ 1 000 años?
c) Posteriormente, el arqueólogo planea estimar λ con λ̂ ⫽
X/25. ¿Cuáles son la media y la desviación estándar de λ̂?
4.11
Simulación
Cuando nacen gemelos-cuates (no idénticos), ambos pueden ser niños, niñas, o uno de cada
uno. Suponga que cada infante tiene la misma probabilidad de ser un niño que una niña, y suponga que los sexos de los gemelos se determinan de manera independiente. ¿Cuál es la probabilidad de que ambos sean niños? Esta probabilidad se estima fácilmente, empleando la
regla de la multiplicación de eventos independientes. La respuesta es (0.5)(0.5) ⫽ 0.25. Pero
se supone que no se conocía la regla de la multiplicación. ¿Existe otra forma en la que se pueda estimar esta probabilidad? Se puede realizar un experimento, o estudio, científico. Es posible obtener los registros de nacimientos de gemelos en hospitales, y contar el número en los
cuales ambos son niños. Si se obtuviese un número suficientemente grande de registros, la
proporción en la cual ambos gemelos fueron niños quizá se aproximaría a 0.25, y se tendría
una buena estimación de la probabilidad.
A continuación se presenta un método más sencillo. Hay dos resultados igualmente probables en el nacimiento de un gemelo: niño o niña. También hay dos resultados probables en
el lanzamiento al aire de una moneda: “cara” o “cruz”. Por consecuencia, el número de “caras” en el lanzamiento de dos monedas tiene la misma distribución que el número de niños en
el nacimiento de un gemelo (ambas son binomiales con n ⫽ 2 experimentos y una probabilidad de éxito p ⫽ 0.5). En lugar de tener el problema de dar seguimiento a los nacimientos
reales, se puede lanzar al aire dos monedas un gran número de veces. La proporción de lanzamientos en los que en ambas monedas sale “cara” se puede utilizar para estimar la proporción de nacimientos en los que ambos gemelos son niños.
Estimar la probabilidad de que ambos gemelos sean niños al usar la estimación de la
probabilidad de que en ambas monedas salga “cara” es un ejemplo de un experimento de simulación. Si se designa a los lados de la moneda como “0” y “1”, entonces el lanzamiento al
aire de una moneda es un ejemplo de un generador de números aleatorios. Este último
constituye un procedimiento para obtener un valor que tiene las mismas propiedades estadísticas como una cantidad muestral aleatoria extraída de cierta distribución específica. El número aleatorio generado por el lanzamiento al aire de una moneda viene de una distribución
de Bernoulli con probabilidad de éxito p ⫽ 0.5.
Hoy en día, las computadoras pueden generar miles de números aleatorios en una fracción de segundo, y virtualmente cada software estadístico contiene rutinas que generan muestras aleatorias a partir de una amplia variedad de distribuciones. Cuando un experimento es
demasiado costoso, o físicamente difícil o imposible de realizar, y cuando la distribución de
la probabilidad de los datos que serían generados por el experimento es aproximadamente co-
282
CAPÍTULO 4
Distribuciones comúnmente usadas
nocido, los números aleatorios generados por computadora a partir de la distribución apropiada se puede utilizar en lugar de los verdaderos datos del experimento. A dichos números se
les llama datos simulados o sintéticos.
Resumen
La simulación se refiere al proceso que genera números aleatorios y los trata como si
hubiesen sido generados por un experimento científico real. A los datos generados de
esta forma se les denomina simulados o sintéticos.
Los métodos de simulación tienen muchos usos, incluyendo la estimación de probabilidades, estimación de medias y varianzas, comprobación de una hipótesis de normalidad, y
estimación de sesgos. En el resto de esta sección se describen algunos de estos métodos.
Uso de la simulación para estimar una probabilidad
Con frecuencia se emplea la simulación para estimar probabilidades que son difíciles de
calcular directamente. Aquí hay un ejemplo. Un ingeniero eléctrico conectará en paralelo
dos resistores, etiquetados como 100 y 25 Ω. Las resistencias verdaderas pueden diferir de
los valores etiquetados. Se denota las resistencias reales de los resistores que son elegidos
por X y Y. La resistencia total R del montaje está dada por R ⫽ XY/(X ⫹ Y). Suponga que
X ⬃ N(100, 102) y Y ⬃ N(25, 2.52) y que los resistores se seleccionan en forma independiente. Suponga que la especificación para la resistencia del montaje es que 19 ⬍ R ⬍ 21.
¿Cuál es la probabilidad de que el montaje cumpla con la especificación? Es decir, ¿a qué
es igual P(19 ⬍ R ⬍ 21)?
Se estimará esta probabilidad con una simulación. La idea es generar datos simulados
cuya distribución se aproxime en lo posible a los datos que serían generados en un experimento
real. En un experimento real, se tomaría una muestra de N resistores etiquetados con 100 Ω,
cuyas resistencias verdaderas fuesen X1, . . . , XN, y después se tomaría una muestra de igual
tamaño de resistores etiquetados con 25 Ω, cuyas resistencias verdaderas fuesen Y1, . . . , YN.
Después se construiría N montajes con resistencias R1 ⫽ X1Y1/(X1 ⫹ Y1), . . . , RN ⫽ XNYN/(XN
⫹ YN). Los valores R1, . . . , RN serían una muestra aleatoria de la población de todos los valores posibles de la resistencia total. La proporción de los valores de la muestra R1, . . . , RN
que estén entre 19 y 21 serían una estimación de P(19 ⬍ R ⬍ 21).
En un experimento real, X1, . . . , XN sería una muestra aleatoria de N(100, 102) y Y1, . . . ,
YN sería una muestra aleatoria de N(25, 2.52). Por consiguiente, en un experimento simulado,
se generaría una muestra aleatoria X *1 , . . . , X *N de N(100, 102) e, independientemente, una
muestra aleatoria Y*1 , . . . , Y*N de N(25, 2.52). Luego se calcularán las resistencias totales simuladas R*1 ⫽ X *1 Y*1 /(X*1 ⫹ Y*1 ), . . . , R*N ⫽ X *N Y*N /(X*N ⫹ Y*N). Se emplea la notación X *i , Y*i y
R*i para indicar que estos son valores simulados provenientes de un generador de números
aleatorios en vez de datos verdaderos provenientes de un experimento real. Dado que la muestra X *1 , . . . , X *N proviene de la misma distribución que la de una muestra real X1, . . . , XN, y
puesto que la muestra Y*1 , . . . , Y*N proviene de la misma distribución que la de una muestra
real Y1, . . . , YN, se tiene que la muestra R*1 , . . . , R*N proviene de la misma distribución que la
de una muestra real de resistencias totales R1, . . . , RN. Por tanto, se puede tratar a R*1 , . . . , R*N
4.11
Simulación
283
como si fuera una muestra de resistencias verdaderas, aunque en realidad es una muestra de
números aleatorios generados por una computadora.
Los resultados de una simulación con un tamaño de muestra N ⫽ 100 se muestran en
la tabla 4.2. Ésta es la muestra más pequeña que se utilizaría en la práctica. Por lo general, se
utilizan con frecuencia muestras de 1 000, 10 000, o más. Las muestras de este tamaño no representan ningún problema para las computadoras modernas y sus programas, y entre más
grande sea la muestra, más precisos serán los resultados.
Con el propósito de que los cálculos sean más transparentes, se ordenan los 100 valores de R*i , que están en la tabla 4.2, en orden ascendente.
15.37
17.91
18.71
19.02
19.47
19.84
20.17
20.69
21.41
22.02
15.48
17.95
18.80
19.03
19.52
19.90
20.49
20.75
21.49
22.06
15.58
18.01
18.81
19.06
19.56
19.91
20.52
20.76
21.52
22.11
16.66
18.06
18.85
19.11
19.58
19.95
20.54
20.78
21.54
22.13
16.94
18.21
18.91
19.13
19.60
19.97
20.55
20.81
21.58
22.36
17.18
18.31
18.92
19.14
19.60
19.98
20.55
20.90
21.79
22.42
17.44
18.49
18.93
19.20
19.65
20.03
20.58
20.96
21.84
23.19
17.54
18.58
18.99
19.22
19.71
20.14
20.60
21.06
21.87
23.40
17.68
18.60
18.99
19.24
19.77
20.16
20.60
21.13
21.93
23.71
17.69
18.65
19.01
19.30
19.81
20.17
20.64
21.24
21.93
24.01
Para estimar la P(19 ⬍ R ⬍ 21) se determina que 48 de los 100 valores de la muestra se encuentran en este rango. Por consiguiente, se estima P(19 ⬍ R ⬍ 21) ⫽ 0.48. Se observa que
con una muestra más grande, se puede emplear un software para hacer este conteo.
Advierta que la importancia del supuesto de que la resistencia X del primer resistor y la
Y del segundo fuesen independientes. Debido a este supuesto, es posible simular el experimento al generar muestras independientes X* y Y*. Si X y Y hubieran sido dependientes, se
tendría que haber generado X* y Y* para que tuvieran la misma distribución conjunta que X
y Y. (En la sección 2.6 se analizaron las distribuciones conjuntas.) Por fortuna, muchos problemas reales de la vida implican muestras independientes.
A continuación se presenta otro ejemplo de una probabilidad estimada con una simulación.
Ejemplo
4.70
Una ingeniera tiene que elegir entre dos tipos de ventiladores para instalarlo en una computadora. Las duraciones, en meses, de los ventiladores del tipo A se distribuyen exponencialmente con una media de 50 meses, y las de los tipo B se distribuyen exponencialmente con
una media de 30 meses. Como consecuencia de que los ventiladores del tipo A son más caros, la ingeniera decide que elegirá estos últimos si la probabilidad de que este tipo duplique
su tiempo de duración que el de un ventilador B sea mayor a 0.5. Estime esta probabilidad.
Solución
Sea A la duración, en meses, de ventilador de tipo A elegido de forma aleatoria, y B representa la duración, en meses, de otro elegido aleatoriamente. Se necesita calcular a P(A ⬎ 2B). Se
realiza un experimento de simulación, utilizando muestras de tamaño 1 000. Se genera una
muestra aleatoria A*1, . . . , A*1 000 a partir de una distribución exponencial con media 50(λ ⫽
0.02) y una muestra aleatoria B*1, . . . , B*1 000 a partir de una distribución exponencial con media 30(λ ⫽ 0.033). Luego se cuenta el número de veces que A*i ⬎ 2B*i . La tabla 4.3 presenta
los primeros diez valores y el último valor. La columna etiquetada como “A* ⬎ 2B*” contiene un “1” si A*i ⬎ 2B*i , y un “0” si A*i ⱕ 2B*i .
284
X∗
102.63
96.83
96.46
88.39
113.07
117.66
108.04
101.13
105.43
103.41
104.89
94.91
92.91
95.86
100.06
90.34
116.74
90.45
97.58
101.19
101.77
100.53
98.00
108.10
91.07
R∗
24.30
21.42
26.34
22.10
29.17
27.09
18.20
28.30
23.51
24.64
22.59
27.86
27.06
24.82
23.65
23.75
24.38
25.30
23.05
23.60
31.42
24.93
27.57
27.51
23.38
19.65
17.54
20.69
17.68
23.19
22.02
15.58
22.11
19.22
19.90
18.58
21.54
20.96
19.71
19.13
18.81
20.17
19.77
18.65
19.14
24.01
19.98
21.52
21.93
18.60
X∗
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
115.94
100.65
89.71
104.93
93.74
104.20
123.43
101.38
88.52
101.23
86.96
95.92
95.97
93.76
113.89
109.37
91.13
101.60
102.69
108.50
80.86
85.80
105.96
103.98
97.97
Y∗
R∗
24.93
28.36
23.00
24.10
23.68
24.02
26.66
22.19
26.85
26.88
25.66
26.16
26.05
24.71
22.79
26.19
24.93
28.66
21.37
25.34
27.55
24.80
23.20
21.78
23.13
20.52
22.13
18.31
19.60
18.91
19.52
21.93
18.21
20.60
21.24
19.81
20.55
20.49
19.56
18.99
21.13
19.58
22.36
17.69
20.54
20.55
19.24
19.03
18.01
18.71
X∗
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
94.20
82.62
119.49
99.43
108.03
95.32
80.70
91.13
111.35
118.75
103.33
107.77
104.86
84.39
94.26
82.16
108.37
86.16
105.97
92.69
97.48
110.45
89.92
103.78
95.53
Y∗
R∗
23.68
27.82
22.88
28.03
21.69
20.60
30.36
20.38
27.09
23.92
23.99
18.08
24.64
25.52
25.61
27.49
27.35
21.46
23.59
23.88
25.43
20.70
27.23
25.67
25.55
18.92
20.81
19.20
21.87
18.06
16.94
22.06
16.66
21.79
19.91
19.47
15.48
19.95
19.60
20.14
20.60
21.84
17.18
19.30
18.99
20.17
17.44
20.90
20.58
20.16
X∗
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
113.32
90.82
102.88
93.59
89.19
95.04
109.72
107.35
89.59
101.72
101.24
109.67
100.74
98.44
101.05
88.13
113.94
97.42
109.05
100.65
105.64
78.82
112.31
100.14
88.78
Y∗
R∗
22.54
23.79
25.99
23.04
27.05
23.76
30.25
27.01
18.55
24.65
25.92
26.61
26.18
23.63
28.81
28.43
29.45
23.78
23.04
26.63
21.57
23.25
22.77
24.95
25.87
18.80
18.85
20.75
18.49
20.76
19.01
23.71
21.58
15.37
19.84
20.64
21.41
20.78
19.06
22.42
21.49
23.40
19.11
19.02
21.06
17.91
17.95
18.93
19.97
20.03
Distribuciones comúnmente usadas
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Y∗
CAPÍTULO 4
TABLA 4.2 Datos simulados de las resistencias en un circuito paralelo
4.11
Simulación
285
TABLA 4.3 Datos simulados para el ejemplo 4.70
1
2
3
4
5
6
7
8
9
10
..
.
1 000
A∗
B∗
A∗ > 2B∗
25.554
66.711
61.189
9.153
98.794
14.577
65.126
13.205
20.535
62.278
..
.
19.705
12.083
11.384
15.191
119.150
45.258
139.149
9.877
12.106
21.613
13.289
..
.
12.873
1
1
1
0
1
0
1
0
0
1
..
.
0
Entre los primeros diez pares (A*i , B*i ) hay seis para los cuales A*i ⬎ 2B*i . Por consecuencia, si se basaran los resultados en los diez primeros valores, se estimaría que P(A ⬎ 2B)
⫽ 6/10 ⫽ 0.06. Obviamente, los diez pares simulados no se aproximan lo suficiente para calcular una estimación confiable. Entre los 1 000 pares simulados, hay 460 para los cuales
A*i ⬎ 2B*i . Por tanto, se estima P(A ⬎ 2B) ⫽ 0.460. La ingeniera escoge el tipo B. Se observa que esta probabilidad se puede calcular sólo con una integral múltiple. La probabilidad
exacta es 5/11 ⫽ 0.4545. La aproximación de la simulación es muy buena.
Una muestra simulada correctamente a partir de una distribución de probabilidad dada
es, de hecho, una muestra aleatoria simple de dicha distribución. Por consiguiente, se puede
utilizar la media y la varianza muestrales simuladas para estimar la media y la varianza de la
distribución, y se puede utilizar una gráfica de probabilidad para determinar si la distribución
de probabilidad fue bien aproximada por una función de densidad estándar, como la curva
normal. A continuación, se presentan algunos ejemplos.
Estimación de medias y varianzas
El ejemplo 4.71 muestra cómo se puede emplear los valores simulados para estimar la media
y la desviación estándar de una población.
Ejemplo
4.71
Utilice los valores simulados R*i en la tabla 4.2 para estimar la media mR y la desviación estándar sR de la resistencia total R.
Solución
Se puede considerar a los valores R*1, . . . , R*100 como si fueran una muestra aleatoria de las
–
resistencias reales. Por consiguiente, se estima mR con la media muestral R* y sR con la des-
286
CAPÍTULO 4
Distribuciones comúnmente usadas
viación estándar muestral sR*. La media y la desviación estándar muestrales de R*1, . . . , R*100
–
son R* ⫽ 19.856 y sR* ⫽ 1.6926, respectivamente. Éstas son las estimaciones de mR y sR.
Comparación con la propagación de errores
En el ejemplo 4.71 se utilizó la simulación para aproximar la media y la desviación estándar
de una función de variables aleatorias R ⫽ XY/(X ⫹ Y). El método de propagación de errores,
analizado en la sección 3.4, también se puede emplear con este propósito (véase el ejemplo
3.20). Por supuesto, la simulación puede hacer muchas cosas que la propagación de errores
no, como estimar probabilidades y determinar si una función dada de variables aleatorias se
distribuye normalmente. Pero si lo que se necesita es estimar la desviación estándar de una
función de variables aleatorias, es natural preguntar si la simulación o la propagación de errores es la mejor técnica. La respuesta es que cada método tiene ventajas y desventajas.
Para que el análisis de esta cuestión sea concreto, sean X1, . . . , Xn variables aleatorias
independientes y U ⫽ U(X1, . . . , Xn) una función. Se desea calcular sU. Lo primero que se
necesita decir es que, en muchos casos, ambos métodos funcionan bien y dan resultados similares, por lo que sólo es una cuestión de conveniencia lo que se utiliza. La simulación tiene una ventaja, que no requiere que las desviaciones estándar de X1, . . . , Xn sean pequeñas,
como lo hace la propagación de errores. Sin embargo, esta última tiene dos grandes ventajas.
Primero, no es necesario conocer las distribuciones de X1, . . . , Xn, como se necesita en simulación. Segundo, puede indicar cuál de las X contribuye más a la incertidumbre de U, lo que
no se puede hacer tan fácil con la simulación.
Uso de la simulación para determinar si una población
es aproximadamente normal
Una de las cuestiones que surge con mayor frecuencia en el análisis de datos es si una población se distribuye aproximadamente normal. Cuando se tiene a la disposición una muestra simulada de una población, es posible resolver esta cuestión.
Ejemplo
4.72
Construya un histograma de los valores simulados de R* presentados en la tabla 4.2. Construya una gráfica de probabilidad normal para determinar si la densidad de la resistencia R es
aproximadamente normal.
Solución
La siguiente figura muestra el histograma y la gráfica de probabilidad. El primero es aproximadamente simétrico y tiene una moda. Esto es consistente con la normalidad. La segunda
indica una ligera desviación de la normalidad, especialmente en las colas. Es muy razonable
decir que la distribución parece ser aproximadamente normal. En la práctica, una muestra de
tamaño 1 000 o más generaría un histograma más preciso. Una muestra de 100 es adecuada
para la gráfica de probabilidad, aunque no haya más problemas para generar una muestra más
grande.
4.11
287
Simulación
Gráfica de probabilidad normal para resistencias simuladas
0.999
0.25
0.99
0.95
0.9
Densidad
0.2
0.75
0.15
0.5
0.25
0.1
0.1
0.05
0.05
0
0.01
0.001
15 16
17 18 19
20 21 22 23 24
Resistencia
25
16
18
20
Resistencia
22
24
El ejemplo 4.73 muestra cómo se puede usar la simulación para determinar si el tamaño de una muestra es lo suficientemente grande para que sea válido el teorema del límite central, si se conoce la distribución de la cual se extrajo la muestra.
Ejemplo
4.73
El artículo “Termal Absorption from Pesticida Residues” (M. Reddy y A. Bunge, en The
Practical Applicability of Toxicokinetic Models in the Risk Assesment of Chemicals, 2002:5579) modela la cantidad de pesticida absorbida en el sistema como una variable aleatoria lognormal, cuya media es proporcional a la dosis. Suponga que para cierta dosis, la cantidad
absorbida sigue una distribución lognormal con parámetros m ⫽ 1 y s ⫽ 0.5. Se llevará a cabo un experimento en el que se aplica esta dosis en cada uno de los cinco experimentos independientes, y la cantidad absorbida se determinará cada vez. ¿La cantidad absorbida en
promedio sigue una distribución aproximadamente normal?
Solución
Sea X1, . . . , X5 una muestra aleatoria de una distribución lognormal con parámetros m ⫽ 1 y
—
s ⫽ 0.5. La pregunta es si la media muestral X tiene una distribución aproximadamente normal. Se responderá esta pregunta al generar 1 000 muestras aleatorias simuladas de tamaño
cinco a partir de esta distribución lognormal, al calcular la media muestral de cada una de
ellas, y después al construir una gráfica de probabilidad para las 1 000 medias muestrales. La
tabla 4.4 presenta las primeras tres y las últimas tres de las muestras. Las primeras cinco columnas en cada renglón de la tabla 4.4 constituyen una muestra aleatoria simple X*1i, . . . , X*5i
proveniente de una distribución lognormal con parámetros m ⫽ 1 y s ⫽ 0.5. La sexta colum—
na es la media muestral X*i . Por consecuencia, las 1 000 entradas en la sexta columna son una
muestra aleatoria de medias muestrales. Al construir una gráfica de probabilidad normal de
estos valores, se puede determinar si la media muestral está distribuida normalmente.
288
CAPÍTULO 4
Distribuciones comúnmente usadas
TABLA 4.4 Datos simulados para el ejemplo 4.73
1
2
3
..
.
998
999
1 000
∗
X1∗
X2∗
X3∗
X4∗
X5∗
X
2.3220
3.3379
2.9338
..
.
4.7993
3.7929
3.7680
1.5087
2.8557
3.0364
..
.
3.7609
2.9527
4.5899
1.2144
1.0023
3.1488
..
.
1.5751
6.3663
2.8609
2.5092
3.8088
2.0380
..
.
3.6382
1.8057
2.1659
3.3408
2.3320
4.7030
..
.
2.0254
10.4450
5.0658
2.1790
2.6673
3.1720
..
.
3.1598
5.0725
3.6901
A continuación se muestra un histograma y una gráfica de probabilidad normal de los
—
1 000 valores de X*. El histograma muestra que la distribución está sesgada a la derecha. La
gráfica de probabilidad confirma que la distribución está muy lejos de ser normal.
0.999
0.6
0.99
Densidad
0.5
0.95
0.9
0.75
0.5
0.4
0.3
0.25
0.1
0.05
0.01
0.2
0.1
0.001
0
1
1.5
2
2.5 3 3.5 4 4.5
Media muestral
5
5.5
6
2
3
4
5
6
Uso de la simulación en los análisis de confiabilidad
Un sistema está formado por componentes, cada uno tiene un tiempo de vida aleatorio. Por
tanto, el tiempo de vida de un sistema también es aleatorio. Con frecuencia los ingenieros especialistas en confiabilidad conocen las distribuciones de probabilidad de los tiempos de vida de los componentes y desean determinar la distribución de probabilidad del sistema. En la
práctica puede ser muy difícil calcular directamente la distribución del tiempo de vida del sistema a partir de las distribuciones de los tiempos de vida de los componentes. No obstante, si
los tiempos de vida de éstos son independientes, con frecuencia ello puede realizarse fácilmente con simulación. En seguida se muestra un ejemplo sencillo.
4.11
Ejemplo
4.74
Simulación
289
Un sistema está formado por los componentes A y B conectados en paralelo, tal y como se
muestra en la siguiente ilustración esquemática. El tiempo de vida en meses del componente
A se distribuye Exp(1) y el tiempo de vida en meses del componente B se distribuye Exp(0.5).
El sistema funcionará hasta que A y B fallen. Estime la media del tiempo de vida del sistema,
la probabilidad de que el sistema funcione durante menos de un mes, y el 10o. percentil de
los tiempos de vida del sistema.
A
B
Solución
Se genera una muestra A*1, . . . , A*1 000 de los tiempos de vida simulados del componente A a
partir de una distribución Exp(1). Después se genera una muestra B*1, . . . , B*1 000 de los tiempos de vida simulados del componente B a partir de una distribución Exp(0.5). Observe que
la media del tiempo de vida del componente A es de un mes y la media del tiempo de vida
del componente B es 1/0.5 ⫽ 2 meses. El tiempo de vida del i-ésimo sistema simulado es
L*i ⫽ máx(A*i , B*i ). La tabla 4.5 muestra los resultados de las primeras diez muestras y de la
última muestra.
TABLA 4.5 Datos simulados para el
ejemplo 4.74
1
2
3
4
5
6
7
8
9
10
..
.
1 000
A∗
B∗
L∗
0.0245
0.3623
0.8858
0.1106
0.1903
2.2259
0.8881
3.3471
2.5475
0.3614
..
.
0.3619
0.5747
0.3998
1.7028
14.2252
0.4665
1.4138
0.9120
3.2134
1.3240
0.8383
..
.
1.8799
0.5747
0.3998
1.7028
14.2252
0.4665
2.2259
0.9120
3.3471
2.5475
0.8383
..
.
1.8799
La media muestral de los primeros diez valores de L*i es 2.724. Cinco de ellos son menores a 1. El 10o. percentil de estos valores es (0.3998 ⫹ 0.4665)/2 ⫽ 0.43315. Por tanto, si
las estimaciones se basaran en las primeras diez muestras, se estimaría que la media del tiempo de vida del sistema es de 2.724 meses, la probabilidad de que el sistema falle en un mes es
0.5, y el 10o. percentil de las duraciones del sistema es 0.43315. Obviamente, diez muestras
290
CAPÍTULO 4
Distribuciones comúnmente usadas
no es ni siquiera una estimación suficientemente confiable. Con base en las 1 000 muestras,
la estimación de la media del tiempo de vida fue de 2.29 meses, la estimación de la probabilidad de error dentro de un mes fue de 0.278 y el 10o. percentil fue de 0.516 meses.
Uso de la simulación para estimar sesgos
La simulación se puede utilizar para estimar sesgos. El ejemplo 4.75 muestra cómo.
Ejemplo
4.75
Si X1, . . . , Xn es una muestra aleatoria, entonces se usa la desviación estándar muestral s para estimar la desviación estándar poblacional s. Sin embargo, s es un estimador sesgado. Si
X1, . . . , X6 es una muestra aleatoria de una distribución N(0, 1), utilice la simulación para estimar el sesgo en s. Asimismo, estime la desviación estándar ss de s.
Solución
Se generarán 1 000 muestras aleatorias X*1i , . . . , X*6i de tamaño seis a partir de N(0, 1) y para cada una se calculará la desviación estándar muestral s*i . La tabla 4.6 muestra los resultados de las diez primeras y de la última muestra.
TABLA 4.6 Datos simulados para el ejemplo 4.75
1
2
3
4
5
6
7
8
9
10
..
.
1 000
X1∗
X2∗
X3∗
X4∗
X5∗
X6∗
s∗
−0.4326
−1.6656
0.1253
−1.7580
1.6867
1.3626
−2.2424
1.3765
−1.8045
0.3165
..
.
0.3274
0.7160
1.5986
−2.0647
0.1575
0.3784
0.7469
−0.5719
−0.4187
0.5361
0.6007
..
.
0.1787
−0.6028
−0.9934
1.1889
−0.8496
0.3809
−2.1102
−1.9659
−0.5014
−0.9121
−0.5363
..
.
0.2006
0.8304
−0.0938
−0.4598
0.3291
0.4870
2.6734
0.1269
1.9869
1.4059
−0.2300
..
.
−1.1602
−0.1342
0.2873
0.3694
−1.5780
0.9454
−0.5311
−0.2642
−0.0532
−1.2156
0.2626
..
.
1.1020
−0.3560
−1.8924
0.4906
−1.1100
−0.4602
1.1611
0.3721
−0.7086
−0.9619
0.0523
..
.
0.3173
0.6160
1.3206
1.1190
0.8733
0.7111
1.6629
1.0955
1.1228
1.2085
0.4092
..
.
0.7328
Los valores s*1, . . . , s*1 000 son una muestra aleatoria de la población de todos los posibles valores de s que se puede calcular a partir de una muestra normal de tamaño seis. Por
consiguiente, la media muestral –s * es una estimación de la media poblacional ms. Ahora, la
desviación estándar real de la distribución a partir de la cual se generó los datos simulados es
s ⫽ 1, por lo que el sesgo en s es mx ⫺ 1. Se estima el sesgo con –s * ⫺ 1.
La media muestral de los primeros diez valores de s*i es 1.0139. Por tanto, si los resultados se basaran en los primeros diez valores, se estimaría que el sesgo es 1.0139 ⫺ 1 ⫽
0.0139. Por supuesto, diez valores no son suficientes para construir una estimación confiable.
4.11
291
Simulación
La media muestral de los 1 000 valores s*i es –s * ⫽ 0.9601. Se estima que el sesgo es 0.9601
⫺ 1 ⫽ ⫺0.0399.
La desviación estándar muestral de los 1 000 valores es 0.3156. Ésta es la estimación
de ss.
La estimación Bootstrap
En los ejemplos analizados hasta ahora en esta sección, se ha especificado la distribución a
partir de la cual se generan los datos simulados. En algunos casos, esta distribución se puede
determinar de los datos. Los métodos de simulación en los cuales la distribución que será extraída se determina a partir de los datos se llaman de estimación bootstrap. Para ilustrar lo
anterior, se presenta una variación del ejemplo 4.75, donde la distribución de la muestra se
determina a partir de los datos.
Ejemplo
4.76
Una muestra de tamaño seis es tomada de una distribución normal cuya media y varianza son
desconocidas. Los valores de la muestra son 5.23, 1.93, 5.66, 3.28, 5.93 y 6.21. La media
—
muestral es X ⫽ 4.7067 y la desviación estándar muestral es s ⫽ 1.7137. El valor de s se usará para estimar la desconocida desviación estándar s de la población. Estime el sesgo en s.
Solución
Si se conociera la media poblacional m y la desviación estándar s de la distribución normal
de la que proviene la muestra, se puede utilizar el método del ejemplo 4.75, para simular una
distribución N(m, s). En virtud de que no se conocen estos valores, se estimarán con los valo—
res muestrales X ⫽ 4.7067 y s ⫽ 1.7137. Se procederá exactamente igual que en el ejemplo
4.75, excepto que se extraerá una muestra de una distribución N(4.7067, 1.71372). Puesto que
la distribución se determinó a partir de los datos, éste es un método de estimación bootstrap.
Se generarán 1 000 muestras aleatorias X*1i , . . . , X*6i de tamaño seis de N(4.7067,
1.71372) y para cada una se calculará la desviación estándar muestral s*i . La tabla 4.7 presenta los resultados de las primeras diez y de la última muestra.
TABLA 4.7 Datos simulados para el ejemplo 4.76
1
2
3
4
5
6
7
8
9
10
..
.
1 000
X1∗
X2∗
X3∗
X4∗
X5∗
X6∗
s∗
2.3995
2.6197
3.0114
3.9375
5.8829
7.8915
4.2737
5.8602
5.7813
3.3690
..
.
2.0496
4.8961
4.3102
5.2492
5.2217
5.3084
3.9731
5.5189
5.3280
4.9364
1.8618
..
.
6.3385
3.6221
3.2350
7.6990
1.9737
4.6003
5.1229
2.3314
5.5860
2.5893
2.7627
..
.
6.2414
6.9787
6.2619
6.0439
4.5434
2.6439
5.1749
5.1512
6.8256
3.7633
3.2837
..
.
5.1580
4.4311
4.4233
6.5965
3.0304
2.3589
3.5255
5.7752
7.5063
0.9065
3.9863
..
.
3.7213
4.5367
3.5903
3.7505
3.8632
2.3055
3.3330
4.0205
3.9393
3.8372
6.0382
..
.
8.4576
1.5157
1.2663
1.7652
1.1415
1.6054
1.6884
1.2705
1.2400
1.7260
1.4110
..
.
2.2364
292
CAPÍTULO 4
Distribuciones comúnmente usadas
Los valores s*1, . . . , s*1 000 son una muestra aleatoria de la población de todos los posibles valores de s que se puede calcular a partir de una muestra normal de tamaño seis. Por tanto, la media muestral –s * es una estimación de la media poblacional ms. Ahora, la desviación
estándar poblacional a partir de la cual se generaron los datos simulados es s* ⫽ 1.7137. El
sesgo se estima con –s * ⫺ 1.7137.
La media muestral de los diez primeros valores de s*i es 1.4630. Por consiguiente, si los
resultados se basaran en los diez primeros valores, se estimaría que el sesgo es 1.4630 ⫺
1.7137 ⫽ ⫺0.2507. Por supuesto, diez valores no son suficientes para construir una estimación confiable. La media muestral de los 1 000 valores de s*i es 1.6188. Se estima que el sesgo es 1.6188 ⫺ 1.7137 ⫽ ⫺0.0949.
Algunas veces se pueden utilizar los resultados de la estimación bootstrap para ajustar
estimaciones con el fin de que sean más exactas. El ejemplo 4.77 muestra cómo se puede realizar esto último con la desviación estándar muestral.
Ejemplo
4.77
En el ejemplo 4.76 se tomó una muestra de tamaño seis de una población N(m, s2). La desviación estándar muestral s ⫽ 1.7137 es una estimación de la desviación estándar poblacional no conocida s. Utilice los resultados de la estimación bootstrap en el ejemplo 4.76 para
reducir el sesgo en esta estimación.
Solución
Se estima que el sesgo en s es ⫺0.0949. Esto significa que, en promedio, la desviación estándar muestral calculada a partir de esta población N(m, s2) será menor que la desviación estándar real s por aproximadamente ⫺0.0949. Por consecuencia, se corrige el sesgo sumando
0.0949 a la estimación. La estimación con sesgamiento corregido de la desviación estándar
poblacional es 1.7137 ⫹ 0.0949 ⫽ 1.81.
Estimación bootstrap paramétrica y no paramétrica
En el ejemplo 4.76 se sabía que la muestra provenía de una distribución normal, pero no se
conocían la media ni la varianza. Por tanto, se empleó los datos para estimar los parámetros
m y s. A este procedimiento se le llama estimación bootstrap paramétrica, ya que los datos son utilizados para estimar parámetros. ¿Qué pasaría si no se hubiera tenido conocimiento de que la distribución era normal? Entonces se hubiera utilizado la estimación bootstrap
no paramétrica. En ésta se hace una simulación mediante el muestreo de los propios datos.
Además, sirve para construir intervalos de confianza y realizar pruebas de hipótesis. Aquí se
definirá la estimación bootstrap no paramétrica, y después se presentarán algunas aplicaciones en las secciones 5.8 y 6.15.
Si se tuviera una muestra X1, . . . , Xn de una distribución desconocida, se simularían
muestras X*1i , . . . , X*ni de la siguiente manera. Imagine que se colocan los valores X1, . . . , Xn
en una caja, y que se saca un valor aleatoriamente. Después se reemplaza el valor y se saca
otra vez. La segunda extracción es también una extracción muestral X1, . . . , Xn. Se continúa
hasta que se han realizado n extracciones. Ésta es la primera muestra simulada, denominada
muestra de estimación bootstrap: X*11, . . . , X*n1. Observe que puesto que se realiza el mues-
4.11
Simulación
293
treo con reemplazo, la muestra de estimación bootstrap probablemente contendrá más de una
vez a algunos de los elementos originales de la muestra y a otros que no aparezcan. Ahora se
toma más muestras de estimación bootstrap: tantas como las que se tomarían en cualquier simulación, probablemente 1 000 o más. Después se procede como en cualquier otra simulación.
Para mayor información acerca de la estimación bootstrap y otros procesos de simulación, Efron y Tibshirani (1993) son una excelente fuente de información.
Ejercicios para la sección 4.11
1. El vendedor A distribuye partes, donde cada una tiene una
probabilidad de 0.03 de estar defectuosa. El vendedor B
también distribuye partes y cada una tiene una probabilidad
de 0.05 de estar defectuosa. Usted recibe un envío de 100
partes por parte de cada vendedor.
a) Sea X el número de partes defectuosas en el envío provenientes del vendedor A y Y el envío proveniente del
vendedor B. ¿Cuáles son las distribuciones de X y Y?
a) Utilice una muestra simulada de tamaño 1 000 para estimar la media y varianza de A.
b) Estime la probabilidad de que P(5.9 ⬍ A ⬍ 6.1).
c) Construya una gráfica de probabilidad normal para las
áreas. ¿El área de una placa sigue una distribución aproximadamente normal?
c) Utilice las muestras para estimar la probabilidad de que
el número total de partes defectuosas sea menor a diez.
4. Un cable está compuesto por cuatro alambres. La fuerza de
ruptura de cada alambre es una variable aleatoria distribuida normalmente con media de 10 kN y desviación estándar
de 1 kN. Utilizando el método de cable quebradizo, se estima que la fuerza del cable es igual a la fuerza de alambre
más frágil multiplicada por el número de alambres.
d) Utilice las muestras para estimar la probabilidad de que
el envío del vendedor A tiene más partes defectuosas
que el envío del vendedor B.
a) Utilice muestras simuladas de tamaño 1 000 para estimar la fuerza media de este tipo de cable.
b) Genere muestras simuladas de tamaño 1 000 a partir de
las distribuciones de X y Y.
e) Construya una gráfica de probabilidad normal para el
número total de partes defectuosas. ¿La cantidad sigue
una distribución aproximadamente normal?
2. Dos diseños de cierto circuito de semiconductores están
compitiendo entre sí. La duración del primero (en horas) se
distribuye exponencialmente con λ ⫽ 10 ⫺4 y la duración
del segundo tiene una distribución lognormal con m ⫽ 6 y
s2 ⫽ 5.4.
a) Utilice una muestra simulada de tamaño 1 000 para estimar la probabilidad de que un circuito con el primer
diseño dure más que otro con el segundo diseño.
b) Estime la probabilidad de que un circuito con el primer
diseño dure el doble de tiempo que otro con el segundo
diseño.
3. Se fabrican placas rectangulares cuyas longitudes se distribuyen como N(2.0, 0.12) y cuyos anchos se distribuyen como
N(3.0, 0.22). Suponga que las longitudes y los anchos son
independientes. El área de una placa está dada por A ⫽ XY.
b) Estime la mediana de la fuerza del cable.
c) Estime la desviación estándar de la fuerza del cable.
d ) Para que sea aceptable en cierta aplicación, la probabilidad de que el cable se rompa con una carga de 28 kN debe ser menor a 0.01. ¿Parece ser que el cable es aceptable?
Explique.
5. La duración de un láser (en horas) tiene una distribución
lognormal con m ⫽ 8 y s2 ⫽ 2.4. Dos de esos láser funcionan de forma independiente.
a) Utilice una muestra de tamaño 1 000 para estimar la
probabilidad de que la suma de las dos duraciones sea
mayor a 20 000 horas.
b) Estime la probabilidad de que ambos láser duren más de
3 000 horas.
c) Estime la probabilidad de que ambos láser fallen antes
de las 10 000 horas.
6. Estimación del valor de π. La siguiente figura sugiere cómo
estimar el valor de π con una simulación. En la figura, un
294
CAPÍTULO 4
Distribuciones comúnmente usadas
círculo con un área igual a π/4 está inscrito en un cuadrado
cuya área es igual a 1. Se elige de forma aleatoria 100 puntos dentro del cuadrado. La probabilidad de que un punto
esté dentro del círculo es igual a la fracción del área del cuadrado que abarca a éste, la cual es π/4. Por tanto, se puede
estimar el valor de π/4 al contar el número de puntos dentro
del círculo, que es 79, y al dividir entre el número total de
puntos, que es 100, para obtener la estimación π/4 ⬇ 0.79.
De esto último se concluye que π ⬇ 4(0.79) ⫽ 3.16. Este
ejercicio presenta un experimento de simulación que fue diseñado para estimar el valor de π al generar 1 000 puntos en
el cuadrado.
1
7. Aplicación a redes de computadoras móviles. Con frecuencia los expertos en computación modelan el movimiento de
una computadora móvil como una trayectoria aleatoria dentro de un rectángulo. Esto es, se elige aleatoriamente dos
puntos dentro del rectángulo y la computadora se mueve en
una línea recta desde el primer punto al segundo. En el estudio de redes de computadoras móviles, es importante conocer la media de la longitud de una trayectoria (véase el
artículo “Stationary Distributions for Random Waypoint
Models”, W. Navidi y T. Camp, en IEEE, Transactions on
Mobile Computing, 2004:99-108). Es muy difícil calcular
directamente esta media, pero es sencillo estimarla con una
simulación. Si los puntos finales de una trayectoria están representados por (X1, Y1) y (X2, Y2), entonces la longitud de
√
la trayectoria es (X2 − X1 )2 + (Y2 − Y1 )2 . La media de la
longitud se estima al generar puntos finales (X*1, Y*1 ) y (X*2,
Y*2 ) para muchas trayectorias, calcular la longitud de cada
una, y estimar su media. Este ejercicio presenta un experimento de simulación que fue diseñado para estimar la media
de la distancia entre dos puntos seleccionados aleatoriamente dentro de un cuadrado de lado 1.
a) Genere 1 000 conjuntos de puntos finales (X*1i, Y*1 i) y
(X*2i, Y*2i) . Utilice la distribución uniforme con valor mínimo de 0 y valor máximo de 1 para cada coordenada en
cada punto. La distribución uniforme genera valores que
tienen la misma probabilidad de provenir de cualquier
parte del intervalo (0, 1).
0
0
1
a) Genere 1 000 coordenadas x X*1, . . . , X*1 000. Utilice la
distribución uniforme con valor mínimo de 0 y valor
máximo de 1. La distribución uniforme genera variables
aleatorias que tienen la misma probabilidad de venir de
cualquier parte del intervalo (0, 1).
b) Genere 1 000 coordenadas y Y*1, . . . , Y*1 000, utilizando
nuevamente la distribución uniforme con valor mínimo de 0 y valor máximo de 1.
c) Cada punto (X*i , Y*i ) se encuentra dentro del círculo si su
distancia desde el centro (0.5, 0.5) es menor a 0.5. Para cada par (X*i , Y*i ) determine si la distancia desde el centro
es menor a 0.5. Esto último se puede realizar al calcular
el valor (X*i ⫺ 0.5)2 ⫹ (Y*i ⫺ 0.5)2, que es el cuadrado
de la distancia, y al determinar si es menor que 0.25.
d) ¿Cuántos de los puntos están dentro del círculo? ¿Cuál
es su estimación de π ? (Nota: Con sólo 1 000 puntos, es
probable que su estimación sea inferior por 0.05 o más.
Una simulación con 10 000 y 100 000 puntos tiene mayores probabilidades de dar como resultado una estimación muy cercana al valor verdadero.
b)
Calcule
p las longitudes pde las 1 000 trayectorias L*i ⫽
(X2i∗ − X1i∗ )2 + (Y2i∗ − Y1i∗ )2 .
c) Calcule la media muestral de la longitud de la trayecto–
ria L *. La media verdadera, con seis dígitos significativos, es 0.521405. ¿Qué tan cercano está su resultado?
d) Estime la probabilidad de que una trayectoria tenga más
de una unidad de largo.
8. Con referencia al ejemplo 4.74 (p. 289), con el fin de incrementar el tiempo de vida del sistema, los ingenieros deben
decidir entre reemplazar el componente A por uno cuyo
tiempo de vida se distribuya Exp(1/2), o reemplazar el componente B con uno cuyo tiempo de vida se distribuya
Exp(1/3).
a) Genere, mediante simulación, un gran número (al menos 1 000) de los tiempos de vida del sistema, bajo el supuesto de que se reemplaza el componente A.
b) Genere, con simulación, un gran número (al menos 1 000)
de los tiempos de vida del sistema, bajo el supuesto de
que se reemplaza el componente B.
c) Si el objetivo es maximizar la media del tiempo de vida
del sistema, ¿cuál es la mejor opción? Explique.
4.11
d) Si el objetivo es minimizar la probabilidad de que el sistema falle en un mes, ¿cuál es la mejor opción? Explique.
e) Si el objetivo es minimizar al 10o. percentil de los tiempos de vida del sistema, ¿cuál es la mejor opción? Explique.
9. Un sistema está compuesto por los componentes A y B conectados en serie, como lo muestra la siguiente ilustración
esquemática. El tiempo de vida en meses del componente A
sigue una distribución lognormal con m ⫽ 1 y s ⫽ 0.5, y la
duración en meses del componente B tiene una distribución
lognormal con m ⫽ 2 y s ⫽ 1. El sistema sólo funcionaría
si A y B lo hacen.
A
B
a) Genere, por simulación, un gran número (al menos 1 000)
de los tiempos de vida del sistema.
b) Estime la media del tiempo de vida del sistema.
c) Estime la probabilidad de que el sistema falle en dos
meses.
d) Estime el 20o. percentil de los tiempos de vida del sistema.
e) Construya una gráfica de probabilidad normal de los
tiempos de vida del sistema. ¿El tiempo de vida del sistema tiene una distribución aproximadamente normal?
f ) Construya un histograma de los tiempos de vida del sistema. ¿Está sesgado a la izquierda, sesgado a la derecha,
o es aproximadamente simétrico?
10. Un sistema está compuesto por dos subsistemas conectados
en serie, como lo muestra la siguiente ilustración esquemática. Cada subsistema consiste en dos componentes conectados
en paralelo. El subsistema AB falla cuando no funcionan A
y B. El subsistema CD falla cuando lo hacen C y D. El sistema falla tan pronto como alguno de los dos subsistemas
falla. Suponga que los tiempos de vida de los componentes,
en meses, tiene las siguientes distribuciones: A: Exp(1), B:
Exp(0.1), C: Exp(0.2), D: Exp(0.2).
A
C
B
D
a) Genere, mediante simulación, un gran número (al menos 1 000) de los tiempos de vida del sistema.
b) Estime la media del tiempo de vida del sistema.
c) Estime la mediana del tiempo de vida del sistema.
Simulación
295
d ) Estime la probabilidad de que el sistema funcione más
de seis meses.
e) Estime el 90o. percentil de los tiempos de vida del sistema.
f ) Estime la probabilidad de que el susbsistema AB falle
antes que lo haga el subsistema CD.
11. (Continuación del ejercicio 12 de la página 280.) La edad
de una antigua pieza de materia orgánica se puede estimar
a partir de la tasa a la que emite partículas beta como resultado del decaimiento del carbono-14. Por ejemplo, si X es el
número de partículas emitidas durante diez minutos por un
fragmento óseo con 10 000 años de antigüedad que contiene 1 g de carbono, entonces X tiene una distribución de
Poisson con media λ ⫽ 45.62. Un arqueólogo descubrió un
pequeño fragmento óseo que contiene exactamente 1 g de
carbono. Si t es la edad desconocida del hueso, en años, el arqueólogo contará el número X de partículas emitidas en diez
minutos y calculará una edad estimada t̂ con la fórmula
ln 15.3 ⫺ ln(X/10)
t̂ ⫽ —————————
0.0001210
El arqueólogo no lo sabe, pero el hueso tiene exactamente
10 000 años de antigüedad, por lo que X tiene una distribución de Poisson con λ ⫽ 45.62.
a) Genere una muestra simulada de 1 000 valores de X y
sus valores correspondientes de t̂ .
b) Estime la media de t̂ .
c) Estime la desviación estándar de t̂ .
d ) Estime la probabilidad de que t̂ esté a 1 000 años con
una edad real de 10 000 años.
e) Estime la probabilidad de que t̂ esté a más de 2 000 años
con una edad real de 10 000 años.
f ) Construya una gráfica de probabilidad normal para t̂ . ¿ t̂
se distribuye aproximadamente en forma normal?
12. Se toma una muestra aleatoria de una distribución normal
con el propósito de estimar la media poblacional m. Puesto
que m es la mediana y la media, parece ser que tanto la me—
diana muestral m como la media muestral X son estimadores razonables. Este ejercicio está diseñado para determinar
cuál de estos estimadores tiene la menor incertidumbre.
a) Genere un gran número de (al menos 1 000) muestras de
tamaño cinco de una distribución N(0, 1).
b) Calcule las medianas muestrales m*1, . . . , m*1 000 de las
1 000 muestras.
c) Calcule la media —
m* y la desviación estándar sm* de
m*1, . . . , m*1 000.
296
CAPÍTULO 4
Distribuciones comúnmente usadas
–
–
d) Calcule las medias muestrales X*, . . . , X*1 000 de las 1 000
muestras.
–
e) Calcule la media y la desviación estándar sX–* de X*1, . . . ,
–
X*1 000.
muestra son 2.74, 6.41, 4.96, 1.65, 6.38, 0.19, 0.52 y 8.38.
Este ejercicio muestra cómo se emplea la estimación bootstrap para estimar el sesgo y la incertidumbre (s λ̂ ) en la es—
timación λ̂ ⫽ 1 / X .
f ) El valor verdadero de m es 0. Estime el sesgo y la incertidumbre (sm) en m. (Nota: De hecho, la mediana no tiene sesgos, por lo que la estimación del sesgo debe
aproximarse a 0.)
—
g) Estime el sesgo y la incertidumbre (s—
X ) en X . ¿Su estimación del sesgo se aproxima a 0? Explique por √
qué.
¿Su estimación de la incertidumbre se aproxima a 1/ 5??
Explique por qué.
—
a) Calcule λ̂ ⫽ 1 / X para la muestra específica.
13. Se toma una muestra aleatoria de tamaño ocho de una distribución Exp(λ), donde no se conoce λ. Los valores de la
b) Genere 1 000 muestras de estimación bootstrap de tamaño ocho a partir de la distribución Exp( λ̂).
–
c) Calcule los valores λ̂*i ⫽ 1/X*i para cada una de las 1 000
muestras bootstrap.
–
d ) Calcule la media muestral λ̂* y la desviación estándar
muestral s λ̂* de λ̂*1, . . . , λ̂*1 000.
e) Estime el sesgo y la incertidumbre (s λ̂ ) en λ̂.
Ejercicios adicionales para el capítulo 4
1. Un avión tiene 100 asientos de pasajeros. Suponga que la
probabilidad de que una persona con boleto llegue al vuelo
es de 0.90. Si la aerolínea vende 105 boletos, ¿cuál es la
probabilidad de que todas las personas tengan asiento?
2. El número de grietas grandes en un pavimento de determinada longitud a lo largo de una cierta calle tiene una distribución de Poisson con una media de una grieta por cada 100 m.
a) ¿Cuál es la probabilidad de que haya exactamente ocho
grietas en una longitud de 500 m de pavimento?
b) ¿Cuál es la probabilidad de que no haya grietas en una
longitud de 100 m de pavimento?
c) Sea T la distancia en metros entre dos grietas sucesivas,
¿cuál es la función de densidad de probabilidad de T?
d ) ¿Cuál es la probabilidad de que la distancia entre dos
grietas sucesivas sea de más de 50 m?
3. Unas plantas de frijoles contienen dos genes del color de la
semilla, donde cada uno puede ser Y (para semillas amarillas) o G (para semillas verdes). A las plantas que contienen
uno de cada tipo de gen se les llama heterozygous. De
acuerdo con la teoría genética de Mendel, si se cruzan dos
plantas heterozygous, cada uno de sus descendientes tendrá
probabilidad de 0.75 de tener semillas amarillas y 0.25 de
que sean verdes.
a) De los diez descendientes de las plantas heterozygous,
¿cuál es la probabilidad de que sólo tres tengan semillas
verdes?
b) De los diez descendientes de las plantas heterozygous
¿cuál es la probabilidad de que más de dos tengan semillas verdes?
c) De los 100 descendientes de las plantas heterozygous,
¿cuál es la probabilidad de que más de 30 tengan semillas verdes?
d ) De los 100 descendientes de las plantas heterozygous,
¿cuál es la probabilidad que entre, e incluyendo a, 30 y
35, tengan semillas verdes?
e) De los 100 descendientes de las plantas heterozygous,
¿cuál es la probabilidad de que menos de 80 tengan semillas amarillas?
4. Se extrae una muestra aleatoria X1, . . . , Xn de una población, y las cantidades ln X1, . . . , ln Xn se incluyen en una
gráfica de probabilidad normal. Los puntos siguen casi una
línea recta. Verdadero o falso:
a) X1, . . . , Xn provienen de una población que es aproximadamente lognormal.
b) X1, . . . , Xn provienen de una población que es aproximadamente normal.
c) ln X1, . . . , ln Xn provienen de una población que es aproximadamente lognormal.
d ) ln X1, . . . , ln Xn provienen de una población que es aproximadamente normal.
5. La agencia de protección ambiental (EPA, por sus siglas en
inglés) ha contratado a una compañía para que dé segui-
Ejercicios adicionales para el capítulo 4
297
miento a la calidad del agua de diversos lagos en su distrito. Se emplean diez dispositivos. Suponga que cada uno tiene una probabilidad de 0.01 de fallar durante el transcurso
del periodo de seguimiento.
c) ¿Cuántos resistores debe extraer de la muestra de tal forma que la probabilidad sea de 0.99 de que 50 o más de
los resistores de la muestra tengan resistencias entre 9.3
y 10.7 Ω?
a) ¿Cuál es la probabilidad de que no falle ninguno de estos dispositivos?
9. La holgura de las válvulas de entrada de unos motores nuevos de cierto tipo se distribuye normalmente con media 200
mm y desviación estándar 10 mm.
b) ¿Cuál es la probabilidad de que fallen dos o más dispositivos?
c) Si la EPA requiere que la probabilidad de que ninguno
de estos dispositivos falle sea de al menos 0.95, ¿cuál es
la probabilidad de falla individual más grande que puede permitirse?
6. En el artículo “Occurrence and Distribution of Ammonium
in Iowa Groundwater” (K. Schilling, en Water Environment
Research, 2002:177-188), se midieron las concentraciones
de amoniaco (en mg/l) de gran número de pozos en Iowa.
La media de la concentración fue de 0.71, la mediana fue de
0.22 y la desviación estándar de 1.09. ¿Sería posible determinar si estas concentraciones tienen una distribución aproximadamente normal? Si es así, diga si éstas se distribuyen
normalmente, y explique cómo lo sabe. Si no, describa la
información adicional que necesitaría para determinar si se
distribuyen normalmente.
7. El medicamento utilizado para tratar cierta condición se administra mediante una inyección. La dosis objetivo en una
aplicación particular es m. Debido a las variaciones de la jeringa, en la escala de lectura, y en la mezcla de la suspensión
del fluido, la dosis realmente administrada se distribuye con
media m y varianza s2.
a) ¿Cuál es la probabilidad de que la dosis administrada difiera de la media m por menos de s?
b) Si X representa la dosis administrada, encuentre el valor
de z de tal forma que P(X ⬍ m ⬍ zs) ⫽ 0.90.
c) Si la media de la dosis es de 10 mg, la varianza es de 2.6
mg2 y una sobredosis clínica se define como una dosis
mayor a 15 mg, ¿cuál es la probabilidad de que un paciente reciba una sobredosis?
8. Usted tiene una caja grande de resistores cuyas resistencias
se distribuyen normalmente con media de 10 Ω y desviación estándar de 1 Ω.
a) ¿Qué proporción de los resistores tienen resistencias entre 9.3 y 10.7 Ω?
b) Si usted extrae una muestra de 100 resistores, ¿cuál es la
probabilidad de que 50 o más de ellos tengan resistencias entre 9.3 y 10.7 Ω?
a) ¿Cuál es la probabilidad de que la holgura sea mayor a
215 mm?
b) ¿Cuál es la probabilidad de que la holgura esté entre 180
y 205 mm?
c) Un motor tiene seis válvulas de entrada. ¿Cuál es la probabilidad de que sólo dos de ellas tengan holguras mayores a 215 mm?
10. La rigidez de cierto tipo de viga de acero utilizada en la
construcción de edificios tiene media de 30 kN/mm y desviación estándar de 2 kN/mm.
a) ¿Es posible calcular la probabilidad de que la rigidez de
una viga seleccionada aleatoriamente sea mayor que 32
kN/mm? Si es así, calcule la probabilidad. Si no, explique por qué.
b) En una muestra de 100 vigas, ¿sería posible calcular la
probabilidad de que la rigidez media muestral de vigas
sea mayor a 30.2 kN/mm? Si es así, calcule la probabilidad. Si no, explique por qué.
11. En cierto proceso, la probabilidad de producir un montaje
de mayor tamaño es de 0.05.
a) En una muestra de 300 montajes elegidos aleatoriamente, ¿cuál es la probabilidad de que menos de 20 tengan
un tamaño mayor?
b) En una muestra de diez montajes elegidos aleatoriamente, ¿cuál es la probabilidad de que uno o más de ellos
tengan tamaño mayor?
c) ¿A qué valor debe reducirse la probabilidad de un montaje de mayor tamaño para que sólo 1% de la población
de 300 montajes tengan 20 o más con mayor tamaño?
12. Un proceso de producir placas de vidrio deja en promedio
tres burbujas pequeñas por cada 10 m2 de vidrio. El número de burbujas en una lámina de vidrio sigue una distribución de Poisson.
a) ¿Cuál es la probabilidad de que una pieza de vidrio de
3 × 5 m contendrá más de dos burbujas?
b) ¿Cuál es la probabilidad de que una pieza de vidrio de
4 × 6 m no tendrá ninguna burbuja?
298
CAPÍTULO 4
Distribuciones comúnmente usadas
c) ¿Cuál es la probabilidad de que 50 piezas de vidrio, cada una de 3 × 6 m contendrá más de 300 burbujas?
b) ¿Cuál es la probabilidad de que un cojinete dure menos
de dos años?
13. Células de levadura se encuentran suspendidas en un medio
líquido. Se toma de la suspensión una muestra de 2 mL. Se
cuentan 56 células de levadura.
18. El tiempo para hacer un cambio de aceite en cierta tienda se
distribuye normalmente con media de 29.5 minutos y desviación estándar de tres minutos. ¿Cuál es la probabilidad
de que un mecánico pueda realizar 16 cambios de aceite en
una jornada de ocho horas al día?
a) Estime la concentración de células de levadura por mL
de suspensión y determine la incertidumbre.
b) ¿Qué volumen de la suspensión debe extraerse para reducir la incertidumbre a una célula por mL?
14. Una placa está sujeta a su asiento utilizando diez pernos. Se
revisa cada perno antes de la instalación y la probabilidad
de pasar la inspección es de 0.9. Sólo se instalan los pernos
que pasan la inspección. Sea X el número de pernos que son
revisados para sujetar una placa.
a) Determine P(X ⫽ 12).
b) Determine mX.
c) Determine sX.
15. Los espesores de cuñas se distribuyen normalmente con una
media de 1.5 mm y una desviación estándar de 0.2 mm. Se
apilan tres cuñas, una sobre otra.
a) Determine la probabilidad de que una pila tenga un espesor de más de 5 mm.
b) Determine el 80o. percentil del espesor de la pila.
c) ¿Cuál es el número mínimo de cuñas que se debe apilar
para que la probabilidad de que la pila tenga un espesor
mayor a 5 mm sea de al menos 0.99?
16. El tiempo de vida de un microprocesador se distribuye exponencialmente con una media de 3 000 horas.
a) ¿Qué proporción de microprocesadores fallará dentro de
3 000 horas?
b) ¿Qué proporción de microprocesadores funcionará durante más de 6 000 horas?
c) Se instala un microprocesador al lado de otro que ha
funcionado durante 1 000 horas. Suponga que los dos
microprocesadores funcionan de manera independiente.
¿Cuál es la probabilidad de que uno nuevo falle antes
que el viejo?
17. La duración de un cojinete (en años) sigue una distribución
de Weibull con parámetros α ⫽ 1.5 y β ⫽ 0.8.
a) ¿Cuál es la probabilidad de que un cojinete dure más de
un año?
19. Un topógrafo estimará la altura de un acantilado al realizar
n mediciones independientes y promediándolas. Cada medición no está sesgada y tiene una desviación estándar s ⫽
1 m. ¿Cuántas mediciones se debe hacer para que la probabilidad sea de 0.95 de que el promedio esté a ⫾ 0.25 del valor verdadero?
20. Se revisa que las latas de aluminio recibidas por una compañía de bebidas satisfagan las especificaciones de resistencia. De un envío muy grande, se selecciona aleatoriamente
y se prueba 100. El envío será rechazado si 12 latas o más no
pasan la prueba. Suponga que 20% de las latas del envío
no satisface la especificación. ¿Cuál es la probabilidad de
que se rechace el envío?
21. Un productor de cereales afirma que el peso bruto (incluyendo el empaque) de una caja de cereal etiquetada con peso de 12 onzas tiene media de 12.2 onzas y desviación
estándar de 0.1 onzas. Usted junta 75 cajas y las pesa todas
juntas. Sea S el peso total de las 75 cajas de cereal.
a) Si la afirmación es cierta, ¿a qué es igual P(S ⱕ 914.8)?
b) Con base en la respuesta al inciso (a), si la afirmación es
cierta, ¿914.8 onzas es un peso total inusualmente pequeño para una muestra de 75 cajas?
c) Si el peso total de las cajas fuera de 914.8 onzas, ¿estaría usted convencido de que la afirmación es falsa? Explique.
d) Si la afirmación es cierta, ¿a qué es igual P(S ⱕ 910.3)?
e) Con base en la respuesta al inciso (d), si la afirmación es
cierta, ¿910.3 onzas es un peso total inusualmente pequeño para una muestra de 75 cajas?
f ) Si el peso total de las cajas fuera de 910.3 onzas, ¿estaría usted convencido de que la afirmación es falsa? Explique.
22. Una persona afirma que el número de visitas a su sitio web
tiene una distribución de Poisson con media de 20 por hora. Sea X el número de visitas en cinco horas.
a) Si la afirmación es cierta, ¿a qué es igual P(X ⱕ 95)?
299
Ejercicios adicionales para el capítulo 4
b) Con base en la respuesta al inciso a), si la afirmación es
cierta, ¿95 visitas durante un periodo de cinco horas es
una cifra inusualmente pequeña?
c) Si usted observó 95 visitas en un periodo de cinco horas, ¿esto sería una evidencia de que la afirmación es falsa? Explique.
d ) Si la afirmación es cierta, ¿a qué es igual P(X ⱕ 65)?
e) Con base en la respuesta al inciso d ), si la afirmación es
cierta, ¿65 visitas durante un periodo de cinco horas es
una cifra inusualmente pequeña?
f) Si usted observó 65 visitas en un periodo de cinco horas, ¿esto sería una evidencia de que la afirmación es falsa? Explique.
23. X ⬃ Geom(p). Sea s ⱖ 0 un entero.
a) Demuestre que P(X ⬎ s) ⫽ (1 ⫺ p)s. (Sugerencia: La
probabilidad de que se necesite más de s experimentos
para obtener el primer éxito es igual a la probabilidad de
que todos los primeros s experimentos resulten en fracaso.)
b) Sea t ⱖ 0 un entero. Demuestre que P(X ⬎ s ⫹ t⏐X ⬎
s) ⫽ P(X ⬎ t). A esto último se le denomina propiedad
de falta de memoria. [Sugerencia: P(X ⬎ s ⫹ t y X ⬎ s)
⫽ P(X ⬎ s ⫹ t).]
c) Existe dos monedas, de uno y cinco centavos, respectivamente. Se lanza al aire tres veces la primera moneda
y todas las veces sale “cruz”. Enseguida, ambas monedas se lanzan al aire dos veces, de tal forma que la moneda de un centavo se lance un total de cinco veces y la
de cinco centavos dos. Utilice la propiedad de falta de
memoria para calcular la probabilidad condicional de
que en los cinco lanzamientos de la moneda de un centavo salga “cruz”, en virtud de que en los primeros tres
lanzamientos salió “cruz”. Después, calcule la probabilidad de que en los dos lanzamientos de la moneda de
cinco centavos salga “cruz”. ¿Las dos probabilidades
son iguales?
24. Sea X ⬃ Bin(n, p).
a) Demuestre que si x es un entero positivo entre, e incluyendo a, 1 y n, entonces
P (X = x)
=
P (X = x − 1)
n−x+1
x
p
1−p
b) Demuestre que si X ⬃ Bin(n, p), el valor más probable
de X es el entero más grande, menor o igual a np ⫹ p.
[Sugerencia: Utilice el inciso a) para demostrar que
P(X ⫽ x) ⱖ P(X ⫽ x ⫺ 1) si y sólo si x ⱕ np ⫹ p.]
25. Sea X ⬃ Poisson(λ).
a) Demuestre que si x es un entero positivo, entonces
P (X = x)
λ
=
P (X = x − 1)
x
b) Demuestre que si X ⬃ Poisson(λ), el valor más probable
de X es el entero más grande, menor o igual a λ. [Sugerencia: Utilice el inciso (a) para demostrar que P(X ⫽ x)
ⱖ P(X ⫽ x ⫺ 1) si y sólo si x ⱕ λ.]
Capítulo
5
Intervalos
de confianza
Introducción
En el capítulo 4 se analizaron estimaciones de diferentes parámetros; por ejemplo, p̂ repre—
senta la estimación de una probabilidad de éxito p, y X lo es de una media poblacional m.
Ambas son llamadas estimaciones puntuales, porque son sólo números, o puntos. Un hecho
importante de las estimaciones puntuales es que casi nunca son exactamente iguales a los valores reales que están estimando.
Difieren casi siempre, a veces por poco y otras por mucho. Con la finalidad de que una
estimación sea útil, se necesita describir qué tan alejada está del valor verdadero. Una manera de lograr esto último es reportar una estimación de la desviación estándar, o de la incertidumbre. En este capítulo se mostrará que cuando la estimación tiene una distribución normal,
se puede obtener más información acerca de su precisión cuando se calcula un intervalo de
confianza. El siguiente ejemplo presenta la idea básica.
Suponga que se hace gran número de mediciones independientes, todas mediante el mismo procedimiento, del diámetro de un pistón. La media muestral de las mediciones es 14.0 cm,
y la incertidumbre en esta cantidad, que representa la desviación estándar de la media muestral, es 0.1 cm. Suponga que las mediciones no están sesgadas. El valor 14.0 proviene de una
distribución normal, ya que es el promedio de un importante número de mediciones. Ahora el
diámetro verdadero del pistón no será exactamente igual a la media muestral de 14.0 cm. Sin
embargo, dado que ésta proviene de una distribución normal, se puede utilizar dicha desviación estándar para determinar qué tan cerca está probablemente del diámetro verdadero. Por
ejemplo, es muy improbable que la media muestral sea diferente del diámetro verdadero en
más de tres desviaciones estándares. Por tanto, se tiene una enorme confianza de que el diámetro verdadero esté en el intervalo (13.7, 14.3). Por otro lado, es muy probable que la media
muestral difiera del valor verdadero en más de una desviación estándar. Por tanto, se tiene que
existe poca certeza de que el diámetro verdadero se encuentre en dicha cercanía (13.9, 14.1).
Los intervalos (13.7, 14.3) y (13.9, 14.1) son intervalos de confianza para el diámetro
verdadero del pistón. En este capítulo se verá cómo calcular una medida cuantitativa del ni300
5.1
Intervalos de confianza para la media poblacional con muestras grandes
301
vel de la confianza que se puede tener en estos intervalos, así como en otros que se pueda
construir. Específicamente, los resultados de la sección 5.1 mostrarán que se puede tener una
confianza de 99.7% de que el diámetro verdadero del pistón se encuentre en el intervalo
(13.7, 14.3), pero sólo certeza de 68% de que ese valor verdadero lo esté en (13.9, 14.1).
5.1
Intervalos de confianza para la media poblacional
con muestras grandes
Se comienza con un ejemplo. Un ingeniero que supervisa el control de calidad quiere calcular la media del peso de cajas que se han llenado con cereal por una máquina específica durante cierto día. Toma una muestra aleatoria de 100 cajas que se han llenado con esa máquina
–
en ese día. Calcula que la media muestral del peso de llenado es de X ⫽ 12.05 oz y la desviación estándar s ⫽ 0.1 oz.
Debido a que la media poblacional no será exactamente igual a la media muestral de
12.05, es mejor construir un intervalo de confianza alrededor de 12.05 que quizá contenga a
aquélla. Después se puede cuantificar el nivel de confianza de que la media poblacional esté
realmente contenida por el intervalo. Con el propósito de ver cómo construir un intervalo de
confianza en este ejemplo, sea m la media poblacional desconocida y s2 la varianza respectiva. Sean X1, . . . , X100 los 100 pesos del llenado de las cajas muestreadas. El valor observado
–
–
de la media muestral es X ⫽ 12.05. Ya que X es la media de una muestra grande, el teorema
del límite central especifica que √
proviene de una distribución normal cuya media es m y cuya
desviación estándar es σX = σ/ 100.
–
La figura 5.1 presenta una curva normal, que representa la distribución de X . Aquí se
indica que 95% intermedio de la curva se extiende una distancia 1.96 s X— a cada lado de la
–
media poblacional. El valor observado X ⫽ 12.05 constituye una sola muestra de esta distribución. No se tiene manera alguna de saber de qué parte de la curva fue extraído este valor
–
especial de X . La figura 5.1 presenta una posibi1idad: que la media muestral esté dentro del
95%
m ⫺ 1.96sX⫺
m
⫺
X ⫺ 1.96sX⫺
⫺
X
m ⫹ 1.96sX⫺
⫺
X ⫹ 1.96sX⫺
–
FIGURA 5.1 La media muestral
X se extrae de una distribución normal con media m y
√
–
desviación estándar σX = σ/ n. Para esta muestra en particular, X proviene de 95% intermedio de la distribución, por lo que el intervalo de confianza 95% X ±1.96σX contiene con seguridad la media poblacional m.
302
CAPÍTULO 5
Intervalos de confianza
95% intermedio de la distribución. Noventa y cinco por ciento de todas las muestras que se
podía haber tomado están dentro de esta categoría. La recta horizontal debajo de la curva en
–
la figura 5.1 significa un intervalo alrededor de X que tiene exactamente la misma longitud de la
–
parte central de 95% de la distribución; es decir, el intervalo X ⫾ 1.96 s X—. Este intervalo de
confianza es de 95% para la media poblacional m. Es obvio que aquél contiene la media poblacional m.
–
Por otra parte, la figura 5.2 representa una muestra cuya media X está fuera de 95% intermedio de la curva. Sólo 5% de todas las muestras se encuentra en dicha categoría. Para es–
tas muestras más inusuales el intervalo de confianza de 95% X ⫾ 1.96 s X— no contiene la
media poblacional m.
95%
⫺
X
m ⫺ 1.96sX⫺
m ⫹ 1.96sX⫺
m
⫺
X ⫹ 1.96sX⫺
⫺
X ⫺ 1.96sX⫺
–
FIGURA 5.2 La media muestral
X viene de una distribución normal con media m y des√
–
viación estándarn σX = σ/ n. Para esta muestra en particular, X proviene de 5% exterior
–
de la distribución, por lo que el intervalo de confianza de 95% X ⫾ 1.96 s X— no contiene la
media poblacional m.
–
Ahora se calculará un intervalo de confianza de 95% X ⫾ 1.96 s X— para la media del pe–
so de√
llenado.
El valor de X es 12.05. La desviación estándar poblacional s y, por tanto, s X—
g
⫽ σ/ 100 son desconocidos. Sin embargo, en este ejemplo, debido a que el tamaño muestral
es grande, se podría aproximar s con la desviación estándar muestral s ⫽ 0.1. Por tanto, se
calcula al intervalo de confianza de 95% para la media del peso de llenado m como 12.05 ⫾
(1.96)(0.01), o (12.0304, 12.0696). Se puede decir que hay 95% de confianza, o un nivel de
confianza de 95%; que la media del peso de llenado esté entre 12.0304 y 12.0696.
¿Este intervalo de confianza de 95% realmente contiene la media poblacional m? Esto
último depende de si esta muestra en particular ocurrió en otra cuya media proviene de 95%
intermedio de la distribución, o si era una muestra cuya media era inusualmente grande o pequeña, en el 5% exterior de la distribución. No hay ninguna manera de saber con seguridad
en qué categoría está contenida esa muestra particular. Pero imagine que el ingeniero repitió
este procedimiento todos los días, extrayendo una muestra grande y calculando el intervalo
–
de confianza de 95% X ⫾ 1.96 s X—. A la larga, 95% de las muestras que extrae tendrán medias
en el 95% intermedio de la distribución, por lo que en tal porcentaje de los intervalos de confianza que el ingeniero calcula estará contenida la media poblacional. En otras palabras, un
intervalo de confianza de 95% se calcula mediante un procedimiento que con seguridad contiene a la media poblacional 95% de las veces.
5.1
Intervalos de confianza para la media poblacional con muestras grandes
303
Es posible utilizar este mismo razonamiento para calcular intervalos de confianza con
diferentes niveles. Por ejemplo, se puede construir un intervalo de confianza de 68%, como
se muestra a continuación. Se sabe que 68% intermedio de la curva normal corresponde al intervalo que se extiende una distancia 1.0 s X— a cualquier lado de la media poblacional m. Por
–
–
consecuencia, un intervalo del mismo largo alrededor de X , específicamente X ⫾ s X—, contendrá la media poblacional en 68% de las muestras que se pudiera extraer. Por tanto, un intervalo de confianza de 68% para la media del peso de llenado de las cajas es 12.05 ⫾
(1.0)(0.01), o (12.04, 12.06).
Observe que el intervalo de confianza de 95% es más ancho que el de 68%. Esto es intuitivamente creíble. Con el fin de aumentar la confianza que se tiene de contener a la verdadera media poblacional, se debe hacer más ancho al intervalo, que proporcionar un margen
más ancho de error. Tomando dos casos extremos, se tiene una confianza de 100% de que la
verdadera media poblacional está en un intervalo infinitamente ancho (-∞, ∞), y una confianza de 0% de que la verdadera media poblacional esté en el intervalo de ancho cero [12.05,
12.05] que contenga a la media muestral y no a otro punto.
A continuación se mostrará cómo encontrar un intervalo de confianza con cualquier nivel de confianza deseado. Sea α un número entre 0 y 1, y 100(1 ⫺ α)% el nivel de confian–
za requerido. La figura 5.3 muestra la curva normal que representa la distribución de X . Se
define a zα/2 como el puntaje z que corta un área de α/2 en la cola del lado derecho. Por ejemplo, la tabla z (tabla A.2) indica que z.025 ⫽ 1.96, ya que 2.5% del área bajo la curva normal
estandarizada está a la derecha de 1.96. De manera similar, la cantidad ⫺zα/2 corta un área de
α/2 en la cola del lado izquierdo. El área 1 ⫺ α intermedia bajo la curva corresponde al intervalo m ⫾ zα/2s X—. Como consecuencia del razonamiento que se muestra en las figuras 5.1 y
–
5.2, el intervalo X ⫾ zα/2s X— contendrá a la media poblacional m para una proporción 1 ⫺ α
de todas las muestras que se pudieran extraer. Por tanto, un intervalo de confianza de nivel
–
–
–
100(1 ⫺ α)% para m es X ⫾ zα/2s X—, o X ⫾ zα/2s/n.
1⫺a
a/2
m ⫺ za/2s⫺
X
m
a/2
m ⫹ za/2s⫺
X
–
FIGURA 5.3 La media muestral
√ X se extrae de una distribución normal con media m y
desviación estándar σX = σ/ n. La cantidad zα/2 constituye el puntaje z que corta un área
de α/2 en la cola del lado derecho. Asimismo, ⫺zα/2 representa el que corta un área de α/2
–
la cola del lado izquierdo. El intervalo X ⫾ zα/2s X— contendrá la media poblacional m para
–
una proporción 1 ⫺ α de todas las muestras que se pudiera extraer. Por tanto, X ⫾ zα/2s X—
significa un intervalo de confianza de nivel 100(1 ⫺ α)% para m.
–
Nótese que aun para muestras grandes, la distribución de X es sólo aproximadamente
normal, y no exactamente normal. Por tanto, los niveles establecidos para los intervalos de
confianza son aproximados. Cuando el tamaño muestral es lo suficientemente grande para
que se utilice el teorema del límite central, la distinción entre los niveles aproximados y exactos se ignora en la práctica.
304
CAPÍTULO 5
Intervalos de confianza
Resumen
Sea Xl, . . . , Xn una muestra aleatoria grande (n > 30) de una población con media m y
–
desviación estándar s, por lo que X es aproximadamente normal. Entonces un intervalo de confianza 100(1 ⫺ α)% para m es
–
X ⫾ zα/2s X—
(5.1)
–
donde s X— ⫽ s/n. Cuando el valor de s es desconocido, se puede sustituir por la desviación estándar muestral s.
En particular,
s
X ± √ es intervalo de confianza de 68% para m.
n
s
X ± 1.645 √ es intervalo de confianza de 90% para m.
n
s
X ± 1.96 √ es intervalo de confianza de 95% para m.
n
s
X ± 2.58 √ es intervalo de confianza de 99% para m.
n
s
X ± 3 √ es intervalo de confianza de 99.7% para m.
n
Ejemplo
5.1
La media y desviación estándar muestrales para todos los pesos de llenado de las 100 cajas
–
son X ⫽ 12.05 y s ⫽ 0.1. Encuentre un intervalo de confianza de 85% para la media de los
pesos de llenado de las cajas.
Solución
Con el propósito de determinar un intervalo de confianza de 85%, haga 1 ⫺ α ⫽ 0.85 para
obtener α ⫽ 0.15 y α/2 ⫽ 0.075. Cuando se busca en la tabla a z.075, el puntaje z que corta
–
7.5% del área en la cola del lado derecho. Se encuentra z.075 ⫽ 1.44. Se aproxima s X— ⬇ s/n
⫽ 0.01. Por lo que el intervalo de confianza de 85% es 12.05 ⫾ (1.44)(0.01). Esto último se
puede escribir como 12.05 ⫾ 0.0144, o como (12.0356, 12.0644).
Ejemplo
5.2
El artículo “Study on the Life Distribution of Microdrills” (Z. Yang, Y. Chen y Y. Yang, en
Journal of Engineering Manufacture, 2002:301-305) notifica que en una muestra de 50 microperforadoras, éstas perforan una aleación de acero con bajo contenido de carbono, el tiempo de vida promedio (expresado como el número de huecos perforados antes de que falle) era
de 12.68 con desviación estándar de 6.83. Determine un intervalo de confianza de 95% para
la media del tiempo de vida de las microperforadoras bajo estas condiciones.
5.1
Intervalos de confianza para la media poblacional con muestras grandes
305
Solución
Primero se traslada el problema al lenguaje estadístico. Se tiene una muestra aleatoria simple
–
Xl, . . . , X50 de los tiempos de vida. La media y desviación estándar muestrales son X ⫽ 12.68
y s ⫽ 6.83. La media poblacional es desconocida y se denota por m.
–
El intervalo de confianza tiene la forma X ⫾ zα/2s X—, como se especifica en la expresión
(5.1). Dado que se quiere un intervalo de confianza de 95%, el nivel respectivo 1 ⫺ α es igual
a 0.95. Por lo que α ⫽ 0.05 y zα/2 ⫽ z.025 ⫽ 1.96. Se aproxima s con s ⫽ 6.83 y se obtiene
—
s X— ⬇ 6.83/50 ⫽ 0.9659. Por lo que el intervalo de confianza de 95% es 12.68 ⫾
(1.96)(0.9659). Lo anterior se puede escribir como 12.68 ⫾ 1.89, o como (10.79, 14.57).
El siguiente resultado de computadora (de MINITAB) presenta el intervalo de confianza de 95% calculado en el ejemplo 5.2.
One-Sample Z
The assumed standard deviation = 6.830000
N
50
Mean
12.680000
SE Mean
0.965908
95% CI
(10.786821, 14.573179)
La mayor parte del resultado se explica solo. La cantidad etiquetada con “SE Mean” repre–
senta la desviación estándar de la media muestral s X—, aproximada por s/n. (“SE Mean” establece el error estándar de la media, que es otro término para la desviación estándar de la
media muestral.)
Ejemplo
5.3
En el ejemplo 5.2 determine un intervalo de confianza de 80 por ciento.
Solución
Para determinar un intervalo de confianza de 80%, haga 1 ⫺ α ⫽ 0.80 para obtener α ⫽ 0.20.
Después busque en la tabla para z.10, el puntaje z que corta 10% del área en la cola del lado
derecho. El valor es z.10 ⫽ 1.28. Por lo que el intervalo de confianza de 80% es 12.68 ⫾
(1.28)(0.9659). Éste se puede escribir como 12.68 ⫾ 1.24, o bien (11.44, 13.92).
Se ha visto cómo calcular un intervalo de confianza con un nivel de confianza específico. Es posible calcular el nivel de un intervalo de confianza dado. El ejemplo 5.4 ilustra el
método apropiado.
Ejemplo
5.4
Con base en los datos del tiempo de vida de las microperforadoras que se presentó en el ejemplo 5.2, un ingeniero notifica un intervalo de confianza de (11.09, 14.27), pero olvidó especificar el nivel. ¿Cuál es el nivel de confianza de este intervalo de confianza?
Solución
–
–
El intervalo de confianza tiene la forma X ⫾ zα/2 s/n. Se despeja a zα/2 y después se consulta
–
la tabla z para determinar el valor de α. Ahora X ⫽ 12.68, s ⫽ 6.83 y n ⫽ 50. El límite supe-
306
CAPÍTULO 5
Intervalos de confianza
—
rior de confianza de 14.27 satisface la ecuación 14.27 ⫽ 12.68 ⫹ zα/2(6.83/50 ). Por tanto,
zα/2 ⫽ 1.646. De la tabla z se determina que α/2, el área a la derecha de 1.646, es aproximadamente 0.05. El nivel es 100(1 ⫺ α)%, o 90 por ciento.
Más acerca de niveles de confianza
El nivel de confianza de un intervalo mide la confiabilidad del método utilizado para calcular
el intervalo. Un intervalo de confianza de un nivel 100(1 ⫺ α)% se calcula mediante un método que a la larga dará como resultado que la media poblacional se sitúe en una proporción
1 ⫺ α todas las veces que se utilice. En la práctica, cuando se calcula un intervalo de confianza, se debe decidir qué nivel de confianza se utilizará. Esta decisión implica un intercambio,
porque los intervalos con niveles de confianza más grandes son menos precisos. Por ejemplo,
un intervalo de confianza de 68% especifica la media poblacional dentro de ⫾ 1.0s X—, mientras que un intervalo de confianza de 95% especifica a éste solamente dentro de ⫾ 1.96s X—;
por tanto, tiene sólo casi la mitad de la precisión del intervalo de confianza de 68%. La figura 5.4 ilustra el intercambio entre confianza y precisión. Se extrajeron cien muestras de una
población con media m. La figura 5.4b presenta cien intervalos de confianza de 95%, cada uno
basado en una de estas muestras. Los intervalos de confianza son todos diferentes, porque ca–
da muestra tiene una media X diferente. (También tienen valores diferentes de s con los que
se aproxima a s, pero esto último tiene un efecto mucho muy pequeño.) Cerca de 95% de estos intervalos contiene la media poblacional m. La figura 5.4a presenta intervalos de confianza de 68% basados en las mismas muestras. Estos intervalos son más precisos (más angostos),
pero muchos de ellos no contienen la media poblacional. La figura 5.4c presenta intervalos de
confianza de 99.7%. Estos intervalos son muy confiables. A la larga, solamente tres de los 1 000
intervalos no contendrán la media poblacional. Sin embargo, son menos precisos (más anchos); por tanto, no transmiten mucha información.
El nivel de confianza más utilizado en la práctica es de 95%. Para muchas aplicaciones,
este nivel proporciona un buen compromiso entre precisión y confiabilidad. Los niveles de
confianza inferiores a 90% rara vez se utilizan. Para algunas aplicaciones de aseguramiento
de calidad, donde la confiabilidad de producto es importante, se utilizan intervalos con niveles de confianza muy altos, de 99.7 por ciento.
Probabilidad contra confianza
En el ejemplo del peso de llenado analizado al inicio de esta sección, se calculó un intervalo
de confianza de 95% para la media poblacional m de (12.304, 12.696). Es arriesgado decir
que la probabilidad es de 95% y que m está entre 12.304 y 12.696. Sin embargo, esto último
no es correcto. El término probabilidad se refiere a los eventos aleatorios que pueden resultar diferentes cuando se repiten los experimentos. Los números 12.304 y 12.696 son fijos, no
aleatorios. La media poblacional es también fija. La media del peso de llenado está ya sea en
el intervalo de 12.304 a 12.696, o no lo está. No hay aleatoriedad implicada. Por tanto, se dice que se tiene confianza de 95% (no una probabilidad) que la media poblacional esté en tal
intervalo.
Por otra parte, se dice que se está analizando un método utilizado para calcular un intervalo de confianza de 95%. El método dará como resultado que la media poblacional esté
95% de las veces, y no el otro 5%. En este caso, si la media poblacional está contenida o no
es un evento aleatorio, porque puede variar entre experimentos. Por tanto, es correcto decir
5.1
Intervalos de confianza para la media poblacional con muestras grandes
m
m
m
a)
b)
c)
307
FIGURA 5.4 a) Cien intervalos de confianza de 68% para una media poblacional, cada uno calculado con una muestra diferente. Aunque precisos, no contienen a la media poblacional 32% de las veces. Esta alta tasa de fallas hace que el intervalo de confianza de 68% sea inaceptable para propósitos prácticos. b) Cien intervalos de confianza de 95% calculado de
estas muestras. Éste presenta un buen compromiso entre precisión y confiabilidad para muchos propósitos. c) Cien intervalos de confianza de 99.7% calculado de estas muestras. Estos intervalos no contienen a la media poblacional solamente tres
veces en 1 000. Son sumamente confiables, pero poco precisos.
que un método para calcular un intervalo de confianza de 95% tiene esa probabilidad de contener a la media poblacional.
Ejemplo
5.5
Un intervalo de confianza de 90% para la media del diámetro (en cm) de varillas de acero fabricadas en cierta máquina de extrusión se calcula de (14.73, 14.91). Verdadero o falso: La
probabilidad de que la media del diámetro de las varillas fabricadas por este proceso esté entre 14.73 y 14.91 es de 90 por ciento.
308
CAPÍTULO 5
Intervalos de confianza
Solución
Falso. Un intervalo específico de confianza está dado. La media está o no en el intervalo. Hay
confianza de 90% de que la media poblacional esté entre 14.73 y 14.91. El término probabilidad no es adecuado.
Ejemplo
5.6
Una ingeniera planea calcular un intervalo de confianza de 90% para la media del diámetro
–
de varillas de acero. Medirá los diámetros de una muestra grande de varillas, calculará X y s,
–
–
y después el intervalo X ⫾ 1.645s/n. Verdadero o falso: La probabilidad de que la media del
diámetro estará en este intervalo es de 90 por ciento.
Solución
Verdadero. Lo que se describe aquí es un método para calcular un intervalo de confianza, más
que un valor numérico específico. Es correcto decir que un método para calcular un intervalo de confianza de 90% tiene probabilidad de 90% de contener la media poblacional.
Ejemplo
5.7
Un equipo de geólogos planea medir los pesos de 250 rocas. Después de pesar cada roca muchas veces, calculará un intervalo de confianza de 95% para su peso. Suponga que no hay sesgo en el procedimiento de pesado. ¿Cuál es la probabilidad de que más de 240 de los
intervalos de confianza contengan los pesos verdaderos de las rocas?
Solución
Aquí se han analizado 250 implementaciones planeadas de un método de cálculo de intervalos de confianza, no 250 intervalos específicos que ya han sido calculados. Por tanto, es adecuado calcular la probabilidad de que un número específico de estos intervalos contendrá los
pesos verdaderos de sus rocas respectivas. Debido a que el procedimiento de pesado no tiene
sesgos, el peso verdadero de una roca es igual a la media poblacional de sus mediciones. Se
puede pensar en cada uno de los 250 intervalos de confianza como un ensayo de Bernoulli,
con el éxito ocurriendo si el intervalo de confianza contiene la media poblacional. Como consecuencia de que un intervalo de confianza de 95% se calcula con un proceso que contiene la
media poblacional 95% de las veces, la probabilidad de éxito para cada ensayo es de 0.95. Sea
g
Y el número de intervalos de confianza que contiene al peso verdadero.
√ Entonces Y
Bin(250, 0.95) N(237.5, 11.875). La desviación estándar de Y es σ = 11.875 = 3.45.
Con el uso de la curva normal, la probabilidad de que Y > 240 es 0.1922. Véase la figura 5.5.
Observe que se ha utilizado la corrección de continuidad (véase la sección 4.10).
Determinación del tamaño muestral necesario
para un intervalo de confianza de ancho específico
En el ejemplo 5.2, un intervalo de confianza de 95% fue dado por 12.68 ⫾ 1.89, o (10.79,
14.57). Éste especifica que la media está dentro de ⫾1.89. Ahora suponga que es demasiado
ancho para ser útil. Suponga que es deseable obtener un intervalo de confianza de 95% que
especifique que la media esté dentro de ⫾0.50. Con este propósito se debe aumentar el tama-
5.1
Intervalos de confianza para la media poblacional con muestras grandes
309
ño muestral. Se ilustra cómo calcular el tamaño necesario para obtener un intervalo de confianza de cualquier ancho específico.
0.1922
237.5
240.5
z = 0.87
FIGURA 5.5 Solución al ejemplo 5.7.
Se sigue de la expresión (5.1) que el ancho de un intervalo de confianza para una media poblacional basado en una muestra de tamaño n extraída de una población con desviación
–
estándar s es ⫾ zα/2s/n. Si se especifica el nivel de confianza 100(1 ⫺ α)% se puede buscar el valor zα/2. Si la desviación estándar s poblacional también se especifica, se calculará el
valor de n necesario para producir un ancho específico. En el ejemplo 5.2, el nivel de confianza
es de 95% y la desviación estándar se calcula de 6.83. Se busca zα/2 ⫽ z.025 ⫽ 1.96. El tamaño muestral necesario para obtener un intervalo de confianza de 95% con ancho ⫾0.50 se en–
cuentra al despejar n de la ecuación (1.96)(6.83)/n ⫽ 0.50. Se obtiene n ⫽ 716.83, que se
redondea hacia arriba a n ⫽ 717.
Ejemplo
5.8
En el ejemplo del peso de llenado que se analizó en esta sección, la desviación estándar muestral de pesos de las 100 cajas era de s ⫽ 0.1 oz. ¿Cuántas cajas se probarán para obtener un
intervalo de confianza de 99% de ancho ⫾ 0.012 oz?
Solución
El nivel es 99%, por lo que 1 ⫺ α ⫽ 0.99. Por tanto, α ⫽ 0.01 y zα/2 ⫽ 2.58. Se calcula el
–
valor de s con s ⫽ 0.1. El tamaño muestral necesario se encuentra con (2.58)(0.1)/n ⫽
0.012. Se obtiene n 463.
Intervalos de confianza de un lado
Los intervalos de confianza que se han analizado son de dos lados, ya que especifican tanto
un límite inferior como otro superior. Ocasionalmente se tiene interés sólo en uno de estos límites. En estos casos son adecuados los intervalos de confianza de un lado. Por ejemplo, suponga que un ingeniero que supervisa la confiabilidad quiere calcular la media de la fuerza
de compresión de cierto tipo de bloque de concreto, con el propósito de determinar los tipos de
aplicaciones para los que será adecuado. El ingeniero estará interesado solamente en un límite inferior para la fuerza, ya que las especificaciones para diferentes aplicaciones en general
especificarán sólo una fuerza mínima.
–
Suponga que una muestra grande tiene una media muestral X y desviación estándar s X—.
La figura 5.6 muestra cómo se puede adaptar la idea detrás del intervalo de confianza de dos
lados para obtener un intervalo de confianza de un lado para la media poblacional m. La cur-
310
CAPÍTULO 5
Intervalos de confianza
–
va normal representa la distribución de X . Para 95% de todas las muestras que se pueden ex–
–
traer, X ⬍ m ⫹ 1.645s X— y, por tanto, el intervalo (X ⫺ 1.645s X—, ∞) contiene a m. Este último no contendrá a m sólo si la media muestral está en el 5% superior de su distribución. El
–
intervalo (X ⫺ 1.645s X—, ∞) es un intervalo de confianza de un lado de 95% desigual para m,
–
y la cantidad X ⫺ 1.645s X— es un límite inferior de confianza del 95% para m.
95%
m
⫺
X
m ⫹1.645s⫺
X
⫺
X ⫺ 1.645s⫺
X
–
FIGURA 5.6 La media muestral X es extraída de una distribución normal con media m y
–
desviación estándar s X— ⫽ s/n–. Para esta muestra en particular, X proviene de 95% más
–
bajo de la distribución, por lo que el intervalo de confianza de un lado de 95% (X ⫺
1.645s X—, ∞) seguramente contiene a la media poblacional m.
Al construir una figura, como la 5.6, con 5% de la cola inferior sombreada, se puede
–
ver que la cantidad X ⫹ 1.645s X— es el límite superior de confianza de 95% superior para m.
Ahora se generalizará el método para obtener intervalos de confianza de un lado a cualquier
nivel deseado. Se define zα como el puntaje z que corta un área α en la cola de la derecha de
la curva normal. Por ejemplo, z.05 ⫽ 1.645. Mediante el razonamiento que se utilizó para obtener un intervalo de confianza de 95%, se pueden apreciar un nivel 100(1 ⫺ α)% con límite
–
inferior de confianza para m dado por X ⫺ zαs X— y un nivel 1 ⫺ α con límite superior de con–
fianza para m dado por X ⫹ zαs X—.
Resumen
Sea Xl, . . . , Xn una muestra aleatoria grande (n > 30) de una población con media m y
–
desviación estándar s, se tiene que X es aproximadamente normal. Entonces el nivel
de confianza 100(1 ⫺ α)% con límite inferior de confianza para m es
–
X ⫺ zαs X—
y un nivel 100(1 ⫺ α)% con límite de confianza superior para m es
–
(5.2)
X ⫹ zαs X—
(5.3)
–
—
donde s X ⫽ s/n. Cuando el valor de s es desconocido, se puede sustituir por la desviación estándar muestral s.
5.1
Intervalos de confianza para la media poblacional con muestras grandes
311
En particular,
s
X + 1.28 √ representa un límite superior de confianza de 90% para m.
n
s
X + 1.645 √ constituye un límite superior de confianza de 95% para m.
n
s
X + 2.33 √ significa un límite superior de confianza de 99% para m.
n
Los correspondientes límites inferiores se encuentran al reemplazar el “⫹” con el “⫺”.
Ejemplo
5.9
Con referencia al ejemplo 5.2, encuentre tanto un límite inferior de confianza de 95% como
uno superior de 99% para la media del tiempo de vida de las microperforadoras.
Solución
–
La media muestral y la desviación estándar son X ⫽ 12.68 y s ⫽ 6.83, respectivamente. El
–
tamaño muestral es n ⫽ 50. Se calcula s X— ⬇ s/n ⫽ 0.9659. El límite inferior de confianza
–
–
de 95% es X ⫺ 1.645s X— ⫽ 11.09 y el de 99% es X ⫹ 2.33s X— ⫽ 14.93.
En el ejemplo 5.2, el intervalo de confianza de 95% de dos lados se calculó de (10.79,
14.57). El límite inferior de confianza de 95% de 11.09, calculado en el ejemplo 5.9, es más
grande que el límite inferior del intervalo de confianza de dos lados. La razón de esto último
consiste en que el intervalo de dos lados puede fallar en dos maneras: el valor de m podría ser
demasiado alto o demasiado bajo. El intervalo de confianza de 95% de dos lados está diseñado para fallar 2.5% de las veces en el lado superior y 2.5% en el inferior. En contraparte, el
límite inferior de confianza de 95% nunca falla sobre el lado superior. Éste está, por tanto, diseñado para fallar 5% de las veces en el lado inferior, por lo que su límite inferior es mayor
que para el intervalo de dos lados.
Intervalos de confianza que deben
estar basados en muestras aleatorias
Los métodos descritos en esta sección requieren que los datos sean una muestra aleatoria de
una población. Cuando se utiliza para otras muestras, los resultados podrían ser no significativos. Los siguientes son dos ejemplos en los que se incumple la suposición de muestreo aleatorio.
Ejemplo
5.10
Un ingeniero químico desea calcular la media de la producción de un nuevo proceso. El proceso está operando 100 veces durante un periodo de varios días. La figura 5.7 presenta las 100
producciones graficadas en función del tiempo. ¿Sería adecuado calcular un intervalo de con–
fianza para la media de la producción mediante el cálculo de X y s para las producciones y
después utilizar la expresión (5.l)?
CAPÍTULO 5
Intervalos de confianza
Producción
312
Tiempo
FIGURA 5.7 Producción de 100 operaciones de un proceso químico, graficadas en función del tiempo. Hay un patrón claro que indica que los datos no forman una muestra aleatoria.
Solución
No. La expresión (5.1) es válida sólo cuando los datos son una muestra aleatoria de una población. La figura 5.7 muestra un patrón cíclico. Éste podría indicar que la producción de cada
operación está influida por la producción de la operación previa, lo que violaría la suposición
de independencia. Otra posibilidad es que la producción esté influida por condiciones ambientales que fluctúan en forma regular. En cualesquiera de los dos casos, los datos no satisfacen las condiciones de una muestra aleatoria y no se debe utilizar la expresión (5.1).
El ingeniero de quien se habló en el ejemplo 5.10 está investigando la producción de otro proceso. La figura 5.8 presenta las producciones de 100 operaciones de éste, graficadas en función del tiempo. ¿Se debe utilizar la expresión (5.1) para calcular un intervalo de confianza
para la media de la producción de este proceso?
Producción
Ejemplo
5.11
Tiempo
FIGURA 5.8 Producción de 100 operaciones de un proceso químico, graficadas en función del tiempo. Hay tendencia creciente con el tiempo, al menos en la parte inicial de la
gráfica, lo que indica que los datos no forman una muestra aleatoria.
5.1
Intervalos de confianza para la media poblacional con muestras grandes
313
Solución
No. Como en el ejemplo 5.10, hay un patrón en el tiempo. En este caso, las producciones tienden a aumentar con el tiempo, al menos en la parte inicial de la gráfica. Esto último podría
indicar un “efecto de aprendizaje”; conforme un operador se hace más experimentado respecto de un proceso, los resultados mejoran. Un análisis más minucioso de los datos podría indicar un momento donde el aumento parece parar y, en tal caso, la parte que tiene éxito se utiliza
para formar un intervalo de confianza.
Ejercicios para la sección 5.1
1. Determine el valor de zα/2 para utilizar la expresión (5.1)
con el fin de construir un intervalo de confianza con nivel
a) 90%
b) 83%
c) 99.5%
d) ¿Aproximadamente cuántas ubicaciones se deben muestrear con el propósito de que un intervalo de confianza
de 95% especificará la media dentro de ⫾0.7 cm?
e) ¿Aproximadamente cuántas ubicaciones se debe muestrear con el propósito de que un intervalo de confianza
de 98% especificará la media dentro de ⫾0.7 cm?
d) 75%
2. Determine los niveles de los intervalos de confianza que tienen los siguientes valores de zα/2:
a) zα/2 ⫽ 1.96
b) zα/2 ⫽ 2.17
c) zα/2 ⫽ 1.28
d ) zα/2 ⫽ 3.28
3. Conforme se eleva el nivel de confianza, la confiabilidad
_____________ y la precisión _________. Opciones: aumenta,
disminuye.
4. Los métodos de interpolación se utilizan para calcular alturas superiores al nivel del mar para ubicaciones donde las
mediciones directas no están disponibles. En el artículo
“Transformation of Ellipsoid Heights to Local Leveling
Heights” (M. Yanalak y O. Baykal, en Journal of Surveying
Engineering, 2001:90-103), se evalúa un método de interpolación para un polinomio de segundo orden que tiene como
objetivo calcular las alturas de mediciones GPS (sistema de
posicionamiento global). En una muestra de 74 ubicaciones, los errores del método tienen promedio de 3.8 cm, con
desviación estándar de 4.8 cm.
a) Determine un intervalo de confianza de 95% para la media del error de este método.
b) Determine un intervalo de confianza de 98% para la media del error de dicho método.
c) Un topógrafo afirma que el error de media está entre 3.2
y 4.4 cm. ¿Con qué nivel de confianza se puede hacer
esta afirmación?
5. En una muestra aleatoria de 100 baterías producidas por
cierto método, el promedio del tiempo de vida fue de 150
horas y la desviación estándar de 25 horas.
a) Determine un intervalo de confianza de 95% para la media del tiempo de vida de las baterías producidas por este método.
b) Determine un intervalo de confianza de 99% para la media del tiempo de vida de baterías producidas por dicho
método.
c) Un ingeniero afirma que la media del tiempo de vida está entre 147 y 153 horas. ¿Con qué nivel de confianza se
puede hacer esta afirmación?
d) ¿Aproximadamente cuántas baterías se deben muestrear
con el propósito de que un intervalo de confianza de
95% especificará la media dentro de ⫾2 horas?
e) ¿Aproximadamente cuántas baterías se deben muestrear
con el fin de que un intervalo de confianza de 99% especificará la media dentro de ⫾2 horas?
6. En una muestra aleatoria de 53 especímenes de concreto, la
media de la porosidad (en %) fue de 21.6 y la desviación estándar de 3.2.
a) Determine un intervalo de confianza de 90% para la media de la porosidad de los especímenes de este tipo de
concreto.
b) Determine un intervalo de confianza de 95% para la media de la porosidad de los especímenes de este tipo de
concreto.
c) ¿Cuál es el nivel de confianza del intervalo (21.0, 22.2)?
314
CAPÍTULO 5
Intervalos de confianza
d) ¿Cuántos especímenes se deben muestrear con el propósito de que un intervalo de confianza de 90% especifique la media dentro ⫾0.3?
e) ¿Cuántos especímenes se deben muestrear con el propósito de que un intervalo de confianza de 95% especifique la media dentro ⫾0.3?
7. En una muestra de 80 clavos con costo de diez centavos, el
peso promedio era 1.56 g y la desviación estándar era de 0.1
gramos.
a) Determine un intervalo de confianza de 95% para la media del peso de este tipo de clavo.
b) Determine un intervalo de confianza de 98% para la media del peso de este tipo de clavo.
c) ¿Cuál es el nivel de confianza del intervalo (1.54, 1.58)?
d) ¿Cuántos clavos se deben muestrear con el propósito de
que un intervalo de confianza de 95% especifique la media dentro de ⫾0.01 g?
e) ¿Aproximadamente cuántos clavos se deben muestrear
con el fin de que un intervalo de confianza de 98% especifique la media dentro de ⫾0.01 g?
8. Una etapa en la fabricación de cierta abrazadera de metal
implica perforar cuatro huecos. En una muestra de 150
abrazaderas, el promedio del tiempo necesario para completar dicha etapa era de 72 segundos y la desviación estándar
de 10 segundos.
a) Determine un intervalo de confianza de 95% para la media del tiempo necesario para completar tal etapa.
b) Determine un intervalo de confianza de 99.5% para la
media del tiempo necesario para completar esta etapa.
c) ¿Cuál es el nivel de confianza del intervalo (27.5, 30.5)?
d ) ¿Cuántas fibras se deben muestrear con el propósito de
que un intervalo de confianza de 95% especifique la media dentro de ⫾1 lb?
e) ¿Cuántas fibras se deben muestrear con el propósito de
que un intervalo de confianza de 99% especifique la media dentro de ⫾1 lb?
10. Con referencia al ejercicio 5.
a) Determine un límite inferior de confianza de 95% para
la media del tiempo de vida de tal tipo de batería.
b) Un ingeniero afirma que la media del tiempo de vida es
mayor de 148 horas. ¿Con qué nivel de confianza se
puede hacer esta afirmación?
11. Con referencia al ejercicio 6.
a) Determine un límite superior de confianza de 99% para
la media de la porosidad.
b) Se hizo una afirmación de que la media de la porosidad
es menor que 22.7%. ¿Con qué nivel de confianza se pudo haber hecho tal afirmación?
12. Con referencia al ejercicio 7.
a) Encuentre un límite superior de confianza de 90% para
la media del peso.
b) Alguien dice que la media del peso es menor que 1.585
g. ¿Con qué nivel de confianza se pudo haber hecho dicha afirmación?
13. Con referencia al ejercicio 8.
c) ¿Cuál es el nivel de confianza del intervalo (71, 73)?
a) Determine un límite inferior de confianza de 98% para
completar la etapa.
d) ¿Cuántas abrazaderas se deben muestrear con el propósito de que un intervalo de confianza de 95% especifique la media dentro de ⫾1.5 segundos?
b) Un especialista en eficiencia dice que la media del tiempo es mayor de 70 segundos. ¿Con qué nivel de confianza se pudo haber hecho esta afirmación?
e) ¿Cuántas abrazaderas se deben muestrear con el objetivo de que un intervalo de confianza 99.5% especifique
la media dentro de ⫾1.5 segundos?
9. Un proveedor vende fibras sintéticas a una compañía de manufactura. Se selecciona una muestra aleatoria simple de 81
fibras de un envío. El promedio de la fuerza de ruptura de
éstas es de 29 lb y la desviación estándar de 9 lb.
a) Determine un intervalo de confianza de 95% para la media de la fuerza de ruptura de todas las fibras del envío.
b) Determine un intervalo de confianza de 99% para la media de la fuerza de ruptura de todas las fibras del envío.
14. Con referencia al ejercicio 9.
a) Determine un límite superior de confianza de 95% para
la media de la fuerza de ruptura.
b) El proveedor afirma que la media de la fuerza de ruptura es mayor que 28 lb. ¿Con qué nivel de confianza se
pudo haber hecho tal afirmación?
15. Una investigadora calcula un intervalo de confianza de 95%
para una media poblacional con base en una muestra de tamaño 70. ¿Si desea calcular un intervalo de confianza de
95% que sea la mitad de ancho, ¿qué tamaño muestral necesita?
5.2
16. Un intervalo de confianza de 95% para una media poblacional se calcula de una muestra de tamaño 50. Se calculará
otro intervalo de confianza de 95% para una muestra de tamaño 200, extraída de la misma población. Elija la mejor
respuesta que complete el espacio en blanco: El intervalo de
una muestra de tamaño 50 será aproximadamente ________
del intervalo de la muestra de tamaño 200.
i) Un octavo de ancho.
ii) Un cuarto de ancho.
iii) La mitad de ancho.
iv) El mismo ancho.
v) Dos veces de ancho.
vi) Cuatro veces de ancho.
vii)Ocho veces de ancho.
17. Con base en pruebas de comportamiento de una gran muestra de uniones soldadas, se calculó un intervalo de confianza de 90% para la media de la dureza Rockwell B de cierto
tipo de soldadura de (83.2, 84.1). Determine un intervalo de
confianza de 95% para la media de la dureza Rockwell B de
este tipo de soldadura.
18. Se hicieron 64 mediciones independientes de la velocidad
de la luz. Con un promedio de 299 795 km/s y tenían una
desviación estándar de 8 km/s. Verdadero o falso:
a) Un intervalo de confianza de 95% para la velocidad de
la luz es 299 795 ⫾ 1.96 km/s.
b) La probabilidad es de 95% de que la velocidad de la luz
esté en el intervalo 299 795 ⫾ 1.96.
c) Si se hace la medición 65, la probabilidad es de 95% de
que estuviera en el intervalo 299 795 ⫾ 1.96.
19. Una caja grande contiene 10 000 cojinetes de bola. Se elige
una muestra aleatoria de 120. La media muestral del diáme-
5.2
Intervalos de confianza para proporciones
315
tro es 10 mm y la desviación estándar es 0.24 mm. Verdadero o falso:
a) Un intervalo de confianza de 95% para la media del diámetro de los 120 cojinetes en la muestra es 0 ⫾
—
(1.96)(0.24)/120.
b) Un intervalo de confianza de 95% para la media del diámetro de los 10 000 cojinetes en la caja es 10 ⫾
—
(1.96)(0.24)/120.
c) Un intervalo de confianza de 95% para la media del diámetro de los 10 000 cojinetes en la caja diez es 10 ⫾
——
(1.96)(0.24)/10 000 .
20. Todos los días un ingeniero de control de calidad selecciona una muestra aleatoria de 100 pernos de la producción del
día, mide sus longitudes y calcula un intervalo de confianza
de 95% para la media de la longitud de todos los pernos fabricados ese día. ¿Cuál es la probabilidad de que más de 15
de los intervalos de confianza construidos en los siguientes
250 días no contendrán la media verdadera?
21. Con base en una muestra de registros de reparación, un ingeniero calcula el intervalo de confianza de 95% para la
media del costo de reparar un componente de fibra óptica de
($140, $160). Un supervisor resume este resultado en un informe, diciendo: “Se tiene una confianza de 95% de que la
media del costo de las reparaciones es menor que $160”.
¿El supervisor está subestimando la confianza, sobreestimándola u obteniéndola de manera correcta? Explique.
22. Un meteorólogo mide la temperatura en el centro de la ciudad de Denver a mediodía todos los días durante un año.
Las 365 lecturas tienen un promedio de 57°F y una desviación estándar de 20°F . El meteorólogo calcula un intervalo
de confianza de 95% para la media de la temperatura a me—
diodía de 57° ⫾ (1.96)(20)/365. ¿Es esto correcto? ¿Por
qué si o por qué no?
Intervalos de confianza para proporciones
Los métodos de la sección 5.1, en particular la expresión (5.1), se pueden utilizar con el fin
de determinar los intervalos de confianza para la media de cualquier población de la cual se
ha extraído una muestra grande. Cuando la población tiene una distribución de Bernoulli, esta expresión toma una forma especial. Se muestra esto último con un ejemplo.
En el ejemplo 5.2 (de la sección 5.1), se construyó un intervalo de confianza para la media del tiempo de vida de una microperforadora cuando perforaba una aleación de acero con
bajo contenido de carbono. Ahora suponga que se ha establecido una especificación de que
una perforadora debe tener un tiempo de vida mínimo de diez huecos perforados antes de fa-
316
CAPÍTULO 5
Intervalos de confianza
llar. Se prueba una muestra de 144 microperforadoras, y 120, 83.3%, satisfacen la especificación. Sea p la proporción de microperforadoras en la población que satisface la especificación.
Se desea encontrar un intervalo de confianza de 95% para p.
Se empieza construyendo un estimador de p. Sea X el número de perforadoras en la
muestra que satisface la especificación. Entonces X ⬃ Bin(n, p), donde n ⫽ 144 es el tamaño muestral. El estimador de p es p̂ ⫽ X/n. En este ejemplo, X ⫽ √
120, por lo que p̂ ⫽ 120/144
⫽ 0.833. La incertidumbre, o desviación estándar de p̂, es σp = p(1 − p)/n. Puesto que el
tamaño muestral es grande, se tiene por el teorema del límite central (ecuación 4.52 de la sección 4.10) que
p(1 − p)
p
∼ N p,
n
El razonamiento que se ilustra en las figuras 5.1 y 5.2 (de la sección 5.1) muestra que en 95%
de todas las muestras posibles, la proporción poblacional p satisface la siguiente desigualdad:
p(1 − p)
p(1 − p)
< p < p
+ 1.96
p
− 1.96
(5.4)
n
n
A primera vista, la expresión
√ (5.4) parece un intervalo de confianza de 95% para p. Sin
± 1.96 p(1 − p)/n contienen una p desconocida, y por eso no se
embargo, los límites p
p
p tradicional es sustituir p con p̂, obtener el intervalo de conpuede calcular.
El
punto de vista
± 1.96 p
(1 − p
)/n. Investigaciones recientes muestran que ese intervalo se puefianza p
de mejorar modificando ligeramente tanto a n como a p̂. En específico, se debe sumar 4 al
número de los ensayos y 2 al de los éxitos. Así que en lugar de n se utiliza ⬃
n ⫽ n ⫹ 4, y en
lugar
de pp̂
se usa ⬃
pp⫽ (X( ⫹ 2)/ ⬃
n . Un intervalo de confianza de 95% para p es así dado por
p
(1 − p
)/
± 1.96 p
n ⫽ 148 y ⬃
p ⫽ 122/148 ⫽ 0.8243, por eso el inn. En este ejemplo, ⬃
p
tervalo de confianza de 95% es 0.8243 ⫾ 0.0613, o (0.763, 0.886).
Se justifica lo anterior con base en el teorema del límite central, que requiere que n sea
grande. Sin embargo, este método de cálculo de intervalos de confianza es adecuado para
cualquier tamaño n de muestra. Cuando se utiliza con muestras pequeñas, podría ocurrir que
el límite inferior sea menor a 0 o que el superior a 1. Dado que 0 < p < 1, un límite inferior
menor que 0 se debe sustituir con 0, y un límite superior mayor que 1 se debe sustituir con 1.
Resumen
Sea X el número de éxitos en n ensayos de Bernoulli independientes con probabilidad
de éxito p, por lo que X ⬃ Bin(n, p).
X+2
=
. Entonces un nivel 100(1 ⫺ α)% de un intervaSe define ⬃
n⫽n⫹4y p
n
lo de confianza para p es
(1 − p
)
p
(5.5)
± zα/2
p
n
Si el límite inferior es menor que 0, se reemplaza éste con 0. Si el superior es mayor
que 1, se remplaza éste con 1.
5.2
317
Intervalos de confianza para proporciones
El intervalo de confianza dado por la expresión (5.5) algunas veces es llamado intervalo de Agresti-Coull, en honor a Alan Agresti y Brent Coull, quienes lo desarrollaron. Para mayor información consulte “Approximate Is Better Than ‘Exact’ for Interval Estimation of
Binomial Proportions” (A. Agresti y B. Coull, en The American Statistician, 1998:119-126).
Ejemplo
5.12
Los métodos de interpolación se usan para calcular las alturas sobre el nivel del mar para ubicaciones donde las mediciones directas no están disponibles. En el artículo “Transformation
of Ellipsoid Heights to Local Leveling Heights” (M. Yanalak y O. Baykal, en Journal of Surveying Engineering, 2001:90-103), se evalúa un método de promedio ponderado de interpolación para calcular las alturas de mediciones GPS. El método se estableció para interpretar
errores “grandes” (errores cuya magnitud están por encima de umbral comúnmente aceptado)
en 26 de 74 ubicaciones de prueba. Determine un intervalo de confianza de 90% para la proporción de ubicaciones en las que este método tendrá errores grandes.
Solución
El número de éxitos es X ⫽ 26 y elde ensayos n ⫽ 74. Por tanto,
se calcula ⬃
n ⫽ 74 ⫹p4 ⫽
p
√
⬃
78, p ⫽ (26 ⫹ 2)/78 ⫽ 0.3590, y p
(1 − p
)/
n = (0.3590)(0.6410)/78 = 0.0543. Para
un intervalo de confianza de 90%, el valor de α/2 es 0.05, por lo que zα/2 ⫽ 1.645. El intervalo de confianza de 90% es, por tanto, 0.3590 ⫾ (1.645)(0.0543), o (0.270, 0.448).
Los intervalos de confianza de un lado se pueden calcular también para proporciones.
Son análogos a los intervalos de un lado para una media poblacional (ecuaciones 5.2 y 5.3 de
la sección 5.1). Los niveles para los intervalos de confianza de un lado son sólo aproximaciones burdas para muestras pequeñas.
Resumen
Sea X el número de éxitos en n ensayos de Bernoulli independientes con probabilidad
p de éxito, por lo que X ⬃ Bin(n, p).
=
Se define ⬃
n⫽n⫹4yp
inferior de confianza para p es
X+2
. Entonces un nivel 100(1 ⫺ α)% de un límite
n
− zα
p
(1 − p
)
p
n
y nivel 100(1 ⫺ α)% de un límite superior de confianza para p es
(1 − p
)
p
+ zα
p
n
(5.6)
(5.7)
Si el límite inferior es menor que 0, se reemplaza con 0. Si el superior es mayor que 1,
se reemplaza con 1.
318
CAPÍTULO 5
Intervalos de confianza
El ejemplo 5.13 muestra cómo calcular el tamaño muestral necesario para un intervalo
de confianza que tenga un ancho específico cuando se conoce un valor preliminar de ⬃
p.
Ejemplo
5.13
En el ejemplo 5.12, ¿qué tamaño muestral se necesita para obtener un intervalo de confianza
de 95% con ancho ⫾0.08?
Solución
(1− p
)/
n, donde ⬃
Un intervalo de confianza de 95% tiene un ancho ±1.96 p
n ⫽ n ⫹ 4. Por
)/(n + 4) = 0.08. De
p
(1
−
p
1.96
tanto, se determina el tamaño muestral n con la ecuación
los datos del ejemplo 5.12, ⬃
p ⫽ 0.3590. Al sustituir este valor para ⬃
p y despejando a n, se obtiene n ⬇ 135.
A veces se puede desear calcular un tamaño muestral sin tener disponible un estimador
confiable. La cantidad ⬃
p (1 ⫺ ⬃
p ), que determina el ancho del intervalo de confianza, se ma⬃
ximiza por p ⫽ 0.5. Debido a que el ancho es el más grande cuando ⬃
p (1 ⫺ ⬃
p ) es mayor, se
⬃
puede calcular un estimador de tamaño muestral conservador con p ⫽ 0.5 y prosiguiendo como en el ejemplo 5.13.
⬃
p
Ejemplo
5.14
En el ejemplo 5.12, ¿qué tamaño muestral es necesario para garantizar que el ancho del intervalo de confianza de 95% no será mayor que ⫾ 0.08, si no se ha tomado alguna muestra preliminar?
Solución
Un intervalo de confianza de 95% tiene un ancho ±1.96 p
El intervalo de
(1 − p
√
)/(n
√ + 4).
confianza √
más ancho posible, para una muestra de tamaño √
n, es ±1.96 (0.5)(1 − 0.5)/(n + 4),
o ±0.98/ n + 4. Al despejar a n de la ecuación 0.98/ n + 4 = 0.08 , se obtiene n ⬇ 147.
Observe que este cálculo es un poco más grande que el que se obtuvo en el ejemplo 5.13.
El método tradicional
El método que se ha descrito se ha desarrollado recientemente (aunque se creó para simplificar un método mucho más antiguo). Muchas personas todavía usan un método más tradiciop.
nal. Éste utiliza el tamaño muestral n real en lugar de ⬃
n y la proporción real p̂ en lugar de ⬃
Aunque este método todavía es usado, falla para lograr la probabilidad de cobertura establecida, incluso para algunos valores bastante grandes de n. Esto significa que intervalos de confianza 100(1 ⫺ α)% que se calculan con los métodos tradicionales contendrán la proporción
verdadera menos del 100(1 ⫺ α)% de las veces. El método tradicional no puede ser usado para todas las muestras pequeñas; una regla práctica respecto del tamaño muestral es que tanto
n p̂ (el número de éxitos) como n(1 ⫺ p̂) (el número de fracasos) deben ser mayores que 10.
Debido a que el método tradicional todavía es muy usado, lo resumimos en el siguiente cuadro. Para tamaños muestrales muy grandes, los resultados del método tradicional son
casi idénticos a los obtenidos con el método moderno. Para tamaños muestrales pequeños o
medianamente grandes, el punto de vista moderno es mejor.
5.2
Intervalos de confianza para proporciones
319
Resumen
El método tradicional para calcular intervalos de confianza para una proporción (ampliamente usado pero no recomendado)
Sea p̂ la proporción de éxitos en un gran número n de ensayos de Bernoulli independientes con probabilidad de éxito p. Entonces el intervalo de confianza tradicional de
nivel 100(1 ⫺ α)% para p es
(1 − p
)
p
(5.8)
p
± zα/2
n
El método no se puede utilizar a menos que la muestra contenga un mínimo de diez
éxitos y diez fracasos.
Ejercicios para la sección 5.2
1. Las concentraciones de contaminantes atmosféricos, como
monóxido de carbono (CO), se pueden medir con un espectrómetro. En una prueba de calibración, se hicieron 50 mediciones de una muestra de gas del laboratorio que se sabía
tenía una concentración de CO de 70 partes por millón
(ppm). Se considera que una medición es satisfactoria si está dentro de 5 ppm de la concentración verdadera. De las 50
mediciones, 37 fueron satisfactorias.
a) ¿Qué proporción de mediciones de la muestra fue satisfactoria?
b) Determine un intervalo de confianza de 95% para la proporción de mediciones hechas por este instrumento que
serán satisfactorias.
c) ¿Cuántas mediciones se debe tomar para especificar la
proporción de mediciones satisfactorias dentro de
⫾0.10 con una confianza de 95%?
b) Determine un intervalo de confianza de 98% para la proporción de fusibles fabricados ese día, cuyo amperaje de
quemado es mayor que 15 A.
c) Determine el tamaño muestral necesario para que un intervalo de confianza de 95% especifique la proporción
dentro de ⫾0.05.
d) Determine el tamaño muestral necesario para que un intervalo de confianza de 98% especifique la proporción
dentro de ⫾0.05.
e) Si se calcula un intervalo de confianza de 95% a diario
durante 200 días, ¿cuál es la probabilidad de que más de
192 intervalos de confianza contengan las proporciones
verdaderas?
d ) Determine un intervalo de confianza de 99% para la proporción de mediciones hechas por este instrumento que
será satisfactorio.
3. Un fabricante de refresco compra latas de aluminio de un
distribuidor externo. Se selecciona una muestra aleatoria de
70 latas de un envío grande, se prueba la resistencia de cada una aplicando una carga creciente en los lados de la lata
hasta que se perfora. De las 70 latas, 52 satisfacen la especificación para la resistencia de perforación.
e) ¿Cuántas mediciones se debe tomar para especificar la
proporción de mediciones satisfactorias dentro de
⫾0.10 con una confianza de 99%?
a) Determine un intervalo de confianza de 95% para la proporción de latas que satisface la especificación en el envío.
2. En cierto día, se fabricó gran número de fusibles, cada uno
tasado a 15 A. Al extraer una muestra de 75 de la producción del día, se encontró que 17 de ellos tenían amperajes
de quemado mayores de 15 A.
a) Determine un intervalo de confianza de 95% para la proporción de fusibles fabricada ese día, cuyo amperaje de
quemado es mayor que 15 A.
b) Determine un intervalo de confianza de 90% para la proporción de latas que satisface la especificación en el envío.
c) Determine el tamaño muestral necesario para que un intervalo de confianza de 95% especifique la proporción
dentro de ⫾0.05.
d ) Determine el tamaño de la muestra necesario para que
un intervalo de confianza de 90% especifique la proporción dentro de ⫾0.05.
320
CAPÍTULO 5
Intervalos de confianza
e) Si un intervalo de confianza de 90% se calcula a diario
durante 300 días, ¿cuál es la probabilidad de que más de
280 intervalos de confianza contengan las proporciones
verdaderas?
4. Con referencia al ejercicio 1, encuentre un límite inferior de
confianza de 95% para la proporción de medidas satisfactorias.
5. Con referencia al ejercicio 2, encuentre un límite superior
de confianza de 98% para la proporción de fusibles con amperajes de quemado mayores de 15 A.
a) Encuentre un intervalo de confianza de 90% para la probabilidad de que una muestra contendrá un nivel detectable de plomo.
b) Determine un intervalo de confianza de 95% para la probabilidad de que una muestra contenga un nivel detectable de arsénico.
c) Determine un intervalo de confianza de 99% para la probabilidad de que una muestra contenga un nivel detectable de cromo.
6. Con referencia al ejercicio 3, encuentre un límite inferior de
confianza de 99% para la proporción de latas que satisface
la especificación.
10. Los aceros inoxidables pueden ser susceptibles al agrietamiento de corrosión por tensión bajo ciertas condiciones.
Un ingeniero especializado en materiales está interesado en
determinar la proporción de fallas de aleaciones de acero
que son atribuibles al agrietamiento de corrosión por tensión.
7. Se prueba una muestra aleatoria de 400 componentes electrónicos fabricados por cierto proceso y se encuentra que 30
están defectuosos.
a) En ausencia de datos preliminares, ¿de qué tamaño debe ser una muestra para asegurar que el intervalo de confianza de 95% especificará la proporción dentro de
⫾0.05?
a) Sea p la proporción de componentes fabricados con este proceso que están defectuosos. Determine un intervalo de confianza de 95% para p.
b) ¿Cuántos componentes se deben muestrear con el propósito de que el intervalo de confianza de 95% especifique la proporción defectuosa dentro de ⫾0.02?
c) (Difícil) La compañía envía los componentes en lotes de
200. Los lotes que contienen más de 20 componentes
defectuosos pueden ser regresados. Determine un intervalo de confianza de 95% para la proporción de lotes
que serán regresados.
8. Con referencia al ejercicio 7, se fabricará un dispositivo en
el cual se conectarán en serie dos de los componentes del
ejercicio 7. Los componentes funcionan de manera independiente, el dispositivo funcionará sólo si ambos componentes funcionan. Sea q la probabilidad de que un
dispositivo funcione. Determine un intervalo de confianza
de 95% para q. (Sugerencia: exprese q en función de p, y
después utilice el resultado del ejercicio 7a.)
9. El artículo “Leachate from Land Disposed Residential
Construction Waste” (W. Weber, Y. Jang y cols., en Journal
of Environmental Engineering, 2002:237-245) presenta un
estudio de la contaminación en basureros que contienen desechos de construcción y desperdicio de demolición. De un
sitio de prueba se tomaron muestras de lixiviado. De cada
42 muestras, 26 contienen niveles detectables de plomo, 41
de arsénico y 32 de cromo.
b) En una muestra de 100 fallas, 20 eran ocasionadas por
el agrietamiento de corrosión por tensión. Encuentre un
intervalo de confianza de 95% para la proporción de fallas ocasionadas por el agrietamiento de corrosión por
tensión.
c) Con base en los datos del inciso (b), calcule el tamaño
muestral necesario con el propósito de que el intervalo
de confianza de 95% especificará la proporción dentro de
⫾0.05.
11. Para que los proyectos de remediación ecológica muy importantes sean exitosos, deben tener apoyo público. El artículo
“Modelling the Non-Market Environmental Costs and Benefits of Biodiversity Using Contingent Value Data” (D.
Macmillan, E. Duff y D. Elston, en Environmental and Resource Economics, 2001:391-410) notifica los resultados de
una encuesta en que a votantes escoceses se les preguntó si
estarían dispuestos a pagar impuestos adicionales con la finalidad de restaurar el bosque Affric. De los 189 que respondieron, 61 decían que sí apoyarían esa medida.
a) Suponiendo que los 189 votantes que respondieron,
constituyen una muestra aleatoria, determine un intervalo de confianza de 90% para la proporción de votantes
que estarían dispuestos a pagar para restaurar el bosque
Affric.
b) ¿Cuántos votantes se deben muestrear para especificar la
proporción dentro de ⫾0.03 con una confianza de 90%?
c) Se planea realizar otra encuesta en la cual se les preguntará a los votantes si estarían dispuestos a pagar con la
5.3
Intervalos de confianza para la media poblacional con muestras pequeñas
finalidad de restaurar el bosque Strathspey. En este momento, no hay alguna estimación disponible. Determine
un cálculo conservador del tamaño muestral necesario
con el propósito de que la proporción estará especificada dentro de ⫾0.03 con una confianza de 90 por ciento.
5.3
321
12. Un analista del mercado de valores observa que, en cierto
año, el precio de cada acción de la IBM aumentó en 131 de
los 252 días bursátiles. ¿Con estos datos se puede encontrar
un intervalo de confianza de 95% para la proporción de días
en que la acción de IBM se incrementa? Explique.
Intervalos de confianza para la media poblacional
con muestras pequeñas
Los métodos descritos en la sección 5.1 con el fin de calcular intervalos de confianza para la
media de una población requieren que el tamaño muestral sea grande. Cuando éste es pequeño, no hay ningún buen método general para encontrar intervalos de confianza. Sin embargo,
cuando la población es aproximadamente normal, se puede utilizar una distribución de probabilidad denominada t de Student para calcular los intervalos de confianza para una media
poblacional. En esta sección se describe dicha distribución y se muestra cómo utilizarla.
Distribución t de Student
–
Si X es la media de una muestra grande de tamaño n de una población con media m y varian–
za s2, entonces el teorema del límite central especifica que X ⬃ N(m, s2/n). La cantidad
–
–
(X ⫺ m)/(s/n ) tiene una distribución normal con media 0 y varianza 1. Además, la desviación estándar muestral s estará cerca de la desviación estándar s poblacional. Por esta razón
–
–
la cantidad (X ⫺ m)/(s/n ) es aproximadamente normal con media 0 y varianza 1, por lo que
se pueden buscar las probabilidades relacionadas con esta cantidad en la tabla normal estándar (tabla z). Esto último permite que se calcule intervalos de confianza para diferentes niveles para la media poblacional m.
–
¿Qué se puede hacer si X es la media de una muestra pequeña? Si éste es pequeño, s
–
podría no estar cercano a s, y X puede no ser aproximadamente normal. Si no se sabe nada
acerca de la población de la que la muestra pequeña fue extraída, entonces no hay ningún método fácil para calcular intervalos de confianza. Sin embargo, si la población es aproximada–
mente normal, X lo será incluso cuando el tamaño muestral sea pequeño. Lo anterior propicia
–
–
que aún se puede utilizar la cantidad (X ⫺ m)/(s/n ), pero debido a que s no está necesariamente cercana a s, esta cantidad no tendrá una distribución normal. En su lugar, tiene la distribución t de Student con n ⫺ 1 grados de libertad, que se denota por tn ⫺ 1. El número de
grados de libertad para la distribución t es uno menos que el tamaño muestral.
La distribución t de Student fue descubierta en 1908 por William Sealy Gossett, un estadístico que trabajó en la cervecera Guinness, en Dublín, Irlanda. La dirección de Guinness
consideró que el descubrimiento era información privada y prohibió a Gossett que lo publicara. Aun así, él lo publicó, usando el seudónimo “Estudiante”. Gossett había hecho ya esto
antes; véase la sección 4.3.
322
CAPÍTULO 5
Intervalos de confianza
Resumen
Sea Xl, . . . , Xn una muestra pequeña (por ejemplo n ⬍ 30) de una población normal
con media m. Entonces la cantidad
X−μ
√
s/ n
tiene una distribución t de Student con n ⫺ 1 grados de libertad, denotada por tn ⫺ 1.
–
–
Cuando n es grande, la distribución de la cantidad (X ⫺ m)/(s/n ) es muy cercana
a la curva normal, de esta forma la curva normal puede usarse en lugar de la t de Student.
La función de densidad de probabilidad de la distribución t de Student es diferente para distintos grados de libertad. La figura 5.9 presenta gráficas de la función de densidad de
probabilidad para diferentes elecciones de grados de libertad. Las curvas tienen una forma similar a la curva normal, o z, es una curva con media 0 y desviación estándar 1. Sin embargo,
las curvas t son más extendidas. Por ejemplo, la curva t con un grado de libertad corresponde a un tamaño muestral de 2. Cuando se extraen muestras de tamaño 2, ocurrirá con frecuencia que la desviación estándar muestral s sea mucho más pequeña que s, lo que llevará a que
–
–
el valor de (X ⫺ m)/(s/n ) sea muy grande (ya sea positivo o negativo). Por esta razón, la curva
t con un grado de libertad tiene mucho más área en las colas. Para tamaños muestrales más
grandes, el valor de s es menos probable que esté lejos de s y la curva t es más cercana a la
curva normal. Con diez grados de libertad (correspondiendo a un tamaño muestral de 11), la diferencia entre la curva t y la curva normal no es grande. Si una curva t con 30 grados de la libertad estuviera dibujada en la figura 5.9, sería indistinguible de la curva normal.
z
t10
t1
t4
0
FIGURA 5.9 Gráficas de la función de densidad de probabilidad de la curva t de Student
para diferentes grados de libertad. La curva normal con media 0 y varianza 1 (curva z) es
graficada para comparar. Las curvas t están más extendidas que la normal, pero la cantidad
de extensión adicional disminuye conforme se aumenta el número de grados de libertad.
5.3
Intervalos de confianza para la media poblacional con muestras pequeñas
323
La tabla A.3 (en el Apéndice A), denominada tabla t, proporciona probabilidades relacionadas con la distribución t de Student. Se presentan algunos ejemplos para mostrar el uso
de la tabla.
Ejemplo
5.15
Se extrae una muestra aleatoria de tamaño 10 de una distribución normal con media 4. La
—
–
estadística t de Student t ⫽ (X ⫺ 4)/(s/10 ) es calculada. ¿Cuál es la probabilidad de que
t ⬎1.833?
Solución
Esta estadística t tiene 10 ⫺ 1 ⫽ 9 grados de libertad. De la tabla t, P(t ⬎ 1.833) ⫽ 0.05. Véase la figura 5.10.
0.05
0
1.833
FIGURA 5.10 Solución al ejemplo 5.15.
Ejemplo
5.16
Con referencia al ejemplo 5.15, determine P(t ⬎ 1.5).
Solución
Buscando a través del renglón correspondiente a 9 grados de libertad, se ve que la tabla t no
lista el valor 1.5. Se encuentra que P(t ⬎ 1.383) ⫽ 0.10 y que P(t ⬎ 1.833) ⫽ 0.05. Se concluye entonces que 0.05 ⬍ P(t ⬎ 1.5) ⬍ 0.10. Véase la figura 5.11. Un resultado más preciso que esta desigualdad se puede obtener mediante interpolación lineal
P (t > 1.5) ≈ 0.10 −
1.5 − 1.383
(0.10 − 0.05) = 0.0870
1.833 − 1.383
Un software proporciona la respuesta correcta con tres dígitos significativos como 0.0839.
0.10
0.05
0
1.38
1.83
1.5
FIGURA 5.11 Solución al ejemplo 5.16.
Ejemplo
5.17
Determine el valor para la distribución t12 cuya cola superior de probabilidad es 0.025.
324
CAPÍTULO 5
Intervalos de confianza
Solución
Al buscar hacia abajo la columna encabezada con “0.025” en el renglón correspondiente a 12
grados de libertad. El valor para t12 es 2.179.
Ejemplo
5.18
Determine el valor para la distribución de tl4 cuya cola de la probabilidad inferior es 0.01.
Solución
Busque hacia abajo de la columna encabezada con “0.01” en el renglón que corresponde a 14
grados de libertad. El valor para tl4 es 2.624. Este valor corta un área, o probabilidad, de 1%
en la cola superior. El valor cuya cola inferior de probabilidad es 1% es ⫺2.624.
No use la estadística t de Student si la muestra
contiene datos atípicos
Para que la estadística t de Student sea válida, la muestra debe provenir de una población que
es aproximadamente normal. Tales muestras rara vez contienen datos atípicos. Por tanto, los
métodos que implican la estadística t de Student no se deben utilizar en muestras que contienen datos atípicos.
Intervalos de confianza al usar la distribución t de Student
Cuando el tamaño muestral es pequeño y la población es aproximadamente normal, se puede
utilizar la distribución t de Student para calcular intervalos de confianza. Se muestra esto último con un ejemplo.
Un metalúrgico estudia un nuevo proceso de soldadura. Fabrica cinco uniones soldadas
y mide la resistencia producida por cada uno. Los cinco valores (en ksi) son 56.3, 65.4, 58.7,
70.1 y 63.9. Suponga que estos valores son una muestra aleatoria de una población aproximadamente normal. La tarea es determinar un intervalo de confianza para la media de la resistencia de las soldaduras hechas por este proceso.
Cuando el tamaño muestral es grande, no necesita preocuparse mucho acerca de la na–
turaleza de la población, porque el teorema del límite central garantiza que la cantidad X tendrá una distribución aproximadamente normal. Sin embargo, cuando la muestra es pequeña,
la distribución de la población debe ser aproximadamente normal.
En este caso el intervalo de confianza se construye de la misma manera que en la sección 5.1, exceptuando que el puntaje z se reemplaza con un valor de la distribución t de Student. La cantidad
X−μ
√
s/ n
tiene una distribución t de Student con n ⫺ 1 grados de libertad. La figura 5.12 muestra la distribución t4. De la tabla t de Student se encuentra que 95% del área bajo la curva está contenida entre los valores t ⫽ ⫺2.776 y t ⫽ 2.776. Por consecuencia, para 95% de todas las
muestras que se pudo haber elegido,
X−μ
√ < 2.776
−2.776 <
s/ n
5.3
325
Intervalos de confianza para la media poblacional con muestras pequeñas
2.5%
2.5%
95%
0
⫺2.776
2.776
FIGURA 5.12 La distribución t de Student con cuatro grados de libertad. Un 95% del área
cae entre t ⫽ ⫺2.776 y t ⫽ 2.776.
Expresado de otra manera, para 95% de todas las muestras que se pudo haber elegido, se tiene que
s
s
−2.776 √ < X − μ < 2.776 √
n
n
–
Multiplicando por ⫺1 y al sumar X en todos los lados de la desigualdad, se obtiene un intervalo de confianza 95% para m:
s
s
X − 2.776 √ < μ < X + 2.776 √
n
n
–
En este ejemplo, la media muestral es X ⫽ 62.88 y la desviación estándar muestral es
–
s ⫽ 5.4838. El tamaño muestral es n ⫽ 5. Al sustituir valores para X , s y n, se encuentra que
un intervalo de confianza de 95% para m es 62.88 ⫺ 6.81 ⬍ m ⬍ 62.88 ⫹ 6.81, o (56.07,
69.69).
En general, para producir un intervalo de confianza de nivel 100(1 ⫺ α)%, sea tn ⫺ l, α/2
el 1 ⫺ α/2 cuantil de la distribución t de Student con n ⫺ 1 grados de libertad, es el valor que
corta un área de α/2 en la cola de la derecha. Por ejemplo, antes se encontró que t4, 0.025 ⫽
2.776. Entonces un intervalo de confianza de nivel 100(1 ⫺ α)% para la media m poblacio–
–
–
–
–
–
nal es X ⫺ tn ⫺ l, α/2(s/n) ⬍ m ⬍ X ⫹ tn ⫺ l, α/2(s/n), o X ⫾ tn ⫺ l, α/2(s/n).
Resumen
Sea Xl, . . . , Xn una muestra aleatoria pequeña de una población normal con media m.
Entonces un intervalo de confianza de nivel 100(1 ⫺ α)% para m es
s
X ± tn−1,α/2 √
n
(5.9)
¿Cómo se determina si la distribución t de Student es adecuada?
La distribución t de Student es adecuada siempre que la muestra provenga de una población
que es más o menos normal. A veces se sabe por experiencia si un proceso genera datos con
una distribución aproximada. Sin embargo, en muchos casos, se debe decidir si una población
es aproximadamente normal examinando la muestra. Por desgracia, cuando el tamaño muestral es pequeño, desviaciones a la normalidad pueden ser difíciles de detectar. Una manera ra-
326
CAPÍTULO 5
Intervalos de confianza
zonable de proceder es construir un diagrama de caja o de puntos de la muestra. Si estos diagramas no revelan una asimetría fuerte o algún dato atípico, entonces en la mayor parte de los
casos la distribución t de Student será confiable. En principio, también se puede determinar
si una población es aproximadamente normal al construir una gráfica de probabilidad. Sin
embargo, con muestras pequeñas, los diagramas de caja y de puntos son más fáciles de dibujar, especialmente a mano.
El artículo “Direct Strut-and-Tie Model for Prestressed Deep Beams” (K. Tan, K. Tong y C.
Tang, en Journal of Structural Engineering, 2001:1076-1084) presenta mediciones de la fuerza nominal de corte (en kN) para una muestra de 15 vigas de concreto. Los resultados son
580
575
400
750
428
636
825
360
850
590
875
735
920
950
550
¿Es adecuado utilizar la estadística t de Student para construir un intervalo de confianza de
99% para la media de la fuerza de corte? Si es así, construya el intervalo de confianza. Si no,
explique por qué.
Solución
Para determinar si la estadística t de Student es adecuada, se hace un diagrama de caja y de
puntos de la muestra. Éstos se muestran en la figura siguiente.
1 000
900
Fuerza de corte (kN)
Ejemplo
5.19
800
700
600
500
400
300
300
400
500
600
700
800
Fuerza de corte (kN)
900
1 000
No hay evidencia de una desviación muy importante a la normalidad; en particular las
gráficas no son fuertemente asimétricas, y no hay algún dato atípico. El método t de Student
–
es adecuado. Por tanto, se calcula X ⫽ 668.27 y s ⫽ 192.089. Se utiliza la expresión (5.9) con
n ⫽ 15 y α/2 ⫽ 0.005. De la tabla t con 14 grados de libertad, se encuentra t14, 0.005 ⫽ 2.977.
—
El intervalo de confianza de 99% es 668.27 ⫾ (2.977)(192.089)/15 , o (520.62, 815.92).
5.3
Intervalos de confianza para la media poblacional con muestras pequeñas
327
El siguiente resultado de computadora (de MINITAB) presenta el intervalo de confianza calculado en el ejemplo 5.19.
One-Sample T: Strength
Test of mu = 0 vs not = 0
Variable
Strength
N
15
Mean
668.2667
StDev
192.0891
SE Mean
49.59718
99% CI
(520.6159, 815.9175)
El resultado es muy claro. La cantidad etiquetada “SE Mean” representa la desviación están–
dar de la media muestral, s/n.
En el artículo referido en el ejemplo 5.19, la fuerza compresiva cilíndrica (en MPa) fue medida para 11 vigas. Los resultados fueron
38.43
38.43
38.39
38.83
38.45
38.35
38.43
38.31
38.32
38.48
38.50
¿Es adecuado utilizar la estadística t de Student para construir un intervalo de confianza de
95% para la media de la fuerza compresiva cilíndrica? Si es así, construya el intervalo de confianza. Si no, explique por qué.
Solución
Como en el ejemplo 5.19, se realizará un diagrama de caja y un diagrama de puntos de la
muestra. Éstos se muestran en la figura siguiente.
39
38.9
Fuerza compresiva (MPa)
Ejemplo
5.20
38.8
38.7
38.6
38.5
38.4
38.3
38.2
38.2
38.4
38.6
38.8
Fuerza compresiva (MPa)
39
Hay un dato atípico en esta muestra. La estadística t de Student no se debe utilizar.
328
Ejemplo
5.21
CAPÍTULO 5
Intervalos de confianza
Un ingeniero lee un informe que dice que una muestra de 11 vigas de concreto tenía una fuerza compresiva promedio de 38.45 MPa con desviación estándar de 0.14 MPa. ¿Se debe utilizar la curva t para encontrar un intervalo de confianza para la media de la fuerza compresiva?
Solución
No. El problema es que no hay ninguna manera de saber si las mediciones provienen de una
población normal. Por ejemplo, si las mediciones contienen un dato atípico (como en el ejemplo 5.20), el intervalo de confianza sería inválido.
La distribución t de Student se puede utilizar para calcular intervalos de confianza de
un lado. Las fórmulas son análogas a las que se utilizan con muestras grandes.
Sea Xl, . . . , Xn una muestra aleatoria pequeña de una población normal con media
m. Entonces un límite superior de confianza de nivel 100(1 ⫺ α)% para m es
s
X + tn−1,α √
n
(5.10)
y un límite inferior de confianza de nivel 100(1 ⫺ α)% para m es
s
X − tn−1,α √
n
(5.11)
Utilice z, no t, si se conoce a s
En ocasiones se puede tomar una pequeña muestra de una población normal cuya desviación
estándar s se conoce. En estos casos, no se utiliza la curva t de Student, porque no se está
aproximando a s con s. En su lugar, se utiliza la tabla z. El ejemplo 5.22 ilustra el método.
Ejemplo
5.22
Con referencia al ejemplo 5.19. Suponga, con base en un número muy grande de mediciones
previas de otras vigas, que la población de las fuerzas de corte es aproximadamente normal,
con desviación estándar s ⫽ 180.0 kN. Encuentre un intervalo de confianza de 99% para la
media de la fuerza de corte.
Solución
–
Se calcula X ⫽ 668.27. No se necesita calcular s, porque se conoce la desviación estándar poblacional s. Dado que se quiere un intervalo de confianza de 99%, α/2 ⫽ 0.005. Ya que se
conoce s, se utiliza zα/2 ⫽ z0.005, en lugar de un valor de t de Student, para calcular el intervalo de confianza. De la tabla z se obtiene z0.005 ⫽ 2.58. El intervalo de confianza es 668.27
—
⫾ (2.58)(180.0)/15 , o (548.36, 788.18).
Es importante recordar que cuando el tamaño muestral es pequeño, la población debe
ser aproximadamente normal, se conozca o no la desviación estándar.
5.3
329
Intervalos de confianza para la media poblacional con muestras pequeñas
Resumen
Sea Xl, . . . , Xn una muestra aleatoria (de cualquier tamaño) de una población normal
con media m. Si se conoce la desviación estándar s, entonces un intervalo de confianza de nivel 100(1 ⫺ α)% es
σ
X ± zα/2 √
n
(5.12)
En ocasiones se tiene un solo valor que se muestrea de una población normal con desviación estándar conocida. En estos casos se puede obtener un intervalo de confianza para m
y deducir como un caso especial de la expresión (5.12) al hacer n ⫽ 1.
Resumen
Sea X un solo valor que se muestrea de una población normal con media m. Si
se conoce la desviación estándar s, entonces un intervalo de confianza de nivel
100(1 ⫺ α)% para m es
X ± zα/2 σ
(5.13)
Ejercicios para la sección 5.3
1. Determine el valor de tn ⫺ l, α/2 necesario para construir un
intervalo de confianza de dos lados de un nivel específico
con los siguientes tamaños muestrales:
c) t ⫽ 1.729, tamaño muestral 20.
d ) t ⫽ 3.707, tamaño muestral 7.
e) t ⫽ 3.707, tamaño muestral 27.
a) Nivel 90%, tamaño muestral 9.
b) Nivel 95%, tamaño muestral 5.
c) Nivel 99%, tamaño muestral 29.
d) Nivel 95%, tamaño muestral 2.
2. Determine el valor de tn ⫺ l, α necesario para construir un límite superior o inferior de confianza en cada uno de los casos del ejercicio 1.
3. Determine el nivel de confianza para un intervalo de dos lados que está basado en el valor dado de tn ⫺ l, α/2 y el tamaño muestral específico.
a) t ⫽ 2.179, tamaño muestral 13.
b) t ⫽ 3.365, tamaño muestral 6.
4. Verdadero o falso: La distribución t de Student se puede utilizar para construir un intervalo de confianza para la media
de cualquier población, en tanto que el tamaño muestral sea
pequeño.
5. El artículo “Ozone for Removal of Acute Toxicity from
Logyard Run-off” (M. Zenaitis y S. Duff, en Ozone Science and Engineering, 2002:83-90) presenta análisis químicos del agua que escurre de aserraderos en la Columbia
Británica. Incluye seis mediciones de pH para seis muestras
de agua: 5.9, 5.0, 6.5, 5.6, 5.9, 6.5. Suponiendo que éstas
sean una muestra aleatoria de las muestras de agua de una
población aproximadamente normal, encuentre un intervalo
de confianza de 95% para la media del pH.
330
CAPÍTULO 5
Intervalos de confianza
6. Los siguientes son resúmenes estadísticos para un conjunto de datos. ¿Sería adecuado utilizar la distribución t de Student para
construir un intervalo de confianza de estos datos? Explique.
N
10
Mean
8.905
Median
6.105
TrMean
6.077
Minimum
0.512
Maximum
39.920
Q1
1.967
Q3
8.103
7. El artículo “An Automatic Visual System for Marble Tile
Classification” (L. Carrino, W. Polini, y S. Turchetta, en
Journal of Engineering Manufacture, 2002:1095-1108)
describe una medida para la sombra del azulejo de mármol
en el cual la cantidad de luz reflejada por éste se mide en
una escala de 0-255. Un azulejo perfectamente negro no refleja luz alguna y mide 0, y un azulejo perfectamente blanco mediría 255. Se midió una muestra de nueve azulejos
Mezza Perla, con los siguientes resultados:
204.999
206.343
206.149
203.496
202.102
206.676
207.048
205.831
203.496
¿Es adecuado utilizar la estadística t de Student para construir un intervalo de confianza de 95% para la media de la
sombra del azulejo Mezza Perla? Si es así, hágalo. Si no,
explique por qué.
8. Una química hizo ocho mediciones independientes del punto de fusión del tungsteno. Obtuvo una media muestral de
3 410.14°C y una desviación estándar muestral de 1.018°C.
a) Determine un intervalo de confianza de 95% para el
punto de fusión del tungsteno.
b) Determine un intervalo de confianza de 98% para el
punto de fusión del tungsteno.
c) Si las ocho mediciones hubieran sido 3 409.76, 3 409.80,
3 412.66, 3 409.79, 3 409.76, 3 409.77, 3 409.80 y
3 409.78 ¿serían válidos los intervalos de confianza que
se encuentran en los incisos a) y b)? Explique.
9. Se hacen ocho mediciones independientes del diámetro de
un pistón. Las mediciones (en pulgadas) son 3.236, 3.223,
3.242, 3.244, 3.228, 3.253, 3.253 y 3.230.
a) Realice un diagrama de puntos de los ocho valores.
b) ¿Se debe utilizar la curva t para encontrar un intervalo
de confianza de 99% para el diámetro de este pistón? Si
es así, encuentre el intervalo de confianza. Si no, explique por qué.
c) Se toman ocho mediciones independientes del diámetro
de otro pistón. Las mediciones en este momento son
StDev
9.690
SE Mean
3.064
3.295, 3.232, 3.261, 3.248, 3.289, 3.245, 3.576 y 3.201.
Realice un diagrama de puntos de estos valores.
d) ¿Se debe utilizar la curva t para encontrar un intervalo
de confianza de 95% para el diámetro de este pistón? Si
es así, encuentre el intervalo de confianza. Si no, explique por qué.
10. Se toman cinco mediciones de la clasificación de octano para un tipo especial de gasolina. Los resultados (en %) son
87.0, 86.0, 86.5, 88.0, 85.3. Encuentre un intervalo de confianza de 99% para la media de la clasificación de octano de
media para este tipo de gasolina.
11. Un modelo de transferencia de calor de un cilindro sumergido en un líquido predice que el coeficiente de transferencia de calor para el cilindro es constante en razones muy
bajas de circulación del fluido. Se toma una muestra de diez
mediciones. Los resultados, en W/m2K, son
13.7
14.1
12.0
14.4
13.1
12.2
14.1
11.9
13.1
11.8
Determine un intervalo de confianza de 95% para el coeficiente de transferencia de calor.
12. Los tensioactivos son agentes químicos, como detergentes,
que bajan la tensión superficial de un líquido. Son importantes en la limpieza de suelos contaminados. En un experimento para determinar la eficacia de cierto método para
retirar tolueno de arena, esta última fue lavada con un agente tensioactivo, y luego enjuagada con agua desionizada. Es
importante la cantidad de tolueno que sale en el enjuague.
En cinco de estos experimentos, las cantidades de tolueno
eliminado en el ciclo de enjuague, expresado como porcentaje de la cantidad total originalmente presente, fueron de
5.0, 4.8, 9.0, 10.0 y 7.3. Determine el intervalo de confianza
de 95% para el porcentaje de tolueno eliminado en el enjuague. (Este ejercicio está basado en el artículo “Laboratory
Evaluation of the Use of Surfactants for Ground Water Remediation and the Potential for Recycling Them” D. Lee, R.
Cody, y B. Hoyle, en Ground Water Monitoring and Remediation, 2001:49-57.)
5.4
331
Intervalos de confianza para la diferencia entre dos medias
13. En un experimento para medir la razón de absorción de pesticidas a través de la piel, 500 mg de uniconazol se aplicó a la piel
de cuatro ratas. Después de diez horas, las cantidades absorbidas (en mg) fueron 0.5, 2.0, 1.4 y 1.1. Encuentre un intervalo de
confianza de 90% para la media de la cantidad absorbida.
14. El siguiente resultado de MINITAB presenta un intervalo de confianza para una media poblacional.
One-Sample T: X
Variable
X
N
10
Mean
6.59635
StDev
0.11213
SE Mean
0.03546
95% CI
(6.51613, 6.67656)
a) ¿Cuántos grados de libertad tiene la distribución t de Student?
b) Utilice la información en el resultado, junto con la tabla t, para calcular un intervalo de confianza de 99 por ciento.
15. El siguiente resultado de MINITAB presenta un intervalo de confianza para una media poblacional, pero algunos de los números están borrosos y son ahora ilegibles. Complete los números faltantes para (a), (b) y (c).
One-Sample T: X
Variable
X
N
20
Mean
2.39374
StDev
(a)
SE Mean
0.52640
99% CI
( (b), (c) )
16. La concentración de monóxido de carbono (CO) en una muestra de gas se mide con un espectrómetro y se encuentra que es de
85 ppm. A partir de la gran experiencia con este instrumento, se cree que sus mediciones no tienen sesgos y se distribuyen normalmente, con incertidumbre (desviación estándar) de 8 ppm. Determine un intervalo de confianza de 95% para la concentración de CO en esta muestra.
5.4
Intervalos de confianza para la diferencia
entre dos medias
Ahora se tratan ejemplos en los que se desea calcular la diferencia entre las medias de dos poblaciones. Los datos constarán de dos muestras, una para cada población. La idea básica es
simple. Se calculará la diferencia de las medias muestrales y la desviación estándar de esa diferencia. Entonces una modificación simple de la expresión (5.1) (de la sección 5.1) proporcionará el intervalo de confianza. El método que se describe está basado en los resultados que
se relacionan con la suma y la diferencia de dos variables aleatorias normales independientes
que se presentaron en la sección 4.5. Aquí se repasan estos resultados:
Sean X y Y independientes, con X ⬃ N(mX, sX2 ) y Y ⬃ N(mY, sY2). Entonces
X ⫹ Y ⬃ N(mX ⫹ mY, sX2 ⫹ sY2)
(5.14)
X ⫺ Y ⬃ N(mX ⫺ mY, sX2 ⫹ sY2)
(5.15)
332
CAPÍTULO 5
Intervalos de confianza
Ahora se verá cómo construir un intervalo de confianza para la diferencia entre dos medias poblacionales. Como ejemplo, suponga que se ha estado desarrollando un diseño nuevo
de foco que se piensa durará más que el diseño viejo. Una muestra aleatoria simple de 144 focos nuevos tiene un tiempo de vida promedio de 578 horas y una desviación estándar de 22
horas. Una muestra aleatoria simple de 64 focos viejos tiene tiempo de vida promedio de 551 horas y desviación estándar de 33 horas. Las muestras son independientes, de tal manera que los
tiempos de vida para una muestra no influyen sobre los tiempos de vida de la otra. Se quiere
encontrar un intervalo de confianza de 95% para la diferencia entre la media de los tiempos
de vida de los focos de los dos diseños.
Se inicia por traducir el problema en el lenguaje estadístico. Se tiene una muestra aleatoria simple X1, . . . , X144 de los tiempos de vida de los focos nuevos. La media muestral es
–
X ⫽ 578 y la desviación estándar muestral es sX ⫽ 22. Se tiene otra muestra aleatoria simple
–
Y1, . . . , Y64 de los tiempos de vida de los focos viejos. Esta muestra tiene una media Y ⫽ 551
y desviación estándar sY ⫽ 33. Las medias poblacionales y las desviaciones estándares no se
conocen. Se denota a la media poblacional de los tiempos de vida de los nuevos focos por mX
y la media poblacional de los focos viejos por mY. Se denota las correspondientes desviaciones estándares por sX y sY. Se tiene interés en la diferencia mX ⫺ mY.
Se puede construir el intervalo de confianza para mX ⫺ mY determinando la distribución
–
–
–
X ⫺ Y . Mediante el teorema del límite central, X proviene de una distribución normal con me—
–
dia mX y desviación estándar sX/144 , y Y proviene de una distribución normal con media mY
—
y desviación estándar sY/64 . Dado que las muestras son independientes, se tiene por medio
–
–
de la expresión (5.15) que la diferencia X ⫺ Y proviene de una distribución normal con media mX ⫺ mY y varianza sX—2 ⫺ Y— ⫽ sX2 /144 ⫹ sY2 /64. La figura 5.13 muestra la distribución de
–
–
X ⫺ Y e indica que 95% intermedio de la curva tiene un ancho ⫾ 1.96s X— ⫺ Y—.
95%
⫺
mX ⫺ mY ⫺ 1.96s⫺
X⫺Y
mX ⫺ mY
–
⫺
mX ⫺ mY ⫹ 1.96s⫺
X⫺Y
–
FIGURA 5.13 La diferencia observada X ⫺ Y ⫽ 27
se extrae de una distribución normal
con media mX ⫺ mY y desviación estándar σX−Y =
σX2 /144 + σY2 /64.
Al estimar las desviaciones estándares poblacionales sX y sY con las
desviaciones
estánp
dares muestrales sX ⫽ 22 y sY ⫽ 33, respectivamente, se estima σX−Y ≈ 222 /144+332 /64
⫽ 4.514. Por tanto, el intervalo de confianza de 95% para mX ⫺ mY es 578 ⫺ 551 ⫾ 1.96(4.514),
o 27 ⫾ 8.85.
5.4
Intervalos de confianza para la diferencia entre dos medias
333
Resumen
Sea X1, . . . , XnX una muestra aleatoria grande de tamaño nX de una población con media mX y desviación estándar sX, y sea Y1, . . . , YnY una muestra aleatoria simple grande de tamaño nY de una población con media mY y desviación estándar sY. Si las dos
muestras son independientes, con un intervalo de confianza de nivel 100(1 ⫺ α)% para
mX ⫺ mY es
σ2
σX2
(5.16)
X − Y ± zα/2
+ Y
nX
nY
Cuando los valores de sX y sY son desconocidos, se pueden sustituir con las desviaciones estándares muestrales sX y sY.
Ejemplo
5.23
La composición química del suelo varía con la profundidad. El artículo “Sampling Soil Water
in Sandy Soils: Comparative Analysis of Some Common Methods” (M. Ahmed, M. Sharma
y colaboradores, en Communications in Soil Science and Plant Analysis, 2001:1677-1686)
describe análisis químicos del suelo tomado de una granja en Australia occidental. Se toman
50 muestras a profundidades de 50 y 250 cm. A una profundidad de 50 cm, la concentración
promedio de NO3 (en mg/l) era de 88.5 con una desviación estándar de 49.4. A una profundidad de 250 cm, la concentración promedio era de 110.6 con una desviación estándar de
51.5. Determine un intervalo de confianza de 95% para la diferencia entre las concentraciones de NO3 a las dos profundidades.
Solución
Sean X1, . . . , X50 las concentraciones de 50 muestras tomadas a 50 cm y sean Y1, . . . , Y50 las
–
–
concentraciones de 50 muestras tomadas a 250 cm. Entonces X ⫽ 88.5, Y ⫽ 110.6, sX ⫽ 49.4
y sY ⫽ 51.5. Los tamaños muestrales son nX ⫽ nY ⫽ 50. Ambas muestras son grandes, por lo
que se puede utilizar la expresión (5.16). Como consecuencia de que se quiere un intervalo de
confianza de 95%, zα/2 ⫽1.96. El intervalo de confianza de 95% para la diferencia mY ⫺ mX
es 110.6 ⫺ 88.5 ⫾ 1.96 49.42 /50 + 51.52 /50, o 22.1 ⫾ 19.8.
Ejercicios para la sección 5.4
1. Se están comparando los puntos de fusión de dos aleaciones.
Se fusionaron 35 ejemplares de la aleación 1. La temperatura promedio de fusión fue de 517.0°F y la desviación estándar fue de 2.4°F. Se fusionaron 47 ejemplares de la aleación
2. La temperatura promedio fue de 510.1°F y la desviación
estándar fue 2.1°F. Determine un intervalo de confianza de
99% para la diferencia entre los puntos de fusión.
2. En un experimento para determinar el efecto de la temperatura en la tasa de deposición del tungsteno sobre placas de
silicio, se procesaron 64 placas a 400°C y se procesaron 88
placas a 425°C. La tasa de deposición promedio para las
placas procesadas a 400°C fue de 1 840 Å/min, con una
desviación estándar de 244 Å/min. Las placas procesadas a
425°C promedian 2 475 Å/min, con desviación estándar de
334
CAPÍTULO 5
Intervalos de confianza
760 Å/min. Determine un intervalo de confianza de 95%
para la diferencia entre las medias de las tasas de deposición.
3. El artículo “Vehicule-Arrival Characteristics at Urban Uncontrolled Intersections” (V. Rengeraju y V. Rao, en Journal of Transportation Engineering, 1995:317-323) presenta
datos de las características del tránsito en diez cruceros en
Madras, India. En un crucero específico, la rapidez promedio para una muestra de 39 automóviles era de 26.50 km/h,
con desviación estándar de 2.37 km/h. La rapidez promedio
para una muestra de 142 motocicletas era de 37.14 km/h,
con desviación estándar de 3.66 km/h. Determine un intervalo de confianza de 95% para la diferencia entre las medias de la rapidez de las motocicletas y de los automóviles.
4. Se realizó un análisis de tensión en muestras aleatorias de
uniones pegadas con resina epoxídica de dos clases de madera. Una muestra aleatoria de 120 uniones de la clase A tuvo
una media de tensión de corte de 1 250 psi y una desviación
estándar de 350 psi, y una muestra aleatoria de 90 uniones
de la clase B tuvo una media de tensión de corte de 1 400 psi
y una desviación estándar de 250 psi. Encuentre un intervalo de confianza de 98% para la diferencia en las medias de
la tensión de corte de las dos clases.
7. En un estudio del efecto de tasa de enfriamiento en la dureza de uniones soldadas, se enfriaron 50 soldaduras a tasa de
10°C/s que tenían un promedio de dureza de Rockwell (B)
de 91.1 y desviación estándar de 6.23, y se enfriaron 40 soldaduras a tasa de 30°C/s que tenían una media de 90.7 y
desviación estándar de 4.34.
a) Determine un intervalo de confianza de 95% para la diferencia en la dureza entre las soldaduras enfriadas a las
tasas diferentes.
b) Alguien dice que la tasa de enfriamiento no tiene ningún
efecto sobre la dureza. ¿Estos datos contradicen dicha
afirmación? Explique.
8. Con referencia al ejercicio 7 se hacen diez soldaduras más
para incrementar la precisión del intervalo de confianza.
¿En cuánto se incrementaría la precisión, enfriando las diez
soldaduras a una tasa de 10°C/s, enfriando las diez soldaduras a una tasa de 30°C/s, o enfriando cinco soldaduras a
10°C/s y cinco a 30°C/s? Explique.
5. En un estudio para comparar dos inhibidores de corrosión
diferentes, se sumergieron especímenes de acero inoxidable
durante cuatro horas en una disolución que contenía ácido
sulfúrico y un inhibidor de corrosión. Cuarenta y siete especímenes en presencia del inhibidor A tenían media de la
pérdida de peso de 242 mg y desviación estándar de 20 mg, y
42 especímenes en presencia del inhibidor B tenían media
de pérdida de peso de 220 mg y desviación estándar de 31 mg.
Determine un intervalo de confianza de 95% para la diferencia en la media de pérdida de peso de los dos inhibidores.
9. El artículo “The Prevalence of Daytime Napping and Its
Relationship to Nighttime Sleep” (J. Pilcher, K. Michalkowski, y R. Canigan), en Behavioral Medicine, 2001:7176) presenta resultados de un estudio de hábitos de sueño en
gran número de personas. En una muestra de 87 adultos jóvenes, el promedio del tiempo por día que pasan en cama
(ya sea despiertos o dormidos) fue de 7.70 horas, con desviación estándar de 1.02 horas, y el promedio del tiempo
pasado en cama durmiendo fue de 7.06 horas, con desviación estándar de 1.11 horas. La media del tiempo pasado en
cama despierto se calculó de 7.70 ⫺ 7.06 ⫽ 0.64 horas. ¿Es
posible calcular un intervalo de confianza de 95% por la
media del tiempo pasado en la cama despierto? Si es así,
construya el intervalo de confianza. Si no es posible, explique por qué.
6. Un ingeniero eléctrico desea comparar las medias de los
tiempos de vida de dos tipos de transistores en una aplicación que implica un desarrollo a alta temperatura. Se probó
una muestra de 60 transistores del tipo A y se encontró que
tenía media de tiempos de vida de 1 827 horas y desviación
estándar de 168 horas. Se probó una muestra de 180 transistores del tipo B y se encontró que tenía media de tiempos de
vida de 1 658 horas y desviación estándar de 225 horas. Determine un intervalo de confianza de 95% para la diferencia
entre las medias de los tiempos de vida de los dos tipos de
transistores.
10. El artículo “Occurrence and Distribution of Ammonium in
Iowa Groundwater” (K. Schilling, en Water Environment
Research, 2002:177-186) describe las mediciones de las
concentraciones de amonio (en mg/l) para gran número de
pozos en Iowa. Éstos incluían 349 pozos aluviales y 143 pozos cuaternarios. Las concentraciones en los pozos aluviales promediaban 0.27 con desviación estándar de 0.40 y los
pozos cuaternarios promediaban 1.62 con desviación estándar de 1.70. Determine un intervalo de confianza de 95%
para la diferencia en las medias de las concentraciones de
los pozos aluviales y los cuaternarios.
5.5
5.5
Intervalos de confianza para la diferencia entre dos proporciones
335
Intervalos de confianza para la
diferencia entre dos proporciones
En una población de Bernoulli, la media es igual a la probabilidad p de éxito, que es la proporción de éxitos en la población. Cuando se realizan ensayos independientes de cada una de
las dos poblaciones de Bernoulli, es posible utilizar métodos similares a los que se presentó
en la sección 5.4 con el fin de encontrar un intervalo de confianza para la diferencia entre las
dos probabilidades de éxito. Se presenta un ejemplo para explicarlo.
Dieciocho de 60 camiones ligeros producidos en la línea de montaje A tenían un defecto en el mecanismo de dirección, que se tenían que reparar antes de enviarlos. Solamente 16
camiones de los 90 producidos en la línea de montaje B tenían este defecto. Suponga que estos camiones se pueden considerar como dos muestras aleatorias simples independientes de los
camiones fabricados en las dos líneas de montaje. Se desea determinar un intervalo de confianza de 95% para la diferencia entre las proporciones de camiones con este defecto en las dos líneas de montaje.
Ésta es una situación en la que se tendría que tener cuidado de asegurarse de que es razonable considerar que los datos sean muestras aleatorias simples. Elegir camiones secuencialmente de la línea no podría ser una buena idea, por ejemplo, si hay fluctuaciones
sistemáticas en la calidad en el tiempo. Se supondrá que el muestreo se ha hecho con un procedimiento bien planeado y adecuado.
Para construir el intervalo de confianza se procede en forma similar a la de la sección
5.4, al sustituir a las medias con las proporciones. Sea pX la proporción de camiones en la población de la línea A que tenían el defecto, y sea pY la proporción correspondiente de la línea
B. Los valores de pX y pY son desconocidos. Se desea encontrar un intervalo de confianza de
95% para pX ⫺ pY.
Sea X el número de camiones en la muestra de la línea A que tenía defectos y sea Y
el número correspondiente de la línea B. Entonces X es una variable aleatoria binomial con
nX ⫽ 60 ensayos y probabilidad de éxito pX, y Y es una variable aleatoria binomial con nY ⫽
90 ensayos y probabilidad de éxito pY. Las proporciones muestrales son p̂X y p̂Y. En este ejemplo los valores observados son X ⫽ 18, Y ⫽ 16, p̂X ⫽ 18/60 y p̂Y ⫽ 16/90. En virtud de que
los tamaños muestrales son grandes, se tiene por el teorema del límite central que p̂X y p̂Y están ambas distribuidas aproximadamente en forma
√ normal con medias pX y pY y desviaciones
√
estándares σpX = pX (1 − pX )/nX y σpY = pY (1 − pY )/nY . Por consecuencia, la diferencia p̂X ⫺ p̂Y tiene una distribución normal con media pX ⫺ pY y desviación estándar
√
pX (1 − pX )/nX + pY (1 − pY )/nY . Se concluye que para 95% de todas las muestras posibles, la diferencia pX ⫺ pY satisface la siguiente desigualdad:
pX (1 − pX ) pY (1 − pY )
X − p
Y − 1.96
+
p
nX
nY
< pX − p Y <
pX (1 − pX ) pY (1 − pY )
(5.17)
X − p
Y + 1.96
p
+
nX
nY
La
√ expresión 5.17 no es un intervalo de confianza, ya que las cantidades expresadas como:
pX (1 − pX )/nX + pY (1 − pY )/nY dependen de los valores verdaderos desconocidos pX y
336
CAPÍTULO 5
Intervalos de confianza
pY. El punto de vista tradicional
es sustituir pX y pY con p̂X y p̂Y, produciendo el intervalo de
confianza p̂X ⫺ p̂Y ⫾ zα/2 p
X (1 − p
X )/nX + p
Y (1 − p
Y )/nY . Investigaciones recientes han
mostrado que este intervalo se puede mejorar modificando un poco a nX, nY, p̂X y p̂Y. Simplemente se suma 1 a cada uno de los números de éxitos de X y Y, y se suma 2 a cada uno de los
números de ensayos nX y nY. Por lo que, se definen ⬃
n X ⫽ nX ⫹ 2, ⬃
n Y ⫽ nY ⫹ 2, ⬃
p X ⫽ (X ⫹
⬃
⬃
⬃
⬃
⬃
1)/
n
,
y
p
⫽
(Y
⫹
1)/
n
.
El
intervalo
de
confianza
de
95%
es
p
⫺
p Y ⫾ zα/2
X
Y
Y
X
⬃
⬃
⬃
X (1 − p
X )/
Y (1 − p
Y )/
p
nX + p
nY . En este ejemplo, n X ⫽ 62, n Y ⫽ 92, p X ⫽ 19/62 ⫽
0.3065, y ⬃
p Y ⫽ 17/92 ⫽ 0.1848. Por tanto, se obtiene 1.3065 ⫺ 0.848 ⫾ 0.1395, o (⫺0.0178,
0.2612).
Para obtener un intervalo de confianza de nivel 100(1 ⫺ α) el intervalo de confianza,
sustituya 1.96 con zα/2. Aunque se justifica este intervalo de confianza usando el teorema del
límite central, que supone que nX y nY son grandes, se ha encontrado que este método da buenos resultados para casi todos los tamaños muestrales.
Resumen
Sea X el número de éxitos en nX ensayos de Bernoulli independientes con probabilidad
de éxito pX, y sea Y el número de éxitos en nY ensayos de Bernoulli independientes
con probabilidad de éxito pY, tal que X ⬃ Bin(nX, pX) y Y ⬃ Bin(nY, pY). Se define
⬃
n X ⫽ nX ⫹ 2, ⬃
n Y ⫽ nY ⫹ 2, ⬃
p X ⫽ (X ⫹ 1)/ ⬃
nX y ⬃
p Y ⫽ (Y ⫹ 1)/ ⬃
n Y.
Entonces un intervalo de confianza de nivel 100(1 ⫺ α)% para la diferencia
pX ⫺ pY es
X (1 − p
X ) p
Y (1 − p
Y )
p
X − p
Y ± zα/2
p
+
(5.18)
nX
nY
Si el límite inferior del intervalo de confianza es menor que ⫺1, sustituya éste con ⫺1.
Si el límite superior del intervalo de confianza es mayor que 1, sustituya éste con 1.
El ajuste que aquí se ha descrito para el intervalo de confianza de dos muestras es similar al que se describió en la sección 5.2 para el intervalo de confianza de una muestra. En ambas casos, se ha agregado un total de dos éxitos y cuatro ensayos. Para el caso de dos
muestras, éstos se han dividido entre las muestras, así que se ha agregado un éxito y dos ensayos a cada muestra. Para el caso de una muestra, se han agregado dos éxitos y cuatro ensayos a una muestra. El intervalo de confianza dado por la expresión (5.18) puede ser llamado
intervalo de Agresti-Caffo, después de que lo desarrollaran Alan Agresti y Brian Caffo. Para
mayor información acerca de este intervalo de confianza consulte el artículo “Simple and Effective Confidence Intervals for Proportions and Differences of Proportions Result from Adding Two Successes and Two Failures” (A. Agresti y B. Caffo, en The American Statistician,
2000:280-288).
Ejemplo
5.24
Los métodos para calcular la fuerza y requerimientos de la dureza deben ser conservadores,
de tal forma que deben sobreestimar en vez de subestimar. La tasa de éxitos de este método
5.5
Intervalos de confianza para la diferencia entre dos proporciones
337
se puede medir con la probabilidad de una sobreestimación. El artículo “Discrete Bracing
Analysis for Light-Frame Wood-Truss Compression Webs” (M. Waltz, T. McLain y cols., en
Journal of Structural Engineering, 2000:1086-1093) presenta los resultados de un experimento que se evaluó con un método usual (el método de Plaut) para calcular la fuerza de soporte
para una red de soportes de compresión. En una muestra de 380 columnas cortas de prueba
(cuatro a seis pies en longitud), el método sobreestimó la fuerza para 304 de ellas, y en una
muestra de 394 columnas largas de prueba (ocho a diez pies en longitud), el método sobreestimó la fuerza para 360 de ellas. Determine un intervalo de confianza de 95% para la diferencia entre las tasas de éxito para columnas largas y columnas cortas.
Solución
El número de éxitos en la muestra de columnas cortas es X ⫽ 304 y el número de éxitos en
la muestra de columnas largas es Y ⫽ 360. Los números de ensayos son nX ⫽ 380 y nY ⫽ 394.
Se calcula ⬃
n X ⫽ 382, ⬃
n Y ⫽ 396, ⬃
p X ⫽ (304 ⫹ 1)/382 ⫽ 0.7984, y ⬃
p Y ⫽ (360 ⫹ 1)/396 ⫽
0.9116.
El
valor
de
z
es
1.96.
El
intervalo
de
confianza
de
95%
es
0.9116
⫺ 0.7984 ⫾ 1.96
α/2
√
(0.7984)(0.2016)/382 + (0.9116)(0.0884)/396, o 0.1132 ⫾ 0.0490.
El método tradicional
Muchas personas usan el método tradicional para calcular intervalos de confianza para la diferencia entre proporciones. Este método utiliza las proporciones muestrales p̂X y p̂Y y los tamaños muestrales verdaderos nX y nY. El método tradicional da los resultados muy similares
a los del método moderno que se acaba de describir para tamaños muestrales grandes o moderadamente grandes. Para tamaños muestrales pequeños, sin embargo, el intervalo de confianza tradicional falla para lograr que contenga la probabilidad; en otras palabras, el intervalo
de confianza de nivel 100(1 ⫺ α)% calculado por el método tradicional contiene el valor verdadero menos del 100(1 ⫺ α)% de las veces.
Resumen
El método tradicional para calcular los intervalos de confianza para la diferencia entre proporciones (ampliamente usado pero no recomendado)
Sea p̂X la proporción de éxitos en un número grande nX de ensayos de Bernoulli independientes con probabilidad de éxito pX, y sea p̂Y la proporción de éxitos en un número grande nY de ensayos de Bernoulli independientes con probabilidad de éxito pY. Entonces el intervalo de confianza de nivel 100(1 ⫺ α)% tradicional para pX ⫺ pY es
X ) p
X (1 − p
Y (1 − p
Y )
p
p
X − p
Y ± zα/2
+
(5.19)
nX
nY
Este método no se puede utilizar a menos que ambas muestras contengan al menos
diez éxitos y diez fracasos.
338
CAPÍTULO 5
Intervalos de confianza
Ejercicio para la sección 5.5
1. En una prueba del efecto de la humedad en conexiones eléctricas, se probaron 100 conexiones eléctricas bajo condiciones
húmedas y 150 en condiciones secas. Veinte de las primeras
fallaron y sólo diez de las segundas no pasaron la prueba.
Determine un intervalo de confianza de 90% para la diferencia entre las proporciones de las conexiones que fallaron, húmedas y secas.
2. La especificación para la resistencia de tensión de un alambre que conecta un circuito integrado a su marco es de 10 g
o más. En una muestra de 85 unidades hechas con alambres
de oro, 68 satisfacen la especificación, y en una muestra de
120 unidades elaboradas con alambres de aluminio, 105
cumplen el requerimiento. Determine un intervalo de confianza de 95% para la diferencia en las proporciones de unidades que satisfacen las especificaciones entre unidades con
alambre de oro y aquellas con alambre de aluminio.
3. En una muestra aleatoria de 340 automóviles conducidos en
altitudes bajas, 46 produjeron más de 10 g de contaminación
de masa particulada por galón de combustible consumido.
En una muestra aleatoria de 85 automóviles conducidos en
altitudes altas, 21 contaminaron en las mismas circunstancias. Determine un intervalo de confianza de 98% para la
diferencia entre las proporciones para vehículos a alta y baja altitudes.
4. De 1 200 piezas de grava de una planta, 110 piezas se clasificaron como “grandes”. De 900 piezas de otra planta, 95 también lo fueron. Determine un intervalo de confianza de 99%
para la diferencia entre las proporciones de piezas de grava
grandes producidas en las dos plantas.
5. Se comparan dos procesos para fabricar cierto microchip. Se
seleccionó una muestra de 400 chips de un proceso menos
costoso, donde 62 estaban defectuosos. Se seleccionó una
muestra de 100 chips de un proceso más costoso, pero 12
tenían defecto.
a) Determine un intervalo de confianza de 95% para la diferencia entre las proporciones de los chips defectuosos
producidos por los dos procesos.
b) Con la finalidad de aumentar la precisión del intervalo
de confianza, se muestrearon más chips. Se están considerando tres planes de muestreo de igual costo. En el
primer plan se probarán 100 chips más del proceso menos costoso. En el segundo se observaron 50 más del
proceso más costoso. En el tercer plan se probaron 50
del menos costoso y 25 del más costoso. ¿Qué plan es
más probable que proporcione el aumento más grande
en la precisión del intervalo de confianza? Explique.
6. El artículo “Occurrence and Distribution of Ammonium in
Iowa Groundwater” (K. Schilling, en Water Environment
Research, 2002:177-186) describe mediciones de concentraciones de amonio (en mg/l) en gran número de pozos en
Iowa. Éstos incluían 349 pozos aluviales y 143 cuaternarios. De los primeros, 182 tenían concentraciones arriba de
0.1, y 112 de los segundos tenían concentraciones superiores a 0.1. Determine un intervalo de confianza de 95% para
la diferencia entre las proporciones de dos tipos de pozos
con concentraciones arriba de 0.1.
7. El artículo referido en el ejercicio 9 en la sección 5.2 describe un experimento en el que 42 muestras de lixiviado
fueron probadas para la presencia de algunos contaminantes, donde 26 contenían niveles detectables de plomo y 32
de cromo. ¿Es posible utilizar los métodos de esta sección
para encontrar un intervalo de confianza de 95% para la diferencia entre la probabilidad de que una muestra contendrá
alguna cantidad detectable de plomo y cromo? Si es así, encuentre el intervalo de confianza. Si no, explique.
8. El artículo “Case Study Based Instruction of DOE and
SPC” (J. Brady y T. Allen, en The American Statistician,
2002:312-315) describe un esfuerzo de un equipo de ingeniería para reducir la tasa de defectos en la fabricación de un
tablero específico de circuitos impresos. El equipo determinó reconfigurar el pozo de calor del transistor. Se fabricaron
1 500 tableros a la semana antes de que se implementara la
reconfiguración, y 345 de éstos estaban defectuosos. Asimismo, se hicieron 1 500 tableros una semana después de la
reconfiguración, y 195 de éstos tenían defectos. Determine
un intervalo de confianza de 95% para el decrecimiento de
la tasa de defectos después de la reconfiguración.
9. Compras repetidas es una buena medida de la satisfacción
del cliente. Al final de año, un distribuidor de suministros
de computadora extrajo una muestra de 120 cuentas y encontró que 56 habían ordenado un pedido más de una vez.
Después lo hizo con 80 cuentas del año anterior, de éstas 30
habían ordenado un pedido más de una vez. Encuentre un
intervalo de confianza de 95% para la diferencia entre las
dos proporciones de clientes que ordenaron más de una vez.
10. El artículo “Accidents on Suburban Highways-Tennessee’s
Experience” (R. Margiotta y A. Chatterjee, en Journal of
Transportation Engineering, 1995:255-261) compara tasas
de accidentes de tránsito en intersecciones con medianas
5.6
Intervalos de confianza para la diferencia entre dos medias con pequeñas muestras
elevadas con tasas en intersecciones con doble sentido y
vuelta a la izquierda. De 4 644 accidentes en el primer tipo
de intersecciones, 2 280 eran en la parte trasera, y de 4 584
accidentes del segundo tipo, 1 982 presentaban esta última
condición. Suponiendo que éstas sean muestras aleatorias
de accidentes de dos tipos de intersecciones, determine un
intervalo de confianza de 90% para la diferencia entre las
proporciones de accidentes que son del tipo de parte trasera en los dos tipos de intersecciones.
339
1)/(365 ⫹ 2) ⫽ 0.22, (63 ⫹ 1)/(365 ⫹ 2) ⫽ 0.17, y propone calcular un intervalo de confianza de 95% para la diferencia entre las proporciones de días que nieva en las dos
ciudades; así:
0.22 ⫺ 0.17 ⫾ 1.96
(0.22)(0.78) (0.17)(0.83)
+
367
367
¿Es éste un intervalo de confianza válido? Explique.
11. En cierto año, había 80 días con nevadas medibles en Denver, y 63 días en Chicago. Un meteorólogo calcula (80 ⫹
5.6
Intervalos de confianza para la diferencia
entre dos medias con pequeñas muestras
La distribución t de Student se puede utilizar en algunos casos donde las muestras son pequeñas y, por tanto, donde no es aplicable el teorema del límite central. Se presenta un ejemplo.
Una muestra de seis soldaduras de un tipo tenía promedio de prueba final de resistencia (en ksi) de 83.2 y desviación estándar de 5.2, y una muestra de diez soldaduras de otro tipo tenía resistencia promedio de 71.3 y desviación estándar de 3.1. Suponga que ambos
conjuntos de soldaduras son muestras aleatorias de poblaciones normales. Se desea encontrar
un intervalo de confianza de 95% para la diferencia entre las medias de las resistencias de los
dos tipos de soldaduras.
Ambos tamaños muestrales son pequeños, por lo que no es aplicable el teorema del límite central. Si ambas poblaciones son normales, la distribución t de Student se puede utilizar
para calcular un intervalo de confianza para la diferencia entre las dos medias poblacionales.
El método es similar al que se presenta en la sección 5.4 para el caso donde las muestras son
grandes, excepto que el puntaje z se sustituye con un valor de la distribución t de Student.
Si X1, . . . , XnX es una muestra de tamaño nX de una población normal con media mX y
Y1, . . . , YnY es una muestra de tamaño nY de una población normal con media mY, entonces la
cantidad
(X − Y ) − (μX − μY )
sX2 /nX + sY2 /nY
tiene una aproximada distribución t de Student.
El número de grados de libertad a usar para esta distribución está dado por
2
sX2
sY2
+
nX
nY
ν= 2
(s 2 /nY )2
(sX /nX )2
+ Y
nX − 1
nY − 1
redondeado hacia abajo al entero más cercano. (5.20)
340
CAPÍTULO 5
Intervalos de confianza
En este ejemplo, sea X1, . . . , X6 de las seis soldaduras del primer tipo y sea Y1, . . . , Y10
las diez soldaduras del segundo tipo. Sustituyendo sX ⫽ 5.2, sY ⫽ 3.1, nX ⫽ 6, nY ⫽ 10 en la
ecuación (5.20) se obtiene
2
3.12
5.22
+
6
10
ν=
= 7.18 ≈ 7
2
2
(3.12 /10)2
(5.2 /6)
+
5
9
Si ambas poblaciones son normales, entonces la cantidad
[(X − Y ) − (μX − μY )]/
sX2 /6 + sY2 /10
tiene una distribución aproximada t de Student con siete grados de libertad. La figura 5.14
presenta esta distribución. El 95% del área bajo la curva está contenida entre los valores t ⫽
⫺2.365 y t ⫽ 2.365. En consecuencia 95% de todas las muestras que se puede haber elegido,
−2.365 <
(X − Y ) − (μX − μY )
< 2.365
sX2 /6 + sY2 /10
95%
⫺2.365
0
2.365
FIGURA 5.14 La distribución t de Student con siete grados de libertad. El 95% del área
está entre t ⫽ ⫺2.365 y t ⫽ 2.365.
Mediante el razonamiento utilizado en la sección
5.3, un intervalo de confianza de 95% para
–
–
–
–
la diferencia mX ⫺ mY es X ⫺ Y ⫾ 2.365 sX2 /6 + sY2 /10. Al sustituir X ⫽ 83.2, Y ⫽ 71.3,
sX ⫽ 5.2 y sY ⫽ 3.1, se encuentra que un intervalo de confianza de 95% para mX ⫺ mY es 11.9
⫾ 5.53, o (6.37, 17.43).
En general, para producir un intervalo de confianza de 100(1 ⫺ α)%, sea tv, α/2 el cuantil 1 ⫺ α/2 de la distribución t de Student con v grados de libertad, éste es el valor que corta
un área de α/2 en la cola del lado derecho. Por ejemplo, antes se encontró que t7, 0.025 ⫽ 2.365.
Después un intervalo de confianza de nivel 100(1 ⫺ α)% para la diferencia entre las medias
–
–
poblacionales
mX ⫺ mY, cuando los tamaños muestrales son nX y nY, respectivamente, X ⫺ Y
⫾ tv,α/2 sX2 /nX + sY2 /nY .
5.6
Intervalos de confianza para la diferencia entre dos medias con pequeñas muestras
341
Resumen
Sea X1, . . . , XnX una muestra aleatoria de tamaño nX de una población normal con media mX, y Y1, . . . , YnY una muestra aleatoria de tamaño nY de una población normal con
media mY. Suponga que las dos muestras son independientes.
Si las poblaciones no necesariamente tienen la misma varianza, un intervalo de confianza de nivel 100(1 ⫺ α)% para mX ⫺ mY es
s2
sX2
(5.21)
+ Y
X − Y ± tν,α/2
nX
nY
El número de grados de libertad, v, está dado por
2
2
sX
s2
+ Y
nX
nY
ν= 2
redondeado hacia abajo al entero más cercano.
(s 2 /nY )2
(sX /nX )2
+ Y
nX − 1
nY − 1
Ejemplo
5.25
Los compuestos con base de resina se usan en odontología restauradora. El artículo “Reduction of Polymerization Shrinkage Stress and Marginal Leakage Using Soft-Start Polymerization” (C. Ernst, N. Brand y colaboradores, en Journal of Esthetic and Restorative Dentistry,
2003:93-104) presenta una comparación de la dureza de la superficie de las muestras curadas
durante 40 segundos con fuerza constante con otra de 40 segundos con la fuerza aumentando
en forma exponencial. Quince muestras fueron curadas con cada método. Las curadas con
fuerza constante tuvieron promedio de dureza de superficie (en N/mm2) de 400.9 con desviación estándar de 10.6. Las curadas con fuerza que aumenta exponencialmente tenían una dureza de superficie promedio de 367.2 con desviación estándar de 6.1. Determine un intervalo
de confianza de 98% para la diferencia en las medias de la dureza entre las muestras curadas
por los dos métodos.
Solución
–
–
Se tiene X ⫽ 400.9, sX ⫽ 10.6, nX ⫽ 15, Y ⫽ 367.2, sY ⫽ 6.1 y nY ⫽ 15. El número de grados de libertad está dado por la ecuación (5.20) como
2
10.62
6.12
+
15
15
ν=
= 22.36 ≈ 22
2
2
(6.12 /15)2
(10.6 /15)
+
15 − 1
15 − 1
De la tabla t (tabla A.3 en el Apéndice A) se encuentra que t22, 0.01 ⫽ 2.508. Se utiliza la expresión (5.21) para encontrar que el intervalo de confianza de 98% es
400.9 − 367.2 ± 2.508 10.62 /15 + 6.12 /15, o 33.7 ± 7.9.
342
CAPÍTULO 5
Intervalos de confianza
Cuando las poblaciones tienen varianzas iguales
Ocasionalmente se presenta una situación en la que se sabe que dos poblaciones tienen varianzas casi iguales. En estos casos un método que explota este hecho se puede utilizar para
producir intervalos de confianza que son más angostos que los producidos por el método más
general descrito antes. Al igual que con el método más general, ambas poblaciones deben ser
aproximadamente normales. Se presenta un ejemplo.
Dos pesas usuales, cada una etiquetada con 100 g, son pesadas varias veces en la misma balanza. La primera se pesa durante ocho veces, y la media de la lectura de la balanza es
18.2 mg arriba de 100 g, con desviación estándar de 2.0 mg. La segunda se pesa en 18 ocasiones y la media de las lecturas es 16.4 g arriba de 100 g, con desviación estándar de 1.8 mg.
Suponga que cada conjunto de lecturas es una muestra de una población aproximadamente
normal. Debido a que se usa la misma balanza para todas las mediciones, y dado que los pesos verdaderos son aproximadamente iguales, es razonable suponer que las desviaciones estándares poblacionales de las lecturas son las mismas para ambas pesas. Se supone que las
mediciones no están sesgadas (es, en realidad, suficiente suponer que el sesgamiento es el
mismo para ambas pesas). Se desea encontrar un intervalo de confianza de 95% para la diferencia entre los pesos verdaderos.
Sean X1, . . . , X8 las lecturas para la primera pesa, y Y1, . . . , Y18 las lecturas para la segunda. Sean mX y mY los pesos verdaderos, que son las medias de las poblaciones de las cuales
se extrajeron estas muestras. Se supone que ambas poblaciones siguen distribuciones normales
–
con la misma varianza s2. Por tanto, X tiene una distribución normal con media mX y varianza
–
s2/8, y Y tiene una distribución normal con media mY y varianza s2/18. Por tanto, la diferencia
–
–
X ⫺ Y tiene una distribución normal con media mX ⫺ mY y la varianza s2(1/8 ⫹ 1/18). Dado
que s2 no se conoce, se debe estimar. Se podría estimar esta cantidad utilizando cualesquie2
ra de las varianzas muestrales sX2 = 8i=1 (Xi − X)2 /(8 − 1) o sY2 = 18
i=1 (Yi − Y ) /(18 − 1).
Pero la mejor estimación se obtiene al combinar la información en ambas muestras. La mejor estimación es la varianza combinada sp2 ⫽ (7sX2 ⫹ 17sY2)/(7 ⫹ 17). La varianza combinada sp2 es un promedio ponderado de dos varianzas muestrales. Los pesos son iguales a los
tamaños muestrales menos uno. Es lógico utilizar un promedio ponderado con el propósito de
que la varianza muestral basada en la muestra más grande cuente más. Con los valores dados
para sX y sY, el valor de la varianza combinada es sp2 ⫽ [7(2.02) ⫹ 17(1.82)]/(7 ⫹ 17) ⫽
3.4617, así sp ⫽ 1.8606.
√
La cantidad [(X − Y ) − (μX − μY )]/ sp 1/8 + 1/18 tiene la distribución t de Student con 8 ⫹ 18 ⫺ 2 ⫽ 24 grados de libertad. De la tabla t, se encuentra que t24, 0.025 ⫽ 2.064.
Por lo que para 95% de todas las muestras que se puede haber elegido,
−2.064 <
(X − Y ) − (μX − μY )
√
< 2.064
sp 1/8 + 1/18
Por el razonamiento utilizado en la sección 5.3, un intervalo de confianza de 95% para mX ⫺ mY
√
–
–
–
–
es X ⫺ Y ⫾ 2.064sp 1/8 + 1/18. Al sustituir X ⫽ 18.2, Y ⫽ 16.4 y sp ⫽ 1.8606 encuentra
un intervalo de confianza de 95% para mX ⫺ mY es 1.8 ⫾ 1.6318, o (0.1682, 3.4318).
5.6
Intervalos de confianza para la diferencia entre dos medias con pequeñas muestras
343
Resumen
Sea X1, . . . , XnX una muestra aleatoria de tamaño nX de una población normal con media mX y Y1, . . . , YnY una muestra aleatoria de tamaño nY de una población normal con
media mY. Se supone que las dos muestras son independientes.
Si se sabe que las poblaciones tienen casi la misma varianza, un intervalo de confianza de nivel 100(1 ⫺ α)% para mX ⫺ mY es
1
1
X − Y ± tnX +nY −2,α/2 · sp
+
(5.22)
nX
nY
La cantidad sp2 es la varianza combinada, dada por
sp2 =
Ejemplo
5.26
(nX − 1)sX2 + (nY − 1)sY2
nX + nY − 2
(5.23)
Se utilizó una máquina para llenar botellas de plástico con blanqueador. Una muestra de 18
botellas tenía una media de volumen de llenado de 2.007 l y desviación estándar de 0.010 l.
Después el aparato se cambió de lugar a otra ubicación. Una muestra de diez botellas llenadas en la nueva ubicación tenía una media del volumen llenado de 2.001 l y desviación estándar de 0.012 l. Se creía que cambiar de lugar la máquina podría haber cambiado la media del
volumen llenado, pero es poco probable haber cambiado la desviación estándar. Suponga que
ambas muestras provienen de poblaciones aproximadamente normales. Determine un intervalo de confianza de 99% para la diferencia entre la media de los volúmenes de llenado en las
dos ubicaciones.
Solución
–
–
Se tiene X ⫽ 2.007, sX ⫽ 0.010, nX ⫽ 18, Y ⫽ 2.001, sY ⫽ 0.012 y nY ⫽ 10. Debido a que se
cree que las desviaciones estándares poblacionales son iguales, se estima su valor común con
la desviación estándar combinada, utilizando la ecuación (5.23). Se obtiene
(18 − 1)(0.0102 ) + (10 − 1)(0.0122 )
sp =
= 0.0107
18 + 10 − 2
El número de grados de libertad es 18 ⫹ 10 ⫺ 2 ⫽ 26. Se utiliza la expresión (5.22) para determinar el intervalo de confianza de 99%. Consultando la tabla t con 26 grados de libertad,
se encuentra que t26, 0.005 ⫽ 2.779. El intervalo de confianza de 99% es, por tanto,
2.007 − 2.001 ± 2.779(0.0107) 1/18 + 1/10, o 0.006 ± 0.012.
No suponga que las varianzas poblacionales son exactamente
iguales sólo porque las varianzas muestrales están cercanas
El intervalo de confianza dado por la expresión (5.22) requiere que las varianzas poblacionales sean iguales, o casi iguales. En situaciones donde las varianzas muestrales son casi igua-
344
CAPÍTULO 5
Intervalos de confianza
les, es tentador suponer que las varianzas poblacionales son también casi iguales. Sin embargo, cuando los tamaños muestrales son pequeños, las varianzas muestrales no son necesariamente buenas aproximaciones a las varianzas poblacionales. Por tanto, es posible que las
varianzas muestrales estén cercanas incluso cuando las varianzas poblacionales estén bastante
alejadas. En general, se debe suponer que las varianzas poblacionales son iguales solamente
cuando se tiene conocimiento acerca de los procesos que produjeron los datos que justifiquen
esta suposición.
El intervalo de confianza dado por la expresión (5.21) produce buenos resultados en casi todos los casos, si las varianzas poblacionales son iguales o no. (Puede haber excepciones
cuando las muestras son de tamaños muy diferentes.) Por tanto, cuando se duda acerca de si
las varianzas poblacionales son iguales, utilice la expresión (5.21).
Ejercicios para la sección 5.6
1. Se midió cinco veces el contenido de carbono (en partes por
millón) para cada una de las dos placas de silicio diferentes.
Las mediciones fueron:
Placa A: 1.10 1.15 1.16 1.10 1.14
Placa B: 1.20 1.18 1.16 1.18 1.15
Determine un intervalo de confianza de 99% para la diferencia en contenido de carbono entre las dos placas.
2. En un estudio de la tasa en donde el pesticida hexaconazol
es absorbido a través de piel, se expusieron muestras de piel
a 24 mg de hexaconazol. Se expusieron cuatro muestras durante 30 minutos y otras cuatro fueron expuestas durante 60
minutos. Las cantidades (en mg) que fueron absorbidas fueron
30 minutos:
60 minutos:
3.1
3.7
3.3
3.6
3.4
3.7
3.0
3.4
Determine un intervalo de confianza de 95% para la media
de la cantidad absorbida en el intervalo entre 30 y 60 minutos después de la exposición.
3. El artículo “Differences in Susceptibilities of Different Cell
Lines to Bilirubin Damage” (K. Ngai, C. Yeung. y C.
Leung, en Journal of Pediatric Child Health, 2000:36-45)
describe una investigación respecto de la toxicidad de bilirrubina sobre algunas líneas de células. Diez conjuntos de
células de hígado humanos y diez conjuntos de células de
fibroblastos de ratón fueron puestos en soluciones de bilirrubina en albúmina a una proporción de 1.4 bilirrubina/albúmina molar durante 24 horas. En los diez conjuntos de
celdas de hígado humanas, el porcentaje promedio de células que sobrevivían era de 53.9 con desviación estándar de
10.7. En los diez conjuntos de celdas de fibroblastos de ra-
tón, el porcentaje promedio de células que sobrevivían era
de 73.1 con desviación estándar de 9.1. Determine un intervalo de confianza de 98% para la diferencia de porcentajes
de superviviencia entre las dos líneas de células.
4. Un médico genetista está estudiando la frecuencia de cierta
mutación genética en hombres de diferentes edades. Para
diez hombres de 20-29 años, la media del número de secuencias mutantes por mg de ADN era 47.2 y la desviación
estándar 15.1. Para 12 hombres de 60-69 años la media era
109.5 y la desviación estándar 31.2. Determine un intervalo de confianza de 99% para la diferencia en la media de la
frecuencia mutante entre hombres de 20-29 años y otros de
60-69.
5. Durante el verano de 1999 los bombardeos destruyeron muchas instalaciones de almacenamiento de combustible en
Serbia. Por consiguiente, importantes cantidades de productos de aceite fueron derramadas y quemadas, dando como
resultado contaminación del suelo. El artículo “Mobility of
Heavy Metals Originating from Bombing of Industrial Sites” (B. S̆krbić, J. Novaković, y N. Miljević, en Journal of
Environmental Science and Health, 2002:7-16) notifica mediciones de concentraciones de metal pesado en algunos sitios
industriales en junio de 1999, justo después del bombardeo,
y nuevamente en marzo de 2000. En el sitio de Smederevo,
en la rivera del Danubio, se tomaron ocho muestras de tierra en 1999, que tenían una concentración promedio de plomo (en mg/kg) de 10.7 con una desviación estándar de 3.3.
Cuatro muestras tomadas en 2000 tuvieron una concentración promedio de plomo de 33.8 con desviación estándar de
0.50. Determine un intervalo de confianza de 95% para el
aumento en la concentración de plomo entre junio de 1999
y marzo de 2000.
5.6
6. El artículo “Quality of the Fire Clay Coal Bed. Southeastern
Kentuchy” (J. Hower, W. Andrews y cols., en Journal of
Coal Quality, 1994:13-26) contiene mediciones acerca de
muestras de carbón en algunos condados de Kentucky. En
unidades de porcentajes de ceniza, cinco muestras del condado de Knott tenían un promedio de dióxido de aluminio
(AlO2) de 32.17 y desviación estándar de 2.23. Seis muestras de condado de Leslie tenían un promedio de contenido
de AlO2 de 26.48 y desviación estándar de 2.02. Determine
un intervalo de confianza de 98% para la diferencia en el
contenido de AlO2 contenido entre las muestras de carbón
de los dos condados.
7. El artículo “The Frequency Distribution of Daily Global
Irradiation at Kumasi” (F. Akuffo y A. Brew-Hammond, en
Solar Energy, 1993:145-154) define el índice de claridad
diaria para una ubicación que está en la proporción de irradiación global con la irradiación extraterrestre. Se tomó mediciones en la ciudad de Ibadan, Nigeria, en un periodo de
cinco años. Para cinco meses de mayo, el promedio del índice de claridad era de 0.498 y tenía 0.036 de desviación estándar. Durante cinco meses de julio, el promedio era de
0.389 y la desviación estándar de 0.049. Encuentre un intervalo de confianza de 95% para la diferencia entre las medias de los índices de claridad de mayo y julio.
10. El artículo “Permeability, Diffusion and Solubility of Gases” (B. Flaconnèche y colaboradores, en Oil and Gas
Science and Technology, 2001:262-278) describe un estudio
del efecto de la temperatura y otros factores en los coeficientes de transporte de gas en polímeros semicristalinos. El
coeficiente de permeabilidad (en 10⫺6 (STP)/cm⋅s⋅MPa) de
CO2 fue medido para la densidad media extrudida de polietileno tanto a 60°C como 61°C. Los resultados fueron:
60°C: 54 51 61
60 63 62
61°C: 58 60 66
67
57
69
60
66
68
61
60
Determine un intervalo de confianza de 95% para la diferencia en el coeficiente de permeabilidad entre 60°C y
61°C.
11. Una administradora de sistemas computacionales observa
que las computadoras que corren en un sistema operativo
especial parecen paralizarse más a menudo conforme pasa
el tiempo desde la instalación del sistema operativo. Ella
mide el tiempo (en minutos) antes de que se paralice para
siete computadoras un mes después de la instalación, y para nueve computadoras siete meses después. Los resultados
fueron:
Un mes después de la instalación:
8. Se probaron algunas muestras de carbón de cada una de dos
minas, y se midió la capacidad calorífica (en kilocalorías
por libra) para cada muestra. Los resultados fueron:
Mina 1: 4 167 4 268 4 159
4 386 4 103
Mina 2: 3 924 3 988 4 096
4 235 4 178
4 285
4 229
9. La fuerza de ruptura de palos de hockey de dos compuestos
de grafito-Kevlar diferentes producen los siguientes resultados (en newtons):
444.5
478.9
501.2
470.0
479.3
467.7
461.5
475.3
469.5
478.3
207.4
235.1
245.3
Siete meses después de la instalación: 84.3
201.3
149.4
233.1 215.9
225.6 244.4
53.2 127.3
174.2 246.2
156.4 103.3
Determine un intervalo de confianza de 95% para la diferencia de las medias en el tiempo en que se paraliza entre el
primero y el séptimo meses.
4 026
Determine un intervalo de confianza de 90% para la diferencia en la capacidad calorífica entre carbón de la mina 1
y carbón de la mina 2.
Compuesto A: 487.3
459.2
Compuesto B: 488.5
499.7
509.3
345
Intervalos de confianza para la diferencia entre dos medias con pequeñas muestras
456.3 449.7
477.2
467.2 462.5
481.5 485.2
491.5
Determine un intervalo de confianza de 98% para la diferencia
entre las medias de la fuerza de ruptura de palos de hockey hechos de los dos materiales.
12. En el artículo “Bactericidal Properties of Flat Surfaces and
Nanoparticles Derivatized with Alkylated Polyethylenimines” (J. Lin, S. Qiu y colaboradores, en Biotechnology Progress, 2002:1082-1086), se describen experimentos en los
que se fijó polietileniminas alquiladas a superficies y a nanopartículas para hacerlas bactericidas. En una serie de experimentos, la eficiencia bactericida contra la bacteria E.
coli fue comparada para un metilado contra un polímero no
metilado. La media del porcentaje de células de bacterias
muertas con el polímero metilado era de 95 con una desviación estándar de 1, y la media del porcentaje de células de
bacterias muertas con el polímero no metilado era de 70 con
una desviación estándar 6. Suponga que se hizo cinco mediciones independientes en cada tipo de polímero. Determine un intervalo de confianza de 95% para el aumento en la
eficiencia bactericida del polímero metilado.
346
CAPÍTULO 5
Intervalos de confianza
13. Una muestra de ocho acondicionadores de aire para habitación de cierto modelo tenía una media de presión de sonido
de media de 52 decibeles (dB) y una desviación estándar de
cinco decibeles, y una muestra de 12 acondicionadores de aire de un modelo diferente tenía una media de presión de so-
Intervalos de confianza con datos apareados
Los métodos analizados hasta ahora para encontrar intervalos de confianza con base en dos
muestras han requerido que las muestras sean independientes. En algunos casos, es mejor diseñar un experimento con el propósito de que cada elemento en una muestra se empareje con
un elemento en la otra. A continuación se muestra un ejemplo.
Un fabricante de neumáticos desea comparar el desgaste de la huella de los neumáticos
hechos de un nuevo material con el de los neumáticos de un material convencional. Un neumático de cada tipo se coloca en cada rueda delantera de cada uno de diez automóviles de unidad de disco de rueda delantera. La elección respecto a qué tipo de neumático va en la rueda derecha y cuál en la izquierda se hace lanzando al aire una moneda. Cada automóvil se conduce durante 40 000 millas, entonces se quita los neumáticos y se mide la profundidad de la huella de cada uno. En la figura 5.15 se presenta los resultados.
Material nuevo
Material viejo
6.5
Profundidad de la huella (mm)
5.7
nido de 46 decibeles y desviación estándar de 2 decibeles.
Determine un intervalo de confianza de 98% para la diferencia en las medias de presión de sonido entre los dos modelos.
6
5.5
5
4.5
4
3.5
3
1
2
3
4
5 6 7
Automóvil
8
9
10
FIGURA 5.15 Profundidad de la huella para diez pares de neumáticos.
La columna del lado derecho de la figura 5.15 presenta los resultados para los 20 neumáticos. Hay coincidencia considerable en el desgaste de la huella para las dos muestras. Es
difícil decir de la columna si hay una diferencia entre las clases vieja y nueva de neumático.
Sin embargo, cuando los datos se revisan en pares, está claro que, en general, los neumáticos
del nuevo tipo tienen más huella que los de la vieja clase. La razón de analizar los pares es
presentar un esquema más claro del resultado, que los automóviles varían mucho en cuanto
5.7
347
Intervalos de confianza con datos apareados
al desgaste que tienen. Automóviles pesados, y los que tienen patrones de manejo que implican muchos arranques y paradas, generalmente producen más desgaste que otros. Los datos
agregados en la columna de la derecha de la figura incluyen esta variabilidad entre los automóviles, así como variabilidad en el desgaste de las llantas. Cuando los datos se consideran
en pares, la variabilidad entre los automóviles desaparece, porque ambas llantas en un par
provienen del mismo automóvil.
La tabla 5.1 presenta, para cada automóvil, las profundidades de las huellas, así como
la diferencia entre ellas. Se desea encontrar un intervalo de confianza de 95% para la media
de la diferencia en el desgaste de la huella entre materiales viejos y nuevos en una forma que
resulta ventajosa para reducir la variabilidad producida por el diseño apareado. La forma de
hacer esto último es pensar en una población de pares de valores, en la cual cada par consiste de mediciones de un tipo viejo y de un nuevo tipo de neumático en el mismo automóvil.
Para cada par en la población, hay una diferencia (nuevo-viejo), por lo que hay una población
de diferencias. Los datos constituyen, entonces, una muestra aleatoria poblacional de pares y
sus diferencias representan una muestra aleatoria poblacional de diferencias.
TABLA 5.1 Profundidades de la huella, en mm, para neumáticos hechos
de materiales nuevos y viejos
1
Material nuevo 4.35
Material viejo
4.19
Diferencia
0.16
Automóvil
5
6
2
3
4
5.00
4.62
0.38
4.21
4.04
0.17
5.03
4.72
0.31
5.71
5.52
0.19
4.61
4.26
0.35
7
8
9
10
4.70
4.27
0.43
6.03
6.24
– 0.21
3.80
3.46
0.34
4.70
4.50
0.20
Con el propósito de poner lo anterior en notación estadística, sea (X1, Y1), . . . , (X10, Y10)
los diez pares observados, con Xi representando la huella del neumático hecho del nuevo material del i-ésimo automóvil y Yi representando la huella del neumático hecho del material viejo del i-ésimo automóvil. Sea Di ⫽ Xi ⫺ Yi las diferencia entre las huellas para los neumáticos
del i-ésimo automóvil. Sean mX y mY las medias poblacional para X y Y, respectivamente. Se
desea encontrar un intervalo de confianza de 95% para la diferencia mX ⫺ mY. Sea mD la media poblacional de diferencias. Entonces mD ⫽ mX ⫺ mY. En consecuencia, un intervalo de
confianza para mD también será un intervalo de confianza para mX ⫺ mY.
Dado que la muestra D1, . . . , D10 es una muestra aleatoria de una población con media
mD, es posible utilizar métodos para encontrar intervalos de confianza para mD. En este ejemplo, puesto que el tamaño muestral es pequeño, se usa el método t de Student de la sección
5.3. Los valores observados de la media muestral y la desviación estándar muestral son
–
D ⫽ 0.232
sD ⫽ 0.183
El tamaño muestral es diez, por lo que hay nueve grados de libertad. El valor adecuado t es
t9, 0.025 ⫽ 2.262. Por tanto, con la expresión (5.9) (de la sección 5.3) el intervalo de confianza
—
es 0.232 ⫾ (2.262)(0.183)/10 , o (0.101, 0.363). Cuando el número de pares es grande, los
métodos de grandes muestras de la sección 5.1, específicamente la expresión (5.1), se pueden
utilizar.
348
CAPÍTULO 5
Intervalos de confianza
Resumen
Sea D1, . . . , Dn una muestra aleatoria pequeña (n ⱕ 30) de diferencias de pares. Si la
población de diferencias es aproximadamente normal, entonces un intervalo de confianza de nivel 100(1 ⫺ α)% para la media de la diferencia mD está dado por
sD
D ± tn−1,α/2 √
n
(5.24)
Observe que este intervalo es el mismo que el que se obtiene con la expresión (5.9).
Si el tamaño muestral es grande, un intervalo de confianza de nivel 100(1 ⫺ α)%
para la media de la diferencia mD está dado por
(5.25)
D ± zα/2 σD
–
se aproxima con sD /n. Observe que este intervalo es el mismo que
En la práctica
el que se obtiene con la expresión (5.1).
s D—
Ejercicios para la sección 5.7
1. El artículo “Simulation of the Hot Carbonate Process for
Removal of CO2 and H2S from Medium Btu Gas” (K. Park
y T. Edgar, en Energy Progress, 1984:174-180) presenta
una ecuación que utilizó para calcular la presión de vapor
en equilibrio del CO2 en una solución de carbonato de potasio. Se midió la presión de equilibrio real (en kPa) en nueve
reacciones diferentes y se comparó con el valor calculado
por una ecuación. Los resultados se presentan en la tabla siguiente:
Reacción
Estimado
1
2
3
4
5
6
7
8
9
45.10
85.77
151.84
244.30
257.67
44.32
84.41
150.47
253.81
Experimental Diferencia
42.95
79.98
146.17
228.22
240.63
41.99
82.05
149.62
245.45
2.15
5.79
5.67
16.08
17.04
2.33
2.36
0.85
8.36
Determine un intervalo de confianza de 95% para la diferencia de medias entre las presiones estimadas y reales.
2. El artículo “Effect of Refrigeration on the Potassium Bitartrate Stability and Composition of Italian Wines” (A. Versan, D. Barbanti y colaboradores, en Italian Journal of Food
Science 2002:45-52) notifica un estudio en el que los ocho
tipos de vino blanco tenían su concentración de ácido tartárico (en g/l), medido tanto antes como después de un proceso de estabilización frío. Las resultados se presentan en la
tabla siguiente:
Tipo de vino Antes Después Diferencia
1
2
3
4
5
6
7
8
2.86
2.85
1.84
1.60
0.80
0.89
2.03
1.90
2.59
2.47
1.58
1.56
0.78
0.66
1.87
1.71
0.27
0.38
0.26
0.04
0.02
0.23
0.16
0.19
Determine un intervalo de confianza de 95% para la diferencia de medias entre las concentraciones de ácido tartárico antes y después del proceso de estabilización frío.
5.7
3. En un experimento para determinar si hay una diferencia
sistemática entre los pesos obtenidos con dos balanzas diferentes, se pesaron diez ejemplares de rocas, en gramos, en
cada balanza. Se obtuvieron los siguientes datos:
Ejemplar Peso en la balanza 1 Peso en la balanza 2
1
2
3
4
5
6
7
8
9
10
11.23
14.36
8.33
10.50
23.42
9.15
13.47
6.47
12.40
19.38
11.27
14.41
8.35
10.52
23.41
9.17
13.52
6.46
12.45
19.35
Suponga que la diferencia entre las balanzas, si es que hay
alguna, no depende del objeto pesado. Determine un intervalo de confianza de 98% para esta diferencia.
4. En un tipo específico de motor, el volante está sujeto al bloque de brida del cigüeñal mediante ocho pernos, que se deben apretar en secuencia. Un ingeniero quiere determinar
qué diferencia existe entre el par de torsión del primero y el
último perno que se apretó. En una muestra de siete motores,
se mide el par de torsión en cada uno de estos pernos. Los
siguientes son los valores, en N·m, para los pernos 1 y 8.
Motor
Perno 1
Perno 8
1
2
3
4
5
6
7
105.28
105.03
104.53
104.68
104.98
105.21
105.30
105.38
105.96
105.19
105.61
105.42
105.20
105.98
Determine un intervalo de confianza de 90% para la diferencia entre los pares de torsión.
5. En un estudio de tiempo de disolución de diferentes dulces,
nueve personas disolvieron una pieza de chocolate y una
pieza de dulce de azúcar y mantequilla. Los tiempos de disolución, en segundos, se presentan en la tabla siguiente:
Intervalos de confianza con datos apareados
Persona
Chocolate
Dulce de azúcar
y mantequilla
1
2
3
4
5
6
7
8
9
51
47
90
65
27
105
90
54
93
53
40
155
90
33
68
72
52
77
349
Determine un intervalo de confianza de 98% para la diferencia entre la media de tiempos de disolución de chocolate y caramelo de azúcar y mantequilla.
6. Una muestra de diez camiones diesel fue operada tanto caliente como fría para calcular la diferencia en el ahorro de
combustible. Los resultados, en milla/galón, se presentan en
la tabla siguiente. (De “In-use Emissions from Heavy-Duty
Diesel Vehicles, ” J. Yanowitz, tesis de doctorado, Escuela
de Minas, de Colorado, 200l.)
Camión Caliente
1
2
3
4
5
6
7
8
9
10
4.56
4.46
6.49
5.37
6.25
5.90
4.12
3.85
4.15
4.69
Frío
4.26
4.08
5.83
4.96
5.87
5.32
3.92
3.69
3.74
4.19
Determine un intervalo de confianza de 98% para la diferencia en la media del millaje de combustible entre motores
calientes y fríos.
7. Para una muestra de nueve automóviles, se mide el millaje
(en mil millas) de los patines de frenos frontales originales
que se han desgastado 10% de su espesor original, así como
el millaje de los patines de los frenos traseros originales que
se han desgastado 10% de su espesor original. Los resultados están dados en la tabla siguiente:
350
CAPÍTULO 5
Intervalos de confianza
Automóvil Delanteros Traseros
1
2
3
4
5
6
7
8
9
32.8
26.6
35.6
36.4
29.2
40.9
40.9
34.8
36.6
41.2
35.2
46.1
46.0
39.9
51.7
51.6
46.1
47.3
Determine un intervalo de confianza de 95% para la diferencia en la media de tiempos de vida entre los patines de
frenos delanteros y traseros.
8. Con referencia al ejercicio 7, alguien sugiere que el diseño
emparejado sea reemplazado con un diseño en el que se seleccionan 18 automóviles, se mide el tiempo de vida de los
frenos delanteros en nueve de ellos, y se mide el tiempo de
vida de los frenos traseros en los otros nueve. Después se
construye un intervalo de confianza para la diferencia entre
las medias usando la expresión (5.21) (de la sección 5.6). Él
afirma que este diseño producirá un intervalo de confianza
más preciso, ya que se utilizará 18 automóviles en lugar de
nueve.
a) ¿El nuevo diseño producirá un intervalo de confianza
válido? Explique.
b) ¿Es probable que el intervalo de confianza producido
por el nuevo diseño será más preciso que, menos preciso que, o casi con la misma precisión que el intervalo de
confianza producido por el diseño apareado? Explique.
(Sugerencia: busque en la figura 5.15.)
9. Un fabricante de neumáticos está interesado en probar el
ahorro de combustible para dos patrones de huellas diferentes. Los neumáticos de cada tipo de huella son conducidos
durante mil millas en cada uno de 18 automóviles diferentes. Los millajes, en milla/galón, se presentan en la tabla siguiente:
Automóvil Huella A Huella B
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
24.1
22.3
24.5
26.1
22.6
23.3
22.4
19.9
27.1
23.5
25.4
24.9
23.7
23.9
24.6
26.4
21.5
24.6
20.3
19.7
22.5
23.2
20.4
23.5
21.9
18.6
25.8
21.4
20.6
23.4
20.3
22.5
23.5
24.5
22.4
24.9
a) Determine un intervalo de confianza de 99% para la media de la diferencia en el ahorro de combustible.
b) Un intervalo de confianza basado en los datos de la tabla tiene un ancho ⫾ 0.5 milla/galón. ¿El nivel de este
intervalo de confianza está más cerca de 80%, de 90% o
de 95%?
10. Con referencia al ejercicio 9, en un experimento distinto se
equipararon 18 automóviles con neumáticos con huellas del
tipo A, y 18 del tipo B. Cada automóvil se condujo mil millas.
Los automóviles con huellas del tipo A promediaban 23.93
milla/galón, con desviación estándar de 1.79 milla/galón. Los
automóviles con huellas de tipo B promediaban 22.19 milla/galón, con desviación estándar de 1.95 milla/galón.
a) ¿Qué método se debe usar para determinar un intervalo
de confianza para la diferencia entre las medias de los
millajes de dos tipos de huellas: la expresión (5.24) (de
esta sección) o la expresión (5.21) (de la sección 5.6)?
b) Usando el método adecuado, determine un intervalo de
confianza de 99% para la diferencia entre las medias de los
millajes de los dos tipos de huella.
c) ¿Es el intervalo de confianza encontrado en el inciso b)
más ancho que el encontrado en el ejercicio 9? ¿Por qué
esto es así?
5.8
5.8
Uso de simulación para construir intervalos de confianza
351
Uso de simulación para construir
intervalos de confianza
Si X1, . . . , Xn son variables aleatorias independientes con desviaciones estándares conocidas,
s1, . . . , sn, y U ⫽ U(X1, . . . , Xn) es una función de X1, . . . , Xn, entonces el método de la
propagación del error (véase el capítulo 3) se puede utilizar para calcular la desviación estándar, o la incertidumbre, en U. Si además las variables aleatorias X1, . . . , Xn están distribuidas
aproximadamente normales, se da con frecuencia el caso (no siempre) de que también U se
distribuye aproximadamente normal. En estos casos se puede utilizar la expresión (5.13) (de la
sección 5.3) para calcular un intervalo de confianza para la media de mU de U. Con el propósito de determinar si U está distribuida aproximadamente normal, se puede utilizar la simulación.
Para dar un ejemplo concreto, suponga que se fabrican lavadoras de acero, cuyos radios
están distribuidos normalmente con media mR desconocida y desviación estándar conocida
sR ⫽ 0.1 cm. Se observa que una sola lavadora, seleccionada aleatoriamente, tiene un radio
de R ⫽ 2.5 cm. Debido a que R proviene de una población normal con desviación estándar
conocida, se puede utilizar la expresión (5.13) para encontrar un intervalo de confianza para
la media del radio mR. Un intervalo de confianza de 95% para mR es R ⫾ 1.96sR ⫽ 2.5 ⫾
0.196. Ahora se considera el área de la lavadora. Ésta es A ⫽ πR2 ⫽ 3.14(2.52) ⫽ 19.63 cm2.
Se puede usar el método de la propagación del error (ecuación 3.10 de la sección 3.3) para
calcular la desviación estándar, o la incertidumbre, sA, por
σA =
dA
σR = 2π RσR = 2(3.14)(2.5)(0.10) = 1.57 cm2
dR
Ahora se tiene un solo valor muestreado A ⫽ 19.63, poblacional de todas áreas posibles, y se tiene una estimación de la desviación estándar de esta población, sA ⫽ 1.57. ¿Se
puede encontrar un intervalo de confianza para la media mA del área? Si la distribución de
áreas estuviera distribuida normalmente, se podría encontrar un intervalo de confianza para
mA con el mismo método usado para mR, obteniendo A ⫾ 1.96sA ⫽ 19.63 ⫾ 1.96(1.57). La
suposición de normalidad es necesaria para justificar este método. ¿Cómo se puede determinar si la distribución de las áreas es normal? Si se tuviera una muestra grande de áreas, se podría construir una gráfica de probabilidad normal. No se tiene una muestra grande de áreas,
pero se puede simular una, como se muestra a continuación (véase la sección 4.11 para un
análisis de los principios básicos de simulación).
Se empieza por generar una muestra grande de radios simulados R*. Se quiere que la
distribución poblacional de la cual se extrae la muestra esté tan cerca como sea posible a la distribución poblacional a partir de la cual se extrajo la observación R ⫽ 2.5. Se sabe que el valor R ⫽ 2.5 fue extraído de una población normal con sR ⫽ 0.1. No se conoce mR, pero se
puede utilizar el valor observado R ⫽ 2.5 como una aproximación a mR para propósitos de la
simulación. Por tanto, se generará una muestra grande de radios simulados R*1, . . . , R*N de una
distribución N(2.5, 0.12). (La notación R*i indica que ello representa un valor simulado, en lugar de un valor observado en un experimento verdadero.)
Para entender exactamente qué se puede hacer con los valores simulados, imagine que
se tenía una muestra grande de lavadoras verdaderas, y que sus radios R1, . . . , Rn se habían
determinado. ¿Cuáles son la similitudes y las diferencias entre la muestra real R1, . . . , Rn y
la muestra simulada R*1, . . . , R*N? La muestra verdadera proviene de una población que está
352
CAPÍTULO 5
Intervalos de confianza
normalmente distribuida, se sabe que la desviación estándar es de 0.1, y su media mR es desconocida. La muestra simulada proviene de una población que también está distribuida normalmente, cuya desviación estándar es también igual a 0.1, y cuya media se ha establecido de
2.5 (el valor de una observación verdadera de R). Por tanto, la población simulada tiene la
misma forma (normal) y la extensión (desviación estándar) poblacional real. Las poblaciones
simuladas y reales tienen medias diferentes (2.5 para la población simulada y el valor desconocido mR para la población real).
Ahora para cada R*i se calcula un área simulada A*i ⫽ πR*i 2. Imagine que se tenía una
muestra verdadera de radios, R1, . . . , Rn, y se calcula una muestra real A1, . . . , An, de áreas
de ésta. Debido a que la muestra de radios simulados R*1, . . . , R*n proviene de una población
cuya forma y extensión son las mismas que la de la población real de radios, es razonable suponer que la muestra simulada de áreas A*1, . . . , A*n proviene de una población cuya forma y
extensión son muy similares a la población verdadera de áreas. En otras palabras, es razonable suponer que la desviación estándar muestral simulada A*1, . . . , A*n es cercana a la desviación estándar muestral sA, y es razonable suponer que si la muestra simulada A*1, . . . , A*n
proviene de una población que es aproximadamente normal, la población verdadera de áreas
es también aproximadamente normal. Sin embargo, la media poblacional simulada de áreas
diferirá de la media poblacional verdadera de las áreas. La razón de esto es que las medias de
las poblaciones simuladas y reales de radios son diferentes. La media poblacional simulada
de áreas será cercana a un valor observado verdadero de A, que es 19.63. La media poblacional verdadera de áreas es el valor desconocido mA.
Se construye una gráfica de probabilidad normal para A*1, . . . , A*n. Si se muestra que la
población de áreas es aproximadamente normal, entonces se puede suponer que el verdadero
observado proviene de una población aproximadamente normal, y se puede encontrar un intervalo de confianza para mA. La figura 5.16 presenta una gráfica de probabilidad normal para una muestra de 1 000 áreas. Con excepción de algunos puntos en cualesquiera de los
extremos, la suposición de normalidad parece bien satisfecha.
0.999
0.99
0.95
0.9
0.75
0.5
0.25
0.1
0.05
0.01
0.001
14
16
18
20
22
24
26
28
FIGURA 5.16 Gráfica de probabilidad normal para 1 000 áreas simuladas. La suposición
de normalidad está justificada.
5.8
Uso de simulación para construir intervalos de confianza
353
El valor observado de A en realidad es A ⫽ 19.63. La desviación estándar de la población de la que A fue extraída, calculada con el método de propagación del error, es sA ⫽ 1.57.
Debido a que esta población es aproximadamente normal, un intervalo de confianza de 95%
para la media mA del área es 19.63 ⫾ 1.96(1.57), o (16.55, 22.71).
En el intervalo de confianza apenas calculado, la desviación estándar sA se obtuvo con
el método de propagación del error. Es también aceptable usar la desviación estándar muestral de valores simulados A*1, . . . , A*n para estimar sA. En los mil valores que se simularon, la
desviación estándar muestral fue de 1.5891, que estaba cerca del valor 1.57 calculado por la
propagación del error. Este acercamiento es típico.
Es importante observar que el centro del intervalo de confianza es el verdadero valor
–
observado A, y no la media del valor simulado A*. La razón para esto último es que se está
determinando un intervalo de confianza para la media poblacional verdadera de áreas mA, y el
valor observado A se ha muestreado de esta población. Los valores simulados se han mues–
treado de una población cuya media es diferente a la población verdadera. Por tanto, A* no es
una elección adecuada para el centro del intervalo de confianza.
El método apenas descrito puede ser muy útil cuando se hacen mediciones cuyos errores de medición están distribuidos normalmente. Se presentan algunos ejemplos.
Ejemplo
5.27
La longitud y el ancho de un rectángulo se miden de X ⫽ 3.0 ⫾ 0.1 y Y ⫽ 3.5 ⫾ 0.2 cm, respectivamente. Suponga que las mediciones provienen de poblaciones normales y no tienen
sesgos. Suponga que se conocen las desviaciones estándares sX ⫽ 0.1 y sY ⫽ 0.2. Determine un intervalo de confianza de 95% para el área del rectángulo.
Solución
Sea A ⫽ XY la medida del área de un rectángulo. El valor observado de A es A ⫽ (3.0)(3.5)
⫽ 10.5. Se usará el método de propagación del error para calcular sA. Entonces se utilizará
la simulación para comprobar que la distribución de A es aproximadamente normal. Para calcular sA, primero se calculan las derivadas parciales de A con respecto a X y Y.
∂A
= Y = 3.5
∂X
∂A
= X = 3.0
∂Y
La desviación estándar sA se estima con
σA =
∂A
∂X
2
σX2 +
∂A
∂Y
2
σY2
(3.5)2 (0.1)2 + (3.0)2 (0.2)2
= 0.6946
=
Para comprobar la normalidad, se generan mil valores simulados X*1, . . . , X*1 000 de una distribución N(3.0, 0.12), y otros mil Y*1, . . . , Y*1 000 de una distribución N(3.5, 0.12). Observe que
se utilizaron los valores observados 3.0 y 3.5 para hacer una aproximación de las medias desconocidas mX y mY (que es la longitud y el ancho, verdadero, respectivamente) para propósitos
354
CAPÍTULO 5
Intervalos de confianza
de simulación. Después se calcula 1 000 áreas simuladas A*1, . . . , A*1 000. Una gráfica de probabilidad normal se presenta en la figura siguiente. La suposición de la normalidad está justificada. Un intervalo de confianza de 95% para el área del rectángulo es 10.5 ⫾ 1.96(0.6946).
0.999
0.99
0.95
0.9
0.75
0.5
0.25
0.1
0.05
0.01
0.001
8
9
10
11
12
13
Nota técnica: En el ejemplo 5.27 se está encontrando un intervalo de confianza para la
media mA del área medida. El área verdadera del rectángulo es el producto de la longitud verdadera por el ancho verdadero, que es mXmY. El valor mA es un poco diferente del producto
mXmY, pero la diferencia es despreciable para propósitos prácticos.
Ejemplo
5.28
Dos resistores, cuyas resistencias se miden de X y Y, están conectados en paralelo. Se calcula la resistencia total con R ⫽ (XY)/(X ⫹ Y). Suponga que X ⫽ 10.0 ⫾ 1.0 Ω, Y ⫽ 20.0 ⫾ 2.0
Ω, y que X y Y provienen de poblaciones normales y no tienen sesgos. Encuentre un intervalo de confianza de 95% para la resistencia total.
Solución
El valor observado de R es (10)(20)/(10 ⫹ 20) ⫽ 6.667 Ω. Para calcular sR, primero se calculan las derivadas parciales de R:
2
Y
∂R
=
= 0.4444
∂X
X+Y
∂R
=
∂Y
X
X+Y
2
= 0.1111
Ahora sX ⫽ 1 Ω y sX ⫽ 2 Ω. Por tanto,
σR =
∂R
∂X
2
σX2
+
∂R
∂Y
2
σY2
= (0.4444)2 (1)2 + (0.1111)2 (2)2
= 0.497
5.8
Uso de simulación para construir intervalos de confianza
355
Para comprobar la normalidad, se han generado mil valores simulados X*1, . . . , X*1 000 de una
distribución N(10, 1.02), y mil Y*1, . . . , Y*1 000 de N(20, 2.02). Observe que se utilizan los valores observados 10 y 20 para aproximar las medias mX y mY para propósitos de simulación.
Después se calculan mil valores simulados R*1, . . . , R*1 000. En la siguiente figura se muestra
una gráfica de probabilidad normal. La suposición de normalidad está justificada. Un intervalo de confianza de 95% para la resistencia total es 6.667 ⫾ 1.96(0.497).
0.999
0.99
0.95
0.9
0.75
0.5
0.25
0.1
0.05
0.01
0.001
5
6
7
8
La nota técnica que se muestra después del ejemplo 5.27 también se aplica al ejemplo
5.28. Se está determinando realmente un intervalo de confianza en realidad para la media mR
de la resistencia total medida. Esta media mR es un poco diferente de la resistencia total verdadera mXmY/(mX ⫹ mY), pero la diferencia es despreciable para propósitos prácticos.
En algunos casos la distribución de una función U(X1, . . . , Xn) no es normal, aun cuando X1, . . . , Xn son normales. Por esta razón es importante comprobar la normalidad con una
simulación. El ejemplo 5.29 proporciona una muestra.
Ejemplo
5.29
La masa de una roca se mide de M ⫽ 10 ⫾ 0.4 g, y su volumen se mide de V ⫽ 1.0 ⫾ 0.2
ml. Se calcula la densidad con D ⫽ M/V. Se supone que M y V provienen de poblaciones normales y no tienen sesgos. ¿D está distribuida normalmente? ¿Se puede utilizar el método descrito en los ejemplos 5.27 y 5.28, que está basado en la curva normal, para encontrar un
intervalo de confianza de 95% para la densidad de la roca?
Solución
Se generan mil valores simulados M*1, . . . , M*1 000 de una distribución de N(10, 0.42), y mil
más V*1, . . . , V*1 000 de una distribución N(1.0, 0.22). Después se calculan los valores D*i ⫽
M*i / V*i . Una gráfica de probabilidad normal de los D*i se muestra en la figura siguiente. La suposición de normalidad no está justificada. El método basado en la curva normal no se puede utilizar para encontrar un intervalo de confianza para la densidad de la roca.
356
CAPÍTULO 5
Intervalos de confianza
0.999
0.99
0.95
0.9
0.75
0.5
0.25
0.1
0.05
0.01
0.001
5
10
15
20
25
Intervalos de confianza usando estimación bootstrap
Cuando se extrae una muestra de una población que no es normal, y se requiere un intervalo
de confianza, se pueden utilizar los métodos basados en la estimación bootstrap (véase la sección 4.11). Existen muchos de estos métodos; aquí se presenta uno simple y se muestra cómo
utilizarlo para construir un intervalo de confianza para una media poblacional.
Se considerará el siguiente ejemplo. El artículo “In-use Emissions from Heavy Duty
Diesel Vehicles” (J. Yanowitz, tesis de doctorado, Escuela de Minas, de Colorado, 2001) presenta mediciones de eficiencia del combustible (en milla/galón) de una muestra de siete camiones. Los datos son los siguientes:
7.69
4.97
4.56
6.49
4.34
6.24
4.45
Se supone que ésta es una muestra aleatoria de una población de camiones, y que se desea construir un intervalo de confianza de 95% para la media m de la eficiencia de combustible de esta población. Al observar la muestra se sugiere que hay una separación cerca de la
mitad de la distribución, ya que no hay ningún camión en la muestra con valores entre 5 y 6.
Por tanto, no se podría suponer que los datos fueran normales. La estimación bootstrap proporciona un método para construir un intervalo de confianza, cuyo nivel será aproximadamente de 95% (o cualquier otro valor que se podría especificar).
Para construir un intervalo de confianza de estimación bootstrap, se deben extraer muestras de estimación bootstrap de los datos. Una muestra de estimación bootstrap es del mismo
tamaño que los datos, extraída con reemplazo. Para describir esto último con detalle, se denotan los valores en una muestra aleatoria por X1, . . . , Xn. Imagine colocar estos valores en
una caja y extraer uno al azar. Éste sería el primer valor de la muestra de estimación bootstrap; se le denota con X*1. Después se regresa a X*1 a la caja, y se extrae otro valor, X*2. Se continúa de este modo hasta que se ha extraído n valores X*1, . . . , X*n. Ésta es una muestra de
estimación bootstrap. Observe que cada valor en la muestra de estimación bootstrap se ha extraído de la muestra de datos completa, por lo que es probable que algunos valores aparecerán más de una vez mientras que otros no lo harán.
Se extrajeron mil muestras por estimación bootstrap de los datos específicos del millaje.
Los primeros diez y el último de éstos se presentan en la tabla 5.2. La media muestral se calcula para cada muestra de estimación bootstrap.
5.8
Uso de simulación para construir intervalos de confianza
357
TABLA 5.2 Muestras de estimación bootstrap de los datos del millaje
Muestra
1
2
3
4
5
6
7
8
9
10
..
.
1 000
Valores de la muestra
4.97
6.24
4.34
4.45
6.24
4.34
4.45
6.49
7.69
6.24
6.49
4.97
4.45
6.49
4.34
4.97
6.49
7.69
4.45
4.56
7.69
4.56
4.56
7.69
4.45
7.69
6.24
4.97
4.45
4.97
4.97
4.97
4.45
6.24
7.69
4.97
4.97
6.49
4.45
6.49
..
.
4.34 7.69 4.45 4.56
7.69
4.56
6.24
4.97
4.56
6.24
4.34
6.49
4.45
4.45
4.56
6.24
4.97
4.45
4.34
6.24
7.69
4.34
4.56
4.97
Media muestral
4.45
7.69
4.34
4.34
4.45
6.24
4.34
4.56
4.56
6.24
7.69 4.45 7.69
5.8314
5.6043
4.7643
5.5186
5.1529
5.8129
5.5029
5.8614
4.9443
5.4171
..
.
5.8386
Para construir un intervalo de confianza de estimación bootstrap, se deben extraer muchas muestras de estimación bootstrap (mil como mínimo). Debido a que se quiere un intervalo de confianza para la media m poblacional, se calcula la media muestral para cada muestra
–
de estimación bootstrap. Sea X *i la media de la i-ésima muestra de estimación bootstrap. Debido a que se quiere que el nivel del intervalo de confianza esté tan cerca de 95% como sea
posible, se determina el intervalo que contiene a 95% del intermedio de las medias muestrales de estimación bootstrap. Los puntos finales de este intervalo son 2.5 percentil y 97.5 per–
centil de la lista de las medias de estimación bootstrap. Se denotan estos percentiles por X *.025
–
y X *.975, respectivamente.
Se calcularon estos percentiles para los datos del millaje. Las siguientes son las 26 más
–
pequeñas y 26 más grandes de las mil muestras de estimación bootstrap X *i .
26 más pequeñas:
26 más grandes:
4.4929
4.5986
4.7014
4.7643
6.4757
6.5929
6.7057
7.0714
4.4971
4.6143
4.7157
4.7643
6.4757
6.5929
6.7129
7.1043
4.5357 4.5400 4.5514 4.5557 4.5557 4.5829
4.6429 4.6457 4.6729 4.6729 4.6900 4.6943
4.7257 4.7257 4.7329 4.7371 4.7414 4.7486
6.4800 6.4900 6.4986 6.5214 6.5443 6.5543
6.6257 6.6257 6.6471 6.6671 6.6900 6.6929
6.7514 6.7971 6.7971 6.8486 6.9329 6.9686
Utilizando el método del cálculo de percentiles presentado en el capítulo, el percentil
2.5 es el promedio de los 25o. y 26o. valores en la muestra ordenada de mil, y el percentil
–
–
97.5 es el promedio de los valores 975o. y 976o. Por tanto, en este caso X *.025 ⫽ 4.7643 y X *.975
⫽ 6.4757.
Ahora hay dos métodos disponibles para construir el intervalo de confianza; cuál será
–
el mejor es un tema de cierta controversia. En el método 1, el intervalo de confianza es (X *.025,
–
–
X *.975). El método 2 utiliza la media X de la muestra original, además de los percentiles; con
–
–
–
–
el método 2 el intervalo de confianza es (2X ⫺ X *.975, 2X ⫺ X *.025). Para los datos del millaje, el
intervalo de confianza de 95% por el método 1 es (4.7643, 6.4757).
358
CAPÍTULO 5
Intervalos de confianza
–
La media muestral para los datos del millaje es X ⫽ 5.5343. Por tanto, el intervalo de confianza de 95% calculado por el método 2 es
(2(5.5343) ⫺ 6.4757, 2(5.5343) ⫺ 4.7643) ⫽ (4.5929, 6.3043)
Para este caso específico, los intervalos de confianza de los dos métodos son similares.
Resumen
Dada una muestra aleatoria X1, . . . , Xn de una población con media m, un intervalo de
confianza de estimación bootstrap para m con nivel aproximado de 100(1 ⫺ α)% se
puede calcular como se muestra a continuación:
Extraiga un gran número m (m ⱖ 1 000) de muestras de estimación bootstrap de
tamaño n con reemplazo de X1, . . . , Xn..
Calcule la media de cada muestra de estimación bootstrap. Denote estas medias de
–
–
estimación bootstrap por X *1, . . . , X *m.
Calcule los percentiles 100α/2 y 100(1 ⫺ α/2) de las medias de estimación. Deno–
–
te estos valores X *a/2, X *1 ⫺ a/2.
Hay dos métodos para calcular el intervalo de confianza.
–
–
–
–
–
–
Método 1: (X *a/2, X *1 ⫺ a/2)
Método 2: (2X ⫺ X *1 ⫺ a/2, 2X ⫺ X *a/2)
Aunque al principio no es obvio, existe una conexión entre el método de estimación
bootstrap presentado aquí para el cálculo de los intervalos de confianza para una media poblacional y el de grandes muestras basado en la curva normal. En ambos casos el ancho del
intervalo de confianza debe idealmente ser igual al ancho de 95% intermedio de la distribu–
–
ción de la media muestral X . Cuando el tamaño muestral es grande, la distribución de X sigue la curva normal, por lo que el ancho del intervalo de confianza de 95% es puesto para
igualar el ancho de 95% intermedio de la distribución normal (véase la figura 5.1 en la sec–
ción 5.1). Se utiliza la estimación bootstrap cuando la distribución de X no es necesariamen–
te normal. La colección de las medias muestrales de estimación bootstrap X *i se aproxima a
–
una muestra aleatoria de la distribución de X , por lo que esta colección, en vez de la curva
normal, constituye la base para el intervalo de confianza. El ancho del intervalo de confianza de
estimación bootstrap es puesto para igualar el ancho de 95% intermedio de la media muestral
–
de estimación bootstrap con el fin de aproximar el ancho de la distribución desconocida de X.
Hay muchos métodos diferentes para calcular intervalos de confianza de estimación
bootstrap. Los métodos simples que aquí se presentan funcionan bien cuando la población de
la cual se extrajo la muestra de estimación bootstrap es aproximadamente simétrica, pero no
funcionan bien cuando está muy sesgada. Se han desarrollado métodos más sofisticados que
producen buenos resultados con condiciones más generales. Se puede encontrar información
adicional sobre este tema en Efron y Tibshirani (1993).
Uso de simulación para evaluar intervalos de confianza
Un intervalo con nivel de confianza del 100(1 ⫺ α)% es el que se calcula mediante un procedimiento que tiene éxito en contener el valor verdadero para el 100(1 ⫺ α)% de todas las
5.8
Uso de simulación para construir intervalos de confianza
359
muestras que posiblemente se pudiera extraer. Cuando los supuestos que gobiernan el uso de
un método son incumplidos, esta tasa de éxito (también llamada la probabilidad de cobertura) podría ser más baja. Con frecuencia, en la práctica, los supuestos no son válidos. Algunos métodos son muy sensibles a sus suposiciones, en lo que respecta a la probabilidad de
cobertura puede ser mucho menos del 100(1 ⫺ α)%, aun cuando los supuestos son solamente
incumplidos. Otros métodos son “robustos”, ello significa que la probabilidad de cobertura no
se va muy por debajo del 100(1 ⫺ α)% en tanto sus suposiciones se satisfagan de manera
aproximada. La ventaja de un método robusto es que es útil en una amplia gama de condiciones y requiere menos preocupación acerca de sus suposiciones. Los experimentos de simulación proporcionan una buena manera de valorar la robustez de un procedimiento estadístico.
En seguida se presenta un experimento que será instructivo respecto a la robustez del método
t de Student para construir intervalos de confianza para una media poblacional (expresión 5.9
en la sección 5.3).
La distribución t de Student se puede utilizar para construir intervalos de confianza para una media poblacional, siempre que la muestra provenga de una población que sea “aproximadamente” normal. Se realizará un experimento de simulación para tener un poco de
percepción de cómo se puede hacer burdamente esta aproximación. La siguiente figura muestra la función de densidad de probabilidad para la distribución Γ(2.5, 0.5) (que también se conoce como distribución Ji-cuadrada con cinco grados de libertad). Está bastante sesgada y no
se parece a la curva normal. La media de esta población es m ⫽ 5. Si el método t de Student se
aplica a muestras de tamaño 5 de esta población, ¿qué proporción de veces el intervalo de
confianza de 95% contendrá la media verdadera?
0.15
0.1
0.05
0
0
5
10
15
Función gamma con r = 2.5 y l = 0.5
20
Para abordar esta pregunta, se generan 10 000 muestras de tamaño 5 de la distribución
Γ(2.5, 0.5). Se denota la i-ésima muestra mediante X*1i , X*2i , X*3i , X*4i , X*5i ; denote su media
–
muestral por medio de X *i ; y la desviación estándar muestral por s*i . Para cada muestra se calcula un intervalo de confianza usando la fórmula por un intervalo de confianza de 95% basado en la distribución t de Student (expresión 5.9 de la sección 5.3). El límite de confianza
—
–
inferior es L*i ⫽ X *i ⫺ 2.776s*i /5 (observe que t4, 0.025 ⫽ 2.776). El límite de confianza supe—
–
rior es U*i ⫽ X *i ⫹ 2.776s*i /5 . En la tabla 5.3 se presenta los resultados para las primeras diez
y la última muestras. La columna derecha contiene un “1” si L*i ⬍ 5 ⬍ U*i , en otras palabras,
si el i-ésimo intervalo de confianza contiene a la media verdadera de 5.
360
Intervalos de confianza
CAPÍTULO 5
TABLA 5.3 Datos simulados de la distribución Γ(2.5, 0.5)
i
1
2
3
4
5
6
7
8
9
10
..
.
10 000
X1∗
X2∗
X3∗
X4∗
X5∗
X
∗
s∗
L∗
U∗
2.58 6.54 3.02 3.40 1.23 3.36 1.96
0.92 5.79
1.28 1.44 1.45 10.22 4.17 3.71 3.83 – 1.05 8.47
7.26 3.28 2.85 8.94 12.09 6.88 3.89
2.05 11.72
6.11 3.81 7.06 11.89 3.01 6.38 3.49
2.04 10.72
4.46 9.70 5.14 2.45 4.99 5.35 2.66
2.05 8.65
2.20 1.46 9.30 2.00 4.80 3.95 3.26 – 0.09 7.99
7.17 13.33 6.19 10.31 8.49 9.10 2.83
5.59 12.61
1.97 1.81 4.13 1.28 5.16 2.87 1.68
0.78 4.95
3.65 1.98 8.19 7.20 3.81 4.97 2.61
1.72 8.21
3.39 2.31 1.86 5.97 5.28 3.76 1.80
1.52 6.00
..
..
..
..
..
..
..
..
..
.
.
.
.
.
.
.
.
.
7.30 7.21 1.64 3.54 3.41 4.62 2.52
1.49 7.75
L∗ < 5 < U ∗
1
1
1
1
1
1
1
0
1
1
..
.
1
Nueve de los diez primeros intervalos de confianza contienen la media verdadera. Así
que si se basaran en los resultados de las diez primeras muestras, se estimaría la probabilidad
de cobertura del intervalo de confianza de 0.90. Por supuesto, diez muestras no son suficientes. De las 10 000 muestras, la media verdadera estaba contenida en 9 205 de ellas. Por tanto, se estima la probabilidad de cobertura de 0.9205. Mientras que ésta es menor de 95%, no
es dramáticamente menor. Esta simulación indica que el procedimiento t de Student es bastante fuerte; en otras palabras, que los intervalos de confianza basados en la distribución t de
Student contienen la media verdadera tan a menudo como la deben contener, incluso cuando
la población es un poco diferente de la normal.
Si la población se desvía mucho de la normal, el método t de Student no funciona bien.
(Véase el ejercicio 8.)
Ejercicios para la sección 5.8
1. La presión de aire (en MPa) que entra en un compresor que
se mide de X ⫽ 8.5 ⫾ 0.2, y la que sale se mide de Y ⫽ 21.2
–
⫾ 0.3. Por tanto, la presión intermedia se mide de P ⫽ XY
⫽ 13.42. Suponga que X y Y provienen de poblaciones normales y no tienen sesgos.
a) ¿A partir de qué distribuciones es apropiado simular los
valores X* y Y*?
b) Genere muestras simuladas de los valores X*, Y* y P*.
c) Utilice el método de propagación del error para calcular
la desviación estándar de P. (Puede usar la muestra simulada.)
d ) Construya una gráfica de probabilidad normal para los
valores P*. ¿Es razonable suponer que P está aproximadamente normal distribuida?
e) Si es apropiado, use la curva normal para encontrar un
intervalo de confianza de 95% para la presión intermedia.
2. La masa (en kg) de una muestra de tierra se mide de X ⫽
1.18 ⫾ 0.02. Después la muestra es deshidratada en un horno, la masa de la tierra deshidratada es de Y ⫽ 0.85 ⫾ 0.02.
Suponga que X y Y provienen de poblaciones normales y no
tienen sesgos. El contenido de agua de la tierra se mide de
5.8
Uso de simulación para construir intervalos de confianza
b) Utilice el método de propagación del error para calcular
la desviación estándar de T (puede usar la muestra simulada).
X⫺Y
W ⫽ ———
X
a) ¿Con cuál distribución es adecuado simular los valores
de X* y Y*?
b) Genere muestras simuladas de valores X*, Y* y W*.
c) Use el método de propagación del error para calcular la
desviación estándar de W (puede usar la muestra simulada).
d) Construya una gráfica de probabilidad normal para los
valores de W*. ¿Es razonable suponer que W está distribuida normalmente?
e) Si es apropiado, utilice la curva normal para encontrar
un intervalo de confianza de 95% para el contenido de
agua.
3. Un estudiante mide la aceleración A de un carro que se está moviendo hacia abajo de un plano inclinado midiendo el
tiempo T cuánto le toma al carro recorrer 1 m y usando la
fórmula A ⫽ 2/T2. Suponga que T ⫽ 0.55 ⫾ 0.01 s, y que
la medición proviene de una población de normal y no tiene sesgos.
a) Genere una muestra simulada adecuada de valores de
A*. Es razonable suponer que A se distribuye normalmente.
b) Utilice el método de propagación del error para calcular
la desviación estándar de A. (Por otra parte, puede usar
la muestra simulada.)
c) Si es adecuado, utilice la curva normal para encontrar un
intervalo de confianza de 95% para la aceleración del
carro.
4. La temperatura inicial de cierto recipiente se mide de T0 ⫽
20°C. La temperatura ambiental se mide de Ta ⫽ 4°C. Un
ingeniero utiliza la ley de enfriamiento de Newton para calcular el tiempo necesario para enfriar el recipiente a una
temperatura de 10°C. Tomando en cuenta las propiedades
físicas del recipiente, este tiempo (en minutos) se calcula de
T = 40 ln
T0 − Ta
10 − Ta
361
Suponga que las mediciones de temperatura T0 y Ta no tienen sesgos y que provienen de poblaciones normales con
desviación estándar de 0.1°C.
a) Genere una muestra simulada adecuada de valores T*.
¿Es razonable suponer que T está distribuida normalmente?
c) Si es adecuado, utilice la curva normal para encontrar un
intervalo de confianza de 95% para el tiempo necesario
para enfriar el recipiente a una temperatura de 10°C.
5. En el artículo “Occurrence and Distribution of Ammonium
in Iowa Groundwater” (K. Schilling, en Water Environment
Research, 2002:177-186), se midieron concentraciones de
amonio (en mg/l) en un gran número de pozos en Iowa. Éstas incluían 349 pozos aluviales y 143 pozos cuaternarios.
Las concentraciones en los pozos de aluviales promediaban
0.27 con una desviación estándar de 0.40, y aquellos en los
pozos cuaternarios determinaron el promedio de 1.62 con
una desviación estándar de 1.70. Debido a que estas desviaciones estándares están basadas en muestras grandes, suponga que son despreciables a diferencia de las desviaciones
estándares poblacionales. Una estimación para la razón de
la media de la concentración en pozos cuaternarios con la
media de la concentración en pozos aluviales es R ⫽
1.62/0.27 ⫽ 6.00.
a) Puesto que las medias muestrales 1.62 y 0.27 están basadas en muestras grandes, es razonable suponer que
provienen de poblaciones normales. ¿Qué distribución
se aproxima a la distribución de la media muestral de
concentración de pozos aluviales, N(0.27, 0.402) o
N(0.27, 0.402/349)? ¿Qué distribución se aproxima a la
distribución de la media muestral de concentración de
pozos cuaternarios, N(1.62, 1.702) o N(1.62, 1.702/143)?
Explique.
b) Genere una muestra simulada de las medias muestrales
y de las proporciones de las medias muestrales. ¿Es razonable suponer que la proporción R está distribuida
normalmente?
c) Utilice el método de la propagación del error para estimar la desviación estándar de R (puede usar la muestra
simulada).
d) Si es adecuado, utilice la curva normal para encontrar un
intervalo de confianza de 95% para la proporción de las
medias de las concentraciones.
6. En el ejemplo 5.20 (de la sección 5.3) se presentaron las
mediciones siguientes para la fuerza compresiva cilíndrica
(en MPa) para 11 vigas:
38.43
38.43
38.43
38.31
38.39
38.32
38.83
38.48
38.45
38.50
38.35
Se generaron 1 000 muestras de estimación bootstrap a partir
de estos datos, y las medias muestrales de estimación bootstrap
362
CAPÍTULO 5
Intervalos de confianza
se arreglaron en orden. Denotando al valor más pequeño
con Y1, el segundo más pequeño como Y2, y así sucesivamente, siendo el más grande Y1 000. Suponga que Y25 ⫽
38.3818, Y26 ⫽ 38.3818, Y50 ⫽ 38.3909, Y51 ⫽ 38.3918,
Y950 ⫽ 38.5218, Y951 ⫽ 38.5236, Y975 ⫽ 38.5382 y Y976 ⫽
38.5391.
a) Calcule un intervalo de confianza de estimación bootstrap de 95% para la media de la fuerza compresiva,
usando el método 1 como se describe en la p. 358.
b) Calcule un intervalo de confianza de estimación bootstrap de 95% para la media de la fuerza compresiva,
usando el método 2, como se describe en la p. 358.
c) Calcule un intervalo de confianza de estimación bootstrap de 90% para la media de la fuerza compresiva,
usando el método 1, como se describe en la p. 358.
d) Calcule un intervalo de confianza de estimación bootstrap de 90% para la media de la fuerza compresiva,
usando el método 2, como se describe en la p. 358.
7. Con referencia al ejercicio 6.
a) Genere 1 000 muestras de estimación bootstrap de estos
datos. Determine los percentiles 2.5 y 97.5.
0.4
0.3
0.2
0.1
0
⫺4 ⫺3 ⫺2 ⫺1 0
8. Este ejercicio continúa con el estudio de la fortaleza del método t de Student para construir intervalos de confianza. La
siguiente figura muestra gráficas de las funciones de densidad de probabilidad para la distribución de N(0, 1), la distribución lognormal con m ⫽ 1 y s2 ⫽ 0.25, y la
distribución gamma con r ⫽ 0.5 y λ ⫽ 0.5 (esta última también se conoce como distribución Ji-cuadrada con un grado
de libertad). Para cada una de estas distribuciones, genere
10 000 muestras de tamaño 5, y para cada muestra calcule
los límites superior e inferior de un intervalo de confianza
de 95% con el método t de Student. [Si fuera necesario, es
posible calcular valores aleatorios lognormal y gamma a
partir de valores aleatorios de la normal. Específicamente,
calcule un valor X de una distribución de lognormal con
m ⫽ 1 y s2 ⫽ 0.25, genere Y ⬃ N(1, 0.25) y calcule X ⫽ eY.
Para generar un valor de X a partir de una distribución gamma con r ⫽ 0.5 y λ ⫽ 0.5, genere Y ⬃ N(0, 1) y calcule a
X ⫽ Y2].
2
3
4
0.4
0.3
0.2
0.1
0
0
b) Calcule un intervalo de confianza de estimación bootstrap de 95% para la media de la fuerza compresiva,
usando el método 1, como se describe en la p. 358.
c) Calcule un intervalo de confianza de estimación bootstrap de 95% para la media de la fuerza compresiva,
usando el método 2, como se describe en la p. 358.
1
Distribución normal con
m = 0, s2 = 1
2
4
6
8
10
Distribución lognormal con
m = 1, s2 = 0.25
12
2
1.5
1
0.5
0
0
1
2
3
4
5
Distribución gamma con
r = 0.5 y l = 0.5
a) La media verdadera de la distribución N(0, 1) es 0. Con
base en los resultados de simulación, estime la probabilidad de cobertura (proporción muestral para las que el
intervalo de confianza contiene la media verdadera) para muestras de tamaño 5 de la distribución N(0, 1). (En
virtud de que los supuestos subyacentes del método t del
estudiante se satisfacen aquí, su respuesta debe ser muy
cercana a 95%.)
5.8
Uso de simulación para construir intervalos de confianza
b) La media verdadera de la distribución lognormal con m ⫽ 1,
s2 ⫽ 0.25 es 3.0802. Con base en los resultados de simulación, calcule la probabilidad de cobertura (la proporción de muestras para las que el intervalo de confianza
contiene a la media verdadera) para muestras de tamaño
5 de la distribución lognormal con m ⫽ 1, s2 ⫽ 0.25.
c) La media verdadera de la distribución gamma con r ⫽ 0.5
y λ ⫽ 0.5 es l. Con base en los resultados de simulación,
calcule la probabilidad de cobertura (la proporción de
muestras para las cuales el intervalo de confianza contiene a la media verdadera) para muestras de tamaño 5
de la distribución gamma con r ⫽ 0.5 y λ ⫽ 0.5.
9. Este ejercicio está diseñado para comparar el desempeño del
intervalo de confianza de Agresti-Coull para una proporción
(expresión 5.5 en la p. 316) con la del intervalo de confianza tradicional (expresión 5.8 en la p. 319). Se usarán tamaños muestrales de n ⫽ 10, n ⫽ 17, y n ⫽ 40, con p ⫽ 0.5.
a) Genere 10 000 observaciones X*i , cada una de una distribución binomial con n ⫽ 10 y p ⫽ 0.5. Para cada observación, calcule los límites superior e inferior tanto para
el intervalo de confianza de Agresti-Coull de 95% como
para el tradicional. Para cada intervalo de confianza, calcule su longitud (límite superior-límite inferior). Utilice
los datos simulados para calcular la probabilidad de cobertura y la media del ancho tanto para el intervalo de
confianza de Agresti-Coull como para el tradicional.
b) Repita el inciso a), usando n ⫽ 17.
c) Repita el inciso a), usando n ⫽ 40.
d) El desempeño del intervalo de confianza tradicional no
mejora regularmente conforme el tamaño muestral aumenta; en lugar de eso oscila, por lo que la probabilidad
de cobertura puede ser mejor para una muestra más pequeña que para una más grande. Compare las probabilidades de cobertura con el método tradicional para tamaños
muestrales de 17 y de 40. ¿Sus resultados confirman este hecho?
e) ¿Para qué tamaños muestrales el intervalo Agresti-Coull
tiene mayor probabilidad de cobertura que con el tradicional? ¿Para qué tamaños muestrales son las probabilidades de cobertura casi iguales?
f ) Otras cosas serán iguales, un intervalo de confianza más
angosto es mejor que uno más amplio. ¿Qué método pro-
363
duce intervalos de confianza con media del ancho más
angosta?
10. Un método general para encontrar un intervalo de confianza para la diferencia entre dos medias poblacionales normales está dado por la expresión (5.21) en la p. 341. Se puede
usar un método combinado cuando se sabe que las varianzas de las poblaciones son iguales y está dado por la expresión (5.22) en la p. 343. Este ejercicio está diseñado para
comparar las probabilidades de cobertura de estos métodos
bajo una variedad de condiciones.
a) Sea nX ⫽ 10, nY ⫽ 10, sX ⫽ l y sY ⫽ 1. Genere 10 000
pares de muestras: X*1i, . . . , X*1nX de una distribución
N(0, sX2), y Y*1i, . . . , Y*1nY de distribución N(0, sY2). Para
cada par de muestras, calcule un intervalo de confianza
de 95% con el método general, y otro de 95% utilizando el método combinado. Observe que cada población
tiene media 0, por lo que la diferencia verdadera entre
medias es 0. Estime la probabilidad de cobertura para
cada método calculando la proporción de intervalos de
confianza que contienen al valor verdadero 0.
b) Repita el inciso a), utilizando nX ⫽ 10, nY ⫽ 10, sX ⫽ l
y sY ⫽ 5.
c) Repita el inciso a), utilizando nX ⫽ 5, nY ⫽ 20, sX ⫽ l y
sY ⫽ 5.
d ) Repita el inciso a), utilizando nX ⫽ 20, nY ⫽ 20, sX ⫽ l
y sY ⫽ 5.
e) La probabilidad de cobertura para el método general es
diferente de 95% en cualesquiera de las condiciones de
los incisos a) al d )? (Esto no se debe hacer.)
f ) Con base en los resultados de los incisos a) al d), ¿bajo
qué condiciones el desempeño del método combinado
sería más malo?
i) Cuando los tamaños muestrales son iguales y las varianzas son diferentes.
ii) Cuando tanto los tamaños muestrales como las varianzas son diferentes, y la muestra más grande proviene de la población con la varianza más grande.
iii) Cuando tanto los tamaños muestrales como las varianzas son diferentes, y la muestra más pequeña
proviene de la población con la varianza más grande.
364
Intervalos de confianza
CAPÍTULO 5
Ejercicios adicionales para el capítulo 5
1. Un biólogo molecular está estudiando la eficacia de una
enzima especial para digerir cierta secuencia de nucleótidos del ADN. Divide seis muestras de ADN en dos partes,
trata una parte con la enzima, y deja la otra parte sin tratar.
Después analiza utilizando una reacción en cadena de polimerasa para contar el número de fragmentos de ADN que
contienen la secuencia dada. Los resultados son los siguientes:
Muestra
1
2
3
4
5
6
Enzima presente 22
Enzima ausente 43
16
34
11
16
14
27
12
10
30
40
Determine un intervalo de confianza del 95% para la diferencia entre la media de los números de fragmentos.
2. Con referencia al ejercicio 1, otra bióloga molecular repite
el estudio con un diseño diferente. Toma 12 muestras de
ADN, y después elige seis aleatoriamente para tratarlas con
la enzima y seis permanecen sin tratamiento. Los resultados
son los siguientes:
Enzima presente:
12
15
14
22
22
20
Enzima ausente:
23
39
37
18
26
24
c) ¿Cuántos alambres se deben probar con el propósito de
que un intervalo de confianza de 98% especificará la
media dentro de ⫾ 0.1 mΩ?
5. Una muestra de 125 piezas de hilo tuvo una media de fuerza de ruptura de 6.1 N y una desviación estándar de 0.7 N.
Se hizo un nuevo grupo de hilo, usando nuevas materias primas de un distribuidor diferente. En una muestra de 75 piezas de hilo del nuevo grupo, la media de la fuerza de ruptura
era de 5.8 N y la desviación estándar de 1.0 N. Encuentre
un intervalo de confianza de 90% para la diferencia en la
media de la fuerza de ruptura entre los dos tipos de hilos.
6. Con referencia al ejercicio 5 se muestrean más piezas de hilo con el fin de mejorar la precisión del intervalo de confianza. ¿Cuál incrementaría más la precisión: muestrear 50
piezas más de hilo del grupo viejo, 50 piezas más provenientes del nuevo grupo, o 25 piezas más de cada uno de los
grupos?
7. La fuga de tanques de combustible subterráneos ha sido una
fuente de contaminación del agua. En una muestra aleatoria
de 87 estaciones de gasolina, se encontró que 13 tenían al
menos un tanque subterráneo con fuga.
a) Determine un intervalo de confianza de 95% para la proporción de estaciones de gasolina con, por lo menos, un
tanque subterráneo con fuga.
Determine un intervalo de confianza de 95% para la diferencia entre la media de los números de fragmentos.
b) ¿Cuántas estaciones se deben muestrear para que un intervalo de confianza de 95% especifique la proporción
dentro de ⫾ 0.03?
3. El artículo “Genetically Based Tolerance to Endosulfan,
Chromium (VI) and Fluoranthene in the Grass Shrimp Palaemonetes pugio” (R. HarperArabie, Tesis de doctorado,
Escuela de Minas, de Colorado, 2002) informa que de 1 985
huevos producidos por el langostino en el sitio Diesel Creek
en Charleston, Carolina del Sur, 1 919 incubaron, y en el sitio
de Shipyard Creed, también en Charleston, de 4 561, 4 988
incubaron. Determine un intervalo de confianza de 99% para la diferencia entre las proporciones de huevos que se incubaron en los dos sitios.
8. Un nuevo catalizador está siendo investigado para el uso en
la producción de un plástico químico. Se producen diez grupos del producto químico. La media de la producción de los
diez grupos es 72.5% y la desviación estándar es 5.8%. Suponga que las producciones son independientes y normalmente distribuidas. Encuentre un intervalo de confianza de
99% para la media de la producción cuando se usa un nuevo catalizador.
4. Se hicieron mediciones de resistencia en una muestra de 81
alambres de cierto tipo. La media muestral de resistencias
era de 17.3 mΩ y la desviación estándar era de 1.2 mΩ.
9. Se calculan tres intervalos de confianza para la media de la
fuerza de corte (en ksi) de pernos de anclaje de un tipo dado, todos de la misma muestra. Los intervalos son (4.01,
6.02), (4.20, 5.83) y (3.57, 6.46). Los niveles de los intervalos son 90, 95 y 99%. ¿Qué intervalo tiene cada nivel?
a) Determine un intervalo de confianza de 98% para la media de la resistencia de este tipo de alambre.
b) ¿Cuál es el nivel del intervalo de confianza (17.1, 17.5)?
10. Se realiza una encuesta en la que a una muestra aleatoria de
residentes en cierta ciudad se les preguntará si están en fa-
Ejercicios adicionales para el capítulo 5
vor o se oponen a la construcción de un nuevo estacionamiento en el centro. ¿A cuántos residentes se les debe preguntar para asegurar que un intervalo de confianza de 95%
para la proporción que favorece la construcción especifica
que proporción está dentro de ⫾0.05?
11. En el artículo “Groundwater Electromagnetic Imaging in
Complex Geological and Topographical Regions: A Case
Study of a Tectonic Boundary in the French Alps” (S. Houtot, P. Tarits y colaboradores, Geophysics, 2002:10481060), se midió el pH para varias muestras de agua en
diferentes localizaciones cerca del lago Gittaz en los Alpes
franceses. Los resultados para 11 localizaciones en el lado
norte del lago y para seis localizaciones en el lado sur son
las siguientes:
Lado norte:
Lado sur:
8.1
7.3
7.8
8.2
7.4
8.2
8.1
8.1
7.9
8.2
8.1
7.9
8.2
7.9
8.1
7.4
8.1
Determine un intervalo de confianza de 98% para la diferencia en pH entre el lado norte y el sur.
12. Los policlorobifenilos (PCB) son un grupo de químicos sintéticos parecidos al aceite que fueron en un tiempo ampliamente usados como aislantes de equipo eléctrico y se
descargaban en ríos. Se descubrió que presentaban un riesgo
para la salud y se prohibieron en la década de 1970. Desde
entonces se ha dedicado mucho esfuerzo para dar seguimiento a las concentraciones de PCB en canales navegables. Suponga se están extrayendo muestras de agua de un
canal navegable con el fin de calcular la concentración de
PCB.
a) Suponga que una muestra aleatoria de tamaño 80 tiene
una media muestral de 1.69 ppb y desviación estándar
muestral de 0.25 ppb. Determine un intervalo de confianza de 95% para la concentración de PCB.
b) Calcule el tamaño muestral necesario con el propósito
de que un intervalo de confianza de 95% especificará
que la media poblacional está dentro de ⫾0.02 ppb.
13. Se calcula un intervalo de confianza de 90% para una media poblacional basada en 144 observaciones de (2.7, 3.4).
¿Cuántas observaciones se debe hacer para que dicho intervalo de confianza de 90% especificara la media dentro de
⫾0.2?
14. Se extrae una muestra de 100 componentes, y un intervalo
de confianza de 95% para la proporción de componentes
defectuosos especifica esta proporción dentro de ⫾0.06. Para obtener una estimación más precisa del número de com-
365
ponentes defectuosos, el tamaño muestral se incrementará a
400, y el intervalo de confianza será nuevamente calculado.
¿Cuál será el ancho aproximado del nuevo intervalo de confianza? Elija la mejor respuesta:
i) ⫾0.015
ii) ⫾0.03
iii) ⫾0.06
iv) ⫾0.12
v) ⫾0.24
15. Un metalúrgico hace varias mediciones de la temperatura de
fusión de cierta aleación y calcula un intervalo de confianza
de 95% de 2 038 ⫾ 2°C. Suponga que el proceso de medición de la temperatura no está sesgado. Verdadero o falso:
a) Hay una probabilidad de 95% de que la temperatura de
fusión verdadera esté en el intervalo 2 038 ⫾ 2°C.
b) Si el experimento fuera repetido, la probabilidad es de
95% de que la media de la medición de ese experimento estaría en el intervalo 2 038 ⫾ 2°C.
c) Si el experimento fuera repetido, y un intervalo de confianza de 95% se calcula, hay una probabilidad de 95%
de que el intervalo de confianza contendría al punto de
fusión verdadero.
d ) Si se hubiera hecho una medición más, la probabilidad
es de 95% de que estaría en el intervalo 2 038 ⫾ 2°C.
16. En un estudio de tiempos de vida de componentes electrónicos, una muestra aleatoria de 400 componentes es evaluado hasta que dejan de funcionar. La media muestral de los
tiempos de vida era de 370 horas y la desviación estándar
era de 650 horas. Verdadero o falso:
a) Un intervalo de confianza de 95% aproximado para la
media de los tiempos de vida de este tipo de componente es de 306.3 a 433.7 horas.
b) Aproximadamente el 95% de los componentes de la
muestra tenía tiempos de vida entre 306.3 y 433.7 horas.
c) Si alguien toma una muestra aleatoria de 400 componentes, divide la desviación estándar muestral de sus
tiempos de vida entre 20, y después suma y resta esa
cantidad a la media muestral, existe una posibilidad de
68% de que el intervalo así construido contenga la media del tiempo de vida de este tipo de componente.
d) La tabla z no se puede usar para construir intervalos de
confianza aquí, porque los tiempos de vida de los componentes no siguen la curva normal.
e) ¿Aproximadamente 68% de los componentes tenía
tiempos de vida en el intervalo 370 ⫾ 650 horas?
366
CAPÍTULO 5
Intervalos de confianza
17. La temperatura de cierta solución se calcula tomando muchas mediciones independientes y determinando el promedio de ellas. El cálculo aproximado es de 37°C y la
incertidumbre (desviación estándar) en esta estimación es
0.1°C.
20. Es necesaria la respuesta al inciso d) del ejercicio 19 para la
realización de este ejercicio. Un geólogo cuenta 64 partículas emitidas en un minuto por cierta roca radiactiva.
a) Determine un intervalo de confianza de 95% para la
temperatura.
b) ¿Cuál es el nivel de confianza del intervalo 37 ⫾ 0.1°C?
b) Después de cuatro minutos, se cuentan 256 partículas.
Determine un intervalo de confianza de 95% para la tasa de emisiones en unidades de partículas por minuto.
c) Si sólo se había hecho una pequeña cantidad de mediciones independientes, ¿qué suposición adicional sería
necesaria para calcular un intervalo de confianza?
c) ¿Por cuántos minutos se debe contar los errores para que
el intervalo de confianza de 95% especifique la tasa dentro de una partícula por minuto?
d) Haciendo la suposición adicional, calcule un intervalo
de confianza de 95% para la temperatura si hubieran hecho diez mediciones.
18. Cajas de clavos contienen 100 clavos cada una. Se extrae
una muestra de diez cajas, y cada una de las cajas es pesada.
El promedio del peso es de 1 500 g y la desviación estándar
es de 5 g. Suponga que el peso de la caja misma es despreciable, por lo que todo el peso es atribuible a los clavos en
la caja.
a) Sea mcaja la media del peso de una caja de clavos. Determine un intervalo de confianza de 95% para mcaja.
b) Sea mclavo la media del peso de un clavo. Exprese mclavo
en función de mcaja.
c) Determine un intervalo de confianza de 95% para mclavo.
19. Sea X el número de eventos que se observa que ocurren en
n unidades de tiempo o espacio, y suponga que X ⬃ Poisson(nλ), donde λ es la media del número de eventos que
ocurren en una unidad de tiempo o espacio. Suponga que X
es grande, por lo que X ⬃ N(nλ, nλ). Con los siguientes incisos del a) al d ) se deduce un intervalo de confianza de nivel 100(1 ⫺ α)% para λ. Después, en el inciso e), se le pide
que aplique el resultado encontrado en el inciso d ).
a) Muestre que para una proporción 1 ⫺ α de todas las posibles muestras, X ⫺ za/2sX ⬍ nλ ⬍ X ⫹ za/2sX.
b) Sea λ̂ ⫽ X/n. Muestre que s λ̂ ⫽ sX/n.
c) Concluya que para una proporción 1 ⫺ α de todas las
muestras posibles, λ̂ ⫺ za/2s λ̂ ⬍ λ ⬍ λ̂ ⫹ za/2s λ̂.
—
d) Utilice el hecho de que s λ̂ ⬇ λ̂/n para deducir una expresión para un intervalo de confianza de nivel 100(1 ⫺
α)% para λ.
e) Una muestra de 5 ml de cierta suspensión contiene 300
partículas. Sea λ la media del número de partículas por
ml en la suspensión. Determine un intervalo de confianza de 95% para λ.
a) Determine un intervalo de confianza de 95% para la tasa de emisiones en unidades de partículas por minuto.
21. En un flujo de Couette, dos placas planas grandes caen una
encima de otra, separadas por una capa fina de fluido. Si se
aplica una fuerza de corte a la placa superior, la viscosidad
del fluido también produce movimiento en la placa inferior.
La velocidad V en la placa superior con respecto a la placa
inferior está dada por V ⫽ τh/m, donde τ es la tensión de
corte aplicada en la placa superior, h es el espesor de la capa de fluido y m es la viscosidad del fluido.
Suponga que m, h y τ son medidos por separado y que
las mediciones no tienen sesgos y están distribuidas normalmente. Los valores medidos son m ⫽ 1.6 Pa⋅ s, h ⫽ 15 mm
y τ ⫽ 25 Pa. Las incertidumbres (desviaciones estándares)
de estas mediciones son sm ⫽ 0.05, sh ⫽ 1.0 y sτ ⫽ 1.0.
a) Utilice el método de la propagación del error para calcular V y su incertidumbre sV.
b) Suponiendo que la estimación de V esté distribuida normalmente, determine un intervalo de confianza de 95%
para V.
c) Realice una simulación para determinar si es o no válido el intervalo de confianza encontrado en el inciso b).
22. Una muestra de siete bloques de concreto tenía su fuerza de
compresión medida en MPa. Los resultados fueron
1 367.6 1 411.5 1 318.7 1 193.6 1 406.2
1 425.7 1 572.4
Diez mil muestras de estimación bootstrap se generaron a
partir de estos datos, y las medias de la estimación bootstrap
fueron arregladas en orden. Denotando a la media más pequeña por Y1, la segunda más pequeña por Y2, y así sucesivamente, siendo la más grande Y10 000. Suponga que
Y50 ⫽
Y101 ⫽
Y500 ⫽
Y9 501 ⫽
Y9 900 ⫽
Y9 951 ⫽
1 283.4,
1 291.5,
1 318.5,
1 449.7,
1 476.2,
1 483.8.
Y51 ⫽
Y250 ⫽
Y501 ⫽
Y9 750 ⫽
Y9 901 ⫽
1 283.4,
1 305.5,
1 318.5,
1 462.1,
1 476.2,
Y100 ⫽
Y251 ⫽
Y9 500 ⫽
Y9 751 ⫽
Y9 950 ⫽
1 291.5,
1 305.5,
1 449.7,
1 462.1,
1 483.8 y
Ejercicios adicionales para el capítulo 5
a) Calcule un intervalo de confianza de estimación bootstrap de 95% para la media de la fuerza compresiva,
usando el método 1, como se describe en la p. 358.
b) Calcule un intervalo de confianza de estimación bootstrap de 95% para la media de la fuerza compresiva,
usando el método 2, como se describe en la p. 358.
c) Calcule un intervalo de confianza de estimación bootstrap de 99% para la media de la fuerza compresiva,
usando el método 1, como se describe en la p. 358.
d) Calcule un intervalo de confianza de estimación bootstrap de 99% para la media de la fuerza compresiva,
usando el método 2, como se describe en la p. 358.
367
23. Con referencia al ejercicio 22.
a) Genere 10 000 muestras de estimación bootstrap de los
datos del ejercicio 22. Encuentre la media de estimación
bootstrap en la muestra de los percentiles que se usan
para calcular un intervalo de confianza de 99 por ciento.
b) Calcule un intervalo de confianza de estimación bootstrap de 99% para la media de la fuerza compresiva,
usando el método 1, como se describe en la p. 358.
c) Calcule un intervalo de confianza de estimación bootstrap de 99% para la media de la fuerza compresiva,
usando el método 2, como se describe en la p. 358.
Capítulo
6
Pruebas de hipótesis
Introducción
En el ejemplo 5.2 (sección 5.l) una muestra de 50 microperforadoras tenía un tiempo de vida
–
promedio de X ⫽ 12.68 huecos perforados con una desviación estándar de s ⫽ 6.83. Supóngase que la cuestión principal es responder si la media poblacional m de los tiempos de vida
es o no mayor de 11. Esta cuestión se aborda cuando se examina el valor de la media mues–
–
–
tral X . Se nota que X ⬎ 11, pero debido a la incertidumbre en X no se garantiza que m ⬎ 11.
Nos gustaría conocer con qué certeza consideramos que m ⬎ 11. Un intervalo de confianza
no es todo lo que se necesita. En el ejemplo 5.2 se calculó un intervalo de confianza de 95%
para la media poblacional m de (10.79, 14.57). Éste indica una confianza de 95% de que m está entre 10.79 y 14.57. Pero el intervalo de confianza no indica directamente cuánta confianza se tiene de que m ⬎ 11.
El enunciado “m ⬎ 11” constituye una hipótesis acerca de la media poblacional m. Con
el propósito de determinar cómo se logra la certeza de que una hipótesis semejante es verdadera se debe realizar una prueba de hipótesis. Esta última produce un número entre 0 y 1 que
mide el grado de certeza que se puede tener de la validez de una hipótesis con respecto a una
cantidad, como una media o proporción de la población. Lo anterior da como resultado que
las pruebas de hipótesis estén estrechamente relacionadas con los intervalos de confianza. En
general, siempre que se pueda calcular un intervalo de confianza, se puede realizar una prueba de hipótesis, y viceversa.
6.1
Pruebas de hipótesis para la media poblacional
con muestras grandes
Se inicia con un ejemplo. Cierto tipo de motor de automóvil emite una media de 100 mg de
óxidos de nitrógeno (NOx) por segundo con 100 caballos de fuerza. Se ha propuesto una modificación al diseño del motor para reducir las emisiones de NOx. El nuevo diseño se produ-
368
6.1
Pruebas de hipótesis para la media poblacional con muestras grandes
369
cirá si se demuestra que la media de su tasa de emisiones es menor de 100 mg/s. Se construye y se prueba una muestra de 50 motores modificados. La media muestral de emisiones de
NOx es de 92 mg/s, y la desviación estándar muestral es de 21 mg/s.
La población, en este caso, consta de las tasas de emisiones de los motores que serían
construidos si se fabricara este diseño modificado. Si no hubiera incertidumbre en la media
muestral, entonces se podría concluir que la modificación reduciría las emisiones de 100 a 92
mg/s. Por supuesto, hay incertidumbre en la media muestral. La media poblacional en realidad será poco mayor o menor de 92.
Los fabricantes están preocupados de que los motores modificados no puedan reducir
todas las emisiones; es decir, que la media poblacional pudiera ser 100 o mayor. Quieren saber si esta preocupación está justificada. La pregunta, por tanto, es: ¿Es factible que esta
muestra, con media de 92, pudiera provenir de una población cuya media es 100 o mayor?
Éste es el tipo de preguntas que las pruebas de hipótesis están diseñadas para responder, y ahora se construirá una prueba de hipótesis para responderla. Se ha observado una
muestra con media 92. Hay dos interpretaciones posibles de esta observación:
1.
2.
La media poblacional es realmente mayor que o igual a 100, y la media muestral es menor
que ésta sólo debido a la variación aleatoria de la media poblacional. Por tanto, las emisiones no bajarán si el nuevo diseño de producciones produce, y la muestra es engañosa.
La media poblacional es en realidad menor que 100, y la media muestral refleja este hecho. Por tanto, la muestra representa una diferencia verdadera que se puede esperar si el
nuevo diseño se fabrica.
Estas dos explicaciones tienen nombres comunes. La primera se llama hipótesis nula. En la
mayoría de las situaciones, la hipótesis nula establece que el efecto que indica la muestra es
atribuible solamente a la variación aleatoria entre la muestra y la población. La segunda se denomina hipótesis alternativa. Esta hipótesis alternativa establece que el efecto que indica la
muestra es verdadero, ya que representa a toda la población.
En este ejemplo, los fabricantes de motores están preocupados de que la hipótesis nula
pudiera ser verdadera. Una prueba de hipótesis asigna una medida cuantitativa a la factibilidad de la hipótesis nula. Después de realizar una prueba de hipótesis, se podría decir a los fabricantes, en términos numéricos, qué tan valida es su preocupación.
Para hacer las cosas más precisas, todo se expresa mediante símbolos. La hipótesis nula se denota con H0. La hipótesis alternativa se denota mediante H1. Como es usual, la media
poblacional es m. Por tanto, se tiene,
H0: m ⱖ 100
contra
H1: m ⬍ 100
Esencialmente, para realizar una prueba de hipótesis se pone la hipótesis nula en juicio. Se
empieza suponiendo que H0 es verdadera, de la misma manera como se empieza un juicio bajo el supuesto de que un acusado es inocente. La muestra aleatoria proporciona la evidencia.
La prueba de hipótesis implica medir la fuerza del desacuerdo entre la muestra y H0 para producir un número entre 0 y 1, llamado P-valor. Éste mide la factibilidad de H0. Entre menor
sea el P-valor, más fuerte será la evidencia en contra de H0. Si el P-valor es suficientemente
pequeño, se puede estar dispuesto a abandonar la suposición de que H0 es verdadera y creer,
en su lugar, que H1 es verdadera. Lo anterior se llama rechazar la hipótesis nula.
370
CAPÍTULO 6
Pruebas de hipótesis
En este ejemplo, sean X1, . . . , X50 las tasas de emisiones medidas de los 50 motores de
–
la muestra. El valor observado de la media muestral es X ⫽ 92. También se necesitará conocer la desviación estándar muestral, que es s ⫽ 21. Se debe evaluar la factibilidad de H0, que
dice que la media poblacional es de 100 o mayor, dado que se ha observado una muestra de
esta población, cuya media es solamente 92. Dicho procedimiento se realizará en dos pasos,
de la siguiente manera:
1.
2.
–
Se calculará a la distribución de X bajo el supuesto de que H0 es verdadera. Esta distri–
bución se llama distribución nula de X .
Se calculará el P-valor. Éste es la probabilidad, bajo el supuesto que H0 sea verdadera, de
–
observar un valor de X, cuyo desacuerdo con H0 sea al menos tan grande como el valor observado de 92.
–
Para realizar el paso 1, observe que X es la media de una muestra grande, así que el teorema del límite central especifica que proviene de una distribución normal, cuya media es m
y su varianza es s2/50, donde s2 es la varianza poblacional y 50 el tamaño de muestra. Se deben especificar los valores para m y para s con el fin de determinar la distribución nula. En
virtud de que se está suponiendo que H0 es verdadera, se supone que m ⱖ 100. Esto último
no proporciona un valor específico para m. Se toma como el valor supuesto para m el valor
más cercano a la hipótesis alternativa H1, por razones que se explicarán posteriormente en esta sección. Por tanto, se supone que m ⫽ 100. No se conoce la desviación estándar poblacional s. Sin embargo, debido a que la muestra es grande, se puede aproximar a s con la
–
desviación estándar muestral s ⫽ 21. Por tanto, se ha determinado
√ que bajo H0, X tiene una
distribución normal con media 100 y desviación estándar 21/ 50 = 2.97. La distribución
–
nula es X ⬃ N(100, 2.972).
Ahora se está listo para el paso 2. La figura 6.1 muestra la distribución nula. El núme–
ro 92 indica el punto de la distribución correspondiente al valor observado de X . ¿Qué tan factible es que un número muestreado de esta distribución sea tan pequeño como 92? Lo anterior
se mide con el P-valor. Éste constituye la probabilidad de que un número extraído de la distribución nula esté en desacuerdo con H0 al menos tan intensamente como el valor observado
–
–
de X que de 92. Dado que H0 especifica que la media de X es mayor que o igual a 100, los
valores menores de 92 están en desacuerdo mayor con H0. Por tanto, el P-valor es la probabilidad de que un número extraído de una distribución N(100, 2.972) sea menor o igual a 92.
Esta probabilidad se determina al calcular el puntaje z:
z=
92 − 100
= −2.69
2.97
De la tabla z, la probabilidad de que una variable aleatoria normal estándar z sea menor
que o igual a ⫺2.69 es 0.0036. El P-valor para esta prueba es 0.0036.
Como promete, el P-valor proporciona una medida cuantitativa de la factibilidad de H0.
¿Pero cómo se interpreta esta cantidad? La interpretación adecuada es algo sutil. El P-valor
indica que si H0 fuera verdadera, la probabilidad de extraer una muestra cuya media esté tan
lejos de H0 como el valor observado de 92 es solamente 0.0036. Por tanto, es posible una de
las siguientes dos conclusiones:
6.1
Pruebas de hipótesis para la media poblacional con muestras grandes
371
H0 es falsa.
H0 es verdadera, lo que implica que de todas las muestras que pudieron haber extraído,
solamente el 0.36% tiene una media igual o más pequeña que la muestra que en realidad se extrajo. En otras palabras, la media muestral está en 0.36% más extremo de su
distribución.
P = 0.0036
92
z = ⫺2.69
100
–
–
probabilidad de que X tome un valor tan extremo o más extremo que el valor observado de
FIGURA 6.1 La distribución nula de X es N(100, 2.972). Por tanto, si H0 es verdadera, la
92 es 0.0036. Éste es el P-valor.
En la práctica, los eventos en el 0.36% más extremo de sus distribuciones muy raramente ocurren. Por tanto, se rechaza H0 y se concluye que los nuevos motores tendrán emisiones menores.
La hipótesis nula en este caso especifica solamente que m ⱖ 100. Suponiendo que H0
es verdadera, ¿por qué se eligió el valor m ⫽ 100, que es el más cercano a H1? Para dar una
prueba justa a la H0, se debe evaluar en su forma más factible. El valor más factible para m,
suponiendo que H0 sea verdadera, es el valor más cercano a H1. Para observar lo anterior, vea
la figura 6.1. Suponga que se ha elegido un valor para m mayor a 100 para representar a H0.
Entonces la distribución nula tendría que estar corrida a la derecha. Esto último causaría que
la media muestral de 92 esté aún más lejos en la cola. Entonces el P-valor tendría que ser aún
menor. Por tanto, entre los valores de m consistentes con H0, el más cercano a H1 tiene el
P-valor mayor, y, por tanto, es el más factible. Por esta razón, cuando se supone que H0 es
verdadera, siempre se utiliza el valor del parámetro más cercano a H1 cuando se realiza una
prueba de hipótesis.
Es natural preguntar qué tan pequeño debe ser el P-valor con la finalidad de rechazar
H0. Algunas personas usan la “regla del 5%”; ellas rechazan H0 si P ⱕ 0.05. Sin embargo, no
hay ninguna justificación científica para ésta o cualquier otra regla. Esta cuestión se analiza
más profundamente en la sección 6.2.
Observe que dicho método usa el teorema del límite central. Por eso para que este método sea válido, el tamaño muestral debe ser razonablemente grande, de 30 o mayor. En la
sección 6.4 se presentan las pruebas de hipótesis que algunas veces son válidas para muestras
pequeñas.
Finalmente, observe que el cálculo del P-valor se hizo al calcular un puntaje z. Por tanto, este puntaje se llama estadístico de prueba. Una prueba que usa un puntaje z como un estadístico de prueba se denomina prueba z.
Hay muchas clases de pruebas de hipótesis. Todas siguen una serie básica de pasos, que
se ilustran en el cuadro de la página siguiente.
372
CAPÍTULO 6
Pruebas de hipótesis
Pasos para la realización de una prueba de hipótesis
1. Defina H0 y H1.
2. Suponga que H0 es verdadera.
3. Calcule un estadístico de prueba. Éste constituye un estadístico que se usa para
evaluar la fuerza de la evidencia en contra de H0.
4. Calcule el P-valor del estadístico de prueba. El P-valor es la probabilidad, suponiendo que H0 es verdadera, de que el estadístico de prueba tenga un valor cuya
diferencia con H0 sea tan grande o mayor que el realmente observado. El P-valor
también se llama nivel de significancia observado.
Ejemplo
6.1
El artículo “Wear in Boundary Lubrication” (S. Hsu, R. Munro y M. Shen, en Journal of Engineering Tribology, 2002:427-441) analiza algunos experimentos que implican diferentes lubricantes. En un experimento, 45 bolas de acero, lubricadas con parafina purificada, estaban
sujetas a una carga de 40 kg a 600 rpm durante 60 minutos. El promedio de desgaste, medido por la reducción en el diámetro, era de 673.2 mm, y la desviación estándar era de 14.9 mm.
Suponga que la especificación para un lubricante es que la media del desgaste sea menor de
675 mm. Determine un P-valor para probar H0: m ⱖ 675 contra H1: m ⬍ 675.
Solución
Primero se traduce el problema al lenguaje estadístico. Se tiene una muestra aleatoria simple
–
X1, . . . , X45 de diámetros de desgaste. La media muestral y la desviación estándar son X ⫽
673.2 y s ⫽ 14.9. La media poblacional es desconocida y se denota con m. Antes de entrar a
la construcción de la prueba, se indicará nuevamente que la idea básica es la incertidumbre en la
media muestral. Si no hubiera incertidumbre se concluiría que el lubricante satisfaría la especificación, ya que 673.2 ⬍ 675. La cuestión es si la incertidumbre en la media muestral es suficientemente grande como para que pudiera ser factible que la media poblacional fuera tan
grande como 675.
Para realizar la prueba de hipótesis se siguen los pasos anteriores. La hipótesis nula es
que el lubricante no satisface la especificación, y que la diferencia entre la media muestral de
673.2 y 675 es consecuencia de la aleatoriedad. La hipótesis alternativa es que el lubricante
efectivamente satisface la especificación.
Se supone que H0 es verdadera, ya que la muestra se extrajo de una población con media m ⫽ 675 (el valor más cercano a H1). Se calcula la desviación estándar poblacional s con
–
–
la desviación estándar muestral s ⫽ 14.9. La prueba está basada en√X . Bajo H0, X proviene de
una población normal con media 675 y desviación estándar 14.9/ 45 = 2.22. El P-valor es
la probabilidad de observar una media muestral menor o igual a 673.2. El estadístico de prueba es el puntaje z, que es
z=
673.2 − 675
= −0.81
2.22
6.1
373
Pruebas de hipótesis para la media poblacional con muestras grandes
El P-valor es 0.209 (véase la figura 6.2). Por tanto, si H0 es verdadera, hay una probabilidad de 20.9% de observar una muestra cuyo desacuerdo con H0 es al menos tan grande como la que en realidad fue observada. Puesto que 0.209 no es una probabilidad muy pequeña,
H0 no se rechaza. En vez de esto último, se concluye que H0 es factible. Los datos no muestran que el lubricante satisfaga la especificación. Observe que no se está concluyendo que la
H0 sea verdadera, solamente que es factible. En la sección 6.2 se analizará esta diferencia con
mayor detalle.
P = 0.209
673.2
675
z = ⫺0.81
–
–
probabilidad que X tome un valor tan extremo o más extremo que el valor observado de
FIGURA 6.2 La distribución nula de X es N(675, 2.222). Por tanto, si H0 es verdadera, la
673.2 es 0.209. Éste es el P-valor.
El siguiente resultado de computadora (de MINITAB) presenta los resultados del ejemplo 6.1.
One-Sample Z: Wear
Test of mu = 675 vs < 675
The assumed standard deviation = 14.9
Variable
Wear
N
45
Mean
673.200
StDev
14.9
SE Mean
2.221
95%
Upper
Bound
676.853
Z
−0.81
P
0.209
El resultado establece la hipótesis nula como m ⫽ 675 en vez de m ⱖ 675. Esto último
refleja que para construir la distribución nula se utilizó el valor m ⫽ 675. La cantidad “SE
√
–
Mean” representa la desviación estándar de X , calculado con s/ n. El resultado también proporciona un límite superior de confianza de 95% para m.
En los ejemplos anteriores, la hipótesis nula especifica que la media poblacional era
menor que o igual a algo, o mayor que o igual a algo. En algunos casos, una hipótesis nula
especifica que la media poblacional es igual a un valor específico. El ejemplo 6.2 ilustra el
caso.
Ejemplo
6.2
Se está calibrando una balanza al pesar una pesa de prueba de 1 000 g 60 veces. Las 60 lecturas de la balanza tienen una media de 1 000.6 g y desviación estándar de 2 g. Determine el
P-valor para la prueba H0: m ⫽ 1 000 contra H1: m ⫽ 1 000.
374
CAPÍTULO 6
Pruebas de hipótesis
Solución
Sea m la media poblacional de las lecturas. La hipótesis nula dice que la balanza está calibrada, por lo que la media poblacional m es igual al peso verdadero de 1 000 g, y la diferencia
entre la media muestral de las lecturas y el peso verdadero es atribuible completamente al aspecto aleatorio. La hipótesis alternativa dice que la balanza no está calibrada.
En este ejemplo la hipótesis nula especifica que m es igual a un valor específico, en lugar de ser mayor o igual que o menor o igual que un valor específico. Por esta razón, los va–
lores de X , que son mucho mayores o mucho menores que m, proporcionarán evidencia en
–
contra de H0. En los ejemplos anteriores, sólo los valores de X en un lado de m proporcionan
evidencia en contra de H0.
Se supone que H0 es verdadera, y que, por tanto, las lecturas de la muestra se extrajeron de una población con media m ⫽ 1 000. La desviación estándar poblacional s se aproxi–
ma√con s ⫽ 2. La distribución nula de X es normal con media de 1 000 y desviación estándar
–
2/ 60 = 0.258. El puntaje z del valor observado X ⫽ 1 000.6 es
z=
1 000.6 − 1 000
= 2.32
0.258
Dado que H0 especifica que m ⫽ 1 000, las regiones en ambas colas de la curva están
en mayor desacuerdo con H0 que el valor observado de 1 000.6. El P-valor es la suma de las
áreas de las dos colas, que es 0.0204 (véase la figura 6.3). Por tanto, si H0 es verdadera, la
probabilidad de un resultado mayor o igual que el valor observado es sólo de 0.0204. Las evidencias en contra de H0 son muy fuertes. Sería prudente rechazar H0 y recalibrar la balanza.
0.0102
999.4
z = ⫺2.32
0.0102
1 000
1 000.6
z = 2.32
–
–
ra, la probabilidad de que X tome un valor tan extremo o más extremo que el valor obser-
FIGURA 6.3 La distribución nula de X es N(1 000, 0.2582). Por lo que si H0 es verdadevado de 1 000.6 es 0.0204. Éste es el P-valor.
Cuando H0 especifica un solo valor para m, como en el ejemplo 6.2, ambas colas contribuyen al P-valor, y se dice que la prueba es una prueba de dos lados o de dos colas. Cuando H0 sólo especifica que m es mayor o igual que, o menor que o igual a un valor, sólo
contribuye una cola al P-valor, y la prueba se llama de un lado o de una cola.
Se concluye esta sección con el resumen del procedimiento utilizado para realizar una
prueba de hipótesis para la media poblacional con muestras grandes.
6.1
Pruebas de hipótesis para la media poblacional con muestras grandes
375
Resumen
Sea X1, . . . , Xn una muestra grande (por ejemplo, n > 30) de una población con la
media m y desviación estándar s.
Para probar una hipótesis nula de la forma H0: m ⱕ m0, H0: m ⱖ m0, o H0: m ⫽ m0:
Calcule el puntaje z: z =
X − μ0
√ .
σ/ n
Si s es desconocida se puede aproximar con s.
Calcule el P-valor. Éste constituye un área bajo la curva normal, que depende de la
hipótesis alternativa de la siguiente manera:
Hipótesis alternativa
H1: m ⬎ m0
H1: m ⬍ m0
H1: m ⫽ m0
P-valor
Área a la derecha de z
Área a la izquierda de z
Suma de áreas en las colas correspondientes a z y ⫺z
Ejercicios para la sección 6.1
1. Recientemente muchas compañías han experimentado con
las “telecomunicaciones”, al permitir que sus empleados
trabajen en su casa en sus computadoras. Entre otros factores, se supone que la telecomunicación reduce las faltas por
enfermedad. Suponga que en una compañía se sabe que en
años pasados los empleados faltaron una media de 5.4 días
por enfermedad. Este año la compañía introduce las telecomunicaciones. La dirección elige una muestra aleatoria simple de 80 empleados para estudiarlos en detalle, y, al final
del año, éstos promedian 4.5 días de faltas por enfermedad
con desviación estándar de 2.7 días. Sea m la media del número de días de faltas por enfermedad para todos los empleados de la compañía.
a) Determine el P-valor para probar H0: m ⱖ 5.4 contra H1:
m ⬍ 5.4.
b) Ya sea que la media del número de días de faltas por enfermedad haya disminuido desde la introducción de las
telecomunicaciones, o que la muestra está en el _____%
más extremo de esta distribución.
2. Una muestra aleatoria simple consta de 65 longitudes de
alambre de piano que se probaron para la cantidad de alargamiento bajo una carga de 30 N. El alargamiento promedio para los 65 alambres era de 1.102 mm, y la desviación
estándar, de 0.020 mm. Sea m la media del alargamiento para todas las unidades de alambre de piano.
a) Determine el P-valor para probar H0: m ⱕ 1.1 contra H0:
m ⬎ 1.1.
b) Ya sea que la media del alargamiento para este tipo de
alambre sea mayor que 1.1 mm, o la media muestral está en ________% más extremo de esta distribución.
3. El artículo “Evaluation of Mobile Mapping Systems for
Roadway Data Collection” (H. Karimi, A. Khattak y J.
Hummer, en Journal of Computing in Civil Engineering,
2000:168-173) describe un sistema para medir a distancia
elementos de avenidas, como el ancho de los carriles y las
alturas de las señales de tránsito. Para una muestra de 160
de esos elementos, el error promedio (en porcentaje) en las
mediciones era de 1.90, con desviación estándar de 21.20.
Sea m la media del error en este tipo de medición.
a) Determine el P-valor para probar H0: m ⫽ 0 contra H1:
m ⫽ 0.
b) Ya sea que la media del error para este tipo de medición
es diferente a cero, o que la muestra esté en ________%
más extremo de su distribución.
4. Un inspector midió el volumen de llenado de una muestra
aleatoria simple de 100 latas de jugo cuya etiqueta afirmaba que contenían 12 oz. La muestra tenía una media de volumen de 11.98 oz y desviación estándar de 0.19 oz. Sea m la
media del volumen de llenado para todas las latas de jugo
376
CAPÍTULO 6
Pruebas de hipótesis
recientemente llenadas con esta máquina. El inspector probará H0: m ⫽ 12 contra H1: m ⫽ 12.
a) Determine el P-valor.
b) ¿Piensa que es factible que la media del volumen de llenado es de 12 oz? Explique su razonamiento.
5. Cuando está operando adecuadamente, una planta química
tiene una media de producción diaria de cuando menos 740
toneladas. La producción se mide en una muestra aleatoria
simple de 60 días. La muestra tenía una media de 715 toneladas/día y desviación estándar de 24 toneladas/día. Sea m
la media de la producción diaria de la planta. Un ingeniero
prueba que H0: m ⱖ 740 contra H1: m ⬍ 740.
a) Determine el P-valor.
b) ¿Piensa que es factible que la planta esté operando adecuadamente o está convencido de que la planta no funciona en forma adecuada? Explique su razonamiento.
6. En un proceso de fabricación de placas de silicio cubiertas
con tungsteno la resistencia objetivo para una placa es de 85
mΩ. En una muestra aleatoria simple de 50 placas, la media de la resistencia de la muestra era de 84.8 de mΩ, y la
desviación estándar, 0.5 mΩ. Sea m la media de la resistencia de las placas fabricadas mediante este proceso. Un ingeniero de control de calidad prueba que H0: m ⫽ 85 contra
H1: m ⫽ 85.
a) Determine el P-valor.
b) ¿Piensa que es factible que la media esté en el objetivo,
o está convencido de que la media no está en el objetivo? Explique su razonamiento.
7. Un filtro de aire ultrabajo de partículas se utiliza para mantener uniforme el flujo de aire en áreas de producción en
una habitación limpia. Ahí la media de la velocidad del aire
debe ser al menos de 40 cm/s. Cierto distribuidor probó una
muestra aleatoria simple de 58 filtros. La media de la velocidad de la muestra era de 39.6 cm/s, con desviación estándar
de 7 cm/s. Sea m la media de la velocidad del aire obtenida
por filtros suministrados por este distribuidor. Se hace una
prueba de H0: m ⱖ 40 contra H1: m ⬍ 40.
a) Determine el P-valor.
b) ¿Piensa que es factible que la media de velocidad es de
al menos 40 cm/s, o está convencido de que la media es
menor de 40 cm/s? Explique su razonamiento.
8. Se está preparando una nueva mezcla de concreto con el fin
de proporcionar una fuerza compresiva adecuada para bloques de concreto. La especificación para una aplicación determinada pide que los bloques tengan una media de la
fuerza compresiva m mayor de 1 350 kPa. Se produce y se
prueba una muestra de 100 bloques. Su media de fuerza
compresiva es de 1 356 kPa, y su desviación estándar, de 70
kPa. Se hace una prueba de H0: m ⱕ 1 350 contra H1: m ⬎
1 350.
a) Determine el P-valor.
b) ¿Piensa que es factible que los bloques no satisfagan la
especificación, o está convencido de que sí lo hacen?
Explique su razonamiento.
9. Complete el enunciado: Si la hipótesis nula es H0: m ⱕ 5,
–
entonces la media de X bajo la distribución nula es _______.
i) 0
ii) 5
iii) Cualquier número menor o igual que 5.
iv) No se puede decir a menos que se conozca H1.
10. Complete el enunciado: en una prueba de H0: m ⱖ 10 con–
tra H1: m ⬍ 10, la media muestral fue de X ⫽ 8 y el P-valor era de 0.04. Esto significa que si m ⫽ 10, y el
experimento se repitiera 100 veces, se esperaría obtener un
–
valor de X de 8 o menor aproximadamente ________ veces.
i) 8
ii) 0.8
iii) 4
iv) 0.04
v) 80
11. Un ingeniero toma gran número de mediciones indepen–
dientes de la longitud de un componente y obtiene X ⫽ 5.2
mm y s X— ⫽ 0.1 mm. Utilice esta información para encontrar
el P-valor que pruebe que H0: m ⫽ 5.0 contra H1: m ⫽ 5.0.
6.2
377
Concluir a partir de las pruebas de hipótesis
12. El siguiente resultado MINITAB presenta los resultados de una prueba de hipótesis para una media poblacional m.
One-Sample Z: X
Test of mu = 73.5 vs not = 73.5
The assumed standard deviation = 2.3634
Variable
X
N
145
Mean
73.2461
StDev
2.3634
SE Mean
0.1963
95% CI
(72.8614, 73.6308)
Z
−1.29
P
0.196
a) ¿Es ésta una prueba de una cola o de dos colas?
b) ¿Cuál es la hipótesis nula?
c) ¿Cuál es el P-valor?
d ) Utilice el resultado y una tabla adecuada para calcular el P-valor para la prueba de H0: m ⱖ 73.6 contra H1: m ⬍ 73.6
e) Utilice el resultado y una tabla adecuada para calcular un intervalo de confianza de 99% para m.
13. El siguiente resultado de MINITAB presenta los resultados de una prueba de hipótesis para una media poblacional m. Faltan
algunos de los números. Complete los números del (a) al (c).
One-Sample Z: X
Test of mu = 3.5 vs > 3.5
The assumed standard deviation = 2.00819
Variable
X
6.2
N
87
Mean
4.07114
StDev
2.00819
SE Mean
(a)
95%
Lower
Bound
3.71700
Z
(b)
P
(c)
Concluir a partir de las pruebas de hipótesis
Se revisarán con más detalle las conclusiones obtenidas en los ejemplos 6.1 y 6.2 (de la sección 6.1). En el ejemplo 6.2 se rechazó H0; en otras palabras, se concluyó que H0 era falsa.
En el ejemplo 6.1 H0 no se rechazó. Sin embargo, tampoco se concluyó que H0 fuera verdadera. Sólo se puede concluir que H0 es factible.
En efecto, sólo se pueden tener dos conclusiones en una prueba de hipótesis: que H0 es
falsa o que H0 es factible. En particular, nunca se puede llegar a la conclusión de que H0 es verdadera. Para comprender por qué, piense nuevamente en el ejemplo 6.1. La media muestral
–
era X ⫽ 673.2 y la hipótesis nula era m ⱖ 675. La conclusión era que 673.2 está suficientemente cerca de 675, por lo que la hipótesis nula podría ser verdadera. Pero una media muestral de 673.2 obviamente no conduce a que se concluya que m ⱖ 675 es verdadera, ya que
673.2 es menor que 675. Éste es un caso típico en muchas situaciones de interés. El estadístico de prueba es consistente con la hipótesis alternativa y está un poco en desacuerdo con la
378
CAPÍTULO 6
Pruebas de hipótesis
nula. La única cuestión es si el nivel de desacuerdo medido con el P-valor es lo suficientemente grande para presentar la hipótesis nula como no factible.
¿Cómo se sabe cuándo rechazar H0? Entre menor sea el P-valor, menos factible es H0.
Una regla general consiste en dibujar una línea en el 5%. De acuerdo con esta regla, si P ⱕ
0.05, H0 se rechaza; de otra manera, H0 no se rechaza. Efectivamente, no hay una línea que
divida con nitidez las evidencias concluyentes en contra de H0 y las evidencias no concluyentes, así como no hay una línea que divida nítidamente el clima caluroso y el frío. Así que aunque esta regla general es conveniente, no tiene ninguna justificación científica verdadera.
Resumen
Entre menor sea el P-valor, se puede tener más certeza de que H0 es falsa.
Entre mayor sea el P-valor, es más factible H0, pero nunca se puede tener la certeza de que H0 sea verdadera.
Una regla general indica rechazar H0 cada vez que P ⱕ 0.05. Aunque esta regla es
conveniente, no tiene ninguna base científica.
Significancia estadística
Cada vez que el P-valor es menor que un umbral específico, el resultado indica que es “significativo estadísticamente” a ese nivel. Por lo que, por ejemplo, si P ⱕ 0.05, el resultado es
estadísticamente significativo a un nivel de 5%; si P ⱕ 0.01, el resultado es estadísticamente
significativo a un nivel de 1%, y así sucesivamente. Si un resultado es estadísticamente significativo a un nivel de 100α%, también se puede decir que la hipótesis nula se “rechaza a un
nivel de 100α%”.
Ejemplo
6.3
Se realiza una prueba de la hipótesis nula H0: m ⫽ 0. El P-valor da un resultado de 0.03. ¿Es
el resultado estadísticamente significativo a un nivel de 10%? ¿ A un nivel de 5%? ¿ A un nivel de 1%? ¿La hipótesis nula es rechazada a un nivel de 10%? ¿A un nivel de 5%? ¿ A un
nivel de 1%?
Solución
El resultado es estadísticamente significativo en cualquier nivel igual o mayor a 3%. Por tanto, es estadísticamente significativo en los niveles 10 y 5%, pero no a un nivel de 1%. De forma semejante, se puede rechazar la hipótesis nula en cualquier nivel igual o mayor al 3%, así
H0 se rechaza en los niveles 10 y 5%, pero no a un nivel de 1%.
A veces las personas sólo informan que un resultado de prueba era estadísticamente significativo en un nivel específico, sin dar el P-valor. Por ejemplo, es común leer que un resultado era “estadísticamente significativo a un nivel de 5%” o “estadísticamente significativo
(P ⬍ 0.05)”. Ésta es una mala práctica, por tres razones. Primera, no proporciona ninguna manera de decir si el P-valor era sólo apenas menor que 0.05, o si era mucho menor. Segunda,
6.2
Concluir a partir de las pruebas de hipótesis
379
notificar que un resultado era estadísticamente significativo a un nivel de 5% implica que hay
gran diferencia entre un P-valor justo abajo de 0.05 y uno justo arriba de 0.05, cuando efectivamente hay una diferencia pequeña. Tercera, un trabajo como éste no permite que los lectores decidan por ellos mismos si el P-valor es lo suficientemente pequeño para rechazar la
hipótesis nula. Si un lector cree que la hipótesis nula no debe rechazarse a menos que P ⬍
0.01, entonces informar solamente que P ⬍ 0.05 no permite que el lector determine si se rechaza o no H0.
Notificar el P-valor proporciona mayor información acerca de la fuerza de la evidencia
contra la hipótesis nula y permite que cada lector decida por sí mismo si se debe rechazar. Los
resultados de software siempre muestran los P-valores que obtienen; éstos se deben incluir
siempre que se notifican los resultados de una prueba de hipótesis.
Resumen
Sea α cualquier valor entre 0 y 1. Entonces, si P ⱕ α.
Se dice que el resultado de la prueba es estadísticamente significativo a un nivel de
100α%.
La hipótesis nula es rechazada a un nivel de 100α%.
Cuando se informa el resultado de una prueba de hipótesis, informe el P-valor, en
lugar de sólo compararlo con el 5 o el 1%.
El P-valor no es la probabilidad de que H0 sea verdadera
Como consecuencia de que P-valor es una probabilidad, y que los P-valores pequeños indican que H0 es improbable que sea verdadera, es tentador pensar que el P-valor representa la
probabilidad de que H0 sea verdadera. Éste no es enfáticamente el caso. El concepto de probabilidad analizado aquí es útil solamente cuando se aplica a los resultados que pueden resultar en formas diferentes cuando se repiten experimentos. Ésta tiene sentido para definir el
–
P-valor como la probabilidad de observar un valor extremo de un estadístico como X , ya que
–
el valor de X podría ser diferente si el experimento se repitiera. Por otra parte, la hipótesis nula
es o no verdadera. La verdad o falsedad de H0 no se puede cambiar mediante la repetición del
experimento. No es, por tanto, correcto hablar de la “probabilidad” de que H0 sea verdadera.
En este momento se debe mencionar que hay un concepto de probabilidad, diferente del
que se analiza en este libro, en el cual se puede calcular una probabilidad de que un enunciado, tal como que una hipótesis nula sea verdadera. Esta clase de probabilidad se llama probabilidad subjetiva, y es importante en la teoría de la estadística bayesiana. La clase de
probabilidad que se analiza en este libro se llama probabilidad frecuentista. Una buena referencia para estadística bayesiana es Lee (1997).
Elija H0 para responder la pregunta correcta
Cuando se realiza una prueba de hipótesis es importante elegir adecuadamente H0 y H1 con
el propósito de que los resultados de la prueba sean útiles para establecer una conclusión. Los
ejemplos 6.4 y 6.5 muestran esto último.
380
Ejemplo
6.4
CAPÍTULO 6
Pruebas de hipótesis
Las especificaciones para un tubo de agua piden una media de fuerza de ruptura m mayor de
2 000 lb por pie de longitud. Los ingenieros realizarán una prueba de hipótesis para determinar si se usa o no cierto tipo de tubo. Seleccionan una muestra aleatoria de secciones del tubo de un pie de longitud para medir sus fuerzas de ruptura y realizar una prueba de hipótesis.
El tubo no se utilizará a menos que los ingenieros pueden concluir que m ⬎ 2 000. Suponga
que se prueba H0: m ⱕ 2 000 contra H1: m ⬎ 2 000. ¿Los ingenieros decidirán utilizar el tubo si se rechaza H0? ¿Qué pasa si H0 no es rechazada?
Solución
Si H0 es rechazada, los ingenieros concluirán que m ⬎ 2 000 y utilizarán el tubo. Si H0 no es
rechazada, los ingenieros concluirán que m podría ser menor o igual a 2 000, y no usarán el
tubo.
En el ejemplo 6.4 la acción de los ingenieros con respecto al uso del tubo diferirá dependiendo de si H0 se rechaza o no. Por tanto, es útil realizar esta prueba, y H0 y H1 se han
especificado correctamente.
Ejemplo
6.5
En el ejemplo 6.4, suponga que los ingenieros prueban que H0: m ⱖ 2 000 contra H1: m ⬍ 2 000.
¿Los ingenieros decidirán utilizar el tubo si se rechaza H0? ¿Qué pasa si H0 no es rechazada?
Solución
Si H0 es rechazada, los ingenieros concluirán que m ⬍ 2 000 y no utilizarán el tubo. Si H0 no
es rechazada, los ingenieros llegarán a la conclusión de que m podría ser mayor o igual a 2 000,
pero también podría no serlo, por lo que nuevamente no utilizarán el tubo.
En el ejemplo 6.5, la acción con respecto al uso del tubo será la misma, no lo utilizarán, si H0 es o no rechazada. No tiene sentido realizar esta prueba. Las hipótesis de H0 y H1
no se han especificado correctamente.
Nota final: En una prueba de una cola la igualdad siempre va con la hipótesis nula. Por
tanto, si m0 es el punto que divide H0 de H1, se podría tener H0: m ⱕ m0 o H0: m ⱖ m0, pero
nunca H0: m ⬍ m0 o H0: m ⬎ m0. La razón para esto último consiste en que cuando se define
la distribución nula H0 se representa con el valor de m más cercano a H1. Sin la igualdad, no
hay un valor especificado por H0 que esté cercano a H1. Por tanto, la igualdad debe ir con H0.
Significancia estadística no es lo mismo que significancia práctica
Cuando un resultado tiene un P-valor pequeño se dice que es “estadísticamente significativo”.
En el uso cotidiano, la palabra significativo quiere decir “importante”. Resulta, por tanto, tentador pensar que los resultados estadísticamente significativos siempre deben ser importantes.
6.2
Concluir a partir de las pruebas de hipótesis
381
Éste no es el caso. A veces los resultados estadísticamente significativos no tienen importancia científica o práctica. Se mostrará esto último con un ejemplo. Suponga que en un proceso con el que se fabrican fibras sintéticas se sabe que éstas tienen una fuerza de ruptura media
de 50 N. Se ha desarrollado un nuevo proceso que requeriría instrumentar el rechazo de mucha maquinaria. En una muestra de mil fibras producidas por este nuevo método, el promedio de la fuerza de ruptura era de 50.1 N, y la desviación estándar, de 1 N. ¿Se puede concluir
que el nuevo proceso produce fibras con una media mayor de la fuerza de ruptura?
Para responder esta pregunta, sea m la fuerza de ruptura media de las fibras producidas
con el nuevo proceso. Se necesita probar H0: m ⱕ 50 contra H1: m ⬎ 50. De este modo, si
se rechaza H0 se llega a la conclusión de que el nuevo proceso es mejor. Bajo H0, la media
–
muestral
X tiene una distribución normal con una media de 50 y una desviación estándar de
√
1/ 1 000 = 0.0316. El puntaje z es
z=
50.1 − 50
= 3.16
0.0316
El P-valor es 0.0008. Ésta es una evidencia muy fuerte contra H0. El nuevo proceso produce fibras con una fuerza de ruptura media mayor.
¿Qué conclusión práctica se debe extraer de este resultado? Con base en la prueba de
hipótesis, se tiene la seguridad de que el nuevo proceso es mejor. ¿Valdría la pena instrumentar el nuevo proceso? Probablemente no. La razón es que la diferencia entre el proceso viejo
y el nuevo, aunque estadísticamente muy significativa, es de sólo 0.1 N. Es improbable que
esta diferencia sea lo suficientemente grande para ser importante.
La lección que aquí se obtiene es que un resultado puede ser estadísticamente significativo sin ser lo suficientemente grande para tener importancia práctica. ¿Cómo puede ocurrir esto? Una diferencia es estadísticamente significativa cuando es grande comparada con su
desviación estándar. En el ejemplo, una diferencia de 0.1 N era estadísticamente significativa, ya que la desviación estándar era solamente de 0.0316 N. Cuando la desviación estándar
es muy pequeña, aun una diferencia pequeña puede ser estadísticamente significativa.
El P-valor no mide la significancia práctica. Lo que mide es el grado de confianza que
se puede tener de que el valor verdadero es muy diferente del valor especificado por la hipótesis nula. Cuando el P-valor es pequeño, entonces se puede tener confianza de que el valor
verdadero es en verdad muy diferente. Esto no necesariamente implica que la diferencia sea
lo bastante grande para que tenga importancia práctica.
Relación entre las pruebas de hipótesis
y los intervalos de confianza
Tanto los intervalos de confianza como las pruebas de hipótesis están dedicados a determinar
los valores creíbles para una cantidad como una media poblacional m. En una prueba de hipótesis para una media poblacional m, se especifica un valor particular de m (la hipótesis nula) y se determina si ese valor es factible. En contraparte, un intervalo de confianza para una
media poblacional m se puede pensar como el conjunto de los valores de m que satisfacen a
un cierto criterio de factibilidad, especificado por el intervalo de confianza con un nivel de
100(1 ⫺ α)%. Efectivamente, la relación entre los intervalos de confianza y las pruebas de hipótesis es muy cercana.
382
CAPÍTULO 6
Pruebas de hipótesis
Para ser más específicos, los valores contenidos dentro de un intervalo de confianza de
dos lados a nivel de 100(1 ⫺ α)%, son precisamente aquellos valores para los cuales el P-valor
de una prueba de hipótesis de dos lados será mayor que α. Para ilustrar esto último, considere el ejemplo siguiente (presentado como el ejemplo 5.2 de la sección 5.1). La media mues–
tral de los tiempos de vida de 50 microperforadoras era de X ⫽ 12.68 huecos perforados y la
desviación estándar de s ⫽ 6.83. Haciendo α igual a 0.05 (5%), el intervalo de confianza al
95% para la media poblacional de los tiempos de vida m se ha calculado de (10.79, 14.57).
Suponga que se quiere probar la hipótesis de que m era igual a uno de los puntos finales del
intervalo de confianza. Por ejemplo, considere probar que H0 : m ⫽ 10.79 contra H1: m ⫽
–
10.79. Bajo H0, el valor observado X √
⫽ 12.68 proviene de una distribución normal con media 10.79 y desviación estándar 6.83/ 50 = 0.9659. El puntaje z es (12.68 ⫺ 10.79)/0.9659
⫽ 1.96. Puesto que H0 especifica que m es igual a 10.79, ambas colas contribuyen al P-valor,
el cual es 0.05, y, por consiguiente, igual a α (véase la figura 6.4).
0.025
0.025
8.90
z = ⫺1.96
10.79
12.68
z = 1.96
–
FIGURA 6.4 La media muestral X es igual a 12.68. Debido a que 10.79 es un punto final
–
de un intervalo de confianza de 95% basado en X ⫽ 12.68, el P-valor para evaluar H0: m
⫽ 10.79 es igual a 0.05.
Ahora considere probar la hipótesis H0: m ⫽ 14.57 contra H1: m ⫽ 14.57, donde 14.57
representa el otro punto final del intervalo de confianza. Esta vez se obtendrá z ⫽ (12.68 ⫺
14.57)/0.9659 ⫽ ⫺1.96, y nuevamente el P-valor es 0.05. Es fácil comprobar que si se elige
cualquier valor de m0 en el intervalo (10.79, 14.57) y se prueba H0: m ⫽ m0 contra H1: m ⫽ m0,
el P-valor será mayor que 0.05. Por otra parte, si se elige m0 ⬍ 10.79 o m0 ⬎ 14.57, el P-valor
será menor que 0.05. Por tanto, el intervalo de confianza de 95% consta precisamente de los
valores de m cuyos P-valores son mayores que 0.05 en una prueba de hipótesis. En este sentido, el intervalo de confianza contiene todos los valores que son creíbles para la media poblacional m.
Es fácil comprobar que un intervalo de confianza a un nivel de 100(1 ⫺ α)% de un sólo lado consta de todos los valores para los cuales el P-valor en una prueba de una cola serían
–
mayores de α. Por ejemplo, con X ⫽ 12.68, s ⫽ 6.83 y n ⫽ 50, el límite inferior de confianza de 95% para los tiempos de vida de las perforadoras es 11.09. Si m0 ⬎ 11.09, entonces el
P-valor para probar H0: m ⱕ m0 será mayor de 0.05. De forma semejante, el límite superior
de confianza de 95% para los tiempos de vida de las perforadoras es 14.27. Si m0 ⬍ 14.27,
entonces el P-valor para probar H0: m ⱖ m0 será mayor que 0.05.
6.2
Concluir a partir de las pruebas de hipótesis
383
Ejercicios para la sección 6.2
1. ¿Para qué P-valor es la hipótesis nula más factible, P ⫽ 0.5
o P ⫽ 0.05?
ii) H0 es definitivamente verdadera.
iii) Hay una probabilidad de 50% de que H0 sea verdadera.
iv) H0 es factible, y H1 es falsa.
2. Verdadero o falso:
a) Si se rechaza H0, entonces se concluye que H0 es falsa.
b) Si no se rechaza H0, entonces se llega a la conclusión de
que H0 es verdadera.
c) Si se rechaza H0, entonces se llega a la conclusión de
que H1 es verdadera.
d) Si no se rechaza H0, entonces se concluye que H1 es falsa.
v) Tanto H0 como H1 son creíbles.
5. Verdadero o falso: Si P ⫽ 0.02, entonces
a) El resultado es estadísticamente significativo a un nivel
de 5%.
b) El resultado es estadísticamente significativo a un nivel
de 1%.
c) La hipótesis nula es rechazada a un nivel de 5%.
3. Si P ⫽ 0.01, ¿cuál es la mejor conclusión?
d ) La hipótesis nula es rechazada a un nivel de 1%.
i) H0 es definitivamente falsa.
ii) H0 es definitivamente verdadera.
iii) Hay probabilidad de 1% de que H0 sea verdadera.
iv) H0 podría ser verdadera, pero es improbable.
6. Una hipótesis nula es rechazada a un nivel de 5%. Verdadero o falso:
a) El P-valor es mayor que 5%.
v) H0 podría ser falsa, pero es improbable.
b) El P-valor es menor o igual a 5%.
vi) H0 es factible.
c) El resultado es estadísticamente significativo a un nivel
de 5%.
4. Si P ⫽ 0.50, ¿cuál es la mejor conclusión?
d ) El resultado es estadísticamente significativo a un nivel
de 10%.
i) H0 es definitivamente falsa.
7. El siguiente resultado de MINITAB (mostrado por vez primera en el ejercicio 12 de la sección 6.1) presenta los resultados de
una prueba de hipótesis para una media poblacional m.
One-Sample Z: X
Test of mu = 73.5 vs not = 73.5
The assumed standard deviation = 2.3634
Variable
X
N
145
Mean
73.2461
StDev
2.3634
SE Mean
0.1963
95% CI
(72.8614, 73.6308)
Z
−1.29
P
0.196
a) ¿Puede H0 ser rechazada a un nivel de 5%? ¿Cómo justifica su respuesta?
b) Alguien le pregunta si la hipótesis nula H0: m ⫽ 73 contra H1: m ⫽ 73 puede ser rechazada a un nivel de 5%. ¿Puede responder sin hacer cálculos? ¿Cómo?
8. Sea m el nivel de radiación al que un trabajador de esta área
se expone durante el transcurso de un año. La agencia de
protección ambiental ha establecido el nivel máximo de seguridad de la exposición en 5 rem por año. Si se realiza una
prueba de hipótesis para determinar si un puesto de trabajo
es seguro, ¿cuál es la hipótesis nula más adecuada: H0: m ⱕ
5, H0: m ⱖ 5, o H0: m ⫽ 5? Explique.
9. En cada uno de los siguientes casos establezca la hipótesis
nula más adecuada, tomando en consideración la media poblacional m.
a) Se instalará un nuevo tipo de batería en marcapasos de
corazón si se puede demostrar que tienen una media de las
duraciones mayor a ocho años.
384
CAPÍTULO 6
Pruebas de hipótesis
b) Se utilizará un nuevo material para fabricar neumáticos
si se puede mostrar que la media de la duración de los
neumáticos es al menos de sesenta mil millas.
c) Un inspector de control de calidad recalibra un medidor
de flujo si la media de la tasa de flujo difiere de 10 ml/s.
10. Se recomienda la instalación de un dispositivo de disminución de radón en cualquier casa donde la media de la concentración de radón es de 4.0 picocuries por litro (pCi/l) o
mayor, porque se ha pensado que a la larga esa exposición
representa una dosis suficientemente grande que puede aumentar el riesgo de cáncer. Se hicieron 75 mediciones en
una casa específica. La media de las concentraciones era de
3.72 pCi/l y la desviación estándar de 1.93 pCi/l.
a) El inspector de casas que realizó la prueba informó que
debido a que la media de las mediciones es menor de 4.0
es innecesaria la disminución de radón. Explique por
qué este razonamiento es incorrecto.
b) Debido a motivos de salud, se recomienda la disminución de radón siempre que sea factible que la concentración media de radón pueda ser de 4.0 pCi/l o mayor.
Establezca las hipótesis nula y alternativa adecuadas para determinar si la disminución de radón es adecuada.
c) Calcule el P-valor. ¿Usted recomendaría la disminución
de radón? Explique.
b) ¿Puede concluir que la máquina está calibrada para proporcionar una media del peso de llenado de 12 oz? Explique.
13. Un método de aplicación de zinc para blindar acero se supone que produce una capa cuyo espesor medio no es mayor de 7 micras. Una inspectora de calidad mide el espesor
de 36 unidades de las capas y prueba que H0: m ⱕ 7 contra
H1: m ⬎ 7. Obtiene un P-valor de 0.40. Dado que P ⬎ 0.05,
concluye que la media del espesor está dentro de la especificación. ¿Esta conclusión es correcta? Explique.
14. Complete la respuesta: un intervalo de confianza al 95% para m es (1.2, 2.0). Con base en los datos a partir de los cuales se construyó el intervalo de confianza, alguien quiere
probar que H0: m ⫽ 1.4 contra H1: m ⫽ 1.4. El P-valor será
_________.
i) Mayor que 0.05
ii) Menor que 0.05
iii) Igual a 0.05
15. Con referencia al ejercicio 14, ¿para qué hipótesis nula será P ⫽ 0.05?
i) H0: m ⫽ 1.2
ii) H0: m ⱕ 1.2
iii) H0: m ⱖ 1.2
11. Es deseable comprobar la calibración de una balanza pesando un peso patrón de 10 g 100 veces. Sea m la media poblacional de lecturas en la balanza, por lo que esta última
estará calibrada si m ⫽ 10. Se hace una prueba de hipótesis
H0: m ⫽ 10 contra H1: m ⫽ 10. Considere tres conclusiones
posibles: (i) la balanza está calibrada. (ii) la balanza no está calibrada. (iii) la balanza podría estar calibrada.
a) ¿Cuál de las tres conclusiones es mejor si H0 es rechazada?
b) ¿Cuál de las tres conclusiones es mejor si H0 no es rechazada?
c) ¿Es posible realizar una prueba de hipótesis en una forma que sea posible demostrar concluyentemente que la
balanza está calibrada? Explique.
12. Se supone que una máquina que llena cajas de cereal está
calibrada, por lo que la media del peso de llenado es de 12
oz. Sea m la media verdadera del peso de llenado. Suponga
que en una prueba de hipótesis H0: m ⫽ 12 contra H1: m ⫽
12, el P-valor es 0.30.
a) ¿Se debe rechazar H0 con base en esta prueba? Explique.
16. Una científica calcula un intervalo de confianza del 90% de
(4.38, 6.02). Con los mismos datos también calcula que un
intervalo de confianza del 95% de (4.22, 6.18), y un intervalo de confianza del 99% de (3.91, 6.49). Ahora quiere
probar H0: m ⫽ 4 contra H1: m ⫽ 4. Considerando el P-valor, ¿cuál de los siguientes enunciados es verdadero?
i) P ⬎ 0.10
ii) 0.05 ⬍ P ⬍ 0.10
iii) 0.01 ⬍ P ⬍ 0.05
iv) P ⬍ 0.01
17. La fuerza de cierto tipo de caucho se prueba sujetando pedazos de éste a una prueba de desgaste. Para que el caucho
sea aceptable, la media del peso m debe ser menor de 3.5
mg. Muchos pedazos de caucho fueron curados en cierta
manera mientras estaban sujetos a la prueba de desgaste. Un
límite superior de confianza del 95% para la media del peso perdido que se calculó a partir de estos datos era de 3.45
mg. Alguien sugiere utilizar estos datos para probar H0: m
ⱖ 3.5 contra H1: m ⬍ 3.5.
a) ¿Es posible determinar a partir del límite de confianza si
P ⬍ 0.05? Explique.
6.3
Pruebas de hipótesis para la proporción poblacional
385
b) ¿Es posible determinar a partir del límite de confianza si
P ⬍ 0.01? Explique.
b) ¿Es posible determinar a partir del límite de confianza si
P ⬍ 0.05? Explique.
18. Una remesa de fibras no es aceptable si la fuerza de ruptura media de las fibras es menor de 50 N. Se probó una gran
muestra de fibras de esta remesa, y se calculó un límite inferior de confianza de 98% para la fuerza de ruptura media
de 50.1 N. Alguien sugiere utilizar estos datos para probar
la hipótesis H0: m ⱕ 50 contra H1: m ⬎ 50.
19. Con referencia al ejercicio 17, se descubre que la media mues–
tral utilizada para calcular el límite de confianza es X ⫽ 3.40.
¿Es posible determinarla si P ⬍ 0.01? Explique.
a) ¿Es posible determinar a partir del límite de confianza si
P ⬍ 0.01? Explique.
6.3
20. Con referencia al ejercicio 18, se descubre que la desviación estándar muestral utilizada para calcular el intervalo de
confianza es 5 N. ¿Es posible determinarla si P ⬍ 0.01? Explique.
Pruebas de hipótesis para la proporción poblacional
Una proporción poblacional es simplemente una media poblacional para una población de 0
y l: una población de Bernoulli. Por esta razón, las pruebas de hipótesis para proporciones son
similares a las analizadas en la sección 6.1 para medias poblacionales. He aquí un ejemplo.
Un proveedor de placas semiconductoras afirma que de todas las placas que suministra,
sólo 10% son defectuosas. Se prueba una muestra de 400 placas, y 50 de ellas, 12.5%, presentan defectos. ¿Se puede concluir que esta afirmación es falsa?
Para realizar la prueba de hipótesis se procede en forma muy parecida a las que se observaron en la sección 6.1. Lo que hace diferente este problema es que la muestra consiste de
éxitos y fracasos, con “éxito” se indica una placa defectuosa. Si la proporción poblacional de placas defectuosas se denota mediante p, entonces la afirmación del proveedor es que p ⱕ 0.1.
Dado que esta hipótesis se ocupa de una proporción poblacional, es natural basar la prueba en
la proporción muestral p̂. Con base en la suposición razonable de que las placas se muestrean
de manera independiente, y al usar el teorema del límite central, puesto que el tamaño muestral es grande, se obtiene que
∼N
p
p(1 − p)
p,
n
(6.1)
donde n es el tamaño de muestra, igual a 400.
Se debe definir la hipótesis nula. La pregunta es si los datos permiten concluir que la
afirmación del proveedor es falsa. Por tanto, la afirmación del proveedor, que es p ⱕ 0.1, debe ser H0. Por otra parte, sería imposible probar la falsedad de la afirmación, sin que importara lo que los datos indicaban.
Las hipótesis nula y alternativa son
H0: p ⱕ 0.1 contra H1: p ⬎ 0.1
Para realizar la prueba de hipótesis se supone que H0 es verdadera y se toma p ⫽ 0.1. Al sustituir p ⫽ 0.1 y n ⫽ 400 en la expresión (6.1) se obtiene la distribución nula de p̂:
∼ N (0.1, 2.25 × 10−4 )
p
386
CAPÍTULO 6
Pruebas de hipótesis
La desviación estándar de p̂ es σp =
50/400 ⫽ 0.125. El puntaje z de p̂ es
z=
√
2.25 × 10−4 = 0.015. El valor observado de p̂ es
0.125 − 0.100
= 1.67
0.015
La tabla z indica que la probabilidad de que una variable aleatoria normal estándar tenga un
valor mayor de 1.67 es 0.0475. El P-valor es, por tanto, 0.0475 (véase la figura 6.5).
P = 0.0475
0.100
0.125
z = 1.67
FIGURA 6.5 La distribución nula de p̂ es N(0.l, 0.0152). Por tanto, si H0 es verdadera, la
probabilidad de que p̂ tome un valor tan extremo o más extremo que el valor observado de
0.125 es 0.0475. Éste es el P-valor.
¿Qué se concluye acerca de H0? Ya sea que la afirmación del proveedor sea falsa, o que
se haya observado una muestra que sea tan extrema como las demás, que se podrían haber extraído 4.75% de las muestras. Tal muestra sería anormal, pero no muy improbable. Hay una
razón para estar particularmente escéptico con respecto a la afirmación, pero tal vez no se debe aún condenar al proveedor. Si es posible, sería una buena idea muestrear más placas.
Observe que bajo la comúnmente utilizada regla práctica se rechazaría H0 y se condenaría al proveedor, debido a que P es menor que 0.05. Este ejemplo ilustra la debilidad de esta regla. Si usted hace los cálculos, encontrará que si sólo 49 de las placas de la muestra
hubieran estado defectuosas en vez de 50, el P-valor se elevaría a 0.0668, y el proveedor estaría salvado. Por tanto, el destino del proveedor depende del resultado de una sola placa de
las 400. No tiene sentido marcar tal línea nítida. Es mejor sólo notificar el P-valor y esperar
a tener más evidencias antes de obtener una conclusión final.
El tamaño muestral debe ser grande
La prueba descrita antes requiere que la proporción muestral esté normalmente distribuida.
Esta suposición estará justificada siempre que np0 ⬎ 10 y n(1 ⫺ p0) ⬎ 10, donde p0 es la proporción poblacional que se especificó en la distribución nula. Entonces el puntaje z se puede
utilizar como el estadístico de prueba, haciendo a ésta una prueba z.
Ejemplo
6.6
El artículo “Refinement of Gravimetric Geoid Using GPS and Leveling Data” (W. Thurston,
en Journal of Surveying Engineering, 2000:27-56) presenta un método para medir las alturas
ortométricas arriba del nivel del mar. Para una muestra de 1 225 puntos de partida, 926 dieron
6.3
Pruebas de hipótesis para la proporción poblacional
387
resultados que están dentro del espíritu de la clase C nivelando los límites de tolerancia. ¿Se
puede llegar a la conclusión de que este método produce resultados dentro de los límites de
tolerancia más de 75% de las veces?
Solución
Sea p la probabilidad de que el método produzca un resultado dentro de los límites de tolerancia. Las hipótesis nula y alternativa son:
H0: p ⱕ 0.75 contra H1: p ⬎ 0.75
La proporción muestral es p̂ ⫽ 926/1 225 ⫽ 0.7559. Bajo la hipótesis
nula, p̂ está distribui√
do normalmente con media de 0.75 y desviación estándar (0.75)(1 − 0.75)/1 225 =
0.0124. El puntaje z es
z=
0.7559 − 0.7500
= 0.48
0.0124
El P-valor es 0.3156 (véase la figura 6.6). No se puede concluir que el método produzca buenos resultados más de 75% de las veces.
P = 0.3156
0.75 0.7559
z = 0.48
FIGURA 6.6 La distribución nula de p̂ es N(0.75, 0.01242). Por tanto, si H0 es verdadera,
la probabilidad de que p̂ tome un valor mayor o igual que el valor observado de 0.7559 es
0.3156. Éste es el P-valor.
El siguiente resultado de computadora (de MINITAB) presenta los resultados del ejemplo 6.6.
Test and CI for One Proportion: GPS
Test of p = 0.75 vs p > 0.75
Variable
GPS
X
926
N
1225
Sample p
0.755918
95%
Lower
Bound
0.735732
Z-Value
0.48
P-Value
0.316
El resultado contiene un límite inferior de confianza de 95%, así como el P-valor. Observe
que este límite inferior se calculó mediante el método tradicional (la expresión 5.8 de la sección 5.2 presenta la versión de dos lados de este método).
388
CAPÍTULO 6
Pruebas de hipótesis
La relación con los intervalos de confianza para una proporción
Un intervalo de confianza a un nivel de 100(1 ⫺ α)% contiene los valores correspondientes
a un parámetro para el cual el P-valor de una prueba de hipótesis será mayor que α. Respecto a los intervalos de confianza para la proporción presentados en la sección 5.2 y la prueba
de hipótesis presentada aquí, este enunciado es aproximadamente verdadero. La razón de esto es que los métodos presentados en la sección 5.2 son versiones ligeramente modificadas (y
mucho más fáciles de calcular) de métodos de intervalos de confianza más complicados para
los cuales el enunciado es verdadero.
Resumen
Sea X el número de éxitos en n ensayos independientes de Bernoulli, cada uno con
probabilidad de éxito p; en otras palabras, sea X ⬃ Bin(n, p).
Para probar una hipótesis nula de la forma H0: p ⱕ p0, H0: p ⱖ p0, o H0: p ⫽ p0,
suponiendo que tanto np0 como n(l ⫺ p0) son mayores que 10:
− p0
p
.
Calcule el puntaje z: z = √
p0 (1 − p0 )/n
Calcule el P-valor. Este último constituye un área bajo la curva normal, que depende de la hipótesis alternativa de la siguiente manera:
Hipótesis alternativa
H1: p ⬎ p0
H1: p ⬍ p0
H1: p ⫽ p0
P-valor
Área a la derecha de z
Área a la izquierda de z
Suma de áreas en las colas correspondientes a z y ⫺z
Ejercicios para la sección 6.3
1. Una muestra aleatoria de 300 componentes electrónicos fabricados mediante un proceso específico se muestrea y se
encuentra que 25 están defectuosos. Sea p la proporción de
componentes fabricados mediante este proceso que presentan defectos. El ingeniero responsable de la producción afirma que p ⱕ 0.05. ¿La muestra proporciona suficientes
evidencias para rechazar la afirmación?
2. Una muestra aleatoria de 100 pernos de la producción de un
día se muestrea y se encuentra que dos de ellos tienen diámetros por debajo de la especificación. Se afirma que la
proporción de pernos defectuosos entre los fabricados en
ese día era menor que 0.05. ¿Es adecuado utilizar los métodos de esta sección para determinar si se puede rechazar esta afirmación? Si es así, establezca las hipótesis nula y
alternativa adecuadas y calcule el P-valor. Si no, explique
por qué.
3. Una compañía de telecomunicaciones proporcionó a sus
suscriptores de televisión por cable acceso libre a un nuevo
canal de deportes durante un mes. Se eligió una muestra de
400 teleespectadores y se les preguntó si estarían dispuestos
a pagar 10 dólares extra por mes para continuar teniendo acceso al canal. Solamente 25 respondieron que estarían dispuestos a pagar.
¿La compañía puede concluir que más de 5% de sus suscriptores pagarían el canal?
4. Las incineradoras pueden ser una fuente de emisiones peligrosas en la atmósfera. Se recolectaron muchas muestras de
gases de una muestra de 50 incineradoras en una ciudad. De
las 50, sólo 18 satisfacían una norma ambiental para la concentración de un compuesto peligroso. ¿Se puede concluir
que menos de la mitad de las incineradoras en la ciudad satisfacen la norma?
6.3
Pruebas de hipótesis para la proporción poblacional
5. Las piezas de grava se clasifican como pequeñas, medianas
o grandes. Una distribuidora afirma que al menos 10% de
las piezas de grava de su planta son grandes. En una muestra aleatoria de 1 600 piezas, 150 se clasificaron como grandes. ¿Representa esto suficiente evidencia para rechazar la
afirmación?
389
proceso actual tiene una tasa de defectos de 5%. En una
muestra de 400 estaciones de trabajo ensambladas con el
nuevo proceso, 15 tenían defectos. ¿Se puede concluir que
el nuevo proceso tiene una tasa menor de defectos?
8. Con referencia al ejercicio 1 de la sección 5.2. ¿Se puede
concluir que más de 60% de las mediciones hechas con el
instrumento serán satisfactorias?
6. Una máquina pulidora será calificada para una tarea especial si puede demostrar que produce menos de 8% de partes
defectuosas. En una muestra aleatoria de 300 partes, 12 estaban defectuosas. ¿Con base en estos datos la máquina
puede ser calificada?
9. Con referencia al ejercicio 2 de la sección 5.2, ¿se puede
concluir que menos de 40% de los fusibles fabricados ese
día tenían amperajes de fundición mayores de 15 A?
7. Un fabricante de estaciones de trabajo de computadora está
probando un nuevo proceso de ensamble automatizado. El
10. El siguiente resultado de MINITAB presenta los resultados de una prueba de hipótesis para una proporción poblacional p.
Test and CI for One Proportion: X
Test of p = 0.4 vs p < 0.4
Variable
X
X
73
N
240
Sample p
0.304167
95%
Upper
Bound
0.353013
Z-Value
−3.03
P-Value
0.001
a) ¿Ésta es una prueba de una o de dos colas?
b) ¿Cuál es la hipótesis nula?
c) ¿Puede H0 ser rechazada a un nivel de 2%? ¿Cómo justifica su respuesta?
d ) Alguien le pregunta si la hipótesis nula H0: p ⱖ 0.45 contra H1: p ⬍ 0.45 se puede rechazar a un nivel de 2%. ¿Puede responder sin hacer ningún cálculo? ¿Cómo?
e) Utilice el resultado y una tabla adecuada para calcular el P-valor para la prueba de H0: p ⱕ 0.25 contra H1: p ⬎ 0.25.
f ) Utilice el resultado y una tabla adecuada para calcular un intervalo de confianza de 90% para p.
11. El siguiente resultado de MINITAB presenta los resultados de una prueba de hipótesis para una proporción poblacional p. Faltan algunos números. Complete éstos del (a) al (c).
Test and CI for One Proportion: X
Test of p = 0.7 vs p < 0.7
Variable
X
X
345
N
500
Sample p
(a)
95%
Upper
Bound
0.724021
Z-Value
(b)
P-Value
(c)
390
6.4
CAPÍTULO 6
Pruebas de hipótesis
Pruebas de hipótesis para la media poblacional
con muestras pequeñas
En la sección 6.1 se describió un método con el cual se prueba una hipótesis para la media
poblacional basada en una muestra grande. Un paso clave en el método es aproximar a la desviación estándar s con la desviación estándar muestral s. Después se utiliza la curva normal
para encontrar el P-valor. Cuando el tamaño muestral es pequeño, s puede no estar cerca de
s, ello invalida este método de muestras grandes. Sin embargo, cuando la población es aproximadamente normal, se puede utilizar la distribución t de Student. Esto se ilustra con un
ejemplo.
Los separadores de anillos para una transmisión de eje tienen una especificación de espesor de 38.98-39.02 mm. El proceso con el que se fabrican los anillos se supone que está calibrado para que la media de los espesores sea de 39 mm en el centro de la ventana de
especificación. Se extrae una muestra de seis anillos y se mide su espesor. Las seis capas son
39.030, 38.997, 39.012, 39.008, 39.019 y 39.002. Suponga que la población de los espesores
de los anillos es aproximadamente normal. ¿Se puede concluir que el proceso necesita recalibración?
Se denota la media poblacional con m, las hipótesis nula y alternativa son
H0: m ⫽ 39.00 contra H1: m ⫽ 39.00
Observe que H0 especifica un solo valor para m, puesto que la calibración requiere que la media sea igual al valor correcto. Para construir el estadístico de prueba, observe que debido a
que se supone que la población tiene una distribución normal, la cantidad
t=
X−μ
√
s/ n
tiene una distribución t de Student con n ⫺ 1 ⫽ 5 grados de libertad. Éste es el estadístico de
prueba.
En este ejemplo los valores observados de la media muestral y la desviación estándar
–
son X ⫽ 39.01133 y s ⫽ 0.011928. El tamaño muestral es n ⫽ 6. La hipótesis nula especifica que m ⫽ 39. Por tanto, el valor del estadístico de prueba es
t=
39.01133 − 39.00
√
= 2.327
0.011928/ 6
El P-valor es la probabilidad de observar un valor del estadístico de prueba cuyo desacuerdo
con H0 es igual o mayor que el realmente observado. Puesto que H0 especifica que m ⫽ 39.00,
ésta es una prueba de dos colas, por lo que ambos valores arriba y abajo de 39.00 no concuerdan con H0. Por tanto, el P-valor es la suma de las áreas bajo la curva correspondiente a t ⬎
2.327 y a t ⬍ ⫺2.327.
La figura 6.7 ilustra la distribución nula e indica la ubicación del estadístico de prueba.
De la tabla t (tabla A.3 en el apéndice A) el renglón que corresponde a 5 grados de libertad
indica que el valor t ⫽ ⫾ 2.015 tiene un área de 0.05 en cada cola, para un total de 0.10, y
que el valor t ⫽ ⫾ 2.571 corta un área de 0.025 en cada cola, para un total de 0.05. Por tanto, el P-valor está entre 0.05 y 0.10. Aunque no se puede establecer en forma concluyente que
el proceso no está calibrado, no parece demasiado bueno. Sería prudente recalibrarlo.
6.4
Pruebas de hipótesis para la media poblacional con muestras pequeñas
0.05
391
0.05
0.025
0.025
⫺2.571
0
⫺2.015
2.015 2.571
2.327
⫺2.327
√
FIGURA 6.7 La distribución nula de t = (X − 39.00)/(s/ 6) es la t de Student con
cinco grados de libertad. El valor observado de t, correspondiente a los valores observados
–
X ⫽ 39.01133 y s ⫽ 0.011928, es 2.327. Si H0 es verdadera, la probabilidad de que t to-
me un valor mayor o igual que el observado está entre 0.05 y 0.10. Debido a que H0 especificó que m era igual a un valor específico, ambas colas de la curva contribuyen al P-valor.
En este ejemplo, el estadístico de prueba era una estadística t en vez de un puntaje z.
Por esta razón, esta prueba se denomina prueba t.
Ejemplo
6.7
Antes de que una sustancia se pueda considerar segura para enterrarse como residuo se deben
caracterizar sus propiedades químicas. El artículo “Landfilling Ash/Sludge Mixtures” (J. Benoît, T. Eighmy y B. Crannell, en Journal of Geotechnical and Geoenvironmental Engineering 1999:877-888) notifica que en una de seis muestras de lodo de una planta de tratamiento
de agua residual de Nueva Hampshire, la media del pH era 6.68 con desviación estándar de
0.20. ¿Se puede concluir que la media del pH es menor de 7.0?
Solución
Sea m la media del pH para este tipo de lodo. Las hipótesis nula y alternativa son
H0: m ⱖ 7.0 contra H1: m ⱕ 7.0
Bajo H0, el estadístico de prueba
t=
X − 7.0
√
s/ n
–
tiene una distribución t de Student con cinco grados de libertad. Al sustituir X ⫽ 6.68, s ⫽
0.20, y n ⫽ 6, el valor del estadístico de prueba es
t=
6.68 − 7.00
√ = −3.919
0.20/ 6
Al observar la tabla t se tiene que al valor t ⫽ ⫺3.365 le corresponde un área de 0.01 en la
cola de la izquierda, y al valor t ⫽ ⫺4.033 le corresponde un área de 0.005 (véase la figura
6.8). Se concluye que el P-valor se encuentra entre 0.005 y 0.01. Existe evidencia de que la
media del pH es menor que 7.0.
392
CAPÍTULO 6
Pruebas de hipótesis
0.01
0.005
⫺4.032
⫺3.365
0
⫺3.919
FIGURA 6.8 Solución al ejemplo 6.7. La distribución nula es una t de Student con cinco
grados de libertad. El valor observado de t es ⫺3.919. Si H0 es verdadera, la probabilidad
de que t tenga un valor mayor o igual que el observado se encuentra entre 0.005 y 0.01.
El siguiente resultado de computadora (de MINITAB) presenta los resultados del ejemplo 6.7.
One-Sample T: pH
Test of mu = 7 vs < 7
Variable
pH
N
6
Mean
6.680
StDev
0.200
SE Mean
0.081665
95%
Upper
Bound
6.84453
T
−3.92
P
0.006
Observe que el límite superior de confianza de 95% dado en el resultado es consistente con
la hipótesis alternativa. Esto último indica que el P-valor es menor a 5%.
Utilice z, no t, si se conoce s
En ocasiones se puede tomar una muestra pequeña de una población normal cuya desviación
estándar s es conocida. En estos casos no se utiliza la curva t de Student, porque no se está
aproximando a s con s. Sino que se utiliza la tabla z y se realiza una prueba z. El ejemplo 6.8
muestra el método.
Ejemplo
6.8
Al principio de esta sección se describió una muestra de seis separadores de anillos, cuyos espesores (en mm) fueron 39.030, 38.997, 39.012, 39.008, 39.019 y 39.002. Se denota la media poblacional de los espesores mediante m y se prueban las hipótesis
H0: m ⫽ 39.00
contra H1: m ⫽ 39.00
Ahora suponga que estos seis separadores de anillos se fabricaron justo después de que
se cambió de lugar la máquina que los produjo. Suponga que, con base en gran número de
anillos fabricados antes del cambio, se tenía conocimiento de que la población de espesores
de los anillos se aproximaba mucho a la normal, con desviación estándar s ⫽ 0.010 mm, y
es razonable suponer que el cambio no afectó esto. Con base en los datos, ¿es posible rechazar H0?
Pruebas de hipótesis para la media poblacional con muestras pequeñas
6.4
393
–
Se calcula X ⫽ 39.01133. No se necesita el valor de s, ya que se sabe que s ⫽ 0.010.
–
Dado que la población es normal, X también lo es, aunque el tamaño de muestra sea pequeño. Por tanto, la distribución nula es
X ∼ N (39.00, 0.0102 )
El puntaje z es
z=
39.01133 − 39.000
√
= 2.78
0.010/ 6
El P-valor es 0.0054, por lo que H0 se puede rechazar tranquilamente.
Resumen
Sea X1, . . . , Xn una muestra de una población normal con media m y desviación estándar s, donde s es desconocida.
Para probar una hipótesis nula de la forma H0: m ⱕ m0, H0: m ⱖ m0, o H0: m ⫽m0:
Calcule el estadístico de prueba t =
X − μ0
√ .
s/ n
Calcule el P-valor. Éste es un área bajo la curva t de Student con n ⫺ 1 grados de
libertad, que depende de la hipótesis alternativa de la siguiente manera:
Hipótesis alternativa
H1: m ⬎ m0
H1: m ⬍ m0
H1: m ⫽ m0
P-valor
Área a la derecha de t
Área a la izquierda de t
Suma de áreas en las colas correspondientes a t y ⫺t
X − μ0
Si se conoce s, el estadístico de prueba es z =
√ , y se debe hacer una prueσ/ n
ba z.
Ejercicios para la sección 6.4
1. Cada uno de los siguientes conjuntos de datos hipotéticos
representan algunos de los pesos repetidos de un patrón estándar de peso del que se sabe que tiene una masa de 100 g.
Suponga que las lecturas son una muestra aleatoria de una
población que sigue una curva normal. Si es posible, realice una prueba t para ver si la balanza está calibrada adecuadamente. Si no es posible, explique por qué.
nes son una muestra aleatoria de una población aproximadamente normal. A continuación se muestran tres conjuntos
de repeticiones de las mediciones, listadas en el orden en
que se realizaron. Para cada conjunto de mediciones establezca si las suposiciones necesarias para la validez de la
prueba t parecen satisfacerse. Si las suposiciones no se satisfacen, explique por qué.
a) 100.02, 99.98, 100.03
b) 100.01
2. Un geólogo está haciendo mediciones repetidas (en gramos) de la masa de una roca. No se conoce si las medicio-
a) 213.03 212.95 213.04
213.01 221.03 213.05
213.00
212.99
b) 213.05 213.00 212.94
213.02 213.06 212.99
213.09
212.98
394
CAPÍTULO 6
Pruebas de hipótesis
c) 212.92 212.95 212.97 213.00
213.04 213.05 213.06
4.065
213.01
3. Se está estudiando un nuevo proceso para sintetizar el metanol a partir del metano con el fin de evaluar su viabilidad
técnica. Las simulaciones de diseño indican que el reactor
debe tener una conversión de metano media mayor que el
35% para que el proceso sea viable. En un estudio inicial se
realizaron seis operaciones. La conversión promedio fue de
39% y la desviación estándar de 4%. Si se puede concluir
que la media de la conversión m es mayor de 35%, debe realizarse una evaluación adicional del proceso.
a) Establezca las hipótesis nula y alternativa adecuadas.
b) Determine el P-valor.
c) ¿Debe realizarse una evaluación adicional del proceso?
Explique.
4. Se supone que un tipo especial de gasolina tiene una media
de octanaje mayor de 90%. Se realizaron cinco mediciones
de la tasa de octanaje de la siguiente manera:
90.1
88.8
89.5
91.0
92.1
¿Se puede concluir que la media del octanaje es mayor a
90%?
5. Se requiere que el espesor de la pared de las botellas de dos
litros de policarbonato sea en promedio de 4.0 milésimas de
pulg. Un ingeniero responsable del control de calidad extrae
una muestra de siete botellas de policarbonato de dos litros
de una población grande y mide (en milésimas de pulg) los
espesores de las paredes de cada una. Se obtienen los siguientes resultados.
3.967
4.028
4.008
4.195
4.057
4.010
¿Se puede concluir que la media de los espesores de las paredes es diferente a 4.0 milésimas de pulg?
6. Como parte del programa de control de calidad para la línea
de producción de un catalizador, se prueba la pureza de las
materias primas (alúmina y un espesante). El proceso requiere que la pureza de la alúmina sea mayor a 85%. Una
muestra aleatoria de un envío reciente de alúmina produjo
estos resultados (en %):
93.2
87.0
92.1
90.1
87.3
93.6
Se realizará una prueba de hipótesis para determinar si se
acepta o no el embarque.
a) Establezca las hipótesis nula y alternativa adecuadas.
b) Calcule el P-valor.
c) ¿Debe aceptarse el embarque? Explique.
7. Una muestra de 18 piezas de material laminado tenía una
media de deformación de 1.88 mm y una desviación estándar de 0.21 mm. ¿Se puede concluir que la media de la deformación de este tipo de laminado es menor a 2 mm?
8. Con referencia al ejercicio 12 de la sección 5.3, ¿se puede
concluir que la media de la cantidad de tolueno eliminado
en el enjuague es menor a 8%?
9. Con referencia al ejercicio 13 en la sección 5.3, ¿se puede
concluir que la media de la cantidad de uniconazol absorbida es menor a 2.5 mg?
10. El siguiente resultado MINITAB presenta los resultados de una prueba de hipótesis para una media poblacional m.
One-Sample T: X
Test of mu = 5.5 vs > 5.5
Variable
X
N
5
Mean
5.92563
StDev
0.15755
SE Mean
0.07046
95%
Lower
Bound
5.77542
T
6.04
P
0.002
a) ¿Es ésta una prueba de una o de dos colas?
b) ¿Cuál es la hipótesis nula?
c) ¿Puede rechazarse H0 a un nivel de 1%? ¿Cómo justifica su respuesta?
d) Utilice el resultado y una tabla adecuada para calcular el P-valor para la prueba de H0: m ⱖ 6.5 contra H1: m ⬍ 6.5.
e) Utilice el resultado y una tabla adecuada para calcular un intervalo de confianza de 99% para m.
6.5
Pruebas de hipótesis para la diferencia entre dos medias con muestras grandes
395
11. El siguiente resultado de MINITAB presenta los resultados de una prueba de hipótesis para una media poblacional m. Faltan
algunos de los números. Complételos.
One-Sample T: X
Test of mu = 16 vs not = 16
Variable
X
6.5
N
11
Mean
13.2874
StDev
(a)
SE Mean
1.8389
95% CI
( (b), (c) )
T
(d)
P
0.171
Pruebas de hipótesis para la diferencia
entre dos medias con muestras grandes
Ahora se analizarán ejemplos en los que se desea determinar si las medias de dos poblaciones
son iguales. Los datos los conformarán dos muestras, una para cada población. La idea básica
es simple. Se calculará la diferencia de las medias muestrales. Si la diferencia se encuentra alejada de 0, se concluirá que las medias poblacionales son diferentes. Si la diferencia se aproxima a 0, se concluirá que las medias poblacionales podrían ser iguales.
Como ejemplo, suponga que a la directora de producción de una fábrica de maquinaria
industrial le interesa que los cojinetes de bolas producidos a temperaturas ambientales bajas
tengan diámetros menores que los producidos a temperaturas mayores. Para analizar esta
cuestión, extrae una muestra de 120 cojinetes que se fabricaron durante la mañana, antes de
que en toda la fábrica se incrementara la temperatura y encontró que la media de su diámetro
es de 5.068 mm, y que su desviación estándar, 0.011 mm. En forma independiente prueba 65
cojinetes fabricados durante la tarde; halló que la media de su diámetro es de 5.072 mm, y su
desviación estándar, 0.007 mm. ¿Puede la directora concluir que los cojinetes fabricados en
la mañana tienen, en promedio, diámetros menores que los fabricados durante la tarde?
Se empieza transfiriendo el problema al lenguaje estadístico. Se tiene una muestra aleatoria simple X1, . . . , X120 de diámetros de cojinetes de bolas fabricados por la mañana, y otra
muestra aleatoria simple Y1, . . . , Y65 de diámetros de cojinetes elaborados por la tarde. Se denota la media poblacional de los diámetros de los primeros cojinetes fabricados por la mañana con mX, y la media poblacional de los diámetros de los segundos elaborados en la tarde con
mY. Las desviaciones estándar correspondientes se denotan con sX y sY. Estas medias y las
desviaciones estándar poblacionales no se conocen. Los tamaños muestrales son nX ⫽ 120 y
nY ⫽ 65. Se tiene interés en la diferencia mX ⫺ mY.
Ahora se deben determinar las hipótesis nula y alternativa. La cuestión es si se puede
concluir que la media poblacional de los cojinetes matutinos es menor que la de los vespertinos. Por consiguiente, las hipótesis nula y alternativa son
H0 : μX − μY ≥ 0
contra H1 : μX − μY < 0
396
CAPÍTULO 6
Pruebas de hipótesis
–
–
–
La prueba está basada en X ⫺ Y . Debido a que ambos tamaños de muestra son grandes, X y
–
Y se distribuyen aproximadamente como una normal. En virtud de que las muestras son inde–
–
pendientes, se tiene que la distribución nula de X ⫺ Y es
σY2
σX2
2
2
(6.2)
+
X − Y ∼ N (μX − μY , σX + σY ) = N μX − μY ,
nX
nY
–
–
Los valores observados son X ⫽ 5.068 y Y ⫽ 5.072 para las medias muestrales, y sX ⫽ 0.011
y sY ⫽ 0.007 para las desviaciones estándar muestrales. Bajo H0, mX ⫺ mY ⫽ 0 (el valor más
cercano a H1). Se aproximan las varianzas poblacionales sX2 y sY2 con las varianzas muestrales sX2 ⫽ 0.0112 y sY2 ⫽ 0.0072, respectivamente, y se sustituye nX⫽ 120 y nY ⫽ 65, parapcalcular la desviación estándar de la distribución nula, obteniendo 0.0112 /120 + 0.0072 /65 ⫽
–
–
0.001327. Por tanto, la distribución nula de X ⫺ Y es
–
–
X − Y ∼ N (0, 0.0013272 )
El valor observado de X ⫺ Y es 5.068 ⫺ 5.072 ⫽ ⫺0.004. El puntaje z es
z=
−0.004 − 0
= −3.01
0.001327
La figura 6.9 muestra la distribución nula y la ubicación del estadístico de prueba. El P-valor
es 0.0013. La sospecha de la directora es correcta. Los cojinetes fabricados en la mañana tienen menor media de los diámetros.
P = 0.0013
⫺0.004
z = ⫺3.01
0
–
–
– –
dadera, la probabilidad de que X ⫺ Y tenga un valor mayor o igual que los valores obser-
FIGURA 6.9 La distribución nula de X ⫺ Y es N(0, 0.0013272). Por lo que si H0 es vervados de ⫺0.004 es de 0.0013. Éste es el P-valor.
Observe que se utilizó la suposición de que las muestras eran independientes cuando se
–
–
calculó la varianza de X ⫺ Y . Ésta es una condición que a menudo se obtiene fácilmente en
la práctica. A menos que exista una conexión bastante obvia entre los elementos de las dos
muestras, por lo general se supone con certeza que son independientes.
Ejemplo
6.9
El artículo “Effect of Welding Procedure on Flux Cored Steel Wire Deposits” (N. Ramini de
Rissone, I. de S. Bott y cols., en Science and Technology of Welding and Joining, 2003:113122) compara las propiedades de soldaduras hechas con dióxido de carbono como gas de protección con respecto a las de soldaduras hechas mediante una mezcla de argón y dióxido de
6.5
Pruebas de hipótesis para la diferencia entre dos medias con muestras grandes
397
carbono. Una propiedad estudiada era el diámetro de inclusiones, que son partículas incrustadas en la soldadura. Una muestra de 544 inclusiones en soldaduras hechas al usar argón como protección tiene un diámetro promedio de 0.37 mm, con desviación estándar de 0.25 mm.
Una muestra de 581 inclusiones en soldaduras hechas al emplear dióxido de carbono como
protección tiene diámetro promedio de 0.40 mm, con desviación estándar de 0.26 mm. (Las
desviaciones estándar se calcularon con una gráfica.) ¿Se puede concluir que las medias de
los diámetros de las inclusiones son diferentes entre los dos gases de protección?
Solución
–
Sea X ⫽ 0.37 la media del diámetro de la muestra para soldaduras de argón. Entonces sX ⫽
–
0.25 y el tamaño de muestra es nX ⫽ 544. Sea Y ⫽ 0.40 la media del diámetro de la muestra
de soldaduras de dióxido de carbono. Entonces sY ⫽ 0.26 y el tamaño muestral es nY ⫽ 581.
Sea mX la media poblacional del diámetro para las soldaduras de argón, y mY la media poblacional del diámetro para soldaduras de dióxido de carbono. Las hipótesis nula y alternativa
son
H0 : μX − μY = 0
–
contra H1 : μX − μY =
0
–
Se ha observado que X ⫺ Y ⫽ 0.37 ⫺ 0.40 ⫽ ⫺0.03. Este valor se extrajo de una población normal con media mX ⫺ mY, y varianza aproximada por sX2/nX ⫹ sY2/nY. Bajo H0 se supone
estándar es
que mX ⫺ mY ⫽ 0. Al sustituir los valores de sX, sY, nX y nY la desviación
–
–
0.252 /544 + 0.262 /581 = 0.01521. Por tanto, la distribución nula de X ⫺ Y es
X − Y ∼ N (0, 0.015212 )
El puntaje z es
z=
−0.03 − 0
= −1.97
0.01521
Ésta es una prueba de dos colas, y el P-valor es 0.0488 (véase la figura 6.10). De acuerdo con
la hipótesis nula se rechazaría la regla de 5%. Es razonable ser escéptico sobre la veracidad
de H0.
0.0244
⫺0.03
z = ⫺1.97
0.0244
0
0.03
z = 1.97
FIGURA 6.10 Solución del ejemplo 6.9.
El siguiente resultado de computadora (de MINITAB) presenta los resultados del ejemplo 6.9.
398
CAPÍTULO 6
Pruebas de hipótesis
Two-sample T for Argon vs C02
N
544
581
Argon
CO2
Mean
0.37
0.40
StDev
0.25
0.26
SE Mean
0.010719
0.010787
Difference = mu (Argon) − mu (CO2)
Estimate for difference: 0.030000
95% confidence bound for difference:
(−0.0598366, −0.000163)
T-Test of difference = 0 (vs not = 0):
T-Value = −1.97 P-Value = 0.049 DF = 1122
Observe que para esta prueba la computadora utiliza el estadístico t en lugar del estadístico z.
Muchos softwares emplean el estadístico t siempre que se utiliza una desviación estándar
muestral para estimar la desviación estándar poblacional. Cuando el tamaño de muestra es
grande, la diferencia entre t y z es insignificante para fines prácticos. Cuando se utilizan tablas en vez de una computadora, el puntaje z tiene la ventaja de que el P-valor se puede determinar con mayor precisión mediante una tabla z que con una t.
Los métodos descritos en esta sección se pueden utilizar para evaluar la hipótesis de que
dos medias poblacionales son diferentes por una constante específica. El ejemplo 6.10 muestra cómo.
Ejemplo
6.10
Con referencia al ejemplo 6.9, ¿se puede concluir que la media del diámetro para soldaduras
de dióxido de carbono (mY) es mayor para las soldaduras de argón (mX) en más de 0.015 mm?
Solución
Las hipótesis nula y alternativa son
H0 : μX − μY ≥ −0.015 contra H1 : μX − μY < −0.015
–
–
Se observa X ⫽ 0.37, Y ⫽ 0.40, sX ⫽ 0.25, sY ⫽ 0.26, nX ⫽ 544 y nY ⫽ 581. Bajo H0 se tie–
–
ne que mX ⫺ mY ⫽ ⫺0.015. La distribución nula de X ⫺ Y dada por la expresión (6.2) es
X − Y ∼ N (−0.015, 0.015212 )
–
–
Se observa que X ⫺ Y ⫽ 0.37 ⫺ 0.40 ⫽ ⫺0.03. El puntaje z es
z=
−0.03 − (−0.015)
= −0.99
0.01521
Ésta es una prueba de una cola. El P-valor es 0.1611. No se puede concluir que la media del
diámetro de inclusiones de soldaduras de dióxido de carbono sea mayor que la de las soldaduras de argón en más de 0.015 mm.
6.5
Pruebas de hipótesis para la diferencia entre dos medias con muestras grandes
399
Resumen
Sean X1, . . . , XnX y Y1, . . . , YnY muestras grandes (por ejemplo, nX ⬎ 30 y nY ⬎ 30)
de las poblaciones con medias mX y mY y las desviaciones estándar sX y sY, respectivamente. Suponga que las muestras se extraen en forma independiente una de la otra.
Para probar una hipótesis nula de la forma H0: mX ⫺ mY ⱕ Δ0, H0: mX ⫺ mY ⱖ Δ0,
o H0: mX ⫺ mY ⫽ Δ0.
(X − Y ) − 0
Calcule el puntaje z: z =
. Si sX y sY son desconocidas se
σX2 /nX + σY2 /nY
pueden aproximar con sX y sY, respectivamente.
Calcule el P-valor. El P-valor es un área debajo de la curva normal que depende
de la hipótesis alternativa de la siguiente manera:
Hipótesis alternativa
P-valor
H1: mX ⫺ mY ⬎ Δ0
Área a la derecha de z
H1: mX ⫺ mY ⬍ Δ0
Área a la izquierda de z
H1: mX ⫺ mY ⫽ Δ0 Suma de las áreas en las colas correspondientes a z y ⫺z
Ejercicios de la sección 6.5
1. El artículo “Measurement of Complex Permittivity of Asphalt Paving Materials” (J. Shang, J. Umana y cols., en Journal of Transportation Engineering, 1999:347-356) compara
las constantes dieléctricas entre dos tipos de asfalto, HL3 y
HL8, utilizados comúnmente en los pavimentos. Para 42
elementos del asfalto HL3 el promedio de la constante dieléctrica fue de 5.92 con desviación estándar de 0.15, y para 37 elementos del asfalto HL8 el promedio de la constante
dieléctrica fue 6.05 con desviación estándar de 0.16. ¿Se
puede concluir que la media de las constantes dieléctricas
difiere entre los dos tipos de asfalto?
2. Para determinar el efecto del grado de combustible en la eficiencia del combustible, 80 nuevos automóviles de la misma marca, con motores idénticos, fueron conducidos cada
uno durante mil millas. Cuarenta de los automóviles funcionaron con combustible regular y otros 40 con combustible
de grado premium; los primeros tenían una media de 27.2
milla/galón, con desviación estándar de 1.2 milla/galón; los
segundos tenían una media de 28.1 milla/galón y una desviación estándar de 2.0 milla/galón. ¿Puede concluir que este
tipo de automóvil tiene mejor millaje con combustible premium?
3. Se comparan dos métodos utilizados para purificar una proteína. En 50 operaciones del método A la media de recuperación fue de 60% y la desviación estándar de 15%, mientras
que en 60 operaciones del método B la media de recuperación fue de 65% y la desviación estándar de 20%. ¿Puede
concluir que hay una diferencia en las dos tasas de recuperación?
4. Se comparan dos máquinas utilizadas para llenar envases de
refresco. Se cuenta durante 60 minutos el número de envases llenados cada minuto por cada máquina. Durante 60 minutos, la máquina número 1 llenó en promedio 73.8 latas
por minuto con desviación estándar de 5.2 latas por minuto, y la máquina número 2 llenó en promedio 76.1 latas por
minuto con desviación estándar de 4.1 latas por minuto.
a) Si los recuentos se hacían cada minuto durante 60 minutos consecutivos, ¿qué suposición es necesaria para que
pueda violarse la validez de una prueba de hipótesis?
b) Suponiendo que se satisfacen todas las suposiciones necesarias, realice una prueba de hipótesis. ¿Puede concluir
que la máquina número 2 es más rápida que la número 1?
5. Un profesor de estadística que imparte una clase a 160 estudiantes quiere determinar si los estudiantes tienen más dificultad con las pruebas de hipótesis de una cola o con las
de dos colas. En el siguiente examen, 80 de los estudiantes,
elegidos aleatoriamente, reciben una versión del examen
con una pregunta de 10 puntos que requiere una prueba de
400
CAPÍTULO 6
Pruebas de hipótesis
una cola. Los otros 80 estudiantes reciben una pregunta
idéntica, excepto que requiere una prueba de dos colas. Los
estudiantes de la pregunta de una cola tienen calificación
promedio de 7.79 puntos, y su desviación estándar es 1.06
puntos. Los estudiantes de la pregunta de dos colas tienen
una calificación promedio de 7.64 puntos, y su desviación
estándar es de 1.31 puntos.
a) ¿Puede concluir que la calificación promedio m1 en la
pregunta de una prueba de hipótesis de una cola es mayor que la calificación promedio m2 de la pregunta de la
prueba de hipótesis de dos colas? Establezca las hipótesis nula y alternativa adecuadas, y después calcule el
P-valor.
b) ¿Puede concluir que la calificación promedio m1 de la
pregunta de una prueba de hipótesis de una cola difiere
de la calificación promedio m2 de la pregunta de la prueba de hipótesis de dos colas? Establezca las hipótesis nula y alternativa adecuadas, y después calcule el P-valor.
6. Se probó la velocidad en cierta aplicación de 50 chips nuevos de computadora, con otra cantidad igual de diseño viejo. La velocidad promedio, en MHz, de los nuevos chips fue
de 495.6, y la desviación estándar de 19.4. La velocidad
promedio de los chips viejos fue de 481.2, y la desviación
estándar fue de 14.3.
a) ¿Se puede concluir que la media de la velocidad de los
nuevos chips es mayor que la de los chips viejos? Establezca las hipótesis nula y alternativa adecuadas, y después encuentre el P-valor.
b) Una muestra de 60 chips aún más viejos tenía velocidad
promedio de 391.2 MHz, con desviación estándar de
17.2 MHz. Alguien afirma que los nuevos chips tienen
una velocidad promedio mayor a 100 MHz que los más
viejos. ¿Los datos proporcionan evidencias convincen-
tes para esta afirmación? Establezca las hipótesis nula y
alternativa, y después determine el P-valor.
7. Se consideran dos métodos en un proceso de fabricación de
pintura con la finalidad de aumentar la producción. En una
muestra aleatoria de 100 días, la media de producción diaria con el primer método fue de 625 toneladas, y la desviación estándar era de 40 toneladas. En una muestra aleatoria
de 64 días, la media de la producción diaria que usaba el segundo método era de 640 toneladas, y la desviación estándar,
de 50 toneladas. Suponga que las muestras son independientes.
a) ¿Puede concluir que el segundo método produce la media de la producción diaria mayor?
b) ¿Puede concluir que la media de la producción diaria
con el segundo método es mayor que la del primer método en más de diez toneladas?
8. Con referencia al ejercicio 7 de la sección 5.4, ¿puede concluir que la media de la dureza de las soldaduras enfriadas
a una tasa de 10°C/s es mayor que la de las soldaduras enfriadas a una tasa de 30°C/s?
9. La Corporación Eléctrica Subterránea (CES) afirma que sus
fuentes de energía suministradas para computadoras personales duran más que la de su competidor, Productos para
Aparatos Zircon (PAZ). Se toman muestras aleatorias independientes de 75 unidades de cada una de las fuentes de
energía de los dos fabricantes y se calculan las medias y las
desviaciones estándar muestrales
–
CES: X 1 ⫽ 4 387 h
s1 ⫽ 252 h
–
s2 ⫽ 231 h
PAZ: X 2 ⫽ 4 260 h
¿Puede concluir que las fuentes de potencia CES duran más
que las de PAZ? ¿Cuál es el P-valor para esta prueba?
10. El siguiente resultado de MINITAB presenta los resultados de una prueba de hipótesis para la diferencia mX ⫺ mY entre dos
medias poblacionales:
Two-sample T for X vs Y
X
Y
N
135
180
Mean
3.94
4.43
StDev
2.65
2.38
SE Mean
0.23
0.18
Difference = mu (X) − mu (Y)
Estimate for difference: −0.484442
95% upper bound for difference: −0.007380
T-Test of difference = 0 (vs <): T-Value = −1.68
P-Value = 0.047
DF = 270
6.6
Pruebas de hipótesis para la diferencia entre dos proporciones
401
a) ¿Ésta es una prueba de una o de dos colas?
b) ¿Cuál es la hipótesis nula?
c) ¿Se puede rechazar H0 a un nivel de 5%? ¿Cómo justifica su respuesta?
d) El resultado presenta una prueba t de Student. Calcule el P-valor mediante una prueba z. ¿Los dos resultados son similares?
e) Utilice el resultado y una tabla adecuada para calcular un intervalo de confianza de 99% para mX ⫺ mY basado en el estadístico z.
11. El siguiente resultado de MINITAB presenta los resultados de una prueba de hipótesis para la diferencia mX ⫺ mY entre dos medias poblacionales. Faltan algunos de los números.
Two-sample T for X vs Y
X
Y
N
78
63
Mean
23.3
20.63
StDev
(i)
3.02
SE Mean
1.26
(ii)
Difference = mu (X) − mu (Y)
Estimate for difference: 2.670
95% CI for difference: (0.05472, 5.2853)
T-Test of difference = 0 (vs not =): T-Value = 2.03
P-Value = 0.045
DF = 90
a) Complete los números faltantes en (i) y en (ii).
b) El resultado presenta una prueba t de Student. Calcule el P-valor mediante una prueba z. ¿Los dos resultados son similares?
c) Utilice el producto y una tabla adecuada para calcular un intervalo de confianza de 98% para mX ⫺ mY basado en el estadístico z.
6.6
Pruebas de hipótesis para la diferencia
entre dos proporciones
El procedimiento para probar la diferencia entre dos proporciones es similar al que se utiliza
cuando se prueba la diferencia entre dos medias. Se ilustra con un ejemplo.
Una red de computadoras móviles consta de un grupo de éstas que mantienen comunicación inalámbrica entre sí dentro de un área específica. Un protocolo de direccionamiento
representa un algoritmo que determina cómo se transmitirá de una máquina a otra en la red,
para tener la mayor posibilidad de que lleguen a su destino los mensajes. El artículo “Performance Comparison of two Location Based Routing Protocols” (T. Camp, J. Boleng y cols.,
en Proceedings of the IEEE International Conference on Communications, 2002:3318-3324)
compara la eficacia de dos protocolos de direccionamiento en muchas métricas, incluyendo
la tasa de envíos exitosos. Suponga que mediante el protocolo A se enviaron 200 mensajes, y
170 de ellos, 85%, fueron recibidos con éxito. Con el protocolo B, se enviaron 150 mensajes,
y 123 de ellos, 82%, fueron recibidos con éxito. ¿Se puede concluir que el protocolo A tiene
mayor tasa de éxito?
En este ejemplo las muestras constan de éxitos y fracasos. Sea X el número de mensajes enviados con éxito al usar el protocolo A, y sea Y el número de mensajes enviados con éxito empleando el protocolo B. Los valores observados en este ejemplo son X ⫽ 170 y Y ⫽ 123.
402
CAPÍTULO 6
Pruebas de hipótesis
Sea pX la proporción de mensajes que se enviaron con éxito mediante el protocolo A y pY la
proporción correspondiente del protocolo B. Los valores pX y pY son desconocidos.
Las variables aleatorias X y Y tienen distribuciones binomiales, con nX ⫽ 200 y nY ⫽
150 ensayos, respectivamente. Las probabilidades de éxito son pX y pY. Las proporciones
muestrales de los valores observados son p̂X ⫽ 170/200 ⫽ 0.85 y p̂Y ⫽ 123/150 ⫽ 0.82.
Las hipótesis nula y alternativa son
H0 : pX − pY ≤ 0
contra H1 : pX − pY > 0
La prueba está basada en el estadístico p̂X ⫺ p̂Y. Se debe determinar la distribución nula de
este estadístico. Por el teorema del límite central, puesto que nX y nY son grandes,
pX (1 − pX )
pY (1 − pY )
X ∼ N pX ,
Y ∼ N pY ,
p
p
nX
nY
Por tanto,
pX (1 − pX ) pY (1 − pY )
X − p
Y ∼ N pX − pY ,
p
+
nX
nY
(6.3)
Obtener la distribución nula requiere sustituir los valores para pX ⫺ pY y la varianza pX(1 ⫺
pX)/nX ⫹ pY (1 ⫺ pY)/nY. La media se obtiene fácilmente. La hipótesis nula especifica que pX
⫺ pY ⱕ 0, por lo que se tiene que pX ⫺ pY ⫽ 0. La obtención de la varianza es un poco más
difícil. A primera vista, podría parecer razonable aproximar la desviación estándar al sustituir
las proporciones muestrales p̂X y p̂Y para las proporciones poblacionales pX y pY. Sin embargo, la hipótesis nula H0 especifica que las proporciones poblacionales son iguales. Por tanto,
se deben calcular ambas con un valor común. El valor adecuado es la proporción combinada, obtenida al dividir el número total de éxitos de ambas muestras entre el tamaño muestral
total. Este valor es
X+Y
=
p
nX + n Y
En consecuencia, la distribución nula de p̂X ⫺ p̂Y se estima cuando se sustituye la proporción
combinada p̂ tanto para pX como para pY en la expresión (6.3). Se obtiene
1
1
X − p
Y ∼ N 0, p
(1 − p
)
p
+
(6.4)
nX
nY
En este ejemplo p̂ ⫽ (170 ⫹ 123)/(200 ⫹ 150) ⫽ 0.837. Bajo H0 se tiene que pX ⫺ pY
⫽
0.
Por
tanto, la distribución nula de p̂X ⫺ p̂Y es normal con media 0 y desviación estándar
√
0.837(1 − 0.837)(1/200 + 1/150) = 0.0399. El valor observado de p̂X ⫺ p̂Y es 0.85 ⫺ 0.82
⫽ 0.03. Por consiguiente, el puntaje z es
z=
0.03 − 0
= 0.75
0.0399
El P-valor es 0.2266. La figura 6.11 muestra la distribución nula y señala la ubicación
del estadístico de prueba. Con base en este P-valor no se puede concluir que el protocolo B
tenga una tasa de éxito mayor. Observe que para que el teorema del límite central sea válido,
ambas muestras deben ser razonablemente grandes. Una buena regla general es que haya al
menos diez éxitos y diez fracasos en cada muestra.
6.6
Pruebas de hipótesis para la diferencia entre dos proporciones
403
P = 0.2266
0
0.03
z = 0.75
FIGURA 6.11 La distribución nula de p̂X ⫺ p̂X es N(0, 0.03992). Por tanto, si H0 es ver-
dadera, la probabilidad que p̂X ⫺ p̂X adquiere un valor mayor o igual que el observado de
0.03 es 0.2266. Éste es el P-valor.
Ejemplo
6.11
A menudo, las compañías industriales emplean métodos de “transferencia de riesgo”, un seguro o las cláusulas de indemnización en los contratos, como una técnica de administración
de riesgos. El artículo “Survey of Risk Management in Major U.K. Companies” (S. Baker, K.
Ponniah y S. Smith, en Journal of Professional Issues in Engineering Education and Practice, 1999:94-102) informa los resultados de una encuesta en la cual se les pregunta a los directivos acerca de los métodos importantes en la estrategia de administración de riesgos de
sus compañías. En una muestra de 43 compañías petroleras, 22 indicaban que la transferencia de riesgos fue determinante, mientras que en una muestra de 93 compañías constructoras
55 confirmaron lo anterior. (Estas cifras se obtuvieron a partir de una gráfica.) ¿Se puede concluir que la proporción de compañías petroleras que emplean el método de transferencia de
riesgos es menor que la proporción de compañías constructoras que lo hacen?
Solución
Sea p̂X ⫽ 22/43 ⫽ 0.5116 la proporción muestral de compañías petroleras que emplean métodos de transferencia de riesgos, y p̂Y ⫽ 55/93 ⫽ 0.5914 la proporción muestral correspondiente de las compañías constructoras. Los tamaños muestrales son nX ⫽ 43 y nY ⫽ 93. Sean
pX y pY las proporciones poblacionales de las compañías petroleras y constructoras, respectivamente. Las hipótesis nula y alternativa son
H0 : pX − pY ≥ 0
contra H1 : pX − pY < 0
La prueba se basa en p̂X ⫺ p̂Y. Dado que ambas muestras son grandes, la distribución nula de
p̂X ⫺ p̂Y está dada por la expresión (6.4). La proporción combinada es
=
p
22 + 55
= 0.5662
43 + 93
La
√ distribución nula es normal con media 0 y desviación estándar
0.5662(1 − 0.5662)(1/43 + 1/93) = 0.0914. El valor observado de p̂X ⫺ p̂Y es 0.5116
⫺ 0.5914 ⫽ ⫺0.0798. El puntaje z es
z=
−0.0798 − 0
= −0.87
0.0914
El P-valor es 0.1922 (véase la figura 6.12). No se puede concluir que la proporción de compañías petroleras que emplean métodos de transferencia de riesgos sea menor que la proporción de compañías constructoras que lo hacen.
404
CAPÍTULO 6
Pruebas de hipótesis
P = 0.1922
⫺0.0798 0
z = ⫺0.87
FIGURA 6.12 Solución al ejemplo 6.11.
El siguiente resultado de computadora (de MINITAB) presenta los resultados del ejemplo 6.11.
Test and CI for Two Proportions: Oil, Indus.
Variable
Oil
Indus.
X
22
55
N
43
93
Sample p
0.511628
0.591398
Difference = p (Oil) − p (Indus.)
Estimate for difference: −0.079770
95% Upper Bound for difference: 0.071079
Test for difference = 0 (vs < 0): Z = −0.87
P-Value = 0.192
El resultado se explica por sí mismo. Observe que el límite superior de confianza de
95% se calcula con el método tradicional (la expresión 5.19 de la sección 5.5 presenta las dos
versiones de este método).
Resumen
Sea X ⬃ Bin(nX, pX) y Y ⬃ Bin(nY, pY). Suponga que tanto nX como nY son grandes, y
que X y Y, son independientes.
Para probar una hipótesis nula de la forma H0: pX ⫺ pY ⱕ 0, H0: pX ⫺ pY ⱖ 0, o
H0: pX ⫺ pY ⫽ 0:
X =
Calcule p
X
Y
X+Y
Y =
=
,p
, y p
.
nX
nY
nX + nY
Calcule el puntaje z: z =
X − p
Y
p
(1 − p
)(1/nX + 1/nY )
p
.
Calcule el P-valor. Éste es un área bajo la curva normal que depende de la hipótesis alternativa de la siguiente manera:
Hipótesis alternativa
P-valor
H1: pX ⫺ pY ⬎ 0
Área a la derecha de z
H1: pX ⫺ pY ⬍ 0
Área a la izquierda de z
H1: pX ⫺ pY ⫽ 0
Suma de las áreas de las colas correspondientes a z y ⫺z
6.6
Pruebas de hipótesis para la diferencia entre dos proporciones
405
Ejercicios de la sección 6.6
1. Se comparan dos máquinas de extrusión que fabrican varillas de acero. En una muestra de mil varillas tomadas de la
máquina número 1, 960 satisfacían las especificaciones de
longitud y diámetro. En otra muestra de 600 varillas tomadas de la máquina número 2, 582 cumplían las especificaciones. La máquina número 2 tiene un costo de operación
más alto, por lo que se decide que se usará la máquina número 1 a menos que se demuestre claramente que la máquina
número 2 produce mayor proporción de varillas que satisfacen las especificaciones.
a) Establezca las hipótesis nula y alternativa adecuadas para
tomar la decisión respecto de qué máquina se utilizará.
b) Calcule el P-valor.
c) ¿Qué máquina se debe utilizar?
2. Se compran resistores etiquetados con 100 Ω a dos distribuidores diferentes. La especificación para este tipo de resistor es que su resistencia verdadera esté dentro del 5% de
su resistencia etiquetada. En una muestra de 180 resistores
del distribuidor A, 150 de éstos satisfacían la especificación. En otra muestra de 270 resistores comprados al distribuidor B, 233 cumplían la especificación. El distribuidor A
es el proveedor actual, pero si los datos demuestran convincentemente que una proporción mayor de los resistores del
distribuidor B satisface la especificación, se hará el cambio.
a) Establezca las hipótesis nula y alternativa adecuadas.
b) Determine el P-valor.
c) ¿Se debe hacer el cambio?
3. El artículo “Strategic Management in Engineering Organizations” (P. Chinowsky, en Journal of Management in Engineering, 2001:60-68) presenta los resultados de una
encuesta de estilos de dirección que se realizó tanto a compañías constructoras privadas como entidades públicas. De
un total de 400 compañías privadas contactadas, 133 contestaron completamente la encuesta, mientras que de 100
entidades públicas sólo 50 respondieron. ¿Puede llegar a la
conclusión de que la tasa de respuesta es diferente entre las
compañías privadas y las entidades públicas?
4. El artículo “Training Artificial Neural Networks with the
Aid of Fuzzy Sets” (C. Juang, S. Ni y C. Lu, en ComputerAided Civil and Infrastructure Engineering, 1999:407-415)
describe el desarrollo de redes neurales artificiales diseñadas para predecir la plegabilidad de suelos. Un modelo con
una capa oculta tiene una predicción de éxito en 48 de los
60 casos, mientras que otro con dos capas ocultas tiene una
predicción de éxito en 44 de los 60 casos. Suponiendo que
estas muestras son independientes, ¿puede concluir que el
modelo con una capa oculta tiene una tasa de éxito mayor?
5. En una encuesta de 100 usuarios de una tarjeta de crédito elegidos aleatoriamente, 57 dijeron que sabían que empleando
la tarjeta podían ganar millas de viajero frecuente en cierta
aerolínea. Después de una campaña publicitaria para difundir
este beneficio, se realizó una encuesta independiente entre
200 usuarios de tarjeta de crédito, y 135 dijeron que conocían
el beneficio. ¿Puede concluir que el conocimiento de este beneficio aumentó después de la campaña publicitaria?
6. El artículo “Modeling the Inactivation of Particle-Associated
Coliform Bacteria” (R. Emerick, F. Loge y cols., en Water
Environment Research, 2000:432-438) presenta los recuentos
de números de partículas de diferentes tamaños en muestras de
agua residual que contenían bacterias coliformes. De las 161
partículas de 75-80 mm de diámetro, 19 contenían bacterias
coliformes, y de las 95 partículas de 90-95 mm de diámetro,
22 contenían bacterias coliformes. ¿Puede concluir que las
partículas más grandes tienen una probabilidad mayor de tener bacterias coliformes?
7. Para probar la eficacia de los empaques de protección, una
compañía envió 1 200 órdenes con un empaque ligero común y 1 500 órdenes con un empaque de gran resistencia.
De las órdenes enviadas con el empaque ligero, 20 llegaron
deterioradas, mientras que de las órdenes enviadas con el
otro empaque, 15 llegaron deterioradas. ¿Puede concluir
que el empaque de gran resistencia reduce la proporción de
órdenes deterioradas?
8. En una muestra de 100 lotes de un producto químico comprado al distribuidor A, 70 satisfacen una especificación de
pureza. En una muestra de 70 lotes comprada al distribuidor
B, 61 satisfacen la especificación. ¿Puede concluir que una
proporción mayor de los lotes del distribuidor B satisface la
especificación?
9. En el artículo “Nitrate Contamination of Alluvial Groundwaters in the Nakdong River Basin, Korea” (J. Min, S. Yun
y cols., en Geosciences Journal, 2002: 35-46) se describen
41 muestras de agua tomadas de pozos en el área Daesan, y
se encontró que 22 satisfacían las normas de calidad de potabilidad. Se tomaron 31 muestras del área de Yongdang, y
se encontró que 18 satisfacían las normas. ¿Puede concluir
que la proporción de pozos que satisfacían las normas es diferente entre las dos áreas?
406
CAPÍTULO 6
Pruebas de hipótesis
10. En una prueba clínica para comparar la efectividad de dos
analgésicos, a una muestra de 100 pacientes se le suministró el medicamento A, y en una muestra independiente de
200 pacientes se les suministró el medicamento B. De los
pacientes que recibieron el medicamento A, 76 notificaron
un importante alivio, mientras que del otro grupo de pacientes, 128 informaron lo mismo. ¿Puede concluir que el medicamento A es más efectivo que el B?
11. Con el propósito de determinar si una nueva campaña de publicidad estaba dirigida más hacia hombres o a mujeres, un
publicista proporcionó a cada pareja de una muestra aleato-
ria de 500 parejas casadas un nuevo tipo de control remoto
de TV que, se supone, es más fácil de encontrarse cuando
se le necesita. De los 500 esposos, 62% dijo que el nuevo
control remoto era más fácil de encontrarse que el viejo. De
las 500 esposas, solamente 54% dijo que el nuevo control
remoto era más fácil de encontrarse. Sea p1 la proporción
poblacional de hombres casados que consideran que el nuevo control remoto es más fácil de encontrar, y sea p2 la proporción correspondiente de mujeres casadas. ¿Puede
utilizarse el estadístico p̂1 ⫺ p̂2 ⫽ 0.62 ⫺ 0.54 para probar
H0: p1 ⫺ p2 ⫽ 0 contra H1: p1 ⫺ p2 ⫽ 0? Si es así, realice
la prueba y calcule el P-valor. Si no, explique por qué.
12. El siguiente resultado MINITAB presenta los resultados de una prueba de hipótesis para la diferencia p1 ⫺ p2 entre dos proporciones poblacionales.
Test and CI for Two Proportions
Sample
1
2
X
41
37
N
97
61
Sample p
0.422680
0.606557
Difference = p (1) − p (2)
Estimate for difference: −0.183877
95% CI for difference: (−0.341016, −0.026738)
Test for difference = 0 (vs not = 0): Z = −2.25
P-Value = 0.024
a) ¿Ésta es una prueba de una o de dos colas?
b) ¿Cuál es la hipótesis nula?
c) ¿Se puede rechazar H0 a un nivel de 5%? ¿Cómo justifica su respuesta?
13. El siguiente resultado de MINITAB presenta los resultados de una prueba de hipótesis para la diferencia p1 ⫺ p2 entre dos proporciones poblacionales. Faltan algunos de los números. Complete los números del (a) al (d).
Test and CI for Two Proportions
Sample
1
2
X
101
(b)
N
153
90
Sample p
(a)
0.544444
Difference = p (1) − p (2)
Estimate for difference: 0.115686
95% CI for difference: (−0.0116695, 0.243042)
Test for difference = 0 (vs not = 0): Z = (c)
P-Value = (d)
6.7
6.7
Pruebas de hipótesis para la diferencia entre dos medias con muestras pequeñas
407
Pruebas de hipótesis para la diferencia
entre dos medias con muestras pequeñas
La prueba t se puede utilizar en algunos casos donde las muestras son pequeñas, por lo cual
el teorema del límite central no es aplicable. Aquí se presenta un ejemplo.
El artículo “The Achondroplasia Paternal Age Effect Is Not Explained By an Increase
in Mutant Frequency” (I. Tiemann-Boege, W. Navidi, y cols., en Proceedings of the National
Academy of Sciences, 2002: 14952-14957) describe un experimento en el que se cuenta un
número de moléculas de ADN, y se necesita determinar si éstas contienen cierta secuencia de
nucleótidos. Lo anterior se hace al repetir el experimento con una enzima adicional que digiere la secuencia de interés. Si el número promedio es menor con la enzima presente, entonces se concluye que las moléculas que se están contando contienen la secuencia.
Suponga que en seis muestras preparadas de forma idéntica, sin la enzima presente, los
números de moléculas contadas son 33, 30, 26, 22, 37 y 34. Suponga que en cuatro muestras
preparadas de forma idéntica, sin la enzima presente, los números de moléculas fueron 22, 29,
25 y 23. ¿Se puede concluir que dicho número es menor cuando la enzima está presente?
Se tienen solamente algunas observaciones para cada proceso, así que el teorema del límite central no es aplicable. Si ambas poblaciones son aproximadamente normales, la distribución t de Student se puede utilizar para construir una prueba de hipótesis.
Sean X1, . . . , X6 los números de moléculas obtenidos sin la enzima, y Y1, . . . , Y4 los
que tienen la enzima. Sean mX y mY las medias poblacionales de las cuales se tomaron estas
muestras; y nX y nY los tamaños de muestra. Las hipótesis nula y alternativa son
H0 : μX − μY ≤ 0
contra H1 : μX − μY > 0
Se supone que ambas poblaciones siguen distribuciones normales. Por tanto (como se
analizó en la sección 5.6), la cantidad
(X − Y ) − (μX − μY )
sX2 /nX + sY2 /nY
(6.5)
tiene una aproximada distribución t de Student con ν grados de libertad, donde
2
sX2
sY2
+
nX
nY
ν= 2
(s 2 /nY )2
(sX /nX )2
+ Y
nX − 1
nY − 1
redondeando hacia abajo al entero más próximo.
–
Los valores observados para las medias y desviaciones estándar muestrales son X ⫽ 30.333,
–
Y ⫽ 24.750, sX ⫽ 5.538, sY ⫽ 3.096. Los tamaños muestrales son nX ⫽ 6 y nY ⫽ 4. Al sustituir los valores para las desviaciones estándar y los tamaños muestrales, se calcula que ν ⫽
7.89, que se redondea hacia abajo a 7. Bajo H0, mX ⫺ mY ⫽ 0. Por tanto, el estadístico de prueba es
408
CAPÍTULO 6
Pruebas de hipótesis
t=
(X − Y ) − 0
sX2 /nX + sY2 /nY
Bajo H0, el estadístico de prueba tiene la distribución t de Student con siete grados de liber– –
tad. Al sustituir los valores de X , Y , sX, sY, nX y nY se calcula que el estadístico de prueba es
t=
5.583 − 0
= 2.038
2.740
Al consultar la tabla t con siete grados de libertad, se encuentra que el valor que corresponde
al 5% en la cola derecha es 1.895, y el que corresponde a 2.5% es 2.365. Por tanto, el P-valor se encuentra entre 0.025 y 0.05 (véase la figura 6.13). Se concluye que el número promedio de moléculas es menor cuando la enzima está presente.
0.05
0.025
0
1.895 2.365
2.038
FIGURA 6.13 La distribución nula es la distribución t de Student con siete grados de libertad. El valor observado del estadístico de prueba es 2.038. Si H0 es verdadera, la probabilidad de que t tenga un valor mayor o igual que el observado está entre 2.5 y 5%.
Ejemplo
6.12
Un buen diseño del sitio web puede hacer la navegación más fácil. El artículo “The Implications of Visualization Ability and Structure Preview Design for Web Information Search
Tasks” (H. Zhang y G. Salvendy, en International Journal of Human-Computer Interaction
2001:75-95) presenta una comparación del reconocimiento de elementos entre dos diseños.
Una muestra de diez usuarios que utilizan un diseño web convencional tuvo promedio de 32.3
elementos identificados, con desviación estándar de 8.56. Una muestra de diez usuarios que
utilizan un nuevo diseño web estructurado tuvo promedio de 44.1 elementos identificados,
con desviación estándar de 10.09. ¿Se puede concluir que el número promedio de elementos
identificados es mayor con el nuevo diseño estructurado?
Solución
–
Sea X ⫽ 44.1 la media muestral para el diseño web estructurado. Entonces sX ⫽ 10.09 y nX
–
⫽ 10. Sea Y ⫽ 32.3 la media muestral para el diseño web convencional. Entonces sY ⫽ 8.56
y nY ⫽ 10. Sean mX y mY las medias poblacionales de las mediciones hechas mediante los métodos estructurado y convencional, respectivamente. Las hipótesis nula y alternativa son
H0 : μX − μY ≤ 0
contra H1 : μX − μY > 0
6.7
Pruebas de hipótesis para la diferencia entre dos medias con muestras pequeñas
409
El estadístico de prueba es
(X − Y ) − 0
t= 2
sX /nX + sY2 /nY
– –
Al sustituir valores para X , Y , sX, sY, nX y nY, se calcula que el valor del estadístico de
prueba es de t ⫽ 2.820. Bajo H0, éste tiene una distribución aproximada t de Student, con el
número de grados de libertad dado por
2
10.092
8.562
+
10
10
ν=
= 17.53 ≈ 17
2
2
(8.562 /10)2
(10.09 /10)
+
9
9
Al consultar la tabla t con 17 grados de libertad, se encuentra que el valor correspondiente a 1% en la cola derecha es 2.567, y el de 0.5%, 2.898. Por tanto, el área en cola derecha correspondiente a los valores que son mayores o iguales que el valor observado de 2.820
se encuentra entre 0.005 y 0.010. En consecuencia, 0.005 ⬍ P ⬍ 0.01 (véase la figura 6.14).
Hay gran evidencia de que el número promedio de elementos identificados es mayor en el diseño nuevo.
0.01
0.005
0
2.567 2.898
2.820
FIGURA 6.14 Solución al ejemplo 6.14. El P-valor es el área en la cola derecha, que está entre 0.005 y 0.01.
El siguiente resultado de computadora (de MINITAB) presenta los resultados del ejemplo 6.12.
Two-Sample T-Test and CI: Struct, Conven
Two-sample T for C1 vs C2
Struct
Conven
N
10
10
Mean
44.10
32.30
StDev
10.09
8.56
SE Mean
3.19074
2.70691
Difference = mu (Struct) − mu (Conven)
Estimate for difference: 11.8000
95% lower bound for difference: 4.52100
T-Test of difference = 0 (vs >):
T-Value = 2.82
P-Value = 0.006
DF = 17
410
CAPÍTULO 6
Pruebas de hipótesis
Observe que el límite inferior de confianza de 95% es consistente con la hipótesis alternativa. Esto último indica que el P-valor es menor a 5%.
Los métodos descritos en esta sección se pueden utilizar para probar la hipótesis de que dos
medias poblacionales difieren por una constante especificada. El ejemplo 6.13 muestra cómo.
Ejemplo
6.13
Con referencia al ejemplo 6.12, ¿puede concluir que la media del número de elementos identificados con el nuevo diseño estructurado es mayor al diseño convencional por más de 2?
Solución
Las hipótesis nula y alternativa son
–
H0 : μX − μY ≤ 2
–
contra H1 : μX − μY > 2
Se observa que X ⫽ 44.1, Y ⫽ 32.3, sX ⫽ 10.09, sY ⫽ 8.56, nX ⫽ 10 y nY ⫽ 10. Bajo H0, se
tiene que mX ⫺ mY ⫽ 2. El estadístico de prueba está dado por la expresión (6.5) como
(X − Y ) − 2
t= 2
sX /nX + sY2 /nY
Bajo H0, el estadístico de prueba tiene la distribución t de Student con 17 grados de libertad.
Observe que el número de grados de libertad se calcula del mismo modo que en el ejemplo
6.12. El valor del estadístico de prueba es t ⫽ 2.342. Ésta es una prueba de una cola. El P-valor está entre 0.01 y 0.025. Se concluye que la media del número de elementos identificados
con el nuevo diseño estructurado es mayor que con el diseño convencional por más de 2.
Resumen
Sean X1, . . . , XnX y Y1, . . . , YnY muestras que tienen poblaciones normales con medias
mX y mY y desviaciones estándar sX y sY, respectivamente. Suponga que las muestras
se extraen de manera independiente entre sí.
Si no se conoce que sX y sY son iguales, entonces, para probar una hipótesis nula
de la forma H0: mX ⫺ mY ⱕ Δ0, H0: mX ⫺ mY ⱖ Δ0, o H0: mX ⫺ mY ⫽ Δ0:
[(sX2 /nX ) + (sY2 /nY )]2
, redondeado hacia
[(sX2 /nX )2 /(nX − 1)] + [(sY2 /nY )2 /(nY − 1)]
abajo al entero más próximo.
(X − Y ) − 0
.
Calcular el estadístico de prueba t = 2
sX /nX + sY2 /nY
Calcular ν =
Calcular el P-valor. Éste es un área debajo la curva t de Student con ν grados de libertad, que depende de la hipótesis alternativa de la siguiente manera:
Hipótesis alternativa
P-valor
H1: mX ⫺ mY ⬎ Δ0
Área a la derecha de t
H1: mX ⫺ mY ⬍ Δ0
Área a la izquierda de t
H1: mX ⫺ mY ⫽ Δ0
Suma de las áreas en las colas correspondientes a t y ⫺t
6.7
Pruebas de hipótesis para la diferencia entre dos medias con muestras pequeñas
411
Cuando las poblaciones tienen varianzas iguales
Cuando se conoce que las varianzas poblacionales son aproximadamente iguales es posible
utilizar la varianza combinada (véase la sección 5.6). Esta última la da
sp2 =
(nX − 1)sX2 + (nY − 1)sY2
nX + n Y − 2
El estadístico de prueba para probar cualesquiera de las hipótesis nulas H0: mX ⫺ mY ⫽ 0, H0:
mX ⫺ mY ⱕ 0, o H0: mX ⫺ mY ⱖ 0 es
t=
X−Y
√
sp 1/nX + 1/nY
Bajo H0, el estadístico de prueba tiene la distribución t de Student con nX ⫹ nY ⫺ 2 grados de
libertad.
Ejemplo
6.14
Se han desarrollado dos métodos para determinar el contenido de níquel del acero. En una
muestra de cinco reproducciones del primer método sobre cierta clase de acero, la medición
–
promedio (en porcentaje) fue X ⫽ 3.16 y la desviación estándar sX ⫽ 0.042. El promedio de
–
las siete reproducciones del segundo método fue Y ⫽ 3.24, y la desviación estándar, sY ⫽
0.048. Suponga que se conoce que las varianzas poblacionales son casi iguales. ¿Se puede
concluir que hay diferencia en las mediciones promedio entre los dos métodos?
Solución
Cuando se sustituyen los tamaños muestrales nX ⫽ 5 y nY ⫽ 7 junto con las desviaciones estándar muestrales sX ⫽ 0.042 y sY ⫽ 0.048, se calcula la desviación estándar combinada y se
obtiene sp ⫽ 0.0457.
Por tanto, el valor del estadístico de prueba es
t=
3.16 − 3.24
√
= −2.990
0.0457 1/5 + 1/7
Bajo H0, el estadístico de prueba tiene la distribución t de Student con diez grados de libertad. Al consultar la tabla t de Student, se encuentra que el área debajo de la curva en cada cola se halla entre 0.01 y 0.005. Dado que la hipótesis nula establecía que las medias eran
iguales, ésta es una prueba de dos colas, por lo que el P-valor representa la suma de las áreas
en ambas colas. Se concluye que 0.01 ⬍ P ⬍ 0.02 (véase la figura 6.15). Parece haber una
diferencia en las medias de las mediciones entre los dos métodos.
No suponga que las varianzas poblacionales son iguales
sólo porque las varianzas muestrales se aproximan
Es tentador suponer que las varianzas poblacionales son iguales siempre que las muestrales
son aproximadamente iguales. Sin embargo, esta suposición no está justificada, ya que tal vez
las varianzas muestrales sean casi iguales, incluso cuando las poblacionales son muy diferentes. Las suposición de que éstas son iguales se hace sólo cuando se conocen los procesos que
produjeron los datos que justificaban esta suposición. Véase el análisis en la p. 343.
412
CAPÍTULO 6
Pruebas de hipótesis
0.01
0.01
0.005
⫺3.169
0.005
0
⫺2.764
2.764 3.169
2.990
⫺2.990
FIGURA 6.15 Solución al ejemplo 6.14. El P-valor es la suma de las áreas en ambas colas, que se encuentra entre 0.01 y 0.02.
Resumen
Sean X1, . . . , XnX y Y1, . . . , YnY muestras de poblaciones normales con medias mX y
mY y desviaciones estándar sX y sY, respectivamente. Suponga que las muestras se extrajeron de manera independiente una de la otra.
Si se conoce que sX y sY son iguales, entonces, para probar una hipótesis nula de
la forma H0: mX ⫺ mY ⱕ Δ0, H0: mX ⫺ mY ⱖ Δ0, o H0: mX ⫺ mY ⫽ Δ0:
(nX − 1)sX2 + (nY − 1)sY2
.
Calcule sp =
nX + n Y − 2
Calcule al estadístico de prueba t =
(X − Y ) − 0
√
.
sp 1/nX + 1/nY
Calcule el P-valor. Éste es un área bajo la curva t de Student con nX ⫹ nY ⫺ 2
grados de libertad, que depende de la hipótesis alternativa como se muestra a continuación:
Hipótesis alternativa
P-valor
H1: mX ⫺ mY ⬎ Δ0
Área a la derecha de t
H1: mX ⫺ mY ⬍ Δ0
Área a la izquierda de t
H1: mX ⫺ mY ⫽ Δ0
Suma de las áreas en las colas correspondientes a t y ⫺t
Ejercicios para la sección 6.7
1. Un fabricante de pinturas en tono pastel está comparando
los efectos de dos clases de tintura amarilla para el brillo de
las pinturas. La tintura B es más costosa que la A, pero se
supone que puede producir una pintura con tono más fuerte. Se prueban cuatro pinturas en tonos pastel con cada tipo
de tintura, y se mide para cada una la energía de impacto (en
joules). Los resultados son:
Tintura A: 1.0
2.0
1.2
3.0
Tintura B: 3.0
3.2
2.6
3.4
a) ¿Puede concluir que la media de la energía de las pinturas en tono pastel hechas con la tintura B es mayor que
las hechas con la tintura A?
6.7
413
Pruebas de hipótesis para la diferencia entre dos medias con muestras pequeñas
b) ¿Puede concluir que la media de la energía de las pinturas en tono pastel hechas con la tintura B es mayor que
las hechas con la tintura A por más de 1 J?
2. Se realiza un estudio para determinar si el chocolate semidulce se disuelve más rápidamente que el de leche. Ocho
personas disolvieron una pieza de chocolate semidulce,
mientras que siete disolvieron una pieza de chocolate de leche. Los tiempos de disolución, en segundos, fueron:
Semidulce:
30
55
50
22
46
45
30
De leche:
45
58
23
64
105
93
28
Dificultad baja
Señales de
una persona
Video
Media
Desviación
estándar
Tamaño
muestral
47.79
47.15
2.19
2.65
14
40
Dificultad moderada
44
¿Puede concluir que la media de los tiempos de disolución
del chocolate de leche es diferente a la del chocolate semidulce?
3. El artículo “Modeling Resilient Modulus and Temperature
Correction for Saudi Roads” (H. Wahhab, I. Asi y R. Ramadhan, en Journal of Materials in Civil Engineering,
2001:298-305) describe un estudio diseñado para predecir
el módulo elástico del pavimento a partir de sus propiedades físicas. Una de las cuestiones tratadas era si los módulos
difieren cuando hay pavimento con y sin baches. A continuación se presentan mediciones del módulo elástico a 40°C
(en 106 kPa) de siete secciones de pavimento con baches y
12 sin baches.
Con baches: 1.48 1.88 1.90 1.29 3.53 2.43 1.00
Sin baches: 3.06 2.58 1.70 5.76 2.44 2.03 1.76
4.63 2.86 2.82 1.04 5.92
Realice una prueba de hipótesis para determinar si es factible que la media de los módulos elásticos sea la misma para pavimento con y sin baches. Calcule el P-valor. ¿Cuál es
su conclusión?
4. El artículo “Time Series Analysis for Construction Productivity Experiments” (T. Abdelhamid y J. Everett, en Journal
of Construction Engineering and Management 1999:87-95)
presenta un estudio que compara la efectividad de un sistema de video que permite que un operador de grúa vea el
punto de levantamiento con respecto a la operación del sistema antiguo, en el cual el operador se auxiliaba con las señales
manuales de una persona. Se estudiaron tres levantamientos
diferentes, A, B, y C. El levantamiento A fue de poca dificultad, el B, de moderada, y el C, de gran dificultad. Cada
levantamiento se realizó varias veces, tanto con el nuevo
sistema de video como con el sistema de señales manuales.
Se registró el tiempo (en segundos) requerido para realizar
cada levantamiento. Las siguientes tablas presentan las medias, las desviaciones estándar y los tamaños muestrales.
Señales de
una persona
Video
Media
Desviación
estándar
Tamaño
muestral
69.33
58.50
6.26
5.59
12
24
Gran dificultad
Señales de
una persona
Video
Media
Desviación
estándar
Tamaño
muestral
109.71
84.52
17.02
13.51
17
29
a) ¿Puede concluir que la media del tiempo para realizar
un levantamiento de dificultad baja es menor cuando se
utiliza el sistema de video que cuando se usa el sistema
antiguo? Explique.
b) ¿Puede concluir que la media del tiempo para realizar
un levantamiento de dificultad moderada es menor
cuando se utiliza el sistema moderno que cuando se emplea el sistema antiguo? Explique.
c) ¿Puede concluir que la media del tiempo para realizar
un levantamiento de gran dificultad es menor cuando se
utiliza el sistema de video que cuando se emplea el sistema anterior? Explique.
5. El artículo “Calibration of an FTIR Spectrometer” (P. Pankratz, en Statistical Case Studies for Industrial, and Process
Improvement, SIAM-ASA, 1997:19-38) describe el uso de
un espectrómetro que hace cinco mediciones del contenido
de carbono (en ppm) de cierta placa de silicio en cada uno de
dos días sucesivos. Los resultados fueron:
Día 1: 2.1321 2.1385 2.0985 2.0941 2.0680
Día 2: 2.0853 2.1476 2.0733 2.1194 2.0717
¿Puede concluir que la calibración del espectrómetro ha
cambiado del primero al segundo días?
414
Pruebas de hipótesis
CAPÍTULO 6
6. Dos pesas, cada una etiquetada con 100 g, se pesan varias
veces en la misma balanza. Los resultados, en unidades de
mg arriba de 100 g, fueron:
Primera pesa: 53 88 89 62 39 66
Segunda pesa: 23 39 28 2
49
En virtud de que se utilizó la misma balanza para ambas pesas, y de que éstas son similares, es razonable suponer que
la varianza en los pesos no depende del objeto que se está
pesando. ¿Se puede concluir que las pesas son diferentes?
7. El artículo “Mechanical Grading of Oak Timbers” (D. Kretschmann y D. Green, en Journal of Materials in Civil Engineering, 1999:91-97) presenta las mediciones finales de la
fuerza compresiva, en MPa, para el roble verde de siete por
nueve maderas de roble mezcladas de Virginia Occidental y
Pensilvania. Para 11 elementos de madera de grado 1, la
fuerza compresiva promedio fue de 22.1 con desviación estándar de 4.09. Para siete elementos de madera de grado 2,
la fuerza compresiva promedio fue 20.4 con desviación estándar de 3.08. ¿Puede concluir que la media de la fuerza
compresiva para la madera de grado 1 es mayor que la de
grado 2?
8. Se comparan dos métodos para medir el calor molar de fusión del agua. Diez mediciones realizadas con el método A
tienen una media de 6.02 kilojoules por mole (kJ/mol) con
desviación estándar de 0.02 (kJ/mol). Cinco mediciones
realizadas con el método B tienen una media de 6.00 kJ/mol
y desviación estándar de 0.01 kJ/mol. ¿Puede concluir que
la media de las mediciones difiere entre los dos métodos?
9. Con referencia al ejercicio 8 de la sección 5.6, ¿puede concluir que las capacidades caloríficas del carbón de las dos
minas son diferentes?
10. Considerando el ejercicio 2 de la sección 5.6, ¿puede concluir que más de 0.1 mg se absorbe entre 30 y 60 minutos
después de la exposición?
11. Considerando el ejercicio 4 de la sección 5.6:
a) ¿Puede concluir que la media de la frecuencia de mutación para hombres de 60 años de edad es mayor que para hombres de 20?
b) ¿Puede concluir que la media de la frecuencia de mutación para hombres de 60 años de edad es mayor a 25 secuencias por mg que para varones de 20?
12. Considerando el ejercicio 9 de la sección 5.6, ¿puede concluir que la media de la fuerza de ruptura es mayor para palos de hockey hechos con el compuesto B?
13. En relación con el ejercicio 10 de la sección 5.6, ¿puede
concluir que la media del coeficiente de permeabilidad en
60°C es diferente que la de 61°C?
14. El siguiente resultado de MINITAB presenta los resultados de una prueba de hipótesis para la diferencia mX ⫺ mY entre dos medias poblacionales.
Two-sample T for X vs Y
X
Y
N
10
10
Mean
39.31
29.12
StDev
8.71
4.79
SE Mean
2.8
1.5
Difference = mu (X) − mu (Y)
Estimate for difference: 10.1974
95% lower bound for difference: 4.6333
T-Test of difference = 0 (vs >): T-Value = 3.25
a) ¿Ésta es una prueba de una o de dos colas?
b) ¿Cuál es la hipótesis nula?
c) ¿Puede H0 ser rechazada a un nivel de 1%? ¿Cómo justifica su respuesta?
P-Value = 0.003
DF = 13
6.8
415
Pruebas de hipótesis con datos apareados
15. El siguiente resultado MINITAB presenta los resultados de una prueba de hipótesis para la diferencia mX ⫺ mY entre dos medias poblacionales. Faltan algunos de los números. Complete los números del (a) al (d).
Two-sample T for X vs Y
N
Mean
StDev
SE Mean
X
6
1.755
0.482
(a)
Y
13
3.239
(b)
0.094
Difference = mu (X) − mu (Y)
Estimate for difference: (c)
95% CI for difference: (−1.99996, −0.96791)
T-Test of difference = 0 (vs not =): T-Value = (d)
6.8
P-Value = 0.000
DF = 7
Pruebas de hipótesis con datos apareados
En la sección 5.7 se observó que algunas veces es mejor diseñar un experimento de dos muestras, por lo que cada elemento en una muestra está apareado con un elemento en la otra. En
esta sección se presenta un método para las pruebas de hipótesis que implica la diferencia entre dos medias poblacionales con base en datos apareados. Se inicia con un ejemplo.
Las emisiones de materia partícula (MP) de los automóviles son un problema ambiental serio. Se eligieron aleatoriamente ocho vehículos de una flota, y se midieron sus emisiones durante su recorrido en autopista y en condiciones de arranque y frenado; además, se
calcularon las diferencias en ambas situaciones. Los resultados, en miligramos de partículas
por galón de combustible, fueron los siguientes:
Vehículo
1
Arranque y frenado
1 500
Recorrido en autopista 941
Diferencia
559
2
3
4
5
6
7
8
870
456
414
1 120
893
227
1 250
1 060
190
3 460
3 107
353
1 110
1 339
−229
1 120
1 346
−226
880
644
236
¿Se puede concluir que la media del nivel de emisiones es menor para el recorrido en autopista que para el arranque y frenado?
La idea básica detrás de la construcción de la prueba de hipótesis en este ejemplo es la
misma que la idea detrás de la construcción de los intervalos de confianza para los datos apareados de la sección 5.7. Se trata de la colección de diferencias como una sola muestra aleatoria de una población de diferencias. La media poblacional se denota con mD y la desviación
estándar con sD. Hay solamente ocho diferencias, de ellas una es muestra pequeña. Si se supone que la población de diferencias es aproximadamente normal, se puede utilizar la prueba
t de Student, como se presentó en la sección 6.4.
416
CAPÍTULO 6
Pruebas de hipótesis
–
El valor observado de la media muestral de diferencias es D ⫽ 190.5. La desviación estándar muestral es sD ⫽ 284.1. Las hipótesis nula y alternativa son
H0 : μD ≤ 0
contra H1 : μD > 0
El estadístico de prueba es
t=
190.5 − 0
D−0
√ = 1.897
√ =
sD / n
284.1/ 8
La distribución nula del estadístico de prueba es la t de Student con siete grados de libertad. La
figura 6.16 presenta la distribución nula e indica la ubicación del estadístico de prueba. Ésta
es una prueba de una cola. La tabla t indica que 5% del área en la cola corresponde a un valor t de 1.895, muy cerca del valor observado de 1.897. El P-valor es aproximadamente 0.05.
El siguiente resultado de computadora (de MINITAB) presenta este resultado.
Paired T-Test and CI: StopGo, Highway
Paired T for StopGo - Highway
StopGo
Highway
Difference
N
8
8
8
Mean
1413.75
1223.25
190.50
StDev
850.780
820.850
284.104
SE Mean
300.796
290.214
100.446
95% lower bound for mean difference: 0.197215
T-Test of mean difference = 0 (vs > 0):
T-Value = 1.90
P-Value = 0.050
Observe que el límite inferior de 95% es apenas consistente con la hipótesis alternativa. Esto
último indica que el P-valor sólo es apenas menor que 0.05 (aunque está dado por 0.050 con
dos dígitos significativos).
P ≈ 0.05
0
1.897
√
FIGURA 6.16 La distribución nula def t = (D − 0)/(sD / 8) es t7. El valor observado de
–
t, correspondiente a los valores observados D ⫽ 190.5 y sp ⫽ 284.1, es 1.897. Si H0 es ver-
dadera, la probabilidad que t tome un valor tan extremo o más extremo que el observado
está muy cercano a 0.05.
6.8
Pruebas de hipótesis con datos apareados
417
Resumen
Sea (X1, Y1), . . . , (Xn, Yn) una muestra de pares ordenados cuyas diferencias D1, . . . ,
Dn son muestra de una población normal con media mD.
Para probar una hipótesis nula de la forma H0: mD ⱕ m0, H0: mD ⱖ m0, o H0: mD ⫽
m0:
D − μ0
√ .
Se calcula el estadístico de prueba t =
sD / n
Se calcula el P-valor. Éste es un área debajo la curva t de Student con n ⫺ 1 grados de libertad, que depende de la hipótesis alternativa de la siguiente manera:
Hipótesis alternativa
P-valor
H1: mD ⬎ m0
Área a la derecha de t
H1: mD ⬍ m0
Área a la izquierda de t
H1: mD ⫽ m0
Suma de las áreas en las colas correspondientes a t y ⫺t
Si la muestra es grande, la Di necesaria no está normalmente distribuida, el
estadístico de prueba es z =
D − μ0
√ , y se debe realizar la prueba z.
sD / n
Ejercicios para la sección 6.8
1. Los músculos se flexionan cuando se estimulan a través de
impulsos eléctricos en puntos motores (puntos en el músculo) o en nervios. El artículo “Force Assessment of the Stimulated Arm Flexors: Quantification of Contractile
Properties” (J. Hong y P. Iaizzo, en Journal of Medical Engineering and Technology, 2002:28-35) informa acerca de
un estudio en el que ambos métodos se aplicaban a las regiones superiores del brazo de cada una de las partes. Se
midió el tiempo de latencia (tiempo entre el estímulo y la
contracción) (en milésimas de segundo) para cada parte.
Los resultados para siete partes se presentan en la siguiente
tabla (se ha eliminado un dato atípico).
Parte
1
2
3
4
5
6
7
Nervio
59
Punto motriz 56
Diferencia
3
57
52
5
58
56
2
38
32
6
53
47
6
47
42
5
51
48
3
¿Puede concluir que hay una diferencia en el periodo de latencia entre el punto motor y el estímulo nervioso?
2. La maniobra de Valsalva implica soplar en un tubo cerrado
con el fin de crear presión en las vías respiratorias. La impedancia cardiográfica se utiliza durante esta maniobra para evaluar la función cardiaca. El artículo “Impedance
Cardiographic Measurement of the Physiological Response
to the Valsalva Manoeuvre” (R. Patterson y J. Zhang, en
Medical and Biological Engineering and Computing,
2003:40-43) presenta un estudio en el cual se midió el cociente de impedancia para cada una de las 11 partes, tanto
en posición de pie como acostada. Los resultados de la presión de una vía aérea de 10 mmHg se presentan en la siguiente tabla.
418
Pruebas de hipótesis
CAPÍTULO 6
Parte
De pie
Acostada
1.45
1.71
1.81
1.01
0.96
0.83
1.23
1.00
0.80
1.03
1.39
0.98
1.42
0.70
1.10
0.78
0.54
1.34
0.72
0.75
0.82
0.60
1
2
3
4
5
6
7
8
9
10
11
Código
Diferencia
0.47
0.29
1.11
−0.09
0.18
0.29
−0.11
0.28
0.05
0.21
0.79
1
2
Placa
1
2
3
4
5
6
7
8
9
10
Centro
Borde
586
568
587
550
543
552
562
577
558
571
582
569
587
543
540
548
563
572
559
566
¿Puede concluir que las tasas de grabado difieren entre el
centro y el borde?
4. Se comparan dos microprocesadores en una muestra de seis
códigos de puntos de referencia para determinar si hay una
diferencia en la rapidez. Los tiempos (en segundos) utilizados para cada procesador en cada código están dados en la
tabla siguiente.
4
5
6
Procesador A 27.2 18.1 27.2 19.7 24.5 22.1
Procesador B 24.1 19.3 26.8 20.1 27.6 29.8
¿Puede concluir que las medias de la rapidez de ambos procesadores son diferentes?
5. Se midió la fuerza compresiva, en kilopascales, para cada
uno de cinco bloques de concreto, tanto tres como seis días
después de verterlos. En la siguiente tabla se presentan los
datos.
¿Puede concluir que hay diferencia entre la media del cociente de la impedancia medida en las posiciones de pie y
sentada?
3. Un proceso de grabado en seco se utiliza para grabar dióxido de silicio (SiO2) fuera de placas de silicio. Un ingeniero
desea estudiar la uniformidad del grabado a través de la superficie de la placa. Se muestrea un total de diez placas después del grabado, y se miden las tasas de grabado (en
Å/minuto) en dos sitios diferentes, uno cerca del centro de
la placa y otro casi en el borde. Los resultados se presentan
en la tabla siguiente.
3
Bloque
Después
de tres días
Después
de seis días
1
2
3
4
5
1 341
1 316
1 352
1 355
1 327
1 376
1 373
1 366
1 384
1 358
¿Puede concluir que la media de la fuerza después de seis
días es mayor que la media de la fuerza después de tres
días?
6. Considerando el ejercicio 3 de la sección 5.7, ¿puede concluir que la balanza 2 registra, en promedio, más peso que
la balanza 1?
7. Teniendo en cuenta el ejercicio 4 de la sección 5.7, ¿puede
concluir que hay una diferencia en la tensión entre los pernos 1 y 8?
8. Considerando el ejercicio 7 de la sección 5.7:
a) ¿Puede concluir que la media de los tiempos de vida de
los patines de los frenos traseros es mayor que la de los
delanteros?
b) ¿Puede concluir que la media de los tiempos de vida de
los patines de los frenos traseros es mayor que la de los
frenos delanteros en más de diez mil millas?
9. La directiva de una compañía de taxis está tratando de decidir si debe cambiar de neumáticos normales a neumáticos
radiales para mejorar el ahorro de combustible. Se equiparon cada uno de los diez taxis con uno de los dos tipos de
6.8
neumáticos y se condujeron en una trayectoria de prueba.
Sin cambiar de conductores, se seleccionó el tipo de neumáticos y se repitió la trayectoria de prueba. El ahorro de combustible (en milla/galón) para los diez automóviles es:
Automóvil
Radial
Normal
1
2
3
4
5
6
7
8
9
10
32.1
36.1
32.3
29.5
34.3
31.9
33.4
34.6
35.2
32.7
27.1
31.5
30.4
26.9
29.9
28.7
30.2
31.8
33.6
29.9
Pruebas de hipótesis con datos apareados
419
a) Debido a que el cambio de neumáticos en la flota de taxis es caro, la directiva no quiere cambiar a menos que
una prueba de hipótesis proporcione evidencias de que
mejorará el millaje. Establezca las hipótesis nula y alternativa adecuadas, y encuentre el P-valor.
b) Un análisis costo-beneficio muestra que será provechoso cambiar a neumáticos radiales si la media de la mejora del millaje es mayor a dos millas/galón. Establezca
las hipótesis nula y alternativa adecuadas, y determine el
P-valor, para una prueba de hipótesis diseñada como base de la decisión de cambiar.
10. El siguiente resultado MINITAB presenta los resultados de una prueba de hipótesis para la diferencia mX ⫺ mY entre dos medias poblacionales.
Paired T for X − Y
X
Y
Difference
N
12
12
12
Mean
134.233
100.601
33.6316
StDev
68.376
94.583
59.5113
SE Mean
19.739
27.304
17.1794
95% lower bound for mean difference: 2.7793
T-Test of mean difference = 0 (vs > 0):
T-Value = 1.96
P-Value = 0.038
a) ¿Es ésta una prueba de una o de dos colas?
b) ¿Cuál es la hipótesis nula?
c) ¿Puede H0 ser rechazada a un nivel de 1%? ¿Cómo justifica su respuesta?
d ) Utilice el resultado y una tabla adecuada para calcular un intervalo de confianza de 98% para mX ⫺ mY.
11. El siguiente resultado MINITAB presenta el desenlace de una prueba de hipótesis para la diferencia mX ⫺ mY entre dos medias
poblacionales. Faltan algunos números. Complete los números del (a) al (d).
Paired T for X − Y
X
Y
Difference
N
7
7
7
Mean
12.4141
8.3476
(c)
StDev
2.9235
(b)
3.16758
SE Mean
(a)
1.0764
1.19723
95% lower bound for mean difference: 1.74006
T-Test of mean difference = 0 (vs > 0):
T-Value = (d)
P-Value = 0.007
420
6.9
CAPÍTULO 6
Pruebas de hipótesis
Pruebas de hipótesis con distribuciones libres
Las pruebas t de Student descritas en las secciones 6.4 y 6.7 requieren que las muestras provengan de poblaciones normales. Las pruebas con distribuciones libres obtienen su nombre
del hecho de que no se requiere que las muestras provengan de ninguna distribución específica. Mientras que pruebas con distribuciones libres requieren de supuestos para su validez,
éstos son un poco menos restrictivos que los necesarios para la prueba t. Las pruebas con distribuciones libres son en ocasiones llamadas pruebas no paramétricas.
En esta sección se analizan dos pruebas con distribuciones libres. La primera, prueba
del rango con signo de Wilcoxon, es útil para una media poblacional, similar a la prueba t
muestral analizada en la sección 6.4. La segunda, prueba de la suma del rango de Wilcoxon, o prueba de Mann-Whitney, es similar a la prueba t de dos muestras analizada en la
sección 6.7.
La prueba del rango con signo de Wilcoxon
Esta prueba se muestra con un ejemplo. El contenido de níquel, en partes de miles por peso,
se mide para seis soldaduras. Los resultados son 9.3, 0.9, 9.0, 21.7, 11.5 y 13.9. Sea m la media del contenido de níquel para este tipo de soldadura. Se desea probar H0: m ⱖ 12 contra
H1: m ⬍ 12. La prueba t de Student no es adecuada porque hay dos datos atípicos, 0.9 y 21.7,
que indican que la población no es normal. La prueba del rango con signo de Wilcoxon se
puede utilizar en esta situación. Esta prueba no exige que la población sea normal. Sin embargo, requiere que sea continua (en vez de discreta), y que la función de densidad de probabilidad sea simétrica. (La normal es un caso especial de una población simétrica continua.)
La muestra dada proviene de una población continua, y la presencia de datos atípicos en cualquier lado hace razonable suponer que la población es casi simétrica. Por tanto, se procede
como se muestra a continuación.
Bajo H0, la media poblacional es m ⫽ 12. Ya que se supone que la población es simétrica, también la mediana poblacional es 12. Para calcular el estadístico de la suma del rango
se inicia restando 12 a cada observación de la muestra con el fin de obtener las diferencias. A
la diferencia más cercana a 0, ignorando el signo, se le asigna un rango de 1. A la siguiente
diferencia más cercana a 0, ignorando nuevamente el signo, se le asigna un rango de 2, y así
sucesivamente. Por último, a los rangos que les corresponden diferencias negativas se les
asignan signos negativos. La siguiente tabla muestra los resultados.
x
x − 12
11.5
13.9
9.3
9.0
21.7
0.9
−0.5
1.9
−2.7
−3.0
9.7
−11.1
Rango
con signo
−1
2
−3
−4
5
−6
La suma de los rangos positivos se denota con S⫹, y la suma de los valores absolutos de
los rangos negativos con S⫺. Tanto S⫹ como S⫺ se pueden utilizar como un estadístico de prueba; se utilizará S⫹. En este ejemplo S⫹ ⫽ 2 ⫹ 5 ⫽ 7, y S⫺ ⫽ 1 ⫹ 3 ⫹ 4 ⫹ 6 ⫽ 14. Observe
6.9
Pruebas de hipótesis con distribuciones libres
421
que debido a que el tamaño de muestra es 6, necesariamente S⫹ ⫹ S⫺ ⫽ 1 ⫹ 2 ⫹ 3 ⫹ 4 ⫹ 5
⫹ 6 ⫽ 21. Para cualquier muestra, éste es el caso S⫹ ⫹ S⫺ ⫽ 1 ⫹ 2 ⫹ · · · ⫹ n ⫽ n(n ⫹ 1)/2.
En algunos casos, donde hay muchos más rangos positivos que rangos negativos, es más fácil
calcular primero a S⫺ al sumar los rangos negativos y después calcular S⫹ ⫽ n(n ⫹ 1)/2 ⫺ S⫺.
Las figuras 6.17 y 6.18 muestran cómo se puede utilizar S⫹ como un estadístico de prueba. En la figura 6.17, m ⬎ 12. Para esta distribución las diferencias positivas son más probables que las negativas y tienden a ser más grandes en magnitud. Por tanto, es probable que los
rangos positivos sean más grandes tanto en número como en magnitud que los rangos negativos, por lo que es posible que S⫹ invierta la situación. Aquí los rangos positivos son menos
en número y menores en magnitud, por lo que S⫹ es pequeño.
12
m
FIGURA 6.17 La mediana verdadera es mayor que 12. Es más probable que las observaciones de la muestra estén por arriba que por debajo de 12. Además, las observaciones arriba de 12 tenderán a tener diferencias mayores de 12 que las observaciones debajo de 12.
Por tanto, S⫹ probablemente es grande.
m
12
FIGURA 6.18 La mediana verdadera es menor de 12. Es más probable que las observaciones de la muestra estén por debajo de 12 que por arriba de 12. Además, las observaciones debajo de 12 tenderán a tener diferencias mayores de 12, que las observaciones arriba
de 12. Por tanto, S⫹ probablemente es pequeño.
422
CAPÍTULO 6
Pruebas de hipótesis
Se observa que, en general, los valores grandes de S⫹ proporcionan evidencia contra
una hipótesis nula de la forma H0: m ⱕ m0, mientras que valores pequeños de S⫹ proporcionarán evidencia en contra de una hipótesis nula de la forma H0: m ⱖ m0.
En este ejemplo, la hipótesis nula es H0: m ⱖ 12, por eso un valor pequeño de S⫹ proporcionará evidencia en contra de H0. Se observa que S⫹ ⫽ 7. El P-valor es la probabilidad
de observar un valor de S⫹ que es menor o igual a 7 cuando H0 es verdadera. La tabla A.4 (en
el apéndice A) presenta ciertas probabilidades para la distribución nula de S⫹. Al consultar esta tabla con el tamaño de muestra n ⫽ 6, se encuentra la probabilidad de observar un valor de
4 o menor de 0.1094. La probabilidad de observar un valor de 7 o menor debe ser más grande que esto último, por lo que se concluye que P ⬎ 0.1094; por consiguiente, no se rechaza
H0.
Ejemplo
6.15
En el ejemplo analizado previamente se midió el contenido de níquel para seis soldaduras de
9.3, 0.9, 9.0, 21.7, 11.5 y 13.9. Utilice estos datos para probar H0: m ⱕ 5 contra H1: m ⬎ 5.
Solución
La tabla de diferencias y los rangos con signos son:
x
9.0
0.9
9.3
11.5
13.9
21.7
x− 5
Rango
con signo
4.0
−4.1
4.3
6.5
8.9
16.7
1
−2
3
4
5
6
El valor observado del estadístico de prueba es S⫹ ⫽ 19. Ya que la hipótesis nula es de la forma H0: m ⱕ m0, valores grandes de S⫹ proporcionan evidencia contra H0. Por tanto, el P-valor es el área en la cola derecha de la distribución nula, correspondiendo a valores igual o
superiores a 19. Al consultar la tabla A.4 se encuentra que el P-valor es 0.0469.
Ejemplo
6.16
Utilice los datos del ejemplo 6.15 para probar H0: m ⫽ 16 contra H1: m ⫽ 16.
6.9
Pruebas de hipótesis con distribuciones libres
423
Solución
La tabla de diferencias y rangos con signos es:
x − 16
x
13.9
11.5
21.7
9.3
9.0
0.9
−2.1
−4.5
5.7
−6.7
−7.0
−15.1
Rango
con signo
−1
−2
3
−4
−5
−6
Puesto que la hipótesis nula es de la forma H0: m ⫽ m0, ésta es una prueba de dos colas. El
valor observado del estadístico de prueba es S⫹ ⫽ 3. Al consultar la tabla A.4, se encuentra
que el área en la cola izquierda, correspondiente a valores menores que o iguales a 3, es
0.0781. El P-valor es el doble de esta cantidad, ya que es la suma de áreas en dos colas iguales. Por tanto, el P-valor es 2(0.0781) ⫽ 0.1562.
Empates
A veces dos o más de las cantidades a las cuales debe asignárseles rango tienen exactamente
el mismo valor. Se dice que estas cantidades están empatadas. El método usual para tratar los
empates es asignar a cada observación empatada el promedio de los rangos que habrían recibido si hubieran sido ligeramente diferentes. Por ejemplo, las cantidades 3, 4, 4, 5, 7 recibirían los rangos 1, 2.5, 2.5, 4, 5 y las cantidades 12, 15, 16, 16, 16, 20 recibirían los rangos 1,
2, 4, 4, 4, 6.
Diferencias de cero
Si la media bajo H0 es m0 y una de las observaciones es igual a m0, entonces su diferencia es
0, que no es positivo ni negativo. Una observación igual a m0 no puede recibir un rango con
signo. El procedimiento adecuado consiste en eliminar estas observaciones de la muestra, y
considerar que el tamaño de ésta se ha reducido como consecuencia del número de aquéllas.
El ejemplo 6.17 sirve para ilustrar este punto.
Ejemplo
6.17
Utilice los datos del ejemplo 6.15 para probar H0: m ⫽ 9 contra H0: m ⫽ 9.
Solución
La tabla de diferencias y de rangos con signo es:
x
x− 9
Rango
con signo
9.0
9.3
11.5
13.9
0.9
21.7
0.0
0.3
2.5
4.9
−8.1
12.7
−
1
2
3
−4
5
424
CAPÍTULO 6
Pruebas de hipótesis
El valor del estadístico de prueba es S⫹ ⫽ 11. El tamaño muestral para propósitos de la prueba es 5, ya que el valor 9.0 no tiene rango. Al ingresar a la tabla A.4 con tamaño muestral 5,
se encuentra que S⫹ ⫽ 12, el P-valor sería 2(0.1562) ⫽ 0.3124. Se concluye que para S⫹ ⫽
11, P ⬎ 0.3124.
Aproximación para muestras grandes
Cuando el tamaño muestral n es grande, el estadístico de prueba S⫹ está distribuido aproximadamente en forma normal. Una regla general es que la aproximación normal es buena si n
⬎ 20. Se puede demostrar mediante métodos avanzados que bajo H0 S⫹ tiene una media n(n
⫹ 1)/4 y varianza n(n ⫹ 1)(2n ⫹ 1)/24. La prueba del rango con signo de Wilcoxon se realiza cuando se calcula el puntaje z de S⫹, y después al usar la tabla normal para encontrar el
P-valor. El puntaje z es
S+ − n(n + 1)/4
z= √
n(n + 1)(2n + 1)/24
El ejemplo 6.18 ilustra el método.
Ejemplo
6.18
El artículo “Exact Evaluation of Batch-Ordering Inventory Policies in Two-Echelon Supply
Chains with Periodic Review” (G. Chacon, en Operations Research, 2001:79-98) presenta
una evaluación de un reordenamiento de una política focal. Se estiman los costos para 32
escenarios. Sea m la media del costo. Pruebe que H0: m ⱖ 70 contra H1: m ⬍ 70. Los datos,
junto con las diferencias y los rangos con signo, se presentan en la tabla 6.1.
TABLA 6.1 Datos para el ejemplo 6.18
x
79.26
80.79
82.07
82.14
57.19
55.86
42.08
41.78
100.01
100.36
30.46
Rango
x − 70 con signo
9.26
10.79
12.07
12.14
–12.81
–14.14
–27.92
–28.22
30.01
30.36
–39.54
1
2
3
4
–5
–6
–7
–8
9
10
–11
x
30.27
22.39
118.39
118.46
20.32
16.69
16.50
15.95
15.16
14.22
11.64
Rango
x − 70 con signo
–39.73
–47.61
48.39
48.46
–49.68
–53.31
–53.50
–54.05
–54.84
–55.78
–58.36
–12
–13
14
15
–16
–17
–18
–19
–20
–21
–22
x
11.48
11.28
10.08
7.28
6.87
6.23
4.57
4.09
140.09
140.77
Rango
x − 70 con signo
–58.52
–58.72
–59.92
–62.72
–63.13
–63.77
–65.43
–65.91
70.09
70.77
–23
–24
–25
–26
–27
–28
–29
–30
31
32
Solución
El tamaño de muestra es n ⫽ 32, por lo que la media es n(n ⫹ 1)/4 ⫽ 264 y la varianza es
n(n ⫹ 1)(2n ⫹ 1)/24 ⫽ 2 860. La suma de los rangos positivos es S⫹ ⫽ 121. Se calcula
z=
121 − 264
√
= − 2.67
2 860
6.9
Pruebas de hipótesis con distribuciones libres
425
Debido a que la hipótesis nula es de la forma H0: m ⱖ m0, valores pequeños de S⫹ proporcionan evidencias contra H0. Por tanto, el P-valor es el área debajo de la curva normal a la izquierda de z ⫽ ⫺2.67. Esta área, y por consiguiente, el P-valor, es 0.0038.
La prueba de la suma del rango de Wilcoxon
La prueba de la suma del rango de Wilcoxon, también llamada de Mann-Whitney, es útil para probar la diferencia en las medias poblacionales en ciertos casos donde las poblaciones no
son normales. Son necesarias dos suposiciones. Primero, las poblaciones deben ser continuas.
Segundo, sus funciones de densidad de probabilidad deben ser idénticas en forma y tamaño;
la única diferencia posible entre ellas será su posición. Para describir la prueba, sea X1, . . . ,
Xm una muestra aleatoria de una población y sea Y1, . . . , Yn una muestra aleatoria de la otra.
Se adopta la notación convencional que cuando los tamaños muestrales no son iguales, la
muestra menor se denotará mediante X1, . . . , Xm. Por tanto, los tamaños muestrales son m y
n, con m ⱕ n. Las medias poblacionales se denotan con mX y mY, respectivamente.
La prueba se realiza ordenando los m ⫹ n valores obtenidos de la combinación de las
dos muestras, y se asignan los rangos 1, 2, . . . , m ⫹ n a ellos. El estadístico de prueba, denotado con W, representa la suma de los rangos correspondientes a X1, . . . , Xm. Debido a que
las poblaciones son idénticas con la posible excepción de la posición, en consecuencia si mX
⬍ mY, los valores en la muestra X tenderán a ser menores que aquellos en la muestra Y, por lo
que la suma de los rangos W también tenderán a ser menores. Por un razonamiento similar, si
mX ⬎ mY, W tenderá a ser mayor. Se muestra la prueba en el ejemplo 6.19.
Ejemplo
6.19
Se miden resistencias, en mΩ, para cinco alambres de un tipo y seis de otro. Los resultados
son:
X:
36
28
29
20
38
Y:
34
41
35
47
49
46
Utilice la prueba de la suma del rango de Wilcoxon para probar H0: mX ⱖ mY contra H1: mX ⬍ mY.
Solución
Se ordenan los 11 valores y se les asignan rangos
Valor
Rango
20
28
29
34
35
36
1
2
3
4
5
6
Muestra
X
X
X
Y
Y
X
Valor
Rango
38
41
46
47
49
7
8
9
10
11
Muestra
X
Y
Y
Y
Y
El estadístico de prueba W es la suma de los rangos que corresponden a los valores de X, por
lo que W ⫽ 1 ⫹ 2 ⫹ 3 ⫹ 6 ⫹ 7 ⫽ 19. El P-valor se determina consultando la tabla A.5 (en
el apéndice A). Se observa que valores pequeños de W proporcionan evidencia en contra de
H0: mX ⱖ mY, por lo que el P-valor es el área en la cola izquierda de la distribución nula. Buscando en la tabla con m ⫽ 5 y n ⫽ 6 se encuentra que el área a la izquierda de W ⫽ 19 es
0.0260. Éste es el P-valor.
426
CAPÍTULO 6
Pruebas de hipótesis
Aproximación para muestras grandes
Cuando ambos tamaños de muestra m y n son mayores que 8, se puede mostrar mediante métodos avanzados que la distribución nula del estadístico de prueba W es aproximadamente
normal con media m(m ⫹ n ⫹ 1)/2 y la varianza mn(m ⫹ n ⫹ 1)/12. En estos casos la prueba se realiza al calcular el puntaje z de W, y después con la tabla normal para encontrar el
P-valor. El puntaje z es
W − m(m + n + 1)/2
z= √
mn(m + n + 1)/12
El ejemplo 6.20 ilustra el método.
Ejemplo
6.20
El artículo “Cost Analysis Between SABER and Design Bid Build Contracting Methods” (E.
Henry y H. Brothers, en Journal of Construction Engineering and Management, 2001:359366) presenta datos de costos de construcción para diez trabajos ofrecidos por el método tradicional (denotados por X) y 19 trabajos ofrecidos por un sistema experimental (denotados
por Y). Los datos, en unidades de dólares por metro cuadrado, y sus rangos se presentan en la
tabla 6.2. Pruebe que H0: mX ⱕ mY contra H1: mX >mY.
TABLA 6.2 Datos para el ejemplo 6.20
Valor
Rango
57
95
101
118
149
196
200
233
243
341
419
457
584
592
594
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Muestra
X
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
X
X
Y
Y
Valor
Rango
613
622
708
726
843
908
926
943
1 048
1 165
1 293
1 593
1 952
2 424
16
17
18
19
20
21
22
23
24
25
26
27
28
29
Muestra
X
Y
X
Y
Y
Y
X
Y
Y
X
X
X
X
Y
Solución
La suma de los rangos X es W ⫽ 1 ⫹ 12 ⫹ 13 ⫹ 16 ⫹ 18 ⫹ 22 ⫹ 25 ⫹ 26 ⫹ 27 ⫹ 28 ⫽
188. Los tamaños de muestra son m ⫽ 10 y n ⫽ 19. Se utiliza la aproximación normal y se
calcula
188 − 10(10 + 19 + 1)/2
z= √
10(19)(10 + 19 + 1)/12
= 1.74
6.9
Pruebas de hipótesis con distribuciones libres
427
Valores grandes de W proporcionan evidencias contra la hipótesis nula. Por tanto, el P-valor
es el área debajo de la curva normal a la derecha de z ⫽ 1.74. De la tabla z se encuentra que
el P-valor es 0.0409.
Los métodos con distribuciones libres no están libres de supuestos
Se debe señalar que los métodos con distribución libre presentados aquí requieren ciertos supuestos para su validez. Desafortunadamente, esto último a veces se olvida en la práctica. Es
tentador usar un procedimiento con distribución libre automáticamente en cualquier situación
en la que la prueba t de Student no parece estar justificada, y suponer que los resultados serán validos siempre que éste no sea el caso. Las suposiciones necesarias de simetría para la
prueba del rango con signo y de formas idénticas y extensiones para la prueba de la suma del
rango son, en realidad, algo restrictivas. Mientras que estas pruebas funcionan razonablemente bien en violaciones moderadas de estos supuestos, no son aplicables de modo universal.
Ejercicios para la sección 6.9
1. El artículo “Wastewater Treatment Sludge as a Raw Material for the Production of Bacillus thuringiensis Based Biopesticides” (M. Tirado Montiel, R. Tyagi y J. Valero, en
Water Research 2001:3807-3816) presenta mediciones de
sólidos totales, en g/l, para siete muestras de lodo. Los resultados (redondeados al gramo más cercano) son 20, 5, 25,
43, 24, 21 y 32. Suponga que la distribución de sólidos totales es casi simétrica.
a) ¿Puede concluir que la media de la concentración de sólidos totales es mayor que 14 g/l? Calcule el estadístico
de prueba adecuado y determine el P-valor.
b) ¿Puede concluir que la media de la concentración de sólidos totales es menor que 30 g/l? Calcule el estadístico
de prueba adecuado y determine el P-valor.
c) Un ingeniero ambienta1 afirma que la media de la concentración de sólidos totales es igual a 18 g/l. ¿Los datos refutan esta afirmación?
2. Se mide el espesor de ocho almohadillas diseñadas para
emplearlas en monturas de motores de aviones. Los resultados, en mm, son 41.83, 41.01, 42.68, 41.37, 41.83, 40.50,
41.70 y 41.42. Suponga que los espesores son una muestra
de distribución casi simétrica.
a) ¿Puede concluir que la media del espesor es mayor a 41
mm? Calcule el estadístico de prueba adecuado y determine el P-valor.
b) ¿Puede concluir que la media del espesor es menor a
41.8 mm? Calcule el estadístico de prueba adecuado y
determine el P-valor.
c) El espesor objetivo es 42 mm, ¿puede concluir que la
media del espesor difiere del valor objetivo? Calcule el
estadístico de prueba adecuado y encuentre el P-valor.
3. El artículo “Reaction Modeling and Optimization Using
Neural Networks and Genetic Algorithms: Case Study Involving TS-l-Catalyzed Hydroxylation of Benzene” (S.
Nandi, P. Mukherjee y cols., en Industrial and Engineering
Chemistry Research, 2002:2159-2169) presenta conversiones de benceno (en porcentaje molar) para 24 reacciones de
hidroxilación de benceno diferentes. Los resultados son
52.3
30.3
14.3
41.1
41.0
30.1
28.8
63.0
33.4
67.8
80.8
36.2
78.6
26.8
34.6
72.3
37.3
40.0
9.1 19.0
38.1 33.6
81.2 59.4.
a) ¿Puede concluir que la media de conversión es menor de
45? Calcule el estadístico de prueba adecuado y determine el P-valor.
b) ¿Puede concluir que la media de conversión es mayor de
30? Calcule el estadístico de prueba adecuado y determine el P-valor.
c) ¿Puede concluir que la media de conversión es diferente de 55? Calcule el estadístico de prueba adecuado y
determine el P-valor.
428
CAPÍTULO 6
Pruebas de hipótesis
4. El artículo “Abyssal Peridotites ⬎ 3 800 Ma from Southern
West Greenland: Field Relationships, Petrography, Geochronology, Whole-Rock and Mineral Chemistry of Dunite
and Harzburgite Inclusions in the Itsaq Gneiss Complex”
(C. Friend, V. Bennett y A. Nutman, en Contributions to Mineral Petrology, 2002:71-92) presenta concentraciones de
dióxido de silicio (SiO2) (en porcentaje de peso) para diez
peridotitas. Los resultados son:
40.57
43.76
41.48
44.86
40.76
43.06
39.68 43.68
46.14.
43.53
a) ¿Puede concluir que la media de la concentración es mayor a 41? Calcule el estadístico de prueba adecuado y
determine el P-valor.
b) ¿Puede concluir que la media de la concentración es menor a 43? Calcule el estadístico de prueba adecuado y
determine el P-valor.
c) ¿Puede concluir que la media de la concentración difiere de 44? Calcule el estadístico de prueba adecuado y
determine el P-valor.
5. Este ejercicio muestra que la prueba del rango con signo se
puede utilizar con datos apareados. Se comparan dos calibradores que miden la profundidad de huella de los neumáticos. Se miden diez diferentes puntos en un neumático una
vez con cada calibrador. Los resultados, en mm, se presentan en la tabla siguiente.
Punto Calibrador 1 Calibrador 2 Diferencia
1
2
3
4
5
6
7
8
9
10
3.95
3.23
3.60
3.48
3.89
3.76
3.45
3.01
3.82
3.44
3.80
3.30
3.59
3.61
3.88
3.73
3.56
3.02
3.77
3.49
0.15
−0.07
0.01
−0.13
0.01
0.03
−0.11
−0.01
0.05
−0.05
Suponga que las diferencias son una muestra de una población casi simétrica con media m. Utilice la prueba del rango con signo de Wilcoxon para probar H0: m ⫽ 0 contra H1:
m ⫽ 0.
6. El artículo “n-Nonane Hydroconversion on Ni and Pt Containing HMFI, HMOR and HBEA” (G. Kinger y H. Vinek,
en Applied Catalysis A: General, 2002:139-149) presenta
tasas de hidroconversión (en mmol/g⋅ s) de n nonanos en
ambos catalizadores HMFI y HBEA. Los resultados son:
HMFI: 0.43
0.93
1.91
2.56
HBEA:
1.12
1.24
2.93
0.73
3.72
6.19
11.00
¿Puede concluir que la media de la tasa es diferente entre
los dos catalizadores?
7. Se está comparando un nuevo tratamiento posquirúrgico
con un tratamiento usual. Siete personas reciben el nuevo tratamiento, mientras que otras siete (los testigos) reciben el
tratamiento usual. Los tiempos de recuperación, en días,
fueron:
Tratamiento (X): 12 13 15 19 20 21 27
Testigo (Y):
18 23 24 30 32 35 40
¿Puede concluir que la media de la tasa es diferente entre el
tratamiento y el testigo?
8. En un experimento para determinar el efecto del tiempo de
cura en la fuerza compresiva de bloques de concreto, dos
muestras de 15 bloques estaban preparadas en forma idéntica excepto por el tiempo de cura. Los bloques en una
muestra se curaron durante dos días, mientras que los bloques en la otra lo fueron durante seis días. Las fuerzas compresivas de los bloques, en MPa, son las siguientes:
Curados dos días (X):
1 326
1 287
1 306
1 255
1 302
1 328
1 329
1 291
1 314 1 270
1 318 1 296
1 255 1 310
1 280
Curados seis días (Y):
1 387
1 399
1 321
1 372
1 301
1 378
1 364
1 341
1 376 1 397
1 343 1 349
1 332 1 396
1 374
¿Puede concluir que la media de la fuerza es mayor para los
bloques curados durante seis días?
9. En una comparación de la eficacia del material aprendido
en clases tradicionales, 12 estudiantes tomaron un curso de
administración de empresas en línea, mientras que 14 lo tomaron en el salón de clases. Las calificaciones del examen
final fueron:
6.10
En línea:
66 75 85 64 88 77 74
91 72 69 77 83
En el salón de clases:
80 83 64 81 75 80 86
81 51 64 59 85 74 77
6.10
429
10. Una mujer que se ha cambiado a una nueva casa está tratando de determinar cuál de dos rutas a su trabajo tiene el tiempo de conducción promedio más corto. Los tiempos en
minutos para seis viajes en la ruta A y cinco en la ruta B
son:
A:
B:
¿Puede concluir que la media de la calificación difiere entre
los dos tipos de cursos?
La prueba Ji cuadrada
16.0
17.2
15.7
16.9
16.4
16.1
15.9
19.8
16.2
16.7
16.3
¿Puede concluir que la media del tiempo es menor para la
ruta A?
La prueba Ji cuadrada
En la sección 4.1 se estudió el ensayo de Bernoulli, que representa un proceso con dos resultados posibles, indicados como “éxito” y “fracaso”. Si se realiza un número de ensayos de
Bernoulli, y se cuenta el número de éxitos, se puede probar la hipótesis nula de que la probabilidad p de éxito sea igual a un valor preespecificado p0. Esto último se trató en la sección
6.3. Si se hacen dos conjuntos de ensayos de Bernoulli, con probabilidad de éxito pl para el
primer conjunto y p2 para el segundo, se puede probar la hipótesis nula que p1 ⫽ p2. Lo anterior se trató en la sección 6.6.
Una generalización del ensayo de Bernoulli es el ensayo multinomial (véase la sección
4.4): un experimento que puede dar como resultado cualquiera de los k resultados, donde k ⱖ
2. Las probabilidades de los k resultados se denotan mediante p1, . . . , pk. Por ejemplo, el lanzamiento de un dado constituye un ensayo multinomial con seis resultados 1, 2, 3, 4, 5, 6; y
probabilidades p1 ⫽ p2 ⫽ p3 ⫽ p4 ⫽ p5 ⫽ p6 ⫽ 1/6. En esta sección se generalizan las pruebas para una probabilidad de Bernoulli a los ensayos multinomiales. Se inicia con un ejemplo en el que se prueba la hipótesis nula de que las probabilidades multinomiales pl, p2, . . . ,
pk son iguales a un conjunto preespecificado de valores, p01, p02, . . . , p0k, por lo que la hipótesis nula tiene la forma H0: p1 ⫽ p01, p2 ⫽ p02, . . . , pk ⫽ p0k.
Imagine que un jugador quiere probar un dado para ver si se desvía de su honestidad.
Sea pi la probabilidad de que salga el número i. La hipótesis nula establecerá que el dado es
honesto, por lo que las probabilidades especificadas bajo la hipótesis nula son p01 ⫽ p02 ⫽ p03
⫽ p04 ⫽ p05 ⫽ p06 ⫽ 1/6. La hipótesis nula es H0: pl ⫽ · · · ⫽ p6 ⫽ 1/6.
El jugador lanza el dado 600 veces y obtiene los resultados que se muestran en la tabla
6.3, en la columna “Observados”. Los resultados obtenidos se denominan valores observados. Para probar la hipótesis nula se construye una segunda columna, llamada “Esperados”.
Esta columna contiene los valores esperados. El valor esperado para un resultado dado es la
media del número de ensayos que resultarían en ese resultado si H0 fuera verdadera. Para calcular los valores esperados, sea N el número total de ensayos. (En el ejemplo del dado, N ⫽ 600.)
Cuando H0 es verdadera, la probabilidad de que en un ensayo salga el resultado i es p0i, por
lo que el número esperado de ensayos en los que sale el resultado i es Np0i. En el ejemplo del
dado, el número esperado de ensayos para cada resultado es 100.
430
CAPÍTULO 6
Pruebas de hipótesis
TABLA 6.3 Valores observados y esperados
para 600 lanzamientos de un dado
Categoría
Observados
Esperados
1
2
3
4
5
6
115
97
91
101
110
86
100
100
100
100
100
100
Total
600
600
La idea detrás de la prueba de hipótesis es que si H0 es verdadera, entonces los valores
observados y esperados están probablemente cercanos entre sí. Por tanto, se construirá un estadístico de prueba que mida la cercanía entre los valores observados y los esperados. El estadístico se llama estadístico Ji cuadrada. Para definirlo, sea k el número de resultados (k ⫽ 6
en el ejemplo del dado), y sean Oi y Ei los números observados y esperados de los ensayos,
respectivamente, que salen en el resultado i. El estadístico Ji cuadrada es
χ2 =
k
(Oi − Ei )2
Ei
i=1
(6.6)
Entre mayor sea el valor χ2, más fuerte es la evidencia contra H0. Para determinar el P-valor
para la prueba se debe conocer la distribución nula de este estadístico de prueba. En general,
no se puede determinar exactamente la distribución nula. Sin embargo, cuando los valores esperados son todos grandes, una buena aproximación está disponible. Ésta se llama distribución Ji cuadrada con k ⫺ 1 grados de libertad, que se denota mediante χ 2k ⫺ 1. Observe que
el número de grados de libertad es uno menos que el número de categorías. El uso de la distribución Ji cuadrada es adecuado siempre que todos los valores esperados sean mayores que
o iguales a 5.
En el apéndice A se proporciona una tabla para la distribución Ji cuadrada (tabla A.6).
La tabla proporciona valores para ciertos cuantiles, o puntos de porcentajes superiores, para
muchas elecciones de grados de libertad. Como ejemplo, la figura 6.19 presenta la función de
2
densidad de probabilidad de la distribución χ10
. El 5% superior de la distribución está sombreado. Para encontrar el punto 5% superior en la tabla, busque abajo de α ⫽ 0.05 y en grados de libertad ν ⫽ 10. El valor es 18.307.
Ahora se calcula el valor de la estadística Ji cuadrada para los datos en la tabla 6.3. El
número de grados de libertad es 5 (uno menos que el número de resultados). Utilizando la
ecuación (6.6), el valor del estadístico es
(115 − 100)2
(86 − 100)2
+ ··· +
100
100
= 2.25 + · · · + 1.96
χ2 =
= 6.12
6.10
La prueba Ji cuadrada
431
5%
0
18.307
2
FIGURA 6.19 Función de densidad de probabilidad de la distribución χ10
. El punto supe-
rior de 5% es 18.307. [Véase la tabla Ji cuadrada (Tabla A.6) en el Apéndice A.]
Determinar el P-valor para el estadístico de prueba requiere observar que todos los valores esperados son iguales o mayores que 5, por lo que es adecuado utilizar la distribución
Ji cuadrada. Se consulta la tabla Ji cuadrada con cinco grados de libertad. El punto 10% superior es 9.236. Se concluye que P ⬎ 0.10. (Véase la figura 6.20.) No hay evidencias que sugerir si el dado no es honesto.
10%
0
6.12
9.236
FIGURA 6.20 Función de densidad de probabilidad de la distribución χ 25. El valor obser-
vado del estadístico de prueba es 6.12. El punto 10% superior es 9.236. Por tanto, el P-valor es mayor que 0.10.
La prueba Ji cuadrada para la homogeneidad
En el ejemplo anterior se probó la hipótesis nula de que las probabilidades de los resultados
para un ensayo multinomial eran iguales al conjunto de valores preespecificados. A veces algunos ensayos multinomiales están dirigidos, cada uno con el mismo conjunto de resultados
posibles. La hipótesis nula es que las probabilidades de los resultados son las mismas para cada experimento. Se presenta un ejemplo.
Cuatro máquinas fabrican alfileres cilíndricos de acero. Los alfileres están sujetos a una
especificación de diámetro. Un alfiler podría satisfacer la especificación, o ser demasiado angosto o demasiado grueso. Se muestrean alfileres de cada máquina y se cuenta su número en
cada categoría. La tabla 6.4 presenta los resultados.
La tabla 6.4 representa un ejemplo de una tabla de contingencia. Cada renglón especifica una categoría respecto de un criterio (máquina, en este caso), y cada columna especifica una categoría respecto de otro (el espesor, en este caso). Cada intersección de renglón y
columna se llama celda, por lo que hay 12 celdas en la tabla 6.4.
432
CAPÍTULO 6
Pruebas de hipótesis
TABLA 6.4 Números de alfileres observados en diferentes categorías,
considerando una especificación del diámetro
Muy
angosto
Está
bien
Muy
grueso
Total
Máquina 1
Máquina 2
Máquina 3
Máquina 4
10
34
12
10
102
161
79
60
8
5
9
10
120
200
100
80
Total
66
402
32
500
El número en la celda en la intersección del renglón i con la columna j constituye el número de ensayos cuyo resultado estaba en la categoría del renglón i y en la categoría de columna j. Este número se llama valor observado para la celda ij. Observe que se han incluido
los totales de los valores observados para cada renglón y columna. Éstos se llaman marginales totales.
La hipótesis nula es que la proporción de alfileres muy angostos, está bien o muy gruesos es la misma para todas las máquinas. De manera general, la hipótesis nula dice que no importa qué renglón se elija, las probabilidades de los resultados asociadas con las columnas son
las mismas. Se desarrollará cierta notación para expresar H0 y definir el estadístico de prueba.
Sea I el número de renglones en la tabla, y J el de columnas. Sea pij la probabilidad de
que el resultado de un ensayo esté en la columna j en virtud de que está en el renglón i. Entonces la hipótesis nula es
H0: Para cada columna j, p1j ⫽ . . . ⫽ pIj
(6.7)
Sea Oij el valor observado en la celda ij. Sea Oi la suma de los valores observados en el renglón i, sea Oj la suma de los valores observados en la columna j, y sea O.. la suma de los valores observados en todas las celdas (véase la tabla 6.5).
TABLA 6.5 Notación para los valores observados
Columna 1
Columna 2
···
Columna J
Total
Renglón 1
Renglón 2
..
.
Renglón I
O 11
O 21
..
.
O I1
O12
O22
..
.
OI 2
···
···
..
.
···
O1J
O2J
..
.
OI J
O1.
O2.
..
.
OI.
Total
O.1
O.2
···
O.J
O..
Definir un estadístico de prueba requiere calcular la tabla. Bajo H0 la probabilidad de
que el resultado de un ensayo esté en la columna j es la misma para cada renglón i. La mejor
estimación de esta probabilidad es la proporción de ensayos cuyo resultado está en la colum-
6.10
La prueba Ji cuadrada
433
na j. Esta proporción es O.j /O... Se necesita calcular el número esperado de ensayos cuyo resultado está en la celda ij. Se denota este valor esperado por Eij. Es igual a la proporción de
ensayos cuyo resultado está en la columna j, multiplicado por el número Oi. de ensayos en el
renglón i. Esto es,
Oi. O.j
O..
Eij =
(6.8)
El estadístico de prueba está basado en las diferencias entre los valores observados y esperados:
χ2 =
I
J
(Oij − Eij )2
Eij
i=1 j =1
(6.9)
Bajo H0 este estadístico de prueba tiene una distribución Ji cuadrada con (I ⫺ 1)(J ⫺ 1) grados de libertad. El uso de la distribución Ji cuadrada es adecuado siempre que los valores esperados sean todos iguales a o mayores que 5.
Ejemplo
6.21
Use los datos de la tabla 6.4 para probar la hipótesis nula de que las proporciones de alfileres
que son muy angostos, están bien o muy gruesos son las mismas para todas las máquinas.
Solución
Se inicia mediante la ecuación (6.8) para calcular los valores esperados Eij. Se muestran los
cálculos de E11 y E23 en detalle:
(120)(66)
= 15.84
500
(200)(32)
=
= 12.80
500
E11 =
E23
La tabla completa de los valores esperados es:
Valores esperados para la tabla 6.4
Muy
angosto
Está
bien
Muy
grueso
Máquina 1
Máquina 2
Máquina 3
Máquina 4
15.84
26.40
13.20
10.56
96.48
160.80
80.40
64.32
7.68
12.80
6.40
5.12
120.00
200.00
100.00
80.00
Total
66.00
402.00
32.00
500.00
Total
434
CAPÍTULO 6
Pruebas de hipótesis
Se observa que todos los valores esperados son mayores que 5. Por tanto, la prueba Ji
cuadrada es adecuada. Se utiliza la ecuación (6.9) para calcular el valor del estadístico Ji cuadrada:
(10 − 5.12)2
(10 − 15.84)2
+ ··· +
χ2 =
15.84
5.12
=
23.8144
34.1056
+ ··· +
15.84
5.12
= 15.5844
Puesto que hay cuatro renglones y tres columnas, el número de grados de libertad es (4 ⫺ 1)(3
⫺ 1) ⫽ 6. Para obtener el P-valor se consulta la tabla Ji cuadrada (tabla A.6). Buscando abajo de seis grados de libertad se encuentra que el punto 2.5% superior es 14.449, y el punto 1%
superior es 16.812. Por tanto, 0.01 ⬍ P ⬍ 0.025. Es razonable concluir que las máquinas difieren en las proporciones de alfileres que son muy angostos, están bien o muy gruesos.
Se observa que el renglón observado y la columna total son idénticos al renglón esperado y la columna total. Éste es siempre el caso.
El siguiente resultado de computadora (de MINITAB) presenta los resultados de esta
prueba de hipótesis.
Chi-Square Test: Thin, OK, Thick
Expected counts are printed below observed counts
Chi-Square contributions are printed below expected counts
Thin
10
15.84
2.153
OK
102
96.48
0.316
Thick
8
7.68
0.013
Total
120
2
34
26.40
2.188
161
160.80
0.000
5
12.80
4.753
200
3
12
13.20
0.109
79
80.40
0.024
9
6.40
1.056
100
4
10
10.56
0.030
60
64.32
0.290
10
5.12
4.651
80
Total
66
402
32
500
1
Chi-Sq = 15.584 DF = 6, P-Value = 0.016
En el resultado, cada celda (la intersección de renglón y columna) contiene tres números. El
número superior es el valor observado, el de enmedio, el valor esperado, y el de abajo, la contribución (Oij ⫺ Eij)2/Eij hechos por el estadístico Ji cuadrada de cada celda.
6.10
La prueba Ji cuadrada
435
La prueba Ji cuadrada para la independencia
En el ejemplo 6.21 las columnas totales eran aleatorias, mientras que los renglones totales estaban presumiblemente fijos con anticipación, como consecuencia de que representaban los
números de elementos probados de varias máquinas. En algunos casos, tanto el renglón como
la columna total son aleatorios. En cualquiera de los dos casos se puede probar la hipótesis
nula de que las probabilidades de los resultados columna son las mismas para cada resultado
renglón, y la prueba es exactamente la misma para ambos casos. Se presenta un ejemplo donde tanto el renglón como la columna totales son aleatorios.
Ejemplo
6.22
Los alfileres cilíndricos de acero en el ejemplo 6.21 están sujetos a una especificación de longitud, así como a una de diámetro. Con respecto a la longitud, un alfiler podría satisfacer la
especificación, o puede ser demasiado corto o demasiado largo. Se hace un muestreo y se categorizan mil alfileres en relación con las especificaciones de longitud y diámetro. En la tabla siguiente se presentan los resultados. Probar la hipótesis nula de que las proporciones de
alfileres que son muy angostos, están bien o muy gruesos respecto de la especificación del
diámetro no dependen de la clasificación con respecto a la especificación de longitud.
Valores observados para mil alfileres de acero
Diámetro
Muy
angosto
Está
bien
Muy
grueso
Total
Demasiado corto
Está bien
Demasiado largo
13
62
5
117
664
68
4
80
8
134
806
81
Total
80
849
92
1 021
Longitud
Solución
Se inicia mediante la ecuación (6.8) para calcular los valores esperados. Estos últimos los da
la siguiente tabla.
Valores observados para mil alfileres de acero
Diámetro
Longitud
Demasiado corto
Está bien
Demasiado largo
Total
Muy
angosto
Está
bien
Muy
grueso
10.50
63.15
6.35
111.43
670.22
67.36
12.07
72.63
7.30
134.0
806.0
81.0
80.0
849.0
92.0
1 021.0
Total
436
CAPÍTULO 6
Pruebas de hipótesis
Se observa que todos los valores esperados son mayores que o iguales a 5. (Uno de los valores observados no lo es; esto es irrelevante.) Por tanto, la prueba Ji cuadrada es adecuada. Se
utiliza la ecuación (6.9) para calcular el valor del estadístico Ji cuadrada:
χ2 =
=
(13 − 10.50)2
(8 − 7.30)2
+ ··· +
10.50
7.30
0.49
6.25
+ ··· +
10.50
7.30
= 7.46
Debido a que hay tres renglones y tres columnas, el número de grados de libertad es (3 ⫺ 1)(3
⫺ 1) ⫽ 4. Para obtener el P-valor se consulta la tabla Ji cuadrada (tabla A.6). Buscando debajo de cuatro grados de libertad, se encuentra que el punto 10% superior es 7.779. Se concluye que P ⬎ 0.10. No hay evidencia de que la longitud y el espesor estén relacionados.
Ejercicios para la sección 6.10
1. Se fabrican remaches para un propósito determinado. La especificación de longitud es 1.20-1.30 cm. Se piensa que
90% de los remaches fabricados satisfacen la especificación, mientras que 5% son demasiado cortos, y 5% demasiado largos. En una muestra aleatoria de mil remaches, 860
satisfacían la especificación, 60 eran demasiado cortos, y 80
demasiado, largos. ¿Puede concluir que los porcentajes verdaderos son diferentes de 90, 5 y 5%?
a) Establezca la hipótesis nula adecuada.
b) Calcule los valores esperados bajo la hipótesis nula.
c) Calcule el valor de la estadística Ji cuadrada.
d) Determine el P-valor. ¿Cuál es su conclusión?
2. Las especificaciones para el diámetro de un rodillo son
2.10-2.11 cm. Los rodillos muy gruesos pueden ser rectificados, mientras que los muy angostos se deben desechar.
Tres maquinistas pulen estos rodillos. Se coleccionaron muestras de los rodillos de cada maquinista y se midieron sus diámetros. Los resultados fueron:
Maquinista
Bien
Volver
a pulir
Desechar
A
B
C
328
231
409
58
48
73
14
21
18
400
300
500
Total
968
179
53
1 200
Total
¿Puede concluir que las proporciones de los rodillos en las
tres categorías son diferentes entre los maquinistas?
a) Establezca la hipótesis nula adecuada.
b) Calcule los valores esperados bajo la hipótesis nula.
c) Calcule el valor de la estadística Ji cuadrada.
d ) Determine el P-valor. ¿Cuál es su conclusión?
3. El artículo “An Investment Tax Credit for Investing in New
Technology: A Survey of California Firms” (R. Pope, en
The Engineering Economist, 1997:269-287) examina el impacto potencial de un impuesto sobre el capital invertido. Se
categorizaron varias compañías por tamaño (> 100 empleados contra ⱕ 100 empleados) y la capacidad excesiva neta.
Los números de las compañías en cada una de las categorías
se presentan en la tabla siguiente:
Capacidad
excesiva neta
< 0%
0-10%
11-20%
21-30%
> 30%
Pequeña
Grande
66
52
13
6
36
115
47
18
5
25
¿Puede concluir que la distribución de la capacidad excesiva neta es diferente entre compañías pequeñas y grandes?
Calcule el estadístico de prueba importante y el P-valor.
4. El artículo citado en el ejercicio 3 clasificó a las compañías
por tamaño y porcentaje de la fuerza laboral actualmente
empleada operando por completo. Los números de las compañías en cada una de las categorías se presentan en la siguiente tabla.
Porcentaje de fuerza laboral
actualmente empleada
operando por completo
> 100%
95–100%
90–94%
85–89%
80–84%
75–79%
70–74%
< 70%
Pequeña
6
29
12
20
17
15
33
39
Grande
8
45
28
21
22
21
29
34
¿Puede concluir que la distribución de fuerza laboral actualmente empleada es diferente entre compañías pequeñas y
grandes? Calcule el estadístico de prueba relevante y el
P-valor.
5. Para la tabla dada de los valores observados.
437
La prueba Ji cuadrada
6.10
Valores observados
A
B
C
1
2
25
3
42
4
3
3
3
11
4
5
7. Complete el enunciado: Para valores observados y esperados, __________.
i) Los totales de los renglones en la tabla observada deben
ser iguales que los totales de los renglones en la tabla esperada, pero los totales de las columnas no necesariamente son iguales.
ii) Los totales de las columnas en la tabla observada deben
ser iguales que los de las columnas en la tabla esperada,
pero los totales de los renglones no necesariamente son
iguales.
iii) Tanto los totales de los renglones como los de las columnas en la tabla observada deben ser iguales que los
totales de los renglones y los de las columnas, respectivamente, en la tabla esperada.
iv) Ni los totales de los renglones ni los de las columnas en
la tabla observada necesitan ser iguales a los totales de
los renglones o a los de la columna en la tabla esperada.
a) Elabore la tabla correspondiente de valores esperados.
b) Si es adecuado, realice la prueba Ji cuadrada para la hipótesis nula de que los resultados en los renglones y columnas son independientes. Si no es adecuado, explique
por qué.
8. Debido a una falla en la impresora, ninguno de los valores
observados en la siguiente tabla se imprimieron, pero algunos de los totales marginales sí lo hicieron. ¿Es posible
construir la tabla correspondiente de valores esperados a
partir de la información dada? Si es así, constrúyala. Si no,
describa la información adicional que necesitaría.
Valores observados
A
B
C
1
2
3
15
3
9
10
11
14
12
11
12
6. Para la tabla dada de valores observados,
Valores observados
1
2
3
Total
A
B
C
D
—
—
—
—
—
—
—
—
—
—
—
—
25
—
40
75
Total
50
20
—
150
a) Elabore la tabla correspondiente de valores esperados.
b) Si es adecuado, realice la prueba Ji cuadrada para la hipótesis nula de que los resultados en los renglones y en
las columnas son independientes. Si no lo es, explique
por qué.
9. Se supone que un generador de números aleatorios produce
los dígitos 0 al 9 con probabilidad igual. Se generó una
muestra de 200 dígitos, con la siguiente frecuencia generada para cada uno de los dígitos.
438
Pruebas de hipótesis
CAPÍTULO 6
Dígito
0
1
2
3
4
5
6
7
8
9
Frecuencia 21 17 20 18 25 16 28 19 22 14
¿Estos datos evidencian que el generador de números aleatorios no está funcionando adecuadamente? Explique.
10. En una planta de ensamblaje de camiones ligeros la supervisión rutinaria de la calidad de las soldaduras produce la
tabla siguiente:
Número de soldaduras
Alta
Moderada
calidad
calidad
Turno de día
Turno de tarde
Turno de noche
470
445
257
191
171
129
Baja
calidad
42
28
17
llaman haplotipos. Se dice que los puntos tienen un enlace
de equilibrio si los dos alelos en un haplotipo particular son
independientes. Se determinaron los haplotipos para 316 individuos. El siguiente resultado MINITAB presenta los resultados de una prueba Ji cuadrada de independencia.
Chi-Square Test: A, B, C
Expected counts are printed below
observed counts
Chi-Square contributions are printed
below expected counts
A
66
61.06
0.399
B
44
47.39
0.243
C
34
35.54
0.067
Total
144
2
36
39.86
0.374
38
30.94
1.613
20
23.20
0.442
94
3
32
33.08
0.035
22
25.67
0.525
24
19.25
1.170
78
134
104
78
316
1
¿Puede concluir que la calidad varía entre los turnos?
11. El artículo “Analysis of Unwanted Fire Alarm: Case Study”
(W. Chow, N. Fong y C. Ho, en Journal of Architectural Engineering, 1999:62-65) presenta el número de falsas alarmas en varios sitios. Los números de falsas alarmas cada
mes, divididos entre aquellos cuyas causas se conocen y los
que se desconocen, están dados en la tabla siguiente. ¿Puede concluir que la proporción de falsas alarmas cuya causa
se conoce es diferente mes a mes?
Mes
1 2 3 4 5 6 7 8 9 10 11 12
Se conocen
20 13 21 26 23 18 14 10 20 20 18 14
Se desconocen 12 2 16 12 22 30 32 32 14 16 10 12
Total
Chi-Sq = 4.868, DF = 4,
P-Value = 0.301
a) ¿Cuántos individuos que tenían el haplotipo B3 se observaron?
b) ¿Cuál es el número esperado de individuos con el haplotipo A2?
c) ¿Cuál de los nueve haplotipos se observó con menor frecuencia?
12. En un cierto punto genético de un cromosoma cada individuo tiene una de tres secuencias de ADN diferentes (alelos).
Los tres alelos se denotan mediante A, B, C. En otro punto
genético en el mismo cromosoma cada organismo tenía uno
de los tres alelos, denotados por 1, 2, 3. Por tanto, cada individuo tiene uno de los nueve posibles pares de alelos: Al,
A2, A3, B1, B2, B3, Cl, C2, o C3. Estos pares de alelos se
d ) ¿Cuál de los nueve haplotipos tiene el menor número esperado?
e) ¿Puede concluir que los puntos no tienen un enlace de
equilibrio (es decir, no independientes)? Explique.
f ) ¿Puede concluir que los puntos tienen una conexión de
equilibrio (es decir, independientes)? Explique.
6.11
6.11
La prueba F para la igualdad de varianzas
439
La prueba F para la igualdad de varianzas
Las pruebas que se han estudiado hasta ahora han implicado medias o proporciones. A veces
se desea probar una hipótesis nula en la cual las dos poblaciones tienen varianzas iguales. En
general, no hay ningún buen método para hacerlo. Sin embargo, para el caso especial donde
ambas poblaciones son normales, hay un método disponible.
Sea X1, . . . , Xm una muestra aleatoria simple de una población N(m1, s 21), y Y1, . . . , Yn
una muestra aleatoria simple de una población N(m2, s 22). Suponga que las muestras se eligen
de manera independiente. Los valores de las medias, ml y m2, aquí son irrelevantes; se trata
sólo con las varianzas s 21 y s 22. Observe que los tamaños muestrales, m y n, podrían ser diferentes. Sean s 21 y s 22 las varianzas muestrales. Esto es,
m
s12
1
(Xi − X)2
=
m − 1 i=1
n
s22
1
(Yi − Y )2
=
n − 1 i=1
Cualesquiera de las tres hipótesis nulas puede probarse. Éstas son
H0 :
σ 21
≤1
σ 22
o de manera equivalente,
σ 12 ≤ σ 22
H0 :
σ 21
≥1
σ 22
o de manera equivalente,
σ 12 ≥ σ 22
H0 :
σ 21
=1
σ 22
o de manera equivalente,
σ 12 = σ 22
Los procedimientos para probar estas hipótesis son similares, pero no idénticos. Se describirá
el procedimiento para probar la hipótesis nula H0: s 21/s 22 ⱕ 1 contra H1: s 21/s 22 ⬎ 1, y después
se analizará cómo se puede modificar el procedimiento para probar las otras dos hipótesis.
El estadístico de prueba representa el cociente de las dos varianzas muestrales:
F =
s 21
s 22
(6.10)
Cuando H0 es verdadera se supone que s 21/s 22 ⫽ 1 (el valor más cercano a H1), o de manera
equivalente, que s 21 ⫽ s 22. Cuando H0 es verdadera, s 21 y s 22 son, en promedio, del mismo tamaño, por lo que F es posiblemente cercano a 1. Cuando H0 es falsa, s 21 ⬎ s 22, por lo que s 21
es posiblemente mayor que s 22, y F es quizá mayor a 1. Para utilizar F como un estadístico de
prueba se debe conocer su distribución nula. Esta última se denomina distribución F, enseguida se le describirá.
La distribución F
Los estadísticos que tienen una distribución F son cocientes de cantidades, tal como el de las
dos varianzas muestrales en la ecuación (6.10). Por tanto, la distribución F tiene dos valores
para los grados de libertad: uno asociado con el numerador, y el otro con el denominador. Los
grados de libertad se indican con subíndices bajo la letra F. Por ejemplo, el símbolo F3,16 de-
440
CAPÍTULO 6
Pruebas de hipótesis
nota la distribución F con 3 grados de libertad para el numerador y 16 grados de libertad para el denominador. Observe que los grados de libertad para el numerador siempre se listan primero.
Se proporciona una tabla para la distribución F (tabla A.7 en el apéndice A). La tabla
proporciona valores para ciertos cuantiles, o puntos de porcentajes superiores, para gran número de elecciones de grados de libertad. Como ejemplo, la figura 6.21 presenta la función
de densidad de probabilidad de la distribución de F3,16. El 5% superior de la distribución está sombreado. Para encontrar el punto 5% superior en la tabla, busque debajo de α ⫽ 0.050,
y en grados de libertad ν1 ⫽ 3, ν2 ⫽ 16. El valor es 3.24.
5%
0
3.24
FIGURA 6.21 Función de densidad de probabilidad de la distribución F3,16. El punto 5%
superior es 3.24. [Véase la tabla F (tabla A.7) del apéndice A.]
El estadístico F para probar la igualdad de varianzas
La distribución nula del estadístico de prueba F ⫽ s 21/s 22 es Fm⫺1, n⫺1. El número de grados de
libertad para el numerador es uno menos que el tamaño muestral usado para calcular s 21, y la
cantidad de grados de libertad para el denominador es uno menos que el tamaño muestral utilizado para calcular s 22. Se muestra la prueba F con un ejemplo.
Ejemplo
6.23
En una serie de experimentos para determinar la tasa de absorción de ciertos pesticidas en la
piel se aplicaron cantidades medidas de dos pesticidas a algunos especímenes de piel. Después de un tiempo se midieron las cantidades absorbidas (en mg). Para el pesticida A la varianza de las cantidades absorbidas en seis muestras fue de 2.3, mientras que para el B, la
varianza de las cantidades absorbidas en diez especímenes fue de 0.6. Suponga que para cada pesticida las cantidades absorbidas constituyen una muestra aleatoria simple de una población normal. ¿Se puede concluir que la varianza en la cantidad absorbida es mayor para el
pesticida A que para el B?
Solución
Sea s 21 la varianza poblacional para el pesticida A, y s 22 la varianza poblacional para el B. La
hipótesis nula es
σ2
H0 : 21 ≤ 1
σ2
Las varianzas muestrales son s 21 ⫽ 2.3 y s 22 ⫽ 0.6. El valor del estadístico de prueba es
F =
2.3
= 3.83
0.6
6.11
La prueba F para la igualdad de varianzas
441
La distribución nula del estadístico de prueba es F5,9. Si H0 es verdadera, entonces s 21 será en
promedio menor que s 22. En consecuencia, entre mayor sea el valor de F, más fuerte es la evidencia contra H0. Al consultar la tabla F con cinco y nueve grados de libertad, se encuentra
que el punto 5% superior es 3.48, mientras que el punto 1% superior es 6.06. Se concluye que
0.01 ⬍ P ⬍ 0.05. En este sentido, hay fuertes evidencias contra la hipótesis nula. Véase la figura 6.22.
5%
1%
0
3.48
6.06
3.83
FIGURA 6.22 El valor observado del estadístico de prueba es 3.83. El punto 5% superior
de la distribución F5,9 es 3.48; el punto 1% superior es 6.06. Por tanto, el P-valor está entre 0.01 y 0.05.
Ahora se describen las modificaciones para el procedimiento mostrado en el ejemplo
6.23, que son necesarias para probar las otras hipótesis nulas. Para probar
H0 :
σ 21
≥1
σ 22
se podría, en principio, utilizar el estadístico de prueba s 21/s 22, con valores pequeños del estadístico proporcionando evidencia contra H0. Sin embargo, puesto que la tabla F contiene solamente valores grandes (es decir, mayores que 1) para la estadística F, es más fácil utilizar
el estadístico s 22/s 21. Bajo H0, la distribución de s 22/s 21 es Fn⫺1,m⫺1.
Por último, se describe el método para probar la hipótesis de dos colas
H0 :
σ 21
=1
σ 22
Para esta hipótesis, tanto los valores grandes como los pequeños del estadístico s 21/s 22 proporcionan evidencia contra H0. El procedimiento es utilizar ya sea s 21/s 22 o s 22/s 21, cualquiera que
sea mayor que 1. El P-valor para la prueba de dos colas es dos veces el P-valor para la prueba de una cola. En otras palabras, el P-valor de la prueba de dos colas constituye dos veces el
área de la cola superior de la distribución de F. Se muestra con un ejemplo.
442
CAPÍTULO 6
Ejemplo
6.24
En el ejemplo 6.23, s 21 ⫽ 2.3 con tamaño de muestra de 6, y s 22 ⫽ 0.6 con tamaño de muestra
de 10. Pruebe la hipótesis nula
Pruebas de hipótesis
H0: s 21 ⫽ s 22
Solución
La hipótesis nula s 21 ⫽ s 22 es equivalente a s 21/s 22 ⫽ 1. Puesto que s 21 ⬎ s 22 se utiliza el estadístico de prueba s 21/s 22. En el ejemplo 6.23 se encuentra que para la prueba de una cola, 0.01
⬍ P ⬍ 0.05. Por tanto, para la prueba de dos colas, 0.02 ⬍ P ⬍ 0.10.
El siguiente resultado de computadora (de MINITAB) presenta la solución al ejemplo
6.24.
Test for Equal Variances
F-Test (normal distribution)
Test statistic = 3.83, p-value = 0.078
La prueba F es sensible a las desviaciones de la normalidad
La prueba F, de la misma manera que la prueba t, requiere que las muestras provengan de poblaciones normales. A diferencia de la prueba t, la prueba F para comparar varianzas es bastante sensible a esta suposición. Si las formas de las poblaciones son muy diferentes de la
curva normal, la prueba F puede dar resultados falsos. Por esta razón, la prueba F para comparar varianzas se debe utilizar con precaución.
En los capítulos 8 y 9 se utilizará la distribución F para realizar ciertas pruebas de hipótesis en el contexto de la regresión lineal y del análisis de varianza. En estos ajustes, la
prueba F es menos sensible a las violaciones de la suposición de normalidad.
La prueba F no puede probar que dos varianzas son iguales
En la sección 6.7 se presentan dos versiones de la prueba t para la diferencia entre dos medias. Una versión es, en general, aplicable, mientras que la segunda versión, que usa la varianza combinada, es adecuada solamente cuando las varianzas poblacionales son iguales.
Cuando se decide si es adecuado suponer que las varianzas poblacionales son iguales, es tentador realizar una prueba F y suponer que las varianzas son iguales si la hipótesis nula de la
igualdad no es rechazada. Desgraciadamente, este procedimiento es poco fiable, por la razón
básica de que falla al rechazar la hipótesis nula que no justifica la suposición de que aquélla
es verdadera. En general, una suposición de que las varianzas poblacionales sean iguales no
se puede justificar con una prueba de hipótesis.
6.12
Prueba de nivel fijo
443
Ejercicios para la sección 6.11
1. Determine el punto 5% superior de F7,20.
a) ¿Puede concluir que la variabilidad del proceso es mayor el segundo día que el primero?
2. Determine el punto 1% superior de F2,5.
b) ¿Puede concluir que la variabilidad del proceso es mayor el tercer día que el segundo?
3. Una prueba F con cinco grados de libertad en el numerador
y siete en el denominador produjo un estadístico de prueba
cuyo valor fue de 7.46.
a) ¿Cuál es el P-valor si la prueba es de una cola?
b) ¿Cuál es el P-valor si la prueba es de dos colas?
4. El contenido de azúcar, en mg/ml, de un caldo utilizado para fabricar un producto farmacéutico fue medido varias veces en cada uno de tres días sucesivos.
Día 1:
Día 2:
Día 3:
6.12
5.0
4.8
5.8
5.3
6.3
6.0
4.8
5.0
4.7
5.3
4.7
5.3
5.1
5.2
4.7
4.8
5.1
4.9
5.1
4.9
4.9
5.7
5.9
5.7
4.8
4.9
5.1
5.1
5.1
5.3
5.1
5.0
4.9
5.7
5.9
5.6
5. Considerando el ejercicio 9 de la sección 5.6, ¿puede concluir que la varianza de las fuerzas de ruptura es diferente
entre los dos compuestos?
6. Respecto al ejercicio 11 de la sección 5.6, ¿puede concluir
que el tiempo en que se paraliza la computadora es más variable en el séptimo mes que en el primero después de la
instalación?
4.8
5.4
4.7
Prueba de nivel fijo
Puntos críticos y regiones de rechazo
Una prueba de hipótesis mide la factibilidad de la hipótesis nula produciendo un P-valor. Entre menor sea éste menos factible será la nula. Se ha indicado que no hay línea divisoria científicamente legítima entre la factibilidad e infactibilidad, por lo que es imposible especificar
un P-valor “correcto” debajo del cual se deba rechazar H0. Cuando sea posible, es mejor sólo notificar el P-valor y no tomar una decisión firme de si se rechaza o no. Sin embargo, a veces se tiene que tomar una decisión. Por ejemplo, si se ha hecho un muestreo de los elementos
de una línea de montaje para probar si la media del diámetro está dentro de la tolerancia, se
debe tomar la decisión de si se recalibra el proceso. Si se extrae una muestra de piezas de un
embarque y se examina en busca de defectos, se debe decidir si aceptar o no la remesa. Si se
tomará una decisión con base en una prueba de hipótesis, no hay ninguna elección pero se elige un punto límite para el P-valor. Cuando se hace esto último la prueba se denomina de nivel fijo.
La prueba de nivel fijo es muy parecida a la de hipótesis que se ha analizado hasta ahora, excepto que se ha establecido una regla firme antes de tiempo para rechazar la hipótesis
nula. Se elige un valor α, donde 0 ⬍ α ⬍ 1. Entonces se calcula el P-valor. Si P ⱕ α, la hipótesis nula se rechaza y la hipótesis alternativa se toma como verdadera. Si P ⬎ α, entonces
la hipótesis nula se considera factible. El valor de α se llama nivel de significancia, o de manera más sencilla, nivel, de la prueba. Recuerde, de la sección 6.2, que si en una prueba se
444
CAPÍTULO 6
Pruebas de hipótesis
obtiene un P-valor menor que o igual a α, se dice que la hipótesis nula se rechaza a un nivel
de α (o 100α %), o que el resultado es estadísticamente significativo a un nivel de α (o
100α %). Como se ha mencionado, una elección común para α es 0.05.
Resumen
Para realizar una prueba de nivel fijo:
Se elige un número α, donde 0 ⬍ α ⬍ 1. Éste se llama nivel de significancia, o nivel, de la prueba.
Se calcula el P-valor en la manera acostumbrada.
Si P ⱕ α, rechaza H0. Si P ⬎ α, no se rechaza H0.
Ejemplo
6.25
En relación con el ejemplo 6.1 de la sección 6.1, la media del desgaste en una muestra de 45
–
bolas de acero fue X ⫽ 673.2 mm, y la desviación estándar s ⫽ 14.9 mm. Sea m la media poblacional de desgaste. Una prueba de H0: m ⱖ 675 contra H1: m ⬍ 675 produjo un P-valor de
0.209. ¿Se puede rechazar H0 a un nivel de 25%? ¿Se puede rechazar H0 a un nivel de 5%?
Solución
El P-valor de 0.209 es menor que 0.25, por lo que si se hubiera elegido un nivel de significancia de α ⫽ 0.25, se rechazaría H0. Por tanto, se rechaza H0 a un nivel de 25%. Dado que
0.209 ⬎ 0.05, no se rechaza H0 a un nivel de 5%.
En una prueba de nivel fijo, un punto crítico constituye un valor del estadístico de prueba que produce un P-valor exactamente igual a α. Un punto crítico representa una línea divisoria para el estadístico de prueba igual que el nivel de significancia representa una línea
divisoria para el P-valor. Si el estadístico de prueba está en un lado del punto crítico, el P-valor será menor que α y se rechazará H0. Si el estadístico de prueba está al otro lado del punto crítico, el P-valor será mayor que α, y H0 no será rechazada. La región en el lado del punto
crítico que conduce al rechazo se llama región de rechazo. El punto crítico también está en la
región de rechazo.
Ejemplo
6.26
Se está evaluando una nueva mezcla de concreto. El plan es hacer un muestreo de 100 bloques de concreto hechos con la nueva mezcla; calcule la media muestral de la fuerza compre–
siva X , después pruebe H0: m ⱕ 1 350 contra H1: m ⬎ 1 350, donde las unidades son MPa. Se
6.12
Prueba de nivel fijo
445
ha supuesto en las pruebas previas que en esta clase la desviación estándar poblacional s será cercana a 70 MPa. Determine el punto crítico y la región de rechazo si la prueba se hace a
un nivel de significancia de 5%.
Solución
Se rechazará H0 si el P-valor es menor o igual a 0.05. El P-valor para esta prueba será el área
–
a la derecha del valor de X . Por tanto, el P-valor será menor que 0.05, y H0 será rechazada, si
–
el valor de X está en el 5% superior de la distribución nula (véase la figura 6.23). Por tanto,
la región de rechazo consta de 5% superior de la distribución nula. El punto crítico es el límite de 5% superior. La distribución nula es normal, y de la tabla z se encuentra que el puntaje
z del punto que corresponde a 5% superior de la curva normal es z.05⫽ 1.645. Por tanto, se
puede expresar el punto crítico como z ⫽ 1.645, y la región de rechazo como z ⱖ 1.645. Con
frecuencia es más conveniente expresar el punto crítico y la región de rechazo en función de
–
X , al convertir el puntaje z en las unidades √
originales.√La distribución nula tiene una media
m ⫽ 1 350 y desviación estándar σX = σ/ n ≈ 70/ 100 = 7. Por tanto, el punto crítico
–
se puede expresar como X ⫽ 1 350 ⫹ (1.645)(7) ⫽ 1 361.5. La región de rechazo consta de
–
los valores de X mayores que o iguales a 1 361.5.
Región de rechazo
5%
1 350
1 361.5
z = 1.645
FIGURA 6.23 La región de rechazo para esta prueba de una cola consta del 5% superior
de la distribución nula. El punto crítico es 1 361.5, en la frontera de la región de rechazo.
Ejemplo
6.27
En una prueba de hipótesis para determinar si una balanza está calibrada, la hipótesis nula es
–
H0: m ⫽ 1 000 y la distribución nula de X es N(1 000, 0.262). (Esta situación se presentó en
el ejemplo 6.2 de la sección 6.1.) Determine la región de rechazo si la prueba se hará en un
nivel de significancia de 5%.
Solución
Dado que ésta es una prueba de dos colas, la región de rechazo está contenida en ambas co–
las de la distribución nula. Específicamente, H0 será rechazada si X está en el 2.5% superior
o inferior de la distribución nula (véase la figura 6.24). Los puntajes z que corresponden al
446
CAPÍTULO 6
Pruebas de hipótesis
2.5% superior e inferior de la distribución son z ⫽ ⫾ 1.96. Por tanto, la región de rechazo
–
consta de todos valores de X mayores que o iguales a 1 000 ⫹ (1.96)(0.26) ⫽ 1 000.51, junto con los valores menores que o iguales a 1 000 ⫺ (1.96)(0.26) ⫽ 999.49. Observe que hay
dos puntos críticos, 999.49 y 1 000.51.
Región de
rechazo
Región de
rechazo
2.5%
999.49
z = ⫺1.96
2.5%
1 000
1 000.51
z = 1.96
FIGURA 6.24 La región de rechazo para la prueba de dos colas consta tanto de 2.5% inferior como superior de la distribución nula. Hay dos puntos críticos, 999.49 y 1 000.51.
Errores de tipos I y II
Debido a que una prueba de nivel fijo da como resultado una decisión firme, hay una posibilidad de que la decisión podría estar equivocada. Hay dos formas en las cuales la decisión
puede estar equivocada. Se puede rechazar H0 cuando en realidad es verdadera. Esto último
se conoce como error de tipo I. O se puede aceptar H0 cuando es falsa. Ello se conoce como
error de tipo II.
Cuando se diseñan experimentos cuyos datos serán analizados con una prueba de nivel
fijo es importante tratar de hacer las probabilidades de los errores de tipos I y II razonablemente pequeñas. No tiene caso realizar un experimento que tiene grandes probabilidades de
dar como resultado una decisión incorrecta. Es fácil controlar la probabilidad de un error de tipo I, como lo muestra el resultado siguiente.
Si α representa el nivel de significancia que se ha elegido para la prueba, entonces la
probabilidad de un error de tipo I nunca es mayor que α.
Este hecho se muestra con el siguiente ejemplo. Sea X1, . . . , Xn una muestra aleatoria
–
grande de una población con media m y varianza s2. Entonces X está normalmente distribui2
da con media m y varianza s /n. Suponga que se quiere probar H0: m ⱕ 0 contra H1: m ⬎ 0
a un nivel fijo α ⫽ 0.05. Esto es, se rechazará H0 si P ⱕ 0.05. La distribución nula, que se
muestra en la figura 6.25, es normal con media 0 y varianza sX—2 ⫽ s2/n. Suponga que la hipótesis nula es verdadera. Se calculará la probabilidad de un error de tipo I y se mostrará que
no es mayor de 0.05.
6.12
447
Prueba de nivel fijo
0.05
0
1.645σX⫺
FIGURA 6.25 Distribución nula con región de rechazo para H0: m ⱕ 0.
–
Un error de tipo I ocurrirá si se rechaza H0, ello sucederá si P ⱕ 0.05, además si X ⱖ
–
1.645s X—. Por tanto, la región de rechazo es la región X ⱖ 1.645s X—. Ahora, puesto que H0 es
–
verdadera, m ⱕ 0. Primero se considerará el caso donde m ⫽ 0. Entonces la distribución de X
–
la da la figura 6.25. En este caso, P(X ⱖ 1.645s X—) ⫽ 0.05, por lo que la probabilidad de rechazar H0 y cometer un error de tipo I es igual a 0.05. Después se considera el caso donde
–
m ⬍ 0. Entonces la distribución de X se obtiene al correr la curva en la figura 6.25 a la iz–
quierda, por lo que P(X ⱖ 1.645s X—) ⬍ 0.05, y la probabilidad de un error de tipo I es menor
de 0.05. Se podría repetir esta ilustración con cualquier número α en lugar de 0.05. Se concluye que si H0 es verdadera, la probabilidad de un error de tipo I nunca es mayor que α. Además, se observa que si m está en el límite de H0 (m ⫽ 0 en este caso), entonces la probabilidad
de un error de tipo I es igual a α.
Por tanto, se puede hacer la probabilidad de un error de tipo I tan pequeña como se quiera, porque nunca es mayor que el nivel de significancia α que se eligió. Desgraciadamente,
como se verá en la sección 6.13, entre menor se haga la probabilidad de un error de tipo I,
mayor será la probabilidad de propiciar un error de tipo II. La estrategia usual es elegir un valor para α con el propósito de que la probabilidad del error de tipo I sea razonablemente pequeña. Como se ha mencionado, una elección convencional para α es 0.05. Entonces se
calcula la probabilidad de un error de tipo II y se espera que no sea demasiado grande. Si lo
fuera, se podría reducir solamente al rediseñar el experimento; por ejemplo, si se incrementa el
tamaño muestral. Calcular y controlar el tamaño del error de tipo II es un poco más difícil que
hacer lo mismo con el tamaño del error de tipo I. Esto último se analizará en la sección 6.13.
Resumen
Cuando se realiza una prueba de nivel fijo a un nivel de significancia α existen dos tipos de errores que se pueden cometer. Éstos son
Error de tipo I: rechazar H0 cuando es verdadera.
Error de tipo II: aceptar H0 cuando es falsa.
La probabilidad de un error de tipo I nunca es mayor que α.
448
CAPÍTULO 6
Pruebas de hipótesis
Ejercicios para la sección 6.12
1. Se realiza una prueba de hipótesis y el P-valor es 0.03. Verdadero o falso:
a) H0 se rechaza a un nivel de 5%.
b) H0 se rechaza a un nivel de 2%.
c) H0 no se rechaza a un nivel de 10%.
2. Se diseña un programa de tratamiento de aguas residuales
para producir agua tratada con pH de 7. Sea m la media del
pH del agua tratada mediante dicho proceso. Se medirá el pH
de 60 muestras de agua y se realizará una prueba de hipótesis H0: m ⫽ 7 contra H1: m ⫽ 7. Suponga que se sabe, con
base en experimentos previos, que la desviación estándar
del pH de las muestras de agua es aproximadamente 0.5.
a) Si la prueba se hace a un nivel de 5%, ¿cuál es la región
de rechazo?
b) Si la media muestral del pH es 6.87, ¿se rechaza H0 a un
nivel de 10%?
c) Si la media muestral del pH es 6.87, ¿se rechaza H0 a un
nivel de 1%?
d) Si el valor 7.2 representa un punto crítico, ¿cuál es el nivel de la prueba?
3. Se está evaluando un nuevo sistema de frenado en cierto tipo de automóvil; aquél se instalará si se puede demostrar
que la distancia en que se detiene bajo ciertas condiciones
controladas a velocidad de 30 mi/h es menor a 90 pies. Se
sabe que bajo estas condiciones la desviación estándar de la
distancia en que se detiene es de casi 5 pies. Se hará una
muestra de 150 frenadas a 30 mi/h. Sea m la media de la distancia en que el automóvil se detiene con el nuevo sistema
de frenado.
a) Establezca las hipótesis nula y alternativa adecuadas.
b) Determine la región de rechazo si la prueba se realiza a
un nivel de 5%.
–
c) Alguien sugiere rechazar H0 si X ⱖ 89.4 pies. ¿Ésta es
una región de rechazo adecuada, o algo está equivocado? Si fuera lo primero, determine el nivel de la prueba.
De otro modo, explique la falla.
–
d) Alguien sugiere rechazar H0 si X ⱕ 89.4 pies. ¿Ésta es
una región de rechazo adecuada, o algo falla? Si fuera el
primer caso, determine el nivel de la prueba. De otro
modo, explique el error.
–
–
e) Alguien sugiere rechazar H0 si X ⱕ 89.4 pies o si X ⱖ
90.6 pies. ¿Ésta es una región de rechazo adecuada, o algo está equivocado? Si fuera lo primero, determine el
nivel de la prueba. De otro modo explique la falla.
4. Se hace una prueba de las hipótesis H0: m ⱕ 10 contra H1:
m ⬎ 10. Para cada una de las situaciones siguientes, determine si la decisión fue correcta u ocurrieron errores de tipo
I o II.
a) m ⫽ 8, H0 es rechazada.
b) m ⫽ 10, H0 no es rechazada.
c) m ⫽ 14, H0 no es rechazada.
d) m ⫽ 12, H0 es rechazada.
5. Un distribuidor afirma que no más de 10% de las partes que
proporciona están defectuosas, sea p la proporción real de
piezas con defecto. Se hace una prueba de hipótesis H0: p ⱕ
0.10 contra H1: p ⬎ 0.10. Para cada una de las siguientes situaciones, determine si la decisión fue correcta u ocurrieron
errores de tipo I o II.
a) La afirmación es verdadera, y H0 es rechazada.
b) La afirmación es falsa, y H0 es rechazada.
c) La afirmación es verdadera, y H0 no es rechazada.
d) La afirmación es falsa, y H0 no es rechazada.
6. Se realiza una prueba de hipótesis y se decide rechazar la
hipótesis nula si P ⬍ 0.10. Si H0 es, en efecto, verdadera,
¿cuál es la probabilidad máxima de que sea rechazada?
7. Se está considerando un nuevo proceso para la licuefacción
de carbón. El anterior proceso producía una media de 15 kg de
combustible destilado por kilogramo de hidrógeno consumido en el proceso. Sea m la media del nuevo proceso. Se
realizará una prueba de H0: m ⱕ 15 contra H1: m ⬎ 15. El
nuevo proceso se realizará si H0 es rechazada. Implantar en
la producción el nuevo proceso es muy costoso. Por tanto,
sería un error muy oneroso instaurar en la producción el
nuevo proceso si efectivamente no es mejor que el anterior.
¿Qué procedimiento proporciona una probabilidad menor
para este error, probar a un nivel de 5% o bien un nivel de
1%?
6.13
6.13
Potencia
449
Potencia
Una prueba de hipótesis da como resultado un error de tipo II si H0 no es rechazada cuando
es falsa. La potencia de una prueba es la probabilidad de rechazar H0 cuando ésta es falsa.
Por tanto,
Potencia ⫽ 1 ⫺ P(error tipo II)
Para ser de utilidad, una prueba debe tener probabilidades razonablemente pequeñas
tanto como errores de tipos I y II. El error de tipo I se conserva pequeño al elegir un valor pequeño de α como nivel de significancia. Entonces se calcula la potencia de la prueba. Si aquélla es grande, entonces la probabilidad de un error de tipo II es también pequeña, y la prueba
es útil. Observe que los cálculos de potencia generalmente se hacen antes de recopilar los datos. El propósito de un cálculo de potencia es determinar, cuando se realiza una prueba de hipótesis, si posiblemente rechaza o no H0 en el evento en que H0 es falsa.
Como ejemplo de un cálculo de potencia, suponga que se ha desarrollado un nuevo proceso químico que puede aumentar la producción del proceso actual. Se sabe que éste tiene una
media de producción de 80 y desviación estándar de 5, donde las unidades representan los
porcentajes de un máximo teórico. Si la media de la producción del nuevo proceso se muestra mayor a 80, el nuevo proceso será realizado. Sea m la media de la producción del nuevo
proceso. Se propone operar el nuevo proceso 50 veces y después probar la hipótesis
H0: m ⱕ 80
contra
H1: m ⬎ 80
a un nivel de significancia de 5%. Si H0 es rechazada, se concluirá que m ⬎ 80, y el nuevo
proceso se realizará. Se supone que si el nuevo proceso tuviera una media de la producción
de 81, entonces sería muy benéfico instaurarlo en la producción. Si éste es, en efecto, el caso
que m ⫽ 81, que es la potencia de la prueba, ¿cuál es la probabilidad de que H0 se rechazará?
Antes de presentar la solución, se observa que para calcular la potencia es necesario especificar un valor particular de m, en este caso m ⫽ 81, para la hipótesis alternativa. La razón
para esto último consiste en que la potencia es diferente para valores diferentes de m. Se verá que si m está cerca de H0, la potencia será pequeña, mientras que si m está lejos de H0 la
potencia será grande.
Calcular la potencia implica dos pasos:
1.
2.
Se calcula la región de rechazo.
Se calcula la probabilidad de que el estadístico de prueba esté en la región de rechazo, si
la hipótesis alternativa es verdadera. Ésta es la potencia.
Se iniciará por encontrar la potencia de la prueba al calcular la región de rechazo mediante el método que se muestra en el ejemplo 6.26 de la sección 6.12. Primero se debe en–
contrar la distribución nula. Se sabe que el estadístico X tiene una distribución normal con
–
media m, y desviación estándar s X— ⫽ s/n, donde n ⫽ 50 es el tamaño muestral. Bajo H0, se
toma m ⫽ 80. Ahora se debe encontrar una aproximación para s. En la práctica éste puede
ser un problema difícil, porque la muestra aún no se ha extraído, por lo que no hay una desviación estándar muestral s. Hay algunas maneras en las que podría ser posible aproximar s.
450
CAPÍTULO 6
Pruebas de hipótesis
A veces se ha extraído una muestra preliminar pequeña; por ejemplo, en un estudio de viabilidad, y la desviación estándar de esta muestra podría ser una aproximación satisfactoria para s. En otros casos, podría existir una muestra de una población similar, cuya desviación
estándar podría utilizarse. En este ejemplo hay una larga historia de un proceso actualmente
utilizado, cuya desviación estándar es 5. Se dice que es razonable suponer que la desviación
estándar del nuevo proceso sea similar a la del proceso actual. Por tanto, se desea suponer que
—
la desviación estándar poblacional para el nuevo proceso es s ⫽ 5 y que s X— ⫽ 5/50 ⫽ 0.707.
–
La figura 6.26 presenta la distribución nula de X . Dado que H0 especifica que m ⱕ 80,
–
valores grandes de X no concuerdan con H0, por lo que el P-valor será el área a la derecha del
–
–
valor observado de X . El P-valor será menor o igual a 0.05 si X está en el 5% superior de la
distribución nula. Este 5% superior está en la región de rechazo. El punto crítico tiene un pun–
taje z de 1.645, por lo que su valor es 80 ⫹ (1.645)(0.707) ⫽ 81.16. Se rechazará H0 si X ⱖ
81.16. Ésta es la región de rechazo.
Región de
rechazo
5%
80
81.16
z = 1.645
FIGURA 6.26 La prueba de hipótesis se realizará en un nivel de significancia de 5%. La
región de rechazo para esta prueba es la región donde el P-valor será menor de 0.05.
–
Ahora está listo para calcular la potencia, que es la probabilidad de que X esté en la región de rechazo si la hipótesis alternativa m ⫽ 81 es verdadera. Bajo ésta, la distribución de
–
X es normal con media 81 y desviación estándar 0.707. La figura 6.27 presenta la distribución
alternativa y la distribución nula en la misma gráfica. Se observa que la distribución alternativa se obtiene al correr la distribución nula con el propósito de que la media sea la media al-
Distribución
nula
Distribución
alternativa
Potencia = 0.4090
80
81 81.16
z0 = 1.645
z1 = 0.23
FIGURA 6.27 La región de rechazo, que consta de 5% superior de la distribución nula,
está sombreada. El puntaje z del punto crítico es z0 ⫽ 1.645 bajo la distribución nula y z1
⫽ 0.23 bajo la alternativa. La potencia constituye el área de la región de rechazo bajo la
distribución alternativa, que es 0.4090.
6.13
Potencia
451
ternativa de 81, en vez de la media nula de 80. Debido a que la distribución alternativa es corrida hacia delante, la probabilidad de que el estadístico de prueba esté en la región de rechazo es mayor a que esté bajo H0. De manera específica, el puntaje z bajo H1 para el punto
crítico 81.16 es z ⫽ (81.16 ⫺ 81)/0.707 ⫽ 0.23. El área a la derecha de z ⫽ 0.23 es 0.4090.
Ésta es la potencia de la prueba.
Una potencia de 0.4090 es muy baja. Esto último significa que si la media de la producción del nuevo proceso es, en realidad, igual a 81, hay solamente una probabilidad de 41% de
que el experimento propuesto detecte la mejoría sobre el proceso antiguo y permita que el
nuevo proceso se realice. Sería poco sabio invertir tiempo y dinero en aplicar este experimento, ya que tiene gran un riesgo de fallar.
Es natural preguntarse qué tan grande debe ser la potencia para que sea útil realizar una
prueba. Como con los P-valores, no hay una línea divisoria científicamente válida entre potencia suficiente e insuficiente. En general, las pruebas con potencias mayores a 0.80 o quizás 0.90 se consideran aceptables, pero no hay reglas prácticas bien establecidas.
Se ha mencionado que la potencia depende del valor elegido de m para representar la
hipótesis alternativa y que es mayor cuando el valor está lejos de la media de la nula. El ejemplo 6.28 muestra esto último.
Ejemplo
6.28
Determine la potencia de la prueba a un nivel de 5% de H0: m ⱕ 80 contra H1: m ⬎ 80 para
la media de la producción del nuevo proceso bajo la alternativa m ⫽ 82, suponiendo que n ⫽
50 y s ⫽ 5.
Solución
Ya se ha terminado el primer paso de la solución, que es calcular la región de rechazo. Se re–
chaza H0 si X ⱖ 81.16. La figura 6.28 presenta las distribuciones alternativa y nula en la misma gráfica. El puntaje z para el punto crítico de 81.16 bajo la hipótesis alternativa es z ⫽
(81.16 ⫺ 82)/ 0.707 ⫽ ⫺1.19. El área a la derecha de z ⫽ ⫺1.19 es 0.8830. Ésta es la potencia.
Distribución
nula
Distribución
alternativa
Potencia = 0.8830
80
81.16
82
z0 = 1.645
z1 = ⫺1.19
FIGURA 6.28 La región de rechazo, que consta del 5% superior de la distribución nula,
está sombreada. El puntaje z del punto crítico es z0 ⫽ 1.645 bajo la distribución nula y z1
⫽ ⫺1.19 bajo la hipótesis alternativa. La potencia es el área de la región de rechazo bajo
la distribución alternativa, que es 0.8830.
452
CAPÍTULO 6
Pruebas de hipótesis
Debido a que la distribución alternativa se obtiene al correr a la distribución nula, la potencia depende de qué tipo de valor alterno se elija para m, y tiene un rango desde apenas ser
mayor del nivel de significancia α hasta arriba de 1. Si la media alternativa se elige muy cerca
de la media de la nula, la curva alternativa será casi idéntica a la nula, y la potencia será muy
cercana a α. Si la media alternativa está lejos de la nula, casi toda el área bajo la curva alternativa estará en la región de rechazo, y la potencia será cercana a 1.
Cuando la potencia no es lo suficientemente grande, se puede aumentar al incrementar
el tamaño muestral. Cuando se planea un experimento se puede determinar el tamaño muestral necesario para lograr la potencia deseada. El ejemplo 6.29 ilustra esto último.
Ejemplo
6.29
Con el propósito de evaluar la hipótesis H0: m ⱕ 80 contra H1: m ⬎ 80, considerando la media de la producción del nuevo proceso, ¿cuántas veces se debe operar el nuevo proceso con
el fin de que una prueba con un nivel de significancia de 5% tenga una potencia de 0.90 contra la alternativa m ⫽ 81, si se supone que s ⫽ 5?
Solución
Sea n el tamaño de muestra necesario. Primero se utiliza la distribución nula para expresar el
–
punto crítico de la prueba en función de n. La distribución nula de X es normal con media 80
–
–
y desviación estándar 5/n. Por tanto, el punto crítico es 80 ⫹ 1.645(5/n). Ahora se utiliza la
distribución alternativa con el fin de obtener una expresión diferente para el punto crítico en
función de n. Consulte la figura 6.29. La potencia de la prueba es el área de la región de rechazo bajo la curva alternativa. Esta área debe ser 0.90. Por tanto, el puntaje z para el punto críti–
co, bajo la hipótesis alternativa, es z ⫽ ⫺ 1.28. El punto crítico es, por tanto, 81 ⫺ 1.28 (5/n).
Ahora se tienen dos expresiones diferentes para el punto crítico. Debido a que sólo hay un punto crítico, estas dos expresiones son iguales. En consecuencia, se hacen iguales y se despeja n.
5
5
= 81 − 1.28 √
80 + 1.645 √
n
n
Distribución
nula
Distribución
alternativa
Potencia = 0.90
80
80.56
81
z0 = 1.645
z1 = ⫺1.28
FIGURA 6.29 Para lograr una potencia de 0.90, con nivel de significancia de 0.05, el puntaje z para el punto crítico debe ser z0 ⫽ 1.645 bajo la distribución nula y de z1 ⫽ ⫺1.28.
Bajo la distribución alternativa.
6.13
Potencia
453
Despejando para n produce n ⬇ 214. El punto crítico se puede calcular cuando se sustituye
este valor para n en cualquier lado de la ecuación anterior. El punto crítico es 80.56.
Utilización de una computadora para calcular la potencia
Se ha presentado un método con el cual calcular la potencia y el tamaño muestral necesario
con el fin de obtener una potencia específica para una prueba de una cola con muestras grandes de una media poblacional. Es razonablemente directo extender este método para calcular
la potencia y los tamaños muestrales necesarios para pruebas de dos colas y de proporciones.
Es más difícil calcular la potencia para una prueba t, prueba F, o prueba Ji cuadrada. Sin embargo, los paquetes computacionales pueden calcular la potencia y los tamaños muestrales necesarios para todas estas pruebas. Se presentan algunos ejemplos.
Ejemplo
6.30
Un individuo realizará una encuesta a una muestra aleatoria de votantes en una comunidad
para calcular la proporción de los que aprueban una medida respecto de bonos escolares. Sea
p la proporción poblacional que aprueba la medida. El encuestador probará H0: p ⫽ 0.50 contra H1: p ⫽ 0.50 a un nivel de 5%. Si se hace un muestreo de 200 votantes, ¿cuál es la potencia de la prueba si el valor verdadero de p es 0.55?
Solución
El siguiente resultado de computadora (de MINITAB) presenta la solución:
Power and Sample Size
Test for One Proportion
Testing proportion = 0.5 (versus not = 0.5)
Alpha = 0.05
Alternative
Proportion
0.55
Sample
Size
200
Power
0.292022
Los primeros dos renglones establecen que éste es un cálculo de potencia para una prueba de
una sola proporción poblacional p. Los siguientes dos renglones establecen las hipótesis nula y alternativa, así como el nivel de significancia de la prueba. Observe que se ha especificado una prueba de dos colas con un nivel de significancia α ⫽ 0.05. El renglón siguiente
representa la proporción alternativa, el valor de p (0.55) que se está suponiendo como verdadero cuando se calcula la potencia. El tamaño muestral se ha especificado en 200, y la potencia se calcula en 0.292.
Ejemplo
6.31
En relación con el ejemplo 6.30, ¿cuántos votantes se deben muestrear con el propósito de
que la potencia sea de 0.8 cuando el valor verdadero es p ⫽ 0.55?
454
CAPÍTULO 6
Pruebas de hipótesis
Solución
El siguiente resultado de computadora (de MINITAB) presenta la solución:
Power and Sample Size
Test for One Proportion
Testing proportion = 0.5 (versus not = 0.5)
Alpha = 0.05
Alternative
Proportion
0.55
Sample
Size
783
Target
Power
0.8
Actual Power
0.800239
El tamaño muestral necesario es de 783. Observe que la potencia verdadera es ligeramente
mayor a 0.80. Debido a que el tamaño muestral es discreto, no es posible encontrar un tamaño muestral que proporcione exactamente la potencia pedida (la potencia objetivo). Como
consecuencia de lo anterior, MINITAB calcula el tamaño muestral menor para la potencia mayor que la que se pidió originalmente.
Ejemplo
6.32
Embarques de granos de café se examinan en busca de humedad. Un alto índice de humedad
indica posible contaminación de agua, lo que origina el rechazo del embarque. Sea m la media del contenido de humedad (en porcentaje por peso) en un embarque. Se hicieron cinco
mediciones de humedad a los granos elegidos aleatoriamente del embarque. Se hará una prueba de hipótesis H0: m ⱕ 10 contra H1: m ⬎ 10 a un nivel de 5%, utilizando la prueba t de Student. ¿Cuál es la potencia de la prueba si el contenido de humedad verdadero es de 12%, y la
desviación estándar, s ⫽ 1.5%?
Solución
El siguiente resultado de computadora (de MINITAB) presenta la solución:
Power and Sample Size
1-Sample t Test
Testing mean = null (versus > null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 1.5
Difference
2
Sample
Size
5
Power
0.786485
La potencia depende solamente de la diferencia entre la media verdadera y la media de la nula que es 12 ⫺ 10 ⫽ 2, y no sobre las medias mismas. La potencia es 0.786. Observe que el
resultado especifica que ésta es la potencia para una prueba de una cola.
6.13
Ejemplo
6.33
Potencia
455
Con referencia al ejemplo 6.32, encuentre el tamaño muestral necesario con el propósito de
que la potencia sea al menos 0.9.
Solución
El siguiente resultado de computadora (de MINITAB) presenta la solución:
Power and Sample Size
1-Sample t Test
Testing mean = null (versus > null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 1.5
Difference
2
Sample
Size
7
Target
Power
0.9
Actual Power
0.926750
El valor menor de la muestra para la cual la potencia es 0.9 o más es 7. La potencia verdadera es 0.927.
Resumiendo, los cálculos de potencia son importantes para asegurar que los experimentos
tengan el potencial de proporcionar conclusiones útiles. Muchos organismos que proporcionan financiamiento para investigación científica requieren que con cada propuesta se presenten cálculos de potencia de las pruebas de hipótesis que realizarán.
Ejercicios para la sección 6.13
1. Una prueba tiene potencia de 0.90 cuando m ⫽ 15. Verdadero o falso:
c) La probabilidad de cometer un error de tipo I cuando m
⫽ 3.5 es 0.20.
a) La probabilidad de rechazar H0 cuando m ⫽ 15 es 0.90.
d) La probabilidad de cometer un error de tipo II cuando m
⫽ 3.5 es 0.80.
b) La probabilidad de tomar una decisión correcta cuando
m ⫽ 15 es 0.90.
c) La probabilidad de tomar una decisión correcta cuando
m ⫽ 15 es 0.10.
d) La probabilidad de que H0 es verdadera cuando m ⫽ 15
es 0.10.
2. Una prueba tiene una potencia de 0.80 cuando m ⫽ 3.5. Verdadero o falso:
a) La probabilidad de rechazar H0 cuando m ⫽ 3.5 es 0.80.
b) La probabilidad de cometer un error de tipo I cuando m
⫽ 3.5 es 0.80.
e) La probabilidad de cometer un error de tipo II cuando m
⫽ 3.5 es 0.20.
f ) La probabilidad de que H0 es falsa cuando m ⫽ 3.5 es
0.80.
3. Si el tamaño de muestra permanece constante, y el nivel α
aumenta, entonces la potencia será ___________. Opciones:
aumenta, disminuye.
4. Si el nivel α permanece constante, y el tamaño muestral aumenta, entonces la potencia ____________. Opciones: aumentará, disminuirá.
456
CAPÍTULO 6
Pruebas de hipótesis
5. Una compañía productora de neumáticos afirma que los
tiempos de vida de sus llantas tienen un promedio de cincuenta mil millas. Se sabe que la desviación estándar de los
tiempos de vida de los neumáticos es de cinco mil millas.
Se muestrean 100 neumáticos y se probará la hipótesis de
que la media de los tiempos de vida de los neumáticos es,
al menos, de cincuenta mil millas contra la alternativa que
es menor. Suponga, que en efecto, la media verdadera de los
tiempos de vida es de 49 500 millas.
a) Establezca las hipótesis nula y alternativa. ¿Cuál es verdadera?
b) Se ha decidido rechazar H0 si la media de muestra es
menor a 49 400. Determine el nivel y la potencia de esta prueba.
i) La potencia de la prueba será menor de 0.90.
ii) La potencia de la prueba será mayor a 0.90.
iii) No se puede determinar la potencia de la prueba sin conocer la desviación estándar poblacional s.
8. Se supone que un nuevo proceso para producir placas de silicio de circuitos integrados reduce la proporción de defectos en 10%. Se probará una muestra de 250 placas. Sea X el
número de defectos en la muestra. Sea p la proporción poblacional de defectos producidos por el nuevo proceso. Se
hará una prueba de H0: p ⱖ 0.10 contra H1: p ⬍ 0.10. Suponga que el valor verdadero de p es realmente 0.06.
a) Se decide rechazar H0 si X ⱕ 18. Determine el nivel de
esta prueba.
c) Si la prueba se realiza a un nivel de 5%, ¿cuál es la potencia?
b) Se decide rechazar H0 si X ⱕ 18. Determine la potencia
de esta prueba.
d ) ¿En qué nivel se debe realizar la prueba con el propósito de que la potencia sea de 0.80?
c) ¿Se debe utilizar la misma desviación estándar para X
con el fin de calcular tanto la potencia como el nivel?
Explique.
e) Le están dando la oportunidad de probar más neumáticos. ¿Qué tantas llantas se deben probar en total con el
propósito de que la potencia sea de 0.80 si la prueba se
hace a un nivel de 5%?
6. La media del tiempo de secado de cierta pintura en determinada aplicación es de 12 minutos. Se probará un nuevo aditivo para probar si reduce el tiempo de secado. Se pintarán
cientos de muestras y se calculará la media del tiempo de
–
secado X . Suponga que la desviación estándar poblacional
del tiempo de secado es s ⫽ 2 minutos. Sea m la media del
tiempo de secado para la nueva pintura. La hipótesis nula
H0: m ⱖ 12 será probada contra la alternativa H1: m ⬍ 12.
Suponga que los investigadores desconocen que la media
verdadera del tiempo de secado de la nueva pintura es de
11.5 minutos.
–
a) Se decide rechazar H0 si X ⱕ 11.7. Determine el nivel y
la potencia de esta prueba.
–
b) ¿Para qué valores de X se debe rechazar H0 con el propósito de que la potencia de la prueba sea de 0.90?
¿Cuál será entonces el nivel?
–
c) ¿Para qué valores de X se debe rechazar H0 con el propósito de que el nivel de la prueba sea de 5%? ¿Cuál será la potencia?
d) ¿Qué tan grande se necesita que sea la muestra con el
propósito de que una prueba de nivel 5% tenga potencia
de 0.90?
7. Un cálculo de potencia ha mostrado que si m ⫽ 8, la potencia de una prueba de H0: m ⱖ 10 contra H1: m ⬍ 10 es 0.90.
Si en lugar de m ⫽ 7, ¿cuál de los siguientes enunciados es
verdadero?
d) ¿Cuántas placas se deben muestrear con el propósito de
que la potencia sea de 0.90 si la prueba se hace a un nivel de 5%?
9. El siguiente resultado de MINITAB presenta los resultados
de un cálculo de potencia para una prueba respecto de una
proporción poblacional p.
Power and Sample Size
Test for One Proportion
Testing proportion = 0.5
(versus not = 0.5)
Alpha = 0.05
Alternative
Proportion
0.4
Sample
Size
150
Power
0.691332
a) ¿La potencia calculada para una prueba es de una o de
dos colas?
b) ¿Cuál es la hipótesis nula para la cual se calcula la potencia?
c) ¿Para qué valor alterno de p es la potencia calculada?
d) Si el tamaño muestral fuera de 100, ¿sería la potencia
menor que 0.7, mayor a 0.7, o es imposible deducirlo
del resultado? Explique.
e) Si el tamaño muestral fuera 200, ¿la potencia sería menor que 0.6, mayor a 0.6, o es imposible deducirlo del
resultado? Explique.
6.13
f ) Para un tamaño de muestra de 150, ¿la potencia contra
la alternativa p ⫽ 0.3 es menor que 0.65, mayor que
0.65, o es imposible deducirlo del resultado? Explique.
Potencia
457
g) Para un tamaño de muestra de 150, ¿la potencia contra
la alternativa p ⫽ 0.45 es menor que 0.65, mayor que
0.65, o es imposible deducirlo del resultado? Explique.
10. El siguiente resultado de MINITAB presenta los resultados de un cálculo de potencia con respecto a una media poblacional m.
Power and Sample Size
1-Sample t Test
Testing mean = null (versus > null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 1.5
Difference
1
Sample
Size
18
Target
Power
0.85
Actual Power
0.857299
a) ¿La potencia calculada para una prueba es de una o de dos colas?
b) Suponga que el valor de m utilizado para la hipótesis nula es m ⫽ 3. ¿Para qué valor alterno de m se calcula la potencia?
c) Si el tamaño muestral fuera 25, ¿la potencia sería menor que 0.85, mayor que 0.85, o es imposible deducirlo del resultado?
Explique.
d) Si la diferencia fuera 0.5, ¿la potencia sería menor que 0.90, mayor que 0.90, o es imposible deducirlo del resultado? Explique.
e) Si el tamaño muestral era de 17, ¿la potencia sería menor que 0.85, mayor que 0.85, o es imposible deducirlo del resultado? Explique.
11. El siguiente resultado de MINITAB presenta los resultados de un cálculo de potencia para una prueba de la diferencia entre dos
medias m1 ⫺ m2.
Power and Sample Size
2-Sample t Test
Testing mean 1 = mean 2 (versus not =)
Calculating power for mean 1 = mean 2 + difference
Alpha = 0.05 Assumed standard deviation = 5
Sample
Target
Difference
Size
Power
3
60
0.9
The sample size is for each group.
Actual Power
0.903115
a) ¿La potencia calculada para una prueba es de una o de dos colas?
b) Si los tamaños de muestra fueran 50 en cada grupo, ¿la potencia sería menor que 0.9, mayor que 0.9, o es imposible deducirlo del producto? Explique.
c) Si la diferencia fuera 4, ¿la potencia sería menor que 0.9, mayor que 0.9, o es imposible deducirlo del resultado? Explique.
458
6.14
CAPÍTULO 6
Pruebas de hipótesis
Pruebas múltiples
A veces se presenta una situación en la que es necesario realizar muchas pruebas de hipótesis. La regla básica de esta situación es que entre más pruebas se realicen, la confianza que se
puede tener en los resultados disminuye. En esta sección se presenta un ejemplo para ilustrar
dicho enfoque.
En cierta aplicación industrial, se supone que la aplicación de una capa dura que contiene partículas muy pequeñas de carburo de tungsteno puede reducir el desgaste en engranes
de levas. Hay muchas formulaciones posibles para la capa, variando el tamaño y la concentración de las partículas de carburo de tungsteno. Se elaboraron 20 formulaciones diferentes.
Cada una se probó aplicándola a muchos engranes, y después se midió el desgaste de éstos
después de transcurrido cierto lapso. Se sabe, con base en la experiencia, que la media del desgaste para engranes no cubiertos en dicho periodo es de 100 mm. Para cada formulación se
hizo una prueba de la hipótesis nula H0: m ⱖ 100 mm. H0 muestra que la formulación no reduce el desgaste. Para 19 de las 20 formulaciones, el P-valor era mayor a 0.05, por lo que H0
no fue rechazada. Para una formulación, H0 fue rechazada. Podría parecer natural llegar a la
conclusión de que esta formulación reduce realmente el desgaste. Los ejemplos 6.34 a 6.37
mostrarán que esta conclusión es prematura.
Ejemplo
6.34
Si sólo se probó una formulación, y no tenía ningún efecto sobre el desgaste, ¿cuál es la probabilidad de que H0 fuera rechazada, dando como resultado una conclusión equivocada?
Solución
Si la formulación no tiene ningún efecto sobre el desgaste, entonces m ⫽ 100 mm, por lo que
H0 es verdadera. Rechazar H0 representa un error de tipo I. Por tanto, la cuestión es preguntarse por la probabilidad de un error de tipo I. En general, esta probabilidad es siempre menor que o igual al nivel de significancia de la prueba, que en este caso es de 5%. Debido a que
m ⫽ 100 está en la frontera de H0, la probabilidad de un error de tipo I es igual al nivel de significancia. La probabilidad de que H0 se rechazará es 0.05.
Ejemplo
6.35
Como consecuencia de que H0 fue rechazada para una de las 20 formulaciones, ¿es factible
que realmente no tenga ningún efecto sobre el desgaste?
Solución
Sí es factible que ninguna de las formulaciones, incluyendo la que rechazó H0, tenga algún
efecto sobre el desgaste. Se hicieron 20 pruebas de hipótesis. Para cada prueba había una probabilidad de 5% (es decir, una oportunidad entre 20) de un error del tipo I. Por tanto, se espera que, en promedio, de las 20 hipótesis nulas verdaderas, una será rechazada. Por lo que
rechazar H0 es una, exactamente, de las 20 pruebas que se esperaría para el caso de que en
ninguna de las formulaciones hubiera diferencia.
6.14
Ejemplo
6.36
Pruebas múltiples
459
Si, en efecto, ninguna de las 20 formulaciones tiene efecto en el desgaste, ¿cuál es la probabilidad de que H0 sea rechazada en una o más de éstas?
Solución
Se encuentra primero la probabilidad de que la conclusión correcta (no rechazar H0) se toma
para todas las formulaciones. Para cada formulación, la probabilidad de que H0 no sea rechazada es 1 ⫺ 0.05 ⫽ 0.95, por lo que la probabilidad de que H0 no sea rechazada para ninguna de las 20 formulaciones es (0.95)20 ⫽ 0.36. Por tanto, la probabilidad es 1 ⫺ 0.36 ⫽ 0.64
de que es incorrecto rechazar H0 para una o más de las formulaciones.
Ejemplo
6.37
El experimento se repite. Esta vez el operador se olvida de aplicar las capas, así que cada una
de las 20 mediciones de desgaste realmente se hacen en engranes no cubiertos. ¿Es probable
que una o más de las formulaciones parecerán reducir el desgaste, en tal caso H0 probablemente será rechazada?
Solución
Sí. El ejemplo 6.36 muestra que la probabilidad es 0.64 de que una o más de las capas parecerá reducir el desgaste, aun si no se aplica realmente la capa.
Los ejemplos 6.34 a 6.37 ilustran un fenómeno conocido como problema de la prueba
múltiple. En otras palabras, el problema de prueba múltiple es éste: cuando se rechaza H0, se
tienen fuertes evidencias de que es falsa, pero ello no significa que haya certeza en dicha conclusión. En ocasiones una hipótesis nula verdadera será rechazada. Cuando se realizan muchas pruebas, es más probable que algunas hipótesis nulas verdaderas sean rechazadas. Por
tanto, cuando se realizan muchas pruebas, es difícil decir cuáles de las hipótesis nulas rechazadas son realmente falsas y a cuáles les corresponden errores de tipo I.
El método de Bonferroni
Este método proporciona una manera de ajustar P-valores hacia arriba cuando se realizan algunas pruebas de hipótesis. Si un P-valor permanece pequeño después del ajuste, la hipótesis
nula puede ser rechazada. Para hacer el ajuste de Bonferroni, sólo multiplique el P-valor por
el número de pruebas realizadas. He aquí dos ejemplos.
Ejemplo
6.38
Se prueban cuatro diferentes formulaciones de capa para verificar si reducen el desgaste sobre engranes de levas a un valor debajo de los 100 mm. La hipótesis nula H0: m ⱖ 100 mm es
probada para cada formulación, y los resultados son
Formulación A: P ⫽ 0.37
Formulación B: P ⫽ 0.41
Formulación C: P ⫽ 0.005
Formulación D: P ⫽ 0.21
460
CAPÍTULO 6
Pruebas de hipótesis
El operador sospecha que la formulación C podría ser eficaz, pero sabe que el P-valor de
0.005 es poco fiable porque se han realizado algunas pruebas. Utilice el ajuste de Bonferroni
para producir un P-valor confiable.
Solución
Se realizaron cuatro pruebas, por lo que el ajuste de Bonferroni producía P ⫽ (4)(0.005) ⫽
0.02 para la formulación C, por lo que la evidencia es razonablemente fuerte de que la formulación C es eficaz.
Ejemplo
6.39
Se supone que en el ejemplo 6.38 el P-valor de la formulación C era 0.03 en lugar de 0.005.
Entonces ¿a qué conclusión llegaría?
Solución
El ajuste de Bonferroni produciría P ⫽ (4)(0.03) ⫽ 0.12. Esto no es probablemente una evidencia fuerte para concluir que la formulación C es eficaz. Debido a que el P-valor original
era pequeño, es probable que sería deseable no querer abandonar aún más la formulación C.
El ajuste de Bonferroni es conservador; en otras palabras, el P-valor que produce nunca es menor que el P-valor verdadero. En este sentido, cuando el P-valor con el ajuste de Bonferri es pequeño, con seguridad la hipótesis nula puede rechazarse. Desafortunadamente,
como se muestra en el ejemplo 6.39, hay muchas ocasiones en las que el P-valor original es
bastante pequeño para suscitar una fuerte sospecha de que una hipótesis nula podría ser falsa, pero el ajuste de Bonferroni no permite rechazar la hipótesis.
Cuando el P-valor con el ajuste de Bonferroni es demasiado grande para rechazar una
hipótesis nula, aun cuando el P-valor original sea bastante pequeño para sospechar que la hipótesis es efectivamente falsa, con frecuencia lo mejor es reexaminar la hipótesis que parece
falsa mediante datos de un nuevo experimento. Si el P-valor es de nuevo pequeño, esta vez
sin pruebas múltiples, ello proporciona evidencias reales contra la hipótesis nula.
A los procesos industriales reales se les da seguimiento mediante muestreo y con la
comprobación del resultado del proceso para verificar si se satisfacen las especificaciones.
Con frecuencia, el resultado parece alejado de las especificaciones. Pero en estos casos, ¿cómo se sabe si el proceso realmente funciona mal (fuera de control) o si el resultado es un error
de tipo I? Ésta es una versión del problema de pruebas múltiples que ha recibido mucha atención. El tema de control de calidad estadístico (véase el capítulo 10) está dedicado, en gran
parte, a encontrar las maneras para superar el problema de pruebas múltiples.
Ejercicios para la sección 6.14
1. Se prueban seis ajustes diferentes en una máquina con el fin
de comprobar si ninguno reducirá la proporción de piezas
defectuosas. Para cada ajuste se prueba una adecuada hipótesis nula para verificar si la proporción de piezas defectuosas se ha reducido. Los seis P-valores son 0.34, 0.27, 0.002,
0.45, 0.03 y 0.19.
a) Determine el P-valor con el ajuste de Bonferroni para
el ajuste cuyo P-valor es 0.002. ¿Puede concluir que este
ajuste reduce la proporción de piezas defectuosas? Explique.
b) Determine el P-valor con el ajuste de Bonferroni para el
ajuste cuyo P-valor es 0.03. ¿Puede concluir que este
6.14
ajuste reduce la proporción de partes defectuosas? Explique.
2. Se operan cinco variaciones diferentes de un proceso para
fabricar pernos con el propósito de verificar si alguna puede aumentar la media de la fuerza de ruptura sobre el proceso actual. Los P-valores son 0.13, 0.34, 0.03, 0.28 y 0.38.
De las siguientes elecciones, ¿cuál será la siguiente opción
que se aplicará?
i) Instrumentar el proceso cuyo P-valor fue 0.03, ya que se
realiza mejor.
Pruebas múltiples
461
Para cada aditivo realice una prueba de hipótesis de la
hipótesis nula H0: m ⱖ 12 contra la alternativa H1: m ⬍ 12.
Puede suponer que cada población es aproximadamente
normal.
a) ¿Cuáles son los P-valores para las cinco pruebas?
b) Con base en los resultados, ¿cuál de las tres conclusiones siguientes parece más adecuada? Explique su respuesta.
i) Al menos uno de los nuevos aditivos mejora el resultado.
ii) Ninguno de los nuevos aditivos mejora el resultado.
ii) Debido a que ninguno de los procesos tenía P-valores
con el ajuste de Bonferrani menores de 0.05, se debe
continuar con el proceso actual.
iii) Algunos de los nuevos aditivos mejoran el resultado,
pero las pruebas no son concluyentes.
iii) Repetir el proceso cuyo P-valor era 0.03 para ver si permanece pequeño en ausencia de pruebas múltiples.
5. A diario, durante 200 días, un ingeniero responsable de la
calidad muestrea 144 fusibles tasados en 15 A y mide el amperaje con el que se queman. Realiza una prueba de hipótesis de H0: m ⫽ 15 contra H1: m ⫽ 15, donde m es la media
del amperaje con que se queman los fusibles fabricados ese
día.
iv) Repetir las cinco variaciones otra vez, para ver si ninguna de ellas produce un P-valor pequeño la segunda vez.
3. Se están probando veinte formulaciones de una capa con el
fin de comprobar si alguna de ellas reduce el desgaste de los
engranes. Con la idea de que el P-valor con el ajuste de
Bonferroni para una formulación sea 0.05, ¿cuál debe ser el
P-valor original?
4. Se han estado probando cinco nuevos aditivos de pintura
con el fin de verificar si alguno puede reducir la media del
tiempo de secado del valor actual de 12 minutos. Se pintaron diez muestras con cada una de los nuevos tipos de pintura y se midieron los tiempos de secado (en minutos). Los
resultados fueron:
Aditivo
1
2
3
4
5
6
7
8
9
10
A
B
C
D
E
14.573
12.012
13.449
13.928
13.123
13.254
12.772
10.948
13.702
11.616
10.393
10.435
11.440
9.719
11.045
11.707
11.141
9.852
13.694
9.474
15.497
9.162
11.394
10.766
11.025
10.636
15.066
11.991
13.395
8.276
10.350
7.324
10.338
11.600
10.725
12.240
10.249
9.326
10.774
11.803
11.263
10.848
11.499
10.493
13.409
10.219
10.997
13.196
12.259
11.056
a) Durante diez de los 200 días, H0 es rechazada a un nivel
de 5%. ¿Esto último proporciona la evidencia concluyente de que la media del amperaje de quemado era diferente de 15 A en al menos uno de los 200 días?
Explique.
b) ¿Sería la respuesta en el inciso (a) diferente si H0 hubiera sido rechazada en 20 de los 200 días? Explique.
462
6.15
CAPÍTULO 6
Pruebas de hipótesis
Uso de la simulación para realizar
pruebas de hipótesis
Si X1, . . . , Xn son variables aleatorias independientes, con desviaciones estándar conocidas
s1, . . . , sn, y U ⫽ U(X1, . . . , Xn) es una función de X1, . . . , Xn, entonces el método de propagación del error (véase el capítulo 3) se puede utilizar para calcular la desviación estándar,
o la incertidumbre, en U. Si además las variables aleatorias X1, . . . , Xn están distribuidas normalmente, con frecuencia, pero no siempre, se da el caso de que U también está distribuida
aproximadamente en forma normal. En estos casos se pueden realizar pruebas de hipótesis sobre la media mU de U. Para determinar si U está distribuida normalmente se puede utilizar la
simulación. El método es similar al descrito en la sección 5.8.
Se muestra con un ejemplo. Sea R la medición del radio de un cilindro, y H la medición
de la altura. Suponga que ambas mediciones no tienen sesgos y están normalmente distribuidas. Sea V ⫽ πR2H la medida del volumen del cilindro que se calcula de R y H. Ahora suponga que R ⫽ 4.8 cm, H ⫽ 10.1 cm, y las incertidumbres (desviaciones estándar) son sR ⫽ 0.1
cm y sH ⫽ 0.2 cm. El volumen medido es V ⫽ π(4.82)(10.1) ⫽ 731.06 cm3. Suponga que se
desea determinar si se puede concluir que el volumen verdadero del cilindro es mayor a 700
cm3. Sea mV la media de V. Dado que R y H no tienen sesgos, con incertidumbres bastante pequeñas, V está cercanamente sin sesgos (véase el análisis en la p. 173), por lo que mV está cerca del volumen verdadero del cilindro. Por tanto, se puede tratar la pregunta respecto del
volumen verdadero realizando una prueba de hipótesis H0: mV ⱕ 700 contra H1: mV ⬎ 700.
Se inicia mediante el método de la propagación del error para calcular la incertidumbre
en V:
∂V 2 2
∂V 2 2
σV =
σR +
σH
∂R
∂H
= (2π RH )2 σR2 + (πR 2 )2 σH2
= [2π(4.8)(10.1)]2 (0.1)2 + [π(4.82 )]2 (0.2)2
= 33.73
Ahora si el volumen medido V está distribuido normalmente, se puede proceder de la siguiente manera: bajo H0, V ⬃ N(700, 33.732). Se observa el valor V ⫽ 731.06. El P-valor para H0:
mV ⱕ 700 es P(V ⱖ 731.06) donde la probabilidad se calcula bajo la suposición de que V ⬃
N(700, 33.732). El puntaje z es (731.06 ⫺ 700)/33.73 ⫽ 0.92, y el P-valor es 0.18.
La validez de la prueba apenas realizada depende de la suposición de que V está normalmente distribuido. Se comprueba esta suposición con una simulación. Se genera, primero, un gran número N de valores R*1, . . . , R*N para la medición de los radios. Se sabe que las
mediciones de los radios están normalmente distribuidas con desviación estándar sR ⫽ 0.1.
No se conoce la media de las mediciones del radio, que es igual al radio verdadero, pero se
puede aproximar a ésta con el valor observado 4.8. Por tanto, se genera R*1, . . . , R*N de la distribución N(4.8, 0.12). Similarmente, se genera H*1, . . . , H*N de la distribución N(10.1, 0.22).
Después se calculan mediciones de volumen simuladas V*i ⫽ π(R*i)2 H*i. Una gráfica de probabilidad normal de V*i se puede, entonces, utilizar para determinar si V es aproximadamente
normal.
6.15
Uso de la simulación para realizar pruebas de hipótesis
463
La figura 6.30 presenta una gráfica de probabilidad normal para una muestra de mil valores de V*i. Se satisface la suposición de normalidad. El P-valor de 0.18 es válido.
Por ultimo, se hace la observación de que si se satisface la suposición de normalidad,
la desviación estándar muestral V*i se puede utilizar en lugar del valor 33.73 que se calculó
con la propagación del error. En la muestra de mil que se generó, la desviación estándar de
muestra era de 31.67, que estaba razonablemente cerca del valor calculado con la propagación del error.
0.999
0.99
0.95
0.9
0.75
0.5
0.25
0.1
0.05
0.01
0.001
650
700
750
800
850
FIGURA 6.30 Gráfica de la probabilidad normal para mil volúmenes simulados. La suposición de normalidad parece estar justificada.
Pruebas de hipótesis con intervalos de confianza bootstrap
Dado un intervalo de confianza de nivel 100(1 ⫺ α)% para un parámetro, tal como una media
poblacional m, se puede rechazar la hipótesis nula a un nivel de 100α % de que el parámetro
sea igual para cualquier valor dado fuera del intervalo, y no se puede rechazar la hipótesis nula
a un nivel de 100α % de que el parámetro sea igual para cualquier valor dado dentro del intervalo (véase el análisis al inicio de la p. 381). Esta idea se puede aplicar a un intervalo de confianza bootstrap para construir una prueba de hipótesis de nivel fijo. Se presenta un ejemplo.
Ejemplo
6.40
En la sección 5.8 un intervalo de confianza de 95% aproximado para la media del millaje, en
millas/galón, de una población de camiones se encontró, con un método bootstrap, que era de
(4.7643, 6.4757). ¿Se puede concluir a un nivel de 5% que la media poblacional del millaje
difiere de 5 mi/galón? ¿De 7 mi/galón?
464
CAPÍTULO 6
Pruebas de hipótesis
Solución
Un intervalo de confianza de 95%, si se calculó mediante bootstrap u otros medios, contiene
los valores que no son rechazados a un nivel de 5%. Por tanto, se concluye que a un nivel de
5% la media poblacional difiere de 7 mi/galón, pero no se puede concluir que en ese nivel
difiere de 5 mi/galón.
Pruebas aleatorias
Las pruebas aleatorias también se llaman pruebas de permutación; estaban entre los primeros
métodos desarrollados para probar la diferencia entre dos medias poblacionales. Mientras no
requieran ninguna suposición acerca de la distribución de los datos, implican muchos cálculos
y no eran realmente viables hasta hace más o menos poco tiempo. Se presenta un ejemplo.
Una científica quiere determinar si la producción de lechuga se incrementará con el uso
de un fertilizante con mayor contenido de nitrógeno. Dirige un experimento que implica 20
parcelas. Se eligen aleatoriamente diez de éstas para tratarse con el fertilizante A, que tiene
un bajo contenido de nitrógeno. Las otras diez parcelas se tratan con el fertilizante B, que tiene un mayor contenido de nitrógeno.
La siguiente tabla presenta el tratamiento aplicado (A o B) para cada parcela y la producción, según la cantidad de plantas de lechuga cosechadas.
Número de parcela
1
2
3
4
5
6
7
8
9
10 11 12 13 14
15 16
17 18 19
20
Tratamiento A A B B A A A B B A A B A A B B B B A B
Cosecha
145 142 144 141 142 155 143 157 152 143 103 151 150 148 150 162 149 158 144 151
La hipótesis nula es que no hay ninguna diferencia entre los fertilizantes con respecto
a la cosecha; en otras palabras, la cosecha para cada parcela habría sido la misma sin que importara el tipo de fertilizante que había recibido. Por ejemplo, la cosecha en la parcela 1 habría sido de 145, ya sea que se hubieran usado los fertilizantes tipos A o B. Si H0 es verdadera,
entonces las 20 producciones observadas son constantes y las producciones relacionadas con
el fertilizante B son una muestra aleatoria simple de diez de estas 20 cosechas constantes. De–
note la media de las diez cosechas asociadas con el fertilizante A por A, y la media de las diez
–
cosechas asociadas con el fertilizante B por B . Debido a que el interés principal en el experimento es determinar si el fertilizante B aumenta la cosecha, un estadístico de prueba razona–
–
ble es la diferenciar B ⫺ A. El valor observado de este estadístico es 151.5 ⫺ 141.5 ⫽ 10.0.
Entre mayor sea el valor del estadístico de prueba, más fuerte es la evidencia contra H0. La
fuerza de la evidencia se mide por medio del P-valor. Ahora se analiza cómo calcular el P-valor.
El experimento implica una elección aleatoria de diez parcelas de las 20 que reciben el
fertilizante A. En general, el número de elecciones diferentes de k artículos que serán seleccionados de un grupo de 11 elementos se denota por 冢nk冣 y está dado por (véase la ecuación
2.12 de la sección 2.2 para su deducción)
n!
n
=
k
k!(n − k)!
6.15
465
Uso de la simulación para realizar pruebas de hipótesis
Por tanto, el número de elecciones posibles para estas diez parcelas es 冢20
10冣 ⫽ 184 756. Esto
último significa que hay tal cantidad de maneras de que el experimento pudiera tener un resultado; el experimento verdadero consiste en observar una de ellas elegida aleatoriamente.
–
–
La elección que se tomó en realidad proporcionó un valor de B ⫺ A ⫽ 10 para el estadístico
de prueba. Debido a que, bajo H0, las producciones no dependen de qué tipo de fertilizante se
–
–
utilizó, se podría, en principio, calcular el valor del estadístico de prueba B ⫺ A para cada uno
de los 184 756 resultados posibles del experimento. El P-valor es la probabilidad, bajo H0, de
que el estadístico de prueba tenga un valor igual o mayor a diez. Esta probabilidad es igual a
–
–
la proporción de los 184 756 resultados posibles del experimento para los cuales B ⫺ A ⱖ 10.
La tabla 6.6 presenta un listado parcial de los resultados posibles del experimento.
TABLA 6.6 Resultados posibles del experimento aleatorio
Cosechas asignadas a A
Cosechas asignadas a B
A
B
B −A
1
103 141 142 142 143
143 144 144 145 148
149 150 150 151 151
152 155 157 158 162
139.5
153.5
14.0
2
103 141 142
143 144 144
..
.
148 150 150
152 155 157
148 150 150
152 155 157
..
.
103 141 142
143 144 144
139.6
153.4
13.8
..
.
..
.
..
.
142 143
145 149
153.4
139.6
−13.8
103 141 142 142 143
143 144 144 145 148
153.5
139.5
−14.0
Resultado
..
.
184 755
184 756
142 143
145 149
151 151
158 162
149 150 150 151 151
152 155 157 158 162
151 151
158 162
El P-valor exacto se puede encontrar cuando se completa la tabla 6.6 y después al de–
–
terminar la proporción de resultados para los cuales B ⫺ A ⱖ 10. Este procedimiento se llama prueba aleatoria, o prueba de permutación. Calcular el P-valor exacto es una tarea
intensiva, aun para una computadora. El método más fácil, bueno en la práctica, es trabajar
con un conjunto de resultados generados aleatoriamente. Esto último se hace cuando se genera un número grande (mil o más) de subconjuntos elegidos aleatoriamente entre diez producciones asignadas al tratamiento A. Cada subconjunto elegido corresponde a uno de los
resultados posibles del experimento, y para cada subconjunto se calcula el valor del estadístico de prueba. El P-valor se aproxima con la proporción de resultados elegidos aleatoriamente para los cuales el valor del estadístico de prueba es igual o mayor al valor observado de
diez.
La tabla 6.7 presenta los primeros cinco y los últimos de mil resultados elegidos aleatoriamente para el experimento. De los primeros cinco resultados, ninguno de ellos tiene va–
–
lores de B ⫺ A mayores que o iguales a diez, por lo que la estimación del P-valor basado en
estos cinco es 0/5 ⫽ 0. Por supuesto, cinco resultados no son suficientes para obtener una conclusión confiable. De todo el conjunto de los mil resultados, solamente nueve tenían valores
–
–
de B ⫺ A mayores o iguales a diez. Por tanto, se calcula que el P-valor es de 0.009, bastante
pequeño para rechazar de manera tajante la hipótesis nula de que no hay ninguna diferencia
entre los fertilizantes. Parece razonable concluir que el fertilizante tipo B tiende a aumentar
la producción.
466
CAPÍTULO 6
Pruebas de hipótesis
TABLA 6.7 Mil resultados simulados del experimento aleatorio
p
Resultado
Cosechas asignadas a A
Cosechas asignadas a B
A
B
B −A
1
157 151 144 150 142
150 155 144 143 141
145 148 142 143 103
152 158 149 162 151
147.70
145.30
−2.40
2
143 103 158 151 142
151 155 150 148 141
142 144 149 144 143
162 157 150 152 145
144.20
148.80
4.60
3
162 158 144 141 148
155 103 143 144 157
143 150 142 152 145
150 142 149 151 151
145.50
147.50
2.00
4
145 151 143 141 150
142 162 148 149 158
144 155 157 103 152
150 144 151 143 142
148.90
144.10
−4.80
5
152 148 144
155 162 103
..
.
144 152 143
148 143 145
145 150 158
143 141 143
..
.
144 103 149
162 150 141
146.40
146.60
0.20
..
.
..
.
..
.
148.10
144.90
..
.
1 000
142 157
150 151
155 142
158 151
149 144
151 142
142 150
151 157
−3.20
Los experimentos aleatorios, como el recién descrito, tienen un papel muy importante
en las investigaciones científicas y se analizan con más profundidad en el capítulo 9. Cuando
ningún dato atípico está presente, se ha mostrado que la prueba t de Student para la diferencia entre medias (véase la sección 6.7) proporciona una buena aproximación a la prueba aleatoria cuando se están comparando dos tratamientos. Los datos de los experimentos aleatorios
se pueden tratar, en general, como si consistieran de muestras aleatorias de poblaciones diferentes; éste es el enfoque que se tomará en el capítulo 9. El trabajo de Freedman, Pisani y Purves (1998) contiene un buen análisis de este tema. A veces también las pruebas de rango
(véase la sección 6.9) se usan para estos experimentos.
Las pruebas aleatorias se pueden utilizar en algunos casos cuando los datos consisten
de dos muestras de dos poblaciones, que es el caso que se analiza en la sección 6.7. Por tanto, las pruebas aleatorias pueden ser una alternativa a la prueba t para la diferencia entre medias cuando hay datos atípicos.
Se puede encontrar más información sobre pruebas aleatorias en Efron y Tibshirani
(1993).
Uso de la simulación para calcular la potencia
Para algunas pruebas es difícil calcular la potencia con una fórmula; en estos casos, con frecuencia se puede utilizar la simulación para calcularla. A continuación se muestra un ejemplo.
Ejemplo
6.41
Se está desarrollando un nuevo tipo de soldadura. Si se demuestra concluyentemente que la
media de la dureza de fractura de la soldadura es mayor de 20 pies⋅lb, la soldadura se usará
en cierta aplicación. Suponga que la dureza está distribuida normalmente con desviación es-
6.15
467
Uso de la simulación para realizar pruebas de hipótesis
tándar igual a 4 pies⋅lb. Se harán seis soldaduras, y se medirá la dureza de fractura de cada
una. Se hará una prueba t de Student de la hipótesis nula H0: m ⱕ 20 contra H1: m ⬎ 20. Si
la prueba se realiza en un nivel de significancia de 5%, ¿cuál es la potencia de la prueba si la
media verdadera de la dureza es 25 pies ⋅lb?
Solución
Sean X1, . . . , X6 las seis durezas de la muestra, y s la desviación estándar muestral. Ésta es
–
–
una muestra de una distribución N(25, 16). El estadístico de prueba es T ⫽ (X ⫺ 20)/(s/6).
Bajo H0, esta estadística tiene una distribución t de Student con cinco grados de libertad. La
hipótesis nula será rechazada si el valor del estadístico de prueba es mayor que t5,0.05 ⫽ 2.015.
Por tanto, la potencia, es igual a P(T ⬎ 2.015). No es fácil calcular esta probabilidad directamente, ya que la hipótesis nula es falsa, por lo que T no tiene la distribución t de Student. Sin
embargo, se puede estimar con un experimento de simulación.
Se generarán diez mil muestras X*1i, . . . , X*6i, cada uno de la distribución N(25, 16). Pa–
ra cada muestra se calculará la media muestral X *i, la desviación estándar muestral s*i, y el es–
–
tadístico de prueba T *i ⫽ (X *i ⫺ 20)/( s*i /6). Debido a que cada muestra simulada es extraída
de la misma distribución, como las durezas verdaderas de las soldaduras, cada muestra simulada es estadísticamente equivalente a una muestra de soldadura verdadera. Por tanto, sólo se
puede estimar la potencia cuando se calcula la proporción de muestras simuladas para las que
se rechaza la hipótesis nula, esto es, para la cual el valor del estadístico de prueba es mayor a
2.015. La tabla 6.8 presenta los resultados para las diez primeras muestras y las últimas. La
columna derecha contiene un “1” si el valor del estadístico de prueba es mayor a 2.015, y un
“0” si la situación es otra.
La hipótesis nula se rechaza para nueve de las diez primeras muestras. Si se basaron los
resultados en éstas, se estimaría la potencia de 0.9. Por supuesto, diez muestras no son suficientes. De las diez mil muestras, la hipótesis nula fue rechazada para 8 366 de ellas. La estimación de la potencia es, por tanto, 0.8366.
TABLA 6.8 Datos simulados para el ejemplo 6.41
p
i
1
2
3
4
5
6
7
8
9
10
..
.
10 000
X1∗
X2∗
X3∗
X4∗
X5∗
X6∗
X∗
s∗
T∗
23.24
26.51
28.61
22.84
22.36
26.54
24.05
28.38
23.55
29.98
..
.
30.75
23.78
19.89
28.19
28.69
21.26
28.63
24.42
29.51
21.73
34.65
..
.
19.99
15.65
20.53
29.48
23.93
26.37
24.79
20.32
23.80
19.57
21.17
..
.
26.20
25.67
25.03
20.06
27.37
23.61
20.63
23.74
29.05
25.04
28.43
..
.
22.41
24.08
28.35
30.00
19.51
34.45
25.44
24.14
26.39
22.34
23.43
..
.
31.53
25.88
28.01
21.19
30.28
29.97
26.69
24.66
23.76
29.71
34.44
..
.
21.78
23.05
24.72
26.26
25.44
26.34
25.45
23.56
26.81
23.66
28.68
..
.
25.45
3.776
3.693
4.423
4.046
5.061
2.703
1.615
2.579
3.484
5.559
..
.
4.862
1.978
3.131
3.465
3.291
3.067
4.940
5.394
6.472
2.570
3.825
..
.
2.744
T ∗ > 2.015
0
1
1
1
1
1
1
1
1
1
..
.
1
468
CAPÍTULO 6
Pruebas de hipótesis
Ejercicios para la sección 6.15
1. Este ejercicio es una continuación del 9 de los ejercicios
adicionales del capítulo 3. El artículo “Insights into PresentDay Crustal Motion in the Central Mediterranean Area
from GPS Surveys” (M. Anzidei, P. Baldi y cols., en
Geophysical Journal International, 2001:98-100) notifica
mediciones de la velocidad de la corteza terrestre en Zimmerwald, Suiza. La componente de la velocidad en dirección norte se midió de X ⫽ 22.10, y la componente en
dirección este se midió de Y ⫽ 14.30, donde las unidades
son mm/año. Las incertidumbres en las mediciones están
dadas como sX ⫽ 0.34 y sY ⫽ 0.32.
a) Calcule la velocidad estimada V de la corteza terrestre
basado en estas mediciones. Utilice el método de propagación del error para calcular su incertidumbre.
b) Suponiendo que la velocidad esté normalmente distribuida, encuentre el P-valor para la hipótesis H0: mV ⱕ 25.
c) Suponiendo que las componentes de la velocidad en las
direcciones norte y este son independientes y están distribuidas normalmente, genere una adecuada muestra simulada de los valores V*. ¿Es razonable suponer que V
se distribuye aproximadamente normal?
2. Un genetista de población está estudiando los genes encontrados en dos ubicaciones diferentes sobre el genoma. Él
calcula que la proporción p1 de organismos que tienen un
gen A en la primera ubicación es p̂1 ⫽ 0.42, con incertidumbre de s1 ⫽ 0.049. Asimismo, calcula la proporción de organismos que tienen un gen B en la segunda posición de p̂2
⫽ 0.23, con incertidumbre s2⫽ 0.043. Bajo las suposiciones
que usualmente se hacen en poblaciones genéticas (equilibrio de Hardy-Weinberg), p̂1 y p̂2 son independientes y están
normalmente distribuidos, y la proporción p de organismos
que tienen tanto genes A como B se estima con p̂ ⫽ p̂1 p̂2.
a) Calcule p̂ y utilice la propagación del error para calcular su incertidumbre.
b) Suponga que p̂ está normalmente distribuido, encuentre
el P-valor para probar H0: p ⱖ 0.10.
c) Genere una muestra simulada adecuada de valores p̂*.
¿Es razonable suponer que p̂ está normalmente distribuido?
3. Con referencia al ejercicio 6 de la sección 5.8, sea m la media poblacional de la fuerza compresiva, en MPa. Considere las siguientes hipótesis nulas:
i) H0: m ⫽ 38.53
ii) H0: m ⫽ 38.35
iii) H0: m ⫽ 38.45
iv) H0: m ⫽ 38.55
a) Con los datos bootstrap presentados en el ejercicio 6 de
la sección 5.8, ¿cuál de estas hipótesis nulas se puede rechazar a un nivel de 5%, si se construye un intervalo de
confianza con el método 1 de la p. 358?
b) Utilizando los datos bootstrap presentados en el ejercicio 6 de la sección 5.8, ¿cuál de estas hipótesis nulas se
puede rechazar a un nivel de 10%, si se construye un intervalo de confianza mediante el método 1 de la p. 358?
4. Con referencia al ejercicio 6 de la sección 5.8, sea m la media poblacional de la fuerza compresiva, en MPa. Genere
mil muestras bootstrap.
a) Utilizando los datos bootstrap que usted generó, ¿cuál
de estas hipótesis nulas se puede rechazar a un nivel de
5%, utilizando el método 1 de la p. 358?
b) Utilizando los datos bootstrap que usted generó, ¿cuál
de estas hipótesis nulas se puede rechazar a un nivel de
10%, con el método 1 de la p. 358?
c) Si se realiza un experimento bootstrap dos veces con los
mismos datos, ¿es necesario que los resultados concuerden? Explique.
5. En el ejemplo de la cosecha de lechugas presentado en la p.
464, ¿sería una buena idea utilizar la prueba t descrita en la
sección 6.7 para determinar si los fertilizantes difieren en
sus efectos sobre la cosecha? ¿Por qué sí o no?
6. Se sospecha que utilizar gasolina premiun en lugar de regular aumentará el millaje para automóviles con un diseño de
motor especial. Se usan 16 automóviles en un experimento
aleatorio. De la misma manera se eligen ocho para probarlos con gasolina regular, mientras que los otros ocho se
prueban con gasolina premium. Los resultados, en mi/galón, son los siguientes:
Regular: 29.1 27.1 30.8 17.3 27.6 16.3
28.4 30.2
Premium: 28.3 32.0 27.4 35.3 29.9 35.6
30.9 29.7
a) Bajo la hipótesis nula de que cada automóvil obtendrá el
mismo millaje con cualquier tipo de gasolina, ¿cuántos
resultados diferentes son posibles para este experimento?
– –
b) Sean R y P la media de los millajes de media de muestra para los grupos de gasolina regular y premium, res– –
pectivamente. Calcule R y P.
6.15
Uso de la simulación para realizar pruebas de hipótesis
c) Realice una prueba aleatoria para determinar si se puede concluir que la gasolina premium tiende a incremen–
–
tar el millaje. Utilice el estadístico de prueba P ⫺ R.
Genere al menos mil resultados aleatorios y calcule el
P-valor.
d) Utilice la prueba t de Student descrita en la sección 6.7
para probar la hipótesis nula de que la media del millaje utilizando gasolina regular es mayor que o igual a la
media del millaje utilizando gasolina premium. ¿Este
resultado es confiable? Explique
7. Para los datos de la cosecha de lechuga (p. 464) se supone
que las cosechas con el fertilizante tipo A podrían tener una
varianza mayor que la varianza con el B.
a) Calcule las varianzas muestrales sA2 y sB2 de las cosechas
atribuibles a A y B, respectivamente, y el cociente sA2 /sB2.
b) Alguien sugiere utilizar la prueba F para este problema
en la sección 6.11. ¿Ésta es una buena idea? ¿Por qué sí
o no?
c) Realice una prueba aleatoria de H0: sA2 ⱕ sB2 contra H1:
sA2 ⬎ sB2, utilizando el estadístico de prueba sA2 /sB2, y un
mínimo de mil resultados aleatorios.
(Sugerencia: Proceda de la misma manera que en el
ejemplo del texto, pero para cada resultado calcule sA2 ,
– – – –
sB2, y sA2 /sB2 en lugar de A, B, y B ⫺ A.)
8. Con referencia al ejercicio 6, realice una prueba aleatoria
para determinar si el millaje de gasolina regular tiene una
varianza mayor que la varianza del millaje utilizando gasolina premium. Genere al menos mil resultados aleatorios.
9. Se supone que cierto método de tratamiento de agua residual se aplica con el propósito de que la media de su pH sea
7. Se realizarán mediciones de pH en siete muestras de agua
residual tratada, y se hará una prueba de hipótesis H0: m ⫽
7 contra H1: m ⫽ 7 utilizando la prueba t de Student (sección 6.4). Suponga que la media verdadera es m ⫽ 6.5, las
mediciones de pH están normalmente distribuidas con media m y desviación estándar 0.5, y la prueba se efectúa a un
nivel de 5%.
469
10. Este ejercicio requiere de las ideas de la sección 2.6. En un
experimento de dos muestras, cuando cada elemento en una
muestra es apareado con un elemento en la otra, la prueba t
apareada (sección 6.8) se puede utilizar para probar hipótesis respecto de la diferencia entre dos medias poblacionales.
Si se desprecia el hecho de que los datos están apareados,
también se puede utilizar la prueba t de dos muestras (sección 6.7). La pregunta que surge es cuál prueba tiene la potencia mayor. El siguiente experimento de simulación se ha
diseñado para abordar esta pregunta.
Sea (Xl, Y1), . . . , (X8, Y8) una muestra aleatoria de ocho
pares, con X1, . . . , X8 extraídos de una población N(0, 1) y
Y1, . . . , Yn extraídos de una población N(1, 1). Se desea probar H0: mX ⫺ mY ⫽ 0 contra H1: mX ⫺ mY ⫽ 0. Observe que
mX ⫽ 0 y mY ⫽ 1, observe que las varianzas de población
son iguales, por lo que la diferencia verdadera entre las medias es 1. También observe que las varianzas poblacionales
son iguales. Si se hace una prueba a un nivel de significancia de 5%, ¿qué prueba tiene la mayor potencia?
Sea Di ⫽ Xi ⫺ Yi para i ⫽ 1, . . . , 10. El estadístico de
–
–
prueba para la prueba t apareada es D/(sD /8 ), donde sD representa la desviación estándar de los Di (véase la sección
6.8). Su distribución nula es la t de Student con siete grados
de libertad. Por tanto, la prueba t apareada rechazará H0 si
–
–
D/(sD /8 ) ⬎ t7, .025 ⫽ 2.365, por lo que la potencia es
–
–
P( D/(sD /8 ) ⬎ 2.365).
Para la prueba t de dos muestras cuando las varianzas
poblacionales
son iguales, el estadístico de prueba es
√
D/(sp 1/8 + 1/8) = D/(sp /2), donde sp constituye
la
desviación estándar combinada, que es igual en este caso
– –
a (sX2 + sY2 )/2. (Véase la p. 411. Observe que D ⫽ X ⫺
–
Y .) La distribución nula es la t de Student con 14 grados de
libertad. Por
√ tanto, la prueba t de dos muestras rechazará H0
si |D/(sp 1/8 + 1/8)| > t14,.025 = 2.145, y la potencia
√
es P (|D/(sp 1/8 + 1/8)| > 2.145).
La potencia de estas pruebas depende de la correlación
entre Xi y Yi.
–
a) Sean X1, . . . , X7 las mediciones de pH, sea que X denote su media, y sea que s denote la desviación estándar
muestral. ¿Para cuáles valores del estadístico de prueba
H0 será rechazada?
a) Genere diez mil muestras X*1i, . . . , X*8i de una población
N(0, 1) y diez mil muestras Y*1i, . . . , Y*8i de una población de N(1, 1). Las variables aleatorias X*ki y Y*ki son independientes en este experimento, por lo que su correlación es 0. Para cada muestra, calcule los estadísticos de
–
– –
prueba D*/(sD* /8 ) y D*/(sp*/2). Calcule la potencia de cada
prueba mediante la proporción de muestras para las cuales los estadísticos de prueba son mayores de su punto
crítico (2.365 para la prueba apareada, 2.145 para la prueba de dos muestras). ¿Qué prueba tiene mayor potencia?
b) Genere diez mil pruebas X*1, . . . , X*7 de la distribución
verdadera de las mediciones de pH. Para cada muestra,
calcule el estadístico de prueba y determine si H0 es rechazada. Calcule la potencia de la prueba.
b) Como en el inciso a), genere diez mil muestras X*1i, . . . ,
X*8i de una población N(0, 1). Esta vez, en lugar de generar los valores Y* de manera independiente, genérelos
para que la correlación entre X*ki y Y*ki sea 0.8. Esto últi-
470
CAPÍTULO 6
Pruebas de hipótesis
mo se puede hacer de la siguiente manera: genere diez
mil muestras Z*1i, . . . , Z*8i de una población N(0, 1), independientemente de los valores de X*. Después calcule Yki ⫽ 1 ⫹ 0.8 X*ki ⫹ 0.6 Z*ki. La muestra Y*1i, . . . , Y*8i
proviene de una población de N(1, 1), y la correlación
entre X*ki y Y*ki será de 0.8, lo que significa que valores
grandes de X*ki tienden a estar apareados con valores grandes de Y*ki, y viceversa. Calcule los estadísticos de prueba y estime la potencia de ambas pruebas, como en el
inciso a). ¿Qué prueba tiene una potencia mayor?
Ejercicios adicionales para el capítulo 6
Los ejercicios 1 a 4 describen experimentos que requieren una
prueba de hipótesis. Para cada experimento describa la prueba
adecuada. Establezca las hipótesis nula y alternativa adecuadas,
describa el estadístico de prueba y especifique qué tabla se debe utilizar para determinar el P-valor. Si es pertinente, establezca el número de grados de libertad para el estadístico de prueba.
1. Una flota de 100 taxis se divide en dos grupos de 50 automóviles cada una para averiguar si la gasolina premium reduce
gastos de mantenimiento. La gasolina sin plomo premium
se utiliza en el grupo A, mientras que la gasolina sin plomo
regular se emplea en el B. Se registra el costo total del mantenimiento para cada automóvil durante un año. Se usará la
gasolina premium si se demuestra que reduce gastos de mantenimiento.
2. Se elige un grupo de 15 nadadores para que participe en un
experimento con el fin de comprobar si un nuevo estilo de
respiración mejora su resistencia. Se mide que cada nadador
recupera su ritmo del pulso después de 20 minutos mediante el viejo estilo de respiración. Los nadadores practican el
nuevo estilo durante dos semanas, y luego miden el ritmo
del pulso después de 20 minutos con el nuevo estilo. Continuarán utilizando el nuevo estilo de respiración si se demuestra que reduce el tiempo de recuperación del pulso.
3. Se está probando un nuevo programa de control de calidad
para ver si reducirá la proporción de piezas enviadas defectuosas. Con el antiguo programa, la proporción de piezas
defectuosas era de 0.10. Se probarán 200 piezas que superaron la inspección bajo el nuevo programa, y se contará el
número de defectos. Se instrumentará el nuevo programa si
se muestra que la proporción de defectos es menor que 0.10.
4. Se está probando un nuevo material, que se usará en la fabricación de un conducto eléctrico, para determinar si reduce la varianza en la fuerza de compresión sobre el viejo
material. La fuerza de compresión se mide para una mues-
tra de 16 conductos del material viejo y una muestra de 20
del nuevo. Si se demuestra que la fuerza compresiva con el
material nuevo tiene una varianza menor, se usará el nuevo material.
5. Suponga que ha comprado una máquina de llenado para
bolsas de dulces que contendrá 16 oz de éstos. Suponga que
los pesos de las bolsas llenas están aproximadamente distribuidos en forma normal. Una muestra aleatoria de diez bolsas produce los siguientes datos (en oz):
15.87
16.04
16.02
15.81
15.78
15.92
15.83
16.10
15.69
15.81
Con base en estos datos, ¿puede concluir que la media del
peso llenado es, en realidad, menor que 16 oz?
a) Establezca las hipótesis nulas y alternativas adecuadas.
b) Calcule el valor del estadístico de prueba.
c) Determine el P-valor y establezca su conclusión.
6. ¿Las respuestas clave para pruebas de elección múltiple se
generan aleatoriamente, o se construyen para que sea menos
probable que ocurran dos veces consecutivas para la misma
respuesta? En el artículo “Seek Whence: Answer Sequences
and Their Consequences in Key-Balanced Multiple-Choice
Tests” (M. Bar-Hillel y Y. Attali, The American Statistician,
2002:299-303) se formuló tal pregunta. Se estudiaron 1 280
preguntas de diez verdaderas pruebas escolares (PE). Suponga que todas las preguntas tenían cinco opciones (en
efecto, 150 de ellas tenían sólo cuatro opciones). Encontraron que para 192 preguntas, la opción correcta (A, B, C, D
o E) era la misma que la elección correcta para la pregunta
anterior. Si las opciones fueran generadas aleatoriamente,
entonces la probabilidad de que una pregunta tuviera la misma opción correcta que la anterior sería de 0.20. ¿Puede
concluir que las elecciones para las PE no se pueden generar de manera aleatoria?
Ejercicios adicionales para el capítulo 6
a) Establezca las hipótesis nula y alternativa adecuadas.
b) Calcule el valor del estadístico de prueba.
c) Determine el P-valor y establezca su conclusión.
7. Un fabricante de automóviles desea comparar las duraciones de dos marcas de neumáticos. Obtiene muestras de seis
llantas de cada marca. En cada uno de seis automóviles instala un neumático de cada marca sobre cada rueda del frente. Los carros se conducen hasta que quede solamente 20%
de las huellas originales. Las distancias, en millas, para cada neumático se presentan en la tabla siguiente. ¿Puede
concluir que hay una diferencia entre la media de las duraciones de las dos marcas de neumáticos?
Automóvil
1
2
3
4
5
6
7
Marca 1
36 925
45 300
36 240
32 100
37 210
48 360
38 200
Marca 2
34 318
42 280
35 500
31 950
38 015
47 800
33 215
a) Establezca las hipótesis nula y alternativa adecuadas.
b) Calcule el valor del estadístico de prueba.
c) Determine el P-valor y establezca su conclusión.
8. Se tomaron 21 mediciones independientes de la dureza (en
la escala C de Rockwell) de metal de base de acero HSLA100, y se hicieron otras 21 mediciones independientes de la
dureza de una soldadura producida sobre este metal básico.
La desviación estándar de las mediciones hechas sobre el
metal básico era de 3.06, y la estándar de las mediciones hechas sobre la soldadura era de 1.41. Suponga que las mediciones son muestras aleatorias independientes de poblaciones
normales. ¿Puede concluir que las mediciones hechas sobre
el metal básico son más variables que las mediciones realizadas sobre la soldadura?
9. Existe la preocupación de que al aumentar la industrialización se incremente el contenido de minerales en el agua de
los ríos. Hace diez años, el contenido de silicio en el agua
de cierto río era de 5 mg/l. Recientemente se tomaron 85
muestras de agua del río que tienen una media de contenido de silicio de 5.6 mg/l y desviación estándar de 1.2 mg/l.
¿Puede concluir que el contenido de silicio del agua es mayor hoy que lo que era hace diez años?
10. El artículo “Modeling of Urban Area Stop-and-Go Traffic
Noise” (P. Pamanikabud y C. Tharasawatipipat, en Journal
471
of Transportation Engineering 1999:152-159) presenta las
mediciones del ruido de tránsito, en dBA, de diez lugares en
Bangkok, Tailandia. En la siguiente tabla se presentan mediciones, realizadas en cada lugar, tanto en carriles acelerados como desacelerados.
Lugar
1
2
3
4
5
6
7
8
9
10
Acelerados
78.1
78.1
79.6
81.0
78.7
78.1
78.6
78.5
78.4
79.6
Desacelerados
78.6
80.0
79.3
79.1
78.2
78.0
78.6
78.8
78.0
78.4
¿Puede concluir que hay una diferencia en la media de los niveles de ruido entre los carriles acelerados y desacelerados?
11. Una máquina se configura para producir válvulas cuyas longitudes tengan una media de 100 mm y desviación estándar
de 0.1 mm. La máquina se traslada a otra ubicación. Se pensaba que el cambio podría haber afectado la calibración para
la media de la longitud, pero que es improbable que cambie la
desviación estándar. Sea m la media de la longitud de válvulas producidas después del cambio. Para probar la calibración se rectifica una muestra de 100 válvulas, se medirán
sus longitudes, y se hará una prueba de las hipótesis H0: m ⫽
100 contra H1: m ⫽ 100.
a) Determine la región de rechazo si la prueba es hecha en
un nivel de 5%.
b) Determine la región de rechazo si la prueba es hecha en
un nivel de 10%.
c) Si la media muestral de longitudes es 99.97 mm, ¿H0 será rechazada a un nivel de 5%?
d ) Si la media muestral de longitudes es 100.01 mm, ¿H0
será rechazado a un nivel de 10%?
e) Un punto crítico es 100.015 mm. ¿Cuál es el nivel de la
prueba?
12. Se supone que se calibra un proceso de fabricación de hojas de vidrio con el propósito de que la media m de los espesores de las hojas sea de más de 4 mm. La desviación
estándar de los espesores de las hojas está bien aproximada
mediante s ⫽ 0.20 mm. Se medirán los espesores de cada
472
Pruebas de hipótesis
CAPÍTULO 6
hoja en una muestra, y se realizará una prueba de hipótesis
H0: m ⱕ 4 contra H1: m ⬎ 4. Suponga que, efectivamente,
la media verdadera del espesor es 4.04 mm.
baja de fallas. Utilice el ajuste de Bonferroni para determinar si puede concluir que la proporción de fallas de la población en la línea 3 es menor que 0.10.
a) Si se muestran 100 láminas, ¿cuál es la potencia de una
prueba hecha a un nivel de 5%?
Los ejercicios 16 y 17 muestran que los métodos de distribución libre pueden producir resultados engañosos cuando
sus suposiciones se incumplen seriamente.
b) ¿Cuántas láminas se deben probar con el propósito de que
una prueba al nivel de 5% tenga una potencia de 0.95?
c) Se prueban 100 láminas, ¿en qué nivel se debe hacer la
prueba con el propósito de que la potencia sea de 0.90?
–
d) Si se probaron 100 láminas, y la región de rechazo es X
ⱖ 4.02, ¿cuál es la potencia de la prueba?
13. Una máquina fabrica pernos que, se supone, son de tres pulgadas de longitud. A diario un ingeniero responsable del
control de calidad selecciona una muestra aleatoria de 50
pernos de la producción del día, mide sus longitudes y realiza una prueba de hipótesis de H0: m ⫽ 3 contra H0: m ⫽ 3,
donde m significa la media de la longitud de todos los pernos fabricados ese día. Suponga que la desviación estándar
poblacional para las longitudes de los pernos es de 0.1 pulg.
Si H0 es rechazada a un nivel de 5%, la máquina se detendrá y se recalibrará.
a) Suponga que en un día específico, la media verdadera de
la longitud de pernos es 3 pulg. ¿Cuál es la probabilidad
de que la máquina se detenga? (Esto último se llama tasa de falsa alarma.)
b) Si la media verdadera de la longitud de los pernos en un
día determinado es 3.01 pulgadas, determine la probabilidad de que el equipo será recalibrado.
14. Se montan motores eléctricos sobre cuatro diferentes líneas
de producción. Se toman muestras aleatorias de los motores de
cada línea y se inspeccionan. Los grupos que pasan y que reprueban la inspección se cuentan en cada línea, con los siguientes resultados:
Línea
1
Pasa
482
Reprueba 57
2
3
4
467
59
458
37
404
47
¿Puede concluir que la tasa de reprobación es diferente entre las cuatro líneas?
15. Con referencia al ejercicio 14, la ingeniera de proceso observa que la muestra de la línea 3 tiene la proporción más
16. Considere las siguientes dos muestras:
X:
0
2
3
4 10 20 40 100 1 000
Y: ⫺738 162 222 242 252 258 259 260 262
a) Muestre que ambas muestras tienen la misma media y
varianza.
b) Utilice la prueba de la suma del rango de Wilcoxon para probar la hipótesis de que las medias poblacionales
son iguales, ¿qué concluye?
c) ¿Parece que las suposiciones de la prueba de la suma del
rango se satisfacen? Explique por qué sí o no.
17. A veces se piensa en la prueba de la suma del rango como
una prueba para las medianas de población. Bajo las suposiciones de igual extensión y forma, las medias de las dos
poblaciones son diferentes si y sólo si las medianas son diferentes; por tanto, probar la igualdad de medias poblacionales son también pruebas para la igualdad de las medianas
poblacionales. Este ejercicio muestra que cuando estas suposiciones se incumplen seriamente la prueba de la suma
del rango puede dar resultados falsos con respecto a la
igualdad de las medianas poblacionales. Considere las siguientes dos muestras:
X:
1
20
2
40
3
50
4
60
5
70
6
80
7
90
100
Y:
⫺10
20
⫺9
21
⫺8
22
⫺7
23
⫺6
24
⫺5
25
⫺4
26
27
a) Compruebe que ambas muestras tienen la misma mediana.
b) Calcule el P-valor para una prueba de la suma del rango
de dos colas. Si P-valores pequeños proporcionan evidencia contra la hipótesis nula de que las medianas poblacionales son iguales, ¿concluiría que las medianas
poblacionales son diferentes?
c) ¿Las suposiciones de la prueba de la suma del rango parecen satisfacerse? Explique por qué sí o no.
18. Se está considerando un nuevo proceso de producción para
la fabricación de cojinetes de acero inoxidables. Mediciones de los diámetros de muestras aleatorias de cojinetes de
viejos y nuevos procesos produjeron los siguientes datos:
473
Ejercicios adicionales para el capítulo 6
Viejo:
16.3
15.7
15.8
15.9
15.8
15.7
15.8
15.9
15.8
16.2
16.1
15.7
16.1
16.3
16.0
16.1
Nuevo:
15.9
15.8
15.8
16.2
16.0
15.8
16.0
16.2
16.2
15.8
15.9
16.3
16.1
15.7
16.1
16.2
b) Si la media poblacional es 1.6 ppmm y la desviación estándar poblacional es 0.33 ppmm, ¿cuál es la probabilidad de que la hipótesis nula H0: m ⱕ 1.50 sea rechazada
a un nivel de 5%, si el tamaño de muestra es 80?
a) ¿Puede concluir que en un nivel de 5% que un proceso
produce una media de los tamaños de los cojinetes diferente de la otra?
b) ¿Puede concluir que en un nivel de 5% la varianza del
nuevo procedimiento es menor que con el procedimiento antiguo?
19. Se consideran dos formulaciones químicas diferentes de
combustible de cohete para el empuje pico que se proporciona a un diseño particular de un motor de cohete. Los cocientes empuje/peso (en kilogramos fuerza por gramo) para cada
uno de los dos combustibles se miden varias veces. Los resultados son los siguientes:
Combustible A:
Combustible B:
54.3
56.8
55.5
52.9
55.9
51.3
57.9
57.9
51.8
58.2
56.8
53.3
53.4
58.4
51.4
52.9
55.1
52.4
48.4
55.5
54.4
48.3
53.1
54.1
55.5
50.5
55.6
54.7
49.7
56.1
50.1
54.8
a) Suponga que la planta de procesamiento de combustible
está configurada para producir combustible B y los costos de cambio son altos. Debido a que el aumento del
cociente empuje/peso para el combustible cohete es benéfico, ¿cómo se deben establecer las hipótesis nula y
alternativa para una prueba útil para la decisión de cambiar al combustible A?
b) ¿Puede concluir a un nivel de 5% que se debe cambiar
al combustible A?
20. Suponga que la Agencia de Protección al Ambiente está en
el proceso de dar seguimiento a la calidad del agua, en un
estuario grande en el este de Estados Unidos, con la finalidad de medir la concentración de PCB (en partes por miles
de millones).
a) Suponga que una muestra aleatoria de tamaño 80 tiene
una media muestral de 1.59 ppmm y una desviación estándar muestral de 0.25 ppmm. Pruebe la hipótesis, a un
nivel de 5%, de que la media de la concentración de
PCB en el estuario es menor o igual a 1.50 ppmm contra la alternativa que es mayor. ¿H0 se rechaza?
c) Si la media de población es 1.6 ppmm, y la desviación
estándar poblacional, 0.33 ppmm, ¿qué tamaño muestral
es necesario con el propósito de que la probabilidad de
0.99 de que H0: m ⱕ 1.50 sea rechazada a un nivel de 5%?
21. Dos máquinas se utilizan para empacar detergente de lavandería. Se sabe que los pesos de las cajas están normalmente distribuidos. Cuatro cajas de cada máquina tienen sus
contenidos cuidadosamente pesados, con los siguientes resultados (en gramos):
Máquina 1:
1 752
1 757
1 751
1 754
Máquina 2:
1 756
1 750
1 752
1 746
Un ingeniero desea para probar la hipótesis nula de que las
medias de los pesos de las cajas de las dos máquinas son iguales. Decide suponer que las varianzas poblacionales son iguales,
el razonamiento es el siguiente:
Las varianzas muestrales son s 21 ⫽ 7.00 para la máquina
número 1 y s 22 ⫽ 17.33 para la máquina número 2. El estadístico F para probar la igualdad de las varianzas poblacionales es F3.3 ⫽ s 22 / s 21 ⫽ 2.48. El punto 10%
superior de la distribución F3,3 es 5.39. Debido a que la
hipótesis nula especifica que las varianzas son iguales, I
determina que el P-valor es mayor que 2(0.10) ⫽ 0.20.
Por tanto, I no rechaza la hipótesis nula, y I concluye
que las varianzas son iguales.
a) ¿La prueba F se ha hecho correctamente?
b) ¿La conclusión está justificada? Explique.
22. El artículo “Valuing Watershed Quality Improvements
Using Conjoint Analysis” (S. Farber y B. Griner, en Ecological Economics, 2000:63-76) presenta los resultados de
una encuesta de correo diseñada para evaluar opiniones
acerca del valor de los esfuerzos para mejorar en una línea
divisoria degradada de mina de ácido en el occidente de
Pensilvania. De 510 personas encuestadas, 347 era hombres. Los datos del censo muestran que 48% de la población
objetivo son hombres. ¿Puede concluir que el método de la
encuesta empleado en este estudio tiende a sobremuestrear
a los hombres? Explique.
23. Los antropólogos pueden calcular la tasa de natalidad de
una antigua civilización estudiando la distribución de edad
de los esqueletos encontrados en cementerios. Los números
474
CAPÍTULO 6
Pruebas de hipótesis
de esqueletos descubiertos en dos de esos sitios, como informa el artículo “Paleoanthropological Traces of a Neolithic
Demographic Transition” (J. Bocquet-Appel, en Current
Anthropology, 2002:637-650), se muestran en la tabla siguiente:
Edad de los esqueletos
Sitio
Casa de Moura
Wandersleben
0–4
años
5–19
años
20 años
o más
27
38
61
60
126
118
estados federales indios: Haryana, Bihar y Uttar Pradesh.
La calidad de bosque en Haryana está un poco degradada,
en Bihar está muy degradada y en Uttar Pradesh está bien
conservada. Con el fin de estudiar la relación entre los niveles educacionales y las actitudes hacia la adminstración del
bosque, se examinaron muestras aleatorias de adultos en cada uno de estos estados federales y se investigaron sus niveles de educación. Se registraron los números de adultos en
cada uno de algunos niveles educativos. Los datos se presentan en la siguiente tabla.
Años de educación
Estado
¿Estos datos dan evidencias convincentes de que las distribuciones de edad son diferentes entre los dos sitios?
24. La deforestación es un problema serio en gran parte de India. El artículo “Factors Influencing People’s Participation
in Forest Management in India” (W. Lise, en Ecological
Economics, 2000:379-392) analiza las fuerzas sociales que
influyen en la dirección de las políticas del bosque en tres
0 1–4 5–6 7–9 10–11 12 o
más
Haryana
48 6
Bihar
34 24
Uttar Pradesh 20 9
16
7
25
26
32
30
24
16
17
7
10
34
¿Puede concluir que los niveles educativos son diferentes
entre los tres estados? Explique.
Capítulo
7
Correlación
y regresión lineal
simple
Introducción
Con frecuencia, científicos e ingenieros reúnen datos con el propósito de determinar la naturaleza de la relación entre dos cantidades. Por ejemplo, un ingeniero químico puede realizar
varias veces un proceso químico para estudiar la relación entre la concentración de cierto catalizador y la producción del proceso. Cada vez que realiza éste, registra la concentración x y
la producción y. Por consiguiente, el experimento genera datos bivariados; un conjunto de
pares ordenados (x1, y1), . . . , (xn, yn). En muchos casos, al graficar los pares ordenados que
se generan en un experimento científico se encontrarán, aproximadamente, a lo largo de una
línea recta. En estos casos, los datos son útiles para calcular la ecuación de una recta. Aquélla se puede utilizar con muchos propósitos; por ejemplo, el catalizador contra la producción
del experimento que se acaba de describir, esto podría ser útil para pronosticar la producción y,
que se obtendrá la próxima vez que se opere el proceso con una concentración específica de
un catalizador x.
Los métodos de correlación y la regresión lineal simple constituyen el tema de este capítulo; ambos se utilizan para: analizar datos bivariados con la finalidad de determinar si un
ajuste lineal es adecuado, calcular la ecuación de la recta si es adecuado, y usar esta ecuación
con el fin de hacer inferencias respecto de la relación entre ambas cantidades.
7.1
Correlación
Una de las primeras aplicaciones de la estadística consistió en estudiar la variación de las características físicas en poblaciones humanas. Con ese fin, los estadígrafos crearon una cantidad llamada coeficiente de correlación como forma de describir la relación tan cercana entre
475
CAPÍTULO 7
Correlación y regresión lineal simple
dos características físicas. El primer coeficiente de correlación publicado fue producto del trabajo de sir Francis Galton, quien, en 1888, midió la estatura y longitud del antebrazo, respectivamente, de 348 hombres adultos. (En realidad, midió la distancia del codo a la punta del
dedo cordial, lo que se conocía como un cúbito.) Si se denota la estatura del i-ésimo hombre
mediante xi, y la longitud de su antebrazo como yi, entonces los datos de Galton consistían de
348 pares ordenados (xi, yi). La figura 7.1 presenta una recreación simulada de estos datos,
con base en una tabla que construyó Galton.
21
Longitud del antebrazo (pulg)
476
20
19
18
17
16
15
60
62
64
66
68
Estatura (pulg)
70
72
74
FIGURA 7.1 Estatura y longitud de los antebrazos de 348 hombres.
Los puntos tienden a inclinarse hacia arriba y a la derecha, lo que indica que los hombres más altos tienden a tener antebrazos más largos. Se dice que hay una asociación positiva entre la estatura y la longitud del antebrazo. La pendiente es casi constante en toda la
gráfica, esto indica que los puntos están agrupados alrededor de una línea recta. La línea sobrepuesta sobre la gráfica representa una recta especial conocida como recta de mínimos cuadrados. Ésta es la que ajusta mejor tales datos, en el sentido que se describirá en la sección
7.2. También ahí se aprenderá cómo calcular la recta de mínimos cuadrados.
La figura 7.2 presenta los resultados de un estudio de la relación entre la media de la
temperatura diaria y la media de la humedad diaria en un lugar cerca de Riverside, California, durante el reciente invierno. Nuevamente los puntos están agrupados alrededor de la recta de mínimos cuadrados. Esta última tiene una pendiente negativa, ello indica que los días
con mayor humedad tienden a tener temperaturas más bajas.
El grado en que los puntos en un diagrama similar tienden a agruparse alrededor de una
recta refleja la fuerza de la relación lineal entre x y y. La impresión visual de una gráfica de
puntos puede ser engañosa respecto de lo anterior, debido al cambio de escala de los ejes, lo
que puede hacer que el agrupamiento parezca más junto o más disperso. En consecuencia, se
define el coeficiente de correlación, que es una medida numérica de la fuerza de la relación
lineal entre dos variables. Este coeficiente se denota con la literal r.
Sean (x1, y1), . . . , (xn, yn) los n puntos del diagrama de dispersión. Para calcular la correlación, primero se deducen las medias y las desviaciones estándar de las x y de las y, que
se representan mediante x–, y–, sx y sy. Después se convierte cada x y cada y a las unidades estándar; en otras palabras, se calculan los puntajes z: (xi – x–)/sx, (yi – y–)/sy. El coeficiente de co-
7.1
Correlación
477
22
Temperatura (⬚C)
20
18
16
14
12
10
8
15
20
25
30
35
40 45 50
Humedad (%)
55
60
65
70
FIGURA 7.2 Humedad (en %) y temperatura (en °C) para los días de un invierno reciente en Riverside,
California.
rrelación representa el promedio de los productos de los puntajes z, excepto que se divide entre n – 1 en lugar de n:
n
1 xi − x
yi − y
r=
(7.1)
n − 1 i=1
sx
sy
Se
puede reescribir la ecuación 7.1 en
una forma que a veces es útil. Al sustituir sx con
n
n
2
2
i=1 (yi − y) /(n − 1) , se obtiene
i=1 (xi − x) /(n − 1) y a sy con
n
i=1 (xi
− x)(yi − y)
n
2
2
i=1 (xi − x)
i=1 (yi − y)
r = n
(7.2)
En principio, el coeficiente de correlación se puede calcular para cualquier conjunto de
puntos. Éstos, en muchos casos, constituyen una muestra aleatoria de una población de puntos. En dichos casos el coeficiente de correlación con frecuencia se llama correlación muestral, y es una estimación de la correlación poblacional. (En la sección 2.6 se analizaron
formalmente correlaciones poblacionales; en forma intuitiva, se supone que la población
consta de un gran número finito de puntos; en esta tesitura, la correlación poblacional significa la cantidad que se calcula mediante la ecuación 7.2 en toda una población, con las medias muestrales sustituidas por las medias poblacionales.) La correlación muestral es útil en
la construcción de intervalos de confianza y la realización de pruebas de hipótesis acerca de la
correlación poblacional; éstas se tratarán después en esta sección. Se puntualiza que el coeficiente de correlación también se puede utilizar para medir la fuerza de una relación lineal en
muchos casos donde los puntos no son una muestra aleatoria de una población; en la sección
7.2 se observa el análisis del coeficiente de determinación.
Es un hecho matemático que el coeficiente de correlación se encuentra siempre entre
⫺1 y l. Valores positivos del coeficiente de correlación indican que la recta de mínimos cuadrados tiene pendiente positiva, ello significa que valores mayores de una variable están asociados con valores mayores que los demás. Por el contrario, valores negativos del coeficiente
478
CAPÍTULO 7
Correlación y regresión lineal simple
de correlación indican que la recta de mínimos cuadrados tiene pendiente negativa, lo anterior muestra que valores mayores de una variable están relacionados con valores menores que
los demás. En este contexto, valores del coeficiente de correlación cercanos a l o a ⫺1 indican fuerte relación lineal; asimismo, valores cercanos a 0 indican débil relación lineal. El coeficiente de correlación es igual a 1 (o a ⫺1) sólo cuando los puntos en el diagrama de
dispersión están exactamente sobre una recta de pendiente positiva (o negativa); en otras palabras, cuando hay una relación lineal perfecta. Como nota técnica, tenemos que si los puntos se hallan exactamente sobre una recta horizontal o vertical, el coeficiente de correlación
está indeterminado, ya que una de las desviaciones estándar es igual a cero. Por último, un
poco de terminología: siempre que r ⫽ 0, se dice que x y y están correlacionados. Si r ⫽ 0,
se dice que x y y no están correlacionados.
La correlación entre estatura y longitud del antebrazo, en la figura 7.1, es 0.80. La que
corresponde a temperatura y humedad en la figura 7.2 es ⫺0.46. Las figuras 7.3 y 7.4 de las
páginas 479 y 480 muestran algunos ejemplos de gráficas de dispersión con diferentes correlaciones. En cada gráfica tanto x como y tienen media 0, y desviación estándar 1. Todas las
gráficas están dibujadas en la misma escala.
Cómo funciona el coeficiente de correlación
¿Por qué la fórmula (ecuación 7.1) para el coeficiente de correlación r mide la fuerza de asociación lineal entre dos variables? La figura 7.5 de la página 481 muestra cómo funciona el
coeficiente de correlación. En este diagrama de puntos, el origen está colocado en el punto de
los promedios (x–, y–). Por tanto, en el primer cuadrante, los puntajes z (xi ⫺ x–)/sx y (yi ⫺ y–)/sy
son positivos, por lo que su producto también lo es. Por consiguiente, cada punto en el primer
cuadrante aporta una cantidad positiva a la suma de la ecuación (7.1). En el segundo cuadrante los puntajes z para las coordenadas x de los puntos son negativos, mientras que los z para
las coordenadas y, positivos. En consecuencia, los productos de los puntajes z son negativos,
por lo que cada punto en el segundo cuadrante aporta una cantidad negativa a la suma de la
ecuación (7.1). De forma semejante, los puntos en el tercer cuadrante aportan cantidades positivas, y los del cuarto cuadrante, cantidades negativas. Evidentemente, en la figura 7.5 hay
más puntos en el primero y tercer cuadrantes que en el segundo y cuarto, así la correlación
será positiva. Si la gráfica tuviera una pendiente negativa, habría más puntos en el segundo y
cuarto cuadrantes, y el coeficiente de correlación sería negativo.
El coeficiente de correlación es un número puro
En cualquier muestra x1, . . . , xn, la media x– y la desviación estándar sx tienen las mismas unidades que x1, . . . , xn. Por esta razón los puntajes z (xi ⫺ x–)兾sx son números puros. Puesto que
el coeficiente de correlación r constituye el promedio de productos de puntajes z, también es un
número puro, sin unidades. Este hecho es crucial para la utilidad de r. Por ejemplo, las unidades para las coordenadas x y y en la figura 7.1 son para ambas pulgadas, mientras que las unidades correspondientes en la figura 7.2 son porcentajes y grados Celsius. Si los coeficientes de
correlación para las dos gráficas tuvieran unidades diferentes, sería imposible comparar sus valores para determinar la gráfica que presenta la relación lineal más fuerte. Pero debido a que los
coeficientes de correlación son números puros, son directamente comparables; se concluye que
la relación entre la estatura de los hombres y la longitud de su antebrazo en la figura 7.1 es linealmente más fuerte que la relación entre la temperatura y la humedad de la figura 7.2.
7.1
El coeficiente de correlación es 0.00
El coeficiente de correlación es 0.30
3
3
2
2
1
1
0
0
⫺1
⫺1
⫺2
⫺2
⫺3
⫺3
⫺3
⫺2
⫺1
0
1
2
3
⫺3
El coeficiente de correlación es 0.50
3
2
2
1
1
0
0
⫺1
⫺1
⫺2
⫺2
⫺3
⫺3
⫺2
⫺1
0
1
2
3
⫺3
3
3
2
2
1
1
0
0
⫺1
⫺1
⫺2
⫺2
⫺3
⫺3
⫺2
⫺1
0
1
2
⫺1
0
1
2
3
⫺2
⫺1
0
1
2
3
El coeficiente de correlación es 0.95
El coeficiente de correlación es 0.90
⫺3
⫺2
El coeficiente de correlación es 0.70
3
⫺3
479
Correlación
3
⫺3
⫺2
⫺1
0
FIGURA 7.3 Ejemplos de diferentes niveles de correlación positiva.
1
2
3
480
Correlación y regresión lineal simple
CAPÍTULO 7
El coeficiente de correlación es ⫺0.20
El coeficiente de correlación es ⫺0.40
3
3
2
2
1
1
0
0
⫺1
⫺1
⫺2
⫺2
⫺3
⫺3
⫺3
⫺2
⫺1
0
1
2
3
⫺3
El coeficiente de correlación es ⫺0.60
3
2
2
1
1
0
0
⫺1
⫺1
⫺2
⫺2
⫺3
⫺3
⫺2
⫺1
0
1
2
3
⫺3
El coeficiente de correlación es ⫺0.95
3
2
2
1
1
0
0
⫺1
⫺1
⫺2
⫺2
⫺3
⫺3
⫺2
⫺1
0
1
2
0
1
2
3
⫺2
⫺1
0
1
2
3
El coeficiente de correlación es ⫺0.99
3
⫺3
⫺1
El coeficiente de correlación es ⫺0.80
3
⫺3
⫺2
3
⫺3
⫺2
⫺1
0
FIGURA 7.4 Ejemplos de diferentes niveles de correlación negativa.
1
2
3
7.1
Correlación
el puntaje z para x es ⫺
el puntaje z para y es ⫹
El producto es ⫺
el puntaje z para x es ⫹
el puntaje z para y es ⫹
El producto es ⫹
el puntaje z para x es ⫺
el puntaje z para y es ⫺
El producto es ⫹
el puntaje z para x es ⫹
el puntaje z para y es ⫺
El producto es ⫺
481
FIGURA 7.5 Cómo funciona el coeficiente de correlación.
Otra importante propiedad del coeficiente de correlación es que no lo afectan las unidades con las que se hacen las mediciones. Por ejemplo, imagine que en la figura 7.1 las estaturas de los hombres se midieron en centímetros en lugar de pulgadas. Entonces cada xi
estaría multiplicada por 2.54. Pero esto ocasionaría que x– y sx también estén multiplicadas por
2.54, por lo que los puntajes z (xi ⫺ x–)兾sx permanecerían constantes, por lo que r permanece
igual. En un ejemplo más extravagante, imagine que cada hombre estaba sobre una plataforma de dos pulgadas mientras se medía su estatura. Esto aumentaría cada xi en 2, pero el de
valor de x– también habría aumentado en 2. Por tanto, los puntajes z no cambiarían, y el coeficiente de correlación también permanecería constante. Por último, imagine que se intercambian los valores de x y y, usando a x para denotar las longitudes de antebrazo, y que y denote
las estaturas. Dado que el coeficiente de correlación se determina mediante el producto de los
puntajes z, no importa cuál variable se representaba por medio de x y cuál por y.
Resumen
El coeficiente de correlación permanece constante en cada una de las siguientes
operaciones:
Multiplicar cada valor de una variable por una constante positiva.
Sumar una constante a cada valor de una variable.
Intercambiar los valores de x y y.
La figura 7.6 de la página 482 presenta gráficas de las medias de temperatura durante
abril y octubre para varias ciudades de Estados Unidos. Ya sea que las temperaturas se midan
en °C o en °F, la correlación es la misma. Esto último se debe a que convertir de °C a °F implica multiplicar por 1.8 y sumar 32.
25
70
60
50
40
40
50
60
70
Temperatura de abril (⬚F)
80
20
15
10
5
0
40
50
60
70
Temperatura de abril (⬚F)
80
Temperatura de octubre (⬚F)
80
Correlación y regresión lineal simple
80
Temperatura de octubre (⬚C)
Temperatura de octubre (⬚F)
CAPÍTULO 7
Temperatura de octubre (⬚C)
482
25
70
60
50
40
0
5
10
15
20
Temperatura de abril (⬚C)
25
0
5
10
15
20
Temperatura de abril (⬚C)
25
20
15
10
5
0
FIGURA 7.6 Medias de las temperaturas de abril y octubre para algunas ciudades de
Estados Unidos. El coeficiente de correlación es 0.96 para cada figura; no importan las
unidades elegidas.
El coeficiente de correlación mide sólo la asociación lineal
Un objeto se dispara hacia arriba desde el suelo con una velocidad inicial de 64 pies/s. Para
cada uno de los tiempos x1, . . . , xn se miden las alturas y1, . . . , yn desde la superficie de la
tierra. En ausencia de fricción, y suponiendo que no hay error de medición, el diagrama de
dispersión de los puntos (x1, y1), . . . , (xn, yn) se parecerá a la figura 7.7. Obviamente existe
una fuerte relación entre x y y; en efecto, el valor de y se determina mediante x a través de la
función y ⫽ 64x ⫺ 16x2. Todavía la correlación entre x y y es igual a 0. ¿Algo está equivocado? No. El valor de 0 para la correlación indica que no hay ninguna relación lineal entre x y
y, lo que es verdadero. La relación es puramente cuadrática. La lección de este ejemplo es
que el coeficiente de correlación se debe utilizar sólo cuando la relación entre x y y es lineal.
De otra manera los resultados pueden ser engañosos.
Datos atípicos
En la figura 7.8 el punto (0, 3) es un dato atípico porque está apartado del cuerpo principal de
datos. La correlación para este diagrama de dispersión es r ⫽ 0.26, lo que indica una relación
lineal débil. Aun así, diez de los 11 puntos tienen una relación lineal perfecta. Los datos atípicos pueden distorsionar el coeficiente de correlación enormemente, en especial con conjuntos pequeños de datos, y presentan un serio problema para los analistas de datos. Algunos
datos atípicos los ocasionan errores en el registro de datos o fallas en la secuencia del protocolo experimental. Estos datos atípicos se pueden corregir o eliminar adecuadamente. A veces las personas eliminan los datos atípicos de una gráfica sin justificación, para darle una
Correlación
7.1
483
70
60
Altura (pies)
50
40
30
20
10
0
0
1
2
Tiempo (s)
3
4
FIGURA 7.7 La relación entre la altura de un objeto en caída libre con una velocidad positiva inicial y el tiempo de caída libre es cuadrático. La correlación es igual a 0.
apariencia más agradable. Esto no es adecuado, ya que es resultado de una subestimación de
la variabilidad del proceso que generó los datos. Interpretar los datos que contienen datos atípicos puede ser difícil, porque hay pocas reglas fáciles de seguir.
3
2.5
2
1.5
1
0.5
0
0
0.5
1
1.5
2
FIGURA 7.8 La correlación es 0.26. Debido a los datos atípicos el coeficiente de correlación es engañoso.
La correlación no es causalidad
En los niños, lo extenso de su vocabulario está fuertemente correlacionado con el tamaño de
su zapato. Sin embargo, aprender nuevas palabras no ocasiona que sus pies crezcan, como
tampoco pies en crecimiento significa que su vocabulario aumente. Hay un tercer factor, en
concreto la edad, que está correlacionada tanto con el tamaño del zapato como con el voca-
484
CAPÍTULO 7
Correlación y regresión lineal simple
bulario. Niños de mayor edad tienden a tener tanto mayor tamaño de zapato como vocabularios más extensos, y esto último propicia una correlación positiva entre el vocabulario y el tamaño del zapato. Este fenómeno se conoce como confusión. La confusión ocurre cuando hay
una tercera variable correlacionada con las dos variables de interés, lo que da como resultado
una correlación entre ambas.
Repitiendo este ejemplo con más detalle: las personas con mayor edad tienden a tener
un tamaño de zapato más grande. Las personas de mayor edad también tienden a tener vocabularios más extensos. Se tiene que personas con tamaño de zapato más grande tenderán a tener vocabularios más variados. En otras palabras, dado que tanto el tamaño de zapato como
el vocabulario están correlacionados con la edad, su correlación es positiva.
En este ejemplo la confusión se descubrió con facilidad. En muchos casos no es tan fácil. El ejemplo muestra que el solo hecho de que dos variables estén correlacionadas entre sí
no permite suponer que el cambio en una tenderá a ocasionar un cambio en la otra. Antes de
que se concluya que las dos variables tienen una relación causal se debe descartar la posibilidad de confusión.
A veces se puede utilizar la regresión múltiple (véase el capítulo 8) para detectar confusión. Algunas veces los experimentos se pueden diseñar para reducir la posibilidad de confusión. El tema del diseño experimental (véase el capítulo 9) está muy relacionado con este
tema. He aquí un ejemplo simple.
Ejemplo
7.1
Una científica ecologista estudia la tasa de absorción de cierto compuesto químico sobre la
piel. Coloca volúmenes diferentes del compuesto químico sobre diferente segmentos de piel
y permite que ésta permanezca en contacto con el compuesto químico durante diferentes lapsos. Ella entonces mide el volumen del compuesto químico absorbido en cada segmento de
piel. Obtiene los resultados que se muestran en la tabla siguiente.
Volumen (mL)
Tiempo (h)
Porcentaje absorbido
0.05
0.05
0.05
2.00
2.00
2.00
5.00
5.00
5.00
2
2
2
10
10
10
24
24
24
48.3
51.0
54.7
63.2
67.8
66.2
83.6
85.1
87.8
La científica grafica el porcentaje absorbido contra el volumen y el tiempo, como se
muestra en la siguiente figura. Calcula la correlación entre el volumen y la absorción y obtiene r ⫽ 0.988. Concluye que aumentar el volumen del compuesto químico ocasiona el incremento de los porcentajes de absorción. Después calcula la correlación entre el tiempo y la
absorción, por lo que obtiene r ⫽ 0.987. Concluye que al aumentar el tiempo que la piel está en contacto con el compuesto químico ocasiona también que los porcentajes de absorción
aumenten. ¿Estas conclusiones están justificadas?
90
90
80
80
Porcentaje absorbido
Porcentaje absorbido
7.1
70
60
50
40
0
1
2
3
Volumen (mL)
4
5
485
Correlación
70
60
50
40
0
5
10
15
Tiempo (h)
20
25
Solución
No. La científica debe observar la gráfica tiempo contra volumen que se presenta en la siguiente figura. La correlación entre el tiempo y el volumen es r ⫽ 0.999, por lo que estas dos
variables están casi completamente confundidas. Si el tiempo o el volumen afecta los porcentajes de absorción, pareciese que ambos lo hacen porque están muy correlacionados entre sí.
En consecuencia, es imposible determinar si es el tiempo o el volumen el que está teniendo
un efecto. Esta relación entre tiempo y volumen resulta del diseño experimental y se debió
haber evitado.
25
Tiempo (h)
20
15
10
5
0
Ejemplo
7.2
0
1
2
3
Volumen (ml)
4
5
La científica del ejemplo 7.1 ha repetido el experimento, esta vez con un nuevo diseño. Los
resultados se presentan en la tabla siguiente.
Correlación y regresión lineal simple
CAPÍTULO 7
Volumen (mL)
Tiempo (h)
Porcentaje absorbido
0.05
0.05
0.05
2.00
2.00
2.00
5.00
5.00
5.00
2
10
24
2
10
24
2
10
24
49.2
51.0
84.3
54.1
68.7
87.2
47.7
65.1
88.4
La científica grafica el porcentaje absorbido tanto contra el volumen como contra el
tiempo, como se muestra en la siguiente figura.
100
100
90
90
Porcentaje absorbido
Porcentaje absorbido
486
80
70
60
50
40
0
1
2
3
4
Volumen (ml)
5
80
70
60
50
40
0
5
10
15
Tiempo (h)
20
25
Después calcula la correlación entre el volumen y la absorción y obtiene r ⫽ 0.121. Concluye que aumentar el volumen del compuesto químico tiene poco o ningún efecto en los porcentajes de absorción. Después calcula la correlación entre el tiempo y la absorción y obtiene
r ⫽ 0.952. Determina que al aumentar el tiempo que el compuesto químico está en contacto
con la piel causará que los porcentajes de absorción aumenten. ¿Estas conclusiones están justificadas?
Solución
Estas conclusiones están mucho mejor justificadas que las del ejemplo 7.1. Se verá por qué.
Observe la gráfica de tiempo contra volumen de la siguiente figura. Este experimento ha sido
diseñado con el propósito de que el tiempo y el volumen no estén correlacionados. Ahora parece que el tiempo, pero no el volumen, tiene efecto en los porcentajes de absorción. Antes de
establecer la conclusión final de que el aumento del tiempo realmente ocasiona que el porcentaje absorbido aumente, la científica debe asegurarse de que no haya algunas otras confusiones
potenciales por ahí. Por ejemplo, si la temperatura ambiental varió con cada reproducción del
experimento, y si estaba muy correlacionada con el tiempo, entonces podría darse el caso de
que la temperatura, más que el tiempo, estaba ocasionando la variación de los porcentajes
de absorción.
7.1
487
Correlación
25
Tiempo (h)
20
15
10
5
0
0
1
2
3
Volumen (ml)
4
5
Inferencia sobre la correlación poblacional
En lo que resta de esta sección se utilizarán algunas ideas de la sección 2.6. Cuando los puntos (xi, yi) son una muestra aleatoria de una población de pares ordenados, entonces cada punto se puede considerar como observación de un par ordenado de variables aleatorias (X, Y). El
coeficiente de correlación, o correlación muestral, r es entonces una estimación de la correlación poblacional, rX,Y.
Si las variables aleatorias X y Y tienen cierta distribución conjunta llamada distribución
normal bivariada, entonces la correlación muestral r se puede utilizar para construir intervalos de confianza y realizar pruebas de hipótesis sobre la correlación poblacional. En la práctica, si X y Y están distribuidas normalmente, entonces hay una certeza virtual de que tanto X
como Y tengan una distribución normal bivariada, por lo que los intervalos de confianza y las
pruebas descritas después serán válidas. (Mientras que es matemáticamente posible construir
dos variables aleatorias normales que no una normal bivariada de manera conjunta, las condiciones en las que esto último ocurre no son visibles en la práctica.)
Los intervalos de confianza, y la mayoría de las pruebas, sobre rX,Y están basados en el
resultado siguiente:
Sean X y Y variables aleatorias con distribución normal bivariada.
Sea r la correlación de población entre X y Y.
Sea (x1, y1), . . . , (xn, yn) una muestra aleatoria de la distribución conjunta de X y Y.
Sea r la correlación muestral de los n puntos.
Entonces la cantidad
1
1⫹r
ln
2
1⫺r
está casi normalmente distribuida, con la media dada por
W=
mW =
y varianza dada por
(7.3)
1
ln 1 ⫹ r
2
1⫺r
(7.4)
1
n⫺3
(7.5)
s2W =
488
CAPÍTULO 7
Correlación y regresión lineal simple
Observe que mW es una función de la correlación poblacional ρ. La construcción de intervalos de confianza requerirá despejar ρ de la ecuación (7.4). Se obtiene
r⫽
Ejemplo
7.3
e2mW ⫺ 1
e2mW ⫹ 1
(7.6)
En un estudio de los tiempos de reacción, el tiempo de respuesta a un estímulo visual (x) y el
tiempo de respuesta a un estímulo auditivo (y) se registraron para cada una de diez personas.
Los tiempos se midieron en m. En la tabla siguiente se presentan los resultados.
x
y
161
159
203
206
235
241
176
163
201
197
188
193
228
209
211
189
191
169
178
201
Determine un intervalo de confianza de 95% para la correlación entre los dos tiempos de reacción.
Solución
Usando la ecuación (7.1) se calcula la correlación muestral, se obtiene r ⫽ 0.8159. Después
se utiliza la ecuación (7.3) para calcular la cantidad W:
W⫽
⫽
1
1⫹r
ln
2
1⫺r
1
1 ⫹ 0.8159
ln
2
1 ⫺ 0.8159
= 1.1444
√
Dado que W está distribuida normalmente con desviación estándar s ⫽ 1/(10 − 3) ⫽
0.3780 (ecuación 7.5), un intervalo de confianza de 95% para µW está dado por
1.1444 ⫺ 1.96(0.3780) ⬍ mW ⬍ 1.1444 ⫹ 1.96(0.3780)
0.4036 ⬍ mW ⬍ 1.8852
Para obtener un intervalo de confianza de 95% para r se transforma la desigualdad mediante
la ecuación (7.6), por lo que se obtiene
e2(1.8852) ⫺ 1
e2(0.4036) ⫺ 1
e2mW ⫺ 1
⬍
⬍
e2(0.4036) ⫹ 1
e2(1.8852) ⫹ 1
e2mW ⫹ 1
0.383 ⬍ r ⬍ 0.955
Para probar hipótesis nulas de la forma r ⫽ r0, r ⱕ r0 y r ⱖ r0, donde r0 es una constante que no es igual a 0, la cantidad W es la base de una prueba. A continuación se presenta
un ejemplo.
Ejemplo
7.4
7.1
Correlación
489
Con referencia al ejemplo 7.3, determine el P-valor para probar H0 : r ⱕ 0.3 contra H1 : r ⬎ 0.3.
Solución
Bajo H0 se tiene que r ⫽ 0.3, por lo que, al usar la ecuación (7.4),
mW ⫽
1
1 ⫹ 0.3
ln
2
1 ⫺ 0.3
⫽ 0.3095
√
La desviación estándar de W es s ⫽ 1/(10 − 3) ⫽ 0.3780. Por lo que bajo H0, W ~ N(0.3095,
0.37802). El valor observado de W es W ⫽ 1.1444. El puntaje z es, por tanto,
z⫽
1.1444 ⫺ 0.3095
⫽ 2.21
0.3780
El P-valor es 0.0136. Se concluye que r ⬎ 0.3.
Para la prueba de hipótesis nula de la forma r ⫽ 0, r ⱕ 0, r ⱖ 0 está disponible un procedimiento parecido. Cuando r ⫽ 0, la cantidad
√
r n−2
U= √
1 − r2
tiene la distribución t de Student con n ⫺ 2 grados de libertad. El ejemplo 7.5 muestra cómo
utilizar U como un estadístico de prueba.
Ejemplo
7.5
Con referencia al ejemplo 7.3, pruebe la hipótesis H0 : r ⱕ 0 contra H1 : r ⬎ 0.
Solución
Bajo H0 se tiene que r ⫽ 0, por lo que el estadístico de prueba U tiene la distribución t de
Student con n ⫺ 2 ⫽ 8 grados de libertad. La correlación muestral es r ⫽ 0.8159, por lo que
el valor de U es
√
r n−2
U = √
1 − r2
√
0.8159 10 − 2
= √
1 − 0.81592
= 3.991
Al consultar la tabla t de Student con ocho grados de libertad, se encuentra que el P-valor está entre 0.001 y 0.005. Es seguro concluir que r ⬎ 0.
490
CAPÍTULO 7
Correlación y regresión lineal simple
Ejercicios de la sección 7.1
1. Calcule el coeficiente de correlación para el siguiente conjunto de datos.
x
1
2
3
4
5
6
7
y
2
1
4
3
7
5
6
2. Para cada uno de los siguientes conjuntos de datos, explique
por qué el coeficiente de correlación es el mismo que para
el conjunto de datos del ejercicio 1.
a)
b)
c)
c)
4. Verdadero o falso, y explique brevemente:
x
1
2
3
4
5
6
7
y
5
4
7
6
10
8
9
x
11
21
31
41
51
61
71
y
5
4
7
6
10
8
9
b) Si el coeficiente de correlación es negativo, entonces los
valores debajo del promedio de una variable están asociados con los valores debajo del promedio de la otra.
x
53
43
73
63
103
83
93
c) Si y es usualmente menor que x, entonces la correlación
entre y y x será negativa.
y
4
6
8
10
12
14
16
3. Establezca para cada una de las siguientes gráficas de dispersión si el coeficiente de correlación es un resumen adecuado y explíquelo brevemente.
a) Si el coeficiente de correlación es positivo, entonces los
valores arriba del promedio de una variable están asociados con los valores superiores al promedio de la otra.
5. Un investigador reunió datos acerca de las estaturas y los
pesos de estudiantes universitarios. La correlación entre la
estatura y el peso para hombres era de 0.6, y para mujeres
era igual. Si los hombres y las mujeres se consideran en
conjunto, la correlación entre la estatura y el peso ¿es mayor que 0.6, menor que 0.6, o casi igual a 0.6? Puede ser útil
hacer un diagrama aproximado de dispersión.
6. En un estudio de movimientos de tierra ocasionados por sismos se registraron para cinco de éstos la velocidad máxima
(en m/s) y la aceleración máxima (en m/s2). Los resultados
se presentan en la tabla siguiente.
Velocidad
1.54
1.60
0.95
1.30
2.92
Aceleración
7.64
8.04
8.04
6.37
5.00
a) Calcule el coeficiente de correlación entre la velocidad
máxima y la aceleración máxima.
a)
b) Construya un diagrama de dispersión para estos datos.
c) ¿El coeficiente de correlación es un resumen adecuado
de estos datos? Explique por qué.
d) Alguien sugiere convertir las unidades de metros a centímetros y de segundos a minutos. ¿Qué efecto tendría
sobre la correlación hacer esto?
b)
7. Un ingeniero químico está estudiando el efecto de la temperatura y la tasa de agitación en la producción de cierto producto. El proceso se realiza 16 veces; en la tabla siguiente
se muestran los resultados. Las unidades para la producción
son porcentajes de un máximo teórico.
7.1
Temperatura
(°C)
110
110
111
111
112
112
114
114
117
117
122
122
130
130
143
143
Tasa de
agitación (rpm)
30
32
34
36
38
40
42
44
46
48
50
52
54
56
58
60
Producción
(%)
70.27
72.29
72.57
74.69
76.09
73.14
75.61
69.56
74.41
73.49
79.18
75.44
81.71
83.03
76.98
80.99
a) Calcule la correlación entre la temperatura y la producción, entre la tasa de agitación y la producción, y entre
la temperatura y la tasa de agitación.
b) ¿Estos datos proporcionan, dentro del rango de los datos, buena evidencia de que el aumento de la temperatura ocasiona que la producción aumente? ¿O el resultado
se podría deber a la confusión? Explique.
c) ¿Estos datos proporcionan, dentro del rango de los datos,
buena evidencia de que el aumento de la tasa de agitación
ocasiona que la producción aumente? ¿O el resultado se
podría deber a la confusión? Explique.
8. Otro ingeniero químico está estudiando el mismo procedimiento que en el ejercicio 7 y utiliza la siguiente matriz experimental.
Temperatura
(°C)
110
110
110
110
121
121
121
121
132
132
132
132
143
143
143
143
Tasa de
agitación (rpm)
30
40
50
60
30
40
50
60
30
40
50
60
30
40
50
60
Producción
(%)
70.27
74.95
77.91
82.69
73.43
73.14
78.27
74.89
69.07
70.83
79.18
78.10
73.71
77.70
74.31
80.99
Correlación
491
a) Calcule la correlación entre la temperatura y la producción, entre la tasa de agitación y la producción, y entre
la temperatura y la tasa de agitación.
b) ¿Estos datos proporcionan, dentro del rango de los datos, buena evidencia de que la producción no está afectada por la temperatura? ¿O el resultado se podría deber
a la confusión? Explique.
c) ¿Estos datos proporcionan, dentro del rango de los datos,
buena evidencia de que el aumento de la tasa de agitación ocasiona que la producción aumente? ¿O el resultado se podría deber a la confusión? Explique.
d) ¿Cuál de los diseños experimentales es mejor, éste o el
del ejercicio 7? Explique.
9. Las siguientes son mediciones de la fuerza de tensión en ksi
(x) y la dureza de Brinell (y) para diez elementos del cobre
extraído en frío. Suponga que la fuerza de tensión y la dureza de Brinell siguen una distribución normal bivariada.
x
y
106.2
106.3
105.3
106.1
105.4
106.3
104.7
105.4
105.5
105.1
35.0
37.2
39.8
35.8
41.3
40.7
38.7
40.2
38.1
41.6
a) Determine un intervalo de confianza de 95% para r, la
correlación poblacional entre la fuerza de tensión y la dureza de Brinell.
b) ¿Puede concluir que r ⬍ 0.3?
c) ¿Puede concluir que r ⫽ 0?
10. En una muestra de 400 cojinetes de bolas, el coeficiente de
correlación entre la excentricidad y la suavidad fue de r ⫽
0.10.
a) Determine el P-valor para probar que H0 : r ⱕ 0 contra
H1 : r ⬎ 0. ¿Puede concluir que r ⬎ 0?
b) ¿El resultado del inciso a) le permite concluir que hay
una fuerte correlación entre excentricidad y suavidad?
Explique.
11. Un diagrama de dispersión contiene cuatro puntos: (⫺2,
⫺2), (⫺1, ⫺1), (0, 0) y (1, 1). Se agrega un quinto punto,
(2, y), a la gráfica. Sea r la correlación entre x y y.
492
CAPÍTULO 7
Correlación y regresión lineal simple
a) Determine el valor de y para que r ⫽ l.
d) Determine el valor de y para que r ⫽ ⫺0.5.
b) Determine el valor de y para que r ⫽ 0.
e) Dé un argumento geométrico para mostrar que no existe un valor y para el cual r ⫽ ⫺1.
c) Determine el valor de y para que r ⫽ 0.5.
7.2
La recta de mínimos cuadrados
Cuando dos variables tienen una relación lineal, el diagrama de dispersión tiende a estar agrupado alrededor de la recta de mínimos cuadrados (véanse las figuras 7.1 y 7.2 en la sección
7.1). En esta sección se aprenderá cómo calcular la recta de mínimos cuadrados y cómo se
puede utilizar para obtener conclusiones de los datos.
Se empieza describiendo un experimento hipotético. Los resortes se usan en aplicaciones por su capacidad para alargarse (contraerse) bajo carga. La rigidez de un resorte se mide
con la “constante del resorte”, que es la longitud del resorte que se alargará por unidad de la
fuerza o de carga.1 Para asegurarse de que un resorte dado funciona adecuadamente es necesario calcular la constante de resorte con exactitud y precisión.
En este experimento hipotético un resorte se cuelga verticalmente con un extremo fijo,
y los pesos se cuelgan uno tras otro del otro extremo. Después de colgar cada peso se mide la
longitud del resorte. Sean x1, . . . , xn los pesos, y sea li la longitud del resorte bajo la carga xi.
La ley de Hooke establece que
li ⫽ β0 ⫹ β1xi
(7.7)
donde β0 representa la longitud del resorte cuando no tiene carga y β1 es la constante del resorte.
Sea yi la longitud medida del resorte bajo carga xi. Debido al error de medición, yi será
diferente de la longitud verdadera li. Se escribe como
yi ⫽ li ⫹ εi
(7.8)
donde εi constituye el error en la i-ésima medición. Al combinar las ecuaciones (7.7) y (7.8)
se obtiene
yi ⫽ β0 ⫹ β1xi ⫹ εi
(7.9)
En la ecuación (7.9) yi se llama variable dependiente, xi se conoce como variable independiente, β0 y β1 son los coeficientes de regresión, y εi se denomina error. A la ecuación (7.9)
se le llama modelo lineal.
La tabla 7.1 presenta los resultados del experimento hipotético y la figura 7.9 el diagrama de dispersión de y contra x. Se quieren utilizar estos datos para calcular la constante β1 del
resorte y la longitud β0 sin carga. Si no hubiera error en la medición, los puntos se encontrarían en una línea recta con pendiente β1 e intercepto β0, y estas cantidades serían fáciles de
determinar. Debido al error de medición, β0 y β1 no se pueden determinar exactamente, pero
se pueden estimar cuando se calcula la recta de mínimos cuadrados.
1
La definición más tradicional de la constante del resorte es el recíproco de esta cantidad, a saber: la fuerza que se
requiere para extender el resorte una unidad de longitud.
493
La recta de mínimos cuadrados
7.2
TABLA 7.1 Longitudes medidas de un resorte bajo diferentes cargas
Peso (lb)
x
0.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
1.6
1.8
Longitud medida (pulg)
y
5.06
5.01
5.12
5.13
5.14
5.16
5.25
5.19
5.24
5.46
Peso (lb)
x
2.0
2.2
2.4
2.6
2.8
3.0
3.2
3.4
3.6
3.8
Longitud medida (pulg)
y
5.40
5.57
5.47
5.53
5.61
5.59
5.61
5.75
5.68
5.80
6
5.9
Longuitud (pulg)
5.8
5.7
5.6
5.5
5.4
5.3
5.2
5.1
5
0
0.5
1
1.5
2
2.5
3
3.5
4
Peso (lb)
FIGURA 7.9 Gráfica de longitudes medidas de un resorte contra carga.
La figura 7.10 de la página 494 presenta el diagrama de dispersión de y contra x con la
recta de mínimos cuadrados sobrepuesta. Se escribe la ecuación de la recta como
y ⫽ β̂ 0 ⫹ β̂ 1x
(7.10)
Las cantidades β̂ 0 y β̂ 1 se llaman coeficientes de mínimos cuadrados. El coeficiente β̂ 1 representa la pendiente de la recta de mínimos cuadrados, es una estimación de la constante verdadera del resorte β1, y el coeficiente β̂ 0, el intercepto de la recta de mínimos cuadrados,
significa una estimación de la verdadera longitud sin carga β0.
La recta de mínimos cuadrados es la que ajusta “mejor” los datos. Ahora se define lo
que significa “mejor”. Para cada punto de datos (xi, yi) la distancia vertical al punto (xi, ŷ i) en
la recta de mínimos cuadrados es ei ⫽ yi ⫺ ŷ i (véase la figura 7.10). La cantidad ŷ i ⫽ β̂ 0 ⫹
β̂ 1xi se llama valor ajustado, y la cantidad ei se llama residuo asociado con el punto (xi, yi).
El residuo ei representa la diferencia entre el valor observado yi en los datos y el valor ajusta-
CAPÍTULO 7
Correlación y regresión lineal simple
6
5.9
5.8
Longuitud (pulg)
494
5.7
(xi, yi)
5.6
ei
5.5
(xi, ^yi)
5.4
5.3
5.2
5.1
5
0
0.5
1
1.5
2
2.5
3
3.5
4
Peso (lb)
FIGURA 7.10 Gráfica de longitudes medidas de un resorte contra carga. La recta de mínimos cuadrados y ⫽ β̂ 0 ⫹ β̂ 1x está sobrepuesta. La distancia vertical de un punto de datos
(xi, yi) para el punto (xi, ŷ i) en la recta es el i-ésimo residuo ei. La recta de mínimos cuadrados es la recta que minimiza la suma de los cuadrados de los residuos.
do ŷ i pronosticado por la recta de mínimos cuadrados. Éste es la distancia vertical del punto
a la recta. Los puntos arriba de la recta de mínimos cuadrados tienen residuos positivos, y los
puntos debajo de la recta de mínimos cuadrados tienen residuos negativos. Entre más cercanos estén los valores ajustados a las observaciones, mejor ajustará la recta a los datos. La recta
de mínimos cuadrados se define como aquella para la que la suma de cuadrados de los residuos
兺ni⫽1 ei2 se minimiza. En este sentido, la recta de mínimos cuadrados ajusta mejor los datos
que cualquier otra recta.
En el ejemplo de ley de Hooke hay solamente una variable independiente (peso), ya que
es razonable suponer que la única variable que afecta la longitud del resorte es la cantidad del
peso colgada de él. En otros casos se necesita utilizar algunas variables independientes. Por
ejemplo, para pronosticar la cosecha de cierto cultivo se necesitará saber la cantidad de fertilizante usado, la cantidad de agua aplicada y diferentes mediciones de las propiedades químicas del suelo. Modelos lineales como la ley de Hooke, con sólo una variable independiente,
se conocen como modelos de regresión lineal simple. Estos últimos, con más de una variable independiente, se llaman modelos de regresión múltiple. Este capítulo trata acerca de la
regresión lineal simple. La regresión múltiple se trata en el capítulo 8.
Cálculo de la ecuación de la recta de mínimos cuadrados
Para calcular la ecuación de la recta de mínimos cuadrados se deben determinar los valores
para la pendiente β̂ 1 y el intercepto β̂ 0 que minimizan la suma del residuo 兺ni=1 ei2.
7.2
La recta de mínimos cuadrados
495
Para hacer esto primero se expresa ei en función de β̂ 0 y β̂ 1:
ei ⫽ yi ⫺ ŷ i ⫽ yi ⫺ β̂ 0 ⫺ β̂ 1xi
(7.11)
Por tanto, β̂ 0 y β̂ 1 son las cantidades que minimizan la suma
S⫽
e2i ⫽
(yi ⫺ β̂ 0 ⫺ β̂ 1xi)2
(7.12)
Estas cantidades son
β1 =
n
i=1 (xi − x)(yi −
n
2
i=1 (xi − x)
y)
β0 = y − β1 x
(7.13)
(7.14)
Las deducciones de estos resultados se proporcionan al final de esta sección.
Fórmulas para el cálculo
Es necesario calcular las cantidades
(xi ⫺ x–)2 y
(xi ⫺ x–)(yi ⫺ y–) con el fin de
determinar la ecuación de la recta de mínimos cuadrados y, como pronto se verá, la cantidad
(yi ⫺ y–)2 que se necesita calcular con el fin de determinar qué tan bien ajusta la recta a
los datos. Cuando se calculan estas cantidades a mano existen fórmulas alternas que con frecuencia son más fáciles de utilizar. Éstas se proporcionan en el cuadro siguiente.
Fórmulas para el cálculo
Las expresiones de la derecha son equivalentes a las de la izquierda, y son, con frecuencia, más fáciles de calcular:
(xi ⫺ x–)2 ⫽
x2i ⫺ nx–2
(7.15)
(yi ⫺ –y )2 ⫽
y2i ⫺ ny–2
(7.16)
(xi ⫺ x–)(yi ⫺ –y ) ⫽
Ejemplo
7.6
xiyi ⫺ nx– –y
(7.17)
Con los datos de la ley de Hooke de la tabla 7.1 calcule los estimadores de mínimos cuadrados de la constante del resorte y la longitud sin carga del resorte. Escriba la ecuación de la
recta de mínimos cuadrados.
496
CAPÍTULO 7
Correlación y regresión lineal simple
Solución
La estimación de la constante del resorte es β̂ 1 y la estimación de la longitud sin carga es β̂ 0.
De la tabla 7.1 se calcula:
x = 1.9000
(xi − x)2 =
n
xi2 − nx 2 = 26.6000
(xi − x)(yi − y) =
n
xi yi − n x y = 5.4430
n
i=1
n
i=1
y = 5.3885
i=1
i=1
Mediante las ecuaciones (7.13) y (7.14) se calcula
β̂ 1 ⫽
5.4430
⫽ 0.2046
26.6000
β̂ 0 ⫽ 5.3885 ⫺ (0.2046)(1.9000) ⫽ 4.9997
La ecuación de la recta de mínimos cuadrados es y ⫽ β̂ 0 ⫹ β̂ 1x. Al sustituir los valores calculados para β̂ 0 y β̂ 1, se obtiene
y ⫽ 4.9997 ⫹ 0.2046 x
Con la ecuación de la recta de mínimos cuadrados se pueden calcular los valores ajustados ŷ i = β̂ 0 ⫹ β̂ 1xi y los residuos ei ⫽ yi ⫹ ŷ i para cada punto (xi, yi) en el conjunto de datos de la ley de Hooke. Los resultados se presentan en la tabla 7.2. El punto cuyo residuo se
muestra en la figura 7.10 es x ⫽ 2.2.
En el ejemplo de la ley de Hooke la cantidad β0 ⫹ β1x representa la longitud verdadera del resorte bajo una carga x. Puesto que β̂ 0 y β̂ 1 son estimadores de los valores verdaderos
β0 y β1 la cantidad ŷ = β̂ 0 ⫹ β̂ 1x es una estimación de β0 ⫹ β1x. Los ejemplos 7.7 y 7.8 muestran esto último.
Ejemplo
7.7
Con los datos de la ley de Hooke calcule la longitud del resorte bajo una carga de 1.3 lb.
Solución
En el ejemplo 7.6 la ecuación de la recta de mínimos cuadrados se calculó de y ⫽ 4.9997 ⫹
0.2046x. Con el valor x ⫽ 1.3 se estima que la longitud del resorte bajo una carga de 1.3 lb
es de
ŷ ⫽ 4.9997 ⫹ (0.2046) (1.3) ⫽ 5.27 pulg.
7.2
La recta de mínimos cuadrados
497
TABLA 7.2 Longitudes medidas de un resorte bajo diferentes cargas, con valores ajustados y residuos
Ejemplo
7.8
Peso
x
Longitud
medida
y
Valor
ajustado
ŷ
0.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
1.6
1.8
5.06
5.01
5.12
5.13
5.14
5.16
5.25
5.19
5.24
5.46
5.00
5.04
5.08
5.12
5.16
5.20
5.25
5.29
5.33
5.37
Residuo
e
0.06
⫺0.03
0.04
0.01
⫺0.02
⫺0.04
0.00
⫺0.10
⫺0.09
0.09
Peso
x
Longitud
medida
y
Valor
ajustado
ŷ
2.0
2.2
2.4
2.6
2.8
3.0
3.2
3.4
3.6
3.8
5.40
5.57
5.47
5.53
5.61
5.59
5.61
5.75
5.68
5.80
5.41
5.45
5.49
5.53
5.57
5.61
5.65
5.70
5.74
5.78
Residuo
e
⫺0.01
0.12
⫺0.02
⫺0.00
0.04
⫺0.02
⫺0.04
0.05
⫺0.06
0.02
Utilizando la ley de Hooke con los datos, estime la longitud de un resorte bajo una carga de
1.4 lb.
Solución
La estimación es ŷ ⫽ 4.9997 ⫹ (0.2046)(1.4) ⫽ 5.29 pulg.
En el ejemplo 7.8, observe que la longitud medida en una carga de 1.4 era de 5.19 pulg
(véase la tabla 7.2). Pero la estimación de mínimos cuadrados de 5.29 pulg está basada en todos los datos y es más precisa (tiene menor incertidumbre). En la sección 7.3 se aprenderá cómo calcular incertidumbres en los estimadores ŷ.
Los estimadores no son lo mismo que los valores verdaderos
Es importante entender la diferencia entre los estimadores de mínimos cuadrados β̂ 0 y β̂ 1, y
los valores verdaderos β0 y β1. Los valores verdaderos son constantes cuyos valores no se conocen. Los estimadores son cantidades que se calculan a partir de los datos. Se pueden utilizar los estimadores como aproximaciones de los valores verdaderos.
En principio, un experimento como el de la ley de Hooke se podría repetir muchas veces.
Los valores verdaderos β0 y β1 permanecerían constantes en todas las reproducciones del experimento, pero cada reproducción produciría datos diferentes; por consiguiente, valores diferentes de los estimadores β̂ 0 y β̂ 1. Los estimadores β̂ 0 y β̂ 1 son, por tanto, variables aleatorias, ya
que sus valores varían de experimento a experimento. Para usar completamente estos estimadores será preciso calcular sus desviaciones estándar. Este tema se analizará en la sección 7.3.
Los residuos no son lo mismo que los errores
Un conjunto de puntos (x1, y1), . . . , (xn, yn) sigue un modelo lineal si las coordenadas x y y
están relacionadas por medio de la ecuación yi ⫽ β0 ⫹ β1xi ⫹ εi. Es importante entender la
diferencia entre los residuos ei y los errores εi. Cada residuo ei es la diferencia yi ⫺ ŷ i entre el
498
CAPÍTULO 7
Correlación y regresión lineal simple
valor observado, o valor medido, el valor yi y el valor ajustado ŷ i ⫽ β̂ 0 ⫹ β̂ 1xi calculado por
la recta de mínimos cuadrados. Debido a que los valores yi se conocen y los valores ŷ i se pueden calcular a partir de los datos, es posible calcular los residuos. En contraste, los errores εi
representan las diferencias entre yi y los valores β0 ⫹ β1xi. Puesto que los valores verdaderos
β0 y β1 no se conocen, los errores son también desconocidos. Otra manera de considerar la diferencia consiste en que los residuos constituyen las distancias verticales de los valores observados yi y la recta de mínimos cuadrados ŷ ⫽ β̂ 0 ⫹ β̂ 1x, y los errores son las distancias del
yi a la recta verdadera y ⫽ β0 ⫹ β1x.
Resumen
Dados los puntos (x1, y1), . . . , (xn, yn):
La recta de mínimos cuadrados es ŷ ⫽ b̂ 0 ⫹ b̂ 1x.
n
(xi − x)(yi − y)
n
β 1 = i=1
2
i=1 (xi − x)
b̂ 0 ⫽ –y ⫺ b̂ 1x–
Las cantidades que b̂ 0 y b̂ 1 se consideran como los estimadores de una pendiente
verdadera b1 y de un intercepto verdadero b0.
Para cualquier x, ŷ ⫽ b̂ 0 ⫹ b̂ 1x significa una estimación de la cantidad β0 ⫹ β1x.
No haga una extrapolación fuera del rango de los datos
¿Qué sucede si se quería estimar la longitud del resorte bajo una carga de 100 lb? La estimación de mínimos cuadrados es 4.9997 ⫹ (0.2046)(100) ⫽ 25.46 pulg. ¿Se debe creer esto?
No. Ninguno de los pesos en el conjunto de datos era tan grande. Es probable que el resorte
se deformaría, por lo que la ley de Hooke no valdría. Para muchas variables las relaciones lineales valen dentro de cierto rango, pero no fuera de él. Si se extrapola una recta de mínimos
cuadrados fuera del rango de los datos, no habrá garantía de que describirá la relación adecuadamente. Si se quiere saber cómo responderá el resorte a una carga de 100 lb se deben incluir
pesos de 100 lb o mayores en el conjunto de datos.
Resumen
No extrapole una recta ajustada (como la recta de mínimos cuadrados) fuera del rango
de los datos. La relación lineal puede no ser válida ahí.
No use la recta de mínimos cuadrados cuando
los datos no sean lineales
En la sección 7.1 se aprendió que el coeficiente de correlación se debía usar solamente cuando la relación entre x y y sea lineal. Lo mismo es verdad para la recta de mínimos cuadrados.
Cuando el diagrama de dispersión sigue un patrón curvado no tiene caso presentarlo con una
línea recta. Para mostrar esto, la figura 7.11 presenta una gráfica de la relación entre la altu-
7.2
499
La recta de mínimos cuadrados
350
300
Altura (pies)
250
200
150
100
50
0
0
1
2
Tiempo (s)
3
4
FIGURA 7.11 Relación entre la altura de un objeto en caída libre con una velocidad inicial positiva y el tiempo de caída libre no es lineal. La recta de mínimos cuadrados no se
ajusta bien a los datos y no se debe utilizar para pronosticar la altura del objeto para un
tiempo dado.
ra y de un objeto desde su lanzamiento a una altura de 256 pies y el tiempo x desde que se
lanzó. La relación entre x y y no es lineal. La recta de mínimos cuadrados no se ajusta bien a
los datos.
En algunos casos la recta de mínimos cuadrados se puede utilizar para datos no lineales, después de que se ha aplicado un proceso conocido como transformación variable. En la
sección 7.4 se analiza este tema.
Otra mirada a la recta de mínimos cuadrados
La expresión (7.13) para β̂ 1 puede rescribirse en una forma que proporciona una interpretación útil. Iniciando con la definición delcoeficiente de correlación
7.2 en la sección
q
n ((ecuación
n
2/
2 = s /s
y)
x)
(y
−
(x
−
7.1) y al multiplicar ambos lados por
y x se obtiei
i
i=1
i=1
ne el resultado
s
β̂ 1 ⫽ r sy
x
(7.18)
La ecuación 7.18 permite interpretar la pendiente de la recta de mínimos cuadrados en función del coeficiente de correlación. Las unidades de β̂ 1, la pendiente de la recta de mínimos
cuadrados, deben ser unidades de y/x. El coeficiente de correlación r es un número puro que
mide la fuerza de la relación lineal entre x y y. La ecuación (7.18) muestra que la pendiente
β̂ 1 es proporcional al coeficiente de correlación, donde la constante de proporcionalidad es la
cantidad sy /sx para que las unidades concuerden con las unidades en las que se miden x y y.
Con la ecuación (7.13) se puede escribir la recta de mínimos cuadrados en su forma
punto pendiente: Sustituyendo y– ⫺ β̂ 1x– por β̂ 0 en la ecuación para la recta de mínimos cuadrados ŷ ⫽ β̂ 0 ⫹ β̂ 1x y reordenando los términos se obtiene
ŷ ⫺ y– ⫽ β̂ 1(x ⫺ x–)
(7.19)
CAPÍTULO 7
Correlación y regresión lineal simple
Combinando las ecuaciones (7.18) y (7.19) se tiene que
sy
ŷ ⫺ y– ⫽ r s (x ⫺ x–)
(7.20)
x
Por consiguiente, la recta de mínimos cuadrados es la que pasa a través del centro de masa
del diagrama de dispersión (x–, y–), con pendiente β̂ ⫽ r(sy兾sx).
Medición de la bondad del ajuste
Un estadístico de la bondad del ajuste representa una cantidad que mide qué tan bien un modelo explica un conjunto específico de datos. Un modelo lineal ajusta bien si hay una fuerte
relación lineal entre x y y. En la sección 7.1 se mencionó que el coeficiente de correlación r
mide la fuerza de la relación lineal entre x y y. Por tanto, r es un estadístico de la bondad del
ajuste para el modelo lineal. Ahora se describirá cómo mide r la bondad del ajuste. La figura
7.12 presenta los datos de Galton acerca de las longitudes de antebrazos contra la estatura.
Los puntos en el diagrama de dispersión son (xi, yi), donde xi significa la estatura del hombre
del i-ésimo y yi es la longitud de su antebrazo. Tanto la recta de mínimos cuadrados como la
horizontal y ⫽ y– están sobrepuestas. Ahora imagine que se debe predecir la longitud de uno
de los antebrazos. Si no se conoce la estatura del hombre, se debe predecir que la longitud del
antebrazo es el promedio de y–. Los errores de predicción son yi ⫺ y–. Si se pronostica de esta manera la longitud de cada antebrazo, la suma de los errores pronosticados al cuadrado será
(yi ⫺ y–)2. Si, por otro lado, se conoce la estatura de cada hombre antes de pronosticar
21
(xi, yi)
yi ⫺ y
20
Longitud de antebrazos (pulgadas)
500
19
yi ⫺ y
18
y= y
17
16
15
60
62
64
66
68
Estatura (pulgadas)
70
72
74
FIGURA 7.12 Estatura y longitud de antebrazos de hombres. La recta de mínimos
cuadrados y la horizontal y ⫽ −
y están sobrepuestas.
7.2
La recta de mínimos cuadrados
501
la longitud de su antebrazo se puede utilizar la recta de mínimos cuadrados, y predecir que la
longitud del i-ésimo antebrazo sea ŷ i . El error pronosticado será el residuo yi ⫺ ŷ i, y la suma de los errores pronosticados al cuadrado es:
(yi ⫺ ŷ i)2 . La fuerza de la relación lineal se mide al calcular la reducción obtenida en la suma de los errores pronosticados al
cuadrado con ŷ i en lugar de y–. Esto es la diferencia
(yi ⫺ y–)2 ⫺
(yi ⫺ ŷ i)2. Mientras más grande sea la diferencia, más fuertes serán la agrupación de puntos alrededor de la
recta de mínimos cuadrados y la relación lineal entre x y y. Por tanto,
(yi ⫺ y–)2 ⫺
2
(yi ⫺ ŷ i) es un estadístico de la bondad del ajuste.
Sin embargo, existe un problema al utilizar
(yi ⫺ y–)2 ⫺
(yi ⫺ ŷ i)2 como un
estadístico de la bondad del ajuste. Esta cantidad tiene unidades, a saber, unidades cuadradas
de y. No se podía usar este estadístico para comparar la bondad del ajuste de dos modelos que
ajusten diferentes conjuntos de datos, puesto que las unidades serían diferentes. Se necesita
utilizar un estadístico de la bondad del ajuste que sea un número puro para que se pueda medir la bondad del ajuste en una escala absoluta.
Aquí es donde entra el coeficiente de correlación r. Se demuestra al final de esta sección que
n
(yi − y)2 − ni=1 (yi − yi )2
n
r 2 = i=1
.
(7.21)
2
i=1 (yi − y)
La cantidad r2, el cuadrado del coeficiente de correlación, se llama coeficiente de la determinación. Ésta es la reducción obtenida en la suma de los errores pronosticados al cuadrado
al utilizar ŷ i en lugar de y–, expresado como una fracción de la suma de los errores pronosticados al cuadrado
(yi ⫺ y–)2, obtenidos al usar y–. Es importante conocer esta interpreta2
ción de r . En el capítulo 8 se verá cómo se puede generalizar para proporcionar una medida
de la bondad del ajuste para relaciones lineales que implican varias variables.
Para una interpretación visual de r2, observe la figura 7.12. Para cada punto (xi, yi) en
el diagrama de dispersión, la cantidad yi ⫺ y– constituye la distancia vertical del punto a la recta horizontal y ⫽ y–. La cantidad yi ⫺ ŷ i es la distancia vertical del punto a la recta de mínimos cuadrados. Por tanto, la cantidad
(yi ⫺ y–)2 mide la dispersión total de los puntos
–
alrededor de la recta y ⫽ y, y la cantidad
(yi ⫺ ŷ i)2 mide la dispersión total de los puntos alrededor de la recta de mínimos cuadrados. Por consiguiente, la cantidad
(yi ⫺ y–)2
2
⫺
(yi ⫺ ŷ i) mide la reducción en la dispersión de los puntos obtenidos usando mínimos cuadrados en lugar de y ⫽ y–. El coeficiente de determinación r2 expresa esta reducción
como una proporción de la dispersión alrededor de y ⫽ y–.
Las sumas de los cuadrados que aparecen en este análisis se utilizan tan a menudo que
los estadígrafos les han dado nombres. Llaman a
(yi ⫺ ŷ i)2 la suma de los cuadrados
2
–
de los errores y a
(yi ⫺ y) la suma total de los cuadrados. Su diferencia
(yi ⫺
y–)2 ⫺
(yi ⫺ ŷ i)2 se denomina suma de los cuadrados de la regresión. Evidentemente,
la siguiente relación es válida:
Suma total
Suma de los cuadrados
Suma de los cuadrados
⫽
⫹
de los cuadrados
de la regresión
de los errores
Mediante la terminología anterior se puede escribir la ecuación (7.21) como
r2 ⫽
Suma de los cuadrados de la regresión
Suma total de los cuadrados
502
CAPÍTULO 7
Correlación y regresión lineal simple
Puesto que la suma total de cuadrados es exactamente la varianza muestral de los yi sin dividir entre n ⫺ 1, los estadígrafos (y otros) con frecuencia se refieren a r2 como la proporción
de la varianza en y explicada por la regresión.
Deducción de los coeficientes de mínimos cuadrados β̂ 0 y β̂ 1
Se deducirán las ecuaciones (7.13) y (7.14). Los coeficientes de mínimos cuadrados β̂ 0 y
β̂ 1 son las cantidades que minimizan la suma
(yi ⫺ β̂ 0 ⫺ β̂ 1 xi)2
S⫽
Se calculan estos valores mediante derivadas parciales de S con respecto a β̂ 0 y β̂ 1 e igualándolas a 0. Por tanto, β̂ 0 y β̂ 1 son las cantidades que resuelven las ecuaciones simultáneas
n
∂S
=−
2(yi − β0 − β1 xi ) = 0
∂β0
i=1
(7.22)
n
∂S
=−
2xi (yi − β0 − β1 xi ) = 0
∂β1
i=1
(7.23)
Estas cantidades se pueden escribir como un sistema de ecuaciones lineales con dos incógnitas:
n
n
nβ 0 +
xi β 1 =
yi
(7.24)
i=1
i=1
n
n
n
2
xi β 0 +
xi β 1 =
xi yi
(7.25)
i=1
i=1
i=1
Se despeja a β̂ 0 de la ecuación (7.24), obteniendo
n
n
yi
xi
i=1
− β1 i=1
β0 =
n
n
= y − β1 x
Esto demuestra la ecuación (7.14). Ahora se sustituye y– ⫺ β̂ 1x– en lugar de β̂ 0 en la ecuación (7.25), con lo que se tiene que
n
n
n
2
(7.26)
xi (y − β 1 x) +
xi β 1 =
xi yi
i=1
i=1
Despejando a β̂ 1 de la ecuación (7.26), se tiene que
n
i=1 xi yi − n x y
β1 =
n
2
2
i=1 xi − nx
i=1
503
La recta de mínimos cuadrados
7.2
Para demostrar la ecuación (7.13) se debe mostrar que
(xi ⫺ x–)2 ⫽
x2i ⫺ nx–2 y
–
–
–
–
que
(xi ⫺ x )(yi ⫺ y) ⫽
xi yi ⫺ nx y. (Éstas son las ecuaciones 7.15 y 7.17.)
Ahora
n
i=1
n
(xi − x)(yi − y) =
i=1
n
=
i=1
n
=
i=1
n
=
i=1
(xi yi − xyi − yxi + x y)
xi yi − x
n
i=1
yi − y
n
i=1
xi +
n
xy
i=1
xi yi − n x y − n y x + n x y
xi yi − n x y
También
n
i=1
(xi − x)2 =
=
=
=
n
i=1
n
i=1
n
i=1
n
i=1
(xi2 − 2xxi + x 2 )
xi2 − 2x
n
i=1
xi +
n
x2
i=1
xi2 − 2nx 2 + nx 2
xi2 − nx 2
Deducción de la ecuación (7.21)
Primero se demuestra que
(yi ⫺ y–)2 ⫽
(yi ⫺ ŷ i)2 ⫹
(ŷ i ⫺ y–)2
(7.27)
Este resultado se conoce como la identidad del análisis de varianza. Para deducirla se comienza por sumar y restar ŷ i en el lado izquierdo:
n
i=1 (yi
− y)2 =
n
− yi ) + (
y i − y)]2
= ni=1 (yi − yi )2 + ni=1 (
y i − y)2 + 2 ni=1 (yi − yi )(
y i − y)
i=1 [(yi
Ahora sólo se necesita demostrar que
β̂ 1xi y β̂ 0 ⫽ y– ⫺ β̂ 1x–,
(yi ⫺ ŷ i)(ŷ i ⫺ y–) ⫽ 0. Puesto que ŷ i ⫽ β̂ 0 ⫹
ŷ i ⫽ y– ⫹ β̂ 1(xi ⫺ x–)
(7.28)
504
CAPÍTULO 7
Correlación y regresión lineal simple
Por tanto,
n
i=1
Ahora β1 =
(yi − yi )(
y i − y) =
n
i=1 (xi − x)(yi − y)
n
,
2
i=1 (xi − x)
n
i=1
n
i=1
= β1
[(yi − y) − β1 (xi − x)][β1 (xi − x)]
n
i=1
(xi − x)(yi − y) − β12
i=1
i=1
(xi − x)2
(7.29)
por lo que
(xi − x)(yi − y) = β1
Sustituyendo en la ecuación (7.29) se obtiene
n
n
(yi − yi )(
y i − y) = β12
n
i=1
n
i=1
(xi − x)2
(xi − x)2 − β12
n
i=1
(xi − x)2 = 0
Esto último demuestra la identidad del análisis de varianza.
Para deducir la ecuación (7.21), la ecuación (7.28) implica que
yi − y = β1 (xi − x)
(7.30)
Elevando al cuadrado ambos lados de la ecuación (7.30) y sumando, se obtiene
n
n
(xi − x)2
(
y i − y)2 = β12
i=1
i=1
sy
Ahora β̂ 1 ⫽ r s (ecuación 7.18), por lo que
x
n
(yi − y)2
β12 = r 2 i=1
n
2
i=1 (xi − x)
Sustituyendo y eliminando, se obtiene
n
n
(
y i − y)2 = r 2
(yi − y)2
i=1
por lo que
i=1
n
(
y i − y)2
r = i=1
n
2
i=1 (yi − y)
2
Por la identidad del análisis de varianza,
(ŷ i ⫺ y–)2 ⫽
(yi ⫺ y–)2 ⫺
2
ŷ i) . Por tanto,
n
(yi − y)2 − ni=1 (yi − yi )2
n
r 2 = i=1
2
i=1 (yi − y)
(yi ⫺
7.2
Ejercicios de la sección 7.2
1. Todos los meses, durante cierto periodo, se midieron la temperatura promedio en °C (x) y el número de libras de vapor
(y) consumidas por cierta planta química. La recta de mínimos cuadrados calculada de los datos resultantes es y ⫽
245.82 ⫹ 1.13 x.
a) Pronostique el número de libras del vapor consumido en
un mes donde la temperatura promedio es 65°C.
b) Si dos meses difieren en sus temperaturas promedio por
5°C, ¿cuánto predice que será diferente el número de libras del vapor consumido?
2. En un estudio de la relación entre la dureza de Brinell (x) y
la tensión de compresión en ksi (y) de elementos de cobre
extraídos en frío, la recta de mínimos cuadrados fue y ⫽
⫺196.32 ⫹ 2.42x.
a) Pronostique la fuerza de tensión de un elemento cuya
dureza de Brinell es 102.7.
b) Si las dos muestras difieren en su dureza de Brinell en
3, ¿cuánto predice que serán diferentes sus tensiones de
compresión?
3. Una recta de mínimos cuadrados está ajustando a un conjunto de puntos. Si la suma total de los cuadrados es
(yi
⫺ y–)2 ⫽ 9 615, y la suma de los cuadrados de los errores es
(yi ⫺ ŷ i)2 ⫽ 1 450, calcule el coeficiente de determinación r2.
4. Una recta de mínimos cuadrados está ajustando un conjunto
de puntos. Si la suma total de cuadrados es
(yi ⫺ y–)2 ⫽
181.2, y la suma de los cuadrados de los errores es
(yi ⫺
ŷ i)2 ⫽ 33.9, calcule el coeficiente de determinación r2.
5. Con los datos de las estaturas de Galton (figura 7. 1, en la
sección 7.1), la recta de mínimos cuadrados para pronosticar la longitud del antebrazo (y) de la estatura (x) es y ⫽
⫺0.2967 ⫹ 0.2738x.
a) Pronostique la longitud del antebrazo de un hombre cuya estatura es 70 pulg.
b) ¿Qué estatura debe tener un hombre con el propósito de
que se pronostique que su longitud de antebrazo sea de 19
pulg?
c) Todos los hombres en cierto grupo tienen mayor estatura que las que se calcularon en el inciso b). ¿Puede concluir que todos sus antebrazos serán de al menos 19 pulg
de longitud? Explique.
6. En un estudio que relaciona el grado de deformación, en
mm, de una placa de cobre (y) a la temperatura en °C (x) se
La recta de mínimos cuadrados
505
calculó el siguiente resumen estadístico: n ⫽ 40,
(xi
(yi ⫺ y–)2 ⫽ 19.10, x– ⫽ 26.36, y– ⫽
⫺ x–)2 ⫽ 98 775,
0.5188,
(xi ⫺ x–)(yi ⫺ y–) ⫽ 826.94.
a) Calcule la correlación r entre el grado de deformación y
la temperatura.
b) Calcule la suma de cuadrados del error, la suma de cuadrados de regresión y la suma total de cuadrados.
c) Calcule la recta de mínimos cuadrados para pronosticar
la deformación de la temperatura.
d) Pronostique la deformación a una temperatura de 40°C.
e) ¿A qué temperatura se pronostica que la deformación
será de 0.5 mm?
f) Suponga que es importante que la deformación no sea
mayor de 0.5 mm. Un ingeniero sugiere que si la temperatura se conserva debajo del nivel calculado en el inciso e) se puede tener la seguridad de que la deformación
no será mayor de 0.5 mm. ¿Ésta es una conclusión correcta? Explique.
7. Se midió el peso inercial (en toneladas) y el ahorro de combustible (en milla/galón) para una muestra de siete camiones
de diesel. En la tabla siguiente se presentan los resultados.
(De “In⫺Use Emissions from Heavy⫺Duty Diesel Vehicles,” J. Yanowitz, tesis de doctorado, Escuela de Minas de
Colorado, 2001.)
Peso
Millaje
8.00
24.50
27.00
14.50
28.50
12.75
21.25
7.69
4.97
4.56
6.49
4.34
6.24
4.45
a) Construya un diagrama de puntos del millaje (y) contra el
peso (x). Compruebe que un modelo lineal es adecuado.
b) Calcule la recta de mínimos cuadrados para pronosticar
el millaje a partir del peso.
c) Si los dos camiones son diferentes en peso por cinco toneladas, ¿cuánto predeciría que son diferentes sus millajes?
d) Pronostique el millaje para camiones con un peso de 15
toneladas.
506
CAPÍTULO 7
Correlación y regresión lineal simple
e) ¿Cuáles son las unidades de la pendiente estimada β̂ 1?
f) ¿Cuáles son las unidades del intercepto estimado β̂ 0?
Concentración
de aditivo (%)
Tiempo de secado (h)
8. El procesamiento de carbón natural implica el “lavado” durante el cual se elimina ceniza de carbón (no orgánico, material no combustible). El artículo “Quantifying Sampling
Precision for Coal Ash Using Gy’s Discrete Model of the
Fundamental Error” (Journal of Coal Quality, 1989, 33-39)
proporciona los datos relacionados con los porcentajes de
ceniza con la densidad de una partícula de carbón. Se midió
el promedio de porcentaje de ceniza para cinco densidades
de partículas de carbón. En la tabla siguiente se presentan
los datos:
4.0
4.2
4.4
4.6
4.8
5.0
5.2
5.4
5.6
5.8
8.7
8.8
8.3
8.7
8.1
8.0
8.1
7.7
7.5
7.2
Densidad
(g/cm3)
Porcentaje
de ceniza
1.25
1.325
1.375
1.45
1.55
1.93
4.63
8.95
15.05
23.31
a) Construya un diagrama de dispersión del porcentaje de
ceniza (y) contra la densidad (x). Verifique que es adecuado un modelo lineal.
b) Calcule la recta de mínimos cuadrados para pronosticar
porcentaje de ceniza a partir de la densidad.
c) Si las dos partículas de carbón difieren en densidad por
0.1 g/cm3, ¿cuánto predeciría que será diferente el porcentaje de ceniza?
d) Pronostique el porcentaje de ceniza para partículas con
1.40 g/cm3.
e) Calcule los valores ajustados.
f) Calcule los residuos. ¿Qué punto tiene el residuo con
magnitud mayor?
g) Calcule la correlación entre la densidad y el porcentaje
de ceniza.
h) Calcule la suma de cuadrados de regresión, la suma de
cuadrados del error y la suma total de cuadrados.
i) Divida la suma de cuadrados de regresión entre la suma
total de cuadrados. ¿Cuál es la relación entre esta cantidad y el coeficiente de correlación?
9. En pruebas diseñadas para medir el efecto de cierto aditivo
en el tiempo de secado de pintura se obtuvieron los siguientes datos.
a) Construya un diagrama de dispersión del tiempo de secado (y) contra la concentración del aditivo (x). Verifique que es adecuado un modelo lineal.
b) Calcule la recta de mínimos cuadrados para pronosticar
el tiempo de secado a partir de la concentración del aditivo.
c) Calcule el valor ajustado y el residuo para cada punto.
d) Si la concentración del aditivo está aumentando en 0.1%,
¿en cuánto predeciría que aumente o disminuya el tiempo de secado?
e) Pronostique el tiempo de secado para una concentración
de 4.4%.
f) ¿Puede utilizarse la recta de mínimos cuadrados para
pronosticar el tiempo de secado respecto a una concentración de 7%? Si es así, pronostique el tiempo de secado. Si no, explique por qué.
g) ¿Para qué concentración pronosticaría un tiempo de secado de 8.2 horas?
h) El objetivo de este proyecto es reducir el tiempo de secado a seis horas. Con base en los datos dados, ¿puede
especificar una concentración que probablemente ocasione este resultado? Si es así, especifique la concentración. Si no, explique por qué.
10. Los tiempos de curado en días (x) y las fuerzas compresivas
en MPa (y) se registraron para varios elementos de concreto. Las medias y las desviaciones estándar de los valores x
y y fueron x– ⫽ 5, sx ⫽ 2, y– ⫽ 1 350, sy ⫽ 100. La correlación entre tiempos de curado y las fuerzas compresivas se
calculó de r ⫽ 0.7. Encuentre la ecuación de la recta de mínimos cuadrados para pronosticar la fuerza compresiva a
partir de los tiempos de curado.
11. Diferentes cantidades de pectina se agregaron a gelatina enlatada para estudiar la relación entre la concentración de
7.2
pectina en % (x) y el índice de firmeza (y). Las medias y las
desviaciones estándar de los valores de x y de y fueron x– ⫽
3, sx ⫽ 0.5, y– ⫽ 50, sy ⫽ 10. La correlación entre los tiempos de cura y la firmeza se calculó de r ⫽ 0.5. Determine la
ecuación de la recta de mínimos cuadrados para pronosticar
la firmeza a partir de la concentración de pectina.
12. Un ingeniero quiere pronosticar el valor de y cuando x ⫽
4.5 utilizando el siguiente conjunto de datos.
x
y
z ⴝ ln y
x
y
z ⴝ ln y
1
2
3
4
5
0.2
0.3
0.5
0.5
1.3
⫺1.61
⫺1.20
⫺0.69
⫺0.69
0.26
6
7
8
9
10
2.3
2.9
4.5
8.7
12.0
0.83
1.06
1.50
2.16
2.48
a) Construya un diagrama de dispersión de los puntos (x, y).
b) ¿La recta de mínimos cuadrados se debe utilizar para
pronosticar el valor de y cuando x ⫽ 4.5? Si es así, calcule la recta de mínimos cuadrados y el valor pronosticado. Si no, explique.
c) Construya un diagrama de dispersión de los puntos (x,
z), donde z ⫽ ln y.
d) Utilice la recta de mínimos cuadrados para pronosticar
el valor de z cuando x ⫽ 4.5. ¿Éste es un método adecuado de pronóstico? Explique por qué sí o no.
e) Sea ẑ el valor pronosticado de z calculado en el inciso
d). Sea ŷ ⫽ eẑ . Explique por qué ŷ es un pronosticador
razonable del valor de y cuando x ⫽ 4.5.
13. Una muestra aleatoria simple de 100 hombres entre 25 y 34
años de edad promediaron 70 pulgadas de estatura, y tenían
desviación estándar de tres pulgadas. Sus ingresos promediaron $34 900 y tenían desviación estándar de $17 200.
Complete el espacio en blanco: a partir de la recta de mínimos cuadrados se predeciría que los ingresos de un hombre
de 70 pulgadas de estatura serían de___________
i. Menor que $34 900.
ii. Mayor que $34 900.
iii. Igual a $34 900.
iv. No se puede saber a menos que se conozca la correlación.
14. Una mezcla de sacarosa y agua se calentó en una plancha y
la temperatura (en °C) se registró cada minuto durante 20
minutos con tres termómetros de termopar. Los resultados
se muestran en la tabla siguiente.
507
La recta de mínimos cuadrados
Tiempo
T1
T2
T3
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
20
18
29
32
37
36
46
46
56
58
64
72
79
84
82
87
98
103
101
103
102
18
22
22
25
37
46
45
44
54
64
69
65
80
74
87
93
90
100
98
103
103
21
11
26
35
33
35
44
43
63
68
62
65
80
75
78
88
91
103
109
107
104
a) Calcule la recta de mínimos cuadrados para estimar la
temperatura como función del tiempo usando T1 como
el valor para la temperatura.
b) Calcule la recta de mínimos cuadrados para estimar la
temperatura como una función del tiempo usando T2 como el valor para la temperatura.
c) Calcule la recta de mínimos cuadrados para estimar la
temperatura como una función del tiempo usando T3 como el valor para la temperatura.
d) Se desea calcular una sola recta para calcular la temperatura como una función del tiempo. Una persona sugiere promediar los tres estimadores de la pendiente para
obtener una sola estimación de la pendiente, y promediar los tres estimadores del intercepto para obtener una
sola estimación del intercepto. Determine la ecuación de
la recta que es resultado de este método.
e) Otra persona sugiere promediar las tres mediciones de la
− ⫽ (T ⫹ T ⫹
temperatura cada vez para obtener T
1
2
−
T3)兾3. Calcule la recta de mínimos cuadrados usando T
como el valor para la temperatura.
f) ¿Los resultados de los incisos d) y e) son diferentes?
508
7.3
CAPÍTULO 7
Correlación y regresión lineal simple
Incertidumbres en los coeficientes
de mínimos cuadrados
En la sección 7.2 se presentó el modelo lineal (ecuación 7.9):
yi ⫽ β0 ⫹ β1xi ⫹ εi
Aquí εi es el error en la i-ésima observación yi. En la práctica, εi representa la acumulación
del error de muchas fuentes. Por ejemplo, en los datos de la ley de Hooke puede estar afectado por los errores al medir la longitud del resorte, al medir los pesos de las cargas puestas en
el resorte, las variaciones en la elasticidad del resorte debidas a los cambios en la temperatura ambiental o al cansancio mental, etcétera. Si no hubiera error los puntos se encontrarían
exactamente en la recta de mínimos cuadrados, y la pendiente β̂ 1 y el intercepto β̂ 0 de la recta de mínimos cuadrados serían iguales a los valores verdaderos β0 y β1. Debido al error los
puntos están dispersos alrededor de la recta, y las cantidades β̂ 0 y β̂ 1 no igualan los valores
verdaderos. Cada vez que se repite el proceso, los valores de εi y, por tanto, los valores de β̂ 0
y β̂ 1 serán diferentes. En otras palabras, εi, β̂ 0, y β̂ 1 son variables aleatorias. Más específicamente, el error εi crea incertidumbre en los estimadores β̂ 0 y β̂ 1. Es obvio que si el εi tiende
a tener una magnitud pequeña, los puntos estarán muy agrupados alrededor de la recta, y la
incertidumbre en los estimadores de mínimos cuadrados β̂ 0 y β̂ 1 será pequeña. Por otro lado,
si el εi tiende a tener mayor magnitud, los puntos estarán muy dispersos alrededor de la recta, y la incertidumbre (desviaciones estándar) en los estimadores de mínimos cuadrados β̂ 0 y
β̂ 1 será mayor.
Suponga que se tienen n puntos de datos (xl, y1), . . . , (xn, yn) y se planea ajustar la recta de mínimos cuadrados. Con la finalidad de que los estimadores β̂ 0 y β̂ 1 sean útiles, se necesita estimar qué tan grandes son sus incertidumbres. Para realizar este cálculo se necesita
conocer algo acerca de la naturaleza de los errores εi. Se iniciará por estudiar la situación más
simple, en la cual se satisfacen cuatro supuestos importantes. Éstos se presentan en el cuadro
siguiente.
Supuestos para los errores en los modelos lineales
En la situación más simple los siguientes supuestos se satisfacen:
1. Los errores ε1, . . . , εn son aleatorios e independientes. En particular, la magnitud
de cualquier error εi no influye en el valor del siguiente error εi ⫹ 1.
2. Todos los errores ε1, . . . , εn tienen media 0.
3. Todos los errores ε1, . . . , εn tienen la misma varianza, que se denota por σ 2.
4. Los errores ε1, . . . , εn están distribuidos normalmente.
Estos supuestos son restrictivos, por lo que es útil analizar brevemente el grado con el cual
es aceptable incumplirlos en la práctica. Cuando el tamaño de muestra es grande, el supuesto de
normalidad (4) será menos importante. Los incumplimientos moderados del supuesto de la varianza constante (3) no importa demasiado, pero se deben corregir los graves. En la sección 7.4
se analizarán los métodos para corregir algunos incumplimientos de estos supuestos.
7.3
Incertidumbres en los coeficientes de mínimos cuadrados
509
Bajo estos supuestos, el efecto del εi lo gobierna en gran parte la magnitud de la varianza σ 2, ya que ésta determina qué tan grandes son los errores. Por tanto, con la finalidad de calcular las incertidumbres en β̂ 0 y β̂ 1, primero se debe estimar la varianza del error σ 2. Debido
a que la magnitud de la varianza se refleja en el grado de dispersión de los puntos alrededor
de la recta de mínimos cuadrados, se tiene que midiendo esta dispersión se puede calcular la
varianza. Específicamente, la distancia vertical desde cada punto de datos (xi, yi) a la recta de
mínimos cuadrados está dada por el residuo ei (véase la figura 7.10 en la sección 7.2). La dispersión de los puntos alrededor de la recta se puede medir con la suma de los residuos al cuadrado
e2i. El estimador de la varianza del error σ 2 es la cantidad s2 dada por
n 2
n
(yi − yi )2
i=1 ei
2
(7.31)
s =
= i=1
n−2
n−2
El estimador de la varianza del error es, por tanto, el promedio de los residuos al cuadrado, excepto que se divide entre n ⫺ 2 en lugar de n. La razón para esto se debe a que la
recta de mínimos cuadrados minimiza la suma
e2i, y los residuos tienden a ser un poco
más pequeños que los errores εi. Al dividir entre n ⫺ 2 en lugar de n se compensa aproximadamente este efecto.
Hay una fórmula equivalente para s2, que implica el coeficiente de correlación r, que es
con frecuencia más fácil calcular.
(1 − r 2 ) ni=1 (yi − y)2
s2 =
(7.32)
n−2
Se presenta una deducción breve de este resultado. La ecuación (7.21) (de la sección 7.2) muestra que 1 ⫺ r2 ⫽
(yi ⫺ ŷ i)2 兾
(yi ⫺ y–)2. Entonces
(yi ⫺ ŷ i)2 ⫽ (1 ⫺ r2)
(yi
2
–
⫺ y) , y se tiene que
n
(yi − yi )2
(1 − r 2 ) ni=1 (yi − y)2
s 2 = i=1
=
n−2
n−2
Bajo los supuestos 1 a 4, las observaciones yi son también variables aleatorias. Efectivamente, puesto que yi ⫽ β0 ⫹ β1xi ⫹ εi, en consecuencia yi tiene una distribución normal con media β0 ⫹ β1xi y la varianza σ 2. En particular, β1 representa el cambio en la media de y asociada
con un aumento de una unidad en el valor de x.
Resumen
En el modelo lineal yi ⫽ β0 ⫹ β1xi ⫹ εi, bajo los supuestos del 1 al 4, las observaciones y1, . . . , yn son variables aleatorias independientes que siguen la distribución normal. La media y la varianza de yi están dadas por
myi ⫽ b0 ⫹ b1xi
sy2i ⫽ s2
La pendiente β1 representa el cambio en la media de y asociada con un aumento de
una unidad en el valor de x.
510
CAPÍTULO 7
Correlación y regresión lineal simple
Ahora se pueden calcular las medias y las desviaciones estándar de β̂ 0 y β̂ 1. Las desviaciones estándar son, por supuesto, las incertidumbres. Tanto β̂ 0 como β̂ 1 se pueden expresar como combinaciones lineales de las yi, por lo que sus medias se pueden determinar
mediante la ecuación (2.49) y sus desviaciones estándar se determinan con la ecuación (2.53)
(ambas ecuaciones de la sección 2.5). Específicamente, al manipular en forma algebraica las
ecuaciones (7.13) y (7.14) (en la sección 7.2) se obtiene
n
(xi − x)
n
yi
β1 =
2
(7.33)
i=1 (xi − x)
i=1
n
1
x(xi − x)
yi
− n
β0 =
2
n
i=1 (xi − x)
i=1
(7.34)
Utilizando el hecho de que cada una de las yi tiene una media β0 ⫹ β1xi y una varianza σ 2, de
las ecuaciones (2.49) y (2.53) se obtienen los siguientes resultados, después de mucha manipulación:
mβ̂ 0 ⫽ β0
mβˆ1 ⫽ β1
σβ0 = σ
1
x2
+ n
2
n
i=1 (xi − x)
σβ1 = n
σ
i=1 (xi
− x)2
Los estimadores β̂ 0 y β̂ 1 no tienen sesgo, ya que sus medias son iguales a los valores verdaderos. También están distribuidos normalmente, porque son combinaciones lineales de las variables aleatorias normales independientes yi. En la práctica, cuando se calculan las desviaciones
estándar, por lo general no se conoce el valor de σ, por eso no se aproxima con s.
Resumen
Bajo los supuestos 1 al 4 (p. 508),
Las cantidades b̂ 0 y b̂ 1 son variables aleatorias normalmente distribuidas.
Las medias de b̂ 0 y b̂ 1 son los valores verdaderos b0 y b1, respectivamente.
Las desviaciones estándar de b̂ 0 y b̂ 1 se calculan con
sβ0 = s
y
1
x2
+ n
2
n
i=1 (xi − x)
sβ1 = n
s
2
i=1 (xi − x)
donde s ⫽
(1 − r 2 )
dar del error σ.
n
i=1 (yi
n−2
− y)2
(7.35)
(7.36)
representa un estimador de la desviación están-
7.3
Ejemplo
7.9
Incertidumbres en los coeficientes de mínimos cuadrados
511
Para los datos de la ley de Hooke, calcule s, sβˆ , y sβˆ . Estime la constante del resorte y la longitud sin carga, y determine sus incertidumbres.
1
0
Solución
En el ejemplo 7.6 (en la sección 7.2) se calculó x– ⫽ 1.9000, y– ⫽ 5.3885,
(xi ⫺ x–)2 ⫽
2
–
–
–
26.6000, y
(xi ⫺ x )(y
(yi ⫺ y) ⫽ 1.1733. La co√ i ⫺ y) ⫽ 5.4430. Ahora calcule
rrelación es r = 5.4430/ (26.6000)(1.1733) = 0.9743.
Utilizando la ecuación (7.32), s =
(1 − 0.97432 )(1.1733)
= 0.0575.
18
Utilizando la ecuación (7.35), sβ0 = 0.0575
1.90002
1
+
= 0.0248.
20 26.6000
0.0575
Utilizando la ecuación (7.36), sβ1 = √
= 0.0111.
26.6000
Los valores x más dispersos son mejores (dentro del razonamiento)
En las expresiones para las dos incertidumbres sβ̂ 0 y sβ̂ 1 en las ecuaciones (7.35) y (7.36), la
cantidad
(xi ⫺ x–)2 aparece en un denominador. Esta cantidad mide la dispersión de los
valores x; cuando se divide por la constante n ⫺ 1, es exactamente la varianza muestral de
los valores x. Como resultado, todas las otras cosas siguen igual, un experimento realizado
con mayor dispersión de los valores x dará como resultado incertidumbres más pequeñas para β̂ 0 y β̂ 1; y por tanto, una estimación más precisa de los valores verdaderos β0 y β1. Por supuesto, es importante no utilizar los valores x tan grandes o tan pequeños que estén fuera del
rango para el cual es legítimo el modelo lineal.
Resumen
Cuando se pueden elegir los valores x es mejor que estén muy dispersos. Entre más
dispersos estén, más pequeñas serán las incertidumbres en b̂ 0 y b̂ 1.
la incertidumbre sβ̂ 1, en b̂ 1 es inversamente proporcional a
Específicamente,
n
2 , o de manera equivalente, a la desviación estándar muestral de x ,
x)
(x
−
i
1
i=1
x2, . . . , xn.
Precaución: Si el rango de valores de x se extiende más allá del rango donde el
modelo lineal es válido, los resultados no lo serán.
Hay otras dos maneras de mejorar la exactitud de la recta estimada de regresión. Primero, se puede aumentar el tamaño de la suma
(xi ⫺ x–)2 tomando más observaciones; por
consiguiente, sumando más términos a la suma. Y segundo, se puede reducir el tamaño de la varianza σ 2 del error, por ejemplo, midiendo con mayor precisión. Estos dos métodos comúnmente aumentan el costo del proyecto; sin embargo, si sólo se eligen valores de x más ampliamente
dispersos con frecuencia no lo hacen.
512
Ejemplo
7.10
CAPÍTULO 7
Correlación y regresión lineal simple
Dos ingenieros están realizando experimentos independientes para estimar una constante del
resorte para un resorte dado. El primer ingeniero sugiere medir la longitud del resorte sin carga, y luego poner cargas de 1, 2, 3 y 4 lb. El segundo ingeniero sugiere utilizar cargas de 0,
2, 4, 6 y 8 lb. ¿Cuál resultado será más preciso? ¿Por qué factor?
Solución
La desviación estándar muestral de los números 0, 2, 4, 6, 8 es dos veces mayor que la de los
números, 0, 1, 2, 3, 4. Por tanto, la incertidumbre sβ̂ 1 para el primer ingeniero es dos veces
mayor que para el segundo, por lo que éste estima con una precisión del doble.
Se han hecho dos supuestos en la solución para este ejemplo. Primero, se supuso que la
varianza del error s2 es la misma para ambos ingenieros. Si ambos están usando los mismos
aparatos y el mismo procedimiento de medición, éste podría ser un supuesto seguro. Pero si
un ingeniero puede medir con mayor precisión, se necesita considerar lo anterior. Segundo,
se ha supuesto que una carga de 8 lb está dentro de la zona elástica del resorte, por lo que el
modelo lineal es aplicable en todo el rango de los datos.
Inferencias acerca de la pendiente y del intercepto
Dado un diagrama de dispersión con puntos (x1, y1), . . . , (xn, yn), se puede calcular la pendiente, β̂ 1 y el intercepto β̂ 0 de la recta de mínimos cuadrados. Se considera que éstos son los
estimadores de una pendiente verdadera β1 e intercepto β0. Ahora se explicará cómo usar estos estimadores para determinar intervalos de confianza y realizar pruebas de hipótesis respecto de los valores verdaderos β1 y β0. Los métodos presentados para una media poblacional,
basados en la distribución t de Student, se pueden adaptar fácilmente para este propósito.
Se ha visto que bajo los supuestos 1 al 4, β̂ 0 y β̂ 1 con medias β0 y β1, y desviaciones
estándar que se han estimado por sβ̂ y sβ̂ . Las cantidades (β̂ 0 ⫺ β0)兾sβ̂ 0 y (β̂ 1 ⫺ β1)兾sβ̂ 1 tienen distribuciones t de Student con n ⫺ 2 grados de libertad. El número de grados de libertad es n ⫺ 2 porque en el cálculo de sβ̂ 0 y sβ̂ 1, se divide la suma de los residuos al cuadrado
entre n ⫺ 2. Cuando el tamaño muestral n es lo suficientemente grande, la distribución normal es casi indistinguible de la t de Student y se puede utilizar en su lugar. Sin embargo, la
mayoría de los paquetes de programas computacionales usan la distribución t de Student sin
considerar el tamaño muestral.
0
1
Resumen
Bajo los supuestos 1 al 4, las cantidades
Student con n – 2 grados de libertad.
β0 − β0 β1 − β1
y
tienen la distribución t de
sβ0
sβ1
Los intervalos de confianza para β0 y β1 se pueden deducir de la misma manera como
los intervalos de confianza basados en la t de Student para una media poblacional. Sea tn⫺2,aⲐ2
7.3
Incertidumbres en los coeficientes de mínimos cuadrados
513
el punto en la curva t de Student con n ⫺ 2 grados de libertad que le corresponde un área de
a/2 en la cola derecha.
Los intervalos con un nivel de confianza de 100(1 ⫺ α)% para b0 y b1 están dados
por
b̂ 0 ⫾ tn⫺2,a兾2 ⋅ sβ̂ 0
(7.37)
b̂ 1 ⫾ tn⫺2,a兾2 ⋅ sβ̂ 1
donde
sβ0 = s
1
x2
+ n
2
n
i=1 (xi − x)
sβ1 = n
s
i=1 (xi
− x)2
Se ilustra el método anterior con algunos ejemplos.
Ejemplo
7.11
Determine un intervalo de confianza de 95% para la constante del resorte de los datos de la
ley de Hooke.
Solución
La constante del resorte es β1. Se ha calculado antes que β̂ 1 ⫽ 0.2046 (ejemplo 7.6 de la sección 7.2) y sβ̂ 1 ⫽ 0.0111 (ejemplo 7.9).
El número de grados de libertad es n ⫺ 2 ⫽ 20 ⫺ 2 ⫽ 18, por lo que el valor de t para
un intervalo de confianza de 95% es t18, .025 ⫽ 2.101. Por tanto, el intervalo de confianza para β1 es
0.2046 ⫾ (2.101)(0.0111) ⫽ 0.2046 ⫾ 0.0233 ⫽ (0.181, 0.228)
Se tiene una confianza de 95% de que el aumento de la longitud del resorte dará como resultado un aumento de 1 lb en la carga que se encuentra entre 0.181 y 0.228 pulg. Por supuesto,
este intervalo de confianza es válido solamente dentro del rango de los datos (0 a 3.8 lb).
Ejemplo
7.12
En los datos de la ley de Hooke determine un intervalo de confianza de 99% para la longitud
del resorte no cargado.
Solución
La longitud no cargada del resorte es β0. Se ha calculado β̂ 0 ⫽ 4.9997 (ejemplo 7.6) y sβ̂ 0 ⫽
0.0248 (ejemplo 7.9).
El número de grados de libertad es n ⫺ 2 ⫽ 20 ⫺ 2 ⫽ 18, por lo que el valor de t para un
intervalo de confianza de 99% es t18, .005 ⫽ 2.878. Por tanto, el intervalo de confianza para β0 es
4.9997 ⫾ (2.878)(0.0248) ⫽ 4.9997 ⫾ 0.0714 ⫽ (4.928, 5.071)
Se tiene confianza de 99% de que la longitud del resorte no cargado se encuentra entre 4.928
y 5.071 pulg.
También se pueden realizar pruebas de hipótesis sobre β0 y β1. Se presentan algunos ejemplos.
514
Ejemplo
7.13
Correlación y regresión lineal simple
CAPÍTULO 7
El fabricante del resorte de los datos de la ley de Hooke afirma que la constante del resorte β1
es de al menos 0.23 pulg/lb. Se ha calculado que la constante del resorte es β̂ 1 ⫽ 0.2046
pulg/lb. ¿Se puede concluir que la afirmación del fabricante es falsa?
Solución
Esto último requiere de una prueba de hipótesis. Las hipótesis nula y alternativa son
H0 : β1 ⱖ 0.23
contra
H1 : β1 ⬍ 0.23
La cantidad
β1 − β1
sβ1
tiene la distribución t de Student con n ⫺ 2 ⫽ 20 ⫺ 2 ⫽ 18 grados de libertad. Bajo H0 se tiene que β1 ⫽ 0.23. Por tanto, el estadístico de prueba es,
β1 − 0.23
sβ1
que se ha calculado anteriormente β̂ 1 ⫽ 0.2046 y sβ̂ 1 ⫽ 0.0248. Por tanto, el valor del estadístico de prueba es
0.2046 − 0.23
= −1.024
0.0248
Al consultar la tabla t de Student se encuentra que el P-valor se encuentra entre 0.10 y 0.25.
No se puede rechazar la afirmación del fabricante con base en estos datos.
La hipótesis nula más comúnmente probada es H0 : β1 ⫽ 0. Si esta hipótesis es verdadera, entonces no hay ninguna tendencia de que y aumente o disminuya cuando x aumenta.
Esto implica que x y y no tienen ninguna relación lineal. En general, si la hipótesis de que β1
⫽ 0 no es rechazada, no se debe utilizar el modelo lineal para pronosticar y a partir de x.
Ejemplo
7.14
La capacidad de una unión soldada de elongarse bajo tensión está afectada por el compuesto
químico del metal de soldadura. En un experimento para determinar el efecto del contenido
de carbono (x) sobre la elongación (y) se elongaron 39 soldaduras hasta la fractura, y se midió tanto el contenido de carbono (en partes por mil) como la elongación (en %). Se calcularon los siguientes resúmenes estadísticos:
n
i=1
(xi − x)2 = 0.6561
n
i=1
(xi − x)(yi − y) = −3.9097
s = 4.3319
Suponiendo que x y y siguen un modelo lineal, calcule el cambio estimado en la elongación
debido a un aumento de una parte por mil en el contenido de carbono. ¿Se debe utilizar el modelo lineal para pronosticar la elongación del contenido de carbono?
7.3
Incertidumbres en los coeficientes de mínimos cuadrados
515
Solución
El modelo lineal es y ⫽ β0 ⫹ β1x ⫹ ε, y el cambio en la elongación (y) debido a una parte por
mil aumentada en el contenido de carbono (x) es β1. Las hipótesis nula y alternativa son
H0 : β1 ⫽ 0
contra
H1 : β1 ⫽ 0
La hipótesis nula establece que incrementar el contenido de carbono no afecta la elongación,
mientras que la hipótesis alternativa establece que lo hace. La cantidad
β1 − β1
sβ1
tiene la distribución t de Student con n ⫺ 2 ⫽ 39 ⫺ 2 ⫽ 37 grados de libertad. Bajo H0, β1
⫽ 0. Por tanto, el estadístico de prueba es
β1 − 0
Se calculan β̂ 1 y sβ̂ 1:
β1 =
sβ1
n
i=1 (xi − x)(yi −
n
2
i=1 (xi − x)
sβ1 = n
s
i=1 (xi
− x)2
y)
=
− 3.9097
= − 5.959
0.6561
= 5.348
El valor del estadístico de prueba es
− 5.959 − 0
= − 1.114
5.348
La tabla t muestra que el P-valor es mayor a 0.20. No se puede concluir que el modelo lineal
sea útil para pronosticar la elongación a partir del contenido de carbono.
Inferencias sobre la respuesta media
En el ejemplo 7.8 (sección 7.2) se calculó que la longitud de un resorte bajo una carga de
1.4 lb era de 5.29 pulg. Debido a que esta estimación estaba basada en mediciones sujetas a
la incertidumbre, la estimación en sí misma está sujeta a la incertidumbre. Para que la estimación sea más útil, se debe construir un intervalo de confianza alrededor de ésta con el propósito de reflejar su incertidumbre. Ahora se describe cómo hacer esto para el caso general
donde la carga sobre el resorte es x lb.
Si se hubiera tomado una medición de la longitud y del resorte bajo una carga de x libras, la media de y sería la longitud verdadera (o “respuesta media”) β0 ⫹ β1x, donde β1 es la
constante del resorte verdadera y β0 es la longitud sin carga verdadera del resorte. Calculamos esta longitud con ŷ ⫽ β̂ 0 ⫹ β̂ 1x. Puesto que β̂ 0 y β̂ 1 están distribuidos por lo general con
medias β0 y β1, respectivamente, por lo cual ŷ de manera habitual está distribuido con media
β0 ⫹ β1x.
Al utilizar ŷ para determinar un intervalo de confianza se debe conocer su desviación
estándar. Esta última se obtiene mediante ŷ como una combinación lineal de los yi y utilizando la ecuación (2.53) (en la sección 2.5). Las ecuaciones (7.33) y (7.34) expresan β̂ 1 y β̂ 0 co-
516
CAPÍTULO 7
Correlación y regresión lineal simple
mo combinaciones lineales de las yi. Puesto que ŷ ⫽ β̂ 0 ⫹ β̂ 1x, estas ecuaciones, después de
algunas manipulaciones algebraicas, se tiene que
n
xi − x
1
yi
+ (x − x) n
y =
2
n
i=1 (xi − x)
i=1
(7.38)
Ahora se puede usar la ecuación (2.53) para obtener una expresión por la desviación estándar
de ŷ . Aquélla depende del error de varianza σ 2. Puesto que en la práctica no se conoce por lo
general el valor de σ, se aproxima con s. La desviación estándar de ŷ es aproximada por
sy = s
1
(x − x)2
+ n
2
n
i=1 (xi − x)
(7.39)
La cantidad [ŷ ⫺ (β0 ⫹ β1x)]兾sŷ tiene una distribución t de Student con n ⫺ 2 grados de libertad. Ahora se puede proporcionar la expresión para un intervalo de confianza destinado a
la respuesta media.
Un intervalo con un nivel de confianza de 100(1 ⫺ α)% para la cantidad β0 ⫹ β1x está dado por
β0 + β1 x ± tn−2,α/2 · sy
(7.40)
donde sy = s
Ejemplo
7.15
(x − x)2
1
+ n
.
2
n
i=1 (xi − x)
Mediante los datos de la ley de Hooke calcule un intervalo de confianza de 95% para la longitud de un resorte bajo una carga de 1.4 lb.
Solución
Se calculará ŷ , sŷ, β̂ 0, y β̂ 1, y se utilizará la expresión (7.40). El número de puntos es n ⫽ 20.
En el ejemplo 7.9 se calculó s ⫽ 0.0575. En el ejemplo 7.6 (de la sección 7.2) se calculó a x– ⫽
1.9,
(xi ⫺ x–)2 ⫽ 26.6, β̂ 1 ⫽ 0.2046 y β̂ 0 ⫽ 4.9997. Utilizando x ⫽ 1.4, ahora se calcula
ŷ ⫽ β̂ 0 ⫹ β̂ 1 ⫽ 4.9997 ⫹ (0.2046)(1.4) ⫽ 5.286
Utilizando la ecuación (7.39) con x ⫽ 1.4 se obtiene
sy = 0.0575
(1.4 − 1.9)2
1
+
= 0.0140
20
26.6
El número de grados de libertad es n ⫺ 2 ⫽ 20 ⫺ 2 ⫽ 18. Se encuentra que el valor de t es
t18, .025 ⫽ 2.101. Sustituyendo en la ecuación (7.40) se determina el intervalo de confianza de
95% para la longitud β0 ⫹ β1(1.4) de
5.286 ⫾ (2.101)(0.0140) ⫽ 5.286 ⫾ 0.0294 ⫽ (5.26, 5.32)
7.3
Ejemplo
7.16
517
Incertidumbres en los coeficientes de mínimos cuadrados
En un estudio de la relación entre el contenido de oxígeno (x) y fuerza de prueba final (y) de
soldaduras se obtuvieron los datos que se presentan en la tabla siguiente para 29 soldaduras.
Aquí el contenido de oxígeno se mide en partes por mil, y la fuerza se mide en ksi. Utilizando un modelo lineal, determine un intervalo de confianza de 95% para la media de la fuerza
de las soldaduras con contenido de oxígeno de 1.7 partes por mil. (Del artículo “Advances in
Oxygen Equivalence Equations for Predicting the Properties of Titanium Welds”, D. Harwig,
W. Ittiwattana y H. Castner, en The Welding Journal, 2001:126s⫺136s.)
Contenido
de oxígeno
Fuerza
Contenido
de oxígeno
Fuerza
1.08
1.19
1.57
1.72
1.80
1.65
1.50
1.60
1.20
1.80
63.00
76.00
66.33
79.67
72.50
78.40
72.00
83.20
71.85
87.15
1.16
1.32
1.61
1.70
1.69
1.78
1.50
1.70
1.30
1.40
68.00
79.67
71.00
81.00
68.65
84.40
75.05
84.45
70.25
68.05
Contenido
de oxígeno
Fuerza
1.17
1.40
1.69
1.71
1.63
1.70
1.60
1.60
1.30
73.00
81.00
75.00
75.33
73.70
91.20
79.55
73.95
66.05
Solución
Se calculan las cantidades siguientes (se pueden utilizar las fórmulas para el cálculo de la p. 495):
x = 1.51966 y = 75.4966
n
i=1
n
i=1
(xi − x)2 = 1.33770
β0 = 49.7796
(xi − x)(yi − y) = 22.6377
n
i=1
(yi − y)2 = 1 304.23
β1 = 16.9229
s = 5.84090
La estimación de la media de la fuerza para soldaduras con contenido de oxígeno de 1.7 es
ŷ ⫽ β̂ 0 ⫹ β̂ 1(1.7) ⫽ 49.7796 ⫹ (16.9229)(1.7) ⫽ 78.5485
La desviación estándar estimada de ŷ es
sy = s
(x − x)2
1
+ n
2
n
i=1 (xi − x)
= 5.84090
(1.7 − 1.51966)2
1
+
29
1.33770
= 1.4163
Hay n ⫺ 2 ⫽ 29 ⫺ 2 ⫽ 27 grados de libertad. Por tanto, el valor t es t27, .025 ⫽ 2.052. El intervalo de confianza de 95% es
78.5485 ⫾ (2.052)(1.4163) ⫽ 78.5485 ⫾ 2.9062 ⫽ (75.64, 81.45)
518
CAPÍTULO 7
Correlación y regresión lineal simple
Se pueden realizar pruebas de hipótesis sobre la respuesta media, utilizando una distribución t de Student. A continuación se presenta un ejemplo.
Ejemplo
7.17
Con referencia al ejemplo 7.15, sea µ0 la longitud verdadera del resorte bajo una carga de
1.6 lb. Pruebe la hipótesis H0 : µ0 ≤ 5.3 contra H1 : µ0 > 5.3.
Solución
Ya que µ0 es la longitud verdadera del resorte bajo una carga de 1.6 lb, µ0 ⫽ β0 ⫹ β1 (1.6).
Ahora sea ŷ ⫽ β̂ 0 ⫹ β̂ 1(1.6). La cantidad
y − [β0 + β1 (1.6)]
y − µ0
=
sy
sy
tiene la distribución t de Student con n ⫺ 2 ⫽ 18 grados de libertad. Bajo H0 se tiene que µ0
⫽ 5.3. Por tanto, el estadístico de prueba es
y − 5.3
sy
Se calculan ŷ y sŷ :
y = β0 + β1 (1.6) = 4.9997 + (0.2046)(1.6) = 5.3271
sy = 0.0575
1
(1.6 − 1.9)2
+
= 0.0133
20
26.6000
El valor del estadístico de prueba es
5.3271 − 5.3
= 2.04
0.0133
El P-valor se encuentra entre 0.025 y 0.05. Es razonable concluir que la longitud verdadera
es mayor a 5.3 pulg.
Intervalos de predicción para futuras observaciones
En el ejemplo 7.16 se encontró un intervalo de confianza para la media de la fuerza de soldaduras con contenido de oxígeno de 1.7 partes por mil. He aquí un escenario algo diferente:
suponga que se desea pronosticar la fuerza de una soldadura dada cuyo contenido de oxígeno es 1.7, en lugar de la media de la fuerza de todas estas soldaduras.
Utilizando los valores calculados en el ejemplo 7.16, se pronostica que la fuerza de esta soldadura es ŷ ⫽ β̂ 0 ⫹ β̂ 1(1.7) ⫽ 49.7796 ⫹ (16.9229)(1.7) ⫽ 78.5485. Este pronóstico
es el mismo que la estimación de la media de la fuerza de todas las soldaduras con un contenido de oxígeno de 1.7. Ahora se quiere poner un intervalo alrededor de este pronóstico para
indicar su incertidumbre. Con el propósito de calcular este intervalo de predicción es preciso determinar la incertidumbre en el pronóstico.
La media de la fuerza de las soldaduras con contenido de oxígeno de 1.7 es β0 ⫹
β1 (1.7). La fuerza verdadera de una soldadura dada es igual a β0 ⫹ β1 (1.7) ⫹ ε, donde ε representa la diferencia aleatoria entre la fuerza de la soldadura dada y la media de la fuerza de
7.3
Incertidumbres en los coeficientes de mínimos cuadrados
519
todas las soldaduras cuyo contenido de oxígeno es 1.7. El error en la predicción de la fuerza
de una soldadura dada con ŷ representa el error de la predicción
ŷ ⫺ [β0 ⫹ β1(1.7)] ⫺ ε
(7.41)
La incertidumbre en la predicción de la fuerza de la soldadura dada es la desviación estándar
de este error de predicción. Se mostrará brevemente cómo calcular esta desviación estándar.
La cantidad β0 ⫹ β1(1.7) es constante y no afecta la desviación estándar. Las cantidades ŷ y
ε son independientes, ya que ŷ se calcula de los datos del ejemplo 7.16, mientras que ε se aplica a una soldadura que no es parte de ese conjunto de datos. Ello da como resultado que la
desviación estándar del error de la predicción (7.41) se aproxime por
spred = sy2 + s 2
Utilizando la ecuación (7.39) al sustituir sŷ se obtiene
spred = s
1+
1
(x − x)2
+ n
2
n
i=1 (xi − x)
(7.42)
Ahora se puede determinar la expresión apropiada para el intervalo de predicción.
Un intervalo de predicción con un nivel de 100(1 ⫺ α)% para la cantidad β0 ⫹ β1x
está dado por
β0 + β1 x ± tn−2,α/2 · spred
(7.43)
donde spred = s
1+
(x − x)2
1
+ n
.
2
n
i=1 (xi − x)
Observe que el intervalo de predicción es más amplio que el de confianza, porque el valor 1 se suma a la cantidad bajo la raíz cuadrada para considerar la incertidumbre adicional.
Ejemplo
7.18
Para los datos de la soldadura del ejemplo 7.16, determine un intervalo de predicción de 95%
para la fuerza de una soldadura específica cuyo contenido de oxígeno es 1.7 partes por mil.
Solución
La fuerza pronosticada es ŷ ⫽ β̂ 0 ⫹ β̂ 1 (1.7), que se calculó en el ejemplo 7.16 de 78.5485.
Utilizando las cantidades que se presentan en el ejemplo 7.16, se calculó el valor de spred
de
1
(1.7 − 1.51966)2
spred = 5.84090 1 +
+
= 6.0102
29
1.33770
Hay n ⫺ 2 ⫽ 29 ⫺ 2 ⫽ 27 grados de libertad. El valor de t es, por tanto, t27, .025 ⫽ 2.052. Por
tanto, el intervalo de predicción de 95% es
78.5485 ⫾ (2.052)(6.0102) ⫽ 78.5485 ⫾ 12.3329 ⫽ (66.22, 90.88)
520
CAPÍTULO 7
Correlación y regresión lineal simple
100
100
90
90
Última fuerza probada (ksi)
Última fuerza probada (ksi)
Tanto los intervalos de confianza como los intervalos de predicción que se han descrito corresponden a un valor específico de x. En los ejemplos 7.16 y 7.18 se tomó x ⫽ 1.7. Al
calcular los intervalos para muchos valores de x y conectar los puntos con una curva suave,
se obtienen las bandas de confianza o bandas de predicción, respectivamente. La figura
7.13 muestra las bandas de confianza de 95% y bandas de predicción para los datos de la soldadura presentados en el ejemplo 7.16. Para cualquier contenido de oxígeno dado, las bandas
de confianza de 95% y las de predicción se pueden leer de la figura.
80
70
60
50
1
1.1
1.2 1.3 1.4 1.5 1.6 1.7 1.8
Contenido de oxígeno (partes por mil)
1.9
80
70
60
50
1
1.1
1.2 1.3 1.4 1.5 1.6 1.7 1.8
Contenido de oxígeno (partes por mil)
a)
1.9
b)
FIGURA 7.13 Contenido de oxígeno contra la última fuerza probada para 29 soldaduras. En ambas figuras, la recta punteada representa la recta de mínimos cuadrados. a) Las dos curvas sólidas son las bandas de confianza de 95%. Dado cualquier
contenido de oxígeno, se tiene una confianza de 95% de que la media de la fuerza para soldaduras con ese contenido de oxígeno se encuentre entre los límites de confianza superior e inferior. b) Las dos curvas sólidas son las bandas de predicción de
95%. Dada cualquier soldadura específica, se tiene una confianza de 95% de que la fuerza para esa soldadura específica se
encuentre entre los límites de predicción superior e inferior correspondiendo al contenido de oxígeno de esa soldadura.
Las bandas de confianza y de predicción proporcionan una presentación visual agradable de la forma en que la incertidumbre depende del valor de la variable independiente. Observe que tanto el intervalo de confianza como el de predicción son más angostos cuando x ⫽
x– , y aumentan el ancho conforme x se aleja de x–. Esto último se debe al término (x ⫺ x–)2 que
aparece en el numerador en las expresiones para sŷ y spred. Se concluye que las predicciones
basadas en la recta de mínimos cuadrados son más precisas cerca del centro del diagrama
de dispersión y lo son menos cerca de los extremos.
Observe que las bandas de confianza indican intervalos de confianza para valores individuales de x. No proporcionan una región de confianza para la recta verdadera y ⫽ β0 ⫹ β1x.
En otras palabras, no se puede tener una confianza de 95% de que la recta verdadera se encuentre en las bandas de confianza de 95%.
Interpretación de los resultados de computadora
En la actualidad, los cálculos de mínimos cuadrados usualmente se hacen en una computadora empleando un software como MINITAB. El siguiente resultado de MINITAB corresponde
a los datos de la ley de Hooke.
7.3
Incertidumbres en los coeficientes de mínimos cuadrados
521
Regression Analysis: Length versus Weight
The regression equation is
Length = 5.00 + 0.205 Weight (1)
Predictor
Constant
Weight
Coef (2)
4.99971
0.20462
SE Coef (3)
0.02477
0.01115
S = 0.05749 (6) R–Sq = 94.9% (7)
T (4)
201.81
18.36
P (5)
0.000
0.000
R-Sq(adj) = 94.6%
Analysis of Variance (8)
Source
Regression
Residual Error
Total
DF
1
18
19
SS
1.1138
0.0595
1.1733
MS
1.1138
0.0033
F
337.02
P
0.000
Unusual Observations (9)
Obs
12
Weight
2.20
Length
5.5700
Fit
5.4499
SE Fit
0.0133
Residual
0.1201
St Resid
2.15R
R denotes an observation with a large standardized residual
Predicted Values for New Observations (10)
New Obs
1
Fit
5.2453
SE Fit
0.0150
95.0% CI
( 5.2137, 5.2769)
95.0% PI
( 5.1204, 5.3701)
Values of Predictors for New Observations (11)
New Obs
1
Weight
1.20
Ahora se explicarán las cantidades etiquetadas en el resultado:
(1) Es la ecuación de la recta de mínimos cuadrados.
(2) Coef: los coeficientes β̂ 0 ⫽ 4.99971 y β̂ 1 ⫽ 0.20462.
(3) SE Coef: las desviaciones estándar sβ̂ 0 y sβ̂ 1. (“SE” significa el error estándar, otro término por la desviación estándar.)
(4) T: los valores de los estadísticos t de Student para probar las hipótesis β0 ⫽ 0 y β1 ⫽ 0.
El estadístico t es igual al coeficiente dividido entre su desviación estándar.
(5) P: Los P-valores para las pruebas de las hipótesis β0 ⫽ 0 y β1 ⫽ 0. El P-valor más importante es el de β1. Si este P-valor no es lo suficientemente pequeño para rechazar la hipótesis de que β1 ⫽ 0, el modelo lineal no es útil para predecir y a partir de x. En este
ejemplo, los P-valores son extremadamente pequeños, indicando que β0 ni β1 son iguales a 0.
522
CAPÍTULO 7
Correlación y regresión lineal simple
(6) S: la estimación s de la desviación estándar del error.
(7) R-Sq: éste es r2, el cuadrado del coeficiente de correlación r, también llamado coeficiente de determinación.
(8) Análisis de varianza: esta tabla no es tan importante en la regresión lineal simple cuando
sólo hay una variable independiente. Es más importante en la regresión múltiple, donde
hay algunas variables independientes. Sin embargo, es notable que los tres números de la
columna etiquetada con “SS” son la suma de cuadrados de regresión
(ŷ i ⫺ y–)2, la
2
suma de cuadrados del error
(yi ⫺ ŷ i) , y su suma, la suma total de cuadrados
(yi ⫺ y–)2.
(9) Observaciones inusuales: aquí MINITAB trata de alertarlo acerca de los puntos de datos que pueden incumplir algunos de los supuestos del 1 al 4 analizados. MINITAB es
conservador y con frecuencia lista varios de esos puntos, incluso cuando los datos están
bien descritos con un modelo lineal. En la sección 7.4 se aprenderán algunos métodos
gráficos para comprobar los supuestos del modelo lineal.
(10) Valores predichos para las nuevas observaciones: éstos son los intervalos de confianza y los de predicción para valores de x especificados por el usuario. Aquí se especifica
x ⫽ 1.2 para el peso. El “Fit” es el valor ajustado ŷ ⫽ β̂ 0 ⫹ β̂ 1x y “SE Fit” es la desviación estándar sŷ. Después se presentan los intervalos de confianza y de predicción del
95%, respectivamente.
(11) Valores de los indicadores para las nuevas observaciones: ésta es sólo una lista de los
valores de x para los cuales se han calculado los intervalos de confianza y de predicción.
Éste muestra que estos intervalos se refieren a un peso de x ⫽ 1.2.
Ejercicios para la sección 7.3
1. Se está evaluado un nuevo resorte. Se han colgado veinticinco pesas xi, y se mide para cada una la longitud del resorte yi. Los
pesos se miden en libras, y la longitud, en pulgadas. Se registró el siguiente resumen estadístico.
x = 2.40
25
i=1
25
y = 12.18
(yi − y)2 = 498.96
i=1
25
i=1
(xi − x)2 = 52.00
(xi − x)(yi − y) = 160.27
Sea β0 la longitud del resorte en reposo, y β1 el aumento en la longitud ocasionado por una carga de 1 lb. Suponga que los supuestos del 1 al 4 de la p. 508 son válidos.
a) Calcule los estimadores de mínimos cuadrados β̂ 0 y β̂ 1.
b) Calcule la estimación de la varianza del error s2.
c) Determine los intervalos de confianza del 95% para β0 y β1.
d) El fabricante del resorte afirma que la constante del resorte no es mayor de 3 pulg/lb. ¿Los datos proporcionan evidencias
suficientes para rechazar esta afirmación?
e) También se afirma que la longitud sin carga del resorte es de al menos 5.5 pulg. ¿Los datos proporcionan pruebas suficientes para rechazar esta afirmación?
f) Determine un intervalo de confianza de 99% para la longitud del resorte bajo una carga de 1.5 lb.
7.3
Incertidumbres en los coeficientes de mínimos cuadrados
523
g) Determine un intervalo de predicción de 99% para la longitud medida del resorte bajo una carga de 1.5 lb.
h) Cuál es más útil en este caso, ¿el intervalo de confianza o el intervalo de predicción? Explique.
2. Para muchos compuestos químicos, la cantidad que se disolverá en un volumen de agua específico depende de la temperatura.
El siguiente resultado de MINITAB describe el ajuste de un modelo lineal y ⫽ β0 ⫹ β1x ⫹ ε que expresa el número de gramos de cierto compuesto químico disueltos por litro de agua (y) con respecto a la temperatura en °C de (x). Hay n ⫽ 6 observaciones.
Predictor
Constant
Temperature
Coef
1.4381
0.30714
SE Coef
0.62459
0.02063
T
2.30
14.9
P
0.083
0.000
Hay n ⫽ 6 observaciones. ¿Cuántos grados de libertad hay para los estadísticos t de Student?
Determine un intervalo de confianza de 95% para β1.
Determine un intervalo de confianza de 95% para β0.
Alguien afirma que si la temperatura del agua se aumentara en 1°C, la media del número de gramos disueltos aumentará en
exactamente 0.40. Utilice el resultado para realizar una prueba de hipótesis con el fin de determinar si esta afirmación puede ser rechazada.
e) Alguien afirma que la media del número de gramos que se puede disolver en un litro de agua a 0°C es menor a 1.0. Utilice el
resultado dado para realizar una prueba de hipótesis con el propósito de determinar si esta afirmación puede ser rechazada.
a)
b)
c)
d)
3. Los óxidos de nitrógeno (NOx) constituyen un componente muy importante de la contaminación atmosférica producida por vehículos automotores. En un estudio para determinar la relación entre la carga sobre un motor y la producción de NOx, un vehículo fue manipulado en un laboratorio de prueba a diferentes velocidades. Se realizaron mediciones periódicas de los caballos de
fuerza (x) y de las emisiones de NOx (y). Las emisiones de NOx se midieron en mg/s. El siguiente resultado de MINITAB describe el ajuste de un modelo lineal con estos datos. Suponga que los supuestos del 1 al 4 de la p. 508 son válidos.
The regression equation is
Chassis NOx = 44.5 + 0.845 Chassis HP
Predictor
Constant
Chassis HP
Coef
44.534
0.84451
S = 24.62
SE Coef
2.704
0.03267
R–Sq = 84.7%
T
16.47
25.85
P
0.000
0.000
R–Sq(adj) = 84.5%
Predicted Values for New Observations
New Obs
1
Fit
78.31
SE Fit
2.23
95.0% CI
( 73.89, 82.73)
95.0% PI
( 29.37, 127.26)
Values of Predictors for New Observations
New Obs
1
a)
b)
c)
d)
e)
Chassis HP
40.0
¿Cuáles son la pendiente y el intercepto de la recta de mínimos cuadrados?
¿El modelo lineal es útil para predecir las tasas de emisión de NOx a partir de los caballos de fuerza? Explique.
Pronostique la tasa de emisión de NOx si el motor se detiene a los 10 caballos de fuerza.
¿Cuál es la correlación entre caballos de fuerza y tasa de emisiones de NOx?
El resultado proporciona un intervalo de confianza de 95% para la media de la tasa de emisiones de NOx a 40 caballos de
fuerza. Hay n ⫽ 123 observaciones en el conjunto de datos. Utilizando el valor “SE Fit”, determine un intervalo de confianza de 90%.
524
CAPÍTULO 7
Correlación y regresión lineal simple
f) Alguien planea operar el motor a 40 caballos de fuerza, y predice que la tasa de emisiones de NOx será de 180 mg/s. ¿Ésta es una predicción razonable? Si es así, explique por qué. Si no, dé un rango razonable de valores predichos.
4. En un experimento similar al del ejercicio 3, el motor se retira del chasis y se acciona. Se miden los caballos de fuerza y la tasa de emisión de NOx. A continuación se muestra el resultado de MINITAB. Suponga que los supuestos del 1 al 4 de la p. 508
son válidos.
The regression equation is
Engine NOx = 33.0 + 0.753 Engine HP
Predictor
Constant
Engine HP
Coef
33.042
0.75269
S = 22.79
SE Coef
2.371
0.02912
R–Sq = 84.7%
T
13.94
25.85
P
0.000
0.000
R–Sq(adj) = 84.5%
a) ¿Cuál es la pendiente de la recta de mínimos cuadrados?
b) Hay 123 puntos en el conjunto de datos. Determine un intervalo de confianza de 95% para la pendiente.
c) Realice una prueba con la hipótesis nula de que la pendiente es mayor que o igual a 0.8. ¿Cuál es el P-valor?
5. Con referencia a los ejercicios 3 y 4, el ingeniero nota que la pendiente de la recta de mínimos cuadrados en el experimento
descrito en el ejercicio 4 es menor que en el experimento descrito en el 3. Quiere probar la hipótesis de que el efecto de los caballos de fuerza en la tasa de emisiones de NOx depende de si el motor está dentro o fuera del chasis. Sea βC el aumento en la
tasa de emisiones debido a un aumento de 1 hp con el motor dentro del chasis, y que βE denote el aumento correspondiente con
el motor fuera del chasis.
a) Exprese la hipótesis nula que debe probarse en función de βC y βE.
b) Sean β̂ C y β̂ E las pendientes de las rectas de mínimos cuadrados. Suponga que estas pendientes son independientes. Hay
123 observaciones en cada conjunto de datos. Pruebe la hipótesis nula en el inciso a). ¿Puede concluir que el efecto de los
caballos de fuerza es diferente en los dos casos?
6. El artículo “Withdrawal Strength of Threaded Nails” (D. Rammer, S. Winistorfer y D. Bender, en Journal of Structural Engineering 2001:442⫺449) describe un experimento para investigar la relación entre el diámetro de un clavo (x) y su fuerza retirada final (y). Se colocaron clavos de forma anular enhebrados en madera de abeto de Douglas, y después se midieron sus
fuerzas de retirada en N/mm. Se obtuvieron los resultados siguientes para diez diámetros diferentes (en mm).
x
2.52
2.87
3.05
3.43
3.68
3.76
3.76
4.50
4.50
5.26
y
54.74
59.01
72.92
50.85
54.99
60.56
69.08
77.03
69.97
90.70
a) Calcule la recta de mínimos cuadrados para predecir la fuerza a partir del diámetro.
b) Calcule la estimación s de la desviación estándar del error.
c) Calcule un intervalo de confianza de 95% para la pendiente.
d) Determine un intervalo de confianza de 95% para la media de la fuerza de retirada de clavos de 4 mm de diámetro.
e) ¿Puede concluir que la media de la fuerza de retirada de clavos de 4 mm de diámetro es mayor que 60 N/mm? Realice una
prueba de hipótesis y reporte el P-valor.
f) Determine un intervalo de predicción de 95% para la fuerza de retirada de un clavo especial cuyo diámetro es de 4 mm.
7. En un estudio para determinar la relación entre la permeabilidad (en cm/m) y la resistencia eléctrica (en kΩ · cm2) de piel humana se reunieron los datos de la tabla siguiente. Suponga que los supuestos del 1 al 4 de la p. 508 son válidos.
7.3
525
Incertidumbres en los coeficientes de mínimos cuadrados
Perm.
Res.
Perm.
Res.
Perm.
Res.
Perm.
Res.
1.39
1.21
1.58
1.35
1.76
1.57
1.32
1.13
1.70
1.79
1.09
1.29
0.90
1.21
0.65
0.97
0.40
0.65
0.95
1.33
0.44
0.37
1.34
0.99
1.08
1.79
1.54
2.04
1.51
1.16
1.71
1.64
1.67
1.19
1.56
1.63
1.35
0.40
0.80
0.17
0.94
1.13
0.57
0.65
0.62
1.22
0.78
0.64
1.53
1.79
1.45
1.46
1.47
1.67
1.81
1.40
1.82
1.49
1.23
0.94
0.41
0.82
0.83
0.79
0.59
0.47
0.90
0.37
0.78
1.01
1.57
1.49
1.68
1.52
1.29
1.90
1.10
1.67
1.66
1.46
1.85
0.72
0.66
0.67
0.79
0.96
0.27
1.28
0.57
0.54
0.82
0.40
Calcule la recta de mínimos cuadrados para pronosticar la permeabilidad (y) a partir de la resistencia (x).
Calcule los intervalos de confianza de 95% para β0 y β1.
Pronostique la permeabilidad de la piel cuya resistencia es 1.7 kΩ.
Determine un intervalo de confianza de 95% para la media de la permeabilidad para todas las muestras de piel con una resistencia de 1.7 kΩ.
e) Determine un intervalo de confianza de 95% para la permeabilidad de la piel cuya resistencia es 1.7 kΩ.
a)
b)
c)
d)
8. Tres ingenieros están calculando de manera independiente la constante de un resorte usando el modelo lineal especificado por la
ley de Hooke. El ingeniero A mide la longitud del resorte bajo cargas de 0, 1, 3, 4 y 6 lb para un total de cinco mediciones. El ingeniero B utiliza las mismas cargas, pero repite el experimento dos veces para un total de diez mediciones independientes. El
ingeniero C usa cargas de 0, 2, 6, 8 y 12 lb midiendo una vez para cada carga. Todos los ingenieros usan los mismos aparatos de
medición y el mismo procedimiento. Cada ingeniero calcula un intervalo de confianza de 95% para la constante del resorte.
a) Si el ancho del intervalo del ingeniero A se divide entre el ancho del intervalo del ingeniero B, el cociente será aproximadamente_______.
b) Si el ancho del intervalo del ingeniero A se divide entre el ancho del intervalo del ingeniero C, el cociente será aproximadamente________.
c) Cada ingeniero calcula un intervalo de confianza de 95% para la longitud del resorte bajo una carga de 2.5 libras. ¿Cuál intervalo es probable que sea el más corto? ¿Cuál será el más largo?
9. En los datos de las soldaduras (ejemplo 7.16), imagine que los intervalos de confianza de 95% se calculan para la media de la
fuerza de las soldaduras con contenido de oxígeno de 1.3, 1.5 y 1.8 partes por mil. ¿Cuál de los intervalos de confianza sería
el más corto? ¿Cuál sería el más largo?
10. Con referencia al ejercicio 1, si se construyen intervalos de confianza de 95% para la longitud del resorte con cargas de 2.15,
2.57 y 2.45 libras, ¿qué intervalo de confianza sería el más corto? ¿Cuál sería el más largo?
11. En un estudio de barras de cobre, la relación entre la tensión de corte en ksi (x) y la de corte en % (y) se resumió por la recta de
mínimos cuadrados y ⫽ ⫺20.00 ⫹ 2.56x. Había un total de n ⫽ 17 observaciones, y el coeficiente de la determinación era r2
⫽ 0.9111. Si la suma total de cuadrados fuera
(yi ⫺ y–)2 ⫽ 234.19, calcule la estimación de la varianza del error s2.
12. En la fabricación de fibras sintéticas con frecuencia es “puesta” a temperaturas altas. El propósito es mejorar las propiedades
de encogimiento de la fibra. En una prueba de 25 elementos de hilo, la relación entre la temperatura en °C (x) y el encogimiento en % (y) se resumió mediante la recta de mínimos cuadrados y ⫽ ⫺12.789 ⫹ 0.133x. La suma total de cuadrados fue
526
CAPÍTULO 7
Correlación y regresión lineal simple
(yi ⫺ y–)2 ⫽ 57.313, y la estimación de la varianza del error aproximadamente fue s2 ⫽ 0.0670. Calcule el coeficiente de la
determinación r2.
13. En el siguiente resultado de MINITAB, algunos de los números han sido accidentalmente borrados. Calcúlelos de nuevo empleando los números aún disponibles. Hay n ⫽ 25 puntos en el conjunto de datos.
The regression equation is
Y = 1.71 + 4.27 X
Predictor
Constant
X
Coef
1.71348
4.27473
SE Coef
6.69327
(c)
S = 0.05749
R-Sq = 38.2%
T
(a)
3.768
P
(b)
(d)
14. En el siguiente resultado de MINITAB, algunos de los números han sido accidentalmente borrados. Calcúlelos otra vez aprovechando los números aún disponibles. Hay n ⫽ 20 puntos en el conjunto de datos.
Predictor
Constant
X
Coef
(a)
0.18917
SE Coef
0.43309
0.065729
S = 0.67580
R-Sq = 31.0%
T
0.688
(c)
P
(b)
(d)
15. Con la finalidad de aumentar la producción de pozos de gas, con frecuencia se usa un procedimiento conocido como “tratamiento de fractura”. Fracturar el fluido consiste en mezclarlo con arena y bombearla dentro del pozo. La siguiente figura presenta un diagrama de dispersión de la producción mensual contra el volumen del fluido fracturado bombeado para 255 pozos
de gas. Tanto la producción como el fluido están expresados en unidades de volumen por pie de profundidad del pozo. La recta de mínimos cuadrados está sobrepuesta. La ecuación de la recta de mínimos cuadrados es y ⫽ 106.11 ⫹ 0. 1119x.
1 600
Producción (1000 pies3/pie)
1 400
1 200
1 000
800
600
400
200
0
0
2 000
4 000
6 000
Fluido fracturado (gal/pie)
8 000
a) De la recta de mínimos cuadrados, calcule la producción para un pozo en el cual se han bombeado 4 000 gal/pie.
b) De la recta de mínimos cuadrados, calcule la producción para un pozo en el cual se han bombeado 500 gal/pie.
c) Se ha excavado un nuevo pozo y se han bombeado 500 gal/pie. Con base en el diagrama de dispersión, ¿es más probable
que la producción de este pozo se encontrará arriba o debajo de lo estimado con mínimos cuadrados?
d) ¿Qué característica del diagrama de dispersión indica que no se cumple el supuesto 3 de la pág. 508?
7.4
7.4
Comprobación de supuestos y transformación de datos
527
Comprobación de supuestos y transformación de datos
Los métodos que se han analizado hasta ahora son válidos bajo el supuesto de que la relación
entre las variables x y y satisfacen el modelo lineal yi ⫽ β0 ⫹ β1xi ⫹ εi, donde los errores εi satisfacen los supuestos 1 al 4. Estos supuestos se repiten aquí.
Supuestos para los errores en los modelos lineales
1. Los errores ε1, . . . , εn son aleatorios e independientes. En particular, la magnitud
de cualquier error εi no influye en el valor del siguiente error εi ⫹ 1.
2. Todos los errores ε1, . . . , εn tienen media 0.
3. Todos los errores ε1, . . . , εn tienen la misma varianza, que se denota mediante σ 2.
4. Los errores ε1, . . . , εn están distribuidos normalmente.
Como ya se mencionó, el supuesto de normalidad (4) es menos importante cuando el
tamaño de muestra es grande. Mientras que los incumplimientos moderados del supuesto de
varianza constante (3) no importan demasiado, los graves se deben corregir.
Se necesita algo para comprobar estos supuestos y asegurarse de que los métodos son
adecuados. Han existido innumerables herramientas diagnósticas propuestas para este propósito. Se han escrito muchos libros sobre el tema. Aquí se restringirá a algunos de los procedimientos más básicos.
La gráfica de residuos contra valores ajustados
El mejor diagnóstico para la regresión de mínimos cuadrados es una gráfica de residuos ei
contra valores ajustados ŷ i, en ocasiones llamada gráfica de residuos. La figura 7.14 de la
página 528 presenta esta gráfica para la estatura de Galton contra los datos de antebrazo (véase la figura 7.1 de la sección 7.1 para los datos originales). Por necesidad matemática, los residuos tienen media 0, y también la correlación entre los residuos y los valores ajustados es
0. Por tanto, la recta de mínimos cuadrados es horizontal, pasando a través del 0 sobre el eje
vertical. Cuando el modelo lineal es válido, y se satisfacen los supuestos del 1 al 4, la gráfica no indicará un patrón importante. No hay curva en la gráfica, y la dispersión vertical de los
puntos no debe variar demasiado de la dispersión horizontal de la gráfica, excepto quizás cerca de los bordes. Estas condiciones están bien satisfechas para los datos de Galton. No existe razón para dudar de los supuestos del modelo lineal.
Un poco de terminología: cuando la dispersión vertical en un diagrama de dispersión no
varía demasiado, se dice que el diagrama de dispersión es homoscedástico. Lo contrario de
homoscedástico es heteroscedástico.
Una gráfica de residuos que se ve bien no prueba por sí misma que el modelo lineal es
adecuado, porque los supuestos del modelo lineal pueden fallar de otras maneras. Por otra
parte, una gráfica de residuos con un defecto serio indica claramente que el modelo lineal es
inadecuado.
528
CAPÍTULO 7
Correlación y regresión lineal simple
4
3
2
Residuo
1
0
⫺1
⫺2
⫺3
⫺4
60
62
64
66
68
Valor ajustado
70
72
74
FIGURA 7.14 Gráfica de residuos (ei) contra valores ajustados (ŷ i) para la estatura de
Galton contra los datos del antebrazo. No hay ningún patrón importante en la gráfica, y la
extensión vertical no varía demasiado, excepto quizás cerca de los bordes. Esto es consistente con los supuestos del modelo lineal.
Resumen
Si la gráfica de residuos contra valores ajustados
No muestra una tendencia importante de la curva, y
Es homoscedástica; es decir, la dispersión vertical no varía demasiado a lo largo
de la longitud horizontal de la gráfica, excepto quizás cerca de los bordes,
entonces es probable, pero no se tiene la seguridad, de que los supuestos del modelo
lineal sean válidos.
Sin embargo, si la gráfica de residuos sí muestra tendencia importante o se curva,
o es heteroscedástica, se tiene la seguridad de que los supuestos del modelo lineal no
son válidos.
En muchos casos, la gráfica de los residuos presentará curvatura o heteroscedasticidad,
ello indica el incumplimiento de los supuestos. Se presentarán tres ejemplos. Después se presentará un método llamado transformación de variables, que algunas veces puede arreglar
los incumplimientos de los supuestos y permite usar el modelo lineal.
Ejemplo
7.19
La figura 7.15 presenta una gráfica de las concentraciones de ozono atmosféricas contra concentraciones de NOx medidas en 359 días en un año reciente cerca de Riverside, California.
(NOx significa óxido de nitrógeno, y se refiere a la suma de NO y NO2.) Ambas concentraciones están medidas en partes por miles de millones (ppmm). Ahora esta gráfica es una gráfica
de residuos. La gráfica es evidentemente heteroscedástica; es decir, la dispersión vertical va-
7.4
529
Comprobación de supuestos y transformación de datos
ría de manera considerable con el valor ajustado. Específicamente, cuando éste (la estimación
de la concentración de ozono) es grande, el residuo tiende a estar más lejos de 0. En virtud de
que la magnitud de la dispersión en los residuos depende de la varianza del error σ 2, se concluye que la varianza del error es grande en días donde el valor ajustado también lo es. Ésta
es una violación del supuesto 3, que establece que la varianza σ 2 es igual para todas las observaciones. La gráfica también contiene un dato atípico (donde la concentración de ozono
está cerca de 100). La gráfica de residuos indica que no se debe usar este modelo lineal para
predecir la concentración de ozono de la concentración de NOx.
100
80
60
40
20
60
Residuo
O3 (ppmm)
80
40
0
⫺20
⫺40
20
⫺60
0
0
⫺80
NOx (ppmm)
20
25
30
Valor ajustado
a)
b)
50
100
150
5
10
15
35
40
45
FIGURA 7.15 a) Gráfica de la concentración de ozono contra la concentración de NOx. La recta de mínimos cuadrados
está sobrepuesta. b) Gráfica de residuos (ei) contra valores ajustados (ŷ i) para estos datos. La dispersión vertical aumenta
evidentemente el valor ajustado. Esto último indica un incumplimiento del supuesto de la varianza del error constante.
Ejemplo
7.20
(Basado en el artículo “Advances in Oxygen Equivalence Equations for Predicting the Properties of Titanium Welds,” D. Harwig, W. Ittiwattana y H. Castner, en The Welding Journal,
2001: 126s-136s.) Las propiedades físicas de una soldadura están influenciadas por la composición química del material de la soldadura. Una medida de la composición química es el
número de Ogden-Jaffe, que es una suma ponderada de los porcentajes de carbono, oxígeno
y nitrógeno en la soldadura. En un estudio de 63 soldaduras, la dureza de la soldadura (medida en la escala de Rockwell B) se graficó contra el número de Ogden-Jaffe. En la figura 7.16
de la página 530 se presenta la gráfica junto con otra de residuos. Esta última muestra un patrón con residuos positivos de la concentración en la parte central de la gráfica, y de residuos
negativos en los extremos. Técnicamente, lo anterior indica que no todos los errores εi tienen
una media de 0. Esto por lo general ocurre por cualquiera de dos razones: ya sea que la relación entre las variables no sea lineal, o que hay otras variables que se necesitan incluir en el
modelo. Se concluye que no se debe usar este modelo para predecir la dureza de la soldadura a partir del número de Ogden-Jaffe.
530
CAPÍTULO 7
Correlación y regresión lineal simple
100
6
4
2
90
Residuo
Dureza de Rockwell
95
85
0
⫺2
80
⫺4
75
0.1
0.2
0.3
Número de Ogden-Jaffe
a)
⫺6
75
0.4
80
85
90
95
Valor ajustado
b)
100
105
FIGURA 7.16 a) Gráfica de la dureza de Rockwell (B) contra el número de Ogden-Jaffe. La recta de mínimos cuadrados
está sobrepuesta. b) Gráfica de residuos (ei) contra valores ajustados (ŷ i) para estos datos. La gráfica de residuos muestra
una tendencia, con residuos positivos en el centro y negativos en los extremos.
Estos datos se presentaron en el ejercicio 15 en la sección 7.3. Para un grupo de 255 pozos de
gas, la producción mensual por pie de profundidad del pozo está graficada contra el volumen
de fluido fracturado bombeado en el pozo. Esta gráfica, junto con la de residuos, se presenta
en la figura 7.17. Esta última es fuertemente heteroscedástica, lo que indica que la varianza
del error es mayor para pozos de gas cuya estimación de la producción es mayor. Por supues-
1 600
1 000
1 400
750
1 200
500
100
250
Residuo
Producción (1 000 pies3/pies)
Ejemplo
7.21
800
600
0
⫺250
400
⫺500
200
⫺750
0
0
2 000
4 000
6 000
Fluido fracturado (galones/pies)
a)
8 000
⫺1 000
200
400
600
800
Valor ajustado
b)
1 000
FIGURA 7.17 a) Gráfica de la producción mensual contra volumen de fluido fracturado para 255 pozos de gas. b) Gráfica de residuos (ei) contra valores ajustados (ŷ i) para los datos de los pozos de gas. La dispersión vertical aumenta con el valor ajustado. Esto último indica incumplimiento del supuesto de la varianza del error constante.
7.4
531
Comprobación de supuestos y transformación de datos
to, éstos son los pozos dentro de los cuales se ha bombeado mayor cantidad de fluido fracturado. Se concluye que no se debe utilizar este modelo para predecir la producción de los pozos a partir de la cantidad de fluido fracturado bombeado.
Transformación de variables
Si se ajusta el modelo lineal y ⫽ β0 ⫹ β1x ⫹ ε y se determina que la gráfica de residuos es
heteroscedástica, o presenta una tendencia o patrón, a veces se puede arreglar el problema elevando x, y, o ambos a una potencia. Podría ser el caso de que un modelo de la forma ya ⫽ β0
⫹ β1xb ⫹ ε ajuste los datos bien. En general, sustituir una variable con una función de la misma se llama transformación de la variable. Específicamente, elevar una variable a una potencia se llama transformación potencia. Tomar el logaritmo de una variable también se
considera como transformación potencia, aunque el logaritmo no es una potencia.
He aquí un ejemplo simple que muestra cómo funciona una transformación de potencia. La tabla siguiente presenta valores para las variables hipotéticas x, y, y y2.
x
y
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
10.0
2.2
9.0
13.5
17.0
20.5
23.3
25.2
26.4
27.6
30.2
y2
4.84
81.00
182.25
289.00
420.25
542.89
635.04
696.96
761.76
912.04
x
y
11.0
12.0
13.0
14.0
15.0
16.0
17.0
18.0
19.0
20.0
31.5
32.7
34.9
36.3
37.7
38.7
40.0
41.3
42.5
43.7
y2
1
1
1
1
1
1
1
1
1
992.25
069.29
218.01
317.69
421.29
497.69
600.00
705.69
806.25
909.69
El diagrama de dispersión de y contra x se presenta en la figura 7.18, junto con la gráfica de
residuos. Evidentemente el modelo lineal no es adecuado.
50
10
40
5
Residuo
30
y
20
0
25
10
0
0
5
10
x
a)
15
20
210
10
20
30
Valor ajustado
b)
40
50
FIGURA 7.18 a) Gráfica de y contra x con la recta de mínimos cuadrados sobrepuesta. b) Gráfica de residuos contra valores ajustados. Hay un fuerte patrón en la gráfica de residuos, lo que indica que el modelo lineal no es adecuado.
532
CAPÍTULO 7
Correlación y regresión lineal simple
El modelo y ⫽ β0 ⫹ β1x ⫹ ε no ajusta los datos. Sin embargo, se puede solucionar este problema usando y2 en lugar de y. La figura 7.19 presenta el diagrama de dispersión de y2
contra x, junto con la gráfica de residuos. La gráfica de residuos es homoscedástica, sin tendencia o patrón perceptible.
2 000
50
40
30
20
Residuo
y2
1 500
1 000
10
0
⫺10
⫺20
500
⫺30
⫺40
0
0
5
10
x
a)
15
20
⫺50
0
500
1 000
Valor ajustado
b)
1 500
2 000
FIGURA 7.19 a) Gráfica de y2 contra x con la recta de mínimos cuadrados sobrepuesta. b) Gráfica de residuos contra valores ajustados. La gráfica de residuos es casi homoscedástica, sin tendencia o patrón perceptible.
Se concluye que el modelo y2 ⫽ β0 ⫹ β1x ⫹ ε es un modelo creíble para estos datos.
En este ejemplo se transforma y, pero no se necesita transformar x. En otros casos, se puede
transformar solamente x, o tanto x como y.
Determinación de cuál transformación se debe aplicar
Con la experiencia es posible observar un diagrama de dispersión, o una gráfica de residuos, y
hacer un supuesto fundamentado respecto a cómo transformar las variables. También hay métodos matemáticos disponibles para determinar una buena transformación. Sin embargo, es satisfactorio proceder por prueba y error. Intente varias potencias tanto para x como para y
(incluyendo ln x y ln y), observe las gráficas de residuos, y espere encontrar una que sea homoscedástica, sin patrón perceptible. Un análisis más avanzado de la selección de la transformación se encuentra en Draper y Smith (1998).
Las transformaciones no siempre funcionan
Es importante recordar que las transformaciones de las potencias no siempre funcionan. A veces ninguna de las gráficas de residuos parece buena, no importa qué transformaciones se prueben. En estos casos, se deben usar otros métodos. Uno de éstos es la regresión múltiple, que se
analizará en el capítulo 8. Algunos otros se mencionan brevemente al final de esta sección.
7.4
533
Comprobación de supuestos y transformación de datos
Las gráficas de residuos con pocos puntos son difíciles de interpretar
Cuando solamente hay algunos puntos en una gráfica de residuos, es difícil determinar si se
satisfacen los supuestos del modelo lineal. A veces tal gráfica parecerá heteroscedástica o presentar un patrón, pero con una inspección cercana se encontrará que esta impresión visual la
causa la colocación de sólo uno o dos puntos. En ocasiones es difícil determinar si tal gráfica contiene un dato atípico. Cuando uno se enfrenta a una gráfica de residuos dispersa difícil
de interpretar es razonable ajustar un modelo lineal, pero considerando los resultados con cautela, en el entendido de que no se ha establecido la propiedad del modelo. Siempre y cuando
se tengan más datos disponibles, se puede tomar una decisión fundamentada. Por supuesto,
no todas las gráficas de residuos dispersas son difíciles de interpretar. Algunas veces hay un
patrón obvio, que no se puede cambiar sólo por el corrimiento de uno o dos puntos. En estos
casos no se debe usar el modelo lineal.
Con referencia al ejemplo 7.19, la figura 7.15 presenta una gráfica de ozono contra concentraciones de NOx. Se tiene que la transformación del ozono es su logaritmo natural, ln ozono,
produce una gráfica lineal satisfactoria. La figura 7.20 presenta el diagrama de dispersión de
ln ozono contra NOx, y la gráfica de residuos correspondiente. La gráfica de residuos es homoscedástica, sin patrón perceptible. El dato atípico que estaba presente en los datos originales es menos prominente. El modelo lineal se ve bien.
4.5
1.5
4
1
3.5
0.5
Residuo
ln (O3)
Ejemplo
7.22
3
2.5
0
⫺0.5
2
⫺1
1.5
⫺1.5
00
50
NOx
a)
100
150
2.2
2.4
2.6
2.8
3
3.2
Valor ajustado
b)
3.4
3.6
3.8
FIGURA 7.20 a) Gráfica del logaritmo natural de la concentración de ozono contra la concentración de NOx. La recta de
mínimos cuadrados está sobrepuesta. b) Gráfica de residuos (ei) contra valores ajustados (ŷ i) para estos datos. El modelo lineal se ve bien.
534
CAPÍTULO 7
Correlación y regresión lineal simple
El siguiente resultado de MINITAB corresponde a los datos transformados.
Regression Analysis: LN OZONE versus NOx
The regression equation is
LN OZONE = 3.78 – 0.0101 NOx
Predictor
Constant
NOx
Coef
3.78238
–0.0100976
S = 0.5475
SE Coef
0.05682
0.0009497
R-Sq = 24.1%
T
66.57
–10.63
P
0.000
0.000
R-Sq(adj) = 23.8%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
1
357
358
SS
33.882
106.996
140.878
MS
33.882
0.300
F
113.05
P
0.000
Predicted Values for New Observations
New Obs
1
Fit
3.2775
SE Fit
0.0289
95.0% CI
( 3.2206, 3.3344)
95.0% PI
( 2.1994, 4.3556)
Values of Predictors for New Observations
New Obs
1
NOx
50.0
El análisis de los datos transformados da resultados para el logaritmo natural de la concentración de ozono. Para algunos propósitos se puede regresar a las unidades originales. Por
ejemplo, se pueden utilizar los datos transformados con el fin de encontrar intervalos de predicción para valores de ozono dando un valor particular de NOx. Con este propósito se usan
los métodos de la sección 7.3 para encontrar el intervalo para ln ozono, y después transformar este intervalo de regreso a las unidades originales. El ejemplo 7.23 muestra cómo.
Ejemplo
7.23
Usando el resultado anterior de MINITAB, pronostique el nivel de ozono cuando el nivel de
NOx es 50 ppmm, y determine un intervalo de predicción de 95% para el nivel de ozono en
un día cuando el nivel de NOx es 50 pppm.
Solución
Sea y el nivel de ozono en un día cuando el nivel de NOx es 50 ppmm, y ŷ el valor pronosticado para ese nivel. Primero se calcula el valor de ln ŷ , que es el valor pronosticado para ln
ozono, utilizando los estimadores de los coeficientes del resultado de MINITAB. Para un valor de NOx de 50, la predicción es
ln ŷ ⫽ 3.78238 ⫺ 0.0100976(50) ⫽ 3.2775
7.4
Comprobación de supuestos y transformación de datos
535
Por tanto, el valor de ozono pronosticado es
ŷ ⫽ e3.2775 ⫽ 26.51
Se calcula un intervalo de predicción de 95% para el nivel de ozono y, se consulta el intervalo de predicción para ln y del resultado de MINITAB:
2.1994 < ln y < 4.3556
Tomando exponenciales a toda la desigualdad se obtiene el intervalo de predicción de 95%
para el nivel de ozono:
e2.1994 < y < e4.3556
9.02 < y < 77.91
Es importante observar que el método utilizado en el ejemplo 7.23 funciona solamente
para el intervalo de predicción. No funciona respecto del intervalo de confianza para la respuesta media. Cuando la variable dependiente se ha transformado, no se puede obtener aquél
en las unidades originales.
Ejemplo
7.24
Con referencia del ejemplo 7.20, la figura 7.16 presenta una gráfica de la dureza de Rockwell
(B) contra el número de Ogden-Jaffe para un grupo de soldaduras. En este caso, al tomar el
recíproco del número de Ogden-Jaffe (elevándolo a la potencia ⫺1) se obtiene una relación
casi lineal. La figura 7.21 presenta los resultados. Observe que, en este caso, se transforma la
100
5
4
3
2
90
Residuo
Dureza de Rockwell
95
85
1
0
⫺1
⫺2
80
⫺3
⫺4
75
2
3
4
5
6
(Número de Ogden-Jaffe)⫺1
a)
7
8
⫺5
75
80
85
90
Valor ajustado
b)
95
100
FIGURA 7.21 a) Gráfica de la dureza contra (número de Ogden-Jaffe)⫺1. La recta de mínimos cuadrados está sobrepuesta.
b) Gráfica de residuos (ei) contra valores ajustados (ŷ i) para estos datos. El modelo lineal queda bien.
536
CAPÍTULO 7
Correlación y regresión lineal simple
variable independiente (x), mientras que en el ejemplo 7.22 se transforma la variable dependiente (y).
Con referencia al ejemplo 7.21, la figura 7.17 presentó una gráfica de la producción contra el
volumen de fluido fracturado para 255 pozos de gas. Ésta presenta una relación casi lineal válida entre el logaritmo de la producción y el del volumen del fluido fracturado. La figura 7.22
presenta los resultados. Observe que en este caso ambas variables fueron transformadas.
8
3
7
2
6
1
Residuo
ln (Producción)
Ejemplo
7.25
5
0
4
⫺1
3
⫺2
2
5
6
7
8
ln(Fluido)
a)
9
10
⫺3
4
4.5
5
5.5
6
Valor ajustado
b)
6.5
7
FIGURA 7.22 a) Gráfica del logaritmo de la producción contra el logaritmo del volumen de fluido fracturado para 255
pozos de gas, con la recta de mínimos cuadrados sobrepuesta. b) Gráfica de residuos contra valores ajustados. No hay patrón importante de los residuos. El modelo lineal queda bien.
Datos atípicos y puntos influyentes
Los datos atípicos son puntos separados del volumen de los datos. Tanto el diagrama de dispersión como la gráfica de residuos se deben revisar para encontrar datos atípicos. Lo primero respecto de un dato atípico es tratar de determinar por qué es diferente del resto de los
puntos. A veces los datos atípicos los causan errores en el registro de datos o el funcionamiento defectuoso del equipo. En estos casos, los datos atípicos se pueden eliminar del conjunto
de datos. Pero muchas veces la causa no se puede determinar con seguridad en un dato atípico. Eliminar el dato atípico resulta poco inteligente, porque da como resultado una subestimación de la variabilidad del proceso que generó los datos.
Con frecuencia los datos atípicos se pueden identificar mediante inspección visual. Mucho software enlista los puntos que tienen residuos inusualmente grandes; esta lista contendrá la mayor parte de los datos atípicos (y a veces también de algunos puntos inocuos). A
veces al transformar las variables se eliminarán los datos atípicos cambiándolos de lugar más
7.4
537
Comprobación de supuestos y transformación de datos
cerca de la mayor parte de los datos. Cuando las transformaciones no ayudan, y cuando no
hay justificación para eliminar los datos atípicos, un enfoque conveniente es ajustar la recta
para todo el conjunto de datos, y eliminar cada dato atípico en turno, ajustando la recta al conjunto de datos con un dato atípico eliminado. Si ninguno de los datos atípicos eliminados hace
una notable diferencia a la recta de mínimos cuadrados o a las desviaciones estándar estimadas de la pendiente y del intercepto, entonces utilice el ajuste con los datos atípicos incluidos.
Si uno o más de los datos atípicos hacen una diferencia cuando se eliminan, entonces se debe
reportar el rango de valores para los coeficientes de mínimos cuadrados. En estos casos se deben evitar los cálculos de los intervalos de confianza o de los de predicción, o la realización
de las pruebas de hipótesis.
Un dato atípico que hace una diferencia considerable en la recta de mínimos cuadrados
cuando se elimina se llama punto influyente. La figura 7.23 presenta un ejemplo de un dato
atípico influyente, junto con uno que no es influyente. En general, los datos atípicos con valores de x inusuales tienen mayor probabilidad de ser influyentes que aquellos con valores de
y inusuales, pero cada dato atípico se debe verificar. Mucho software identifica puntos potencialmente influyentes. Se puede encontrar más información acerca del tratamiento de datos
atípicos y puntos influyentes en Draper y Smith (1998), Belsey, Kuh, Welsch (1980), y Cook
y Weisberg (1994).
y = ⫺0.34 + 1.05x
7
y = ⫺0.22 + 1.06x
7
6
6
6
5
5
5
4
4
4
3
3
3
2
2
2
2
3
4
5
a)
6
7
2
3
4
5
b)
6
7
y = 0.97 + 0.70x
7
2
3
4
5
6
7
c)
FIGURA 7.23 a) Diagrama de dispersión sin datos atípicos. b) Se agrega un dato atípico a la gráfica. Hay poco cambio en
la recta de mínimos cuadrados, por lo que este punto no es influyente. c) Se agrega un dato atípico a la gráfica. Hay un cambio considerable en la recta de mínimos cuadrados, por lo que este punto es influyente.
Por último, se menciona que algunos escritores restringen la definición de datos atípicos a puntos con residuos inusualmente grandes. Según esta definición, un punto lejano de la
mayor parte de los datos, aun cerca de la recta de mínimos cuadrados, no es un dato atípico.
Ese punto podría ser o no influyente.
El siguiente ejemplo caracteriza un conjunto de datos que contiene dos datos atípicos.
En un estudio para determinar si la frecuencia de cierto gene mutante aumenta con la edad, se
contó el número de genes mutantes en un microgramo de ADN para cada uno de 30 hombres.
Dos de los hombres tenían recuentos sumamente grandes; sus puntos son datos atípicos. La
538
CAPÍTULO 7
Correlación y regresión lineal simple
recta de mínimos cuadrados fue ajustada para los 30 puntos, para cada conjunto de 29 puntos
obtenidos al eliminar un atípico, y después para los 28 puntos que quedaban después de eliminar los dos datos atípicos. La figura 7.24 presenta diagramas de dispersión de frecuencia
contra edad para todo el conjunto de datos y para los conjuntos con uno y con dos datos atípicos eliminados. Las rectas de mínimos cuadrados están sobrepuestas. Con los datos atípicos incluidos, la ecuación de la recta de mínimos cuadrados es y ⫽ ⫺137.76 ⫹ 4.54x. Con
los datos atípicos eliminados, la ecuación de la recta de mínimos cuadrados es y ⫽ 31.86 ⫹
1.23x. Estos resultados son bastante diferentes, por lo que ambos se deben notificar.
600
A
y = ⫺137.76 + 4.54x
500
Mutaciones por mg DNA
Mutaciones por mg DNA
600
B
400
300
200
y = ⫺76.23 + 3.25x
B
400
300
200
100
100
0
500
40
50
60
70
Edad (años)
80
0
40
90
50
a)
600
80
90
y = 31.86 + 1.23x
Mutaciones por mg DNA
Mutaciones por mg DNA
90
600
500
400
300
200
100
0
80
b)
A
y = ⫺53.08 + 2.97x
60
70
Edad (años)
500
400
300
200
100
40
50
60
70
Edad (años)
c)
80
90
0
40
50
60
70
Edad (años)
d)
FIGURA 7.24 Frecuencia de mutación contra la edad. a) La gráfica contiene dos datos atípicos, A y B. b) El dato atípico
A se elimina. El cambio en la recta de mínimos cuadrados es perceptible, aunque no extremo; este punto es un poco influyente. c) El dato atípico B se elimina. El cambio en la recta de mínimos cuadrados es otra vez perceptible, pero no extremo; también este punto es poco influyente. Observe que el dato atípico B es un poco más influyente que el dato atípico A,
aunque visualmente B está cerca de la mayor parte de los datos. d) Ambos datos atípicos son eliminados. El efecto combinado en la recta de mínimos cuadrados es importante.
7.4
Comprobación de supuestos y transformación de datos
539
Otros métodos para transformar variables
Residuo
Residuo
Transformar variables no es el único método para analizar los datos cuando la gráfica de residuos indica un problema. Cuando ésta es heteroscedástica, algunas veces se utiliza una técnica llamada mínimos cuadrados ponderados. En este método, las coordenadas x y y de
cada punto se multiplican por una cantidad conocida como peso. Los puntos en las regiones
donde la dispersión vertical es grande se multiplican por pesos más pequeños, mientras que
los puntos en regiones con dispersión vertical menor se multiplican por pesos más grandes.
El efecto es lograr que los puntos cuya varianza del error es más pequeña tengan influencias
mayores en el cálculo de la recta de mínimos cuadrados.
Cuando la gráfica de residuos muestra una tendencia, indica que se necesita más de una
variable independiente para explicar la variación en la variable dependiente. En estos casos se
agregan más variables independientes al modelo, y se utiliza la regresión múltiple. Por último, algunas relaciones son inherentemente no lineales. En éstas se puede aplicar un método
llamado regresión no lineal. La regresión múltiple se trata en el capítulo 8. Los otros dos métodos están más allá del alcance de este libro. Una buena referencia sobre estos temas es Draper y Smith (1998).
Para resumir, en la figura 7.25 se presentan algunos ejemplos genéricos de gráficas de
residuos. Para cada una se presentan un diagnóstico y una receta.
Valores ajustados
b)
Residuo
Residuo
Valores ajustados
a)
Valores ajustados
c)
Valores ajustados
d)
FIGURA 7.25 a) Ningún patrón importante, la gráfica es homoscedástica. El modelo lineal está bien. b) Heteroscedástica. Pruebe una transformación de potencia. c) Tendencia perceptible de los residuos. Pruebe una transformación de potencia o utilice la regresión múltiple. d) Dato atípico. Examine el punto de datos infractor para ver si hay un error. Si no, calcule
la recta de mínimos cuadrados tanto con y sin el dato atípico para ver si hay una diferencia perceptible.
540
Correlación y regresión lineal simple
CAPÍTULO 7
Comprobación de independencia y normalidad
Si la gráfica de residuos contra valores ajustados queda bien, podría ser aconsejable realizar
diagnósticos adicionales para verificar más el ajuste del modelo lineal. En particular, cuando
las observaciones ocurren en un orden de tiempo definido, es deseable graficar los residuos
contra el orden con el cual las observaciones fueron hechas. Si hay tendencias en la gráfica,
indica que la relación entre x y y puede estar variando con el tiempo. En estos casos una variable que representa el tiempo, u otras variables relacionadas con el tiempo, se deben incluir
en el modelo como variables independientes adicionales, y se debe realizar una regresión
múltiple.
En los datos de contaminación del aire del ejemplo 7.19, con y representando la concentración de ozono y x la concentración de NOx, la gráfica de residuos (figura 7.15) para el
modelo ln y ⫽ β0 ⫹ β1x ⫹ ε es homoscedástica, sin patrón o tendencia perceptible. Se reunieron estos datos durante el transcurso de 359 días durante un año especial. La figura 7.26
presenta la gráfica de residuos contra el tiempo para estos datos. Hay un patrón claro. Los residuos positivos en medio de los datos corresponden al verano, y los negativos en los extremos de los datos, al invierno. Cada residuo es igual al logaritmo de la concentración de ozono
observada en ese día, menos el logaritmo del valor pronosticado por el modelo. Se concluye
que los valores pronosticados por el modelo son demasiado bajos en verano y demasiado altos en invierno. Es obvio que conocer la época del año puede mejorar el pronóstico de la concentración de ozono sobre el proporcionado por el modelo con la concentración de NOx como
la única variable independiente. Por tanto, se ajustaría bien un modelo de regresión múltiple
que contendría tanto al tiempo como al NOx como variables independientes. Dependiendo de
los resultados de ese ajuste, se podrían hacer los ajustes adicionales al modelo. Estas ideas serán tratadas más profundamente en el capítulo 8.
2
1.5
1
Residuo
0.5
0
⫺0.5
⫺1
⫺1.5
⫺2
0
50
100 150 200 250 300
Orden de las observaciones
350
FIGURA 7.26 Gráfica de residuos contra el orden de las observaciones (tiempo) para el ozono contra los datos de NOx.
Se ajustó el modelo ln ozono ⫽ β0 ⫹ β1NOx ⫹ ε. Los residuos muestran un patrón claro con el tiempo que indica que se
debe ajustar a un modelo de regresión múltiple, con el tiempo como una variable adicional.
7.4
Comprobación de supuestos y transformación de datos
541
A veces una gráfica de residuos contra el tiempo muestra que aquéllos oscilan con el
tiempo. Esto último indica que el valor de cada error está influenciado por los errores en las
observaciones anteriores, por lo que los errores no son independientes. Cuando esta característica es grave no se debe usar la regresión lineal, y en su lugar se deben usar los métodos de
análisis de serie de tiempo. Una buena referencia sobre el análisis de serie de tiempo es
Brockwell y Davis (2002).
Para comprobar que los errores están normalmente distribuidos, se puede hacer una gráfica de probabilidad normal de los residuos. Si esta última tiene bruscamente la apariencia de
una línea recta, ello significa que los residuos están casi normalmente distribuidos. Puede ser una
buena idea hacer una gráfica de probabilidad cuando se transforman las variables, ya que una señal de una buena transformación es que los residuos estén casi normalmente distribuidos. Como ya se mencionó, el supuesto de la normalidad no es tan importante cuando el número de
puntos de datos es grande. Desafortunadamente, cuando el número de puntos de datos es pequeño, puede ser difícil detectar las desviaciones de la normalidad.
Modelos empíricos y leyes físicas
¿Cómo se sabe si la relación entre dos variables es lineal? En algunos casos, las leyes físicas, como la ley de Hooke, proporcionan la garantía de que un modelo lineal es correcto. En otros,
como en la relación entre el logaritmo del volumen de fluido fracturado bombeado en un pozo de gas y el logaritmo de su producción mensual, no existe una ley física conocida. En estos casos se utiliza un modelo lineal simplemente porque parece ajustarse a los datos del pozo.
Un modelo que se elige porque parece ajustar a los datos, en ausencia de una teoría física, se
llama modelo empírico. En la vida real, la mayoría de los análisis de datos están basados en
modelos empíricos. Es menos frecuente cuando se aplica una ley física conocida. Por supuesto, muchas leyes físicas comenzaron como modelos empíricos. Si un modelo empírico se
prueba en muchas ocasiones diferentes, bajo diversas circunstancias, y se encuentra que es válido sin excepción, puede obtener el estatus de una ley física.
Hay una diferencia importante entre la interpretación de los resultados basados en leyes
físicas y la de los resultados basados en modelos empíricos. Una ley física se puede considerar verdadera, mientras que lo mejor que se puede esperar de un modelo empírico es que sea
útil. Por ejemplo, en los datos de ley de Hooke se puede estar seguro que la relación entre la
carga sobre el resorte y su longitud es realmente lineal. Se tiene la seguridad de que cuando
se coloca otro peso en el resorte, la longitud del resorte se puede predecir con exactitud del
modelo lineal. Por otro lado, para los datos del pozo de gas, mientras que la relación lineal
describe los datos del pozo, no se puede asegurar que capta la verdadera relación entre el volumen del fluido fracturado y la producción.
He aquí un ejemplo simple que ilustra el punto. La figura 7.27 de la página 542 presenta 20 triángulos de formas diferentes. Suponga que no se conoce la fórmula para el área de un
triángulo. Sin embargo, observe que los triángulos con perímetros mayores parecen tener
áreas más grandes, así que se ajusta un modelo lineal:
Área ⫽ β0 ⫹ β1 (Perímetro) ⫹ ε
542
CAPÍTULO 7
Correlación y regresión lineal simple
El diagrama de dispersión del área contra el perímetro, con la recta de mínimos cuadrados sobrepuesta, se muestra a la derecha de la figura 7.27. La ecuación de la recta de mínimos cuadrados es
Área ⫽ ⫺1.232 ⫹ 1.373 (Perímetro)
Las unidades en esta ecuación son arbitrarias. La correlación entre área y perímetro es r ⫽
0.88, que es fuertemente positiva. El modelo lineal parece ajustar bien. Se podría utilizar este modelo para predecir, por ejemplo, que un triángulo con perímetro igual a 5 tendrá una área
de 5.633.
Áreas de veinte triángulos
0.25
0.20
•
0.15
•
0.10
•
•
0.05
0.0
1.0
Veinte triángulos
a)
•
•• •
•
•
•
•
•
• •
•
•
•
•
•
1.2
1.4
1.6
1.8
2.0
2.2
2.4
Perímetro de veinte triángulos
b)
FIGURA 7.27 a) Veinte triángulos. b) Área contra perímetro para 20 triángulos. La correlación entre perímetro y área es
0.88.
Ahora aunque este modelo lineal podría ser útil, no es verdadero. El modelo lineal
muestra que hay una fuerte tendencia de que triángulos con perímetros mayores tengan áreas
más grandes. En ausencia de un mejor método, éste podría ser calcular algunas de las áreas de
los triángulos. Pero no ayuda para mostrar el verdadero mecanismo detrás de la determinación del área. El mecanismo verdadero, por supuesto, está dado por la ley
Área ⫽ 0.5 × base × altura
Los resultados pronosticados por un modelo empírico podrían no ser válidos bajo la reproducción. Por ejemplo, un conjunto de triángulos podría estar diseñado de tal manera que
algunos con perímetros mayores tuvieran áreas más pequeñas. En otro conjunto, el área podría parecer ser proporcional al cuadrado del perímetro, o su logaritmo. No se puede determinar con el análisis estadístico de los datos de los triángulos qué tan bien será aplicable el
modelo empírico a un triángulo que aún no se observa. Determinar si es adecuado aplicar los
resultados de un modelo empírico a las futuras observaciones es un tema de juicio científico
más que estadístico.
7.4
Comprobación de supuestos y transformación de datos
543
Resumen
Las leyes físicas son aplicables a todas las futuras observaciones.
Un modelo empírico es válido solamente para los datos a los que se ajusta. Esto
último puede o no ser útil para predecir los resultados para las siguientes observaciones.
Determinar si se aplica un modelo empírico a una futura observación requiere juicio científico más que análisis estadístico.
Ejercicios de la sección 7.4
1. El siguiente resultado de MINITAB corresponde a la recta de mínimos cuadrados ln y ⫽ β0 ⫹ β1 ln x ⫹ ε, donde y representa la producción mensual de un pozo de gas y x el volumen de fluido fracturado bombeado dentro. (Un diagrama de dispersión
de estos datos se presentó en la figura 7.22.)
Regression Analysis: LN PROD versus LN FLUID
The regression equation is
LN PROD = – 0.444 + 0.798 LN FLUID
Predictor
Constant
LN FLUID
Coef
–0.4442
0.79833
S = 0.7459
SE Coef
0.5853
0.08010
R–Sq = 28.2%
T
–0.76
9.97
P
0.449
0.000
R–Sq(adj) = 27.9%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
1
253
254
SS
55.268
140.756
196.024
MS
55.268
0.556
F
99.34
P
0.000
Predicted Values for New Observations
New Obs
1
Fit
5.4457
SE Fit
0.0473
95.0% CI
( 5.3526, 5.5389)
95.0% PI
( 3.9738, 6.9176)
Values of Predictors for New Observations
New Obs
1
LN FLUID
7.3778
a) ¿Cuál es la ecuación de la recta de mínimos cuadrados para pronosticar ln y a partir de ln x?
b) Pronostique la producción de un pozo en el cual se han bombeado 2 500 gal/pie de fluido.
c) Pronostique la producción de un pozo en el que se han bombeado 1 600 gal/pie de fluido.
d) Determine un intervalo de predicción de 95% para la producción de un pozo en el que se han bombeado 1 600 gal/pie de
fluido. (Nota: ln 1 600 ⫽ 7.3778)
544
CAPÍTULO 7
Correlación y regresión lineal simple
2. El procesamiento de carbón sin tratar implica el “lavado”, en donde se elimina la ceniza de carbón (no orgánico, material incombustible). El artículo “Quantifying Sampling Precision for Coal Ash Using Gy’s Discrete Model of the Fundamental Error”
(Journal of Coal Quality, 1989:33-39) proporciona los datos relacionados con los porcentajes de ceniza con el volumen de una
partícula de carbón. Se midieron los porcentajes promedio de ceniza para seis volúmenes de partículas de carbón. Los datos
son los siguientes:
Volumen (cm3)
0.01
0.06
0.58
2.24
15.55
276.02
Porcentaje de ceniza
3.32
4.05
5.69
7.06
8.17
9.36
a) Calcule la recta de mínimos cuadrados para predecir el porcentaje de ceniza (y) a partir del volumen (x). Grafique los residuos contra los valores ajustados. ¿El modelo lineal parece adecuado? Explique.
b) Calcule la recta de mínimos cuadrados para predecir el porcentaje de ceniza a partir del ln volumen. Grafique los residuos
contra los valores ajustados. ¿El modelo lineal parece adecuado? Explique.
—
c) Calcule la recta de mínimos cuadrados para predecir el porcentaje de ceniza a partir del 冑volumen . Grafique los residuos
contra los valores ajustados. ¿El modelo lineal parece adecuado? Explique.
d) Utilizando el modelo más adecuado, pronostique el porcentaje de ceniza para partículas con un volumen de 50 m3.
e) Utilizando el modelo más adecuado, construya un intervalo de confianza de 95% para la media de un porcentaje de ceniza
para partículas con un volumen de 50 m3.
3. Para determinar el efecto de la temperatura sobre la producción de cierto proceso químico, el proceso se opera 24 veces en diferentes temperaturas. La temperatura (en °C) y la producción (expresada como un porcentaje de un máximo teórico) para cada operación está dada en la tabla siguiente. Los resultados se presentan en el orden en el que se operaron, de los primeros a
los últimos.
Orden
1
2
3
4
5
6
7
8
Temp
Producción
Orden
Temp
Producción
Orden
Temp
Producción
30
32
35
39
31
27
33
34
49.2
55.3
53.4
59.9
51.4
52.1
60.2
60.5
9
10
11
12
13
14
15
16
25
38
39
30
30
39
40
44
59.3
64.5
68.2
53.0
58.3
64.3
71.6
73.0
17
18
19
20
21
22
23
24
34
43
34
41
36
37
42
28
65.9
75.2
69.5
80.8
78.6
77.2
80.3
69.5
a) Calcule la recta de mínimos cuadrados para predecir la producción (y) de temperatura (x).
b) Grafique los residuos contra los valores ajustados. ¿El modelo lineal parece adecuado? Explique.
c) Grafique los residuos contra el orden en el que se hicieron las observaciones. ¿Hay una tendencia en los residuos con el
tiempo? ¿El modelo lineal parece adecuado? Explique.
4. En una roca detonada con explosivos, la velocidad máxima de la partícula (VMP) depende de la distancia de la explosión y de
la cantidad de carga. El artículo “Prediction of Particle Velocity Caused by Blasting for an Infrastructure Excavation Covering
Granite Bedrock” (A. Kahriman, Mineral Resources Engineering, 2001:205-218) sugiere que predecir la VMP (y) a partir de
la distancia escalada (x), que es igual a la distancia dividida entre la raíz cuadrada de la carga. Los resultados para 15 explosiones se presentan en la tabla siguiente.
7.4
Comprobación de supuestos y transformación de datos
VMP (mm/s)
Distancia escalada (m/kg0.5)
1.4
15.7
2.54
1.14
0.889
1.65
1.4
26.8
1.02
4.57
6.6
1.02
3.94
1.4
1.4
47.33
9.6
15.8
24.3
23.0
12.7
39.3
8.0
29.94
10.9
8.63
28.64
18.21
33.0
34.0
545
a) Grafique la VMP contra la distancia escalada. ¿La relación parece ser lineal?
b) Calcule la recta de mínimos cuadrados para el modelo ln VMP ⫽ β0 ⫹ β1 ln distancia escalada ⫹ ε. Grafique los residuos
contra los valores ajustados. ¿Este modelo lineal parece adecuado?
c) Utilice la recta de mínimos cuadrados calculada en el inciso b) para predecir la VMP cuando la distancia escalada es 20.
Determine un intervalo de predicción de 95%.
5. La buena previsión y el control de las actividades de preconstrucción conducen al uso más eficiente del tiempo y recursos en proyectos de construcción de autopistas. Los datos acerca de los costos de construcción (en miles de dólares) y las horas-persona de
trabajo requeridas para varios proyectos se presentan en la tabla siguiente y fueron tomados del artículo “Forecasting Engineering
Manpower Requirements for Highway Preconstruction Activities” (K. Persad, J. O’Connor, y K. Varghese, Journal of Management
Engineering, 1995:41-47). Cada valor representa un promedio de algunos proyectos, y se han eliminado dos datos atípicos.
a)
b)
c)
d)
e)
Horaspersona (x)
Costo (y)
939
5 796
289
283
138
2 698
663
251
4 690
124
294
138
1 385
345
Horaspersona (x)
1 069
6 945
4 159
1 266
1 481
4 716
Costo (y)
355
5 253
1 177
802
945
2 327
Calcule la recta de mínimos cuadrados para predecir y a partir de x.
Grafique los residuos contra los valores ajustados. ¿El modelo parece adecuado?
Calcule la recta de mínimos cuadrados para predecir ln y a partir de ln x.
Grafique los residuos contra los valores ajustados. ¿El modelo parece adecuado?
Usando el modelo más adecuado, construya un intervalo de predicción de 95% para el costo de un proyecto que requiere
mil horas-persona de trabajo.
6. El artículo “Oxidation State and Activities of Chromium Oxides in CaO-SiO2-CrOx Slag System” (Y. Xiao, L. Holappa y M.
Reuter, Metallurgical and Materials Transactions B, 2002:595-603) presenta la cantidad x (en porcentaje molar) y el coefi-
546
CAPÍTULO 7
Correlación y regresión lineal simple
ciente de actividad y de CrO1.5 para varios elementos. Los datos, extraídos de una tabla más grande, se presentan en la tabla
siguiente.
x
y
x
y
x
y
10.20
5.03
8.84
6.62
2.89
2.31
2.6
19.9
0.8
5.3
20.3
39.4
7.13
3.40
5.57
7.23
2.12
1.67
5.8
29.4
2.2
5.5
33.1
44.2
5.33
16.70
9.75
2.74
2.58
1.50
13.1
0.6
2.2
16.9
35.5
48.0
a) Calcule la recta de mínimos cuadrados para predecir y a partir de x.
b) Grafique los residuos contra los valores ajustados.
c) Calcule la recta de mínimos cuadrados para predecir y a partir de 1/x.
d) Grafique residuos contra valores ajustados.
e) Usando la mejor línea ajustada, encuentre un intervalo de confianza de 95% para la media del valor de y cuando x ⫽ 5.0.
7. Se utiliza un molino de viento para generar corriente continua. Se reúnen datos en 45 días diferentes para determinar la relación entre la velocidad del viento en mi/h (x) y la corriente en kA (y). Los datos se presentan en la tabla siguiente.
Día
Velocidad
del viento
Corriente
Día
Velocidad
del viento
Corriente
Día
Velocidad
del viento
Corriente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
4.2
1.4
6.6
4.7
2.6
5.8
1.8
5.8
7.3
7.1
6.4
4.6
1.6
2.3
4.2
1.9
0.7
2.2
2.0
1.1
2.6
0.3
2.3
2.6
2.7
2.4
2.2
1.1
1.5
1.5
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
3.7
5.9
6.0
10.7
5.3
5.1
4.9
8.3
7.1
9.2
4.4
8.0
10.5
5.1
5.8
2.1
2.2
2.6
3.2
2.3
1.9
2.3
3.1
2.3
2.9
1.8
2.6
3.0
2.1
2.5
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
2.6
7.7
6.1
5.5
4.7
4.0
2.3
11.9
8.6
5.6
4.2
6.2
7.7
6.6
6.9
1.4
2.8
2.4
2.2
2.3
2.0
1.2
3.0
2.5
2.1
1.7
2.3
2.6
2.9
2.6
a) Calcule la recta de mínimos cuadrados para predecir y a partir de x. Realice una gráfica de residuos contra valores ajustados.
b) Calcule la recta de mínimos cuadrados para predecir y a partir de ln x. Realice una gráfica de residuos contra valores ajustados.
c) Calcule la recta de mínimos cuadrados para predecir ln y a partir de x. Realice una gráfica de residuos contra valores ajustados.
–
d) Calcule la recta de mínimos cuadrados para predecir 冑 y , a partir de x. Realice una gráfica de residuos contra valores ajustados.
e) ¿Cuál de los cuatro modelos de la a) a la d) se ajusta mejor? Explique.
f) Para el modelo que ajusta mejor, grafique los residuos contra el orden en el cual se realizaron las observaciones. ¿Los residuos parecen variar con el tiempo?
g) Utilizando el mejor modelo, pronostique la corriente cuando la velocidad del viento es 5.0 mi/h.
7.4
547
Comprobación de supuestos y transformación de datos
h) Utilizando el mejor modelo, determine un intervalo de predicción de 95% para la corriente en una día específico cuando la
velocidad del viento es 5.0 mi/h.
8. Dos detectores de radón se colocaron en ubicaciones diferentes en el sótano de una casa. Cada uno proporcionó mediciones horarias de la concentración de radón, en unidades de pCi/L. Los datos se presentan en la tabla siguiente.
R1
R2
R1
R2
R1
R2
R1
R2
1.2
1.3
1.3
1.3
1.5
1.5
1.6
2.0
2.0
2.4
2.9
3.0
1.2
1.5
1.6
1.7
1.7
1.7
1.8
1.8
1.9
1.9
1.9
2.0
3.4
3.5
3.6
3.6
3.7
3.8
3.8
3.8
3.9
3.9
3.9
3.9
2.0
2.0
2.1
2.1
2.1
2.2
2.2
2.3
2.3
2.4
2.4
2.4
4.0
4.0
4.3
4.3
4.4
4.4
4.7
4.7
4.8
4.8
4.9
5.4
2.6
2.7
2.7
2.8
2.9
3.0
3.1
3.2
3.2
3.5
3.5
3.5
5.5
5.8
5.9
6.0
6.0
6.1
6.2
6.5
6.6
6.9
7.0
3.6
3.6
3.9
4.0
4.2
4.4
4.4
4.4
4.4
4.7
4.8
a) Calcule la recta de mínimos cuadrados para predecir la concentración de radón en la posición 2 a partir de la concentración
en la posición l.
b) Grafique los residuos contra los valores ajustados. ¿El modelo lineal parece adecuado?
c) Divida los datos en dos grupos: los puntos donde R1 < 4 en un grupo, donde R1 ⱖ 4 en los demás. Calcule la recta de mínimos cuadrados y la gráfica de residuos para cada grupo. ¿La recta describe bien cualquier grupo? ¿Cuál?
d) Explique por qué podría ser una buena idea ajustar un modelo lineal a una parte de estos datos, y un modelo no lineal a la otra.
⫹
⫹
9. El artículo “The Equilibrium Partitioning of Titanium Between Ti3 and Ti4 Valency States in CaO-SiO2-TiOx Slags” (G. Tranell, O. Ostrovski y S. Jahanshahi, en Metallurgical and Materials Transactions B, 2002:61-66) analiza la relación entre el
⫹
⫹
Ti3 /Ti4 de proporción de redox y la presión parcial de oxígeno pO2 en CaO-SiO2-TiOx. Algunas mediciones independientes
⫺
⫺
⫺
⫺
⫺
del cociente redox se hicieron en cada uno de cinco presiones parciales diferentes: 10 7, 10 8, 10 9, 10 10 y 10 12 atmósferas. Los resultados para las operaciones en 14% de la masa de TiOx se presentan en la tabla siguiente.
Presión parcial
de oxígeno
10⫺7
10⫺8
10⫺9
10⫺10
10⫺12
Mediciones del cociente redox
0.011, 0.017, 0.034, 0.039
0.018, 0.011, 0.026, 0.050, 0.034, 0.068, 0.061
0.027, 0.038, 0.076, 0.088
0.047, 0.069, 0.123, 0.162
0.160, 0.220, 0.399, 0.469
β
a) Denotando el cociente redox por y y la presión parcial por x, la teoría establece que y debe ser proporcional a x para alguna β. Exprese esta relación teórica como un modelo lineal.
b) Calcule la recta de mínimos cuadrados para este modelo lineal. Grafique los residuos contra los valores ajustados. ¿El modelo lineal es válido?
⫺
c) Consideraciones teóricas adicionales sugieren que bajo las condiciones de este experimento, y debe ser proporcional a x 1/4,
¿los datos de la tabla anterior son consistentes con esta teoría? Explique.
10. El artículo “The Selection of Yeast Strains for the Production of Premium Quality South African Brandy Base Products” (C.
Steger y M. Lambrechts, en Journal of Industrial Microbiology and Biotechnology, 2000:431-440) se presenta información de-
548
CAPÍTULO 7
Correlación y regresión lineal simple
tallada sobre la composición compuesta volátil de la base de vino realizada para cada una de 16 variedades de levadura seleccionadas. Debajo están las concentraciones de ésteres totales y ácidos volátiles totales (en mg/l) en cada uno de los vinos.
Ésteres
Ácidos
Ésteres
Ácidos
Ésteres
Ácidos
Ésteres
Ácidos
284.34
215.34
139.38
658.38
445.70
332.59
356.88
192.59
173.01
188.72
197.81
105.14
265.43
166.73
291.72
412.42
229.55
144.39
303.28
295.24
210.58
254.82
215.83
442.55
312.95
172.79
256.02
170.41
203.62
342.21
152.38
391.30
a) Construya un diagrama de dispersión de la concentración de ácido contra la concentración de ésteres. Indique el dato atípico.
b) Calcule los coeficientes de la recta de mínimos cuadrados para predecir el nivel de ácido (y) a partir del nivel de ésteres (x),
junto con sus desviaciones estándar estimadas.
c) Calcule el P-valor de que la prueba de hipótesis nula H0 : β1 ⫽ 0.
d) Elimine el dato atípico, y calcule nuevamente los coeficientes de la recta de mínimos cuadrados, junto con sus desviaciones estándar estimadas.
e) Calcule el P-valor de la prueba de la hipótesis nula H0 : β1 ⫽ 0 para los datos con el dato atípico eliminado.
f) ¿Un modelo lineal parece útil para predecir la concentración de ácido de la concentración de ésteres? Explique.
11. El artículo “Mathematical Modeling of the Argon-Oxygen Decarburization Refining Process of Stainless Steel: Part II. Application of the Model to Industrial Practice” (J. Wei y D. Zhu, en Metallurgical and Materials Transactions B, 2001:212-217)
presenta el contenido de carbono (en % de masa) y la temperatura del baño (en K) para 32 calores de acero inoxidable austenítico. Estos datos se muestran en la tabla siguiente.
% de
carbono Temperatura
19
23
22
16
17
18
12
24
1 975
1 947
1 954
1 992
1 965
1 971
2 046
1 945
% de
carbono
Temperatura
% de
carbono
Temperatura
% de
carbono
Temperatura
17
20
19
22
18
22
20
19
1 984
1 991
1 965
1 963
1 949
1 960
1 960
1 953
18
19
19
15
20
22
15
15
1 962
1 985
1 946
1 986
1 946
1 950
1 979
1 989
17
20
21
17
18
23
13
15
1 983
1 966
1 972
1 989
1 984
1 967
1 954
1 977
a) Calcule la recta de mínimos cuadrados para predecir la temperatura del baño (y) del contenido de carbono (x).
b) Identifique dos datos atípicos. Calcule las dos rectas de mínimos cuadrados que resultan de la eliminación de cada dato atípico por separado, y la recta de mínimos cuadrados que da como resultado la eliminación de ambos datos atípicos.
c) ¿Las rectas de los mínimos cuadrados calculados en los incisos a) y b) son similares? Si es así, reporte la recta que ajustó
a todo el conjunto de datos, junto con los intervalos de confianza de 95% para la pendiente y el intercepto. Si no, informe
el rango de pendientes, sin un intervalo de confianza.
12. El artículo “Mechanistic-Empirical Design of Bituminous Roads: An Indian Perspective” (A. Das y B. Pandey, en Journal of
Transportation Engineering, 1999:463-471) presenta una ecuación de la forma y ⫽ a(1/x1)b(1/x2)c para predecir el número de
las repeticiones para fallas por fatiga de laboratorio (y) en relación con la fuerza de tensión en la parte baja de la viga bituminosa (x1), y con el módulo de resiliencia (x2). Transforme esta ecuación en un modelo lineal, y exprese los coeficientes del modelo lineal en función de a, b y c.
13. Un ingeniero quiere determinar la constante del resorte para un resorte especial. Cuelga cada vez varias pesas al final del resorte y mide la longitud de éste. En la siguiente figura se muestra un diagrama de dispersión de longitud (y) contra carga (x).
549
Longitud
Ejercicios adicionales para el capítulo 7
Carga
a) ¿El modelo y ⫽ β0 ⫹ β1x es un modelo empírico o una ley física?
b) ¿El ingeniero debe transformar las variables para hacer la relación más lineal, o sería mejor repetir el experimento? Explique.
Ejercicios adicionales para el capítulo 7
1. La ley de Beer-Lambert relaciona la absorción A de una solución con la concentración C de una especie en solución por A ⫽
MLC, donde L es la longitud de la trayectoria y M el coeficiente de absorción molar. Suponga que L ⫽ 1 cm. Las mediciones
de A se realizan a diferentes concentraciones. Los datos se presentan en la tabla siguiente.
Concentración (mol/cm3)
1.00
1.20
1.50
1.70
2.00
Absorción
0.99
1.13
1.52
1.73
1.96
a) Sea A ⫽ β̂ 0 ⫹ β̂ 1C la ecuación de la recta de mínimos cuadrados para predecir la absorción (A) a partir de la concentración
(C). Calcule los valores de β̂ 0 y β̂ 1.
b) ¿Qué valor le asigna la ley de Beer-Lambert a β0?
c) ¿Cuál es la cantidad física que estima β̂ 1?
d) Pruebe H0 : β0 ⫽ 0. ¿Este resultado es consistente con la ley de Beer-Lambert?
2. En una prueba de material de guerra se dejó caer un gran número de bombas sobre un objetivo desde diferentes alturas. La velocidad inicial de las bombas en dirección a la tierra fue 0. Sea y la altura en metros a partir de cual se deja caer una bomba, x
–
el tiempo en segundos para que la bomba pegue en el suelo, sea ⫽ x2, y = 冑 y . La relación entre x y y está dada por y ⫽
4.9x2. Para cada uno de los siguientes pares de variables, establezca si el coeficiente de correlación es un resumen adecuado.
a) x y y
b) w y y
c) x y v
d) w y v
e) ln x y ln y
3. Las erupciones del géiser Old Faithful en el Parque Nacional de Yellowstone generalmente duran de 1.5 a 5 minutos. Entre las
eruociones hay periodos de inactividad, que generalmente duran de 50 a 100 minutos. Un periodo de inactividad también se
puede considerar como el tiempo de espera entre las erupciones. Las duraciones en minutos para 60 periodos de inactividad
consecutivos se muestran en la tabla siguiente. Se desea predecir la duración de un periodo de inactividad a partir de la duración del que le precede inmediatamente. Para expresar esto en forma simbólica, denote la secuencia de periodos de inactividad
T1, . . . , T60. Se quiere predecir Ti⫹1 a partir de Ti.
550
CAPÍTULO 7
Correlación y regresión lineal simple
i
Ti
i
Ti
i
Ti
i
Ti
i
Ti
i
Ti
1
2
3
4
5
6
7
8
9
10
80
84
50
93
55
76
58
74
75
80
11
12
13
14
15
16
17
18
19
20
56
80
69
57
90
42
91
51
79
53
21
22
23
24
25
26
27
28
29
30
82
51
76
82
84
53
86
51
85
45
31
32
33
34
35
36
37
38
39
40
88
51
80
49
82
75
73
67
68
86
41
42
43
44
45
46
47
48
49
50
72
75
75
66
84
70
79
60
86
71
51
52
53
54
55
56
57
58
59
60
67
81
76
83
76
55
73
56
83
57
a) Construya un diagrama de dispersión de los puntos (Ti, Ti⫹1) para i ⫽ 1, . . . , 59.
b) Calcule la recta de mínimos cuadrados para predecir Ti⫹l a partir de Ti. (Sugerencia: los valores de la variable (x) independiente son T1, . . . , T59, y los valores de la variable dependiente (y) son T2, . . . , T60).
c) Determine un intervalo de confianza del 95% para la pendiente β1.
d) Si los tiempos de espera antes de la última erupción eran de 70 minutos, ¿cuál es el tiempo de espera pronosticado antes de
la próxima erupción?
e) Determine un intervalo de confianza del 98% para la media del tiempo de espera antes de la próxima erupción cuando el
tiempo de espera de la última erupción fue de 70 minutos.
f) Determine un intervalo de predicción del 99% para el tiempo de espera antes de la próxima erupción, si el tiempo de espera antes de la última erupción fue de 70 minutos.
4. Con referencia al ejercicio 3.
a) Grafique los residuos contra los valores ajustados. ¿La gráfica indica incumplimientos serios de los supuestos usuales?
b) Grafique los residuos contra el orden de los datos. ¿La gráfica indica violaciones serias de los supuestos usuales?
5. Un químico está calibrando un espectrómetro que se utilizará para medir la concentración de monóxido de carbono (CO) en
muestras atmosféricas. Para comprobar la calibración, se miden muestras de concentración conocida. Las concentraciones verdaderas (x) y las medidas (y) están dadas en la tabla siguiente. Debido al error aleatorio, mediciones repetidas en la misma
muestra variarán. Se considera que la máquina está calibrada si su media de respuesta es igual a la concentración verdadera.
Concentración verdadera
(ppm)
Concentración medida
(ppm)
0
10
20
30
40
50
60
70
80
90
100
1
11
21
28
37
48
56
68
75
86
96
Ejercicios adicionales para el capítulo 7
551
Para comprobar la calibración se ajusta al modelo lineal y ⫽ β0 ⫹ β1x ⫹ ε. Idealmente, el valor de β0 debe ser 0 y el valor β1
debe ser l.
a)
b)
c)
d)
e)
f)
g)
Calcule los estimadores β̂ 0 y β̂ 1 de mínimos cuadrados.
¿Se puede rechazar la hipótesis nula H0 : β0 ⫽ 0?
¿Se puede rechazar la hipótesis nula H1 : β1 ⫽ 1?
¿Los datos proporcionan suficiente evidencia para concluir que la máquina está fuera de calibración?
Calcule un intervalo de confianza de 95% para la media de la medición cuando la concentración verdadera es 20 ppm.
Calcule un intervalo de confianza de 95% para la media de la medición cuando la concentración verdadera es 80 ppm.
Alguien afirma que la máquina está calibrada para concentraciones cerca de 20 ppm, ¿estos datos proporcionan suficiente
evidencia para rechazar esta afirmación? Explique.
6. El artículo “Experimental Measurement of Radiative Heat Transfer in Gas-Solid Suspension Flow System” (G, Han, K. Tuzla
y J. Chen, en AiChe Journal, 2002: 1910-1916) analiza la calibración de un radiómetro. Se hicieron algunas mediciones de la
fuerza electromotriz en lecturas del radiómetro (en volts) y el flujo de radiación (en kilowatts por metro cuadrado). Los resultados (leídos de una gráfica) se presentan en la tabla siguiente.
Flujo de calor (y)
15
31
51
55
67
89
Señal de salida (x)
1.08
2.42
4.17
4.46
5.17
6.92
a) Calcule la recta de mínimos cuadrados para predecir el flujo de calor a partir de la señal de salida.
b) Si el radiómetro lee 3.00 V, pronostique el flujo de calor.
c) Si el radiómetro lee 8.00 V, ¿se puede predecir el flujo de calor? Si es así, predígalo. Si no, explique.
7. El artículo “Effect of Temperature on the Marine Immersion Corrosion of Carbon Steels” (R. Melchers, en Corrosion,
2002:768-781) presenta mediciones de pérdida por corrosión (en mm) que soportan elementos de acero y de cobre sumergidos
en agua de mar en 14 ubicaciones diferentes. Para cada ubicación se registró la media de la pérdida por corrosión (en mm), junto con la media de la temperatura del agua (en °C). Los resultados, después de un año de inmersión, se presentan en la tabla
siguiente.
a)
b)
c)
d)
Corrosión
Media de
la temperatura
Corrosión
Media de
la temperatura
0.2655
0.1680
0.1130
0.1060
0.2390
0.1410
0.3505
23.5
18.5
23.5
21.0
17.5
20.0
26.0
0.2200
0.0845
0.1860
0.1075
0.1295
0.0900
0.2515
26.5
15.0
18.0
9.0
11.0
11.0
13.5
Calcule la recta de mínimos cuadrados para predecir la pérdida por corrosión (y) para la media de la temperatura (x).
Determine un intervalo de confianza de 95% para la pendiente.
Determine un intervalo de confianza de 95% para la media de la pérdida de corrosión a una media de temperatura de 20°C.
Determine un intervalo de predicción de 90% para la pérdida por corrosión de un elemento inmerso a una media de la temperatura de 20°C.
8. El artículo “Measurements of the Thermal Conductivity and Thermal Diffusivity of Polymer Melts with the Short-Hot-Wire
Method” (X. Zhang, W. Hendro y cols., en International Journal of Thermophysics, 2002: 1077⫺1090) presenta mediciones
de la conductividad térmica y difusividad de algunos polímeros a diferentes temperaturas. Los resultados para la difusividad
⫺
⫺
térmica de policarbonato (en 10 7 m2s 1) se presentan en la tabla siguiente.
552
CAPÍTULO 7
Correlación y regresión lineal simple
Temperatura
Temperatura
Temperatura
Temperatura
Difusividad
(°C)
Difusividad
(°C)
Difusividad
(°C)
Difusividad
(°C)
1.43
1.53
1.43
1.34
28
38
61
83
1.36
1.34
1.29
1.36
107
119
130
146
1.05
1.13
1.03
1.06
159
169
181
204
1.26
0.86
1.01
0.98
215
225
237
248
a) Calcule la recta de mínimos cuadrados para predecir la difusividad (y) a partir de la temperatura (x).
b) Determine un intervalo de confianza de 95% para la pendiente.
c) Determine un intervalo de confianza de 95% para la difusividad de policarbonato a 100°C.
d) Determine un intervalo de predicción de 95% para la difusividad de policarbonato a 100°C.
e) ¿Cuál es más útil, el intervalo de confianza o el de predicción? Explique.
9. El artículo “Copper Oxide Mounted on Activated Carbon as Catalyst for Wet Air Oxidation of Aqueous Phenol. 1. Kinetic and
Mechanistic Approaches” (P. Alvarez, D. McLurgh y P. Plucinski, en Industrial Engineering and Chemistry Research,
2002:2147-2152) notifica resultados de experimentos para describir el mecanismo de oxidación catalítica húmeda aérea de fenol acuoso. En un conjunto de experimentos se midieron la tasa de oxidación inicial (en kilogramos de fenol por kilogramo de
catalizador por hora) y la concentración de oxígeno (en mol/m3). Los resultados (leídos de una gráfica) se presentan en la tabla siguiente.
Tasa (y)
0.44
0.49
0.60
0.64
0.72
Concentración de O2 (x)
3.84
4.76
6.08
7.06
8.28
r
a) Se sabe que x y y están relacionados por una ecuación de la forma y ⫽ kx , donde r es el orden de reacción de oxígeno.
Realice las transformaciones apropiadas para expresar esto último como una ecuación lineal.
b) Estime los valores de k y r calculando la recta de mínimos cuadrados.
c) Con base en estos datos, ¿es creíble que el orden de reacción del oxígeno es igual a 0.5? Explique.
10. Una científica especialista en materiales está experimentando con un nuevo material para fabricar latas de bebidas. Llena latas
con líquido a temperatura ambiente, y después las refrigera para ver qué tan rápido se enfrían. De acuerdo con la ley de enfriamiento de Newton, si t es el tiempo de refrigeración y y la disminución de la temperatura al tiempo t, entonces y está relacionado con t por una ecuación de la forma
ln y ⫽ β0 ⫹ β1t,
Residuo
ln (temperatura)
donde β0 representa una constante que depende de la temperatura inicial de la lata y de la temperatura ambiente del refrigerador, y β1, una constante que depende de las propiedades físicas de la lata. La científica mide la temperatura a intervalos regulares, y después ajusta este modelo a los datos. Los resultados se muestran en la siguiente figura. Un diagrama de dispersión,
con la recta de mínimos cuadrados sobrepuesta, está a la izquierda, y la gráfica de residuos, a la derecha.
Tiempo
Valor ajustado
Ejercicios adicionales para el capítulo 7
553
¿Qué debe hacer después la científica?
i. Tratar de encontrar una transformación que haga la relación más lineal.
ii. Utilizar el modelo tal como está, ya que la ley del enfriamiento de Newton es una ley física.
iii. Utilizar el modelo tal como está, porque ajusta bastante bien.
iv. Revisar cuidadosamente la configuración experimental para ver qué puede estar mal.
11. La supervisión de la producción de una reacción química dada a diferentes temperaturas del recipiente de reacción produce los
resultados que se muestran en tabla siguiente.
Temperatura (°C) Producción (%)
150
150
150
200
200
200
a)
b)
c)
d)
e)
f)
g)
Temperatura (°C)
Producción (%)
250
250
250
300
300
300
88.9
89.2
89.7
94.8
94.7
95.9
77.4
76.7
78.2
84.1
84.5
83.7
Determine los estimadores de mínimos cuadrados para β0, β1 y σ 2 para el modelo lineal simple ⫽ β0 ⫹ β1 Temperatura ⫹ ε.
¿Puede concluir que β0 no es igual a 0?
¿Puede concluir que β1 no es igual a 0?
Realice una gráfica de residuos. ¿El modelo lineal parece adecuado?
Determine un intervalo de confianza de 95% para la pendiente.
Determine un intervalo de confianza de 95% para la media de la producción a 225°C.
Determine un intervalo de predicción de 95% para una producción a 225°C.
12. El artículo “Approach to Confidence Interval Estimation for Curve Numbers” (R. McCuen, en Journal of Hydrologic Engineering, 2002:43-48) analiza la relación entre la profundidad de precipitación y la profundidad de corrientes en algunos lugares.
En un lugar especial se registraron la profundidad de precipitación y la de corrientes para 13 lluvias torrenciales. El siguiente
corresponde al resultado de MINITAB para un ajuste de la recta de mínimos cuadrados para predecir la profundidad de las corrientes de la profundidad de precipitación (ambas medidas en pulgadas).
The regression equation is
Runoff = –0.23 + 0.73 Rainfall
Predictor
Constant
Rainfall
S = 0.40229
Coef
–0.23429
0.72868
SE Coef
0.23996
0.06353
R–Sq = 92.3%
T
–0.98
11.47
P
0.350
0.000
R–Sq(adj) = 91.6%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
1
11
12
SS
21.290
1.780
23.070
MS
21.290
0.16184
F
131.55
P
0.000
a) Pronostique la corriente para una tormenta con 2.5 pulg de precipitación.
b) Alguien afirma que si dos tormentas difieren en su precipitación en 1 pulg, entonces sus corrientes serán diferentes, también en promedio por 1 pulg. ¿Esta afirmación es creíble? Explique.
c) Es un hecho que si la precipitación es 0 la corriente es 0. ¿La recta de mínimos cuadrados es consistente con este hecho?
Explique.
554
CAPÍTULO 7
Correlación y regresión lineal simple
13. Con referencia al ejercicio 12, alguien quiere calcular un intervalo de confianza de 95% para la media de la corriente cuando
la precipitación es 3. ¿Se puede calcular a partir de la información en el resultado de MINITAB que se muestra en el ejercicio
12? ¿O se necesita más información? Elija la mejor respuesta.
i.
ii.
iii.
iv.
Sí, se puede calcular del resultado de MINITAB.
No, también se necesita conocer los valores de la precipitación que se utilizaron para calcular la recta de mínimos cuadrados.
No, también se necesita conocer los valores de la corriente que se utilizaron para calcular la recta de mínimos cuadrados.
No, también se necesita conocer tanto los valores de la precipitación como de la corriente que se utilizaron para calcular la
recta de mínimos cuadrados.
14. Durante la producción de un plato de caldera, las piezas de prueba están sujetas a una carga, y se miden sus elongaciones. En
un experimento especial, se realizarán cinco pruebas, con cargas (en MPa) de 11, 37, 54, 70 y 93. Se calculará la recta de cuadrados mínimos para predecir la elongación de la carga. Se calcularán los intervalos de confianza para la media de la elongación respecto a algunas cargas diferentes. ¿Cuál de los siguientes intervalos será el más ancho? ¿Cuál será el más angosto?
i. El intervalo de confianza de 95% para la media de la elongación bajo una carga de 53 MPa.
ii. El intervalo de confianza de 95% para la media de la elongación bajo una carga de 72 MPa.
iii. El intervalo de confianza de 95% para la media de la elongación bajo una carga de 35 MPa.
15. El artículo “Low-Temperature Heat Capacity and Thermodynamic Properties of 1,1,l-trifluoro-2,2-dichloroethane” (R. Varushchenko y A. Druzhinina, en Fluid Phase Equilibria, 2002: 109-119) describe un experimento en el cual muestras de freón R-123
fueron derretidas en un calorímetro. Se proporcionaron diferentes cantidades de energía al calorímetro para derretirlas. Se midieron las temperaturas de equilibrio de fusión (t) y las fracciones derretidas (f). La recta de cuadrados mínimos se ajustó con el
modelo t ⫽ β0 ⫹ β1(1/f) ⫹ ε, donde 1/f es el recíproco de la fracción. Los resultados del ajuste son los siguientes.
The regression equation is
Temperature = 145.74 – 0.052 Reciprocal Frac
Predictor
Constant
Recip Frac
Coef
145.736
–0.05180
S = 0.019516
SE Coef
0.00848
0.00226
R–Sq = 97.6%
T
17190.1
–22.906
P
0.000
0.000
R–Sq(adj) = 97.4%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
1
13
14
SS
0.200
0.00495
0.205
MS
0.200
0.000381
F
524.70
P
0.000
a) Estime la temperatura con la cual la mitad de la muestra se ha derretido (es decir, f ⫽ 1/2).
b) ¿Puede determinar el coeficiente de correlación entre la temperatura de equilibrio y el recíproco de la fracción derretida en
este resultado? Si es así, determínelo. Si no, explique qué información adicional se necesita.
c) La temperatura de punto triple es la más baja a la cual toda la muestra se derrite (es decir, f ⫽ 1). Calcule la temperatura
del punto triple.
16. El artículo “Polyhedral Distortions in Tourmaline” (A. Ertl, J. Hughes y cols., en The Canadian Mineralogist, 2002: 153-162)
presenta un modelo para calcular la distorsión que soporta la longitud de enlace turmalina-vanadio. Para comprobar la exactitud del modelo se calcularon diferentes valores (x) que se compararon directamente con los valores observados (y). Los resultados (leídos de una gráfica) se presentan en la tabla siguiente.
Ejercicios adicionales para el capítulo 7
Valor observado
Valor calculado
Valor observado
Valor calculado
0.33
0.36
0.54
0.56
0.66
0.66
0.74
0.36
0.36
0.58
0.64
0.64
0.67
0.58
0.74
0.79
0.97
1.03
1.10
1.13
1.14
0.78
0.86
0.97
1.11
1.06
1.08
1.17
555
a) Suponga que el valor observado y es una medición sin sesgo del valor verdadero. Muestre que si el valor calculado x es
exacto (es decir, es igual al valor verdadero), entonces y ⫽ x ⫹ ε, donde ε es el error de medición.
b) Calcule la recta de mínimos cuadrados y ⫽ β̂ 0 ⫹ β̂ 1x.
c) Muestre que si los valores calculados son precisos, entonces los coeficientes verdaderos son β0 ⫽ 0 y β1 ⫽ l.
d) Pruebe la hipótesis nula β0 ⫽ 0 y β1 ⫽ l.
e) ¿Es creíble que el valor calculado es exacto? ¿O puede concluir que no lo es? Explique.
17. Considere el modelo y ⫽ β x ⫹ ε, donde se sabe que el intercepto de la recta es cero. Suponga que se observan los valores
(x1, y1), . . . , (xn, yn), y se calcula el estimador de mínimos cuadrados β̂ de β.
a) Deduzca el estimador de mínimos cuadrados β̂ en función de xi y yi.
2
b) Sea σ 2 la varianza de ε (que es también la varianza de y). Deduzca el estimador de la varianza sβ̂ de los mínimos cuadrados en función de σ 2 y de las xi.
18. Utilice la ecuación (7.33) (pág. 510) para mostrar que mβ̂ 1 ⫽ β1.
19. Utilice la ecuación (7.34) (pág. 510) para mostrar que mβ̂ 0 ⫽ β0.
σ2
.
(xi − x)2
i=1
20. Utilice la ecuación (7.33) (pág. 510) para deducir la fórmula σβ2 = n
1
21. Utilice la ecuación (7.34) (pág. 510) para deducir la fórmula σ2 = σ 2
β
0
1
x2
+ n
n
(xi − x)2
i=1
.
Capítulo
8
Regresión múltiple
Introducción
Los métodos de regresión lineal simple, analizados en el capítulo 7, son aplicables cuando se
desea ajustar un modelo lineal al relacionar el valor de una variable independiente y con el
valor de una sola variable dependiente x. Sin embargo, hay muchos casos en los que una sola variable independiente no es suficiente. Por ejemplo, el grado de desgaste de un cojinete
lubricado en una máquina puede depender tanto de la carga en el cojinete como de las propiedades físicas del lubricante. Una ecuación que exprese el desgaste como una función sólo
de la carga o de las propiedades del lubricante fallará como predictor. En situaciones como
éstas hay varias variables independientes, x1, x2, . . . , xp, relacionadas con una variable dependiente y. Si la relación entre las variables dependiente e independiente es lineal, se puede usar
la técnica de regresión múltiple.
8.1
El modelo de regresión múltiple
A continuación se describirá el modelo de regresión múltiple. Suponga que se tiene una muestra de n elementos, y para cada uno se ha medido una variable dependiente y y p variables independientes x1, . . . , xp. El i-ésimo elemento de la muestra, por tanto, tiene el conjunto ordenado
(yi, x1i, . . . , xpi). En consecuencia, se puede ajustar al modelo de regresión múltiple
yi ⫽ β0 ⫹ β1x1i ⫹ . . . ⫹ βp xpi ⫹ εi
(8.1)
Hay algunos casos especiales del modelo de regresión múltiple (8.1) que con frecuencia se utilizan en la práctica. Uno es el modelo de regresión polinomial, en el cual las variables independientes son potencias de una sola variable. El modelo de regresión polinomial de grado p es
yi ⫽ β0 ⫹ β1xi ⫹ β2x2i ⫹ . . . ⫹ βp x pi ⫹ εi
556
(8.2)
8.1
El modelo de regresión múltiple
557
Los modelos de regresión múltiple también se pueden hacer con potencias de diversas variables. Por ejemplo, un modelo de regresión polinomial de grado 2, también llamado modelo
cuadrático, en dos variables x1 y x2 está dado por
yi ⫽ β0 ⫹ β1x1i ⫹ β2x2i ⫹β3x1ix2i ⫹ β4 x 21i ⫹ β5x 22i ⫹ εi
(8.3)
Una variable producto de las otras dos variables es llama interacción. En el modelo (8.3), la
variable x1i x2i es la interacción entre x1 y x2.
Los modelos (8.2) y (8.3) se consideran lineales, aunque contengan términos no lineales de las variables independientes. La razón de que continúen siendo modelos lineales es que
son lineales en los coeficientes βi.
Estimando los coeficientes
En cualquier modelo de regresión múltiple, los estimadores β̂ 0, β̂ 1, . . . , β̂ p, se calculan por
medio de mínimos cuadrados, exactamente de la misma forma como en la regresión lineal
simple. La ecuación
ŷ ⫽ β̂ 0 ⫹ β̂ 1x1 ⫹ . . . ⫹ β̂ p x p
(8.4)
se llama ecuación de mínimos cuadrados o ecuación de regresión ajustada. Ahora se define ŷi como la coordenada y de la ecuación de mínimos cuadrados correspondiente a los valores x (x1i, . . . , xpi ). Los residuos representan las cantidades ei ⫽ yi ⫺ ŷi, que constituyen las
diferencias entre los valores observados y y los valores y que proporciona la ecuación.
n Se
quieren calcular β̂ 0, β̂ 1, . . . , β̂ p, para minimizar la suma de los cuadrados residuales i=1 ei2 .
Con ese propósito se expresa ei como función de β̂ 0, β̂ 1, . . . , β̂ p:
ei ⫽ yi ⫺ β̂ 0 ⫺ β̂ 1x1i ⫺ . . . ⫺ β̂ p x pi
(8.5)
Por consiguiente, se desea minimizar la suma
n
i=1
(yi − β0 − β1 x1i − · · · − βp xpi )2
(8.6)
Hacer esto último requiere tomar derivadas parciales de (8.6) con respecto a β̂ 0, β̂ 1, . . . , β̂ p,
e igualarlas a 0, así como resolver las p ⫹ 1 ecuaciones resultantes con p ⫹ 1 incógnitas. Las
expresiones que se obtienen para β̂ 0, β̂ 1, . . . , β̂ p, son complicadas. Afortunadamente, han sido codificadas en muchos software para que pueda calcularlos en la computadora. Para cada
coeficiente estimado β̂ i, hay una desviación estándar estimada sβ̂ i. También las expresiones
para estas cantidades son complicadas, por lo que en la actualidad las personas dependen de
las computadoras para calcularlas.
Sumas de cuadrados
Gran parte del análisis en la regresión múltiple se basa en tres cantidades fundamentales. Éstas son suma de los cuadrados de la regresión (SSR, por sus siglas en inglés), suma de los
cuadrados del error (SSE, por sus siglas en inglés), y suma total de los cuadrados (SST,
558
CAPÍTULO 8
Regresión múltiple
por sus siglas en inglés). Estas cantidades se definieron en la sección 7.2, en el análisis de la
regresión lineal simple. Las definiciones también valen para la regresión múltiple. Aquí se repiten.
Definición: Sumas de los cuadrados
En el modelo de regresión múltiple
yi ⫽ β0 ⫹ β1x1i ⫹ . . . ⫹ βp xpi ⫹ εi,
se definen las siguientes sumas de cuadrados:
n
yi − y)2
Suma de los cuadrados de la regresión: SSR
n = i=1 (
Suma de los cuadrados del error: SSE = i=1 (yi − yi )2
Suma total de los cuadrados: SST = ni=1 (yi − y)2
Se puede mostrar que
SST ⫽ SSR ⫹ SSE
(8.7)
La ecuación (8.7) se llama identidad del análisis de la varianza. Ésta se obtiene para
la regresión lineal simple al final de la sección 7.2.
Ahora se verá cómo se utilizan estas sumas de los cuadrados para deducir los estadísticos que se emplean en la regresión múltiple. Como se hizo en la regresión lineal simple, el
análisis se restringirá al caso más simple, en el cual se satisfacen los cuatro supuestos acerca
de los errores εi. Aquí se repiten estos supuestos.
Supuestos para los errores en modelos lineales
En la situación más simple se satisfacen los siguientes supuestos:
1. Los errores ε1, . . . , εn son aleatorios e independientes. En particular, la magnitud
de cualquier error εi no influye en el valor del siguiente error εi⫹1.
2. Los errores ε1, . . . , εn tienen media 0.
3. Los errores ε1, . . . , εn tienen la misma varianza, que se denota por medio de s2.
4. Los errores ε1, . . . , εn están distribuidos normalmente.
Al igual que en la regresión lineal simple, estos supuestos implican que las observaciones yi sean variables aleatorias independientes. Para ser más específico, cada yi tiene una distribución normal con media β0 ⫹ β1x1i ⫹ . . . ⫹ βp xpi y varianza s2. Cada coeficiente βi
representa el cambio en la media de y relacionado con un aumento de una unidad en el valor
de xi, cuando las otras variables x se mantienen constantes.
8.1
559
El modelo de regresión múltiple
Resumen
En el modelo de regresión múltiple yi ⫽ β0 ⫹ β1x1i ⫹ . . . ⫹ βp xpi ⫹ εi, bajo los supuestos 1 a 4, las observaciones y1, . . . , yn son variables aleatorias independientes que
siguen la distribución normal. La media y la varianza de yi están dadas por
myi ⫽ β0 ⫹ β1x1i ⫹ . . . ⫹ βp xpi
s2yi ⫽ s2
Cada coeficiente βi representa el cambio en la media de y relacionada con un aumento
de una unidad en el valor de xi, cuando las otras variables x se mantienen constantes.
Los estadísticos s2, R2 y F
Los tres estadísticos más utilizados en la regresión múltiple son el estimador de la varianza
del error s2, el coeficiente de determinación R2 y el estadístico F. Cada uno de éstos tiene un
análogo en la regresión lineal simple. En su momento se analizará a
cada uno.
n
En la regresión lineal simple, el estimador de la varianza de error es i=1 (yi − yi )2 /(n − 2).
Se divide entre n ⫺ 2 en lugar de n porque los residuos (ei ⫽ yi ⫺ ŷi) tienden a ser un poco
más pequeños que los errores εi. La razón de que los residuos sean un
poco más pequeños que
los dos coeficientes (β̂ 0 y β̂ 1) es que se han elegido para minimizar ni=1 (yi − yi )2 . Ahora,
para el caso de la regresión múltiple, se están estimando p ⫹ l coeficientes en lugar de sólo
dos.
n Por tanto,2 los residuos tienden a ser aún más pequeños, por lo que se debe dividir
i ) entre un denominador aún más pequeño. En este sentido, el denominador adei=1 (yi − y
cuado es igual al número de las observaciones (n) menos el número de parámetros en el modelo (p ⫹ 1). Por tanto, el estimador de la varianza del error está dado por
2
s =
n
SSE
− yi )2
=
n−p−1
n−p−1
i=1 (yi
(8.8)
El estimador de la varianza s β̂2i de cada coeficiente de mínimos cuadrados β̂ i se calcula
al multiplicar s2 por una función bastante complicada de las variables xij. En la práctica, los
valores de s β̂2i se calculan en una computadora. Cuando se satisfacen los supuestos l a 4, la
cantidad
βi − βi
sβi
tiene una distribución t de Student con n ⫺ p ⫺ 1 grados de libertad. El número de grados de
libertad es igual al denominador con que se calculó el estimador de varianza del error s2
(ecuación 8.8). Con este estadístico se calculan los intervalos de confianza y se realizan pruebas de hipótesis sobre los valores βi, de igual forma que en la regresión lineal simple.
En la regresión lineal simple, el coeficiente de determinación, r2, mide la bondad del
ajuste del modelo lineal. El estadístico de bondad del ajuste en la regresión múltiple represen-
560
CAPÍTULO 8
Regresión múltiple
ta una cantidad que se denota mediante R2, también denominado coeficiente de determinación. El valor de R2 se calcula del mismo modo que r2 en la regresión lineal simple (ecuación
7.21, en la sección 7.2). Éste es
R2 =
n
i=1 (yi
− y)2 − ni=1 (yi − yi )2
SST − SSE
SSR
n
=
=
2
SST
SST
i=1 (yi − y)
(8.9)
En la regresión lineal simple casi siempre se prueba la hipótesis nula β1 ⫽ 0. Si ésta se
aprueba, entonces el modelo lineal no podría ser útil. La hipótesis nula análoga en la regresión múltiple es H0 : β1 ⫽ β2 ⫽ . . . ⫽ βp ⫽ 0. Ésta es una hipótesis muy fuerte. Establece
que ninguna de las variables independientes tiene alguna relación lineal con la variable dependiente. En la práctica, los datos por lo general proporcionan evidencia suficiente para rechazar esta hipótesis. El estadístico de prueba para esta hipótesis es
n
n
2
i )2 /p
[SST − SSE]/p
SSR/p
i=1 (yi − y) −
i=1 (yi − y
n
F=
=
=
2
SSE/(n
−
p
−
1)
SSE/(n
− p − 1)
i=1 (yi − yi ) /(n − p − 1)
(8.10)
Éste es un estadístico F; su distribución nula es Fp, n ⫺ p ⫺ 1. Observe que el denominador del estadístico F es s2 (ecuación 8.8). Los subíndices p y n ⫺ p ⫺ 1 son los grados de libertad del estadístico F.
Las diferentes versiones del estadístico F se pueden utilizar para probar la hipótesis nula más débil. En particular, dado un modelo con variables independientes x1, . . . , xp, a veces
se quiere probar la hipótesis nula de que alguna de ellas (por ejemplo, xk ⫹ 1, . . . , xp) no se
relaciona linealmente con la variable dependiente. Con este propósito se puede construir una
versión del estadístico F para probar la hipótesis nula H0 : βk ⫹ 1 ⫽ . . . ⫽ βp ⫽ 0. Lo anterior
se analizará con mayor profundidad en la sección 8.3.
Un ejemplo
Ahora se analizará un ejemplo de regresión múltiple. Primero se describen los datos. Una red
de computadoras móviles ad hoc consta de varias computadoras (nodos) que se mueven dentro de un área de la red. Con frecuencia los mensajes se envían de uno a otro nodo. Cuando
el nodo receptor está fuera del alcance, se debe enviar el mensaje a un nodo cercano, que después lo envía hacia su destino a lo largo de una ruta de direccionamiento. Ésta se determina
por medio de una rutina conocida como un protocolo de direccionamiento. El porcentaje de
mensajes que se distribuye exitosamente se llama goodput (caudal útil), y lo afecta la velocidad promedio del nodo y la pausa en los nodos en cada destino. La tabla 8.1 presenta la velocidad de nodo promedio, el promedio de pausa y el goodput para 25 redes ad hoc móviles
simuladas. Estos datos se generaron para un estudio descrito en el artículo “Metrics to Enable Adaptive Protocols for Mobile Ad Hoc Networks” (J. Boleng, W. Navidi y T. Camp, en
Proceedings of the 2002 International Conference on Wireless Networks, 2002:293-298).
8.1
561
El modelo de regresión múltiple
TABLA 8.1 Velocidad de nodo promedio, tiempo de pausa y goodput para redes
de computadoras
Velocidad
(m/s)
Tiempo de pausa
(s)
Goodput
(%)
Velocidad
(m/s)
5
5
5
5
5
10
10
10
10
10
20
20
20
10
20
30
40
50
10
20
30
40
50
10
20
30
95.111
94.577
94.734
94.317
94.644
90.800
90.183
91.341
91.321
92.104
72.422
82.089
84.937
20
20
30
30
30
30
30
40
40
40
40
40
Tiempo de pausa
(s)
Goodput
(%)
40
50
10
20
30
40
50
10
20
30
40
50
87.800
89.941
62.963
76.126
84.855
87.694
90.556
55.298
78.262
84.624
87.078
90.101
El siguiente resultado de MINITAB presenta los resultados del ajuste al modelo
Goodput ⫽ β0 ⫹ β1 Velocidad ⫹ β2 Pausa ⫹ β3 Velocidad ⋅ Pausa
⫹ β4 Velocidad2 ⫹ β5 Pausa2 ⫹ ε
The regression equation is
Goodput = 96.0 – 1.82 Speed + 0.565 Pause
+ 0.0247 Speed*Pause + 0.0140 Speedˆ2
–0.0118 Pauseˆ2
Predictor
Constant
Speed
Pause
Speed*Pa
Speedˆ2
Pauseˆ2
Coef
96.024
–1.8245
0.5652
0.024731
0.014020
–0.011793
S = 2.942
SE Coef
3.946
0.2376
0.2256
0.003249
0.004745
0.003516
R–Sq = 93.2%
T
24.34
–7.68
2.51
7.61
2.95
–3.35
P
0.000
0.000
0.022
0.000
0.008
0.003
R–Sq(adj) = 91.4%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
5
19
24
SS
2240.49
164.46
2404.95
MS
448.10
8.66
F
51.77
P
0.000
562
CAPÍTULO 8
Regresión múltiple
Predicted Values for New Observations
New
Obs
Fit
SE Fit
95% CI
1
74.272
1.175
(71.812, 76.732)
95% PI
(67.641, 80.903)
Values of Predictors for New Observations
New
Obs
Speed
Pause
Speed*Pause
Speedˆ2
1
25.0
15.0
375
625
Pauseˆ2
225
Gran parte del resultado es análogo al de la regresión lineal simple. La ecuación de regresión ajustada se presenta cerca de la parte superior del resultado. Debajo de ésta se muestran el estimador del coeficiente β̂ i y las estimaciones de sus desviaciones estándar sβ̂ i.
Después de cada desviación estándar está el estadístico t de Student para probar la hipótesis
nula de que el valor verdadero del coeficiente es igual a 0. Este estadístico es igual al cociente del estimador del coeficiente y su desviación estándar. Debido a que hay n ⫽ 25 observaciones y p ⫽ 5 variables independientes, el número de grados de libertad para el estadístico t
de Student es 25 ⫺ 5 ⫺ 1 ⫽ 19. Los P-valores para las pruebas se presentan en la columna
siguiente. Todos los P-valores son pequeños, por lo que sería razonable concluir que cada una
de las variables independientes en el modelo es útil para pronosticar el goodput.
La cantidad “S” es s, la estimación de la desviación estándar del error, y “R-sq” representa el coeficiente de determinación de R2. El ajuste R2, “R-sq(adj)”, se utiliza principalmente en la selección de modelo. En la sección 8.3 se analizará este estadístico.
El análisis de la tabla de varianza es análogo al que se encuentra en la regresión lineal
simple. Se recorrerá columna por columna. En la columna correspondiente, “DF”, los grados
de libertad para la regresión son igual al número de variables independientes (5). Observe que
Speed2 (Velocidad2), Pause2 (Pausa2), y Speed ⋅ Pause (Velocidad ⋅ Pausa) se consideran como variables independientes distintas, aun cuando se pueden calcular a partir de Speed (Velocidad) y Pause (Pausa). En el siguiente renglón, etiquetado como “Residual Error”, se
encuentra que el número de grados de libertad es 19, que representa el número de observaciones (25) menos el número de los parámetros estimados (6: el intercepto, y los coeficientes para cinco variables independientes). Por último, el “Total” de grados de libertad es uno menos
que el tamaño de muestra de 25. Observe que el total de grados de libertad constituye la suma de los grados de libertad de regresión más los grados de libertad para el error. Yendo hacia abajo en la columna “SS”, se encuentra la suma de los cuadrados de la regresión SSR, la
suma de los cuadrados del error SSE, y la suma total de los cuadrados SST. Note que SST ⫽
SSR ⫹ SSE. La columna “MS” presenta la media de los cuadrados, que son las sumas de
cuadrados divididas entre sus respectivos grados de libertad. Observe que la media del cuadrado del error es igual a s2, la estimación para la varianza de error: (s2 ⫽ S2 ⫽ 2.9422 ⫽
8.66). La columna etiquetada como “F” presenta los cuadrados medios para la regresión dividida entre los cuadrados medios para el error (448.10/8.66 ⫽ 51.77, lo que permite el error
de redondeo). Éste es el estadístico F que se muestra en la ecuación (8.10), y con el que se
prueba la hipótesis nula de que ninguna de las variables independientes están relacionadas linealmente con las variables dependientes. El P-valor para esta prueba es 0.
El resultado debajo del encabezado “Predicted Values for New Observations” presenta
los intervalos de confianza de la respuesta media y los intervalos de predicción para los valo-
8.1
El modelo de regresión múltiple
563
res de las variables dependientes que haya especificado el usuario. Los valores de las variables dependientes que se han especificado están listadas debajo del encabezado “Values of
Predictors for New Observations”. Los valores de las variables independientes en este resultado son Speed ⫽ 25 y Pause ⫽ 15. La cantidad 74.242, etiquetada como “Fit”, es el valor de
ŷ, obtenido al sustituir estos valores en la ecuación de regresión ajustada. La cantidad etiquetada “SE Fit” representa el estimador de la desviación estándar de ŷ, que se utiliza para calcular el intervalo de confianza de 95%, etiquetado como “95% CI”. La cantidad “95% PI”
significa el intervalo de predicción de 95% para una futura observación de la variable dependiente cuando se establecen las variables independientes para algunos valores dados. De la
misma manera que con el intervalo de confianza, este intervalo se centra en ŷ, pero es más ancho, igual que en la regresión lineal simple.
Ejemplo
8.1
Utilice el modelo de la regresión múltiple con el propósito de pronosticar el goodput para una
red con velocidad de 12 m/s y tiempo de pausa de 25 s.
Solución
Del resultado de MINITAB, el modelo ajustado es
Goodput ⫽ 96.0 ⫺ 1.82 Velocidad ⫹ 0.565 Pausa ⫹ 0.0247 Velocidad ⋅ Pausa
⫹ 0.0140 Velocidad2 ⫺ 0.0118 Pausa2
Al sustituir 12 para velocidad y 25 para pausa, se encuentra que el goodput pronosticado es
90.336.
Ejemplo
8.2
Para los datos goodput, determine el residuo para el punto Velocidad ⫽ 20, Pausa ⫽ 30.
Solución
El valor observado goodput (tabla 8.1) es y ⫽ 84.937. El valor pronosticado ŷ se encuentra
sustituyendo Velocidad ⫽ 20 y Pausa ⫽ 30 en el modelo ajustado que se presenta en la solución del ejemplo 8.1. Se obtiene un valor pronosticado para goodput de ŷ ⫽ 86.350. El residuo está dado por y ⫺ ŷ ⫽ 84.937 ⫺ 86.350 ⫽ ⫺1.413.
Es sencillo calcular, mediante el resultado computacional, los intervalos de confianza y
probar las hipótesis considerando los coeficientes de mínimos cuadrados. Los ejemplos 8.3 a
8.5 proporcionan casos ilustrativos.
Ejemplo
8.3
Determine un intervalo de confianza de 95% para el coeficiente de la Velocidad en el modelo de regresión múltiple.
Solución
Del resultado, el coeficiente estimado es ⫺1.8245, con desviación estándar de 0.2376. Un intervalo de confianza se determina utilizando la distribución t de Student con 19 grados de li-
564
CAPÍTULO 8
Regresión múltiple
bertad. Los grados de libertad para el estadístico t son iguales a los de libertad del error. El
valor t para un intervalo de confianza de 95% es t19, .025 ⫽ 2.093. El intervalo de confianza de
95% es
⫺1.8245 ⫾ (2.093)(0.2376) ⫽ ⫺1.8245 ⫾ 0.4973 ⫽ (⫺2.3218, ⫺1.3272)
Ejemplo
8.4
Pruebe la hipótesis nula de que el coeficiente de Pausa es menor o igual que 0.3.
Solución
El estimador del coeficiente de Pausa es β̂ 2 ⫽ 0.5652, con desviación estándar sβ̂ 2 ⫽ 0.2256.
La hipótesis nula es β 2 ⱕ 0.3. Bajo H0 se tiene que β 2 ⫽ 0.3, por lo que la cantidad
t=
β2 − 0.3
0.2256
tiene una distribución t de Student con 19 grados de libertad. Observe que el concepto grados
de libertad para el estadístico t es igual a los grados de libertad para el error. El valor del estadístico t es (0.5652 ⫺ 0.3)/0.2256 ⫽ 1.1755. El P-valor se encuentra entre 0.10 y 0.25. Es
creíble que β 2 ⱕ 0.3.
Ejemplo
8.5
Determine un intervalo de confianza de 95% para la respuesta media myi, y un intervalo de
predicción de 95% para una futura observación cuando Velocidad ⫽ 25 y Pausa ⫽ 15.
Solución
Del resultado, bajo el encabezado “Predicted Values for New Observations”, el intervalo de
confianza de 95% es (71.812, 76.732) y el intervalo de predicción de 95% es (67.641,
80.903).
Comprobación de supuestos en la regresión múltiple
En la regresión múltiple, como en la regresión lineal simple, es importante probar la validez
de los supuestos para los errores en modelos lineales (presentados al principio de esta sección). Los diagnósticos para estos supuestos empleados en el caso de la regresión lineal simple también son útiles en la regresión múltiple. Estos diagnósticos son las gráficas de residuos
contra valores ajustados, las de probabilidad normal de residuos y las de residuos contra el orden en que se hacen las observaciones. También es una buena idea hacer gráficas de residuos
contra cada una de las variables independientes. Si las gráficas de residuos indican incumplimiento de los supuestos, es posible intentar arreglar el problema al transformar las variables,
como en la regresión lineal simple.
La figura 8.1 presenta una gráfica de residuos contra valores ajustados para los datos
goodput. Las figuras 8.2 y 8.3 presentan gráficas de residuos contra velocidad y pausa, res-
8.1
El modelo de regresión múltiple
565
pectivamente. La gráfica de los residuos contra valores ajustados da la impresión de curvatura, que causan principalmente algunos puntos en los extremos. Las gráficas de los residuos
contra variables independientes no indican ningún incumplimiento grave de los supuestos del
modelo. En la práctica se podría aceptar que este modelo ajusta bastante bien, o se podrían
aplicar técnicas de selección de modelos (analizadas en la sección 8.3) para analizar modelos
alternativos.
6
4
Residuos
2
0
⫺2
⫺4
⫺6
60
70
80
Valor ajustado
90
100
FIGURA 8.1 Gráfica de residuos contra valores ajustados para los datos goodput.
6
4
Residuos
2
0
⫺2
⫺4
⫺6
5
10
15
20
25
Velocidad
30
35
40
FIGURA 8.2 Gráfica de residuos contra la velocidad para los datos goodput.
566
Regresión múltiple
CAPÍTULO 8
6
4
Residuos
2
0
⫺2
⫺4
⫺6
10
20
30
Pausa
40
50
FIGURA 8.3 Gráfica de residuos contra pausa para los datos goodput.
Ejercicios para la sección 8.1
1. En un experimento para determinar los factores que afectan el ahorro de combustible en camiones se midió el consumo de combustible (mi/gal), el peso (toneladas) y la lectura de odómetro (miles de millas) en 15 camiones. El siguiente resultado de MINITAB presenta los resultados del ajuste del modelo millas por galón ⫽ β0 ⫹ β1 peso ⫹ β2 odómetro.
The regression equation is
MPG = 8.24 – 0.108 Weight – 0.00392 Odometer
Predictor
Constant
Weight
Odometer
Coef
8.2407
–0.10826
–0.0039249
S = 0.3182
SE Coef
0.2871
0.01194
0.001406
R–Sq = 87.8%
T
28.70
–9.06
–2.79
P
0.000
0.000
0.016
R–Sq(adj) = 85.7%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
2
12
14
SS
8.720
1.215
9.935
MS
4.360
0.101
F
43.05
P
0.000
8.1
El modelo de regresión múltiple
567
a) Pronostique las millas por galón para un camión que pesa diez toneladas y tiene una lectura del odómetro de 50 000 millas.
b) Si los dos camiones tienen el mismo peso y uno tiene 10 000 millas más en el odómetro, ¿qué tanto se predice que difieran
sus millas por galón?
c) Si dos camiones tienen la misma lectura del odómetro, y uno pesa cinco toneladas más que el otro, ¿qué tanto se predice
que difieran sus millas por galón?
2. Considerando el ejercicio l.
a) Determine un intervalo de confianza de 95% para el coeficiente del peso.
b) Determine un intervalo de confianza de 99% para el coeficiente del odómetro.
c) ¿Puede concluir que β1 ⬍ ⫺0.05? Realice la prueba de hipótesis adecuada.
d) ¿Puede concluir que β2 ⬎ ⫺0.005? Realice la prueba de hipótesis adecuada.
3. En la tabla siguiente se presentan los datos con que se ajusta el modelo del ejercicio 1, junto con los residuos y los valores ajustados. Grafique los residuos contra los valores ajustados. ¿La gráfica indica que ese modelo lineal es razonable? Explique.
MPG
Peso
Odómetro
Residuo
7.28
5.63
5.26
6.58
5.01
6.73
5.37
7.28
4.85
5.08
5.51
4.75
6.03
5.26
5.60
10.5
23.0
27.5
14.5
30.5
14.0
21.0
8.5
26.0
26.5
15.0
30.0
15.0
22.5
16.0
15
71
36
113
39
97
195
8
84
25
124
25
75
192
139
0.235
0.158
0.138
0.353
0.224
0.386
0.168
−0.009
−0.246
−0.194
−0.620
−0.145
−0.292
0.209
−0.363
Valor ajustado
7.045
5.472
5.122
6.227
4.786
6.344
5.202
7.289
5.096
5.274
6.130
4.895
6.322
5.051
5.963
4. El artículo “Application of Analysis of Variance to Wet Clutch Engagement” (M. Mansouri. M. Khonsari y cols., en Proceedings of the Institution of Mechanical Engineers, 2002:117-125) presenta el siguiente modelo ajustado para pronosticar el tiempo que se presiona el clutch en segundos (y) a partir de la velocidad en que se inicia la presión en m/s(x1), el momento de torsión
máximo de conducción en N ⋅ m(x2), la inercia del sistema en kg ⋅ m2 (x3), y la tasa de la fuerza aplicada en kN/s (x4):
y ⫽ ⫺0.83 ⫹ 0.017x1 ⫹ 0.0895x2 ⫹ 42.771x3 ⫹ 0.027x4 ⫺ 0.0043x2x4
La suma de los cuadrados de la regresión fue SSR ⫽ 1.08613 y la suma de los cuadrados del error SSE ⫽ 0.036310. Había 44
grados de libertad del error.
a) Pronostique el tiempo de presión del clutch cuando la velocidad inicial es 20 m/s, el momento de torsión máximo de conducción es 17 N ⋅ m, la inercia de sistema es 0.006 kg ⋅ m2, y la tasa de la fuerza aplicada es 10 kN/s.
b) ¿Es posible pronosticar el cambio en el tiempo de presión relacionado con un aumento de 2 m/s en la velocidad inicial? Si
es así, encuentre el cambio pronosticado. Si no, explique.
568
CAPÍTULO 8
Regresión múltiple
c) ¿Es posible predecir el cambio en el tiempo de presión relacionado con un aumento de 2 N ⋅ m en el momento de torsión
máximo? Si es así, encuentre el cambio pronosticado. Si no, explique por qué.
d) Calcule el coeficiente de determinación R2.
e) Calcule el estadístico F para probar la hipótesis nula de que todos los coeficientes son iguales a 0. ¿Esta hipótesis puede ser
rechazada?
5. En el artículo “Application of Statistical Design in the Leaching Study of Low-Grade Manganese Ore Using Aqueous Sulfur
Dioxide” (P. Naik, L. Sukla y S. Das, en Separation Science and Technology, 2002:1375-1389), un modelo ajustado para predecir la extracción de manganeso en % (y) a partir del tamaño de partícula en mm (x1), la cantidad de dióxido de azufre en múltiplos de la cantidad estequiométrica necesaria para la disolución de manganeso (x2) y la duración de la filtración en minutos
(x3) están dadas como
y ⫽ 56.145 ⫺ 9.046x1 ⫺ 33.421x2 ⫹ 0.243x3 ⫺ 0.5963x1x2 ⫺ 0.0394x1x3 ⫹ 0.6022x2x3
⫹ 0.6901x 21 ⫹ 11.7244x 22 ⫺ 0.0097x 23
Se tomaron n ⫽ 27 observaciones, con SSE ⫽ 209.55 y SST ⫽ 6 777.5.
a) Pronostique el porcentaje de extracción cuando el tamaño de partícula es 3 mm, la cantidad de dióxido de azufre 1.5, y la
duración de la filtración es de 20 minutos.
b) ¿Es posible predecir un cambio en el porcentaje de extracción cuando la duración de la filtración aumenta en un minuto?
Si es así, encuentre el cambio pronosticado. Si no, explique.
c) Calcule el coeficiente de determinación R2.
d) Calcule el estadístico F para probar la hipótesis nula de que todos los coeficientes son iguales a 0. ¿Esta hipótesis es rechazable?
6. El artículo “Earthmoving Productivity Estimation Using Linear Regression Techniques” (S. Smith, en Journal of Construction
Engineering and Management, 1999:133-141) presenta el siguiente modelo lineal para pronosticar la productividad del movimiento de tierra (en m3 movido por hora):
Productividad ⫽ ⫺297.877 ⫹ 84.787x1 ⫹ 36.806x2 ⫹ 151.680x3 ⫺ 0.081x4 ⫺ 110.517x5
⫺ 0.267x6 ⫺ 0.016x1x4 ⫹ 0.107x4x5 ⫹ 0.0009448x4x6 ⫺ 0.244x5x6
donde x1 ⫽ cantidad de camiones,
x2 ⫽ cantidad de cubos por carga,
x3 ⫽ volumen del cubo, en m3
x4 ⫽ longitud de arrastre, en m
x5 ⫽ factor de acoplamiento (cociente de la capacidad de arrastre entre la capacidad de carga),
x6 ⫽ tiempo de viaje en camión, en s
a) Si el volumen del cubo aumenta en 1 m3 mientras que las otras variables independientes permanecen iguales, ¿puede determinar el cambio pronosticado en la productividad? Si es así, determínelo. Si no, diga qué otra información necesitaría para determinarlo.
b) Si la longitud de arrastre aumenta en 1 m, ¿puede determinar el cambio pronosticado en la productividad? Si es así, determínelo. Si no, diga qué otra información necesitaría para determinarlo.
7. En un estudio de la función pulmonar de niños, el volumen de aire exhalado por la fuerza en un segundo se llama FEV1. (FEV1
es el volumen de expiración forzada en un segundo.) Se hicieron mediciones en un grupo de niños cada año durante dos años.
Se ajustó a un modelo lineal para pronosticar los FEV1 de estos años como una función del FEV1 (en litros) del último año, el
sexo del niño (0 ⫽ masculino, 1 ⫽ femenino), la estatura del niño (en m), y la presión atmosférica ambiental (en mm). El siguiente resultado de MINITAB presenta los resultados de ajuste del modelo
8.1
El modelo de regresión múltiple
569
FEV1 ⫽ β0 ⫹ β1 Último FEV1 ⫹ β2 Sexo ⫹ β3 Estatura ⫹ β4 Presión ⫹ ε
The regression equation is
FEV1 = –0.219 + 0.779 Last FEV – 0.108 Gender + 1.354 Height – 0.00134 Pressure
Predictor
Constant
Last FEV
Gender
Height
Pressure
Coef
–0.21947
0.779
–0.10827
1.3536
–0.0013431
S = 0.22039
SE Coef
0.4503
0.04909
0.0352
0.2880
0.0004722
T
–0.49
15.87
–3.08
4.70
–2.84
P
0.627
0.000
0.002
0.000
0.005
R–Sq = 93.5%
R–Sq(adj) = 93.3%
DF
4
160
164
MS
27.826
0.048572
Analysis of Variance
Source
Regression
Residual Error
Total
SS
111.31
7.7716
119.08
F
572.89
P
0.000
a) Pronostique el FEV1 para un niño con estatura de 1.4 m, si la medida se tomó a presión de 730 mm y la medición del último año fue 2.113 L.
b) Si dos niñas difieren en estatura por 5 cm, ¿qué tanto esperaría que sus mediciones de FEV1 difieran; los otros conceptos
siguen igual?
c) Se estima que el término constante β0 es negativo, pero el FEV1 debe ser siempre positivo. ¿Algo está erróneo? Explique.
d) El responsable de este experimento quiere rediseñar el algoritmo que registra las mediciones electrónicamente con el fin de
ajustar la presión atmosférica automáticamente. Se fija un barómetro al dispositivo para registrar la presión. Utilice el resultado anterior de MINITAB para determinar cómo calcular un valor FEV1 ajustado como función del valor FEV1 medido y de la presión.
8. En relación con el ejercicio 7.
a) Determine un intervalo de confianza de 95% para el coeficiente del último FEV.
b) Determine un intervalo de confianza de 98% para el coeficiente de la estatura.
c) ¿Puede concluir que β2 ⬍ ⫺0.08? Realice la prueba de hipótesis adecuada.
d) ¿Puede concluir que β3 ⬎ 0.5? Realice la prueba de hipótesis adecuada.
9. El artículo “Drying of Pulps in Sprouted Bed: Effect of Composition on Dryer Performance” (M. Medeiros, S. Rocha y cols.,
Drying Technology, 2002:865-881) presenta mediciones de pH, de viscosidad (kg/m ⋅ s), la densidad (g/cm3) y BRIX (%). El
siguiente resultado de MINITAB presenta los resultados del modelo de ajuste
pH ⫽ β0 ⫹ β1 Viscosidad ⫹ β2 Densidad ⫹ β3 BRIX ⫹ ε
570
CAPÍTULO 8
Regresión múltiple
The regression equation is
pH = –1.79 + 0.000266 Viscosity + 9.82 Density – 0.300 BRIX
Predictor
Constant
Viscosity
Density
BRIX
Coef
–1.7914
0.00026626
9.8184
–0.29982
S = 0.379578
SE Coef
6.2339
0.00011517
5.7173
0.099039
R–Sq = 50.0%
T
–0.29
2.31
1.72
–3.03
P
0.778
0.034
0.105
0.008
R–Sq(adj) = 40.6%
Predicted Values for New Observations
New
Obs
1
2
3
Fit
3.0875
3.7351
2.8576
SE Fit
0.1351
0.1483
0.2510
95%
(2.8010,
(3.4207,
(2.3255,
CI
3.3740)
4.0496)
3.3896)
95%
(2.2333,
(2.8712,
(1.8929,
PI
3.9416)
4.5990)
3.8222)
Values of Predictors for New Observations
New
Obs
1
2
3
Viscosity
1000
1200
2000
Density
1.05
1.08
1.03
BRIX
19.0
18.0
20.0
a) Pronostique el pH para una pulpa con viscosidad de 1 500 kg/m ⋅ s, densidad de 1.04 g/cm3 y BRIX de 17.5%.
b) Si dos pulpas difieren en densidad por 0.01 g/cm3, ¿qué tanto esperaría que difirieran en pH; los otros conceptos siguen
igual?
c) Se estima que el término constante β0 es negativo, pero el pH de pulpa debe ser siempre positivo. ¿Algo está equivocado?
Explique.
d) Determine un intervalo de confianza de 95% para la media del pH de las pulpas con viscosidad 1 200 kg/m ⋅ s, densidad
1.08 g/cm3 y BRIX 18.0%.
e) Determine un intervalo de predicción de 95% para el pH de una pulpa con viscosidad 1 000 kg/m ⋅ s, densidad 1.05 g/cm3
y BRIX 19.0%.
f ) La pulpa A tiene viscosidad 2 000, densidad 1.03 y BRIX 20.0. La pulpa B tiene viscosidad 1 000, densidad 1.05 y BRIX
19.0. ¿Qué pulpa tendrá su pH pronosticado con mayor precisión? Explique.
10. Una científica ha medido las cantidades, y, x1 y x2. Cree que y está relacionado con x1 y x2 a través de la ecuación y ⫽ αeβ1x1⫹β2x2δ,
donde δ representa un error aleatorio siempre positivo. Encuentre una transformación de los datos que le permita utilizar un
modelo lineal para estimar β1 y β2.
11. El siguiente resultado de MINITAB es para una regresión múltiple. Algo salió mal en la impresión y faltan algunos números.
Complételos.
8.1
Predictor
Constant
X1
X2
X3
Coef
–0.58762
1.5102
(c)
1.8233
S = 0.869
R–Sq = 90.2%
SE Coef
0.2873
(b)
0.3944
0.3867
El modelo de regresión múltiple
T
(a)
4.30
–0.62
(d)
571
P
0.086
0.005
0.560
0.003
R–Sq(adj) = 85.3%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
3
6
(h)
SS
41.76
(g)
46.30
MS
(e)
0.76
F
(f)
P
0.000
12. El siguiente resultado de MINITAB es para una regresión múltiple. Algunos de los números se mancharon y son ilegibles. Complete los números que faltan.
Predictor
Constant
X1
X2
X3
S = 0.82936
Source
Regression
Residual Error
Total
Coef
(a)
1.2127
7.8369
(d)
R–Sq = 78.0%
DF
(e)
10
13
SE Coef
1.4553
(b)
3.2109
0.8943
T
5.91
1.71
(c)
–3.56
P
0.000
0.118
0.035
0.005
R–Sq(adj) = 71.4%
SS
(f)
6.8784
(h)
MS
8.1292
(g)
F
11.818
P
0.001
13. El artículo “Evaluating Vent Manifold Inerting Requirements: Flash Point Modeling for Organic Acid-Water Mixtures” (R.
Garland y M. Malcolm, en Process Safety Progress, 2002:254-260) presenta un modelo para pronosticar el punto de inflamación (en °F) de una mezcla de agua, ácido acético, ácido propiónico y ácido butírico a partir de las concentraciones (en % de
peso) de los tres ácidos. Los resultados son los siguientes. La variable “ácido butírico * ácido acético” es la interacción entre
la concentración de ácido butírico y la de ácido acético.
Predictor
Constant
Acetic Acid
Propionic Acid
Butyric Acid
Butyric Acid *Acetic Acid
Coef
267.53
–1.5926
–1.3897
–1.0934
–0.002658
SE Coef
11.306
0.1295
0.1260
0.1164
0.001145
T
23.66
–12.30
–11.03
–9.39
–2.32
P
0.000
0.000
0.000
0.000
0.034
572
CAPÍTULO 8
Regresión múltiple
a) Pronostique el punto de inflamación para una mezcla de 30% de ácido acético y 35% de ácido propiónico, y 30% de ácido
butírico. (Nota: en el modelo, 30% se representa por 30, no por 0.30.)
b) Alguien pregunta qué tanto cambiará el punto de inflamación pronosticado si la concentración de ácido acético se aumenta en 10% mientras que las otras concentraciones se conservan constantes. ¿Es posible responder esta pregunta? Si es así,
respóndala. Si no, explique.
c) Alguien pregunta qué tanto cambiará el punto de inflamación pronosticado si la concentración del ácido propiónico aumenta en 10% mientras que las otras concentraciones se mantienen constantes. ¿Es posible responder esta pregunta? Si es así,
respóndala. Si no, explique.
14. En el artículo “Low-Temperature Heat Capacity and Thermodynamic Properties of 1,1,1-trifluoro-2, 2-dichloroethane” (R. Varushchenko y A. Druzhinina, en Fluid Phase Equilibria, 2002:109-119), la relación entre la presión de vapor (p) y la capacidad calorífica (t) está dada como p ⫽ tβ3 ⋅ eβ0⫹β1tβ2/ tδ, donde δ es un error aleatorio siempre positivo. Exprese esta relación como
un modelo lineal usando una transformación adecuada.
15. Se reunieron los siguientes datos en un experimento para estudiar la relación entre la fuerza de corte en kPa (y) y la temperatura de endurecimiento en °C (x).
x
y
138
5 390
140
5 610
146
5 670
148
5 140
152
4 480
153
4 130
El modelo de mínimos cuadrados es y ⫽ ⫺291 576.77 ⫹ 4 168.6479x ⫺ 14.6133933x2.
a) Utilizando esta ecuación, calcule los residuos.
b) Calcule la suma de los cuadrados del error SSE y la suma total de los cuadrados SST.
c) Calcule la estimación de la varianza del error s2.
d) Calcule el coeficiente de determinación R2.
e) Calcule el valor del estadístico F para la hipótesis H0 : β1 ⫽ β2 ⫽ 0. ¿Cuántos grados de libertad tiene este estadístico?
f ) ¿La hipótesis H0 : β1 ⫽ β2 ⫽ 0 puede ser rechazada al nivel de 5%? Explique.
16. Se reunieron los siguientes datos en un experimento para estudiar la relación entre el número de libras de fertilizante (x) y la
cosecha de tomates en busheles (y).
x
y
5
16
10
21
15
27
20
25
25
21
El modelo de mínimos cuadrados es y ⫽ 4.8000 ⫹ 2.508571x ⫺ 0.07428571x2.
a) Utilizando esta ecuación, calcule los residuos.
b) Calcule la suma de los cuadrados del error SSE y la suma total de los cuadrados SST.
c) Calcule la estimación de la varianza del error s2.
d) Calcule el coeficiente de determinación R2.
e) Calcule el valor del estadístico F para la hipótesis H0 : β1 ⫽ β2 ⫽ 0. ¿Cuántos grados de libertad tiene este estadístico?
f ) ¿La hipótesis H0 : β1 ⫽ β2 ⫽ 0 puede rechazarse al nivel de 5%? Explique.
17. El 24 de noviembre de 2001, el diario The Economist publicó datos para 15 países industrializados. Se incluyen los cambios
porcentuales del producto interno bruto (PIB), la producción industrial (PI), los precios al consumidor (PC), y los precios de
producción (PP) de otoño de 2000 a otoño de 2001, y la tasa de desempleo en otoño de 2001 (DESEMPLEO). Un economista quiere construir un modelo para pronosticar el PIB a partir de las otras variables. Un ajuste del modelo
8.1
El modelo de regresión múltiple
573
PIB ⫽ β0 ⫹ β1PI ⫹ β2DESEMPLEO ⫹ β3PC ⫹ β4PP ⫹ ε
produce el siguiente resultado:
The regression equation is
GDP = 1.19 + 0.17 IP + 0.18 UNEMP + 0.18 CP – 0.18 PP
Predictor
Constant
IP
UNEMP
CP
PP
Coef
1.18957
0.17326
0.17918
0.17591
–0.18393
SE Coef
0.42180
0.041962
0.045895
0.11365
0.068808
T
2.82
4.13
3.90
1.55
–2.67
P
0.018
0.002
0.003
0.153
0.023
a) Pronostique el cambio porcentual en el PIB para un país con PI ⫽ 0.5, DESEMPLEO ⫽ 5.7, PC ⫽ 3.0, y PP ⫽ 4.1.
b) Si los dos países difieren en tasa de desempleo por 1%, ¿qué tanto predeciría que cambie el porcentaje del PIB; los otros
conceptos siguen igual?
c) PC y PP son medidas de la tasa de inflación. ¿Cuál es más útil para predecir el PIB? Explique.
d ) El índice de precios de producción para Suecia en septiembre de 2000 era 4.0, y para Austria, 6.0. Los otros conceptos siguen igual, ¿para qué país esperaría el mayor cambio porcentual en el PIB? Explique.
18. El artículo “Multiple Linear Regression for Lake Ice and Lake Temperature Characteristics” (S. Gao y H. Stefan, en Journal
of Cold Regions Engineering, 1999:59-77) presenta datos del espesor máximo de hielo en mm (y), el número promedio de días
por año cubiertos de hielo (x1), y el número promedio de días en que la temperatura inferior es menor de 8°C (x2), y la profundidad de nieve promedio en mm (x3) para 13 lagos en Minnesota. Los datos se presentan en la tabla siguiente.
y
x1
x2
x3
y
x1
x2
x3
730
760
850
840
720
730
840
152
173
166
161
152
153
166
198
201
202
202
198
205
204
91
81
69
72
91
91
70
730
650
850
740
720
710
157
136
142
151
145
147
204
172
218
207
209
190
90
47
59
88
60
63
a) Ajuste el modelo y ⫽ β0 ⫹ β1x1 ⫹ β2x2 ⫹ β3x3 ⫽ ε. Encuentre el P-valor de cada coeficiente para probar la hipótesis nula
de que el coeficiente es igual a 0.
b) Si dos lagos difieren en dos en el número promedio de días por año cubiertos de hielo, con las otras variables permaneciendo constantes, ¿qué diferencia esperaría entre sus capas de hielo máximas?
c) ¿Los lagos con media de profundidad de nieve mayor tenderían a tener espesores de hielo máximo mayores o menores? Explique.
19. En un experimento para estimar la aceleración de un objeto hacia abajo de un plano inclinado, aquél se suelta y su distancia en
metros (y) desde la parte superior del plano se mide cada 0.1 segundo a partir del tiempo t ⫽ 0.1 a t ⫽ 1.0. En la tabla siguiente se presentan los datos.
574
CAPÍTULO 8
Regresión múltiple
t
y
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
0.03
0.1
0.27
0.47
0.73
1.07
1.46
1.89
2.39
2.95
Los datos siguen el modelo cuadrático y ⫽ β0 ⫹ β1t ⫹ β2t2 ⫹ ε, donde β0 representa la posición inicial del objeto, β1 la velocidad inicial del objeto, y β2 ⫽ a/2, donde a es la aceleración del objeto, que se supone constante. En un experimento perfecto, tanto la posición como la velocidad del objeto serían cero al tiempo 0. Sin embargo, debido al error experimental, es posible
que la posición y la velocidad en t ⫽ 0 sean diferentes de cero.
a) Ajuste el modelo cuadrático y ⫽ β0 ⫹ β1t ⫹ β2t2 ⫹ ε.
b) Determine un intervalo de confianza de 95% para β2.
c) Determine un intervalo de confianza de 95% para la aceleración a.
d) Calcule el P-valor para cada coeficiente.
e) ¿Puede concluir que la posición inicial no fue cero? Explique.
f ) ¿Puede concluir que la velocidad inicial no fue cero? Explique.
8.2
Confusión y colinealidad
El subtítulo de esta sección es “Ajustar modelos por separado para cada variable no es lo mismo que ajustar el modelo multivariado”. Para ilustrar de qué se está hablando, se revisan los
datos del pozo de gas, descrito por vez primera en el ejercicio 15 de la sección 7.3. Un total
de 255 pozos de gas recibieron “tratamiento de fractura” para incrementar la producción. En
este tratamiento, el fluido fracturado, fluido mezclado con arena, se bombea al pozo. La arena abre grietas en la roca, lo que incrementa el flujo del gas. Las preguntas principales son éstas: ¿Al aumentar el volumen de fluido bombeado crece la producción del pozo? ¿Al
aumentar el volumen de arena se aumenta la producción del pozo?
Los pozos de mayor profundidad producen más gas porque proporcionan más superficie a través de la cual penetra el gas. Por esa razón es adecuado expresar todas las variables
en unidades por pie de profundidad del pozo. Por tanto, se mide la producción en unidades de
pie3 de gas por pie de profundidad, el fluido en unidades de gal/pie, y la arena en unidades
de lb/pie.
En la figura 7.17 (de la sección 7.4) se mostró que se necesitaba una transformación logaritmo para obtener homocedasticidad en la gráfica de producción contra fluido. Se indicó
que también se requiere una transformación logaritmo para la variable arena. La figura 8.4
muestra los diagramas de dispersión de ln Producción contra ln Fluido y ln Producción contra ln Arena. Tanto el fluido como la arena parecen estar fuertemente relacionados con la producción.
8
8
7
7
6
6
In Producción
In Producción
8.2
5
4
3
2
Confusión y colinealidad
575
5
4
3
5
6
7
8
9
2
10
6
7
8
ln Fluido
a)
ln Arena
9
10
11
b)
FIGURA 8.4 a) Gráfica del logaritmo de la producción contra el logaritmo del volumen de fluido fracturado para 255 pozos de gas, con la recta de mínimos cuadrados sobrepuesta. b) Gráfica del logaritmo de la producción contra el logaritmo
del peso de arena para los mismos 255 pozos. Parecen existir fuertes relaciones lineales entre el logaritmo de la producción
tanto con el logaritmo de fluido como con el logaritmo de arena.
Para confirmar el resultado aparente de las gráficas en la figura 8.4 se ajustan dos modelos de regresión lineal simple:
ln Producción ⫽ β0 ⫹ β1 ln Fluido ⫹ ε
ln Producción ⫽ β0 ⫹ β1 ln Arena ⫹ ε
El resultado MINITAB para estos modelos es el siguiente:
The regression equation is
ln Prod = –0.444 + 0.798 ln Fluid
Predictor
Constant
ln Fluid
S = 0.7459
Coef
–0.4442
0.79833
SE Coef
0.5853
0.08010
R–Sq = 28.2%
T
–0.76
9.97
P
0.449
0.000
R–Sq(adj) = 27.9%
The regression equation is
ln Prod = –0.778 + 0.748 ln Sand
Predictor
Constant
ln Sand
S = 0.7678
Coef
–0.7784
0.74751
SE Coef
0.6912
0.08381
R–Sq = 23.9%
T
–1.13
8.92
P
0.261
0.000
R–Sq(adj) = 23.6%
CAPÍTULO 8
Regresión múltiple
Tanto el fluido como la arena tienen coeficientes que son definitivamente diferentes de
0 (los P-valores para ambos son ≈ 0). Por tanto, se podría intentar concluir inmediatamente
que al aumentar el volumen de fluido o el volumen de arena bombeada en un pozo se aumentará la producción, pero primero se debe considerar la posibilidad de confusión.
La cuestión de confusión surge de esta manera. Fluido y arena se bombean dentro juntos en una sola mezcla. Es lógico esperar que los pozos que tienen más fluido también tienden a tener más arena. Si esto último es verdadero, entonces la confusión es una posibilidad.
La figura 8.5 presenta el diagrama de dispersión de ln Fluido contra ln Arena. Se tiene bastante seguridad de que la cantidad de fluido bombeada en un pozo está muy correlacionada
con la cantidad de arena bombeada. Por tanto, es muy posible que cualquiera de los dos resultados univariados que se presentaron antes pudieran representar confusión en lugar de una
relación real. Si la producción depende solamente del volumen de fluido, aún habrá una relación entre los datos entre la producción y la arena. Si la producción depende solamente del
volumen de arena, aún habrá una relación en los datos entre la producción y el fluido.
10
9
ln Fluido
576
8
7
6
5
6
7
8
ln Arena
9
10
11
FIGURA 8.5 Diagrama de dispersión de ln Fluido contra ln Arena para 255 pozos de gas. Evidentemente hay una fuerte relación lineal. Por tanto, las relaciones aparentes entre fluido o arena
y producción podrían representar un confusión en lugar de una causalidad.
La regresión múltiple proporciona una manera de resolver la cuestión. El siguiente resultado de MINITAB corresponde al modelo
ln Producción ⫽ β0 ⫹ β1 ln Fluido ⫹ β2 ln Arena ⫹ ε
(8.11)
8.2
Confusión y colinealidad
577
The regression equation is
ln Prod = –0.729 + 0.670 ln Fluid + 0.148 ln Sand
Predictor
Constant
ln Fluid
ln Sand
S = 0.7463
Coef
–0.7288
0.6701
0.1481
SE Coef
0.6719
0.1687
0.1714
R–Sq = 28.4%
T
–1.08
3.97
0.86
P
0.279
0.000
0.389
R–Sq(adj) = 27.8%
Se puede ver que el coeficiente de ln Fluido es significativamente diferente de 0, pero
el coeficiente de ln Arena no lo es. Si se supone que no hay otra confusión (por ejemplo, con
la posición de los pozos), se puede concluir que el aumento en la cantidad de fluido tiende a
aumentar la producción, pero no está claro que el aumento en la cantidad de arena tiene un
efecto. Por tanto, se podría aumentar la cantidad de fluido, pero podría ser innecesario agregarle más arena.
Una observación final: ninguno de los modelos tiene un valor particularmente alto de
R2. Lo anterior indica que hay otros factores importantes que afectan la producción y que no
se han incluido en los modelos. En un análisis más completo, se intentaría identificar y medir algunos de estos factores para construir un modelo con el potencial de predicción mayor.
Colinealidad
Cuando dos variables independientes están muy fuertemente correlacionadas la regresión
múltiple no puede ser capaz de determinar cuál es la importante. En este caso, se dice que las
variables son colineales. La palabra colineal significa que se encuentra en la misma línea, y
cuando dos variables están muy correlacionadas su diagrama de dispersión es casi una línea
recta. También a veces se utiliza la palabra multicolinealidad. Cuando la colinealidad está
presente, se dice a veces que el conjunto de variables independientes está mal condicionado.
La tabla 8.2 de la página 578 presenta algunos datos hipotéticos que muestran el fenómeno
de colinealidad.
Primero se ajustan los modelos lineales simples
y ⫽ β0 ⫹ β1x1 ⫹ ε
y ⫽ β0 ⫹ β1x2 ⫹ ε
El siguiente resultado de MINITAB muestra que tanto x1 como x2 tienen una fuerte relación
lineal con y. Los valores de r2 están ambos alrededor de 0.96, por lo que las correlaciones r
entre x1 y y y entre x2 y y están ambos alrededor de 0.98.
578
CAPÍTULO 8
Regresión múltiple
TABLA 8.2 Datos colineales
x1
x2
y
0.1
0.2
0.6
1.4
2.0
2.0
2.1
2.1
2.8
3.6
4.2
4.5
4.7
5.3
6.1
6.8
7.5
8.2
8.5
9.4
0.3
0.2
1.4
3.4
5.2
5.5
5.5
5.3
7.4
9.4
10.3
11.4
11.3
13.6
15.3
17.4
18.5
20.4
21.3
23.3
3.6
0.3
6.0
10.6
8.4
11.8
12.7
6.8
9.9
16.7
16.3
19.9
20.2
22.9
26.6
28.1
31.0
28.8
32.4
35.0
The regression equation is
Y = 2.90 + 3.53 X1
Predictor
Constant
X1
S = 2.080
Coef
2.8988
3.5326
SE Coef
0.8224
0.1652
R–Sq = 96.2%
T
3.52
21.38
P
0.002
0.000
R–Sq(adj) = 96.0%
The regression equation is
Y = 2.74 + 1.42 X2
Predictor
Constant
X2
S = 2.033
Coef
2.7431
1.42024
SE Coef
0.8090
0.06485
R–Sq = 96.4%
T
3.39
21.90
P
0.003
0.000
R–Sq(adj) = 96.2%
La figura 8.6 presenta el diagrama de dispersión de x2 contra xl. Evidentemente hay una
fuerte relación lineal, por lo que se sospecha que y podría tener realmente una relación con
sólo una de estas variables, con lo demás enredado.
8.2
Confusión y colinealidad
579
25
20
15
x2
10
5
0
0
2
4
6
8
10
x1
FIGURA 8.6 Las variables independientes x1 y x2 son colineales porque tienen una fuerte rela-
ción lineal.
Por tanto, se ajusta el modelo de regresión múltiple
y ⫽ β0 ⫹ β1x1 ⫹ β2x2 ⫹ ε
El resultado MINITAB es el siguiente.
The regression equation is
Y = 2.72 – 0.49 X1 + 1.62 X2
Predictor
Constant
X1
X2
S = 2.091
Coef
2.7248
–0.490
1.617
SE Coef
0.8488
4.460
1.791
R–Sq = 96.4%
T
3.21
–0.11
0.90
P
0.005
0.914
0.379
R–Sq(adj) = 96.0%
Sorprendentemente, el resultado parece indicar que ni x1 ni x2 están linealmente relacionados con y, ya que ambos tienen P-valores grandes. Lo que está ocurriendo es que la relación lineal entre x1 y x2 es tan fuerte que resulta imposible determinar cuál de los dos es
responsable de la relación lineal con y. Visto de esta manera, los P-valores grandes tienen sentido. Es creíble que el coeficiente de x1 sea 0 y que solamente x2 tenga una relación real con
y. Por tanto, el P-valor para x1 debe ser grande. Igual, es creíble que el coeficiente de x2 es 0 y
que sólo x1 tiene una relación real con y. Por tanto, el P-valor para x2 también debe ser grande.
En general, no hay mucho que se pueda hacer cuando las variables son colineales. La
única buena manera de arreglar la situación es reunir más datos, incluyendo algunos valores
para las variables independientes que no están en la misma línea recta. Entonces la regresión
múltiple será capaz de determinar cuáles de las variables son realmente importantes.
580
CAPÍTULO 8
Regresión múltiple
Ejercicios para la sección 8.2
1. En un experimento para determinar los factores relacionados con la dureza de las soldaduras se midió la dureza de impacto de
la muesca Charpy V pies ⋅ lb (y) para 22 soldaduras a 0°C, junto con la expansión lateral en la muesca en % (x1), y la superficie frágil en % (x2). En la siguiente tabla se presentan los datos.
y
x1
x2
y
x1
x2
y
x1
x2
32
39
20
21
25
20
32
29
20.0
23.0
12.8
16.0
10.2
11.6
17.6
17.8
28
28
32
29
31
28
25
28
27
43
22
22
18
32
22
16.0
26.2
9.6
15.2
8.8
20.4
12.2
29
27
32
32
43
24
36
25
25
20
20
24
18
28
14.6
10.4
11.6
12.6
16.2
9.2
16.8
36
29
30
31
36
34
30
a) Ajuste el modelo y ⫽ β0 ⫹ β1x1 ⫹ ε. Para cada coeficiente, pruebe la hipótesis nula que es igual a 0.
b) Ajuste el modelo y ⫽ β0 ⫹ β1x2 ⫹ ε. Para cada coeficiente, pruebe la hipótesis nula que es igual a 0.
c) Ajuste el modelo y ⫽ β0 ⫹ β1x1 ⫹ β2x2 ⫹ ε. Para que cada coeficiente pruebe que la hipótesis nula es igual a 0.
d) ¿Cuál de los modelos de los incisos a) al c) es el mejor? ¿Cómo justifica su respuesta?
2. En una prueba de laboratorio de un nuevo diseño de motor se midió la tasa de emisiones (en mg/s de óxidos de nitrógeno, NOx)
como una función de la velocidad de motor (en rpm), del momento de torsión del motor (en pies ⋅ lb), y de los caballos de fuerza totales. (De “In-Use Emissions from Heavy-Duty Diesel Vehicles”, J. Yanowitz, tesis de doctorado, Escuela de Minas, de
Colorado, 2001). El resultado de MINITAB se presenta para los siguientes tres modelos:
NOx ⫽ β0 ⫹ β1 Velocidad ⫹ β2 Momento de torsión ⫹ ε
NOx ⫽ β0 ⫹ β1 Velocidad ⫹ β2 HP ⫹ ε
NOx ⫽ β0 ⫹ β1 Velocidad ⫹ β2 Momento de torsión ⫹ β3 HP ⫹ ε
The regression equation is
NOx = –321 + 0.378 Speed – 0.160 Torque
Predictor
Constant
Speed
Torque
S = 67.13
Coef
–320.59
0.37820
–0.16047
SE Coef
98.14
0.06861
0.06082
R–Sq = 51.6%
T
–3.27
5.51
–2.64
P
0.003
0.000
0.013
R–Sq(adj) = 48.3%
8.2
Confusión y colinealidad
581
The regression equation is
NOx = –380 + 0.416 Speed – 0.520 HP
Predictor
Constant
Speed
HP
S = 67.19
Coef
–380.1
0.41641
–0.5198
SE Coef
104.8
0.07510
0.1980
R–Sq = 51.5%
T
–3.63
5.54
–2.63
P
0.001
0.000
0.014
R–Sq(adj) = 48.2%
The regression equation is
NOx = –302 + 0.366 Speed – 0.211 Torque + 0.16 HP
Predictor
Constant
Speed
Torque
HP
S = 68.31
Coef
–301.8
0.3660
–0.2106
0.164
SE Coef
347.3
0.2257
0.8884
2.889
R–Sq = 51.6%
T
–0.87
1.62
–0.24
0.06
P
0.392
0.116
0.814
0.955
R–Sq(adj) = 46.4%
De las variables velocidad, momento de torsión y HP, ¿cuáles dos son más cercanamente colineales? ¿Cómo justifica su respuesta?
3. Dos ingenieros químicos, A y B, están trabajando de manera independiente para desarrollar un modelo que pronostique la viscosidad de un producto (y) a partir del pH (x1) y la concentración de cierto catalizador (x2). Cada ingeniero ha ajustado al modelo lineal
y ⫽ β0 ⫹ β1x1 ⫹ β2x2 ⫹ ε.
Los ingenieros le han enviado el resultado MINITAB que resume sus resultados
Engineer A
Predictor
Constant
pH
Concent.
Coef
199.2
–1.569
–4.730
SE Coef
0.5047
0.4558
0.5857
T
394.7
–3.44
–8.08
P
0.000
0.007
0.000
Coef
199.0
–1.256
–3.636
SE Coef
0.548
1.983
1.952
T
363.1
–0.63
–1.86
P
0.000
0.544
0.112
Engineer B
Predictor
Constant
pH
Concent.
Los ingenieros también le han enviado los siguientes diagramas de dispersión de pH contra la concentración, pero olvidaron poner sus nombres en ellos.
582
CAPÍTULO 8
Regresión múltiple
pH
pH
Concentración
ii)
Concentración
i)
a) ¿Qué gráfica proviene de cada ingeniero? ¿Cómo justifica su respuesta?
b) ¿Cuál experimento produce los resultados más confiables? Explique.
4. El artículo “Influence of Freezing Temperature on Hydraulic Conductivity of Silty Clay” (J. Konrad y M. Samson, en Journal
of Geotechnical and Geoenvironmental Engineering, 2000:180-187) describe un estudio de los factores que afectan la conductancia hidráulica de suelos. Las mediciones de esta última en unidades de 10⫺8 cm/s (y), cociente inicial vacío (x1) y el cociente de deshielo vacío (x2) para 12 elementos de arcilla cenagosa se presentan en la tabla siguiente.
y
x1
x2
1.01
0.84
0.81
1.12
0.88
0.85
1.04
0.85
0.87
1.30
0.95
0.92
1.01
0.88
0.84
1.04
0.86
0.85
0.955
0.85
0.85
1.15
0.89
0.86
1.23
0.90
0.85
1.28
0.94
0.92
1.23
0.88
0.88
1.30
0.90
0.92
a) Ajuste el modelo y ⫽ β0 ⫹ β1x1 ⫹ ε. Para cada coeficiente pruebe la hipótesis nula que es igual a 0.
b) Ajuste el modelo y ⫽ β0 ⫹ β1x2 ⫹ ε. Para cada coeficiente, pruebe la hipótesis nula que es igual a 0.
c) Ajuste el modelo y ⫽ β0 ⫹ β1x1 ⫹ β2x2 ⫹ ε. Para cada coeficiente pruebe la hipótesis nula que es igual a 0.
d) ¿Cuál de los modelos de los incisos a) al c) es el mejor? ¿Cómo justifica su respuesta?
5. En relación con el ejercicio 8 de la sección 7.4.
a) Divida los datos en dos grupos: los puntos donde R1 ⬍ 4 en un grupo, los puntos donde R1 ⱖ 4 en los otros. Calcule la recta de mínimos cuadrados para pronosticar R2 a partir de R1 para cada grupo. (Usted ya hizo esto si realizó el ejercicio 8c en
la sección 7.4.)
b) Para uno de los dos grupos la relación es obviamente no lineal. Para este grupo, ajuste un modelo cuadrático (es decir, utilizando R1 y R21 como variables independientes), un modelo cúbico y otro cuártico. Calcule los P-valores para cada uno de
los coeficientes en cada uno de los modelos.
c) Grafique los residuos contra los valores ajustados para cada uno de los tres modelos del inciso b).
d) Calcule el coeficiente de correlación entre R31 y R41, y realice un diagrama de dispersión de los puntos (R31, R41).
e) Con base en el coeficiente de correlación y en el diagrama de dispersión, explique por qué son muy diferentes los P-valores para el modelo cuártico que para el cúbico.
f ) ¿Cuál de los tres modelos del inciso b) es más adecuado? ¿Por qué?
8.3
583
Selección de modelos
6. La tabla siguiente lista valores para tres variables medidas para 60 erupciones consecutivas del géiser Old Faithful en el Parque Nacional Yellowstone. Estas son las duraciones de la erupción (x1), las duraciones del periodo de inactividad inmediatamente anterior a la erupción (x2) y las duraciones del periodo de inactividad inmediatamente después de la erupción (y). Todos
los tiempos están en minutos. (La variable x2 se presentó en el ejercicio adicional 3 del capítulo 7.)
x1
x2
y
x1
x2
y
x1
x2
y
x1
x2
y
3.5
4.1
2.3
4.7
1.7
4.9
1.7
4.6
3.4
4.3
1.7
3.9
3.7
3.1
4.0
80
84
50
93
55
76
58
74
75
80
56
80
69
57
90
84
50
93
55
76
58
74
75
80
56
80
69
57
90
42
1.8
4.1
1.8
3.2
1.9
4.6
2.0
4.5
3.9
4.3
2.3
3.8
1.9
4.6
1.8
42
91
51
79
53
82
51
76
82
84
53
86
51
85
45
91
51
79
53
82
51
76
82
84
53
86
51
85
45
88
4.7
1.8
4.6
1.9
3.5
4.0
3.7
3.7
4.3
3.6
3.8
3.8
3.8
2.5
4.5
88
51
80
49
82
75
73
67
68
86
72
75
75
66
84
51
80
49
82
75
73
67
68
86
72
75
75
66
84
70
4.1
3.7
3.8
3.4
4.0
2.3
4.4
4.1
4.3
3.3
2.0
4.3
2.9
4.6
1.9
70
79
60
86
71
67
81
76
83
76
55
73
56
83
57
79
60
86
71
67
81
76
83
76
55
73
56
83
57
71
a) Calcule la recta de mínimos cuadrados para predecir la duración del periodo de inactividad seguido de una erupción (y) a
partir de la duración de la erupción (x1). ¿Existe una relación lineal entre la duración de una erupción y el tiempo de espera hasta que ocurre la próxima erupción?
b) Calcule la recta de mínimos cuadrados para pronosticar la duración del periodo de inactividad seguido de una erupción (y)
a partir de la duración del que precede a la erupción (x2). (Usted ya hizo esto si realizó el ejercicio adicional 3 del capítulo
7. Los resultados en este problema son ligeramente diferentes, debido a que hay 60 puntos en lugar de 59.) ¿Hay una relación lineal entre la duración del periodo de inactividad que precede a una erupción y el tiempo de espera hasta que ocurre
la próxima erupción?
c) Ajuste al modelo de regresión múltiple que incluya tanto la duración de la erupción x1 como la duración del periodo de inactividad que precede a la erupción x2 como variables independientes.
d ) Si usted pudiera encontrar el valor ya sea de x1 o de x2 pero no de ambos, ¿cuál querría conocer para pronosticar y? ¿Ayudaría mucho conocer al otro también? Explique.
8.3
Selección de modelos
Hay muchas situaciones en las que se han medido bastantes variables independientes; se necesita decidir cuáles implican un modelo. Éste es el problema de selección de modelos, el cual
es difícil. En la práctica con frecuencia se realiza la selección de modelos usando métodos ad
hoc, con la guía de toda la intuición física disponible. No se intenta realizar un análisis completo de este extenso y difícil tema. En vez de eso, se limita a establecer algunos principios
básicos y presentar ejemplos. Se puede consultar un texto avanzado como el de Miller (2002)
para información acerca de métodos específicos.
584
CAPÍTULO 8
Regresión múltiple
La buena selección de modelos se basa en un principio básico conocido como navaja de
Occam. Este principio se enuncia de la siguiente manera:
La navaja de Occam
El mejor modelo científico es el modelo más simple que explica los hechos observados.
En términos de modelos lineales, la navaja de Occam implica el principio de parsimonia:
El principio de parsimonia
Un modelo debe contener el menor número de variables necesario para ajustar los
datos.
Existen algunas excepciones al principio de parsimonia:
1. Un modelo lineal siempre debe contener un intercepto, a menos que una teoría física indique otra cosa.
2. Si una potencia xn de una variable se incluye en un modelo, también estarán incluidas todas las potencias inferiores x2, . . . , xn⫺1, a menos que una teoría física
indique lo contrario.
3. Si un producto xixj de dos variables está incluido en un modelo, entonces las variables xi y xj también deben estar incluidas por separado, a menos que una teoría
física indique algo distinto.
Los modelos que sólo contienen las variables necesarias para ajustar los datos se llaman parsimoniosos. Gran parte del trabajo práctico de la regresión múltiple implica su desarrollo.
Con el siguiente ejemplo se muestra el principio de parsimonia. Los datos en la tabla
8.3 se tomaron del artículo “Capacities and Performance Characteristics of Jaw Crushers” (S.
Sastri, en Minerals and Metallurgical Processing, 1994:80-86). Se midieron tasas de alimentación y de potencia para varias trituradoras de quijada industriales.
TABLA 8.3 Tasas de alimentación y potencia para trituradoras de quijada industriales
Tasa de
alimentación
(100 t/h)
Potencia
(kW)
Tasa de
alimentación
(100 t/h)
Potencia
(kW)
Tasa de
alimentación
(100 t/h)
Potencia
(kW)
0.10
1.55
3.00
3.64
0.38
1.59
4.73
11
60
40
150
69
77
83
0.20
2.91
0.36
0.14
0.91
4.27
4.36
15
84
30
16
30
150
144
0.91
0.59
0.27
0.55
0.68
4.27
3.64
45
12
24
49
45
150
100
Tasa de
alimentación
(100 t/h)
Potencia
(kW)
1.36
2.36
2.95
1.09
0.91
2.91
58
45
75
44
58
149
8.3
Selección de modelos
585
El siguiente resultado MINITAB presenta los resultados para ajustar el modelo
Potencia ⫽ β0 ⫹ β1 Tasa de Alimentación ⫹ ε
(8.12)
The regression equation is
Power = 21.0 + 24.6 FeedRate
Predictor
Constant
FeedRate
S = 26.20
Coef
21.028
24.595
SE Coef
8.038
3.338
R–Sq = 68.5%
T
2.62
7.37
P
0.015
0.000
R–Sq(adj) = 67.2%
A partir del resultado se observa que el modelo ajustado es
Potencia ⫽ 21.028 ⫹ 24.595 Tasa de Alimentación
(8.13)
y que el coeficiente para la Tasa de Alimentación es significativamente diferente de 0 (t ⫽
7.37, P ≈ 0). Ahora la pregunta es si un modelo cuadrático pudiese ajustar mejor que este lineal. Así que se ajusta
Potencia ⫽ β0 ⫹ β1 Tasa de Alimentación ⫹ β2 Tasa de Alimentación2 ⫹ ε
(8.14)
Los resultados se presentan en el siguiente resultado de MINITAB. Observe que los valores
para el intercepto y del coeficiente de la Tasa de Alimentación son diferentes que cuando estaban en el modelo lineal. Esto es típico. El agregar una nueva variable a un modelo podría
cambiar considerablemente los coeficientes de las variables que ya estaban en el modelo.
The regression equation is
Power = 19.3 + 27.5 FeedRate – 0.64 FeedRateˆ2
Predictor
Constant
FeedRate
FeedRateˆ2
S = 26.72
Coef
19.34
27.47
–0.6387
SE Coef
11.56
14.31
3.090
R–Sq = 68.5%
T
1.67
1.92
–0.21
P
0.107
0.067
0.838
R–Sq(adj) = 65.9%
El punto más importante que debe observarse es que el P-valor para el coeficiente de
Tasa de Alimentación2 es mayor de (0.838). Recuerde que este P-valor es para la prueba de la
hipótesis nula de que el coeficiente es igual a 0. Por tanto, los datos no proporcionan evidencias de que el coeficiente de Tasa de Alimentación2 sea diferente de 0. Observe también que
incluyendo Tasa de Alimentación2 en el modelo se aumenta sólo ligeramente el valor del estadístico de bondad del ajuste R2, en forma tan ligera que los primeros tres dígitos son iguales. En este sentido, no hay evidencias de que el modelo cuadrático ajuste mejor los datos que
el modelo lineal, así que junto con el principio de parsimonia se debe preferir el modelo lineal.
CAPÍTULO 8
Regresión múltiple
La figura 8.7 proporciona una ilustración gráfica del principio de parsimonia. Se presenta el diagrama de dispersión de la potencia contra la tasa de alimentación, y ambas rectas
de mínimos cuadrados (8.13) y el modelo cuadrático (8.14) están sobrepuestos. Aunque los
coeficientes de los modelos son diferentes, se puede advertir que las dos curvas son casi idénticas. No hay razón para incluir el término cuadrático en el modelo. Esto último hace que el
modelo sea más complicado, sin que mejore el ajuste.
160
140
120
Potencia (kW)
586
100
80
60
40
20
0
0
1
2
3
4
Tasa de alimentación (100 toneladas/h)
5
FIGURA 8.7 Diagrama de dispersión de potencia contra tasa de alimentación para 27 trituradoras de quijada industriales. La recta de mínimos cuadrados y la del mejor ajuste de modelo cuadrático están sobrepuestas. Las dos curvas son prácticamente idénticas, lo que refleja el hecho de
que el coeficiente de Tasa de Alimentación2 en el modelo cuadrático no es significativamente diferente de 0.
Determinando si se pueden eliminar variables de un modelo
Con frecuencia ocurre que se ha formado un modelo con muchas variables independientes, y
que se desea determinar si un subconjunto en particular de ellas se puede eliminar del modelo sin reducir significativamente la precisión de éste. Para ser más específico, suponga que se
conoce que el modelo
yi ⫽ β0 ⫹ β1x1i ⫹ . . . ⫹ βkxki ⫹ βk⫹1xk⫹1i ⫹ . . . ⫹ βpxpi ⫹ εi
(8.15)
es correcto, en lo que respecta a representar la relación verdadera entre las variables x y y. Se
llamará a éste el modelo “completo”.
Se desea probar la hipótesis nula
H0 : βk⫹1 ⫽ . . . ⫽ βp ⫽ 0
Si H0 es verdadera, el modelo permanecerá correcto si se eliminan las variables xk⫹1, . . . , xp,
por lo que se puede reemplazar el modelo completo con el siguiente modelo reducido:
yi ⫽ β0 ⫹ β1x1i ⫹ . . . ⫹ βkxki ⫹ εi
(8.16)
8.3
Selección de modelos
587
El desarrollo de un estadístico de prueba para H0 se inicia calculando la suma de cuadrados del error tanto para el modelo completo como para el reducido. Se denotarán por SSEcompleto
y SSEreducido. El número de grados de libertad para SSEcompleto es n ⫺ p ⫺ 1, y el número de
grados de libertad para SSEreducido es n ⫺ k ⫺ 1.
Ahora, puesto que el modelo completo es correcto, se sabe que la cantidad SSEcompleto/
(n ⫺ p ⫺ 1) es un estimador de la varianza del error s2; en efecto, es exactamente s2. Si H0 es
verdadera, entonces el modelo reducido también es correcto, así que la cantidad SSEreducido/
(n ⫺ k ⫺ 1) es también un estimador de la varianza del error. Intuitivamente, SSEcompleto está
cerca de (n ⫺ p ⫺ 1)s2, y si H0 es verdadera, SSEreducido está cerca de (n ⫺ k ⫺ 1)s2. Por lo que
si H0 es verdadera, la diferencia (SSEreducido ⫺ SSEcompleto) es cercana a (p ⫺ k)s2, por lo que el
(SSEreducido ⫺ SSEcompleto)/(p ⫺ k) está cerca de s2. El estadístico de prueba es
f =
(SSEreducido − SSEcompleto)/(p − k)
SSEcompleto/(n − p − 1)
(8.17)
Ahora, si H0 es verdadera, tanto el numerador como el denominador de f son estimadores de
s2, por lo que f está probablemente cerca de 1. Si H0 es falsa, la cantidad SSEreducido tiende a
ser más grande, por lo que el valor de f tiende a ser mayor. El estadístico f es un estadístico
F; su distribución nula es Fp ⫺ k, n ⫺ p ⫺ 1.
El método recién descrito es muy útil en la práctica para desarrollar modelos parsimoniosos eliminando las variables superfluas. Sin embargo, las condiciones en las que esto es
formalmente válido rara vez se encuentran en la práctica. Primero, es raro el caso que el modelo completo sea correcto; habrá cantidades no aleatorias que afectan el valor de la variable
dependiente y que no se consideran para las variables independientes. Segundo, para que el
método sea formalmente válido, el subconjunto de variables que se eliminará debe determinarse independientemente de los datos. Éste por lo general no es el caso. Más a menudo,
cuando un modelo grande se ajusta, algunas de las variables se ve que tienen realmente P-valores grandes, y se utiliza la prueba F para determinar si se debe eliminar del modelo. Como
se ha dicho, ésta es una técnica útil en la práctica, pero, de la misma manera que la mayoría
de los métodos de la selección de modelos, debe verse como una herramienta informal en vez de
un procedimiento riguroso basado en la teoría.
Se muestra el método con un ejemplo. En redes ad hoc de computadoras móviles, los
mensajes deben enviarse de computadora a computadora hasta que alcanzan su destino. La sobrecarga de datos es el número de bytes de información que se deben transmitir junto con los
mensajes para llegar a las posiciones correctas. Un protocolo exitoso generalmente tiene una
sobrecarga de datos menor. La tabla 8.4 presenta la velocidad promedio, el tiempo de espera,
la razón de cambio de enlace (LCR), y la sobrecarga de datos para 25 redes de computadoras
simuladas. La razón de cambio de enlace para una computadora en particular es la razón en la
que las otras computadoras en la red entran y dejan el rango de transmisión de la computadora dada. Estos datos fueron generados para un estudio publicado en el artículo “Metrics to Enable Adaptive Protocols for Mobile Ad Hoc Networks” (J. Boleng, W. Navidi y T. Camp, en
Proceedings of the 2002 International Conference On Wireless Networks, 2002:293-298).
Se inicia ajustando un modelo realmente grande para estos datos, a saber,
Sobrecarga ⫽ β0 ⫹ β1 LCR ⫹ β2 Velocidad ⫹ β3 Pausa ⫹ β4 Velocidad ⋅ Pausa
⫹ β5 LCR2 ⫹ β6 Velocidad2 ⫹ β7 Pausa2 ⫹ ε
588
CAPÍTULO 8
Regresión múltiple
TABLA 8.4 Sobrecarga de datos, velocidad, tiempo de pausa, y razón de cambio
de enlace por una red de computadoras móviles
Velocidad
(m/s)
Tiempo de
pausa
LCR
(s)
(100/s)
5
5
5
5
5
10
10
10
10
10
20
20
20
10
20
30
40
50
10
20
30
40
50
10
20
30
9.426
8.318
7.366
6.744
6.059
16.456
13.281
11.155
9.506
8.310
26.314
19.013
14.725
Sobrecarga
Tiempo de
Sobrecarga
de datos Velocidad pausa
LCR
de datos
(kB)
(m/s)
(s)
(100/s)
(kB)
428.90
443.68
452.38
461.24
475.07
446.06
465.89
477.07
488.73
498.77
452.24
475.97
499.67
20
20
30
30
30
30
30
40
40
40
40
40
40
50
10
20
30
40
50
10
20
30
40
50
12.117
10.284
33.009
22.125
16.695
13.257
11.107
37.823
24.140
17.700
14.064
11.691
501.48
519.20
445.45
489.02
506.23
516.27
508.18
444.41
490.58
511.35
523.12
523.36
Los resultados del ajuste a este modelo son los siguientes.
The regression equation is
Overhead = 368 + 3.48 LCR + 3.04 Speed + 2.29 Pause – 0.0122 Speed*Pause
– 0.1041 LCRˆ2 – 0.0313 Speedˆ2 – 0.0132 Pauseˆ2
Predictor
Constant
LCR
Speed
Pause
Speed*Pa
LCRˆ2
Speedˆ2
Pauseˆ2
Coef
367.96
3.477
3.044
2.2924
–0.01222
–0.10412
–0.03131
–0.01318
S = 5.72344
SE Coef
19.40
2.129
1.591
0.6984
0.01534
0.03192
0.01906
0.01045
R–Sq = 97.2%
T
18.96
1.63
1.91
3.28
–0.80
–3.26
–1.64
–1.26
P
0.000
0.121
0.073
0.004
0.437
0.005
0.119
0.224
R–Sq(adj) = 96.1%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
7
17
24
SS
19567.5
556.9
20124.3
MS
2795.4
32.8
F
85.33
P
0.000
Se puede ver que LCR, Velocidad ⋅ Pausa, Velocidad2, y Pausa2 tienen P-valores grandes.
Se dejará a LCR en el modelo por ahora, porque LCR2 tiene un P-valor muy pequeño, y, por
tanto, debe quedarse en el modelo. Se utilizará la prueba F para determinar si el modelo reducido obtenido al eliminar Velocidad ⋅ Pausa, Velocidad2 y Pausa2 es razonable. Primero, del
8.3
Selección de modelos
589
resultado para el modelo completo, observe que SSEcompleto ⫽ 556.9, y que tiene 17 grados de
libertad. El número de variables independientes en el modelo completo es p ⫽ 7.
Queda bien el modelo reducido
Sobrecarga ⫽ β0 ⫹ β1 LCR ⫹ β2 Velocidad ⫹ β3 Pausa ⫹ β5 LCR2 ⫹ ε
Los resultados del ajuste de este modelo son:
The regression equation is
Overhead = 359 + 6.69 LCR + 0.777 Speed + 1.67 Pause – 0.156 LCRˆ2
Predictor
Constant
LCR
Speed
Pause
LCRˆ2
Coef
359.22
6.695
0.7766
1.6729
–1.5572
S = 6.44304
SE Coef
13.01
1.156
0.2054
0.1826
0.02144
R–Sq = 95.9%
T
27.61
5.79
3.78
9.16
–7.26
P
0.000
0.000
0.001
0.000
0.000
R–Sq(adj) = 95.0%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
4
20
24
SS
19294.1
830.3
20124.3
MS
4823.5
41.5
F
116.19
P
0.000
Los P-valores para las variables en este modelo son bastante pequeños. Del resultado
para este modelo reducido, se observa que SSEreducido ⫽ 830.3. El número de variables en este modelo reducido es k ⫽ 4.
Ahora se puede calcular el estadístico F. Utilizando la ecuación (8.17) se calcula
f =
(830.3 − 556.9)/(7 − 4)
= 2.78
556.9/17
La distribución nula es F3,17. De la tabla F (tabla A.7 en el apéndice A) se encuentra que 0.05
⬍ P ⬍ 0.10. De acuerdo con la regla general del 5%, puesto P ⬎ 0.05, el modelo reducido
es creíble, pero sólo apenas es cierto. Más que establecer un modelo apenas creíble, es inteligente ir más lejos para buscar un modelo ligeramente menos reducido que tenga un P-valor
mayor.
Con este propósito se observa que de las tres variables que se eliminan, la variable Velocidad2 tenía el P-valor más pequeño en el modelo completo. Lo anterior se tomará como
una indicación de que ésta podría ser la más importante de las variables que se elimina, y se
pondrá en el modelo. Ahora se ajustará un segundo modelo reducido, que es
Sobrecarga ⫽ β0 ⫹ β1 LCR ⫹ β2 Velocidad ⫹ β3 Pausa ⫹ β5 LCR2 ⫹ β6 Velocidad2
590
CAPÍTULO 8
Regresión múltiple
Los resultados del ajuste a este modelo son:
The regression equation is
Overhead = 373 + 4.80 LCR + 1.99 Speed + 1.45 Pause – 0.123 LCRˆ2
–0.0212 Speedˆ2
Predictor
Constant
LCR
Speed
Pause
LCRˆ2
Speedˆ2
Coef
372.60
4.799
1.993
1.4479
–0.12345
–0.02120
S = 6.36809
SE Coef
16.93
1.935
1.023
0.2587
0.03400
0.01746
R–Sq = 96.2%
T
22.00
2.48
1.95
5.60
–3.63
–1.21
P
0.000
0.023
0.066
0.000
0.002
0.240
R–Sq(adj) = 95.2%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
5
19
24
SS
19353.8
770.5
20124.3
MS
3870.8
40.6
F
95.45
P
0.000
Observe que el P-valor para Velocidad2 en este modelo es grande (0.240). Esto no es
bueno. En general no se quiere agregar una variable cuyo coeficiente podría ser igual a 0. Por
lo que tal vez no se querrá seguir con este modelo. De todos modos, sólo por práctica se calcula el valor del estadístico F. El valor de SSEreducido en este modelo es 770.5. El número de
variables independientes es k ⫽ 5. Por tanto, el valor del estadístico F, utilizando la ecuación
(8.17), es
f =
(770.5 − 556.9)/(7 − 5)
= 3.26
556.9/17
La distribución nula es F2,17. En la tabla F (tabla A.7) se encuentra nuevamente que 0.05
⬍ P ⬍ 0.10, por lo que el modelo reducido apenas es creíble como el mejor.
Se elige poner Velocidad2 en el modelo porque tenía el menor P-valor entre las variables eliminadas originalmente. Pero, como se acaba de ver, esto último no garantiza que tiene un P-valor pequeño cuando se pone nuevamente en el modelo reducido. Quizás una de las
otras variables que se eliminaron sería mejor. De las tres variables que se eliminaron originalmente, la que tenga el segundo P-valor más pequeño era Pausa2. Se trata de sustituir Velocidad2 con Pausa2. En este contexto, ahora se ajusta a un tercer modelo:
Sobrecarga ⫽ β0 ⫹ β1 LCR ⫹ β2 Velocidad ⫹ β3 Pausa ⫹ β5 LCR2 ⫹ β6 Pausa2
8.3
Selección de modelos
591
Los resultados del ajuste a este modelo son:
The regression equation is
Overhead = 345 + 6.484 LCR + 0.707 Speed + 2.85 Pause – 0.145 LCRˆ2
– 0.0183 Pauseˆ2
Predictor
Constant
LCR
Speed
Pause
LCRˆ2
Pauseˆ2
Coef
345.42
6.484
0.7072
2.8537
–0.14482
–0.018334
S = 5.83154
SE Coef
13.19
1.050
0.1883
0.5337
0.01996
0.007879
R–Sq = 96.8%
T
26.20
6.17
3.76
5.35
–7.25
–2.33
P
0.000
0.000
0.001
0.000
0.000
0.031
R–Sq(adj) = 95.9%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
5
19
24
SS
19478.2
646.1
20124.3
MS
3895.6
34.0
F
114.55
P
0.000
Este modelo tiene buen aspecto, al menos al principio. Todas las variables tienen P-valores pequeños. Se calculará el estadístico F para ver si este modelo es creíble. El valor de
SSEreducido en este modelo es 646.1. El número de variables independientes es k ⫽ 5. El valor
del estadístico F, usando la ecuación (8.17), es, por tanto,
f =
(646.1 − 556.9)/(7 − 5)
= 1.36
556.9/17
La distribución nula es F2,17. Al consultar la tabla F (tabla A.7) se encuentra que el punto 0.10
en esta distribución F es 2.64. Por tanto, el P-valor es mucho mayor que 0.10. Este modelo
es evidentemente creíble.
Se ha utilizado un método informal para encontrar un buen modelo parsimonioso. Es
importante darse cuenta que este procedimiento informal se podía haber realizado de manera
diferente, con elecciones diferentes de las variables eliminadas e incluidas en el modelo. Se
podría haber tenido un modelo final diferente que pudiera haber sido tan bueno como el que
se encontró. Con frecuencia, en la práctica hay muchos modelos que ajustan los datos casi
igualmente bien; no hay un único modelo “correcto”.
Regresión con los mejores subconjuntos
Como se ha mencionado, con frecuencia los métodos de selección de modelos son más informales y adecuados. Sin embargo, hay algunas herramientas que pueden hacer el proceso más
sistemático. Una de ellas es la regresión con los mejores subconjuntos. El concepto es muy
simple. Suponga que hay p variables independientes, x1, . . . , xp, que están disponibles para
592
CAPÍTULO 8
Regresión múltiple
ponerse en el modelo. Suponga que se desea encontrar un buen modelo que contenga exactamente cuatro variables independientes. Se puede ajustar cada modelo potencial que contenga
cuatro de las variables, y ordenarlos según sus ajustes de bondad, midiendo el coeficiente de
determinación R2. El subconjunto de cuatro variables que produce el valor mayor de R2 es el
“mejor” subconjunto de tamaño 4. Se puede repetir el proceso para otros tamaños de subconjuntos, encontrando los mejores subconjuntos de tamaño 1, 2, . . . , p. Después se pueden examinar estos mejores subconjuntos para ver cuál proporciona un buen ajuste en tanto continúe
siendo parsimonioso.
El procedimiento para encontrar los mejores subconjuntos es computacionalmente intenso. Cuando hay muchas potenciales variables independientes, existirán bastantes modelos
para ajustar. Sin embargo, para la mayoría de los conjuntos de datos, las computadoras actuales pueden manejar 30 o más variables independientes, ello es suficiente para tratar muchas
situaciones prácticas. El siguiente resultado de MINITAB es para la regresión con los mejores subconjuntos aplicados a los datos de la tabla 8.4. Se están considerando siete variables
independientes: Velocidad, Pausa, LCR, Velocidad ⋅ Pausa, Velocidad2, Pausa2 y LCR2.
Best Subsets Regression
Response is Overhead
Vars
R–Sq
Adj.
R–Sq
1
1
2
2
3
3
4
4
5
5
6
6
7
73.7
54.5
82.7
82.2
92.9
89.6
95.9
95.4
96.8
96.7
97.1
97.0
97.2
72.5
52.6
81.2
80.6
91.9
88.1
95.0
94.5
95.9
95.8
96.2
96.0
96.1
C–p
s
140.6
258.3
87.0
90.3
26.5
46.9
10.3
13.2
6.7
7.2
6.6
7.6
8.0
15.171
19.946
12.564
12.755
8.2340
9.9870
6.4430
6.7991
5.8315
5.9074
5.6651
5.8164
5.7234
S
p
e
e
d
P
a
u
s
e
L
C
R
S
p
e
e
d
ˆ
2
P
a
u
s
e
ˆ
2
S
p
e
e
d
*
P
a
L
C
R
ˆ
2
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
En este resultado se presenta tanto el mejor y el segundo mejor subconjunto, para tamaños del 1 al 7. Se destaca que el término mejor sólo significa que el modelo tiene el mayor
valor de R2, y no garantiza que éste sea el mejor en cualquier sentido práctico. Se explicará el
resultado columna por columna. La primera, rotulada como “Vars”, presenta el número de va-
8.3
Selección de modelos
593
riables en el modelo. Por tanto, el primer renglón de la tabla describe el mejor modelo que se
puede hacer con una variable independiente, y el segundo renglón describe el segundo mejor
de este modelo. El tercero y cuarto renglones describen los mejores y los segundos mejores
modelos que se pueden hacer con dos variables, y así sucesivamente. La segunda columna
presenta el coeficiente de determinación, R2, para cada modelo. Observe que el valor de R2
para el mejor subconjunto aumenta cuando el número de variables lo hace. Es un hecho matemático que el mejor subconjunto de k ⫹ 1 variables de k siempre tendrá por lo menos un R2
tan grande como el mejor subconjunto de variables k. Por el momento no se considerarán las
dos siguientes columnas. La columna rotulada como “s” presenta la estimación de la desviación estándar del error. Es la de raíz cuadrada de la estimación s2 (ecuación 8.8 de la sección
8.1). Por último, las columnas de la derecha representan variables independientes que son
candidatas para incluirse en el modelo. El nombre de cada variable se escribe verticalmente
arriba de su columna. Una “X” en la columna significa que la variable está incluida en el modelo. Por tanto, el mejor modelo que contiene cuatro variables es el que tiene las variables Velocidad, Pausa, LCR y LCR2.
Al observar los mejores subconjuntos del resultado de regresión, es importante fijarse
que existe una pequeña diferencia en el ajuste entre el mejor y el segundo modelo de cada tamaño (excepto para el tamaño 1). También es importante darse cuenta de que el valor de R2
es una cantidad aleatoria, que depende de los datos. Si el proceso se repitiera y se obtuvieran
nuevos datos, los valores de R2 para los diferentes modelos serían algo diferentes, y los modelos diferentes serían “mejores”. Por esta razón no se debe usar este procedimiento, o cualquier otro, para elegir sólo un modelo. En lugar de ello se debe dar cuenta de que habrá
muchos modelos que ajustan los datos casi igualmente bien.
Sin embargo, existen métodos que se han desarrollado para elegir un solo modelo, presumiblemente el “mejor” de los “mejores”. Aquí se describen dos de ellos, con la advertencia de que no se consideren muy en serio. Se inicia al observar que si sólo se elige el modelo
con el valor más alto de R2, siempre se elegirá el que contiene todas las variables, ya que el
valor de R2 aumenta necesariamente cuando el número de variables en el modelo se incrementa. Los métodos de selección de un modelo implican estadísticos que ajustan el valor de R2,
para eliminar esta característica.
El primero es el R2 ajustado. Sea n el número de observaciones y k el de variables independientes en el modelo. El R2 ajustado se define así:
2
2
R ajustado = R −
k
n−k−1
(1 − R 2 )
(8.18)
El R2 ajustado es siempre menor que R2, ya que una cantidad positiva es restada de R2. Conforme el número de variables k aumenta, R2 aumentará, pero la cantidad restada de éste también lo hará. El valor de k para el cual el valor de R2 ajustado es un máximo se puede usar
para determinar el número de variables en el modelo, y el mejor subconjunto de ese tamaño
que se puede elegir como modelo. En el resultado anterior se puede ver que el R2 ajustado alcanza su máximo (96.2%) en el modelo de seis variables que contienen las variables Velocidad, Pausa, LCR, Velocidad2, Pausa2 y LCR2.
Otro estadístico comúnmente usado es Cp de Mallows. Para calcular esta cantidad, sea
n el número de observaciones, p el número total de variables independientes en consideración
y k el número de variables independientes en un subconjunto. Como antes, sea SSEcompleto la
594
CAPÍTULO 8
Regresión múltiple
suma de los cuadrados del error para el modelo completo que contiene todas las variables p,
y sea SSEreducido la suma de los cuadrados del error para el modelo que contiene solamente el
subconjunto de variables k. El Cp de Mallows se define como
Cp =
(n − p − 1)SSEreducido
− (n − 2k − 2)
SSEcompleto
(8.19)
Para modelos que contienen tantas variables independientes como se necesiten, se supone que el valor de Cp es casi igual al número de variables, incluyendo el intercepto, en el
modelo. Para elegir sólo un modelo se puede elegir éste ya sea con el valor mínimo de Cp, o
se puede escoger el modelo en el que el valor de Cp está más cerca del número de variables
independientes en el modelo. En el resultado anterior, ambos criterios producen el mismo modelo de seis variables elegidas por el criterio del R2 ajustado. El valor de Cp para este modelo es 6.6.
Por último, se indica que el procedimiento ad hoc es utilizar la prueba F que produjo el
modelo de cinco variables que contiene las variables Velocidad, Pausa, LCR, Pausa2 y LCR2.
El resultado muestra que este modelo es el mejor de cinco variables en función de R2. Su R2
ajustado es 95.9%, y su valor Cp, 6.7, ambos están cercanos a sus valores óptimos. En la práctica no hay una razón clara para preferir el modelo elegido con R2 ajustado o con Cp de Mallows, o viceversa.
Regresión stepwise
La regresión stepwise es quizás la técnica de selección de modelos más ampliamente usada.
Su ventaja principal sobre la regresión con los mejores subconjuntos es que es menos intensa computacionalmente, por lo que se puede utilizar en situaciones donde hay un número muy
grande de variables candidatas independientes y demasiados subconjuntos posibles para revisarse cada uno. La versión de la regresión stepwise que se describirá está basada en los P-valores de los estadísticos t para las variables independientes. Una versión equivalente tiene
como sustento el estadístico F (que es el cuadrado del estadístico t). Antes de operar el algoritmo, el usuario elige dos P-valores de umbral, αdentro y αfuera, con αdentro ⱕ αfuera. La regresión stepwise empieza con un paso de selección hacia delante, en el cual se selecciona la
variable independiente con el P-valor más pequeño, suponiendo que se satisface P ⬍ αdentro.
Esta variable se introduce en el modelo, creando un modelo con una sola variable independiente. Esta variable se denotará por x1. En el siguiente paso, que también es un paso de selección hacia adelante, se revisan una a una las variables restantes como candidatas para la
segunda variable en el modelo. La que tenga el P-valor más pequeño se agrega al modelo, suponiendo nuevamente que P ⬍ αdentro.
Ahora, es posible que al haber agregado la segunda variable al modelo se provoque un
aumento en el P-valor de la primera variable. En el siguiente paso, llamado de eliminación
hacia atrás, la primera variable se elimina del modelo si su P-valor es mayor que αfuera. El
algoritmo continúa alternando los pasos de selección hacia adelante con los de eliminación
hacia atrás: en cada paso de selección hacia adelante se agrega la variable con el P-valor más
pequeño si P ⬍ αdentro, y en cada paso de eliminación hacia atrás se elimina la variable con el
P-valor más grande si P ⬎ αfuera. El algoritmo se termina cuando ninguna variable satisface
los criterios para ser agregada o eliminada del modelo.
8.3
Selección de modelos
595
El siguiente resultado es el procedimiento de regresión stepwise de MINITAB, aplicado a los datos de la tabla 8.4. Los umbrales para los P-valores son αdentro ⫽ αfuera ⫽ 0.15. Hay
un total de siete variables independientes que deben considerarse: Velocidad, Pausa, LCR, Velocidad ⋅ Pausa, Velocidad2, Pausa2 y LCR2.
Alpha-to-Enter = 0.15
Alpha-to-Remove = 0.15
Response is Overhead on 7 predictors, with N = 25
Step
Constant
Speed*Pause
T-Value
P-Value
1
452.2
2
437.3
3
410.7
4
388.4
5
338.5
0.0470
8.03
0.000
0.0355
6.00
0.000
0.0355
6.96
0.000
0.0304
5.21
0.000
0.0146
3.52
0.002
0.74
3.40
0.003
3.02
3.78
0.001
3.75
4.20
0.000
3.24
6.25
0.000
– 0.0380
– 2.94
0.008
– 0.0442
– 3.39
0.003
– 0.0256
– 3.19
0.005
0.69
1.62
0.121
6.97
6.95
0.000
Pause
T-Value
P-Value
Pauseˆ2
T-Value
P-Value
LCR
T-Value
P-Value
LCRˆ2
T-Value
P-Value
S
R-Sq
R-Sq(adj)
Mallows C-p
– 0.139
– 6.46
0.000
15.2
73.70
72.55
140.6
12.6
82.74
81.18
87.0
10.8
87.77
86.02
58.1
10.4
89.19
87.02
51.4
5.99
96.62
95.73
7.8
En el paso 1, la variable Velocidad ⋅ Pausa tenía el P-valor (0.000) más pequeño entre
las siete, por lo que fue la primera variable en el modelo. En el paso 2, la Pausa tenía el P-valor (0.003) más pequeño entre las variables restantes, por lo que fue la segunda variable agregada en el modelo. El P-valor para la variable Velocidad ⋅ Pausa permanecía en 0.000 después
de que se agregó Pausa al modelo; debido a que no subió a un valor mayor que αfuera ⫽ 0.15,
no se elimina del modelo. En los pasos 3, 4 y 5 las variables Pausa2, LCR y LCR2 son agregadas una tras otra. En ningún punto el P-valor de una variable en el modelo superó el umbral αfuera ⫽ 0.15, por lo que no se eliminó ninguna variable. Después de cinco pasos, ninguna
de las variables que permanecían tenía P-valores menores que αdentro ⫽ 0.15, por lo que el algoritmo termina. El modelo final contiene las variables Velocidad ⋅ Pausa, Pausa, Pausa2, LCR
y LCR2.
596
CAPÍTULO 8
Regresión múltiple
El modelo elegido por la regresión stepwise es uno con cinco variables. En comparación con el resultado arrojado por la regresión con los mejores subconjuntos, muestra que no
es uno de los mejores dos modelos con cinco variables en términos de R2. El modelo ajusta
bien, y solamente en relación con el ajuste es razonable. Se indica que este modelo tiene una
característica indeseable que contiene el término de interacción Velocidad ⋅ Pausa sin contener la variable Velocidad sola. Esto último indica una debilidad de todos los procedimientos
automáticos de selección de variables, incluyendo la regresión stepwise y la regresión con los
mejores subconjuntos. Operan sólo con base en la bondad del ajuste, y pueden no considerar
las relaciones entre variables independientes que son importantes.
Los procedimientos de selección de modelos algunas veces
encuentran modelos cuando no deben hacerlo
Cuando se construye un modelo para pronosticar el valor de una variable dependiente, podría
parecer razonable tratar de empezar con tantas variables candidatas independientes como sea
posible para que un procedimiento de selección de modelos tenga un número muy grande de
modelos que elegir. Desgraciadamente, lo anterior no es una buena idea, como se mostrará a
continuación.
Un coeficiente de correlación se puede calcular entre cualesquiera dos variables. A veces, dos variables sin ninguna relación real estarán correlacionadas fuertemente por probabilidad. Por ejemplo, George Udny Yule observó que la tasa de natalidad anual en Gran Bretaña
estaba casi perfectamente correlacionada (r ⫽ ⫺0.98) con la producción anual de hierro en
lingotes en Estados Unidos durante 1875-1920. Aunque nadie sugeriría tratar de pronosticar
alguna de estas variables por la otra. Ello ilustra una dificultad que comparten todos los procedimientos de selección de modelos. Lo más probable es que algunas de las variables independientes que se proporcionan sean mejores candidatas solamente por azar y presenten correlaciones
sin sentido con la variable dependiente.
Este fenómeno se muestra con una simulación. Se genera una muestra aleatoria simple
y1, . . . , y30 de tamaño 30 de una distribución N(0, 1). Esta muestra se denota por y. Después
se generan 20 muestras independientes más de tamaño 30 de una distribución N(0, 1); estas
muestras se denotarán por x1, . . . , x20. Para hacer la notación clara, la muestra xi contiene 30
valores xi1, . . . , xi30. Después se aplican ambas, la regresión stepwise y la regresión con los
mejores subconjuntos, a estos datos simulados. Ninguno de los xi está relacionado con y; todos fueron generados de manera independiente. Por tanto, el resultado ideal de un procedimiento de selección de modelos sería producir otro similar sin ninguna variable dependiente.
El comportamiento verdadero era muy diferente. Los dos siguientes resultados de MINITAB
muestran la regresión stepwise y la regresión con los mejores subconjuntos. El método de regresión stepwise recomienda un modelo que contiene seis variables, con un R2 ajustado de
41.89%. El procedimiento de la regresión con los mejores subconjuntos produce el modelo
de mejor ajuste para cada número de variables de 1 al 20. Usando el criterio de R2 ajustado,
el procedimiento de mejores subconjuntos recomienda un modelo de 12 variables, con un R2
ajustado de 51.0%. De acuerdo con el criterio mínimo de Cp de Mallows, el “mejor” modelo
es uno de cinco variables.
Alguien que considerara este resultado en sentido literal creería que algunas de las variables independientes podrían ser útiles para pronosticar la variable dependiente. Pero ninguna de ellas lo es. Todas las relaciones aparentes se deben completamente al azar.
8.3
Selección de modelos
Stepwise Regression: Y versus X1, X2, . . .
Alpha-to-Enter: 0.15
Alpha-to-Remove: 0.15
Response is Y on 20 predictors, with N = 30
Step
Constant
X15
T-Value
P-Value
1
0.14173
2
0.11689
3
0.12016
4
0.13756
5
0.09070
6
0.03589
– 0.38
– 2.08
0.047
– 0.38
– 2.19
0.037
– 0.28
– 1.60
0.122
– 0.32
– 1.87
0.073
– 0.28
– 1.69
0.105
– 0.30
– 1.89
0.071
0.39
2.04
0.051
0.55
2.76
0.010
0.57
2.99
0.006
0.57
3.15
0.004
0.52
2.87
0.009
– 0.43
– 1.98
0.058
– 0.43
– 2.06
0.050
– 0.55
– 2.60
0.016
– 0.73
– 3.07
0.005
0.33
1.79
0.086
0.42
2.29
0.031
0.49
2.66
0.014
– 0.42
– 1.83
0.080
– 0.52
– 2.23
0.035
X6
T-Value
P-Value
X16
T-Value
P-Value
X12
T-Value
P-Value
X3
T-Value
P-Value
X17
T-Value
P-Value
S
R-Sq
R-Sq(adj)
Mallows C-p
0.35
1.53
0.140
1.15
13.33
10.24
5.5
1.09
24.92
19.36
3.3
1.04
34.75
27.22
1.7
0.998
42.15
32.90
1.0
0.954
49.23
38.66
0.4
0.928
53.91
41.89
0.7
597
598
CAPÍTULO 8
Regresión múltiple
Best Subsets Regression: Y versus X1, X2, . . .
Response is Y
X X X X X X X X X X X
Mallows
X X X X X X X X X 1 1 1 1 1 1 1 1 1 1 2
R-Sq R-Sq(adj)
C-p
S 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0
1
13.3
10.2
5.5
1.1539
2
28.3
23.0
2.0
1.0685
X
X
3
34.8
27.2
1.7
1.0390
X
X X
4
43.2
34.1
0.6 0.98851
X
X
X
X
5
49.2
38.7
0.4 0.95391
X
X
X
X X
6
53.9
41.9
0.7 0.92844
X
X
X
X X X
7
57.7
44.3
1.3 0.90899 X X
X
X
X X
X
8
61.2
46.4
2.1 0.89168
X
X
X X
X X X
X
9
65.0
49.3
2.7 0.86747
X
X X
X X
X X X
X
10
67.6
50.5
3.8 0.85680
X
X X
X X
X X X X X
11
69.2
50.4
5.2 0.85803 X X X
X X
X X
X X X
X
12
71.3
51.0
6.4 0.85267 X X X
X X
X X
X X X X
X
13
72.4
49.9
8.0 0.86165 X X X
X X
X X X
X X X X
X
14
73.0
47.8
9.8 0.87965 X X X
X X X
X X X
X X X X
X
15
74.2
46.5
11.4 0.89122 X X X
X X X
X X X
X X X X X X
16
74.5
43.1
13.3 0.91886 X X X
X X X X
X X X
X X X X X X
17
74.8
39.2
15.1 0.94985 X X X
X X X X
X X X X X X X X X X
18
75.1
34.2
17.1 0.98777 X X X
X X X X
X X X X X X X X X X X
19
75.1
27.9
19.0
1.0344 X X X
X X X X X X X X X X X X X X X X
20
75.2
20.1
21.0
1.0886 X X X X X X X X X X X X X X X X X X X X
Vars
X
¿Cómo se puede determinar qué variables, si las hay, en el modelo seleccionado están
muy relacionadas con la variable dependiente, y cuáles se seleccionaron solamente por azar?
Los métodos estadísticos no son de mucha ayuda aquí. El método más confiable es repetir el
experimento, reuniendo más datos de la variable dependiente y de las variables independientes que fueron seleccionadas para el modelo. Entonces las variables independientes sugeridas
por el procedimiento de selección se pueden ajustar a la variable dependiente utilizando los
nuevos datos. Si algunas de estas variables ajusta bien a los nuevos datos, la evidencia de una
relación real será más convincente.
Enseguida se resume el análisis de la selección de modelos destacando cuatro puntos.
Selección de modelos
8.3
599
Resumen
Cuando seleccione un modelo de regresión considere lo siguiente:
Cuando hay poca o ninguna teoría física para apoyarse, muchos modelos diferentes ajustarán los datos casi igualmente bien.
Los métodos para elegir un modelo implican estadísticos (R2, el estadístico F, Cp)
cuyos valores dependen de los datos. Por tanto, si el experimento se repite, estos
estadísticos tendrán valores diferentes, y los modelos diferentes pueden parecer ser
“mejores”.
Algunas o todas las variables independientes en un modelo seleccionado pueden
no estar realmente relacionadas con la variable dependiente. Siempre que sea posible, los experimentos se deben repetir para evaluar estas relaciones aparentes.
La selección de modelos es un arte, no una ciencia.
Ejercicios para la sección 8.3
1. Verdadero o falso:
a) Para algún conjunto de datos siempre hay un mejor modelo.
b) Cuando no hay teoría física sobre la cual especificar un modelo, por lo general no hay ningún mejor modelo, pero muchos
son casi igualmente buenos.
c) Los métodos de selección de modelos como la regresión con los mejores subconjuntos o la regresión stepwise, cuando se
usan adecuadamente, están diseñados en forma científica para encontrar el mejor modelo disponible.
d) Los métodos de selección de modelos como la regresión con los mejores subconjuntos y regresión stepwise, cuando se usan
adecuadamente, pueden sugerir modelos que ajustan los datos bien.
2. El artículo “Experimental Design Approach for the Optimization of the Separation of Enantiomers in Preparative Liquid
Chromatography” (S. Lai y Z. Lin, en Separation Science and Technology, 2002:847-875) describe un experimento que implica un proceso químico diseñado para separar enantiomeros. Se ajustó un modelo para estimar el tiempo del ciclo (y) en función de la razón de flujo (x1), la concentración de la muestra (x2), y la composición de fase móvil (x3). En la tabla siguiente se
presentan los resultados de un ajuste de mínimos cuadrados. (El artículo no proporciona el valor del estadístico t para el término constante.)
Pronosticador
Coeficiente
Constante
x1
x2
x3
x12
x22
x32
x1 x2
x1 x3
x2 x3
1.603
−0.619
0.086
0.306
0.272
0.057
0.105
−0.022
−0.036
0.036
De los siguientes, ¿cuál es el mejor paso siguiente en el análisis?
i) No hay necesidad de hacer ninguno. Este modelo es excelente.
T
−22.289
3.084
11.011
8.542
1.802
3.300
−0.630
−1.004
1.018
P
0.000
0.018
0.000
0.000
0.115
0.013
0.549
0.349
0.343
600
CAPÍTULO 8
Regresión múltiple
ii) Eliminar, x 21, x 22 y x 23 del modelo, y después realizar una prueba F.
iii) Eliminar x1x2, x1x3 y x2x3 del modelo, y después realizar una prueba F.
iv) Eliminar x1 y x 21 del modelo, y después realizar una prueba F.
v) Agregar los términos cúbicos x 31, x 32 y x 33 al modelo para tratar de mejorar el ajuste.
3. En el artículo que se cita en el ejercicio 2 se ajustó un modelo para investigar la relación entre las variables independientes dadas en el ejercicio 2 y la cantidad del isómero S coleccionada. Los resultados del ajuste de mínimos cuadrados se presentan en
la tabla siguiente. (El artículo no proporciona el valor del estadístico t para el término constante.)
Pronosticador
Coeficiente
T
P
Constante
x1
x2
x3
x12
x22
x32
x1 x2
x1 x3
x2 x3
3.367
−0.018
1.396
0.104
0.017
−0.023
−0.030
−0.006
0.012
0.055
−1.729
135.987
10.098
1.471
−0.909
−2.538
−0.466
0.943
4.194
0.127
0.000
0.000
0.184
0.394
0.039
0.655
0.377
0.004
De lo siguiente, ¿cuál es el mejor paso siguiente en el análisis?
i) Elimine x 21, x 22 y x 23 del modelo, y después realice una prueba F.
ii) No se tiene que hacer nada. Este modelo es excelente.
iii) Agregar términos cúbicos x 31, x 32 y x 33 al modelo para tratar de mejorar el ajuste.
iv) Eliminar x1x2, x1x3 y x2x3 del modelo, después realice una prueba F.
v) Elimine x 22, x1x2 y x1x3 del modelo, y después realice una prueba F.
4. Un ingeniero mide una variable dependiente y y las variables independientes x1, x2, y x3. El resultado de MINITAB para el modelo y ⫽ β0 ⫹ β1x1 ⫹ β2x2 ⫹ β3x3 ⫹ ε se presenta a continuación.
The regression equation is
Y = 0.367 + 1.61 X1 – 5.51 X2 + 1.27 X3
Predictor
Constant
X1
X2
X3
Coef
0.3692
1.6121
5.5049
1.2646
SE Coef
0.9231
1.3395
1.4959
1.9760
T
0.40
1.21
3.68
0.64
P
0.698
0.254
0.004
0.537
De los siguientes, ¿cuál es el mejor paso siguiente en el análisis?
i) Agregar términos de interacción x1x2 y x2x3 con el propósito de intentar determinar más variables para poner en el modelo.
ii) Agregar el término de interacción x1x3 para intentar determinar otra variable para poner en el modelo.
iii) No se tiene que hacer nada. Este modelo es excelente.
iv) Eliminar x1 y x3, y después realizar una prueba F.
v) Eliminar x2, y después realizar una prueba F.
vi) Eliminar el intercepto (constante), ya que tiene el P-valor más grande.
8.3
Selección de modelos
601
5. Un fisiólogo está tratando de pronosticar las tasas de respiración de las personas (en m3/h) durante ejercicio pesado a partir de
sus tasas de respiración en reposo, mientras están sentadas, y durante ejercicio ligero. El siguiente resultado de MINITAB es
del modelo
Pesado ⫽ β0 ⫹ β1 Ligero ⫹ β2 Sentado ⫹ β3 Reposo ⫹ β4 Ligero ⋅ Sentado ⫹ β5 Ligero ⋅ Reposo ⫹ β6 Sentado ⋅ Reposo ⫹ ε
The regression equation is
Heavy = 265.6 + 1.48 Light – 10.4 Sit – 1.13 Rest + 0.044 Light*Sit
+ 0.0010 Light*Rest + 0.026 Sit*Rest
Predictor
Constant
Light
Sit
Rest
Light*Sit
Light*Rest
Sit*Rest
Coef
265.64
1.4755
– 10.410
– 1.1338
0.043728
0.00099612
0.026348
SE Coef
10.59
0.2632
1.660
2.233
0.01513
0.01855
0.02196
T
25.08
5.61
– 6.27
– 0.51
2.89
0.05
1.20
P
0.000
0.000
0.000
0.622
0.015
0.958
0.255
De los siguientes, ¿cuál es el mejor paso siguiente en el análisis?
i) Eliminar Reposo, Ligero ⋅ Reposo, y Sentado ⋅ Reposo del modelo, y después realizar una prueba F.
ii) Eliminar Ligero ⋅ Sentado del modelo, y después realizar una prueba F.
iii) No se tiene que hacer nada. Este modelo es excelente.
iv) Agregar las variables Ligero2 y Sentado2 para tratar de encontrar más variables que poner en el modelo.
v) Agregar la variable Reposo2 para tratar de encontrar más variables que poner en el modelo.
6. El siguiente resultado de MINITAB es para una regresión con los mejores subconjuntos que implica cinco variables dependientes X1, . . . , X5. Los dos modelos de cada tamaño con los valores más altos de R2 están listados.
Best Subsets Regression: Y versus X1, X2, X3, X4, X5
Response is Y
Vars
1
1
2
2
3
3
4
4
5
R-Sq
77.3
10.2
89.3
77.8
90.5
89.4
90.7
90.6
90.7
R-Sq(adj)
77.1
9.3
89.0
77.3
90.2
89.1
90.3
90.2
90.2
Mallows
C-p
133.6
811.7
14.6
130.5
3.6
14.6
4.3
5.3
6.0
S
1.4051
2.7940
0.97126
1.3966
0.91630
0.96763
0.91446
0.91942
0.91805
X
1
X
X
X
X
X
X
X
X
X
2
X
3
X
4
X
5
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
602
CAPÍTULO 8
Regresión múltiple
a) ¿Qué variables están en el modelo seleccionado por el criterio del mínimo Cp?
b) ¿Qué variables están en el modelo seleccionado por el criterio del R2 ajustado?
c) ¿Existen algunos otros modelos buenos?
7. Supuestamente el siguiente es el resultado de la regresión con los mejores subconjuntos que implica las cinco variables independientes X1, . . . , X5. Los dos modelos de cada tamaño con los valores más altos de R2 están listados. Algo está equivocado.
¿Qué es?
Best Subsets Regression
Response is Y
Vars
R-Sq
Adj.
R-Sq
C-p
s
1
1
2
2
3
3
4
4
5
69.1
60.8
80.6
79.5
93.8
93.7
91.4
90.1
94.2
68.0
59.4
79.2
77.9
92.8
92.7
90.4
88.9
93.0
101.4
135.4
55.9
60.7
13.4
18.8
5.5
5.6
6.0
336.79
379.11
271.60
279.59
184.27
197.88
159.59
159.81
157.88
X
1
X
2
X
3
X
4
X
5
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
8. Cierto proceso químico se realizó 12 veces, con las concentraciones diferentes de tres reactivos. Las concentraciones se denotan por x1, x2 y x3. El modelo y ⫽ β0 ⫹ β1x1 ⫹ β2x2 ⫹ β3x3 ⫹ β4x1x2 ⫹ β5x1x3 ⫹ β6x2x3 ⫹ ε se ajusta a los datos, y la suma de
los cuadrados del error es SSE ⫽ 4.6409. Entonces se ajusta el modelo reducido y ⫽ β0 ⫹ β1x1 ⫹ β2x2 ⫹ β3x3, y la suma de los
cuadrados del error es SSE ⫽ 11.5820. ¿Es razonable utilizar el modelo reducido, en vez del que contiene todas las interacciones, para pronosticar la producción? Explique.
9. (Continúa el ejercicio 7 de la sección 8.1.) Para tratar de mejorar el pronóstico de FEV1, se incluyeron variables independientes adicionales en el modelo. Estas nuevas variables son el peso (en kg), el producto (interacción) de la estatura y el peso, y de
la temperatura ambiente (en °C). El siguiente resultado de MINITAB presenta los resultados del ajuste del
FEV1 ⫽ β0 ⫹ β1 Último FEV1⫹ β2 Sexo ⫹ β3 Altura ⫹ β4 Peso ⫹ β5 Altura ⋅ Peso ⫹ β6 Temperatura ⫹ β7 Presión ⫹ ε
The regression equation is
FEV1 = – 0.257 + 0.778 Last FEV – 0.105 Gender + 1.213 Height – 0.00624 Weight
+ 0.00386 Height*Weight – 0.00740 Temp – 0.00148 Pressure
Predictor
Constant
Last FEV
Gender
Height
Weight
Height*Weight
Coef
0.2565
0.77818
– 0.10479
1.2128
– 0.0062446
0.0038642
SE Coef
0.7602
0.05270
0.03647
0.4270
0.01351
0.008414
T
0.34
14.77
– 2.87
2.84
– 0.46
0.46
P
0.736
0.000
0.005
0.005
0.645
0.647
8.3
Temp
Pressure
S = 0.22189
– 0.007404
– 0.0014773
0.009313
0.0005170
R-Sq = 93.5%
– 0.79
– 2.86
603
Selección de modelos
0.428
0.005
R-Sq(adj) = 93.2%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
7
157
164
SS
111.35
7.7302
119.08
MS
15.907
0.049237
F
323.06
P
0.000
a) El siguiente resultado de MINITAB, reproducido del ejercicio 7 de la sección 8.1, es para un modelo reducido en el cual
Peso, Estatura ⋅ Peso y Temperatura se tienen que eliminar. Calcule el estadístico F para probar la credibilidad del modelo
reducido.
The regression equation is
FEV1 = –0.219 + 0.779 Last FEV – 0.108 Gender + 1.354 Height – 0.00134 Pressure
Predictor
Constant
Last FEV
Gender
Height
Pressure
Coef
– 0.21947
0.779
– 0.10827
1.3536
– 0.0013431
S = 0.22039
SE Coef
0.4503
0.04909
0.0352
0.2880
0.0004722
R-Sq = 93.5%
T
– 0.49
15.87
– 3.08
4.70
– 2.84
P
0.627
0.000
0.002
0.000
0.005
R-Sq(adj) = 93.3%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
4
160
164
SS
111.31
7.7716
119.08
MS
27.826
0.048572
F
572.89
P
0.000
b) ¿Cuántos grados de libertad tiene el estadístico F?
c) Determine el P-valor para el estadístico F. ¿El modelo reducido es creíble?
d) Alguien afirma que puesto que cada una de las variables que se ha eliminado tenía P-valores grandes, el modelo reducido
debe ser creíble, y no era necesario realizar una prueba F. ¿Esto es correcto? Explique por qué.
e) La suma total de los cuadrados es la misma en ambos modelos, aunque las variables independientes son diferentes. ¿Hay
un error? Explique.
10. El artículo “Optimization of Enterocin P Production by Batch Fermentation of Enterococcus faecium P 13 at Constant pH” (C.
Herran, J. Martínez y cols., en Applied Microbiology and Biotechnology, 2001:378-383) describe un estudio que implica la tasa de crecimiento de la bacteria Enterococcus faecium en medios con pH diferente. El logaritmo de la tasa máxima de crecimiento para diferentes valores de pH se presenta en la tabla siguiente:
ln tasa de crecimiento
pH
−2.12
4.7
−1.51
5.0
−0.89
5.3
−0.33
5.7
−0.05
6.0
−0.11
6.2
0.39
7.0
−0.25
8.5
604
CAPÍTULO 8
Regresión múltiple
a) Ajuste el modelo lineal: ln tasa de crecimiento ⫽ β0 ⫹ β1 pH ⫹ ε. Para cada coeficiente, encuentre el P-valor para la hipótesis nula de que el coeficiente es igual a 0. Además, calcule al análisis de la varianza tabla (ANOVA).
b) Ajuste el modelo cuadrático: ln tasa de crecimiento ⫽ β0 ⫹ β1 pH ⫹ β2 pH2 ⫹ ε. Para cada coeficiente, encuentre el P-valor para la hipótesis nula de que el coeficiente es igual a 0. Además, calcule la tabla ANOVA.
c) Ajuste el modelo cúbico: ln tasa de crecimiento ⫽ β0 ⫹ β1 pH ⫹ β2 pH2 β3 pH3 ⫹ ε. Para cada coeficiente, encuentre el Pvalor para la hipótesis nula de que el coeficiente es igual a 0. Además, calcule la tabla ANOVA.
d ) ¿Cuál de estos modelos prefiere y por qué?
11. En relación con el ejercicio 7 de la sección 7.4, un molino de viento se utiliza para generar corriente directa. Se reúnen datos
para determinar la relación entre la velocidad del viento y la corriente. Sea y la corriente y x la velocidad del viento.
a) Ajuste el modelo cuadrático y ⫽ β0 ⫹ β1x ⫹ β2x2 ⫹ ε. Respecto a cada coeficiente, encuentre el P-valor para la hipótesis
nula de que el coeficiente es igual a 0.
b) Ajuste el modelo y ⫽ β0 ⫹ β1 ln x ⫹ ε. Respecto a cada coeficiente, determine el P-valor para la hipótesis nula de que el
coeficiente es igual a 0.
c) Realice una gráfica de residuos contra valores ajustados para cada modelo. ¿Los supuestos de cualquier modelo parece que
hayan sido violados?
d) Utilizando cada modelo, pronostique la corriente para las velocidades del viento de 3.0, 5.0, 7.0 y 9.0 mi/h.
e) El modelo cuadrático tiene dos variables dependientes (x y x2), mientras que el logaritmo del modelo sólo tiene uno. ¿La
prueba F se puede utilizar para determinar qué modelo es más adecuado? Si es así, calcule el estadístico F y el P-valor. Si
no, explique.
f ) ¿Puede decir una razón para preferir uno de estos modelos con respecto a los demás? Explique.
12. En una roca que se detona con explosivos la velocidad máxima de la partícula (PPV, por sus siglas en inglés) depende tanto de
la distancia de la explosión como de la cantidad de carga. El artículo “Prediction of Particle Velocity Caused by Blasting for an
Infrastructure Excavation Covering Granite Bedrock” (A. Kahriman, en Mineral Resources Engineering, 2001:205-218) presenta datos de PPV, la distancia escalada (que es igual a la dividida entre la raíz cuadrada de la carga), y la cantidad de carga.
La tabla siguiente presenta los valores de PPV, la distancia escalada y la cantidad de carga para 15 explosiones. (Algunos de
estos datos se presentaron en el ejercicio 4 de la sección 7.4.)
PPV (mm/s)
Distancia escalada
(m/kg0:5)
Cantidad de
carga (kg)
1.4
15.7
2.54
1.14
0.889
1.65
1.4
26.8
1.02
4.57
6.6
1.02
3.94
1.4
1.4
47.33
9.6
15.8
24.3
23
12.7
39.3
8
29.94
10.9
8.63
28.64
18.21
33
34
4.2
92
40
48.7
95.7
67.7
13
70
13.5
41
108.8
27.43
59.1
11.5
175
a) Ajuste el modelo ln PPV ⫽ β0 ⫹ β1 ln Distancia escalada ⫹ β2 ln Carga ⫹ ε. Calcule el P-valor para probar H0 : βi ⫽ 0
respecto de β0, β1 y β2.
Selección de modelos
8.3
605
b) El artículo afirma que es apropiado el modelo ln PPV ⫽ β0 ⫹ β1 ln Distancia escalada ⫹ ε. Ajuste este modelo. Calcule el
P-valor para probar H0 : βi ⫽ 0 respecto de β0, β1 y β2.
c) ¿Qué modelo prefiere usted? ¿Por qué?
13. El artículo “Ultimate Load Analysis of Plate Reinforced Concrete Beams” (N. Subedi y P. Baglin, en Engineering Structures.
2001:1068-1079) presenta fuerzas finales teóricas y medidas (en kN) para una muestra de vigas de concreto reforzado con acero. Los resultados se presentan en la tabla siguiente (se han eliminado dos datos atípicos).
Sea y la fuerza medida, x la fuerza teórica y t la fuerza verdadera, que no se conoce. Suponga que y ⫽ t ⫹ ε, donde ε es el
error de medición. Está poco claro si t está relacionada con x mediante un modelo lineal t ⫽ β0 ⫹ β1x o por un modelo cuadrático t ⫽ β0 ⫹ β1x ⫹ β2x2.
Teórica
Medida
Teórica
Medida
991
785
1195
1021
1285
1167
1519
1314
1743
791
1118
902
1373
1196
1609
1413
1668
1491
1952
844
1516
1071
1480
1622
2032
2032
660
565
738
682
1550
1167
1609
1756
2119
2237
640
530
893
775
a) Ajuste el modelo lineal y ⫽ β0 ⫹ β1x ⫹ ε. Respecto de cada coeficiente, encuentre el P-valor para la hipótesis nula de que
el coeficiente es igual a 0.
b) Ajuste el modelo lineal y ⫽ β0 ⫹ β1x ⫹ β2x2 ⫹ ε. Respecto de cada coeficiente, encuentre el P-valor para la hipótesis nula de que el coeficiente es igual a 0.
c) Grafique los residuos contra los valores ajustados para el modelo lineal.
d) Grafique los residuos contra los valores ajustados para el modelo cuadrático.
e) Con base en los resultados de los incisos a) al d), ¿qué modelo parece más adecuado? Explique.
f ) Utilizando el modelo más adecuado, calcule la fuerza verdadera si la fuerza teórica es 1 500.
g) Utilizando el modelo más adecuado, encuentre un intervalo de confianza de 95% para la fuerza verdadera si la fuerza teórica es 1 500.
14. El artículo “Permanent Deformation Characterization of Subgrade Soils from RLT Test” (A. Puppala, L. Mohammad y cols.,
en Journal of Materials in Civil Engineering, 1999:274-282) presenta mediciones de tensiones plásticas (en %) sobre suelos
para diferentes esfuerzos limitantes y de desviación en kPa. La tabla siguiente presenta las tensiones plásticas (y), los esfuerzos limitantes (x1) y el esfuerzo de desviación (x2) para pruebas sobre una tierra arenosa.
y
0.01
0.02
0.05
0.09
0.003
0.006
0.05
0.23
0.003
0.0008
x1
x2
21
21
21
21
35
35
35
35
70
70
21
35
52.5
70
35
70
105
140
35
70
y
0.01
0.07
0.002
0.0003
0.0009
0.01
0.001
0.0003
0.0005
0.03
x1
x2
70
70
105
105
105
105
140
140
140
140
140
210
70
105
140
210
70
105
210
280
606
Regresión múltiple
CAPÍTULO 8
a) Ajuste el modelo y ⫽ β0 ⫹ β1x1 ⫹ β2x2 ⫹ ε. Realice la gráfica de residuos contra valores ajustados. ¿Parece apropiado el
modelo?
b) Ajuste el modelo ln y ⫽ β0 ⫹ β1 ln x1 ⫹ β2 ln x2 ⫹ ε. Realice la gráfica de residuos contra valores ajustados. ¿Parece apropiado el modelo?
c) Utilice el más apropiado de los modelos de los incisos a) al b) para pronosticar y cuando x1 ⫽ 50 y x2 ⫽ 100.
d) ¿Se mejorará el modelo utilizado en el inciso c) al incluir un término de interacción? Explique.
15. El artículo “Vehicle-Arrival Characteristics at Urban Uncontrolled Intersections” (V. Rengaraju y V. Rao, en Journal of Transportation Engineering, 1995:317-323) presenta los datos sobre las características de tránsito en diez cruceros en Madrás, India. La siguiente tabla proporciona datos sobre el ancho del camino en m (x1), el volumen de tránsito de vehículos por carril
por hora (x2) y la velocidad media en km/h (x3).
y
x1
x2
y
x1
x2
35.0
37.5
26.5
33.0
22.5
76
88
76
80
65
370
475
507
654
917
26.5
27.5
28.0
23.5
24.5
75
92
90
86
80
842
723
923
1 039
1 120
a) Ajuste el modelo y ⫽ β0 ⫹ β1x1 ⫹ β2x2 ⫹ ε. Encuentre los P-valores para probar que los coeficientes sean iguales a 0.
b) Ajuste el modelo y ⫽ β0 ⫹ β1x1 ⫹ ε. Encuentre los P-valores para probar que los coeficientes sean iguales a 0.
c) Ajuste el modelo y ⫽ β0 ⫹ β1x2 ⫹ ε. Encuentre los P-valores para probar que los coeficientes sean iguales a 0.
d) ¿Cuál de los modelos del a) al c) considera el mejor? ¿Por qué?
16. La tabla siguiente presenta mediciones de la media de los niveles de ruido en dBA (y), el ancho de la avenida en m (x1) y media de la velocidad en km/h (x2) de diez ubicaciones en Bangkok, Tailandia, como se informa en el artículo “Modeling of Urban Area Stop-and-Go Traffic Noise” (P. Pamanikabud y C. Tharasawatipipat, en Journal of Transportation Engineering
1999:152-159).
y
x1
x2
y
x1
x2
78.1
78.1
79.6
81.0
78.7
6.0
10.0
12.0
6.0
6.5
30.61
36.55
36.22
38.73
29.07
78.1
78.6
78.5
78.4
79.6
12.0
6.5
6.5
9.0
6.5
28.26
30.28
30.25
29.03
33.17
Construya un buen modelo lineal para pronosticar la media de los niveles de ruido usando el ancho de la avenida, la media de
la velocidad, o ambos, como indicadores. Proporcione las desviaciones estándar de los coeficientes estimados y los P-valores
para probar que son diferentes de 0. Explique cómo escogió su modelo.
17. El artículo “Modeling Resilient Modulus and Temperature Correction for Saudi Roads” (H. Wahhab, I. Asi y R. Ramadhan, en
Journal of Materials in Civil Engineering, 2001:298-305) describe un estudio diseñado para pronosticar los módulos de resiliencia del pavimento a partir de las propiedades físicas. La tabla siguiente presenta datos para los módulos de resiliencia a
40°C en 106 kPa (y), el área de superficie del agregado en m2/kg (x1), y el punto de suavidad del asfalto en °C (x2).
Ejercicios adicionales para el capítulo 8
y
x1
x2
y
x1
x2
y
x1
x2
1.48
1.70
2.03
2.86
2.43
5.77
7.45
8.14
8.73
7.12
60.5
74.2
67.6
70.0
64.6
3.06
2.44
1.29
3.53
1.04
6.89
8.64
6.58
9.10
8.06
65.3
66.2
64.1
68.6
58.8
1.88
1.90
1.76
2.82
1.00
5.93
8.17
9.84
7.17
7.78
63.2
62.1
68.9
72.2
54.1
607
El modelo cuadrático completo es y ⫽ β0 ⫹ β1x1 ⫹ β2x2 ⫹ β3x1x2 ⫹ β4x 21 ⫹ β5x 22 ⫹ ε. ¿Qué submodelo de este modelo completo cree que es el más adecuado? Justifique su respuesta ajustando dos o más modelos y compare los resultados.
18. El artículo “Models for Assessing Hoisting Times of Tower Cranes” (A. Leung y C. Tam, en Journal of Construction Engineering and Management, 1999:385-391) presenta un modelo construido mediante un procedimiento de regresión stepwise para
pronosticar el tiempo necesario para la operación con poleas de una grúa de torre. Se consideraron veinte variables y el procedimiento stepwise eligió un modelo de nueve variables. El R2 ajustado para el modelo seleccionado fue 0.73. Verdadero o falso:
a) El valor 0.73 es una medida confiable de la bondad del ajuste del modelo seleccionado.
b) El valor 0.73 puede exagerar la bondad del ajuste del modelo.
c) Un procedimiento de regresión stepwise selecciona solamente variables de cierta utilidad para el pronóstico del valor de la
variable dependiente.
d ) Es posible que una variable que no se utiliza en el pronóstico del valor de una variable dependiente sea parte de un modelo seleccionado por un procedimiento de regresión stepwise.
Ejercicios adicionales para el capítulo 8
1. El artículo “Advances in Oxygen Equivalence Equations for Predicting the Properties of Titanium Welds” (D. Harwig, W. Ittiwattana y H. Castner, en The Welding Journal, 200l:126s-136s) describe un experimento para pronosticar diferentes propiedades de las soldaduras de titanio. Entre otras propiedades, se midió la elongación (en %), junto con los contenidos de oxígeno y
de nitrógeno (ambos en %). El siguiente resultado de MINITAB presenta los resultados del ajuste del modelo.
Elongación ⫽ β0 ⫹ β1 Oxígeno ⫹ β2 Nitrógeno ⫹ β3 Oxígeno ⋅ Nitrógeno
The regression equation is
Elongation = 46.80 – 130.11 Oxygen – 807.1 Nitrogen + 3580.5 Oxy*Nit
Predictor
Constant
Oxygen
Nitrogen
Oxy*Nit
S = 2.809
Coef
46.802
– 130.11
– 807.10
3580.5
SE Coef
3.702
20.467
158.03
958.05
R-Sq = 74.5%
T
12.64
– 6.36
– 5.107
3.737
P
0.000
0.000
0.000
0.001
R-Sq(adj) = 72.3%
608
CAPÍTULO 8
Regresión múltiple
Analysis of Variance
Source
Regression
Residual Error
Total
DF
3
35
38
SS
805.43
276.11
1081.54
MS
268.48
7.89
F
34.03
P
0.000
a) Pronostique la elongación para una soldadura con un contenido de oxígeno de 0.15% y otro de nitrógeno de 0.01%.
b) Si las dos soldaduras tienen un contenido de nitrógeno de 0.006%, y su contenido de oxígeno es diferente por 0.05%, ¿cuál
predeciría que sea su diferencia en la elongación?
c) Las dos soldaduras tienen contenidos de oxígeno idénticos, y contenidos de nitrógeno diferentes por 0.005%. ¿Ésta es información para pronosticar su diferencia en la elongación? Si es así, pronostique la elongación. Si no, explique qué información adicional se necesita.
2. En relación con el ejercicio 1.
a) Determine un intervalo de confianza de 95% para el coeficiente del oxígeno.
b) Determine un intervalo de confianza de 99% para el coeficiente de nitrógeno.
c) Determine un intervalo de confianza de 98% para el coeficiente del término de interacción del Oxígeno ⋅ Nitrógeno.
d) ¿Puede concluir que β1 ⬍ ⫺75? Encuentre el P-valor.
e) ¿Puede concluir que β2 ⬎ ⫺1 000? Encuentre el P-valor.
3. El siguiente resultado de MINITAB es para una regresión múltiple. Algunos de los números aparecieron borrosos y por lo tanto son ilegibles. Complete los números faltantes.
Predictor
Constant
X1
X2
S = (d)
Coef
(a)
1.8515
2.7241
SE Coef
0.3501
(b)
0.7124
R-Sq = 83.4%
T
0.59
2.31
(c)
P
0.568
0.040
0.002
R-Sq(adj) = 80.6%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
(e)
12
(i)
SS
(f)
17.28
104.09
MS
(g)
1.44
F
(h)
P
0.000
4. Una ingeniera prueba tres métodos diferentes para seleccionar un modelo lineal. Primero utiliza un método informal basado en
el estadístico F, como se describió en la sección 8.3. Después realiza la rutina de los mejores subconjuntos, y encuentra el modelo con el mejor ajuste R2 y otro con el mejor Cp de Mallows. Ello da como resultado que los tres métodos seleccionen el mismo modelo. La ingeniera dice que puesto que los tres métodos concuerdan, este modelo debe ser el mejor. Uno de sus colegas
dice que otros modelos podrían ser igualmente buenos. ¿Quién tiene razón? Explique.
5. En una simulación de 30 redes de computadoras móviles, se midieron la velocidad promedio, la pausa de tiempo y el número de
vecinas. Una “vecina” es una computadora dentro del rango de transmisión de otra. En la tabla siguiente se presentan los datos.
609
Ejercicios adicionales para el capítulo 8
Vecinas
10.17
8.46
10.20
7.93
10.17
7.44
10.19
7.30
10.18
7.19
Velocidad
Pausa
Vecinas
Velocidad
Pausa
5
5
10
10
20
20
30
30
40
40
0
30
0
30
0
30
0
30
0
30
9.36
8.30
8.86
7.73
8.24
7.30
7.91
7.14
7.72
7.05
5
5
10
10
20
20
30
30
40
40
10
40
10
40
10
40
10
40
10
40
Vecinas
8.92
8.00
8.28
7.56
7.78
7.21
7.45
7.08
7.32
6.99
Velocidad
Pausa
5
5
10
10
20
20
30
30
40
40
20
50
20
50
20
50
20
50
20
50
a) Ajuste el modelo con vecinas como la variable dependiente, y las variables independientes Velocidad, Pausa, Velocidad ⋅
Pausa, Velocidad2 y Pausa2.
b) Construya un modelo reducido para eliminar algunas variables cuyos P-valores son grandes, y pruebe la credibilidad del
modelo con una prueba F.
c) Realice la gráfica de residuos contra valores ajustados para el modelo reducido. ¿Existen algunos indicadores de que el modelo es inadecuado? Si es así, ¿cuáles son?
d) Alguien sugiere que un modelo que contenga Pausa y Pausa2 como las únicas variables dependientes es adecuado. ¿Está de
acuerdo? ¿Por qué sí o no?
e) Utilizando un mejor software para determinar los mejores subconjuntos, encuentre los dos modelos con el valor R2 más alto para cada tamaño de modelo de una a cinco variables. Calcule Cp y R2 ajustado para cada modelo.
f ) ¿Qué modelo se selecciona para Cp mínimo? ¿Para R2 ajustado? ¿Son los mismos?
6. Los datos en la tabla SE6 constan de las mediciones de producción de muchas operaciones de una reacción química. Las cantidades cambian con la temperatura en °C (x1), la concentración del reactivo fundamental en % (x2), y la duración de la reacción en horas (x3). La variable dependiente (y) es la fracción convertida al producto deseado.
a) Ajuste el modelo lineal y ⫽ β0 ⫹ β1x1 ⫹ β2x2 ⫹ β3x3 ⫹ ε.
b) De las dos variables en este modelo se tienen coeficientes significativamente diferentes de 0 al nivel 15%. Ajuste un modelo de regresión lineal que contenga estas dos variables.
c) Calcule el producto (interacción) de las dos variables que se mencionan en el inciso b). Ajuste el modelo que contiene las
dos variables junto con el término de interacción.
d) Con base en los resultados de los incisos a) al c), especifique un modelo que parezca bueno para pronosticar y a partir de
x1, x2 y x3.
e) ¿Podría ser posible construir un modelo igualmente bueno de otra manera?
610
CAPÍTULO 8
Regresión múltiple
TABLA SE6 Datos para el ejercicio 6
x1
x2
x3
y
x1
x2
x3
y
x1
x2
x3
y
50
90
70
70
60
70
60
70
80
70
70
70
60
60
70
70
60
60
60
60
70
80
60
70
60
50
50
80
70
60
19
38
28
25
26
29
23
28
34
26
26
26
30
26
25
31
27
23
23
24
31
32
26
28
24
21
17
34
27
24
4.0
8.0
6.5
5.5
6.5
5.0
5.5
5.5
6.5
4.5
8.0
8.0
5.0
7.0
7.5
5.5
7.5
6.0
6.0
9.0
5.5
6.0
10.0
4.5
4.0
7.0
2.0
8.5
5.5
2.5
27.464
49.303
37.461
36.478
33.776
35.092
31.307
37.863
41.109
28.605
35.917
33.489
31.381
38.067
31.278
32.172
36.109
31.535
33.875
37.637
40.263
36.694
45.620
38.571
19.163
31.962
23.147
40.278
32.725
28.735
70
80
50
50
80
50
80
60
60
60
60
70
70
60
60
70
60
60
60
60
60
60
80
80
60
70
60
60
60
70
27
32
26
22
34
21
34
22
24
23
29
27
32
25
26
28
22
22
27
25
23
27
31
36
22
28
26
25
24
32
10.0
6.5
9.0
4.0
6.5
10.0
7.5
2.5
5.0
4.0
6.5
7.5
4.0
5.5
3.5
7.5
5.5
4.5
7.0
6.0
6.5
7.5
4.5
4.5
7.5
4.5
7.0
7.0
5.0
7.5
38.241
34.635
44.963
30.012
41.077
41.964
44.152
29.901
26.706
28.602
33.401
41.324
24.000
38.158
25.412
37.671
27.979
31.079
30.778
28.221
30.495
38.710
27.581
38.705
40.525
29.420
37.898
40.340
27.891
38.259
70
60
50
60
70
70
50
70
60
70
70
70
50
60
60
60
60
60
60
50
60
60
60
70
60
60
60
60
60
70
31
23
19
22
30
25
17
28
25
25
29
29
19
24
26
28
22
28
25
20
26
25
29
30
26
24
25
24
24
26
6.0
7.0
6.0
7.5
9.5
8.0
9.5
7.0
5.5
5.5
5.0
6.5
4.5
6.5
7.5
6.0
6.5
7.5
4.0
8.5
9.5
4.0
4.0
6.0
8.0
6.5
6.0
5.5
5.0
8.0
35.091
34.372
26.481
36.739
36.185
38.725
32.707
32.563
36.006
33.127
32.941
33.650
34.192
24.115
37.614
29.612
39.106
36.974
28.334
33.767
38.358
33.381
37.672
36.615
39.351
38.611
36.460
23.449
23.027
31.372
7. En un estudio para pronosticar la temperatura de la presión atmosférica en un dispositivo pistón-cilindro, se hicieron 19 mediciones de la temperatura en °F (y) y de la presión del aire en psi (x). Se ajustaron tres modelos: el modelo lineal y ⫽ β0 ⫹ β1x
⫹ ε, el cuadrático y ⫽ β0 ⫹ β1x ⫹ β2x2 ⫹ ε, y el cúbico y ⫽ β0 ⫹ β1x ⫹ β2x2 ⫹ β3x3 ⫹ ε. En la tabla siguiente se presentan
los residuos y los valores ajustados para cada modelo. Realice una gráfica de los residuos contra los valores ajustados para cada modelo. Para cada uno de éstos establezca si es adecuado y explique.
611
Ejercicios adicionales para el capítulo 8
Modelo lineal
Modelo cuadrático
Modelo cúbico
Residuo
Ajuste
Residuo
Ajuste
Residuo
−56.2
−34.0
8.4
21.4
28.6
46.9
47.2
8.5
−7.1
−47.1
−1.6
38.0
35.7
34.1
34.6
1.0
−23.2
−50.7
−72.9
125.6
153.1
179.8
207.2
234.7
260.9
288.1
314.4
342.0
139.3
166.2
220.9
247.8
275.1
301.1
328.2
355.3
368.4
382.1
11.2
−7.4
4.9
−3.6
−8.2
8.1
15.7
−7.0
4.0
−1.3
9.1
5.9
−3.2
−2.1
9.9
−2.4
4.1
−5.0
−5.7
58.2
126.5
183.4
232.2
271.5
299.7
319.6
329.8
330.9
93.6
155.5
253.0
286.7
311.3
325.8
331.6
327.9
322.7
314.9
3.3
−6.7
9.2
0.9
−5.9
7.3
12.1
−11.7
1.0
−4.1
12.1
9.5
−2.4
−4.5
5.5
−6.7
3.5
−2.1
2.1
Ajuste
66.1
125.7
179.0
227.8
269.2
300.5
323.2
334.6
333.9
96.4
152.5
249.4
286.0
313.7
330.2
335.9
328.5
319.9
307.1
8. El voltaje de salida (y) de una batería se mide en un rango de temperaturas (x) desde 0°C hasta 50°C. La siguiente tabla representa un diagrama de dispersión del voltaje contra la temperatura, con tres curvas ajustadas sobrepuestas. Las curvas son el modelo lineal y ⫽ β0 ⫹ β1x ⫹ ε, el cuadrático y ⫽ β0 ⫹ β1x ⫽ β2x2 ⫹ ε, y el cúbico, y ⫽ β0 ⫹ β1x ⫹ β2x2 ⫹ β3x3 ⫹ ε. Con base
en la gráfica, ¿cuál de los modelos se debe utilizar para describir los datos? Explique.
i) El modelo lineal.
ii) El modelo cuadrático.
iii) El modelo cúbico.
iv) Todos parecen ser igualmente buenos.
115
Voltaje de salida (V)
110
105
100
95
90
85
0
10
20
30
Temperatura (°C)
40
50
612
CAPÍTULO 8
Regresión múltiple
9. En relación con el ejercicio 2 de la sección 8.2.
a) Utilizando cada uno de los tres modelos, pronostique la emisión de NOx cuando Velocidad ⫽ 1 500, Momento de torsión
⫽ 400 y HP ⫽ 150.
b) Utilizando cada uno de los tres modelos, pronostique la emisión de NOx cuando Velocidad ⫽ 1 600, Momento de torsión
⫽ 300 y HP ⫽ 100.
c) Utilizando cada uno de los tres modelos, pronostique la emisión de NOx cuando Velocidad ⫽ 1 400, Momento de torsión
⫽ 200, y HP ⫽ 75.
d) ¿Cuál(es) modelo(s) parece(n) ser el(los) mejor(es)? Elija una de las respuestas y explique.
i)
El modelo con Velocidad y Momento de torsión como variables independientes es el mejor.
ii) El modelo con Velocidad y HP como variables independientes es el mejor.
iii) El modelo con Velocidad, Momento de torsión y HP como variables independientes es el mejor.
iv) El modelo con Velocidad y Momento de torsión y el modelo con Velocidad y HP son casi igualmente buenos; ambos
son mejores que el modelo con Velocidad, Momento de torsión y HP.
v) El modelo con Velocidad y Momento de torsión y el modelo con Velocidad, Momento de torsión y HP son casi igualmente buenos; ambos son mejores que el modelo con Velocidad y HP.
vi) El modelo con Velocidad y HP y el modelo con Velocidad, Momento de torsión y HP son casi igualmente buenos; ambos son mejores que el modelo con Velocidad y Momento de torsión.
vii) Todos los modelos son casi igualmente buenos.
10. Este ejercicio ilustra una razón para las excepciones a la regla de la parsimonia (véase la p. 584).
a) Un científico ajusta el modelo Y ⫽ β1C ⫹ ε, donde C representa la temperatura en °C y Y pueden representar cualquier resultado. Observe que el modelo no tiene intercepto. Ahora convierta °C a °F (C ⫽ 0.556F ⫺ 17.78). ¿Ahora el modelo tiene intercepto?
b) Otro científico ajusta el modelo Y ⫽ β0 ⫹ β2C2, donde C y Y son como en el inciso a). Observe que el modelo tiene un término numérico cuadrático, pero ningún término lineal. Convierta °C a °F (C ⫽ 0.556F ⫺ 17.78). ¿Ahora el modelo tiene
un término lineal?
c) Suponga que x y z son dos unidades diferentes que se pueden utilizar para medir la misma cantidad, y que z ⫽ a ⫹ bx, donde a ≠ 0. (°C y °F son un ejemplo.) Muestre que los modelos sin intercepto y ⫽ βx y y ⫽ βz no pueden ser correctos, por
lo que la validez de que no tengan intercepto depende del punto cero de las unidades para la variable independiente.
d ) Sea x y z como en el inciso c). Muestre que los modelos y ⫽ β0 ⫹ β2x2 y y ⫽ β0 ⫹ β2z2 no pueden ser correctos, y, por tanto, la validez del modelo depende del punto cero para las unidades de la variable independiente.
11. Los datos que se presentan en la tabla siguiente dan la fuerza de tensión en psi (y) del papel como función de los porcentajes
de contenido de madera dura (x).
Contenido de
madera dura
Fuerza
de tensión
Contenido de
madera dura
Fuerza
de tensión
1.0
1.5
2.0
3.0
4.0
4.5
5.0
5.5
6.0
6.5
26.8
29.5
36.6
37.8
38.2
41.5
44.8
44.7
48.5
50.1
7.0
8.0
9.0
10.0
11.0
12.0
13.0
14.0
15.0
16.0
52.1
56.1
63.1
62.0
62.5
58.0
52.9
38.2
32.9
21.9
613
Ejercicios adicionales para el capítulo 8
a) Ajuste modelos polinomiales de grados 1, 2, etcétera, para pronosticar la fuerza de tensión a partir del contenido de madera dura. Por cada uno, utilice la prueba F para comparar con el grado del modelo menos uno. Pare cuando el P-valor de la
prueba F sea mayor de 0.05. ¿Cuál es el grado del modelo polinomial elegido por este método?
b) Utilizando el modelo del inciso a), estime la concentración de madera dura que produce la fuerza de tensión más alta.
12. El artículo “Enthalpies and Entropies of Transfer of Electrolytes and Ions from Water to Mixed Aqueous Organic Solvents” (G.
Hefter, Y. Marcus y W. Waghorne, en Chemical Reviews, 2002:2773-2836) presenta mediciones de entropía y cambios de entalpía para muchas sales bajo diferentes condiciones. La tabla siguiente presenta los resultados para las transferencias de entropía (en J/K ⋅ mol) de agua a agua ⫹ metanol de NaCl (sal de mesa) en un rango de concentraciones de metanol:
Concentración (%)
5
10
20
30
40
50
60
70
80
90
100
Entropía
1
−1
−7
−17
−28
−39
−52
−65
−80
−98
−121
a) Ajuste modelos polinomiales de grados 1, 2 y 3 para pronosticar la entropía (y) a partir de la concentración (x).
b) ¿Qué grado del polinomio es el más adecuado? Explique.
c) Utilizando el modelo más adecuado, determine los intervalos de confianza de 99% para los coeficientes.
13. Una compañía de pintura recopila datos acerca de la durabilidad de su pintura y de sus competidores. Midieron los tiempos de
vida de tres muestras de cada tipo de pintura en algunas ciudades estadounidenses. Los resultados se consignan en la tabla SEI3.
TABLA SE13 Datos para el ejercicio 13
Temperatura
promedio (◦ F)
Ciudad
Atlanta, GA
Boston, MA
Kansas City, KS
Minneapolis, MN
Dallas, TX
Denver, CO
Miami, FL
Phoenix, AZ
San Francisco, CA
Seattle, WA
Washington, DC
Media anual
Tiempo de vida (años)
Enero Julio Precipitación (pulg.) Pintura del patrocinador Pintura de la competencia
41.9
29.6
28.4
11.2
45.0
29.5
67.1
52.3
48.5
40.6
35.2
78.6
73.5
80.9
73.1
86.3
73.3
82.4
92.3
62.2
65.3
78.9
48.6
43.8
29.3
26.4
34.2
15.3
57.5
7.1
19.7
38.9
39.0
11.5
11.7
12.3
10.5
11.2
15.2
8.7
11.1
16.7
14.2
12.6
10.7
10.1
13.4
9.9
10.6
14.2
7.9
11.8
17.2
14.1
11.5
12.3
12.5
12.8
11.2
12.0
13.8
9.4
12.4
15.9
13.6
12.0
10.8
10.7
11.8
10.4
10.6
13.4
8.1
10.9
15.8
12.6
11.9
11.1
11.6
12.2
9.6
10.1
14.4
8.6
10.1
15.4
13.6
10.9
10.2
11.0
11.3
9.2
11.4
13.2
7.6
9.9
14.9
14.1
11.4
614
CAPÍTULO 8
Regresión múltiple
a) La prueba previa sugiere que los factores más importantes que influyen en la vida de las capas de pintura son la temperatura mínima (estimado por el promedio de la temperatura de enero), la temperatura máxima (estimado por el promedio de
la temperatura de julio) y la precipitación anual. Utilizando estas variables, y productos y potencias de estas variables, construya un buen modelo para predecir el tiempo de vida de la pintura del patrocinador y un buen modelo (quizás diferente)
para pronosticar el tiempo de vida de la pintura del competidor.
b) Utilizando los modelos desarrollados en el inciso a), calcule los tiempos de vida esperados para estas dos pinturas para alguien que vive en Cheyenne, Wyoming, donde la temperatura promedio de enero es 26.1°F; la de julio, 68.9°F, y la media
de la precipitación anual, 13.3 pulg.
14. El artículo “Two Different Approaches for RDC Modelling When Simulating a Solvent Deasphalting Plant” (J. Aparicio, M.
Heronimo y cols., Computers and Chemical Engineering, 2002:1369-1377) notifica la razón de flujo (en dm3/h) y las mediciones de peso específico para una muestra de hidrocarburos parafínicos. Los logaritmos naturales de las tasas de flujo (y) y de las
mediciones del peso específico (x) se presentan en la tabla siguiente.
y
x
−1.204
−0.580
0.049
0.673
1.311
1.959
2.614
3.270
0.8139
0.8171
0.8202
0.8233
0.8264
0.8294
0.8323
0.8352
a) Ajuste al modelo lineal y ⫽ β0 ⫹ β1x ⫹ ε. Para cada coeficiente pruebe la hipótesis de que el coeficiente es igual a 0.
b) Ajuste al modelo cuadrático y ⫽ β0 ⫹ β1x ⫹ β2x2 ⫹ ε. Para cada coeficiente pruebe la hipótesis de que el coeficiente es
igual a 0.
c) Ajuste el modelo cúbico y ⫽ β0 ⫹ β1x ⫹ β2x2 ⫹ β3x3 ⫹ ε. Para cada coeficiente pruebe la hipótesis de que el coeficiente
es igual a 0.
d) ¿Cuál de los modelos en los incisos a) a c) es más adecuado? Explique.
e) Mediante el modelo más adecuado, estime la razón de flujo cuando el peso específico sea 0.83.
15. El artículo “Measurements of the Thermal Conductivity and Thermal Diffusivity of Polymer Melts with the Short-Hot-Wire
Method” (X. Zhang, W. Hendro y cols., en International Journal of Thermophysics, 2002:1077-1090) describe mediciones de
conductividad térmica (en W ⋅ m⫺1 ⋅ K⫺1) y la difusividad de algunos polímeros a diferentes temperaturas (en 1 000°C). La siguiente tabla presenta los resultados para la conductividad térmica de policarbonato.
Conductividad Temperatura Conductividad Temperatura Conductividad Temperatura Conductividad Temperatura
0.236
0.241
0.244
0.251
0.028
0.038
0.061
0.083
0.259
0.257
0.257
0.261
0.107
0.119
0.130
0.146
0.254
0.256
0.251
0.249
0.159
0.169
0.181
0.204
0.249
0.230
0.230
0.228
0.215
0.225
0.237
0.248
a) Denotando la conductividad por y y la temperatura por x, ajuste el modelo lineal y ⫽ β0 ⫹ β1x ⫹ ε. Para cada coeficiente
pruebe la hipótesis de que el coeficiente es igual a 0.
b) Ajuste el modelo cuadrático y ⫽ β0 ⫹ β1x ⫹ β2x2 ⫹ ε. Para cada coeficiente pruebe la hipótesis de que el coeficiente es
igual a 0.
Ejercicios adicionales para el capítulo 8
615
c) Ajuste el modelo cúbico y ⫽ β0 ⫹ β1x ⫹ β2x2 ⫹ β3x3 ⫹ ε. Para cada coeficiente pruebe la hipótesis de que el coeficiente
es igual a 0.
d) Ajuste el modelo cuártico y ⫽ β0 ⫹ β1x ⫹ β2x2 ⫹ β3x3 ⫹ β4x4 ⫹ ε. Para cada coeficiente pruebe la hipótesis de que el coeficiente es igual a 0.
e) ¿Cuál de los modelos de los incisos a) al d) es más adecuado? Explique.
f ) Utilizando el modelo más adecuado, calcule la conductividad a una temperatura de 120°C.
16. El artículo “Electrical Impedance Variation with Water Saturation in Rock” (Q. Su, Q. Feng y Z. Shang, en Geophysics,
2000:68-75) informa mediciones de permeabilidades (en 10⫺3 µm2), porosidades (en %), y área superficial por unidad de volumen del espacio del poro (en 104 cm⫺1) para algunas muestras de roca. Los resultados se presentan en la tabla siguiente, denotando ln Permeabilidad por y, la porosidad por x1, y el área superficial por unidad de volumen por x2.
y
−0.27
2.58
3.18
1.70
−1.17
−0.27
−0.53
−0.29
4.94
1.94
3.74
x1
19.83
17.93
21.27
18.67
7.98
10.16
17.86
13.48
17.49
14.18
23.88
x2
9.55
10.97
31.02
28.12
52.35
32.82
57.66
21.10
9.15
11.72
5.43
y
0.58
−0.56
−0.49
−0.01
−1.71
−0.12
−0.92
2.18
4.46
2.11
−0.04
x1
10.52
18.92
18.55
13.72
9.12
14.39
11.38
16.59
16.77
18.55
18.02
x2
20.03
13.10
12.78
40.28
53.67
26.75
75.62
9.95
7.88
88.10
10.95
a) Ajuste el modelo y ⫽ β0 ⫹ β1x1 ⫹ β2x2 ⫹ β3x1x2 ⫹ ε. Calcule la tabla de análisis de varianza.
b) Ajuste el modelo y ⫽ β0 ⫹ β1x1 ⫹ β2x2 ⫹ ε. Calcule la tabla de análisis de varianza.
c) Ajuste el modelo y ⫽ β0 ⫹ β1x1 ⫹ ε. Calcule la tabla de análisis de varianza.
d) Calcule los estadísticos F para comparar los modelos en los incisos b) y c) con el modelo del inciso a). ¿Qué modelo prefiere usted? ¿Por qué?
17. El artículo “Groundwater Electromagnetic Imaging in Complex Geological and Topographical Regions: A Case Study of a Tectonic Boundary in the French Alps” (S. Houtot, P. Tarits y cols., Geophysics, 2002:1048-1060) presenta mediciones de concentraciones de algunos químicos (en mmol/L) y la conductividad eléctrica (en 10⫺2 S/m) para varias muestras de agua en diferentes
ubicaciones cerca del Lago Gittaz, en los Alpes franceses. En la tabla siguiente se presentan los resultados para el magnesio y
el calcio. Se han eliminado dos datos atípicos.
Conductividad
2.77
3.03
3.09
3.29
3.37
0.88
0.77
0.97
Magnesio
Calcio
0.037
0.041
0.215
0.166
0.100
0.031
0.012
0.017
1.342
1.500
1.332
1.609
1.627
0.382
0.364
0.467
Conductividad
1.10
1.11
2.57
3.27
2.28
3.32
3.93
4.26
Magnesio
Calcio
0.027
0.039
0.168
0.172
0.044
0.069
0.188
0.211
0.487
0.497
1.093
1.480
1.093
1.754
1.974
2.103
616
CAPÍTULO 8
Regresión múltiple
a) Pronostique la conductividad (y) de las concentraciones de magnesio (x1) y del calcio (x2), ajuste al modelo cuadrático completo y ⫽ β0 ⫹ β1x1 ⫹ β2x2 ⫹ β3x 21 ⫹ β4x 22 ⫹ β5x1x2 ⫹ ε. Calcule la tabla de análisis de varianza.
b) Utilice la prueba F para investigar algunos submodelos del modelo cuadrático completo. Establezca qué modelo prefiere y
por qué.
c) Utilice la rutina de mejores subconjuntos para encontrar los submodelos con el máximo R2 ajustado y el mínimo Cp de Mallows. ¿Son el mismo modelo? Comente sobre lo adecuado de este(estos) modelo(s).
18. El artículo “Low-Temperature Heat Capacity and Thermodynamic Properties of 1,1,l-trifluoro-2,2-dichloroethane” (R. Varushchenko y A. Druzhinina, en Fluid Phase Equilibria, 2002:109-119) presenta mediciones de la capacidad calorífica molar (y)
de 1,1,1-trifluoro-2,2-dicloroetano (en J ⋅ K⫺1 ⋅ mol⫺1) a diferentes temperaturas (x) en unidades de 10 K. Los resultados para
cada décima medición se presentan en la tabla siguiente.
y
x
y
5.7037
16.707
29.717
41.005
48.822
55.334
1.044
1.687
2.531
3.604
4.669
5.722
60.732
65.042
71.283
75.822
80.029
x
6.765
7.798
9.241
10.214
11.266
a) Ajuste al modelo lineal simple y ⫽ β0 ⫹ β1x ⫹ ε. Realice una gráfica de residuos y el comentario sobre lo adecuado del
modelo.
b) Ajuste al modelo lineal simple y ⫽ β0 ⫹ β1 ln x ⫹ ε. Realice una gráfica de residuos y comente sobre lo adecuado del modelo.
c) Calcule los coeficientes y sus desviaciones estándar para polinomios de grados 2, 3, 4 y 5. Realice gráficas de residuos para cada uno.
d) El artículo citado al principio de este ejercicio recomienda el modelo cuártico y ⫽ β0 ⫹ β1x ⫹ β2x2 ⫹ β3x3 ⫹ β4x4 ⫹ ε. ¿Le
parece razonable? ¿Por qué sí o no?
19. El artículo “Lead Dissolution from Lead Smelter Slags Using Magnesium Chloride Solutions” (A. Xenidis, T. Lillis y I. Hallikia) analiza una investigación de las tasas de filtración de plomo en soluciones de cloruro de magnesio. Los datos en la tabla
siguiente (leídos de una gráfica) presentan el porcentaje de plomo que se ha extraído en diferentes tiempos (en minutos).
Tiempo (t)
4
8 16 30 60 120
Porcentaje extraído (y) 1.2 1.6 2.3 2.8 3.6 4.4
a) El artículo sugiere ajustar estos datos a un modelo cuadrático y ⫽ β0 ⫹ β1t ⫹ β2t2 ⫹ ε. Ajuste este modelo y calcule las
desviaciones estándar de los coeficientes.
b) La tasa reacción al tiempo t está dada por la derivada dy/dt ⫽ β1 ⫹ 2β2t. Calcule el tiempo en que la tasa de reacción será
igual a 0.05.
c) La tasa de reacción en t ⫽ 0 es igual a β1. Determine un intervalo de confianza de 95% para la tasa de reacción en t ⫽ 0.
d) ¿Puede concluir que la tasa de reacción está disminuyendo con el tiempo? Explique.
20. El artículo “The Ball-on-Three-Ball Test for Tensile Strength: Refined Methodology and Results for Three Hohokam Ceramic
Types” (M. Beck, en American Antiquity, 2002:558-569) describe la resistencia de las cerámicas antiguas. La tabla siguiente
presenta pesos medidos (en g), espesores (en mm), y las cargas (en kg) requeridas para agrietar un ejemplar de una colección
de ejemplares fechados entre 1100 y 1300 que provienen del río Middle Gila, en Arizona.
Ejercicios adicionales para el capítulo 8
Peso (x 1)
Espesor (x2)
Carga (y)
12.7
12.9
17.8
18.5
13.4
15.2
13.2
18.3
16.2
14.7
18.2
14.8
17.7
16.0
17.2
14.1
16.1
5.69
5.05
6.53
6.51
5.92
5.88
4.09
6.14
5.73
5.47
7.32
4.91
6.72
5.85
6.18
5.13
5.71
20
16
20
36
27
35
15
18
24
21
30
20
24
23
21
13
21
617
a) Ajuste al modelo y ⫽ β0 ⫹ β1x1 ⫹ β2x2 ⫹ε.
b) Elimine la variable cuyo coeficiente tiene el mayor P-valor, y repita el ajuste.
c) Realice la gráfica de residuos contra valores ajustados del modelo en el inciso b). ¿Hay señales de que el modelo es inadecuado?
21. El modelo lineal de partes en pasos: Sea ⬃
x una constante conocida, y suponga que una variable dependiente y está relacionada con una variable independiente x1, como se muestra a continuación:
y=
β0 + β1 x1 + ε
β0∗ + β1∗ x1 + ε
si x1 ≤ x
si x1 > x
x . Defina una
x o x1 ⬎ ⬃
En otras palabras, y y x1 están relacionados linealmente, pero son adecuadas diferentes rectas si x1 ⱕ ⬃
nueva variable independiente x2 por
x2 =
0
1
si x1 ≤ x
si x1 > x
También defina β2 ⫽ β*0 ⫺ β0 y β3 ⫽ β*1 ⫺ β1. Determine un modelo de regresión múltiple que implique a y, x1, x2, β0, β1, β2
y β3 que exprese la relación descrita aquí.
22. El artículo “Seismic Hazard in Greece Based on Different Strong Ground Motion Parameters” (S. Koutrakis, G. Karakaisis y
cols., en Journal of Earthquake Engineering, 2002:75-109) presenta un estudio de episodios sísmicos en Grecia durante 19781997. Es de interés la duración de los “fuertes movimientos de tierra”, que es el tiempo en que la aceleración de la tierra excede un valor específico. En cada episodio las mediciones de la duración de temblores fuertes de tierra se hicieron en una o más
ubicaciones. La tabla SE22 de la página 618 presenta cada uno de 121 temblores medidos, los datos con el tiempo de duración
y (en segundos) durante los cuales la aceleración de la tierra excedió el doble de la aceleración de la gravedad. La magnitud m
del sismo, la distancia d (en km) de la medición desde el epicentro, y los dos indicadores del tipo de suelo s1 y s2, definidos de
la siguiente manera: s1 ⫽ 1 si el suelo consta de depósitos aluviales blandos, s1 ⫽ 0 de otra manera, y s2 ⫽ 1 si el suelo consta de rocas terciarias o más viejas, s2 ⫽ 0 de otra manera. Los casos donde tanto s1 ⫽ 0 como s2 ⫽ 0 corresponden a condiciones intermedias del suelo. El artículo presenta mediciones repetidas en algunas ubicaciones que no se incluyen aquí.
618
CAPÍTULO 8
Regresión múltiple
TABLA SE22 Datos para el ejercicio 22
y
8.82
4.08
15.90
6.04
0.15
5.06
0.01
4.13
0.02
2.14
4.41
17.19
5.14
0.05
20.00
12.04
0.87
0.62
8.10
1.30
11.92
3.93
2.00
0.43
14.22
0.06
1.48
3.27
6.36
0.18
0.31
1.90
0.29
6.26
3.44
2.32
1.49
2.85
0.01
9.34
10.47
m
d
s1
s2
y
m
d
s1
s2
y
m
d
s1
s2
6.4
5.2
6.9
5.8
4.9
6.2
6.6
5.1
5.3
4.5
5.2
5.9
5.5
4.9
5.8
6.1
5.0
4.8
5.4
5.8
5.6
5.7
5.4
5.4
6.5
6.5
5.2
5.1
5.2
5.0
4.5
4.7
4.7
6.3
5.4
5.4
5.0
5.4
6.4
6.6
6.6
30
7
105
15
16
75
119
10
22
12
17
9
10
14
16
31
65
11
12
34
5
65
27
31
20
72
27
12
14
19
12
12
5
9
4
5
4
1
86
116
117
1
0
1
0
1
1
0
1
0
0
0
0
1
1
1
0
1
1
1
1
0
1
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
1
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
1
0
4.31
28.27
17.94
3.60
7.98
16.23
3.67
6.44
10.45
8.32
5.43
4.78
2.82
3.51
13.92
3.96
6.91
5.63
0.10
5.10
16.52
19.84
1.65
1.75
6.37
2.78
2.14
0.92
3.18
1.20
4.37
1.02
0.71
4.27
3.25
0.90
0.37
21.07
0.04
15.30
5.3
6.6
6.9
5.4
5.3
6.2
6.6
5.2
5.3
5.5
5.2
5.5
5.5
5.7
5.8
6.1
5.4
5.3
5.2
4.8
5.5
5.7
5.4
5.4
6.5
4.9
5.2
5.2
4.8
5.0
4.7
5.0
4.8
6.3
5.4
4.7
5.0
6.4
6.4
6.6
6
31
33
6
12
13
85
21
11
22
49
1
20
22
34
44
16
6
21
16
15
50
27
30
90
8
22
29
15
19
5
14
4
9
4
4
4
78
105
82
0
1
0
0
1
0
1
0
0
1
0
0
0
0
1
0
0
1
1
1
1
1
1
0
1
0
0
0
0
0
0
0
1
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
1
0
1
0
1
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
1
1
0
1
1
1
1
5.74
5.13
3.20
7.29
0.02
7.03
2.17
4.27
2.25
3.10
6.18
4.56
0.94
2.85
4.21
1.93
1.56
5.03
0.51
13.14
8.16
10.04
0.79
0.02
0.10
5.43
0.81
0.73
11.18
2.54
1.55
0.01
0.21
0.04
0.01
1.19
2.66
7.47
30.45
12.78
5.6
6.9
5.1
5.2
6.2
5.4
5.1
5.2
4.8
5.5
5.2
5.5
5.0
4.6
4.7
5.7
5.0
5.1
4.9
5.6
5.5
5.1
5.4
5.4
6.5
5.2
4.6
5.2
5.0
4.5
4.7
4.5
4.8
4.5
4.5
4.7
5.4
6.4
6.6
6.6
15
128
13
19
68
10
45
18
14
15
13
1
6
21
20
39
44
2
14
5
12
28
35
32
61
9
9
22
8
6
13
17
5
3
1
3
1
104
51
65
0
1
0
1
1
0
0
1
0
0
0
0
0
1
1
1
1
1
1
1
1
1
0
1
0
0
0
0
0
0
0
0
0
1
1
1
1
0
1
1
0
0
0
0
0
0
1
0
1
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
1
0
1
0
0
0
0
0
0
0
Con los datos de la tabla SE22 construya un modelo lineal para pronosticar la duración y a partir de alguna o de todas las
variables m, d, s1 y s2. Asegúrese de considerar las transformaciones de las variables, así como las potencias de y las interacciones entre las variables independientes. Describa sus pasos para construir su modelo. Realice una gráfica de residuos contra
valores ajustados para comprobar que su modelo satisface los supuestos necesarios. Además, observe que los datos se presentan en orden cronológico, al leer hacia abajo en las columnas. Realice una gráfica para determinar si se debe incluir al tiempo
como una variable independiente.
Ejercicios adicionales para el capítulo 8
619
23. El artículo “Estimating Resource Requirements at Conceptual Design Stage Using Neural Networks” (A. Elazouni, I. Nosair y
cols., en Journal of Computing in Civil Engineering, 1997:217-223) sugiere que ciertos requerimientos de recursos en la construcción de silos de concreto se puede pronosticar a partir de un modelo. Éstos incluyen la cantidad de concreto en m3 (y), el
número de personas por días de trabajo (z), o el número de horas de la mezcladora de concreto (w) necesarios para un trabajo
dado. La tabla SE23A define 23 variables independientes potenciales que se pueden usar para pronosticar y, z o w. Los valores de las variables dependientes e independientes, reunidos en 28 trabajos de construcción, se presentan en las tablas SE23B
de la página 620 y de la tabla SE23C en la página 621. A menos que se establezca otra situación, las longitudes están en m, las
áreas en m2 y los volúmenes en m3.
a) Utilizando la regresión de los mejores subconjuntos, determine el mejor modelo para pronosticar y de acuerdo con el criterio de R2 ajustado.
b) Utilizando la regresión de los mejores subconjuntos, determine el mejor modelo para pronosticar y de acuerdo con el criterio del Cp mínimo de Mallows.
c) Determine un modelo para pronosticar y usar la regresión paso a paso. Explique el criterio que está usando para determinar qué variables agregar o eliminar del modelo.
d) Utilizando la regresión de los mejores subconjuntos, determine el mejor modelo para pronosticar z de acuerdo con el criterio del R2 ajustado.
e) Utilizando la regresión de los mejores subconjuntos, determine el mejor modelo para predecir z de acuerdo con el criterio
del Cp mínimo de Mallows.
f ) Determine un modelo para pronosticar z usando la regresión paso a paso. Explique el criterio que está usando para determinar qué variables agregar o eliminar del modelo.
g) Utilizando la regresión de los mejores subconjuntos, determine el mejor modelo para pronosticar w de acuerdo con el criterio del R2 ajustado.
h) Mediante la regresión de los mejores subconjuntos, determine el mejor modelo para pronosticar w de acuerdo con el criterio del Cp mínimo de Mallows.
i) Determine un modelo para pronosticar w utilizando la regresión paso a paso. Explique el criterio que está usando para determinar qué variables agregar o eliminar del modelo.
TABLA SE23A Descripción de las variables para el ejercicio 23
x1 Número de cubos
x13 Cociente amplitud-espesor
x2 Máximo concreto requerido por hora
x14 Perímetro del complejo
x3 Altura
x15 Capacidad de mezcla
x4 Razón de deslizamiento de la cimbra (m/día)
x16 Densidad de material almacenado
x5 Número de etapas de construcción
x17 Porcentaje de desechos para reforzar el acero
x6 Perímetro de la cimbra
x18 Porcentaje de desechos de concreto
x7 Volumen de complejo de silos
x19 Número de trabajadores en el equipo de concreto
x8 Área superficial de las paredes del silo
x20 Espesores de la pared (cm)
x9 Volumen de un cubo
x21 Número de trabajadores en los equipos que refuerzan el concreto
x10 Áreas de pared a piso
x22 Número de trabajadores que forman los equipos
x11 Número de gatos de elevación
x23 Cociente longitud-amplitud
x12 Cociente longitud-espesor
620
CAPÍTULO 8
Regresión múltiple
TABLA SE23B Datos para el ejercicio 23
y
z
w
x1
x2
x3
x4
1 850
932
556
217
199
56
64
397
1 926
724
711
1 818
619
375
214
300
771
189
494
389
441
768
797
261
524
1 262
839
1 003
9 520
4 272
3 296
1 088
2 587
1 560
1 534
2 660
11 020
3 090
2 860
9 900
2 626
2 060
1 600
1 820
3 328
1 456
4 160
1 520
1 760
3 040
3 180
1 131
1 904
5 070
7 080
3 500
476
268
206
68
199
120
118
133
551
103
143
396
202
103
80
140
256
91
320
95
110
152
159
87
119
169
354
175
33
24
18
9
2
2
2
14
42
15
25
28
12
12
12
6
30
12
27
6
6
12
9
3
6
15
9
9
4.5
3.5
2.7
3.2
1.0
0.5
0.5
3.0
3.5
7.8
5.0
4.8
3.0
5.8
3.5
2.1
3.0
4.0
3.3
4.1
4.0
5.0
5.0
3.0
4.4
7.0
5.2
5.7
19.8
22.3
20.3
11.0
23.8
16.6
18.4
16.0
16.0
15.0
16.0
22.0
18.0
15.0
15.0
14.0
14.0
17.0
20.0
19.0
22.0
24.0
25.0
17.5
18.8
24.6
25.5
27.7
4.0
4.0
5.0
4.5
5.0
5.0
5.0
4.0
4.0
3.5
3.5
4.0
5.0
3.5
4.5
5.0
5.0
4.5
4.5
4.0
5.0
4.0
4.0
4.0
4.0
3.5
4.0
4.0
x5
4
2
2
1
1
1
1
1
4
1
1
3
1
1
1
1
3
1
3
1
1
1
1
1
1
1
1
1
x6
x7
x8
x9
x10
x11
223
206
130
152
79
43
43
240
280
374
315
230
163
316
193
118
165
214
178
158
154
275
216
116
190
385
249
246
11 072
2 615
2 500
1 270
1 370
275
330
5 200
15 500
4 500
2 100
13 500
1 400
4 200
1 300
800
2 800
2 400
6 750
2 506
2 568
5 376
4 514
1 568
3 291
8 970
5 845
6 095
14 751
8 875
5 321
1 675
7 260
1 980
825
18 525
3 821
5 600
6 851
13 860
2 935
4 743
2 988
1 657
2 318
3 644
3 568
3 011
3 396
6 619
5 400
2 030
3 572
9 490
6 364
6 248
335
109
139
141
685
137
165
371
369
300
87
482
115
350
105
133
92
200
250
401
428
448
501
522
548
598
649
677
26.1
27.9
28.4
11.6
17.1
22.0
23.6
12.8
12.8
12.2
24.8
17.6
26.4
11.8
20.6
17.0
19.9
13.6
14.0
11.8
14.1
14.5
14.8
10.5
9.8
12.9
13.9
15.1
72
64
48
40
21
15
12
74
88
114
60
44
36
93
40
24
43
53
44
38
35
65
52
24
42
92
60
60
Ejercicios adicionales para el capítulo 8
621
TABLA SE23C Datos para el ejercicio 23
x12
x13
x14
x15
x16
x17
x18
x19
x20
x21
x22
x23
19.6
16.0
15.3
17.0
28.1
20.3
24.0
27.5
27.5
21.2
10.6
20.0
13.7
20.4
13.6
13.6
13.6
18.5
19.5
21.0
20.8
23.4
16.8
26.8
23.6
23.6
25.6
22.3
17.6
16.0
13.5
13.8
27.5
20.0
18.3
23.0
23.0
18.4
10.0
20.0
13.9
20.4
10.2
12.8
9.6
16.0
16.0
12.8
16.0
17.3
15.4
17.8
16.1
16.6
16.0
14.3
745
398
262
152
79
43
43
240
1121
374
315
630
163
316
193
118
424
214
472
158
154
275
216
116
190
385
249
246
0.50
0.25
0.25
0.25
0.15
0.15
0.15
0.25
0.25
0.75
0.50
0.50
0.25
0.50
0.50
0.25
0.25
0.50
0.25
0.50
0.50
0.50
0.50
0.25
0.50
0.75
0.50
0.50
800
600
850
800
800
600
600
600
800
800
800
800
600
800
800
800
800
600
600
800
800
600
800
850
850
800
600
800
6.00
7.00
7.00
5.00
7.50
5.00
5.05
6.00
8.00
5.00
6.00
7.00
6.00
6.50
5.00
5.00
5.00
6.00
6.50
5.50
7.00
7.50
8.00
6.50
6.50
8.00
8.00
8.50
5.50
5.00
4.50
4.00
3.50
4.00
4.25
4.00
4.00
3.50
4.00
5.00
4.50
3.50
3.50
3.75
3.75
4.00
4.50
3.50
4.00
5.50
5.50
3.00
4.50
6.50
5.50
6.00
10
10
8
8
5
5
5
8
10
10
10
10
8
10
10
8
8
8
10
6
8
8
8
6
5
15
12
8
24
20
20
25
20
15
15
20
20
25
25
25
18
25
25
25
25
20
20
25
36
22
28
25
28
25
25
28
7
6
5
6
4
1
2
7
9
12
11
9
11
6
4
6
6
4
3
8
8
11
12
5
9
16
13
16
20
20
18
16
14
12
12
22
24
24
20
18
18
14
14
14
14
14
14
14
14
16
16
14
16
20
16
16
1.12
1.00
1.13
1.23
1.02
1.02
1.31
1.20
1.20
1.15
1.06
1.00
1.20
1.00
1.33
1.06
1.42
1.15
1.20
1.30
1.35
1.40
1.10
1.50
1.45
1.43
1.60
1.55
24. El artículo que se cita en el ejercicio 23 presenta valores para las variables dependientes e independientes para diez trabajos de
construcción adicionales. Estos valores se presentan en las tablas SE24A y SE24B de la página 622.
a) Utilizando la ecuación construida en el inciso a) del ejercicio 23, pronostique la cantidad concreta (y) para cada uno de estos diez trabajos.
b) Denotando los valores pronosticados por ŷ1, . . . , ŷ10 y los valores observados por y1, . . . , y10, calcule las cantidades yi ⫺ ŷi.
Estos son los errores de predicción.
c) Calcule los valores ajustados ŷ1, . . . , ŷ28 a partir de los datos del ejercicio 23. Utilice los valores observados y1, . . . , y28 a
partir de esos datos, calcule los residuos yi ⫺ ŷi.
d) En general, ¿cuáles son más grandes, los residuos o los errores de predicción? ¿Por qué será cierto esto en general?
622
CAPÍTULO 8
Regresión múltiple
TABLA SE24A Datos para el ejercicio 24
y
z
w
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
x11
1 713
344
474
1 336
1 916
1 280
1 683
901
460
826
3 400
1 616
2 240
5 700
9 125
11 980
6 390
2 656
2 943
3 340
170
101
140
190
365
599
213
166
150
167
6
3
3
15
18
9
12
6
3
6
4.2
3.4
3.4
7.0
5.6
2.1
7.9
5.4
3.0
4.9
27.0
20.0
28.0
26.0
26.5
28.3
29.0
29.5
30.0
29.8
4.0
5.0
5.0
3.5
3.5
4.0
3.5
4.5
5.0
4.5
1
1
1
1
2
1
1
1
1
1
179
133
116
344
307
283
361
193
118
211
4 200
2 255
2 396
12 284
15 435
8 064
11 364
5 592
2 943
6 000
4 980
2 672
3 259
9 864
8 140
8 156
10 486
5 696
3 540
6 293
700.0
751.5
798.8
818.9
852.5
896.0
947.0
932.0
981.0
1 000.0
15.1
16.7
17.0
16.0
12.4
14.0
13.4
14.8
17.2
15.1
42
30
24
86
68
68
87
39
26
50
TABLA SE24B Datos para el ejercicio 24
x12
x13
x14
x15
x16
x17
22.5
32.0
24.6
20.2
30.0
25.3
22.7
20.5
26.0
32.0
14.8
18.8
15.0
21.1
13.2
14.3
14.0
16.0
20.1
20.0
179
133
116
344
540
283
361
193
118
211
0.50
0.25
0.25
0.75
0.50
0.25
0.75
0.50
0.25
0.50
850
800
800
850
600
800
800
850
600
600
8.0
7.5
9.0
8.5
6.5
7.5
9.0
9.5
10.0
9.5
x18
x19
x20
x21
x22
x23
5.0
3.0
4.0
6.5
7.0
6.5
7.0
5.5
4.0
5.0
6
10
10
12
15
14
10
10
10
10
28
25
28
28
25
30
30
30
25
25
11
7
9
19
12
20
25
15
8
13
16
14
14
18
18
16
18
16
14
16
1.52
1.70
1.65
1.72
1.75
1.80
1.42
1.20
1.30
1.90
Capítulo
9
Experimentos
factoriales
Introducción
Los experimentos son esenciales para desarrollar y mejorar los métodos científicos y de ingeniería. Sólo mediante la experimentación se pueden comparar las diferentes variantes de un
método con el fin de comprobar cuál es el más efectivo. Para que sea útil, un experimento se
debe diseñar adecuadamente, y los datos que se obtienen de éste se deben analizar en forma
correcta. En este capítulo se analizan el diseño y el análisis de datos a partir de una clase de
experimentos conocidos como experimentos factoriales.
9.1
Experimentos de un solo factor
Se inicia con un ejemplo. El artículo “An Investigation of the CaCO3-CaF2-K2SiO3-SiO2-Fe
Flux System Using the Submerged Arc Welding Process on HSLA-l00 and AISI-1081 Steels”
(G. Fredrickson, tesis de maestría, Escuela de Minas de Colorado, 1992) describe un experimento en el que se prepararon flujos de soldadura con diferentes composiciones químicas. Se
hicieron varias soldaduras utilizando cada flujo sobre metal con base de acero AISI-1018. La
tabla 9.1 presenta los resultados de las mediciones de la dureza, en la escala de Brinell, de
cinco soldaduras que usan cada uno de los cuatro flujos.
TABLA 9.1 Dureza de Brinell de soldaduras que utilizan cuatro flujos diferentes
Flujo
Valores de la muestra
A
B
C
D
250 264 256 260 239
263 254 267 265 267
257 279 269 273 277
253 258 262 264 273
Media muestral Desviación estandar muestral
253.8
263.2
271.0
262.0
9.7570
5.4037
8.7178
7.4498
623
CAPÍTULO 9
Experimentos factoriales
La figura 9.1 presenta diagramas de puntos para las durezas que utilizan los cuatro flujos. Cada media muestral está marcada con una “X”. Es obvio que las medias muestrales difieren. En particular, las soldaduras que se hicieron con un flujo C tienen la media muestral
mayor y las que usan el flujo A tienen la más pequeña. Por supuesto, existe incertidumbre en
la media muestral, y la pregunta es si ésta difiere de la otra en una cantidad mayor que la que
se podría considerar para la incertidumbre de una sola cantidad. Otra manera de redactar la
pregunta es: ¿Se puede concluir que hay diferencias en las medias poblacionales entre los cuatro tipos de flujos?
290
Dureza (escala de Brinell)
624
280
270
260
250
240
230
A
B
Flujo
C
D
FIGURA 9.1 Diagramas de puntos para cada muestra en la tabla 9.1. Cada media muestral está marcada con una “X”. Las medias muestrales son un poco diferentes, pero los valores de muestra se traslapan considerablemente.
Éste es un ejemplo de un experimento factorial. En general, un experimento factorial
implica varias variables. Una de éstas es la variable respuesta, que en ocasiones se llama variable de salida o variable dependiente. Las otras se denominan factores. La pregunta indicada por un experimento factorial es si la variación de los niveles de los factores produce una
diferencia en la media de la variable respuesta. En el experimento descrito en la tabla 9.1, la
dureza es la respuesta, y hay un factor: tipo de flujo. Debido a que sólo hay un factor, éste es
un experimento de un solo factor. Hay cuatro valores diferentes para el factor tipo de flujo
en este experimento. Estos valores diferentes se denominan niveles del factor y también tratamientos. Por último, los objetos con los que se realizaron dichas mediciones se llaman unidades experimentales. Las unidades asignadas a un tratamiento dado se llaman réplicas. En
el experimento anterior, las soldaduras son las unidades experimentales, y hay cinco réplicas
para cada tratamiento.
En este experimento de soldaduras, las cuatro composiciones particulares del flujo las
eligió de manera intencional el experimentador, más que en forma aleatoria de una gran población de flujos. Se dice que este experimento sigue un modelo de efectos fijos. En algunos
experimentos, los tratamientos se eligen aleatoriamente de una población de tratamientos posibles. En este caso se dice que el experimento sigue un modelo de efectos aleatorios. Los
métodos de análisis para estos dos modelos son los mismos, aunque las conclusiones se pueden obtener a partir de sus diferencias. Se centrará la atención en los modelos de efectos fi-
9.1
Experimentos de un solo factor
625
jos. Posteriormente se analizarán algunas de las diferencias entre modelos de efectos fijos y
aleatorios.
Experimentos completamente aleatorios
En este experimento de soldaduras se produjeron 20 soldaduras, cinco con cada uno de los
cuatro flujos. Cada soldadura se produjo sobre una placa de base de acero diferente. Por tanto, para operar el experimentador tuvo que elegir, de un total de 20 placas de base, un grupo
de cinco soldaduras con flujo A, otro grupo de cinco con soldaduras con flujo B, y así sucesivamente. El mejor camino para asignar las placas base para los flujos es en forma aleatoria.
De este modo, el diseño experimental no favorecerá algún tratamiento sobre otro. Por ejemplo, el experimentador podría numerar las placas de la 1 a la 20, y luego generar un ordenamiento aleatorio de los enteros del 1 al 20. Las placas cuyos números corresponden a los
primeros cinco números de la lista se les asigna el flujo A, y así sucesivamente. Éste es un
ejemplo de un experimento completamente aleatorio.
Definición
Un experimento factorial en el cual las unidades experimentales son asignadas a los
tratamientos en forma aleatoria, con todas las asignaciones posibles siendo igualmente
probables, se llama experimento completamente aleatorio.
En muchas situaciones, en los resultados de un experimento puede incidir el orden en
que se tomaron las observaciones. Por ejemplo, el desempeño de una máquina para hacer mediciones podría cambiar con el tiempo, debido, por ejemplo, a un movimiento de calibración,
o a efectos de calentamiento. En casos como éstos, el procedimiento ideal es hacer observaciones en orden aleatorio. Esto último requiere cambiar de tratamiento a tratamiento conforme transcurren las observaciones, en lugar de hacer las que corresponden a un tratamiento
específico en forma consecutiva. En algunos casos los cambios en los tratamientos implican
tiempos o costos considerables, por lo que no es factible cambiar entre tratamientos. En situaciones de este tipo los tratamientos se deben realizar en un orden aleatorio, con todas las observaciones que corresponden al primer tratamiento elegido de forma aleatoria para que opere
primero, y así sucesivamente.
En un experimento completamente aleatorio, es adecuado considerar que cada tratamiento representa una población, y a las respuestas observadas para las unidades asignadas a
ese tratamiento como una muestra aleatoria simple de esa población. Por consiguiente, los datos del experimento constan de algunas muestras aleatorias, cada una proveniente de una población diferente. Las medias poblacionales se llaman medias del tratamiento. Las
preguntas de interés relacionadas con las medias de tratamiento son si son todas iguales, y si
no, cuáles son diferentes, qué tan grandes son las diferencias, etcétera.
Análisis de varianza de un sentido
La determinación formal respecto a si las medias del tratamiento son diferentes requiere una
prueba de hipótesis. Se inicia introduciendo la notación. Se tienen I muestras, cada una proveniente de un tratamiento diferente. Las medias del tratamiento se denotan por
m1, . . . , mI
626
CAPÍTULO 9
Experimentos factoriales
No es necesario que los tamaños de muestra sean iguales, aunque es deseable, como se analizará posteriormente en esta sección. Los tamaños de muestra se denotan por
J1, . . . , JI
El número total en todas las muestras combinadas se denota por N.
N ⫽ J1 ⫹ J2 ⫹ . . . ⫹ JI
Las hipótesis que se desea probar son
H0 : m1 ⫽ . . . ⫽ mI contra H1 : dos o más de las mi son diferentes
Si había solamente dos muestras, se podría utilizar la prueba t de dos muestras (sección 6.7)
para probar la hipótesis nula. Debido a que hay más de dos muestras, se utiliza un método conocido como análisis de varianza de un sentido (ANOVA, por sus siglas en inglés). Para definir el estadístico de prueba de un ANOVA, primero se desarrolla la notación para las
observaciones muestrales. Debido a que hay varias muestras, se usa un subíndice doble para
denotar las observaciones. Específicamente, sea Xij la j-ésima observación en la i-ésima mues–
tra. La media de la i-ésima muestra se denota por X i..
Ji
j =1 Xij
(9.1)
Xi. =
Ji
–
La gran media muestral, denotada por X .., es el promedio de todos los elementos que se
muestrean tomados en conjunto:
I Ji
j =1 Xij
i=1
X .. =
(9.2)
N
Con un poco de álgebra se puede demostrar que la gran media muestral también es un promedio ponderado de las medias de las muestras:
I
Ji Xi.
(9.3)
X .. = i=1
N
Ejemplo
9.1
–
–
Respecto a los datos en la tabla 9.1, determine I, J1, . . . , JI, N, X23, X 3., X ...
Solución
Hay cuatro muestras, por lo que I ⫽ 4. Cada muestra contiene cinco observaciones, así J1 ⫽
J2 ⫽ J3 ⫽ J4 ⫽ 5. El número total de observaciones es N ⫽ 20. La cantidad X23 es la tercera
–
observación en la segunda muestra, que es 267. La cantidad X 3. es la media muestral de la ter–
cera muestra. Este valor es X 3. ⫽ 271.0. Por último, con la ecuación (9.3) se calcula la gran
–
media muestral X ...
(5)(253.8) + (5)(263.2) + (5)(271.0) + (5)(262.0)
20
= 262.5
X.. =
9.1
Experimentos de un solo factor
627
La figura 9.2 presenta la idea detrás de un ANOVA de un sentido. La figura ilustra varias muestras hipotéticas provenientes de tratamientos diferentes, junto con sus medias muestrales y la gran media muestral. Éstas están dispersas alrededor de la gran media muestral. El
ANOVA de un sentido proporciona una manera de medir esta dispersión. Si aquéllas están
muy dispersas, entonces es probable que las medias del tratamiento sean diferentes, y no se
rechazará H0.
⫺
X1.
⫺
X..
⫺
X2.
⫺
X3.
⫺
X4.
FIGURA 9.2 La variación de las medias muestrales alrededor de la gran muestra puede
atribuirse tanto a la incertidumbre aleatoria como a las diferencias entre las medias del tratamiento. La variación dentro de una muestra particular alrededor de su propia media
muestral sólo es atribuible a la incertidumbre aleatoria.
La variación de las medias muestrales alrededor de la gran media muestral se mide por
una cantidad que se llama suma total de cuadrados del tratamiento (SSTr, por sus siglas en
inglés), que está dada por
SSTr =
I
i=1
Ji (X i. − X.. )2
(9.4)
Cada término en la SSTr implica la distancia de las medias muestrales a la gran media.
Observe que cada distancia al cuadrado está multiplicada por el tamaño de muestra que corresponde a su media muestral, por lo que las medias mayores para las muestras cuentan más.
La SSTr indica cómo son diferentes las medias del tratamiento entre sí. Si la SSTr es grande,
entonces las medias muestrales están muy dispersas, y es razonable concluir que las medias
del tratamiento son diferentes y se rechaza H0. Si, por otro lado, la SSTr es pequeña, entonces todas las medias muestrales son cercanas a la gran muestra y, por tanto, entre sí, por lo
que es creíble que las medias del tratamiento sean iguales.
Una fórmula equivalente para la SSTr, un poco más fácil de calcular a mano, es
SSTr =
I
i=1
2
Ji Xi. − N X..
2
(9.5)
Para determinar si la SSTr es suficientemente grande para rechazar H0, se compara con otra
suma de cuadrados, que se llama suma de los cuadrados del error (SSE, por sus siglas en
inglés). La SSE mide la diferencia en los puntos muestrales individuales alrededor de sus respectivas medias muestrales. Esta diferencia se mide al sumar los cuadrados de las distancias
de cada punto a su propia media muestral. La SSE está dada por
628
CAPÍTULO 9
Experimentos factoriales
SSE =
–
Ji
I
i=1 j =1
(Xij − Xi. )2
(9.6)
Las cantidades Xij ⫺ X i. se llaman residuos, por lo que la SSE representa la suma de los cuadrados de los residuos. La SSE, a diferencia de la SSTr, depende solamente de las distancias
de los puntos muestrales a partir de sus propias medias y no la afecta la ubicación de las medias del tratamiento con respecto a otra. Por tanto, la SSE sólo mide la variación aleatoria subyacente en el proceso que se está estudiando. Es análoga a la suma de los cuadrados del error
en la regresión.
Una fórmula equivalente para la SSE, que es un poco más fácil de calcular a mano, es
SSE =
Ji
I
Xij2
i=1 j =1
−
I
Ji Xi.
2
(9.7)
i=1
Otra fórmula equivalente para la SSE que se basa en las variancias muestrales. Sea s 2i la varianza muestral de la i-ésima muestra. Entonces
Ji
2
j =1 (Xij − X i. )
2
(9.8)
si =
Ji − 1
Por lo que de la ecuación (9.8) se tiene que
tituye en la ecuación (9.6) se obtiene
SSE =
Ejemplo
9.2
Ji
j =1 (Xij
I
i=1
− Xi. )2 = (Ji − 1)si2 . Cuando se sus-
(9.9)
(Ji − 1)si2
Para los datos en la tabla 9.1, calcule la SSTr y la SSE.
Solución
Las medias muestrales se presentan en la tabla 9.1. Éstas son
–
X 1. ⫽ 253.8
–
X 2. ⫽ 263.2
–
X 3. ⫽ 271.0
–
X 4. ⫽ 262.0
–
En el ejemplo 9.1 se calculó la gran media muestral de X .. ⫽ 262.5. Ahora se utiliza la ecuación (9.4) para calcular la SSTr:
SSTr ⫽ 5(253.8 ⫺ 262.5)2 ⫹ 5(263.2 ⫺ 262.5)2 ⫹ 5(271.0 ⫺ 262.5)2 ⫹ 5(262.0 ⫺ 262.5)2
⫽ 743.4
Para calcular a la SSE se utilizará la ecuación (9.9), ya que las desviaciones estándar muestrales si ya se han presentado en la tabla 9.1.
SSE ⫽ (5 ⫺ 1)(9.7570)2 ⫹ (5 ⫺ 1)(5.4037)2 ⫹ (5 ⫺ 1)(8.7178)2 ⫹ (5 ⫺ 1)(7.4498)2
⫽ 1 023.6
Se pueden utilizar la SSTr y la SSE para construir un estadístico de prueba, suponiendo que se satisfacen los siguientes dos supuestos.
9.1
Experimentos de un solo factor
629
Supuestos para el ANOVA de un sentido
Las pruebas de hipótesis usuales del ANOVA de un sentido son válidas en las condiciones siguientes:
1. Las poblaciones en tratamiento deben ser normales.
2. Las poblaciones en tratamiento deben tener todas la misma varianza, que se denota por s2.
Antes de presentar el estadístico de prueba se explicará cómo funciona. Si los dos supuestos para el ANOVA de un sentido se satisfacen aproximadamente, se pueden calcular las
medias de la SSE y de la SSTr. La media de la SSTr depende de si H0 es verdadera, porque
la SSTr tiende a ser más pequeña cuando H0 es verdadera y mayor cuando H0 es falsa. La media de la SSTr satisface la condición
mSSTr ⫽ (I ⫺ 1)s2
mSSTr ⬎ (I ⫺ 1)s2
cuando H0 es verdadera
cuando H0 es falsa
(9.10)
(9.11)
El tamaño probable de la SSE, y por tanto, su media, no depende de que H0 sea verdadera. La
media de la SSE está dada por
mSSE ⫽ (N ⫺ I)s2
si H0 es o no verdadera
(9.12)
Las deducciones de las ecuaciones (9.10) y (9.12) se presentan al final de esta sección.
Las cantidades I ⫺ 1 y N ⫺ I son los grados de libertad para la SSTr y la SSE, respectivamente. Cuando una suma de cuadrados se divide entre sus grados de libertad, la cantidad obtenida se llama media cuadrática. La media cuadrática de tratamiento se denota
por MSTr, y la media cuadrática del error se denota por MSE. Se definen por
MSTr =
SSTr
I −1
De las ecuaciones (9.10) a la (9.13) se tiene que
mMSTr ⫽ s2
mMSTr ⬎ s2
mMSE ⫽ s2
MSE =
SSE
N −I
cuando H0 es verdadera
cuando H0 es falsa
si H0 es o no verdadera
(9.13)
(9.14)
(9.15)
(9.16)
Las ecuaciones (9.14) y (9.16) muestran que cuando H0 es verdadera, la MSTr y la MSE
tienen la misma media. Por tanto, cuando H0 es verdadera, se esperaría que su cociente esté
cerca de l. Este cociente es, en efecto, el estadístico de prueba. Éste para probar H0 : m1 ⫽ . . .
⫽ mI es
MSTr
F =
(9.17)
MSE
Cuando H0 es verdadera, el numerador y el denominador de F son, en promedio, del mismo
tamaño, por lo que F tiende a estar cerca de l. En efecto, cuando H0 verdadera, su estadístico
de prueba tiene una distribución F con I ⫺ 1 y N ⫺ I grados de libertad, que se denota por
FI ⫺ 1, N ⫺ I. Cuando H0 es falsa, la MSTr tiende a ser mayor, pero la MSE no, por lo que F tiende ser mayor que 1.
630
CAPÍTULO 9
Experimentos factoriales
Resumen
La prueba F para el ANOVA de un sentido
Para probar H0 : m1 ⫽ . . . ⫽ mI contra H0 : dos o más de las mi son diferentes:
1. Calcule SSTr =
2. Calcule SSE =
=
I
i=1
Ji (Xi. − X.. )2 =
Ji
I
i=1 j =1
I
i=1
I
(Xij − Xi. )2 =
i=1
2
2
Ji Xi. − N X.. .
Ji
I
i=1 j =1
Xij2 −
I
Ji Xi.
2
i=1
(Ji − 1)si2 .
SSTr
SSE
y MSE =
.
I −1
N −I
MSTr
4. Calcule el estadístico de prueba: F =
.
MSE
5. Encuentre el P-valor consultando la tabla F (tabla A.7 en el Apéndice A) con I ⫺ 1
y N ⫺ I grados de libertad.
3. Calcule MSTr =
Ahora se aplica el método de análisis de varianza al ejemplo con el que se introdujo esta sección.
Ejemplo
9.3
Para los datos en la tabla 9.1, calcule la MSTr, la MSE y F. Determine el P-valor para probar
la hipótesis nula de que todas las medias son iguales. ¿Qué concluye?
Solución
Del ejemplo 9.2, SSTr ⫽ 743.4 y SSE ⫽ 1 023.6. Se tienen I ⫽ 4 muestras y N ⫽ 20 observaciones en todas las muestras tomadas en conjunto. Utilizando la ecuación (9.13),
MSTr =
743.4
= 247.8
4−1
MSE =
El valor del estadístico de prueba F es, por tanto,
F =
1023.6
= 63.975
20 − 4
247.8
= 3.8734
63.975
Para encontrar el P-valor se consulta la tabla F (tabla A.7). Los grados de libertad son 4 ⫺ 1
⫽ 3 para el numerador y 20 ⫺ 4 ⫽ 16 para el denominador. Bajo H0, F tiene una distribución
F3, 16. Observando la tabla F debajo de 3 y 16 grados de libertad, se encuentra que el punto
superior al 5% es 3.24, y que el punto superior al 1% es 5.29. Por tanto, el P-valor se encuentra entre 0.01 y 0.05 (véase la figura 9.3; un paquete de software da un valor exacto de 0.029
con dos dígitos significativos). Es razonable concluir que las medias poblacionales no son todas iguales, y, por consiguiente, la composición del flujo afecta la dureza.
9.1
631
Experimentos de un solo factor
5%
1%
0
3.24 3.87
5.29
FIGURA 9.3 El valor observado del estadístico de prueba es 3.87. El punto superior al 5%
de la distribución F3, 16 es 3.24. El punto superior al 1% de la distribución F3, 16 es 5.29.
Por tanto, el P-valor se encuentra entre 0.01 y 0.05. Un paquete de software da un valor de
0.029.
Intervalos de confianza para medias de tratamiento
Las observaciones sobre el i-ésimo tratamiento se supone que son una muestra aleatoria simple de una población normal con media mi y varianza s2. Para construir un intervalo de confianza para mi, el primer paso es estimar la varianza poblacional s2. Una manera de hacer esto
último sería utilizar la varianza muestral s 2i de las observaciones en el i-ésimo tratamiento. Sin
embargo, debido a que se supone que todas las observaciones para todos los tratamientos tienen la misma varianza, es mejor combinar todas las variancias muestrales en una estimación
“combinada”. Con este propósito, observe que la SSE es una suma ponderada de las variancias muestrales (ecuación 9.9) y la MSE es el promedio ponderado (ecuación 9.13). Por tan–
to, la cantidad MSE es la estimación combinada de la varianza s2. Puesto que X i. es la media
–
2
muestral de Ji observaciones, la varianza de X i. es s /Ji, estimada con MSE/Ji. El número de
grados de libertad para la MSE es N ⫺ I. La cantidad
Xi. − µi
√
MSE/Ji
tiene una distribución t de Student con N ⫺ I grados de libertad. Por tanto, se puede construir
un intervalo de confianza para mi con el método descrito en la sección 5.3.
Un intervalo de confianza de nivel 100(1 ⫺ α) para mi está dado por
MSE
Xi. ± tN −I, α/2
Ji
Ejemplo
9.4
(9.18)
Determine un intervalo de confianza del 95% para la media de la dureza de soldaduras producidas con el flujo A.
Solución
–
De la tabla 9.1, X 1. ⫽ 253.8. El valor de la MSE se calculó en el ejemplo 9.3 de 63.975. Hay
I ⫽ 4 tratamientos, J1 ⫽ 5 observaciones para el flujo A, y N ⫽ 20 observaciones en conjunto. De la tabla t de Student se obtiene t16, .025 ⫽ 2.120. Por tanto, el intervalo de confianza del
95% es
632
CAPÍTULO 9
Experimentos factoriales
253.8 ± 2.120
63.975
= 253.8 ± 7.6
5
La tabla ANOVA
Los resultados de un análisis de varianza generalmente se resumen en una tabla de análisis de
varianza (ANOVA). Esta tabla es muy parecida a la que se obtiene en la regresión múltiple.
El siguiente resultado de MINITAB muestra el análisis de varianza para los datos de soldaduras que se presentan en la tabla 9.1.
One-way ANOVA: A, B, C, D
Source
Factor
Error
Total
DF
3
16
19
S = 7.998
Level
A
B
C
D
N
5
5
5
5
SS
743.40
1023.60
1767.00
R-Sq = 42.07%
Mean
253.80
263.20
271.00
262.00
StDev
9.76
5.40
8.72
7.45
MS
247.800
63.975
F
3.87
P
0.029
R-Sq(adj) = 31.21%
Individual 95% CIs For Mean Based on
Pooled StDev
----+---------+---------+---------+----(-------∗------)
(------∗-------)
(-------∗-------)
(-------∗-------)
----+---------+---------+---------+----250
260
270
280
Pooled StDev = 8.00
En la tabla ANOVA, la columna “DF” presenta el número de grados de libertad tanto
para el tratamiento (“Factor”) como para la suma de los cuadrados del error (“Error”). La columna “SS” presenta la SSTr (en el renglón “Factor”) y la SSE (en el renglón “Error”). El renglón “Total” contiene la suma total de los cuadrados, que es la suma de SSTr y SSE. La
columna “MS” presenta las medias cuadráticas MSTr y MSE. La columna “F” presenta el estadístico F para probar la hipótesis nula de que todas las medias poblacionales son iguales.
Por último, la columna “P” representa el P-valor para la prueba F. Debajo de la tabla ANOVA, el valor “S” es la estimación combinada de la desviación estándar del error s, que se calcula al tomar la raíz cuadrada de la MSE. La cantidad “R-sq” es R2, el coeficiente de
determinación, que es igual al cociente SSTr/TSS. Esto es análogo al caso de la regresión
múltiple (véase la ecuación 8.9 de la sección 8.1). El valor “R-Sq(adj)” es el R2 ajustado, igual
9.1
Experimentos de un solo factor
633
a R2 ⫺ [(I ⫺ 1)/(N ⫺ I)](1 ⫺ R2 ), nuevamente análogo a la regresión múltiple. Las cantidades R2 y R2 ajustadas no son muy utilizadas en el análisis de varianza como en la regresión
múltiple. Por último, se presentan las medias muestrales y las desviaciones estándar para cada grupo de tratamiento, junto con una gráfica que muestra un intervalo de confianza del 95%
para cada media de tratamiento.
Ejemplo
9.5
En el artículo “Review of Development and Application of CRSTER and MPTER Models”
(R. Wilson, Atmospheric Environment, 1993:41-57) se presentan varias mediciones de las
concentraciones máximas por hora (en µg/m3) de SO2 para cada una de las cuatro plantas de
energía. Los resultados son los siguientes (se han eliminados dos datos atípicos):
Planta 1:
Planta 2:
Planta 3:
Planta 4:
438
857
925
893
619
732 638
1 014 1 153 883
786 1 179 786
891
917 695
1 053
675
595
El siguiente resultado de MINITAB presenta resultados para un ANOVA de un sentido. ¿Puede concluir que las máximas concentraciones por hora difieren entre las plantas?
One-way ANOVA: Plant 1, Plant 2, Plant 3, Plant 4
Source
Plant
Error
Total
DF
3
15
18
S = 142.6
Level
1
2
3
4
N
4
5
4
6
SS
378610
304838
683449
MS
126203
20323
R-Sq = 55.40%
Mean
606.8
992.0
919.0
777.7
StDev
122.9
122.7
185.3
138.8
Pooled StDev = 142.6
F
6.21
P
0.006
R-Sq(adj) = 46.48%
Individual 95% CIs For Mean Based on
Pooled StDev
-------+---------+---------+---------+-(------∗-------)
(------∗-----)
(-------∗-------)
(-----∗-----)
-------+---------+---------+---------+-600
800
1000
1200
634
CAPÍTULO 9
Experimentos factoriales
Solución
En la tabla ANOVA el P-valor para la hipótesis nula es que todas las medias de tratamiento
son iguales a 0.006. Por tanto, se concluye que no todas las medias de tratamiento son iguales.
Comprobación de supuestos
Como se mencionó antes, los métodos de análisis de varianza requieren los supuestos que las
observaciones sobre cada tratamiento sean una muestra proveniente de una población normal
y que todas las poblaciones normales tengan la misma varianza. Una buena manera de comprobar el supuesto de normalidad es con una gráfica de probabilidad normal. Si los tamaños
muestrales son suficientemente grandes, se puede construir una gráfica distinta de probabilidad para cada muestra. Este caso rara vez se presenta en la práctica. Cuando los tamaños de
muestra no son lo suficientemente grandes para que las gráficas individuales de probabilidad
–
proporcionen información, los residuos Xij ⫺ X i., pueden graficarse todos en una sola gráfica.
Cuando se satisfacen los supuestos de normalidad y de varianza constante, estos residuos estarán distribuidos normalmente con media cero y se deberán graficar aproximadamente en
una línea recta. La figura 9.4 presenta una gráfica de probabilidad normal de los residuos para los datos de soldaduras de la tabla 9.1. No hay evidencias de una violación grave del supuesto de normalidad.
0.999
0.99
0.95
0.9
0.75
0.5
0.25
0.1
0.05
0.01
0.001
⫺15
⫺10
⫺5
0
5
10
FIGURA 9.4 Gráfica de probabilidad para los residuos de los datos de soldadura. No hay
evidencias de una violación grave del supuesto de normalidad.
El supuesto de variancias iguales puede ser difícil de comprobar, porque con sólo algunas pocas observaciones en cada muestra, las desviaciones estándar muestrales pueden ser
muy diferentes (por un factor de 2 o más) incluso cuando vale el supuesto. Para los datos de
las soldaduras, las desviaciones estándar muestrales varían de 5.4037 a 9.7570. Es razonable
proseguir como si las variancias fueran iguales.
Las dispersiones de las observaciones dentro de varias muestras se pueden comprobar
visualmente haciendo una gráfica de residuos. Esto último se hace al realizar la gráfica de re–
–
siduos Xij ⫺ X i. contra los valores ajustados, que son las medias muestrales X i.. Si las disper-
9.1
Experimentos de un solo factor
635
siones difieren considerablemente entre las muestras, el supuesto de variancias iguales es sospechoso. Si una o más de las muestras contienen datos atípicos, el supuesto de normalidad
también es dudoso. La figura 9.5 presenta una gráfica de residuos para los datos de soldadura. No hay datos atípicos graves, y las dispersiones no son muy diferentes entre las muestras.
15
10
Residuo
5
0
⫺5
⫺10
⫺15
250
255
260
265
Valor ajustado
270
–
275
–
FIGURA 9.5 Gráfica de residuos de los valores Xij ⫺ X i. contra X i. para los datos de sol-
daduras. Las dispersiones no son muy diferentes de muestra a muestra, y no hay ningún
dato atípico grave.
Diseños balanceados contra no balanceados
Cuando se asignan números iguales de unidades a cada tratamiento, se dice que el diseño está balanceado. Aunque el análisis de varianza de un sentido se puede utilizar tanto con diseños balanceados como no balanceados, los primeros brindan una gran ventaja. Un diseño
balanceado es mucho menos sensible a las violaciones del supuesto de la igualdad de la varianza que uno no balanceado. Debido a que las desviaciones moderadas de este supuesto
pueden ser difíciles de detectar, es mejor utilizar un diseño balanceado siempre que sea posible, para que las violaciones no detectadas del supuesto no comprometan gravemente la validez de los resultados. Cuando es imposible obtener un diseño balanceado, es preferible un
diseño ligeramente desbalanceado a uno gravemente desbalanceado.
Resumen
Con un diseño balanceado el efecto de las variancias desiguales generalmente no
es grande.
Con un diseño desbalanceado el efecto de las variancias desiguales puede ser importante.
Entre más desbalanceado sea el diseño, mayor será el efecto de las variancias desiguales.
636
CAPÍTULO 9
Experimentos factoriales
La identidad del análisis de la varianza
Tanto en la regresión lineal como en el análisis de varianza, una cantidad que se llama la suma total de los cuadrados se obtiene al restar la gran media muestral de cada observación, elevando al cuadrado estas desviaciones, y después sumándolas. Una identidad del análisis de
varianza es una ecuación que expresa la suma total de cuadrados como una suma de las otras
sumas de los cuadrados. Se han presentado identidades del análisis de varianza para la regresión lineal simple (al final de la sección 7.2) y para la regresión múltiple (ecuación 8.7 en la
sección 8.1).
La suma total de los cuadrados para el ANOVA en un sentido está dada por
SST =
Ji
I
i=1 j =1
(Xij − X .. )2
(9.19)
2
(9.20)
Una fórmula equivalente está dada por
SST =
Ji
I
i=1 j =1
Xij2 − N X..
Al examinar las ecuaciones (9.5), (9.7) y (9.20) se encuentra que la suma total de los cuadrados es igual a la suma de los cuadrados del tratamiento más la suma de los cuadrados del error.
Esta es la identidad del análisis de varianza para el análisis de varianza de un sentido.
La identidad del análisis de varianza
SST SSTr SSE
(9.21)
Una parametrización alternativa
La presentación del análisis de varianza de un sentido, como un método para comparar varias
medias de tratamiento utilizando muestras aleatorias extraídas de cada población de tratamiento, es una manera natural de ver el tema. Existe otra manera de expresar estas mismas
ideas, con una notación algo diferente, que a veces es útil.
Para cada observación Xij , se define ij Xij mi, la diferencia entre la observación y
su media. Por analogía con la regresión lineal, las cantidades ij se llaman errores. Es cierto
que
Xij mi ij
(9.22)
Ahora, puesto que Xij está distribuido normalmente con media mi y varianza s2, se tiene que
ij está distribuido normalmente con media 0 y varianza s2.
En un experimento de un solo factor se tiene interés en determinar si las medias de tratamiento son todas iguales. Dando las medias del tratamiento m1, . . . , mI, la cantidad
I
1
µ=
µi
I i=1
(9.23)
9.1
637
Experimentos de un solo factor
representa el promedio de todas las medias del tratamiento. La cantidad µ se llama gran media de la población. El i-ésimo efecto del tratamiento, que se denota por αi, es la diferencia entre la media del i-ésimo tratamiento y la gran media de la población:
αi ⫽ mi ⫺ m
(9.24)
I
que se obtiene a partir de la definición de αi en la cual i=1 αi = 0.
Ahora se pueden descomponer las medias del tratamiento de la siguiente manera:
mi ⫽ m ⫺ αi
(9.25)
Combinando las ecuaciones (9.22) y (9.25) se obtiene el modelo del análisis de la varianza
de un sentido:
Xij ⫽ m ⫹ αi ij
(9.26)
La hipótesis nula H0 : m1 . . . mI es equivalente a H0 : a1 . . . aI 0.
En el ANOVA de un sentido es posible trabajar con las medias de tratamiento mi, como
se ha hecho, en lugar de con los efectos de tratamiento αi. Sin embargo, en los experimentos
de múltiples factores las medias de tratamiento en sí mismas no son suficientes y se deben
descomponer en una manera similar a la que se describió aquí. Lo anterior se analizará más
profundamente en la sección 9.3.
Potencia
Cuando se diseña un experimento factorial es importante que la prueba F tenga buena potencia; es decir, gran probabilidad de rechazar la hipótesis nula de la igualdad si en efecto todas
las medias de tratamiento no son iguales. Un experimento con potencia baja no es muy aconsejable, ya que es improbable detectar una diferencia en los tratamientos, aun si existiera una.
En lo que sigue, se supondrá que el experimento está balanceado y que los supuestos de normalidad y de igualdad de varianza valen. Suponga que el número de niveles se fija en I.
La potencia de cualquier prueba primero depende del criterio de rechazo: entre mayor
sea el nivel en el que se quiere rechazar, mayor es la potencia. El nivel de 5% es el que con
más frecuencia se utiliza en la práctica. En cuanto se establece el nivel de rechazo, la potencia
de la prueba F depende
de tres cantidades: 1) la dispersión de las medias verdaderas se mide
mediante la cantidad i αi2 donde αi es el efecto del i-ésimo tratamiento, 2) la desviación estándar del
error s y 3) el tamaño muestralJ. Observe que si la hipótesis nula es verdadera, entonces i αi2 0. Entre más grande es i αi2 , más se aleja de la verdadera hipótesis nula, y
mayor es la potencia, que es la probabilidad de que la hipótesis nula se rechace.
Un cálculo de potencia puede servir para cualquiera de dos propósitos: determinar el tamaño muestral para cada tratamiento necesario con el fin de obtener una potencia deseada, o
determinar qué potencia tiene con un
tamaño de muestra dado. En un cálculo de potencia tradicional, se especifica la cantidad i αi2 con la que se desea detectar y el valor de s que se
espera encontrar. Entonces se puede calcular la potencia para un tamaño de muestra dado, o
el tamaño de muestra necesario para obtener
una potencia específica. En la práctica, rara vez
se sabe cómo especificar un valor para i αi2 , pero se puede con frecuencia especificar el tamaño de una diferencia entre la mayor y la menor medias del tratamiento que se desea detectar. Por ejemplo, en el experimento de soldaduras, un metalúrgico es capaz de especificar que
una diferencia de 10 o más entre la mayor y menor medias
de tratamiento es científicamente
importante, pero es improbable que haga lo mismo para i αi2 .
638
CAPÍTULO 9
Experimentos factoriales
En MINITAB se puede especificar el tamaño de una diferencia científicamente importante entre las medias de tratamiento más grande y más pequeña y calcular el tamaño de
muestra necesario para garantizar que la potencia para detectar la diferencia será al menos una
cantidad específica. Se presenta un ejemplo.
Ejemplo
9.6
Un metalúrgico quiere repetir el experimento de soldaduras con cuatro flujos diferentes y
quiere que el diseño sea bastante sensible para que sea probable detectar una diferencia de 10
o más en la dureza de Brinell con un nivel de 5%. Supone que la desviación estándar del error
tiene aproximadamente el mismo valor de 7.998 calculado en el experimento que se ha estado estudiando. El siguiente resultado de MINITAB muestra un cálculo de potencia para un
experimento con cinco observaciones por tratamiento. ¿Cuál es la potencia? ¿Qué le recomendaría al metalúrgico con respecto a la utilidad de este experimento propuesto?
One-way ANOVA
Alpha = 0.05 Assumed standard deviation = 7.998
Number of Levels = 4
SS
Means
50
Sample
Size
5
Power
0.281722
Maximum
Difference
10
The sample size is for each level.
Solución
La potencia es 0.281772. Esto último significa que la probabilidad de que el experimento propuesto detectará una diferencia de 10 entre el mayor y el menor tratamientos no podría ser
mayor a 0.28. La recomendación adecuada es no operar este experimento; tiene muy poca
oportunidad de éxito. En su lugar, se debe calcular el tamaño de muestra necesario para proporcionar la potencia adecuada, y, si es factible, el tamaño que debe tener un experimento
operado.
Ejemplo
9.7
El metalúrgico del ejemplo 9.6 ha tomado su consejo y ha calculado el tamaño de muestra necesario para proporcionar una potencia de 0.90 y así detectar una diferencia de 10 con un nivel de 5%. En el siguiente resultado de MINITAB, ¿cuál es la potencia? ¿Cuántas
observaciones serán necesarias en cada nivel? ¿Cuántas observaciones se necesitarán en total?
9.1
Experimentos de un solo factor
639
One-way ANOVA
Alpha = 0.05 Assumed standard deviation = 7.998
Number of Levels = 4
SS
Means
50
Sample
Size
20
Target
Power
0.9
Actual Power
0.914048
Maximum
Difference
10
The sample size is for each level.
Solución
El tamaño muestral necesario es 20 por nivel; con cuatro niveles habrá 80 observaciones en
total. Observe que la potencia verdadera del experimento es aproximadamente 0.914, mayor
que la “potencia objetivo” de 0.90 que fue pedida. La razón para esto último es que la potencia proporcionada por un tamaño de muestra de 19 por nivel podía ser algo menor que 0.90;
un tamaño de muestra de 20 es el más pequeño que garantiza que proporciona una potencia
de 0.90 o más.
Modelos de efectos aleatorios
En muchos experimentos factoriales los tratamientos los elige deliberadamente el experimentador. Se dice que estos experimentos siguen un modelo de efectos fijos. En algunos casos,
los tratamientos se eligen en forma aleatoria de una población de tratamientos posibles. En
estos casos se dice que los experimentos siguen un modelo de efectos aleatorios. En un modelo de efectos fijos interesan los tratamientos específicos elegidos por el experimento. En un
modelo de efectos aleatorios, interesa toda la población de tratamientos posibles, y no sólo
los que se eligen para el experimento.
El artículo que describe el experimento de soldaduras establece que los tratamientos
fueron elegidos deliberadamente y no representa una muestra aleatoria proveniente de una población mayor de compuestos de flujo. Por tanto, este experimento sigue un modelo de efectos
fijos. Las cuatro centrales hidroeléctricas en el ejemplo 9.5 son una muestra de conveniencia;
son plantas en las que las mediciones estaban fácilmente disponibles. En algunos casos es
adecuado tratar una muestra de conveniencia como si hubiera una muestra aleatoria simple
(véase el análisis en la sección 1.1). Si estas condiciones valen, entonces se puede considerar
que el experimento de la central hidroeléctrica sigue un modelo de efectos aleatorios; de otra
forma, se debe tratar como un modelo de efectos fijo.
Hay una diferencia importante en la interpretación entre los resultados de un modelo de
efectos fijos y la de un modelo de efectos aleatorios. En el primer modelo las únicas conclusiones que se pueden obtener son acerca de los tratamientos empleados en realidad en el experimento. Sin embargo, en un modelo de efectos aleatorios, debido a que los tratamientos
son una muestra aleatoria simple de una población de tratamientos, se pueden obtener conclusiones con respecto a toda la población, incluyendo los tratamientos que no incluyen en
realidad en el experimento.
Esta diferencia en las interpretaciones genera una diferencia en las hipótesis nulas que
se prueban. En el modelo de efectos fijos la hipótesis nula de interés es H0 : m1 ⫽ . . . ⫽ mI.
En el modelo de efectos aleatorios la hipótesis nula de interés es
H0 : las medias del tratamiento son iguales para cada nivel en la población.
640
CAPÍTULO 9
Experimentos factoriales
En el modelo de efectos aleatorios se hace el supuesto de que la población de las medias del
tratamiento es normal.
Curiosamente, aunque la hipótesis nula para el modelo de efectos aleatorios difiere de
la del modelo de efectos fijo, la prueba de hipótesis es exactamente la misma. La prueba F
descrita antes se aplica para el modelo de efectos aleatorios y también para el modelo de efectos fijos.
Ejemplo
9.8
En el ejemplo 9.5, suponga que es razonable tratar las cuatro centrales hidroeléctricas como
una muestra aleatoria proveniente de una gran población de centrales hidroeléctricas; además,
suponga que las concentraciones de SO2 en la población de plantas están distribuidas normalmente. ¿Se puede concluir que hay diferencias en las concentraciones de SO2 entre las centrales hidroeléctricas en la población?
Solución
Éste es un modelo de efectos aleatorios, así que se puede aplicar la prueba F para probar la
hipótesis nula de que todas las medias del tratamiento en la población son las mismas. Los resultados de la prueba F se muestran en el ejemplo 9.5. El P-valor es 0.006. Por tanto, se rechaza la hipótesis nula y se concluye que hay diferencias en las medias de las concentraciones
de SO2 entre las centrales hidroeléctricas en la población.
Deducciones de las ecuaciones (9.10) y (9.12)
En lo que sigue será más fácil usar la notación E( ) para denotar la media de una cantidad V( ) para denotar la varianza. Por lo que, por ejemplo, E(SSE) ⫽ mSSE, E(SSTr) ⫽
mSSTr, y V(Xij) denota la varianza de
Xijj.
Se mostrará que E(SSE) = E[ Ii=1 Jj i=1 (Xij − Xi. )2 ] = (N −I )σ 2 , si las medias
de la población son o no iguales. Estal eshila iecuacióni (9.12).
(9 12)
Se
inicia
por
sumar
y
restar
la
media
de
tratamiento
mi de cada término en
I Ji
2 para obtener
(X
−
X
)
ij
i.
j =1
i=1
Ji
I
SSE =
[(Xij − µi ) − (Xi. − µi )]2
i=1 j =1
Desarrollando se obtiene
Ji
Ji
Ji
I
I
I
2
SSE =
(Xij − µi )2 −
(Xi. − µi )
2(Xij − µi )(Xi. − µi ) +
i=1 j =1
i=1 j =1
i=1 j =1
(9.27)
Ahora Jj i=1 (Xij − µi ) = Ji (Xi. − µi ). Sustituyéndolo en el término de en medio del lado derecho de la ecuación (9.27) se obtiene
Ji
Ji
I
I
I
2
2
2
SSE =
(Xij − µi ) − 2
(Xi. − µi )
Ji (Xi. − µi ) +
i=1 j =1
Puesto que
Ji
I
i=1 j =1
i=1 j =1
i=1
2
(X i. − µi ) =
I
i=1
2
Ji (X i. − µi ) , esto simplifica a,
9.1
SSE =
Ji
I
i=1 j =1
2
(Xij − μi ) −
Experimentos de un solo factor
I
i=1
2
641
(9.28)
Ji (Xi. − μi )
Tomando medias en ambos lados de la ecuación (9.28) se obtiene
E(SSE) =
–
Ji
I
i=1 j =1
E(Xij − μi )2 −
I
i=1
2
(9.29)
Ji E(Xi. − μi )
Ahora E(Xij) ⫽ E(X i.) ⫽ mi. Todas las variancias de la población son iguales; se denota su
valor común por s2. De lo que se tiene que
E(Xij − μi )2 = V (Xij ) = σ 2
σ2
2
E(Xi. − μi ) = V (X i. ) =
Ji
Sustituyendo en la ecuación (9.29) se obtiene
E(SSE) =
Ji
I
i=1 j =1
σ2 −
I
Ji σ 2
Ji
i=1
= N σ 2 − I σ 2 = (N − I )σ 2
(
)
Lo anterior termina la deducción de E(SSE).
Ahora se muestra que E(SSTr) = E[ Ii=1 Ji (Xi. − X.. )2 ] = (I − 1)σ 2 bajo el supuesto de que las medias del tratamiento son todas iguales a un valor común denotado por
µ. Esto es la ecuación (9.10).
y restar la media común del tratamiento µ de cada término en
I Se inicia por sumar
2
−
X
)
J
(X
para
obtener
i.
..
i=1 i
I
SSTr =
i=1
Ji [(Xi. − µ) − (X.. − µ)]2
Desarrollando, se obtiene
SSTr =
I
i=1
2
Ji (Xi. − µ) − 2
I
i=1
Ji (Xi. − µ)(X .. − µ) +
Ahora
X.. =
por lo que
X .. − µ =
y
I
i=1
I
Ji X i.
i=1
N
I
Ji (Xi. − µ)
i=1
N
Ji (X i. − µ) = N (X.. − µ)
I
i=1
Ji (X .. − µ)
2
(9.30)
642
CAPÍTULO 9
Experimentos factoriales
Sustituyendo en el término de en medio del lado derecho de (9.30), se obtiene
SSTr =
Puesto que
I
i=1
I
i=1
2
2
Ji (Xi. − μ) − 2N (X .. − μ) +
I
i=1
Ji (X.. − μ)
2
Ji = N, se obtiene
SSTr =
I
i=1
2
Ji (X i. − μ) − N (X .. − μ)
2
Tomando medias en ambos lados se obtiene
E(SSTr) =
–
I
i=1
2
Ji E(Xi. − μ) − N E(X.. − μ)
2
(9.31)
–
Ahora E(X i.) ⫽ E(X ..) ⫽ m, por lo que
2
E(Xi. − μ) = V (X i. ) =
2
E(X .. − μ) = V (X .. ) =
σ2
Ji
σ2
N
Sustituyendo en (9.31) se obtiene
E(SSTr) =
I
Ji σ 2
Ji
i=1
−
Nσ 2
= (I − 1)σ 2
N
Ejercicios para la sección 9.1
1. Uno de los factores que determina el grado del riesgo que un pesticida plantea a la salud humana es la tasa con la que lo absorbe la piel después del contacto. Una pregunta importante es si la cantidad en la piel aumenta con la duración del contacto,
o si sólo aumenta durante un tiempo corto antes de estabilizarse. Para investigar esto último se aplicaron cantidades medidas
de cierto pesticida a 20 muestras de piel de rata. Se analizaron cuatro pieles en cada uno de los intervalos de 1, 2, 4, 10 y 24
horas. Las cantidades de compuestos químicos (en µg) que estaban en la piel están dadas en la tabla siguiente.
Duración
1
2
4
10
24
Cantidades absorbidas
1.7
1.8
1.9
2.3
2.1
1.5
1.6
1.7
1.9
2.2
a) Construya una tabla ANOVA. Puede dar un rango para el P-valor.
b) ¿Puede concluir que la cantidad en la piel varía con el tiempo?
1.2
1.8
2.1
1.7
2.5
1.5
1.9
2.0
1.5
2.3
9.1
Experimentos de un solo factor
643
2. La fuerza producida de soldaduras de titanio CP se midió para soldaduras enfriadas en tasas de 10°C/s, 15°C/s y 28°C/s. Los
resultados se presentan en la tabla siguiente. (Basada en el artículo “Advances in Oxygen Equivalence Equations for Predicting
the Properties of Titanium Welds” D. Harwig, W. Ittiwattana, y H. Castner, en The Welding Journal, 2001:126s-136s.)
Razón de
enfriamiento
10
15
28
Producción de la fuerza
71.00 75.00 79.67 81.00 75.50 72.50 73.50 78.50 78.50
63.00 68.00 73.00 76.00 79.67 81.00
68.65 73.70 78.40 84.40 91.20 87.15 77.20 80.70 84.85 88.40
a) Construya una tabla ANOVA. Puede dar un rango para el P-valor.
b) ¿Puede concluir que la producción de la fuerza de soldaduras de titanio CP varía con la tasa de enfriamiento?
3. La eliminación de nitrógeno de amoniaco es un aspecto importante del tratamiento de filtraciones en basureros. Durante varios
días se registró la tasa de eliminación (en % por día) para cada uno de los diferentes métodos de tratamiento. Los resultados se
presentan en la tabla siguiente. (Basado en el artículo “Removal of Ammoniacal Nitrogen from Landfill Leachate by Irrigation
onto Vegetated Treatment Planes”, S. Tyrrel, P. Leeds-Harrison y K. Harrison, en Water Research, 2002:291-299.)
Tratamiento
A
B
C
D
E
Tasa de eliminación
5.21
5.59
6.24
6.85
4.04
4.65
2.69
5.94
9.18
3.29
7.57 5.16
6.41
4.94
4.52 3.75
a) Construya una tabla ANOVA. Puede dar un rango para el P-valor.
b) ¿Puede concluir que los métodos de tratamiento difieren en sus tasas de eliminación?
4. En el artículo “Calibration of an FTIR Spectrometer” (P. Pankratz, Statistical Case Studies for Industrial and Process Improvement, SIAM-ASA, 1997:19-38) se usa un espectrómetro para hacer cinco mediciones del contenido de carbono (en ppmm)
de cierta placa de silicio en cuatro días consecutivos. Los resultados son:
Día
Día
Día
Día
1:
2:
3:
4:
358
373
336
368
390
376
360
359
380
413
370
351
372
367
368
349
366
368
352
343
a) Construya una tabla ANOVA. Puede dar un rango para el P-valor.
b) ¿Puede concluir que la calibración del espectrómetro es diferente entre los cuatro días?
5. El artículo “Quality of the Fire Clay Coal Bed, Southeastern Kentucky” (J. Hower, W. Andrews y cols., en Journal of Coal Quality, 1994:13-26)) contiene mediciones de muestras de carbón de varios lugares en Kentucky. Los datos en porcentaje de ceniza de TiO2 son los siguientes (se ha eliminado un dato atípico):
Buckeye Hollow:
Bear Branch:
Defeated Creek:
Turkey Creek:
0.96
2.10
0.91
1.30
1.20
0.86
2.19
1.42
1.39
1.60
0.94 0.91 0.70 1.28 1.19 1.04 1.42 0.82 0.89 1.45 1.66 1.68
2.54 2.23 2.20 1.44 1.70 1.53 1.84
2.58 1.49 1.49 2.07 1.87 1.39 1.02 0.91 0.82 0.67 1.34 1.51
1.32 1.24 1.08 2.33 1.81 1.76 1.25 0.81 0.95 1.92
a) Construya una tabla ANOVA. Puede dar un rango para el P-valor.
b) ¿Puede concluir que hay diferencias en contenido de TiO3 entre estos lugares?
644
CAPÍTULO 9
Experimentos factoriales
6. Los arqueólogos pueden determinar las dietas de las antiguas civilizaciones midiendo el cociente de carbono 13 entre carbono
12 en huesos encontrados en sitios de entierro. Las grandes cantidades de carbono 13 sugieren una dieta rica en hierbas como
maíz, mientras que las cantidades pequeñas sugieren una dieta basada de plantas herbáceas. El artículo “Climate and Diet in
Fremont Prehistory: Economic Variability and Abandonment of Maize Agriculture in the Great Salt Lake Basin” (J. Coltrain y
S. Leavitt, en American Antiquity, 2002:453-485) informa cocientes, como una diferencia de un patrón en unidades de partes
por mil, para huesos de personas en varios grupos de edades. Los datos se presentan en la tabla siguiente.
Grupo de edades (años)
0-11
12-24
25-45
46+
Cociente
17.2
14.8
18.4
19.2
15.5
18.4
17.6
13.0
15.4
18.2
17.9
18.3
14.8
13.2
12.7
16.6 19.0 18.3 13.6 13.5 18.5 19.1 19.1 13.4
17.2 10.0 11.3 10.2 17.0 18.9 19.2
18.4 12.8 17.6 18.8 17.9 18.5 17.5 18.3 15.2 10.8 19.8 17.3
15.1 18.2 18.0 14.4 10.2 16.7
a) Construya una tabla ANOVA. Puede dar un rango para el P-valor.
b) ¿Puede concluir que los coeficientes de concentración son diferentes entre los grupos de edades?
7. Un experimento se realizó para medir la producción proporcionada por cada uno de tres catalizadores en cierta reacción. El experimento se repitió tres veces para cada catalizador. Las producciones del reactor, en gramos, son:
Catalizador 1: 84.33 90.25 85.62
Catalizador 2: 88.44 89.81 86.53
Catalizador 3: 94.71 91.19 92.81
a) Construya una tabla ANOVA. Puede dar un rango para el P-valor.
b) ¿Puede concluir que hay diferencias en las medias de las producciones entre los catalizadores?
8. Se llevó a cabo un experimento para comparar las vidas de cuatro marcas diferentes de bujía de encendido. Se usaron cinco bujías de cada marca y se registró el número de millas hasta que fallaba cada una. Lo siguiente es una parte del resultado MINITAB para un ANOVA de un sentido.
One-way Analysis of Variance
Analysis of Variance
Source
DF
SS
Brand
3
176.482
Error
(b)
(c)
Total
19
235.958
MS
(a)
(d)
F
(e)
P
(f)
Complete los números faltantes del a) al f ) en la tabla. Puede dar un rango para el P-valor.
9. En relación con el ejercicio 8, ¿es creíble que las marcas de bujía de encendido tengan la misma media de tiempos de vida?
10. Se compararon tres métodos de separación en cierto proceso químico para estudiar sus efectos sobre la producción. Se hicieron tres operaciones con cada método, y las producciones, en porcentaje de un máximo teórico, son los siguientes:
Método A:
Método B:
Método C:
84.6 83.3 85.1
87.3 85.9 88.2
87.2 86.0 86.3
a) Construya una tabla ANOVA. Puede dar un rango para el P-valor.
b) ¿Puede concluir que hay diferencias entre las medias de las producciones?
9.1
Experimentos de un solo factor
645
11. Se realizó un experimento para determinar si la temperatura de recocido de hierro dúctil afecta su fuerza de tensión. Se recocieron cinco elementos para cada una de las cuatro temperaturas. Se midió la fuerza de tensión (en ksi) para cada una. Los resultados se presentan en la tabla siguiente.
Temperatura (◦ C)
750
800
850
900
Valores muestrales
19.72
16.01
16.66
16.93
20.88
20.04
17.38
14.49
19.63
18.10
14.49
16.15
18.68
20.28
18.21
15.53
17.89
20.53
15.58
13.25
a) Construya una tabla ANOVA. Puede dar un rango para el P-valor.
b) ¿Puede concluir que hay diferencias entre las medias de las fuerzas de tensión?
12. Considere el ejercicio 10.
a) Calcule la cantidad s =
√
MSE, la estimación de la desviación estándar del error s.
b) Suponiendo que s sea la desviación estándar del error, encuentre el tamaño de muestra necesario en cada tratamiento para
proporcionar una potencia de 0.90 y detectar una diferencia máxima de 2 en las medias de tratamiento a un nivel del 5%.
c) Utilizando una estimación más conservadora de 1.5s como la desviación estándar de error, encuentre el tamaño muestral
necesario en cada tratamiento para proporcionar una potencia de 0.90 para detectar una diferencia máxima de 2 en las medias de tratamiento con un nivel de 5%.
13. Considérese el ejercicio 11.
a) Calcule la cantidad s =
√
MSE, la estimación de la desviación estándar de error s.
b) Suponiendo que s sea la desviación estándar de error, determine el tamaño de muestra necesario en cada tratamiento para
proporcionar una potencia de 0.90 y detectar una diferencia máxima de 2 en las medias del tratamiento con un nivel de 5%
c) Utilizando una estimación más conservadora de 1.5s como la desviación estándar del error, determine el tamaño de muestra necesario en cada tratamiento para proporcionar una potencia de 0.90 y detectar una diferencia máxima de 2 en las medias de tratamiento con un nivel de 5%.
14. El artículo “The Lubrication of Metal-on-Metal Total Hip Joints: A Slide Down the Stribeck Curve k” (S. Smith, D. Dowson,
y A. Goldsmith, en Proceedings of the Institution of Mechanical Engineers, 2001:483-493) presenta los resultados de pruebas
de desgaste hechas en uniones artificiales de cadera de metal. Se probaron uniones con diferentes diámetros. Los datos que se
presentan en la tabla siguiente para la rugosidad de la cabeza son consistentes con las medias y las desviaciones estándar descritas en el artículo.
Diámetro (mm)
Rugosidad de la cabeza
(nm)
16
28
36
0.83 2.25 0.20 2.78 3.93
2.72 2.48 3.80
5.99 5.32 4.59
a) Construya una tabla ANOVA. Puede dar un rango para el P-valor.
b) ¿Puede concluir que la media de la rugosidad varía con el diámetro? Explique.
15. El artículo “Mechanical Grading of Oak Timbers” (D. Kretschmann y D. Green, en Journal of Materials in Civil Engineering,
1999:91-97) presenta mediciones de los módulos de ruptura, en MPa, para maderas de 7 por 9 de roble mezclados verdes de
Virginia occidental y Pensilvania. Las medias, desviaciones estándar y tamaños muestrales para cuatro diferentes grados de madera se presentan en la tabla siguiente.
646
CAPÍTULO 9
Experimentos factoriales
Grado
Selecta
Núm. 1
Núm. 2
Grado bajo
Media
Desviación estándar Tamaño muestral
45.1
42.0
33.2
38.1
8.52
5.50
6.71
8.04
32
11
15
42
a) Construya una tabla ANOVA. Puede dar un rango para el P-valor.
b) ¿Puede concluir que la media de los módulos de ruptura difieren para los diferentes grados de madera?
16. El artículo “Withdrawal Strength of Threaded Nails” (D. Rammer, S. Winistorfer y D. Sender, en Journal of Structural Engineering 2001:442-449) describe un experimento para comparar las fuerzas de retirada para algunos tipos de clavos. Los datos
contenidos en la tabla siguiente son consistentes con las medias y las desviaciones estándar que se describen en el artículo para tres tipos de clavos: con estrías anulares, con estrías en espiral y comunes. Todos los clavos tenían diámetros a 0.1 mm del
otro, y todos fueron hechos con el mismo tipo de madera.
Tipo de clavo
Fuerza de retirada (N/mm)
Con estrías anulares
36.57 29.67 43.38 26.94 12.03 21.66 41.79 31.50 35.84 40.81
Con estrías en espiral 14.66 24.22 23.83 21.80 27.22 38.25 28.15 36.35 23.89 28.44
Común
12.61 25.71 17.69 24.69 26.48 19.35 28.60 42.17 25.11 19.98
a) Construya una tabla ANOVA. Puede dar un rango para el P-valor.
b) ¿Puede concluir que la media de la fuerza de retirada es diferente para los diferentes tipos de clavo?
17. El siguiente resultado de MINITAB presenta un cálculo de potencia.
Alpha = 0.05
SS Means
20000
Assumed standard deviation = 142.6
Sample
Size
14
Target
Power
0.85
Actual Power
0.864138
Number of Levels = 4
Maximum
Difference
200
The sample size is for each level.
a) ¿Cuál es la potencia que requiere el experimentador?
b) Para garantizar una potencia de 0.864138, ¿cuántas observaciones se deben tomar para todos los tratamientos combinados?
c) ¿Cuál es la diferencia entre las medias del tratamiento que puedan detectarse con una potencia de al menos 0.864138?
d ) ¿La potencia para detectar es una diferencia máxima de 250 mayor que 0.864138 o menor que 0.864138? Explique.
9.2
Comparaciones apareadas en los experimentos
de un solo factor
En un ANOVA de un sentido se utiliza una prueba F para probar la hipótesis nula de que todas
las medias de tratamiento son iguales. Si ésta es rechazada se puede concluir que las medias de
tratamiento no son todas iguales. Pero esta prueba no indica cuáles son diferentes del resto. A
veces un experimentador considera dos tratamientos específicos, i y j, y quiere estudiar la diferencia mi ⫺ mj. En este caso el método de la diferencia significativa mínima de Fisher (DSM)
9.2
Comparaciones apareadas en los experimentos de un solo factor
647
es adecuado y puede usarse para construir intervalos de confianza para mi ⫺ mj o para probar la
hipótesis nula que mi ⫺ mj ⫽ 0. Otras veces, un experimentador tal vez desee determinar todos
los pares de medias que se pueda concluir que difieren de otro. En este caso se debe utilizar otro
tipo de procedimiento que se llama método de comparaciones múltiples. Se analizarán dos
métodos de comparaciones múltiples, el de Bonferroni y el de Tukey-Kramer.
El método de la diferencia significativa mínima de Fisher
Se inicia mediante la decripción del método DSM de Fisher para construir intervalos de confianza de Fisher. El intervalo de confianza para la diferencia mi ⫺ mj se centra en la diferencia
–
–
de las medias muestrales X i. ⫺ X j.. Determinar qué tan ancho hacer el intervalo de confianza
–
–
requiere calcular la desviación estándar de X i. ⫺ X j.. Sean Ji y Jj los tamaños de muestra en
los niveles i y j, respectivamente. Debido al supuesto de que todas las observaciones están dis–
–
tribuidas normalmente con varianza s2, por lo que X i. ⫺ X j. está distribuido normalmente con
media mi ⫺ mj y varianza s2(1/Ji ⫹ 1/Jj). La varianza s2 se estima con MSE, para las razones que se explicaron previamente en el análisis de los intervalos de confianza para las medias de tratamiento (sección 9.1). Ahora la cantidad
(X i. − Xj. ) − (μi − μj )
MSE(1/Ji + 1/Jj )
tiene una distribución t de Student con N ⫺ I grados de libertad. (El valor N ⫺ I es el número de grados
de libertad usado para calcular MSE; véase la ecuación 9.13.) La cantidad
tN −I, α/2 MSE(1/Ji + 1/Jj ) ise llama diferencia significativa mínima. Esta última constituye la base para los intervalos de confianza y las pruebas de hipótesis.
Método de Fisher de la diferencia significativa mínima para intervalos
de confianza y pruebas de hipótesis
El intervalo de confianza de la diferencia significativa mínima de Fisher, al nivel
100(1 ⫺ a)%, para la diferencia mi ⫺ mj es
1
1
Xi. − Xj. ± tN−I, α/2 MSE
+
(9.32)
Ji
Jj
Para probar la hipótesis nula H0 : mi ⫺ mj ⫽ 0, el estadístico de prueba es
X i. − Xj.
1
1
+
MSE
Ji
Jj
(9.33)
Si H0 es verdadera, este estadístico tiene una distribución t Student con N ⫺ I grados
de libertad. Específicamente, si
1
1
(9.34)
|Xi. − Xj. | > tN−I, α/2 MSE
+
Ji
Jj
Entonces H0 es rechazada al nivel α.
648
CAPÍTULO 9
Experimentos factoriales
La razón de que la cantidad tN−I, α/2 MSE(1/Ji + 1/Jj ) se llame la diferencia significativa mínima es que la hipótesis nula de las medias iguales se rechazó con un nivel de α
–
–
siempre que la diferencia en las medias muestrales ⎪X i. ⫺ X j.⎪ supere este valor. Cuando el
diseño es balanceado, con √
todos los tamaños muestral iguales a J, la diferencia significativa
mínima es igual a tN −I, α/2 2MSE/J para todos los pares de medias.
Ejemplo
9.9
En el experimento de las soldaduras analizado en la sección 9.1 se midió la dureza para cinco soldaduras de cada uno de cuatro flujos A, B, C, y D. La media muestral de los valores de
–
–
–
–
la dureza fueron X A. ⫽ 253.8, X B. ⫽ 263.2, X C. ⫽ 271.0 y X D. ⫽ 262.0. La tabla ANOVA se
muestra en el siguiente cuadro.
One-way ANOVA: A, B, C, D
Source
Factor
Error
Total
S = 7.998
DF
3
16
19
SS
743.40
1023.60
1767.00
R-Sq = 42.07%
MS
247.800
63.975
F
3.87
P
0.029
R-Sq(adj) = 31.21%
Antes de realizar el experimento se midieron los contenidos de carbono de los flujos.
El flujo B tenía el contenido de carbono más bajo (2.67% por peso), y el flujo C tenía el más
alto (5.05% por peso). Por tanto, el experimentador está particularmente interesado en comparar las durezas obtenidas con estos dos flujos. Determine un intervalo de confianza del 95%
para la diferencia de las medias de durezas entre soldaduras producidas con los flujos B y C.
¿Se puede concluir que las dos medias son diferentes?
Solución
Se utiliza la expresión (9.32). Las medias muestrales son 271.0 y 263.2 para los flujos C y B,
respectivamente. El producto anterior de MINITAB da la cantidad MSE de 63.975. (Este valor también se calculó en el ejemplo 9.3 en la sección 9.1.) Ambos tamaños muestrales son
iguales a 5. Hay I ⫽ 4 niveles y N ⫽ 20 observaciones en total. Para un intervalo de confianza de 95% se consulta la tabla t para determinar el valor
√ t16,, .025 ⫽ 2.120. Por tanto, el intervalo de confianza de 95% es 271.0 − 263.2 ± 2.120 63.975(1/5 + 1/5) o (⫺2.92, 18.52).
Para realizar una prueba de hipótesis nula con el fin de que las dos medias de tratamiento sean iguales, se calcula el valor del estadístico de prueba (expresión 9.33) y se obtiene
271.0 − 263.2
√
= 1.54
63.975(1/5 + 1/5)
Al consultar la tabla t con N ⫺ I ⫽ 16 grados de libertad, se encuentra que P está entre 2(0.05)
⫽ 0.10 y 2(0.10) ⫽ 0.20 (observe que ésta es una prueba de dos colas). No se puede concluir
que las medias del tratamiento difieren.
9.2
Comparaciones apareadas en los experimentos de un solo factor
649
Si se desea realizar una prueba de nivel fijo a un nivel α ⫽ 0.05 como una alternativa
para calcular el P-valor, el valor crítico t es t16, .025 ⫽ 2.120. El lado izquierdo de la desigual√
dad (9.34) es ⎪271.0 ⫺ 263.2⎪ ⫽ 7.8. El lado derecho es 2.120 63.975(1/5+1/5) ⫽ 10.72.
Dado que 7.8 no es mayor que 10.72, no se rechaza H0 al nivel 5%.
El siguiente resultado de MINITAB presenta los intervalos de confianza al 95% de Fisher
de DSM para cada diferencia entre las medias de tratamiento en el experimento de soldaduras.
Fisher 95% Individual Confidence Intervals
All Pairwise Comparisons
Simultaneous confidence level = 81.11%
A subtracted from:
B
C
D
Lower
–1.324
6.476
–2.524
Center
9.400
17.200
8.200
Upper
20.124
27.924
18.924
------+---------+---------+---------+--(--------∗--------)
(--------∗--------)
(--------∗--------)
------+---------+---------+---------+--–12
0
12
24
Upper
18.524
9.524
------+---------+---------+---------+--(--------∗-------)
(--------∗--------)
------+---------+---------+---------+--–12
0
12
24
Upper
1.724
------+---------+---------+---------+--(--------∗-------)
------+---------+---------+---------+--–12
0
12
24
B subtracted from:
Lower
C –2.924
D –11.924
Center
7.800
–1.200
C subtracted from:
D
Lower
–19.724
Center
–9.000
Los valores “Center” son las diferencias entre pares de medias de tratamiento. Las cantidades “Lower” y “Upper” son los límites superior e inferior, respectivamente, del intervalo
de confianza. De particular interés es el nivel de confianza simultáneo de 81.11%. Esto último indica que aunque se tiene una confianza de 95% de que cualquier intervalo de confianza
dado contiene su diferencia verdadera en las medias, sólo se tiene una confianza de 81.11%
de que todos los intervalos de confianza contienen sus diferencias verdaderas.
En el ejemplo 9.9 se realizó una sola prueba sobre la diferencia entre dos medias específicas. ¿Qué sucede si se quería probar cada par de medias para averiguar acerca de cuáles
se puede concluir que son diferentes? Podría parecer razonable realizar la prueba DSM sobre
cada par. Sin embargo, esto último no es adecuado porque cuando se realizan varias pruebas
aumenta la probabilidad de rechazar una hipótesis nula verdadera. Éste es problema de pruebas múltiples, que se analizaron con cierto detalle en la sección 6.14. Este problema se mostró en el resultado anterior de MINITAB, que muestra que sólo se tiene una confianza de
650
CAPÍTULO 9
Experimentos factoriales
81.11% de que todos los intervalos de confianza de 95% contengan sus valores verdaderos.
Cuando se consideran simultáneamente, algunos intervalos de confianza o pruebas de hipótesis, aquéllos deben ser más amplios, y el criterio para rechazar las hipótesis nulas más estricto, que en situaciones donde sólo está implicado un intervalo o una prueba. En estas
situaciones se utilizan métodos de comparaciones múltiples para producir intervalos de confianza simultáneos y pruebas de hipótesis simultáneas. Si se construyen intervalos de confianza simultáneos de nivel 100(1 ⫺ α)% para las diferencias entre cada par de medias,
entonces se tiene una confianza de nivel 100(1 ⫺ α)% de que cada intervalo de confianza
contenga la diferencia verdadera. Si se realizan pruebas de hipótesis simultáneas para todas
las hipótesis nulas de la forma H0 : mi ⫺ mj ⫽ 0, entonces se puede rechazar, al nivel α, cada
hipótesis nula cuyo P-valor sea menor que α.
El método de Bonferroni de comparaciones múltiples
El método de Bonferroni, analizado en la sección 6.14, es un método general, válido siempre
que algunos intervalos de confianza o pruebas sean considerados simultáneamente. La aplicación del método es simple. Sea C el número de pares de las diferencias que van a compararse. Por ejemplo, si hay I tratamientos, y todos los pares de diferencias que van a
compararse, entonces C ⫽ I(I ⫺ 1)/2. El método de Bonferroni es el mismo que el método de
DSM, excepto que α se sustituye con α /C.
El método de Bonferroni para intervalos de confianza simultáneos
y pruebas de hipótesis
Se supone que se están considerando C diferencias de la forma mi ⫺ mj. Los intervalos de confianza simultáneos de Bonferroni, al nivel 100(1 ⫺ α)%, para las C diferencias mi ⫺ mj son
1
1
+
Xi. − X j. ± tN −I, α/(2C) MSE
(9.35)
Ji
Jj
Se tiene una confianza del 100(1 ⫺ α)% de que los intervalos de confianza de Bonferroni contengan el valor verdadero de la diferencia mi ⫺ mj para todos los pares C
que se están considerando.
Con el fin de probar las C hipótesis nulas de la forma H0 : mi ⫺ mj ⫽ 0, los estadísticos de prueba son
Xi. − X j.
1
1
+
MSE
Ji
Jj
Determine el P-valor para cada prueba consultando la tabla t de Student con N ⫺ 1
grados de libertad, y multiplique el P-valor encontrado por C.
Específicamente, si
1
1
|Xi. − Xj. | > tN−I, α/(2C) MSE
+
Ji
Jj
entonces H0 es rechazada con un nivel de α.
9.2
Ejemplo
9.10
Comparaciones apareadas en los experimentos de un solo factor
651
Con los datos de soldaduras analizados en el ejemplo 9.9 utilice el método de Bonferroni para determinar cuáles pares de flujos, si los hay, se puede concluir que difieren en su efecto de
dureza, a un nivel del 5%.
Solución
Hay I ⫽ 4 niveles, con J ⫽ 5 observaciones en cada nivel, de un total de N ⫽ 20 observaciones. Con cuatro niveles, hay un total de C ⫽ (4)(3)/2 ⫽ 6 pares de medias que comparar.
Para probar al nivel α ⫽ 5%, se calcula α/(2C) ⫽ 0.004167. El valor crítico de t es t16, .004167.
Este valor no está en la tabla; se encuentra entre t16, .005 ⫽ 2.921 y t16, .001 ⫽ 3.686. Mediante
software se calcula t16, .004167 ⫽ 3.0083. Sin el respectivo software se podría aproximar este
valor en formag aproximada
⫽ 63.975 (véase el ejemplo 9.9),
y pp por interpolación.
y Ahora
p MSE
√
por lo que tN −I, α/(2C) MSE(1/Ji + 1/Jj ) = 3.0083 63.975(1/5 + 1/5) = 15.22. Las
cuatro medias muestrales son:
Flujo
A
Medida de la dureza 253.8
B
263.2
C
271.0
D
262.0
Hay solamente un par de las medias muestrales, 271.0 y 253.8, cuya diferencia es mayor a
15.22. Por tanto, se concluye que las soldaduras producidas con el flujo A tienen una media
de dureza diferente que las generadas con el flujo C. Ninguna de las otras diferencias son importantes con un nivel de 5%.
Aunque es fácil de utilizar, el método de Bonferroni tiene la desventaja que cuando C
se hace grande, los intervalos de confianza resultan muy anchos, y las pruebas de hipótesis
tienen potencia baja. La razón de esto último consiste en que el método de Bonferroni es un
método general, no específicamente diseñado para el análisis de varianza o para poblaciones
normales. En muchos casos C es bastante grande, en particular con frecuencia se desean comparar todos los pares de medias. En estos casos, el método de Tukey-Kramer es superior,
porque está diseñado para comparaciones múltiples de las medias de poblaciones normales.
A continuación se le describe.
El método de Tukey-Kramer de comparaciones múltiples
El método de Tukey-Kramer está basado en la distribución de rango studentizado, en lugar
de la distribución t de Student. Dicha distribución tiene dos grados de libertad como valores, que
para el método de Tukey-Kramer son I y N ⫺ I. (En comparación, la prueba F utiliza I ⫺ 1 y
N ⫺ I grados de libertad.) El método de Tukey-Kramer utiliza el cuantil 1 ⫺ α de la distribución
de rango studentizado con I y N ⫺ I grados de libertad; esta cantidad se denota por qI, N ⫺ I, α. La
tabla A.8 (en el Apéndice A) presenta valores de qI, N ⫺ I, α, para diferentes valores de I, N, y α.
Los mecanismos del
yde Tukey-Kramer son los mismos que los
del método de DSM, exmétodo
q
(MSE/2)(1/Ji + 1/Jj ).
cepto que tN−I, α/2 MSE(1/Ji + 1/J
se
sustituye
con
)
I,N−I,α
j
j
Algunas veces la cantidad qI,N−I,α (MSE/2)(1/Ji + 1/Jj ) se denomina diferencia honestamente significativa (DHS), en contraparte con la diferencia significativa mínima de Fisher.
652
CAPÍTULO 9
Experimentos factoriales
El método de Tukey-Kramer para los intervalos de confianza simultáneos
y pruebas de hipótesis
Los intervalos de confianza simultáneos de Tukey-Kramer de nivel 100(1 ⫺ α)% para todas las diferencias mi ⫺ mj son
1
MSE 1
X i. − Xj. ± qI,N−I,α
+
(9.36)
2
Ji
Jj
Ahora se tiene una confianza del 100(1 ⫺ α)% para los intervalos de confianza de
Tukey-Kramer de que contengan el valor verdadero de la diferencia mi ⫺ mj para cada i y j.
Con el fin de probar todas las hipótesis nulas simultáneas H0 : mi ⫺ mj ⫽ 0, los estadísticos de prueba son
Xi. − Xj.
MSE 1
1
+
2
Ji
Jj
El P-valor para cada prueba se encuentra al consultar la tabla de la distribución de
rango studentizado (tabla A.8) con I y N ⫺ I grados de libertad.
Para cada par de niveles i y j para los cuales
MSE 1
1
|Xi. − X j. | > qI,N−I,α
+
2
Ji
Jj
la hipótesis nula H0 : mi ⫺ mj ⫽ 0 se rechaza con un nivel de α.
Una nota de terminología:
todos los tamaños de
cuando el diseño es balanceado, con
√
muestra iguales a J, la cantidad (MSE/2)(1/Ji + 1/Jj ) es igual a MSE/J para todos los
pares de niveles. En este caso, con frecuencia el método sólo se llama método de Tukey.
Ejemplo
9.11
Para los datos de las soldaduras en la tabla 9.1 (en la sección 9.1), ¿cuáles pares de flujos, si
hay, se puede concluir, con un nivel de 5%, que difieren en su efecto en la dureza?
Solución
Hay I ⫽ 4 niveles, con J ⫽ 5 observaciones en cada nivel, para un total de N ⫽ 20 observaciones en total. Con el propósito de probar con un nivel de α ⫽ 0.05, se consulta la tabla de
rango studentizado (tabla A.8) encontrando q4, 16, .05 ⫽ 4.05.
√
√El valor de MSE es 63.975 (véase el ejemplo 9.9). Por tanto, qI,N −I,α MSE/J =
4.05 63.975/5 = 14.49. Las cuatro medias muestrales son:
Flujo
Medida de la dureza
A
253.8
B
263.2
C
271.0
D
262.0
9.2
Comparaciones apareadas en los experimentos de un solo factor
653
Hay solamente un par de medias muestrales, 271.0 y 253.8, cuya diferencia es mayor a 14.49.
Por tanto, se concluye que las soldaduras producidas con el flujo A tienen una media de dureza diferente que las soldaduras producidas con el flujo C. Ninguna de las otras diferencias
son importantes con un nivel de 5%.
Al comparar los resultados del ejemplo 9.11 con los del 9.10 se encuentra, en este caso,
que el método de Tukey-Kramer es ligeramente más poderoso que el método de Bonferroni,
ya que su valor crítico es solamente de 14.49, mientras que el de Bonferroni fue de 15.22.
Cuando es posible comparar todos los pares posibles, como en este ejemplo, el método de Tukey-Kramer es siempre más poderoso que el de Bonferroni. Cuando sólo se comparan algunos de los pares posibles, el método de Bonferroni es a veces más poderoso.
En ocasiones sólo se realiza una sola prueba, pero la diferencia que se prueba se elige
al examinar las medias muestrales y al elegir dos cuya diferencia es grande. En estos casos se
debe utilizar un método de comparaciones múltiples, aunque sólo se esté realizando una prueba. El ejemplo 9.12 ilustra la idea.
Ejemplo
9.12
Un ingeniero examina los datos de las soldaduras en la tabla 9.1 y advierte que los dos tratamientos con la diferencia mayor en las medias muestrales son los flujos A y C. Decide probar la hipótesis nula de que la media de la dureza para las soldaduras producidas con el flujo
A difiere de las que se producen con el flujo C. Debido a que sólo se realizará una prueba,
utiliza el método de Fisher de DSM en lugar del de Bonferroni o de Tukey-Kramer. Explique
por qué está equivocado.
Solución
El ingeniero ha revisado cada par de medias y ha elegido dos cuya diferencia es mayor. Aunque formalmente está realizando sólo una prueba, ha elegido ésta al comparar cada par de medias muestrales. Por esta razón debe utilizar un procedimiento de comparaciones múltiples,
como el método de Bonferroni o de Tukey-Kramer.
El siguiente resultado de MINITAB presenta intervalos de confianza simultáneos de
95% de Tukey-Kramer para los datos de las soldaduras.
Tukey 95% Simultaneous Confidence Intervals
All Pairwise Comparisons
Individual confidence level = 98.87%
A subtracted from:
B
Lower
–5.087
Center
9.4000
Upper
23.887
------+---------+---------+---------+--(--------∗---------)
654
CAPÍTULO 9
C
D
Experimentos factoriales
2.713
–6.287
17.200
8.200
31.687
22.687
(--------∗---------)
(--------∗---------)
------+---------+---------+---------+--–15
0
15
30
Upper
22.287
13.287
------+---------+---------+---------+--(--------∗---------)
(--------∗---------)
------+---------+---------+---------+--–15
0
15
30
Upper
5.487
------+---------+---------+---------+--(---------∗---------)
------+---------+---------+---------+--–15
0
15
30
B subtracted from:
Lower
C –6.687
D –15.687
Center
7.800
–1.200
C subtracted from:
D
Lower
–23.487
Center
–9.000
Los valores “Center” son las diferencias entre pares de medias del tratamiento. Las cantidades “Lower” y “Upper” son los límites inferior y superior, respectivamente, del intervalo
de confianza. Se tiene una confianza de 95% de que cada uno de estos intervalos contenga la
diferencia verdadera de las medias de tratamiento. Observe que el “Individual confidence level” es 98.87%. Esto significa que se tiene una confianza con ese porcentaje de que cualquier
intervalo de confianza específico contenga su valor verdadero. Por último, se indica que el nivel de confianza para los intervalos de Tukey-Kramer es mayor que para los intervalos de Fisher DSM, los intervalos de Tukey-Kramer son más amplios.
Ejemplo
9.13
En el ejemplo 9.5 (en la sección 9.1) se presentaron varias mediciones de las máximas concentraciones por hora (en µg/m3) de SO2 para cada una de cuatro centrales hidroeléctricas, y se concluyó que la media de las concentraciones en las cuatro plantas no eran todas iguales. El
siguiente resultado de MINITAB presenta los intervalos de confianza simultáneos del 95% de
Tukey-Kramer para la media de las concentraciones de las cuatro plantas. ¿Cuáles pares de plantas, si hay alguna, puede concluir con una confianza del 95% que tienen medias diferentes?
Tukey 95% Simultaneous Confidence Intervals
All Pairwise Comparisons
Individual confidence level = 98.87%
9.2
Comparaciones apareadas en los experimentos de un solo factor
655
1 subtracted from:
2
3
4
Lower
109.4
21.4
–94.6
Center
385.3
312.3
170.9
Upper
661.1
603.1
436.4
-----+---------+---------+---------+---(--------∗--------)
(--------∗---------)
(--------∗--------)
-----+---------+---------+---------+---–300
0
300
600
Upper
202.9
34.7
-----+---------+---------+---------+---(---------∗--------)
(-------∗-------)
-----+---------+---------+---------+---–300
0
300
600
2 subtracted from:
Lower
3 –348.9
4 –463.4
Center
-73.0
–214.3
3 subtracted from:
Lower
4 –406.8
Center
–141.3
Upper
124.1
-----+---------+---------+---------+---(--------∗--------)
-----+---------+---------+---------+---–300
0
300
600
Solución
Entre los intervalos de confianza simultáneos hay dos que no contienen 0. Éstos son los intervalos para m1 ⫺ m2 y para m1 ⫺ m3. Por tanto, se concluye que la media de las concentraciones difiere entre las plantas 1 y 2 y entre las 1 y 3.
Ejercicios para la sección 9.2
1. El artículo “Organic Recycling for Soil Quality Conservation in a Sub-Tropical Plateau Region” (K. Chakrabarti, B. Sarkar y
cols., en J. Agronomy and Crop Science, 2000:137-142) describe un experimento en el que se trataron muestras de suelo con
seis tratamientos diferentes, con dos réplicas por tratamiento, y se registró la actividad de fosfato ácido (en µmol de p-nitrofenol liberado por gramo de tierra seca por hora). Una tabla ANOVA para un ANOVA de un sentido se presenta en el cuadro siguiente.
One-way ANOVA: Treatments A, B, C, D, E, F
Source
Treatment
Error
Total
DF
5
6
11
SS
1.18547
0.03050
1.21597
MS
0.23709
0.00508
F
46.64
P
0.000
656
CAPÍTULO 9
Experimentos factoriales
Las medias del tratamiento fueron
Tratamiento
Media
A
0.99
B
1.99
C
1.405
D
1.63
E
1.395
F
1.22
a) ¿Puede concluir que hay diferencias en la actividad de fosfato ácido entre los tratamientos?
b) Utilice el método de Tukey-Kramer para determinar cuáles pares de medias de tratamiento, si los hay, son diferentes a un
nivel de 5%.
c) Utilice el método de Bonferroni para determinar cuáles pares de medias de tratamiento, si los hay, son diferentes con un nivel de 5%.
d ) ¿Cuál método es más poderoso en este caso: el método de Tukey-Kramer o el de Bonferroni?
e) El experimentador observa que el tratamiento A tenía la media muestral más pequeña, mientras que la media del tratamiento B era mayor. De los métodos de Fisher de DSM, de Bonferroni y del de Tukey-Kramer, ¿cuál, si hay alguno, se puede
utilizar para probar que la hipótesis de estas dos medias de tratamiento son iguales?
2. El artículo “Optimum Design of an A-pillar Trim with Rib Structures for Occupant Head Protection” (H. Kim y S. Kang, en
Proceedings of the Institution of Mechanical Engineers, 2001:1161-1169) analiza un estudio en que varios tipos de columnas
A se compararon para determinar cuál proporciona la mayor protección para los ocupantes de los automóviles durante una colisión. Se sigue una tabla ANOVA de un sentido, donde los tratamientos son tres niveles de espacio longitudinal del saliente (el
artículo también analiza dos factores insignificantes, que aquí se omitieron). Había nueve réplicas en cada nivel. La respuesta
es el criterio de lesión de cabeza (HIC), una cantidad sin unidades que mide la absorción de energía de impacto de la columna.
One-way ANOVA: Spacing
Source
Spacing
Error
Total
DF
2
24
26
SS
50946.6
120550.9
171497.4
MS
25473.3
5023.0
F
5.071
P
0.015
A
930.87
B
873.14
C
979.41
Las medias de tratamiento fueron
Tratamiento
Media
a) ¿Puede concluir que el espaciado longitudinal afecta la absorción de energía de impacto?
b) Utilice el método de Tukey-Kramer para determinar cuáles pares de medias de tratamiento, si las hay, son diferentes con un
nivel de 5%.
c) Utilice el método de Bonferroni para determinar cuáles pares de medias de tratamiento, si las hay, son diferentes con un nivel de 5%.
d ) ¿Cuál método es más poderoso en este caso, el método de Tukey-Kramer o el de Bonferroni?
3. Las resinas de acrílico utilizadas en la fabricación de dentaduras postizas no deben absorber mucha agua, ya que se reduce la
fuerza. El artículo “Reinforcement of Acrylic Resin for Provisional Fixed Restorations. Part III: Effects of Addition of Titania
and Zirconia Mixtures on Some Mechanical and Physical Properties” (W. Panyayong, Y. Oshida y cols., Bio-Medical Materials
and Engineering, 2002:353-366) describe un estudio del efecto sobre la absorción de agua al agregar dióxido de titanio (TiO2)
y dióxido de circonio (ZrO2) a una resina acrílica usual. Se midió la absorción de agua (en µg/mm2) de cada uno de doce elementos de cada una de diferentes formulaciones, con diferentes cantidades de TiO2 y ZrO2, que fueron inmersas en agua durante una semana. Los resultados se presentan en la tabla siguiente.
9.2
Formulación
Comparaciones apareadas en los experimentos de un solo factor
Volumen %
TiO2
ZrO2
A (control)
B
C
D
E
F
G
H
0
1
1
1
2
2
2
3
0
1
2
0.5
2
4
1
3
Media
24.03
14.88
12.81
11.21
16.05
12.87
15.23
15.37
657
Desviación estándar
2.50
1.55
1.08
2.98
1.66
0.96
0.97
0.64
a) Utilice el método de Bonferroni para determinar cuál de las formulaciones no controladas (de la B a la H) difiere, con un
nivel de 5%, en su media de absorción de agua a partir de la formulación de control A.
b) Repita el inciso a) utilizando el método de Tukey-Kramer.
c) ¿Qué método es más poderoso para estas comparaciones? ¿Por qué?
4. Considere el ejercicio 1 de la sección 9.1.
a) Con el método de Bonferroni determine qué pares de medias, si hay, son diferentes con un nivel de 5%.
b) Con el método de Tukey-Kramer determine qué pares de medias, si hay, son diferentes con un nivel de 5%.
c) ¿Cuál es el método más poderoso para encontrar todos los pares de tratamientos cuyas medias son diferentes, el método de
Bonferroni o el de Tukey-Kramer?
5. Considere el ejercicio 11 de la sección 9.1.
a) Mediante el método de Bonferroni determine cuáles pares de medias, si hay, son diferentes con un nivel de 5%.
b) Con el método de Tukey-Kramer determine cuáles pares de medias, si hay, son diferentes con un nivel de 5%.
c) ¿Cuál es el método más poderoso para encontrar todos los pares de tratamientos cuyas medias son diferentes, el de Bonferroni o el de Tukey-Kramer?
6. Considérese el ejercicio 1 en la sección 9.1. Un científico quiere determinar si la media de la cantidad absorbida durante 24 horas difiere de la media de las cantidades absorbidas durante una, dos, cuatro y diez horas.
a) Con el método de Bonferroni determine cuáles de las medias, si hay, para una, dos, cuatro y diez horas difieren de la media de 24 horas. Utilice un nivel de 5%.
b) Mediante el método de Tukey-Kramer determine cuáles de las medias, si hay, para una, dos, cuatro y diez horas difieren de
la media durante 24 horas. Utilice un nivel de 5%.
c) ¿Cuál es el método más poderoso para encontrar todos los tratamientos cuyas medias difieren de la de duración de 24 horas, el de Bonferroni o el de Tukey-Kramer?
7. Considérese el ejercicio 11 de la sección 9.1. Un minero quiere determinar si la media fuerza de tensión para elementos endurecidos a 900°C difiere de la media para fuerzas endurecidas a 750, 800 y 850°C.
a) Con el método de Bonferroni determine cuáles de las medias, si hay, para 750, 800 y 850°C difiere de la media para 900°C.
b) Con el método de Tukey-Kramer determine cuáles de las medias, si hay, para 750, 800, y 850°C difiere de la media para
900°C.
c) ¿Cuál es el método más poderoso para encontrar todos los pares de los tratamientos cuyas medias difieren de la de 900°C,
el de Bonferroni o el de Tukey-Kramer?
658
CAPÍTULO 9
Experimentos factoriales
8. Considere el ejercicio 3 de la sección 9.1.
a) Con el método de Fisher de DSM encuentre un intervalo de confianza de 95% para la diferencia entre las medias de los tratamientos B y D.
b) Con el método de Tukey-Kramer determine qué pares de tratamientos, si hay, son diferentes con un nivel de 5%.
9. Considérese el ejercicio 5 de la sección 9.1.
a) Con el método de Fisher de DSM encuentre un intervalo de confianza de 95% para la diferencia entre las medias para Buckeye Hollow y Bear Branch.
b) Con el método de Tukey-Kramer determine cuáles pares de tratamientos, si hay, difieren con un nivel de 5%.
10. Considere el ejercicio 7 de la sección en 9.l.
a) Con el método de Fisher de DSM encuentre un intervalo de confianza de 95% para la diferencia entre las medias para los
catalizadores 1 y 3.
b) Con el método de Tukey-Kramer determine qué pares de catalizadores, si hay, difieren con un nivel de 5%.
11. Con referencia al ejercicio 14 en la sección 9.1.
a) Con el método de Fisher de DSM encuentre un intervalo de confianza de 95% para la diferencia entre las medias para un
diámetro de 16 y otro de 36.
b) Con el método de Tukey-Kramer determine qué pares de diámetros, si hay, difieren con un nivel de 5%.
12. Considere el ejercicio 16 de la sección 9.1.
a) Con el método de Fisher de DSM encuentre un intervalo de confianza de 95% para la diferencia entre las medias para clavos de estrías anulares y comunes.
b) Con el método de Tukey-Kramer determine qué pares de tipos de clavo, si hay, difieren con un nivel de 5%.
13. En un experimento para determinar el efecto del catalizador en la producción de cierta reacción, la media de las producciones
–
–
–
–
para las reacciones operadas con cada uno de los cuatro catalizadores fue X 1. ⫽ 89.88, X 2. ⫽ 89.51, X 3. ⫽ 86.98 y X 4. ⫽ 85.79.
Suponga que se hicieron cinco operaciones con cada catalizador.
a) Si MSE ⫽ 3.85, calcule el valor del estadístico F para probar la hipótesis nula de que los cuatro catalizadores tienen la misma media de la producción. ¿Puede concluir que difiere con un nivel de 5%?
b) Con el método de Tukey-Kramer determine qué pares de catalizadores, si hay, se puede concluir que difieren con un nivel
de 5%.
14. En un experimento para determinar el efecto del tiempo de endurecimiento sobre la fuerza compresiva de cierto tipo de concreto, la media de las fuerzas, en MPa, para elementos endurecidos para cada uno de los cuatro tiempos de endurecimiento fue–
–
–
–
ron X 1. ⫽ 1 316, X 2. ⫽ 1 326, X 3. ⫽ 1 375 y X 4. ⫽ 1 389. Suponga que se endurecieron cuatro elementos para cada tiempo de
endurecimiento.
a) Si MSE ⫽ 875.2, calcule el valor del estadístico F para probar la hipótesis nula de que los cuatro tiempos de endurecimiento tienen la misma media de la fuerza. ¿Esta hipótesis nula puede ser rechazada con un nivel de 5%?
b) Con el método de Tukey-Kramer determine qué pares de tiempos de endurecimiento, si hay, se puede concluir que difieren
con un nivel de 5%.
15. Para algunos conjuntos de datos, el estadístico F rechazará la hipótesis nula de ninguna diferencia en la media de la producción, pero el método de Tukey-Kramer no encontrará algún par de medias que pueden concluir que difieren. Para las cuatro
medias muestrales dadas en el ejercicio 13, suponiendo un tamaño de muestra de 5 para cada tratamiento, determine un valor
de MSE con el propósito de que el estadístico F rechace la hipótesis nula de que no hay diferencia con un nivel de 5%, mientras que el método de Tukey-Kramer no encuentra algún par de medias que difieran con un nivel de 5%.
16. Para algunos conjuntos de datos, el estadístico F rechazará la hipótesis nula de la no diferencia en la media de las producciones, pero el método de Tukey-Kramer no encontrará algún par de medias que se pueda concluir que difiere. Para las cuatro me-
9.3
Experimentos de dos factores
659
dias muestrales dadas en el ejercicio 14, suponiendo un tamaño de muestra de 4 para cada tratamiento, encuentre un valor de
MSE con el propósito de que el estadístico F rechace la hipótesis nula de ninguna diferencia con un nivel de 5%, mientras que
el método de Tukey-Kramer no encuentra algún par de medias que difieran con un nivel de 5%.
9.3
Experimentos de dos factores
En los experimentos de un factor, analizados en las secciones 9.1 y 9.2, el propósito es determinar si al cambiar el nivel de un solo factor sólo se afecta la respuesta. Muchos experimentos implican variar algunos factores, cada uno de ellos puede afectar la respuesta. En esta
sección se analizará el caso en el que existen dos factores. Los experimentos, naturalmente
suficientes, son llamados experimentos de dos factores. Se muestra con un ejemplo.
Un ingeniero químico está estudiando los efectos de varios reactivos y catalizadores en
la producción de cierto proceso. Esta última se expresa como un porcentaje de un máximo
teórico. Se hicieron cuatro operaciones del proceso para cada combinación de tres reactivos
y cuatro catalizadores. Los resultados se presentan en la tabla 9.2. En este experimento hay
dos factores, el catalizador y el reactivo. El primero se llama factor renglón, ya que su valor
varía de renglón a renglón en la tabla; el segundo se denomina factor columna. Estas designaciones son arbitrarias, en la tabla se podía haber presentado tan fácilmente como que los
renglones representen los reactivos y las columnas, los catalizadores.
TABLA 9.2 Producciones para varias operaciones de un proceso químico con varias
combinaciones de reactivos y catalizadores
Catalizador
A
B
C
D
Reactivo
2
1
86.8
71.9
65.5
63.9
82.4
72.1
72.4
70.4
86.7
80.0
76.6
77.2
83.5
77.4
66.7
81.2
93.4
74.5
66.7
73.7
85.2
87.1
77.1
81.6
94.8
71.9
76.7
84.2
3
83.1
84.1
86.1
84.9
77.9
87.5
72.7
79.8
89.6
82.7
77.8
75.7
89.9
78.3
83.5
80.5
83.7
90.1
78.8
72.9
En general hay I niveles del factor renglón y J niveles del factor columna. (En la tabla
9.2, I ⫽ 4 y J ⫽ 3). Por tanto, hay I J combinaciones diferentes de los dos factores. La terminología para estas combinaciones de factores no está estandarizada. Se llamará a cada combinación de factores tratamiento, pero algunos escritores usan el término combinación de
tratamiento. Se debe recordar que las unidades asignadas a un tratamiento específico se denominan réplicas. Cuando el número de éstas es el mismo para cada tratamiento, se denotará
con K. Por consiguiente, en la tabla 9.2, K ⫽ 4.
Cuando las observaciones se toman en cada tratamiento posible, el diseño se llama diseño completo o diseño factorial completo. Los diseños incompletos, en que no hay datos
para uno o más tratamientos, pueden ser difíciles de interpretar, excepto para algunos casos
especiales. Cuando sea posible se deben utilizar los diseños completos. Cuando el número de
réplicas es el mismo para cada tratamiento, se dice que el diseño es balanceado. Para los experimentos de un solo factor no se necesitaba suponer que el diseño era balanceado. Con los
experimentos de dos factores los diseños no balanceados son mucho más difíciles de analizar
que los balanceados. Se restringirá el análisis a diseños balanceados. Como con los experi-
660
CAPÍTULO 9
Experimentos factoriales
mentos de un solo factor, los factores pueden ser fijos o aleatorios. Los dos métodos que se
describirán son aplicables a modelos de efectos fijos. Después se describirán brevemente modelos donde uno o ambos factores son aleatorios.
En un diseño totalmente aleatorio, cada tratamiento representa una población, y las observaciones sobre éste representan una muestra aleatoria simple de esa población. Se denotarán los valores muestrales para el tratamiento que corresponderá al i-ésimo nivel del factor de
renglón y al j-ésimo nivel del factor columna por Xij1, . . . , XijK. Se denotará el resultado de
la media de la población para este tratamiento con mij. Los valores mij con frecuencia se llaman medias de tratamiento. En general, el propósito de un experimento de dos factores consiste en determinar si las medias de tratamiento están afectados por la variación del factor
renglón, del factor columna, o de ambos. El método de análisis adecuado para los experimentos de dos factores se denomina análisis de varianza de dos sentidos.
Parametrización para el análisis de varianza de dos sentidos
En un análisis de varianza de dos sentidos se desea determinar si al cambiar el nivel de los
factores de renglón o de columna cambia también el valor mij. Para hacer esto último se debe
expresar mij en función de los parámetros que describen los factores renglón y columna por
separado. Se iniciará esta tarea describiendo alguna notación para los promedios de las medias de tratamiento respecto de los diferentes niveles de los factores renglón y columna.
Para cualquier nivel i del factor de renglón, el promedio de todas las medias de trata– . Se expresa m
– en relación con las memiento mij en el i-ésimo renglón se denota mediante m
i.
i.
dias de tratamiento de la siguiente manera:
µi. =
J
1
µij
J j =1
(9.37)
De manera similar, para cualquier nivel j del factor de columna, el promedio de todas las me– . Se expresa m
– en función de
dias de tratamiento mij en la j-ésima columna se denota por m
.j
.j
las medias de tratamiento, como se muestra a continuación:
I
1
µij
µ.j =
(9.38)
I i=1
Por último, se define la gran media de la población, se denota por µ, que representa el promedio de todas las medias de tratamiento mij. La gran media de la población también se pue– o de las cantidades m
– :
de expresar como el promedio de las m
i.
.j
µ=
J
I
I
J
1
1
1
µij
µi. =
µ.j =
I i=1
J j =1
I J i=1 j =1
(9.39)
– ,m
– y m.
La tabla 9.3 ilustra las relaciones entre mij, m
i.
.j
–
–
Utilizando las cantidades mi., m.j y m, se puede descomponer la media de tratamiento mij
como sigue:
– ⫺ m) ⫹ (m
– ⫺ m) ⫹ (m ⫺ m
– ⫺m
– ⫹ m)
mij ⫽ m ⫹ (m
(9.40)
i.
.j
ij
i.
.j
La ecuación (9.40) expresa la media de tratamiento mij como una suma de cuatro términos. En
la práctica, se usa la notación más simple para los tres términos que están más a la derecha en la
ecuación (9.40):
9.3
Experimentos de dos factores
– ⫺m
αi ⫽ m
i.
–
βj ⫽ m.j ⫺ m
– ⫺m
– ⫹m
γij ⫽ mij ⫺ m
i.
.j
661
(9.41)
(9.42)
(9.43)
TABLA 9.3 Medias de tratamiento y sus promedios a través de los
renglones y hacia debajo de las columnas
Nivel columna
2
···
Nivel renglón
1
1
2
..
.
I
m 11
m 21
..
.
mI 1
m 12
m 22
..
.
mI 2
m .1
m .2
Media de la
columna
···
···
Media del
renglón
J
···
···
m 1J
m 2J
..
.
m IJ
m 1.
m 2.
..
.
m I.
···
m. J
m
Cada una de las cantidades m, αi, βj y γij tiene una interpretación importante:
La cantidad µ es la gran media de la población, que es el promedio de todas las medias
de tratamiento.
– ⫺ m se llama el i-ésimo efecto de renglón. Representa la diferenLa cantidad αi ⫽ m
i.
cia entre el promedio del tratamiento para el nivel del i-ésimo del factor renglón y la gran
media de la población. El valor de αi indica el grado con el cual el i-ésimo nivel factor
de renglón tiende a producir resultados que son mayores o menores que la gran media de
la población.
– ⫺ m se llama el j-ésimo efecto de columna. Es la diferencia entre
La cantidad βj ⫽ m
.j
el promedio de las medias del tratamiento para el j-ésimo nivel del factor columna y la
gran media de la población. El valor de βj indica el grado con el cual el j-ésimo nivel del
factor columna tiende a producir resultados mayores o menores que la gran media de la
población.
– ⫺m
– ⫹ m se lama interacción ij. El efecto de un nivel de facLa cantidad γij ⫽ mij ⫺ m
i.
.j
tor renglón (o columna) puede depender de qué nivel del factor columna (o renglón) está
apareado con éste. Los términos de interacción miden el grado con el que esto último ocurre. Por ejemplo, suponga que el nivel 1 del factor renglón tiende a producir un resultado
grande cuando se aparea con la columna de nivel 1, pero un resultado pequeño cuando se
aparea con una columna de nivel 2. En este caso γ1, 1 sería positiva, y γ1, 2 sería negativo.
Tanto los efectos de renglón como los de columna se llaman efectos principales para
distinguirlos de las interacciones. Observe que hay I efectos renglón, uno por cada nivel del
factor renglón, los efectos columna J, uno por cada nivel del factor columna, y las IJ interac– ,
ciones, una por cada tratamiento. Además, se tiene de las definiciones de las cantidades m
i.
–
m.j y µ de las ecuaciones (9.37) a la (9.39) que los efectos de renglón, efectos de columna, y
las interacciones satisfacen las restricciones siguientes:
I
J
I
J
αi = 0
βj = 0
γij =
γij = 0
(9.44)
i=1
j =1
i=1
j =1
662
CAPÍTULO 9
Experimentos factoriales
Ahora se puede expresar a las medias de tratamiento mij en función de αi, βj y de γij. De la
ecuación (9.40) se tiene que
mij ⫽ m ⫹ αi ⫹ βj ⫹ γij
(9.45)
Para cada observación Xijk se define εijk ⫽ Xijk ⫺ mij, la diferencia entre la media de la observación y su media de tratamiento. Las cantidades εijk se llaman errores. De aquí que
Xijk ⫽ mij ⫹ εijk
(9.46)
Al combinar las ecuaciones (9.46) y (9.45) se obtiene el modelo ANOVA de dos sentidos:
Xijk ⫽ m ⫹ αi ⫹ βj ⫹ γij ⫹ εijk
(9.47)
Cuando todas las interacciones γij son iguales a 0, se dice que el modelo aditivo es aplicable.
Bajo el modelo aditivo, la ecuación (9.45) será
mij ⫽ m ⫹ αi ⫹ βj
(9.48)
y la ecuación (9.47) será
Xijk ⫽ m ⫹ αi ⫹ βj ⫹ εijk
(9.49)
Bajo el modelo aditivo, la media de tratamiento mij es igual a la gran media de la población
µ, más una cantidad αi que es resultado de utilizar el renglón i más otra βj que es resultado
de utilizar la columna j. En otras palabras, el efecto combinado de utilizar el renglón de nivel
i junto con la columna de nivel j se encuentra al sumar los efectos principales individuales de
los dos niveles. Cuando alguna o todas las interacciones no son iguales a 0, el modelo aditivo no vale, y el efecto combinado de un nivel de renglón y un nivel de columna no puede determinarse a partir de sus principales efectos individuales.
Ahora se mostrará cómo estimar los parámetros para el modelo completo de dos sentidos (9.47). El procedimiento para el modelo aditivo es exactamente el mismo, excepto que no
se estiman las interacciones γij. El procedimiento es directo. Primero se define alguna notación para varios promedios de los datos Xijk, utilizando como ejemplo los datos de la tabla 9.2.
La tabla 9.4 presenta el promedio de la producción de las cuatro operaciones para cada reactivo y catalizador de la tabla 9.2.
–
TABLA 9.4 Promedio de las producciones X ij. para operaciones de un proceso
químico utilizando diferentes combinaciones de reactivos y catalizadores
Catalizador
1
Reactivo
2
3
Media del renglón X i..
A
B
C
D
84.85
75.35
70.30
73.18
89.13
79.40
76.65
81.10
85.28
84.65
78.20
77.23
86.42
79.80
75.05
77.17
Media de la
columna X .j.
75.92
81.57
81.34
Gran media muestral
X... ⫽ 79.61
Cada número en el cuerpo de la tabla 9.4 es el promedio de los cuatro números en la
celda correspondiente de la tabla 9.2. Éstos se llaman las medias de las celdas. Se denotan
–
por X ij. y se definen como
K
1
X ij. =
Xij k
(9.50)
K k=1
9.3
Experimentos de dos factores
663
Al promediar las medias de las celdas a través de los renglones se obtienen las medias de ren–
glón X i..:
J
J
K
1
1
(9.51)
Xij k
Xi.. =
Xij. =
J j =1
J K j =1 k=1
Asimismo, cuando se promedian las medias de las celdas hacia abajo de las columnas se ob–
tienen las medias de columna X .j.:
X .j.
I
I
K
1
1
Xij k
=
X ij. =
I i=1
I K i=1 k=1
(9.52)
–
La gran media muestral X ... se puede encontrar al calcular el promedio de las medias de renglón, el promedio de las medias de la columna, el promedio de las medias de la celda, o el
promedio de todas las observaciones:
I
J
I
I
J
J
K
1
1
1
1
X... =
Xi.. =
X.j. =
X ij. =
Xij k (9.53)
I i=1
J j =1
I J i=1 j =1
I J K i=1 j =1 k=1
Ahora se describe como estimar los parámetros en el modelo ANOVA de dos sentidos.
La idea fundamental es que la mejor estimación de la media del tratamiento mij es la media
–
de la celda X ij., que representa el promedio de las observaciones muestrales que tiene ese tra–
– es la media del renglón X
tamiento. Se tiene que la mejor estimación de la cantidad m
i.
i.., la
–
– es la media de la columna X , y la mejor estimación de
mejor estimación de la cantidad m
.j
.j.
–
la gran media de la población µ es la gran media muestral X .... Se estiman los efectos de renglón que αi, los efectos columna βj, y las interacciones γij al sustituir estas estimaciones en las
ecuaciones de la (9.41) a la (9.43).
–
–
α̂i ⫽ X i.. ⫺ X ...
–
–
β̂ j ⫽ X .j. ⫺ X ...
–
–
–
–
γˆij ⫽ X ij. ⫺ X i.. ⫺ X .j. ⫹ X ...
(9.54)
(9.55)
(9.56)
Los efectos renglón, los efectos columna y las interacciones satisfacen las restricciones dadas
en la ecuación (9.44). Realizando un poco de álgebra, se puede demostrar que sus estimaciones satisfacen las mismas restricciones:
I
i=1
Ejemplo
9.14
αi = 0
J
j =1
βj = 0
I
i=1
γij =
J
j =1
γij = 0
(9.57)
Calcule los efectos estimados de renglón, de columna y las interacciones para los datos de la
tabla 9.2.
Solución
Mediante las cantidades de la tabla 9.4 y las ecuaciones (9.54) a (9.56) se calcula
α̂1 ⫽ 86.42 ⫺ 79.61 ⫽ 6.81
α̂3 ⫽ 75.05 ⫺ 79.61 ⫽ ⫺4.56
α̂2 ⫽ 79.80 ⫺ 79.61 ⫽ 0.19
α̂4 ⫽ 77.17 ⫺ 79.61 ⫽ ⫺2.44
664
CAPÍTULO 9
Experimentos factoriales
β̂ 1 ⫽ 75.92 ⫺ 79.61 ⫽ ⫺3.69
β̂ 3 ⫽ 81.34 ⫺ 79.61 ⫽ 1.73
γˆ11 ⫽ 2.12
γˆ21 ⫽ ⫺0.76
γˆ31 ⫽ ⫺1.06
γˆ41 ⫽ ⫺0.30
β̂ 2 ⫽ 81.57 ⫺ 79.61 ⫽ 1.96
γˆ12 ⫽ 0.75
γˆ22 ⫽ ⫺2.36
γˆ32 ⫽ ⫺0.36
γˆ42 ⫽ 1.97
γˆ13 ⫽ ⫺2.87
γˆ23 ⫽ 3.12
γˆ33 ⫽ 1.42
γˆ43 ⫽ ⫺1.67
Utilizando un ANOVA de dos sentidos para probar hipótesis
Un análisis de varianza de dos sentidos está diseñado para responder tres preguntas principales:
1.
2.
3.
¿El modelo aditivo vale?
¿Si es así, la media del resultado es la misma para todos los niveles del factor renglón?
¿Si es así, la media del resultado es la misma para todos los niveles del factor columna?
En general, se hacen las preguntas 2 y 3 solamente cuando se cree que el modelo aditivo
puede valer. Esto último se analizará con profundidad más adelante. Las tres preguntas son indicadas para la realización de pruebas de hipótesis. Las hipótesis nulas para estas pruebas son:
1.
Para probar si el modelo aditivo vale se prueba la hipótesis nula de que todas las interacciones son iguales a 0:
H0 : γ11 ⫽ γ12 ⫽ . . . ⫽ γIJ ⫽ 0
2.
Si esta hipótesis nula es verdadera, el modelo aditivo vale.
Para probar si la media del resultado es igual para todos los niveles del factor renglón, se
prueba la hipótesis nula de que todos los efectos renglón son iguales a 0:
H0 : α1 ⫽ α2 ⫽ . . . ⫽ αI ⫽ 0
3.
Si esta hipótesis nula es verdadera, entonces la media del resultado es igual para todos
los niveles del factor renglón.
Para probar si la media del resultado es igual para todos los niveles del factor columna,
se prueba la hipótesis nula de que todos los efectos columna son iguales a 0:
H0 : β1 ⫽ β2 ⫽ . . . ⫽ βJ ⫽ 0
Si esta hipótesis nula es verdadera, entonces la media del resultado es igual para todos
los niveles del factor columna.
Ahora se describen las pruebas usuales para estas hipótesis nulas. Para que las pruebas
sean válidas, las siguientes condiciones deben valer:
9.3
665
Experimentos de dos factores
Supuestos para un ANOVA de dos sentidos
Las pruebas usuales de hipótesis ANOVA de dos sentidos son válidas bajo las siguientes condiciones:
1. El diseño debe estar completo.
2. El diseño debe ser balanceado.
3. El número de réplicas por tratamiento, K, deber ser al menos 2.
4. Dentro de cualquier tratamiento, las observaciones Xij1, . . . , XijK constituyen una
muestra aleatoria simple de una población normal.
5. La varianza poblacional es igual para todos los tratamientos. Esta varianza se denota mediante s2.
Igual que con un ANOVA de un sentido, las pruebas usuales para estas hipótesis nulas
están basadas en las sumas de los cuadrados. Específicamente, son la suma de los cuadrados
de renglón (SSA), de los cuadrados de columna (SSB), de los cuadrados de interacción
(SSAB), y de los cuadrados del error (SSE). También es de interés la suma total de los cuadrados (SST), que es igual a la suma de las otras. Las fórmulas para estas sumas de cuadrados son:
SSA = J K
SSB = I K
SSAB = K
=K
SSE =
SST =
I
i=1
J
j =1
αi2 = J K
2
βj = I K
I
J
i=1 j =1
I
J
i=1 j =1
I
i=1
J
j =1
γij2 = K
2
i=1 j =1 k=1
I
J
K
i=1 j =1 k=1
(X.j. − X... )2 = I K
I
J
X ij. − J K
I
K
J
(X i.. − X... )2 = J K
i=1 j =1
I
i=1
I
i=1
J
j =1
2
2
(9.58)
2
2
(9.59)
Xi.. − I J KX ...
X .j. − I J KX ...
(Xij. − Xi.. − X .j. + X ... )2
2
X i.. − I K
(Xij k − Xij. )2 =
(Xij k − X ... )2 =
J
j =1
2
2
(9.60)
X .j. + I J KX ...
I
K
J
i=1 j =1 k=1
I
J
K
i=1 j =1 k=1
Xij2 k − K
I
J
2
(9.61)
Xij.
i=1 j =1
2
Xij2 k − I J KX...
(
(9.62)
Se puede ver, de las expresiones que están más a la derecha en las ecuaciones (9.58) a (9.62),
que la suma total de los cuadrados, SST, es igual a la suma de las otras. Ésta es la identidad
del análisis de varianza para un ANOVA de dos sentidos.
666
CAPÍTULO 9
Experimentos factoriales
La identidad del análisis de varianza
SST ⫽ SSA ⫹ SSB ⫹ SSAB ⫹ SSE
(9.63)
Junto con cada suma de los cuadrados aparece una cantidad conocida como sus grados
de libertad. Las sumas de los cuadrados y sus grados de libertad, en general, se presentan en
una tabla ANOVA. La tabla 9.5 presenta los grados de libertad para cada suma de los cuadrados, junto con la fórmula más conveniente para el cálculo. Se indica que los grados de libertad para SST es la suma de los grados de libertad para las otras sumas de los cuadrados.
TABLA 9.5 Tabla ANOVA para un ANOVA de dos sentidos
Fuente
Grados de libertad
Renglones (SSA)
I −1
Columnas (SSB)
J −1
Interacciones(SSAB)
(I − 1)(J − 1)
Suma de los cuadrados
JK
I
i=1
IK
J
j =1
K
αi2 = J K
2
βj = I K
J
I
i=1 j =1
I
i=1
J
j =1
γij2 = K
2
2
2
2
Xi.. − I J KX ...
X .j. − I J KX ...
J
I
i=1 j =1
2
X ij. − J K
I
2
Xi..
i=1
J
−I K
IJ (K − 1)
IJK − 1
I
Error (SSE)
i=1
I
Total (SST)
i=1
J
j =1
J
j =1
j =1
2
K
k=1
(Xij k −Xij. )2 =
K
k=1
2
X .j. + I J KX ...
J
K
I
i=1
k=1
I
(Xij k − X... )2 =
j =1
Xij2 k−K
i=1
J
j =1
J
I
2
Xij.
i=1 j =1
K
k=1
2
Xij2 k − I J KX...
Observe que la magnitud de SSA depende de la magnitud de los efectos de renglón estimados α̂i. Por tanto, cuando los efectos de renglón verdaderos αi son iguales a 0, SSA tenderá a ser más pequeña, y cuando algunos de los efectos de renglón verdaderos no sean
iguales a 0, SSA será mayor. Por tanto, se rechazará a H0 : α1 ⫽ . . . ⫽ αI ⫽ 0 cuando SSA
sea suficientemente grande. De manera semejante, SSB tenderá ser más pequeña cuando los
efectos de columna verdaderos βj sean iguales a 0 y mayor cuando algunos efectos de columna no sean 0, y SSAB tenderá a ser más pequeña cuando las interacciones verdaderas γij sean
todas iguales a 0 y mayor cuando algunas interacciones no sean 0. Por tanto, se rechazará H0 :
β1 ⫽ . . . ⫽ βJ ⫽ 0 cuando SSB sea suficientemente grande, y se rechazará H0 : γ11 ⫽ . . . ⫽
γIJ ⫽ 0 cuando SSAB sea muy grande.
Se puede determinar si SSA, SSB y SSAB son bastante grandes comparándolas con la
suma de los cuadrados del error, SSE. Como en el ANOVA de un sentido (sección 9.1), SSE
9.3
Experimentos de dos factores
667
depende solamente de las distancias entre las observaciones y sus propias medias de celda.
Por tanto, SSE mide sólo la variación aleatoria inherente al proceso y no está afectado por los
valores de los efectos de renglón, los de columna o las interacciones.
Para comparar SSA, SSB y SSAB con SSE, primero se divide cada suma de los cuadrados entre sus grados de libertad, produciendo cantidades conocidas como medias cuadráticas. Estas últimas se denotan mediante MSA, MSB, MSAB y MSE, están definidas así:
SSB
SSA
MSB =
I −1
J −1
SSE
MSE =
I J (K − 1)
MSA =
MSAB =
SSAB
(I − 1)(J − 1)
(9.64)
Los estadísticos de prueba para las tres hipótesis nulas son los cocientes de MSA, MSB
y MSAB con MSE. Las distribuciones nulas de estos estadísticos de prueba son las distribuciones F. Específicamente,
MSA tiene una distribución F
Bajo H0 : α1 ⫽ . . . ⫽ αI ⫽ 0, el estadístico —–—
I ⫺ 1, IJ(K ⫺ 1).
MSE
MSB tiene una distribución F
Bajo H0 : β1 ⫽ . . . ⫽ βJ ⫽ 0, el estadístico —–—
J ⫺ 1, IJ(K ⫺ 1).
MSE
MSAB tiene una distribución F
Bajo H0 : γ11 ⫽ . . . ⫽ γIJ ⫽ 0, el estadístico ———
(I ⫺ 1)(J ⫺ 1), IJ(K ⫺ 1).
MSE
En la práctica, las sumas de cuadrados, las medias cuadráticas y los estadísticos de
prueba generalmente se calculan utilizando una computadora. El siguiente resultado de MINITAB presenta la tabla ANOVA para los datos de la tabla 9.2.
Two-way ANOVA: Yield versus Catalyst, Reagent
Source
Catalyst
Reagent
Interaction
Error
Total
DF
3
2
6
36
47
SS
877.56
327.14
156.98
1125.33
2487.02
S = 5.591
R-sq = 54.75%
MS
292.521
163.570
26.164
31.259
F
9.36
5.23
0.84
P
0.000
0.010
0.550
R-Sq(adj) = 40.93%
Las etiquetas DF, SS, F y P se refieren a los grados de libertad, suma de cuadrados, media
cuadrática, los estadísticos F, y P-valor, respectivamente. Como en un ANOVA de un sentido, la media cuadrática para el error (MSE) es una estimación de la varianza del error s2, la
cantidad “S” representa la raíz cuadrada de MSE y es una estimación de la desviación estándar del error s. Las cantidades “R-sq” y “R-sq(adj)” se calculan con fórmulas similares a las
del ANOVA de un sentido.
668
Ejemplo
9.15
CAPÍTULO 9
Experimentos factoriales
Utilice la tabla ANOVA anterior para determinar si el modelo aditivo es creíble para los datos de producción. Si lo fuera, ¿se puede concluir que el catalizador o el reactivo afecta la producción?
Solución
Primero se verifica si el modelo aditivo es creíble. El P-valor para las interacciones es 0.55,
que no es pequeño. Por tanto, no se rechaza la hipótesis nula de que todas las interacciones
son iguales a 0, y se concluye que el modelo aditivo es creíble. En consecuencia, ahora la siguiente pregunta es si los factores renglón o columna afectan el resultado. Se ve de la tabla
que el P-valor para los efectos de renglón (catalizador) es 0 aproximadamente, por lo que se
concluye que el catalizador afecta la producción. De manera similar, el P-valor para los efectos de columna (reactivo) es pequeño (0.010), por lo que se concluye que el reactivo también
afecta la producción.
Ejemplo
9.16
El artículo “Uncertainty in Measurements of Dermal Absorption of Pesticides” (W. Navidi y A.
Bunge, en Risk Analysis, 2002:1175-1182) describe un experimento en el que se aplicó un pesticida a piel en diferentes concentraciones y distintos tiempos. El resultado es la cantidad del
pesticida que absorbió la piel. El siguiente resultado de MINITAB presenta la tabla ANOVA.
¿El modelo aditivo es creíble? Si es así, ¿afecta la concentración o la duración la cantidad absorbida?
Two-way ANOVA: Absorbed versus Concentration, Duration
Source
Concent
Duration
Interaction
Error
Total
DF
2
2
4
27
35
SS
49.991
19.157
0.337
6.250
75.735
MS
24.996
9.579
0.084
0.231
F
107.99
41.38
0.36
P
0.000
0.000
0.832
Solución
El P-valor para la interacción es 0.832, por lo que se concluye que el modelo aditivo es creíble. Los P-valores tanto para la concentración como para la dosis son muy pequeños. Por tanto, se deduce que tanto la concentración como la duración afectan la cantidad absorbida.
Comprobación de los supuestos
Se puede utilizar una gráfica de residuos para comprobar el supuesto de las variancias iguales, y una gráfica de probabilidad normal de los residuos para verificar la normalidad. La grá–
fica de residuos traza los residuos Xijk. ⫺ X ij. contra los valores ajustados, que son las medias
–
muestrales X ij.. Las figuras 9.6 y 9.7 presentan tanto una gráfica de probabilidad normal co-
9.3
Experimentos de dos factores
669
mo una de residuos para los datos de la producción que se encuentran en la tabla 9.2. Parece
que los supuestos se satisfacen bien.
0.999
0.99
0.95
0.9
0.75
0.5
0.25
0.1
0.05
0.01
0.001
⫺10
0
⫺5
5
10
FIGURA 9.6 Gráfica de probabilidad normal para los residuos a partir de los datos de producción. No hay evidencia de fuerte desviación de la normalidad.
10
Residuo
5
0
⫺5
⫺10
70
75
80
Valor ajustado
85
90
FIGURA 9.7 Gráfica de residuos para los datos de producción. No hay evidencias contra
el supuesto de las variancias iguales.
No interprete los efectos principales
cuando el modelo aditivo no vale
Cuando las interacciones son suficientemente pequeñas para que el modelo aditivo sea creíble, la interpretación de los efectos principales es muy directa, como se muestra en los ejemplos 9.15 y 9.16. Sin embargo, cuando el modelo aditivo no vale, no siempre es fácil
interpretar los efectos principales. He aquí un ejemplo hipotético para ilustrar el punto. Su-
670
CAPÍTULO 9
Experimentos factoriales
ponga que un proceso está operando bajo condiciones obtenidas al variar dos factores diferentes en dos niveles cada uno. Se hacen dos operaciones en cada una de las cuatro combinaciones de niveles de renglón y de columna. Cada vez se mide la producción y se obtienen los
resultados que se presentan en la tabla siguiente.
Nivel de
renglón
1
2
Nivel de columna
1
2
51, 49
43, 41
43, 41
51, 49
Obviamente, si se desea maximizar la producción, los factores de renglón y de columna son
importantes, se quiere aparear ya sea el nivel de renglón l con el nivel de columna 1 o el nivel de renglón 2 con el nivel de columna 2.
Ahora mire la tabla siguiente de ANOVA.
Source
Row
Column
Interaction
Error
Total
DF
1
1
1
4
7
SS
0.0000
0.0000
128.00
8.0000
136.00
MS
0.0000
0.0000
128.00
2.0000
F
0.00
0.00
64.00
P
1.000
1.000
0.001
Los efectos principales de la suma de los cuadrados tanto para el renglón como para la columna son iguales a 0, y sus P-valores son iguales a 1, que es el P-valor más grande que puede haber. Si se continúa con el procedimiento usado en los ejemplos 9.15 y 9.16, se concluirá
que ni el factor de renglón ni el factor de columna afectan la producción. Pero es claro de los
datos que los factores de renglón y de columna afectan la producción. Lo que está ocurriendo es que ambos no importan en promedio. El nivel 1 del factor renglón es mejor si se usa el
nivel 1 del factor columna, y el nivel 2 del factor renglón es mejor si se usa nivel 2 del factor
columna. Cuando se determina el promedio sobre dos niveles del factor columna, los niveles
del factor renglón tienen la misma media de producción. Asimismo, los niveles columna tienen la misma media de producción cuando se promedian sobre los niveles del factor renglón.
Cuando los efectos de los niveles de renglón dependen de cuáles niveles columna se han apareado, y viceversa, los efectos principales pueden ser engañosos.
El P-valor para las interacciones es el que indica que no se trata de interpretar los efectos principales. Este P-valor es muy pequeño, por lo que se rechaza el modelo aditivo. Entonces se sabe que algunas de las interacciones son diferentes de cero, por lo que los efectos de
los niveles de renglón dependen de los niveles de columna, y viceversa. En consecuencia,
cuando se rechaza el modelo aditivo no se debe tratar de interpretar los efectos principales.
Se necesita observar en las mismas medias de celda para determinar cómo afectan el resultado las diferentes combinaciones de los niveles de renglón y de columna.
9.3
Experimentos de dos factores
671
Resumen
En un análisis de varianza de dos sentidos:
Si el modelo aditivo no es rechazado, entonces las pruebas de hipótesis para los
efectos principales se pueden utilizar para determinar si los factores renglón o columna afectan el resultado.
Si el modelo aditivo es rechazado, entonces las pruebas de hipótesis para los efectos principales no se deben utilizar. En lugar de eso, se deben examinar las medias
de celda para determinar cómo afectan el resultado las diferentes combinaciones
de los niveles de renglón y de columna.
Ejemplo
9.17
El espesor de la capa de dióxido de silicio en una placa semiconductora es crucial para su desempeño. En el artículo “Virgin Versus Recycled Wafers for Furnace Qualification: Is the Expense Justified?” (V. Czitrom y J. Reece, en Statistical Case Studies for Process Improvement,
SIAM-ASA, 1997:87-103) se midió el espesor de la capa de óxido para tres tipos de placas:
placas vírgenes, placas recicladas en la empresa, y placas recicladas por un proveedor externo. Además se utilizaron diferentes posiciones en el horno para crecer la capa de óxido. Se
realizó un ANOVA de dos sentidos por tres operaciones en una empresa de fabricación de placas para los tres tipos de placas en tres ubicaciones del horno. Los datos se presentan en la tabla siguiente, seguida por el resultado de MINITAB.
Ubicación en
el horno
1
1
1
2
2
2
3
3
3
Tipo de placa
Virgen
En la empresa
Externa
Virgen
En la empresa
Externa
Virgen
En la empresa
Externa
Espesor de la
capa de óxido (A)
90.1
90.4
92.6
91.9
90.3
88.3
88.1
91.0
91.5
90.7
88.8
90.0
88.6
91.9
88.2
90.2
90.4
89.8
89.4
90.6
93.3
89.7
91.5
89.4
86.6
90.2
89.8
Two-way ANOVA for Thickness versus Wafer, Location
Source
Wafer
Location
Interaction
Error
Total
DF
2
2
4
18
26
SS
5.8756
4.1089
21.349
25.573
56.907
MS
2.9378
2.0544
5.3372
1.4207
F
2.07
1.45
3.76
P
0.155
0.262
0.022
672
CAPÍTULO 9
Experimentos factoriales
Debido a que las placas recicladas son más baratas, la compañía espera que no haya ninguna diferencia en el espesor de la capa de óxido entre los tres tipos de chips. Si es posible,
determine si los datos son consistentes con la hipótesis de ninguna diferencia. Si no posible, explique por qué.
Solución
El P-valor para las interacciones es 0.022, que es pequeño. Por tanto, el modelo aditivo no es
creíble por lo que no se pueden interpretar los efectos principales. Un aspecto positivo es hacer una tabla de las medias de la celda. La tabla 9.6 presenta la media muestral para cada tratamiento.
TABLA 9.6 Medias muestrales para cada tratamiento
Tipo de placa
En la empresa Externa
Ubicación en
el horno
Virgen
1
2
3
90.067
90.067
88.300
89.933
91.233
90.533
91.967
88.633
90.367
Media de
la columna
89.478
90.566
90.322
Media del
renglón
90.656
89.978
89.733
De la tabla 9.6 se puede ver que los espesores varían entre los tipos de placa, pero ninguno de éstos produce la capa de óxido más gruesa o más angosta. Por ejemplo, en la ubicación 1
del horno las placas recicladas externamente producen la capa más gruesa, mientras las placas
recicladas en la empresa producen la más angosta. En la ubicación 2 del horno se invierte el orden: las placas en la empresa producen la capa más gruesa mientras las externas la más angosta. Esto último es atribuible a la interacción de la ubicación del horno y del tipo de placa.
Un ANOVA de dos sentidos no es lo mismo
que dos ANOVA de un sentido
En el ejemplo 9.17 se presentó un ANOVA de dos sentidos con tres niveles de renglón y tres
de columna, para un total de nueve tratamientos. Si se corrieran los ANOVA de un sentido separados, habría solamente seis tratamientos. Lo anterior significa que en la práctica correr por
separado los ANOVA de un sentido para cada factor podría ser menos costoso que correr un
ANOVA de dos sentidos. Desgraciadamente, a veces este diseño de “uno-a-la-vez” se usa en
la práctica por esta razón. Es importante darse cuenta que correr análisis de un sentido de factores individuales puede dar resultados engañosos cuando las interacciones están presentes. Para ver esto, mire la tabla 9.6. Suponga que un ingeniero está tratando de encontrar la
combinación de horno y ubicación que producirá la capa de óxido más angosta. Primero corra
el proceso una vez en cada ubicación del horno, utilizando placas recicladas de la empresa,
porque esas placas son las que actualmente se usan en la producción. La ubicación 1 del horno produce la capa más angosta para las placas de la empresa. Ahora el ingeniero corre el proceso una vez para cada tipo de placa, todas en la ubicación 1, que fue la mejor para las placas
de la empresa. De los tres tipos de placa las placas en la empresa producen la capa más angosta en la ubicación 1. Así que la conclusión que se obtiene del análisis uno-a-la-vez es que las
capas más angostas se producen mediante la combinación de placas de la empresa en la ubica-
9.3
Experimentos de dos factores
673
ción 1 del horno. Una mirada a la tabla 9.6 muestra que la conclusión es falsa. Hay dos combinaciones de ubicación de horno y tipo de placa que producen capas más angostas que ésta.
El método de uno-a-la-vez supone que la placa que produce las capas más angostas en
una ubicación producirá las más angostas en todas las ubicaciones, y que la ubicación que
produce las capas más angostas para un tipo de placa producirá las capas más angostas para
todos los tipos. Esto último equivale a suponer que no hay ninguna interacción entre los factores, que en el caso de las placas y las ubicaciones es incorrecto. En resumen, el método unoa-la-vez falla porque no puede detectar las interacciones entre los factores.
Resumen
Cuando hay dos factores se debe usar un diseño de dos factores.
El examen de un factor a la vez no puede revelar las interacciones entre los factores.
Gráficas de interacción
Las gráficas de interacción pueden ayudar a visualizar las interacciones. La figura 9.8 presenta una gráfica de interacción para los datos de placa. Se describe el método con el que se construyó esta gráfica. El eje vertical representa la respuesta: el espesor de capa. Se elige un factor
para que se represente en el eje horizontal. Se eligió la ubicación de horno; habría sido igualmente aceptable haber elegido el tipo de placa. Ahora se continúa a través de los niveles del
factor tipo de placa. Se inicia con las placas externas. Las tres medias de la celda para placas
externas, como se muestran en la tabla 9.6, son 91.967, 88.633, y 90.367, que corresponden
a las ubicaciones del horno 1, 2 y 3, respectivamente. Estos valores se trazan arriba de sus ubicaciones respectivas en el horno y se conectan con segmentos de recta. Este procedimiento se
repite en los otros dos tipos de placa para terminar la gráfica.
Espesor de la capa de óxido
92
Placas de la
empresa
91
90
Placas
externas
89
88
Placas
vírgenes
1
2
Ubicación en el horno
3
FIGURA 9.8 Gráfica de interacción para los datos de placa. Las rectas están lejos de ser
paralelas, ello indica una importante interacción entre los factores.
CAPÍTULO 9
Experimentos factoriales
En cuanto a los datos de la placa, las medias para placas externas siguen un patrón considerablemente diferente que las de los otros dos tipos de placa. Ésta es la fuente de la interacción importante y es la razón por la cual los efectos principales de placa y tipo de horno no
se pueden interpretar con facilidad. En comparación, para los datos perfectamente aditivos,
para los cuales las interacciones estimadas γˆij son iguales a 0, los segmentos de recta en la
gráfica de interacción son paralelos. La figura 9.9 ilustra este caso hipotético.
Medida de la respuesta
674
Niveles del
Factor B
Niveles del Factor A
FIGURA 9.9 Gráfica de interacción para datos hipotéticos con estimaciones de la interacción γˆij iguales a 0. Los segmentos de recta son paralelos.
La figura 9.10 presenta una gráfica de interacción para los datos de producción. Las medias de celda se presentaron en la tabla 9.4. Las líneas no son paralelas, pero sus pendientes
se acoplan mejor que para los datos de placa. Esto último indica que las estimaciones de la
interacción son diferentes de cero, pero son más pequeñas que los datos de la placa. En efecto, el P-valor para la prueba de la hipótesis nula de ninguna interacción fue 0.550 (véase la p.
667). La desviación del paralelismo que se presenta en la figura 9.10 es, por tanto, bastante
pequeña para ser consistente con la hipótesis de ninguna interacción.
Comparaciones múltiples en un ANOVA de dos sentidos
Se utiliza una prueba F para probar la hipótesis nula de que todos los efectos renglón (o todos los efectos columna) sean iguales a 0. Si la hipótesis nula es rechazada, se puede concluir
que algunos de dichos efectos difieren entre sí. Pero la hipótesis de la prueba no dice cuáles
son diferentes del resto. Si el modelo aditivo es creíble, entonces se puede aplicar el método
de comparaciones múltiples de Tukey (relacionado con el método de Tukey-Kramer descrito
en la sección 9.2) para determinar cuáles pares de los efectos renglón o columna difieren entre sí. El método se describe en el cuadro siguiente.
9.3
Experimentos de dos factores
675
90
Producción
85
Reactivo 2
80
Reactivo 3
Reactivo 1
75
70
A
B
C
Catalizador
D
FIGURA 9.10 Gráfica de interacción para los datos de producción.
Método de Tukey para intervalos de confianza y pruebas de hipótesis para un
ANOVA de dos sentidos
Sea I el número de niveles de un factor renglón, J el número de niveles del factor columna, y K el tamaño muestral para cada tratamiento. Entonces, si el modelo aditivo es creíble, los intervalos de confianza simultáneos de nivel 100(1 ⫺ α)% para
todas las diferencias αi ⫺ αj (o para todas las diferencias βi ⫺ βj) son
MSE
MSE
αi − αj ± qI,IJ(K−1),α
βi − βj ± qJ,IJ(K−1),α
JK
IK
Se tiene una confianza de 100(1 ⫺ α)% de que los intervalos de confianza de Tukey
contengan el verdadero valor de la diferencia αi ⫺ αj (o βi ⫺ βj) para cada i y j.
βj
y
j
MSE
Para cada par de niveles i y j para los cuales |αi − αj | > qI,IJ(K−1),α
, la
JK
hipótesis nula H0 : αi ⫺ αj ⫽ 0 se rechaza con un nivel de α.
MSE
, la
Para cada par de niveles i y j para los cuales |β i − β j | > qJ,IJ(K−1),α
IK
hipótesis nula H0 : βi ⫺ βj ⫽ 0 se rechaza al nivel αt .
Ejemplo
9.18
En el ejemplo 9.14 los efectos principales y las interacciones fueron calculados para los datos de producción de la tabla 9.2. Una tabla ANOVA para estos datos se presentó en la p. 667.
Si es adecuado, utilice el método de Tukey para determinar qué pares de catalizadores y de
reactivos difieren con un nivel de 5%, en su efecto sobre la producción.
676
CAPÍTULO 9
Experimentos factoriales
Solución
De la tabla ANOVA, el P-valor para las interacciones es 0.550. Por tanto, el modelo aditivo
es creíble, por lo que es adecuado utilizar el método de Tukey. El catalizador es el factor renglón y el reactivo lo es de columna, por lo que I ⫽ 4, J ⫽ 3 y K ⫽ 4. De la tabla ANOVA,
MSE ⫽ 31.259.
Primero se encuentran todos los pares para los cuales los efectos de renglón son diferentes con un nivel de 5%. Para los efectos de renglón se debe utilizar el valor q4, 36, .05. Este
valor no se encuentra en la tabla de rango studentizado (tabla A.8, Apéndice A). Por tanto, se
utiliza el valor
que está cercano (sólo ligeramente mayor que) q4, 36, .05. Se calcu√ q4, 36, .05 ⫽ 3.85, √
la q4,30,.05 MSE/J K = 3.85 31.259/12 = 6.21.
En el ejemplo 9.14 los efectos de renglón estimados fueron calculados de
α̂1 ⫽ 6.81
α̂2 ⫽ 0.19
α̂3 ⫽ ⫺4.56
α̂4 ⫽ ⫺2.44
Los pares de efectos de renglón cuyas diferencias son mayores a 6.21 son α̂1 y α̂2, α̂1 y α̂3, y
α̂1 y α̂4. Se concluye que la media de la producción del catalizador A difiere de la media de
las producciones de los catalizadores B, C y D, pero no se puede concluir que la media de las
producciones de los catalizadores B, C, y D difieren entre sí.
Ahora se encuentran todos los pares para los cuales los efectos de columna difieren con
un nivel de 5%. Para los efectos columna se debe utilizar el valor, q3, 36, .05, pero debido a que
este valor no se encuentra
√ studentizado, se utilizará el valor, q3, 30, .05 ⫽
√ en la tabla de rango
3.49. Se calcula q3,30,.05 MSE/I K = 3.49 31.259/16 = 4.88.
En el ejemplo 9.14 los efectos de columna estimados fueron calculados de
β̂ 1 ⫽ ⫺3.69
β̂ 2 ⫽ 1.96
β̂ 3 ⫽ 1.73
Los pares de los efectos de columna cuyas diferencias son mayores a 4.88 son β̂ 1 y β̂ 2 y β̂ 1 y
β̂ 3. Se concluye que la media de la producción del reactivo 1 es diferente de la media de las
producciones de los reactivos 2 y 3, pero no se puede concluir que la media de las producciones de los reactivos 2 y 3 difieran entre sí.
ANOVA de dos sentidos cuando K ⫽ 1
Las pruebas F que se han presentado requieren del supuesto que el tamaño muestral K para
cada tratamiento sea al menos de 2. La razón para esto último consiste en que cuando K ⫽ 1,
–
la suma de los cuadrados del error (SSE) es igual a 0, puesto que Xijk ⫽ X ij. para cada i y j.
Además, los grados de libertad para SSE, que están dados por IJ(K ⫺ 1), es igual a 0 cuando
K ⫽ 1.
Cuando K ⫽ 1, no se puede realizar un ANOVA de dos sentidos, a menos que se tenga
la seguridad de que el modelo aditivo vale. En este caso, puesto que se ha supuesto que las
interacciones sean iguales a cero, se pueden utilizar la media cuadrática para la interacción
(MSAB; véase la ecuación 9.64) y sus grados de libertad; en este sentido, en lugar de MSE,
pruébense los efectos principales de renglón y de columna.
Factores aleatorios
El análisis de los experimentos de dos factores se ha concentrado en el caso donde ambos factores son fijos. Se dice que un experimento sigue un modelo de efectos fijos. También se pueden diseñar los experimentos para que uno o los dos factores sean aleatorios. Si ambos
9.3
Experimentos de dos factores
677
factores lo son, se dice que el experimento sigue un modelo de efectos aleatorios. Si un factor es fijo y el otro es aleatorio, se dice que el experimento sigue un modelo mezclado.
Para el caso de un factor, el análisis es el mismo tanto para modelos de efectos fijos como aleatorios, mientras que la hipótesis nula de la prueba es diferente. En este contexto, para el caso de dos factores, tanto los métodos de análisis como las hipótesis nulas difieren entre
los modelos de efectos fijos, los aleatorios y los mezclados. Los métodos para modelos en los
cuales uno o más efectos son aleatorios se pueden encontrar en textos más avanzados, como
Hocking (2003).
Diseños desbalanceados
Se ha supuesto que el diseño sea balanceado; es decir, que el número de réplicas sea igual en
cada tratamiento. Los métodos que aquí se han descrito no son aplicables a diseños desbalanceados. Sin embargo, los diseños desbalanceados que están completos se pueden analizar con
los métodos de regresión múltiple. Se puede consultar un texto avanzado, como Draper y
Smith (1998), para los detalles.
Ejercicios para la sección 9.3
1. Para tasar el efecto del tipo de anillo del pistón y del tipo de aceite en el desgaste del anillo del pistón, se estudiaron tres tipos
del primero y cuatro tipos del segundo. Se midió el número de miligramos de material perdido por el anillo en cuatro horas de
uso en tres réplicas de un experimento, se realizaron para cada una de las 12 combinaciones del tipo de aceite y del tipo de anillo de pistón. Con el tipo de aceite como el efecto renglón y tipo de anillo del pistón como el efecto columna, se observaron
las siguientes sumas de los cuadrados: SSA ⫽ 1.0926, SSB ⫽ 0.9340, SSAB ⫽ 0.2485, SSE ⫽ 1.7034.
a) ¿Cuántos grados de libertad hay para el efecto del tipo de aceite?
b) ¿Cuántos grados de libertad hay para el efecto del tipo de anillo del pistón?
c) ¿Cuántos grados de libertad hay para las interacciones?
d ) ¿Cuántos grados de libertad hay para el error?
e) Construya una tabla ANOVA. Puede dar rangos para los P-valores.
f ) ¿El modelo aditivo es creíble? Proporcione el valor del estadístico de prueba y el P-valor.
g) ¿Es creíble que los efectos principales del tipo de aceite son todos iguales a 0? Proporcione el valor del estadístico de prueba y el P-valor.
h) ¿Es creíble que los efectos principales del tipo de anillo del pistón sean todos iguales a 0? Proporcione el valor del estadístico de prueba y el P-valor.
2. Una tienda de maquinaria utiliza tres máquinas para pulir con precisión rodillos para levas. Se emplearon tres operarios para pulir los rodillos en las máquinas. En un experimento para determinar si hay diferencias en el producto entre las máquinas o entre
sus operarios, cada uno de éstos trabajó en cada máquina durante cuatro días diferentes. El resultado medido fue la producción
diaria de partes que satisfacían las especificaciones. Con el operario como el efecto renglón y la máquina como el efecto columna, se observaron las siguientes sumas de los cuadrados: SSA ⫽ 3 147.0, SSB ⫽ 136.5, SSAB ⫽ 411.7, SSE ⫽ 1 522.0.
a) ¿Cuántos grados de libertad hay para el efecto operario?
b) ¿Cuántos grados de libertad hay para el efecto máquina?
c) ¿Cuántos grados de libertad hay para las interacciones?
d ) ¿Cuántos grados de libertad hay para el error?
e) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
f ) ¿El modelo aditivo es creíble? Proporcione el valor del estadístico de prueba y el P-valor.
678
CAPÍTULO 9
Experimentos factoriales
g) ¿Es creíble que los efectos principales de operador sean todos iguales a 0? Proporcione el valor del estadístico de prueba y
el P-valor.
h) ¿Es creíble que los efectos principales de máquina sean todos iguales a 0? Proporcione el valor del estadístico de prueba y
el P-valor.
3. Un experimento para determinar el efecto de la temperatura del molde sobre la fuerza de tensión implicaba tres aleaciones diferentes y cinco temperaturas de molde distintas. Se fundieron cuatro elementos de cada aleación para cada temperatura de molde. Con la temperatura de molde como el factor renglón y la aleación como el factor columna, las sumas de los cuadrados
fueron: SSA ⫽ 69 738, SSB ⫽ 8 958, SSAB ⫽ 7 275 y SST ⫽ 201 816.
a) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
b) ¿Es creíble el modelo aditivo? Explique.
c) ¿Es creíble que los efectos principales de la temperatura de molde sean todos iguales a 0? Proporcione el valor del estadístico de prueba y el P-valor.
d) ¿Es creíble que los efectos principales de aleación sean todos iguales a 0? Proporcione el estadístico de prueba del valor y
el P-valor.
4. El efecto de la presión de endurecimiento sobre la fuerza de enlace se probó en cuatro adhesivos diferentes. Había tres niveles
de presión de endurecimiento. Se realizaron cinco réplicas para cada combinación de presión de endurecimiento y adhesivo.
Con adhesivo como el factor renglón y la presión de endurecimiento como el factor columna, las sumas de los cuadrados fueron: SSA ⫽ 155.7, SSB ⫽ 287.9, SSAB ⫽ 156.7 y SST ⫽ 997.3.
a) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
b) ¿Es creíble el modelo aditivo? Explique.
c) ¿Es creíble que los efectos principales de la presión de endurecimiento sean todos iguales a 0? Proporcione el valor del estadístico de prueba y el P-valor.
d) ¿Es creíble que los efectos principales de adhesivo sean todos iguales a 0? Proporcione el valor del estadístico de prueba y
el P-valor.
5. El artículo “Change in Creep Behavior of Plexiform Bone with Phosphate Ion Treatment” (R. Regimbal, C. DePaula y N. Guzelsu, en Bio-Medical Materials and Engineering, 203:11-25) describe un experimento para estudiar los efectos con soluciones salinas y con soluciones del ion fosfato sobre las propiedades mecánicas del hueso plexiforme. La tabla siguiente presenta
las mediciones de tensión producidas para seis elementos tratados con la solución salina (NaCl) o con la solución de ion fosfato (Na2HPO4), a 25 o 37°C. (El artículo presenta solamente las medias y las desviaciones estándar; los valores en la tabla son
consistentes con éstos.)
Solución
Temperatura
NaCl
NaCl
Na2 HPO4
Na2 HPO4
25° C
37° C
25° C
37° C
Tensión producida (MPa)
138.40
92.312
120.18
123.50
130.89 94.646 96.653
147.28 116.48
88.802
129.43 139.76 132.75
128.94 102.86
99.941
116.90 88.215
114.37 90.737
137.23 121.73
161.68 136.44
a) Estime todos los efectos principales y las interacciones.
b) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
c) ¿Es creíble el modelo aditivo? Proporcione el valor del estadístico de prueba y el P-valor.
d) ¿Puede describirse el efecto de solución (NaCl contra Na2HPO4) sobre la tensión producida interpretando los efectos principales de la solución? Si es así, interprete los efectos principales, incluyendo el estadístico de prueba adecuado y el P-valor. Si no, explique por qué.
e) ¿Puede describirse el efecto de la temperatura sobre la tensión producida interpretando los efectos principales de la temperatura? Si es así, interprete los efectos principales, incluyendo el estadístico de prueba adecuado y el P-valor. Si no, explique por qué.
9.3
Experimentos de dos factores
679
6. Se realizó un estudio para determinar los efectos de dos factores sobre lo cremoso del jabón. Los dos factores eran tipo de agua
(de la llave contra desionizada) y glicerina (presente o ausente). El resultado medido fue la cantidad de espuma producida (en ml).
Se repitió el experimento tres veces para cada combinación de los factores. Los resultados se presentan en la tabla siguiente.
Tipo de agua
Glicerina
Desionizada
Desionizada
De la llave
De la llave
Ausente
Presente
Ausente
Presente
Espuma (mL)
168
160
152
139
178
197
142
160
168
200
142
160
a) Estime todos los efectos principales y las interacciones.
b) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
c) ¿Es creíble el modelo aditivo? Proporcione el valor del estadístico de prueba y el P-valor.
d ) ¿Puede describirse el efecto del tipo de agua en la cantidad de espuma al interpretar los efectos principales del tipo de agua?
Si es así, interprételos. Si no, explique por qué.
e) ¿Puede describirse el efecto de glicerina en la cantidad de espuma interpretando los efectos principales de glicerina? Si es
así, interprételos. Si no, explique.
7. Se realizó un experimento para medir los efectos de dos factores sobre la capacidad de las soluciones de limpieza para eliminar aceite de una pieza de tela. Los factores fueron la concentración del jabón (en % por peso) y la fracción de ácido láurico
en la solución. Se repitió dos veces el experimento para la combinación de cada uno de los factores. El resultado medido fue
el porcentaje de aceite eliminado. Los resultados se presentan en la tabla siguiente.
Peso % de jabón
Fracción de
ácido láurico
15
15
25
25
% de aceite
eliminado
10
30
10
30
52.8
57.8
56.4
42.7
54.0
53.3
58.4
45.1
a) Estime todos los efectos principales y las interacciones.
b) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
c) ¿Es creíble el modelo aditivo? Proporcione el valor del estadístico de prueba y el P-valor.
d ) ¿Puede describirse el efecto de concentración de jabón sobre la cantidad de aceite eliminado al interpretar los efectos principales de concentración de jabón? Si es así, interprete los efectos principales. Si no, explique.
e) ¿Puede describirse el efecto de fracción de ácido láurico sobre la cantidad de aceite eliminado con la interpretación de los
efectos principales de la fracción de ácido láurico? Si es así, interprételos. Si no, explique.
8. El artículo “A 4- Year Sediment Trap Record of Alkenones from the Filamentous Upwelling Region Off Cape Blanc, NW Africa and a Comparison with Distributions in Underlying Sediments” (P. Müller y G. Fiseher, en Deep Sea Research, 2001:18771903) estudió registros de sedimentos atrapados para valorar la transferencia de señales de agua de superficie en el registro
geológico. Los datos en la tabla siguiente son las mediciones del flujo de masa total (en mg/m2 por día) para trampas en dos
ubicaciones y a profundidades diferentes.
Ubicación Profundidad
A
A
B
B
Superior
Inferior
Superior
Inferior
Flujo
109.8
163.7
93.2
137.0
86.5
139.4
123.6
88.3
150.5
176.9
143.9
53.4
69.8
170.6
163.2
104.0
63.2
123.5
82.6
78.0
107.8
142.9
63.0
39.3
72.4
130.3
196.7
117.9
74.4
111.6
160.1
143.0
680
CAPÍTULO 9
Experimentos factoriales
a) Estime todos los efectos principales y las interacciones.
b) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
c) ¿Es creíble el modelo aditivo? Proporcione el valor del estadístico de prueba y el P-valor.
d) Calcule todas las medias de celda. Utilícelas para describir la manera en que afectan al flujo la profundidad y la ubicación.
9. Las articulaciones artificiales constan de una pelota de cerámica montada sobre un cono. El artículo “Friction in Orthopaedic
Zirconia Taper Assemblies” (W. Macdonald, A. Aspenberg y cols., en Proceedings of the Institution of Mechanical Engineers,
2000:685-692) presenta datos del coeficiente de fricción para un empujón hacia delante de 2 kN para el ensamble cónico hecho de dos aleaciones de circonio y empleando tres diferentes largos. Se hicieron cinco mediciones para cada combinación de
material y de largo. Los resultados presentados en la tabla siguiente son consistentes con las medias de celda y desviaciones
estándar presentadas en el artículo.
Material del cono
Longitud
CPTi-ZrO2
CPTi-ZrO2
CPTi-ZrO2
TiAlloy-ZrO2
TiAlloy-ZrO2
TiAlloy-ZrO2
Corto
Medio
Largo
Corto
Medio
Largo
Coeficiente de fricción
0.254
0.196
0.329
0.150
0.180
0.178
0.195
0.220
0.481
0.118
0.184
0.198
0.281
0.185
0.320
0.158
0.154
0.201
0.289
0.259
0.296
0.175
0.156
0.199
0.220
0.197
0.178
0.131
0.177
0.210
a) Calcule los efectos principales y las interacciones.
b) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
c) ¿Es creíble el modelo aditivo? Proporcione el valor del estadístico de prueba, su distribución nula, y el P-valor.
d) ¿Puede describirse el efecto del material sobre el coeficiente de fricción interpretando los efectos principales del material?
Si es así, interprételos. Si no, explique.
e) ¿Puede describirse el efecto del largo sobre el coeficiente de fricción al interpretar los efectos principales del largo? Si es
así, interprételos. Si no, explique.
10. El artículo “Anodic Fenton Treatment of Treflan MTF” (D. Saltmiras y A. Lemley, en Journal of Environmental Science and
Health, 2001:261-274) describe un experimento de dos factores diseñado para estudiar la absorción del herbicida trifluralin.
Los factores son la concentración inicial de trifluralin y el cociente de entrega Fe2:H-2O-2. Hubo tres réplicas por cada tratamiento. Los resultados que se presentan en la tabla siguiente son consistentes con las medias y las desviaciones estándar notificadas en el artículo.
Concentración
inicial (M)
15
15
15
15
40
40
40
40
100
100
100
100
Cociente de
entrega
1:0
1:1
1:5
1:10
1:0
1:1
1:5
1:10
1:0
1:1
1:5
1:10
Absorción (%)
10.90
3.33
0.79
0.54
6.84
1.72
0.68
0.58
6.61
1.25
1.17
0.93
8.47
2.40
0.76
0.69
7.68
1.55
0.83
1.13
6.66
1.46
1.27
0.67
12.43
2.67
0.84
0.57
6.79
1.82
0.89
1.28
7.43
1.49
1.16
0.80
9.3
Experimentos de dos factores
681
a) Estime todos los efectos principales y las interacciones.
b) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
c) ¿Es creíble el modelo aditivo? Proporcione el valor del estadístico de prueba, su distribución nula, y el P-valor.
11. Con referencia al ejercicio 10. Los tratamientos con un cociente de entrega de 1:0 fueron controlados, o en blanco. Después del
experimento se descubrió que los niveles evidentes altos de absorción en tales controles se debían en gran parte a la volatilidad
del trifluralin. Elimine los tratamientos de control de los datos.
a) Estime todos los efectos principales y las interacciones.
b) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
c) ¿Es creíble el modelo aditivo? Proporcione el valor del estadístico de prueba, su distribución nula y el P-valor.
d) Construya una gráfica de interacción. Explique cómo la gráfica ilustra el grado con el que las interacciones están presentes.
12. El artículo “Use of Taguchi Methods and Multiple Regression Analysis for Optimal Process Development of High Energy Electron Beam Case Hardening of Cast Iron” (M. Jean y Y. Tzeng, en Surface Engineering, 2003:150-156) describe un experimento factorial diseñado para determinar cómo los factores de un proceso de haces de electrones de alta-energía afectan la dureza
en metales. Los resultados para dos factores, cada uno con tres niveles, se presentan en la tabla siguiente. El factor A es la velocidad del viaje en mm/s, y el factor B es el voltaje de aceleración en volts. El resultado es la dureza de Vickers. Hubo seis réplicas para cada tratamiento. En el artículo se estudió un total de siete factores; los dos que aquí se presentan son los que se
encontraron más significativos.
A
B
10
10
10
20
20
20
30
30
30
10
25
50
10
25
50
10
25
50
Dureza
875
712
568
876
889
756
901
789
792
896
719
546
835
876
732
926
801
786
921
698
559
868
849
723
893
776
775
686
621
757
812
768
681
856
845
706
642
632
723
796
706
723
832
827
675
613
645
734
772
615
712
841
831
568
a) Estime todos los efectos principales y las interacciones.
b) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
c) ¿Es creíble el modelo aditivo? Proporcione el valor del estadístico de prueba y el P-valor.
d) ¿Puede describirse el efecto de la velocidad de viaje sobre la dureza interpretando los efectos principales de la velocidad de
viaje? Si es así, interprete los efectos principales utilizando comparaciones múltiples con un nivel de 5% si es necesario. Si
no, explique.
e) ¿Puede describirse el efecto del voltaje de aceleración en la dureza interpretando los efectos principales de voltaje de aceleración? Si es así, interprételos, utilizando comparaciones múltiples con un nivel de 5%. Si no, explique.
13. El artículo “T-Bracing for Stability of Compression Webs in Wood Trusses” (R. Leichti, I. Hofaker, y cols., en Journal of Structural Engineering, 2002:374-381) presenta los resultados de los experimentos de la carga crítica de doblaje (en kN) para ensambles reforzados en T, la carga se estimó por un método de elemento finito. La tabla siguiente presenta datos en los que los
factores son la longitud del miembro de lado y su sistema de unión. Hubo diez réplicas para cada combinación de factores. Los
datos son consistentes con las medias y las desviaciones estándar dadas en el artículo.
682
CAPÍTULO 9
Experimentos factoriales
Sistema de unión
Longitud
Adhesivo
Adhesivo
Adhesivo
Clavo
Clavo
Clavo
Un cuarto
La mitad
Completo
Un cuarto
La mitad
Completo
Carga crítica de doblaje
7.90
14.07
26.80
6.92
9.67
20.63
8.71
13.82
28.57
5.38
9.17
21.15
7.72
14.77
24.82
5.38
10.39
24.75
8.88
13.39
23.51
5.89
10.90
20.76
8.55
11.98
27.57
6.07
10.06
21.64
6.95
12.72
25.96
6.37
9.86
21.47
7.07
9.48
24.28
7.14
10.41
25.25
7.59
13.59
25.68
6.71
10.24
22.52
7.77
13.09
21.64
4.36
9.31
20.45
7.86
12.09
28.16
6.78
11.99
20.38
a) Calcule todos los efectos principales y las interacciones.
b) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
c) ¿Es creíble el modelo aditivo? Proporcione el valor del estadístico de prueba y el P-valor.
d) ¿Puede describirse el efecto del método adjunto (clavo contra adhesivo) sobre la carga crítica de doblaje interpretando los
efectos principales sobre el sistema de unión? Si es así, interprételos. Si no, explique.
e) ¿Puede describirse el efecto de la longitud del miembro de lado sobre la carga crítica de doblaje interpretando los efectos
principales de la longitud del miembro de lado? Si es así, interprételos, utilizando comparaciones múltiples con un nivel de
5% si es necesario. Si no, explique.
14. El artículo referido en el ejercicio 13 también presenta mediciones de los módulos de Young para los miembros de lado de los
ensambles reforzados en T. La tabla siguiente presenta los datos en los que los factores son la longitud del miembro de lado y
su sistema de unión. Hubo diez réplicas para cada combinación de los factores. Los datos (en kN/mm2) son consistentes con
las medias y las desviaciones estándar dadas en el artículo.
Sistema de unión
Longitud
Adhesivo
Adhesivo
Adhesivo
Clavo
Clavo
Clavo
Cuarto
Mitad
Completo
Cuarto
Mitad
Completo
Módulo de Young
9.56
8.74
9.84
10.24
9.84
7.96
10.67
9.24
9.80
9.38
9.34
8.32
8.82
10.77
8.31
9.38
9.64
8.73
8.40
9.10
7.37
7.48
8.21
9.37
9.23
8.08
10.12
9.23
10.43
9.12
8.20
11.14
9.18
9.64
9.48
7.98
10.23
10.00
8.93
8.45
7.46
9.84
9.58
9.17
8.65
8.12
9.51
8.89
7.57
9.79
7.89
8.86
10.20
10.10
8.05
8.13
9.07
8.07
9.66
8.07
a) Calcule todos los efectos principales y las interacciones.
b) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
c) ¿Es creíble el modelo aditivo? Proporcione el valor de un estadístico de prueba y el P-valor.
d) ¿Puede describirse el efecto del sistema de unión (clavo contra adhesivo) sobre los módulos de Young al interpretar los efectos principales del sistema de unión? Si es así, interprételos. Si no, explique.
e) ¿Puede describirse el efecto de la longitud del miembro de lado sobre los módulos de Young interpretando los efectos principales de la longitud del miembro de lado? Si es así, interprételos mediante comparaciones múltiples con un nivel de 5%.
Si no, explique.
15. Cada uno de tres operarios repesó dos veces algunas placas de silicio. Los resultados se presentan en la tabla siguiente para tres
placas. Todas las placas tenían pesos muy cercanos a 54 g, por lo que los pesos fueron notificados en unidades de µg arriba de
54 gramos (basado en “Revelation of a Microbalance Warmup Effect”, J. Buckner, B. Chin y cols., en Statistical Case Studies
for Industrial Process Improvement, SIAM-ASA, 1997:39-45).
Placa
Operador 1
Operador 2
Operador 3
1
2
3
11 15
210 208
111 113
10 6
205 201
102 105
14 10
208 207
108 111
9.4
Diseños de bloque completamente aleatorios
683
a) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
b) ¿Puede determinarse una tabla ANOVA si hay una diferencia en los pesos medidas entre los operadores; si es así, proporcione el valor del estadístico de prueba y el P-valor. Si no, explique por qué no.
16. En el ejercicio 15 se tiene que las mediciones del operario 2 fueron tomadas por la mañana, poco después de que se había encendido la balanza. Una nueva política fue instituida de dejar todo el tiempo prendida la balanza. Entonces, los tres operarios
hicieron dos pesadas de tres placas diferentes. Los resultados se presentan en la tabla siguiente.
Placa
Operador 1
1
2
3
152 156
443 440
229 227
Operador 2
156 155
442 439
229 232
Operador 3
152 157
435 439
225 228
a) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
b) Compare la tabla ANOVA del inciso a) con la tabla del inciso a) del ejercicio 15. ¿Recomendaría dejar la balanza prendida todo el tiempo? Explique su razonamiento.
17. El artículo “Cellulose Acetate Microspheres Prepared by O/W Emulsification and Solvent Evaporation Method” (K. Soppinmath, A Kulkarni y cols., en Journal of Microencapsulation, 2001:811-817) describe un estudio de los efectos de las concentraciones de alcohol polivinílico (PVAL) y diclorometano (DCM) sobre la eficiencia de encapsulación en un proceso que
produce microesferas que contienen el medicamento ibuprofén. Había tres concentraciones de PVAL (medido en unidades de
% w/v) y tres de DCM (en ml). Los resultados que se presentan en la tabla siguiente son consistentes con las medias y las desviaciones estándar presentados en el artículo.
PVAL
DCM = 50
DCM = 40
DCM = 30
0.5
1.0
2.0
98.983 99.268 95.149
89.827 94.136 96.537
95.095 95.153 92.353
96.810 94.572 86.718
82.352 79.156 80.891
86.153 91.653 87.994
75.288 74.949 72.363
76.625 76.941 72.635
80.059 79.200 77.141
a) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
b) Analice las relaciones entre la concentración de PVAL, la concentración de DCM y la eficiencia de encapsulación.
9.4
Diseños de bloque completamente aleatorios
En algunos experimentos hay factores que varían y tienen un efecto en la respuesta, pero esos
efectos son irrelevantes para el experimentador. Por ejemplo, una situación que ocurre comúnmente es que resulta imposible terminar un experimento en un día, por lo que las observaciones se tienen que continuar durante varios días. Si las condiciones que pueden afectar el
resultado se desvían día tras día, entonces este concepto representa un factor en el experimento, aunque puede haber un nulo interés en calcular su efecto.
Para un ejemplo más específico, imagine que se evalúan tres tipos de fertilizantes con
respecto a su efecto sobre la cosecha de fruta en una huerta de naranjas, y que se realizarán
tres replicas con un total de nueve observaciones. Un área se divide en nueve parcelas, en tres
hileras de tres parcelas cada una. Suponga que hay una caída de agua a lo largo del área de la
parcela, por lo que ahora las hileras reciben cantidades diferentes de agua. La cantidad del
agua es ahora un factor en el experimento, aunque no hay interés en calcular el efecto de la
cantidad de agua sobre la cosecha de naranja.
684
CAPÍTULO 9
Experimentos factoriales
Si se ignora el factor de agua, un experimento de un solo factor se podría realizar con
el fertilizante como el único factor. Cada uno de los tres fertilizantes sería asignado a tres parcelas. En un experimento completamente aleatorio, los tratamientos serían asignados a las
parcelas al azar. La figura 9.11 presenta dos arreglos aleatorios posibles. En el arreglo de la
izquierda, las parcelas con el fertilizante A tienen más agua que las de los otros dos fertilizantes. En la parcela de la derecha, las parcelas con el fertilizante C tienen más agua. Cuando los
tratamientos para un factor son asignados completamente al azar, es probable que no sea distribuido uniformemente sobre los niveles de otro factor.
A
A
B
B
C
A
B
C
C
Más agua
Menos agua
C
B
C
A
C
B
A
A
B
Más agua
Menos agua
FIGURA 9.11 Dos arreglos posibles para tres fertilizantes, A, B y C, asignados a las nueve parcelas en forma completamente aleatoria. Es probable que las cantidades de agua sean
diferentes para los diferentes fertilizantes.
Si la cantidad de agua tiene un efecto insignificante sobre la respuesta, entonces es adecuado el diseño de un solo factor completamente aleatorio. No hay por qué preocuparse por
un factor que no afecta la respuesta. Pero ahora suponga que el nivel de agua tiene un impacto importante en la respuesta. Entonces la figura 9.11 muestra que en cualquier otro experimento los efectos estimados de los tratamientos están probablemente fuera de marca, o
sesgados, por los niveles diferentes del agua. Los arreglos diferentes de los tratamientos desvían las estimaciones en diferentes direcciones. Si el experimento se repite varias veces, las
estimaciones probablemente varíen mucho de repetición en repetición. Por esta razón, el diseño un solo factor completamente aleatorio produce efectos estimados que tienen incertidumbres grandes.
Un mejor diseño para este experimento es uno que contenga dos factores, con el agua
como el segundo factor. Debido a que los efectos del agua son irrelevantes, el agua se llama
factor bloqueado, en vez de un factor de tratamiento. En el experimento de dos factores hay
nueve combinaciones de bloque de tratamiento, por lo que corresponde a los tres niveles del
tratamiento fertilizante y a los tres niveles de bloque de agua. Con nueve unidades experimentales (las nueve parcelas) es necesario asignar una parcela a cada combinación de fertilizante
y agua. La figura 9.12 presenta dos arreglos posibles.
Bloque 1
A
C
B
Bloque 2
B
A
Bloque 3
B
C
Más agua
Bloque 1
C
B
A
C
Bloque 2
A
B
C
A
Menos agua Bloque 3
B
A
C
Más agua
Menos agua
FIGURA 9.12 Dos posibles arreglos para tres fertilizantes, A, B y C, con la restricción
que cada fertilizante debe aparecer una vez en cada nivel de agua (bloque). La distribución
de niveles de agua es siempre la misma para cada fertilizante.
Diseños de bloque completamente aleatorios
9.4
685
En el diseño de dos factores cada tratamiento aparece con la misma frecuencia en cada
bloque (una vez, en este ejemplo). Por consiguiente, el efecto del factor bloqueado no contribuye a la incertidumbre en la estimación de los efectos principales del factor de tratamiento.
Como consecuencia de que cada tratamiento debe salir con la misma frecuencia en cada bloque, la única aleatorización en la asignación de tratamientos para unidades experimentales es
el orden en el que salen los tratamientos en cada bloque. Éste no es un diseño completamente aleatorio; es uno en el que los tratamientos están aleatorizados dentro de los bloques. Debido a que cada combinación posible de tratamientos y bloques es incluida en el experimento,
el diseño está completo. Por esta razón el diseño se llama diseño de bloques completamente aleatorios.
Estos últimos se pueden construir con varios factores de tratamiento y varios factores
de bloques. Se restringirá este análisis al caso donde hay un factor de tratamiento y un factor
bloqueado. Los datos de un diseño de bloques completamente aleatorios se analizan con un
ANOVA de dos sentidos, del mismo modo que serían los datos de cualquier diseño balanceado
de dos factores, completo. Sin embargo, hay una consideración importante. Los únicos efectos de interés son los efectos principales del factor de tratamiento. Para interpretar estos efectos
principales, no debe haber alguna interacción entre el tratamiento y los factores bloqueados.
Ejemplo
9.19
Se estudia el efecto de tres fertilizantes sobre la cosecha en una huerta de naranjas. Se están
utilizando nueve parcelas de tierra, dividida en bloques de tres parcelas cada una. Se usa un
diseño de bloques completamente aleatorio, aplicando cada fertilizante una vez en cada bloque. Los resultados, en libras de la fruta cosechada, se presentan en la tabla siguiente, seguida del resultado de MINITAB para el ANOVA de dos sentidos. ¿Se puede concluir que la
media de las cosechas difiere entre los fertilizantes? ¿Qué supuesto se hace acerca de las interacciones entre fertilizantes y parcelas? ¿Cómo se calcula la suma de cuadrados del error?
Fertilizante Parcela 1 Parcela 2 Parcela 3
A
B
C
430
367
320
542
463
421
287
253
207
Two-way ANOVA: Yield versus Block, Fertilizer
Source
Fertilizer
Block
Error
Total
DF
2
2
4
8
SS
16213.6
77046.9
651.778
93912.2
MS
8106.778
38523.44
162.9444
F
49.75
236.4
P
0.001
0.000
Solución
El P-valor para el factor fertilizante es 0.001, por lo que se concluye que el fertilizante tiene
un efecto sobre la cosecha. Se hace el supuesto de que no hay interacción entre el fertilizan-
686
CAPÍTULO 9
Experimentos factoriales
te y el factor bloqueado (parcela), por lo que se pueden interpretar los efectos principales de
fertilizante. Debido a que hay solamente una observación para cada combinación de tratamiento-bloque (es decir, K ⫽ 1). La suma de los cuadrados del error (SSE) notificada en el
resultado de MINITAB es realmente SSAB, la suma de cuadrados de la interacción, y la media cuadrática del error (MSE) es en realidad MSAB. (Véase el análisis en la p. 676.)
Una mirada más cercana a la tabla ANOVA del ejemplo 9.19 muestra que en este experimento bloquear era necesario para detectar el efecto fertilizante. Con este propósito, considere que el experimento es un experimento de un solo factor. La suma de los cuadrados del
error (SSE) sería entonces la suma SSE para el diseño bloqueado más la suma de cuadrados
por bloques, o 651.778 ⫹ 77 046.9 ⫽ 77 698.7. Los grados de libertad del error serían iguales a la suma de los grados de libertad del error en el diseño bloqueado más los grados de libertad por bloques, o 2 ⫹ 4 ⫽ 6. El error medio cuadrático (MSE) sería entonces 77 698.7/6
≈ 12 950 en lugar de 162.9444, y el estadístico F para el efecto fertilizante sería entonces al
menos de 1, lo que daría como resultado una falla para detectar un efecto.
En general, utilizar un diseño bloqueado reduce los grados de libertad del error, que sólo tiende a reducir la potencia para detectar un efecto. Sin embargo, a menos que el factor bloqueado tenga un muy pequeño efecto sobre la respuesta, esto último será generalmente más
que compensado por una reducción en la suma de los cuadrados del error. Dejar de incluir un
factor bloqueado que afecta la respuesta puede reducir la potencia enormemente, mientras que
incluir un factor bloqueado que no afecta la respuesta reduce la potencia sólo en forma modesta en la mayoría de los casos. Por esta razón es una buena idea utilizar un diseño bloqueado siempre que se considere que es posible que el factor bloqueado está relacionado con la
respuesta.
Resumen
Un diseño de bloques completamente aleatorios de dos factores es un diseño de
dos factores balanceado completo en el cual los efectos de un factor (el factor de
tratamiento) son relevantes, mientras que los efectos del otro factor (el factor bloqueado) no. El factor bloqueado es incluido para reducir la incertidumbre en las
estimaciones del efecto principal del factor de tratamiento.
Debido a que el objetivo de un diseño de bloques completamente aleatorios es calcular los efectos principales del factor de tratamiento, no debe haber interacción
entre el factor de tratamiento y el factor bloqueado.
Se utiliza un análisis de varianza de dos sentidos para estimar los efectos y realizar
pruebas de hipótesis sobre los efectos principales del factor de tratamiento.
Un diseño de bloques completamente aleatorios proporciona gran ventaja sobre un
diseño completamente aleatorio cuando el factor bloqueado afecta fuertemente la
respuesta y proporciona una desventaja pequeña cuando el factor bloqueado no tiene poco o nada de efecto. Por tanto, cuando se tiene duda, es una buena idea utilizar un diseño bloqueado.
9.4
Ejemplo
9.20
Diseños de bloque completamente aleatorios
687
El artículo “Experimental Design for Process Settings in Aircraft Manufacturing” (R. Sauter
y R. Lenth, en Statistical Case Studies: A Collaboration Between Academe and Industry, SIAM-ASA, 1998:151-157) describe un experimento en el que se estudió la calidad de huecos
perforados en partes de aeronave de metal. Un indicador importante de la calidad de hueco es
el “diámetro excedente”, que es la diferencia entre el diámetro poco perforado y el diámetro
del hueco. Los diámetros excesivamente pequeños son mejores que los grandes. Suponga que
se tiene interés en el efecto de la velocidad rotacional del taladro sobre el diámetro excesivo
del hueco. Se perforarán huecos en seis artículos de prueba (cupones), con tres velocidades:
6 000, 10 000 y 15 000 rpm. Al diámetro excedente puede afectarlo no sólo la velocidad del
taladro, sino también las propiedades físicas del cupón de prueba. Describa un diseño adecuado para este experimento.
Solución
Un diseño de bloques completamente aleatorios es adecuado, con la velocidad del taladro como el factor de tratamiento y el cupón de prueba como el factor bloqueado. Debido a que se
pueden hacer seis observaciones en cada bloque, cada velocidad de taladro se debe usar dos
veces en cada bloque. El orden de las velocidades dentro de cada bloque debe elegirse en forma aleatoria.
Ejemplo
9.21
El diseño sugerido en el ejemplo 9.20 ha sido adoptado y se ha realizado el experimento. A
continuación se presenta el resultado de MINITAB. ¿El resultado indica alguna violación de
los supuestos necesarios? ¿Qué concluye respecto al efecto de la velocidad del taladro sobre
el diámetro excedente?
Two-way ANOVA: Excess Diameter versus Block, Speed
Source
Block
Speed
Interaction
Error
Total
S = 0.1931
DF
5
2
10
18
35
SS
0.20156
0.07835
0.16272
0.67105
1.11368
R-Sq = 39.74%
MS
0.0403117
0.0391750
0.0162717
0.0372806
F
1.08
1.05
0.44
P
0.404
0.370
0.909
R-Sq(adj) = 0.00%
Solución
En un diseño de bloques completamente aleatorios no debe haber interacción entre el factor
de tratamiento y el factor bloqueado, por lo que puede interpretarse el efecto principal del factor de tratamiento. El P-valor para las interacciones es 0.909, que es compatible con la hipó-
688
CAPÍTULO 9
Experimentos factoriales
tesis de no interacciones. Por tanto, no hay señal en el resultado de alguna violación de los
supuestos. El P-valor para el efecto principal de la velocidad es 0.370, que no es pequeño. Por
tanto, no se puede concluir que al diámetro excedente de hueco lo haya afectado la velocidad
de taladro.
El ejemplo 9.22 muestra un diseño apareado (véase la sección 6.8), en el cual se utiliza una prueba t para comparar dos medias poblacionales, es un caso especial de un diseño de
bloques aleatorios.
Ejemplo
9.22
Un fabricante de neumáticos quiere comparar el desgaste del dibujo de neumáticos hechos
con un material nuevo con el de los hechos con material convencional. Hay diez neumáticos
de cada tipo. Cada neumático será montado sobre la rueda frontal de un automóvil de tracción delantera y conducido durante 40 000 millas. Para cada neumático se medirá el desgaste de la huella. Describa un diseño adecuado para este experimento.
Solución
La respuesta es el desgaste de la huella después de 40 000 millas. Hay un factor de interés: el
tipo de neumático. Debido a que los automóviles podrían diferir en las cantidades de desgaste que producen, el automóvil también es un factor, pero su efecto carece de interés. Un diseño de bloques completamente aleatorios es adecuado, en el cual un neumático de cada tipo es
montado sobre las ruedas de cada automóvil.
Puede observar que el diseño de bloques completamente aleatorios en el ejemplo 9.22
es el mismo que se usa cuando compara dos medias poblacionales con una prueba apareada
t, como se analiza en la sección 6.8. El diseño apareado descrito ahí es un caso especial de un
diseño de bloques completamente aleatorios, en el cual el factor de tratamiento tiene sólo dos
niveles y cada uno sale una vez en cada bloque. En efecto, un análisis de varianza de dos sentidos aplicado a los datos de tal diseño equivale a la prueba t apareada.
Comparaciones múltiples en diseños
de bloques completamente aleatorios
Una vez que se ha construido un ANOVA, entonces si la prueba F muestra que el tratamiento de los efectos principales no es el mismo, se puede utilizar un método de comparaciones
múltiples para determinar cuáles pares de efectos difieren. Se describe el método de Tukey,
que es un caso especial del método de Tukey-Kramer descrito en la sección 9.2. Se usan los
grados de libertad y la media cuadrática, que son diferentes si cada tratamiento aparece sólo
una vez, o más de una vez, en cada bloque.
9.4
Diseños de bloque completamente aleatorios
689
Método de Tukey para comparaciones múltiples en diseños de bloques
completamente aleatorios
En un diseño de bloques completamente aleatorios, con I niveles de tratamiento, J niveles de bloque, y efectos principales de tratamiento α1, . . . , αI:
Si cada tratamiento aparece sólo una vez en cada bloque, entonces la hipótesis nula H0 : αi ⫺ αj ⫽ 0 se rechaza con un nivel de α para cada par de tratamientos i y
j para el cual
MSAB
|Xi. − Xj. | > qI,(I −1)(J −1),α
J
donde MSAB representa la media cuadrática para la interacción.
Si cada tratamiento aparece K ⬎ 1 veces en cada bloque, entonces la hipótesis nula H0 : αi ⫺ αj ⫽ 0 se rechaza con un nivel de α para cada par de tratamientos i y j
para el cual
|Xi.. − X j.. | > qI,IJ(K−1),α
MSE
JK
donde MSE constituye la media cuadrática del error.
Para mayor información acerca de los diseños de bloques aleatorios se puede consultar
un texto acerca del diseño de experimentos, como Montgomery (2001a).
Ejercicios para la sección 9.4
1. El artículo “Methods for Evaluation of Easily-Reducible Iron and Manganese in Paddy Soils” (M. Borges, J. de Mello y cols.,
en Communication in Soil Science and Plant Analysis, 2001:3009-3022) describe un experimento en el cual se midieron los niveles de pH de suelo aluvial. Se aplicaron diferentes niveles de abono a cada suelo. El interés principal se centra en las diferencias entre los suelos, no hay mucho interés en el efecto del abono. Los resultados se presentan en la tabla siguiente.
Tierra
A
B
C
D
Nivel de abono
3
4
1
2
5.8
5.2
5.5
6.0
5.9
5.7
6.0
6.6
a) ¿Cuáles son los factores de bloqueado y de tratamiento?
b) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
6.1
6.0
6.2
6.7
6.7
6.4
6.7
6.7
5
7.1
6.8
7.0
7.5
690
CAPÍTULO 9
Experimentos factoriales
c) ¿Puede concluir qué suelo tiene niveles diferentes de pH?
d) ¿Cuáles pares de suelos, si hay, puede concluir que tienen diferentes niveles de pH? Utilice un nivel de 5%.
2. Se hizo un estudio para ver cuál de las cuatro máquinas realiza más rápido cierta tarea. Hay tres operarios; cada uno realiza
la tarea dos veces sobre cada máquina. Se emplea un diseño de bloques aleatorios. A continuación se muestra el resultado de
MINITAB.
Source
Machine
Block
Interaction
DF
SS
MS
F
P
(i)
257.678
(ii)
(iii)
0.021
(iv)
592.428
(v)
(vi)
0.000
(x)
0.933
(vii)
(viii)
(ix)
Error
(xi)
215.836
17.986
Total
(xii)
1096.646
a) Complete los números que faltan del (i) al (xii) en el resultado.
b) ¿El resultado indica que se satisfacen los supuestos para el diseño de bloque aleatorios? Explique.
c) ¿Puede concluir que hay diferencias entre las máquinas? Explique.
3. Se realizó un experimento para determinar el efecto de la concentración del caldo en la producción de cierto microorganismo.
Fueron cuatro formulaciones diferentes y tres diferentes concentraciones de caldo. Hubo tres réplicas para cada combinación
de la formulación de caldo y de la concentración, cuyo resultado se expresa en ml. La formulación de caldo es un factor bloqueado; el único efecto importante es el efecto de la concentración. Se calcularon las siguientes sumas de los cuadrados: suma
de los cuadrados para bloques ⫽ 504.7, suma de los cuadrados para tratamientos ⫽ 756.7, suma de los cuadrados para las interacciones ⫽ 415.3, suma total de los cuadrados ⫽ 3 486.1.
a) Construya una tabla ANOVA. Puede dar rangos para los P-valores.
b) ¿Los supuestos para un diseño de bloques completamente aleatorios se satisfacen? Explique.
c) ¿La tabla ANOVA proporciona pruebas de que la concentración de caldo afecta la producción? Explique.
4. Se está considerando emplear tres máquinas diferentes para terminar cierta tarea. Cuatro operarios terminan la tarea sobre cada una de las tres máquinas, cada operario repite la tarea dos veces. El resultado es el tiempo en minutos necesario para terminar la tarea. El único efecto de interés es la máquina; el operario es un factor bloqueado. Se calcularon las siguientes sumas de
los cuadrados: suma de los cuadrados para bloques ⫽ 48.47, suma de los cuadrados para tratamientos ⫽ 30.83, suma de los
cuadrados para las interacciones ⫽ 93.27, suma total de los cuadrados ⫽ 217.36.
a) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
b) ¿Los supuestos para diseño de bloques completamente aleatorios se satisfacen? Explique.
c) ¿La tabla ANOVA proporciona pruebas de que la media del tiempo de terminación difiere entre las máquinas? Explique.
5. El artículo “Genotype-Environment Interactions and Phenotypic Stability Analyses of Linseed in Ethiopia” (W. Adguna y
M. Labuschagne, en Plant Breeding. 2002:66-71) describe un estudio en que se compararon las producciones de semillas
de diez variedades de linaza. Cada variedad fue cultivada en seis parcelas diferentes. Las cosechas, en kilogramos por hectárea, se presentan en la tabla ubicada en la parte superior de la página siguiente.
a) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
b) ¿Puede concluir que las variedades tienen diferentes medias de producción?
691
Diseños de bloque completamente aleatorios
9.4
Parcela
Variedad
A
B
C
D
E
F
G
H
I
J
1
2
2032
1815
1739
1812
1781
1703
1476
1745
1679
1903
1377
1126
1311
1313
1271
1089
1333
1308
1216
1382
3
4
5
6
1343
1338
1340
1044
1308
1256
1162
1190
1326
1373
1366
1188
1250
1245
1220
1385
1363
1269
1271
1609
1276
1566
1473
1090
1371
1079
1056
1251
1506
1396
1209
1454
1617
1280
1361
1318
1096
1325
1368
1366
6. El artículo “Sprinkler Technologies, Soil Infiltration, and Runoff” (D. DeBoer y S. Chu, en Journal of Irrigation and Drainage Engineering, 2001:234-239) presenta un estudio de la profundidad de corriente (en mm) para varios tipos de aspersor. Se
probó cada uno de cuatro aspersores cada cuatro días, con dos réplicas por día (hubo tres réplicas en algunos de días; éstas se
omiten). Reviste interés determinar si la profundidad de corriente varía con el tipo de aspersor; la variación de un día a otro carece de interés. Los datos se presentan en la tabla siguiente.
Día 1
Aspersor
A
B
C
D
8.3
6.5
1.8
0.7
Día 2
5.5
9.5
1.2
0.8
7.8
3.7
0.5
0.1
Día 3
4.5
3.6
0.3
0.5
10.7
7.7
1.7
0.1
Día 4
9.8
10.6
1.9
0.5
10.6
3.6
2.2
0.3
6.6
6.7
2.1
0.5
a) Identifique el factor bloqueado y el factor de tratamiento.
b) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
c) ¿Los supuestos de un diseño de bloques completamente aleatorios se satisfacen? Explique.
d) ¿Puede concluir que hay diferencias en la media de la profundidad de corriente entre algunos pares de aspersores? Explique.
e) ¿Qué pares de aspersores, si hay, puede concluir, con un nivel de 5%, que tienen diferente media de profundidades de corriente?
7. El artículo “Bromate Surveys in French Drinking Waterworks” (B. Legube, B. Parinet y cols., en Ozone Science and Engineering, 2002:293-304) presenta mediciones de las concentraciones de bromina (en µg/L) en algunas centrales de abastecimiento
de agua. Las mediciones hechas 15 veces diferentes en cada una de cuatro centrales de abastecimiento de agua se presentan en
la tabla siguiente. (El artículo también presentó algunas mediciones adicionales hechas en algunas otras centrales de abastecimiento de agua.) Es de interés determinar si las concentraciones de bromina varían entre las centrales de abastecimiento de
agua; no lo es determinar si las concentraciones varían con el tiempo.
Centrales de
abastecimiento
de agua
1
2
3
4
5
6
7
A
B
C
D
29
24
25
31
9
29
17
37
7
21
20
34
35
24
24
30
40
20
19
39
53
25
19
41
38
15
17
34
Tiempo
8
9
38
14
23
34
41
8
22
29
10
11
12
13
14
15
34
12
27
33
42
14
17
33
35
35
33
34
38
32
33
16
35
38
39
31
36
33
37
16
692
CAPÍTULO 9
Experimentos factoriales
a) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
b) ¿Puede concluir que la concentración de bromina varía entre las centrales de abastecimiento de agua?
c) ¿Qué pares de las centrales de abastecimiento de agua, si hay, puede concluir, con un nivel de 5%, que tienen concentraciones de bromina diferentes?
d) Alguien sugiere que estos datos se analizaran con un ANOVA de un sentido, ignorando el factor de tiempo, con 15 observaciones para cada una de las cuatro centrales de abastecimiento de agua. ¿La tabla ANOVA soporta esta sugerencia? Explique.
8. El artículo “Application of Fluorescence Technique for Rapid Identification of IOM Fractions in Source Waters” (T. Marhaba
y R. Lippincott, en Journal of Environmental Engineering, 2000:1039-1044) presenta mediciones de las concentraciones de
carbono orgánico disuelto (en mg/L) en seis ubicaciones (A, B, C, D, E, F) a lo largo del río Millstone, en el centro de Nueva
Jersey. Las mediciones se tomaron cuatro veces al año: enero, abril, julio y octubre. Es de interés determinar si las concentraciones varían entre las ubicaciones. Los datos se presentan en la tabla siguiente.
Enero
A
B
C
D
E
F
Abril
Julio
Octubre
3.7
3.5
3.4
3.3
3.4
3.5
3.7
3.4
3.0
2.9
3.0
2.8
4.1
5.7
4.8
4.6
3.4
4.7
3.9
4.0
4.2
4.1
4.1
4.2
a) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
b) ¿Puede concluir que la concentración varía entre las ubicaciones?
c) ¿Qué pares de ubicaciones, si hay, puede concluir, con un nivel de 5%, que tienen concentraciones diferentes?
9. Le han dado la tarea de diseñar un estudio con respecto a los tiempos de vida de cinco tipos diferentes de motor eléctrico. La
pregunta inicial que debe responderse es si hay diferencias en la media de vida entre los cinco tipos. Hay 20 motores, cuatro
de cada tipo, disponibles para la prueba. Se puede probar un máximo de cinco motores todos los días. La temperatura ambiental es diferente día tras día, esto último puede afectar la vida del motor.
a) Describa cómo elegiría los cinco motores para hacer pruebas todos los días. ¿Usaría un diseño completamente aleatorio?
¿Usaría cualquier aleatorización en todo?
b) Si Xij representa la vida media medida de un motor del tipo i probada un día j, exprese el estadístico de prueba para probar
la hipótesis nula de tiempos de vida iguales en función del Xij.
10. Una catedrática de ingeniería quiere determinar qué tema encuentran sus alumnos más difícil entre estadística, física y química. Obtiene la calificación del examen final para cuatro estudiantes que tomaron tres cursos el último semestre y quienes estaban en las mismas secciones de cada clase. Los resultados se presentan en la tabla siguiente.
Curso
Estadística
Física
Química
1
82
75
93
Estudiante
2
3
94
70
82
78
81
80
4
70
83
70
a) La catedrática propone un diseño de bloques completamente aleatorios, con los estudiantes como los bloques. Dé una razón de que es probable que no sea adecuado.
b) Describa las características de los datos en la tabla anterior que indican que no se cumplen los supuestos del diseño de bloques completamente aleatorios.
9.5
9.5
Experimentos factoriales 2p
693
Experimentos factoriales 2p
Cuando un experimentador quiere estudiar varios factores simultáneamente, el número de diferentes tratamientos puede ser muy grande. En estos casos, con frecuencia los experimentos
preliminares se realizan en cada factor que tiene sólo dos niveles. Se diseña un nivel como el
nivel “alto”, y se diseña otro como el nivel “bajo”. Si hay p factores, entonces hay 2p tratamientos diferentes. Tales experimentos se llaman experimentos factoriales 2p. Con frecuencia, el propósito de un experimento de este tipo es determinar qué factores tienen un efecto
importante sobre el resultado. Una vez que se han determinado, se pueden realizar experimentos más elaborados, en los cuales los factores que son importantes varían en algunos niveles.
Se iniciará por describir los experimentos factoriales 23.
Notación para los experimentos factoriales 23
En experimentos factoriales 23 hay tres factores y 23 ⫽ 8 tratamientos. El efecto principal de
un factor se define como la diferencia entre la respuesta media cuando el factor está en su nivel alto y la respuesta media cuando el factor está en su nivel bajo. Es común denotar los efectos principales por A, B y C como con cualquier experimento factorial, puede haber
interacciones entre los factores. Con tres factores hay tres interacciones de dos sentidos, una
para cada par de factores, y una interacción de tres sentidos. Las interacciones de dos sentidos por AB, AC y BC, y la interacción de tres sentidos se denota con ABC. Los tratamientos
se denotan tradicionalmente con letras minúsculas, con una letra que indica que un factor está en su nivel alto. Por ejemplo, ab denota el tratamiento en el que los primeros dos factores
están en su nivel alto y el tercer factor en su nivel bajo. El símbolo “1” se utiliza para denotar el tratamiento en el que todos los factores están a sus niveles bajos.
Estimación de los efectos en un experimento factorial 23
Suponga que hay K réplicas para cada tratamiento en un experimento factorial 23. Para cada
tratamiento, la media de la celda representa el promedio de las K observaciones para ese tratamiento. Las fórmulas para las estimaciones del efecto se pueden obtener fácilmente de la
tabla de signos 23, que se presenta como la tabla 9.7 en la página 694. Los signos se colocan
en la tabla como se indica a continuación. Para los efectos principales A, B, C el signo es ⫹
para los tratamientos en los que el factor está en su nivel alto, y ⫺ para los tratamientos donde el factor está en su nivel bajo. En este contexto, para el efecto principal A, el signo es ⫹
para los tratamientos a, ab, ac y abc y ⫺ para el resto. Para las interacciones, los signos se
calculan tomando el producto de los signos en las columnas de los efectos principales correspondientes. Por ejemplo, los signos para la interacción de dos sentidos AB son los productos
de los signos en las columnas A y B, y los signos para la interacción de tres sentidos ABC son
los productos de los signos en las columnas A y B y C.
La estimación de los efectos principales y de las interacciones se hace empleando la tabla de los signos. Se muestra cómo estimar el efecto principal del factor A. El factor A está en
su nivel alto en los renglones de la tabla donde hay un signo “⫹” en la columna A. Cada una
– –
–
–
de las medias de la celda X a, X ab, X ac y X abc es una respuesta promedio para las corridas hechas con el factor A como en su nivel alto. Se estima que la respuesta media para el factor A
en su nivel alto es el promedio de estas medias de celda.
694
CAPÍTULO 9
Experimentos factoriales
TABLA 9.7 Tabla de signos para un experimento factorial 23
Tratamiento
1
a
b
ab
c
ac
bc
abc
Media de
la celda
A
B
C
AB
AC
BC
ABC
X1
Xa
Xb
X ab
Xc
X ac
X bc
X abc
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫺
⫺
⫹
⫹
⫹
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫹
⫺
⫺
⫹
⫺
⫹
⫹
⫹
⫺
⫺
⫺
⫺
⫹
⫹
⫺
⫹
⫹
⫺
⫹
⫺
⫺
⫹
Respuesta media estimada para A en su nivel alto =
1
(X a + Xab + Xac + X abc )
4
De manera similar, cada renglón con signo “⫺” en la columna A representa un tratamiento
con un factor A puesto en su nivel bajo. Se estima la respuesta media para el factor A en su
nivel bajo como el promedio de las medias de celda en estos renglones.
Respuesta media estimada para A en su nivel bajo =
1
(X 1 + X b + X c + Xbc )
4
La estimación del efecto principal del factor A es la diferencia en la respuesta media estimada entre sus niveles alto y bajo.
Efecto estimado de A =
1
(−X1 + Xa − Xb + X ab − Xc + Xac − X bc + Xabc )
4
La cantidad dentro de los paréntesis se llama contraste del factor A. Se calcula al sumar y
restar las medias de celda, utilizando los signos en la columna adecuada de la tabla de signos.
Observe que el número de signos “más” es el mismo como el número de signos “menos”, por
lo que la suma de los coeficientes es igual a 0. La estimación del efecto se obtiene al dividir
el contraste entre la mitad del número de los tratamientos, que es 23/2, o 4. Las estimaciones
de otros efectos principales y las interacciones se calculan en una forma similar. Para ilustrar
lo anterior se presentan las estimaciones del efecto para el efecto principal C y la interacción
de dos sentidos AB:
Estimación de efecto C =
Estimación de la interacción AB =
1
(−X1 − Xa − Xb − Xab + Xc + Xac + Xbc + X abc )
4
1
(X1 − Xa − Xb + Xab + X c − X ac − Xbc + Xabc )
4
9.5
Experimentos factoriales 2p
695
Resumen
El contraste para cualquier efecto principal o interacción se obtiene mediante la suma
y resta de las medias de la celda, así como utilizando los signos en la columna adecuada de la tabla de signos.
Para un experimento factorial 23,
contraste
Efecto estimado ⫽ ––––––––––
(9.65)
4
Ejemplo
9.23
Se realizó un experimento factorial 23 para calcular los efectos de tres factores en la producción de una reacción química. Los factores fueron A: concentración de catalizador (bajo o alto), B: reactivo (formulación usual o nueva formulación), y C: tasa de agitación (lenta o
rápida). Se obtuvieron tres réplicas para cada tratamiento. Las producciones se presentan en
la tabla siguiente y se miden como un porcentaje de un máximo teórico. Estime todos los
efectos y las interacciones.
Tratamiento
1
a
b
ab
c
ac
bc
abc
Producción
71.67
78.46
77.14
79.72
72.65
80.10
80.20
75.58
70.55
75.42
78.25
76.17
71.03
73.91
73.49
80.28
67.40
81.77
78.33
78.41
73.54
74.81
74.86
71.64
Media de la celda
69.8733
78.5500
77.9067
78.1000
72.4067
76.2733
76.1833
75.8333
Solución
Mediante la tabla de signos (tabla 9.7) se determinan las sumas adecuadas y las diferencias
de las medias de celda. Se presentan los cálculos para el efecto principal A, la interacción de
dos sentidos BC, y la interacción de tres sentidos ABC:
Estimación de efecto A =
Interacción estimada BC =
Interacción estimada ABC =
1
(−69.8733 + 78.5500 − 77.9067 + 78.1000
4
− 72.4067 + 76.2733 − 76.1833 + 75.8333) = 3.0967
1
(69.8733 + 78.5500 − 77.9067 − 78.1000
4
− 72.4067 − 76.2733 + 76.1833 + 75.8333) = −1.0617
1
(−69.8733 + 78.5500 + 77.9067 − 78.1000
4
+ 72.4067 − 76.2733 − 76.1833 + 75.8333) = 1.0667
696
CAPÍTULO 9
Experimentos factoriales
En la tabla siguiente se presentan todos los efectos estimados, redondeados con la misma precisión que los datos:
Variable
Efecto
A
B
C
AB
AC
BC
ABC
3.10
2.73
⫺0.93
⫺3.18
⫺1.34
⫺1.06
1.07
Para cada efecto se puede probar la hipótesis nula de que el efecto es igual a 0. Cuando ésta es rechazada se tiene evidencia de que los factores implicados afectan en realidad el
resultado. Para probar estas hipótesis nulas se construye una tabla ANOVA que contiene las
sumas de los cuadrados adecuadas. Las pruebas que se presentan serán válidas si el número
de réplicas es para cada tratamiento y deber ser al menos 2. Además, las observaciones en cada tratamiento deben constituir una muestra aleatoria de una población normal, y todas las poblaciones deben tener la misma varianza.
Se calcula la suma de los cuadrados del error (SSE) al sumar las sumas de las desviaciones al cuadrado de las medias muestrales para todos los tratamientos. Con el fin de expresar esto en una ecuación, sean s21, . . . , s28 las variancias muestrales de las observaciones en
cada uno de los ocho tratamientos, y K el número de réplicas por tratamiento. Entonces
SSE = (K − 1)
8
si2
(9.66)
i=1
Cada efecto principal e interacción también tienen su propia suma de los cuadrados. Éstas son
fáciles calcular. La suma de los cuadrados para cualquier efecto o interacción se calcula elevando al cuadrado su contraste, multiplicando por el número de réplicas K, y dividiendo entre el número total de tratamientos: 23 ⫽ 8.
K(contraste)2
Suma de los cuadrados para un efecto ⫽ ——————
8
(9.67)
Cuando se utiliza la ecuación (9.67) es mejor conservar, en tanto sea posible, los mismos dígitos que en las estimaciones de los efectos con el fin de obtener la máxima precisión en la
suma de los cuadrados. Para la presentación en una tabla, las estimaciones de los efectos y las
sumas de los cuadrados se pueden redondear con la misma precisión que los datos.
Las sumas de los cuadrados para los efectos y las interacciones tienen un grado de libertad cada una. La suma de los cuadrados del error tiene 8(K ⫺ 1) grados de libertad. El método para calcular la media cuadrática y el estadístico F es el mismo que el que se presentó
en la sección 9.3 para una tabla ANOVA de dos sentidos. Cada media cuadrática es igual a su
9.5
Experimentos factoriales 2p
697
suma de los cuadrados dividida entre sus grados de libertad. El estadístico de prueba para probar la hipótesis nula de que un efecto o interacción es igual a 0 se calcula dividiendo la media cuadrática para la estimación del efecto entre la media cuadrática para el error. Cuando la
hipótesis nula es verdadera, el estadístico de prueba tiene una distribución F1, 8(K ⫺ 1).
Ejemplo
9.24
Con referencia al ejemplo 9.23, construya una tabla ANOVA. Respecto a cada efecto e interacción pruebe la hipótesis nula de que es igual a 0. ¿Cuáles factores, si hay, parecen más probables de tener un efecto en el resultado?
Solución
La tabla ANOVA se muestra a continuación. Las sumas de los cuadrados para los efectos y
las interacciones se calcularon utilizando la ecuación (9.67). La suma de los cuadrados del
error fue calculada aplicando la ecuación (9.66) a los datos del ejemplo 9.23. Cada estadístico F es el cociente de la media cuadrática con la media cuadrática del error. Cada estadístico
F tiene 1 y 16 grados de libertad.
Fuente
Efecto
A
B
C
AB
AC
BC
ABC
Error
Total
3.10
2.73
⫺0.93
⫺3.18
⫺1.34
⫺1.06
1.07
Suma de
cuadrados
gl
57.54
44.72
5.23
60.48
10.75
6.76
6.83
125.48
317.78
1
1
1
1
1
1
1
16
23
Media
cuadrática
57.54
44.72
5.23
60.48
10.75
6.76
6.83
7.84
F
P
7.34
5.70
0.67
7.71
1.37
0.86
0.87
0.015
0.030
0.426
0.013
0.259
0.367
0.365
Los efectos principales de los factores A y B, así como la interacción de AB, tienen Pvalores bastante pequeños. Ello indica que estos efectos no son iguales a 0 y que los factores
A y B afectan el resultado. No hay evidencias de que el efecto principal o factor C, o alguna
de sus interacciones, difieran de 0. Experimentos adicionales se podrían concentrar en los factores A y B. Quizá se realizaría un ANOVA de dos sentidos, con cada uno de los factores A y
B evaluados en diferentes niveles, para obtener información más detallada acerca de sus efectos en el resultado.
Interpretación del resultado computacional
En la práctica, los análisis de diseños factoriales se realizan generalmente en una computadora, utilizando un software como MINITAB. El siguiente resultado de MINITAB presenta los
resultados del análisis descrito en los ejemplos 9.23 y 9.24.
698
CAPÍTULO 9
Experimentos factoriales
Factorial Fit: Yield versus A, B, C
Estimated Effects and Coefficients for Yield (coded units)
Term
Constant
A
B
C
A∗B
A∗C
B∗C
A∗B∗C
Effect
S = 2.80040
R-Sq = 60.51%
3.097
2.730
–0.933
–3.175
–1.338
–1.062
1.067
Coef
75.641
1.548
1.365
–0.467
–1.587
–0.669
–0.531
0.533
SE Coef
0.5716
0.5716
0.5716
0.5716
0.5716
0.5716
0.5716
0.5716
T
132.33
2.71
2.39
–0.82
–2.78
–1.17
–0.93
0.93
P
0.000
0.015
0.030
0.426
0.013
0.259
0.367
0.365
R-Sq(adj) = 43.24%
Analysis of Variance for Yield (coded units)
Source
Main Effects
2-Way Interactions
3-Way Interactions
Residual Error
Pure Error
Total
DF
3
3
1
16
16
23
Seq SS
107.480
77.993
6.827
125.476
125.476
317.776
Adj SS
107.480
77.993
6.827
125.476
125.476
Adj MS
35.827
25.998
6.827
7.842
7.842
F
4.57
3.32
0.87
P
0.017
0.047
0.365
La tabla en la parte superior del resultado de MINITAB presenta las estimaciones de los
efectos y coeficientes. La frase “coded units” significa que se usan los valores 1 y –1 en lugar de los valores verdaderos y con ellos se representan los niveles altos y bajos de cada factor. Los efectos estimados se listan en la columna “Effect”. En la columna siguiente están las
estimaciones de los coeficientes, cada una de las cuales es igual a la mitad del efecto correspondiente. Mientras que el efecto representa la diferencia en la respuesta media entre los niveles altos y bajos de un factor, el coeficiente representa la diferencia entre la respuesta media
al nivel alto y la respuesta de la gran media, que es cuando mucho de la mitad. El coeficiente “Constant” es la media de todas las observaciones; es decir, es la gran media muestral. Cada estimación del coeficiente tiene la misma desviación estándar, ello se muestra en la
columna “SECoef”.
MINITAB usa el estadístico t de Student, en lugar del estadístico F, para probar las hipótesis de que los efectos son iguales cero. La columna “T” presenta el valor del estadístico
t de Student, que es igual al cociente de la estimación del coeficiente (Coef) y su desviación
estándar. Bajo la hipótesis nula, el estadístico t tiene la distribución t de Student con 2p(K ⫺ 1)
grados de libertad. Los P-valores se presentan en la columna “P”. La prueba t que realiza MI-
9.5
Experimentos factoriales 2p
699
NITAB equivale a la prueba F descrita en el ejemplo 9.24. El estadístico t8(K ⫺ 1) se puede calcular tomando la raíz cuadrada del estadístico F1, 8(K ⫺ 1) y aplicando el signo de la estimación
del efecto. Los P-valores son idénticos.
A continuación se tratará el análisis de la tabla de varianza. La columna “DF” presenta
los grados de libertad. Las columnas “SeqSS” (suma de los cuadrados secuencial) y “AdjSS”
(suma de los cuadrados ajustada) serán idénticas en todos los ejemplos que se considerarán y
que contendrán sumas de los cuadrados. La columna “Adj MS” contiene medias cuadráticas,
o sumas de cuadrados divididas entre sus grados de libertad. Ahora se explicarán los renglones que implican al error. El renglón “PureError” se refiere a la suma de los cuadrados del
error (SSE) (ecuación 9.66). Hay 8(K ⫺ 1) ⫽ 16 grados de libertad (DF) para el error puro.
La suma de los cuadrados para este último se encuentra en cada una de las siguientes dos columnas, es la suma de los cuadrados del error (SSE). Bajo la columna “Adj MS” está la media cuadrática para el error. El renglón arriba del renglón del error puro se denomina
“Residual Error”. La suma de los cuadrados para el error de residuos es igual a la suma de
cuadrados para el error puro, más las sumas de los cuadrados para cualquiera de los efectos
principales o interacciones que no se incluyen en el modelo. Los grados de libertad por la suma de los cuadrados del error de residuos es igual a los grados de libertad para el error puro,
más los grados de libertad (uno de cada uno) para cada efecto principal o interacción no incluidos en el modelo. Debido a que en este ejemplo todos los efectos principales e interacciones están incluidos en el modelo, la suma de los cuadrados del error de residuos y sus grados
de libertad son iguales a las cantidades correspondientes para el error puro. El renglón “Total” contiene la suma de los cuadrados (SST). La suma total de los cuadrados y sus grados de
libertad son iguales a las sumas de las cantidades correspondientes para todos los efectos, las
interacciones y el error de residuos.
Yendo a la parte superior de la tabla, el primer renglón es “Main Effects”. Hay tres grados de libertad para los efectos principales, porque hay tres efectos principales (A, B, y C) con
un grado de libertad cada uno. La suma de los cuadrados secuencial es la suma de las sumas
de los cuadrados para cada uno de los tres efectos principales. La media cuadrática (Adj MS)
es la suma de los cuadrados dividida entre sus grados de libertad. La columna “F” presenta el
estadístico F para probar la hipótesis nula de que todos los efectos principales son iguales al
cero. El valor del estadístico F (4.57) es igual al cociente de la media cuadrática para los efectos principales (35.827) y la media cuadrática para el error (puro) (7.842). Los grados de libertad para el estadístico F son 3 y 16, por lo que corresponden a los grados de libertad para
las dos medias cuadráticas. La columna “P” presenta el P-valor para la prueba F. En este caso el P-valor es 0.017, que indica que no todos los efectos principales son cero.
Los renglones “2-Way Interactions” y “3-Way Interactions” son similares al renglón para los efectos principales. El P-valor para las interacciones de dos sentidos es 0.047, que es
una evidencia razonablemente fuerte de que al menos algo de las interacciones de dos sentidos no es igual a cero. Debido a que sólo hay una interacción de tres sentidos (A * B * C), el
P-valor en el renglón “3-Way Interactions” es igual (0.365) como el P-valor en la tabla en la
parte superior del resultado de MINITAB para A * B * C.
Recuerde que las pruebas de hipótesis se realizan bajo el supuesto de que todas las observaciones tienen la misma desviación estándar s. La cantidad “S” es la estimación de s y
es igual a la raíz cuadrada de la media al cuadrado del error (MSE). Las cantidades “R-sq” y
“R-sq(adj)” son los coeficientes de determinación R2 y del R2 ajustado, respectivamente, y se
calculan con métodos similares a los del ANOVA de un sentido.
700
CAPÍTULO 9
Experimentos factoriales
Estimación de efectos en un experimento factorial 2p
Mediante una tabla de signos se pueden obtener las fórmulas para calcular las estimaciones
del efecto en cualquier experimento factorial 2p. El método es similar al caso 23, los tratamientos están listados en una columna. El signo para cualquier efecto principal es ⫹ en los
renglones que corresponden a los tratamientos donde el factor está en su nivel alto, y ⫺ en renglones que corresponden a los tratamientos donde el factor está en su nivel bajo. Los signos
para las interacciones se encuentran al multiplicar los signos que corresponden a los factores
en la interacción. La estimación para cualquier efecto o interacción se encuentra sumando y
restando las medias de celda para los tratamientos, utilizando los signos en las columnas adecuadas, para calcular un contraste. El contraste es dividido entre la mitad del número de tratamientos, o 2p ⫺ 1, y obtener así la estimación del efecto.
Resumen
Para un experimento factorial 2p:
contraste
Efecto estimado ⫽ ––––––––––
2p ⫺ 1
(9.68)
Como ejemplo, la tabla 9.8 presenta una tabla de signos para un experimento factorial 25. Se
enlistan los signos para los efectos principales y las interacciones seleccionadas.
Las sumas de cuadrados se calculan con un método similar al del experimento 23. Para
calcular la suma de los cuadrados de error (SSE), sean s1, . . . , s2 las variancias de muestra
de las observaciones en cada uno de los 2p tratamientos. Entonces
p
p
SSE = (K − 1)
2
si2
i=1
p
Los grados de libertad para el error son 2 (K ⫺ 1), dónde K es el número de réplicas por tratamiento. La suma de los cuadrados para cada efecto e interacción es igual al cuadrado del
contraste, multiplicado por el número de réplicas K y dividido entre el número de tratamientos 2p. Las sumas de los cuadrados para los efectos y las interacciones tienen un grado de libertad cada una.
K(contraste)2
Suma de los cuadrados para un efecto ⫽ ——————
(9.69)
2p
Los estadísticos F para los efectos principales y las interacciones se calculan dividiendo la suma de los cuadrados para el efecto entre la media cuadrática para el error. La distribución nula del estadístico F es F1, 2 (K ⫺ 1).
p
Experimentos factoriales sin réplica
Cuando el número de p factores es grande con frecuencia no es viable realizar más de una réplica por cada tratamiento. En este caso no es posible calcular SSE, por lo que las pruebas de
hipótesis antes descritas no se pueden efectuar. Si es razonable suponer que algunas de las interacciones de más alto-orden sean iguales a 0, entonces las sumas de los cuadrados para esas
interacciones pueden sumarse y tratarse de la misma manera que una suma de los cuadrados
9.5
Experimentos factoriales 2p
701
del error. Entonces los efectos principales y las interacciones de orden más bajo se pueden
probar.
TABLA 9.8 Tabla de signos para los efectos principales e interacciones seleccionadas
para un experimento factorial 25
Ejemplo
9.25
Tratamiento
A
B
C
D
E
AB
CDE
ABDE
ABCDE
1
a
b
ab
c
ac
bc
abc
d
ad
bd
abd
cd
acd
bcd
abcd
e
ae
be
abe
ce
ace
bce
abce
de
ade
bde
abde
cde
acde
bcde
abcde
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫺
⫺
⫹
⫹
⫹
⫹
⫺
⫺
⫺
⫺
⫹
⫹
⫹
⫹
⫺
⫺
⫺
⫺
⫹
⫹
⫹
⫹
⫺
⫺
⫺
⫺
⫹
⫹
⫹
⫹
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫺
⫺
⫺
⫺
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫺
⫺
⫺
⫺
⫹
⫹
⫹
⫹
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫹
⫹
⫹
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫺
⫹
⫹
⫺
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫺
⫹
⫹
⫺
⫹
⫺
⫺
⫹
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫹
⫺
⫺
⫹
Mediante un experimento factorial 25 se estimaron los efectos de cinco factores en la calidad
de focos fabricados por cierto proceso. Los factores eran A: planta (1 o 2), B: tipo de máquina (velocidad baja o alta), C: turno (día o noche), D: material del alambre de plomo (usado o
nuevo) y E: método de cargar materiales en el ensamblador (manual o automático). Se obtuvo una réplica para cada tratamiento. La tabla 9.9 presenta los resultados. Calcule las estimaciones de los efectos principales y las interacciones, y sus sumas de los cuadrados. Suponga
que las interacciones de tercero, cuarto y quinto órdenes son despreciables, y haga las sumas
de los cuadrados para utilizarlas como sustituto de una suma de los cuadrados del error. Utilice este sustituto para probar hipótesis referidas a los efectos principales y a las interacciones de segundo orden.
702
CAPÍTULO 9
Experimentos factoriales
TABLA 9.9
Tratamiento Resultado
1
a
b
ab
c
ac
bc
abc
Tratamiento Resultado
32.07
39.27
34.81
43.07
31.55
36.51
28.80
43.05
Tratamiento Resultado
35.64
35.91
47.75
51.47
33.16
35.32
48.26
53.28
d
ad
bd
abd
cd
acd
bcd
abcd
Tratamiento Resultado
25.10
39.25
37.77
46.69
32.55
32.56
28.99
48.92
e
ae
be
abe
ce
ace
bce
abce
de
ade
bde
abde
cde
acde
bcde
abcde
40.60
37.57
47.22
56.87
34.51
36.67
45.15
48.72
TABLA 9.10
Variable
Efecto
A
B
C
D
E
AB
AC
AD
AE
BC
BD
BE
CD
CE
DE
ABC
6.33
9.54
⫺2.07
6.70
0.58
2.84
0.18
⫺3.39
0.60
⫺0.49
4.13
0.65
⫺0.18
⫺0.81
0.24
1.35
Suma de cuadrados
320.05
727.52
34.16
358.72
2.66
64.52
0.27
91.67
2.83
1.95
136.54
3.42
0.26
5.23
0.46
14.47
Variable
Efecto Suma de cuadrados
ABD
ABE
ACD
ACE
ADE
BCD
BCE
BDE
CDE
ABCD
AB CE
ABD E
ACD E
BCD E
AB CD E
⫺0.29
0.76
0.11
⫺0.69
⫺0.45
0.76
⫺0.82
⫺2.17
⫺1.25
⫺2.83
0.39
0.22
0.18
⫺0.25
⫺1.73
0.67
4.59
0.088
3.75
1.60
4.67
5.43
37.63
12.48
63.96
1.22
0.37
0.24
0.52
23.80
Solución
Los efectos se calculan utilizando las reglas y al sumar y restar las observaciones dadas en la
tabla de signos y las sumas de los cuadrados mediante la ecuación (9.69). Véase la tabla 9.10.
Observe que ninguna de las interacciones de tercer, cuarto o quinto orden están entre
los efectos mayores. Si alguna de ellas estuviera no sería inteligente combinar sus sumas de los
cuadrados. En consecuencia, se suman las sumas de los cuadrados de las interacciones tercera, cuarta y quinta. Los resultados se presentan en el siguiente resultado de MINITAB.
Factorial Fit: Response versus A, B, C, D, E
Estimated Effects and Coefficients for
Response (coded units)
Term
Constant
A
Effect
6.325
Coef
39.658
3.163
SE Coef
0.5854
0.5854
T
67.74
5.40
P
0.000
0.000
9.5
B
C
D
E
A∗B
A∗C
A∗D
A∗E
B∗C
B∗D
B∗E
C∗D
C∗E
D∗E
S = 3.31179
9.536
–2.066
6.696
0.576
2.840
0.183
–3.385
0.595
–0.494
4.131
0.654
–0.179
–0.809
0.239
4.768
–1.033
3.348
0.288
1.420
0.091
–1.693
0.298
–0.247
2.066
0.327
–0.089
–0.404
0.119
R–Sq = 90.89%
0.5854
0.5854
0.5854
0.5854
0.5854
0.5854
0.5854
0.5854
0.5854
0.5854
0.5854
0.5854
0.5854
0.5854
Experimentos factoriales 2p
8.14
–1.76
5.72
0.49
2.43
0.16
–2.89
0.51
–0.42
3.53
0.56
–0.15
–0.69
0.20
703
0.000
0.097
0.000
0.629
0.027
0.878
0.011
0.618
0.679
0.003
0.584
0.881
0.500
0.841
R–Sq(adj) = 82.34%
Analysis of Variance for Response (coded units)
Source
Main Effects
2-Way Interactions
Residual Error
Total
DF
5
10
16
31
Seq SS
1443.1
307.1
175.5
1925.7
Adj SS
1443.1
307.1
175.5
Adj MS
288.62
30.71
10.97
F
26.31
2.80
P
0.000
0.032
Las estimaciones no han cambiado para los efectos principales o las interacciones de
dos sentidos. La suma de los cuadrados del error de residuos (175.5) en la tabla de análisis de varianza se encuentra al sumar los cuadrados para todas las interacciones de orden más alto que
se eliminaron del modelo. El número de grados de libertad (16) es igual a la suma de los grados de libertad (uno para cada uno) para las 16 interacciones de orden más alto. No hay ninguna suma de los cuadrados del error puro (SSE), porque sólo hay una réplica por tratamiento.
La suma de los cuadrados del error de residuos se utiliza como un sustituto de SSE para calcular todas las cantidades que requieren una suma de los cuadrados del error.
Se concluye del resultado que los factores A, B, y D probablemente afecten el resultado. También parece que lo hacen las interacciones entre algunos pares de estos factores. Podría ser adecuado planear experimentos adicionales concentrados en los factores A, B, y D.
Uso de gráficas de probabilidad para detectar efectos grandes
Un método informal, sugerido para ayudar a determinar cuáles de los efectos es grande, consiste en trazar el efecto y la interacción estimados en una gráfica de probabilidad normal. Si,
en efecto, ninguno de los factores afecta el resultado, entonces el efecto y la interacción estimados forman una muestra aleatoria simple de una población normal y se deben encontrar
aproximadamente en una línea recta. En muchos casos, la mayoría de las estimaciones se encontrarán aproximadamente en una recta, y unas pocas estarán lejos de la recta. Los efectos
principales y las interacciones cuyas estimaciones se encuentran lejos de la recta tienen más
probabilidad de ser importantes. La figura 9.13 presenta una gráfica de probabilidad normal
704
CAPÍTULO 9
Experimentos factoriales
del efecto principal y la interacción estimada a partir de los datos del ejemplo 9.25. Es claro,
a partir de la gráfica, que los efectos principales de los factores A, B y D, y las interacciones
AB y BD, resaltan del resto.
0.999
B
0.99
D
0.95
0.9
AB
0.75
0.5
BD
A
0.25
0.1
0.05
0.01
0.001
⫺4
⫺2
0
2
4
Efecto
6
8
10
FIGURA 9.13 Gráfica de probabilidad normal de las estimaciones del efecto de los datos
del ejemplo 9.25. Los efectos principales de los factores A, B y D son mayores que el resto.
Experimentos factoriales muy pequeños
Cuando el número de los factores es grande tal vez no sea factible realizar incluso una réplica para cada tratamiento. En estos casos las observaciones pueden tomarse sólo para alguna
fracción de los tratamientos. Si éstos se eligen correctamente, aun es posible obtener la información acerca de los factores.
Cuando cada factor tiene dos niveles, la fracción debe ser siempre una potencia de 2; es
decir, la mitad, un cuarto, etcétera. Un experimento en el que se usa la mitad de los tratamientos se llama media-réplica; si se usa un cuarto de los tratamientos, es un cuarto-réplica, etcétera. Un experimento 2p de media-réplica con frecuencia se denota por 2p⫺1, para indicar
que mientras que hay p factores, solamente hay 2p⫺1 tratamientos que deben considerarse. De
forma similar, un cuarto-réplica con frecuencia se denota mediante 2p⫺2. Se concentrará la
atención en experimentos de media-réplica.
Se presenta un método para elegir un media-réplica de un experimento 25. Tal experimento tendrá 16 tratamientos elegidos de los 32 en el experimento 25. La elección de 16 tratamientos se inicia con una tabla de signos para un diseño 24 que indica los signos para los
efectos principales y la interacción de más alto orden. Esto último se presenta en la tabla 9.11.
La tabla 9.11 tiene el número correcto de tratamientos (16), pero sólo cuatro factores.
Con el fin de transformarla para un diseño 25 de media-réplica, se debe presentar un quinto
factor, E. Para hacer esto se reemplaza la interacción de más alto orden con E. Éste establece
los signos para el efecto principal de E. Entonces en cada renglón donde el signo para E es
⫹, se agrega la letra e al tratamiento. Esto indica que el factor E se establece en su nivel más
9.5
Experimentos factoriales 2p
705
TABLA 9.11 Tabla de signos para los efectos
principales y para las interacciones de cuatro
sentidos en un experimento factorial 24
Tratamiento
A
B
C
D
ABCD
1
a
b
ab
c
ac
bc
abc
d
ad
bd
abd
cd
acd
bcd
abcd
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫺
⫺
⫹
⫹
⫹
⫹
⫺
⫺
⫺
⫺
⫹
⫹
⫹
⫹
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫺
⫺
⫹
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫹
⫺
⫺
⫹
alto para ese tratamiento. Donde el signo de E es ⫺, el factor E se establece en su nivel bajo.
El diseño resultante se llama fracción principal del diseño 25. La tabla 9.12 presenta los signos para los efectos principales y las interacciones seleccionadas de este diseño.
TABLA 9.12 Tabla de signos para los efectos principales y las interacciones
seleccionadas para un experimento factorial 25
Tratamiento
A
B
C
D
E = ABCD
AB
CDE
ACDE
e
a
b
abe
c
ace
bce
abc
d
ade
bde
abd
cde
acd
bcd
abcde
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫺
⫺
⫹
⫹
⫹
⫹
⫺
⫺
⫺
⫺
⫹
⫹
⫹
⫹
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫺
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫹
⫺
⫺
⫹
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
⫺
⫺
⫹
⫹
706
CAPÍTULO 9
Experimentos factoriales
Hay un precio que pagar por utilizar solamente la mitad de los tratamientos. Con este
propósito, observe que en la tabla 9.12 la interacción AB tiene los mismos signos que la interacción CDE y la interacción ACDE tiene los mismos signos que el efecto principal B. Cuando dos efectos tienen los mismos signos, se dice que son seudónimos. En efecto, los efectos
principales y las interacciones en una fracción media forman pares en los cuales cada miembro de la pareja es seudónimo del otro. Los pares de seudónimos para esta fracción media de
diseño 25 son
{A, BCDE}
{B, ACDE}
{C, ABDE}
{D, ABCE}
{E, ABCD}
{AB, CDE}
{AC, BDE}
{AD, BCE}
{AE, BCD}
{BC, ADE}
{BD, ACE}
{BE, ACD}
{CD, ABE}
{CE, ABD}
{DE, ABC}
Cuando dos efectos son seudónimos sus estimaciones del efecto son las mismas, ya que
implican los mismos signos. En efecto, cuando se utiliza la fracción principal de un diseño,
la estimación de cualquier efecto representa la suma de ese efecto y de su seudónimo. Por tanto, para la fracción principal de un diseño 25, cada estimación del efecto principal representa
realmente la suma del efecto principal más su interacción seudónima de cuatro sentidos, y cada estimación de la interacción de dos sentidos representa la suma de la interacción de dos
sentidos más su interacción seudónima de tres sentidos.
En muchos casos es razonable suponer que las interacciones de más alto orden son pequeñas. En la media-réplica 25, si las interacciones de cuatro sentidos son despreciables, la estimación del efecto principal será exacta. Si además las interacciones de tres sentidos son
despreciables, la estimación de la interacción de dos sentidos también es exacta.
En un diseño fraccional sin replicación con frecuencia no hay ninguna buena manera de
calcular una suma de los cuadrados del error; por tanto, ninguna forma rigurosa de probar las
hipótesis de que los efectos sean iguales a 0. En muchos casos, el propósito de un diseño fraccional sólo es identificar algunos factores que parecen tener mayor impacto en el resultado.
Esta información se puede utilizar para diseñar experimentos más elaborados con el fin de investigar estos factores. Con este propósito puede ser suficiente sólo elegir aquellos factores
cuyos efectos o interacciones de dos sentidos son inusitadamente grandes, sin realizar pruebas de hipótesis. Esto último es posible enlistando las estimaciones en orden decreciente, y
luego ver si hay algunos que sean notablemente mayores que el resto. Otro método es trazar
las estimaciones del efecto y de la interacción en una gráfica de probabilidad normal, como
se analizó previamente.
Ejemplo
9.26
En un sistema de emulsión de membrana líquida, una emulsión (fase interna) se dispersa en
un medio externo líquido que contiene un contaminante. Éste se elimina del líquido externo
mediante transferencia de masa en la emulsión. El escape de la fase interna ocurre cuando
partes del material extraído se derraman en el líquido externo. En el artículo “Leakage and
Swell in Emulsion Liquid Membrane Systems: Batch Experiments” (R. Pfeiffer, W. Navidi y
A. Bunge, en Separation Science and Technology, 2003:519-539) se estudiaron los efectos de
cinco factores para determinar el efecto sobre la fuga en cierto sistema. Los cinco factores
fueron A: concentración del agente tensoactivo, B: concentración de hidróxido de litio de la
9.5
Experimentos factoriales 2p
707
fase interna, C: fase de membrana, D: fracción de volumen de fase interna y E: tasa de agitación de extracción del recipiente. Se utilizó un diseño 25 de media fracción. Los datos se presentan en la tabla siguiente (en el experimento verdadero, cada punto en realidad representaba
el promedio de dos mediciones). La fuga se mide en unidades porcentuales. Suponga que las
interacciones de tercero, cuarto y quinto órdenes son despreciables. Estime los efectos principales y las interacciones de dos sentidos. ¿Cuáles, si hay, destacan por ser notablemente mayores que el resto?
Tratamiento Fuga
e
a
b
abe
0.61
0.13
2.23
0.095
Tratamiento Fuga
c
ace
bce
abc
0.35
0.075
7.31
0.080
Tratamiento Fuga
d
ade
bde
abd
2.03
0.64
11.72
0.56
Tratamiento Fuga
cde
acd
bcd
abcde
1.45
0.31
1.33
6.24
Solución
Utilizando la tabla de signos (tabla 9.12) se calculan las estimaciones para los efectos principales y las interacciones de dos sentidos, los cuales se muestran en la tabla siguiente.
Variable
Efecto
Variable
Efecto
A
B
C
D
E
AB
AC
AD
⫺2.36
3.00
⫺0.11
1.68
2.64
⫺1.54
1.43
0.17
AE
BC
BD
BE
CD
CE
DE
⫺1.15
0.20
0.86
2.65
⫺1.30
0.61
1.32
Observe que no se considera realizar cálculos para las sumas de los cuadrados para las estimaciones, porque no se tiene SSE con el cual compararlos. Para determinar informalmente
qué efectos pueden merecer investigación adicional, se clasifican las estimaciones en orden
de sus valores absolutos: B: 3.00, BE: 2.65, E: 2.64, A: ⫺2.36, D: 1.68, y así sucesivamente.
Parece razonable decidir que hay bastante separación entre los efectos A y D; por tanto, se tiene que los factores A, B y E son probablemente los más importantes.
Ejercicios para la sección 9.5
1. Construya una tabla de signos para la fracción principal respecto de un diseño 24. Después indique todos los pares de seudónimos.
2. Dé un ejemplo de un experimento factorial en el cual la falla de aleatoriedad puede producir los resultados incorrectos.
3. Un estudio en una planta piloto investigó los efectos de tres factores en la producción (en gramos) de monómero para la formulación adhesiva. Los tres factores fueron A: temperatura, B: nivel catalizador y C: tipo de catalizador. Los niveles de los factores fueron A: 160°C(⫺1) y 180°C(⫹1); B: 20%(⫺1) y 40%(⫹1); C: distribuidor E(⫺1) y distribuidor J(⫹1). Se realizaron
dos réplicas de un diseño factorial 23, con los resultados que se presentan en la tabla siguiente.
708
CAPÍTULO 9
Experimentos factoriales
A
B
C
–1
1
–1
1
–1
1
–1
1
–1
–1
1
1
–1
–1
1
1
–1
–1
–1
–1
1
1
1
1
Media de la
Producciones producción
58,
74,
43,
75,
56,
74,
46,
78,
60
70
51
73
60
78
44
80
59
72
47
74
58
76
45
79
a) Calcule las estimaciones de los efectos principales y las interacciones, y la suma de los cuadrados y el P-valor para cada uno.
b) ¿Cuáles efectos principales e interacciones son importantes?
c) Las otras cosas siguen igual, ¿la media de la producción será más alta cuando la temperatura sea de 160°C o de 180°C? Explique.
4. El artículo “Efficient Pyruvate Production by a Multi-Vitamin Auxotroph of Torulopsis glabrata: Key Role and Optimization
of Vitamin Levels” (Y. Li, J. Chen y cols., en Applied Microbiology and Biotechnology, 2001:680-685) investiga los efectos de
los niveles de algunas vitaminas en un cultivo de células en la producción (en g/L) de piruvato, un ácido orgánico útil. Los datos en la tabla siguiente se presentan con dos réplicas de un diseño 23. Los factores son A: el ácido nicotínico, B: tiamina y C:
biotina. (Se han eliminado dos factores estadísticamente insignificantes. En el artículo, cada factor fue probado en cuatro niveles; se han reducido éstos a dos.)
A
B
C
–1
1
–1
1
–1
1
–1
1
–1
–1
1
1
–1
–1
1
1
–1
–1
–1
–1
1
1
1
1
Producciones
0.55,
0.60,
0.37,
0.30,
0.54,
0.54,
0.44,
0.36,
Media de la
producción
0.49
0.42
0.28
0.28
0.54
0.47
0.33
0.20
0.520
0.510
0.325
0.290
0.540
0.505
0.385
0.280
a) Calcule las estimaciones de los efectos principales y las interacciones, y la suma de los cuadrados y el P-valor para cada una.
b) ¿Es adecuado el modelo aditivo?
c) ¿Qué conclusiones acerca de los factores se pueden obtener de estos resultados?
5. El artículo citado en el ejercicio 4 también investigó los efectos de los factores en el consumo de glucosa (en g/L). Se proporciona una sola medición para cada combinación de factores (en el artículo hubo cierta replicación). Los resultados se presentan en la tabla siguiente.
A
B
C
Consumo de glucosa
–1
1
–1
1
–1
1
–1
1
–1
–1
1
1
–1
–1
1
1
–1
–1
–1
–1
1
1
1
1
68.0
77.5
98.0
98.0
74.0
77.0
97.0
98.0
9.5
Experimentos factoriales 2p
709
a) Calcule las estimaciones de los efectos principales y las interacciones.
b) ¿Se puede calcular una suma de los cuadrados del error? Explique.
c) ¿Alguna de las interacciones se encuentra entre los efectos mayores? Si es así, ¿cuál es?
d) Suponga que se conoce de experiencias pasadas donde el modelo aditivo vale. Sume las sumas de los cuadrados para las interacciones, y utilice ese resultado en lugar de una suma de los cuadrados del error para probar las hipótesis de que los efectos principales sean iguales a 0.
6. Se diseñó y se construyó un decantador para la separación de sólidos de jabón de una suspensión con base de agua. El propósito del dispositivo es reducir el contenido de agua de la suspensión de jabón para que éste se pueda procesar aún más en barras y el líquido (una solución salina) se pueda reutilizar. Se realizó un estudio preliminar en el que se variaron tres factores.
Éstos fueron A: temperatura de la operación (medida en °C), B: tasa de circulación del dispositivo (medida como el tiempo de
residencia, en segundos) y C: atasco de sólidos en el dispositivo (medido como el tiempo de residencia, en segundos). El resultado es la fracción sólida en la suspensión. El experimento se realizó una vez para cada combinación de factores. Los resultados se presentan en la tabla siguiente.
Temperatura Circulación
(A)
(B)
50
70
50
70
50
70
50
70
170
170
300
300
170
170
300
300
Atasco de Fracción de
sólidos
sólidos en
(C)
la suspensión
150
150
150
150
500
500
500
500
33
44
47
36
51
43
54
56
a) Calcule las estimaciones de los efectos principales y de las interacciones.
b) ¿Se puede calcular una suma de los cuadrados del error? Explique.
c) ¿Alguna de las interacciones se encuentra entre los efectos mayores? Si es así, ¿cuál es?
d) Alguien afirma que el modelo aditivo vale. ¿Los resultados tienden a respaldar esta declaración? Explique.
7. La medición de la resistencia de una placa cubierta con tungsteno que se utiliza en la fabricación de circuitos integrados puede estar afectada por varios factores, incluyendo A: cuál de los dos tipos de casete se utiliza para fijar la placa, B: si la placa está cargada hacia arriba o sobre la parte inferior del casete, y C: si se utilizó la parte del frente o trasera de la estación del casete.
Los datos de un experimento factorial 23 con una réplica se presentan en la tabla siguiente. (Basado en el artículo “Prometrix
RS35e Gauge Study in Five Two-Level Factors and One Three-Level Factor”, J. Buckner, B. Chin y J. Henri, en Statistical Case Studies for Industrial Process Improvement, SIAM-ASA, 1997:9-18.)
A
B
C
Resistencia (mΩ)
–1
1
–1
1
–1
1
–1
1
–1
–1
1
1
–1
–1
1
1
–1
–1
–1
–1
1
1
1
1
85.04
84.49
82.15
86.37
82.60
85.14
82.87
86.44
710
CAPÍTULO 9
Experimentos factoriales
a) Calcule las estimaciones de los efectos principales y de las interacciones.
b) ¿Se puede calcular una suma de los cuadrados del error? Explique.
c) Trace las estimaciones en una gráfica de probabilidad normal. ¿La gráfica muestra que algunos de los factores influyen en
la resistencia? Si es así, ¿cuál es?
8. En un diseño 2p con una réplica por tratamiento a veces ocurre que falta la observación para uno de los tratamientos, debido al
error experimental o a alguna otra causa. Cuando esto último ocurre, un enfoque es reemplazar el valor faltante con el que tiene la interacción de más alto orden igual a 0. Considere el ejercicio 7 y suponga que falta la observación para el tratamiento
donde A, B y C están en su nivel bajo (⫺1).
a) ¿Qué valor para esta observación hace que la interacción de tres sentidos sea igual a 0?
b) Utilizando este valor, calcule las estimaciones para los efectos principales y las interacciones.
9. Las consideraciones de seguridad son importantes en el diseño de automóviles. El artículo “An Optimum Design Methodology
Development Using a Statistical Technique for Vehicle Occupant Safety” (J. Hong, M. Mun, y S. Song, en Proceedings of the
Institution of Mechanical Engineers, 2001:795-801) presenta los resultados de un estudio de simulación de un ocupante. La variable del resultado es la aceleración del pecho (en g) 3 ms después del impacto. Se consideraron cuatro factores. Éstos fueron
A: característica de abertura de la bolsa de aire, B: tiempo en que se dispara el inflador de la bolsa de aire, C: tasa de flujo de
masa del inflador de la bolsa de aire y D: relación de tensión-tirantez de espuma de rodilla. Los resultados (parte de un estudio mayor) se presentan en la tabla siguiente. Hay una réplica por tratamiento.
Tratamiento Resultado Tratamiento Resultado Tratamiento Resultado Tratamiento Resultado
1
a
b
ab
85.2
79.2
84.3
89.0
c
ac
bc
abc
66.0
69.0
68.5
76.4
d
ad
bd
abd
85.0
82.0
84.7
82.2
cd
acd
bcd
abcd
62.6
65.4
66.3
69.0
a) Calcule las estimaciones de los efectos principales y de las interacciones.
b) Si usted fuera a diseñar un estudio de seguimiento, ¿en qué factor o factores se concentraría? Explique.
10. El artículo estudio “Experimental Study of Workpiece-Level Variability in Blind via Electroplating” (G. Poon, J. Chan y D. Williams, en Proceedings of the Institution of Mechanical Engineers, 2001:521-530) describe un experimento factorial con que
determinó cuáles de los diferentes factores influyen en la variabilidad del espesor de un depósito de ácido de cobre electrodepositado. Los resultados del experimento se presentan aquí como un diseño completo 25; se han omitido dos factores estadísticamente insignificantes. Hubo una réplica por tratamiento. Los factores son A: concentración de ácido sulfúrico (g/L), B:
concentración de sulfato de cobre (g/L), C: densidad de corriente promedio (mA/cm2), D: separación de electrodo (cm) y E:
distancia entre los huecos (cm). El resultado es la variabilidad en el espesor (en µm), medida al calcular la desviación estándar
de los espesores medidos en diferentes puntos en un tablero de prueba, después de que se han eliminado las mediciones más
grandes y más pequeñas. Los datos se presentan en la tabla siguiente.
Tratamiento Resultado Tratamiento Resultado Tratamiento Resultado Tratamiento Resultado
1
a
b
ab
c
ac
bc
abc
1.129
0.985
1.347
1.151
2.197
1.838
1.744
2.101
d
ad
bd
abd
cd
acd
bcd
abcd
1.760
1.684
1.957
1.656
2.472
2.147
2.142
2.423
e
ae
be
abe
ce
ace
bce
abce
1.224
1.092
1.280
1.381
1.859
1.865
1.867
2.005
de
ade
bde
abde
cde
acde
bcde
abcde
1.674
1.215
1.275
1.446
2.585
2.587
2.339
2.629
9.5
Experimentos factoriales 2p
711
a) Calcule las estimaciones de los efectos principales y de las interacciones.
b) Si usted fuera a diseñar un experimento de seguimiento, ¿en qué factores se concentraría? ¿Por qué?
11. El artículo “Factorial Design for Column Flotation of Phosphate Wastes” (N. Abdel-Khalek, en Particulate Science and Technology, 2000:57-70) describe un diseño factorial 23 para investigar el efecto de velocidad aérea superficial (A), concentración
más espumosa (B) y velocidad de agua de lavado superficial (C) en la recuperación porcentual del P2O5. Hubo dos réplicas.
Los datos se presentan en la tabla siguiente.
A
B
C
–1
1
–1
1
–1
1
–1
1
–1
–1
1
1
–1
–1
1
1
–1
–1
–1
–1
1
1
1
1
Recuperación
porcentual
56.30
70.10
65.60
80.20
50.30
65.30
60.53
70.63
54.85
72.70
63.60
78.80
48.95
66.00
59.50
69.86
a) Calcule las estimaciones de los efectos principales y las interacciones, junto con sus sumas de los cuadrados y P-valores.
b) ¿Cuales factores parecen más importantes? ¿Los factores importantes interactúan? Explique.
12. El artículo “An Application of Fractional Factorial Designs” (M. Kilgo, en Quality Engineering, 1988:19-23) describe un diseño
25⫺1(media-réplica de un diseño 25) que implica el uso de dióxido de carbono (CO2) en la alta presión para extraer aceite de los
cacahuates. Los resultados fueron la solubilidad del aceite de cacahuate en el CO2 (en mg de aceite/litro de CO2) y la producción
de aceite de cacahuate (en %). Los cinco factores fueron A: presión del CO2, B: temperatura del CO2, C: humedad del cacahuate,
D: tasa de circulación del CO2 y E: tamaño de partícula de cacahuate. Los resultados se presentan en la tabla siguiente.
Tratamiento
e
a
b
abe
c
ace
bce
abc
Solubilidad
29.2
23.0
37.0
139.7
23.3
38.3
42.6
141.4
Producción Tratamiento
63
21
36
99
24
66
71
54
d
ade
bde
abd
cde
acd
bcd
abcde
Solubilidad
Producción
22.4
37.2
31.3
48.6
22.9
36.2
33.6
172.6
23
74
80
33
63
21
44
96
a) Suponiendo que las interacciones de tercer orden y superiores son despreciables, calcule las estimaciones de los efectos
principales y de las interacciones para la solubilidad resultante.
b) Trace las estimaciones en una gráfica de probabilidad normal. ¿La gráfica muestra que algunos de los factores influyen en
la solubilidad? Si es así, ¿cuáles son?
c) Suponiendo que las interacciones de tercer orden y superior sean insignificantes, calcule las estimaciones de los efectos
principales y de las interacciones para la producción resultante.
d) Trace las estimaciones en una gráfica de probabilidad normal. La gráfica muestra que algunos de los factores influyen en
la producción? Si es así, ¿cuáles son?
13. En un diseño 25⫺1 (como en el ejercicio 12), ¿qué representa en realidad la estimación del efecto principal del factor A?
712
CAPÍTULO 9
Experimentos factoriales
i) El efecto principal de A.
ii) La suma del efecto principal de A y la interacción de BCDE.
iii) La diferencia entre el efecto principal de A y la interacción de BCDE.
iv) La interacción entre A y BCDE.
Ejercicios adicionales para el capítulo 9
1. El artículo “Gypsum Effect on the Aggregate Size and Geometry of Three Sodic Soils Under Reclamation” (I. Lebron, D. Suárez y T. Yoshida, en Journal of the Soil Science Society of America, 2002:92-98) describe un experimento en el que se ha agregado yeso en diferentes cantidades a muestras de tierra antes del filtrado. Uno de los resultados relevantes fue el pH de la tierra.
El yeso se agregó en cuatro cantidades diferentes. Tres muestras de tierra recibieron una cantidad agregada. Las mediciones de
pH de las muestras se presentan en la tabla siguiente.
Yeso (g/kg)
0.00
0.11
0.19
0.38
pH
7.88
7.81
7.84
7.80
7.72
7.64
7.63
7.73
7.68
7.85
7.87
8.00
¿Puede concluir que el pH difiere de la cantidad de yeso agregado? Proporcione el valor del estadístico de prueba y el P-valor.
2. El artículo mencionado en el ejercicio 1 también considera el efecto del yeso en la conductancia eléctrica (en dS m⫺1) de la tierra. Dos tipos de tierra fueron tratados, cada uno, con tres cantidades diferentes de yeso, con dos réplicas para cada combinación de tierra-yeso. Los datos se presentan en la tabla siguiente.
Yeso (g/kg)
0.00
0.27
0.46
Tipo de tierra
las Animas
Madera
1.52 1.05
1.49 0.91
0.99 0.92
1.01 0.92
1.12 0.92
0.88 0.92
a) ¿Hay evidencias convincentes de una interacción entre la cantidad de yeso y el tipo de tierra?
b) ¿Puede concluir que la conductividad difiere entre los tipos de tierra?
c) ¿Puede concluir que la conductividad difiere con la cantidad de yeso agregado?
3. La penicilina la produce el hongo Penicillium, que se cultiva en un caldo cuyo contenido de azúcar debe ser cuidadosamente
controlado. Se tomaron algunas muestras de caldo en cada uno de tres días sucesivos, y se midió la cantidad de azúcar disuelta (en mg/ml) en cada muestra. Los resultados fueron:
Día 1:
Día 2:
Día 3:
4.8 5.1 5.1 4.8 5.2 4.9 5.0 4.9 5.0 4.8 4.8 5.1 5.0
5.4 5.0 5.0 5.1 5.2 5.1 5.3 5.2 5.2 5.1 5.4 5.2 5.4
5.7 5.1 5.3 5.5 5.3 5.5 5.1 5.6 5.3 5.2 5.5 5.3 5.4
¿Puede concluir que la media de la concentración de azúcar difiere entre los tres días?
Ejercicios adicionales para el capítulo 9
713
4. El siguiente resultado de MINITAB es un ANOVA de dos sentidos. Algo no funcionó con la impresora, y algunos de los números no se imprimieron.
Two-way Analysis of Variance
Analysis of Variance
Source
DF
Row
3
Column
2
Interaction
6
Error
(a)
Total
23
SS
145.375
15.042
(b)
(c)
217.870
MS
(d)
(e)
4.2000
(f)
F
(g)
(h)
(i)
P
(j)
(k)
(l)
Complete los números que faltan en la tabla del (a) al (l). Puede dar los rangos para los P-valores.
5. Mediante un experimento se determinó si a diferentes clases de chocolate les toma periodos diferentes disolverse. Cuarenta personas fueron divididas en cinco grupos. A cada grupo se le asigno cierto tipo de chocolate. Cada persona disolvió una pieza de
chocolate, y se registró el tiempo de disolución (en segundos). Para comparar, cada persona en cada grupo también disolvió
una pieza de golosina de dulce de azúcar y mantequilla; estos artículos eran idénticos para todos los grupos. Los datos, que incluyen el grupo, el tiempo de disolución tanto para el chocolate como para el dulce de azúcar y mantequilla, la diferencia entre los tiempos de disolución, y el cociente de los tiempos de disolución, se presentan en la tabla siguiente. Observe que el
diseño es ligeramente no balanceado; el grupo 3 tiene nueve personas y el grupo 5 tiene solamente siete.
Grupo
Chocolate
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
3
3
3
3
3
135
865
122
110
71
81
2 405
242
42
30
104
124
75
80
255
71
51
47
90
65
27
Dulce de azúcar
y mantequilla
60
635
63
75
37
58
1 105
135
38
30
110
118
40
91
121
71
53
40
155
90
33
Diferencia
75
230
59
35
34
23
1 300
107
4
0
⫺6
6
35
⫺11
134
0
⫺2
7
⫺65
⫺25
⫺6
Cociente
2.25
1.36
1.94
1.47
1.92
1.40
2.18
1.79
1.11
1.00
0.95
1.05
1.88
0.88
2.11
1.00
0.96
1.18
0.58
0.72
0.82
Continúa en la página 714
714
CAPÍTULO 9
Experimentos factoriales
Grupo
Chocolate
3
3
3
3
4
4
4
4
4
4
4
4
5
5
5
5
5
5
5
Dulce de azúcar
y mantequilla
105
90
54
93
48
85
82
46
64
125
69
73
105
99
45
137
170
153
49
Diferencia
68
72
52
77
30
55
50
22
46
45
30
44
45
58
23
64
105
93
28
37
18
2
16
18
30
32
24
18
80
39
29
60
41
22
73
65
60
21
Cociente
1.54
1.25
1.04
1.21
1.60
1.55
1.64
2.09
1.39
2.78
2.30
1.66
2.33
1.71
1.96
2.14
1.62
1.65
1.75
a) Para probar si hay diferencias en la media de los tiempos de disolución para los diferentes tipos de chocolate, alguien sugiere realizar un ANOVA de un sentido, utilizando el tiempo de disolución para los datos del chocolate. ¿Estos datos parecen satisfacer los supuestos para un ANOVA de un sentido? Explique.
b) Otra persona sugiere utilizar las diferencias (chocolate ⫺ dulce de azúcar y mantequilla). ¿Estos datos parecen satisfacer
los supuestos para un ANOVA de un sentido? Explique.
c) Realice un análisis de varianza de un sentido utilizando los cocientes. ¿Puede concluir que la media del cociente del tiempo de disolución difiere para clases de chocolate diferentes?
6. El artículo “Stability of Silico-Ferrite of Calcium and Aluminum (SFCA) in Air-Solid Solution Limits Between 1 240°C and
1 390°C and Phase Relationships within the Fe2O3-CaO-Al2O3SiO2 (FCAS) System” (T. Patrick y M. Pownceby, en Metallurgical and Materials Transactions B, 2002:79-90) investiga las propiedades de silicio-ferritas de calcio y aluminio (SFCA). Los
datos en la tabla siguiente presentan el cociente de los pesos Fe2O3 y CaO para elementos SFCA con algunos porcentajes de
peso diferentes de Al2O3 y C4S3.
Al2O3 (%)
1.0
1.0
1.0
5.0
5.0
5.0
10.0
10.0
10.0
C4S3
Bajo (3-6%)
Medio (7-10%)
Alto (11-14%)
Bajo (3-6%)
Medio (7-10%)
Alto (11-14%)
Bajo (3-6%)
Medio (7-10%)
Alto (11-14%)
Fe2O3 /CaO
7.25
6.03
5.10
6.92
5.74
4.84
6.50
5.37
4.52
6.92
5.78
4.90
6.59
5.26
4.65
6.18
5.14
4.33
6.60
5.54
4.71
6.29
5.04
4.47
5.89
4.92
4.16
6.31
5.31
4.53
6.01
4.84
4.29
5.63
4.71
3.99
a) Estime todos los efectos principales y las interacciones.
b) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
c) ¿Los datos indican que hay interacciones entre el porcentaje de peso de Al2O3 y el porcentaje de peso C4S3? Explique.
Ejercicios adicionales para el capítulo 9
715
d) ¿Los datos demuestran convincentemente que el cociente Fe2O3/CaO depende del porcentaje de peso de Al2O3? Explique.
e) ¿Los datos demuestran convincentemente que el cociente Fe2O3/CaO depende del porcentaje de peso de C4S3? Explique.
7. Se puede fabricar un componente de acuerdo con cualquiera de dos diseños, uno con material más costoso o uno con material menos costoso. Varios componentes se fabrican con cada combinación de diseño y material, y los tiempos de vida de cada uno se miden (en horas). Mediante un análisis de varianza de dos sentidos se estimaron los efectos de diseño y material en el tiempo de vida
de un componente. Las estimaciones de la media de las celdas y de los efectos principales se presentan en la tabla siguiente.
Medias de la celda
Diseño 1
Diseño 2
Más caros
Menos caros
118
60
Efectos principales
Más caros
Menos caros
Diseño 1
Diseño 2
120
122
14
⫺14
⫺16
16
Tabla A
ANOVA
Fuente
GL
SS
MS
F
P
Material
Diseño
Interacción
Error
Total
1
1
1
8
11
2 352.0
3 072.0
2 700.0
1 800.0
9 924.0
2 352.0
3 072.0
2 700.0
225.00
10.45
13.65
12.00
0.012
0.006
0.009
El ingeniero de proceso recomienda que se debe utilizar el diseño 2 junto con el material más costoso. Argumenta que los efectos principales son positivos, por lo que la utilización de esta combinación dará como resultado un tiempo de vida mayor del
componente. ¿Está de acuerdo con la recomendación? ¿Por qué sí o no?
8. El artículo “Case Study Based Instruction of DOE and SPC” (J. Brady y T. Allen, en The American Statistician, 2002:312315) presenta el resultado de un experimento factorial 24⫺1 para investigar los efectos de cuatro factores en la producción de
un proceso que fabrica tableros de circuitos impresos. Los factores fueron A: la alimentación eléctrica de transistor produjo
(límite de especificación superior o más bajo), B: enfoque de soporte de transistor (atornillado o soldado), C: tipo de absorbedor de calor del transistor (configuración actual o alternativa) y D: posición de tornillo en el ajustador de frecuencia (media o dos vueltas). Los resultados se presentan en la tabla siguiente. La producción es un porcentaje de un máximo teórico.
A
B
C
D
Producción
–1
1
–1
1
–1
1
–1
1
–1
–1
1
1
–1
–1
1
1
–1
–1
–1
–1
1
1
1
1
–1
1
1
–1
1
–1
–1
1
79.8
69.0
72.3
71.2
91.3
95.4
92.7
91.5
716
CAPÍTULO 9
Experimentos factoriales
a) Estime los efectos principales de cada uno de los cuatro factores.
b) Suponiendo que todas las interacciones sean despreciables, combine las sumas de los cuadrados para la interacción que se
utilizarán en vez de una suma de los cuadrados del error.
c) ¿Cuál de los cuatro factores, si hay, puede concluir que afecta la producción? ¿Cuál es el P-valor de la prueba importante?
9. El artículo “Combined Analysis of Real-Time Kinematic GPS Equipment and Its Users for Height Determination” (W. Featherstone y M. Stewart, en Journal of Surveying Engineering, 2001:31-51) presenta un estudio de la precisión de los equipos
para medir la altura del sistema de posicionamiento global (GPS, por sus siglas en inglés). Se estudiaron tres tipos de equipos
y se utilizó cada uno en la realización de mediciones en cuatro estaciones base diferentes (en el artículo se incluye una quinta
estación, para que los resultados difirieran considerablemente de las otras cuatro). Se hicieron 60 mediciones con cada pieza
del equipo en cada base. Las medias y las desviaciones estándar de los errores de medición (en mm) se presentan en la tabla
siguiente para cada combinación de tipo de equipo y estación base.
Instrumento B
Instrumento A
Base 0
Base 1
Base 2
Base 3
Instrumento C
Media
Desviación
estándar
Media
Desviación
estándar
Media
3
14
1
8
15
26
26
34
⫺24
⫺13
⫺22
⫺17
18
13
39
26
⫺6
⫺2
4
15
Desviación
estándar
18
16
29
18
a) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
b) La pregunta relevante es si la media del error es diferente entre los instrumentos. No es de interés determinar si el error es
diferente entre las estaciones base. Por esta razón, un topógrafo sugiere tratar esto último como un diseño de bloques completamente aleatorios, con las estaciones base como los bloques. ¿Esto es adecuado? Explique.
10. Productores de azúcar de arce de Vermont patrocinaron un programa de prueba para determinar el beneficio de un potencial
nuevo régimen fertilizante. Se eligió una muestra aleatoria de 27 árboles de arce en Vermont y se trató con uno de los tres niveles de fertilizante sugeridos por el químico del productor. En esta configuración experimental, nueve árboles (tres de cada
una de las tres zonas climáticas) se trataron con cada nivel de fertilizante y se midió la cantidad de savia producida (en ml) por
los árboles en la siguiente estación. Los resultados se presentan en la tabla siguiente.
Fertilizante bajo
Fertilizante medio
Fertilizante alto
Zona sur
Zona central
Zona norte
76.2 80.4 74.2
87.0 95.1 93.0
84.2 87.5 83.1
79.4 87.9 86.9
98.2 94.7 96.2
90.3 89.9 93.2
84.5 85.2 80.1
88.4 90.4 92.2
81.4 84.7 82.2
a) Calcule los efectos principales de los niveles de fertilizante y la zona climática, y sus interacciones.
b) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
c) Pruebe la hipótesis de que no hay interacción entre los niveles de fertilizante y la zona climática.
d) Pruebe la hipótesis de que no hay ninguna diferencia en la producción de savia respecto los tres niveles de fertilizante.
11. Un ingeniero civil está interesado en algunos diseños para un canal de drenaje que se utiliza en la desviación de aguas desbordadas de los alrededores de una ciudad. Los tiempos de drenaje de una represa conectada a cada uno de los cinco diseños de
canal diferentes, obtenidos a partir de una serie de experimentos usando condiciones de flujo inicial similares, se presentan en
la tabla siguiente.
Ejercicios adicionales para el capítulo 9
Tipo de canal
717
Tiempo de drenaje (min)
1
2
3
4
5
41.4
37.7
32.6
27.3
44.9
43.4
49.3
33.7
29.9
47.2
50.0
52.1
34.8
32.3
48.5
41.2
37.3
22.5
24.8
37.1
a) ¿Puede concluir que hay una diferencia en la media de los tiempos de drenaje para los diferentes diseños de canal?
b) ¿Cuáles pares de diseños, si hay, puede concluir que difieren en sus tiempos de drenaje?
12. Se estudió un proceso que fabrica vinilo para cubiertas de asientos de automóvil. Se variaron tres factores: el cociente de cierto plastificante (A), la tasa de extrusión (B), y la temperatura de secado (C). El resultado relevante era el espesor del vinilo (en
milésimas de pulgada). Se empleó un diseño factorial 23 con cuatro réplicas. Los resultados se presentan en la tabla siguiente.
(Basado en el artículo “Split-Plot Designs and Estimation Methods for Mixture Experiments with Process Variables”, S. Kowalski, J. Cornell y G. Vining, en Technometrics, 2002:72-79.)
A
B
C
–1
1
–1
1
–1
1
–1
1
–1
–1
1
1
–1
–1
1
1
–1
–1
–1
–1
1
1
1
1
Espesor
7
6
8
9
7
7
6
8
5
5
8
5
6
7
4
11
6 7
5 5
4 6
6 9
5 5
11 10
5 8
11 9
a) Estime todos los efectos principales y las interacciones.
b) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
c) ¿El modelo aditivo es adecuado? Explique.
d) ¿Qué conclusiones acerca de los factores puede obtener a partir de estos resultados?
13. En el artículo “Occurrence and Distribution of Ammonium in Iowa Groundwater” (K. Schilling, en Water Environment Research, 2002:177-186) se midieron concentraciones de amoniaco (en mg/L) en un gran número de pozos en el estado de Iowa.
Éstos incluían cinco tipos de pozos base. El número de pozos de cada tipo, junto con la media y la desviación estándar de las
concentraciones en esos pozos, se presentan en la tabla siguiente.
Tipo de pozo
Cretaceous
Mississippian
Devonian
Silurian
Cambrian-Ordovician
Tamaño muestral
Media
Desviación estándar
53
57
66
67
51
0.75
0.90
0.68
0.50
0.82
0.90
0.92
1.03
0.97
0.89
¿Puede concluir que la media de la concentración difiere entre los cinco tipos de pozos?
14. El artículo “Enthalpies and Entropies of Transfer of Electrolytes and Ions from Water to Mixed Aqueous Organic Solvents” (G.
Hefter, Y. Marcus y W. Waghorne, en Chemical Reviews, 2002:2773-2836) presenta mediciones de los cambios de entropía y
718
Experimentos factoriales
CAPÍTULO 9
entalpía para muchas sales en una variedad de condiciones. La tabla siguiente presenta los resultados de la transferencia de entalpía (en kJ/mol) de agua a agua ⫹ metanol de NaCl (sal de mesa) para varias concentraciones de metanol. Se realizaron cuatro mediciones independientes en cada concentración.
Concentración (%)
5
10
20
30
Entalpía
1.62
2.69
3.56
3.35
1.60
2.66
3.45
3.18
1.62
2.72
3.65
3.40
1.66
2.73
3.52
3.06
a) ¿Es creíble que la entalpía sea la misma en todas las concentraciones? Explique.
b) ¿Cuáles pares de concentraciones, si hay, puede concluir que tienen entalpías diferentes?
15. Considere el ejercicio 11.
a) Calcule la cantidad s =
√
MSE, la estimación de la desviación estándar del error s.
b) Suponga que s sea la desviación estándar del error, determine el tamaño de muestra necesario en cada tratamiento para proporcionar una potencia de 0.90 y así detectar una diferencia máxima de 10 en las medias del tratamiento con un nivel de 5%.
c) Utilizando una estimación más conservadora de 1.5s como la desviación estándar del error, determine el tamaño de muestra necesario en cada tratamiento para proporcionar una potencia de 0.90 y así detectar una diferencia máxima de 10 en las
medias de tratamiento con un nivel de 5%.
16. Considere el ejercicio 14.
a) Calcule la cantidad s =
√
MSE, la estimación de la desviación estándar del error s.
b) Suponga que s sea la desviación estándar del error, encuentre el tamaño de muestra necesario en cada tratamiento para proporcionar una potencia de 0.80 y así detectar una diferencia máxima de 0.1 en las medias de tratamiento con un nivel de 5%.
c) Utilizando una estimación más conservadora de 1.5s como la desviación estándar del error, determine el tamaño de muestra necesario en cada tratamiento para proporcionar una potencia de 0.80 y así detectar una diferencia máxima de 0.1 en las
medias de tratamiento con un nivel de 5%.
17. El artículo “Factorial Experiments in the Optimization of Alkaline Wastewater Pretreatment” (M. Prisciandaro, A. Del Borghi
y F. Veglio, en Industrial Engineering and Chemistry Research, 2002:5034-5041) presenta los resultados de algunos experimentos para investigar los métodos de tratamientos de agua de residuos alcalinos. Se diseñó un experimento 24 sin réplicas. Los
cuatro factores fueron A: concentración de ácido sulfúrico, B: temperatura, C: tiempo y D: cloruro de calcio de la concentración. La variable resultado es la cantidad de precipitados en kg/m3. Los resultados se presentan en la tabla siguiente.
A
B
C
D
Resultado
A
B
C
D
Resultado
–1
1
–1
1
–1
1
–1
1
–1
–1
1
1
–1
–1
1
1
–1
–1
–1
–1
1
1
1
1
–1
–1
–1
–1
–1
–1
–1
–1
6.4
12.9
8.6
12.9
7.4
12.0
10.7
15.0
–1
1
–1
1
–1
1
–1
1
–1
–1
1
1
–1
–1
1
1
–1
–1
–1
–1
1
1
1
1
1
1
1
1
1
1
1
1
11.9
13.1
12.1
16.0
12.4
16.5
15.3
18.3
Ejercicios adicionales para el capítulo 9
719
a) Calcule todos los efectos principales y las interacciones.
b) ¿Qué efectos parecen ser mayores que los otros?
c) Suponga que todas las interacciones de tercer y superior órdenes son iguales a 0, y sume las sumas de los cuadrados. Utilice el resultado en lugar de una suma de los cuadrados del error para calcular los estadísticos F y los P-valores de los efectos principales. ¿Cuáles factores puede concluir que tienen un efecto sobre el resultado?
d ) El artículo describe algunas réplicas del experimento, en las cuales el error medio cuadrático se encuentra de 1.04, con cuatro grados de libertad. Utilizando este valor, calcule los estadísticos F y los P-valores de todos los efectos principales y las
interacciones.
e) ¿Los resultados del inciso d ) ayudan a justificar el supuesto de que las interacciones de tercer y superior órdenes son iguales a 0? Explique.
f) Utilizando los resultados del inciso d), ¿cuáles factores puede concluir que tienen un efecto sobre el resultado?
18. El Williamsburg es un puente colgante que cruza el río East y conecta a Brooklyn y Manhattan en Nueva York. Una evaluación
de las fuerzas de sus cables se reporta en el artículo “Estimating Strength of the Williamsburg Bridge Cables” (R. Perry, en The
American Statistician, 2002:211-217). Cada cable de suspensión consta de 7 696 alambres. De uno de los cables se tomó una
muestra de alambres de 128 puntos. Estos puntos provenían de cuatro posiciones a lo largo de la longitud del cable (I, II, III,
IV). En cada ubicación había ocho puntos igualmente espaciados alrededor de la circunferencia del cable (A, B, C, D, E, F, G,
H). De cada uno de los ocho puntos se tomaron muestras de alambre de cuatro profundidades: 1) la superficie externa del cable, 2) dos pulgadas de profundidad, 3) cuatro pulgadas de profundidad y 4) siete pulgadas de profundidad (el cable tiene un
radio de 9.625 pulgadas). Bajo los supuestos hechos en el artículo, es adecuado considerar esto último como un experimento
de dos factores con la posición en la circunferencia y la profundidad como los factores, y con la posición proporcionando cuatro réplicas respecto cada combinación de estos factores. La fuerza de ruptura mínima (en lbf) de cada uno de los 128 puntos
se presenta en la tabla siguiente.
Circunferencia Profundidad
A
A
A
A
B
B
B
B
C
C
C
C
D
D
D
D
E
E
E
E
F
F
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
I
6 250
6 650
5 390
6 510
6 200
6 430
5 710
6 510
5 570
6 260
6 050
6 390
6 140
5 090
5 280
6 300
4 890
5 360
5 600
6 640
5 920
5 880
Posición
II
III
5 910
6 690
6 080
6 580
6 240
6 590
6 230
6 600
5 700
6 290
6 120
6 540
6 210
6 000
5 650
6 320
4 830
5 640
5 500
6 810
5 300
5 840
5 980
6 780
6 550
6 700
6 180
6 500
6 450
6 250
6 390
5 630
6 290
6 590
5 710
6 020
5 410
6 650
5 000
5 920
6 250
5 760
5 670
7 270
IV
5 800
5 540
5 690
5 980
6 740
6 110
6 310
5 660
6 170
6 990
5 800
6 620
5 090
6 480
5 730
6 050
6 490
6 390
6 510
5 200
6 200
5 230
Continúa en la página 720
720
CAPÍTULO 9
Experimentos factoriales
Circunferencia Profundidad
3
4
1
2
3
4
1
2
3
4
F
F
G
G
G
G
H
H
H
H
Posición
II
III
I
6 570
6 120
6 070
6 180
6 360
6 340
5 950
6 180
6 560
6 700
6 130
6 430
6 980
6 340
6 420
6 380
5 950
6 560
6 560
6 690
5 800
6 100
6 570
6 830
6 370
6 480
6 450
5 730
6 450
6 670
IV
6 200
6 370
6 980
6 260
6 550
7 020
5 870
6 550
6 790
6 600
a) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
b) ¿Puede concluir que hay interacciones entre la posición en la circunferencia y la profundidad? Explique.
c) ¿Puede concluir que la tensión varía con la posición en la circunferencia? Explique.
d) ¿Puede concluir que la tensión varía con la profundidad? Explique.
19. En el artículo “Nitrate Contamination of Alluvial Groundwaters in the Nakdong River Basin, Korea” (J. Min, S. Yun y cols.,
Geosciences Journal, 2002:35-46) se midieron varias propiedades químicas de muestras de agua tomadas de pozos de irrigación en tres ubicaciones. La tabla siguiente presenta las medias, las desviaciones estándar y los tamaños de muestra de las mediciones de pH.
Ubicación
Río arriba
Río en medio
Río abajo
Media
DE
6.0
6.2
6.4
0.2
0.4
0.6
Tamaño de
muestra
49
31
30
¿Los datos prueban concluyentemente que el pH difiere en las diferentes ubicaciones?
20. El artículo citado en el ejercicio 19 proporciona las medidas de la conductividad eléctrica (en µS/cm). Los resultados se presentan en la tabla siguiente.
Ubicación
Media
DE
Río arriba
Río en medio
Río abajo
463
363
647
208
98
878
Tamaño de
muestra
49
31
30
¿Puede utilizarse un análisis de varianza de un sentido para determinar si la conductividad varía con la ubicación? ¿O uno de
los supuestos necesariamente no se cumple? Explique.
21. El artículo “Factorial Experiments in the Optimization of Alkaline Wastewater Pretreatment” (M. Prisciandaro, A. Del Borghi
y F. Veglio, en Industrial Engineering and Chemistry Research, 2002:5034-5041) presenta los resultados de un experimento
para investigar los efectos de las concentraciones de ácido sulfúrico (H2SO4) y cloruro de calcio (CaCl2) en la cantidad de barro negro que se precipita en el tratamiento de agua de residuos alcalinos. Había tres niveles de cada concentración y se reali-
Ejercicios adicionales para el capítulo 9
721
zaron dos réplicas del experimento en cada combinación de niveles. Los resultados se presentan en la tabla siguiente (todas las
mediciones están en unidades de kg/m3).
H2SO4
CaCl2
110
110
110
123
123
123
136
136
136
15
30
45
15
30
45
15
30
45
Precipitado
100.2
175.8
216.5
110.5
184.7
234.0
106.5
181.7
211.8
98.2
176.2
206.0
105.5
189.0
222.0
107.0
189.0
201.3
a) Construya una tabla ANOVA. Puede dar los rangos para los P-valores.
b) ¿Es creíble el modelo aditivo? Explique.
c) ¿Puede concluir que la concentración de H2SO4 afecta la cantidad de precipitado? Explique.
d) ¿Puede concluir que la concentración de CaCl2 afecta la cantidad de precipitado? Explique.
22. Las inclusiones de un fluido son volúmenes microscópicos de fluido atrapados en la roca durante la formación de ésta. El artículo “Fluid Inclusion Study of Metamorphic Gold-Quartz Veins in Northwestern Nevada, U.S.A.: Characteristics of Tectonically Induced Fluid” (S. Cheong, en Geosciences Journal, 2002:103-115) describe las propiedades geoquímicas de las
inclusiones inestables en algunos filones diferentes en el noroeste de Nevada. La tabla siguiente presenta los datos acerca de la
salinidad máxima (% de NaCl por peso) de las inclusiones en algunas muestras de roca de algunas áreas.
Área
Humboldt Range
Santa Rosa Range
Ten Mile
Antelope Range
Pine Forest Range
Salinidad
9.2
5.2
7.9
6.7
10.5
10.0
6.1
6.7
8.4
16.7
11.2 8.8
8.3
9.5 7.3 10.4 7.0
9.9
17.5 15.3 20.0
¿Puede concluir que la salinidad difiere entre las áreas?
23. El artículo “Effect of Microstructure and Weathering on the Strength Anisotropy of Porous Rhyolite” (Y. Matsukura, K. Hashizume, y C. Oguchi, en Engineering Geology, 2002:39-47) investiga la relación entre el ángulo entre la división y la estructura de flujo y la fuerza de la riolita porosa. Se midieron las fuerzas (en MPa) para varios elementos cortados en diferentes
ángulos. La media y la desviación estándar de las fuerzas para cada ángulo se presentan en la tabla siguiente.
722
CAPÍTULO 9
Ángulo
Experimentos factoriales
Media
Desviación estándar
Tamaño de muestra
22.9
22.9
19.7
14.9
13.5
11.9
14.3
2.98
1.16
3.00
2.99
2.33
2.10
3.95
12
6
4
5
7
6
6
0°
15°
30°
45°
60°
75°
90°
¿Puede concluir que la fuerza varía con el ángulo?
24. El artículo “Influence of Supplemental Acetate on Bioremediation for Dissolved Polycyclic Aromatic Hydrocarbons” (T. Ebihara y P. Bishop, en Journal of Environmental Engineering, 2002:505-513) describe experimentos en los que agua con hidrocarburos de poliaromáticos disueltos (PAH) era introducida en columnas de arena. Se midieron las concentraciones de PAH en
diferentes profundidades después de 25, 45 y 90 días. Suponga que se realizaron tres mediciones independientes en cada profundidad cada vez. Los datos que se presentan en la tabla siguiente son las concentraciones de naftaleno (en mg/L) que son
consistentes con las medias y desviaciones estándar descritas en el artículo.
Profundidad
0
5
15
30
50
75
11.15
14.40
11.51
12.77
11.71
11.18
25 días
11.39
11.78
11.01
12.18
11.29
11.45
45 días
11.36
11.92
11.09
11.65
11.20
11.27
9.28
9.44
9.34
9.37
9.25
9.09
8.15
9.34
9.11
9.27
8.97
8.86
90 días
8.59
9.33
8.94
9.05
9.29
8.78
7.68
7.53
7.43
7.60
7.76
7.72
7.59
7.92
7.47
7.48
7.84
7.61
7.41
7.12
7.53
7.84
7.68
7.74
a) Construya una tabla ANOVA. Puede dar rangos para los P-valores.
b) Realice una prueba para determinar si el modelo aditivo es creíble. Proporcione el valor del estadístico de prueba y el P-valor.
Capítulo
10
Control estadístico
de calidad
Introducción
A medida que el mercado industrial de bienes se hace más global, los fabricantes se han dado
cuenta que para ser competitivos la calidad y la confiabilidad de sus productos deben ser lo más
altas posible. Hoy se reconoce, por lo general, que la forma más eficiente en costos para mantener una alta calidad se logra mediante un seguimiento constante del proceso de producción.
A menudo dicho seguimiento se realiza al extraer una muestra de las unidades de la producción y medir cierta característica de calidad. Debido a que las unidades se extraen de determinada población grande, estos métodos tiene una naturaleza inherentemente estadística.
Uno de los pioneros en el área del control de calidad estadístico fue el doctor Walter A.
Shewart, de los laboratorios de la compañía telefónica Bell. En 1924 desarrolló la gráfica del
control moderna, la cual sigue siendo hasta hoy una de las herramientas más utilizadas en el control de calidad. Después de la Segunda Guerra Mundial, los descubrimientos de W. Edwards
Deming fueron cruciales para despertar el interés en el control de calidad, primero en Japón y
después en Estados Unidos y otros países. El científico japonés Genichi Taguchi tuvo también un
papel destacado, al desarrollar métodos de diseño experimental con una visión de mejoramiento
de la calidad. En este capítulo se destacarán los diagramas de control de Shewart y los diagramas de suma acumulada (CUSUM, por sus siglas en inglés), puesto que éstas son las herramientas más poderosas entre las utilizadas frecuentemente en el control estadístico de calidad.
10.1
Ideas básicas
El principio básico de los diagramas de control consiste en que en cualquier proceso hay
siempre una variación en el resultado. Parte de esta variación se debe a causas inherentes al
proceso y es muy difícil o imposible especificarlas. A estas causas se les llama causas comunes o probables. Cuando éstas son las únicas causas de la variación, se dice que el proceso
está en un estado de control estadístico, o de forma sencilla, en control.
723
724
CAPÍTULO 10
Control estadístico de calidad
Algunas veces se presentan factores especiales que producen mayor variabilidad. Entre
los factores más comunes se encuentran las máquinas que no funcionan adecuadamente, errores del operador, fluctuaciones en las condiciones ambientales y variaciones en las propiedades de las materias primas. A éstas se les denomina causas especiales o asignables. Por lo
general, estas últimas producen mayor nivel de variabilidad que las causas comunes; a esta
variabilidad se le considera como inaceptable. Cuando un proceso opera cuando se presenta
una o más causas especiales, se dice que está fuera de control estadístico.
Los diagramas de control le permiten al ingeniero responsable del mismo decidir si un
proceso parece estar en control, o si están presente una o más causas especiales. Si se determina que el proceso está fuera de control, debe definirse y corregirse la naturaleza de la causa especial, de tal forma que el proceso vuelva al estado de control estadístico. Existen diversos
tipos de diagramas de control; el uso de determinado diagrama dependerá de si la característica de calidad que se midió es una variable continua, variable binaria, o variable discreta.
Por ejemplo, cuando se hace el seguimiento de un proceso que fabrica latas de aluminio para
bebidas, debe medirse la altura de cada lata de la muestra. La altura es una variable continua.
En ciertas ocasiones, basta simplemente con determinar si la altura se encuentra dentro de ciertos límites requeridos. En este caso, la medición de la calidad toma sólo uno de los dos valores: adecuado (dentro de los límites) o no adecuado (fuera de los límites). Esta medición es una
variable binaria, ya que sólo tiene dos valores. Finalmente, podría tenerse interés en contar el
número de imperfecciones en la superficie de la lata. Ésta es una variable discreta.
A los diagramas de control utilizados para variables continuas se les denominan dia–
gramas de control de variables. Entre los ejemplos están el diagrama X , el diagrama R y el
diagrama S. A los diagramas de control utilizados para variables binarias o discretas se les llama diagramas de control de atributos. El diagrama p es el diagrama más comúnmente utilizado para variables binarias, mientras que el diagrama c se utiliza para variables discretas.
Recolección de datos: subgrupos racionales
Los datos utilizados en la construcción de un diagrama de control se recolectan mediante cierto número de muestras tomadas durante determinado periodo. A estas muestras se les conoce
como subgrupos racionales. Existen muchas estrategias diferentes para escoger subgrupos
racionales. El principio básico que debía seguirse es que toda la variabilidad dentro de las unidades de un subgrupo racional debe ser resultado de causas comunes, y ninguna debe ser resultado de causas especiales. En general, una buena forma de elegir subgrupos racionales
consiste en definir qué causas especiales son las más importantes de detectar, y enseguida elegir a los subgrupos racionales en lo que es más probable detectarlas. Los dos métodos comúnmente más utilizados son:
Muestreo en intervalos regulares, en el que todos los elementos de cada muestra son producidos casi en el mismo tiempo en que se realiza el muestreo.
Muestreo en intervalos regulares, en el que los elementos de cada muestra se extraen a
partir de todas las unidades producidas desde que se tomó la última muestra.
Para datos de variables la mayoría de las veces el número de unidades en cada muestra es pequeño, con frecuencia se encuentra entre tres y ocho. El número de muestras debe ser al menos veinte. En general, es mejor tomar con cierta frecuencia muchas muestras pequeñas que
tomar pocas muestras con poca frecuencia. Para los datos binarios o discretos, en general, las
muestras deben ser más grandes.
10.1
Ideas básicas
725
Control contra capacidad
Es importante entender la diferencia entre el control del proceso y la capacidad del proceso.
Un proceso está en control si no opera ninguna causa especial. La característica distintiva de un
proceso que está en control consiste en que los valores de la característica de control varían
sin seguir alguna tendencia o patrón, ya que las causas comunes no cambian a lo largo del
tiempo. Sin embargo, es muy posible que un proceso esté en control y aún produzca unidades que no satisfagan cierta especificación. Por ejemplo, suponga que un proceso produce barras de acero cuyas longitudes varían de forma aleatoria entre 19.9 y 20.1 cm, sin ningún
patrón aparente de fluctuación. Este proceso se encuentra en un estado de control. No obstante, si el diseño requiere una longitud entre 21 y 21.2 cm, muy poca de la producción cumpliría con la especificación. A la capacidad de un proceso para producir elementos que satisfagan
con una especificación dada se le llama capacidad del proceso. En la sección 10.5 se analizará la medición de este último.
El control del proceso debe realizarse continuamente
Existen tres fases básicas en el uso de los diagramas de control. Primero, se reúnen los datos;
luego se grafican para determinar si el proceso está en control y, por último, una vez que el
proceso ya está en control, debe estimarse su capacidad. Por supuesto, un proceso que en determinado momento está en control y tiene capacidad para estar fuera de control posteriormente, conforme se vuelvan a presentar las causas especiales. Por esta razón debe darse
seguimiento a los procesos continuamente.
Ejercicios para la sección 10.1
1. Indique si cada una de las siguientes características de control es una variable continua, binaria o discreta.
a) La longitud de una barra de acero.
b) El número de imperfecciones que hay en una sección de
una lámina de metal.
c) Si un tipo de concreto cumple con la resistencia requerida.
d) El tiempo necesario para realizar una inspección final a
un producto acabado.
e) Si un proceso está en un estado de control estadístico,
entonces casi no habrá variación en la producción.
3. Complete los enunciados. Las opciones son: está en control; tiene una capacidad alta.
a) Si la variabilidad en un proceso es aproximadamente
constante en el tiempo, el proceso _________.
b) Si la mayoría de las unidades producidas cumplen la especificación, el proceso _________.
2. Verdadero o falso:
a) Los diagramas de control se utilizan para determinar si
están en curso causas especiales.
b) Si no está en curso ninguna causa especial, entonces la
mayoría de la producción cumplirá con la especificación.
4. Complete el enunciado: Una vez que un proceso está en un
estado de control estadístico, _________.
i) El seguimiento debe seguirse realizando constantemente.
c) La variabilidad debida a causas comunes no aumenta ni
disminuye demasiado en periodos cortos.
ii) El seguimiento debe detenerse durante cierto tiempo, ya
que es poco probable que el proceso se salga de control
inmediatamente.
d) La variabilidad dentro de los elementos de un subgrupo
racional es resultado de causas especiales.
iii) No debe darse seguimiento nuevamente al proceso, a
menos que éste sea rediseñado.
726
CAPÍTULO 10
Control estadístico de calidad
5. Verdadero o falso:
a) Cuando un proceso se encuentra en un estado de control
estadístico, entonces la mayoría de la producción cumplirá con las especificaciones.
b) Cuando un proceso está fuera de control, una proporción inaceptablemente grande de la producción no cumplirá con las especificaciones.
c) Cuando un proceso está en un estado de control estadístico, toda la variación en el proceso se debe a causas inherentes al propio proceso.
6. Complete el enunciado: Cuando se extraen muestras de unidades para subgrupos racionales, _________.
a) Es más importante elegir muestras grandes que realizar
el muestreo frecuentemente, debido a que las muestras
grandes dan una información más precisa sobre el proceso.
b) Es más importante realizar el muestreo frecuentemente
que elegir muestras grandes, de tal manera que las causas especiales puedan ser detectarse con mayor rapidez.
d) Cuando un proceso está fuera de control, parte de la variación en el proceso se debe a causas externas al proceso.
10.2
Diagramas de control para variables
Cuando se realiza una medición de calidad en una escala de variables, a los datos se les conoce como datos de variables. Para estos datos, primero se utiliza un diagrama R o un diagrama S con el fin de controlar la variabilidad del proceso, y después se utiliza un diagrama
–
X para controlar la media del proceso. Los métodos descritos en esta sección suponen que todas las mediciones siguen una distribución aproximadamente normal.
Lo anterior se ilustra con un ejemplo. El ingeniero de control de calidad a cargo de un
proceso de empaquetado de sal está preocupado por el contenido de humedad en los paquetes de sal. Para determinar si el proceso está en control estadístico, primero se necesitan definir los subgrupos racionales, y después recolectar ciertos datos. Suponga que para el proceso
de empaquetado de sal la preocupación principal es que la variación en la humedad del ambiente de la planta pueda variar el contenido de humedad promedio de los paquetes a lo largo del tiempo. Recuerde que los subgrupos racionales deben elegirse de tal forma que la
variación dentro de cada muestra se deba sólo a causas comunes, no a causas especiales. Por
consiguiente, en este caso una buena opción para los subgrupos racionales es extraer muestras de diversos paquetes, cada una en intervalos regulares. Los paquetes en cada muestra serán producidos lo más próximos en tiempo entre sí. De este modo, la humedad del ambiente
será casi la misma para cada paquete de la muestra, de forma que la variación dentro del grupo no se verá afecta por esta causa especial. Suponga que se extraen cinco paquetes de sal cada 15 minutos durante ocho horas, y que el contenido de humedad en cada paquete se mide
como un porcentaje del peso total. Los datos se presentan en la tabla 10.1.
Como consecuencia de que la muestra se mide en una escala continua, éstos son datos
de variables. Cada renglón de la tabla 10.1 presenta las cinco mediciones de humedad en una
–
muestra dada, junto con su media muestral X , su desviación estándar muestral s y su rango
muestral R (la diferencia entre el valor mayor
y el menor). El último renglón de la tabla con–
–
tiene la media de las medias muestrales (X ), la media de los rangos muestrales (R) y la media
–
de las desviaciones estándar muestrales (s).
Se supone que cada una de las 32 muestras en la tabla 10.1 constituye una muestra de
una población normal con media m y desviación estándar s. A la cantidad m se le llama media del proceso, y a s, desviación estándar del proceso. La idea detrás de los diagramas de
10.2
727
Diagramas de control para variables
TABLA 10.1 Contenido de humedad en los paquetes de sal, como porcentaje
del peso total
Muestra
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
Valores muestrales
2.53
2.69
2.67
2.10
2.64
2.64
2.58
2.31
3.03
2.86
2.71
2.95
3.14
2.85
2.82
3.17
2.81
2.99
3.11
2.83
2.76
2.54
2.27
2.40
2.41
2.40
2.56
2.21
2.56
2.42
2.62
2.21
2.66
2.38
2.23
2.26
2.42
1.63
2.69
2.39
2.68
3.22
2.80
3.54
2.84
3.29
3.71
3.07
3.21
2.65
2.74
2.74
2.85
2.63
2.54
2.62
2.72
2.33
2.47
2.61
2.26
2.37
2.11
2.15
1.88
2.34
2.10
2.51
2.56
2.95
3.01
2.60
2.27
2.72
3.09
2.59
3.77
3.25
3.36
3.14
2.95
2.79
2.59
3.03
2.59
2.32
2.82
2.84
2.29
2.40
2.11
2.59
1.95
2.13
2.47
2.18
–
2.21
2.47
2.43
2.58
2.51
2.12
3.01
2.40
2.54
3.09
2.60
3.31
2.80
3.35
2.95
3.63
3.04
2.80
3.01
2.68
2.23
2.48
2.11
2.50
2.35
2.02
2.43
2.24
2.26
2.09
2.27
2.59
2.26
2.61
2.54
2.28
2.36
2.67
2.23
2.46
2.63
2.48
3.39
2.87
3.22
3.59
3.37
3.70
2.85
2.95
3.03
2.49
2.87
2.93
2.69
2.51
2.63
2.43
2.85
2.34
2.40
2.41
2.49
2.61
Media (X )
2.308
2.498
2.394
2.346
2.498
2.402
2.704
2.432
2.630
2.874
2.918
3.052
3.154
3.266
3.242
3.342
2.972
2.836
2.896
2.754
2.660
2.580
2.486
2.574
2.480
2.316
2.484
2.398
2.286
2.284
2.392
2.348
X ⫽ 2.6502
Rango (R)
0.780
0.350
0.570
0.480
0.280
1.320
0.780
0.290
0.760
0.740
0.790
0.950
0.970
0.740
0.890
0.630
0.400
0.340
0.520
0.540
0.640
0.610
0.710
0.440
0.430
0.410
0.740
0.400
0.610
0.330
0.510
0.460
R ⫽ 0.6066
SD (s)
0.303
0.149
0.230
0.196
0.111
0.525
0.327
0.108
0.274
0.294
0.320
0.375
0.390
0.267
0.358
0.298
0.160
0.137
0.221
0.198
0.265
0.226
0.293
0.168
0.186
0.169
0.266
0.191
0.225
0.161
0.201
0.231
s ⫽ 0.2445
control es que cada valor de X se aproxima a la media del proceso durante el tiempo en que
se tomó la muestra, mientras que los valores de R y s se pueden utilizar para aproximar la desviación estándar muestral. Si el proceso está en control, entonces la media y la desviación estándar del proceso son iguales en cada muestra. Si el proceso está fuera de control, la media
del proceso m o la desviación estándar s, o ambas, diferirán de muestra en muestra. Por tan–
to, los valores de X , R, y s variarán menos cuando el proceso esté en control que cuando el
–
proceso esté fuera de control. Si fuera el primer caso, los valores de X , R, y s se mantendrán
casi siempre dentro de límites calculables, denominados límites de control. Si el proceso es–
tá fuera de control, es más probable que los valores de X , R, o s excedan estos límites. Un dia–
grama de control grafica los valores de X , R, o s junto con los límites de control, de forma que
puede verse muy fácilmente si la variación es lo bastante grande para concluir que el proceso está fuera de control.
CAPÍTULO 10
Control estadístico de calidad
Ahora se verá cómo determinar si el proceso de empaquetado de sal se encuentra en un
estado de control estadístico con respecto al contenido de humedad. Puesto que se supone que
la variación dentro de cada muestra se debe solamente a causas comunes, esta variación no
debe ser muy diferente de una muestra a otra. Por consiguiente, lo primero es comprobar para tener la certeza que la cantidad de la variación dentro de cada muestra, ya sea medida por
el rango muestral o desviación estándar muestral, no varía demasiado de una muestra a otra.
Con este propósito se utiliza el diagrama R para estimar la variación en el rango muestral, o
puede usarse el diagrama S para calcular la variación en la desviación estándar muestral. Primero se estudiará el diagrama R, ya que es el más tradicional. Al final de esta sección se analizará el diagrama S.
La figura 10.1 presenta el diagrama R para los datos de humedad. El eje horizontal representa las muestras, numeradas del 1 al 32. Los rangos muestrales están graficados en el eje
vertical. Las tres líneas horizontales son las más importantes. La recta en el centro del diagra–
ma es el valor R y se le llama recta central. Las rectas superior e inferior indican los límites
de control 3σ superior e inferior (UCL y LCL, respectivamente). Los límites de control están
dibujados de tal forma que cuando el proceso está en control, casi todos los puntos estarán
dentro de los límites. Un punto graficado fuera de los límites de control es una evidencia de
que el proceso no está en control.
Diagrama R
UCL = 1.283
Rango muestral
728
1
R = 0.607
0.5
0
LCL = 0
0
5
10
15
20
25
Número de muestra
30
FIGURA 10.1 Diagrama R para los datos de humedad.
Para entender dónde se ubican en el diagrama los límites de control, suponga que los
32 rangos muestrales provienen de una población con media mR y desviación estándar sR. Los
valores de mR y sR no se conocerán exactamente, pero se sabe que en la mayoría de las poblaciones es poco usual observar un valor que sea diferente a la media por más de tres desviaciones estándar. Por esta razón se tiene la costumbre de graficar los límites de control en
puntos que se aproximan a los valores mR ⫾ 3sR. Se puede demostrar mediante métodos avan–
zados que las cantidades mR ⫾ 3sR. pueden estimarse con múltiplos de R; dichos múltiplos
–
se representan con D3 y D4. La cantidad mR ⫺ 3sR. se estima con D3 R, y la cantidad mR ⫹
–
3sR. se estima con D4 R. Las cantidades D3 y D4 son constantes cuyos valores dependen del
tamaño de la muestra n. A continuación se presenta una tabla de valores de D3 y D4. En la tabla 4.9 (Apéndice A) se muestra una tabulación más extensa. Observe que para tamaños de
muestra de 6 o menos, el valor de D3 es 0. Para estos tamaños de muestra pequeños, la cantidad mR ⫺ 3sR. es negativa. En estos casos se establece que el límite de control inferior es 0,
debido a que es imposible que el rango sea negativo.
10.2
Ejemplo
10.1
729
Diagramas de control para variables
n
2
3
4
5
6
7
8
D3
D4
0
3.267
0
2.575
0
2.282
0
2.114
0
2.004
0.076
1.924
0.136
1.864
Calcule los límites de control 3s superior e inferior del diagrama R para los datos de humedad de la tabla 10.1
Solución
–
El valor de R es 0.6066 (tabla 10.1). El tamaño de la muestra es n ⫽ 5. A partir de la tabla se
tiene que D3 ⫽ 0 y D4 ⫽ 2.114. En consecuencia, el límite de control superior es
(2.114)(0.6066) ⫽ 1.283, y el límite de control inferior es (0)(0.6066) ⫽ 0.
Resumen
En un diagrama R, la recta central y los límites de control 3s superior e inferior están
dados por
–
Límite 3s superior ⫽ D4 R
–
Recta central ⫽ R
–
Límite 3s inferior ⫽ D3 R
Los valores D3 y D4 dependen del tamaño de la muestra. Los valores están tabulados
en la tabla A.9.
Una vez que se han calculado los límites de control y se han graficado los puntos, puede utilizarse el diagrama R para determinar si el proceso está en control con respecto a la variación. La figura 10.1 muestra que el rango para la muestra 6 excede el límite de control
superior, por lo que evidencia que estaba operando una causa especial y que la variación del
proceso no está en control. La acción apropiada es determinar la naturaleza de la causa especial, y después eliminar la muestra que no está en control y calcular de nuevo los límites. Suponga que se descubre que un técnico tuvo la negligencia de cerrar una ventana, lo cual
provocó una variación mayor a la usual en el contenido de humedad durante el tiempo en el
que se eligió la muestra. Volver a entrenar al técnico corregirá esa causa especial. Se elimina
la muestra 6 de los datos y se vuelve a calcular el diagrama R. Los resultados se muestran en la
figura 10.2. Ahora, la variación del proceso está en control.
Ahora que se ha puesto en control la variación del proceso, se puede determinar si la
–
media del proceso está bajo control al dibujar el diagrama X . La figura 10.3 (página 730) pre–
senta el diagrama X . Las medias muestrales están graficadas en el eje vertical. Observe que
no se ha utilizado en este diagrama la muestra 6, ya que es preciso eliminarla para que el pro–
ceso de variación esté en control. Como en todas los diagramas de control, el diagrama X tiene una recta central y límites de control superior e inferior.
CAPÍTULO 10
Control estadístico de calidad
Diagrama R
Rango muestral
UCL = 1.234
1
R = 0.584
0.5
LCL = 0
0
0
5
10
15
20
Número de muestra
25
30
FIGURA 10.2 Diagrama R para los datos de humedad, después de eliminar la muestra
fuera de control.
Diagrama X
3.5
Rango muestral
730
3
UCL = 2.995
X = 2.658
2.5
LCL = 2.321
2
0
5
10
15
20
Número de muestra
25
30
–
FIGURA 10.3 Diagrama X para los datos de humedad. La muestra 6 se ha eliminado con
–
el fin de que el proceso de variación esté en control. Sin embargo, el diagrama X muestra
que la media muestral está fuera de control.
Para calcular la recta central y los límites de control, se puede suponer que la desviación estándar del proceso es igual en todas las muestras, ya que se ha utilizado al diagrama R
para que la variación del proceso esté en control. Si la media del proceso m también está en
control, entonces también es igual en todas las muestras. En ese caso, se extraen 32 medias
–
muestrales de una población normal con media mX— ⫽ m y desviación estándar sX— ⫽ s/n,
donde n es el tamaño de la muestra, que en este caso es igual a 5. Idealmente, se desearía trazar la recta central en m y los límites de control 3s en m ⫾ 3sX—. Sin embargo, con frecuencia no se conocen los valores de m y sX— y se deben estimar a partir de los datos. Se estima m
–
–
con X , el promedio de las medias muestrales. Por consiguiente, la recta central se ubica en X .
–
La cantidad sX— se puede estimar ya sea mediante el rango promedio R o usando las desvia–
ciones estándar muestrales. Aquí se usará R y al final de la sección se analizarán los métodos
basados en la desviación estándar, junto con el análisis de los diagramas S. Se puede demos–
trar por medio de métodos avanzados que la cantidad 3sX— se estima con A2R, donde A2 es una
constante cuyo valor depende del tamaño de la muestra. A continuación se presenta una tabla
de valores de A2. En la tabla A.9 se muestra una tabulación más extensa.
10.2
n
A2
2
1.880
3
1.023
4
0.729
731
Diagramas de control para variables
5
0.577
6
0.483
7
0.419
8
0.373
Resumen
–
–
En un diagrama X , cuando se utiliza R para estimar a sX—, la recta central y los límites
de control 3s superior e inferior están dados por
–
–
Límite 3s superior ⫽ X ⫹ A2R
–
Recta central ⫽ X
–
–
Límite 3s inferior ⫽ X ⫺ A2R
El valor A2 depende del tamaño de la muestra. Los valores están tabulados en la
tabla A.9.
Ejemplo
10.2
–
Calcule los límites de control 3s superior e inferior del diagrama X para los datos de humedad de la tabla 10.1.
Solución
–
–
Con la muestra 6 eliminada, el valor de X es 2.658, y el valor de R es 0.5836. El tamaño de
la muestra es n ⫽ 5. A partir de la tabla se tiene que A2 ⫽ 0.577. Por tanto, el límite de control superior es 2.658 ⫹ (0.577)(0.5836) ⫽ 2.995, y el límite de control inferior es 2.658 –
(0.577)(0.5836) ⫽ 2.321.
–
El diagrama X muestra claramente que la media del proceso no está en control, ya que
hay diversos puntos ubicados fuera de los límites de control. El jefe de producción instala un
higrómetro para darle seguimiento a la humedad del ambiente, y determina que las fluctuaciones en el contenido de humedad se deben a las fluctuaciones en la humedad del ambiente.
Se instala un deshumidificador para estabilizar la humedad del ambiente. Después de haber
solucionado esta causa especial se recolectan más datos y se construyen un nuevo diagrama
–
R y un diagrama X . La figura 10.4 (página 732) presenta los resultados. Ahora el proceso se
encuentra en un estado de control estadístico. Obviamente, el proceso debe vigilarse en forma constante, debido a que las causas especiales tienen tendencia a cambiar en forma inesperada cada vez y es preciso detectarlas y corregirlas.
Observe que mientras los diagramas de control pueden detectar la presencia de una causa especial, éstos no pueden determinar su naturaleza ni cómo corregirlas. Es necesario que
el ingeniero del proceso entienda bien éste para que puedan diagnosticarse y corregirse las
causas especiales, detectadas por los diagramas de control.
CAPÍTULO 10
Control estadístico de calidad
Diagrama R
Rango muestral
UCL = 1.223
1
R = 0.578
0.5
0
LCL = 0
0
5
10
15
20
25
Número de muestra
30
Diagrama X
2.8
UCL = 2.609
2.6
Rango muestral
732
2.4
X = 2.275
2.2
2
LCL = 1.942
1.8
0
5
10
15
20
25
Número de muestra
30
–
FIGURA 10.4 El diagrama R y el diagrama X después de que se ha corregido una causa
especial. Ahora el proceso se encuentra en un estado de control estadístico.
Resumen
–
Los pasos que deben seguirse cuando se utilizan el diagrama R y el diagrama X son:
1. Elija subgrupos racionales.
2. Calcule el diagrama R.
3. Determine las causas especiales para cualesquiera de los puntos que no estén en control.
4. Vuelva a construir el diagrama R; omita las muestras que resultaron en puntos fuera de control.
5. Una vez que el diagrama R indique que se está en un estado de control, calcule el
–
diagrama X, omitiendo las muestras que resultaron en puntos fuera de control en el diagrama R.
–
6. Si el diagrama X indica que el proceso no está en control, identifique y corrija algunas de las causas especiales.
–
7. Continúe dando seguimiento a X y R.
10.2
Diagramas de control para variables
733
Funcionamiento del diagrama de control
Existe una estrecha conexión entre los diagramas de control y las pruebas de hipótesis. La hipótesis nula es que los procesos están en un estado de control. Un punto graficado fuera de
los límites de control 3s representa una evidencia en contra de la hipótesis nula. Como en
cualquier prueba de hipótesis, se puede cometer un error. Por ejemplo, ocasionalmente algún
punto se encontrará fuera de los límites 3s incluso cuando el proceso está en control. A esto
se le llama falsa alarma. También puede suceder que un proceso no está en control o no tenga algún punto fuera de los límites de control, en especial si no se observan durante un periodo suficientemente largo. A esto se le denomina falla de detección.
Lo deseable es que estos errores ocurran lo menos frecuente posible. Se describe a la
frecuencia con la cual estos errores se presentan con una cantidad llamada longitud de corrida promedio (ARL, por sus siglas en inglés). La ARL es el número de muestras que deben
observarse, en promedio, antes de que un punto sea graficado fuera de los límites de control.
Se desea que la ARL sea grande cuando el proceso está en control, y pequeña cuando está fue–
ra de control. Se puede calcular la ARL de un diagrama X si se supone que se conocen la media del proceso m y la desviación estándar del proceso s. Entonces la recta central se
localizará en la media del proceso m y los límites centrales estarán en m ⫾ 3sX—. También de–
be suponerse, como siempre ha sido el caso con el diagrama X , que la cantidad que se medirá sigue una distribución aproximadamente normal. Los ejemplos 10.3 al 10.6 muestran cómo
calcular la ARL.
Ejemplo
10.3
–
Para un diagrama X con límites de control en m ⫾ 3sX—, calcule la ARL de un proceso que está en control.
Solución
–
–
Sea X la media de una muestra. Entonces X ⬃ N(m, sX—2 ). La probabilidad de que un punto es–
–
té graficado fuera de los límites de control es igual a P(X ⬍ m ⫺ 3sX—) ⫹ P(X ⬎ m ⫹ 3sX—).
Esta probabilidad es igual a 0.00135 ⫹ 0.00135 ⫽ 0.0027 (véase la figura 10.5). Por tanto,
en promedio, 27 de cada 10 000 puntos estarán graficados fuera de los límites de control. Esto es equivalente a 1 de cada 10 000/27 ⫽ 370.4 puntos. Por consiguiente, la longitud de corrida promedio es igual a 370.4.
0.00135
m ⫺ 3s⫺
X
z=⫺3
0.00135
m
m ⫹ 3s⫺
X
z=3
FIGURA 10.5 La probabilidad de que un punto esté graficado fuera de los límites de control 3s, cuando el proceso está en control, es 0.0027 (0.00135 ⫹ 0.00135).
El resultado del ejemplo 10.3 puede interpretarse de la siguiente manera: si un proceso
está en control, se espera observar alrededor de 370 muestras, en promedio, antes de encon-
734
CAPÍTULO 10
Control estadístico de calidad
trar una cuyos diagramas estén fuera de los límites de control, provocando una falsa alarma.
Observe también que la ARL en el ejemplo 10.3 fue de 10 000/27, que es igual a 1/0.0027,
donde 0.0027 es la probabilidad de cualquiera de los diagramas de la muestra estén fuera de
los límites de control. En general, esto es cierto.
Resumen
La longitud de corrida promedio (ARL) es el número de muestras que se observarán,
en promedio, antes de que algún punto del diagrama esté fuera de los límites de control. Si p es la probabilidad de que cualquier punto dado del diagrama esté fuera de los
límites de control, entonces
1
ARL =
(10.1)
p
Si un proceso está fuera de control, entonces la ARL será menor a 370.4. El ejemplo
10.4 muestra cómo calcular la ARL para una situación en la que el proceso cambia a una situación fuera de control.
Ejemplo
10.4
Un proceso tiene una media m ⫽ 3 y desviación estándar s ⫽ 1. Se toman muestras de tamaño n ⫽ 4. Si una causa especial cambia a la media del proceso a un valor de 3.5, encuentre la
ARL.
Solución
Primero se calcula la probabilidad p de que un punto del diagrama esté fuera de los límites de
control. Entonces ARL ⫽ 1/p. Los límites de control se grafican con base en un proceso que
–
está en control. Por consiguiente, éstos se encuentran en m ⫾ 3sX—, donde m ⫽ 3 y sX— ⫽ s/冑n
–
⫽ 1/冑4 ⫽ 0.5. Por tanto, el límite de control inferior está en 1.5 y el de control superior está
–
en 4.5. Si X es la media de una muestra tomada después de que cambió la media del proceso,
–
–
entonces X ⬃ N(3.5, 0.52). La probabilidad de que el diagrama X se encuentre fuera de los lí–
–
mites de control es igual a P(X ⬍ 1.5) ⫹ P(X ⬎ 4.5). Esta probabilidad es 0.2228 (véase la
figura 10.6). En consecuencia, la ARL es igual a 1/0.0228= 43.9. Se tienen que observar alrededor de 44 muestras, en promedio, antes de detectar este cambio.
≈0
1.5
z=⫺4
0.0228
3.5
4.5
z=2
FIGURA 10.6 La media del proceso ha cambiado de m ⫽ 3 a m ⫽ 3.5. Ahora el límite
de control superior se encuentra a sólo 2sX— de la media, que es indicado por el hecho de
que z ⫽ 2. Ahora el límite de control inferior está a 4sX— por debajo de la media. La probabilidad de que los puntos del diagrama estén fuera de los límites de control es 0.0228
(0 ⫹ 0.0228).
10.2
Ejemplo
10.5
Diagramas de control para variables
735
Con referencia al ejemplo 10.4, ¿a qué valor puede detectarse un cambio positivo con una
ARL de 20?
Solución
M es la nueva media a la que ha cambiado el proceso. Dado que se ha especificado un cambio positivo, m > 3. En el ejemplo 10.4 se calculó que los límites de control eran 1.5 y 4.5. Si
–
–
X es la media de la muestra tomada después de que la media del proceso cambió, entonces X
–
⬃ N(m, 0.52). La probabilidad de que el diagrama X esté fuera de los límites de control es
–
–
igual a P(X ⬍ 1.5) ⫹ P(X ⬎ 4.5) (véase la figura 10.7). Esta probabilidad es igual a 1/ARL
⫽ 1/20 ⫽ 0.05. Puesto que m > 3, m se aproxima más a 4.5 que a 1.5. Se comenzará suponiendo que el área a la izquierda de 1.5 es insignificante y que el área a la derecha de 4.5 es
igual a 0.05. El puntaje z de 4.5 es, entonces, 1.645, por lo que (4.5 – m)/0.5 ⫽ 1.645. Al despejar a m, se tiene que m ⫽ 3.68. Se termina por comprobar la suposición de que el área a la
izquierda de 1.5 es insignificante. Con m ⫽ 3.68, el puntaje z para 1.5 es (1.5 – 3.68)/0.5 ⫽
–4.36. El área a la izquierda de 1.5 es en realidad insignificante.
≈0
0.05
1.5
z = ⫺ 4.36
m
4.5
z = 1.645
FIGURA 10.7 Solución al ejemplo 10.5.
Ejemplo
10.6
Con referencia al ejemplo 10.4, si el tamaño de la muestra sigue siendo n ⫽ 4, ¿cuál debe ser
el valor de la desviación estándar s para tener una ARL de 10 cuando la media del proceso
cambia a 3.5?
Solución
–
Sea s la nueva desviación estándar del proceso. Los nuevos límites de control son 3 ⫾ 3s/冑n,
–
2
o 3 ⫾ 3s/2. Si la media del proceso cambia a 3.5, entonces X ⬃ N(3.5, s /4). La probabili–
–
dad de que el diagrama X esté fuera de los límites de control es igual a P(X ⬍ 3 ⫺ 3s/2) ⫹
–
P(X ⬎ 3 ⫺ 3s/2). Esta probabilidad es igual a 1/ARL ⫽ 1/10 ⫽ 0.10 (véase la figura 10.8,
página 736). La media del proceso, 3.5, se aproxima más a 3 ⫹ 3σ/2 que a 3 ⫺ 3s/2. Se supondrá que el área a la izquierda de 3 ⫺ 3s/2 es insignificante y que el área a la izquierda de
3 ⫹ 3s/2 es igual a 0.10. El puntaje z para 3 ⫹ 3s/2 es, entonces, 1.28, por lo que
(3 + 3σ/2) − 3.5
= 1.28
σ/2
Al despejar s se obtiene que s ⫽ 0.58. Se concluye que el área a la izquierda de 3 ⫺ 3s/2
es insignificante. Al sustituir s ⫽ 0.58, se obtiene que 3 ⫺ 3s/2 ⫽ 2.13. El puntaje z es (2.13
– 3.5)(0.58/2) ⫽ –4.72. El área a la izquierda de 3 ⫺ 3s/2 es verdaderamente insignificante.
736
CAPÍTULO 10
Control estadístico de calidad
≈0
0.10
3 ⫺ 3s/2
z = ⫺ 4.72
3.5
3 ⫹ 3s/2
z = 1.28
FIGURA 10.8 Solución al ejemplo 10.6.
–
Los ejemplos 10.4 a 10.6 muestran que usualmente los diagramas X no detectan los
cambios pequeños de forma rápida. En otras palabras, la ARL es alta cuando los cambios en
la media del proceso son pequeños. En principio, se puede reducir la ARL al mover los límites de control cerca de la recta central. Esto último reduciría el tamaño del cambio que se necesita para detectar una condición fuera de control, por lo que los cambios en la media del
proceso se detectarían más rápidamente. No obstante, hay un intercambio. La tasa de falsa
alarma también puede incrementarse, debido a que es más probable que ocurran cambios fuera de los límites de control. La situación se parece mucho a las pruebas de hipótesis de nivel
fijo. La hipótesis nula consiste en que el proceso esté en control. El diagrama de control realiza una prueba de hipótesis para cada muestra. Cuando un punto del diagrama está fuera de
los límites de control, se rechaza la hipótesis nula. Con los límites de control en ⫾ 3sX—, un
error del tipo I (rechazo de una hipótesis nula verdadera) ocurrirá aproximadamente una vez
por cada 370 muestras. El precio que debe pagarse por esta baja tasa de falsa alarma es la falta de capacidad de rechazar una hipótesis nula cuando ésta es falsa. La respuesta no es mover
los límites de control para que se aproximen entre sí. Aunque incrementará la capacidad, también aumentará la razón de falsa alarma.
Dos de los medios por los cuales los practicantes han intentado mejorar su capacidad
para detectar pequeños cambios de forma rápida son el uso de las reglas de Western Electric para interpretar el diagrama de control y el uso de los diagramas CUSUM. Enseguida se
describirán las reglas de Western Electric. En la sección 10.4 se presentarán los diagramas
CUSUM.
Las reglas de Western Electric
–
La figura 10.9 presenta un diagrama X . A pesar de que ninguno de los puntos está fuera de
los límites de control 3s, claramente el proceso no se encuentra en un estado de control, ya
que las medias muestrales siguen un patrón no aleatorio. Al darse cuenta de que un proceso
puede estar fuera de control aun cuando ninguno de los puntos del diagrama se encuentre fuera
de los límites de control, en 1956 los ingenieros de la compañía Western Electric propusieron
una lista de condiciones, de las cuales cualquiera puede utilizarse para demostrar que un proceso está fuera de control. La idea detrás de estas condiciones es que si en el diagrama de control persiste una tendencia o patrón durante un gran periodo, puede ser una señal de ausencia de
control, incluso si ninguno de los puntos del diagrama está fuera de los límites de control 3s.
La aplicación de las reglas de Western Electric
requiere calcular los límites de control
–
–
1s y 2s. Los
límites
de
control
están
dados
por
X
⫾
A
2R/3, y los límites de control 2s están
–
–
dados por X ⫾ 2A2R/3.
10.2
Diagramas de control para variables
Diagrama X
5
3s = 4.725
4
Rango muestral
737
2s = 3.987
1s = 3.249
3
X = 2.511
2
⫺1s = 1.773
1
0
⫺2s = 1.035
⫺3s = 0.297
0
5
10
15
20
25
Número de muestra
30
–
FIGURA 10.9 Este diagrama X exhibe patrones no aleatorios, lo cual es muestra de una
falta de control estadístico, aun cuando no se encuentren puntos fuera de los límites de control 3s. En este diagrama se muestran los límites de control 1s y 2s, de tal forma que puedan aplicarse las reglas de Western Electric.
Las reglas de Western Electric
Cualquiera de las siguientes condiciones es prueba de que un proceso está fuera de
control:
1. Cualquier punto del diagrama fuera de los límites 3s.
2. Dos de tres puntos consecutivos del diagrama por arriba del límite superior 2s, o
dos de tres puntos consecutivos del diagrama por abajo del límite inferior 2s.
3. Cuatro de cinco puntos consecutivos del diagrama por arriba del límite superior
1s, o cuatro de cinco puntos consecutivos del diagrama por debajo del límite inferior 1s.
4. Ocho puntos consecutivos del diagrama que estén del mismo lado que la recta central.
En la figura 10.9 las reglas de Western Electric indican que un proceso está fuera de
control en el número de muestra 8, lugar en el cual cuatro de cinco puntos consecutivos se encuentran por arriba del límite de control superior 1s. Para mayor información sobre el uso de
las reglas de Western Electric para interpretar los diagramas de control, véase Montgomery
(2001b).
El diagrama S
El diagrama S es una alternativa al diagrama R. Ambos son útiles para controlar la variabilidad en un proceso. Mientras que el diagrama R evalúa la variabilidad con el rango muestral,
el S utiliza la desviación estándar muestral. La figura 10.10 presenta el diagrama de los datos
de humedad de la tabla 10.1.
738
CAPÍTULO 10
Control estadístico de calidad
Diagrama S
0.6
DE muestral
UCL = 0.511
0.4
s = 0.245
0.2
0
LCL = 0
0
5
10
15
20
N mero de muestra
25
30
FIGURA 10.10 Diagrama S para los datos de humedad. Compárese con la figura 10.1.
Observe que el diagrama S para los datos de humedad es similar en apariencia al diagrama R (figura 10.1) para los mismos datos. Al igual que el diagrama R, el S indica que la
variación estaba fuera de control en la muestra 6.
Para entender dónde deben graficarse los límites de control, suponga que 32 desviaciones estándar provienen de una población con media m y desviación estándar s. Idealmente se
desearía que en el diagrama la recta central estuviera en ms y los límites de control en ms ⫾
3ss. Generalmente no se conocen estas cantidades. Se aproxima ms con s–, el promedio de las
desviaciones estándar. Por tanto, se grafica la recta central en s–. Puede demostrarse mediante
métodos avanzados que las cantidades ms ⫾ 3ss pueden estimarse con múltiplos de s–; estos
múltiplos se representan mediante B3 y B4. La cantidad ms ⫺ 3ss se estima con B3s–, mientras
que la cantidad ms ⫹ 3ss se estima con B4s–. Las cantidades B3 y B4 son constantes cuyos valores dependen del tamaño de la muestra n. A continuación se presenta una pequeña tabla de
valores de B3 y B4. La tabla A.9 (Apéndice A) muestra una tabulación más extensa. Observe
que para muestras de tamaño 5 o menos, el valor de B3 es 0. Para muestras así de pequeñas,
el valor de ms ⫺ 3ss es negativo. En estos casos se establece que el límite de control es 0, debido a que es imposible que una desviación estándar sea negativa.
Ejemplo
10.7
n
2
3
4
5
6
7
8
B3
B4
0
3.267
0
2.568
0
2.266
0
2.089
0.030
1.970
0.118
1.882
0.185
1.815
Calcule la recta central y los límites de control 3s superior e inferior del diagrama para los
datos de humedad de la tabla 10.1.
Solución
El valor de s– es 0.2445 (tabla 10.1). El tamaño de la muestra es n ⫽ 5. De la tabla anterior se
tiene que B3 ⫽ 0 y B4 ⫽ 2.089. Por consiguiente, el límite de control superior es
(2.089)(0.2445) ⫽ 0.5108, y el límite de control inferior es (0)(0.2445) ⫽ 0.
739
Diagramas de control para variables
10.2
Resumen
En un diagrama S, la recta central y los límites de control 3s superior e inferior están
dados por
Límite superior 3s ⫽ B4s–
Recta central ⫽ s–
Límite inferior 3s ⫽ B3s–
Los valores B3 y B4 dependen del tamaño de la muestra. La tabla A.9 tabula estos valores.
El diagrama S de la figura 10.10 muestra que la variación del proceso se encuentra fuera de control en la muestra 6. Se elimina esta muestra y se vuelve a calcular el diagrama S. La
figura 10.11 presenta los resultados. Ahora la variación está bajo control. Observe que este
diagrama tiene una apariencia similar al diagrama R de la figura 10.2.
Diagrama S
0.5
UCL = 0.492
DE muestral
0.4
0.3
s = 0.235
0.2
0.1
LCL = 0
0
0
5
10
15
20
Número de muestra
25
30
FIGURA 10.11 Diagrama S para los datos de humedad, después de eliminar la muestra
que estaba fuera de control. Compárese con la figura 10.2.
–
Una vez que la variación está en control, se calcula el diagrama X para evaluar la me–
–
dia muestral. Recuerde que para el diagrama X la recta central se encuentra en X , y que lo
ideal sería que los límites de control superior e inferior se localizaran a una distancia 3sX— por
debajo y por arriba de la recta central. Puesto que se empleó el diagrama S para evaluar la variación del proceso, se estimará la cantidad 3sX— con un múltiplo de s–. Específicamente, se estima a 3sX— con A3s–, donde A3 es una constante cuyo valor depende del tamaño de muestra n.
A continuación se muestra una pequeña tabla de valores de A3. La tabla A.9 muestra una tabulación más extensa.
n
A3
2
2.659
3
1.954
4
1.628
5
1.427
6
1.287
7
1.182
8
1.099
740
CAPÍTULO 10
Control estadístico de calidad
Resumen
–
En un diagrama X , cuando se utiliza a s– para estimar s X—, la recta central y los límites
3s superior e inferior están dados por
–
Límite superior 3s ⫽ X ⫹ A3s–
–
Recta central ⫽ X
–
Límite inferior 3s ⫽ X ⫺ A3s–
El valor A3 depende del tamaño de la muestra. Los valores están tabulados en la tabla A.9.
Si se utilizan las reglas de Western Electric, deben calcularse los límites de control 1s
–
–
y 2s. Los límites 1s son X ⫾ A3s–/3; los límites 2s son X ⫾ 2A3s–/3.
–
Calcule los límites de control 3s superior e inferior del diagrama X para los datos de humedad de la tabla 10.1.
Solución
–
Con la muestra 6 eliminada, el valor de X es 2.658, y el valor de s– es 0.2354. El tamaño de la
muestra es n ⫽ 5. De la tabla se tiene que A3 ⫽ 1.427. Por tanto, el límite de control superior
es 2.658 ⫹ (1.427)(0.2354) ⫽ 2.994, y el límite de control inferior es 2.658 – (1.427)(0.2354)
⫽ 2.322.
–
La figura 10.12 muestra el diagrama X de los datos de humedad con la muestra 6 eliminada. Los límites de control se parecen mucho a los calculados a partir de los rangos mues-
Diagrama X
3.5
Media muestral
Ejemplo
10.8
3
UCL = 2.994
X = 2.658
2.5
LCL = 2.322
2
0
5
10
15
20
Número de muestra
25
30
–
FIGURA 10.12 Diagrama X para los datos de humedad. Los límites de control están basados en las desviaciones estándar en vez de los rangos muestrales. Compárese con la figura 10.3.
10.2
Diagramas de control para variables
741
trales, como lo muestra la figura 10.3. La figura 10.12 indica que el proceso no está en con–
trol. Después de corregirse, se construyen nuevos diagramas S y X . La figura 10.13 presenta
los resultados. Ahora, el proceso está en un estado de control estadístico.
Diagrama S
DE muestral
0.5
UCL = 0.483
0.4
0.3
s = 0.231
0.2
0.1
LCL = 0
0
0
5
10
15
20
Número de muestra
25
30
Diagrama X
2.8
UCL = 2.605
Media muestral
2.6
2.4
X = 2.275
2.2
2
LCL = 1.946
1.8
0
5
10
15
20
Número de muestra
25
30
–
FIGURA 10.12 Diagramas S y X después de que se corrigió la causa especial. Ahora el
proceso se encuentra en un estado de control estadístico. Compárese con la figura 10.4.
En resumen, el diagrama S es una alternativa al diagrama R que puede utilizarse junto
–
con el diagrama X . Para los datos de humedad, los dos diagramas produjeron resultados muy
similares. Esto es cierto en muchos casos, pero algunas veces los resultados son diferentes.
¿Cuál es mejor, el diagrama S o el diagrama R?
Ambos diagramas tienen el mismo objetivo: estimar la desviación estándar del proceso y determinar si está en control. Parece ser más natural estimar la desviación estándar del proceso
con la desviación estándar muestral s que con el rango R. De hecho, cuando la población es
normal, s es una estimación más precisa de la desviación estándar del proceso que R, debido
a una incertidumbre menor. Para ver esto de forma intuitiva, note que el cálculo de s abarca
742
CAPÍTULO 10
Control estadístico de calidad
todas las mediciones de cada muestra, mientras que el cálculo de R sólo toma en cuenta dos
mediciones (la mayor y la menor). Resulta que el mejoramiento de la precisión obtenido con
s en contraposición con R aumenta a medida que el tamaño de muestra es mayor. De ahí que
el diagrama S sea una mejor opción, especialmente para tamaños de muestras más grandes
(mayores a 5 y en adelante). El diagrama R se sigue utilizando aún, en gran parte por tradición. En determinada época, el diagrama R tenía la ventaja de que podía calcularse el rango
muestral con menos aritmética que la desviación estándar muestral. Hoy en que la mayoría de
los cálculos se hacen electrónicamente, esta ventaja ya no es válida. Por tanto, el diagrama S
es en general la mejor opción.
Muestras de tamaño 1
En algunas ocasiones se necesitan definir los grupos racionales de tal manera que cada muestra sólo contenga un valor. Por ejemplo, si la tasa de producción es muy lenta, no sería conveniente esperar a acumular muestras mayores a n ⫽ 1. Es imposible calcular un rango
muestral o una desviación estándar muestral para una muestra de tamaño 1, por lo que no pueden utilizarse los diagramas R y S. Se puede disponer de muchos otros métodos. Uno de ellos
es el diagrama CUSUM, que se analiza en la sección 10.4.
Ejercicios para la sección 10.2
1. El plan de control de calidad para cierto proceso de producción consiste en tomar muestras de tamaño 4. Los resultados
de las últimas 30 muestras pueden resumirse de la siguiente manera:
30
i=1
X i = 712.5
30
i=1
Ri = 143.7
30
i=1
3s
2s
1s
si = 62.5
X
⫺1s
a) Calcule los límites de control 3s para el diagrama R.
b) Calcule los límites de control 3s para el diagrama S.
⫺2s
c) Utilizando los rangos muestrales, calcule los límites de
–
control 3s para el diagrama X .
⫺3s
d ) Utilizando las desviaciones estándar muestrales, calcule
–
los límites de control 3s para el diagrama X .
–
2. El siguiente diagrama X presenta las últimas 50 muestras
tomadas de la producción de un proceso. Utilizando las reglas de Western Electric, ¿podría detectarse en cualquier
momento que el proceso no está en control? Si es así, especifique en qué muestra se detectaría primero que el proceso
está fuera de control y qué regla no se cumple.
0
10
20
30
40
50
3. Se mide la distancia (en mm) entre los electrodos centrales
y laterales de las bujías de motores de combustión interna
en muestras de tamaño 5. La siguiente tabla presenta las
medias, los rangos y las desviaciones estándar de 20 muestras consecutivas.
10.2
Muestra
X
R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
1.11
1.09
1.10
1.09
1.11
1.07
1.05
1.04
1.05
1.07
1.11
1.06
1.10
1.14
1.10
1.13
1.19
1.20
1.21
1.18
0.17
0.13
0.13
0.22
0.15
0.13
0.11
0.12
0.12
0.05
0.14
0.10
0.14
0.14
0.19
0.09
0.18
0.06
0.11
0.14
s
0.07
0.06
0.06
0.09
0.06
0.06
0.05
0.06
0.05
0.02
0.07
0.04
0.07
0.05
0.08
0.04
0.07
0.03
0.05
0.06
–
–
Las medias son X ⫽ 1.110, R ⫽ 0.131 y s– ⫽ 0.057.
a) Calcule los límites de control 3s para el diagrama R.
¿La varianza está bajo control? Si no es así, elimine
– – las
muestras que no lo están y vuelva a calcular a X y R.
Diagramas de control para variables
743
duzca una ARL de 6 cuando la media del proceso cambia a 11?
d ) Si la desviación estándar sigue siendo de 2, ¿qué tamaño de muestra debe utilizarse para que se produzca una
ARL no mayor de 6 cuando la media del proceso cambia a 11?
6. Un proceso tiene una media de 7.2 y desviación estándar de
1.3. Se da seguimiento al proceso tomando muestras de tamaño 6 en intervalos regulares. Se concluye que el proceso
–
no está en control si es que un punto del diagrama X se encuentra fuera de los límites de control 3s.
a) Si la media del proceso cambia a 6.7, ¿cuál es el número de muestras promedio que se extraerán antes de que
–
se detecte el cambio en el diagrama X ?
b) ¿A qué valor necesita darse el cambio positivo para detectarlo con una ARL de 15?
c) Si el tamaño de la muestra sigue siendo de 6, ¿a qué valor debe reducirse la desviación estándar para que produzca una ARL de 15 cuando la media del proceso
cambia a 6.7?
d ) Si la desviación estándar sigue siendo de 1.3, ¿qué tamaño de muestra debe utilizarse para que se produzca
una ARL no mayor a 6 cuando la media del proceso
cambia a 6.7?
b) Con base en el rango muestral R, calcule los límites de
–
control 3s para el diagrama X . Con base en los límites
3s, ¿la media del proceso está bajo control? Si no es así,
¿cuándo se detecta por primera vez que no está en control?
7. Se da seguimiento a un proceso tomando muestras en intervalos regulares y se concluye que está fuera de control si un
punto del diagrama está fuera de los límites de control 3s.
Suponga que el proceso está en control.
c) Con base en las reglas de Western Electric, ¿la media del
proceso está bajo control? Si no es así, ¿cuándo se detecta por primera vez que no está en control?
a) ¿Cuál es la probabilidad de que ocurra una falsa alarma
en las próximas 50 muestras?
4. Repita el ejercicio 3 utilizando el diagrama S en lugar del R.
5. Un proceso tiene una media de 10 y desviación estándar de
2. Se da seguimiento al proceso tomando muestras de tamaño 4 en intervalos regulares. Se concluye que el proceso no
–
está en control si es que un punto del diagrama X se encuentra fuera de los límites de control 3s.
a) Si la media del proceso pasa a ser 11, ¿cuál es el número de muestras promedio que se extraerán antes de que
–
se detecte el cambio en el diagrama X ?
b) ¿A qué valor necesita darse el cambio positivo para detectarlo con una ARL de 6?
c) Si el tamaño de la muestra sigue siendo de 4, ¿a qué valor debe reducirse la desviación estándar para que pro-
b) ¿Cuál es la probabilidad de que ocurra una falsa alarma
en las próximas 100 muestras?
c) ¿Cuál es la probabilidad de que no haya una falsa alarma en las próximas 200 muestras?
d) Complete el enunciado: La probabilidad es de 0.5 de
que haya una falsa alarma en las próximas ______
muestras.
8. Se toman periódicamente muestras de seis cojinetes de bola y se miden sus diámetros (en mm). La siguiente tabla presenta las medias, los rangos y las desviaciones estándar de
25 muestras consecutivas.
744
CAPÍTULO 10
Control estadístico de calidad
Muestra
X
R
s
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
199.5
200.4
202.0
198.9
199.1
200.2
199.5
198.1
200.0
199.0
199.3
199.3
200.5
200.1
200.1
200.4
200.9
200.8
199.3
199.8
199.5
198.9
199.6
200.3
199.9
7.2
7.9
3.6
5.3
3.4
4.8
2.1
5.5
5.5
9.2
7.8
5.8
3.6
5.7
3.0
5.2
4.1
5.5
8.3
3.8
3.6
7.2
3.8
3.1
4.1
2.38
2.70
1.35
1.95
1.53
2.19
0.87
2.22
2.09
3.17
2.64
1.98
1.36
2.34
1.11
1.99
1.54
2.01
2.92
1.78
1.60
2.60
1.69
1.15
1.86
–
–
Las medias son X ⫽ 199.816, R ⫽ 5.164 y s– ⫽ 1.961.
10. Cierto tipo de circuito integrado está conectado a su marco
mediante cuatro alambres. Se toman treinta muestras de
cinco unidades cada una, y se mide la resistencia de empuje (en gramos) de un alambre de cada
– unidad. –La tabla E10
presenta los datos. Las medias son X ⫽ 9.81, R ⫽ 1.14 y s–
⫽ 0.4647.
a) Calcule los límites de control 3s para el diagrama R.
¿La varianza está fuera control en algún punto? Si es así,
elimine las–muestras que no están en control y vuelva a
–
calcular a X y a R.
–
b) Calcule los límites de control 3s para el diagrama X .
Con base en los límites 3s, ¿la media del proceso está
bajo control? Si no es así, ¿en qué punto se detecta por
primera vez que no lo está?
c) Con base en las reglas de Western Electric, ¿la media del
proceso está bajo control? Si no es así, ¿cuándo se detecta por primera vez que no lo está?
11. Repita el ejercicio 10 utilizando el diagrama S en lugar del R.
12. Los alambres de cobre están revestidos con una fina capa de
plástico. Cada hora se toman muestras de cuatro alambres y
se mide el espesor del revestimiento (en milésimas). La tabla E12 de la página 746 presenta
los datos de las últimas
–
–
30 muestras. Las medias son X ⫽ 150.075, R ⫽ 6.97 y s– ⫽
3.082.
b) Con base en el rango muestral R, calcule los límites de
–
control 3s para el diagrama X . Con base en los límites
3s, ¿la media del proceso está bajo control? Si no es así,
¿cuándo se detecta por primera vez que no lo está?
a) Calcule los límites de control 3s para el diagrama R.
¿La varianza está fuera control en algún punto? Si es así,
elimine
las muestras que no lo están y vuelva a calcular
–
–
a X y a R.
–
b) Calcule los límites de control 3s para el diagrama X .
Con base en los límites 3s, ¿la media del proceso está
bajo control? Si no es así, ¿en qué punto se detecta por
primera vez que no lo está?
c) Con base en las reglas de Western Electric, ¿la media del
proceso está bajo control? Si no es así, ¿cuándo se detecta por primera vez que no lo está?
c) Con base en las reglas de Western Electric, ¿la media del
proceso está bajo control? Si no es así, ¿cuándo se detecta por primera vez que no lo está?
9. Repita el ejercicio 8 utilizando el diagrama S en lugar del R.
13. Repita el ejercicio 12 utilizando el diagrama S en lugar del R.
a) Calcule los límites de control 3s para el diagrama R.
¿La varianza está bajo control? Si no es así, elimine las
–
muestras que no están en control y vuelva a calcular a X
–
y R.
10.2
745
Diagramas de control para variables
TABLA E10 Datos para el ejercicio 10
Muestra
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Valores muestrales
10.3
9.9
9.0
10.1
10.8
10.3
8.8
9.4
9.1
8.9
9.0
9.5
9.0
9.4
9.4
9.6
10.2
10.4
11.1
9.3
9.5
10.5
9.8
9.3
10.2
10.8
10.4
11.0
10.3
10.9
9.8
9.4
9.9
10.6
9.4
10.1
9.3
9.7
8.9
9.4
8.6
9.2
9.4
9.2
10.2
9.5
8.8
9.4
10.5
9.9
10.2
10.5
8.9
9.7
9.6
9.5
9.9
10.8
10.0
10.6
9.7
10.0
9.6
10.3
9.9
10.0
9.9
9.4
9.8
10.6
9.9
9.4
9.7
9.4
9.0
10.0
10.0
9.9
10.6
10.9
9.7
10.1
9.6
10.3
8.8
10.5
10.1
10.1
10.6
9.9
9.9
9.4
9.2
9.6
10.1
9.5
8.9
9.9
9.0
9.4
9.6
9.3
9.4
9.3
8.8
9.3
10.1
9.4
9.8
9.5
9.4
9.5
9.8
10.1
9.9
10.5
9.9
9.2
10.0
10.0
10.2
10.2
10.6
9.7
10.1
9.8
9.3
10.5
9.3
8.7
10.5
9.6
8.6
9.7
10.2
9.4
10.1
9.9
9.4
10.6
10.0
10.3
9.6
9.7
10.2
10.1
10.9
9.9
11.1
10.8
X
R
s
9.98
9.78
9.66
10.06
10.06
9.94
9.24
9.78
9.22
9.40
9.52
9.40
9.22
9.40
9.52
9.56
9.84
9.80
10.28
10.04
9.76
10.18
9.54
9.82
9.74
10.28
10.24
10.20
10.40
10.44
0.6
0.8
1.6
1.0
1.4
0.8
1.1
1.1
0.9
1.9
1.9
0.4
1.1
0.5
1.4
0.7
1.4
1.0
1.7
1.6
0.8
1.0
0.9
1.0
1.4
1.3
1.0
1.8
1.1
1.0
0.26
0.36
0.63
0.42
0.50
0.30
0.43
0.45
0.36
0.74
0.75
0.16
0.43
0.19
0.66
0.27
0.59
0.42
0.68
0.69
0.34
0.41
0.37
0.39
0.58
0.50
0.42
0.72
0.46
0.46
746
CAPÍTULO 10
Control estadístico de calidad
TABLA E12 Datos para el ejercicio 12
Muestra
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
10.3
Valores muestrales
146.0
147.1
148.7
151.3
146.4
150.2
147.8
137.1
151.1
151.3
151.3
151.9
152.8
152.9
149.0
153.9
150.4
157.2
152.7
150.2
151.0
143.8
143.0
148.8
153.8
151.6
149.4
149.8
155.8
153.9
147.4
147.5
148.4
150.0
147.5
142.9
148.3
156.6
148.1
151.3
153.5
152.2
149.1
149.9
149.9
150.8
151.8
152.6
156.2
148.2
151.7
154.5
156.4
147.7
145.4
149.3
151.4
149.0
152.4
145.7
151.9
151.4
149.6
152.4
152.9
152.5
145.7
147.2
145.6
142.5
150.2
149.3
148.5
151.9
153.1
153.9
151.3
148.4
146.8
149.8
148.5
154.8
149.2
147.1
149.5
155.0
154.6
146.8
150.2
150.7
155.2
149.4
154.1
148.2
150.3
155.5
149.7
148.9
147.6
146.2
148.7
154.2
146.9
150.4
152.8
145.0
153.0
152.6
148.7
142.1
147.0
151.6
152.2
148.2
153.4
149.0
150.0
145.7
154.8
150.4
X
R
s
150.125
148.850
150.200
150.475
149.275
150.275
147.875
147.450
148.100
147.825
150.925
151.900
149.325
151.275
151.200
150.900
151.625
152.700
151.100
147.575
149.550
151.175
150.200
147.950
150.525
151.225
151.350
147.825
153.300
150.175
9.2
4.3
5.7
4.2
6.5
12.6
4.0
19.5
5.5
8.8
4.8
4.9
5.9
3.0
4.1
8.9
2.6
8.8
9.4
8.1
4.7
11.0
13.4
1.7
8.4
6.0
5.2
4.1
5.6
8.2
4.22
1.97
2.65
1.81
2.92
5.37
1.66
8.02
2.27
4.29
2.02
2.01
2.50
1.38
2.06
4.20
1.08
3.59
4.20
3.75
2.19
5.12
5.64
0.72
3.93
2.77
2.32
1.90
2.51
3.38
Diagramas de control para atributos
El diagrama p
El diagrama p se utiliza cuando la característica de calidad que se medirá en cada unidad sólo
toma dos valores; por lo general, “defectuoso” y “no defectuoso”. En cada muestra se calcula
la proporción de unidades defectuosas; después se grafican estas proporciones muestrales.
Ahora se describirá cómo calcular la recta central y los límites de control.
Sea p la probabilidad de que una unidad dada esté defectuosa. Si el proceso está en control, esta probabilidad es constante a lo largo del tiempo. Sea k el número de muestras. Se supondrá que todas las muestras tienen el mismo tamaño, y éste se representará por n. Sea Xi el
número de unidades defectuosas en la i-ésima muestra, y p̂i ⫽ Xi /n la proporción de unidades
defectuosas en la i-ésima muestra. Ahora, Xi ⬃ Bin (n, p), y si np ⬎ 10, es aproximadamente cierto que p̂i ⬃ N(p, p(1 ⫺ p)/n) (véase p. 274). Dado que p̂i tiene una media m ⫽ p y una
10.3
Diagramas de control para atributos
747
√
desviación estándar σ = p(1 − p)/n, se tiene que la recta central debe ubicarse en p, y
√
que los límites de control
3s deben estar en p ± 3 p(1 − p)/n. Usualmente no se conoce
k
i /k, el promedio de las proporciones muestrales p̂i.
a p y se estima con p = i=1 p
Resumen
En un diagrama p, en el que el número de unidades en cada muestra es n, la recta central y los límites de control 3s superior e inferior están dados por
p(1 − p)
Límite superior 3s = p + 3
n
Recta central = p
p(1 − p)
Límite inferior 3s = p − 3
n
Estos límites de control serán válidos si np– ⬎ 10.
Estas ideas se ilustran en el ejemplo 10.9.
Ejemplo
10.9
En la producción de placas de silicio se extraen 30 muestras de tamaño 500, y se calcula la
proporción de placas defectuosas en cada muestra. La tabla 10.2 muestra los resultados. Calcule la recta central y los límites de control del diagrama p. Dibuje el diagrama. ¿Parece que
el proceso esté en control?
TABLA 10.2 Número y proporción de unidades defectuosas, para el ejemplo 10.9
Número de
Muestra unidades defectuosas
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
17
26
31
25
26
29
36
26
25
21
18
33
29
17
28
Proporción de
unidades
defectuosas ( p̂)
0.034
0.052
0.062
0.050
0.052
0.058
0.072
0.052
0.050
0.042
0.036
0.066
0.058
0.034
0.056
Proporción de
Número de
unidades
Muestra unidades defectuosas defectuosas ( p̂)
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
26
19
31
27
24
22
24
30
25
26
28
22
31
18
23
0.052
0.038
0.062
0.054
0.048
0.044
0.048
0.060
0.050
0.052
0.056
0.044
0.062
0.036
0.046
CAPÍTULO 10
Control estadístico de calidad
Solución
El promedio de las 30 proporciones muestrales es p– ⫽ 0.050867. En consecuencia, la recta
central se pubica en 0.050867. Los límites de control se grafican en 0.050867 ⫾
√
3 (0.050867)(0.949133)/500. Por tanto, el límite de control superior es 0.0803, y el límite
de control inferior es 0.0214. La figura 10.4 muestra el diagrama p. Parece que el proceso sí
está en control.
Diagrama p
Proporción muestral
748
UCL = 0.0803
0.08
0.06
p = 0.0509
0.04
LCL = 0.0214
0.02
0
5
10
15
20
Número de muestra
25
30
FIGURA 10.4 Diagrama p para los datos de la tabla 10.2.
El tamaño de muestra necesario para construir un diagrama p usualmente es mayor que
–
el requerido para un diagrama X . La razón es que el tamaño de la muestra debe ser lo suficientemente grande para que haya varias unidades defectuosas en la mayoría de las muestras.
Si las unidades defectuosas no se presentan frecuentemente, el tamaño de las muestras debe
ser muy grande.
Interpretación de las señales de fuera de control
en diagramas de atributos
Cuando se utiliza un diagrama de control de atributos para darle seguimiento a la frecuencia
de las unidades defectuosas, un punto del diagrama que está por arriba del límite de control
superior requiere de una respuesta muy diferente a un punto del diagrama que está por debajo del límite de control inferior. Ambas situaciones indican que una causa especial ha cambiado la proporción de unidades defectuosas. Un punto del diagrama que está por arriba del
límite de control superior señala que la proporción de unidades defectuosas ha aumentado,
por lo que debe emprenderse alguna acción para identificar y eliminar la causa especial. Sin
embargo, un punto del diagrama que está por debajo del límite de control inferior indica que
la causa especial ha reducido la proporción de unidades defectuosas. Aun así debe identificarse la causa especial; en este caso, debe hacerse algo para que ésta siga operando, de tal forma que la proporción de unidades defectuosas pueda disminuir permanentemente.
El diagrama c
El diagrama c se utiliza cuando la medida de calidad es el conteo del número de defectos, o
imperfecciones, en una unidad dada. Una unidad puede ser un solo elemento o un grupo de
elementos lo suficientemente grande para que el número esperado de imperfecciones sea lo
bastante grande. El uso del diagrama c requiere que el número de defectos siga una distribución Poisson. Suponga que se extraen k unidades, y que ci denota el número total de defectos
en la i-ésima unidad. Sea que λ denote la media del número total de fallas por unidad. Enton-
10.3
749
Diagramas de control para atributos
ces ci ⬃ Poisson(λ). Si el proceso está en control, el valor de λ es constante en el tiempo. Ahora,
si λ es razonablemente grande, por ejemplo λ > 10, entonces aproximadamente ci ⬃ N(λ, λ)
(véase p. 278). Observe que el valor de λ puede hacerse grande al escoger un número de elementos por unidad lo suficientemente grande. El diagrama c se construye al graficar
los va√
lores de ci. Puesto que ci tiene una media λ y una desviación estándar igual
la
recta
λ,
√
central debe graficarse en λ y los límites de control deben graficarse en λ ± 3 λ. Usualmente no se conoce
el valor de λ y tiene que estimarse a partir de los datos. La estimación apropiada es c = ki=1 ci /k, el número de defectos por unidad.
Resumen
En un diagrama c, la recta central y los límites de control 3s superior e inferior están
dados por
√
Límite superior 3s = c + 3 c
Recta central = c
√
Límite inferior 3s = c − 3 c
Estos límites de control serán válidos si –c ⬎ 10.
El ejemplo 10.10 muestra estas ideas.
Ejemplo
10.10
Se examinan las grietas en la superficie de los rollos de láminas de aluminio utilizados para
fabricar latas. La tabla 10.3 presenta el número de grietas que hay en 40 muestras de 100 m2
cada una. Calcule la recta central y los límites de control 3s para el diagrama c. Dibuje el diagrama. ¿El proceso parece estar en control?
Solución
El promedio de los 40 conteos es –c ⫽ 12.275. Por tanto,
√ la recta central se localiza en 12.275.
Los límites de control 3s se grafican en 12.275 ± 3 12.275. En consecuencia, el límite de
control superior es 22.7857, y el de control inferior es 1.7643. La figura 10.15 en la página
750 presenta el diagrama c. El proceso parece estar en control.
TABLA 10.3 Número de grietas, para el ejemplo 10.10
Muestra
Número de
grietas (c)
Muestra
Número de
grietas (c)
Muestra
Número de
grietas (c)
Muestra
1
2
3
4
5
6
7
8
9
10
16
12
9
13
15
5
13
11
15
12
11
12
13
14
15
16
17
18
19
20
14
11
10
9
9
14
10
12
8
14
21
22
23
24
25
26
27
28
29
30
11
16
16
13
12
17
15
13
15
13
31
32
33
34
35
36
37
38
39
40
Número de
grietas (c)
10
10
10
12
14
10
15
12
11
14
750
Control estadístico de calidad
CAPÍTULO 10
Diagrama c
Conteo muestral
25
UCL = 22.786
20
15
c = 12.275
10
5
LCL = 1.764
0
0
10
20
30
Número de muestra
40
FIGURA 10.15 Diagrama c para los datos de la tabla 10.3.
Ejercicios para la sección 10.3
1. Se da seguimiento a un proceso para determinar las unidades defectuosas tomando diariamente una muestra de 200
unidades y calculando la proporción que está defectuosa.
Sea pi la proporción de unidades defectuosas en la i-ésima
muestra. Para las últimas 30 muestras, la suma de las pro
porciones es 30
p = 1.64. Calcule la recta central y los
i=1 i
límites de control 3s superior e inferior para un diagrama p.
2. Se requiere que el diámetro de cierta cabeza remachadora
mida entre 13.3-13.5 mm. Diariamente se toma una muestra de 400 remachadoras, y se cuenta el número de éstas que
no cumplen con el requisito. Los números de remachadoras
defectuosas para cada uno de los últimos 20 días son los siguientes:
12
25
23
15
20
11
16
20
18
25
22
16
22
18
37
35
40
40
36
30
a) Calcule los límites 3s superior e inferior para un diagrama p.
b) ¿El proceso está en control? Si no es así, ¿cuándo es la
primera vez que se detectó que no lo está?
3. Se da seguimiento a un proceso para determinar las unidades
defectuosas tomando periódicamente una muestra de 100
unidades y calculando el número de defectuosas. En las últimas 50 muestras hubo un total de 622 unidades defectuosas.
¿Se tiene la suficiente información para calcular los límites
de control 3s para un diagrama p? Si es así, calcule los límites. Si no, diga qué información adicional se requiere.
4. Con referencia al ejercicio 3, en las últimas 50 muestras hubo 622 unidades defectuosas. El número máximo de éstas
en las muestras fue de 24, mientras que el mínimo fue de 6.
¿Esta información es suficiente para determinar si el proceso se encontraba fuera de control en cualquier momento durante las últimas 50 muestras? Si es así, diga si el proceso
estaba o no fuera de control. Si no, diga qué información
adicional se requiere para hacer la determinación.
5. Un programa de control de calidad apenas diseñado para
cierto proceso consiste en tomar muestras de 20 unidades al
día y contar el número de unidades defectuosas. El número
éstas en las primeras 10 muestras son 0, 0, 1, 0, 1, 0, 0, 0, 1,
0. Un miembro del grupo de control de calidad pide consejo dada su preocupación de que el número de unidades defectuosas sea muy pequeño para construir un diagrama p
preciso. ¿Cuál de los siguientes consejos es el mejor?
i) No necesita cambiarse nada. Un diagrama p preciso
puede construirse cuando el número de unidades defectuosas es así de pequeño.
ii) Dado que la proporción de unidades que están defectuosas es tan pequeña, no se necesita construir un diagrama
p para este proceso.
iii) Aumente el valor de p para incrementar el número de
unidades defectuosas por muestra.
iv) Aumente el tamaño de las muestras para incrementar el
número de unidades defectuosas por muestra.
6. Se da seguimiento a un proceso que produce latas de aluminio al tomar muestras de mil latas y contar el número total
de grietas visuales que hay en todas las latas de la muestra.
Sea ci el número total de grietas en las latas en la i-ésima
muestra.
Para las últimas 50 muestras se ha calculado la
50
cantidad i=1 ci = 1476 . Calcule la recta central y los límites de control 3s superior e inferior para un diagrama c.
10.4
7. Con referencia al ejercicio 6, el número de grietas en la vigésima muestra fue 48. ¿Se puede determinar si el proceso
estaba en control en dicho momento? Si es así, establezca si
el proceso estaba o no en control. Si no, diga qué información adicional se necesita para hacer dicha determinación.
38
35
35
49
33
48
40
47
45
46
41
53
36
41
51
63
35
58
55
57
a) Calcule los límites 3s superior e inferior para un diagrama p.
b) ¿El proceso está en control? Si no es así, ¿cuándo es la
primera vez que se detectó que no lo está?
8. Cada hora se inspecciona una sección 10 m2 de un tejido para determinar sus grietas. Los números de grietas observadas durante las últimas 20 horas son:
10.4
751
El diagrama CUSUM
El diagrama CUSUM
–
Uno de los objetivos de un diagrama X es detectar un cambio en la media del proceso. No
obstante, a menos que un cambio sea bastante grande, puede transcurrir cierto tiempo antes
de que un punto del diagrama se ubique fuera de los límites de control 3s. El ejemplo 10.4
(en la sección 10.2) demostró que cuando la media de un proceso cambia por una cantidad
igual a s X—, la longitud de corrida promedio (ARL) es aproximadamente de 44, lo cual significa que en promedio deben observarse 44 muestras antes de que se determine que el proceso está fuera de control. Las reglas de Western Electric (sección 10.2) son un método para
reducir la ARL; el diagrama CUSUM (cumulative sums) es otro.
Una forma en que se manifiestan los cambios por sí mismos es con una corrida de puntos por arriba o debajo de la recta central. Las reglas de Western Electric están diseñadas para responder a las corridas. Otra forma de detectar pequeños cambios es con sumas
acumuladas. Imagine que la media de un proceso tiene un ligero cambio positivo. Entonces
los puntos tendrán cierta tendencia a estar por arriba de la recta central. Si se suman las desviaciones desde la recta central en adelante, y se grafican las sumas acumuladas, los puntos
se desplazarían hacia arriba y excederían un límite control mucho antes de lo que lo harían en
–
un diagrama X .
Ahora se describe cómo graficar los puntos en un diagrama CUSUM. Se supone que se
–
–
tienen m muestras de tamaño n, con medias muestrales X 1, . . . , X m. Para comenzar, debe especificarse un valor objetivo m para la media del proceso. Con frecuencia, el valor de m se to–
ma igual al valor X . Por lo que se necesita una estimación de s X—, la desviación estándar de
las medias muestrales. Ésta puede obtenerse ya sea con rangos muestrales, utilizando la esti–
mación s X— ⬇ A2R/3, o con desviaciones estándar muestrales, empleando la estimación s X— ⬇
A3s–/3. Si sólo hay una unidad por muestra (n ⫽ 1), entonces se necesita de una estimación externa. Aunque una estimación aproximada puede producir buenos resultados, el procedimiento CUSUM también puede ser útil cuando n ⫽ 1. Finalmente, deben especificarse dos
constantes, de manera usual denominadas k y h. Los valores grandes de estas constantes resultan en longitudes de corridas promedio más largas y, por tanto, en menos falsas alarmas,
pero también resultan en mayores tiempos de espera para descubrir que un proceso está fuera de control. A menudo se utilizan los valores k ⫽ 0.5 y h ⫽ 4 o 5, ya que resultan en una
ARL razonablemente larga cuando el proceso está en control, aún así siguen teniendo buen
poder de detectar un cambio de magnitud 1s X— o mayor en la media del proceso.
–
Para cada muestra, la cantidad X i ⫺ m es la desviación del valor objetivo. Se definen
dos sumas acumuladas, SH y SL. La suma SH siempre es positiva o cero e indica que la media del proceso se ha hecho mayor que el valor objetivo. La suma SL siempre es negativa o
cero e indica que la media del proceso se ha hecho menor al valor objetivo. Ambas sumas se
CAPÍTULO 10
Control estadístico de calidad
calculan de forma recursiva; es decir, se utiliza el valor actual en la secuencia para calcular el
siguiente valor. Los valores iniciales de SH y SL son
(10.2)
SH0 = 0
SL0 = 0
Para i ≥ 1, los valores son
(10.3)
SHi = máx[0, Xi − µ − kσX + SHi−1 ]
(10.4)
SLi = mín[0, Xi − μ + kσX + SLi−1 ]
—
Si SHi ⬎ hs X para alguna i, se concluye que la media del proceso es mayor que el valor objetivo. Si SLi ⬍ ⫺hs X— para alguna i, se concluye que la media del proceso es menor que el
valor objetivo.
La figura 10.16 presenta un diagrama CUSUM para los datos de la figura 10.9 (sección
10.2). Se utilizaron los valores k ⫽ 0.5 y h ⫽ 4. El valor 2.962 es la cantidad hs X— ⫽ 4(0.738).
El diagrama CUSUM muestra que en la décima muestra hay una situación fuera de control.
Para estos datos, el diagrama CUSUM funciona tan bien como las reglas de Western Electric,
las cuales determinaron que el proceso se encontraba fuera de control en la octava muestra
(véase la figura 10.9).
Diagrama CUSUM
8
6
4
Suma acumulada
752
UCL = 2.952
2
0
⫺2
LCL = ⫺2.952
⫺4
⫺6
⫺8
0
5
10
15
20
25
Número de muestras
30
FIGURA 10.16 Diagrama CUSUM para los datos de la figura 10.9.
Resumen
En un diagrama CUSUM se grafican dos sumas acumuladas, SH y SL.
Los valores iniciales son SH0 ⫽ SL0 ⫽ 0. Para i ≥ 1,
SHi = máx[0, X i − μ − kσX + SHi−1 ]
SLi = mín[0, X i − μ + kσX + SLi−1 ]
Deben especificarse las constantes k y h. Con frecuencia se obtienen buenos resultados
con los valores k ⫽ 0.5 y h ⫽ 4 o 5.
Si para cualquier i, SHi ⬎ hs X— o SLi ⬍ ⫺hs X—, se dice que el proceso está fuera de
control.
10.4
El diagrama CUSUM
753
Existen algunos otros métodos para construir diagramas CUSUM, los cuales son equivalentes, o casi equivalentes, al método presentado aquí. Alguna gente define que las desvia–
ciones son los puntajes z zi ⫽ (X i ⫺ m)/s X—, y después se utiliza zi en lugar de Xi ⫺ µ, y k en
lugar de ks X— en las fórmulas de SH y SL. Con esta definición, los límites de control se grafican en ⫾h en vez de en ⫾hs X—.
También existen otros métodos para dibujar el diagrama CUSUM. La alternativa más
común es el enfoque “máscara V”. Para mayor información, puede consultarse un libro sobre
control estadístico de calidad, como Montgomery (2000).
Ejercicios para la sección 10.4
1. Considérese el ejercicio 3 de la sección 10.2.
a) Elimine todas las muestras que sean necesarias para que
la variación del proceso esté bajo control. (Usted ya realizó esto último si resolvió el ejercicio 3 en la sección
10.2.)
–
–
b) Utilice R para estimar s X— (s X— es la diferencia entre X y
–
el límite de control 1s en un diagrama X ).
–
c) Construya un diagrama CUSUM utilizando X para la
media objetivo, m, y la estimación de s X— encontrada en
el inciso b) para la desviación estándar. Use los valores
k ⫽ 0.5 y h ⫽ 4.
d) ¿La media del proceso está en control? Si no es así,
¿cuándo se detecta por primera que no lo está?
–
e) Construya un diagrama X y emplee las reglas de Western Electric para determinar si la media del proceso está en control. (Usted ya lo hizo en el ejercicio 3 de la
sección 10.2.) ¿Las reglas de Western Electric dan los
mismos resultados que el diagrama CUSUM? Si no, ¿en
qué difieren?
2. Considere el ejercicio 8 de la sección 10.2.
a) Elimine todas las muestras que sean necesarias para que
la variación del proceso esté bajo control. (Usted ya realizó esto último si resolvió el ejercicio 8 en la sección
10.2.)
–
–
b) Utilice R para estimar s X— (s X— es la diferencia entre X y
–
el límite de control 1s en un diagrama X ).
–
c) Construya un diagrama CUSUM utilizando X para la
media objetivo, m, y la estimación de s X— encontrada en
el inciso b) para la desviación estándar. Use los valores
k ⫽ 0.5 y h ⫽ 4.
d) ¿La media del proceso está en control? Si no es así,
¿cuándo se detecta por primera que no lo está?
–
e) Construya un diagrama X y emplee las reglas de Western Electric para determinar si la media del proceso está en control. (Usted ya hizo esto si resolvió el ejercicio
8 de la sección 10.2.) ¿Las reglas de Western Electric
dan los mismos resultados que el diagrama CUSUM? Si
no es así, ¿en qué difieren?
3. Considere el ejercicio 10 de la sección 10.2.
a) Elimine todas las muestras que sean necesarias para que
la variación del proceso esté bajo control. (Usted ya realizó esto si resolvió el ejercicio 8 en la sección 10.2.)
–
–
b) Utilice R para estimar s X— (s X— es la diferencia entre X y
–
el límite de control 1s en un diagrama X ).
–
c) Construya un diagrama CUSUM utilizando X para la
media objetivo, m, y la estimación de s X— encontrada en
el inciso b) para la desviación estándar. Use los valores
k ⫽ 0.5 y h ⫽ 4.
d) ¿La media del proceso está en control? Si no es así,
¿cuándo se detecta por primera que no lo está?
–
e) Construya un diagrama X y emplee las reglas de Western Electric para determinar si la media del proceso está en control. (Usted ya hizo esto si resolvió el ejercicio
10 de la sección 10.2.) ¿Las reglas de Western Electric
producen los mismos resultados que el diagrama CUSUM? Si no es así, ¿en qué difieren?
4. Considere el ejercicio 3 de la sección 10.2.
a) Elimine todas las muestras que sean necesarias para que
la variación del proceso esté bajo control. (Usted ya realizó esto si resolvió el ejercicio 12 en la sección 10.2.)
–
–
b) Utilice R para estimar s X— (s X— es la diferencia entre X y
–
el límite de control 1s en un diagrama X ).
–
c) Construya un diagrama CUSUM utilizando X para la
media objetivo, m, y la estimación de s X— encontrada en
754
CAPÍTULO 10
Control estadístico de calidad
el inciso b) para la desviación estándar. Use los valores
k ⫽ 0.5 y h ⫽ 4.
Resultados anteriores sugieren que un valor de s ⫽ 15 es
razonable para este proceso.
d) ¿La media del proceso está en control? Si no es así,
¿cuándo se detecta por primera que no lo está?
–
e) Construya un diagrama X y emplee las reglas de Western Electric para determinar si la media del proceso está en control. (Usted ya hizo esto si resolvió el ejercicio
12 de la sección 10.2.) ¿Las reglas de Western Electric
dan los mismos resultados que el diagrama CUSUM? Si
no es así, ¿en qué difieren?
a) Construya un diagrama CUSUM utilizando el valor de
1500 para la media objetivo m, y los valores k ⫽ 0.5 y
h ⫽ 4.
5. Se supone que los bloques de concreto utilizados en cierta
aplicación tienen una fuerza de compresión promedio de
1 500 MPa. Se usan muestras de tamaño 1 para el control
de calidad. Las fuerzas de compresión de las últimas 40
muestras están dadas en la siguiente tabla.
Muestras
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Fuerza
Muestras
1487
1463
1499
1502
1473
1520
1520
1495
1503
1499
1497
1516
1489
1545
1498
1503
1522
1502
1499
1484
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
Fuerza
1507
1474
1515
1533
1487
1518
1526
1469
1472
1512
1483
1505
1507
1505
1517
1504
1515
1467
1491
1488
b) ¿La media del proceso está en control? Si no es así,
¿cuándo se detecta por primera vez que no lo está?
6. Un aprendiz de control de calidad está construyendo un diagrama CUSUM. Los valores calculados para SL y SH se
presentan en la siguiente tabla. Tres de los valores no se calcularon correctamente. ¿Cuáles son éstos?
Muestra
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
SL
0
0
0
−1.3280
−1.4364
−2.0464
−1.6370
−0.8234
−0.4528
0
0.2371
0.7104
0
0
0
0
0
0
−0.2036
0
SH
0
0
0
0
0
0
0
0.2767
0.1106
0.7836
0.0097
0
0.2775
0.5842
0.3750
0.4658
0.1866
0.3277
0
−0.7345
10.5
10.5
Capacidad del proceso
755
Capacidad del proceso
Una vez que un proceso se encuentra en un estado de control estadístico es importante evaluar su habilidad para producir elementos que se apeguen a las especificaciones del diseño.
Se toman en cuenta los datos de variables y se supone que la característica relevante de calidad sigue una distribución normal.
El primer paso al evaluar la capacidad del proceso es estimar la media y su desviación
estándar. Estas estimaciones se denotan mediante m̂ y ŝ, respectivamente. De manera usual,
los datos utilizados para calcular m̂ y ŝ se extraen de los diagramas de control justo cuando el
–
proceso está en un estado de control. La media del proceso se estima con m̂ ⫽ X . La desvia–
ción estándar del proceso se puede estimar mediante el rango muestral promedio R o la desviación estándar muestral promedio s–. Específicamente, se ha demostrado que ŝ puede
–
calcularse al dividir R entre una constante llamada d2, o al dividir s– entre una constante llamada c4. Los valores de las constantes d2 y c4 dependen del tamaño de la muestra. Los valores están tabulados en la tabla A.9 (en el Apéndice A).
Resumen
Si una característica de calidad de un proceso que se encuentra en un estado de control
sigue una distribución normal, entonces la media m̂ y la desviación estándar del proceso ŝ pueden estimarse a partir de los datos del diagrama de control, de la siguiente
manera:
=X
µ
σ =
R
d2
o
σ =
s
c4
Los valores de las constantes d2 y c4 dependen del tamaño de la muestra. Los valores
están tabulados en la tabla A.9.
Observe que la desviación estándar del proceso s no es la misma cantidad que se utili–
zó para calcular los límites de control 3s en el diagrama X . Los límites de control son m ⫾
3s X—, donde s X— es la desviación estándar de la media muestral. La desviación estándar del proceso s es la desviación de la característica de calidad de las unidades individuales. Éstas se
–
relacionan entre sí por medio de s X— ⫽ s/冑n, donde n es el tamaño de la muestra.
Para que pueda utilizarse, una característica de calidad debe encontrarse entre un límite de especificación menor (LSL, por sus siglas en inglés) y un límite de especificación superior (USL, por sus siglas en inglés). En algunas ocasiones sólo hay un límite; esta situación
se analizará al final de esta sección. Los límites de especificación los determinan los requerimientos del proceso. En los diagramas de control no hay límites de control. Se supondrá que
la media del proceso está entre LSL y USL.
Se analizarán dos índices de la capacidad del proceso, Cpk y Cp. El índice Cpk describe
la capacidad del proceso tal como ésta es, mientras que Cp describe la capacidad potencial del
proceso. Observe que el índice de capacidad del proceso Cp no tiene relación alguna con la
cantidad denominada Cp de Mallows que se utiliza para la selección de modelos lineales (véase el capítulo 8). Es una coincidencia que las dos cantidades tengan el mismo nombre.
756
CAPÍTULO 10
Control estadístico de calidad
Se define al índice Cpk como la distancia desde m̂ hasta el límite de especificación más
cercano, dividida entre 3ŝ. La figura 10.17 presenta una ilustración en donde m̂ se acerca más
al límite de especificación superior.
LSL
^
m
USL
FIGURA 10.17 La curva normal representa la población de unidades producidas por un
proceso. La media del proceso se acerca más al límite de especificación superior (USL) que
al límite de especificación inferior (LSL). Por tanto, el índice Cpk es igual a (USL ⫺ m̂)/3ŝ.
Definición
El índice Cpk es igual a
cualquiera que sea menor.
− LSL
μ
3
σ
o
USL − μ
3
σ
Convencionalmente, el valor mínimo aceptable para Cpk es 1. Es decir, se considera que
un proceso es mínimamente capaz si la media del proceso se encuentra a tres desviaciones estándar del límite de especificación más cercano. En general, se considera que un valor Cpk de
1.33, el cual indica que la media del proceso está a cuatro desviaciones estándar del límite de
especificación más cercano, es bueno.
Ejemplo
10.11
Las especificaciones de diseño de una barra de un pistón utilizada en una transmisión automática requieren que la longitud de la barra esté entre 71.4 y 72.8 mm. El proceso se vigila
–
con un diagrama X y un diagrama S, que utilizan muestras
de–tamaño n ⫽ 5. Éstas demues–
tran que el proceso está en control. Los valores de X y s– son X ⫽ 71.8 mm y s– ⫽ 0.20 mm.
Calcule el valor de Cpk. ¿La capacidad del proceso es aceptable?
Solución
–
Se estima que m̂ ⫽ X ⫽ 71.8. Para calcular ŝ, se tiene, a partir de la tabla A.9, que c4 ⫽ 0.9400
cuando el tamaño de la muestra es 5. Por consiguiente, ŝ ⫽ s–/c4 ⫽ 0.20/0.9400 ⫽ 0.2128. Los
límites de especificación son LSL ⫽ 71.4 mm y USL ⫽ 72.8 mm. El valor m̂ es más cercano
al LSL que al USL. En consecuencia,
− LSL
71.8 − 71.4
µ
=
3
σ
(3)(0.2128)
= 0.6266
Cpk =
Dado que Cpk ⬍ 1, la capacidad del proceso no es aceptable.
10.5
Ejemplo
10.12
757
Capacidad del proceso
Con referencia al ejemplo 10.11, suponga que se puede ajustar la media del proceso a cualquier valor deseado. ¿Qué valor debe establecerse para maximizar el valor Cpk? ¿Cuál será el
valor de Cpk?
Solución
Los límites de especificación son LSL ⫽ 71.4 y USL ⫽ 72.8. El valor de Cpk se maximizará
si se ajusta a la media del proceso en el punto medio entre los límites de especificación; esto
es, si µ ⫽ 72.1. La desviación estándar del proceso se estima con ŝ ⫽ 0.2128. Por tanto, el
valor máximo de Cpk es (72.1 – 71.4)/(3)(0.2128) ⫽ 1.0965. La capacidad del proceso sería
aceptable.
A la capacidad que puede alcanzarse potencialmente al cambiar la media del proceso al
punto medio entre los límites de especificación superior e inferior se le llama índice de capacidad del proceso, que se denota por Cp. Si la media del proceso se encuentra en el punto
medio entre LSL y USL, entonces la distancia desde de la media hasta cualquier límite de especificación es igual a la mitad de la distancia entre los límites de especificación, esto es m –
LSL ⫽ USL – m ⫽ (USL – LSL)/2 (véase la figura 10.18). De ahí que
Cp =
USL − LSL
6
σ
(10.5)
El índice de capacidad del proceso Cp mide la capacidad potencial del proceso; es decir, la capacidad máxima que puede alcanzar el proceso sin reducir la desviación estándar de éste.
LSL
m
USL
FIGURA 10.18 Un proceso alcanza su capacidad máxima cuando la media del proceso
se encuentra en el punto medio entre los límites de especificación. En este caso m – LSL
⫽ USL – m ⫽ (USL – LSL)/2.
Ejemplo
10.13
Cierto circuito eléctrico requiere que el voltaje de salida esté entre 48 y 52 V. El proceso está en control con ŝ ⫽ 0.482 V. Calcule el índice de capacidad del proceso Cp.
758
CAPÍTULO 10
Control estadístico de calidad
Solución
52 − 48
USL − LSL
=
6
σ
(6)(0.482)
= 1.38
Cp =
La capacidad del proceso es potencialmente buena.
Estimación de la proporción de unidades que no se ajustan
a las especificaciones a partir de la capacidad del proceso
Mucha gente utiliza el valor de Cp para tratar de estimar la proporción de unidades que no siguen las especificaciones. Por ejemplo, si Cp ⫽ 1, entonces los límites de especificación son
iguales a m̂ ⫺ 3ŝ y m̂ ⫹ 3ŝ, respectivamente. Por tanto, una unidad no seguirá las especificaciones sólo si se encuentra a más de tres desviaciones estándar de la media del proceso. Ahora,
para una población normal la proporción de unidades que se encuentran a más de tres desviaciones estándar de la media es igual a 0.0027. Por consiguiente, con frecuencia se afirma que
un proceso con Cp ⫽ 1 producirá 27 partes que no seguirán las especificaciones de 10 000.
El problema con esto es que el supuesto de normalidad sólo es aproximado para los procesos reales. La aproximación puede ser muy buena cerca de la mitad de la curva, pero con
frecuencia no es buena en las colas. Por tanto, la proporción verdadera de las partes que no
siguen las especificaciones puede ser muy diferente de la predicha a partir de la curva normal,
especialmente cuando la proporción es muy pequeña. En general, las estimaciones de las probabilidades pequeñas que están basadas en una aproximación normal son en el mejor de los
casos extremadamente burdas.
Calidad six-sigma
La frase “calidad six-sigma” se ha convertido en un término muy común en los estudios de
calidad de control de los últimos años. Se dice que un proceso tiene una calidad six-sigma si
el índice de la capacidad del proceso Cp tiene un valor mayor o igual a 2.0. De forma equivalente, un proceso tiene una calidad six-sigma si la diferencia USL – LSL es de al menos 12s.
Cuando un proceso tiene una calidad six-sigma, entonces la media del proceso se ajusta óptimamente y se encuentra a seis desviaciones estándar de cada límite de especificación. En este caso, la proporción de unidades que no siguen las especificaciones es virtualmente igual a
cero.
Una característica importante de un proceso six-sigma es que puede resistir cambios
moderados en la media del proceso sin que haya un deterioro importante en la capacidad. Por
ejemplo, aunque la media del proceso cambiara en 3s en una dirección u otra, aún se encontraría a 3s del límite de especificación más cercano, por lo que el índice de capacidad seguiría siendo aceptable.
Ejemplo
10.14
Considere el ejemplo 10.13, ¿ a qué valor debe reducirse la desviación estándar del proceso
para que el proceso alcance una calidad six-sigma?
10.5
Capacidad del proceso
759
Solución
Para alcanzar una calidad six-sigma, el valor de Cp debe ser al menos de 2.0. El valor de s en
el que esto último ocurre se encuentra al establecer que Cp ⫽ 2.0 y despejando s. Se obtiene
2.0 =
52 − 48
6σ
a partir del cual s ⫽ 0.33.
Tolerancias unilaterales
Algunas características tienen sólo un límite de especificación. Por ejemplo, los esfuerzos tienen usualmente un límite de especificación inferior pero no un límite superior, ya que la mayoría de las aplicaciones de una parte no puede ser demasiado fuerte. El equivalente de Cpk
cuando sólo hay un límite inferior es el índice de capacidad inferior Cpl; cuando sólo hay
un límite superior se refiere al índice de capacidad superior Cpu. Cada una de estas cantidades
es la diferencia entre la media del proceso m̂ y el límite de especificación, dividida entre 3ŝ.
Resumen
Si un proceso sólo tiene un límite de especificación inferior (LSL), entonces el índice
de capacidad inferior es
Cpl =
− LSL
μ
3
σ
Si un proceso sólo tiene un límite de especificación superior (USL), entonces el índice
de capacidad superior es
Cpu =
USL − μ
3
σ
No hay ningún equivalente de Cp para los procesos que tienen sólo un límite de especificación.
Ejercicios para la sección 10.5
1. Las especificaciones de diseño para la válvula de entrada de
un motor de combustión interna requieren que la apertura
de la válvula mida entre 0.18 y 0.22 mm. Con base en
–
muestras de tamaño 4, los datos de un diagrama X , que demuestran
que el proceso está en control, producen valores
–
de X ⫽ 0.205 mm y s– ⫽ 0.002 mm.
a) Calcule el valor de Cpk para este proceso.
b) ¿La capacidad del proceso es aceptable? Explique.
2. Las especificaciones para el volumen de llenado de latas de
bebidas se encuentran entre 11.95 y 12.10 onzas. Con base
–
en muestras de tamaño 5, los datos de un diagrama X , que
demuestran
que el proceso está en control, producen valo–
–
res de X ⫽ 12.01 oz y R ⫽ 0.124 oz.
a) Calcule el valor de Cpk para este proceso.
b) ¿La capacidad del proceso es aceptable? Explique.
760
CAPÍTULO 10
Control estadístico de calidad
3. Considérese el ejercicio 1.
a) ¿A qué valor debe establecerse la media del proceso para que la capacidad del proceso sea máxima?
b) ¿Cuál sería entonces la capacidad del proceso?
proceso para que la capacidad del proceso tenga una calidad six-sigma?
5. Un proceso tiene un índice de capacidad del proceso de Cp
⫽ 1.2.
a) ¿A qué valor debe establecerse la media del proceso para que la capacidad del proceso sea máxima?
a) Suponga que la media del proceso está en su valor óptimo. Exprese los límites de especificación superior e inferior en términos de la media y la desviación estándar
del proceso.
b) ¿Es posible convertir en aceptable la capacidad del proceso simplemente gastando la media del mismo? Explique.
b) Utilizando la curva normal, estime la proporción de unidades que no seguirán la especificación.
c) Cuando la media del proceso se encuentra en su valor óptimo, ¿qué valor debe tener la desviación estándar del
proceso para que la capacidad del proceso sea aceptable?
c) ¿Existe o no la posibilidad de que la verdadera proporción de unidades que no siguen la especificación sea
muy diferente a la estimación del inciso b)? Explique.
4. Considérese el ejercicio 2.
d) Cuando la media del proceso se encuentra en su valor
óptimo, ¿qué valor debe tener la desviación estándar del
Ejercicios adicionales para el capítulo 10
1. Se da seguimiento a un proceso para encontrar el número
de unidades defectuosas tomando diariamente una muestra de
250 unidades y calculando la proporción que está defectuosa. Sea pi la proporción de unidades defectuosas en la i-ésima muestra. Para
últimas 50 muestras, la suma de las
las
50
proporciones es i=1 pi = 2.98. Calcule la recta central y
los límites de control 3s superior e inferior para un diagrama p.
–
2. Alguien construye un diagrama X en que los límites de control se encuentran en ⫾2.5s X— en vez de ⫾3s X—.
a) Si el proceso está en control, ¿cuál es la ARL de este
diagrama?
b) Si la media del proceso cambia a 1s X—, ¿cuál es la ARL
de este diagrama?
c) En unidades de s X— , ¿qué tan grande puede ser un cambio positivo para que sea detectado con una ARL de 10?
3. Se toman periódicamente muestras de tres resistores y se
miden sus resistencias en ohms. La siguiente tabla presenta
las medias, los rangos y las desviaciones estándar de 30
muestras consecutivas.
Muestra
X
R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
5.114
5.144
5.220
5.196
5.176
5.222
5.209
5.212
5.238
5.152
5.163
5.221
5.144
5.098
5.070
5.029
5.045
5.008
5.029
5.038
4.962
5.033
4.993
4.961
4.976
5.005
5.022
5.077
5.033
5.068
0.146
0.158
0.057
0.158
0.172
0.030
0.118
0.099
0.157
0.104
0.051
0.105
0.132
0.123
0.083
0.073
0.161
0.138
0.082
0.109
0.066
0.078
0.085
0.126
0.094
0.135
0.120
0.140
0.049
0.146
s
0.077
0.085
0.031
0.081
0.099
0.017
0.059
0.053
0.085
0.054
0.026
0.055
0.071
0.062
0.042
0.038
0.087
0.071
0.042
0.055
0.034
0.041
0.044
0.066
0.047
0.068
0.062
0.074
0.026
0.076
Ejercicios adicionales para el capítulo 10
–
–
Las medias son X ⫽ 5.095, R ⫽ 0.110 y s– ⫽ 0.058.
a) Calcule los límites 3s para el diagrama R. ¿La varianza
está fuera de control en algún punto? Si es así, elimine
las –
muestras que están fuera de control y vuelva a calcu–
lar X y R.
–
b) Calcule los límites 3s para el diagrama X . Con base en
los límites 3s, ¿la media del proceso está en control? Si
no es así, ¿en qué punto se detecta por primera vez que
está fuera de control?
c) Con base en las reglas de Western Electric, ¿la media del
proceso está en control? Si no es así, ¿en qué punto se
detecta por primera vez que no lo está?
4. Repita el ejercicio 3, utilizando el diagrama S en lugar del R.
5. Considérese el ejercicio 3.
a) Elimine todas las muestras que sean necesarias para que
la variación del proceso esté bajo control. (Usted ya hizo esto si resolvió el ejercicio 3.)
–
–
b) Utilice R para estimar s X— (s X— es la diferencia entre X y
–
el límite de control 1s en un diagrama X ).
–
c) Construya un diagrama CUSUM utilizando X para la
media objetivo m y la estimación de s X— encontrada en el
inciso b) para la desviación estándar. Utilice los valores
k ⫽ 0.5 y h ⫽ 0.4.
d) ¿La media del proceso está en control? Si no es así, ¿en
qué punto se detecta por primera vez que no lo está?
–
e) Construya un diagrama X y utilice las reglas de Western
Electric para determinar si la media del proceso está en
761
control. (Usted ya hizo esto si resolvió el ejercicio 3.)
¿Las reglas de Western Electric producen los mismos resultados que el diagrama CUSUM? Si no es así, ¿en qué
son diferentes?
6. Se da seguimiento a un proceso para determinar las grietas
tomando cada hora una muestra de tamaño 50 y contando el
número total de grietas en las unidades extraídas. El número total de grietas en las últimas 30 muestras fue de 658.
a) Calcule la recta central y los límites de control 3s superior e inferior.
b) La décima muestra tiene tres grietas. ¿El proceso estaba
fuera de control en dicho momento? Explique.
7. Para construir un diagrama p que vigile un proceso que produce chips computacionales, diariamente se toman muestras
de 500 chips y se cuenta el número de éstos defectuosos en
cada muestra. Los números de chips defectuosos para cada
uno de los últimos 25 días son los siguientes:
25 22 14 24 18 16 20 27 19 20 22 7 24 26
11 14 18 29 21 32 29 34 34 30 24
a) Calcule los límites 3s superior e inferior para un diagrama p.
b) ¿En qué muestra se detecta por primera vez que el proceso está fuera de control?
c) Suponga que se determina la causa especial que da como resultado la condición fuera de control. ¿Debería remediarse esta causa? Explique.
Apéndice
A
Tablas
Tabla A.1: Distribución binomial acumulativa
Tabla A.2: Distribución normal acumulativa
Tabla A.3: Puntos porcentuales superiores para la distribución t de Student
Tabla A.4: Puntos críticos para la prueba de rango con signo de Wilcoxon
Tabla A.5: Puntos críticos para la prueba de rango-suma de Wilcoxon
Tabla A.6: Puntos porcentuales superiores para la distribución X2
Tabla A.7: Puntos porcentuales superiores para la distribución F
Tabla A.8: Puntos porcentuales superiores para la distribución de rango
studentizado qv1, v2
Tabla A.9: Constantes de diagramas de control
763
764
APÉNDICE A
Tablas
TABLA A.1 Distribución binomial acumulativa
F.x/ = P.X ≤ x/ =
x
k=0
n!
k! .n − k/!
pk .1− p/.n−k/
p
n
x
0.05
0.10
0.20
0.25
0.30
0.40
0.50
0.60
0.70
0.75
0.80
0.90
0.95
2
0
1
2
0.902
0.997
1.000
0.810
0.990
1.000
0.640
0.960
1.000
0.562
0.938
1.000
0.490
0.910
1.000
0.360
0.840
1.000
0.250
0.750
1.000
0.160
0.640
1.000
0.090
0.510
1.000
0.062
0.438
1.000
0.040
0.360
1.000
0.010
0.190
1.000
0.003
0.098
1.000
3
0
1
2
3
0.857
0.993
1.000
1.000
0.729
0.972
0.999
1.000
0.512
0.896
0.992
1.000
0.422
0.844
0.984
1.000
0.343
0.784
0.973
1.000
0.216
0.648
0.936
1.000
0.125
0.500
0.875
1.000
0.064
0.352
0.784
1.000
0.027
0.216
0.657
1.000
0.016
0.156
0.578
1.000
0.008
0.104
0.488
1.000
0.001
0.028
0.271
1.000
0.000
0.007
0.143
1.000
4
0
1
2
3
4
0.815
0.986
1.000
1.000
1.000
0.656
0.948
0.996
1.000
1.000
0.410
0.819
0.973
0.998
1.000
0.316
0.738
0.949
0.996
1.000
0.240
0.652
0.916
0.992
1.000
0.130
0.475
0.821
0.974
1.000
0.062
0.313
0.688
0.938
1.000
0.026
0.179
0.525
0.870
1.000
0.008
0.084
0.348
0.760
1.000
0.004
0.051
0.262
0.684
1.000
0.002
0.027
0.181
0.590
1.000
0.000
0.004
0.052
0.344
1.000
0.000
0.000
0.014
0.185
1.000
5
0
1
2
3
4
0.774
0.977
0.999
1.000
1.000
0.590
0.919
0.991
1.000
1.000
0.328
0.737
0.942
0.993
1.000
0.237
0.633
0.896
0.984
0.999
0.168
0.528
0.837
0.969
0.998
0.078
0.337
0.683
0.913
0.990
0.031
0.187
0.500
0.812
0.969
0.010
0.087
0.317
0.663
0.922
0.002
0.031
0.163
0.472
0.832
0.001
0.016
0.104
0.367
0.763
0.000
0.007
0.058
0.263
0.672
0.000
0.000
0.009
0.081
0.410
0.000
0.000
0.001
0.023
0.226
5
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0
1
2
3
4
0.735
0.967
0.998
1.000
1.000
0.531
0.886
0.984
0.999
1.000
0.262
0.655
0.901
0.983
0.998
0.178
0.534
0.831
0.962
0.995
0.118
0.420
0.744
0.930
0.989
0.047
0.233
0.544
0.821
0.959
0.016
0.109
0.344
0.656
0.891
0.004
0.041
0.179
0.456
0.767
0.001
0.011
0.070
0.256
0.580
0.000
0.005
0.038
0.169
0.466
0.000
0.002
0.017
0.099
0.345
0.000
0.000
0.001
0.016
0.114
0.000
0.000
0.000
0.002
0.033
5
6
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.999
1.000
0.996
1.000
0.984
1.000
0.953
1.000
0.882
1.000
0.822
1.000
0.738
1.000
0.469
1.000
0.265
1.000
0
1
2
3
4
0.698
0.956
0.996
1.000
1.000
0.478
0.850
0.974
0.997
1.000
0.210
0.577
0.852
0.967
0.995
0.133
0.445
0.756
0.929
0.987
0.082
0.329
0.647
0.874
0.971
0.028
0.159
0.420
0.710
0.904
0.008
0.063
0.227
0.500
0.773
0.002
0.019
0.096
0.290
0.580
0.000
0.004
0.029
0.126
0.353
0.000
0.001
0.013
0.071
0.244
0.000
0.000
0.005
0.033
0.148
0.000
0.000
0.000
0.003
0.026
0.000
0.000
0.000
0.000
0.004
5
6
7
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.999
1.000
1.000
0.996
1.000
1.000
0.981
0.998
1.000
0.938
0.992
1.000
0.841
0.972
1.000
0.671
0.918
1.000
0.555
0.867
1.000
0.423
0.790
1.000
0.150
0.522
1.000
0.044
0.302
1.000
6
7
Continúa en la página 765
APÉNDICE A
Tablas
765
TABLA A.1 Distribución binomial acumulativa (continuación)
p
n
x
0.05
0.10
0.20
0.25
0.30
0.40
0.50
0.60
0.70
0.75
0.80
0.90
0.95
8
0
1
2
3
4
0.663
0.943
0.994
1.000
1.000
0.430
0.813
0.962
0.995
1.000
0.168
0.503
0.797
0.944
0.990
0.100
0.367
0.679
0.886
0.973
0.058
0.255
0.552
0.806
0.942
0.017
0.106
0.315
0.594
0.826
0.004
0.035
0.145
0.363
0.637
0.001
0.009
0.050
0.174
0.406
0.000
0.001
0.011
0.058
0.194
0.000
0.000
0.004
0.027
0.114
0.000
0.000
0.001
0.010
0.056
0.000
0.000
0.000
0.000
0.005
0.000
0.000
0.000
0.000
0.000
5
6
7
8
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.999
1.000
1.000
1.000
0.996
1.000
1.000
1.000
0.989
0.999
1.000
1.000
0.950
0.991
0.999
1.000
0.855
0.965
0.996
1.000
0.685
0.894
0.983
1.000
0.448
0.745
0.942
1.000
0.321
0.633
0.900
1.000
0.203
0.497
0.832
1.000
0.038
0.187
0.570
1.000
0.006
0.057
0.337
1.000
0
1
2
3
4
0.630
0.929
0.992
0.999
1.000
0.387
0.775
0.947
0.992
0.999
0.134
0.436
0.738
0.914
0.980
0.075
0.300
0.601
0.834
0.951
0.040
0.196
0.463
0.730
0.901
0.010
0.071
0.232
0.483
0.733
0.002
0.020
0.090
0.254
0.500
0.000
0.004
0.025
0.099
0.267
0.000
0.000
0.004
0.025
0.099
0.000
0.000
0.001
0.010
0.049
0.000
0.000
0.000
0.003
0.020
0.000
0.000
0.000
0.000
0.001
0.000
0.000
0.000
0.000
0.000
5
6
7
8
9
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.997
1.000
1.000
1.000
1.000
0.990
0.999
1.000
1.000
1.000
0.975
0.996
1.000
1.000
1.000
0.901
0.975
0.996
1.000
1.000
0.746
0.910
0.980
0.998
1.000
0.517
0.768
0.929
0.990
1.000
0.270
0.537
0.804
0.960
1.000
0.166
0.399
0.700
0.925
1.000
0.086
0.262
0.564
0.866
1.000
0.008
0.053
0.225
0.613
1.000
0.001
0.008
0.071
0.370
1.000
0
1
2
3
4
0.599
0.914
0.988
0.999
1.000
0.349
0.736
0.930
0.987
0.998
0.107
0.376
0.678
0.879
0.967
0.056
0.244
0.526
0.776
0.922
0.028
0.149
0.383
0.650
0.850
0.006
0.046
0.167
0.382
0.633
0.001
0.011
0.055
0.172
0.377
0.000
0.002
0.012
0.055
0.166
0.000
0.000
0.002
0.011
0.047
0.000
0.000
0.000
0.004
0.020
0.000
0.000
0.000
0.001
0.006
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
5
6
7
8
9
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.994
0.999
1.000
1.000
1.000
0.980
0.996
1.000
1.000
1.000
0.953
0.989
0.998
1.000
1.000
0.834
0.945
0.988
0.998
1.000
0.623
0.828
0.945
0.989
0.999
0.367
0.618
0.833
0.954
0.994
0.150
0.350
0.617
0.851
0.972
0.078
0.224
0.474
0.756
0.944
0.033
0.121
0.322
0.624
0.893
0.002
0.013
0.070
0.264
0.651
0.000
0.001
0.012
0.086
0.401
10
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0
1
2
3
4
0.569
0.898
0.985
0.998
1.000
0.314
0.697
0.910
0.981
0.997
0.086
0.322
0.617
0.839
0.950
0.042
0.197
0.455
0.713
0.885
0.020
0.113
0.313
0.570
0.790
0.004
0.030
0.119
0.296
0.533
0.000
0.006
0.033
0.113
0.274
0.000
0.001
0.006
0.029
0.099
0.000
0.000
0.001
0.004
0.022
0.000
0.000
0.000
0.001
0.008
0.000
0.000
0.000
0.000
0.002
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
5
6
7
8
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.988
0.998
1.000
1.000
0.966
0.992
0.999
1.000
0.922
0.978
0.996
0.999
0.753
0.901
0.971
0.994
0.500
0.726
0.887
0.967
0.247
0.467
0.704
0.881
0.078
0.210
0.430
0.687
0.034
0.115
0.287
0.545
0.012
0.050
0.161
0.383
0.000
0.003
0.019
0.090
0.000
0.000
0.002
0.015
9
10
11
Continúa en la página 766
766
APÉNDICE A
Tablas
TABLA A.1 Distribución binomial acumulativa (continuación)
p
n
x
0.05
0.10
0.20
0.25
0.30
0.40
0.50
0.60
0.70
0.75
0.80
0.90
0.95
11
9
10
11
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.999
1.000
1.000
0.994
1.000
1.000
0.970
0.996
1.000
0.887
0.980
1.000
0.803
0.958
1.000
0.678
0.914
1.000
0.303
0.686
1.000
0.102
0.431
1.000
12
0
1
2
3
4
0.540
0.882
0.980
0.998
1.000
0.282
0.659
0.889
0.974
0.996
0.069
0.275
0.558
0.795
0.927
0.032
0.158
0.391
0.649
0.842
0.014
0.085
0.253
0.493
0.724
0.002
0.020
0.083
0.225
0.438
0.000
0.003
0.019
0.073
0.194
0.000
0.000
0.003
0.015
0.057
0.000
0.000
0.000
0.002
0.009
0.000
0.000
0.000
0.000
0.003
0.000
0.000
0.000
0.000
0.001
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
5
6
7
8
9
1.000
1.000
1.000
1.000
1.000
0.999
1.000
1.000
1.000
1.000
0.981
0.996
0.999
1.000
1.000
0.946
0.986
0.997
1.000
1.000
0.882
0.961
0.991
0.998
1.000
0.665
0.842
0.943
0.985
0.997
0.387
0.613
0.806
0.927
0.981
0.158
0.335
0.562
0.775
0.917
0.039
0.118
0.276
0.507
0.747
0.014
0.054
0.158
0.351
0.609
0.004
0.019
0.073
0.205
0.442
0.000
0.001
0.004
0.026
0.111
0.000
0.000
0.000
0.002
0.020
10
11
12
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.997
1.000
1.000
0.980
0.998
1.000
0.915
0.986
1.000
0.842
0.968
1.000
0.725
0.931
1.000
0.341
0.718
1.000
0.118
0.460
1.000
0
1
2
3
4
0.513
0.865
0.975
0.997
1.000
0.254
0.621
0.866
0.966
0.994
0.055
0.234
0.502
0.747
0.901
0.024
0.127
0.333
0.584
0.794
0.010
0.064
0.202
0.421
0.654
0.001
0.013
0.058
0.169
0.353
0.000
0.002
0.011
0.046
0.133
0.000
0.000
0.001
0.008
0.032
0.000
0.000
0.000
0.001
0.004
0.000
0.000
0.000
0.000
0.001
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
5
6
7
8
9
1.000
1.000
1.000
1.000
1.000
0.999
1.000
1.000
1.000
1.000
0.970
0.993
0.999
1.000
1.000
0.920
0.976
0.994
0.999
1.000
0.835
0.938
0.982
0.996
0.999
0.574
0.771
0.902
0.968
0.992
0.291
0.500
0.709
0.867
0.954
0.098
0.229
0.426
0.647
0.831
0.018
0.062
0.165
0.346
0.579
0.006
0.024
0.080
0.206
0.416
0.001
0.007
0.030
0.099
0.253
0.000
0.000
0.001
0.006
0.034
0.000
0.000
0.000
0.000
0.003
10
11
12
13
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.999
1.000
1.000
1.000
0.989
0.998
1.000
1.000
0.942
0.987
0.999
1.000
0.798
0.936
0.990
1.000
0.667
0.873
0.976
1.000
0.498
0.766
0.945
1.000
0.134
0.379
0.746
1.000
0.025
0.135
0.487
1.000
0
1
2
3
4
0.488
0.847
0.970
0.996
1.000
0.229
0.585
0.842
0.956
0.991
0.044
0.198
0.448
0.698
0.870
0.018
0.101
0.281
0.521
0.742
0.007
0.047
0.161
0.355
0.584
0.001
0.008
0.040
0.124
0.279
0.000
0.001
0.006
0.029
0.090
0.000
0.000
0.001
0.004
0.018
0.000
0.000
0.000
0.000
0.002
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
5
6
7
1.000
1.000
1.000
0.999
1.000
1.000
0.956
0.988
0.998
0.888
0.962
0.990
0.781
0.907
0.969
0.486
0.692
0.850
0.212
0.395
0.605
0.058
0.150
0.308
0.008
0.031
0.093
0.002
0.010
0.038
0.000
0.002
0.012
0.000
0.000
0.000
0.000
0.000
0.000
13
14
Continúa en la página 767
APÉNDICE A
Tablas
767
TABLA A.1 Distribución binomial acumulativa (continuación)
p
n
x
0.05
0.10
0.20
0.25
0.30
0.40
0.50
0.60
0.70
0.75
0.80
0.90
0.95
14
8
9
1.000
1.000
1.000
1.000
1.000
1.000
0.998
1.000
0.992
0.998
0.942
0.982
0.788
0.910
0.514
0.721
0.219
0.416
0.112
0.258
0.044
0.130
0.001
0.009
0.000
0.000
10
11
12
13
14
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.996
0.999
1.000
1.000
1.000
0.971
0.994
0.999
1.000
1.000
0.876
0.960
0.992
0.999
1.000
0.645
0.839
0.953
0.993
1.000
0.479
0.719
0.899
0.982
1.000
0.302
0.552
0.802
0.956
1.000
0.044
0.158
0.415
0.771
1.000
0.004
0.030
0.153
0.512
1.000
0
1
2
3
4
0.463
0.829
0.964
0.995
0.999
0.206
0.549
0.816
0.944
0.987
0.035
0.167
0.398
0.648
0.836
0.013
0.080
0.236
0.461
0.686
0.005
0.035
0.127
0.297
0.515
0.000
0.005
0.027
0.091
0.217
0.000
0.000
0.004
0.018
0.059
0.000
0.000
0.000
0.002
0.009
0.000
0.000
0.000
0.000
0.001
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
5
6
7
8
9
1.000
1.000
1.000
1.000
1.000
0.998
1.000
1.000
1.000
1.000
0.939
0.982
0.996
0.999
1.000
0.852
0.943
0.983
0.996
0.999
0.722
0.869
0.950
0.985
0.996
0.403
0.610
0.787
0.905
0.966
0.151
0.304
0.500
0.696
0.849
0.034
0.095
0.213
0.390
0.597
0.004
0.015
0.050
0.131
0.278
0.001
0.004
0.017
0.057
0.148
0.000
0.001
0.004
0.018
0.061
0.000
0.000
0.000
0.000
0.002
0.000
0.000
0.000
0.000
0.000
10
11
12
13
14
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.999
1.000
1.000
1.000
1.000
0.991
0.998
1.000
1.000
1.000
0.941
0.982
0.996
1.000
1.000
0.783
0.909
0.973
0.995
1.000
0.485
0.703
0.873
0.965
0.995
0.314
0.539
0.764
0.920
0.987
0.164
0.352
0.602
0.833
0.965
0.013
0.056
0.184
0.451
0.794
0.001
0.005
0.036
0.171
0.537
15
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0
1
2
3
4
0.440
0.811
0.957
0.993
0.999
0.185
0.515
0.789
0.932
0.983
0.028
0.141
0.352
0.598
0.798
0.010
0.063
0.197
0.405
0.630
0.003
0.026
0.099
0.246
0.450
0.000
0.003
0.018
0.065
0.167
0.000
0.000
0.002
0.011
0.038
0.000
0.000
0.000
0.001
0.005
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
5
6
7
8
9
1.000
1.000
1.000
1.000
1.000
0.997
0.999
1.000
1.000
1.000
0.918
0.973
0.993
0.999
1.000
0.810
0.920
0.973
0.993
0.998
0.660
0.825
0.926
0.974
0.993
0.329
0.527
0.716
0.858
0.942
0.105
0.227
0.402
0.598
0.773
0.019
0.058
0.142
0.284
0.473
0.002
0.007
0.026
0.074
0.175
0.000
0.002
0.007
0.027
0.080
0.000
0.000
0.001
0.007
0.027
0.000
0.000
0.000
0.000
0.001
0.000
0.000
0.000
0.000
0.000
10
11
12
13
14
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.998
1.000
1.000
1.000
1.000
0.981
0.995
0.999
1.000
1.000
0.895
0.962
0.989
0.998
1.000
0.671
0.833
0.935
0.982
0.997
0.340
0.550
0.754
0.901
0.974
0.190
0.370
0.595
0.803
0.937
0.082
0.202
0.402
0.648
0.859
0.003
0.017
0.068
0.211
0.485
0.000
0.001
0.007
0.043
0.189
15
16
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.997
1.000
0.990
1.000
0.972
1.000
0.815
1.000
0.560
1.000
15
16
Continúa en la página 768
768
APÉNDICE A
Tablas
TABLA A.1 Distribución binomial acumulativa (continuación)
p
n
x
0.05
0.10
0.20
0.25
0.30
0.40
0.50
0.60
0.70
0.75
0.80
0.90
0.95
17
0
1
2
3
4
0.418
0.792
0.950
0.991
0.999
0.167
0.482
0.762
0.917
0.978
0.023
0.118
0.310
0.549
0.758
0.008
0.050
0.164
0.353
0.574
0.002
0.019
0.077
0.202
0.389
0.000
0.002
0.012
0.046
0.126
0.000
0.000
0.001
0.006
0.025
0.000
0.000
0.000
0.000
0.003
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
5
6
7
8
9
1.000
1.000
1.000
1.000
1.000
0.995
0.999
1.000
1.000
1.000
0.894
0.962
0.989
0.997
1.000
0.765
0.893
0.960
0.988
0.997
0.597
0.775
0.895
0.960
0.987
0.264
0.448
0.641
0.801
0.908
0.072
0.166
0.315
0.500
0.685
0.011
0.035
0.092
0.199
0.359
0.001
0.003
0.013
0.040
0.105
0.000
0.001
0.003
0.012
0.040
0.000
0.000
0.000
0.003
0.011
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
10
11
12
13
14
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.999
1.000
1.000
1.000
1.000
0.997
0.999
1.000
1.000
1.000
0.965
0.989
0.997
1.000
1.000
0.834
0.928
0.975
0.994
0.999
0.552
0.736
0.874
0.954
0.988
0.225
0.403
0.611
0.798
0.923
0.107
0.235
0.426
0.647
0.836
0.038
0.106
0.242
0.451
0.690
0.001
0.005
0.022
0.083
0.238
0.000
0.000
0.001
0.009
0.050
15
16
17
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.998
1.000
1.000
0.981
0.998
1.000
0.950
0.992
1.000
0.882
0.977
1.000
0.518
0.833
1.000
0.208
0.582
1.000
0
1
2
3
4
0.397
0.774
0.942
0.989
0.998
0.150
0.450
0.734
0.902
0.972
0.018
0.099
0.271
0.501
0.716
0.006
0.039
0.135
0.306
0.519
0.002
0.014
0.060
0.165
0.333
0.000
0.001
0.008
0.033
0.094
0.000
0.000
0.001
0.004
0.015
0.000
0.000
0.000
0.000
0.001
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
5
6
7
8
9
1.000
1.000
1.000
1.000
1.000
0.994
0.999
1.000
1.000
1.000
0.867
0.949
0.984
0.996
0.999
0.717
0.861
0.943
0.981
0.995
0.534
0.722
0.859
0.940
0.979
0.209
0.374
0.563
0.737
0.865
0.048
0.119
0.240
0.407
0.593
0.006
0.020
0.058
0.135
0.263
0.000
0.001
0.006
0.021
0.060
0.000
0.000
0.001
0.005
0.019
0.000
0.000
0.000
0.001
0.004
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
10
11
12
13
14
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.999
1.000
1.000
1.000
1.000
0.994
0.999
1.000
1.000
1.000
0.942
0.980
0.994
0.999
1.000
0.760
0.881
0.952
0.985
0.996
0.437
0.626
0.791
0.906
0.967
0.141
0.278
0.466
0.667
0.835
0.057
0.139
0.283
0.481
0.694
0.016
0.051
0.133
0.284
0.499
0.000
0.001
0.006
0.028
0.098
0.000
0.000
0.000
0.002
0.011
15
16
17
18
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.999
1.000
1.000
1.000
0.992
0.999
1.000
1.000
0.940
0.986
0.998
1.000
0.865
0.961
0.994
1.000
0.729
0.901
0.982
1.000
0.266
0.550
0.850
1.000
0.058
0.226
0.603
1.000
0
1
0.377
0.755
0.135
0.420
0.014
0.083
0.004
0.031
0.001
0.010
0.000
0.001
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
18
19
Continúa en la página 769
APÉNDICE A
Tablas
769
TABLA A.1 Distribución binomial acumulativa (continuación)
p
n
x
0.05
0.10
0.20
0.25
0.30
0.40
0.50
0.60
0.70
0.75
0.80
0.90
0.95
19
2
3
4
0.933
0.987
0.998
0.705
0.885
0.965
0.237
0.455
0.673
0.111
0.263
0.465
0.046
0.133
0.282
0.005
0.023
0.070
0.000
0.002
0.010
0.000
0.000
0.001
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
5
6
7
8
9
1.000
1.000
1.000
1.000
1.000
0.991
0.998
1.000
1.000
1.000
0.837
0.932
0.977
0.993
0.998
0.668
0.825
0.923
0.971
0.991
0.474
0.666
0.818
0.916
0.967
0.163
0.308
0.488
0.667
0.814
0.032
0.084
0.180
0.324
0.500
0.003
0.012
0.035
0.088
0.186
0.000
0.001
0.003
0.011
0.033
0.000
0.000
0.000
0.002
0.009
0.000
0.000
0.000
0.000
0.002
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
10
11
12
13
14
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.998
1.000
1.000
1.000
1.000
0.989
0.997
0.999
1.000
1.000
0.912
0.965
0.988
0.997
0.999
0.676
0.820
0.916
0.968
0.990
0.333
0.512
0.692
0.837
0.930
0.084
0.182
0.334
0.526
0.718
0.029
0.077
0.175
0.332
0.535
0.007
0.023
0.068
0.163
0.327
0.000
0.000
0.002
0.009
0.035
0.000
0.000
0.000
0.000
0.002
15
16
17
18
19
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.998
1.000
1.000
1.000
1.000
0.977
0.995
0.999
1.000
1.000
0.867
0.954
0.990
0.999
1.000
0.737
0.889
0.969
0.996
1.000
0.545
0.763
0.917
0.986
1.000
0.115
0.295
0.580
0.865
1.000
0.013
0.067
0.245
0.623
1.000
0
1
2
3
4
0.358
0.736
0.925
0.984
0.997
0.122
0.392
0.677
0.867
0.957
0.012
0.069
0.206
0.411
0.630
0.003
0.024
0.091
0.225
0.415
0.001
0.008
0.035
0.107
0.238
0.000
0.001
0.004
0.016
0.051
0.000
0.000
0.000
0.001
0.006
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
5
6
7
8
9
1.000
1.000
1.000
1.000
1.000
0.989
0.998
1.000
1.000
1.000
0.804
0.913
0.968
0.990
0.997
0.617
0.786
0.898
0.959
0.986
0.416
0.608
0.772
0.887
0.952
0.126
0.250
0.416
0.596
0.755
0.021
0.058
0.132
0.252
0.412
0.002
0.006
0.021
0.057
0.128
0.000
0.000
0.001
0.005
0.017
0.000
0.000
0.000
0.001
0.004
0.000
0.000
0.000
0.000
0.001
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
10
11
12
13
14
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.999
1.000
1.000
1.000
1.000
0.996
0.999
1.000
1.000
1.000
0.983
0.995
0.999
1.000
1.000
0.872
0.943
0.979
0.994
0.998
0.588
0.748
0.868
0.942
0.979
0.245
0.404
0.584
0.750
0.874
0.048
0.113
0.228
0.392
0.584
0.014
0.041
0.102
0.214
0.383
0.003
0.010
0.032
0.087
0.196
0.000
0.000
0.000
0.002
0.011
0.000
0.000
0.000
0.000
0.000
15
16
17
18
19
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
0.994
0.999
1.000
1.000
1.000
0.949
0.984
0.996
0.999
1.000
0.762
0.893
0.965
0.992
0.999
0.585
0.775
0.909
0.976
0.997
0.370
0.589
0.794
0.931
0.988
0.043
0.133
0.323
0.608
0.878
0.003
0.016
0.075
0.264
0.642
20
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
20
770
APÉNDICE A
Tablas
TABLA A.2 Distribución normal acumulativa (tabla z)
z
0
z
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
–3.6
–3.5
–3.4
–3.3
–3.2
.0002
.0002
.0003
.0005
.0007
.0002
.0002
.0003
.0005
.0007
.0001
.0002
.0003
.0005
.0006
.0001
.0002
.0003
.0004
.0006
.0001
.0002
.0003
.0004
.0006
.0001
.0002
.0003
.0004
.0006
.0001
.0002
.0003
.0004
.0006
.0001
.0002
.0003
.0004
.0005
.0001
.0002
.0003
.0004
.0005
.0001
.0002
.0002
.0003
.0005
–3.1
–3.0
–2.9
–2.8
–2.7
.0010
.0013
.0019
.0026
.0035
.0009
.0013
.0018
.0025
.0034
.0009
.0013
.0018
.0024
.0033
.0009
.0012
.0017
.0023
.0032
.0008
.0012
.0016
.0023
.0031
.0008
.0011
.0016
.0022
.0030
.0008
.0011
.0015
.0021
.0029
.0008
.0011
.0015
.0021
.0028
.0007
.0010
.0014
.0020
.0027
.0007
.0010
.0014
.0019
.0026
–2.6
–2.5
–2.4
–2.3
–2.2
.0047
.0062
.0082
.0107
.0139
.0045
.0060
.0080
.0104
.0136
.0044
.0059
.0078
.0102
.0132
.0043
.0057
.0075
.0099
.0129
.0041
.0055
.0073
.0096
.0125
.0040
.0054
.0071
.0094
.0122
.0039
.0052
.0069
.0091
.0119
.0038
.0051
.0068
.0089
.0116
.0037
.0049
.0066
.0087
.0113
.0036
.0048
.0064
.0084
.0110
–2.1
–2.0
–1.9
–1.8
–1.7
.0179
.0228
.0287
.0359
.0446
.0174
.0222
.0281
.0351
.0436
.0170
.0217
.0274
.0344
.0427
.0166
.0212
.0268
.0336
.0418
.0162
.0207
.0262
.0329
.0409
.0158
.0202
.0256
.0322
.0401
.0154
.0197
.0250
.0314
.0392
.0150
.0192
.0244
.0307
.0384
.0146
.0188
.0239
.0301
.0375
.0143
.0183
.0233
.0294
.0367
–1.6
–1.5
–1.4
–1.3
–1.2
.0548
.0668
.0808
.0968
.1151
.0537
.0655
.0793
.0951
.1131
.0526
.0643
.0778
.0934
.1112
.0516
.0630
.0764
.0918
.1093
.0505
.0618
.0749
.0901
.1075
.0495
.0606
.0735
.0885
.1056
.0485
.0594
.0721
.0869
.1038
.0475
.0582
.0708
.0853
.1020
.0465
.0571
.0694
.0838
.1003
.0455
.0559
.0681
.0823
.0985
–1.1
–1.0
–0.9
–0.8
–0.7
.1357
.1587
.1841
.2119
.2420
.1335
.1562
.1814
.2090
.2389
.1314
.1539
.1788
.2061
.2358
.1292
.1515
.1762
.2033
.2327
.1271
.1492
.1736
.2005
.2296
.1251
.1469
.1711
.1977
.2266
.1230
.1446
.1685
.1949
.2236
.1210
.1423
.1660
.1922
.2206
.1190
.1401
.1635
.1894
.2177
.1170
.1379
.1611
.1867
.2148
–0.6
–0.5
–0.4
–0.3
–0.2
.2743
.3085
.3446
.3821
.4207
.2709
.3050
.3409
.3783
.4168
.2676
.3015
.3372
.3745
.4129
.2643
.2981
.3336
.3707
.4090
.2611
.2946
.3300
.3669
.4052
.2578
.2912
.3264
.3632
.4013
.2546
.2877
.3228
.3594
.3974
.2514
.2843
.3192
.3557
.3936
.2483
.2810
.3156
.3520
.3897
.2451
.2776
.3121
.3483
.3859
–0.1
–0.0
.4602
.5000
.4562
.4960
.4522
.4920
.4483
.4880
.4443
.4840
.4404
.4801
.4364
.4761
.4325
.4721
.4286
.4681
.4247
.4641
Continúa en la página 771
APÉNDICE A
Tablas
771
TABLA A.2 Distribución normal acumulativa (continuación)
0
z
z
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.0
0.1
0.2
0.3
0.4
.5000
.5398
.5793
.6179
.6554
.5040
.5438
.5832
.6217
.6591
.5080
.5478
.5871
.6255
.6628
.5120
.5517
.5910
.6293
.6664
.5160
.5557
.5948
.6331
.6700
.5199
.5596
.5987
.6368
.6736
.5239
.5636
.6026
.6406
.6772
.5279
.5675
.6064
.6443
.6808
.5319
.5714
.6103
.6480
.6844
.5359
.5753
.6141
.6517
.6879
0.5
0.6
0.7
0.8
0.9
.6915
.7257
.7580
.7881
.8159
.6950
.7291
.7611
.7910
.8186
.6985
.7324
.7642
.7939
.8212
.7019
.7357
.7673
.7967
.8238
.7054
.7389
.7704
.7995
.8264
.7088
.7422
.7734
.8023
.8289
.7123
.7454
.7764
.8051
.8315
.7157
.7486
.7794
.8078
.8340
.7190
.7517
.7823
.8106
.8365
.7224
.7549
.7852
.8133
.8389
1.0
1.1
1.2
1.3
1.4
.8413
.8643
.8849
.9032
.9192
.8438
.8665
.8869
.9049
.9207
.8461
.8686
.8888
.9066
.9222
.8485
.8708
.8907
.9082
.9236
.8508
.8729
.8925
.9099
.9251
.8531
.8749
.8944
.9115
.9265
.8554
.8770
.8962
.9131
.9279
.8577
.8790
.8980
.9147
.9292
.8599
.8810
.8997
.9162
.9306
.8621
.8830
.9015
.9177
.9319
1.5
1.6
1.7
1.8
1.9
.9332
.9452
.9554
.9641
.9713
.9345
.9463
.9564
.9649
.9719
.9357
.9474
.9573
.9656
.9726
.9370
.9484
.9582
.9664
.9732
.9382
.9495
.9591
.9671
.9738
.9394
.9505
.9599
.9678
.9744
.9406
.9515
.9608
.9686
.9750
.9418
.9525
.9616
.9693
.9756
.9429
.9535
.9625
.9699
.9761
.9441
.9545
.9633
.9706
.9767
2.0
2.1
2.2
2.3
2.4
.9772
.9821
.9861
.9893
.9918
.9778
.9826
.9864
.9896
.9920
.9783
.9830
.9868
.9898
.9922
.9788
.9834
.9871
.9901
.9925
.9793
.9838
.9875
.9904
.9927
.9798
.9842
.9878
.9906
.9929
.9803
.9846
.9881
.9909
.9931
.9808
.9850
.9884
.9911
.9932
.9812
.9854
.9887
.9913
.9934
.9817
.9857
.9890
.9916
.9936
2.5
2.6
2.7
2.8
2.9
.9938
.9953
.9965
.9974
.9981
.9940
.9955
.9966
.9975
.9982
.9941
.9956
.9967
.9976
.9982
.9943
.9957
.9968
.9977
.9983
.9945
.9959
.9969
.9977
.9984
.9946
.9960
.9970
.9978
.9984
.9948
.9961
.9971
.9979
.9985
.9949
.9962
.9972
.9979
.9985
.9951
.9963
.9973
.9980
.9986
.9952
.9964
.9974
.9981
.9986
3.0
3.1
3.2
3.3
3.4
.9987
.9990
.9993
.9995
.9997
.9987
.9991
.9993
.9995
.9997
.9987
.9991
.9994
.9995
.9997
.9988
.9991
.9994
.9996
.9997
.9988
.9992
.9994
.9996
.9997
.9989
.9992
.9994
.9996
.9997
.9989
.9992
.9994
.9996
.9997
.9989
.9992
.9995
.9996
.9997
.9990
.9993
.9995
.9996
.9997
.9990
.9993
.9995
.9997
.9998
3.5
3.6
.9998
.9998
.9998
.9998
.9998
.9999
.9998
.9999
.9998
.9999
.9998
.9999
.9998
.9999
.9998
.9999
.9998
.9999
.9998
.9999
772
APÉNDICE A
Tablas
TABLA A.3 Puntos porcentuales superiores para la distribución t de Student
a
0
t
A
v
0.40
0.25
0.10
0.05
0.025
0.01
0.005
0.001
0.0005
1
2
3
4
5
0.325
0.289
0.277
0.271
0.267
1.000
0.816
0.765
0.741
0.727
3.078
1.886
1.638
1.533
1.476
6.314
2.920
2.353
2.132
2.015
12.706
4.303
3.182
2.776
2.571
31.821
6.965
4.541
3.747
3.365
63.657
9.925
5.841
4.604
4.032
318.309
22.327
10.215
7.173
5.893
636.619
31.599
12.924
8.610
6.869
6
7
8
9
10
0.265
0.263
0.262
0.261
0.260
0.718
0.711
0.706
0.703
0.700
1.440
1.415
1.397
1.383
1.372
1.943
1.895
1.860
1.833
1.812
2.447
2.365
2.306
2.262
2.228
3.143
2.998
2.896
2.821
2.764
3.707
3.499
3.355
3.250
3.169
5.208
4.785
4.501
4.297
4.144
5.959
5.408
5.041
4.781
4.587
11
12
13
14
15
0.260
0.259
0.259
0.258
0.258
0.697
0.695
0.694
0.692
0.691
1.363
1.356
1.350
1.345
1.341
1.796
1.782
1.771
1.761
1.753
2.201
2.179
2.160
2.145
2.131
2.718
2.681
2.650
2.624
2.602
3.106
3.055
3.012
2.977
2.947
4.025
3.930
3.852
3.787
3.733
4.437
4.318
4.221
4.140
4.073
16
17
18
19
20
0.258
0.257
0.257
0.257
0.257
0.690
0.689
0.688
0.688
0.687
1.337
1.333
1.330
1.328
1.325
1.746
1.740
1.734
1.729
1.725
2.120
2.110
2.101
2.093
2.086
2.583
2.567
2.552
2.539
2.528
2.921
2.898
2.878
2.861
2.845
3.686
3.646
3.610
3.579
3.552
4.015
3.965
3.922
3.883
3.850
21
22
23
24
25
0.257
0.256
0.256
0.256
0.256
0.686
0.686
0.685
0.685
0.684
1.323
1.321
1.319
1.318
1.316
1.721
1.717
1.714
1.711
1.708
2.080
2.074
2.069
2.064
2.060
2.518
2.508
2.500
2.492
2.485
2.831
2.819
2.807
2.797
2.787
3.527
3.505
3.485
3.467
3.450
3.819
3.792
3.768
3.745
3.725
26
27
28
29
30
0.256
0.256
0.256
0.256
0.256
0.684
0.684
0.683
0.683
0.683
1.315
1.314
1.313
1.311
1.310
1.706
1.703
1.701
1.699
1.697
2.056
2.052
2.048
2.045
2.042
2.479
2.473
2.467
2.462
2.457
2.779
2.771
2.763
2.756
2.750
3.435
3.421
3.408
3.396
3.385
3.707
3.690
3.674
3.659
3.646
35
40
60
120
∞
0.255
0.255
0.254
0.254
0.253
0.682
0.681
0.679
0.677
0.674
1.306
1.303
1.296
1.289
1.282
1.690
1.684
1.671
1.658
1.645
2.030
2.021
2.000
1.980
1.960
2.438
2.423
2.390
2.358
2.326
2.724
2.704
2.660
2.617
2.576
3.340
3.307
3.232
3.160
3.090
3.591
3.551
3.460
3.373
3.291
APÉNDICE A
Tablas
773
TABLA A.4 Puntos críticos para la prueba de rango con signo de Wilcoxon
a
a
sbajo
n
sbajo
salto
4
1
0
3
2
1
0
4
3
2
1
0
6
5
4
3
2
1
0
9
8
6
5
4
3
2
1
0
11
10
9
8
6
5
4
3
2
1
9
10
12
13
14
15
17
18
19
20
21
22
23
24
25
26
27
28
27
28
30
31
32
33
34
35
36
34
35
36
37
39
40
41
42
43
44
5
6
7
8
9
salto
A
n
sbajo
salto
0.1250
0.0625
0.1562
0.0938
0.0625
0.0312
0.1094
0.0781
0.0469
0.0312
0.0156
0.1094
0.0781
0.0547
0.0391
0.0234
0.0156
0.0078
0.1250
0.0977
0.0547
0.0391
0.0273
0.0195
0.0117
0.0078
0.0039
0.1016
0.0820
0.0645
0.0488
0.0273
0.0195
0.0137
0.0098
0.0059
0.0039
10
15
14
11
10
9
8
6
5
4
3
40
41
44
45
46
47
49
50
51
52
0.1162
0.0967
0.0527
0.0420
0.0322
0.0244
0.0137
0.0098
0.0068
0.0049
18
17
14
13
11
10
8
7
6
5
48
49
52
53
55
56
58
59
60
61
0.1030
0.0874
0.0508
0.0415
0.0269
0.0210
0.0122
0.0093
0.0068
0.0049
22
21
18
17
14
13
10
9
8
7
56
57
60
61
64
65
68
69
70
71
0.1018
0.0881
0.0549
0.0461
0.0261
0.0212
0.0105
0.0081
0.0061
0.0046
27
26
22
21
18
17
13
64
65
69
70
73
74
78
0.1082
0.0955
0.0549
0.0471
0.0287
0.0239
0.0107
11
12
13
A
n
14
15
16
17
sbajo
salto
A
12
10
9
32
31
26
25
22
21
16
15
13
12
37
36
31
30
26
25
20
19
16
15
43
42
36
35
30
29
24
23
20
19
49
48
42
41
79
81
82
73
74
79
80
83
84
89
90
92
93
83
84
89
90
94
95
100
101
104
105
93
94
100
101
106
107
112
113
116
117
104
105
111
112
0.0085
0.0052
0.0040
0.1083
0.0969
0.0520
0.0453
0.0290
0.0247
0.0101
0.0083
0.0054
0.0043
0.1039
0.0938
0.0535
0.0473
0.0277
0.0240
0.0108
0.0090
0.0051
0.0042
0.1057
0.0964
0.0523
0.0467
0.0253
0.0222
0.0107
0.0091
0.0055
0.0046
0.1034
0.0950
0.0544
0.0492
S − n(n + 1)/4
Para n > 20, calcule z = √n(n+ + 1)(2n + 1)/24 y utilice la tabla z (tabla A.2).
n
sbajo
salto
A
35
34
28
27
24
23
118
119
125
126
129
130
0.0253
0.0224
0.0101
0.0087
0.0055
0.0047
18
56
55
48
47
41
40
33
32
28
27
115
116
123
124
130
131
138
139
143
144
0.1061
0.0982
0.0542
0.0494
0.0269
0.0241
0.0104
0.0091
0.0052
0.0045
19
63
62
54
53
47
46
38
37
33
32
127
128
136
137
143
144
152
153
157
158
0.1051
0.0978
0.0521
0.0478
0.0273
0.0247
0.0102
0.0090
0.0054
0.0047
20
70
69
61
60
53
52
44
43
38
37
140
141
149
150
157
158
166
167
172
173
0.1012
0.0947
0.0527
0.0487
0.0266
0.0242
0.0107
0.0096
0.0053
0.0047
774
APÉNDICE A
Tablas
TABLA A.5 Puntos críticos para la prueba de rango-suma de Wilcoxon
a
a
w bajo
m n wbajo walto
2
5
6
7
8
3
4
5
6
7
8
4
4
5
walto
A
m n wbajo walto
A
11
10
14
13
12
11
10
15
14
13
12
11
10
16
15
14
13
12
11
29
30
30
31
32
33
34
33
34
35
36
37
38
36
37
38
39
40
41
0.0159
0.0079
0.0571
0.0333
0.0190
0.0095
0.0048
0.0545
0.0364
0.0212
0.0121
0.0061
0.0030
0.0545
0.0364
0.0242
0.0141
0.0081
0.0040
20
19
18
17
16
15
21
20
19
18
17
16
35
36
37
38
39
40
39
40
41
42
43
44
0.0754
0.0476
0.0278
0.0159
0.0079
0.0040
0.0628
0.0411
0.0260
0.0152
0.0087
0.0043
4
3
4
3
4
3
5
4
3
12
13
14
15
16
17
17
18
19
0.0952
0.0476
0.0714
0.0357
0.0556
0.0278
0.0889
0.0444
0.0222
7
6
8
7
6
9
8
7
9
8
7
6
10
9
8
7
6
17
18
19
20
21
21
22
23
24
25
26
27
26
27
28
29
30
0.0571
0.0286
0.0714
0.0357
0.0179
0.0833
0.0476
0.0238
0.0583
0.0333
0.0167
0.0083
0.0667
0.0424
0.0242
0.0121
0.0061
12
11
10
13
12
24
25
26
27
28
0.0571
0.0286
0.0143
0.0556
0.0317
6
7
8
5 5
6
m n wbajo walto
7
8
6 6
7
8
A
m n wbajo walto
A
30
29
28
27
26
25
60
61
62
63
64
65
0.0296
0.0213
0.0147
0.0100
0.0063
0.0040
40
39
37
36
35
34
33
32
42
41
39
38
36
35
34
65
66
68
69
70
71
72
73
70
71
73
74
76
77
78
0.0641
0.0487
0.0265
0.0189
0.0131
0.0087
0.0055
0.0035
0.0603
0.0469
0.0270
0.0200
0.0103
0.0070
0.0047
52
51
50
49
46
45
44
43
84
85
86
87
90
91
92
93
0.0524
0.0415
0.0325
0.0249
0.0103
0.0074
0.0052
0.0035
22
21
20
19
18
17
16
24
23
22
21
20
19
18
17
43
44
45
46
47
48
49
46
47
48
49
50
51
52
53
0.0530
0.0366
0.0240
0.0152
0.0088
0.0051
0.0025
0.0637
0.0466
0.0326
0.0225
0.0148
0.0093
0.0054
0.0031
29
28
27
26
25
24
23
30
29
28
27
26
25
24
32
31
49
50
51
52
53
54
55
54
55
56
57
58
59
60
58
59
0.0660
0.0465
0.0325
0.0206
0.0130
0.0076
0.0043
0.0507
0.0367
0.0256
0.0175
0.0111
0.0070
0.0041
0.0539
0.0406
7 7
8
8 8
W − m(m + n + 1)/2
Cuando tanto m como n sean mayores que 8, calcule z = √mn(m + n + 1)/12 y utilice la tabla z (tabla A.2).
APÉNDICE A
Tablas
775
TABLA A.6 Puntos porcentuales superiores para la distribución x2
a
xn,2 a
0
A
v
0.995
0.99
0.975
0.95
0.90
0.10
0.05
0.025
0.01
0.005
1
2
3
4
5
0.000
0.010
0.072
0.207
0.412
0.000
0.020
0.115
0.297
0.554
0.001
0.051
0.216
0.484
0.831
0.004
0.103
0.352
0.711
1.145
0.016
0.211
0.584
1.064
1.610
2.706
4.605
6.251
7.779
9.236
3.841
5.991
7.815
9.488
11.070
5.024
7.378
9.348
11.143
12.833
6.635
9.210
11.345
13.277
15.086
7.879
10.597
12.838
14.860
16.750
6
7
8
9
10
0.676
0.989
1.344
1.735
2.156
0.872
1.239
1.646
2.088
2.558
1.237
1.690
2.180
2.700
3.247
1.635
2.167
2.733
3.325
3.940
2.204
2.833
3.490
4.168
4.865
10.645
12.017
13.362
14.684
15.987
12.592
14.067
15.507
16.919
18.307
14.449
16.013
17.535
19.023
20.483
16.812
18.475
20.090
21.666
23.209
18.548
20.278
21.955
23.589
25.188
11
12
13
14
15
2.603
3.074
3.565
4.075
4.601
3.053
3.571
4.107
4.660
5.229
3.816
4.404
5.009
5.629
6.262
4.575
5.226
5.892
6.571
7.261
5.578
6.304
7.042
7.790
8.547
17.275
18.549
19.812
21.064
22.307
19.675
21.026
22.362
23.685
24.996
21.920
23.337
24.736
26.119
27.488
24.725
26.217
27.688
29.141
30.578
26.757
28.300
29.819
31.319
32.801
16
17
18
19
20
5.142
5.697
6.265
6.844
7.434
5.812
6.408
7.015
7.633
8.260
6.908
7.564
8.231
8.907
9.591
7.962
8.672
9.390
10.117
10.851
9.312
10.085
10.865
11.651
12.443
23.542
24.769
25.989
27.204
28.412
26.296
27.587
28.869
30.144
31.410
28.845
30.191
31.526
32.852
34.170
32.000
33.409
34.805
36.191
37.566
34.267
35.718
37.156
38.582
39.997
21
22
23
24
25
8.034
8.643
9.260
9.886
10.520
8.897
9.542
10.196
10.856
11.524
10.283
10.982
11.689
12.401
13.120
11.591
12.338
13.091
13.848
14.611
13.240
14.041
14.848
15.659
16.473
29.615
30.813
32.007
33.196
34.382
32.671
33.924
35.172
36.415
37.652
35.479
36.781
38.076
39.364
40.646
38.932
40.289
41.638
42.980
44.314
41.401
42.796
44.181
45.559
46.928
26
27
28
29
30
11.160
11.808
12.461
13.121
13.787
12.198
12.879
13.565
14.256
14.953
13.844
14.573
15.308
16.047
16.791
15.379
16.151
16.928
17.708
18.493
17.292
18.114
18.939
19.768
20.599
35.563
36.741
37.916
39.087
40.256
38.885
40.113
41.337
42.557
43.773
41.923
43.195
44.461
45.722
46.979
45.642
46.963
48.278
49.588
50.892
48.290
49.645
50.993
52.336
53.672
31
32
33
14.458
15.134
15.815
15.655
16.362
17.074
17.539
18.291
19.047
19.281
20.072
20.867
21.434
22.271
23.110
41.422
42.585
43.745
44.985
46.194
47.400
48.232
49.480
50.725
52.191
53.486
54.776
55.003
56.328
57.648
34
35
16.501
17.192
17.789
18.509
19.806
20.569
21.664
22.465
23.952
24.797
44.903
46.059
48.602
49.802
51.966
53.203
56.061
57.342
58.964
60.275
36
37
38
39
40
17.887
18.586
19.289
19.996
20.707
19.233
19.960
20.691
21.426
22.164
21.336
22.106
22.878
23.654
24.433
23.269
24.075
24.884
25.695
26.509
25.643
26.492
27.343
28.196
29.051
47.212
48.363
49.513
50.660
51.805
50.998
52.192
53.384
54.572
55.758
54.437
55.668
56.896
58.120
59.342
58.619
59.893
61.162
62.428
63.691
61.581
62.883
64.181
65.476
66.766
√
2 ≈ 0.5(z + 2ν − 1).
Para ν > 40, χν,α
α
776
APÉNDICE A
Tablas
TABLA A.7 Puntos porcentuales superiores para la distribución F
a
0
Fn1, n2, a
v1
v2
1
2
3
4
5
6
7
8
9
A
1
2
3
4
5
6
7
8
9
0.100
39.86
49.50
53.59
55.83
57.24
58.20
58.91
59.44
59.86
0.050 161.45 199.50 215.71 224.58 230.16 233.99 236.77 238.88 240.54
0.010 4052.18 4999.50 5403.35 5624.58 5763.65 5858.99 5928.36 5981.07 6022.47
0.001 405284 500012 540382 562501 576405 585938 592874 598144 603040
0.100
8.53
9.00
9.16
9.24
9.29
9.33
9.35
9.37
9.38
0.050
18.51
19.00
19.16
19.25
19.30
19.33
19.35
19.37
19.38
0.010
98.50
99.00
99.17
99.25
99.30
99.33
99.36
99.37
99.39
0.001 998.50 999.00 999.17 999.25 999.30 999.33 999.36 999.37 999.39
0.100
5.54
5.46
5.39
5.34
5.31
5.28
5.27
5.25
5.24
0.050
10.13
9.55
9.28
9.12
9.01
8.94
8.89
8.85
8.81
0.010
34.12
30.82
29.46
28.71
28.24
27.91
27.67
27.49
27.35
0.001 167.03 148.50 141.11 137.10 134.58 132.85 131.58 130.62 129.86
0.100
4.54
4.32
4.19
4.11
4.05
4.01
3.98
3.95
3.94
0.050
7.71
6.94
6.59
6.39
6.26
6.16
6.09
6.04
6.00
0.010
21.20
18.00
16.69
15.98
15.52
15.21
14.98
14.80
14.66
0.001
74.14
61.25
56.18
53.44
51.71
50.53
49.66
49.00
48.47
0.100
4.06
3.78
3.62
3.52
3.45
3.40
3.37
3.34
3.32
0.050
6.61
5.79
5.41
5.19
5.05
4.95
4.88
4.82
4.77
0.010
16.26
13.27
12.06
11.39
10.97
10.67
10.46
10.29
10.16
0.001
47.18
37.12
33.20
31.09
29.75
28.83
28.16
27.65
27.24
0.100
3.78
3.46
3.29
3.18
3.11
3.05
3.01
2.98
2.96
0.050
5.99
5.14
4.76
4.53
4.39
4.28
4.21
4.15
4.10
0.010
13.75
10.92
9.78
9.15
8.75
8.47
8.26
8.10
7.98
0.001
35.51
27.00
23.70
21.92
20.80
20.03
19.46
19.03
18.69
0.100
3.59
3.26
3.07
2.96
2.88
2.83
2.78
2.75
2.72
0.050
5.59
4.74
4.35
4.12
3.97
3.87
3.79
3.73
3.68
0.010
12.25
9.55
8.45
7.85
7.46
7.19
6.99
6.84
6.72
0.001
29.25
21.69
18.77
17.20
16.21
15.52
15.02
14.63
14.33
0.100
3.46
3.11
2.92
2.81
2.73
2.67
2.62
2.59
2.56
0.050
5.32
4.46
4.07
3.84
3.69
3.58
3.50
3.44
3.39
0.010
11.26
8.65
7.59
7.01
6.63
6.37
6.18
6.03
5.91
0.001
25.41
18.49
15.83
14.39
13.48
12.86
12.40
12.05
11.77
0.100
3.36
3.01
2.81
2.69
2.61
2.55
2.51
2.47
2.44
0.050
5.12
4.26
3.86
3.63
3.48
3.37
3.29
3.23
3.18
0.010
10.56
8.02
6.99
6.42
6.06
5.80
5.61
5.47
5.35
0.001
22.86
16.39
13.90
12.56
11.71
11.13
10.70
10.37
10.11
Continúa en la página 777
APÉNDICE A
Tablas
777
TABLA A.7 Puntos porcentuales superiores para la distribución F (continuación)
v1
v2
A
10
12
15
20
25
30
40
50
60
1
0.100
60.19
60.71
61.22
61.74
62.05
62.26
62.53
62.69
62.79
0.050 241.88 243.91 245.95 248.01 249.26 250.10 251.14 251.77 252.20
0.010 6055.85 6106.32 6157.29 6208.73 6239.83 6260.65 6286.78 6302.52 6313.03
0.001 606316 611276 616292 621362 624430 626486 659725 660511 6610390
2
0.100
0.050
0.010
0.001
9.39
19.40
99.40
999.40
9.41
19.41
99.42
999.42
9.42
19.43
99.43
999.43
9.44
19.45
99.45
999.45
9.45
19.46
99.46
999.46
9.46
19.46
99.47
999.47
9.47
19.47
99.47
999.47
9.47
19.48
99.48
999.48
9.47
19.48
99.48
999.48
3
0.100
0.050
0.010
0.001
5.23
8.79
27.23
129.25
5.22
8.74
27.05
128.32
5.20
8.70
26.87
127.37
5.18
8.66
26.69
126.42
5.17
8.63
26.58
125.84
5.17
8.62
26.50
125.45
5.16
8.59
26.41
124.96
5.15
8.58
26.35
124.66
5.15
8.57
26.32
124.47
4
0.100
0.050
0.010
0.001
3.92
5.96
14.55
48.05
3.90
5.91
14.37
47.41
3.87
5.86
14.20
46.76
3.84
5.80
14.02
46.10
3.83
5.77
13.91
45.70
3.82
5.75
13.84
45.43
3.80
5.72
13.75
45.09
3.80
5.70
13.69
44.88
3.79
5.69
13.65
44.75
5
0.100
0.050
0.010
0.001
3.30
4.74
10.05
26.92
3.27
4.68
9.89
26.42
3.24
4.62
9.72
25.91
3.21
4.56
9.55
25.39
3.19
4.52
9.45
25.08
3.17
4.50
9.38
24.87
3.16
4.46
9.29
24.60
3.15
4.44
9.24
24.44
3.14
4.43
9.20
24.33
6
0.100
0.050
0.010
0.001
2.94
4.06
7.87
18.41
2.90
4.00
7.72
17.99
2.87
3.94
7.56
17.56
2.84
3.87
7.40
17.12
2.81
3.83
7.30
16.85
2.80
3.81
7.23
16.67
2.78
3.77
7.14
16.44
2.77
3.75
7.09
16.31
2.76
3.74
7.06
16.21
7
0.100
0.050
0.010
0.001
2.70
3.64
6.62
14.08
2.67
3.57
6.47
13.71
2.63
3.51
6.31
13.32
2.59
3.44
6.16
12.93
2.57
3.40
6.06
12.69
2.56
3.38
5.99
12.53
2.54
3.34
5.91
12.33
2.52
3.32
5.86
12.20
2.51
3.30
5.82
12.12
8
0.100
0.050
0.010
0.001
2.54
3.35
5.81
11.54
2.50
3.28
5.67
11.19
2.46
3.22
5.52
10.84
2.42
3.15
5.36
10.48
2.40
3.11
5.26
10.26
2.38
3.08
5.20
10.11
2.36
3.04
5.12
9.92
2.35
3.02
5.07
9.80
2.34
3.01
5.03
9.73
9
0.100
0.050
0.010
0.001
2.42
3.14
5.26
9.89
2.38
3.07
5.11
9.57
2.34
3.01
4.96
9.24
2.30
2.94
4.81
8.90
2.27
2.89
4.71
8.69
2.25
2.86
4.65
8.55
2.23
2.83
4.57
8.37
2.22
2.80
4.52
8.26
2.21
2.79
4.48
8.19
Continúa en la página 778
778
APÉNDICE A
Tablas
TABLA A.7 Puntos porcentuales superiores para la distribución F (continuación)
v1
v2
10
11
12
13
14
15
16
17
18
19
20
A
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
1
3.29
4.96
10.04
21.04
3.23
4.84
9.65
19.69
3.18
4.75
9.33
18.64
3.14
4.67
9.07
17.82
3.10
4.60
8.86
17.14
3.07
4.54
8.68
16.59
3.05
4.49
8.53
16.12
3.03
4.45
8.40
15.72
3.01
4.41
8.29
15.38
2.99
4.38
8.18
15.08
2.97
4.35
8.10
14.82
2
2.92
4.10
7.56
14.91
2.86
3.98
7.21
13.81
2.81
3.89
6.93
12.97
2.76
3.81
6.70
12.31
2.73
3.74
6.51
11.78
2.70
3.68
6.36
11.34
2.67
3.63
6.23
10.97
2.64
3.59
6.11
10.66
2.62
3.55
6.01
10.39
2.61
3.52
5.93
10.16
2.59
3.49
5.85
9.95
3
2.73
3.71
6.55
12.55
2.66
3.59
6.22
11.56
2.61
3.49
5.95
10.80
2.56
3.41
5.74
10.21
2.52
3.34
5.56
9.73
2.49
3.29
5.42
9.34
2.46
3.24
5.29
9.01
2.44
3.20
5.18
8.73
2.42
3.16
5.09
8.49
2.40
3.13
5.01
8.28
2.38
3.10
4.94
8.10
4
2.61
3.48
5.99
11.28
2.54
3.36
5.67
10.35
2.48
3.26
5.41
9.63
2.43
3.18
5.21
9.07
2.39
3.11
5.04
8.62
2.36
3.06
4.89
8.25
2.33
3.01
4.77
7.94
2.31
2.96
4.67
7.68
2.29
2.93
4.58
7.46
2.27
2.90
4.50
7.27
2.25
2.87
4.43
7.10
5
2.52
3.33
5.64
10.48
2.45
3.20
5.32
9.58
2.39
3.11
5.06
8.89
2.35
3.03
4.86
8.35
2.31
2.96
4.69
7.92
2.27
2.90
4.56
7.57
2.24
2.85
4.44
7.27
2.22
2.81
4.34
7.02
2.20
2.77
4.25
6.81
2.18
2.74
4.17
6.62
2.16
2.71
4.10
6.46
6
7
8
9
2.46
3.22
5.39
9.93
2.39
3.09
5.07
9.05
2.33
3.00
4.82
8.38
2.28
2.92
4.62
7.86
2.24
2.85
4.46
7.44
2.21
2.79
4.32
7.09
2.18
2.74
4.20
6.80
2.15
2.70
4.10
6.56
2.13
2.66
4.01
6.35
2.11
2.63
3.94
6.18
2.09
2.60
3.87
6.02
2.41
3.14
5.20
9.52
2.34
3.01
4.89
8.66
2.28
2.91
4.64
8.00
2.23
2.83
4.44
7.49
2.19
2.76
4.28
7.08
2.16
2.71
4.14
6.74
2.13
2.66
4.03
6.46
2.10
2.61
3.93
6.22
2.08
2.58
3.84
6.02
2.06
2.54
3.77
5.85
2.04
2.51
3.70
5.69
2.38
3.07
5.06
9.20
2.30
2.95
4.74
8.35
2.24
2.85
4.50
7.71
2.20
2.77
4.30
7.21
2.15
2.70
4.14
6.80
2.12
2.64
4.00
6.47
2.09
2.59
3.89
6.19
2.06
2.55
3.79
5.96
2.04
2.51
3.71
5.76
2.02
2.48
3.63
5.59
2.00
2.45
3.56
5.44
2.35
3.02
4.94
8.96
2.27
2.90
4.63
8.12
2.21
2.80
4.39
7.48
2.16
2.71
4.19
6.98
2.12
2.65
4.03
6.58
2.09
2.59
3.89
6.26
2.06
2.54
3.78
5.98
2.03
2.49
3.68
5.75
2.00
2.46
3.60
5.56
1.98
2.42
3.52
5.39
1.96
2.39
3.46
5.24
Continúa en la página 779
APÉNDICE A
Tablas
779
TABLA A.7 Puntos porcentuales superiores para la distribución F (continuación)
v2
10
11
12
13
14
15
16
17
18
19
20
A
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
10
12
15
20
v1
25
30
40
50
60
2.32
2.98
4.85
8.75
2.25
2.85
4.54
7.92
2.19
2.75
4.30
7.29
2.14
2.67
4.10
6.80
2.10
2.60
3.94
6.40
2.06
2.54
3.80
6.08
2.03
2.49
3.69
5.81
2.00
2.45
3.59
5.58
1.98
2.41
3.51
5.39
1.96
2.38
3.43
5.22
1.94
2.35
3.37
5.08
2.28
2.91
4.71
8.45
2.21
2.79
4.40
7.63
2.15
2.69
4.16
7.00
2.10
2.60
3.96
6.52
2.05
2.53
3.80
6.13
2.02
2.48
3.67
5.81
1.99
2.42
3.55
5.55
1.96
2.38
3.46
5.32
1.93
2.34
3.37
5.13
1.91
2.31
3.30
4.97
1.89
2.28
3.23
4.82
2.24
2.85
4.56
8.13
2.17
2.72
4.25
7.32
2.10
2.62
4.01
6.71
2.05
2.53
3.82
6.23
2.01
2.46
3.66
5.85
1.97
2.40
3.52
5.54
1.94
2.35
3.41
5.27
1.91
2.31
3.31
5.05
1.89
2.27
3.23
4.87
1.86
2.23
3.15
4.70
1.84
2.20
3.09
4.56
2.20
2.77
4.41
7.80
2.12
2.65
4.10
7.01
2.06
2.54
3.86
6.40
2.01
2.46
3.66
5.93
1.96
2.39
3.51
5.56
1.92
2.33
3.37
5.25
1.89
2.28
3.26
4.99
1.86
2.23
3.16
4.78
1.84
2.19
3.08
4.59
1.81
2.16
3.00
4.43
1.79
2.12
2.94
4.29
2.17
2.73
4.31
7.60
2.10
2.60
4.01
6.81
2.03
2.50
3.76
6.22
1.98
2.41
3.57
5.75
1.93
2.34
3.41
5.38
1.89
2.28
3.28
5.07
1.86
2.23
3.16
4.82
1.83
2.18
3.07
4.60
1.80
2.14
2.98
4.42
1.78
2.11
2.91
4.26
1.76
2.07
2.84
4.12
2.16
2.70
4.25
7.47
2.08
2.57
3.94
6.68
2.01
2.47
3.70
6.09
1.96
2.38
3.51
5.63
1.91
2.31
3.35
5.25
1.87
2.25
3.21
4.95
1.84
2.19
3.10
4.70
1.81
2.15
3.00
4.48
1.78
2.11
2.92
4.30
1.76
2.07
2.84
4.14
1.74
2.04
2.78
4.00
2.13
2.66
4.17
7.30
2.05
2.53
3.86
6.52
1.99
2.43
3.62
5.93
1.93
2.34
3.43
5.47
1.89
2.27
3.27
5.10
1.85
2.20
3.13
4.80
1.81
2.15
3.02
4.54
1.78
2.10
2.92
4.33
1.75
2.06
2.84
4.15
1.73
2.03
2.76
3.99
1.71
1.99
2.69
3.86
2.12
2.64
4.12
7.19
2.04
2.51
3.81
6.42
1.97
2.40
3.57
5.83
1.92
2.31
3.38
5.37
1.87
2.24
3.22
5.00
1.83
2.18
3.08
4.70
1.79
2.12
2.97
4.45
1.76
2.08
2.87
4.24
1.74
2.04
2.78
4.06
1.71
2.00
2.71
3.90
1.69
1.97
2.64
3.77
2.11
2.62
4.08
7.12
2.03
2.49
3.78
6.35
1.96
2.38
3.54
5.76
1.90
2.30
3.34
5.30
1.86
2.22
3.18
4.94
1.82
2.16
3.05
4.64
1.78
2.11
2.93
4.39
1.75
2.06
2.83
4.18
1.72
2.02
2.75
4.00
1.70
1.98
2.67
3.84
1.68
1.95
2.61
3.70
Continúa en la página 780
780
APÉNDICE A
Tablas
TABLA A.7 Puntos porcentuales superiores para la distribución F (continuación)
v1
v2
21
22
23
24
25
26
27
28
29
30
31
A
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
1
2.96
4.32
8.02
14.59
2.95
4.30
7.95
14.38
2.94
4.28
7.88
14.20
2.93
4.26
7.82
14.03
2.92
4.24
7.77
13.88
2.91
4.23
7.72
13.74
2.90
4.21
7.68
13.61
2.89
4.20
7.64
13.50
2.89
4.18
7.60
13.39
2.88
4.17
7.56
13.29
2.87
4.16
7.53
13.20
2
2.57
3.47
5.78
9.77
2.56
3.44
5.72
9.61
2.55
3.42
5.66
9.47
2.54
3.40
5.61
9.34
2.53
3.39
5.57
9.22
2.52
3.37
5.53
9.12
2.51
3.35
5.49
9.02
2.50
3.34
5.45
8.93
2.50
3.33
5.42
8.85
2.49
3.32
5.39
8.77
2.48
3.30
5.36
8.70
3
2.36
3.07
4.87
7.94
2.35
3.05
4.82
7.80
2.34
3.03
4.76
7.67
2.33
3.01
4.72
7.55
2.32
2.99
4.68
7.45
2.31
2.98
4.64
7.36
2.30
2.96
4.60
7.27
2.29
2.95
4.57
7.19
2.28
2.93
4.54
7.12
2.28
2.92
4.51
7.05
2.27
2.91
4.48
6.99
4
2.23
2.84
4.37
6.95
2.22
2.82
4.31
6.81
2.21
2.80
4.26
6.70
2.19
2.78
4.22
6.59
2.18
2.76
4.18
6.49
2.17
2.74
4.14
6.41
2.17
2.73
4.11
6.33
2.16
2.71
4.07
6.25
2.15
2.70
4.04
6.19
2.14
2.69
4.02
6.12
2.14
2.68
3.99
6.07
5
2.14
2.68
4.04
6.32
2.13
2.66
3.99
6.19
2.11
2.64
3.94
6.08
2.10
2.62
3.90
5.98
2.09
2.60
3.85
5.89
2.08
2.59
3.82
5.80
2.07
2.57
3.78
5.73
2.06
2.56
3.75
5.66
2.06
2.55
3.73
5.59
2.05
2.53
3.70
5.53
2.04
2.52
3.67
5.48
6
2.08
2.57
3.81
5.88
2.06
2.55
3.76
5.76
2.05
2.53
3.71
5.65
2.04
2.51
3.67
5.55
2.02
2.49
3.63
5.46
2.01
2.47
3.59
5.38
2.00
2.46
3.56
5.31
2.00
2.45
3.53
5.24
1.99
2.43
3.50
5.18
1.98
2.42
3.47
5.12
1.97
2.41
3.45
5.07
7
2.02
2.49
3.64
5.56
2.01
2.46
3.59
5.44
1.99
2.44
3.54
5.33
1.98
2.42
3.50
5.23
1.97
2.40
3.46
5.15
1.96
2.39
3.42
5.07
1.95
2.37
3.39
5.00
1.94
2.36
3.36
4.93
1.93
2.35
3.33
4.87
1.93
2.33
3.30
4.82
1.92
2.32
3.28
4.77
8
1.98
2.42
3.51
5.31
1.97
2.40
3.45
5.19
1.95
2.37
3.41
5.09
1.94
2.36
3.36
4.99
1.93
2.34
3.32
4.91
1.92
2.32
3.29
4.83
1.91
2.31
3.26
4.76
1.90
2.29
3.23
4.69
1.89
2.28
3.20
4.64
1.88
2.27
3.17
4.58
1.88
2.25
3.15
4.53
9
1.95
2.37
3.40
5.11
1.93
2.34
3.35
4.99
1.92
2.32
3.30
4.89
1.91
2.30
3.26
4.80
1.89
2.28
3.22
4.71
1.88
2.27
3.18
4.64
1.87
2.25
3.15
4.57
1.87
2.24
3.12
4.50
1.86
2.22
3.09
4.45
1.85
2.21
3.07
4.39
1.84
2.20
3.04
4.34
Continúa en la página 781
APÉNDICE A
Tablas
781
TABLA A.7 Puntos porcentuales superiores para la distribución F (continuación)
v2
21
22
23
24
25
26
27
28
29
30
31
A
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
0.100
0.050
0.010
0.001
10
1.92
2.32
3.31
4.95
1.90
2.30
3.26
4.83
1.89
2.27
3.21
4.73
1.88
2.25
3.17
4.64
1.87
2.24
3.13
4.56
1.86
2.22
3.09
4.48
1.85
2.20
3.06
4.41
1.84
2.19
3.03
4.35
1.83
2.18
3.00
4.29
1.82
2.16
2.98
4.24
1.81
2.15
2.96
4.19
12
1.87
2.25
3.17
4.70
1.86
2.23
3.12
4.58
1.84
2.20
3.07
4.48
1.83
2.18
3.03
4.39
1.82
2.16
2.99
4.31
1.81
2.15
2.96
4.24
1.80
2.13
2.93
4.17
1.79
2.12
2.90
4.11
1.78
2.10
2.87
4.05
1.77
2.09
2.84
4.00
1.77
2.08
2.82
3.95
15
1.83
2.18
3.03
4.44
1.81
2.15
2.98
4.33
1.80
2.13
2.93
4.23
1.78
2.11
2.89
4.14
1.77
2.09
2.85
4.06
1.76
2.07
2.81
3.99
1.75
2.06
2.78
3.92
1.74
2.04
2.75
3.86
1.73
2.03
2.73
3.80
1.72
2.01
2.70
3.75
1.71
2.00
2.68
3.71
20
1.78
2.10
2.88
4.17
1.76
2.07
2.83
4.06
1.74
2.05
2.78
3.96
1.73
2.03
2.74
3.87
1.72
2.01
2.70
3.79
1.71
1.99
2.66
3.72
1.70
1.97
2.63
3.66
1.69
1.96
2.60
3.60
1.68
1.94
2.57
3.54
1.67
1.93
2.55
3.49
1.66
1.92
2.52
3.45
v1
25
1.74
2.05
2.79
4.00
1.73
2.02
2.73
3.89
1.71
2.00
2.69
3.79
1.70
1.97
2.64
3.71
1.68
1.96
2.60
3.63
1.67
1.94
2.57
3.56
1.66
1.92
2.54
3.49
1.65
1.91
2.51
3.43
1.64
1.89
2.48
3.38
1.63
1.88
2.45
3.33
1.62
1.87
2.43
3.28
30
1.72
2.01
2.72
3.88
1.70
1.98
2.67
3.78
1.69
1.96
2.62
3.68
1.67
1.94
2.58
3.59
1.66
1.92
2.54
3.52
1.65
1.90
2.50
3.44
1.64
1.88
2.47
3.38
1.63
1.87
2.44
3.32
1.62
1.85
2.41
3.27
1.61
1.84
2.39
3.22
1.60
1.83
2.36
3.17
40
1.69
1.96
2.64
3.74
1.67
1.94
2.58
3.63
1.66
1.91
2.54
3.53
1.64
1.89
2.49
3.45
1.63
1.87
2.45
3.37
1.61
1.85
2.42
3.30
1.60
1.84
2.38
3.23
1.59
1.82
2.35
3.18
1.58
1.81
2.33
3.12
1.57
1.79
2.30
3.07
1.56
1.78
2.27
3.03
50
1.67
1.94
2.58
3.64
1.65
1.91
2.53
3.54
1.64
1.88
2.48
3.44
1.62
1.86
2.44
3.36
1.61
1.84
2.40
3.28
1.59
1.82
2.36
3.21
1.58
1.81
2.33
3.14
1.57
1.79
2.30
3.09
1.56
1.77
2.27
3.03
1.55
1.76
2.25
2.98
1.54
1.75
2.22
2.94
60
1.66
1.92
2.55
3.58
1.64
1.89
2.50
3.48
1.62
1.86
2.45
3.38
1.61
1.84
2.40
3.29
1.59
1.82
2.36
3.22
1.58
1.80
2.33
3.15
1.57
1.79
2.29
3.08
1.56
1.77
2.26
3.02
1.55
1.75
2.23
2.97
1.54
1.74
2.21
2.92
1.53
1.73
2.18
2.87
Continúa en la página 782
782
APÉNDICE A
Tablas
TABLA A.7 Puntos porcentuales superiores para la distribución F (continuación)
v1
v2
A
1
2
3
4
5
6
7
8
9
32
0.100
0.050
0.010
0.001
2.87
4.15
7.50
13.12
2.48
3.29
5.34
8.64
2.26
2.90
4.46
6.94
2.13
2.67
3.97
6.01
2.04
2.51
3.65
5.43
1.97
2.40
3.43
5.02
1.91
2.31
3.26
4.72
1.87
2.24
3.13
4.48
1.83
2.19
3.02
4.30
33
0.100
0.050
0.010
0.001
2.86
4.14
7.47
13.04
2.47
3.28
5.31
8.58
2.26
2.89
4.44
6.88
2.12
2.66
3.95
5.97
2.03
2.50
3.63
5.38
1.96
2.39
3.41
4.98
1.91
2.30
3.24
4.67
1.86
2.23
3.11
4.44
1.83
2.18
3.00
4.26
34
0.100
0.050
0.010
0.001
2.86
4.13
7.44
12.97
2.47
3.28
5.29
8.52
2.25
2.88
4.42
6.83
2.12
2.65
3.93
5.92
2.02
2.49
3.61
5.34
1.96
2.38
3.39
4.93
1.90
2.29
3.22
4.63
1.86
2.23
3.09
4.40
1.82
2.17
2.98
4.22
35
0.100
0.050
0.010
0.001
2.85
4.12
7.42
12.90
2.46
3.27
5.27
8.47
2.25
2.87
4.40
6.79
2.11
2.64
3.91
5.88
2.02
2.49
3.59
5.30
1.95
2.37
3.37
4.89
1.90
2.29
3.20
4.59
1.85
2.22
3.07
4.36
1.82
2.16
2.96
4.18
36
0.100
0.050
0.010
0.001
2.85
4.11
7.40
12.83
2.46
3.26
5.25
8.42
2.24
2.87
4.38
6.74
2.11
2.63
3.89
5.84
2.01
2.48
3.57
5.26
1.94
2.36
3.35
4.86
1.89
2.28
3.18
4.56
1.85
2.21
3.05
4.33
1.81
2.15
2.95
4.14
37
0.100
0.050
0.010
0.001
2.85
4.11
7.37
12.77
2.45
3.25
5.23
8.37
2.24
2.86
4.36
6.70
2.10
2.63
3.87
5.80
2.01
2.47
3.56
5.22
1.94
2.36
3.33
4.82
1.89
2.27
3.17
4.53
1.84
2.20
3.04
4.30
1.81
2.14
2.93
4.11
38
0.100
0.050
0.010
0.001
2.84
4.10
7.35
12.71
2.45
3.24
5.21
8.33
2.23
2.85
4.34
6.66
2.10
2.62
3.86
5.76
2.01
2.46
3.54
5.19
1.94
2.35
3.32
4.79
1.88
2.26
3.15
4.49
1.84
2.19
3.02
4.26
1.80
2.14
2.92
4.08
39
0.100
0.050
0.010
0.001
2.84
4.09
7.33
12.66
2.44
3.24
5.19
8.29
2.23
2.85
4.33
6.63
2.09
2.61
3.84
5.73
2.00
2.46
3.53
5.16
1.93
2.34
3.30
4.76
1.88
2.26
3.14
4.46
1.83
2.19
3.01
4.23
1.80
2.13
2.90
4.05
40
0.100
0.050
0.010
0.001
2.84
4.08
7.31
12.61
2.44
3.23
5.18
8.25
2.23
2.84
4.31
6.59
2.09
2.61
3.83
5.70
2.00
2.45
3.51
5.13
1.93
2.34
3.29
4.73
1.87
2.25
3.12
4.44
1.83
2.18
2.99
4.21
1.79
2.12
2.89
4.02
50
0.100
0.050
0.010
0.001
2.81
4.03
7.17
12.22
2.41
3.18
5.06
7.96
2.20
2.79
4.20
6.34
2.06
2.56
3.72
5.46
1.97
2.40
3.41
4.90
1.90
2.29
3.19
4.51
1.84
2.20
3.02
4.22
1.80
2.13
2.89
4.00
1.76
2.07
2.78
3.82
60
0.100
0.050
0.010
0.001
2.79
4.00
7.08
11.97
2.39
3.15
4.98
7.77
2.18
2.76
4.13
6.17
2.04
2.53
3.65
5.31
1.95
2.37
3.34
4.76
1.87
2.25
3.12
4.37
1.82
2.17
2.95
4.09
1.77
2.10
2.82
3.86
1.74
2.04
2.72
3.69
120
0.100
0.050
0.010
0.001
2.75
3.92
6.85
11.38
2.35
3.07
4.79
7.32
2.13
2.68
3.95
5.78
1.99
2.45
3.48
4.95
1.90
2.29
3.17
4.42
1.82
2.18
2.96
4.04
1.77
2.09
2.79
3.77
1.72
2.02
2.66
3.55
1.68
1.96
2.56
3.38
Continúa en la página 783
APÉNDICE A
783
Tablas
TABLA A.7 Puntos porcentuales superiores para la distribución F (continuación)
v1
v2
A
10
12
15
20
25
30
40
50
60
32
0.100
0.050
0.010
0.001
1.81
2.14
2.93
4.14
1.76
2.07
2.80
3.91
1.71
1.99
2.65
3.66
1.65
1.91
2.50
3.40
1.62
1.85
2.41
3.24
1.59
1.82
2.34
3.13
1.56
1.77
2.25
2.98
1.53
1.74
2.20
2.89
1.52
1.71
2.16
2.83
33
0.100
0.050
0.010
0.001
1.80
2.13
2.91
4.10
1.75
2.06
2.78
3.87
1.70
1.98
2.63
3.62
1.64
1.90
2.48
3.36
1.61
1.84
2.39
3.20
1.58
1.81
2.32
3.09
1.55
1.76
2.23
2.94
1.53
1.72
2.18
2.85
1.51
1.70
2.14
2.79
34
0.100
0.050
0.010
0.001
1.79
2.12
2.89
4.06
1.75
2.05
2.76
3.83
1.69
1.97
2.61
3.58
1.64
1.89
2.46
3.33
1.60
1.83
2.37
3.16
1.58
1.80
2.30
3.05
1.54
1.75
2.21
2.91
1.52
1.71
2.16
2.82
1.50
1.69
2.12
2.75
35
0.100
0.050
0.010
0.001
1.79
2.11
2.88
4.03
1.74
2.04
2.74
3.79
1.69
1.96
2.60
3.55
1.63
1.88
2.44
3.29
1.60
1.82
2.35
3.13
1.57
1.79
2.28
3.02
1.53
1.74
2.19
2.87
1.51
1.70
2.14
2.78
1.50
1.68
2.10
2.72
36
0.100
0.050
0.010
0.001
1.78
2.11
2.86
3.99
1.73
2.03
2.72
3.76
1.68
1.95
2.58
3.51
1.63
1.87
2.43
3.26
1.59
1.81
2.33
3.10
1.56
1.78
2.26
2.98
1.53
1.73
2.18
2.84
1.51
1.69
2.12
2.75
1.49
1.67
2.08
2.69
37
0.100
0.050
0.010
0.001
1.78
2.10
2.84
3.96
1.73
2.02
2.71
3.73
1.68
1.95
2.56
3.48
1.62
1.86
2.41
3.23
1.58
1.81
2.31
3.07
1.56
1.77
2.25
2.95
1.52
1.72
2.16
2.81
1.50
1.68
2.10
2.72
1.48
1.66
2.06
2.66
38
0.100
0.050
0.010
0.001
1.77
2.09
2.83
3.93
1.72
2.02
2.69
3.70
1.67
1.94
2.55
3.45
1.61
1.85
2.40
3.20
1.58
1.80
2.30
3.04
1.55
1.76
2.23
2.92
1.52
1.71
2.14
2.78
1.49
1.68
2.09
2.69
1.48
1.65
2.05
2.63
39
0.100
0.050
0.010
0.001
1.77
2.08
2.81
3.90
1.72
2.01
2.68
3.67
1.67
1.93
2.54
3.43
1.61
1.85
2.38
3.17
1.57
1.79
2.29
3.01
1.55
1.75
2.22
2.90
1.51
1.70
2.13
2.75
1.49
1.67
2.07
2.66
1.47
1.65
2.03
2.60
40
0.100
0.050
0.010
0.001
1.76
2.08
2.80
3.87
1.71
2.00
2.66
3.64
1.66
1.92
2.52
3.40
1.61
1.84
2.37
3.14
1.57
1.78
2.27
2.98
1.54
1.74
2.20
2.87
1.51
1.69
2.11
2.73
1.48
1.66
2.06
2.64
1.47
1.64
2.02
2.57
50
0.100
0.050
0.010
0.001
1.73
2.03
2.70
3.67
1.68
1.95
2.56
3.44
1.63
1.87
2.42
3.20
1.57
1.78
2.27
2.95
1.53
1.73
2.17
2.79
1.50
1.69
2.10
2.68
1.46
1.63
2.01
2.53
1.44
1.60
1.95
2.44
1.42
1.58
1.91
2.38
60
0.100
0.050
0.010
0.001
1.71
1.99
2.63
3.54
1.66
1.92
2.50
3.32
1.60
1.84
2.35
3.08
1.54
1.75
2.20
2.83
1.50
1.69
2.10
2.67
1.48
1.65
2.03
2.55
1.44
1.59
1.94
2.41
1.41
1.56
1.88
2.32
1.40
1.53
1.84
2.25
120
0.100
0.050
0.010
0.001
1.65
1.91
2.47
3.24
1.60
1.83
2.34
3.02
1.55
1.75
2.19
2.78
1.48
1.66
2.03
2.53
1.44
1.60
1.93
2.37
1.41
1.55
1.86
2.26
1.37
1.50
1.76
2.11
1.34
1.46
1.70
2.02
1.32
1.43
1.66
1.95
784
APÉNDICE A
Tablas
TABLA A.8 Puntos porcentuales superiores para la distribución de rango studentizado qv1, v2
a
0
qn1, n2, a
v1
v2
1
2
3
4
5
6
7
8
9
10
11
12
A
2
3
4
5
6
0.10 8.93 13.44 16.36 18.49 20.15
0.05 17.97 26.98 32.82 37.08 40.41
0.01 90.02 135.0 164.3 185.6 202.2
0.10 4.13 5.73 6.77 7.54 8.14
0.05 6.08 8.33 9.80 10.88 11.74
0.01 14.04 19.02 22.29 24.72 26.63
0.10 3.33 4.47 5.20 5.74 6.16
0.05 4.50 5.91 6.82 7.50 8.04
0.01 8.26 10.62 12.17 13.33 14.24
0.10 3.01 3.98 4.59 5.04 5.39
0.05 3.93 5.04 5.76 6.29 6.71
0.01 6.51 8.12 9.17 9.96 10.58
0.10 2.85 3.72 4.26 4.66 4.98
0.05 3.64 4.60 5.22 5.67 6.03
0.01 5.70 6.98 7.80 8.42 8.91
0.10 2.75 3.56 4.07 4.44 4.73
0.05 3.46 4.34 4.90 5.31 5.63
0.01 5.24 6.33 7.03 7.56 7.97
0.10 2.68 3.45 3.93 4.28 4.55
0.05 3.34 4.16 4.68 5.06 5.36
0.01 4.95 5.92 6.54 7.01 7.37
0.10 2.63 3.37 3.83 4.17 4.43
0.05 3.26 4.04 4.53 4.89 5.17
0.01 4.75 5.64 6.20 6.63 6.96
0.10 2.59 3.32 3.76 4.08 4.34
0.05 3.20 3.95 4.42 4.76 5.02
0.01 4.60 5.43 5.96 6.35 6.66
0.10 2.56 3.27 3.70 4.02 4.26
0.05 3.15 3.88 4.33 4.65 4.91
0.01 4.48 5.27 5.77 6.14 6.43
0.10 2.54 3.23 3.66 3.96 4.20
0.05 3.11 3.82 4.26 4.57 4.82
0.01 4.39 5.15 5.62 5.97 6.25
0.10
0.05
0.01
2.52
3.08
4.32
3.20
3.77
5.05
3.62
4.20
5.50
3.92
4.51
5.84
4.16
4.75
6.10
7
8
9
10
11
12
13
14
15
21.51
43.12
215.8
8.63
12.44
28.20
6.51
8.48
15.00
5.68
7.05
11.10
5.24
6.33
9.32
4.97
5.90
8.32
4.78
5.61
7.68
4.65
5.40
7.24
4.54
5.24
6.91
4.47
5.12
6.67
4.40
5.03
6.48
22.64
45.40
227.2
9.05
13.03
29.53
6.81
8.85
15.64
5.93
7.35
11.55
5.46
6.58
9.67
5.17
6.12
8.61
4.97
5.82
7.94
4.83
5.60
7.47
4.72
5.43
7.13
4.64
5.31
6.88
4.57
5.20
6.67
23.62
47.36
237.0
9.41
13.54
30.68
7.06
9.18
16.20
6.14
7.60
11.93
5.65
6.80
9.97
5.34
6.32
8.87
5.14
6.00
8.17
4.99
5.77
7.68
4.87
5.59
7.33
4.78
5.46
7.05
4.71
5.35
6.84
24.48
49.07
245.6
9.72
13.99
31.69
7.29
9.46
16.69
6.33
7.83
12.27
5.82
6.99
10.24
5.50
6.49
9.10
5.28
6.16
8.37
5.13
5.92
7.86
5.01
5.74
7.49
4.91
5.60
7.21
4.84
5.49
6.99
25.24
50.59
253.2
10.01
14.39
32.59
7.49
9.72
17.13
6.49
8.03
12.57
5.97
7.17
10.48
5.64
6.65
9.30
5.41
6.30
8.55
5.25
6.05
8.03
5.13
5.87
7.65
5.03
5.72
7.36
4.95
5.61
7.13
25.92
51.96
260.0
10.26
14.75
33.40
7.67
9.95
17.53
6.65
8.21
12.84
6.10
7.32
10.70
5.76
6.79
9.49
5.53
6.43
8.71
5.36
6.18
8.18
5.23
5.98
7.78
5.13
5.83
7.49
5.05
5.71
7.25
26.54
53.20
266.2
10.49
15.08
34.13
7.83
10.15
17.89
6.78
8.37
13.09
6.22
7.47
10.89
5.87
6.92
9.65
5.64
6.55
8.86
5.46
6.29
8.31
5.33
6.09
7.91
5.23
5.93
7.60
5.15
5.81
7.36
27.10
54.33
271.8
10.70
15.38
34.81
7.98
10.35
18.22
6.91
8.52
13.32
6.34
7.60
11.08
5.98
7.03
9.81
5.74
6.66
9.00
5.56
6.39
8.44
5.42
6.19
8.03
5.32
6.03
7.71
5.23
5.90
7.46
27.62
55.36
277.0
10.89
15.65
35.43
8.12
10.52
18.52
7.02
8.66
13.53
6.44
7.72
11.24
6.07
7.14
9.95
5.83
6.76
9.12
5.64
6.48
8.55
5.51
6.28
8.13
5.40
6.11
7.81
5.31
5.99
7.56
4.35
4.95
6.32
4.51
5.12
6.51
4.65
5.27
6.67
4.78
5.40
6.81
4.89
5.51
6.94
4.99
5.62
7.06
5.08
5.71
7.17
5.16
5.80
7.26
5.24
5.88
7.36
Continúa en la página 785
APÉNDICE A
Tablas
785
TABLA A.8 Puntos porcentuales superiores para la distribución de rango studentizado qv1, v2 (continuación)
v1
v2
13
A
0.10
0.05
0.01
2
2.50
3.06
4.26
3
3.18
3.73
4.96
4
3.59
4.15
5.40
5
3.88
4.45
5.73
6
4.12
4.69
5.98
7
4.30
4.88
6.19
8
4.46
5.05
6.37
9
4.60
5.19
6.53
10
4.72
5.32
6.67
11
4.83
5.43
6.79
12
4.93
5.53
6.90
13
5.02
5.63
7.01
14
5.10
5.71
7.10
15
5.18
5.79
7.19
14
0.10
0.05
0.01
2.49
3.03
4.21
3.16
3.70
4.89
3.56
4.11
5.32
3.85
4.41
5.63
4.08
4.64
5.88
4.27
4.83
6.08
4.42
4.99
6.26
4.56
5.13
6.41
4.68
5.25
6.54
4.79
5.36
6.66
4.88
5.46
6.77
4.97
5.55
6.87
5.05
5.64
6.96
5.12
5.72
7.05
15
0.10
0.05
0.01
2.48
3.01
4.17
3.14
3.67
4.84
3.54
4.08
5.25
3.83
4.37
5.56
4.05
4.60
5.80
4.23
4.78
5.99
4.39
4.94
6.16
4.52
5.08
6.31
4.64
5.20
6.44
4.75
5.31
6.55
4.84
5.40
6.66
4.93
5.49
6.76
5.01
5.58
6.84
5.08
5.65
6.93
16
0.10
0.05
0.01
2.47
3.00
4.13
3.12
3.65
4.79
3.52
4.05
5.19
3.80
4.33
5.49
4.03
4.56
5.72
4.21
4.74
5.92
4.36
4.90
6.08
4.49
5.03
6.22
4.61
5.15
6.35
4.71
5.26
6.46
4.81
5.35
6.56
4.89
5.44
6.66
4.97
5.52
6.74
5.04
5.59
6.82
17
0.10
0.05
0.01
2.46
2.98
4.10
3.11
3.63
4.74
3.50
4.02
5.14
3.78
4.30
5.43
4.00
4.52
5.66
4.18
4.71
5.85
4.33
4.86
6.01
4.46
4.99
6.15
4.58
5.11
6.27
4.68
5.21
6.38
4.77
5.31
6.48
4.86
5.39
6.57
4.93
5.47
6.66
5.01
5.55
6.73
18
0.10
0.05
0.01
2.45
2.97
4.07
3.10
3.61
4.70
3.49
4.00
5.09
3.77
4.28
5.38
3.98
4.49
5.60
4.16
4.67
5.79
4.31
4.82
5.94
4.44
4.96
6.08
4.55
5.07
6.20
4.65
5.17
6.31
4.75
5.27
6.41
4.83
5.35
6.50
4.90
5.43
6.58
4.98
5.50
6.65
19
0.10
0.05
0.01
2.44
2.96
4.05
3.09
3.59
4.67
3.47
3.98
5.05
3.75
4.25
5.33
3.97
4.47
5.55
4.14
4.65
5.73
4.29
4.79
5.89
4.42
4.92
6.02
4.53
5.04
6.14
4.63
5.14
6.25
4.72
5.23
6.34
4.80
5.32
6.43
4.88
5.39
6.51
4.95
5.46
6.58
20
0.10
0.05
0.01
2.44
2.95
4.02
3.08
3.58
4.64
3.46
3.96
5.02
3.74
4.23
5.29
3.95
4.45
5.51
4.12
4.62
5.69
4.27
4.77
5.84
4.40
4.90
5.97
4.51
5.01
6.09
4.61
5.11
6.19
4.70
5.20
6.29
4.78
5.28
6.37
4.85
5.36
6.45
4.92
5.43
6.52
24
0.10
0.05
0.01
2.42
2.92
3.96
3.05
3.53
4.55
3.42
3.90
4.91
3.69
4.17
5.17
3.90
4.37
5.37
4.07
4.54
5.54
4.21
4.68
5.69
4.34
4.81
5.81
4.45
4.92
5.92
4.54
5.01
6.02
4.63
5.10
6.11
4.71
5.18
6.19
4.78
5.25
6.26
4.85
5.32
6.33
30
0.10
0.05
0.01
2.40
2.89
3.89
3.02
3.49
4.45
3.39
3.85
4.80
3.65
4.10
5.05
3.85
4.30
5.24
4.02
4.46
5.40
4.16
4.60
5.54
4.28
4.72
5.65
4.38
4.82
5.76
4.47
4.92
5.85
4.56
5.00
5.93
4.64
5.08
6.01
4.71
5.15
6.08
4.77
5.21
6.14
40
0.10
0.05
0.01
2.38
2.86
3.82
2.99
3.44
4.37
3.35
3.79
4.70
3.60
4.04
4.93
3.80
4.23
5.11
3.96
4.39
5.27
4.10
4.52
5.39
4.21
4.63
5.50
4.32
4.74
5.60
4.41
4.82
5.69
4.49
4.90
5.76
4.56
4.98
5.83
4.63
5.05
5.90
4.69
5.11
5.96
60
0.10
0.05
0.01
2.36
2.83
3.76
2.96
3.40
4.28
3.31
3.74
4.59
3.56
3.98
4.82
3.75
4.16
4.99
3.91
4.31
5.13
4.04
4.44
5.25
4.16
4.55
5.36
4.25
4.65
5.45
4.34
4.73
5.53
4.42
4.81
5.60
4.49
4.88
5.67
4.56
4.94
5.73
4.62
5.00
5.79
120
0.10
0.05
0.01
2.34
2.80
3.70
2.93
3.36
4.20
3.28
3.68
4.50
3.52
3.92
4.71
3.71
4.10
4.87
3.86
4.24
5.01
3.99
4.36
5.12
4.10
4.47
5.21
4.19
4.56
5.30
4.28
4.64
5.38
4.35
4.71
5.44
4.42
4.78
5.50
4.48
4.84
5.56
4.54
4.90
5.61
∞
0.10
0.05
0.01
2.33
2.77
3.64
2.90
3.31
4.12
3.24
3.63
4.40
3.48
3.86
4.60
3.66
4.03
4.76
3.81
4.17
4.88
3.93
4.29
4.99
4.04
4.39
5.08
4.13
4.47
5.16
4.21
4.55
5.23
4.28
4.62
5.29
4.35
4.68
5.35
4.41
4.74
5.40
4.47
4.80
5.45
786
APÉNDICE A
Tablas
TABLA A.9 Constantes de diagramas de control
n
A2
A3
B3
B4
D3
D4
c4
d2
2
3
4
5
6
1.880
1.023
0.729
0.577
0.483
2.659
1.954
1.628
1.427
1.287
0.000
0.000
0.000
0.000
0.030
3.267
2.568
2.266
2.089
1.970
0.000
0.000
0.000
0.000
0.000
3.267
2.575
2.282
2.114
2.004
0.7979
0.8862
0.9213
0.9400
0.9515
1.128
1.693
2.059
2.326
2.534
7
8
9
10
11
0.419
0.373
0.337
0.308
0.285
1.182
1.099
1.032
0.975
0.927
0.118
0.185
0.239
0.284
0.321
1.882
1.815
1.761
1.716
1.679
0.076
0.136
0.184
0.223
0.256
1.924
1.864
1.816
1.777
1.744
0.9594
0.9650
0.9693
0.9727
0.9754
2.704
2.847
2.970
3.078
3.173
12
13
14
15
16
0.266
0.249
0.235
0.223
0.212
0.866
0.850
0.817
0.789
0.763
0.354
0.382
0.406
0.428
0.448
1.646
1.618
1.594
1.572
1.552
0.283
0.307
0.328
0.347
0.363
1.717
1.693
1.672
1.653
1.637
0.9776
0.9794
0.9810
0.9823
0.9835
3.258
3.336
3.407
3.472
3.532
17
18
19
20
21
0.203
0.194
0.187
0.180
0.173
0.739
0.718
0.698
0.680
0.663
0.466
0.482
0.497
0.510
0.523
1.534
1.518
1.503
1.490
1.477
0.378
0.391
0.403
0.415
0.425
1.622
1.609
1.597
1.585
1.575
0.9845
0.9854
0.9862
0.9869
0.9876
3.588
3.640
3.689
3.735
3.778
22
23
24
25
0.167
0.162
0.157
0.153
0.647
0.633
0.619
0.606
0.534
0.545
0.555
0.565
1.466
1.455
1.445
1.435
0.434
0.443
0.452
0.459
1.566
1.557
1.548
1.541
0.9882
0.9887
0.9892
0.9896
3.819
3.858
3.895
3.931
√
√
√
Para n > 25: A3 ≈ 3/ n, B3 ≈ 1 − 3/ 2n, y B4 ≈ 1 + 3/ 2n.
Apéndice
B
Derivadas parciales
Este apéndice presenta los mecanismos para calcular las derivadas parciales que se necesitan
en la sección 3.4. Se inicia recordando que una derivada especifica la razón de cambio de una
variable con respecto a la otra. Por ejemplo, el volumen y de una esfera cuyo radio r está dado por y ⫽ 4πr3. Si a r se le permite aumentar (o disminuir) la razón con la cual y aumenta
(o disminuye) está dada por la derivada de y con respecto a r: dy/dr ⫽ 12πr2.
Las derivadas parciales se necesitan cuando la cantidad cuya razón de cambio se está
calculando es una función de más de una variable. Aquí se presenta un ejemplo. El volumen
y de un cilindro cuyo radio r y altura h está dado por y ⫽ πr2h. Si alguna de las dos, r o h
cambian, y también lo hará. Ahora imagine que h es una constante y que a r se le permite aumentar. La razón de aumento en y está dada por la derivada parcial de y con respecto a r.
Esta derivada se denota por ∂y/∂r, y se calcula exactamente como la derivada ordinaria de y
con respecto a r, tratando a h como una constante: ∂y/∂r ⫽ 2πrh.
Ahora suponga que r es una constante, y que h está aumentando. La razón de aumento
en y es la derivada parcial de y con respecto a h, que se denota por ∂y/∂h. Ésta se calcula
exactamente como la derivada ordinaria de y con respecto a h, tratando a r como una constante: ∂y/∂h ⫽ πr2.
Si y es una función de varias variables, y ⫽ f(x1, x2, . . . , xn), entonces la derivada
parcial de y con respecto a una de las variables x1, x2, . . . , xn se calcula de la misma
forma que la derivada ordinaria, manteniendo a las otras variables constantes.
Los ejemplos B.1 y B.2 muestran que el cálculo de derivadas parciales no es más difícil que el cálculo de derivadas ordinarias.
Ejemplo
B.1
Sea y ⫽ 12x2y ⫹ 3xy2. Determine las derivadas parciales de y con respecto a x y y.
Solución
Para calcular ∂y/∂x, manteniendo a y constante, y calculando la derivada con respecto a x. El
resultado es
787
788
APÉNDICE B
Derivadas parciales
∂v
= 24xy + 3y 2
∂x
Para calcular ∂y/∂y, manteniendo a x constante, y calculando la derivada con respecto a y. El
resultado es
∂v
= 12x 2 + 6xy
∂y
Ejemplo
B.2
Sea v =
x 3 y + y 3 z − xz3
. Determine las derivadas parciales de y con respecto a x, y, y z.
x 2 + y 2 + z2
Solución
Para calcular ∂y/∂x, manteniendo tanto a y como a z constantes, y calculando la derivada con
respecto a x, utilizando la regla del cociente:
∂v
(3x 2 y − z3 )(x 2 + y 2 + z2 ) − (x 3 y + y 3 z − xz3 )(2x)
=
∂x
(x 2 + y 2 + z2 )2
De manera semejante se calculan las derivadas parciales de y con respecto a y y a z:
(x 3 + 3y 2 z)(x 2 + y 2 + z2 ) − (x 3 y + y 3 z − xz3 )(2y)
∂v
=
∂y
(x 2 + y 2 + z2 )2
∂v
(y 3 − 3xz2 )(x 2 + y 2 + z2 ) − (x 3 y + y 3 z − xz3 )(2z)
=
∂z
(x 2 + y 2 + z2 )2
Ejercicios para el apéndice B
En los siguientes ejercicios, calcule todas las derivadas parciales.
√ 2
x + 4y 2 + 3z2
1. v = 3x + 2xy 4
6. w =
2. w =
7. z = ln(x 2 + y 2 )
x3 + y3
x2 + y2
3. z = cos x sen y
2
2
4. v = exy
5. v = ex (cos y + sen z)
8. v = ey cos(xz) + ln(x 2 y + z)
2xy 3 − 3xy 2
√
xy
√
10. z = sen(x 2 y)
9. v =
Apéndice
C
Bibliografía
Agresti, A. (1996). An Introduction to Categorical Data Analysis. John Wiley & Sons, Nueva York. Un autorizado y completo tratado del tema.
Belsey, D., Kuh, E. y Welsch, R. (1980). Regression Diagnostics: Identifying Influential Data and Sources of Collinearity. John Wiley & Sons, Nueva York. Una presentación de métodos para evaluar la confiabilidad de las estimaciones de regresión.
Bevington, P. y Robinson, D. (2002). Data Reduction and Error Analysis for the Physical
Sciences, 3a. ed. McGraw-Hill, Boston. Una introducción al análisis de datos con énfasis en
la propagación del error y su cálculo.
Bickel, P. y Doksum, K. (2001). Mathematical Statistics: Basic Ideas and Selected Topics,
vol. 1, 2a. ed. Prentice-Hall, Upper Saddle River, NJ. Un minucioso tratado de los principios
matemáticos de la estadística en un nivel bastante avanzado.
Box, G. y Draper, N. (1987). Empirical Model-Building and Response Surfaces. John Wiley
& Sons, Nueva York. Una excelente introducción práctica al ajuste de curvas y superficies de
alto orden de los datos.
Box, G., Hunter, W. y Hunter, J. (1978). Statistics for Experimenters. John Wiley & Sons,
Nueva York. Una introducción práctica e intuitiva de los principios básicos del análisis de datos y diseño experimental.
Brockwell, R. y Davis, R. (2002). Introduction to Time Series and Forecasting, 2a. ed. Springer-Verlag, Nueva York. Un excelente texto introductorio a nivel de licenciatura, más riguroso que Chatfield (2003).
Casella, G. y Berger, R. (2002). Statistical Inference, 2a. ed. Duxbury, Pacific Grove, CA. Un
riguroso desarrollo de la teoría de la estadística.
Chatfield, C. (2003). An Analysis of Time Series: An Introduction, 6a. ed. CRC Press, Boca
Raton, FL. Una presentación intuitiva, en un nivel un poco menos avanzado que Brockwell y
Davis (2002).
789
790
APÉNDICE C
Bibliografía
Chatfield, C. (1983). Statistics for Technology, 3a. ed., revisada. Chapman y Hall/CRC, Boca
Raton, FL. Una obvia y concisa introducción de los principios básicos de la estadística, orientado a los ingenieros y científicos.
Cochran, W. (1977). Sampling Techniques, 3a. ed. John Wiley & Sons, Nueva York. Una explicación completa de la teoría del muestreo.
Cook, D. y Weisberg, S. (1994). An Introduction to Regression Graphics. John Wiley & Sons,
Nueva York. Una presentación de los métodos interactivos para el análisis de datos con modelos lineales.
DeGroot, M. y Schervish, M. (2002). Probability and Statistics, 3a. ed. Addison-Wesley, Reading, MA. Una introducción muy entendible en un nivel matemático un poco más alto que este libro.
Draper, N. y Smith, H. (1998). Applied Regression Analysis, 3a. ed. John Wiley & Sons, Nueva York. Un tratado amplio y autorizado de la regresión lineal.
Efron, B. y Tibshirani, R. (1993). An Introduction to the Bootstrap. Chapman and Hall, Nueva York. Una clara y completa introducción a los métodos de estimación por bootstrap.
Freedman, D., Pisani, R. y Purves, R. (1998). Statistics, 3a. ed. Norton, Nueva York. Una excelente introducción a los principios fundamentales de la estadística.
Hocking, R. (2003). Methods and Applications of Linear Models: Regression and the Analysis of Variance, 2a. ed. John Wiley & Sons, Nueva York. Un minucioso tratado de la teoría y
aplicaciones de la regresión y del análisis de varianza.
Kenett, R. y Zacks, S. (1998). Modern Industrial Statistics. Brooks/Cole, Pacific Grove, California. Un tratado de actualización del tema con énfasis en la ingeniería industrial.
Larsen, R. y Marx, M. (2001). An Introduction to Mathematical Statistics and Its Applications, 3a. ed. Prentice-Hall, Upper Saddle River, NJ. Una introducción a la estadística en un
nivel matemático superior a este libro. Contiene muy buenos ejemplos.
Lee, P. (1997). Bayesian Statistics: An Introduction, 2a. ed. Oxford University Press, Nueva
York. Una introducción clara y básica a los métodos estadísticos basados en el punto de vista subjetivo de la probabilidad.
Lehmann, E. (1998). Nonparametrics: Statistical Methods Based on Ranks. Pearson, Nueva
York. Una minuciosa presentación de los métodos libres de distribución.
Miller, A. (2002). Subset Selection in Regression, 2a. ed. Chapman and Hall, Londres. Un
fuerte y conciso tratado de los principios básicos de la selección de modelos.
Miller, R. (1997). Beyond ANOVA: The Basics of Applied Statistics. Chapman and Hall/CRC,
Boca Raton, FL. Un tratado muy práctico e intuitivo de los métodos útiles para el análisis de
datos reales, cuando no se satisfacen los supuestos usuales.
Montgomery, D. (2001a). Design and Analysis of Experiments, 5a. ed. John Wiley & Sons,
Nueva York. Una minuciosa exposición de los métodos de los experimentos factoriales dirigidos a aplicaciones en ingeniería.
Montgomery, D. (200lb). Introduction to Statistical Quality Control, 4a. ed. John Wiley &
Sons, Nueva York. Una completa e inteligible introducción al tema.
APÉNDICE C
Bibliografía
791
Mood, A., Graybill, F. y Boes, D. (1974). Introduction to the Theory of Statistics, 3a. ed. McGraw-Hill, Boston. Una introducción clásica a la estadística matemática y una excelente referencia bibliográfica.
Mosteller, F. y Tukey, J. (1977). Data Analysis and Regression. Addison-Wesley, Reading,
MA. Una intuitiva y filosófica presentación de algunas ideas prácticas.
Rice, J. (1995). Mathematical Statistics and Data Analysis, 2a. ed. Wadsworth, Belmont, CA.
Una buena mezcla de teoría y práctica, en un nivel un poco más alto que este libro.
Ross, S. (2001). A First Course in Probability, 6a. ed. Prentice-Hall, Upper Saddle River, NJ.
Una introducción sofisticadamente matemática a la probabilidad.
Ross, S. (2004). Introduction to Probability and Statistics for Engineers and Scientists, 3a. ed.
Harcourt/Academic Press, San Diego. Una introducción a un nivel matemático un poco superior a este libro.
Salsburg, D. (2001). The Lady Tasting Tea. W. H. Freeman and Company, Nueva York. Un
análisis perspicaz de la influencia de la estadística en la ciencia del siglo XX, con muchas
anécdotas fascinantes de estadígrafos famosos. En este libro se puede encontrar la historia en
la sección 4.3 acerca del descubrimiento de Student de que el número de partículas en una
suspensión seguía una distribución de Poisson.
Tanur, J., Pieters, R. y Mosteller, F. (eds.) (1989). Statistics: A Guide to the Unknown, 3a. ed.
Wadsworth/Brooks-Cole, Pacific Grove, CA. Un conjunto de estudios de caso que muestra
muchas aplicaciones estadísticas.
Taylor, J. (1997). An Introduction to Error Analysis, 2a. ed. University Science Books, Sausalito, CA. Un minucioso tratado de la propagación del error, junto con una selección de otros
temas en los análisis de datos.
Tufte, E. (2001). The Visual Display of Quantitative Information, 2a. ed. Graphics Press,
Cheshire, CT. Una clara y fascinante demostración de los principios efectivos de las gráficas
estadísticas; contiene numerosos ejemplos.
Tukey, J. (1977). Exploratory Data Analysis. Addison-Wesley, Reading, MA. Una riqueza de
técnicas para resumir y describir datos.
Wackerly, D., Mendenhall, W. y Scheaffer, R. (2002). Mathematical Statistics with Applications, 6a. ed. Duxbury, Pacific Grove, CA. Una introducción a la estadística en un nivel matemático un poco superior a este libro.
Weisberg, S. (1985). Applied Linear Regression, 2a. ed. John Wiley & Sons, Nueva York. Una
introducción concisa de las aplicaciones de los modelos de regresión lineal, incluyendo diagnósticos, construcción de modelos e interpretación de resultados.
Respuestas a los
ejercicios impares
Sección 1.1
1. a) La población consta de todos los tornillos de la remesa. Es tangible.
b) La población consta de todas las mediciones que se hicieron en el resistor con el óhmetro. Es conceptual.
c) La población consta de todos los habitantes del pueblo. Es tangible.
d ) La población consta de todas las soldaduras que pudieron haberse hecho con el proceso. Es conceptual.
e) La población consta de todas las partes fabricadas ese día. Es tangible.
3. a) Falso
b) Verdadero
5. a) No. Lo importante es la proporción poblacional de defectos: el porcentaje de la muestra es sólo una aproximación.
La proporción poblacional para el nuevo proceso puede, en efecto, ser mayor o menor que la del proceso anterior.
b) No. La proporción poblacional para el nuevo proceso puede ser 10% o mayor, aun cuando la proporción muestral
fue de sólo 9%.
c) Encontrando dos botellas defectuosas en la muestra.
7. Un buen conocimiento del proceso que produce los datos.
Sección 1.2
1. Falso.
3. No. En las muestras 1, 2, 4, la media es 7/3, que no aparece en toda la muestra.
5. El tamaño de la muestra puede ser cualquier número impar.
7. La media y la desviación estándar aumentan 5%.
9. La media es 2.45, la mediana es 3 y la desviación estándar es 1.2999.
792
Respuestas a los ejercicios impares
793
11. a) Sí, la media es 2.45.
b) Sí, la mediana es 3.
c) No, la desviación estándar de la muestra depende del tamaño de la muestra.
13. a) Todo se multiplicaría por 2.54.
b) No exactamente lo mismo, puesto que las mediciones serían un poco diferentes la segunda vez.
15. No existe un cuarto cuartil. Hay tres cuartiles; son los puntos que dividen los datos en cuatro grupos iguales.
Sección 1.3
1. a)
Tallos
11
12
13
14
15
16
17
18
19
20
Hojas
6
678
13678
13368
126678899
122345556
013344467
1333558
2
3
0.2
b) Aquí se muestra un histograma. Son posibles otras elecciones
para los puntos finales.
Densidad
0.15
0.1
0.05
0
c)
10
12
14
16
18
Peso (oz)
20
22
24
11
13 14 15 16 17 18 19
Peso (oz)
21
794
Respuestas a los ejercicios impares
d)
22
Peso (oz)
20
18
16
El diagrama de puntos no muestra datos atípicos.
14
12
10
3.
Tallo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
Hoja
1588
00003468
0234588
0346
2235666689
00233459
113558
568
1225
1
2
06
1
6
9
3
Hay 23 tallos en esta gráfica; una de sus ventajas sobre la de la figura 1.6 consiste en que los valores están dados con
dígitos en los décimos en lugar de un dígito. Una desventaja es que hay muchos tallos, y muchos de éstos están vacíos.
Respuestas a los ejercicios impares
795
5. a) Aquí se muestran los histogramas en cada grupo. Otras elecciones para los puntos extremos son posibles.
0.4
0.25
0.3
Densidad
Densidad
0.2
0.15
0.1
0.1
0.05
0
b)
0.2
18 19 20 21 22 23 24 25 26
Grupo 1 de mediciones (cm)
0
15 16 17 18 19 20 21 22 23 24 25
Grupo 2 de mediciones (cm)
30
Mediciones (cm)
25
20
15
10
Grupo 2
Grupo 1
c) Las mediciones en el grupo 1 son por lo general mayores que en el grupo 2. Las mediciones en el grupo 1 no están
lejos de ser simétricas, aunque el diagrama de caja sugiere un ligero sesgo a la izquierda, puesto que la mediana está más cerca del tercer cuartil que del primero. No hay datos atípicos. La mayoría de las mediciones del grupo 2 están muy concentradas en el rango angosto y sesgadas a la izquierda dentro del rango. Las cuatro mediciones restantes
son datos atípicos.
7. a) Cercano al 25%
b) 130-135 mm
9. ii)
12
10
8
11. a) A: 4.60, B: 3.86
c) 12%
b) Sí
6
4
2
0
c) No. El valor mínimo de
–2.235 es un “dato atípico”
ya que está a más de 1.5 veces del rango intercuartil
debajo del primer cuartil.
El bigote inferior se extiende al dato menor que no es
un dato atípico, pero el valor del punto no está dado.
796
Respuestas a los ejercicios impares
Tensión de fractura (MPa)
13. a)
500
b) El diagrama de caja indica que el valor 470 es un dato
atípico.
400
c)
300
0
200
200
300
Tensión de fractura (MPa)
60
50
40
y 30
La relación es no lineal.
20
10
0
5
10
x
15
b)
4
3.5
ln y
3
2.5
La relación es aproximadamente lineal.
2
1.5
1
0.5
0
400
500
d ) El diagrama de caja indica que el valor 384 está alejado del volumen de los datos y se pudiera considerar un
dato atípico.
100
0
15. a)
100
5
x
10
15
c) Sería más fácil trabajar con x y ln y, porque la relación es aproximadamente lineal.
Respuestas a los ejercicios impares
797
Ejercicios adicionales para el capítulo 1
1. a) La media se dividirá entre 2.2.
b) La desviación estándar estará dividida entre 2.2.
3. a) Falso
b) Verdadero
c) Falso
d ) Verdadero
5. a) No es posible decir cuánto cambia la media.
b) Si hay más de dos números aleatorios en la lista, la mediana no cambia. Si hay sólo dos números en la lista, la mediana cambia, pero no se puede decir cuánto.
c) No es posible decir cuánto cambia la desviación estándar.
7. a) La media disminuye por 0.774.
b) La media cambia a 24.226.
c) La mediana no cambia.
d ) No es posible decir cuánto cambia la desviación estándar.
9. El enunciado i) es verdadero.
11. a) Incorrecto
b) Correcto
c) Incorrecto
d ) Correcto
13. a) Sesgado a la izquierda. El 85o. percentil esta mucho más cercano a la mediana (50o. percentil) que el 15o. percentil. Por tanto, el histograma parece tener una cola izquierda más larga que la cola derecha.
b) Sesgado a la derecha. El 15o. percentil está mucho más cercano a la mediana (50o. percentil) que el 85o. percentil.
Por tanto, el histograma parece tener una cola derecha más larga que la cola izquierda.
15. a)
0.25
Densidad
0.2
0.15
0.1
0.05
0
6
9
12 13 14 15 16 17 18
Log2 de la población
b) 0.14
c) Aproximadamente simétrico
20
23
798
Respuestas a los ejercicios impares
d)
0.25
Densidad
0.2
0.15
0.1
0.05
0
0
2
4
6
Población (en millones)
8
Los datos usando la escala real están muy sesgados a la derecha, por lo que es imposible apreciar las características
del histograma.
17. a)
0.25
Densidad
0.2
0.15
0.1
0.05
0
b) 3.35
19. a)
024
10
c) 1.88
15 20 25 30
Número de propietarios
d ) 7.70
e) 5.95
50
f ) 43.34
70
60
Carga (kg)
50
40
30
20
10
0
Sacaton
Planicie del río Gila Casa Grande
Respuestas a los ejercicios impares
799
b) Cada muestra contiene un dato atípico.
c) En el diagrama de caja de Sacaton, la mediana está aproximadamente a la mitad entre el primer y el tercer cuartiles,
ello sugiere que los datos entre estos cuartiles son bastante simétricos. El bigote superior de la caja es mucho mayor
que el inferior, y hay un dato atípico en el lado superior. Esto último indica que los datos, como un todo, están sesgados a la derecha. En los datos del diagrama de la planicie del río Gila, la mediana está aproximadamente entre el
primer y el tercer cuartiles, lo que sugiere que los datos entre estos cuartiles son bastante simétricos. El bigote superior es ligeramente más largo que el inferior, y hay un dato atípico en el lado superior. Lo anterior sugiere que los
datos, como un todo, están un poco sesgados a la derecha. En el diagrama de caja de Casa Grande la mediana está
muy cerca del primer cuartil. Esto sugiere que hay varios valores muy cercanos entre sí, aproximadamente a un cuarto de distancia de los datos. Los dos bigotes tienen aproximadamente la misma longitud, lo que sugiere que las colas son aproximadamente iguales, excepto para el dato atípico en el lado superior.
Sección 2.1
1. 0.92
3. a) 0.6
b) 0.9
5. a) Falso
b) Verdadero
7. 0.94
9. a) Falso
b) Verdadero c) Falso d) Verdadero
Sección 2.2
1. a) 64
b) 8
c) 24
3. 210
5. 1 048 576
7. a) 368 = 2.8211 × 1012
b) 368 − 268 = 2.6123 × 1012
c) 0.9260
9. 0.5238
Sección 2.3
1. a) 2/10
b) 2/9
c) 1/9
3. Dado que un estudiante es un graduado de ingeniería, es casi cierto que el estudiante tomó un curso de cálculo. Por tanto P(B兩 A) es cercano a 1. Dado que un estudiante tomó un curso de cálculo es mucho menos cierto que es un graduado
de ingeniería, ya que muchos graduados de otras carreras toman cálculo. Por tanto, P(A兩 B) es mucho menor que 1, por
lo que P(B兩 A) ⬎ P(A兩 B).
5. a) 0.018
b) 0.728
c) 0.272
7. a) 0.8
b) 0.125
c) 0.12
d) 0.167
9. a) 0.98
b) 0.02
c) 0.72
d) 0.18
e) 0.88
f) 0.205
g) 0.795
11. a) Los sistemas de medición fallan en forma independiente.
b) Una causa de falla, un incendio, ocasionaría que ambos sistemas de medición fallen. Por tanto, no fallan de manera
independiente.
800
Respuestas a los ejercicios impares
c) Demasiado baja. El cálculo correcto utilizaría P (segundo sistema de medición falla|primer sistema de medición falla) en lugar de P(segundo sistema de medición falla). Porque existe una posibilidad de que ambos sistemas fallen
en un incendio, la condición de que el primer sistema de medición falle aumenta la probabilidad de que el segundo
sistema de medición falle también. Por tanto, P(segundo sistema de medición falla|primer sistema de medición falla) ⬎ P(segundo sistema de medición falla).
b) 2/9
c) 1/15
d) 7/30
e) 3/10
13. a) 3/10
f) No. P (B) =
P (B|A) [o P (A ∩ B) =
P (A)P (B)]
15. n ⫽ 10 000. Los dos componentes son una muestra aleatoria simple proveniente de la población. Cuando la población
es grande, los elementos en una muestra aleatoria simple son casi independientes.
17. a) 0.011
b) 0.0033
19. a) 5.08 × 10−5
21. a) 0.9904
b) 0.9801
b) 0.1
c) 0.0001
c) 0.2154
d) 0.9801
d) 7
23. Para demostrar que Ac y B son independientes, se muestra que P(Ac 艚 B) ⫽ P(Ac)P(B). Ahora B ⫽ (Ac 艚 B) 艛 (A 艚 B),
y (Ac 艚 B) y (A 艚 B) son mutuamente excluyentes. Por tanto P(B) ⫽ P(Ac 艚 B) ⫹ P(A 艚 B); en consecuencia, P(Ac 艚
B) ⫽ P(B) ⫺ P(A 艚 B). Puesto que A y B son independientes, P(A 艚 B) ⫽ P(A)P(B). Por tanto, P(Ac 艚 B) ⫽ P(B) ⫺
P(A)P(B) ⫽P(B)[1 ⫺ P(A)] ⫽ P(Ac)P(B). Para mostrar que A y Bc son independientes, basta con intercambiar A y B en
el argumento anterior. Para mostrar que Ac y Bc son independientes, sustituya B con Bc en el argumento anterior, y utilice el hecho de que A y Bc son independientes.
Sección 2.4
1. a) Discreta
3. a) 2.3
b) 1.81
5. a) c = 0.1
7. a)
b) Continua
x
p1 .x/
0
1
2
3
4
5
0.2
0.16
0.128
0.1024
0.0819
0.0655
c) Discreta
c) 1.345
b) 0.2
c) 3
b)
d)
y
p(y)
d) 1
x
p2 .x/
0
1
2
3
4
5
0.4
0.24
0.144
0.0864
0.0518
0.0311
d) Continua
10
0.4
20
0.2
30
0.2
40
0.1
e) Discreta
50
0.1
e) 23
f) 181
g) 13.45
e) 1
c) p2(x) parece ser el mejor modelo. Todas sus probabilidades están bastante cercanas a las proporciones de los días observados en los datos. En contraste, las probabilidades de 0 y 1 para p1(x) son mucho menores que las proporciones
observadas.
d ) No, esto no es correcto. Los datos son una muestra aleatoria simple, y un modelo representa la población. Las muestras aleatorias simples por lo general no reflejan a la población exactamente.
9. a) 2
b) 0.81
c) 0.09
d) 0.9
e) 0.162
Respuestas a los ejercicios impares
11. a) 0.444
b) 50 µg
13. a) 5 segundos
c) 14.142 µg
b) 5 segundos
d) F (x) =
c) F (t) =
f) 11.5129 segundos
0
(x 2 /2 − 10x + 50)/1 800
1
0
1 − e−0.2t
t <0
t ≥0
x < 10
10 ≤ x < 70
x ≥ 70
d) 0.8647
801
e) 52.426 µg
e) 3.466 segundos
15. Con este proceso la probabilidad de que un anillo satisfaga la especificación es 0.641. Con el proceso del ejercicio 14,
la probabilidad es 0.568. Por tanto, este proceso es mejor que el del ejercicio 14.
17. a) 10
b) 2
Sección 2.5
1. a) µ = 21.0, σ = 1.0
b) µ = 4.8, σ = 0.583
c) µ = 42.9, σ = 1.62
3. µ = 3 500 horas, σ = 44.7 horas
5. a) 0.625 pulg.
7. a) 0.650
9. a) 150 cm
11. a) 0.2993
b) 0.0112 pulg.
b) 0.158
b) 0.447 cm
b) 0.00288
Sección 2.6
1. a) 0.08
b) 0.36
c) 0.86
d) 0.35
e) 0.60
f) 0.65
g) 0.40
3. a) pY |X (0 | 1) = 0.577, pY |X (1 | 1) = 0.308, pY |X (2 | 1) = 0.115
b) pX|Y (0 | 1) = 0.522, pX|Y (1 | 1) = 0.348, pX|Y (2 | 1) = 0.130
c) 0.538
d) 0.609
5. a) µX+Y = 3.90
7. a) 100X + 200Y
b) σX+Y = 1.179
b) 595 ms
c) P (X + Y = 4) = 0.35
c) 188.35
9. a) pX (0) = 0.10, pX (1) = 0.20, pX (2) = 0.30, pX (3) = 0.25, pX (4) = 0.15, pX (x) = 0 si x = 0, 1, 2, 3, o 4
b) p Y (0) = 0.13, pY (1) = 0.21, pY (2) = 0.29, pY (3) = 0.22, pY (4) = 0.15, pY (y) = 0 si y = 0, 1, 2, 3, o 4
c) No. La probabilidad conjunta de la función de masa no es igual al producto de las marginales. Por ejemplo,
p X,Y (0, 0) = 0.05 =
pX (0)pY (0).
d) μ X = 2.15, μY = 2.05
e) σX = 1.1948, σY = 1.2440
f) Cov(X, Y ) = 1.0525
g) ρX,Y = 0.7081
11. a) pY |X (0 | 3) = 0, pY |X (1 | 3) = 0.08, pY |X (2 | 3) = 0.32, pY |X (3 | 3) = 0.40, pY |X (4 | 3) = 0.20
b) pX|Y (0 | 4) = 0, pX|Y (1 | 4) = 0, pX|Y (2 | 4) = 2/15, pX|Y (3 | 4) = 1/3, pX|Y (4 | 4) = 8/15
c) E(Y | X = 3) = 2.72
d) E(X | Y = 4) = 3.4
802
Respuestas a los ejercicios impares
13. a) µZ = 2.55
b) σZ = 1.4309
c) P (Z = 2) = 0.2
15. a) pY |X (0 | 3) = 0.25, pY |X (1 | 3) = 0.25, pY |X (2 | 3) = 0.5
b) p X|Y (0 | 1) = 0.125, pX|Y (1 | 1) = 0.25, pX|Y (2 | 1) = 0.5, pX|Y (3 | 1) = 0.125
c) 1.25
d) 1.625
17. a) −0.000193
19. a) fX (x) =
b) −0.00232
x + 1/2
0
b) f Y |X (y | 0.75) =
0<x<1
para otros valores de x
(4y + 3)/5
0
fY (y) =
0<y<1
para otros valores de y
y + 1/2
0
0<y<1
para otros valores de y
c) E(Y | X = 0.75) = 0.5667
21. a) 0.3
b) 0.45
23. a) f (x, y) =
c) 0.135
e−x−y
0
d) µX = 10
e) µY = 5
f) µA = 50
x>0 y y>0
de otro modo
b) P (X ≤ 1 y Y > 1) = e−1 − e−2 = 0.2325
c) 1
e) 1 − 3e−2 = 0.5940
d) 2
25. a) µ = 40.25, σ = 0.11
b) n ≈ 52
27. a) 0.3X + 0.7Y
b) µ = $6, σ = $2.52
√
c) µ = $6, σ = 0.03 1.4K 2 − 140K + 10 000
d) K = $50
√ 2
e) Para cualquier correlación ρ, el riesgo es 0.03 K + (100 − K)2 + 2ρK(100 − K). Si ρ ⫽1 la cantidad se minimiza cuando K ⫽ 50.
29. a) Cov(aX, bY ) = μ aX·bY −μaX μbY = μabXY − aμX bμY = abμXY −abμX μY = ab(μXY −μX μY ) = ab Cov(X, Y ).
b) ρ aX,bY = Cov(aX, bY )/(σaX σbY ) = ab Cov(X, Y )/(abσX σY ) = Cov(X, Y )/(σX σY ) = ρX,Y .
Ejercicios adicionales para el capítulo 2
1. 0.9997
3. a) 0.15
b) 0.6667
5. 0.271
7. 0.82
9. 1/3
11. a) 0.3996
b) 0.0821
c) f X (x) =
1
2
0
e−x/2
x>0
x≤0
d) f Y (y) =
1
3
e−y/3
0
e) Sí, f (x, y) = f X (x)fY (y).
13. a) 0.0436
b) 0.0114
c) 0.7377
15. 1/3
17. a) µ = 6, σ 2 = 9
b) μ = 4, σ 2 = 10
c) μ = 0, σ 2 = 10
d) μ = 16, σ 2 = 328
y>0
y≤0
Respuestas a los ejercicios impares
803
19. a) Para la concentración de aditivo: p(0.02) ⫽ 0.22, p(0.04) ⫽ 0.19, p(0.06) ⫽ 0.29, p(0.08) ⫽ 0.30 y p(x) ⫽ 0 para
x ⫽ 0.02, 0.04, 0.06 o 0.08. Para la fuerza de tensión: p(100) ⫽ 0.14, p(150) ⫽ 0.36, p(200) ⫽ 0.50 y p(x) ⫽ 0
para x ⫽ 100, 150 o 200.
b) No, X y Y no son independientes. Por ejemplo, P(X ⫽ 0.02 艚 Y ⫽ 100) ⫽ 0.05, pero P(X ⫽ 0.02) P(Y ⫽ 100) ⫽
(0.22)(0.14) ⫽ 0.0308.
c) 0.947
d ) 0.867
e) La concentración sería 0.06.
21. a) p Y |X (100 | 0.06) = 0.138, pY |X (150 | 0.06) = 0.276, pY |X (200 | 0.06) = 0.586
b) p X|Y (0.02 | 100) = 0.357, pX|Y (0.04 | 100) = 0.071, pX|Y (0.06 | 100) = 0.286, pX|Y (0.08|100) = 0.286
c) 172.4
d) 0.0500
23. a) µ = 3.75, σ = 6.68
b) µ = 2.90, σ = 4.91
c) µ = 1.08, σ = 1.81
d ) Bajo el escenario A, 0.85; bajo el escenario B, 0.89 y bajo el escenario C, 0.99.
25. a) La probabilidad conjunta de la función de masa es
b) 0.8
c) 0.6
d) 0.6532
27. a) µX = 9/14 = 0.6429
e) 0.6110
x
0
y
1
0
1
2
0.0667
0.2667
0.1333
0.2000
0.2667
0
f) −0.2133
2
X
b) σ = 199/2 940 = 0.06769
d) ρ X,Y = −25/199 = −0.1256
29. a) pX(0) ⫽ 0.6, pX(1) ⫽ 0.4, pX(x) ⫽ 0 si x ⫽ 0 o 1.
2
0.0667
0
0
g) −0.5345
c) Cov(X, Y ) = −5/588 = −0.008503
b) pY(0) ⫽ 0.4, pY(1) ⫽ 0.6, pY(y) ⫽ 0 si y ⫽ 0 o 1.
c) Sí. Es razonable suponer que el conocimiento del resultado de una moneda no ayudará a predecir el resultado de la
otra.
d) p(0, 0) = 0.24, p(0, 1) = 0.36, p(1, 0) = 0.16, p(1, 1) = 0.24, p(x, y) = 0 para otros valores de (x, y).
31. a) p X,Y (x, y) = 1/9 para x = 1, 2, 3 y y = 1, 2, 3.
c) µX = µY = 2
d) µXY = 4
b) pX (1) = pX (2) = pX (3) = 1/3. pY es igual.
e) Cov(X, Y ) = 0.
Sección 3.1
1. ii)
3. a) Verdadero
b) Falso
c) Falso
d) Verdadero
5. a) No, no se puede determinar la desviación estándar del proceso a partir de una sola medición.
b) Sí, el sesgo se puede calcular igual a 2 lb, ya que la lectura es 2 lb cuando el peso verdadero es 0.
7. a) Sí, la incertidumbre se puede calcular con la desviación estándar de las cinco mediciones, que es 21.3 mg.
b) No, el sesgo no se puede calcular, porque se desconoce el valor verdadero.
9. Se puede tener una medición más precisa restando el sesgo de 26.2 mg, obteniendo 100.8 mg arriba de 1 kg.
11. a) No, están en orden creciente, lo que no es casi nada común para una muestra aleatoria simple.
b) No, puesto que no son una muestra aleatoria simple de una población de posibles mediciones, no se puede calcular
la incertidumbre.
804
Respuestas a los ejercicios impares
Sección 3.2
1. a) 0.6
b) 0.45
c) 1.3
3. 1.01 ± 0.30 mm
5. 378.0 ± 0.5 pulg3
7. 1.04 ± 0.04 cm2 /mol
9. a) 64.04 ± 0.39◦ F
b) 64.04 ± 0.11◦ F
√
11. a) La incertidumbre en el promedio de las nueve mediciones es aproximadamente igual a s/ 9 = 0.081/3 = 0.027 cm.
b) La incertidumbre en una sola medición es aproximadamente igual a s, que es 0.081 cm.
13. a) 87.0 ± 0.7 mL
b) 0.5 mL
c) 25
15. a) A 65 C, la producción es 70.14 ± 0.28. A 80◦ C, la producción es 90.50 ± 0.25.
◦
17. a) 0.016
b) 0.0089
c) La incertidumbre en 12 X + 12 Y es 0.0091. La incertudumbre en
d) c = 0.24; la incertidumbre mínima es 0.0078.
10
15
X+
5
15
Y es 0.011.
Sección 3.3
1. a) 3.2
b) 0.1
c) 0.025
d) 0.1
e) 21.8
f) 0.26
3. 9.80 ± 0.39 m/s2
b) 9.79 ± 0.11 m/s2
5. a) 1.7289 ± 0.0058 s
7. a) 0.2555 ± 0.0005 m/s
b) 0.256 ± 0.026 m/s
c) 0.2555 ± 0.0002 m/s
9. a) 2.3946 ± 0.0011 g/mL
11. a) 0.27%
b) 0.037%
c) 4.0%
d) 0.5%
13. 9.802 m/s2 ± 6.0%
15. a) 1.856 s ± 0.29%
17. a) 0.2513 m/s ± 0.33%
b) 9.799 m/s2 ± 0.54%
b) 0.2513 m/s ± 2.0%
c) 0.2513 m/s ± 0.57%
19. 2.484 g/mL ± 0.19%
Sección 3.4
1. a) 250 ± 16
b) 125 ± 10
c) 17.50 ± 0.56
3. a) 14.25 ± 0.25 MPa
b) Reduciendo la incertidumbre en P1 a 0.2 MPa.
5. a) 1.320 ± 0.075 cm
b) Reduciendo la incertidumbre en p a 0.1 cm.
7. 0.259 ± 0.014 m/s
b) 20.36 ± 0.38
Respuestas a los ejercicios impares
805
9. a) 32.6 ± 3.4 MPa
b) Reduciendo la incertidumbre en k a 0.025 mm−1 .
c) La implementación del proceso reduciría la incertidumbre en τ sólo a 3.0 MPa. Es probable que no valga la pena
implementar el nuevo proceso para una reducción tan pequeña.
11. a) 710.68 ± 0.15 g
b) Reduciendo la incertidumbre en b a 0.1 g.
13. a) 2 264 ± 608 N/mm2
b) R
15. 0.0626 ± 0.0013 min−1
17. a) No, ambos implican las cantidades h y r.
b) 2.68c ± 0.27c
19. 283.49 mm/s ± 2.5%
21. 1.41 cm ± 6.4%
23. 0.487 ± 1.7%
25. 3 347.9 N/mm2 ± 29%
b) 5.965 µm3 ± 30%
27. a) 17.59 µm ± 18%
c) 2.95c ± 11%
d) No
Ejercicios adicionales para el capítulo 3
1. a) 1.8
b) 4.1
3. a) 0.14 mm
c) 15
d) 4.3
b) 0.035 mm
5. a) (1.854 ± 0.073) × 106 W
7. a) 6.57 ± 0.17 kcal
9. a) 26.32 ± 0.33 mm/año
b) 3.9%
b) 2.6%
c) Reduciendo la incertidumbre en H a 0.05.
c) Reduciendo la incertidumbre en la masa a 0.005 g.
b) 3.799 ± 0.048 años
11. 5.70 ± 0.17 mm
13. a) 1.4%
b) Reduciendo la incertidubre en l a 0.5%
15. a) Sí, la fuerza calculada es 80 000 lb en ambos casos.
b) √
No, en el método de cable dúctil los cuadrados de las incertidumbres de los 16 alambres se suman, para obtener σ =
16 × 202 = 80. Para el método de cable quebradizo, la incertidumbre en la fuerza del alambre más débil se multiplica
por el número de alambres para obtener σ = 16 × 20 = 320.
17. a) 113.1 ± 6.1 m3 /s
b) 100.5 ± 5.4 m3 /s
19. a) 10.04 ± 0.95 s−1
b) 10.4 ± 1.2 s−1
c) Sí, la incertidumbre relativa es 5.4%.
c) 0.78
d) 0.63
21. a) 32 833 ± 36 m2
b) 12 894 ± 14 m2
c) Esto no es correcto. Sea s la longitud de un lado del cuadrado. Ya que tanto S como C se calculan en función de s,
no son independientes. Con el fin de comparar a σA en forma correcta, se debe expresar A directamente en función
de s: A = s 2 + 2πs 2 /8 = s 2 (1 + π/4). Por lo que σA = (dA/ds)σs = 2s(1 + π/4)σs = 65 m2 .
23. a) P 3 = 11.16871 ± 0.10 MPa
b) 11.16916
c) No. La diferencia entre los dos cálculos es mucho menor que la incertidumbre.
806
Respuestas a los ejercicios impares
Sección 4.1
1. a) µ = 0.55, σ 2 = 0.2475
b) No. Una variable aleatoria de Bernoulli tiene valores posibles 0 y 1. Los valores posibles de Y son 0 y 2.
c) μ = 1.10, σ 2 = 0.99
3. a) 0.05
b) 0.20
c) 0.23
d) Sí
e) No
f ) No. Si la superficie se decolora y se agrieta, entonces X = 1, Y = 1 y Z = 1, pero X + Y = 2.
5. a) 1/2
b) 1/2
c) 1/4
d) Sí
e) Sí
f ) Sí, si ambas monedas salen “caras”, entonces X = 1, Y = 1 y Z = 1, por lo que Z = XY . Si no, entonces Z = 0,
y ya sea X, Y , o ambas, también son iguales a 0, por lo que nuevamente Z = XY .
7. a) Puesto que los valores posibles de X y Y son 0 y 1, los valores posibles del producto Z = XY son también 0 y 1.
Por tanto, Z es una variable aleatoria de Bernoulli.
b) p Z = P (Z = 1) = P (XY = 1) = P (X = 1 y Y = 1) = P (X = 1)P (Y = 1) = pX pY .
Sección 4.2
1. a) 0.2090
b) 0.2322
3. a) 0.1172
b) 5
5. a) 0.0039
b) 0.2188
7. a) 0.120 ± 0.032
9. a) 0.96
c) 0.1064
c) 2.5
d) 0.0085
e) 3.2
f) 1.92
d) 1.58
c) 0.1445
b) 0.050 ± 0.015
d) 0.9648
c) 0.070 ± 0.036
b) 0.0582
11. a) 1.346 × 10−4
b) Sí, sólo aproximadamente 13 o 14 de cada 100 000 muestras de tamaño 10 tendrían siete o más unidades defectuosas.
c) Sí, debido a que siete unidades en una muestra de tamaño 10 es un número inusualmente grande para un buen cargamento.
d) 0.4557
e) No, en aproximadamente 45% de las muestras de tamaño 10, dos o más unidades estarían defectuosas.
f) No, debido a que dos defectuosas en una muestra de tamaño 10 no es un número inusualmente grande para un buen
cargamento.
13. a) Y = 7X + 300
b) $930
c) $21
15. 0.225 ± 0.064
Sección 4.3
1. a) 0.0733
b) 0.0183
c) 0.0916
d) 0.9084
3. a) 0.2240
b) 0.4232
c) 0.5974
d) 3
5. a) 0.0916
b) 0.1048
c) 0.2381
e) 4
e) 1.73
7. ii)
9. 78 ± 12
11. a) 12.5
b) 7.0
c) 2.5
d) 1.9
e) 5.5 ± 3.1
f) 2
Respuestas a los ejercicios impares
807
13. a) 7.295 × 10⫺3
b) Si la media de la concentración es siete partículas por mL, entonces sólo aproximadamente
siete de cada mil muestras de 1 mL contendrían una o menos partículas.
c) Sí, debido a que una partícula en una muestra de 1 mL es un número inusualmente pequeño si la media de la concentración es siete partículas por mL.
d) 0.4497
e) No. Si la media de la concentración es siete partículas por
mL, entonces aproximadamente 45% de todas las muestras de 1 mL contendrán seis o menos partículas.
f) No, debido a que seis partículas en una muestra de 1 mL no es un número inusualmente pequeño si la media de la
concentración es de siete partículas por mL.
15. 0.271 ⫾ 0.019
Sección 4.4
1. 0.4196
3. 0.0314
5. a) 0.1244
b) 7.5
c) 11.25
7. iv)
9. a) 0.3
b) µX = 1.2
11. a) 0.00890
c) 0.7483
b) 0.1275
Sección 4.5
1. a) 0.8023
b) 0.2478
c) 0.4338
3. a) 0.0073
b) ≈ 420
c) 91o. percentil
5. a) 0.0764
b) 9.062 GPa
7. a) 0.0336
b) Sí, la proporción de días se suspende; en este caso sería de sólo 0.0228.
9. a) 0.06 cm
d) 0.7404
d) 0.4186
c) 12.303 GPa
b) 0.01458 cm
c) 0.2451
d) 0.0502 cm
e) 0.7352
f ) El diámetro de la perforación tendría una media de 15.02 cm. La probabilidad de satisfacer la especificación será
entonces de 0.8294.
11. a) 0.0475
13. a) 7.8125 N/m
15. a) 0.7088
b) 12.07 oz
2
c) 0.0215 oz
b) 4.292 N/m2
b) 0.2912
c) 76.65 N/m2
c) 0.0485
17. a) la media es 114.8 J; la desviación estándar es 5.006 J.
b) Sí, sólo 0.15% de los pernos tendrían torsiones de ruptura menores de 100 J.
c) La media es 117.08 J; la desviación estándar es 8.295 J. Aproximadamente 2% de pernos tendrían torsiones de ruptura menores de 100 J, por lo que el cargamento no sería aceptado.
d) Los pernos del inciso c) son más resistentes.
e) El método efectivamente no es válido para los pernos del inciso c). Esta muestra contiene un dato atípico (140), por
lo que la distribución normal no se debe usar.
808
Respuestas a los ejercicios impares
Sección 4.6
1. a) 3.5966
b) 0.5293
c) 3.3201
d ) 5.5400
3. a) 25.212
b) 3.9828
c) 24.903
d ) 0.2148
e) 27.666
5. a) 46.711 N/mm
b) 33.348 N/mm
c) Clavos con rosca anular. La probabilidad es 0.3372 contra 0.0516 para clavos con rosca en espiral.
d ) 0.0985.
e) Un clavo con rosca en espiral. Sólo aproximadamente 0.01%
de los clavos con rosca anular tienen resistencias así de pequeñas, mientras que aproximadamente 4.09% de los clavos
con rosca en espiral la tienen. Se puede tener la certeza de que éste fue un clavo con rosca en espiral.
7. a) $1.0565
b) 0.0934
c) $1.0408
d ) 0.2090
Sección 4.7
1. a) 2.2222
b) 4.9383
c) 0.2592
3. a) 4 micrones
b) 4 micrones
g) 18.4207 micrones
d ) 1.5403
c) 0.5276
d) 0.0639
e) 2.7726 micrones
f ) 5.5452 micrones
5. No. Si las duraciones estuvieran distribuidas exponencialmente, la proporción de los componentes usados que duran
más de cinco años sería la misma que la proporción de los nuevos componentes que duran más de cinco años, debido
a la propiedad de falta de memoria.
7. a) 1/3 año
b) 1/3 año
c) 0.0498
d ) 0.2212
e) 0.9502
9. a) 0.6065
b) 0.0821
c) El tiempo del primer reemplazo sería mayor de 100 horas si y sólo si cada uno de
los focos durara más de 100 horas.
d) 0.9179
e) P(T ⱕ t) ⫽ 1 ⫺ e⫺0.025t.
f ) Sí, T ⬃ Exp(0.025).
g) 40 horas
h) T ⬃ Exp(nλ)
Sección 4.8
1. a) 8
b) 4
c) 0.00175
d ) 0.9344
3. a) 0.6667
b) 1.4907
c) 0.8231
5. a) 0.8490
b) 0.5410
c) 1 899.2 horas
7. a) 0.3679
b) 0.2978
c) 0.4227
9. a) 0.3679
b) 0.1353
d ) 0.0208
e) 0.0550
d ) 8.761 × 10⫺4
c) La duración del sistema será mayor de cinco horas si y sólo si las duraciones de ambos componentes fueran mayores de cinco horas.
d ) 0.8647
e) P(T ⱕ t) ⫽ 1 ⫺ e⫺0.08t
f ) Sí, T ⬃ Weibull(2, 0.2828)
2
Respuestas a los ejercicios impares
809
Sección 4.9
1. a) No
3.
b) No
c) Sí
0.999
0.99
0.95
0.9
0.75
0.5
Estos datos no parecen provenir de una distribución aproximadamente normal.
0.25
0.1
0.05
0.01
0.001
2
5.
2.5
3
3.5
4
4.5
0.999
0.99
0.95
0.9
0.75
0.5
Los datos de MP no parecen provenir de una distribución
aproximadamente normal.
0.25
0.1
0.05
0.01
0.001
0
5
10
15
20
25
7. Sí, si los logs de los datos de MP provienen de una población normal, entonces los datos de MP provienen de una población lognormal, y viceversa.
Sección 4.10
1. a) 0.0793
b) 0.0170
3. 0.9772
5. 0.5793
7. a) 0.0951
b) 0.0344
c) 0.181 (0.278 es una raíz espuria.)
9. a) 0.6578
b) 0.4714
c) 0.6266
d) 48.02 mL
11. a) 0.0002
b) Sí. Sólo aproximadamente dos de 10 000 muestras de tamaño 1 000 tendrán 75 o más losas no satisfactorias si se ha alcanzado el objetivo.
c) No, debido a que 75 losas no satisfactorias en una muestra de 1 000 es
un número inusualmente grande si se ha alcanzado el objetivo.
810
Respuestas a los ejercicios impares
d ) 0.3594
e) No. Más de un tercio de las muestras de tamaño 1 000 tendrán 53 o más losas no satisfactorias si se
ha alcanzado el objetivo.
f ) Sí, debido a que 53 de las losas no satisfactorias en una muestra de 1 000 no es un número inusualmente grande si se ha alcanzado el objetivo.
Sección 4.11
1. a) X ∼ Bin(100, 0.03), Y ∼ Bin(100, 0.05)
b) Las respuestas variarán.
e) La distribución se desvía un poco de lo normal.
c) ≈ 0.72
d) ≈ 0.18
3. a) µ A = 6 exactamente (los resultados de la simulación serán aproximados), σA2 ≈ 0.25.
b) ≈ 0.16
c) La distribución es aproximadamente normal.
5. a) ≈ 0.25
b) ≈ 0.25
c) ≈ 0.61
7. a, b, c) Las respuestas variarán.
d) ≈ 0.025
9. a) Las respuestas variarán.
b) ≈ 2.7
c) ≈ 0.34
d) ≈ 1.6
e) El tiempo de vida del sistema no está distribuido aproximadamente normal.
b) ≈ 10 090
c) ≈ 1 250
11. a) Las respuestas variarán.
f ) La distribución difiere un poco de la normal.
13. a)
λ = 0.25616
b, c, d) Las respuestas variarán.
d) ≈ 0.58
f ) Sesgado a la derecha.
e) ≈ 0.095
e) Sesgo ≈ 0.037, σ λ ≈ 0.12.
Ejercicios adicionales para el capítulo 4
1. 0.9744
3. a) 0.2503
b) 0.4744
5. a) 0.9044
b) 0.00427
c) 0.00512
7. a) 0.6826
b) z = 1.28
c) 0.0010
9. a) 0.0668
b) 0.6687
c) 0.0508
11. a) 0.8830
b) 0.4013
c) 0.0390 (0.1065 es una raíz espuria.)
13. a) 28.0 ± 3.7
c) 0.1020
d ) 0.1414
e) 0.8508
b) 28 mL
15. a) 0.0749
b) 4.7910 cm
17. a) 0.4889
b) 0.8679
c) 4
19. 62
21. a) 0.4090
b) No. Más de 40% de las muestras tendrán un peso total de 914.8 oz o menos si la afirmación es cierta.
c) No, debido a que un peso total de 914.8 oz no es inusualmente pequeño si la afirmación es cierta.
d) ⬇ 0
e) Sí. Casi ninguna de las muestras tendrá un peso total de 910.3 oz o menos si la afirmación es verdadera.
f ) Sí, porque un peso total de 910.3 oz es inusualmente pequeño si la afirmación es cierta.
23. a) P (X > s) = P (Primeras s tiradas son fracasos) = (1 − p)s .
b) P (X > s + t | X > s) = P (X > s + t y X > s)/P (X > s) = P (X > s + t)/P (X > s) =
(1 − p)s+t /(1 − p)s = (1 − p)t = P (X > t). Observe que si X > s + t, éste debe ser el caso que X > s, que
es la razón de que P (X > s + t y X > s) = P (X > s + t).
Respuestas a los ejercicios impares
811
c) Sea X el número de lanzamientos de la moneda de un centavo necesario para obtener la primera cara. Entonces
P(X ⬎ 5 兩 X ⬎ 3) ⫽ P(X ⬎ 2) ⫽ 1/4. La probabilidad de que la moneda de cinco centavos salga “cruz” dos veces
también es 1/4.
e−λ λx /x!
e−λ λx (x − 1)! λ
P (X = x)
= −λ x−1
=
= .
P (X = x − 1) e λ /(x − 1)!
e−λ λx−1 x!
x
λ
b) P (X = x) ≥ P (X = x − 1) si y sólo si
≥ 1 si y sólo si x ≤ λ.
x
25. a)
Sección 5.1
1. a) 1.645
b) 1.37
c) 2.81
d ) 1.15
3. Aumenta, disminuye
5. a) (145.10, 154.90)
b) (143.55, 156.45)
c) 76.98%
d) 601
e) 1041
7. a) (1.538, 1.582)
b) (1.534, 1.586)
c) 92.66%
d) 385
e) 543
9. a) (27.04, 30.96)
b) (26.42, 31.58)
c) 86.64%
d) 312
e) 540
11. a) 22.62
b) 99.38%
13. a) 70.33
b) 99.29%
15. 280
17. (83.11, 84.19)
19. a) Falso
c) Falso
b) Verdadero
21. El supervisor está subestimando la confianza. El enunciado de que la media del costo es menor de $160 es un límite superior de confianza unilateral con un nivel de confianza de 97.5%.
Sección 5.2
1. a) 0.74
b) (0.603, 0.842)
3. a) (0.629, 0.831)
c) 74
b) (0.645, 0.815)
d) (0.565, 0.879)
c) 300
d ) 210
e) 130
e) 0.0217
5. 0.339
7. a) (0.0529, 0.1055)
9. a) (0.490, 0.727)
11. a) (0.271, 0.382)
b) 697
c) (0.0008, 0.556)
b) (0.863, 1)
b) 658
c) (0.572, 0.906)
c) 748
Sección 5.3
1. a) 1.860
3. a) 95%
b) 2.776
b) 98%
c) 2.763
c) 90%
d ) 12.706
d) 99%
e) 99.9%
5. (5.303, 6.497)
7. Sí, no hay datos atípicos. Un intervalo de confianza de 95% es (203.81, 206.45).
812
Respuestas a los ejercicios impares
b) Sí, el intervalo de confianza es (3.2247, 3.2526)
a)
3.22
3.23
3.24
3.25
3.26
3.27
d ) No, el conjunto de datos contiene un dato atípico.
c)
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
11. (12.318, 13.762)
13. (0.515, 1.985)
15. a) 2.3541
b) 0.888
c) 3.900
Sección 5.4
1. (5.589, 8.211)
3. (9.683, 11.597)
5. (11.018, 32.982)
7. a) (−1.789, 2.589)
b) No, ya que 0 se encuentra en el intervalo de confianza, se podría considerar que es un valor creíble para la diferencia de las medias de dureza.
9. No es posible. Los tiempos en cama despiertos y dormidos no son independientes.
Sección 5.5
1. (0.0591, 0.208)
3. (⫺0.232, 0.00148)
5. a) (⫺0.0446, 0.103)
b) Si se muestrearan 100 chips más del proceso menos costoso, el ancho del intervalo de confianza sería aproximadamente ⫾ 0.0721. Si se hubiesen muestreado 50 chips más del proceso más costoso, el ancho del
intervalo de confianza sería aproximadamente ⫾ 0.0638. Si se hubiesen muestreado 50 chips más del proceso menos
costoso y 25 chips más del proceso más costoso, el ancho del intervalo de confianza sería aproximadamente ⫾ 0.0670.
Por tanto, el mayor aumento en la precisión se lograría muestreando 50 chips más del proceso más costoso.
7. No. Las proporciones de la muestra provienen de la muestra en vez de dos muestras independientes.
9. (⫺0.0481, 0.226)
11. No, éstas no son muestras aleatorias simples.
Respuestas a los ejercicios impares
813
Sección 5.6
1. (−0.0978, 0.00975)
3. (7.798, 30.602)
5. (20.278, 25.922)
7. (0.0447, 0.173)
9. (2.500, 33.671)
11. (38.931, 132.244)
13. (0.614, 11.386)
Sección 5.7
1. (2.090, 11.384)
3. (−0.0456, 0.00558)
5. (−30.260, 26.260)
7. (9.350, 10.939)
9. a) (0.747, 2.742)
b) 80%
Sección 5.8
1. a) X* ⬃ N(8.5, 0.22), Y* ⬃ N(21.2, 0.32)
b) Las respuestas variarán.
d ) Sí, P está de manera normal aproximadamente distribuida.
utiliza para encontrar la desviación estándar.
c) sP ⬇ 0.18429
e) (13.063, 13.785) si la propagación del error se
3. a) Sí, A está de manera normal aproximadamente distribuida.
b) sA ⬇ 0.24042
propagación del error se utiliza para encontrar la desviación estándar.
c) (6.140, 7.083) si la
5. a) N(0.27, 0.402/349) y N(1.62, 1.702/143). Debido a que los valores 0.27 y 1.62 son las medias muestrales, sus varianzas son iguales a las varianzas poblacionales divididas entre los tamaños de la muestra.
b) No, R está de manera
d) No es adecuado, ya que R está de manera normal
normal aproximadamente distribuida.
c) sR ⬇ 0.70966
aproximadamente distribuida.
7. a, b, c) Las respuestas variarán.
9. a) La probabilidad de cobertura de Agresti-Coull ⬇ 0.98; para el intervalo tradicional ⬇ 0.89. La media del ancho para Agresti-Coull ⬇ 0.51; para el intervalo tradicional ⬇ 0.585.
b) La probabilidad de cobertura de Agresti-Coull ⬇
0.95; para el intervalo tradicional ⬇ 0.95. La media del ancho para Agresti-Coull ⬇ 0.42; para el intervalo tradicional ⬇
0.46.
c) La probabilidad de cobertura de Agresti-Coull ⬇ 0.96; para el intervalo tradicional ⬇ 0.92. La media del
ancho para Agresti-Coull ⬇ 0.29; para el intervalo tradicional ⬇ 0.305.
d ) El método tradicional tiene una probabilidad de cobertura cercana a 0.95 para n ⫽ 17, pero menor que 0.95 tanto para n ⫽ 10 como para n ⫽
40.
e) Agresti-Coull tiene mayor probabilidad de cobertura para tamaños de muestra de 10 y de 40, casi igual que
para 17.
f ) El método de Agresti-Coull.
814
Respuestas a los ejercicios impares
Ejercicios adicionales para el capítulo 5
1. (1.942, 19.725)
3. (0.0374, 0.0667)
5. (0.084, 0.516)
7. a) (0.0886, 0.241)
b) 584
9. El intervalo más angosto (4.20, 5.83), es el intervalo de confianza de 90%, el intervalo más ancho, (3.57, 6.46), es el intervalo de confianza de 99%, y (4.01, 6.02) es el intervalo de confianza de 95%.
11. (⫺0.420, 0.238)
13. 441
15. a) Falso
b) Falso
17. a) (36.804, 37.196)
c) Verdadero
b) 68%
d ) Falso
c) Las mediciones provienen de una población normal.
d ) (36.774, 37.226)
19. a) Debido a que X se distribuye normalmente con media nλ, se tiene que para una proporción 1 ⫺ α de todas las muestras posibles, ⫺za/2sX ⬍ X ⫺ nλ ⬍ za/2sX. Multiplicando por ⫺1 y sumando a X en toda la desigualdad se obtiene
X ⫺ za/2sX ⬍ nλ ⬍ X ⫹ za/2sX, que es el resultado deseado.
√
√
b) Ya que n es constante, σX/n = σX /n = nλ/n = λ/n. Por tanto s λ̂ ⫽ sX /n.
c) Se divide la desigualdad del inciso a) entre n.
d) Sustituyendo
λ/n en
lugar de s λ̂ en el inciso
/ c) se demuestra que para una proporción
1 ⫺ α de todas las posiλ − zα/2
λ/n < λ <
bles muestras
λ + zα/2
λ/n. Por tanto, el intervalo
λ ± zα/2
λ/n i es un intervalo de confianza para λ a un nivel 1 ⫺ α.
e) (53.210, 66.790)
21. a) 234.375 ⫾ 19.639
b) (195.883, 272.867)
c) Hay algo de desviación de la normalidad en las colas de la distribución. El 95% intermedio sigue la curva normal
cercanamente, por lo que el intervalo de confianza es razonablemente bueno.
23. a, b, c) Las respuestas variarán.
Sección 6.1
1. a) 0.0014
b) 0.14%
3. a) 0.2584
b) 25.84%
5. a) ⬇ 0
b) Si la media de la producción diaria fuera 740 toneladas o más, la probabilidad de observar una media
muestral tan pequeña como el valor de 715 que realmente fue observado es casi 0. Por tanto, se tiene el convencimiento de que la media de la producción diaria no es de 740 toneladas o más, si no que, por el contrario, es menor.
7. a) 0.3300
b) Si la media de la velocidad del aire es 40 cm/s, hay 33% de probabilidad de que una muestra tenga
una media menor o igual que el valor observado de 39.6. Debido a que 33% no es una probabilidad pequeña, es creíble
que la media de la velocidad del aire sea 40 cm/s.
9. ii)
11. P ⫽ 0.0456
13. a) 0.2153
b) 2.65
c) 0.0040
Respuestas a los ejercicios impares
815
Sección 6.2
1. P = 0.5
3. iv)
b) Falso
5. a) Verdadero
c) Verdadero
d) Falso
7. a) No. El P-valor es 0.196, que es mayor que 0.05.
b) La media muestral es 73.2461. La media muestral es, por tanto, más cercana a 73 que a 73.5. El P-valor para la hipótesis nula m ⫽ 73, por consiguiente, será mayor que el P-valor para la hipótesis nula m ⫽ 73.5, que es 0.196. Por
tanto, la hipótesis nula m ⫽ 73 no se puede rechazar al nivel de 5%.
9. a) H 0 : µ ≤ 8
b) H0 : µ ≤ 60 000
c) H0 : µ = 10
11. a) ii) La balanza está fuera de calibración.
b) iii) La balanza podría estar calibrada.
c) No. La balanza es–
tá calibrada sólo sí m ⫽ 10. La evidencia más fuerte en favor de esta hipótesis ocurriría si X ⫽ 10, pero puesto que hay
–
incertidumbre en X, no se puede tener la seguridad aun cuando m ⫽ 10.
13. No, ella no puede concluir que la hipótesis nula sea verdadera.
15. i)
17. a) Sí. Las cantidades mayores que el límite superior de confianza tendrán P-valores menores que 0.05. Por tanto, P < 0.05.
b) No, se necesitaría conocer el límite superior de confianza del 99% para determinar si P < 0.01.
19. Si, se puede
Ya que 95% del límite superior de confianza es 3.45, se sabe que 3.40 ⫹
√
√ calcular el P-valor exactamente.
1.645s/ n = 3.45. Por tanto, s/ n = 0.0304. El puntaje z es (3.40 ⫺ 3.50)/0.0304 ⫽ ⫺3.29. El P-valor es 0.0005,
que es menor que 0.01.
Sección 6.3
1. Sí, P = 0.0040.
3. No, P = 0.1251.
5. No, P = 0.2033.
7. No, P = 0.1251.
9. Sí, P = 0.0011.
11. a) 0.69
b) −0.49
c) 0.3121
Sección 6.4
1. a) t2 ⫽ 0.6547, 0.50 ⬍ P ⬍ 0.80. La balanza podría estar calibrada adecuadamente.
b) No se puede realizar la prueba t, ya que la desviación estándar de la muestra no se puede calcular a partir de una
muestra de tamaño 1.
3. a) H0 : m ⱕ 35 vs. H1 : m ⬎ 35
b) t5 ⫽ 2.4495, 0.025 ⬍ P ⬍ 0.050
c) Sí, el P-valor es pequeño, por lo que se concluye que m ⬎ 35.
816
Respuestas a los ejercicios impares
5. No, t6 = 1.7085, 0.10 < P < 0.20.
7. Sí, t17 = −2.4244, 0.01 < P < 0.025.
9. Sí, t3 = −4.0032, 0.01 < P < 0.025.
11. a) 6.0989
b) 9.190
c) 17.384
d) −1.48
Sección 6.5
1. Sí, P ⫽ 0.0002
3. No, P ⫽ 0.1336
5. a) H0 : m1 ⫺ m2 ⱕ 0 vs. H1 : m1 ⫺ m2 ⬎ 0, P ⫽ 0.2119. No se puede concluir que la calificación promedio de las preguntas de una cola sea mayor.
b) H0 : m1 ⫺ m2 ⱕ 0 vs. H1 : m1 ⫺ m2 ⫽ 0, P ⫽ 0.4238. No se puede concluir que la calificación promedio de las preguntas de una cola difiera de la calificación promedio de las preguntas de dos colas.
7. a) Sí, P ⫽ 0.0217.
b) No, P ⫽ 0.2514.
9. Sí, P ⫽ 0.0006.
11. a) i) 11.128, ii) 0.380484
b) 0.424, similar al P-valor calculado con el estadístico t.
c) (⫺0.3967, 5.7367)
Sección 6.6
1. a) H 0 : p1 − p2 ≥ 0 vs. H1 : p1 − p2 < 0
b) P = 0.1492
c) Máquina 1
3. Sí, P = 0.0018.
5. Sí, P = 0.0367.
7. P ⫽ 0.0643. La evidencia sugiere que el empaque de gran resistencia reduce la proporción de órdenes deterioradas, pero no puede ser concluyente.
9. No, P ⫽ 0.7114.
11. No, porque las dos muestras no son independientes.
13. a) 0.660131
b) 49
c) 1.79
d ) 0.073
Sección 6.7
1. a) Sí, t 3 = 2.5740, 0.025 < P < 0.050.
b) No, t3 = 0.5148, 0.25 < P < 0.40.
3. t16 = −2.0143, 0.05 < P < 0.10. La hipótesis nula es sospechosa.
5. No, t7 = 0.3444, 0.50 < P < 0.80.
7. No, t15 = 1.0024, 0.10 < P < 0.25.
9. Sí, t9 = 2.5615, 0.02 < P < 0.05.
Respuestas a los ejercicios impares
11. a) Sí, t16 = 6.1113, P < 0.0005.
817
b) Sí, t16 = 3.659, 0.001 < P < 0.005.
13. No, t14 = 1.0236, 0.20 < P < 0.50.
15. a) 0.197
b) 0.339
c) −1.484
d) −6.805
Sección 6.8
1. Sí, t6 = 7.0711, P < 0.001.
3. Sí, t9 = 2.6434, 0.02 < P < 0.05.
5. Sí, t4 = 4.7900, 0.001 < P < 0.005.
7. Sí, t6 = 3.7591, 0.002 < P < 0.010.
9. a) Sea mR la media del número de millas por galón para taxis que utilizan neumáticos radiales, y sea mB la media del
número de millas por galón para taxis que utilizan neumáticos con cinturón. Las hipótesis nula y alternativa adecuadas son H0 : mR ⫺ mB ⱕ 0 contra H1 : mR ⫺ mB ⬎ 0. El valor del estadístico de prueba es t9 ⫽ 8.9532, por lo que P
⬍ 0.0005.
b) Las hipótesis nula y alternativa adecuadas son H0 : mR ⫺ mB ⱕ 2 contra H1 : mR ⫺ mB ⬎ 2. El valor del estadístico
de prueba es t9 ⫽ 3.3749, por lo que 0.001 ⬍ P ⬍ 0.005.
11. a) 1.1050
b) 2.8479
c) 4.0665
d) 3.40
Sección 6.9
1. a) Sí. S+ = 25, P = 0.0391.
b) No. S+ = 7, P > 0.1094.
c) No. S + = 23, P > 2(0.0781) = 0.1562.
3. a) No. S + = 134, z = −0.46, P = 0.3228.
c) Sí. S+ = 70.5, z = −2.27, P = 0.0232.
5.
Diferencia
Signo del rango
0.01
2
0.01
2
−0.01
−2
b) Sí. S+ = 249.5, z = 2.84, P = 0.0023.
0.03
4
0.05
5.5
−0.05
−5.5
−0.07
−7
−0.11
−8
S+ = 2 + 2 + 4 + 5.5 + 10 = 23.5. De la tabla, P > 2(0.1162) = 0.2324. No se rechaza.
7. Sí. W = 34, P = 2(0.0087) = 0.0174.
9. No. W = 168, z = 0.31, P = 0.7566.
Sección 6.10
1. a) H0 : p1 ⫽ 0.90, p2 ⫽ 0.05, p3 ⫽ 0.05
b) 900, 50, 50
c) x22 ⫽ 21.7778
d ) P ⬍ 0.005. Los verdaderos porcentajes difieren de 90%, 5% y 5%.
3. Los valores esperados son
< 0%
Capacidad excesiva neta
0 -10% 11-20% 21-30%
Pequeña 81.7572 44.7180
Grande 99.2428 54.2820
14.0026
16.9974
4.9687
6.0313
> 30%
27.5535
33.4465
x24 ⫽ 12.9451, 0.01 ⬍ P ⬍ 0.05. Es razonable concluir que las distribuciones difieren.
−0.13
−9
0.15
10
818
Respuestas a los ejercicios impares
5. a) 10.30
13.35
13.35
6.96
9.02
9.02
9.74 12.62
12.62
b) x24 ⫽ 6.4808, P ⬎ 0.10. No hay evidencia de que los renglones y las columnas no sean independientes.
7. iii)
9. x29 ⫽ 8.0000, P ⬎ 0.10. No hay evidencia de que el generador de números aleatorios no esté funcionando adecuadamente.
11. Sí, x211 ⫽ 41.3289, P ⬍ 0.005.
Sección 6.11
1. 251
3. a) 0.01
b) 0.02
5. No, F8, 13 ⫽ 1.0429, P ⬎ 0.20.
Sección 6.12
1. a) Verdadero
b) Falso
c) Falso
–
b) X ⬍ 89.3284
3. a) H0 : m ⱖ 90 contra H1 : m ⬍ 90
–
c) Ésta no es una región de rechazo adecuada. La región de rechazo consistiría de los valores para X que haría el P-valor de la prueba menor que una frecuencia de umbral elegida. Esta región de rechazo consiste de los valores para los
cuales el P-valor será mayor que algún nivel.
d ) Ésta es una región de rechazo adecuada. El nivel de la prueba es 0.0708.
–
e) Ésta no es una región de rechazo adecuada. La región de rechazo consiste de los valores para X que harían el P-va–
lor de la prueba menor que un nivel de umbral elegido. La región de rechazo contiene los valores de X para los cuales el P-valor será grande.
5. a) Error de tipo I
b) Decisión correcta
c) Decisión correcta
d ) Error de tipo II
7. Al nivel 1%
Sección 6.13
1. a) Verdadero
b) Verdadero
c) Falso
d ) Falso
3. Aumenta
5. a) H0 : m ⱖ 50 000 contra H1 : m ⬍ 50 000 es verdadera.
c) 0.2578
d ) 0.4364
e) 618
b) El nivel es 0.1151; la potencia es 0.4207.
7. ii)
9. a) Dos colas
b) p ⫽ 0.5
c) p ⫽ 0.4
d) Menor que 0.7. La potencia para un tamaño de muestra de 150 es 0.691332, y la potencia para un tamaño de muestra menor de 100 sería menor que éste.
e) Mayor que 0.6. La potencia para un tamaño de muestra de 150 es 0.691332, y la potencia para un tamaño de muestra mayor de 100 sería mayor que éste.
f ) Mayor que 0.65. La potencia contra la alternativa p ⫽ 0.4 es 0.691332, y la alternativa p ⫽ 0.3 está más alejada de
la nula que p ⫽ 0.4. Por lo que la potencia contra la alternativa p ⫽ 0.3 es mayor que 0.691332.
Respuestas a los ejercicios impares
819
g) Es imposible decirlo del resultado. La potencia contra la alternativa p ⫽ 0.45 será menor que la potencia contra p ⫽
0.4 que es 0.691332. Pero no se puede decir sin calcularlo si es menor de 0.65.
11. a) Dos colas
b) Menos de 0.9. El tamaño de la muestra de 60 es el menor que produce la potencia mayor que o
igual a la potencia objetivo de 0.9.
c) Mayor de 0.9. La potencia es mayor de 0.9 contra una diferencia de 3, por lo que será mayor que 0.9 contra cualquier diferencia mayor que 3.
Sección 6.14
1. a) El P-valor con el ajuste de Bonferroni es 0.012. Puesto que este valor es pequeño, se puede concluir que este ajuste reduce la proporción de piezas defectuosas.
b) El P-valor con el ajuste de Bonferroni es 0.018. Puesto que este valor no es tan pequeño, no se puede concluir que
este ajuste reduzca la proporción de piezas defectuosas.
3. 0.0025
5. a) No. Si la media del amperaje de quemada es igual a 15 A cada día, la probabilidad de rechazar H0 es 0.05 cada día.
El número de veces en 200 días que H0 es rechazada es entonces una variable aleatoria binomial con n ⫽ 200, p ⫽
0.05. La probabilidad de rechazar H0 10 o más veces en 200 días es entonces aproximadamente igual a 0.5636. Por
lo que no sería inusual rechazar H0 10 veces en 200 ensayos si H0 es siempre verdadera.
b) Sí. Si la media del amperaje de quemada es igual a 15 A cada día, la probabilidad de rechazar H0 es 0.05 cada día.
El número de veces en 200 días que H0 es rechazada es entonces una variable aleatoria binomial con n ⫽ 200, p ⫽
0.05. La probabilidad de rechazar H0 20 o más veces en 200 días es entonces aproximadamente igual a 0.0010. Por
lo que sería bastante inusual rechazar H0 20 veces en 200 ensayos si H0 es siempre verdadera.
Sección 6.15
1. a) V ⫽ 26.323, sV ⫽ 0.3342
3. a) ii) y iv)
b) z ⫽ 3.96, P ⬇ 0.
c) Sí, V está aproximadamente normalmente distribuida.
b) i), ii) y iv)
5. No, el valor 103 es un dato atípico.
b) No, la prueba F requiere la suposición de que los datos están normal7. a) sA2 ⫽ 200.28, sB2 ⫽ 39.833, sA2 /sB2 ⫽ 5.02.
mente distribuidos. Estos datos contienen un dato atípico (103), por lo que no se debe usar la prueba F.
c) P ⬇ 37.
9. a) El estadístico de prueba es t =
X−7
√ . H0 se rechazará si 兩t 兩 ⬎ 2.447.
s/ 7
b) ⬇ 0.60.
Ejercicios adicionales para el capítulo 6
1. Éste requiere una prueba para la diferencia entre dos medias. Los datos no están apareados. Sea m1 la media poblacional del costo anual para automóviles que usan combustible regular, y m2 la media poblacional del costo anual para automóviles que usan combustible premium. Entonces las hipótesis nula y alternativa adecuadas son H0 : m1 ⫺ m2 ⱖ 0
contra H1 : m1 ⫺ m2 ⬍ 0. El estadístico de prueba es la diferencia en la media muestral de los costos entre los dos grupos. La tabla z se debe utilizar para encontrar el P-valor.
3. Éste requiere una prueba para una proporción poblacional. Sea p la proporción poblacional de las piezas defectuosas bajo el nuevo programa. Las hipótesis nula y alternativa adecuadas son H0 : p ⱖ 0.10 contra H1 : p ⬍ 0.10. El estadístico
de prueba es una proporción muestral de las piezas defectuosas. La tabla z se debe utilizar para determinar el P-valor.
820
Respuestas a los ejercicios impares
5. a) H 0 : µ ≥ 16 contra H1 : µ < 16
b) t9 = −2.7388
7. a) H 0 : µ1 − µ2 = 0 contra H1 : µ1 − µ2 =
0
c) 0.01 < P < 0.025, rechaza a H0 .
b) t6 = 2.1187
c) 0.05 < P < 0.10, H0 es sospechosa.
9. Sí. z = 4.61, P ≈ 0.
11. a) Rechaza a H0 si X ≥ 100.0196 o si X ≤ 99.9804.
c) Sí
d) No
e) 13.36%
13. a) 0.05
b) Rechaza a H0 si X ≥ 100.01645 o si X ≤ 99.98355.
b) 0.1094
15. El P-valor con el ajuste de Bonferroni es 0.1228. No se puede concluir que la tasa de fallas en la línea 3 sea menor de
0.10.
17. a) Ambas muestras tienen una mediana de 20.
b) W ⫽ 281.5, z ⫽ 2.03, P ⫽ 0.0424. El P-valor es bastante pequeño. Si la hipótesis nula establece que las medianas poblacionales eran iguales, proporcionaría una razonable fuerte
evidencia de que las medianas poblacionales eran efectivamente diferentes.
c) No, la muestra X está pesadamente sesgada a la derecha, mientras que la muestra Y es fuertemente bimodal. No parece razonable suponer que estas muestras provengan de poblaciones con la misma forma.
19. a) Sea mA la media del cociente empuje/peso para el combustible A, y sea mB la media del cociente empuje/peso para
el combustible B. Las hipótesis nula y alternativa adecuadas son H0 : mA ⫺ mB ⱕ 0 contra H1 : mA ⫺ mB ⬎ 0.
b) Sí, t29 ⫽ 2.0339, 0.025 ⬍ P ⬍ 0.05.
21. a) Sí
b) La conclusión no está justificada. El ingeniero está concluyendo que H0 es verdadera debido a que la
prueba falla al rechazarla.
23. No, x22 ⫽ 2.1228, P ⬎ 0.10.
Sección 7.1
1. 0.8214
3. a) El coeficiente de correlación es adecuado. Los puntos están aproximadamente agrupados alrededor de una recta.
b) El coeficiente de correlación no es adecuado. La relación es una curva, no es lineal.
c) El coeficiente de correlación no es adecuado. La gráfica contiene datos atípicos.
5. Más de 0.6
7. a) Entre la temperatura y la producción, r ⫽ 0.7323; entre la tasa de agitación y la producción, r ⫽ 0.7513; entre la
temperatura y la tasa de agitación, r ⫽ 0.9064.
b) No, el resultado se podría deber a la confusión, ya que la correlación entre la temperatura y la tasa de agitación está alejada de 0.
c) No, el resultado se podría deber a la confusión, ya que la correlación entre la temperatura y la tasa de agitación está alejada de 0.
9. a) (⫺0.8632, 0.1739)
b) z ⫽ ⫺2.31, P ⫽ ⫺0.0104, se puede concluir que r ⬍ 0.3.
c) U ⫽ ⫺1.6849, 0.10 ⬍ P ⬍ 0.20, es creíble que r ⫽ 0.
11. a) y ⫽ 2
b) y ⫽ ⫺3
c) y ⫽ ⫺1.1699
d ) y ⫽ ⫺9.8301
e) Para que la correlación sea igual a
⫺1, los puntos se encontrarían en una recta con pendiente negativa. No existe un valor para y para este caso.
Respuestas a los ejercicios impares
821
Sección 7.2
1. a) 319.27 lb
b) 5.65 lb
3. 0.8492
5. a) 18.869 pulg.
b) 70.477 pulg.
c) No, algunos de los hombres cuyos puntos se encuentran debajo de la
recta de mínimos cuadrados tendrán brazos más cortos.
7. a)
8
Millaje
7
6
El modelo lineal es adecuado.
5
4
5
10
15
20
25
30
Peso
b) y ⫽ 8.5593 ⫺ 0.15513x.
lada
f ) Millas por galón
7. a)
c) 0.776 millas/galón
d ) 6.23 millas/galón
e) Millas por galón por tone-
Tiempo de secado
9
8.5
8
El modelo lineal es adecuado.
7.5
7
4
4.5
5
Concentración
5.5
6
b) y ⫽ 12.193 ⫺ 0.833x
c) (8.86, ⫺0.16), (8.69, 0.11), (8.53, ⫺0.23), (8.36, 0.34), (8.19, ⫺0.09), (8.03, ⫺0.03),
(7.86, 0.24), (7.69, 0.01), (7.53, ⫺0.03), (7.36, ⫺0.16)
d) Disminuye en 0.0833 horas.
e) 8.53 horas
f ) No, ya que el 7% está fuera del rango de concentraciones presentes en los datos.
g) 4.79%
h) No se puede especificar esa concentración. De acuerdo con la recta de mínimos cuadrados, una concentración de
7.43% daría como resultado un tiempo de secado de seis horas. Sin embargo, puesto que 7.43% está fuera del rango de los
datos, esta predicción no es confiable.
11. y ⫽ 20 ⫹ 10x
13. iii)
822
Respuestas a los ejercicios impares
Sección 7.3
b) 0.2169
c) Para β0: (4.409, 5.157) para β1: (2.948, 3.216)
1. a) β̂0 ⫽ 4.7829, β̂1 ⫽ 3.0821
e) Sí. t23 ⫽ ⫺3.965, P ⬍ 0.0005.
f ) (9.098, 9.714)
d ) No. t23 ⫽ 1.271, 0.10 ⬍ P ⬍ 0.25.
g) (8.063, 10.749)
h) El intervalo de confianza es más útil ya que considera la longitud verdadera del resorte,
mientras que el intervalo de predicción considera la siguiente medición de la longitud.
3. a) La pendiente es 0.84451; el intercepto es 44.534.
b) Sí, el P-valor para la pendiente es ⬇ 0, por lo que el caballo de fuerza está relacionado con NOx.
c) 52.979 mg/s
d ) 0.920
e) (74.6, 82.0)
f ) No. Un razonable rango de los valores pronosticados está dado por el intervalo
de predicción del 95%, que es (29.37, 127.26).
5. a) H0 : βC ⫺ βE ⫽ 0
b) Sí. z ⫽ 2.10, P ⫽ 0.0358
7. a) y ⫽ 2.11 ⫺ 0.776x
d ) (0.742, 0.847)
b) Para β0: (2.07, 2.16) para β1: (⫺0.829, ⫺0.722).
c) 0.795
e) (0.675, 0.914)
9. El intervalo de confianza en 1.5 sería más corto. El intervalo de confianza en 1.8 sería más largo.
11. 1.388
13. a) 0.256
b) 0.80
c) 1.13448
d ) 0.001
15. a) 553.71
b) 162.06
c) Debajo
d ) Hay mayor cantidad de dispersión vertical en el lado derecho de la gráfica que en el lado izquierdo.
Sección 7.4
1. a) ln y ⫽ ⫺0.4442 ⫹ 0.79833 ln x
b) 330.95
c) 231.96
d ) (53.19, 1 009.89)
3. a) y ⫽ 20.162 ⫹ 1.269x
15
b)
10
Residuo
5
No existe un patrón aparente en la gráfica de residuos.
El modelo lineal es adecuado.
0
⫺5
⫺10
50
55
60
65
Valor ajustado
70
75
Respuestas a los ejercicios impares
c)
823
15
10
Residuo
5
Los residuos aumentan con el tiempo. El modelo lineal no es adecuado. El tiempo, u otras variables relacionadas con el tiempo, se deben incluir en el modelo.
0
⫺5
⫺10
⫺15
0
5
10
15
20
Orden de las observaciones
25
5. a) y ⫽ ⫺235.32 ⫹ 0.695x.
b)
1 500
1 000
Residuo
500
La gráfica de residuos muestra un patrón con residuos
positivos en los valores ajustados altos y bajos y residuos negativos en medio. El modelo no es adecuado.
0
⫺500
⫺1 000
⫺1 500
0
1 000
2 000 3 000
Valor ajustado
4 000
5 000
c) ln y ⫽ ⫺0.0745 ⫹ 0.925 ln x.
d)
0.6
0.4
Residuo
0.2
La gráfica de residuos no muestra un patrón obvio. El
modelo es adecuado.
0
⫺0.2
⫺0.4
⫺0.6
⫺0.8
4.5
5
5.5
6
6.5
Valor ajustado
7
7.5
8
e) El modelo log es más adecuado. El intervalo de predicción del 95% es (197.26, 1 559.76).
824
Respuestas a los ejercicios impares
a)
0.6
0.4
Residuo
0.2
0
⫺0.2
La recta de mínimos cuadrados es
y ⫽ 0.833 ⫹ 0.235x.
⫺0.4
⫺0.6
⫺0.8
⫺1
1
1.5
2
2.5
Valor ajustado
3
3.5
b)
0.4
0.2
Residuo
0
La recta de mínimos cuadrados es
y ⫽ 0.199 ⫹ 1.207 ln x.
⫺0.2
⫺0.4
⫺0.6
0.5
c)
1
1.5
2
Valor ajustado
2.5
3
0.4
0.2
0
Residuo
⫺0.2
⫺0.4
La recta de mínimos cuadrados es
y ⫽ ⫺0.0679 ⫹ 0.137x.
⫺0.6
⫺0.8
⫺1
⫺1.2
⫺1.4
0
0.5
1
Valor ajustado
1.5
Respuestas a los ejercicios impares
d)
825
0.2
Residuo
0
⫺0.2
La recta de mínimos cuadrados es
冑y– ⫽ 0.956 ⫹ 0.0874x.
⫺0.4
⫺0.6
1
1.2
1.4
1.6
Valor ajustado
1.8
2
e) El modelo y ⫽ 0.199 ⫹ 1.207 ln x ajusta mejor. Su gráfica de residuos muestra el patrón mínimo.
f)
0.2
Residuo
0.5
0
Los residuos no muestran un patrón con el tiempo.
⫺0.5
⫺1
10
20
30
40
50
Día
g) 2.14
h) (1.689, 2.594)
9. a) El modelo es log10 y ⫽ β0 ⫹ β1 log10 x ⫹ ε. Observe que el logaritmo natural (ln) se podría usar en lugar de log10, pero los logaritmos comunes son más convenientes, ya que las presiones parciales se expresan como potencias de 10.
826
Respuestas a los ejercicios impares
d)
0.4
0.3
0.2
Residuo
0.1
0
La recta de mínimos cuadrados es log10 y ⫽ ⫺3.277
⫺ 0.225 log10 x. El modelo lineal parece ajustar bastante bien.
⫺0.1
⫺0.2
⫺0.3
⫺0.4
⫺0.5
⫺2
⫺1.5
⫺1
Valor ajustado
⫺0.5
c) La teoría establece que el coeficiente β1 de log10x en el modelo lineal es igual a ⫺0.25. El valor estimado es β̂ ⫽
⫺0.225. Se determina si los datos son consistentes con la teoría mediante la prueba de hipótesis H0 : β1 ⫽ ⫺0.25
contra H1 : β1 ⫽ ⫺0.25. El valor del estadístico de prueba es t21 ⫽ 0.821, por lo que 0.20 ⬍ P ⬍ 0.50. No se rechaza H0, por lo que los datos son consistentes con la teoría.
11. a) y ⫽ 2 049.87 ⫺ 4.270x
b) (12, 2 046) y (13, 1 954) son datos atípicos. La recta de mínimos cuadrados con (12,
2 046) eliminado es y ⫽ 2 021.85 ⫺ 2.861x. La recta de mínimos cuadrados con (13, 1 954) eliminado es y ⫽ 2 069.30
⫺ 5.236x. La recta de mínimos cuadrados con ambos datos atípicos eliminados es y ⫽ 2 040.88 ⫺ 3.809x.
c) Las pendientes de las rectas de mínimos cuadrados están notoriamente afectadas por los datos atípicos. Su rango es
de ⫺2.861 a ⫺5.236.
13. a) Una ley física.
b) Sería mejor repetir el experimento. Si los resultados de un experimento violan una ley física, entonces algo está equivocado en el experimento, y no puede fijar éste al transformar las variables.
Ejercicios adicionales para el capítulo 7
11. a) β̂0 ⫽ ⫺0.0390, β̂1 ⫽ 1.017
b) 0
c) El coeficiente de absorción molar M.
d) Probando H0 : β0 ⫽ 0
contra H1 : β0 ⫽ 0, t3 ⫽ ⫺0.428 y 0.50 ⬍ P ⬍ 0.80, por lo que los datos son consistentes con la ley de Beer-Lambert.
3. a) 100
90
80
70
60
50
40
40
50
60
70
80
90
100
Respuestas a los ejercicios impares
b) Ti ⫹ 1 ⫽ 120.18 ⫺ 0.696Ti.
f ) (45.00, 97.95)
c) (⫺0.888, ⫺0.503)
d ) 71.48 minutos
827
e) (68.40, 74.56)
b) No. t9 ⫽ 1.274, 0.20 ⬍ P ⬍ 0.50.
c) Sí. t9 ⫽ ⫺5.358, P ⬍ 0.001.
5. a) β̂0 ⫽ 0.8182, β̂1 ⫽ 0.9418
d ) Sí, puesto que se puede concluir que β1 ≠ 1, se puede concluir que la máquina está fuera de calibración.
e) (18.58, 20.73)
f ) (75.09, 73.23)
g) No, cuando el valor verdadero es 20, el resultado del inciso e) muestra que un intervalo de confianza de 95% para la media de los valores medidos es (18.58, 20.73). Por tanto, es creíble
que la media de la medición será 20, por lo que la máquina está calibrada.
7. a) y⫽ 0.041496 ⫹ 0.0073664x
b) (⫺0.00018, 0.01492)
c) (0.145, 0.232)
d ) (0.0576, 0.320)
9. a) ln y ⫽ β0 ⫹ β1 ln x, donde β0 ⫽ ln k y β1 ⫽ r
b) La recta de mínimos cuadrados es ln y ⫽ ⫺1.7058 ⫹ 0.65033 ln x. Por tanto, r̂ ⫽ 0.65033 y k̂ ⫽ e⫺1.7058 ⫽ 0.18162.
c) T3 ⫽ 4.660, P ⫽ 0.019. No, esto no es creíble.
11. a) β̂0 ⫽ 60.263, β̂1 ⫽ 0.11653, s2 ⫽ 0.38660.
d)
b) Sí. t10 ⫽ 80.956, P ⬇ 0.
c) Sí. t10 ⫽ 36.294, P ⬇ 0.
1
Residuo
0.5
0
El modelo lineal parece ser adecuado.
⫺0.5
⫺1
80
e) (0.10938, 0.12369)
85
90
Valor ajustado
95
f ) (86.083, 86.883)
g) (85.041, 87.925)
13. ii)
√
15. a) 145.63
b) Sí. r = − R-Sq = −0.988. Observe que r es negativo porque la pendiente de la recta de mínimos
cuadrados es negativa.
c) 145.68.
xi )2
17. a) Se necesita minimizar la suma de cuadrados S = (yi − β
a β̂ y se hace
. Se toma la derivada con respecto
xi ) = 0. Entonces xi yi − β xi2 = 0, por lo que β = xi yi / xi2 .
igual a 0, obteniendo −2
xi (yi − β
b) Sea ci = xi /
=
xi2 . Entonces β
ci yi , por lo que σβ2 =
19.
De la respuesta del ejercicio 18, se sabe que
n
(xi − x)2 . Ahora
i=1
n
µβ0 =
=
i=1
n
i=1
n
i=1
(xi − x) = 0,
ci2 σ 2 = σ 2
n
i=1
xi2 /
2 2
x(xi − x) = 0, y
1
x(xi − x)
µyi
− n
n
(xi − x)2
i=1
1
x(xi − x)
(β0 + β1 xi )
− n
n
(xi − x)2
i=1
xi
= σ 2/
n
i=1
xi2 .
xi (xi − x) =
828
Respuestas a los ejercicios impares
n
= β0
1
+ β1
n
i=1
n
i=1
n
n
x(xi − x)
x x(xi − x)
xi
i=1 i
− β0 i=1
− β1
n
n
2
n
(xi − x)
(xi − x)2
i=1
i=1
n
xi (xi − x)
= β0 + β1 x − 0 − β1 x i=1
n
2
i=1
= β 0 + β1 x − 0 − β 1 x
(xi − x)
= β0
21.
n
σβ2 =
0
i=1
n
=
i=1
n
=
i=1
1
x(xi − x)
− n
n
(xi − x)2
i=1
2
σ2
n
(xi − x)2
(xi − x)
2x
1
2
i=1
+
−
x
2 σ 2
n
n
n2
n
(xi − x)2
(xi − x)2
i=1
i=1
n
n
(xi − x)
(xi − x)2
x
1
2
i=1
i=1
−
2
+
x
2
n
n
n2
n i=1 (xi − x)2
(xi − x)2
i=1
σ2
1
x
x2
− 2 (0) + n
σ2
n
n
(xi − x)2
i=1
=
x2
1
σ2
+ n
2
n
x)
(x
−
i
i=1
=
Sección 8.1
1. a) 6.9619
3.
b) 0.03925
c) 0.5413
0.5
Residuo
0
No hay un patrón obvio en la gráfica de residuos, por lo
que el modelo lineal parece ajustar bien.
⫺0.5
⫺1
4
5
6
Valor ajustado
7
8
5. a) 25.465
b) No, los cambios pronosticados dependen de los valores de las otras variables independientes, debido a los términos de interacción.
c) 0.9691
d ) F9, 17 ⫽ 59.204. Sí, la hipótesis nula se puede rechazar.
829
Respuestas a los ejercicios impares
7. a) 2.3411 L
b) 0.06768 L
c) Nada está equivocado, las estimaciones constantes FEV1 respecto de una persona cuyos valores para los otras variables sean todas iguales a cero. Debido a que estos valores están fuera del rango
de los datos (por ejemplo, no hay ninguna con estatura cero), la constante necesita no representar un valor real para una
persona real.
d ) FEV1 ajustado ⫽ FEV1 medido ⫹ 0.0013431 ⋅ presión.
9. a) 3.572
b) 0.098184
c) Nada está equivocado. Las estimaciones constantes del pH respecto de una pulpa
cuyos valores para las otras variables sean iguales a cero. Puesto que estos valores están fuera del rango de los datos
(por ejemplo, no pulpa tiene densidad cero), la constante necesita no representar un valor real para una pulpa
real.
d) (3.4207, 4.0496)
e) (2.2333, 3.9416)
f ) Pulpa B. La desviación estándar de su pH pronosticado (SE Fit) es más pequeño que para la pulpa A (0.1351 contra 0.2510).
11. a) ⫺2.05
b) 0.3512
c) ⫺0.2445
d) 4.72
e) 13.92
f ) 18.316
g) 4.54
h) 9
13. a) 135.92°F b) No. El cambio en el punto de inflamación pronosticado debido al cambio en la concentración del ácido acético depende también de la concentración del ácido butírico, debido a la interacción entre estas dos variables.
c) Sí. El punto de inflamación pronosticado cambiará por ⫺13.897°F.
15. a) ⫺9.17819, ⫺1.42732, 123.26818, ⫺151.35236, 50.12800, ⫺11.43494
b) SSE ⫽ 40 832.432, SST ⫽ 1 990 660
d) R2 ⫽ 0.979487
e) F ⫽ 71.6257. Hay dos y tres grados de libertad.
f ) Sí. A parc) s2 ⫽ 13 610.811
tir de la tabla F, 0.001 ⬍ P ⬍ 0.01.
17. a) 2.0711
b) 0.17918
c) PP es más útil, ya que su P-valor es pequeño, mientras que el P-valor de PC es bastante grande.
d ) El cambio porcentual en el PIB se esperaría que fuese mayor en Suecia, porque el coeficiente de
PP es negativo.
b) (2.830, 3.011)
c) (5.660, 6.022)
d) β̂0: t7 ⫽ ⫺1.1766,
19. a) y ⫽ ⫺0.012167 ⫹ 0.043258t ⫹ 2.9205t2
e) No el P-valor de 0.278 no es lo suficienteP ⫽ 0.278, β̂1: t7 ⫽ 1.0017, P ⫽ 0.350, β̂2: t7 ⫽ 76.33, P ⫽ 0.000.
f ) No, el P-valor de 0.350 no es lo suficientemente pemente pequeño para rechazar la hipótesis nula de β0 ⫽ 0.
queño para rechazar la hipótesis nula de β1 ⫽ 0.
Sección 8.2
1. a)
Pronosticador Coeficiente
Constante
x1
6.3347
1.2915
Desviación
estándar
T
P
2.1740
0.1392
2.9138
9.2776
0.009
0.000
β0 difiere de 0 (P ⫽ 0.009), β1 difiere de 0 (P ⫽ 0.000).
b)
Pronosticador
Constante
x2
Coeficiente
Desviación
estándar
T
P
53.964
⫺0.9192
8.7737
0.2821
6.1506
⫺3.2580
0.000
0.004
β0 difiere de 0 (P ⫽ 0.000), β1 difiere de 0 (P ⫽ 0.004).
830
Respuestas a los ejercicios impares
c)
Pronosticador
Constante
x1
x2
Coeficiente
12.844
1.2029
⫺0.1682
Desviación
estándar
7.5139
0.1707
0.1858
T
P
1.7094
7.0479
⫺0.90537
0.104
0.000
0.377
β0 puede no diferir de 0 (P ⫽ 0.104), β1 difiere de 0 (P ⫽ 0.000) β2 puede no diferir de 0 (P ⫽ 0.377).
d) El modelo en el inciso a) es el mejor. Cuando tanto x1 y x2 están en el modelo, sólo el coeficiente de x1 es significativamente diferente de 0. Además, el valor de R2 es sólo ligeramente mayor (0.819 contra 0.811) para el modelo que
contiene tanto a x1 como x2 que para el modelo que sólo contiene a x1.
3. a) La gráfica i) proviene del ingeniero B, y la gráfica ii), del ingeniero A. Se sabe esto porque las variables x1 y x2 son
significativamente diferentes de 0 para el ingeniero A, pero no para el ingeniero B; por tanto, el ingeniero B es quien
diseñó que el experimento tenga las variables dependientes casi colineales.
b) El experimento del ingeniero A produce el experimento con los resultados más reales. En el experimento del ingeniero B, las dos variables son casi colineales.
5. a) Para R1 ⬍ 4, la recta de mínimos cuadrados es R2 ⫽ 1.23 ⫹ 0.264R1. Para R1 ⱖ 4, la recta de mínimos cuadrados
es R2 ⫽ ⫺0.190 ⫹ 0.710R1.
b) La relación es obviamente no lineal cuando R1 ⬍ 4.
Pronosticador
Constante
R1
R 12
Pronosticador
Constante
R1
R 12
R 13
Pronosticador
Constante
R1
R 12
R 13
R 14
Coeficiente
1.2840
0.21661
0.0090189
Coeficiente
⫺1.8396
4.4987
⫺1.7709
0.22904
Coeficiente
⫺2.6714
6.0208
⫺2.7520
0.49423
⫺0.02558
Desviación
estándar
0.26454
0.23558
0.044984
T
P
4.8536
0.91947
0.20049
0.000
0.368
0.843
Desviación
estándar
T
P
0.56292
0.75218
0.30789
0.039454
⫺3.2680
5.9809
⫺5.7518
5.8053
0.004
0.000
0.000
0.000
Desviación
estándar
T
P
2.0117
3.6106
2.2957
0.61599
0.05930
⫺1.3279
1.6675
⫺1.1988
0.80234
⫺0.43143
0.200
0.112
0.245
0.432
0.671
Respuestas a los ejercicios impares
831
c)
Modelo cuadrático
d)
2
Valor ajustado
0
⫺0.5
2.5
1
Modelo cuadrático
0.5
Residuo
0
⫺0.5
1.5
Modelo cúbico
0.5
Residuo
Residuo
0.5
1.5
2
Valor ajustado
2.5
0
⫺0.5
1
1.5
2
Valor ajustado
2.5
250
200
150
El coeficiente de correlación entre R31 y R41 es 0.997.
4
R1
100
50
0
0
20
40
60
3
R1
e) R31 y R41 son casi colineales.
f) El modelo cúbico es mejor. El cuadrático no es adecuado porque la gráfica de residuos muestra un patrón. Las gráficas de residuos para los modelos cúbicos y cuárticos ajustan bien; sin embargo, no hay razón para incluir R41 en el
modelo porque éste simplemente confunde el efecto de R31.
Sección 8.3
1. a) Falso
b) Verdadero
c) Falso
d ) Verdadero
3. v)
5. i)
7. La cuarta variable del modelo con el valor más alto de R2 tiene un menor R2 que la tercera variable del modelo con el
valor más alto de R2. Esto es imposible.
9. a) 0.2803
b) Tres grados de libertad en el numerador y 157 en el denominador.
c) P > 0.10. El modelo reducido es creíble.
d ) Esto no es correcto. Es posible para un grupo de variables que están fuertemente relacionadas con una variable independiente, aun cuando ninguna de las variables individualmente esté
fuertemente relacionada.
e) No hay error. Si y es la variable dependiente, entonces la suma total de cuadrados es (yi − y)2 . La cantidad no
implica las variables independientes.
832
Respuestas a los ejercicios impares
11. a)
Pronosticador
Coeficiente
Constante
x
x2
0.087324
0.52203
⫺0.02333
Pronosticador
Coeficiente
0.19878
1.2066
b)
Constante
ln x
Desviación
estándar
T
P
0.53237
9.4909
⫺5.396
0.597
0.000
0.000
Desviación
estándar
T
P
0.11677
0.068272
1.7023
17.673
0.096
0.000
0.16403
0.055003
0.0043235
c)
Modelo logarítmico
1
0.5
0.5
Residuo
Residuo
Modelo cuadrático
1
0
⫺0.5
0
⫺0.5
⫺1
0
2
Valor ajustado
1
3
4
⫺1
0
1
2
Valor ajustado
3
4
Ninguna de las gráficas de residuos revela un fuerte incumplimiento de los supuestos.
d)
x
Modelo cuadrático Modelo log
de predicción
de predicción
3.0
5.0
7.0
9.0
1.44
2.11
2.60
2.90
1.52
2.14
2.55
2.85
e) La prueba F no se puede utilizar; sólo puede emplearse cuando un modelo se forma eliminando una o más de las variables independientes del otro modelo.
f ) Las predicciones de los dos modelos no difieren mucho. El modelo logarítmico tiene sólo una variable independiente en lugar de dos, lo que es una ventaja.
13. a)
Pronosticador
Constante
x
Coeficiente
Desviación
estándar
T
37.989
1.0774
53.502
0.041608
0.71004
25.894
P
0.487
0.000
Respuestas a los ejercicios impares
b)
Pronosticador
Constante
x
x2
Coeficiente
⫺253.45
1.592
⫺0.00020052
Desviación
estándar
T
132.93
⫺1.9067
0.22215
7.1665
0.000085328 ⫺2.3499
833
P
0.074
0.000
0.031
c)
Modelo lineal
200
150
Residuo
100
50
0
⫺50
⫺100
⫺150
500
1 000
1 500
Valor ajustado
2 000
d)
Modelo cuadrático
150
100
Residuo
50
0
⫺50
⫺100
⫺150
500
1 000
1 500
Valor ajustado
2 000
2 500
e) El modelo cuadrático parece el más apropiado. El P-valor para el término cuadrático es bastante pequeño (0.031) y
la gráfica de residuos para el modelo cuadrático muestra menos de un patrón. (Sin embargo, hay un par de puntos
un poco alejados del resto de la gráfica.)
f ) 1 683.5
g) (1 634.7, 1 732.2)
834
Respuestas a los ejercicios impares
15. a)
Coeficiente
Desviación
estándar
T
P
Constante
x1
x2
25.613
0.18387
⫺0.015878
10.424
0.12353
0.0040542
2.4572
1.4885
⫺3.9164
0.044
0.180
0.006
Pronosticador
Coeficiente
Desviación
estándar
Pronosticador
b)
Constante
x1
Constante
x2
P
14.444
0.17334
16.754
0.20637
0.86215
0.83993
0.414
0.425
Coeficiente
Desviación
estándar
T
P
40.370
–0.015747
3.4545
0.0043503
c)
Pronosticador
T
11.686
–3.6197
0.000
0.007
d) El modelo que contiene a x2 como la única variable independiente es mejor. No hay evidencia de que el coeficiente
de x1 difiera de 0.
17. El modelo y ⫽ β0 ⫹ β1x2 ⫹ ε es uno bueno. Una forma de ver esto último es comparar el ajuste de este modelo con el
modelo cuadrático completo. La tabla ANOVA para este modelo es
Fuente
GL
SC
MC
F
P
Regresión
5 4.1007 0.82013 1.881 0.193
Error de residuos 9 3.9241 0.43601
Total
14 8.0248
La tabla ANOVA para el modelo y ⫽ β0 ⫹ β1x2 ⫹ ε es
Fuente
GL
SC
MC
F
P
Regresión
1 2.7636 2.7636 6.8285 0.021
Error de residuos 13 5.2612 0.40471
Total
14 8.0248
A partir de estas dos tablas, el estadístico de prueba para probar la credibilidad del modelo reducido es
(5.2612 − 3.9241)/(5 − 1)
= 0.7667. La hipótesis nula es F4, 9, P ⬎ 0.10. El P-valor grande indica que el modelo
3.9241/9
reducido es creíble.
Ejercicios adicionales para el capítulo 8
1. a) 24.6%
3. a) 0.207
b) 5.43%
b) 0.8015
c) No, se necesita conocer el contenido de oxígeno.
c) 3.82
d) 1.200
e) 2
f) 86.81
g) 43.405
h) 30.14
i) 14
Respuestas a los ejercicios impares
5. a)
Pronosticador
Coeficiente
Desviación
estándar
T
Constante
Velocidad
Pausa
Velocidad 2
Pausa 2
Velocidad ⋅ Pausa
10.84
⫺0.073851
⫺0.12743
0.0011098
0.0016736
⫺0.00024272
0.2749
0.023379
0.013934
0.00048887
0.00024304
0.00027719
39.432
⫺3.1589
⫺9.1456
2.2702
6.8861
⫺0.87563
P
0.000
0.004
0.000
0.032
0.000
0.390
Análisis de varianza
Fuente
GL
Regresión
5
Error de residuos 24
Total
29
SC
MC
F
P
31.304
2.6462
33.95
6.2608
0.11026
56.783
0.000
b) Se elimina el término de interacción Velocidad ⋅ Pausa.
Pronosticador
Coeficiente
Desviación
estándar
Constante
Velocidad
Pausa
Velocidad 2
Pausa 2
10.967
⫺0.079919
⫺0.13253
0.0011098
0.0016736
0.23213
0.022223
0.01260
0.00048658
0.0002419
T
P
47.246
⫺3.5961
⫺10.518
2.2809
6.9185
0.000
0.001
0.000
0.031
0.000
Análisis de varianza
Fuente
GL
Regresión
5
Error de residuos 25
Total
29
SC
MC
F
P
31.22
2.7307
33.95
7.8049
0.10923
71.454
0.000
Comparando este modelo con el del inciso a), F1, 24 ⫽ 0.77, P ⬎ 0.10.
835
836
Respuestas a los ejercicios impares
c)
1
Residuo
0.5
Hay cierta sugerencia de heteroscedasticidad, pero es difícil de estar seguros sin más datos.
0
⫺0.5
⫺1
6
7
8
9
Valor ajustado
10
11
d ) No, comparado con el modelo cuadrático completo que contiene Velocidad, Pausa, Velocidad2 y Pausa2, y Velocidad
⋅ Pausa, el estadístico F es F3, 24 ⫽ 15.70, y P ⬎ 0.001.
e)
Vars
1
1
2
2
3
3
4
4
5
R-Sq
61.5
60.0
76.9
74.9
90.3
87.8
92.0
90.5
92.2
R-Sq(adj)
60.1
58.6
75.2
73.0
89.2
86.4
90.7
89.0
90.6
C-p
92.5
97.0
47.1
53.3
7.9
15.5
4.8
9.2
6.0
S
0.68318
0.69600
0.53888
0.56198
0.35621
0.39903
0.33050
0.35858
0.33205
S
p
e
e
d
P
a
u
s
e
X
S
p
e
e
d
2
P
a
u
s
e
2
S
p
e
e
d
*
P
a
u
s
e
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
f) El modelo que contiene las variables dependientes Velocidad ⋅ Pausa, Velocidad2 y Pausa2, tienen tanto el valor mínimo de Cp como el valor máximo de R2 ajustado.
Respuestas a los ejercicios impares
7.
837
Modelo lineal
80
60
40
Residuo
20
La gráfica de residuos muestra un patrón curvo obvio,
por lo que el modelo lineal no es adecuado.
0
⫺20
⫺40
⫺60
⫺80
100
200
300
Valor ajustado
400
Modelo cuadrático
20
Residuo
10
No hay un patrón obvio en la gráfica de residuos, por lo que el
modelo cuadrático parece ajustar bien.
0
⫺10
⫺20
0
100
200
300
Valor ajustado
400
Modelo cúbico
15
10
Residuo
5
0
No hay un patrón obvio en la gráfica de residuos, por lo
que el modelo cúbico parece ajustar bien.
⫺5
⫺10
⫺15
0
100
9. a) 182.52, 166.55, 187.56
200
Valor ajustado
300
400
b) 236.39, 234.18, 237.02
c) 176.80, 163.89, 180.78
d) iv). El resultado no proporciona mucho de dónde elegir entre los modelos de dos variables. En el modelo de tres variables, ninguno de los coeficientes es significativamente diferente de 0, aun cuando fueron significativos en los modelos de dos variables. Esto sugiere colinealidad.
838
Respuestas a los ejercicios impares
11. a) A continuación se presentan los valores de SSE y sus grados de libertad para modelos de grados 1, 2, 3 y 4.
Lineal
Cuadrático
Cúbico
Cuártico
18
17
16
15
2726.55
481.90
115.23
111.78
(2726.55 − 481.90)/(18 − 17)
= 79.185, P ≈ 0.
481.90/17
/
(481.90 − 115.23)/(17 − 16)
=
= 50.913, P ≈ 0.
115.23/16
Para comparar cuadrático contra lineal, F1,17 =
Para comparar cúbico contra cuadrático, F1,16
Para comparar cuártico contra cúbico, F1,15 =
(115.23 − 111.78)/(16 − 15)
= 0.463, P > 0.10.
111.78/15
El modelo cúbico se selecciona con este procedimiento.
b) El modelo cúbico es y ⫽ 27.937 ⫹ 0.48749x ⫹ 0.85104x2 ⫺0.057254x3. La estimación y se maximiza cuando dy/dx
⫽ 0. dy/dx ⫽ 0.48749 ⫹ 1.70208x ⫺ 0.171762x2. Por tanto, x ⫽ 10.188.
13. a) Sea y1 el tiempo de vida de la pintura del patrocinador, y2 es el tiempo de vida de la pintura del competidor, x1 es la
temperatura en enero, x2 es la temperatura en julio, x3 es la precipitación. Entonces un buen modelo para y1 es y1 ⫽
⫺4.2342 ⫹ 0.79037x1 ⫹ 0.20554x2 ⫺ 0.082363x3 ⫺ 0.0079983x1x2 ⫺ 0.0018349x21. Un buen modelo para y2 es y2
⫽ 6.8544 ⫹ 0.58898x1 ⫹ 0.054759x2 ⫺ 0.15058x3 ⫺ 0.0046519x1x2 ⫹ 0.0019029x1x3 ⫺ 0.0035069x21.
b) ŷ1 ⫽ 13.83, ŷ2 ⫽ 13.90.
15. a)
Pronosticador
Constante
x
Coeficiente
0.25317
–0.041561
b)
Pronosticador
Constante
x
x2
Constante
x
x2
x3
0.0065217
0.040281
Coeficiente
Desviación
estándar
0.21995
0.58931
–2.2679
0.0038434
0.06146
0.2155
Coeficiente
Desviación
estándar
c)
Pronosticador
Desviación
estándar
0.22514
0.41105
–0.74651
–3.6728
0.0068959
0.20576
1.6887
4.043
T
38.819
–1.0318
T
57.23
9.5886
–10.524
T
32.648
1.9977
–0.44206
–0.90843
P
0.000
0.320
P
0.000
0.000
0.000
P
0.000
0.069
0.666
0.382
Respuestas a los ejercicios impares
d)
Pronosticador
Coeficiente
Constante
x
x2
x3
x4
0.23152
0.10911
3.4544
–26.022
40.157
Desviación
estándar
0.013498
0.58342
7.7602
40.45
72.293
T
839
P
17.152
0.18702
0.44515
–0.64333
0.55548
0.000
0.855
0.665
0.533
0.590
e) El modelo cuadrático. El coeficiente de x3 en el modelo cúbico no es significativamente diferente de 0. No hay ningún coeficiente de x4 en el modelo cuártico.
f ) 0.258
17. a)
Pronosticador
Constante
x1
x2
x 12
x 22
x1x2
Coeficiente
Desviación
estándar
–0.093765
0.63318
2.5095
5.318
–0.3214
0.15209
0.092621
2.2088
0.30151
8.2231
0.17396
1.5778
T
P
–1.0123
0.28666
8.3233
0.64672
–1.8475
0.09639
0.335
0.780
0.000
0.532
0.094
0.925
Análisis de varianza
Fuente
GL
Regresión
5
Error de residuos 10
Total
15
SC
20.349
0.045513
20.394
MC
F
P
4.0698
0.0045513
894.19
0.000
b) El modelo que contiene las variables x1, x2 y x 22 es bueno. A continuación se presentan los coeficientes junto con sus
desviaciones estándar, y enseguida la tabla del análisis de varianza.
Pronosticador
Constante
x1
x2
x 22
Coeficiente
Desviación
estándar
T
P
–0.088618
2.1282
2.4079
–0.27994
0.068181
0.30057
0.13985
0.059211
–1.2997
7.0805
17.218
–4.7279
0.218
0.000
0.000
0.000
Análisis de varianza
Fuente
GL
SC
Regresión
Error de residuos
Total
3
12
15
20.346
0.048329
20.394
MC
6.782
0.0040275
F
P
1683.9
0.000
840
Respuestas a los ejercicios impares
El estadístico F para comparar este modelo con el modelo cuadrático completo es
(0.048329 − 0.045513)/(12−10)
2
= 0.309, P ⬎ 0.10, por lo que es razonable eliminar x 1 y x1x2 del modelo
F2,10 =
0.045513/10
lcuadrático completo. Todos los coeficientes restantes son significativamente diferentes de 0, por lo que no sería razonable reducir más el modelo.
c) El modelo con el mejor R2 ajustado contiene las variables x2, x 21 y x 22. Este modelo también es el modelo con el valor mínimo de Mallows Cp (2.2). Éste no es el mejor modelo, ya que contiene a x 21, pero no x 1. El modelo que contiene x 1, x 2 y x 22, sugerido en la respuesta del inciso b), es mejor. Observe que el R2 ajustado para el modelo en el
inciso b) es 0.99704, que casi no difiere del modelo con el máximo valor de R2 ajustado.
19. a)
Pronosticador
Constante
t
t2
Coeficiente
1.1623
0.059718
–0.00027482
Desviación
estándar
0.17042
0.0088901
0.000069662
T
6.8201
6.7174
–3.9450
P
0.006
0.007
0.029
b) 17.68 minutos
c) (0.0314, 0.0880)
d) La tasa de reacción disminuye con el tiempo si β2 ⬍ 0. Por tanto,
se prueba H0 : β2 ⱖ 0 contra H1 : β2 ⬍ 0. El estadístico de prueba es t3 ⫽ 3.945, P ⫽ 0.029/2 ⫽ 0.0145. Es razonable
concluir que la tasa de reacción disminuye con el tiempo.
21. y = β0 + β1 x1 + β2 x2 + β3 x1 x2 + ε.
23. a) El modelo de 17 variables que contiene las variables independientes x 1, x 2, x 3, x 6, x 7, x 8, x 9, x 11, x 13, x 14, x 16, x 18, x 19,
x 20, x 21, x 22 y x 23 tiene un R2 ajustado igual a 0.98446. El modelo ajustado es
y = −1569.8 − 24.909x1 + 196.95x2 + 8.8669x3 − 2.2359x6 − 0.077581x7 + 0.057329x8
− 1.3057x9 − 12.227x11 + 44.143x13 + 4.1883x14 + 0.97071x16 + 74.775x18
+ 21.656x19 − 18.253x20 + 82.591x21 − 37.553x22 + 329.8x23
b) El modelo de ocho variables que contiene las variables independientes x 1, x 2, x 5, x 8, x 10, x 11, x 14, y x 21 tiene un Cp
de Mallows igual a 1.7. El modelo ajustado es
y = −665.98 − 24.782x1 + 76.499x2 + 121.96x5 + 0.024247x8 + 20.4x10 − 7.1313x11 + 2.4466x14 + 47.85x21
c) Utilizando un valor de 0.15 tanto para α que se introduce como para α que se elimina, la ecuación elegida para la
regresión paso a paso es y = −927.72 + 142.40x5 + 0.081701x7 + 21.698x10 + 0.41270x16 + 45.672x21 .
d) El siguiente modelo de 13 variables tiene un R2 ajustado igual a 0.95402. (También hay modelos de 12 variables cuyo R2 ajustado es sólo ligeramente menor.)
z = 8663.2 − 313.31x3 − 14.46x6 + 0.358x7 − 0.078746x8 + 13.998x9 + 230.24x10
− 188.16x13 + 5.4133x14 + 1928.2x15 − 8.2533x16 + 294.94x19 + 129.79x22 − 3020.7x23
e) El modelo de dos variables z ⫽ ⫺1660.9 ⫹ 0.67152x7 ⫹ 134.28x10 tiene un Cp de Mallows igual a ⫺4.0.
f) Utilizando un valor de 0.15 tanto para α que se introduce como para α que se elimina, la ecuación elegida por la regresión paso a paso es z ⫽ ⫺1660.9 ⫹ 0.67152x7 ⫹ 134.28x10
g) El siguiente modelo de 17 variables tiene un R2 ajustado igual a 0.97783.
w = 700.56 − 21.701x2 − 20.000x3 + 21.813x4 + 62.599x5 + 0.016156x7
− 0.012689x8 + 1.1315x9 + 15.245x10 + 1.1103x11 − 20.523x13 − 90.189x15
− 0.77442x16 + 7.5559x19 + 5.9163x20 − 7.5497x21 + 12.994x22 − 271.32x23
Respuestas a los ejercicios impares
841
h) El siguiente modelo de 13 variables tiene un Cp de Mallows igual a 8.0.
w = 567.06 − 23.582x2 − 16.766x3 + 90.482x5 + 0.0082274x7 − 0.011004x8 + 0.89554x9
+ 12.131x10 − 11.984x13 − 0.67302x16 + 11.097x19 + 4.6448x20 + 11.108x22 − 217.82x23
i) Utilizando un valor de 0.15 tanto para α que se introduce como para α que se elimina, la ecuación elegida por la regresión paso a paso es w ⫽ 130.92 ⫺ 28.085x2 ⫹ 113.49x5 ⫹ 0.16802x9 ⫺ 0.20216x16 ⫹ 11.417x19 ⫹ 12.068x21 ⫺
78.371x23.
Sección 9.1
1. a)
Fuente
GL
SC
MC
F
P
Duración
Error
Total
4 1.3280 0.33200 7.1143 0.002
15 0.7000 0.046667
19 2.0280
b) Sí. F4, 15 ⫽ 7.1143, 0.001 ⬍ P ⬍ 0.01 (P ⫽ 0.002).
3. a)
Fuente
GL
SC
Tratamiento 4
Error
11
Total
15
MC
F
P
19.009 4.7522 2.3604
22.147 2.0133
41.155
0.117
b) No. F4, 11 ⫽ 2.3604, P ⬎ 0.10 (P ⫽ 0.117).
5. a)
Fuente
GL
Lugar
Error
Total
3
47
50
SC
MC
F
P
1.4498 0.48327 2.1183 0.111
10.723 0.22815
12.173
b) No. F3, 47 ⫽ 2.1183, P ⬎ 0.10 (P ⫽ 0.111).
7. a)
Fuente
GL
Catalizador 2
Error
6
Total
8
SC
61.960
31.019
92.979
MC
F
P
30.980 5.9926 0.037
5.1698
b) Sí. F2, 6 ⫽ 5.9926, 0.01 ⬍ P ⬍ 0.05 (P ⫽ 0.037).
9. No, F3, 16 ⫽ 15.8255, P ⬍ 0.001 (P ⬇ 4.8 ⫻ 10⫺5).
11. a)
Fuente
GL
Temperatura 3
Error
16
Total
19
SC
MC
F
P
58.650 19.550 8.4914 0.001
36.837 2.3023
95.487
842
Respuestas a los ejercicios impares
b) Sí. F 3,16 = 8.4914, 0.001 < P < 0.01 (P = 0.0013).
13. a) s = 1.517
15. a)
b) 18
c) 38
Fuente
GL
SC
Grado
Error
Total
3
96
99
1721.4
5833.4
7554.9
MC
F
P
573.81 9.4431 0.000
60.765
b) Sí. F3, 96 ⫽ 9.4431, P ⬍ 0.001 (P ⬇ 0).
17. a) 0.85
b) 56
lidad de detectarla.
c) 200
d ) Mayor que 0.864138. Entre mayor sea la diferencia, mayor será la probabi-
Sección 9.2
1. a) Sí. F5, 6 ⫽ 46.64, P ⬇ 0.
√
b) q6, 6, .05 ⫽ 5.63. El valor de MSE es 0.00508. El valor crítico al 5% es, por tanto, 5.63 0.00508/2 = 0.284. Cualquier par que difiera en más de 0.284 se puede concluir que es diferente. Los siguientes pares satisfacen este criterio: A y B, A y C, A y D, A y E, B y C, B y D, B y E, B y F, D y F.
c) t6, .025/15 ⫽ 4.698 (el√valor obtenido por interpolación es 4.958). El valor de MSE es 0.00508. El valor crítico al 5%
es, por tanto, 4.698 2(0.00508)/2 = 0.335. Cualquier par que difiera en más de 0.335 se puede concluir que es diferente. Los siguientes pares satisfacen este criterio: A y B, A y C, A y D, A y E, B y C, B y D, B y E, B y F, D y F.
d) El método de Tukey-Kramer es más poderoso, ya que su valor crítico es más pequeño (0.284 contra 0.335).
e) Sea el método de Tukey-Kramer o el método de Bonferroni, ambos se pueden utilizar.
3. a) MSE ⫽ 2.9659, Ji ⫽ 12 para toda
√ i. Hay siete comparaciones que deben hacerse. Ahora t88, .025/7 ⫽ 2.754, por lo que
el valor crítico al 5% es 2.754 2.9659(1/12 + 1/12) = 1.936. Todas las medias muestrales de las formulaciones
no controladas difieren de la media muestral de las formulaciones controladas en más de esta cantidad. Por tanto, se
concluye que al nivel de 5% todas las formulaciones no controladas difieren de la formulación controlada.
b) Hay siete comparaciones que deben hacerse. Se debe utilizar el valor de rango de Student q7, 88, .05. Este valor no está
√
en la tabla, por lo que se usará q7, 60, .05 ⫽ 4.31, que es un poco mayor. El valor crítico al 5% es 4.31 2.9659/12 =
2.14. Todas las formulaciones no controladas difieren de la media muestral de la formulación controlada en más de
esta cantidad. Por tanto, se concluye que al nivel de 5% todas las formulaciones no controladas difieren de la formulación controlada.
c) El método de Bonferroni es más poderoso, porque está basado en el número real de comparaciones que deben hacerse, que es siete. El método de Tukey-Kramer está basado en el número mayor de comparaciones que se pudieran
hacer, que es (7)(8)/2 ⫽ 28.
5. a) t16, .025/6 ⫽ 3.0083 (el√valor obtenido por interpolación es 3.080). El valor de MSE es 2.3023. Por tanto, el valor crítico al 5% es 3.0083 2(2.3023)/5 = 2.8869. Se puede concluir que la media para 750°C difiere de las medias para 850°C y 900°C, y que la media para 800°C difiere de la media para 900°C.
√
b) q4, 16, .05 ⫽ 4.05. El valor de MSE es 2.3023. Por tanto, el valor crítico al 5% es 4.05 2.3023/5 = 2.75. Se puede
concluir que la media para 750°C difiere de las medias para 850°C y 900°C, y que la media para 800°C difiere de
la media para 900°C.
c) El método de Tukey-Kramer es más poderoso, porque su valor crítico es menor.
7. a) t16, .025/3 ⫽ 2.6730 (el valor obtenido por interpolación es 2.696). El valor de MSE es 2.3023. Por tanto, el valor crí√
tico al 5% es 2.6730 2(2.3023)/5 = 2.5651. Se puede concluir que la media para 900°C difiere de las medias para 750°C y 800°C.
Respuestas a los ejercicios impares
843
√
b) q4, 16, .05 ⫽ 4.05. El valor de MSE es 2.3023. Por tanto, el valor crítico al 5% es 4.05 2.3023/5 = 2.75. Se puede
concluir que la media para 900°C difiere de las medias para 750°C y 800°C.
c) El método de Bonferroni es más poderoso, porque su valor crítico es menor.
–
9. a) t47, .025 ⫽ 2.012, MSE ⫽ 0.22815, los tamaños de la muestra son 16 y 9. Las
√ medias de la muestra son X1 ⫽ 1.255625,
–
X2 ⫽ 1.756667. El intervalo de confianza del 95% es 0.501042 ± 2.012 0.22815(1/16 + 1/9), o (0.1006, 0.9015).
b) Los tamaños de la muestra son J1 ⫽ 16, J2 ⫽ 9, J3 ⫽ 14, J4 ⫽ 12. MSE ⫽ 0.22815. Se debe usar el valor del rango
de Student q4, 47, .05. Este
valor no está en la tabla, por lo que se usará q4, 40, .05 ⫽ 3.79, que es sólo un poco mayor.
Los valores de q4,40,.05 (MSE/2)(1/Ji + 1/Jj ) se presentan en la siguiente tabla de la izquierda y los valores de
–
–
las diferencias 兩 Xi. ⫺ Xj. 兩 se presentan en la tabla de la derecha.
1
2
3
4
1
—
0.53336 0.46846 0.48884
2 0.53336
—
0.54691 0.56446
3 0.46846 0.54691
—
0.50358
4 0.48884 0.56446 0.50358
1
2
3
4
1
0
0.50104
0.16223
0.18354
2
0.50104
0
0.33881
0.31750
3
0.16223
0.33881
0
0.02131
4
0.18354
0.3175
0.02131
0
Ninguna de las diferencias excede su valor crítico, por lo que cualquiera de las medias de tratamiento difiere.
–
–
11. a) t8, .025 ⫽ 2.306, MSE = 1.3718. Las medias muestrales son X1 ⫽ 1.998 y X3 ⫽ 5.300. Los tamaños de las muestras son
√
J1 ⫽ 5 y J3 ⫽ 3. Por tanto, el intervalo de confianza del 95% es 3.302 ± 2.306 1.3718(1/5 + 1/3), o (1.330, 5.274).
–
–
–
b) Las medias muestrales son X1 ⫽ 1.998, X2 ⫽ 3.0000, X3 ⫽ 5.300. Los tamaños de la muestra son J1 ⫽ 5, J2 ⫽ J3 ⫽
–
–
–
–
兩 X 1 ⫺ X 2 兩 y para 兩 X 1 ⫺ X 3 兩
3. El punto superior al 5% del rango de Student es q3, 8, .05 ⫽ 4.04. El valor crítico para √
√
es 4.04 (1.3718/2)(1/5 + 1/3) = 2.44, y el valor crítico al 5% para |X2 −X 3 | es 4.04 (1.3718/2)(1/3 + 1/3) =
2.73. Por tanto, las medias 1 y 3 difieren al nivel de 5%.
13. a) MSTr ⫽ 19.554 por lo que F ⫽ 19.554/3.85 ⫽ 5.08. Hay 3 y 16 grados de libertad, por lo que 0.01 ⬍ P ⬍ 0.05. La
hipótesis nula de no diferencia se rechaza al nivel de 5%.
√
b) q4, 16, .05 ⫽ 4.05, por lo que el catalizador cuyas medias difieren en más de 4.05 3.85/5 = 3.55 son significativamente diferentes al nivel de 5%. Los dos catalizadores 1 y 2 difieren significativamente del catalizador 4.
15. Cualquier valor de MSE satisface 5.099 ⬍ MSE ⬍ 6.035.
Sección 9.3
1. a) 3
e)
b)
Fuente
2
c)
GL
6
SC
Aceite
3 1.0926
Anillo
2 0.9340
Interacción 6 0.2485
Error
24 1.7034
Total
35 3.9785
d) 24
MC
F
P
0.36420 5.1314 0.007
0.46700 6.5798 0.005
0.041417 0.58354 0.740
0.070975
f) Sí. F6, 24 ⫽ 0.58354, P ⬎ 0.10 (P ⫽ 0.740).
g) No, algunos de los efectos principales del tipo de aceite son diferentes de cero. F3, 24 ⫽ 5.1314, 0.001 ⬍ P ⬍ 0.01
(P ⫽ 0.007).
h) No, algunos de los efectos principales del tipo de anillo son diferentes de cero. F2, 24 ⫽ 6.5798, 0.001 ⬍ P ⬍ 0.01
(P ⫽ 0.005).
844
Respuestas a los ejercicios impares
3. a)
Fuente
GL
Temperatura molde
Aleación
Interacción
Error
Total
4
2
8
45
59
SC
MC
69 738
8958
7275
115 845
201 816
F
P
17 434.5 6.7724 0.000
4 479.0 1.7399 0.187
909.38 0.35325 0.939
2 574.3
b) Sí. F8, 45 ⫽ 0.35325, P ⬎ 0.10(P ⫽ 0.939).
c) No, algunos de los principales efectos de la temperatura de molde son distintos de cero. F4, 45 ⫽ 6.7724, P ⬍ 0.001
(P ⬇ 0).
d) Sí. F3, 45 ⫽ 1.7399, P ⬎ 0.10, (P ⫽ 0.187).
Interacciones
5. a)
Temperatura
Efectos principales
de la solución
Efectos principales
de la temperatura
Solución
25° C
NaCl
–9.1148
Na2 HPO4 9.1148
25° C
37° C
NaCl
Na2 HPO4
–0.49983
0.49983
b) Fuente
GL
Solución
1
Temperatura 1
Interacción
1
Error
20
Total
23
SC
1.8101
–1.8101
MC
1 993.9
1 993.9
78.634
78.634
5.9960
5.9960
7 671.4
383.57
9 750.0
F
37° C
0.49983
–0.49983
P
5.1983 0.034
0.20500 0.656
0.015632 0.902
c) Sí. F1, 20 ⫽ 0.015632, P ⬎ 0.10 (P ⫽ 0.902).
d ) Sí, puesto que el modelo aditivo es creíble. La media de la tensión producida difiere entre Na2HPO4 y NaCl: F1, 20 ⫽
5.1983, 0.01 ⬍ P ⬍ 0.05 (P ⫽ 0.034).
e) No hay evidencia de que la temperatura afecte la tensión producida: F1, 20 ⫽ 0.20500, P ⬎ 0.10 (P ⫽ 0.656).
7. a)
Efectos principales
del peso
15
25
b)
1.9125
⫺1.9125
Fuente
Peso
Ácido láurico
Interacción
Error
Total
Interacciones
Efectos principales
del ácido láurico
10
30
Fracción = 10
Peso ⫽ 15
Peso ⫽ 25
2.8375
⫺2.8375
GL
SC
MC
F
1
1
1
4
7
29.261
64.411
122.46
15.725
231.86
29.261
64.411
122.46
3.9312
7.4432
16.384
31.151
c) No. F1, 4 ⫽ 31.151, 0.001 ⬍ P ⬍ 0.01 (P ⫽ 0.005).
d ) No, debido a que el modelo aditivo es rechazado.
e) No, debido a que el modelo aditivo es rechazado.
⫺3.9125
3.9125
P
0.053
0.016
0.005
Fracción = 30
3.9125
⫺3.9125
Respuestas a los ejercicios impares
Interacciones
9. a)
Efectos principales
del largo
Efectos principales
del material
Corto
Medio
Largo
CPTi-ZrO2
0.044367
Aleación Ti-ZrO 2 –0.044367
b)
845
Fuente
GL
SC
–0.018533
–0.024833
0.043367
MC
Material del cono 1 0.059052
Longitud
2 0.028408
Interacción
2 0.0090089
Error
24 0.059976
Total
29 0.15652
F
Largo
Corto
Medio
Largo
CPTi-ZrO2
0.0063333 –0.023767 0.017433
Aleación Ti-ZrO 2 0.0063333 0.023767 –0.017433
P
0.059052 23.630 0.000
0.014204
5.6840 0.010
0.0045444 1.8185 0.184
0.002499
c) Sí, puede ser creíble que las interacciones sean iguales a 0. El valor del estadístico de prueba es 1.8185, su distribución nula es F2, 24 y P ⬎ 0.10 (P ⫽ 0.184).
d ) Sí, debido a que el modelo aditivo es creíble. La media del coeficiente de fricción difiere entre CPTi-ZrO2 y Aleación
Ti-ZrO2: F1, 24 ⫽ 23.630, P ⬍ 0.001.
e) Sí, debido a que el modelo aditivo es creíble. La media del coeficiente de fricción no es la misma para todas los largos: √
F2, 24 ⫽ 5.6840, P ⬇ 0.01. Para determinar qué pares de efectos difieren, se utiliza q3, 24, .05 ⫽ 3.53. Se calcula
3.53 0.002499/10 = 0.056. Se concluye que el efecto de la longitud del largo difiere de las longitudes cortas y
medianas, pero no se puede concluir que los efectos de las longitudes cortas y medianas difieren entre sí.
Interacciones
11. a)
Efectos principales
de la concentración
15
40
100
b)
Fuente
Efectos principales del
cociente de entrega
1:1
1:5
1:10
0.16667
–0.067778
–0.098889
DL
SC
Concentración
2 0.37936
Cociente de entrega 2 7.34
Interacción
4 3.4447
Error
18 0.8814
Total
26 12.045
Concentración
15
40
100
0.73333
–0.30000
–0.43333
MC
F
Cociente de entrega
1:1
1:5
1:10
0.66778
–0.20111
–0.46667
P
0.18968
3.8736 0.040
3.67
74.949 0.000
0.86118 17.587 0.000
0.048967
c) No. El valor del estadístico de prueba es 17.587, su distribución nula es F4, 18, y P ⬇ 0.
–0.30222 –0.36556
–0.064444 0.26556
0.36667
0.10000
846
Respuestas a los ejercicios impares
d)
3
2.5
Absorción (%)
Concentración = 15
2
1.5
Concentración = 100
1
Concentración = 40
Las pendientes de los segmentos de la recta son bastantes diferentes entre sí, lo que indica el alto grado de
interacción.
0.5
0
1:1
1:5
Cociente de entrega
1:10
Interacciones
13. a)
Efectos principales
del sistema de unión
Clavo
Adhesivo
b)
Fuente
–1.3832
1.3832
GL
Sistema de unión 1
Longitud
2
Interacción
2
Error
54
Total
59
Efectos principales
de la longitud
Un cuarto –7.1165
La mitad –2.5665
Completo
9.683
SC
MC
Longitud
Sistema de unión
Un cuarto La mitad Completo
Clavo
Adhesivo
F
0.48317
–0.48317
0.33167
–0.33167
–0.51633
0.51633
P
114.79
114.79
57.773 0.000
3 019.8 1 509.9
759.94
0.000
10.023
5.0115 2.5223 0.090
107.29
1.9869
3 251.9
c) El modelo aditivo es apenas creíble: F2, 54 ⫽ 2.5223, 0.05 ⬍ P ⬍ 0.10 (P ⫽ 0.090).
d ) Sí, el método del sistema de unión afecta la carga crítica de doblaje: F1, 54 ⫽ 57.773, P ⬇ 0.
e) Sí, el miembro de lado afecta la carga crítica de doblaje: F2, 54 ⫽ 759.94, P ⬇ 0. Para determinar cuál de los efectos
difiere a un nivel de 5% se usaría q3,√54, .05. Este valor no se encuentra en la tabla A.8, por lo que se aproxima a éste
con q3, 40, .05 ⫽ 3.44. Se calcula 3.44 1.9869/20 = 1.08. Se concluye que los efectos de un cuarto, la mitad y completo difieren entre sí
15. a)
Fuente
GL
SC
Placa
Operador
Interacción
Error
Total
2
2
4
9
17
114 661.4
136.78
6.5556
45.500
114 850.3
MC
57 330.7
68.389
1.6389
5.0556
F
11 340.1
13.53
0.32
P
0.000
0.002
0.855
b) Hay diferencias entre los operadores. F2, 9 ⫽ 13.53, 0.01 ⬍ P ⬍ 0.001(P ⫽ 0.002).
Respuestas a los ejercicios impares
17. a)
Fuente
GL
SC
MC
F
PVAL
DCM
Interacción
Error
Total
2
2
4
18
26
125.41
1 647.9
159.96
136.94
2 070.2
62.704
823.94
39.990
7.6075
8.2424
108.31
5.2567
847
P
0.003
0.000
0.006
b) Puesto que los términos de interacción no son iguales a 0 (F4, 18 ⫽ 5.2567, P ⫽ 0.006), no se pueden interpretar los
efectos principales. Por tanto, se calculan las medias de las celdas. Éstas son
DCM (ml)
PVAL
50
40
30
0.5
1.0
2.0
97.8
93.5
94.2
92.7
80.8
88.6
74.2
75.4
78.8
Se concluye que un nivel DCM de 50 ml produce mayor eficiencia de encapsulación que en los otros niveles. Si DCM
⫽ 50, la concentración PVAL no tiene mucho efecto. Observe que para DCM ⫽ 50, la eficiencia de encapsulación se
maximiza en la menor concentración PVAL, pero para DCM ⫽ 30 se maximiza a la mayor concentración PVAL. Ésta
es la fuente de la interacción significativa.
Sección 9.4
1. a) El abono es el factor bloqueado, la tierra es el factor de tratamiento.
b)
Fuente GL
Tierra
Bloque
Error
Total
SC
MC
F
P
3 1.178 0.39267 18.335 0.000
4 5.047 1.2617
58.914 0.000
12 0.257 0.021417
19 6.482
c) Sí, F3, 12 ⫽ 18.335, P ⬇ 0.
√
d) q4, 12, .05 ⫽ 4.20, MSAB ⫽ 0.021417 y J ⫽ 5. Por tanto, el valor crítico de 5% es 4.20 0.021417/5 = 0.275. Las
–
–
–
–
medias muestrales son XA ⫽ 6.32, XB ⫽ 6.02, XC ⫽ 6.28, XD ⫽ 6.70. Por tanto, se puede concluir que D difiere de A,
B y C, y que A difiere de B.
3. a)
Fuente
GL
SC
Concentración 2
756.7
Bloque
3
504.7
Interacción
6
415.3
Error
24 1 809.4
Total
35 3 486.1
MC
F
P
378.35 5.0185 0.015
168.23 2.2315 0.110
69.217 0.91809 0.499
75.392
b) Sí. El P-valor para la interacción es grande (0.499).
c) Sí. El P-valor para la concentración es pequeño (0.015).
848
Respuestas a los ejercicios impares
5. a)
Fuente GL
Variedad
Bloque
Error
Total
9
5
45
59
SC
MC
F
339 032
1 860 838
660 198
2 860 069
37 670
372 168
14 671
P
2.5677 0.018
25.367 0.000
b) Sí, F9, 45 ⫽ 2.5677, P ⫽ 0.018.
7. a)
GL
Fuente
SC
MC
F
P
Centrales de abastecimiento
de agua
3 1 253.5 417.84 4.8953 0.005
Bloque
14 1 006.1 71.864 0.84193 0.622
Error
42 3 585.0 85.356
Total
59 5 844.6
c) Para determinar cuáles efectos difieren al 5%, se debe usar q4, 42, .05. Este valor
b) Sí, F3, 42 ⫽ 4.8953, P ⫽ 0.005.
no se
encuentra
en
la
tabla
A.8,
por
lo que se aproxima con q4, 40, .05 ⫽ 3.79. El valor crítico del 5% es
√
–
–
–
–
3.79 85.356/15 = 9.04. Las medias muestrales son XA ⫽ 34.000, XB ⫽ 22.933, XC ⫽ 24.800, XD ⫽ 31.467. Se puede
concluir que A difiere tanto de B como de C.
d) El P-valor para el factor bloqueado es grande (0.622), lo que sugiere que el factor bloqueado (tiempo) tiene sólo un
efecto pequeño en el resultado. Por tanto, podría ser razonable despreciar al factor bloqueado y realizar un ANOVA
de un sentido.
9. a) Un motor de cada tipo se deberá probar cada día. El orden con el cual se probarán en un día dado debe ser aleatorio. Éste es un diseño de bloques aleatorios, en el cual los días son los bloques. Éste no es un diseño completamente aleatorio, ya que la aleatorización ocurre sólo dentro de los bloques.
b) El estadístico de prueba es 4
j =1
5
5
i=1
i=1
(Xi. − X .. )2
(Xij − X i. − X .j − X .. )2 /12
.
Sección 9.5
1.
1
ad
bd
ab
cd
ac
bc
abcd
A
B
C
D
–
+
–
+
–
+
–
+
–
–
+
+
–
–
+
+
–
–
–
–
+
+
+
+
–
+
+
–
+
–
–
+
Los pares de seudónimos son {A, BCD}, {B, ACD}, {C, ABD}, {D, ABC}, {AB, CD}, {AC,
BD} y {AD, BC}
Respuestas a los ejercicios impares
3. a)
Variable
Efecto
GL
Suma de
cuadrados
Media
cuadrática
A
B
C
AB
AC
BC
ABC
Error
Total
23.0000
–5.0000
1.5000
7.5000
3.0000
0.0000
0.5000
1
1
1
1
1
1
1
8
15
2 116.0000
100.0000
9.0000
225.0000
36.0000
0.0000
1.0000
64.0000
2 551.0000
2 116.0000
100.0000
9.0000
225.0000
36.0000
0.0000
1.0000
8.0000
F
P
264.5000
12.5000
1.1250
28.1250
4.5000
0.0000
0.1250
0.000
0.008
0.320
0.001
0.067
1.000
0.733
849
b) Los efectos principales A y B y la interacción AB son más importantes. La interacción AC es frontera.
c) La media de la producción es mayor cuando la temperatura es 180°C.
5. a)
Variable
Efecto
A
B
C
AB
AC
BC
ABC
3.3750
23.625
1.1250
–2.8750
–1.3750
–1.6250
1.8750
b) No, puesto que el diseño es sin réplica, no hay suma de cuadrados del error.
c) No, ninguno de los términos de interacción son casi tan grandes como el efecto principal del factor B.
d) Si el modelo aditivo se sabe que vale, entonces la siguiente tabla ANOVA muestra que los efectos principales de B
no es igual a 0, mientras que los efectos principales de A y C podría ser igual a 0.
Variable
Efecto
GL
Suma de
cuadrados
Media
cuadrática
A
B
C
Error
Total
3.3750
23.625
1.1250
1
1
1
4
7
22.781
1 116.3
2.5312
32.625
1 174.2
22.781
1 116.3
2.5312
8.1562
F
2.7931
136.86
0.31034
P
0.170
0.000
0.607
850
Respuestas a los ejercicios impares
7. a)
Variable Efecto
A
B
C
AB
AC
BC
ABC
2.445
0.140
–0.250
1.450
0.610
0.645
–0.935
b) No, debido a que el diseño es sin réplica, no hay suma de los cuadrados del error.
0.999
0.99
0.95
0.9
0.75
0.5
c) Las estimaciones se encuentran cerca de una recta, por
lo que ninguno de los factores se puede decir obviamente que influya en la resistencia.
0.25
0.1
0.05
0.01
0.001
⫺1
9. a) Variable Efecto
A
B
C
D
AB
AC
AD
BC
BD
CD
ABC
ABD
ACD
BCD
ABCD
1.2
3.25
–16.05
–2.55
2
2.9
–1.2
1.05
–1.45
–1.6
–0.8
–1.9
–0.15
0.8
0.65
b) El factor C es el único que realmente se distingue.
0
1
Efecto
2
Respuestas a los ejercicios impares
11. a)
Variable
Efecto
GL
Suma de
cuadrados
Media
cuadrática
A
B
C
AB
AC
BC
ABC
Error
Total
14.245
8.0275
–6.385
–1.68
–1.1175
–0.535
–1.2175
1
1
1
1
1
1
1
8
15
811.68
257.76
163.07
11.29
4.9952
1.1449
5.9292
9.3944
1 265.3
811.68
257.76
163.07
11.29
4.9952
1.1449
5.9292
1.1743
F
691.2
219.5
138.87
9.6139
4.2538
0.97496
5.0492
851
P
0.000
0.000
0.000
0.015
0.073
0.352
0.055
b) Todos los efectos principales son significativos, así como la interacción AB. Únicamente la interacción BC tiene un
P-valor que es razonablemente grande. Los tres factores parecen importantes, y parecen interaccionar considerablemente entre sí.
13. ii)
Ejercicios adicionales para el capítulo 9
1.
Fuente GL
Yeso
Error
Total
3
8
11
SC
MC
F
P
0.013092 0.0043639 0.28916 0.832
0.12073 0.015092
0.13383
El valor del estadístico es F3, 8 ⫽ 0.28916; P ⬎ 0.10(P ⫽ 0.832). No hay evidencia de que el pH difiera con la cantidad de yeso agregado.
3.
Fuente GL
Día
Error
Total
SC
2
36
38
MC
1.0908
0.87846
1.9692
F
P
0.54538 22.35 0.000
0.024402
Se puede concluir que la media del contenido del azúcar entre los tres días (F2, 36 ⫽ 22.35, P ⬇ 0).
5. a) No. Las varianzas no son constantes a través de los grupos. En particular, hay un dato atípico en el grupo 1.
b) No, por las mismas razones que en el inciso a).
c)
Fuente GL
Grupo
Error
Total
4
35
39
SC
5.2029
5.1080
10.311
MC
F
P
1.3007 8.9126 0.000
0.14594
Se concluye que la media de los tiempos de disolución difiere entre los grupos (F4, 35 ⫽ 8.9126, P ⬇ 0).
7. La recomendación no es buena. El ingeniero está tratando de interpretar los efectos principales sin considerar las interacciones. El P-valor pequeño para las interacciones indica que se deben considerar. Observando las medias de la celda,
852
Respuestas a los ejercicios impares
es obvio que si se usa el diseño 2, entonces el material menos costoso se desarrolla igual de bien que el material más
costoso. Por tanto, la mejor recomendación es utilizar el diseño 2 con el material menos costoso.
9. a)
Fuente
GL
Base
3
Instrumento 2
Interacción
6
Error
708
Total
719
SC
F
MC
P
13 495 4 498.3
7.5307 0.000
90 990 45 495
76.164 0.000
12 050 2 008.3
3.3622 0.003
422 912
597.33
539 447
b) No, esto no es adecuado debido a que hay interacciones entre los efectos renglón y columna (F6, 708 ⫽ 3.3622, P ⫽
0.003).
b) q5, 20 ⫽ 4.23, MSE ⫽ 29.026, J ⫽ 4. Por tanto, el valor crítico 5% es
11. a) Sí, F4, 15 ⫽ 8.7139, P ⫽ 0.001.
√
–
–
–
4.23 29.026/4 = 11.39. Las medias muestrales para los cinco canales son X1 ⫽ 44.000, X2 ⫽ 44.100, X3 ⫽ 30.900,
–
–
X4 ⫽ 28.575, X5 ⫽ 44.425. Por tanto, podemos concluir que los canales 3 y 4 difieren de los canales 1, 2 y 5.
13. No, F4, 289 ⫽ 1.5974, P ⬎ 0.10(P ⫽ 0.175).
15. a) s ⫽ 5.388
17. a)
Variable
A
B
C
D
b) 10
Efecto
3.9875
2.0375
1.7125
3.7125
c) 22
Variable
Efecto
Variable
Efecto
Variable
AB
AC
AD
BC
–0.1125
0.0125
–0.9375
0.7125
BD
CD
ABC
ABD
–0.0875
0.6375
–0.2375
0.5125
ACD
BCD
ABCD
Efecto
0.4875
–0.3125
–0.7125
b) Los efectos principales son notablemente mayores que las interacciones, y los efectos principales para A y D son notablemente mayores que aquellos para B y C.
c)
Suma de
Media
Variable
Efecto
GL
F
P
cuadrados
cuadrática
A
B
C
D
AB
AC
AD
BC
BD
CD
Interacción
Total
3.9875
2.0375
1.7125
3.7125
–0.1125
0.0125
–0.9375
0.7125
–0.0875
0.6375
1
1
1
1
1
1
1
1
1
1
5
15
63.601
16.606
11.731
55.131
0.050625
0.000625
3.5156
2.0306
0.030625
1.6256
4.6481
158.97
63.601
16.606
11.731
55.131
0.050625
0.000625
3.5156
2.0306
0.030625
1.6256
0.92963
68.415
17.863
12.619
59.304
0.054457
0.00067231
3.7818
2.1843
0.032943
1.7487
Se puede concluir que cada uno de los factores A, B, C y D tienen un efecto en el resultado.
0.000
0.008
0.016
0.001
0.825
0.980
0.109
0.199
0.863
0.243
Respuestas a los ejercicios impares
853
d) Los estadísticos F se calculan al dividir la media cuadrática para cada efecto (igual a su suma de los cuadrados) entre el error medio cuadrático 1.04. Los grados de libertad para cada estadístico F son 1 y 4. Los resultados se resumen en la tabla siguiente.
Variable
Efecto
GL
Suma de
cuadrados
Media
cuadrática
A
B
C
D
AB
AC
AD
BC
BD
CD
ABC
AB D
ACD
BCD
ABCD
3.9875
2.0375
1.7125
3.7125
–0.1125
0.0125
–0.9375
0.7125
–0.0875
0.6375
–0.2375
0.5125
0.4875
–0.3125
–0.7125
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
63.601
16.606
11.731
55.131
0.050625
0.000625
3.5156
2.0306
0.030625
1.6256
0.22563
1.0506
0.95063
0.39062
2.0306
63.601
16.606
11.731
55.131
0.050625
0.000625
3.5156
2.0306
0.030625
1.6256
0.22563
1.0506
0.95063
0.39062
2.0306
F
61.154
15.967
11.279
53.01
0.048678
0.00060096
3.3804
1.9525
0.029447
1.5631
0.21695
1.0102
0.91406
0.3756
1.9525
e) Sí. Ninguno de los P-valores para las interacciones de tercer o más alto orden es pequeño.
f) Se puede concluir que cada uno de los factores A, B, C y D tienen un efecto en el resultado.
19. Sí, F2, 107 ⫽ 9.4427, P ⬍ 0.001.
21. a)
Fuente
GL
SC
MC
H2 SO4
CaCl2
Interacción
Error
Total
2
2
4
9
17
457.65
38 783
279.78
232.85
39 753
228.83
19 391
69.946
25.872
F
8.8447
749.53
2.7036
P
0.008
0.000
0.099
b) El P-valor para la interacción es 0.099. No se puede descartar el modelo aditivo.
c) Sí, F2, 9 ⫽ 8.8447, 0.001 ⬍ P ⬍ 0.01(P ⫽ 0.008).
d) Sí, F2, 9 ⫽ 749.53, P ⬇ 0.000.
23. Sí, F6, 39 ⫽ 20.302, P ⬇ 0.
Sección 10.1
1. a) Continua
b) Discreta
3. a) está en control
5. a) Falso
b) Falso
c) Binaria
d) Continua
b) tiene una capacidad alta
c) Verdadero
d ) Falso
P
0.001
0.016
0.028
0.002
0.836
0.982
0.140
0.235
0.872
0.279
0.666
0.372
0.393
0.573
0.235
854
Respuestas a los ejercicios impares
Sección 10.2
1. a) LCL ⫽ 0, UCL ⫽ 10.931
b) LCL ⫽ 0, UCL ⫽ 4.721
c) LCL ⫽ 20.258, UCL ⫽ 27.242
d ) LCL ⫽ 20.358, UCL ⫽ 27.142
3. a) LCL ⫽ 0, UCL ⫽ 0.277. La varianza está en control.
b) LCL ⫽ 1.034, UCL ⫽ 1.186. El proceso está fuera de control por primera vez en la muestra 17.
c) Los límites 1s son 1.085, 1.135; los límites 2s son 1.0596, 1.1604. El proceso está fuera de control la primera vez
en la muestra 8, donde dos de las tres últimas muestras están debajo del límite de control 2s.
5. a) 43.86
b) 12.03
c) 0.985
d ) 17
7. a) 0.126
b) 0.237
c) 0.582
d ) 256
9. a) LCL ⫽ 0.0588, UCL ⫽ 3.863. La varianza está en control.
b) LCL ⫽ 197.292, UCL ⫽ 202.340. El proceso está en control.
c) Los límites 1s son 198.975, 200.657; los límites 2s son 198.133, 201.499. El proceso está en control.
11. a) LCL ⫽ 0, UCL ⫽ 0.971. La varianza está en control.
b) LCL ⫽ 9.147, UCL ⫽ 10.473. El proceso está en control.
c) Los límites 1s son 9.589, 10.031; los límites 2s son 9.368, 10.252. El proceso está fuera de control por primera vez
en la muestra 9, donde dos de las tres últimas muestras están debajo del límite de control 2s.
–
13. a) LCL ⫽ 0, UCL ⫽ 6.984. La varianza está fuera de control en la muestra 8. Después de eliminar esta muestra, X ⫽
–
s ⫽ 2.911. Los nuevos límites para el diagrama S son 0 y 6.596. Ahora la varianza está en control.
150.166, R ⫽ 6.538, b) LCL ⫽ 145.427, UCL ⫽ 154.905. El proceso está en control.
c) Los límites 1s son 148.586, 151.746; los límites 2s son 147.007, 153.325. El proceso está en control (recuerde que
la muestra 8 se ha eliminado).
Sección 10.3
1. La recta central es 0.0547, LCL es 0.00644, UCL es 0.1029.
3. Sí, los límites 3s son 0.0254 y 0.2234.
5. iv)
7. Estaba fuera de control. El UCL es 45.82.
Sección 10.4
1. a) No se necesita eliminar muestras.
b) sX– ⫽ (0.577)(0.131)/3 ⫽ 0.0252
Respuestas a los ejercicios impares
855
c)
Diagrama CUSUM
0.4
0.3
Suma acumulativa
0.2
0.1
UCL = 0.101
0
LCL = ⫺0.101
⫺0.1
⫺0.2
⫺0.3
⫺0.4
0
5
10
Número de muestra
15
20
d ) El proceso está fuera de control en la muestra 8.
está fuera de control en la muestra 8.
3. a) No es necesario eliminar muestras.
e) Las reglas de Western Electric especifican que el proceso
b) sX– ⫽ (0.577)(1.14)/3 ⫽ 0.219
c)
Diagrama CUSUM
3
Suma acumulativa
2
1
UCL = 0.877
0
LCL = ⫺0.877
⫺1
⫺2
⫺3
0
5
10
15
20
Número de muestra
25
d ) El proceso está fuera de control en la muestra 9.
está fuera de control en la muestra 9.
30
e) Las reglas de Western Electric especifican que el proceso
856
Respuestas a los ejercicios impares
5. a)
Diagrama CUSUM
80
60
UCL = 60
Suma acumulativa
40
20
0
⫺20
⫺40
⫺60
LCL = ⫺60
⫺80
0
10
20
Número de muestra
30
40
b) El proceso está en control.
Sección 10.5
1. a) Cpk ⫽ 2.303
3. a) 0.20
5. a) m ⫾ 3.6s
b) Sí. Puesto que Cpk ⬎ 1, la capacidad del proceso es aceptable.
b) 3.071
b) 0.0004
c) Probablemente. La aproximación normal quizá sea imprecisa en las colas.
Ejercicios adicionales para el capítulo 10
1. La recta central es 0.0596, LCL es 0.0147, UCL es 0.1045.
3. a) LCL ⫽ 0, UCL ⫽ 0.283. La varianza está en control.
b) LCL ⫽ 4.982, UCL ⫽ 5.208. El proceso está fuera de control en la muestra 3.
c) Los límites 1s son 5.057, 5.133; los límites 2s son 5.020, 5.170. El proceso está fuera de control por primera vez
en la muestra 3, donde una media de la muestra está arriba del límite de control superior 3s.
5. a) No es necesario eliminar muestras.
b) sX– ⫽ (1.023)(0.110)/3 ⫽ 0.0375
Respuestas a los ejercicios impares
c)
857
Diagrama CUSUM
1
Suma acumulativa
0.5
UCL = 0.15
0
LCL = ⫺0.15
⫺0.5
⫺1
0
5
10
15
20
Número de muestra
25
d ) El proceso no está en control en la muestra 4.
tá fuera de control en la muestra 3.
7. a) LCL ⫽ 0.0170, UCL ⫽ 0.0726.
30
e) La reglas de Western Electric especifican que el proceso es-
b) Muestra 12
c) No, esta causa especial mejora el proceso. Ésta debe preservarse en lugar de eliminarse.
Apéndice B
∂v
= 8xy 3
∂y
1.
∂v
= 3 + 2y 4 ,
∂x
2.
3x 2
2x(x 3 + y 3 )
∂w
= 2
−
,
∂x
x + y2
(x 2 + y 2 )2
∂w
3y 2
2y(x 3 + y 3 )
= 2
−
∂y
x + y2
(x 2 + y 2 )2
3.
∂z
∂z
= − sen x sen y 2 ,
= 2y cos x cos y 2
∂x
∂y
4.
∂v
= yexy ,
∂x
5.
∂v
∂v
∂v
= ex (cos y + sen z),
= −ex sen y,
= ex cos z
∂x
∂y
∂z
∂v
= xexy
∂y
∂w
∂w
x
4y
,
,
=√ 2
=√ 2
∂x
∂y
x + 4y 2 + 3z2
x + 4y 2 + 3z2
2x
∂z
2y
∂z
= 2
,
= 2
7.
∂x
x + y2
∂y
x + y2
6.
8.
∂v
2xy
x2
∂v
2
2
= 2
− zey sen(xz),
= 2
+ 2yey cos(xz),
∂x
x y+z
∂y
x y+z
∂v
=
9.
∂x
10.
∂w
3z
= √ 2
∂z
x + 4y 2 + 3z2
3
y5
−
x
2
∂z
xy cos(x 2 y)
,
= √
∂x
sen(x 2 y)
y3
,
x
∂v
9√
= 5 xy 3 −
xy
∂y
2
∂z
x 2 cos(x 2 y)
= √
∂y
2 sen(x 2 y)
1
∂v
2
= 2
− xey sen(xz)
∂z
x y+z
ÍNDICE ANALÍTICO
23 Experimento factorial
efectos, suma de los cuadrados de los, 696
errores, suma de los cuadrados de los, 696
estimación de los efectos, 695
notación, 693
prueba F, 696-697
tabla de signos, 694
tabla del análisis de la varianza, 697
2p Experimento factorial
efectos, suma de los cuadrados de los, 700
errores, suma de los cuadrados de los, 700
estimación de los efectos, 700
prueba F, 700
sin réplica, 700
tabla de signos, 701
A
Aleatorización dentro de los bloques, 685
Análisis de confiabilidad, 81
Análisis de la varianza
unidireccional, véase unidireccional, análisis de la
Análisis de la varianza bidireccional
diseño balanceado, 659
diseño completo, 659
diseño factorial completo, 659
efecto columna, 661
efecto renglón, 661
efectos estimados de efectos, 663
efectos principales, 661
error de la suma de cuadrados, 665
F prueba, 667
factor columna, 659
factor renglón, 659
hipótesis nula, 664
identidad del análisis de la varianza, 666
interacción, 661
interacción suma de cuadrados, 665
interpretación de efectos principales, 669-672
media cuadrática, 667
media de la celda, 662
media de la columna, 663
media de renglón, 663
modelo aditivo, 662
suma de cuadrados por columna, 665
suma de cuadrados por renglón, 665
suma total de cuadrados, 665
supuestos para el, 665
tabla del análisis de la varianza, 666
una observación por celda, 676
Análisis de la varianza unidireccional
hipótesis nula, 626
identidad del análisis de la varianza, 636
Modelo de efectos fijos, 624, 639
Modelos de efectos aleatorios, 639-640
prueba F, 630
suma de los cuadrados de los errores, 627
suma total de los cuadrados, 632
supuestos en, 629
tabla del análisis de la varianza, 632
tratamiento de la suma de los cuadrados, 627
Aproximadamente normal, véase Teorema del límite central
B
Bondad del ajuste, 500-502
C
Capacidad del proceso, 755-759
vs. control del proceso, 725
Causas atribuibles, 724
Causas azarosas, 723
Causas comunes, 723
Causas especiales, 724
Coeficiente de correlación, 476-477
cómo funciona el, 478, 481
mide sólo la relación lineal, 482
midiendo la bondad del ajuste, 500-502
y datos atípicos, 482-483
y la proporción de la varianza explicada por la
regresión, 502
Coeficiente de determinación
en regresión lineal simple, 501
en regresión lineal múltiple, 560
y la proporción de la varianza explícita por regresión, 502
Coeficiente de variación, 174
Coeficientes de la regresión, 492
intervalos de confianza para los, 513, 563-564
pruebas de hipótesis para los, 513-515, 563-564
859
860
Índice analítico
Coeficientes mínimos cuadráticos
desviación estándar de los, 510
distribuidos normalmente, 510
en la regresión lineal simple, 493
en la regresión múltiple, 557
insesgados, 510
relación con el coeficiente de correlación, 499
Colinealidad, 577-579
Combinación lineal de mediciones,
incertidumbre en la, 163
límite superior para la incertidumbre en la, 169
Combinación lineal de variables aleatorias, 114, 142
media de la, 114, 142
varianza de la, 116, 142-143
Combinaciones, 65-66
Comparaciones múltiples
análisis de la varianza bidireccional, 674-676
análisis de la varianza unidireccional, 650-655
diseños de bloques completamente aleatorios,
688-689
método de Bonferroni, 459-460, 650
método de Tukey, 675, 689
método de Tukey-Kramer, 652
Confusión entre variables,
y regresión múltiple, 574-577
Conteo
combinaciones, 65-66
permutaciones, 63-65
principio fundamental del, 63
Corrección por continuidad, 275-278
para la distribución de Poisson, 278
precisión de la, 278
Correlación, 140-142, 475-489
e independencia, 142
muestral, 477
no implica causalidad, 483-484
poblacional, 140,487
Correlación de variables, 478
Correlación poblacional, 140, 487
Covarianza, 136-140
e independencia, 141-142
Cp, véase Mallows Cp, véase Índice de capacidad del
proceso
Cpk, véase Índice de capacidad del proceso
Cualidad seis-sigma, 758
Cuartil, 18-19
primer cuartil, 19
segundo cuartil, 19
tercer cuartil, 19
Cuarto de réplica, 704
D
Datos
categóricos, 11
cualitativos, 11
cuantitativos, 11
numéricos, 11
Datos atípicos, 16
datos extremos, 35
distribución lognormal, 247
distribución normal, 240
eliminación de, 16
en los diagramas de caja, 35-36
y el coeficiente de correlación, 482-483
y el uso de la media recortada, 17
y la distribución t de Student, 324
y la regresión lineal simple, 536-538
Datos bivariados, 39
Datos multivariados, 39-40
Desviación estándar
de una variable aleatoria continua, 104
de una variable aleatoria discreta, 96
Desviación estándar muestral, 13, 14
muestral, véase Desviación estándar muestral
poblacional, véase Desviación estándar poblacional
Desviación estándar poblacional, 232
Diagrama cuantil-cuantil, 268
Diagrama CUSUM, 751-753
Diagrama de caja, 35-39
comparativos, 37-39
representando datos atípicos en un, 35-36
Diagrama de control de suma acumulativa, véase
Diagrama CUSUM
Diagrama de dispersión, 39-40
Diagrama de puntos, 26-27
Diagrama de tallo y hojas, 25-26
Diagrama-c, 748-750
límites de control para el, 749
Diagrama-CC, 268
Diagrama-p, 746-748
límites de control para, 747
Diagrama-R
comparación con el diagrama-S, 741-742
límites de control para el, 729
pasos para el uso del, 732
Diagrama-S
comparación con el diagrama-R, 741-742
límites de control para el, 739
Diagrama-X
límites de control para el, 731, 740
pasos para usar el, 732
Índice analítico
Diagramas de control
diagrama-R, véase Diagrama-R
diagrama-c, véase Diagrama-c
diagrama CUSUM, véase Diagrama CUSUM
diagrama-p, véase Diagrama-p
diagrama-S, véase Diagrama-S
diagrama-X, véase Diagrama-X
para atributos de datos, véase Diagrama-p
para conteo de datos, véase Diagrama-c
para datos binarios, véase Diagrama-p
para datos variables, véase Diagrama-X
Diagramas de probabilidad, 265-269
interpretando los, 269
para detectar efectos en experimentos factoriales,
703-704
Diagramas de Venn, 52
Diferencia honestamente significativa, 651
Diferencia significativa mínima, 647
Diferencia significativa mínima de Fisher, 647
Diseño balanceado, 635, 659
Diseño completo, 659, 685
Diseño factorial completo, 659
diseños de bloques completamente aleatorios, 689
método de Tukey en los, 689
Diseños de bloques completamente aleatorios, 683-689
bidireccional ANOVA, 675
Distribución
análisis de la varianza bidireccional, 667
análisis de la varianza unidireccional, 630
en experimento factorial 23, 696
para coeficientes en la regresión múltiple, 563-564
para la diferencia entre medias, 399, 412
para la diferencia entre proporciones, 404
para la media, 375, 393
para la pendiente y el intercepto, 513-515
para la proporción, 388
Prueba de Mann-Whitney, véase Prueba de la suma del
rango de Wilcoxon para el problema de pruebas
múltiples, 458-460
prueba de nivel fijo, 443-447
prueba F, véase prueba F
Pruebas no paramétricas, véase Pruebas libres de
Distribución de una cola, 374
datos apareados, 417
dos colas, 374
error tipo I, 446-447
error tipo II, 446-447
nivel de significancia, 443-444
pasos en el desarrollo, 372
potencia, véase Potencia
861
prueba del rango con signo, véase Prueba del rango
con signo de Wilcoxon
prueba del rango de la suma, véase Prueba de la suma
del rango de Wilcoxon
prueba t, véase Prueba t de Student
P-valor, véase P-valor
rechazando la hipótesis nula, 370, 377-378, 444
región de rechazo, 444
relación con intervalos de confianza, 381-382
simultáneas, véase Comparaciones múltiples
Distribución binomial, 195-204
aproximación de la normal a una, 274
función de masa de probabilidad de una, 198
media, 201
suma de variables aleatorias de Bernoulli, 200
varianza, 201
Distribución binomial negativa, 224-227
función de masa de probabilidad de la, 225
media, 226
suma geométrica de variables aleatorias, 226
varianza, 226
Distribución de Bernoulli, 192-194
función de masa de probabilidad de una, 192-193
media, 194
varianza, 194
Distribución de Erlang, 262
Distribución de Poisson, 206-217
aproximación a la binomial, 206-207, 208, 209
aproximación a la normal de la, 278
función de masa de probabilidad de la, 209
media, 209
varianza, 209
Distribución de probabilidad, 91, 99
Bernoulli, véase Distribución de Bernoulli
binomial, véase Distribución binomial
binomial negativa, véase Distribución binomal negativa
exponencial, véase Distribución exponencial
F, véase Distribución F
gamma, véase Distribución gamma
gaussiana, véase Distribución normal
geométrica, véase Distribución geométrica
hipergeométrica, véase Distribución hipergeométrica
Ji-cuadrado, véase Distribución Ji-cuadrada
lognormal, véase Distribución lognormal
multinomial, véase Distribución multinomial
normal, véase Distribución normal
Poisson, véase Distribución de Poisson
t, véase Distribución t de Student
Weibull, véase Distribución de Weibull
Distribución de rango studentizado, 651
862
Índice analítico
Distribución exponencial, 250-257
función de densidad de probabilidad, 250
función de distribución acumulativa, 251
media, 251
propiedad de la falta de memoria de la, 252-253
varianza,251
y su relación con un proceso de Poisson, 252
Distribución F, 439-440
grados de libertad de la, 439-440
Distribución gamma, 259-262
Distribución gaussiana, véase Distribución normal
función de masa de probabilidad de una, 224
varianza, 224
Distribución geométrica, 223-224
media, 224
Distribución hipergeométrica, 220-223
función de masa de probabilidad de la, 221
media, 222
varianza, 222
Distribución Ji cuadrada, 262, 430, 433
caso especial de la distribución gamma, 262
Distribución lognormal, 244-248
datos atípicos y, 247
función de densidad de probabilidad, 244
media, 245
relación con la normal, 244
uso de la tabla z con la, 245-246
varianza, 245
Distribución multinomial, 227-229
Distribución normal, 231-241
datos atípicos, 240
desviación estándar de la, 231
función de densidad de probabilidad de la, 231
media de la, 231
mediana, 231
población normal estándar, 232
puntaje z, 232
unidades estándar, 231
varianza de la, 231
Distribución t de Student, 321-324
en la prueba de hipótesis, véase Prueba t de Student
grados de libertad para la, 321, 322, 341
intervalos de confianza usando la, 324-325,
341, 343
y datos atípicos, 324-325
Distribución Weibull, 262-264
función de densidad de probabilidad de la, 262
función de distribución acumulativa, 263
media de la, 263
varianza de la, 263
E
Efecto columna, 661
cálculo del, 663
Efecto de la suma de cuadrados
en el experimento factorial 2p, 700
en el experimento factorial 23, 696
Efecto renglón, 661
cálculo del, 663
Efectos principales, 661
interpretación de los, 669-672
El kilogramo, 161
Eliminación hacia atrás, 594
Ensayo de Bernoulli, 192
Ensayo multinomial, 227, 429
Error
aleatorio, 158
sistemático, 158
Error aleatorio, 158
Error cuadrático medio
análisis de la varianza bidireccional del, 667
análisis de la varianza unidireccional del, 629
Error de especificación, 577
Error estándar de la media, 21
Error sistemático, 158
Error tipo I, 446-447
Error tipo II, 446-447
Errores
análisis de la varianza bidireccional, 662
análisis de la varianza unidireccional, 636
en la regresión lineal simple, 492
Espacio muestral, 50
con resultados equiprobables, 57
Esperanza, véase Media poblacional
Esperanza condicional, 133-134
Estadística, 23
Estadística bayesiana, 379
Estadística descriptiva, 2, 20
Estadística inferencial, 2
Estadística Ji cuadrada, 430, 433
Estimación bootstrap, 291-293
e intervalos de confianza, 356-358
estimando el sesgo con, 291-292
no paramétrica, 292-293
paramétrica, 292-293
y prueba de hipótesis, 463-464
Estimación puntual, 300
Evento(s), 51
complemento de, 52
exhaustivos, 76
independientes, 73
Índice analítico
intersección de, 52
mutuamente excluyentes, 53
regla de multiplicación de, 74
unión de, 52
Eventos exhaustivos, 76
Eventos independientes, 73
regla de la multiplicación para, 74
Eventos mutuamente excluyentes, 53
Experimento completamente aleatorio, 625
Experimento con una muestra, 10
Experimento de múltiples muestras, 10
Experimento factorial,
2p diseño, véase Experimento factorial 2p
23 diseño, véase Experimento factorial 23
fraccionado, véase Experimento factorial fraccionado
Experimento factorial fraccionado, 704-707
cuarto de réplica en el, 704
fracción principal en el, 705
media réplica en el, 704
seudónimos en, 706
Experimentos de dos factores, 659-677
Experimentos de un factor, 623-642, 646-655
F
Factor columna, 659
Factor renglón, 659
Falla a detectar, 733
Falsa alarma, 733
Fórmula de propagación del error
multivariados, 179
los resultados sólo aproximan, 173, 179
univariado, 173
Fracción principal, 705
Frecuencias, 22
Frecuencias relativas, 22, 27
Función de densidad de probabilidad, 99-101
condicional, 132
conjunta, 123-124
marginal, 125
Función de densidad de probabilidad condicional, 132
Función de densidad de probabilidad conjunta, 123-124
Función de densidad de probabilidad marginal, 125
celda, 662
columna, 663
condicional, véase Esperanza condicional
de una combinación lineal de variables aleatorias,
114, 142
de una función de variables aleatorias, 129-131
de una variable aleatoria continua, 104
de una variable aleatoria discreta, 95
gran, véase Gran media
muestral, véase Media muestral
poblacional, véase Media poblacional
recortada, 17
renglón, 663
Función de distribución acumulativa
continua, 102
discreta, 93
Función de masa de la probabilidad condicional, 131
Función de masa de probabilidad, 91, 93
condicional, 131
conjunta, 123
marginal, 123
Función de masa de probabilidad conjunta, 123
Función de masa de probabilidad de la marginal, 123
Función gamma, 159
Función riesgo, 264
G
Gosset, William Sealy (estudiante), 210, 321
Gráfica de los residuales, 527
en la regresión múltiple, 564-565
interpretación del, 528, 533, 539
tendencia en el, 539
Gran media
muestra, 626, 662
población, 637, 660
H
Heterocedasticidad, 528
Hipótesis alternativa, 369
Hipótesis nula, 369
análisis de la varianza bidireccional, 664
análisis de la varianza unidireccional, 626
elección de la, 379-380
haciendo un ensayo, 369
rechazando la, 370, 377-378, 444
Histograma, 27-35
bimodal, 32-33
intervalos de clase, 27
sesgado, 31-32
simétrico, 31-32
unimodal, 32-33
Histograma de probabilidad, 97
Homocedasticidad, 528
I
i.i.d., véase Independientes e idénticamente
distribuidos
863
864
Índice analítico
Identidad del análisis de varianza
para el análisis de la varianza bidireccional, 666
para el análisis de la varianza unidireccional, 636
para la regresión lineal simple, 503
para la regresión múltiple, 558
Incertidumbre
de una función de una medición, 173-177
de una función de varias mediciones, 179-185
en la media muestral, 165
límite superior para una combinación lineal de
mediciones dependientes, 169
límite superior para una función no lineal de
mediciones dependientes, 182
relativa, véase Incertidumbre relativa
y desviación estándar, 159
Incertidumbre aleatoria, véase Incertidumbre
Incertidumbre relativa
de una función de una medición, 174-176
de una función de varias mediciones, 182-184
dos métodos para el cálculo de la, 175, 183
Independientes e idénticamente distribuidos, 117
Índice de capacidad del proceso
Cp, 757
Cpk, 756
Cpl, 759
Cpu, 759
Interacción
análisis de la varianza bidireccional, 661
cálculo de, 663
e interpretación de efectos principales, 669-672
en la regresión múltiple, 557
media cuadrática, 667
suma de cuadrados, 665
Interacción media cuadrática, 667
Interacción suma de cuadrados, 665
Intercepto
intervalo de confianza para el, 513
prueba de hipótesis para el, 513
Intervalo de predicción, 519
Intervalos de confianza
basado en muestras aleatorias, 311
con la distribución t de Student, 325, 341, 343
de un lado, 310-311, 317, 328
determinación del tamaño muestral, 308-309, 318
estimación bootstrap e, 356-358
grado de confianza, véase Grado de confianza
para datos apareados, 348
para diferencia de proporciones, 336
para la diferencia de medias, 333, 341, 343
para la media, 304, 325, 329
para la pendiente y el intercepto, 513
para la proporción, 316, 319
para la respuesta media, 516
para los coeficientes en regresión múltiple, 563, 564
simultáneo, véase Comparaciones múltiples en
muestras pequeñas, 325, 329, 341, 343
y su relación con pruebas de hipótesis, 381-382
Intervalos de confianza simultáneos, véase
Comparaciones múltiples
L
Ley de la probabilidad total, 77
Ley física, 541
Límite de confianza, 310-311, 317, 328
Límite de especificación, 755
Límites de control
para el diagrama-c, 749
para el diagrama-p, 747
para el diagrama-R,729
para el diagrama-S, 739
para el diagrama-X, 731, 740
Linealizando el problema, 176, 184
M
Mallows Cp, 593
Mann-Whitney prueba de, véase Prueba de la suma del
rango de Wilcoxon
Media cuadrática
para el error, véase Error medio cuadrático
para la interacción, véase Interacción media cuadrática
para tratamiento, véase Tratamiento de la media
cuadrática
Media de la celda, 662
Media de la columna, 663
Media del renglón, 663
Media muestral, 13
desviación estándar de la, 118, 144
incertidumbre en la, 165
media de la, 118, 144
teorema del límite central, 270
varianza de la, 118, 144
y centro de masa de histograma, 30-31
Media poblacional
de una variable aleatoria continua, 104
de una variable aleatoria discreta, 95
intervalo de confianza para la, véase Intervalo de
confianza
prueba de hipótesis para la, véase Prueba de hipótesis
Mediana
muestral, 16-17
poblacional, 105-107
Índice analítico
Mediana muestral, 16-17
Medidas dependientes
límite superior para la incertidumbre de una
combinación lineal de, 169
límite superior para la incertidumbre en una función
no lineal de, 182
Mejores subconjuntos en regresión, 591-594
Método de Bonferroni, 459-460, 650
Método de Tukey
unidireccional ANOVA, véase Método de TukeyKramer
Método de Tukey-Kramer, 652
Mitad de réplica, 704
Moda, 18
de una histograma, 32
Modelo aditivo, 662
Modelo de efectos aleatorios, 624, 639-640, 676
Modelo de regresión cuadrática, 557
Modelo de regresión polinomial, 556
Modelo empírico, 541
Modelo lineal, 492
Modelo mixto, 677
Modelos de efectos fijos, 624, 639, 676
Muestra, 3
agrupada, 10
aleatoria estratificada, 10
aleatoria simple, 3
de conveniencia, 4
ponderada, 10
Muestra aleatoria, véase Muestra aleatoria simple
Muestra aleatoria simple, 3
Muestreo con reemplazo, 9
N
Navaja de Occam, 584
Nivel de confianza
interpretación del, 306, 307
y probabilidad, 306
Nivel de significancia, 443-444
Nivel de significancia observado, 372
Nivel de una prueba de hipótesis, véase Nivel de
significancia
Niveles de un factor, 624
No correlacionados, 142, 478
No sesgado, 158
P
Parámetro, 23
Parsimonia, 584
Pendiente
intervalo de confianza para la, 513
prueba de hipótesis para la, 514-515
Percentil
de una muestra, 19
de una población, 105-107
Permutación, 63-65
Población, 3
conceptual, 6
tangible, 6
Población normal estándar, 232
Potencia, 449-455
análisis de la varianza unidireccional, 637-639
depende de la hipótesis alternativa, 449, 451, 452
determinada por el tamaño de la muestra, 452
pasos en el cálculo de la, 449
Precisión, 158
Principio de la parsimonia, 584
excepciones al, 584
Principio fundamental de conteo, 63
Probabilidad
axiomas de la, 55
condicional, 71
diagramas de árbol, 79
frecuentista, 379
incondicional, 69
regla de la multiplicación, 74
regla de la suma, 58-59
subjetiva, 379
Probabilidad condicional, 71
diagramas de árbol para la, 79
Probabilidad de éxito, véase Proporción poblacional
Probabilidad frecuentista, 379
Probabilidad incondicional, 69
Probabilidad subjetiva, 379
Proceso de Poisson
estimación de la razón, 213
incertidumbre en la razón estimada, 214
la razón estimada es insesgada, 214
relación con la distribución exponencial, 252
Promedio, 13
Promedio del tiempo de la corrida, 734
Propiedad de la falta de memoria, 252-253
Proporción
cálculo de, véase Proporción poblacional
intervalo de confianza para la, véase Intervalo de
confianza
muestral, véase Proporción muestral
poblacional, véase Proporción poblacional
prueba de hipótesis para, véase Prueba de hipótesis
865
866
Índice analítico
Proporción muestral, 22, 201
como estimación de la proporción poblacional, 201
incertidumbre en la, 202
no sesgada, 202
Proporción poblacional
cálculo de, 201
intervalo de confianza para la, véase Intervalo de
confianza
prueba de hipótesis para la, véase Prueba de hipótesis
Prueba aleatorizada, 464-466
Prueba de hipótesis
eligiendo la hipótesis nula, 379-380
estimación bootstrap y, 463-464
método de Bonferroni, 459-460, 650
prueba Ji cuadrada, véase Ji cuadrada, prueba
pruebas libres de distribución, véase Pruebas libres de
punto crítico, 444
Prueba de la suma del rango, 425-427
Prueba de la suma del rango de Wilcoxon, 425-427
Prueba de nivel fijo, 443-447
Prueba de permutación, 465
Prueba de significancia, véase Prueba de hipótesis
Prueba del rango con signo, 420-425
Prueba del rango con signo de Wilcoxon, 420-425
Prueba estadística, 372
Prueba F
análisis de la varianza bidireccional, 667
análisis de la varianza unidireccional, 630
en el experimento factorial 2p, 700
en el experimento factorial 23, 696-697
en la regresión múltiple, 587
para la igualdad de varianzas, 439-442
Prueba Ji cuadrada, 429-436
grados de libertad para, 430, 433
para la homogeneidad, 431, 435
para la independencia, 435, 436
para probabilidades específicas, 429-431
Prueba t de Student
dos muestras, 410, 412
una muestra, 393
Prueba z, 371, 386, 393
Pruebas de hipótesis, véase Prueba de hipótesis
Pruebas de hipótesis simultáneas, véase Comparaciones
múltiples
Pruebas de rango, véase Pruebas libres de distribución
Pruebas libres de distribución, 420-427
prueba del rango con signo, 420-425
prueba del rango de la suma, 425-427
Pruebas no paramétricas, véase Pruebas libres de
distribución
Punto crítico, 444
Punto influyente, 537
p-valor, 369, 372
interpretando el, 370-371, 372
no es la probabilidad de que H0 sea verdadera, 379
R
R2 ajustado, 593
R2, véase Coeficiente de determinación
Rango, 18
Rango de Wilcoxon
Rango intercuartil, 35
Recta de mínimos cuadrados, 492-504
bondad del ajuste de la, 500-502
cálculo de la, 494-496
no extrapolar, 498
no se use cuando los datos no son lineales, 498-499
Región de rechazo, 444
Regla de la multiplicación para probabilidades, 74
Regla de la suma de probabilidades, 58-59
Reglas eléctricas de occidente, 737
Regresión lineal simple
gráfica de los residuales contra tiempo, 540
supuestos en la, 508, 527
tabla del análisis de la varianza, 522
transformación de variables en la, 531-536
y datos atípicos, 536-538
Regresión múltiple
coeficientes de mínimos cuadrados, 557
modelo de regresión múltiple, 556
prueba F, 587
puede detectar error de especificación, 574-577
selección del modelo, véase Selección del modelo
sumas de cuadrados, 558
supuestos en la, 558
tabla del análisis de la varianza, 562
y colinealidad, 577-579
Residual
análisis de la varianza unidireccional, 628
en la regresión lineal simple, 493-494
Respuesta media, 515-516
intervalo de confianza para la, 516
Resumen estadístico, 13-23
S
Selección del modelo, 583-599
es arte no una ciencia, 599
excepción en el principio de la parsimonia, 584
Índice analítico
navaja de Occam, 584
principio de la parsimonia, 584
Selección hacia delante, 594
Sesgo, 158, 159
de funciones no lineales, 173, 179
Seudonónimos, 706
Significancia estadística, 378-379, 444
no es lo mismo significancia práctica, 380-381
Simulación
comparación con la propagación de errores, 286
estimación bootstrap, véase Estimación bootstrap
usada en el análisis de confiabilidad, 288-290
usada en el cálculo de medias y varianzas, 285-286
usada en el cálculo de probabilidades, 282-285
usada en el cálculo de sesgo, 290-292
usada en el desarrollo de pruebas de hipótesis,
462-466
usada en la construcción de intervalos de confianza,
351-358
usada en la estimación de la potencia, 466-467
usada en la prueba de normalidad, 286-288
Subgrupos racionales, 724
Suma acumulativa, 751
Suma de cuadrados
para error, véase Error de la suma de cuadrados
para interacción, véase Interacción de la suma de
cuadrados
para tratamiento, véase Tratamiento suma de cuadrados
por columnas, véase Suma de cuadrados por columna
por renglones, véase Suma de cuadrados por renglón
total, véase Suma total de cuadrados
Suma de cuadrados de la regresión
en la regresión lineal simple, 501, 522
en la regresión múltiple, 558, 562
Suma de cuadrados por renglón, 665
Suma de los cuadrados de los errores
análisis de la varianza bidireccional, 665
análisis de la varianza unidireccional, 627
en el experimento factorial 2p, 700
en el experimento factorial 23, 696
en la regresión lineal simple, 501, 522
en regresión múltiple, 558, 562
Suma de los cuadrados por columna, 665
Suma de variables aleatorias
media de la, 114, 142
teorema del límite central para, 270
varianza de la, 116, 143
Suma total de cuadrados
análisis de la varianza bidireccional, 665
análisis de la varianza unidireccional, 632
867
en múltiple regresión, 558, 562
en regresión lineal simple, 501, 522
T
t distribución, véase Distribución t Student.
t prueba, véase Prueba t Student.
Tabla de contingencia, 431
Tabla de frecuencias, 27
Tabla de signos, 694, 701
Tabla del análisis de la varianza
para el análisis de la varianza bidireccional, 666
para el análisis de la varianza unidireccional, 632
para el experimento factorial, 23, 697
para la regresión lineal simple, 522
para la regresión múltiple, 562
Teorema de Bayes, 79
Teorema del límite central, 270-279
para la distribución binomial, 274
para la distribución de Poisson, 278
para la media de una muestra, 270
para la suma, 270
tamaño muestral necesario para la validación, 271, 272
Tiempo de espera, 250
Transformación de variables, 531-536
Transformación potencia, 531
Tratamiento de la media cuadrática, 629
Tratamiento de suma de cuadrados, 627
Tratamiento del efecto, 637
Tratamientos, 624, 659
U
Unidades estándares, 231
V
Valor ajustado, 493
Valor esperado, véase Media poblacional
Variable aleatoria
combinación lineal de, véase Combinación lineal de
variables aleatorias
conjuntamente continua, 123-128
conjuntamente discreta, 121-123
continua, véase Variable aleatoria continua
discreta, véase Variable aleatoria discreta
independiente, 115, 135
suma de, véase Suma de variables aleatorias
Variable aleatoria continua, 89, 99-107
desviación estándar de una, 104
868
Índice analítico
función de distribución acumulativa, 102
función de la densidad de probabilidad de una,
99-101
media de una, 104
varianza de una, 104
Variable aleatoria discreta, 89, 91-98
desviación estándar de una, 96
función de distribución acumulativa de una, 93
función de masa de probabilidad de una, 91, 93
media de una, 95
varianza de una, 96
Variable de respuesta, 624
Variable dependiente, 492
Variable independiente, 492
Variables aleatorias conjuntamente continuas, 123-128
Variables aleatorias conjuntamente discretas, 121-123
Variables aleatorias independientes, 115, 135
Variación del muestreo, 5
Varianza
bidireccional, véase bidireccional, análisis de la
varianza
combinada, véase Varianza combinada
de una combinación lineal de variables aleatorias,
116, 142-143
de una variable aleatoria continua, 104
de una variable aleatoria discreta, 96
muestral, véase Varianza muestral
poblacional, véase Varianza poblacional
Varianza de una combinación
análisis de la varianza unidireccional, 631
y la distribución t de Student, 343, 411, 412
Varianza muestral, 14
y el momento de inercia del histograma, 31
Varianza poblacional
de una variable aleatoria continua, 104
de una variable aleatoria discreta, 96