Estadistica Hildebrand
Estadistica Hildebrand
Estadistica Hildebrand
UN PRIMER VISTAZO
3 A LA PROBABILIDAD
moneda sólo tiene dos resultados posibles: car.i o cruz; por lo tanto, la probabilidad
de que aparezca una cara debería ser una de cada dos. En una baraja estándar de 52
4
cartas, 4 son reyes, de modo que la probabilidad de extraer un re:y debt!ria !>er 4
entre 52.
Estos cálculos de la probabilidad ~e llasan en la interpretación clásica de Ja
inl('rprct:.1ción probabilidad. En esta interpretación, se llama rcsultu .lo a ca<la dc~nlace posible de
cl:i\ iCll un experimento; un eHnto • se identifka con algunos de c!>tO!. resultado:.. En el
ejemplo de la extracción de cartas, hay 52 resultados posibles. 4 de los cuales están
identificados con el evento "extraer un rey". De acuerdo con la interpretación clási-
ca. la probabilidad de un evento E es el cociente del número NF. de resultados favo-
rables al evento entre el número total .V de resultados posibles. En símbolos,
N
P(evento E) "' N
La utilidad de esta mtcrpn:tac1ón depende por completo de la hipótesis de que
todos los resultados son igual ni ente po~ ihl(''I Si la hipótesis es falsa (por ejemplo,
si la moneda no está equi librada o la ba1..1jJ e<,tj marcada) la interpretación clásica
no se aplica.
EJEMPLO 3.1 Una tachuela ordinaria se lanza sobre una superficie dura. Puede caer con la punta
hacia arriba o de lado. ¿Son estos dos resultados igualmente posibles?
Soluci6 n No hay ninguna razón para suponer que los dos resultados son igualmente posibles .
•
L3 interpretación clásica es de alguna utilidad incluso fuera de los juegos de
uc\ trlt'i a leatoria' a1ar. Una mu c~ tra aleatoria . por definición, se toma de tal manera que una mues-
tra posible (de un tam:u'lo especifico) tiene la misma probabilidad de ser selecciona-
d:i que cualquier otra. Por consiguiente. los result:idos (muestr:is posibles) son
igualmente posibles, y las probabilidades se pueden encontrar contando los resulta-
dos ra, ora bles. En este 1ibro haremos uso extenso de esta idea.
Hay situaciones que no admiten de inmediato la interpretación clásica. No obs-
tante, en ocasiones se puede asociar una probabilidad a los eventos según su fre-
ccucncia rclati\ a cuencia rrlati\ a en el límite Si un experimento se ha repetido un gran número de
en el hmil c 'ece~ > "' el 24% de las veces el resultado ha sido un evento particular E. entonces
la probabilidad del evento E debería ser 0.24, al meno~ como una buena apro,ima-
c1on. Simbólicamente. 11i un C\pcrimcnto se repite 11 \ ecc'i ~ el C\ cnto F: ~ u cede
i:n " ~ de e lla,, la probabilith1d del c\cnto E es apro\imadamente n~ tli\ idido
cnt re 11 :
P(evento E)
EJEMPLO 3.2 Suponga que en el experimento del ejemplo 3 1, que consiste en lanzar una tachue-
la. se afinna que la probabilidad de que ésta caiga con Ja punta hacia arriba es 0.70.
Dé una interpretación en términos de la frecuencia rela11va en el límite que justifi-
caría esta afirmación
• Tnduc1mos ti término n-rnt como rv~io. aunque en algunos paistt de habla h1spa11a s.e traduce como
tUt C'fU (,V «I E.)
).1 75
EJEMPLO 3.3 Dé una interpretación subjetiva del enunciado "la rrobabilidad de que un::i tachue-
la caiga con la punta h::icia arriba es 0.5''.
Solución
'
Si usted es quien enuncia tal proposición, estará diciendo que tomaría cualquier
partido en una apuesta de un dólar a favor de que la tachuela caerá con la punta
hacia arriba, contrn un dólar a que no lo hará. Como sugerimos en el ejemplo 3.1,
nosotros no estaríamos de acuerdo con usted. Creemos que lo más probable es que
la tachuela caiga con la punta hacia arriba y preferiríamos ese lado de la apuesta "a
cantidades iguales". •
TABLA3 . I Opiniones de los miembros del jurado calificador acerca del sabor: por estado civil
Op111 1011
Total 20 44 K4 52 21Xl
EJE MPLO 3.4 Un distrihuidor minorista acepta pedidos de tres maneras distintas· por teléfono, :i
lra\ e"de una lomla que \a adjunta a su catálogo o rcpitiem.lo las órdenes de compra
de sus clientes. l a'> ordene~ de compra están clasificadas como pequeñas (menos de
$25.00). medianas (de $25 .00 a S99 <)9). grandes (de SI00.00 a S2tJ9.99) y mayo-
res ($300.00 o más). En la tabla 3.2 mostramos un análisis de las últimas 4000 ór-
denes <le compra que recibió el distrihuidC1r.
3 UN PRIMER VISTAZO A LA PROBABIUOAO
a. Los pedidos procedentes de las órdenes repetidas y del catálogo pasan por
un proceso de entrada. ¿Cuál es la probabilidad de que un dato selecciona-
do a l azar pertenezca a esta categoría?
b. Las órdenes mayores y las órdenes telefónicas se retienen mientras se veri-
fica el crédito. ¿Cuál es la probabilidad de que una orden seleccionada al
azar haya sido retenida?
probahilidad de que un jurado seleccionado al azar tenga una opinión mala. regu-
lar o hucna, podríamos observar que el evento complementario es "excelente". Así
/>(opinión mala u opinión regular u opinión buena) 1 - />(excelente)
1- ic?o = .74
Ohviamente, podríamos haber utilizado la ley aditiva y sumar las probabilidades de
"opi11ión mala", "opinión regular" y "opinión buena". Frecuentemente. hay muchas
manera~ de resolver un problema.
EJEMPLO 3.5 Como una medida de control de la calidad. el distribuidor del c1emplo 3.4 coteja
los embarques con las órdenes de compra correspondientes a lo'> pedidos grandes y
mayores. asi como con las órdenes de compra de catálogo y repetidas Use la ley de
los complementos para encontrar Ja probabilidad de que se coteje un pedido selec·
cionado al a7ar.
Solución Las únicas órdenes que no se cotejan son las órdenes tclefónicac; pequeñas o medianas.
I'( cotejada) - P(orden telefónica pequeña o mediana)
- IP<pequeña y telefónica) + P(mediana y telefónica)]
= _ ( 1497 + 230 ) = 56 g, 5
4000 4000 ·- --
Sin la ley de los complementos, habríamos tenido que sumar 1O probabilidades di-
ferentes correspondientes a Jos JO tipos de órdenes que se cotejan. •
-
P (BIA) - P(A y B)
P(A)
EJEMPLO 3.6 En el ejemplo 3.4 del distribuidor minorista, ¿cuál es la probabilidad de que una
orden enviada por escrito (no telefónica) ~ea una orden repetida'!
Soluc16n En primer lugar, escamos buscando una probabilidad condicionada, pues s~ponemos
que la orden es escrita. Hay 1360 + 814 - 2174 órdenes escritas, de las cuales 814
son repetidas. De este modo, ?(repetida escrita) 81412174 = 0.374. Como alter-
nativa, podemos utilizar la definición de probabilidad condicionada. Obsen e que
todas las órdenes repetidas son órdenes escritas. de modo que P(escrita y
repetida)= P(rcpetida) = 814/4000.
. P(escrita y repetida) 814 4000
P(rcpetida escrita) -
P(escrita)
= ----
2174 4000
814 "'7 .
=- - = ·-'
2174
4 una vez mas.
•
La ley multiplic:atiu de la probabilidad es '>implemente la reescritura de la
delin1c1ón de la prohab1lidad condicionada hta le) ~e utiliza pam evaluar probabilida-
des "y", del mismo modo que la le) ad1tJ\a c;e utih1..a para C\aluar probabilidade'> "o".
EJEMPLO 3. 7 Como se muestra en la labia 3.3, l::i tabla 3.2 del ejemplo 3.4 se puede expresar en pro-
babilidades condicionadas y no condicionadas mediante la conversión apropiada.
TABLA 3.3
Sección 3.1 E1en:1t1os
3.1 En cada una de las situaciones siguiente-;, indique la mterrirctac1ón del enunciado de la
probabilidad que parece mis adecuada (E·n mucha.~ 'iituac1oncc; c'ito e<; di<ieutiblc.I
a. l~~tá r>or pubhcarc;c un nuevo libro de estadística para gerentes El editor afirma
que la probahilidad de que c;e -.cnda el número de copias necesario para no ganar
ni perder es de 0.8.
b. Uro J'(:quei\a empresa fabnca ciena cla~ de disco~ para equipoc; clcctnco<.. Un com-
ponente critico del disco es cierto engrana1c. De acuerdo con los limites de toleran-
cia, la probabilidad de que un engrana1e en p.lrticul:ir rec;ultc dcfectuo'o es de 0.002.
c. Se va a tomar una muestra de 100 empleados de una compa"ta en la que trabajan un
t<>W de 13,000 perwna\ Se sabe que el 55° o de los tr.lNJJdores son hombres. Como
2 3 UN PRIMER VISTAZO A LA PROBABILIDAD
Probl~ma
Nú,,.ero de probklfllU
1 2 3 Total
Marca C 382 54 17 453
G 135 16 5 156
a. ¿Cuál es la probabilidad de que una reparación seleccionada :il azar incluya más
de un problema?
b. ¿Cuál es la probabilidad de que una reparación seleccionada al V.ólr de la marca
e incluya más de un problema?
3.6 Utilice los datos del ejercicio 3.S para construir una tabla de probahilidóldes condi-
cionadas del número de problemas, dada la marca. ¿Oiría usted que las probólbilida-
des condicionadas son similares?
3.7 En los ejercicios 3.3 y 3.5, el número de entradas de la marca Ces mucho ma)or
que el número de entradas de la marca G. ¿f.s é'lt<l una indicación de que la marca
C tiene una calidad inferior a la de la marca G?
3. ~ En un día normal, una tienda registró 186 venia$ de gasolina, 207 de productos lác-
teos, 188 de refrescos. 339 de alimentos envasados y 316 de productos no alimenti-
cios: un total de 1236 ventas.
a. ¿Cuál es Ja probabilidad de que una venta seleccionada al ª"ªr sc:a de gasolina'?
b. ¿Cuál es Ja probabilidad de que una venta seleccionada al azar sea de un ¡m>duc-
to :ilimenticio (incluyendo lácteos y refrescos, que por cortesía consideraremos
alimentos)?
3.9 En el ejercicio 3.8, ¿cuál es la probabilidad de que una venta de alimentos seleccio-
nada al al.ar sea de productos lácteos?
3.1 O Una compañía que realiza investigaciones de mercado reúne grupos de con~um1do·
res para probar la cfecthidad de nue\M anunc1M para la tele\1<;1ón Al consumidor
se le dice que cc;tá c'raluando un rrograma piloto rara la TV. Después de ver un pro-
grama de una hora de duración. mclu) cndo los anuncios. se le hacen muchas pre-
guntas acerca del programa y algunas ocras acerca del anuncio (el verdadero objeto
de investigación). Una tabla con Jos resultados de un grupo nos rresenta el núme-
ro de individuos que recordaron incorrectamente el producto, el número que recor-
dó el producto cornctamente y tenía un opinión favorable, asi como el número que
recordó correctamente el producto y tenla una opinión desfavorable.
3.2
CONCEPTOS BÁSICOS Y AXIOMAS DE
LA TEORÍA DE LA PROBABILIDAD
Espacio muestra! S
Un es pacio muestra! S e:. el conjunto de todos Jos resultados posibles de un expe-
rimento. Un r c'lultado es un elemento de S. Un evento es cualquier colección de
re:.ultados o, en lenguaje matemático, un subconjunto de S.
•
A los resultados en ocasiones se les llama eventos simples o eventos no divisib/eJ.
y a los eventos en ocasiones se les llama eventos compuestos.
EJEMPLO 3 .8 Una moneda va a ser lanZ.lda 3 veces. Defina el espacio muestra! haciendo una lis-
ta de todos los resultados en la forma (resultado del lanzamiento No. 1. r!!sultado
del lanzamiento No. 2, resultado del lanZ.lmiento No. 3).
Solución Dado que en cualquier !:mi.amiento de una moneda podemos obtener una cara (H)
o una cruz (T), el espacio mui;:stral S consiste en 8 resultados posibles
EJEMPLO 3.9 Identifique en el experimento del ejemplo 3.8 los siguientes eventos: A, se obtiene
exactamente una cara; B. se obtiene un número impar de caras y C, no se obtiene
ninguna cara.
Axiomas de la probabilidad
J. Para todo evento A, O ~ P(A) ~ 1.
2. P(S) = l
3. Si los eventos A y B no tienen resultados en común,
P(sucede A o sucede B) =P(A) + P(B)
•
Los primeros dos axiomas simplemente indican que las probabilidades se escogen
convencionalmente entre O y 1, y que Ja probabilidad 1 se asigna al e\ ento que for-
ma el espacio muestra), el cual, por definición, es seguro que ocurra. el tercer axio-
ma es la generalización de la idea de sumar las probabilidades de los resultados: en
la medida en que los eventos A y B no tengan resultados en común, la probabilidad
de que uno o el otro sucedan es la suma <le las probabilidades de los eventos por se-
parado. En la sección .3 ..3 nos basaremos en estas ideas al introducir otros métodos
para el cálculo de las probabilidades.
3.13 Una corporación consta de tres divisiones. cada una de las cuales está encabezada
por un 'iceprcsidcnlc ejccuti.,,o. En cada división hay dos grupos, cac:ja uno de ellos
dirigido por un vicepresidente del grupo. La decisión final acerca de las bonificacio-
nes anuales c;e toma en un comílé integrado por un viceprcsulcnte ejecutivo> do~' i-
cepresidentes de grupo. Cada allo los miemhros del comité se determinan mediante
un sorteo. Defina un espacio muestra! haciendo una lista de todos los comités posi-
hles. Designe a los vicepresidentes ejecutivos con las letras A, B y C, y a los vice-
presidentes de grupo con los dígitos 1, 2, 3, 4, S y 6.
3.14 En el ejercicio 3.13, ¿cuál es la probabilidad de que los tres miembros del comité
pcrtene.lcan a una sola división? ¿Y a tres divisiones distintas?
3. 1S Se lleva a cabo una revisión de las cuentas por cobrar en una tienda de departamen-
tos (un gran almacén). Se seleccionan al a7.41r un centenar de cuentas) se examinan.
Cada una de ellas se codifica como O (correcta) o 1 (errónea). Describa un resulta-
do tipico del espacio muestra!. ¿Debería considcrar.;e que todos los resultados son
igualmente posibles?
3.16 Un espacio muestral consiste en seis resultados con las siguient~s probabilidades:
Resultado 1 2 3 4 s 6
Probabilidad .25 .20 .20 .15 .15 .05
Jl L~ de b probablhdad 87
El evento A esta formado por Jos resuhados 1, 2, 3 y 4, y el evento B por los resul·
tados 3, 4 y S. Encuentre />t.A), P(B), ,">(A y 8) y P<.A o B o ambos).
3.17 En el ejercicio 3.16, ¿debería ~r P(A o 8) Pf.A) + P(B)? ¡,Por qué?
3. 18 Un fabricante de computadoras 'ende los modelos del 1 al 9. Los modelos 1-6 tie-
nen una memoria estándar y los modelos 7 9 tienen memoria expandida. Los mode-
los 1-3 tienen sólo una unidad de disquetes de 5V." y los modelos 4 9 tienen
unidades de disquetes de 5 Y.- y 3 W'. l.os modelos I, 4 y 7 tienen un disco duro de
20 mB; los modelos 2. S y 8 tienen un disco duro de 40 mB; por último, los mode·
los 3, 6 y 9 tienen un disco duro de 80 mB. Los rorcentajes de venta del ailo pasa-
do fueron los siguientes:
Modelo l 2 ) 4 s 6 7 R 9
Porcentaje de \Cntas 27 23 10 13 7 4 5 R J
(a) (b)
FIGURA 3.1 Diagramas de Venn que ilustran P(A), P( A). P(A u 8) y P(A n B)
Estas definiciones formalizan las ideas mfu. simples de la lógica. El evento A su-
cede siempre que no sucede A, A u B ocurre ~iempre que A ocurre o B ocurre. y
A n B acontece siempre que A y B acontecen. Con frecuencia decimos simple-
mente "no", "o" o "y" en lugar de complemento, unión o intersección.
Los diagramas de Venn, como los de la figura 3.1, nos proporcionan una ima-
gen de estos conceptos mu) fácil de manejar. Piense que la probabilidad de un
evento corresponde a su área; el rectángulo completo, que representa a S, tiene área
igual a 1. En Ja figura 3.1 (a), el evento A aparece sombreado; su complemento es
todo el conjunto en blanco. En la figura J . l(b), A V Bes toda d área sombreada,
mientras que A n B es el área sombreada con un tono más oscuro.
Ya hemos utilizado la idea de la unión en el tercer axioma de 13 probabilidad,
que dice que si los eventos A y B no tienen resultados en común, la probabilidad
de que suceda A o B [es decir, P(A v B}J es P(A) + P(B). L::i condición de que A
y B no tengan resultados en común es suficientemente importante como para mere-
cer un nombre.
EJEr:1PLO 3.11 Los eventos A, B y C tienen probabilidades 0.2, 0.5 y 0.4, respectivamente. Los
eventos A y B son mutuamente excluyentes. pero A ) C no Jo son. al igual que B y
C. ¿Cuál de la.s probabilidades P(A v B). P(A v C), /'(B u C)) P(A u B u C)
se puede calcular con la infonnación que hemos proporcionado?
• Para los puristas matem~tícos: el tercer axíoma se puede: extender, por índuccion, para cubrir ~ualquicr
número finito de eventos, pero se debe modificar para cubrir un numero infinito de ellos.
90 l UN PRJMER VISTAZO A LA PROBA81UDAD
EJEMPLO 3 .12 Suponga que, en el ejemplo 3.11, P(A n C) = 0.05 y P(B n C) = 0.18. Encuen-
tre P(A v C) y P(B v C).
Solución Cuando sumamos P(A) y P(C), contamos dos veces el área P(A n C) de la in-
tersección. Para corregir esto, podemos re!.tar (una vez) el área de la intersec-
ción. Así, P(A v C)'"" 0.2 + 0.4 0.05 = 0.55 . Análogamente, P(B u C) •
0.5 + 0.4 -- 0.18 = 0.72. •
Solución Con base en la informacil'ln que se da en el ejemplo 3. 12, podemos deducir las pro-
bab1l1dades que se muestran en la figura 3.4 . Para P(A u B u C) sumamos todas
lal> probabilidades corre~pondientes a la ocurrencia de uno o más de estos eventos:
3l Leya ele la probab1hdad
.32
e
.18
Para P(sucede exactami.:nte uno de los c\entos A. B o C), no sumamos las proba-
bilidades de la intersección 0.05 y 0.18, pues ¿sta representa la ocurrencia de dos
eventos. Así, P(sucede exactamente uno de los e\ entos A, B o C) = 0.15 + 0.17 +
0.32 = 0.64.
Del principio aditivo se deduce directamente una ley de la probabilidad
muy útil. Por def!!!ición, un evento A y su complemento A son mutuamente ex-
cluyentes. y A u A incluye a la totalidad del espacio muestra! y tiene probabi-
lidad 1. Por consiguiente,
P(AvA) = P(A) + P(A) = 1
Solución El e\cnto "O defectos" es el complemento del evento "lo más defectos": P(O de-
fectos)= 1 - P(I o más defectos). A su vez, por el principio de adición de eventos
mutuamente excluyentes,
Hay otro concepto que es crucial en el desarrollo de las leyes básicas de la pro-
babilid¡d: la probabilidad condicionada de un e\Cnto B dado que ha sucedido otro
evento A. Por ejemplo, puede ser que el 10% de los compradores de un automóvil
de lujo pidan altavoces de alta eficiencia para el sistema de audio, de modo que
?(altavoces especiales) - 0. 1. Pero si se sabe que el cliente ha pedido el mejor re-
ceptor en estéreo para el automóvil, la probabilidad de que pida los altavoces de alta
eficiencia es presumiblemente más alu. Es así que una condición, en este caso que
el cliente pida un receptor especial, puede cambiar la probahilidad de un evento
(que el cliente pida los aluvoces de alta eficiencia). Para dar otro ejemplo, suponga
que unos auditores seleccionarán al azar una muestra de una lista de 216 cuentas por
cobrar. y que de éstas, 24 tienen algün error. Si no se tiene información acerca de la
situación de la primera de ellas, la probabilidad de que la segunda cuenta seleccio-
nada tenga un error es de 24/216. Pero si se sabe que la primera cuenta selecciona-
da contiene un error, entonces hay sólo 23 cuentas por cobrar erróneas entre las 215
restantes, y la probabilidad de que l::i segunda también lo tenga cambia a 231215. En
los siguientes capítulos, con mucha frecuencia utiliiaremos l::i definición de proba-
bilidad condicionada en términos de probabilidades no condicionadas.
P{A 1 B) - P(A n B)
P(B)
""ª
n
P{B A) = -
""n
l.l Leyei de la probab1hdad 93
P(Af"\8)
P(B 1 A)= P(A)
EJEMPLO 3. 15 Remítase al ejemplo 3.8. Si el evento A es "se obtienen una o más caras en tres bn-
z;imientos de una moneda" y el evento 8 es "se obtiene exactamente una cara", cal-
cule P(B 1 A) con Ja definición de probabilidad condicionada.
P(Ar. B)
P(B I AI
P(A)
3¡ 8 J
=-=-
7/8 7
EJEMPLO 3. 16 En el ejemplo de las cuentas por cobrar que se dio en la página anterior, suponga
que 16 cJ.e las 80 cuentas grandes (más de 10,000 dólares) tienen algún error y que
se elige una única cuenta al azar. ¿Cuál es la probabilidad de que la cuenta selec-
cionada tenga un error, si se trata de una cuenta grande?
ley multiplicativa
Si A y B 50n dos eventos cualesquiera,
P(AyB) = P(AnB>= P(A)P{ B IA>
Notn: Si intercambiamos Jos papeles de A y B, P(AnB) P(B)P(J\ 8).
•
La única diferencia cntr-.: la ley multiplicativa y la definición de probabilidad con-
dicion:ula r:idica en cuáles probabilidades se suponen ) cuáles han de calcularse.
probabilidad Cuando '>t: supone que !>C conocen las llamada!> probabilidad conjuntll P(A n B)
conjunta y rrohabilidad mar2inal P(A), la probabilidad condicionada P(B 1 A) se puede
probabilidad calcular por medio de la definición. Cuando P(A)): P(B 1A) se suponen conocidas,
marginal P(A B) !.e puede calcular con la ley mult1phcati\a
So/uc16n Sea A e l C\ ento "Ja primera persona seleccionada es una mujer" y !.ea B el e"ento
"la segunda persona seleccionada es mujer". Lo que queremos calcular es P(A
r. B ). Por la ley multiplicativa,
P(A l"'I B) = P(A)PCB 1A )
Debería ser c laro que P(J\) = 6116 y P(B 1A)=5/15. Sustituyendo. obtenemos
EJEMPLO 3. 18 Suponga que en el ejemplo 3.17 se tienen que seleccionar tres personas. ¿Cuál es
la probabilidad de que las tres sean mujeres?
Solución Defina A corno "la primera persona seleccionada es mujer", B como "la segunda
per!.ona seleccionada es mujer" y C como "la tercera persona seleccionada es mu-
jer". P(C 1 t\ l'"'1 B) debe ser 4/ 14, de modo que
= (i66)(.5s)C:) .036
=
•
Sección 3 ) e,.rc1c1os 95
3.20 Una fábrica cuenta con dos generadores de emergencia, cada uno de los cuales pue-
de proporcionar suficiente energfo eléctrica para las opcrt1ciones básicas. Ambos ge·
neradores están expuestos a fallas . Sea A el evento " el generador 1 funciona
adecuadamente" y Bel C\ento "el generador 2 funciona adecuadt1mente". De-.cnh.1
\Crbalmente cada uno de los siguientes eventos: A; A V u: Ar'\ u; A r'\ e. ¿Cuál es
el complemento de A u O?
3 21 Supon&a en d ejercicio 3.20 que P{/\) O 96. pt B) O 94 y /'( A r B) O 93 . fra-
cc un diagrama de Venn. Encuentre !'( /\ n B ). PI Ar ll ) > P{ /\ r B ).
3.22 Use las probahilidades del e1ercicio 3 21 para encontrar P(B 1A), P( H A). P(B A)
)' P( ti A ). Enuncie 'erbalmente cada una de estas prob:ih1htlatles (.Es P(B A)+
Pl,B A) l?¿f.:.sP(B A)+P{B A) I?
3.23 ¿Son mutuamente cxclu)cntes los e\ento'I A y U de los ejercicios 3.20 y J .21? En·
cuentre P(A o B).
3.24 ...1 director de una agencia federal responsable de otorgar viviendas a pequellas co-
munidades. encontró que el 14.2% de las solicitudes eran extemporáneas (fuera de
plazo). el 8.7% estaban incompletas y el IS .9% eran inelegibles. l)elina A como
"extemporánea", B como "incompleta" y C como "inelegible". ¿Qué parejas de
eventos, si es que las hay, son mutuamente excluyentes? Dé una interpretación del
e\.ento A r'\ o r. e.
3.2S l:;n el ejercicio 3.24, suponga que P( Ar. B) 0.046. /'(A r.C) = 0.092,
P( RnC) = 0.035 y P( Ar. BnC) - 0.016. Construya un diagram.:i de Venn y de-
dwca las probabilidades de los eventos mutu.:imentc excluyentes. Por ejemplo, en
vista de que P( A n B) = 0.046 y que P( A r. On C) - 0.016, debe ser cierto que
P( A n Bf"\ C ) 0.030.
3.26 Utilice el d1.:igrama de Venn que construyó en el ejercicio 3.25 para encontrJr
Pt A ri B r- e). P( A V B V e ) y P( A'"' R). Exprese \.erhalmc:nte estos eventos.
3.27 l-n cierto proceso de fabricación es necesario perforar un bloque de metal con apc·
go a especificaciones mu) precisas Un defecto en el orilicio puede c ~tropcar el hlo·
que. lo que sólo se puede descubrir al final del montaje. La experiencia md1ca que
el 90% de las perforaciones se hacen dentro de las especificaciones. Un mo;pector
examina cada perforación. Si el orificio no está hecho dentro de lac; ec;pecificac10·
nes, hay una probabilidad del 90% de que el inspector descubra el defecto.
a. ¿Cuál es la probahilidad de que un bloque esté perforado defectuosamente y que
el inspector lo descubra'?
b. ¿Cuál es la probabilidad de que un bloque esté perforado dclectuosamente y de
que el inspector no lo descubra'!
3.28 SupongJ. en el ejercicio 3 27. que, con una red1c;tr1huc16n del trabajo, la tasa de per·
foraciones dentro de las especílicac1one~ c;e puede ele\ ar al 99%. lamhién ~uponga
que con esta estrategia se cuenta con meno., tiempo para la 111'pecc1ón. de modo que
un inspector sólo detecta los bloques defectuosos en el 80° o de los casos.
a. ¿Cuál es la probabilidad de que un bloque tenga una perforación defectuosa y el
inspector no descubra el defecto?
b. Compare la respuesta del inciso (a) con la que obtuvo para el inciso (b) del cjcr·
c1cio 3.27 ¿En qué caso es menor la prohabilidad de que un defecto no se descu-
bra? ¿Seria relevante para su respuesta el que lt1 tasa de detección de defecto.,
fuese sólo del 400. en \eZ del 8~9'>
3.29 Nos referimos nue\amente al ejercicio 3.27. Suponga que los defectos de perfora-
ción que no son descubiertos por un inspector se detectan durante el montaje, con
una probahilidad de 0.80. ¿Cuál es la prohahilidad de que un bloque seleccionado al
96 l UN PRIHER VISTAZO A LA PROBABILIDAD
'
3.4 INDEPENDENCIA ESTADÍSTICA
•
Un concepto básico de la lt!oria de la probabilidad, de panicular importancia por
sus aplicaciones a la estadística, es el de independencia. Suponga que en el ejem-
plo de las cuentas por cobrar de la sección anterior. 36 de las 216 cuentas son "con
el extranjero"> 4 de las 36 cuentas con el extranjero tienen un error. ¿,Es diferente
la probabilidad de error dado que la cuenta es con el extranjero a la probabilidad
global (no condicionada) de error? Recuerde que había 24 cuentas erróneas en el
grupo de 216, de modo que ?(errónea)- 24/216 - 1/9. la probab1lldac.1 condicio-
nada de error dado que la cuenta es con el extranjero es P(errónea 1
extranjero) - ?(extranjero y errónea} ?(extranjero) (4 2 l 6H36 216) - 4136 = 1/9,
lo mismo que la anterior. Como la probabilidad condicionada de un error es exacta-
mente la misma que la probabilidad no condicionada. se dice que los eventos "selec-
cionar una cuenta con el extranjero" y "seleccionar una cuenta con un error" son
estadísticamente e!>tadblicamen lc independientes.
ind epe ndientei. La idea de independencia estadística es que la ocurrencia del evento A no
cambia la probabilidad de que el evento B suceda. En otras palabras, la probabili-
dad conc.licion:id:i P(B 1 A) es la misma que la probabilidad no condicionada P(B).
EJEMPLO 3. 19 Rcmita~e al ejemplo de las cuentas por cobrar de la sección anterior. Determine si
los eventos "primera cuent.a errónea" y "segunda cuenta errónea" son independientes.
So/uc16n Dado que el muestreo de las cuentas por cobrar se hace i.in reemplazo, el hc:cho de
que se elija una cuenta errónea en la primera selección reduce (ligeramente)
la probabilidad de que se presente una cuenta errónea en la segunda. Por consi-
guiente, los e\Cntos no son independientes. Sabemos que />(la segunda es errónea
la primera C\ errónea) = 23/215 = 0.107 y que la probabilidad no condicionada P(la
segunda es errónea) = 24 216 = 0.111. La diferencia numérica entre las prob:ibali-
dades es muy pequei\a, de modo que los e\.entos son casi independientes. pero no
del todo. •
34 Independencia eir:.ad1suc:a 97
EJEMPLO 3.20 Suponga que en el centro de cálculo de una universidad, 192 de 960 trabajos son de
alta prioridad; de éstos, 128 son propuestos por estudiantes y 64 por el cuerpo do-
cente. Del total, 640 trabajos son de los e~tudiantcs ) 320 de docentes. Si se selec-
ciona un trabajo al azM, ¿son los eventos, ..trabajos <le alta prioridad" ~ "trabajo de
estudiantes". independientes?
Solución Sea A el evento "el trabajo es propuesto por un estudiante" y Bel evento "el traba-
jo es de alta prioridad". Para que los eventos A y B sean independientes debemos
demosU"ar que
P(A j 8) = P(A)
o
PCB I A) = P(B)
En este caso podemos calcular P(B 1 A) util izando la definición de probabili-
dad condicion:ida:
P(AnB)
P(B 1A) = P(A)
Así mismo, P(B) = 1921960 = 0.200. de modo que los eventos A y 13 son inde-
pendientes. •
EJEMPLO 3.21 Utilice la ley multiplicativa para eventos independientes para verificar que los dos
eventos del ejemplo 3.20 son independientes.
EJEMPLO 3.22 Suponga que, en una evaluación, el 70% del profesorado de un distrito escolar al-
canza calificación satisfactoria, que el 59% tiene 40 ai\os o más, y que la edad y la
evaluación son inJepcndicntcs. ¿Cuál C!> la probabilidad de que un profesor seleccio-
nado al azar (a) se;i C\aluado satisfactoriamente) tenga más de ~O ;iños; (b) no sea
evaluado satisfactonamcnte y no tenga más Je 40 años; (e) no sea e\aluado satisfac-
toriamente dado que tiene menos de ~O años?
Solución a. Puesto que los eventos "evaluado satisfactoriamente" y "más de 40 ai'los de edad"
se consideran independientes, se sigue que
P(A n B n C n 0) = P(AIP(B)P(C)P(D)
EJEMPLO 3.23 Suponga que la probabilidad de que el comprador de un automóvil nuevo pida que
el aire acondicionado venga instalado de fábric:t es de 0.6, y que las diferentes de-
cisiones de los compradores son procesos independientes. ¿Cuál es la probabilidad
de que los próximos cinco compradores pidan que el aire acondicionado venga ins-
talado de fábrica?
99
Solución Sean A 1• A~. Al' A4 y A 5 los ~vcntos de que los compradores 1, 2, 3, 4 y 5 piden
que el aire acondicionado venga instalado de fábrica. En tal caso.
P (los cinco piden aire acondicionado de fábrica) = P(A 1 n A 2 n A 3 n A 4 n A~)
= P(A ¡)P(A 2 )P(AJ )P(A 4 )P(Ad
= (.6)(.6)(.6)(.6)(.6)
= .07776 •
SECCIÓN 3.4 EJERCICIOS
3.30 El director de personal de una empresa que emplea vendedores a tiempo parcial en-
saya un3 prueba de aptitudes para las ventas con cientos de aspir3ntes. Como la
prueba es nueva, los resultado'> no se utilizan para dar el empleo. El 40% de los as-
pirantes muestran gran aptitud segun la prueba, y el 12% de los contratados mue~
tran un3 gran aptitud y alcanzan buenas cuotas de ventas. La experiencia de la
empresa indica que el 30% del personal de \entas consigue buenos nivele'> en !:is
ventas. Sea A el evento "muestra una gran aptitud" y Bel evento "logra buenas venta.""·
a. 1-ncuentre P(A). P( A11B) y P(B 1A).
b. ¿Son independientes A y R?
c. ¿Es ütil la prueba para predecir buenos niveles en las ventas'> ¡,Qué tanto'?
3.3 1 Construya un diagrama de Venn para el ejercicio 3.30.
a. Encuentre P(A 11 i'i ) y />( A A).
h. ¡,Son independientes A y B ?
3 .J:! tin estudio acerca de los trabajadores de dos plantas de una empresa manufacturera
incluye la pregunta: "¿Cuán efectiva es la gerencia para responder a la.'> legítimas
quejas de los trabajadores?" En la planta 1, 48 de 192 trabajadores contestaron
"poco efectiva", una respuesta desfavorable; en la planta 2, 80 de 248 trabajadores
respondieron "poco efectiva". Se va a seleccionar aleatoriamente a un empicado de
la empresa manufacturera. Sea ¡\ el evento "el trabajador procede de la planta I" y
Bel evento "la respuesta es desfavorable".
a. Fncuentre P(A), P(B) y P( Ar. B ).
b. ¿Son independientes los eventos A y B?
c. Encuentre P(B 1A) y P(B A). ¿Son iguales?
3.3 3 Demuestre ~e si A y B son independientes, entonces P<B A) P(B 1A). (Suge-
rencia: B y A también son independientes.)
3 .34 Un distrito escolar debe sustituir profesores en dos escuelas primarias y una escue-
la secundaria. En un día cualquiera, la probabilidad de que, en las escuelas prima-
rias 1 y 2, no se necesite un sustituto para cubrir la ausencia de algún profesor es de
0.60. En la escuela secundaria, la probabilidad de que no se necesite un sustituto es
de 0 .50. Suponga que el ausentismo en las tres escuelas define tres procesos inde-
pendientes. Encuentre la probabilidad de que no se necesite ningün sustituto en nin-
guna de las escuelas en un día especifico.
3.35 ¿Cree usted que la hipótesis sobre la independencia de los procesos en el ejercicio
3.34 es realista?
3.3 6 En el ejercicio 3.18, la probabilidad de .:¡ue una computadora seleccionada al azar
tuviese memoria est~ndar era de 0.84, y la probabilidad de que tuviese unidades de
disquetes de 5W' y 3Yi" era de 0.40. La probabilidad de que tuviese ambos tipos
de unidades y memoria estándar era de 0.24.
a. Encuentre la probabilidad de que una computadora tenga ambos tipos de unida-
des de disquetes dado que tiene memori:i estándar.
100 3 UN PRIMER VISTAZO A LA PROBABILIDAD
EJEMPLO 3.24 Una compaí'ia encuentra que el 46% de sus jóvenes directores está casado con
un(a) profesional, el 37% no está casado con un(a) profesional y el 17% son solte-
ros La compa"ia considera que el 40% de los directores casados con profesionales
rehusarían !>er transferidos a otra oficinn. al igual que el 10º~ de los solteros) el
15% de Jo., qu\! no cMán casados con profesionall!s Si 3 un director seleccionado al
:v.ir se le pmpone ~er transforido. ¿cuál L~ la probabilidad de que rechace la oferta'?
Solución En primer lugar. el C\ento "rechazada" se puede pensar como "(rechazada f"'I dos
profesionales) v (rechazada (')un solo profesional) v (rechazada r-. soltero)". L;is
tres posibilidades son mutuamente cxclu)entes. de modo que por la ley aditiva te-
nemos que
/'(rechazada) - P(rechazada f"'I dos prolesionales )
+ P(rechazada f"'I un solo profesional) + /'(rechazada l'"'I soltero)
En segundo lugar, cada una de las tres probabilidades se puede valorar por medio
de )3 ley multiplicativa. Por ejemplo,
EJEMPLO 3. 25 Se hacen dos inversiones de 100 dólares en dos proyectos. Se supone que el proyec-
to A 'a a producir un rendimiento neto de 8, 1O o 12 dólares, con probabilidades
respectivas de 0.2, 0.6 y 0.2. Se supone que el pro)ecto B va a producir una ganan-
cia neta de 8, 10 o 12 dólares, con probabilidades rcspccti\as de 0.3, 0.4 y 0.3. Ade-
más se supone que las ganancias de ambas inversiones son independientes entre sí.
¿Cuál es la probabilidad de que la ganancia total ~a de ~O dólares cxacmmente?
EJEMPLO 3.26 Con los datos del ejemplo 3.24, construya una tabla de probabilidades conjuntas
comparando la condición matrimonial con la actitud ante un:i e\ entual translcren-
cia a otra oficina. Utilícela para encontrar P(rcchazada).
Soluc16n En primer lugar, ponga todas las prob¡¡bilid:ides marginales conocidas en los extre-
mos apropiados d~ la tabla.
Dos profesionales Un profesional Soltero
Rech:i1:ida
Aceptada
.37
EJEMPLO 3.27 •
Con los datos del ejemplo 3.25, construya unn tabla de probabilidades conjuntas y
encuentre ?(ganancia total :: $20).
.2 .6 .2
Paro llc!nar la tabla se puede utiliz.ar la ley multiplicativa para eventos independientes.
Ganancia en A •
SK SIO Sl2
Ganancia Sli 06 .IR ()6• .)
en SIO ()!! .24• 08 4
B SI:! ()6• 18 .06 .3
.2 .6 .2
Las entradas 4ue corresponden a una ganancia total de 20 dólares están marcadas
con un asterisco. La ley aditi\ a nos da
P(ganancia total • S20) = 0.06 + 0.24 + 0.06 '"' 0.36.
como en el ejemplo 3.25. •
Las tnhlas de probabilidad constituyen una forma breve y conveniente de re-
solver muchos problemas. Con frecuencia también proporcionan la solución de
algunos problemas relacionados. Por ejemplo. usted no debería tener ninguna difi-
cultad para encontrar en el ejemplo J.27 P(gananc1a total =- S22) o P(ganancia to-
tal= $16). Ahora bien, en aquellos problema!> ~ue comprenden más de dos
categorías de eventos, las tablas de probabilidad son, en el mejor de los casos, di·
ficiles de manejar. Si en el ejemplo 3.25 hubic!>e hah1do un proyecto C, habría sido
necesario utilizar una especie de tabla tridimensional
:irbol de Otro artificio que se usa con frecuencia es el •irhol t.lc p robabilílhu.I Este
1>rohnbi lid11d método es dilic1I de describir pero muy fácil de ejcmplific:ir.
) S Tablu y M'boles de probab1hdad 103
Soluc..ión Primero, construya ramas para un conjunto de eventos con probabilidades margina-
les conocidas:
Un profesional 37
Soltero .17
Despu~s. en la punta de cada una de estns romas lc\'ante nuc\ a'l ramas para otro
conjunto de eventos, utilizando probabilidades condicionadas (dada la primera
rama apropiada):
Rechazada .40
(.46)( 40) • . 1840'
Dos profesionales 46
Rechazada 15
(.37)(.15) ~ osss·
Un profesional .37
Aceptada 85
(.37)(.85) • .3145
Rechazada
'º (.17)(.10) - .0110·
Sollero 17
Aceptada 90
(, 17)(.90) . 1530
104 3 UN PRIMER VISTAZO A LA PROBABILIDAD
(Si hubiese habido otro conjunto de eventos relevantes, habríamos ai\adido otro
conjunto de ramas.) Como se ve, la probabilidad de cada tra)ectoria específica (su-
cesión de ramas) se encuentra multiplicando las probabilidades a lo largo de ella.
la probabilidad de un C\.cnto se puede encontrar 'iumando las probabilidades de to-
das las trayectorias que lo satisfacen. Los trayecto!> corre:.pondientc~ a "rechazada"
están marcados con un asterisco: ?(rechazada) = 0. 18..iO + 0.0555 + O.O 170 =
0.2565, una vez más. •
Ganancias en B Ganancias en A
se .2
.06
$8 3 S.10 6
.18
$12 .2
.06'
SS 2
.08
SIO 4 $10 6
.24º
$12 2
.08
$8 2
.06'
S12 3 S10 6
.18
$12 2
.06
3.5 Tablas y árboles de probabilidad 105
Como hemos supuesto que los eventos son independientes, no es necesario consi-
derar las probabilidades condicionadas de las ganancias en A para cada ganancia
particular en B. Las ramas correspondientes a las probabilidades para una ganancia
total de 20 dólares están marcadas con un asterisco: ?(ganancia touil =$20) - 0.06 +
0.24 + 0.06 = 0.36. •
EJEMPLO 3.30 En un programa de concursos de la tele'< isión hay un valioso premio oculto detrás
de una de tres puertas. Usted, el concursante, debe escoger una de ellas. Una vez
escogida y antes de abrirla, el presentador descubre una de las puertas no seleccio-
nadas para que usted vea que el premio no esuí ahí. Después, le ofrece la oportuni-
dad de escoger la puena rcsiante. ¿Debería usted aceptar el cambio, o éste no le
representa ninguna ventaja?
106 3 UN PRIMER VISTAZO A LA PR08ABILJOAO
13 1 '2
1/6
A 1 13
e 12
1/6
13 1 13 e
1/3
e 1/3 B
1/3
P( detrás de C y escogió B )
P(detnís de C 1escogió B ) = P(escogió B )
l/3 1/3 2
=
1/6 + 1/ 3
= --
1/2
=-
3
así, P(detrás de A escogió 13) = 1 - 2/3 = 1/3 . ¡La posibilidad de que usted gane
es mayor si acepta el cambio y escoge la puerta C! •
l .S Tablas y arbolei de probabfkdad 107
EJEMPLO 3.3 1 Suponga que el 4~o de los m~icamentos teóricamente aceptables son biológica-
mente activos)' que de estos últimos el 7(J% muestra serios efectos secundarios. Oc
los medicamentos que se sabe que no son activos. el 20% se pueden reformular para
que lo sean y. enlre estos medicamentos refonnulados. el 800/o tienen serios efectos
secundarios. Todos los medicamentos que se van a comercializar deben ser aproba-
dos por el gobierno. La probabiliJad de que un medicamento sea aprobado, supo-
n1enc.lo que es biológicamente activo y no tiene efectos secundarios. es de 0.90. De
lo!> medicamentos qUc! son biológicamente acti"os ) tienen cfoctos secundarios. solo el
Sº o scr:í aprobado. Si el medicamento no es b1ológ1camentc acl1\o, no será aprobado.
a. ¿Cuál es la probabilidad de que se apruebe un nue\O medicamento?
b. ¿Cuál es la probabilidad de que un nue\o medicamento tenga efectos se-
cundarios?
c. Si un mcJicamento es aprobado, ¿cuál es la probabilidad de que tenga
efectos secundarios'?
Soluci6n Se puede construir un árbol de probabilidad. En este caso, como a menudo aconte-
ce, las ramas se suceden en orden cronológico. La primera rama revela si el medi-
camento es o no activo. Después se con-.ídcran los segmentos correspondientes a sí
el mcJicamento se puede rcformular, si tiene efectos '>Ccundarios y si será aproba-
do, en este orden.
SI .05
.0140
51 .70
No .95
2660
Sí 40
$1 90
.1080
No .30
No 10
0120
S1 05
0048
Sí .80
No .95
.0912
sr .20
sr 90
.0216
No 20
No 60
No 10
0024
No 80 No 1.00
4800
108 3 UN PRIMER VISTAZO A LA PROBABILIDAD
Importante .) .s .2
Primera prueba Menor .1 .3 .6
Ninguno o .2 .H
a Con'>truya una tabla con las probabilidades conjuntas de todas las combinaciones
posibles de resultados de la primera y la segunda prueba
b. Encuentre la probabilidad de descubrir un error importante durante la segun-
da prueba.
Se<ción ) S E¡erc•clOS 109
de los clientes por contrato tienen prioridad; el 40% de l:is solicitudes son por con-
trato. Las primeras cuatro llamadas de cada dla se asignan de inmediato a los camio·
'1'S. Si al menos tres de ellas son de clientes por contrato, el despachador detie
rehus:ir cualquier llamada posterior de cliente!> ocasionales durante ese di3.
a. Construya un :irbol de probabilidad para las primeras cuatro llamadas. La primera
rJma deberá ser para clientes por contrato u ocasionales en Ja primera llamadJ
b. ¡.Cu~I es la probabilidad de que el despach01dor rechace cualquier otra llamad01
de clientes ocasionales?
3.47 Suponga que, en el ejercicio J.46, el despachador debe recha1ar las llamadas poste-
riores de cualquier cliente ocasional. ¿Cuál es la probab1hdad de que las primeras
cuatro llamac:Lls fuerJn hechas por clientes por contrato'!
SIDA .001
Positivo 02 01998
P(SIDA y positivo)
P(SJDA 1 positivo) =
?(positivo)
.00095
= - ----- = .045
.00095 + .01998
Este ejemplo tiene todos los elementos del teorema de Bayes. Comenzamos
ProbabiJíd;1cks con las p robabilidades a priori e.le un evento o "estado natural". En este caso, las
a priori probabilidades a priori (es decir, antes de que obtengamos nueva información) se
aplican independientemente de que la persona seleccionada tenga SIDA o no. La
información (en nuestro caso. lús resultados de Ja prueba) es una indicación imper-
fecta del estado 'erdadero. A las probabilidades de los distintos resultados que nos
po.,ibilidadcs o da la información. tales como un diagnóstico positivo o negativo, se les llama po-
vc ro:,imilitudcs s ih ilidadcs o veros im ilitudes. Estas probabilidades se combinan para producir
11ro babilitladcs p robabilitlatlcs :i polltcriori (es decir, después de obtenida la información) de los
a polltcriori distinto\ estad os naturales.
Teorema de Bayes
Sí A1, ... , Ak son estados naturales mutuamente excluyentes y si 8 1, ... , B,,, son m
eventos observables posiblemente excluyentes entre sí, entonces
P(B¡I A,)P(A,J
P(B;\A 1 )P(A 1 ) + P(B,jA 2 }P(A 2 J .t ... + P(B,IA JPCA
1 1)
P(B, I A,)P(A.}
L P(B, I A,)P(A,}
1
como el SIDA; además de su alto costo, el fenómeno del "falso positivo" que hemos
ilu.~t.rado con nuestro ejemplo es un fuene argumento en contra de dichos proyectos.
'
EJEMPLO 3.32 Un club de libros clasifica a sus miembros como compradores grandes, medianos o
peque"os y prepara por separado la correspondencia para cada uno de estos grupos.
Aproximadamente el 200/o de sus clientes son grandes compradores, el 30%, media-
nos y el 50%, peque"os. No se clssilica a un miembro dentro de ningún grupo has-
ta que transcurren 18 meses de su ingreso al club, aunque se realiza una prueba para
ver si es factible clasificar a los miembros con las compras de los primeros 3 meses.
Los siguientes porcentajes se obtuvieron de los registros correspondientes a miem-
bros ya clasificados como comprJdores grandes, medianos o ¡xque"os.
Compras
durante los G"'po
primeros
3 meses Grande Mediano Peque"º
o 5~ .. 15º u 60~0
1 IOuu 30º·o 20~~
2 30% 40º o 15~~
3+ 55~n l 5u0 5uIn•
Solución a. Por lo que al club de libros concierne, hay tres posibles estodos naturales:
A 1 =grande, A 2 .- mediano y A,= peque"º· Los e\entos observables son las com-
pras en los tres primeros meses: B 1 - O, 8 2 = 1, 8 1 2 y 8 4 - 3+.
:i.
b. Anll..~ de reunir cualquier información :icerca de la..'> compras en los ll\!S pnme-
ros meses, la probabilidad de ser un comprador pequeño 'I! e~pcc.:1fica como 0.50.
c. No comprar ningún libro md1ca que lo más probable es que el miembro
sea un comprador peque"º· Relativamente pocos compradores medianos o ~randcs
no compran libros durante los primeros tres meses. La probabilidad a postcnori de
"peque"o", dado que no hiL.o ninguna compra, debc!ria .,er !>uperior a 0.50.
d. Se puede utilizar el teorem:i de Bayes para 1.:alcl1lar la probabilidad a pos-
teriori de "peque"º· dado O" (es decir, que adquirió O libros).
P(O 1 pequeil.o)P(pequei\o)
P( peque"º 1 O) = P(O 1 peque"o)P(pequei'lo) + P(O 1 mediano)P(mediano) + P(O 1 grande)P(grande)
(.60)(.50) = .845
(.60)(.50) + (.15)(.30) + (.05)(.20)
36 Teorema de Bayes Probab1hdades a pnon y a pouenon 113
----------·
o 15
045
Mediano .30
---------· -
o .60
.300
Peauel\o .so
-----------
FIGURA 3.6 Árbol de probabilidad para el ejemplo 3.32
¿Cómo debería cambiar la probabilidad de que el anuncio será efectivo con una
reacción neutral del grupo'? Verifique su respuesta con el teorema de Bayes.
Solución '
El e-.ento observable "reacción neutral" ce; estadísticamente independiente de los
estados naturales "resultado del anuncio''. La probabilidad (condicionada) de una
reacción neutral es la misma para todos los resultados Por consiguiente, la proba-
bilidad de un anuncio publicitario dectiYO no debería cambiar con una reacción
neutral. Utili1ando el teorema de Bayes,
3.48 El lo/e de los préstamos que hace cierta empresa financiera no ~n sal~dos (es de-
cir, la cantidad presuda no le es dc\'uelta en su totalidad). La compa"ia efectua un
estudio rutinario de las posibilidades cn:diticias de los solicitantes. Encuentra que el
JO~o de los préstamos no saldados se hicieron ;a clientes <le alto riesgo. el 40% a
clientes de riesgo moderado >el restante 30% a clientes de bajo riesgo. De los pres-
tamos que fueron saldados. el 10% se hicieron a clientes de alto riesgo, el 40'/o a
clientes de riesgo moderado y el 50°0 a clientes de bajo nesgo.
a. Utilice un árbol de probabilidad para calcular la probabilidad de que un présta-
mo de alto riesgo no sea saldado.
b. Utilice el teorema de Ba) es para calcular la misma probahilid.i<.I.
3 49 Remitase al ejercicio 3.48. Muestre que la probab1hdad a po'>tcrion <le deuda no '\'11-
dada. dado que el riesgo es moderado, es 1gu.il a la probabilidad a priori de deuda
no saldada. Explique por qué este resultado es r.i.ronahle
J .50 Una emprcc;a manufacturera tiene tres opcrarioc; para una máquina que produce cier-
tos componentes. El operario A tiene una tac;a de dcfectoc; del 5%; el operario B. del
1° o, ) el operario C. del 2%. Los tres operarios producen el mismo numero de com-
ponentes. Suponga que un componente seleccionado al :var resulta dcfcctuoc;o Cal-
cule la probahihdad a poo;tcriori de que el componente haya sido producido por A.
Compare el resultado con la probabilidad a priori que es 1' 3.
3 .51 Una empresa que vende póli1as de seguro para casas estudia el problema de los in-
cendios ocasionados por estufas de lci'a. Entre las casas que cuentan con tales estu-
fas, el 30% cuenta con una estufa del tipo 1; el 25%, del tipo 2: el 15%, del tipo J,
y el 30'/e restante tienen estufas de otro tipo. i:n tres a/los de operación. el S% de las
Sección 3.6 E¡ercicioi 115
estufas del tipo 1, el 3°/o de las del tipo 2. el 2% de las del lipo 3 y el 4% de las de
otro tipo han ocasionado incendios. Si en una casa en panicular se presenta un in-
cendio, ¡,cuál es la probabilidad de que haya una estufa de tipo 1 en esa casa?
3.52 Un crítico de libros de tc>.to tiene un curioso "historial".
lJn editor estima los siguientes porcentajes para los libros de gr.in éxito, éxito regu-
lar y poco éxito: Alrededor del 10% de los libros tiene gran éxito. el 500/o tienen un
bito regular y el 40% restante tiene poco éxito.
Si este crítico califica un lit'iro como bueno. calcule la probabilidad a postcrio·
ri de que el libro tenga poco éxito. Compare el resultado con la probahilidad a priori
de 0.40.
3.53 Las probabilidades condicionadas pueden ser útile~ par;i diagnosticar enfermedades.
Suponga que el 25%, el 15% y el 12% de la pohlaeión padece tres enfermedades
diferentes, estrechamente relacionadas entre sí (A 1• A:) A,). AcJem:is, supon¡a que
con cada una de cst¡¡s cnfennedades se pueden asoc1:ir cualquiera de tres estados
sintomáticos mutuamente excluyentes: B 1• B~ y o, 1 .i C'-JlCricncia mue~tra que la
probabilidad /'(li A) de mo~trar un tipo de sintomJ\ cu.indo ~e padece la cnfenne·
dad es la siguiente:
J::nfermeúoú A1
Estado
sintomático B1 A1 /\2 /\l
B, .011 .17 .10
B~ IK .12 .14
B, 06 .07 011
e. (sin síntomas) 61! 64 .68
Resumen
•
Los conceptos de probabilidad que se analizan en este capítulo ~on base y funda-
mento de los métodos de predicción e inferencia que desarrollaremos m:is addan·
te. La probabilidad es el lenguaje básico de lo incertidumbre y la aleatoriedad,
conceplOl> clave en el pensamiento esuidíst1co
1 os enunc1ado5 de la probabilidad se pueden interpretar de distintas manera\.
En la interpretación clásica se les considera como el cociente de los resultados fa-
vorables entre el total de resultados (cuondo se supone que todos los resultados son
igualmente posibles). Otra interpretación es como frecuencias relativas en el lími-
te y otra más como las expresiones subjetivas de una opinión personal. La interpre-
tación clásico y la idea de tomar muestras aleatorias de uno población proporcionan
un m:irco adecuado para entender las definiciones básicas y los principios de la
probabilidad. Las mismas definiciones y leyes se pueden establecer de un modo
general en términos de las nociones de la teoría de los conjuntos y de los concep-
tos de espacio muestra!, resultado. evento, unión, intersección y complemento.
Las definiciones básicas incluyen eventos netamente exclusivos (la ocurren-
cio de uno de ellos hace que los otros sean impo<oible!>), evi:ntos indep(ndit:ntes (la
ocurrencia de uno de ellos no cambia la probahilida<l de los otros) y la probabilidad
condicionada. Resaltan por su import~mcia la ley aditiva {para la ocurrencia de uno
Resumen 117
u otro evento, más fácil de calcular cuando los e\entos son mutuamente excluyen-
tes), la ley de Jos complementos (para encontrar la probabilidad de que un evento
no suceda} y Ja ley multiplicativa (para encontrar la probabilidad conjunta de que
varios eventos sucedan).
Hay algunos anificios muy útiles para entender el razonamiento en Jos pro-
blemas de probabilidad. Para clarificar una situación en que interviene la probabi-
lidod se pueden desarrollar diagramas de Venn, Labias y árboles de probabilidad.
Uno fónnula particular, el teorema de Ba) es, sintcti.t.a los cálculos que hay que rea-
lizar cuando se trata con probabilidades a priori, y la posibilidac.I (\erosimilitud) de
los datos parJ detennmar probabilidades a postenori relativas a los estados natura-
les dada una infonnación adicional; esta fórmula simplifica el trabajo que también
se puede hacer utilizando árboles de probabilidad.
1. Interpretaciones de la probabilidad
N
a. Interpretación clásica: P(evento E)= :
CAPÍTULO 3 EJERCICIOS
- ----
3.58 Con frecuencia l:is aerolíneas aceplan billetes (bolclos) compradM en otras lineas
aéreas con el mismo destino. Suponga que cada año se rcal11a un recuento > se li·
quidan dichos billetes, } que cada mes se realizan p;1gos aproximados sobre la base
de una muestra aleatoria de lo-; billetes acumulados durante el mes. La aemlmea A
toma una muestra mensual de 60 billetes, que pueden corresponder a las ;icrolinea~
B. C o D. Indique cómo scrfa un resull.ido típico de este experimento. ¿Se debe con-
siderar que todos los resultados son igualmente probables?
3.59 Suponga que en l:i indu~lria ue los cereales envasados, el 290/e de los vicepresiden-
tes poseen el lltulo de maestro en administración de emprec;ac;, el 24% de ellos han
reali1.ado estudios en una escuela comercial y el 8% tiene ambas coc;as. Se \a a se-
leccionar un v1ceprcs1dcn1e al a1ar.
a. Construya un d1agram:i. de Vcnn para esta situación
b . ¿Cuál es la prob:i.b1hdau de que el vicepresidente tenga o hien el título de maes-
tro en adm1n1stracmn de empres:is o haya realizado estudios en una escuela co-
mercial (o ambas cosas)?
c . ¿Cuál es la probabilidad de que el vicepresidente no teng3 ninguno de los títulos
anteriores?
3.60 En el ejercicio J .59, ¿cuál es la probabilidad de que el viccpresideote tenga un titu-
lo o el otro, pero no ambos?
3.61 Suponga que los registros de un fabricante de automóviles muestran que para cier-
to modelo de automóvil comp;icto, el 50% de los clientes lo piden con aire acondi-
cionado, el 49% con dirección hidráulica y el 26% con ambas coc;as Se selecciona
un pedido al a1ar.
a. Trace un d1agram3 de Venn para esta situación.
b. ¿Cuál es la prob3bilidau de que pidan :11rc acondic1onado. ~ no dirección hidr.íulica·?
c. ¿Cuál es la probabilidad de que el cliente no solicite nmguna de estas opciones?
J .62 Fn el ejercicio 3.61, suponga que el 68% de los clientes solidtan transmisii'>n auto·
mática, el 19% transmisión automático y dirección hidráulica sin aire acondiciona·
do, el 13% transmisión automática y aire acondicionado sin dirección hidráulica. y
el 21 % las tres opciones.
a. Construya un diagrama de Venn para esta situación.
b. ¿Cuál es la probabilidad de que se solicite al menos una de las opciones?
c. ¿Cuál es la probabilidad de que se solicite exactamente una de las opcionc:!-'?
3.63 Utilice los datos de los ejercicios 3.61 y 3.62 11ara encontrar P(transmisión automá·
tica n aire acondicionado). ¿Son independientes estos eventos?
J .64 Los defeosorcs de la teoría del recorrido aleatorio de los precios de las acciones sos-
tienen que las predicciones sobre si una acción particular se comportara bien o mal
en el mercado en el cono plazo (digamos, en un periodo de un mes) no son mejores
E¡erc1c1os 119
que las predicciones que se obtendrían al lanzar una moneda al :iire. Suponga que
un analista de valores selecciona 8 acc;oncs que se piensa superarán al mcrcad<1 en
el mes siguiente.
a. Suponiendo que la teoría del recorrido aleatorio es válida, ¿cuál es la probabili·
dad de que las ocho acciones sobrepasen al mercado?
b. Exprese las hipótesis que hizo al contestar el inciso (a).
3.65 En relación con el ejercicio J.64, suponga que la teoría del recorrido aleatorio del
precio de las acciones es válida y que 100 analistas distintos seleccionan ocho ac-
ciones por separado.
a. ¿Cuál es la probabilidad de que ninguno de ellos escoja ocho ganadoras?
b. ¿Cuál es la probabilidad de que al menos un analista seleccione ocho ganadoras?
3.66 Un \cndedor de libros de bolsillo estima las siguientes probabilidades para las ven·
tas semanales de una aventura romántica de carácter histórico:
Ventas : 10 20 30 40
Probabilidad: .40 .JO .20 .JO
Suponga que las vent.as de una semana a otra son independientes entre sí.
a. Construya una t.abla de probabilidad para las probabilidades conjuntas de los dis-
tintos niveles de venta en las semanas 1 y 2.
b. Encuentre la probabilidad de que el nivel de ventas medio por semana (en un
periodo de dos semanas) sea de 25.
3.67 ¿Cree usted que la hipótesis de independencia que se hizo en el ejercicio 3.66
es razonable?
3 .68 Un depanamento de compras encuentra que el 75% de sus pedidos especiales se re-
ciben a tiempo. De los pedidos que se reciben a tiempo, el 80% cumple totalmente
las especificaciones; de los pedidos que llegan con retraso, el 60% cumple con las
especificaciones.
a. Encuentre la probabilidad de que un pedido llegue a tiempo y cumpla con las
especificaciones.
b. Construya una tabla o un árbol de probabilidad para esta situación.
c. Encuentre la probabilidad de que un pedido cumpla con las especificaciones.
3.69 Para la situación descrita en el ejercicio 3.68, suponga que se han recibido cuatro
pedidos.
a. Encuentre la probabilidad de que los cuatro pedidos cumplan con las especi·
licaciones.
b. Se~ale qué hipótesis hizo usted al responder el inciso (a).
3 .70 Una compai'lfa de tarjetas de crédito encuentra que cada mes el SO% de quienes po-
seen la tarjeta cubren totalmente sus dcudJs.
a . Suponga que se seleccionan dos usuarios al azar. ¿,Cuál es la probabilidad de que
ambos paguen totalmente su deuda ese mes? (El número de personas que poseen
la tarjda es tan grande que usted no necesita preocuparse de que la selección se
haga Clln reemplazo o sin él }
b. Suponga que se selecciona al a/.ar un usuario de la tarjeta. ¿,Cuál es la probabilidad
de que dicha pero;ona pague totalmente su~ deudas en do<> meses consecutivos?
c. ¿,En qué hipótesis se apoyó al responder a los incisos (a) y (b)? ¿,En algunos de
los casos le parecen irra.wnables las hipótesis en las que se apoyó?
3.71 Un examen más detallado de los registros de la compai'lía de tarjetas de crédito del
ejercicio 3. 70 muestra que el 90% de los clientes que pagan totalmente una cuenta
mensual también lo hacen al mes siguiente, y que sólo el 10% de los clientes que no
pagan totalmente en un mes cubren totalmente su deuda al mes siguiente.
a. Encuentre la probabilidad de que un cliente seleccionado al azar pague totalmen-
te dos cuentas mensuales consecuthas.
120 l UN PRIMER VISTAZO A LA PROBABILIDAD
El presidente de una empresa que hace estudios del mercado tiene un problema con
los datos de una encuesta que realizó para un banco. La instjtución bancaria preten-
de cambiar los estados de cuenta de los clientes que tienen cuentas de crédito (es-
pecialmente tarjetas de crédito y préstamos de interés variable). El cambio afectaría
principalmente a los clientes que tienen varias cuentas en el banco, de modo que la
opinión de estas personas es la que más le interesa conocer.
la institución bancaria proporcionó a la empresa algunas muestras aleatorias
de tama~o casi igual tomadas de tres listas de clientes. la lista "rosa" (entregada en
tarjetas color de rosa) fue una muestra tomada entre 190,878 clientes que aparen-
temente no tenían cuentas crediticias; la lista "amarilla", una mue~tra tomada entre
48,328 clientes que supuestamente sólo tenían un cuenta crediticia; y la lista
"azul", una muestra tomada entre 21,539 clientes que en apariencia tenían dos o
más cuentas crediticias. Los investigadores de mercado entrevistaron telefónica-
mente a todos los clientes. A cada uno de ellos se le pidió su opinión respecto de
los cambios propuestos en los estados de cuenta y se les preguntó acerca del núme·
ro de cuentas que tenían en el banco. La tabla de respuestas mostró qui: los di: la
encuesta acerca del número de cuentas no concordaban con los del banco.
I
¡
Estudio d• a.so· Pronc1p1os de la probllb1hdad 121
Número n!portado •• t
de t:"Ul'/l/,H
o 2+ Total
'\__
Ro~a 66 56 2!1 150
Muestra Amarilla 24 90 36 150
Azul 46 16 89 1.51
lota) 136 16:-? 153 451
Al cotejar la información con la del banco descubrieron que las listas tenian varios
meses de antigüedad, de modo que en el lapso transcurrido algunos clientes cam-
biaron el número de cuentas que tenían en el banco. Los investigadores también hi-
cieron un cuadro sinóptico con las opiniones expresadas acerca del procedimiento
para elaborar los estados de cuenta.
Muesa-a rosa
Número reportado
de <.·uentas
o 2+
1-J\illrahle J1 32 ló
Opinión Neutral :?O IK !I
Des fa\ ora ble 15 6 4
Mu~a-a amarilla
Numero !l!portado
de cuentas
o 2+
Favorable 9 JI 19
Opinión Neutral 7 JO 9
Dcsfo,orable !I 19 !I
Muestra azul
--~
Número reportado
de ,·ucnta.,
o 2+
fa,orable 18 6 JJ
Opinión Neutral 21 5 w
Dei.fa\ ora ble 7 5 25
muestra, pero lo que él quiere es obtener una estimación lógica de estas proporcio-
nes. Además, está interesado en saber. en cada caso, en qué medida dependen es-
tas estimaciones del número de clientes de los que se extrajo la lista. Todo el
mundo desconfiaba de la precisión de estos números. Prepare un informe · la justi-
ficación de su respuesta será una parte importante del informe que la empresa en-
tregará al banco, de modo que usted deberá explicar su razonamiento con la mayor
claridad posible.
a. Sintetice los datos de cada r>rovcedor por separado. Asegúrese de ;inalizar el pro-
medio, la variabílidad y las asimetrías.
h. ;,l>ebemos esperar que la regla empírica sea útíl par;i analizar estos d3tos? ¿Por
qué si o por qué no?
R2 E.ncucntrc la medía ) la varianza de los datos combinados del ejercicio k 1. En el
ejercicio R 1. ¿se puede detenninar la media directamente a panir de las medias por
proveedor? ¿Se puede determinar la vanan1u dircctarnente a partir de las v;inanta'>'?
RJ En un supennercado, los precios marcados en los carteles que se colocan en la es·
tantería no siempre corresponden al precio actual de Ja mercancía. pues pueden pro-
ducirse errores al anotar los c;imbios de precios. Suponga que con el tiempo el 60%
de los cambios de precios son aumentos y el 40% reducciones. Suponga también
que el 93% de los incrementos de precio están marcados correctamente. al igual que
el 980/o de las reducciones. Si un precio no está marcado correctamente, ¿cuál es la
probabilidad de que el cambio sea una reducción?
R-l l In estudio de pequeflas sociedades de ahorro y r>ristamo aportó la siguiente infor-
mación financiera :
Eíerc1c1os de repaso pNa los capítulos 2 y 3 123
X2
x, Precio X1 X~ Xs
Centavos normal Tipo Ventas Ventas en fa
de descuento (centavos) de carne normales semana de cupones
29 379 1 37.000 42.000
19 109 2 67,200 79.900
50 399 1 21 .200 32,SOO
25 199 s 11,600 12.900
59 209 4 18.800 22.800
100 379 1 37,000 51.300
20 109 2 67.200 1!3. 100
40 229 3 l:?.000 13.200
79 199 21.200 36,000
50 2()9 4 18,800 20.100
29 109 2 67,200 83.900
30 379 1 37.000 40.900
50 229 3 12,000 14.100
124 l UN PRIMER VISTAZO A LA PROBABILIDAD
Deducciones: o 1 2 3 4 5 6
7 8 9 10 11 12
Frecuencia: 201 287 364 332 151 97 52
28 11 5 2 o 3
a. F.ncuentre la media del número de deducciones.
b. Encuentre la desviación estándar. ¿llabrá mucha diferencia si los d:itos se consi-
deran como una muestra en vez de una población?
c. ¿Da buen resultado Ja regla empírica con los datos que se encuentran a una des-
viación estándar de Ja media?
RI~ En el ejercicio RIJ se ha seleccionado al a1ar una form3 W-4.
a. ¿Cuál es la probabilidad de que en ella se pida al menoi; una deducción?
b. Si en la forma se pide al menos una deducción, ¿cuál es la probabilidad de que
en ella se exijan como máximo tres?
K15 Se han reunido datos acerca de las remuncrociones (s:ilario m:is bonos) de una
muestra de gerentes subaltemos, tanto hombres como mujeres, en una compailía.
Los datos (en miles de dólares por aoo) son
E1erc1cios de repaso para los capítulos 2 y ) 125
1larina
anterior Tiempo
Mai1 IOO 11.0 11.5 9.5 10.0 12 5 8.5 9.0 100 105
11.5 13.0 9.5 16.5 14.5 11.0 10.5 10.0 11.0 15.0
Avena 13.5 11.0 10.0 11.5 12.0 10.5 11.0 16.5 13.0 190
12.5 17.0 11.0 13.5 12.0 11 o 13.5 15.0
Trigo 28 o 31.0 33.0 350 30.0 2K.5 27.5 26.5 32.0 240
30.5 32.0 31.5 40 5 31.0 no 30.5 33.0 28.S 47.5
31 o 33.5 35.0 33.5 30.0 36.5 39 5 29.0 30.5
a. Trace diagramas apropiados para los tres grupos de tiempos. ¿Cual es la distribu-
ción general de los datos?
b. Calcule las medias y las medianas para los tres grupos de tiempos. <.Confirma Ja
relación entre las medias y las medianas calcul<idas su juicio acerca de cada
distribución?
R:?O En el ejercicio Rl9, calcule la media y la mediana de las muestras combinadas. ¿F..s
ésta una cifra razonable para resumir el tiempo típico de limpieza?
CAP Í T U L O
VARIABLES ALEATORIAS
4 ' ,
Y DISTRIBUCION DE
PROBABILIDAD ES
Por ejemplo,
. 1 1 l 3
P(Y = 2) = P(H HT) + P(HTH ) + P(l H Hl = S+ g + S = 8
Dado up espacio muestra! S, una variable aleatoria es una regla (función) que asig-
na un 'alor numérico a cada res ultado de S.
•
En la práctica no es necesario seguir la definición formal con mucho apego.
Cuando se fijan los valores y las probabilidades de una variahle aleotoría, implíci-
tamente se define un espacio muestra!: los valores mismos. Por ejemplo, un espacio
muestra! perfectamente 'álido pora el lonz.imiento de la moneda es S - {O. 1. 2, 3},
l.uponiendo las mismas probabilidades 118. 3/8, 3/8 y 118. No existe la necesidad
lógica de hacer algo más que especificar los valores posibles y sus probabilidades.
a menos que convenga primero hacer una lista de todos los resultados.
Se acostumbra representar las variables aleatorias con letras mayúsculas del
final del alfabeto. 01! este modo, podemos definir X - número de caras observadas
en tres lanL.amientos de una moneda e Y~ número de individuos inscritos en la aso-
ciación de teatro, en una muestra aleatoria de 200 personas. Los valores posihles de
una variable aleatoria se denotan usualmente con la letra minúscula com:spondien-
te; digamos que .t puede ser O, 1, 2 o 3 e y puede ser O. 1, 2, ... , 200. La sutil dis-
tinción entre Y, la variable aleatoria en sí, e y, uno de sus valores posibles, se hnce
clara con la práctica.
EJEMPLO 4. 1 Suponga que se va a seleccionar una muestra aleatoria de dos perl.onas de una po-
blación muy grande formada por un 30% de individuos inscritos en la asociación de
teatro y un 70% de no inscritos.
a. Hagn uno lista de los resultados que integran el espacio muestra!.
b. Asigne probabilidades.
c. Defino la variable aleatoria cuantitativa Y como el número <le individuos
inscritos en la asociación de teatro en la muestra. Especifique los valores
que la \arbble alentoria puede tomar y determine lo probabilidad <le cada
uno de ellos.
b. Del enunciodo del problema sabemos que P(S) = 0.3 y P(N) - 0.7. Bajo la
h1¡x)tes11. de que los resultadoc; paro las dos personas de la muestra son independien-
tes, tenemos lal. '>Íguientcs probabilidodes a1.ociadas a los cuatro resultados:
IN.NI 49 o 49
(N.S)
IS.NI
(S.SI
.21
.21
.09
:)
2
.42
.09
•
'ari<thko¡ ~ilrato 1lasta ahora sólo hemos considerado variables aleatorias di.,er ctas: sus posi-
ria" ti io¡rrrta'i ~ bles valores son distintos y separados, como Oo 1 o 2 o 3. En ocasiones, es más útil
continua\i pensar que las variables aleatorias son continuas : sus valores posibles forman un
intervalo (un continuo numérico). Por ejemplo, el rendimiento anual por cada dólar
invertido en una acción ordinaria puede variar desde cero hasta un valor bastante
grande. En la práctica, virtualmente todas las variables aleatorias adoptnn un con-
junto discreto de valores; el rendimiento por cada dólar en una inversión de un mi-
llón de dólares en acciones ordinarias podría ser 1.06219423 o 1.06219424 o
l .062 l 9.i25 o .... Ahora bien, cuando hay muchos valores posibles para una varia-
ble aleatoria, suele ser muy útil. desde un punto de vista matemático, tratarla como
si fuese continua. De hecho, una de las especificaciones teóricas más imponantes de
la probabilidad, la distribución normal con fonna de campana, en rigor sólo se apli-
ca a variahles aleatorias continuas. En la sección 4.2 definimos pane del lenguaje y
de la notación para las variables aleatorias discretas. En la sección 4.3, extendemos
estas ideos a las variables aleatorias continuas.
} Pr(}') - 1
l~l>
'
3. Como los distintos valores de Y son eventos mutuamente excluyentes, sus
probabilidades son aditivas. Es decir.
PCY ==a o Y= b) = Pr(a) + Pr(b)
y o 2 3
P,fy) 1/ 8 3/8 3/8 1/ 8
y o 2 3
3. 2. 1 1 1 3. 2. 1 1 3 3·2·1 1 3 3. 2. 1 1 1
Pr(J')
( 1)(3 . 2 . 1) 8 8 (J)U-li 8 = 8 (2. 1)(1) 8 = 8 (3 . 2 . 1)(1) 8 8
3/8
1/8
. y
o 2 3
FIGURA4.I Gráfica de Py (y) para el experimento de lanzar una moneda
'4 2 D1nnb~IÓll de probab1hdades de vanables alea.ton;u dtscreta.1 . ~<
~~ •. "
,
'#
~31 . • •
y o 2 3
P,(y) 1/8 3/8 3/8 1/8
F,(y) 1/8 4/8 7/8 8/8
y o 2 3 4 6 7 8
F,(y) 001 .003 .006 .011 024 061 .139 .224 .336
y 9 10 11 12 13 14 15 16 17
F.(y) .5 10 .672 .782 .870 .925 964 .988 .997 1()(Xl
Suponga que al comenzar un dia el hospital tiene disponibles 14 camas para el cui-
dado de enfennos coronarios. La probabilidad de que el número de casos nuevos Y
sea menor o igual a 14 se puede leer directamente de la tnbla como 0.964. Encontrar
la probabilidad de que Y sea mayor o igual que 15 es también bastante sencillo:
P( r ~ 15) .,. 1 - P( Y s 14) = 1 - O. 964 = 0.036. Si la tabla se hubiese elaborado
en ténnmos de probabilidades individuales P(y), habría sido necesario sumar mu-
chas entradas para encontrar estas probabilidades.
El uso general de las tablas para Ja fd es mu} fácil si usted traza un histogra-
ma. En la figura 4.2 se muestra uno de ellos para el ejemplo del cuidado de enfennos
132 4 VARIABLES ALEATORIAS Y OISTRJBUCION DE PROBABILIDADES
p f (y)
15
10
o 1 2 a 4 s 6 1 e g 10 11 12 13 14 1s 16 11
FIGURA 4.2 Histograma para el e1emplo del cuidado de enfermos coronarios
coronarios; la probabilidad P y(v) de cada valor particular y está indicada por la al-
tura del rectángulo que se halla por encama del valor y.
Por ejemplo, suponga que queremos saber el valor de P(7 $Y$ 12). Buscamos
la suma de las ár~as de los rectángulos por encima de y= 7, 8, 9, 1O, 11 y 12, la re-
gión sombreada en la figura 4.2. F 1{ 12) es el área de todos los rectángulos por enci-
ma de y= O, 1, ... , 12. Para encontrar P(7 ~ Y~ 12) debemos sustraer el área de los
rectángulos por encima de y= O, 1, 2, 3. 4, 5 y 6, es decir, restar F t<6) de F r< 12):
P(7 S: Y S: 12) = Fr(12) - fr(6) ,;,, .870 - .139 = .731
En general, siempre que usted quiera utili?.ar tablas para calcular probabilidades. es
útil trazar un histograma.
EJEMPLO 4.2 Suponga que una compai'lía de cosméticos planea elaborar un nuevo perfume. El
gerente de producto ha estimado las siguientes probabilidades subjetivas para las
ventas del primer ai\o (denor.adas con X) en millones de botellas:
X 0 2 J 4 5 6 7 8
F,r(X) .05 .20 .40 60 .75 85 .90 .95 1.00
a. P(X ~ 5)
b. P(2 S: X S: 4)
c. P(X S: 1) •
Secciones '4 1 y 4.2 E1erc1c1os 133
Solucíón En la figura 4.3 se muestra un histograma para este ejemplo. Las áreas relevantes
para cada problema están indicadas con a, by c.
a. P(X ~ 5) =1- P(X ~ 4) = 1.00 - .75 = .25
El área. total es l.00 (es decir, el área de todos los rectángulos). Debemos restar la.s
áreas de los rectángulos desde el principio hasta x =4.
b. Para obtener P(2 S X$ 4 ), sustraiga las áreas correspondientes ax = O, 1 de
las áreas correspondientes ax = O. l, 2, 3 y 4;
P(2 ~X~ 4) = F.r(4) - F.r(I) = .75 - .20 = .55
c. Por definición, P(X S 1) = FJ..1) = 0.20; no es necesaria. ninguna
sustracción. •
.20
.15 - -
b b b
.10 ,_
.05 -
e e a a a a
o 2 3 4 5 6 7 e
FIGURA 4.3 Histograma para el ejemplo 4.2
134 '4 VARIABLES ALEATORIAS Y DISTRIBUCIÓN DE PROBA81LIDADES
a. Constru)a un histograma.
b. l:.ncuentre P(Y S 2).
c, Encuentre P( r ~ 7).
d. Encuentre P( 1 ~ r $ 5).
4.5 En el ejercicio 4.4. calcule la fd correspondiente a P y()•). Use esta fd para encontrar
P(YS 2), P(Y ~7) y P(I ~Y!> 5).
4 .6 La demanda semanal X de copias de un procesador de textos en una tiend:i de soft-
ware tiene la siguiente distribución de probabilidades·
x: o 2 3 4 5 6 1 11 9 10
PJ'(T): .06 .14 .16 .14 .12 .10 08 .07 06 04 .oJ
Py (y)
1
TO'
o 2 3 4 5 6 7 8 9
1
10(f
o' 02 03 04 05 . . . 96 97 98 99
A medida que refinamos este proceso: considerando los primeros tres d1gitos,
dcspu¿s los cuatro primeros,) así succsi\amcnte, obtcndn:mo~ rectángulo!> cada \C7
más delgados. Muy pronto (matemáticamente. en el limite) los rectángulos desapa·
recen y se fonna una mancha continua.
EJEMPLO 4.3 Suponga que el gerente de personal de un supennercado mide el tiempo real Y de tra·
bajo semanal de los empleados. Consuuya histogramas que indiquen la distribución
de probabilidades de Y cuando las medidas se redondean a
a. la hora más cercana;
b. los 1O minutos más cercanos;
c. el segundo más cercano.
Solución a. Suponga una semana laboral nominal de .io horas, con tiempos extra práctica·
mente nulos. El histograma correspondiente a la hora más cercana puede tener un as·
pecto como el de la figura 4.6a.
b. El histograma correspondiente a los 1O minutos más próximos puede tener
el aspecto de la figura 4.6b.
c. Por razones prácticas, el histograma correspondiente ni segundo más cerca-
no tendría el aspecto de la figura 4.6c. •
136 4 VARIABLES ALEATORIAS Y DISTRIBUCION DE PROBABILIDADES
Py (y)
y
36 37 38 39 40 41 42 43 44 45 46 47
Py (y) (a)
(b)
Py (y)
y
(e)
EJEMPLO 4.4 Suponga que el gerente del departamento de reservaciones de una linea aérea supo-
ne que el tiempo T (medido en minutos) entre dos llamadas telefónicas consecuti-
vas al centro de reservaciones es una variable aleatoria continua con fü
a. P(T?: 5)
b. P(2 ~ T~ 4)
c. P(T ~ 1)
Solución Las tres partes de este ejemplo parecen idénticas a las del ejemplo 4.2. No obstan-
te, en virtud de que Tes continua, el procedimiento de solución es distinto al del
ejemplo 4.2.
~
= 1 - e- 2l•> = .865
•
La función de distribución F tiene el mismo significado para las\ ariables alea-
torias continuas y discretas. Para cualquier variable aleatoria Y, F>(.r) = P( Y$ y).
Para las variables aleatorias continuas hay otra función, la función de densidad, que
es ampliamente utilizada. Para una variable aleatoria Y. la función de densidad se
denota con f >ü ). Grosso modo es el análogo de la distribución de probabilidades
!\~')definida para las' ariables aleatorias discretas, en el sentido de que mide cómo
M! cncucnlra dispersa (distribuida) la probabilidad en el rango de valores posibles de
la variable aleatoria. No obstante, para una variable aleatoria continua Y, la proba-
bilidad de que r sea exactamente igual a un número particular es cero. La función de
densidad no proporciona probabilidades directamente. En vez de ello. esta función
define una curva lisa y la probabilidad se calcula como el área bajo la curva, utili-
1..ando el cálculo integral. Si se conocen tanto la fd, F>{l"), como la función de densi-
dad />(.r), podemos calcular de dos manerai. la probabilidad de que Y se encuentre
entre los números a y h.
l'{tl $ Y S h) = Fr(h) - Fr(ut
o
P(a S }' $ b) = f' fr(y)dy
La proliabilidad de que X sea mayor que 0.9 puede calcul::irse integrando la función
de densidad sobre la región 0.9 S .r S 1, pues X no puede ser ma)or que 1
P(.9 <X)= J: 1
21(20)x "(1 - x)d.'<
= L 21(20)(x
19
- x 2º)dx
= 1 - .3647 = .6353
como ya habíamos encontrado.
EJEMPLO 4.5 Se puede demostrar que la función de densidad de la variable aleatoria T del ejem-
plo 4.4 es
f r(t) - 2e
2
'. t ~O
Calcule la probabilidad de que T se encuentre entre 2 y 4 utilizando esta función de
densidad.
Solucion Para resolver este problema. habremos de recurrir a un resultado del c::ílculo ele-
mental que establece que la integral ind<!finida de ce '"' es - e·'"'. De acuerdo con
lo anterior
'4 3 Oisrrit>uoón de pt'Obabdidadel de variables &lutonu cOl\tlnuu ( f/, J ) 139
, 2 3 4 5
FIGURA 4.7 Área (probabilidad) encontrada en el ejemplo 4.5
P(2 ~ T ~ 4) -= f: 2
2e- 'dt = -e- 2 '1~
= - .000335 - (- .018316) ... 0180
en el caso continuo
140 4 VARIABLES ALEATORIAS Y OISTRIBUCION DE PROBABILIDADES
J\I efectuar la integración. hay que tener la precaución de excluir aquellas regiones
en donde la variable aleatoria no puede ocurrir y por consiguiente la función de
densidad.ies igual a cero. Si por definición una variable aleatoria X es no negativa.
la probabilidad de que sea menor que cero (es decir. J0 -f~x)dx), es cero.
EJEMPLO 4.6 Demuestre que la función de densidad que se dio en el ejemplo .i.s proporciona la
fd del ejemplo 4.4.
Solucion Observ:imos en primer lugar que T, al ser una medida del tiempo transcurrido, no
puede ser negativa. Por consiguiente, la función de densidad de T debe ser cero
para todos los valores t <O. En el ejemplo 4.5 est:lblecimos que la función de den·
sidad de Tes /.,{t) - 2e 2', para t > O. Por consiguiente,
-e -21·1,0
F7 (t) =
=
f '2e
0
l -
ll"d.
e-21
t - = -e - 21 - ( - 1)
4.8 Ciena sociedad de beneficencia est.á planeando una campai\a direcl:i por correo. Se
considera que la fracción r de quienes no re$ponden es una variable ale:itoria con-
tinua con la sisuiente fd:
o !>; y s; 1
a. Calcule Ft{v) para distintos valores de y entre O y 1. Represente graficamente la
función Ftü').
b. Utilice la grálic:i de F1~y) para calcular P( )'SO 8). /'(}'>O 6) > P(0.5 ~ r~ 0.9).
4.9 llna compai\ia de procesamiento de datos tiene una macrocomputadora, a la cual se
accede a través de un gran número de terminales remot:is. lln modelo razonable de
probabilidad para el tiempo Y (en minutos) tr:inscurrido entre: cnvios sucesivos de
los trabajos a la computadora supone que
F,(y) 1- ,-.s,, Os;y<oo
:i. Calcule los .,.:ilores numéricos de Ft(>') para y 1.0, 2.0, ...• hasta que F ~y) ex-
ceda de 0.98 aproximadamente. Trace una gráfica de F 1ü•) con respecto a v
b. Utilice la gr.ífica de F .,(r) para encontrar PO s O. 75). Pf. Y "2: 4 0) y P(2.0 ~ Y~ 3.S).
I
4 'I Valor esperado. var1111za y desv1ac16n en6ndar o tip1a. vv1ables aleatornu discretas 14 1
a. Calcule ¡.¡,y) para varios valores de y (tales como O. 0.25. 0.50, ... ) y trace una
gráfica de/1.(J•) con respecto ay.
b. Encuentre P( Y~ 1.50). Pf. Y 2' 2.00) y P( l $ Y$ 2.50).
c. Encuentre F 1(v) y represéntela gráficamente.
4. I'.! Una casa de corretaje tiene una macrocomputadora en la que proces:i todas sus tran-
sacciones. El tiempo de máquina sobrante se vende a otras compai\ios. Para deter-
minar qué cantidad de tiempo se puede \<ender, la compañia estudió la distrihución
de Y= tiempo de computadora (en minutos) necesario cada día para procesar sus
propias transacciones. Una buena aproximación de l:i densidad de Y es
/,(y)= .0009375[40 - .l(y - 100) 2 ] , para 80 <y< 120
= O. fuera de 80 < _.. < 120
Definición de E(Y)
Para una variable aleatorin discreta Y con distribución de probabilidades P 1{y), el
'alor esperado de Yes
E(Y) = ~ yP,(y)
teda.,
Para encontrar E( Y), tome cada valor posible de y, multiplique lo (péselo, pondérelo)
por la probabilidad ~uc le corresponde P1~y) y sume los resultados.
EJEMPLO 4 . 7 Una cmprc'>a con-.1derados 1mersiones posibles Como apro"mac1on inicinl. asigna
probabilidades (subjeti\ as) n cada uno de los siguientes eventos: ~rder un 20% por
cada dólar imcrlldo, p<rdcr un 100/o, ni ganar ni perder, gnnar un 1Oºó y ganar un
20%. Sea Y el rendimiento por cada dólar im en1do en el pnmer pro) ccto ~ /el ren-
dimiento por coda dólar invenido en el segundo. Las probahilicbdcs :is1gnada.., son
Calcule los rendimientos esperndos por cadn dólnr invertido en cadn proyecto.
¿Cuál proyecto le parece a usted que rcprcsentn l::i inversión más atractiva?
Solución El proyecto Y. de acuerdo con cualquier estándar razonable. parece meno-. atracti-
vo. Resulta igualmente posible perder un 20% que ganarlo, o gan::ir un 10% que
perderlo. El proyecto Z ofrece mayores posibilidndes de gnn:ir un 1O o un 20% y
relat1vnmentc poca.e; de perder.
Cálculos:
EJEMPLO 4 8 Suponga que una población consiste en los siguientes valores y frecuencias aso-
ciadas:
Valor· 1000 :?000 3000 4000
Frecuencia· 80 60 40 :!O
(N ... 2001
El valor esperado es
E(Y) = 1000(.4) + 2000(.3) + 3000(.2) + 4000())
- 400 + 600 + 600 + 400 = 2000
E( Y) es exactamente igual a la media poblacional. •
Hasta ahora hemos analtU1do las distintas interpretaciones asociadas con el va-
lor esperado de una variable aleatoria discreta. Otra\ cnraclcri,tica\ igualmente
1mportunlc\ de una \aria ble alealoria tfücrcla ~o n Ja urianu )' la dC!I\ i:1ri(111
'arian1a d e una C\tandar, que miden la tJi'\pcr,ii>n de las prohahilidadc' o uriabilidatJ de una
'ariahlc :ale:uoria \itriahlc aleatoria. La varianza de una 'anahh.· ah:aloria), \'M( ~).e' el promedio
<focrct :i pondorado con probabilidades de las dl!sviaeiones cuadráticas con respecto a la me-
dia (valor esperado).
Definición de Var(Y) y ay
Si Y es una variable aleatoria discreta
rsy "Var( Y)
Para calcular Var( Y}, tome cada valor J' sustraiga el valor esperado µ r =E( Y), ele-
ve al cuadrado el resultado, multiplique por P¡(v) y ~ume .
SoluCIÓn En dicho ejemplo tenemos que µr= E(Y) =O y µL- E(Z) = 0.11'1. Un par de tablas
nos muestran los c:llculos requeridos.
Var(Y) =[
lodo y
y 2Pr(Y) - µ:. donde µy = E( Y)
Podemos elevar al cuadrado los valores originales, ponderar con l\O') y sumar. Al
final de dicha operación sustraemos el cuadrado de la media (valor esperado) para
obtener la varianza.
EJEMPLO 4.1 O Use la tOrmula abreviada para repetir el cálculo de las varian7.as del ejemplo 4 .9.
: Pz(z) :l z 2Pz(Z)
Tome cada valor y, multiplique (pondere) por Ja función de dcnsid:id /.,.(y), e inte-
gre (en vez de sumar). Las cuestiones técnicas no deberían oscurecer el hecho de
4S Valor csperado,vwianza y desviac16n esúndar: vr1ables aleatori• contmuat ( /) 147
EJEMPLO 4 . 11 Encuentre E(1). donde Tes el 1icmpo entre llamadas del ejemplo 4.4 y f .,(t) = le-21,
12 O. ¿Cuál es la interpretación de e~te valor?
Solución Implícitamente, f ¡{t) - O para / <O, pues / <O es imposible en este contexto. Es ne-
cesario saber que
«; 1
Jo re- <1 dt = l
e
Et T) J_"'~ tfrhl de
= 2 Iz. re 2'dt
= 2(.:._)
2 2
=1
2
Como Tes el tiempo que transcurre entre dos llamadas consecutivas, E( T) - 112
significa que, en el límite, M! recibe una llamada telefónica cada medio minuto. •
EJEMPLO 4.1 2 Encuentre Var(n donde Tes la variable definida en los ejemplos 4.4 y 4.11. Se
sabe que / 0 t 2 e •' dt =2 / c 1 •
Solución "
lltilice la fürmula abreviada y observe que se puede integrar de O a oo, puesf¡{I) =O
para f < O. En el ejemplo 4.11 encontramos que µr -- E(1) - 1/2.
Var(T) t. t 2fr(t)dt - µ}
= 2f.., t 2 r - 2'dt 4
11
1 1
-
4
::::
2 4 4
•
SECCIONES 4.4 Y 4.5 EJE RCICIOS
a. Construya un histograma.
b. C:;ilcule el 'alor e~pcrado de Y.
c . Marque E(>) en el histograma. ¿Cómo afecla la form;i del histograma a E()")?
4.17 Remítase al ejercicio 4. 16.
;i. Calcule la des\ iación estánd3r de Y. Use la definición
b. lJc;e el mttodo abre .. iado para c3Jcul;ir CJ,-
4. 18 Remrtase al ejercicio 4.16. ¿Cuál es la probabilid;id real de que }' difiera de Jl 1 en
menos de una desviación estándar? ¿Por qué difiere esta probabilidad de la estima-
ción que no-; d3 la regla empírica?
4 . 19 l na ~icdad de inversiones está tratando de decidir cuál de dos edilicios de apar-
tamentos comprar. cada uno con un valor de $200,000 dólares. Un asesor estima 13s
sii;urentcs prohahilid:ides par3 el rendimiento neto en 5 ar'ios (en m1lec; de dólares):
o 2 3 4 5 7 8 9 IO
.06 . 14 .16 .14 .12 .10 .01 06 04 ()~
a. Encuentre la media de X.
b. Utilice 13 delinición para calcular Ja varianza de X.
c. Utilice el método abreviado y vuelva a calcular la varianza de X.
-1.22 En el ejercicio 4.21. cakule la probabilidad de que X se encuentre a menos de dos
desviaciones estándar de su media. ¿,Cómo se compara esta probabilidad con los va-
~res teóricos que nos dan la regla empfrica >- la desigualdad de Chcbyshev':'
f 0 - n el ejercicio 4.14 definimos
4.'.!8 El fabricante del ejercicio 4.26 podría re<>rganiiar sus recursos de modo que el 9'.!º~
de las controladoras pasasen la primera prueba sin tener que ser reelahoradac; Sin
.tmbargo, de a4uellas rech;vadas en Ja primera prueh:i. st'>lo d <10° o la pasaría dcs-
rués de rehacerlas una vez. De aquellas controladoras que follac;en después de ser
rcelaboradas una ver.. sólo el 80% pasaría la prueha después de ser reproce~adas una
segunda vez (y el resto serian desmontadas).
a. ¡,Cómo alteran estos cambios la distribución de probabilidades del ejercicio 4.26?
b . .,Cómo cambia la probabilidad de que una máquina seoi desmontada'.'
c. i.lncrcmcnl4ln estos cambios el valor esperado de Y que se encontró en el c.1crcicio
4 '.!7. o lo reducen'! Vuelva a calcular el valor esperado para verificar su respuesta.
4.'.!9 Una compal\ía que vende articulos de oficina detenta el JOºó del mercado de ahastt:-
ci micnto de oficinas de gobierno suburbana.e;. Esu participación en el mercado ha sido
bastante estable y no hay ninguna ra7Ón para pensar que h.ibrj de cambiar La comp:i·
ilía tiene tres importantes licit.iciones en puena, preparadas de acuerdo con su proce-
dimiento estándar. Sea r el nümcro de alertas de la eompa"ía que sun aceptadas.
a Encuentre la distribución de probabilidad de Y.
b. ¿Qué h1pótes1s hizo usted al responder al inciso (a)? ¿Es alguna de ellas clara·
mente irrazonahle?
4.30 En el ejercicio 4.29, encuentre el valor esperado y la \arian/a de Y.
4.31 Si la compailia del ejercicio 4.'.!9 pierde en l:i primera liciL'.!.ción. se puede SU!'<mcr que
esto es sella) de que un competidor está reduciendo sus precios y que lo más pruh:ible
es que también pierda las otras ofertas. Análogamente. si la compa1'ía ganil en la pri-
mera licit;:ición, esto seria una sc"al de que los competidores ec;t:in tr:>tando de mejo-
rar sus márgenes de ganancia y que lo mác; probable es que tambicn gane lm; otros
concursos. Si los argumentos son correctos ~ ambos c:isos balancean al JOº o la parti-
cipación de la compal\fa en el mercado, ¡,se incrcment.in o reducen el valor esrcrado
y la varianz.a de Y comparados con los valores calculados en el ejercicio 4 ..lO'!
/ 4.32 Una compailia se dedica a rcnO\ ar edificios históricos cnnvirtiéndolos en aparta-
mentos de lujo. La compañía invita a inversionistas particul:ires a que comprc:n ac-
ciones de un edificio particular; los accionistas pueden revender sus acciones a la
compaMa después de dos años. El precio de una acción al lcrmino de do~ a11os de-
pende de di\crsos factores, destacando entre ellos el monto de las t:is:i~ de interés y
l:i demanda de apartamentos. La compal\ia estima que fa distribución de probabili-
dades de X. el rendimiento neto por acción después de dos años. es
b. l loy en día. un in\ crsiomsta podría adquirir un pagaré dd tesoro que le daria un
rend1m1ento neto de 0.176 al término de dos años Si la in\ crsion en los .iparta-
mentos ha de ser atractiva. la probabilidad de alcan1:1r un rendimiento ma) or que
0. 176 deber:i ser grande. Con la distrihución de rrobabilidadcs e st imada. ¿lo es
realmente?
/ 4.33 a. Encuentre el valor esperado de X en el ejercicio 4.32. ¿Cu:il es el s ignilicado
económico de este número~ La parte motcm:it1ca puede simpli licarse si usted
'I
1
'
I St
considera Y - X+ J ~ recuerda que la integral de: OJ tntinllo de ,>t.' <• e~ k' e'·•': f..J ·¿
"alor c~pc:r.i.do de X se puede detcm1inar a partir del de Y.
b. Encuentre la \arian1..a de X en el ejercicio 4.32. Quizá usted quiera trabajar con
y X+ l.
c. Suponga que un inversionista tiene otra inversión, digamos W, que tiene un valor
esperado (en el mismo periodo de tiempo) de 0.24 y una variani'a de O 30. ¿Se-
gún su npinión. que in\ersión es más probable que escoja el inversionista'!
En las s1:cciones 4.2 y 4.3 desarrollamos el lenguaje básico para tratar con una va-
•
riable aleatoria. En esta sección extendemos dicho lenguajt! para tratar con distribu-
ciont!S de probabilidades conjuntas de dos variables aleatorias X t! Y. Ddinimos
todos los conceptos en términos dt! dos variables aleatorias discretas. Quicnes ten-
g:m conocimientos de cálculo deberían ser capaces dt! deducir los análogos para va-
ri<1bles aleatorias continuas.
Cuando 1ra1amos con dos variables aleatorias X e Y, es conveniente trabajar
con probabilidades conjuntas. En el capitulo 3 la p ro hi& hilid ad conjunta de los
eventos A y B era la probabilidad dt! la mtcrsccc1on />(A /J). Sc.i A el evento X - x
d b tribución de y 13 el c\ento Y"'" y. Defina la distribución de probab ilida d c!I conjunta Pn ( \, 1 ).
probabilidad e\ como una función que proporciona la prohahilldn<l conjunw para cada pareja de \.l-
conjuntu lores x ey.
EJEMPLO 4. 13 Suponga que en la sala de emergencias de un pequeño hospital, los casos más se-
rios comprenden ataques coronarios y traumas (heridas causadas por actos de vio-
lencia o accidentes severos). De tina X= número de casos de coronarias e
Y = número de casos de traumas que llegan por la noche t!n un dia particular entre
:.emana. Se supone que
(Jt + J)(y + 2)
P..,(x, }') = 84 • .~ = º· l. 2; }' = º· l. 2. )
Calcule una tabla numérica dt! probabilidades conjuntas.
Solución Simplemente sustituya los valores deseados x e y para obtener las probabilidades
conjuntas: Pn(O, )) - P(X= O e Y = 3) = (0 1 1)(3 + 2)184 = 5/84, y asi sucesiva-
mente. A continuación mostramos una tabla de la distribución de probabilidades
conjuntas PS)(:c, y):
y
o 2 3
o 2 84 3 84 4 84 5 ll4
4 84 6 84 8 84 10 84
6 84 9 84 12 84 IS 84
152 '4 VARIABLES ALEATORIAS Y DISTRIBUCION DE PROBABILIDADES
Solución Sume a lo largo de las lilas para obtener las probabilidades de X. y a lo largo de las
columnas para obtener las probabilidades de Y.
y
X o 2 ) Px(X)
o 2/84 3/84 4/84 5¡84 14/84
1 4184 6/84 8/ 84 10 84 28 184
2 6184 9 84 12/84 15 84 42 84
Pr< y) 12 84 18 84 24 84 30 84
Esta idea se puede expresar con una fónnula. Para encontrar la probabilidad
P_/..x), sume las probabilidades conjuntas para ese valor de x y para cada valor
posible de y:
En este ejemplo,
P(X = 1) = L Pxr(l.y)
En este ejemplo.
P(Y = 1) = L Pxr(x, I)
coda r
- PxrCO. 1) + Pn( l. 1) + Pxr(2, 1)
J 6 9 18
= 84 + 84 + 84 = 84
<f 6 01stnbuc1on de probab1hdade5 coníunta e 1ndependenc1<1 esudí5t1ca 153
P(BIA) = P~" B)
P(A)
distribución Podcmo~ definir la dhtribución condicio11ada de Y dado que X - x como
coudídonad:t
Prr.r(Ylx)
Así, para cualquier valor de Y
P(X =X ri Y= y)
P(Y""' YIX = x) = P(X = .x)
Pxr(x,y)
=---
P,r(x)
EJEMPLO 4.1 S En Jos ejemplos 4.13 y 4. J4, demuestre que X e Y son independientes.
• Ahora podemos ellplicar por qué utilizamos la notación aparentemente redundante PJ..x), Py(JI). Si sólo
cscribíéKmos .P(x) o .P(v), no sabrfamo$$i P( 1) significa P(X; 1); PJ..1) o P( Y"' 1) - P,( 1).
154 '4 VARIABLES ALEATORIAS Y OISTRIBUCION DE PROBABILIDADES
Dcspués de reducir las fracciones en esta tabla. encontramos que cada valor en ella
r
es igual al valor de Pn{x, y) del ejemplo 4. 13. Por lo tanto, l\""x. y)= ,~' )/> 1{yl
par.s totb :e e y; es decir, X e Y son independientes. •
l:.n la forma matemática de esta P n{r, 1·) particular !>e hace valer la hipótesis
de independencia. En la práctica, a menudo suponemos que X e Y son indcpendien·
les; una vc1. c~pccificados l\{l) y P,.(y). Tal hipótesis nos permite calcular />.11~x.
_\')como el producto !\{.\ J/'¡(r). El ejemplo 4.1 J es una situación en la cual la hi-
pótesis de independencia parece raLonable. El número de casos de coronaria~ que
llegan a la sala de emergencias no tiene ninguna relevancia para predecir el núme-
ro de casos de traumas
En la sección 3.6 discutimos cómo las prohabilidades a priori de \arios esta·
dos naturales se pueden modificar con las probab1l1Jades de e' entos observables
utiliz.:indo el teorema de B:t)es. Algunas \Cccs los estados naturales y los eventos
observables son de naturale1.a numérica, de modo que las ideas de promedio y 'a-
riahilidad tienen sentido. En tales casos, es útil escribir t:l teorcma de Uayes en la
notación <le l::is '::iriablcs aleatorias. Por ejemplo, el agente de un escritor de nove·
las con gran i!xito Je \'entas (he.~/ .vdlers) quiere estimar la cantidad que deberá re·
dir por los derechos de edición de un::i novela reciente. Bas:indo'>e en experiencias
pasadas y en las tendencias recientes de la industria de Jos lihros de bolsillo, el
agente considera que la c:inudad podría ser de S 100,000, S 150,000, $200,000 o
S::!5U.OOO, con probabilidades respectivas de 0.4, 0.3, 0.2 y 0.1. armximadamente
El agente se mantiene mfonnado de las comprns de una cadena de librcrias cuyo
gerente de adquisiciones suele predecir con mucha certe/..a los éxitos comerciales.
Las compras de la cadena de librerías son compras de 10.000, 20,000 o 30,000
ejemplares; el agente piensa que las probabilidades de cada una de estas compras.
dado el eventual precio por los derechos, de~rian ser más o meno~ las siguientes:
Con base en estas probabilidades a priori , el valor esperado del precio por derechos
de edición es S100,000(0.4) + $ 150,000(0.3) • $200,000(0.2) -+ $250,000(0.1) -
S 150,000. Suponga ahora que la cadena de librerías pide 30,000 copias; esta nota
de optimismo lleva al agente a revisar las probabilidades a priori. De acuerdo con el
teorema de Baycs (o, lo que es lo mismo, con el cálculo de un á~bol de probabilidad)
(.10)(.4)
=-(.10)(.4)
-------------
+ (.20)(.3) + (.30)(.2) + (.40)(.1)
= .20
Cálculos similares nos muestran que P(S 150,000130,000) =OJO, ~$200 ,000 l 30,000)
= 0.30y?($250,000 130,000) - 0.20. Utilizando estas probabilidades a postcriori, el
\ alor esperado del precio es ahora $100,000(0.20) ~ S 150.000(0.30) 1 $200,000(0.30) '
$250,000(0.20) = S 175,000. Como consecuencia de una orden de compra tan optimis-
ta, el valor esperado de los derechos se ha incrementado.
4.34 Un fabricante de televisores tiene a Ja venta dos modelos. Defina X ventas del mo-
delo A el próximo mes de diciembre (en cientos de miles) e } \entas del modelo B
el próximo mes de diciembre. El consejo de administración estima que las probabi-
lidades conjuntas P_n(x, y) son
y
2 3 4
"1 .030 .055 .070 .075
2 055 .070 .075 .070
3 .070 .075 .070 .oss
4 .075 .070 .055 .030
x: o 1 2 3 4
P,.(.x): . 10 40 .25 .20 05
y: o 1 2 3 4 5
P,(y): .10 .)0 .25 .20 .10 .05
a. Suponiendo que X e Y son independientes, calcule la di stribución de probabilida-
des conjunta P.nf.x, y).
b. Verifique sus cálculos encontr.i.ndo las probabilidades marginales /'_./..x) y Pi-{y).
4.3 7 ¿Cree usted que la independencia es una hipótesis ro1.onable en el ejercicio 4.36?
4.38 Una compaf\la de asesorías en administración de empresas presenta s us ofertas por
escrito y oralmente en un esfuerzo para obtener nuevos contratos. Los archivos indi-
can que la distribución de probabilidades P.n<x. y ) de X - número de ofertas orale5
en una semana e Y - número de ofertas por escrito en esa semana, está dada por la
siguiente tabla:
y
X o 2 3 4
o 010 .015 030 075 oso
020 030 045 060 040
2 .030 045 100 045 030
3 040 060 045 030 020
4 050 075 030 015 010
a. Encuentre la probabilidad de que en una -;emana ha) a dos ofertas orales y dos
por escrito
b. Encuentre la probabilidad de que haya exactamente dos ofertas orales y dos o me·
nos ofertas por escrito.
c. Encuentre la probabilidad de que haya dos o menos ofertas orales y dos o menos
ofertas por escrito en una 5emana
4.39 a. Utilice la distribución de probabilidades del ejercicio 4.38 para calcular las dis-
tribuciones marginales de X e Y.
b. Asumiendo estas probabilidades. ¿son X e Y indcpend1cnte<;·l
4 40 Con la distribución de probabilidades del CJerc1c1n 4 18. calcule la distribución con-
dicionada de )'para cada \.alor posible de X ¿Indican estas distribuciones condicio·
nadas que X e r son independiente~"
se pueden medir. Son muchos los tipos de dependencia que pueden tener dos varia-
bles y muchas las medidas que podemos uti lizar. Dos de ellas, la covarianza y la
correlación. son particularmente imponantes porque están íntimamente relacionadas
con el concepto de \ arianza de una variable aleatoria.
Comenzamos nuevamente con un ejemplo. Un funcionario del departamento de
crédito de un banco supone las siguientes probabilidades conjuntas (subjetivas) del
rendimiento porcentual (interés más cambio en el mercado de valores) de dos bonos
públicos. Llamemos X e Y a los rendimientos.
y
X 8 9 10 11 12 P.r(:t)
8 .oJ .04 .03 .00 .00 .JO
9 .04 .06 .06 04 .00 .20
10 .02 .08 .20 .08 .02 .40
11 00 .04 .06 06 .04 .20
12 .00 .00 .03 04 03 . JO
EJEMPLO 4. 16 Calcule Cov(X, Y) para la distribución conjunta de los rendimil!ntos <le los bonos
públicos que dimos en el caso precedente. Utilice primero la definición y verifique
después que el método abreviado da las mismas respuestas.
Cov(X, Y)
Pxr = <1.r<1r
Se sigue que
Cov(X, Y) Pu<1x<1r
EJEMPLO 4.17 Encuentre P.n para la distríbución del rendimiento de los bonos analizada anterior-
mente.
Soluc1on En el ejemplo 4.16 encontramos que Cov(X, }') = 0.60. Para obtener P.n· necesita-
mos las desviaciones estándar de X e Y, que podemos calcular a partir de las respec-
tivas probabilidades marginales. Para calcular cr; y a;
se pueden utilizar las
fónnulas de las secciones 4.4 y 4.5.
ni - Ls ."< 1Px(x) - µi
= 8 2 (.10) + 9 2 (.20) + 10 2 (.40) + 11 2 ( 20) + 12 1 (.10)-(10) 2
= 101.20 100 = 1.20
'4. 7 Covar1anu y correlac16n de variables aleatorias 159
t1: = L >·lP,(y) -
)'
µ: - 1.16
y t1y = J1.i6 - 1.077.
EJEMPLO 4. 18 Una cadena de montaje se puede detener temporalmente para ajustar partes que
se encuentran mal alineadas o corregir soldaduras defectuos:is. Los archivos de
producción indican la siguiente distribución de probabilidades conjunta para
X - número de su.spcnsiones en un turno de producción por mal nline:imiento e
Y= número de suspensiones en un tumo de producción por soldaduras defectuosas.
y
X o 2 3 4
Solución En cada caso PH~x. y)= Px(x)Py(y). Por ejemplo, P.n.<.2, 4) = 0.03 y Pxf,.2)x
P>.(.4) (0.30)(0.10) 0.03. Por consiguienle, X e Y son independientes y Cov(X, Y)
debería St!r igual a cero.
b. Al examinar las probabilidades m3rginalcs de X e Y se puede ver que µ:r = 1
y µy = 2. [)e este modo
y
X o 2 3 4
o .01 .05 .18 .OS .01 .30
.03 .10 .14 .10 .03 40
2 .06 .05 08 .05 .06 '.30
.10 20 .40 .20 . 10 100
Soluc i ón No, hay una dependencia. Por ejemplo, Px.J.O, 0) = 0.01, pero PiO)P>.(0) =
(0. 10)(0.30) =0.03. No obstante,
f ru(t, u) .02(t + l }(t + 2)( 1O - t)u'( 1 - u), o< l < 10. o < u < l
En este caso, tanto T como U son variables aleatorias continuas, como lo indica el
hecho de que varían sobre intervalos continuos O < t < 1O y O < u < 1. Así, en v~z
de encontrar la probabilidad de que T y U se encuentren en un intervalo específico
sumando probabilidades, ésta se encuentra integrando densidades.
(Parn quienes no están familiariudos con las integrales dobles: La integral se calcu-
la "de adentro hacia afuera". Asi, en la expresión anterior, la primera integral se
efectúa con respecto a y, considerando ax como una constante. Una vez que se ha
integrado con respecto a la variable y, se lleva a cabo la integral con respecto a la
variable .\.)
Por ejemplo, suponga que las variables aleatorias continuas X e Y tienen den·
sidad conjunta
= (6/ 17) tl 4y - (x ~ y)
3
J1::: dx
= 36[<·¿
5
- (.¿ 6
] - 24('·¿ 6
- (.~),]
= 0.0955, después de realizar algunos cálculos aritméticos •
48 Función de de~ coojunta ~ ...anables alHton;u continu;u !f) 163
fx(x) = f. fxr(X.}')d.v
IOd• 1
Para T tiempo requerido para preparar una licitación y U = monto <le la ofcna,
con densidad conjunta
fn:(l,u) - .02(1 + 1)(1 + 2)(10 1)u1(1 - u). O< l < 10. O< u< t
fr(I) = f_. 0
1
.02(t + 1)(1 + 2)(10 t)u'(I - 11)du
~)][: :
1
= 0.2(1 + 1)(1 + 2>( 1O - 1)[(1 11
;
1
) - (lu;
1 1
""' .02(1 + 1)(1+2)(10-11(,--) - -,- - ]
t +l , + 2)
= .02(10 - 1)
•
Podemos extender la definición de distribución d.: probabilidad condicionada
a la idea de densidad condicionada de Y dada X Así como la distribución de proba-
bilidad condicionada se define en el caso discreto como la razón de la probabilidad
conjunta P.n.(."<, y) a la probabilidad marginal Pix), podemos definir la densidad
condicionada como
( 1
Jrtx(}' x)
f xr(X, }')
fx(."<)
En panicular, podemos e>.1ender la definición de independencia diciendo que una va-
riable aleatona continua }'es independiente de otra variable aleatoria continua X si
/n,(l, u) = .02(t + l)(t + 2)( 10 t)u'(I - u). o< , < 1 º· o< 11 < 1
164 -4 VARIABLES ALEATORIAS Y OISTRIBUCION DE PROBABILIDADES
Soluc1ó n üeCinimos
f xr(x. }') ""' 72:< 2 ( 1 x)y( l - }'), 0 <X< l, 0 < }' < J
En el ejemplo 4.21 mostramos que
f x(.""<) = 12.'( 2(1 .""<)
de modo que
72x 2(1 - .'t) )'( 1 - )')
fu( y. x) ~ 12x2(l - x) = 6y( 1 - y)
sólo es una función de y. (Cabe sei\alar que el rango de ddinición de la fórmula para
y es independiente de x, como lo es aquí.) Así que X e Yson independientes.
Una alternativa es calcular la densidad marginal de Y como/y(}')= 6y(l - f),
par:i O <y < l. Así
fx(X)/r(J) = 12x 2(1 - x)6y(t y), O< x < l. O< y< 1
= fxr(x,y)
y nuevamente X e Y son independientes. •
SECCIONES 4 .7 Y 4.8 EJERCICIOS
- --
4 .41 l:n el ejercicio 4.38 consideramos la siguiente distribución conjunta P xt.x..v> de
X número de ofertas orales en una semana e Y ... número e.le ofertas por escrito en
una ~emana. e.le acuerdo con la siguiente tabla:
)'
x O 2 3 4 Total
o .010 .015 030 .075 MO 180
1 020 030 045 060 040 195
2 1))0 045 100 045 030 .250
3 040 060 045 030 020 .195
4 oso 075 030 .015 OJO .180
Total ISO .225 .250 .22~ 150
ar= Jvar(Y)
= L L 9 •Pxr(X..}) - µxµr ·
• y
• Par.a variables akatorias continuas, los signos de sumatoria ~e reemplazan por signos de integración Y
la función de dcnsidild ft'cmplau a P .J._v).
168 4 VARIABLES ALEATORIAS Y OISTRIBUCION DE PR.OBABILIOAOES
Resumen
•
'
Este capitulo contiene los conceptos necesarios rara extender las ideas de la proha-
hilidad a los resultados numéricos. La idea centrnl es la de variable aleatoria. es de-
cir, cualquier cantidad numérica que esté sujeta a una variación alc::itoria. lJ na
variable akatoria se identifica por su distribución de probabilidades. que es una lista
de sus valores posibles y las probabilidades asociadas con ellos.
Las variables aleatorias pueden ser discretas (las que toman valores distintos y
separados) o continuas (las que toman \alores a lo largo de un inter\'alo numérico).
Ha} resultados paralelos para las \ariablcs aleatorias discretas y continuas. cual-
quier cálculo que contenga una suma para vanahles aleatorias dio;crctas imrlica una
operación analoga para \ariables aleatorias continuas que comprende una integrnl.
Como las 'ar1ables aleatorias son cuantitativas (numéricas). podemos extender
la idea de la media a la de valor esperado (promedio en el limite) de una vana ble
aleatoria. También la idea de desviación estándar se: puede extender a variables alea-
torias como una medida de la variación aleatoria que presenta la variable.
También consideramos la distribución de probabilidades conjunta para <los o
más variables aleatorias, )' la extensión de la idea de independencia a este dominio.
El teorema de Aayes se puede exponer en forma modificada en términos de variahles
aleatorias, y la covari:mza y la correlación son formas de medir la relación lineal
entre dos 'aria bles de esta intlolc.
CAPÍTULO 4 EJERCICIOS
4.59 El personal de ventas de una compai'lia consta de 4 ingenieros (tre~ de lo~ cuales tie-
nen más de 40 ai'los de edad) y 6 representantes de \Cntas (dus de los cuales tienen
m:is de 40 ai\os de edad). Se selecciona. supuestamente al azar. a un ingeniero y a
dos representantes de ventas para recibir un adiestramiento especial.
a. Construya el espacio mue~tral de es1e experimento. l'umerc: a los ing.enieros
1, ... , 4 y a los representantes de \enta<; S•. .. , 10
b. Sea Y = número de personas seleccion::idas que tienen m3s de 40 ai'los de cd::id.
Por conteo, encuentre P r(.i•) y F 1{l·).
4 .60 F.n el eJerc1cio 4.59 encuentre E(Y) y <1r
4 .6 1 Una oficina estatal de salud investiga las denuncias sobre prácticas insalubres en los
restaurantes. tiendas de alimentos y similares. El número de caso~ varia de una se-
mana a la otra. Los datos indican lo siguiente:
Numero de casos'semana: o 1 2 3 4 5 (,
Probabilidad: 02 .IJ 20 30 .19 .15 .01
Nümcro de clientes: o 1 2 3 4 5 6
Frecuencia relativa: .2 1 .38 20 .11 06 .03 01
Sea Y= número de clientes atendidos en un día.
a. Calcule F1(.~·).
b. Encuentre E( Y) y a..-
4 .66 En el ejercicio 4.65 suponga que los números de clientes en días consecutivos son
independientes entre sí. Sean Y1 e Y2 los números de clientes correspondientes a dos
dias consecutivos.
a. Construya una tahla para Pr,t; (y1y 2 ).
b. Defina S = Y1 + Y2, como el número total de clientes en dos dias. Encuentre 1\1,s).
c. Calcule E(S) y a5 .
f 4 .67 Los usuarios de una base de datos de computadora h:in encontr:ido que X= número
1k líneas de código (en miles) e Y= tiempo en minutos que se requiere para correr el
programa, tienen la densidad conjunta
f.o(X,J") (3 3::!0)()6 - 4'1" 2 }" 1 + 4'1".i'). o < '( < 2. () < .\' < 4
a. Encuentre la probabilidad de que lanlo X como Y sean menores que O.S.
b. Encuentre la probabilidad de que l' sea ma)'or que l. (X puede tomar cualquier
valor.)
f 4.68 a. Para la densidad conjunta del ejercicio 4.67, calcule la denc;idad marginal de X.
h. Encuentre fn./.Y 1x).
f 4 .69 !Ornando en cuenta su naturaleza, ¿se deben considerar l:is v:iriahles aleatorias X e
r del ejercicio 4.67 como independientes? ¿Lo son de :icucrdo con el ejercicio 4.68?
f 4. 70 Una compañia de seguros recibe informes semestrales de agentes independientes.
Con base en los datos pasados, un modelo para la dcnsid:id conjunta de
X= proporción de informes que requieren de un estudio de acluali:ración e
Y= proporción de informes que requieren de un cambio de dirección es
fxrl·'"· y) = .:?4(h:J( 1 x) 2 ( 1 - >·». para O < .'I" < l. O < )' < t
170 '4 VARIABLES ALEATORIAS Y DISTRIBUCIÓN DE PROBABILIDADES
O<r<I
a Calcule los \'alares <le la dcn~idad para y= 0.70, 0.75. 0.80. 0.115. 0.90 y 0.95.
Dibuje la función de densidad sin much(1 detalle.
b. Encuentre el valor y que maximi1..'.l la dcnsídadh(l·) (o. lo que es lo mismo, el"ª"
lor y que maximiza el logaritmo de la densitJad). En otras pulabras, ¿cuál es la
moda tJe )":'
c. Encuentre la proh¡¡hilídad de que en un día seleccionado al azar. al meno~ el <JO~o
de las unidades pasen la prueba inicial. Encuentre la probabilidad de que no más
del 85% pasen la prueba.
I 4. 73 :i. Encuentre el "alor esperado de y para la densidad del ejercicio 4. 72.
b. Encuentre la desviación estándar.
c. Al anali1ar los diagramas de control en el capitulo:?. fijamos como uno de los lí-
mites de control la media menos 3 desv13cíones c:;tánd3r i,Cu31 es la probab11íd3d
de que Y caiga por dehajo de este limite de control?
f 4. 7~ l.os analist:is de la bolsa de valores observan cuidados3mcnte J3 "caída de l:is accio-
ne"" en el mercatJo. Un inversionista \ende acciones a 13 baja 1omandol:1.<; prestadas
de un agente de bolsa. El inversionista espera que el precio de las acciones se "ª)3
3 pique p3ra pagarle al corredor de bolsa con accione~ de poco \'alor. Un anafüt3
díce que la distribución de X. la proporción de toda.~ las 3cciones que ~e 'cndcn a
la h:iJa. es
/,(.'C) = 272.'{(I x)is. par:i 0 < 'C < 1
3. ¡,Pensarla usted que con frecuencia.\' es una proporc1on mu~ grande, como 0.8" S1
eso sucediese, ¿qué significaría en rel:ición con la bolsa de valores'? Calcule algu-
nos valores def1{x). ¿Para qué valores de x es rel:itivamentc alta la densid:id~
h. Encuentre 13 probabilidad de que X sea menor que 0.1 O. (Al integrar se dará
cuenta que es conveniente sustituir w = 1 - x, de modo que dw - dt.)
4. 75 a. En el ejercicio 4. 74. encuentre el v3Jor esperado de .\'. Por el c:ilculo diferencial
e integral s3bcmos que la integral de O a 1 de r"(I xt es a!h! I (o+ b + I~
b. Interprete el número que calculó en el inciso (a). En particular. ¿es éste el valor
más probable para la rroporción de ventas de 3CCioncs a la ba,t3. _\..,
c. Encuentre la varian1.<1 y la dcsvi:ieión estándar de.\'. ¿Qué le dice el ,·alor numé-
rico de la desviación estándar acerca de un rango r:11onable para los \'al ores de X?
4.76 El analista del ejercicio 4.74 t:imhién consideró la \3riahle r - rroporc1ón de \en-
tas diarias a individuos (inversionistas que no son inst1tuc1ones) 1.a s<1hiduría popu-
lar (b:istante cinica) es que los inversionistas indl\'lduales tienden a comprar en Jo-.
peores momentos, justo :intes de las caídas en el mercado de \'alores. de mudo que
l\U'
,o
E1erc1ctos 171
a. Al empleado que hace las entregas se le deben retribuir horas extra si el recorrido
requiere más de 8 horas. ¿Cu~I es la probabilidad de que se ¡iagucn horas extra?
b. Si el recorrido requiere más de 9 horas. algunos restaurantes se quedan sin sufi·
ciente producto. ¿Cuál es la probabilidad de 4ue el recorrido requiera del pago de
horas extra sin ocasionar desabasto en los restaurantes?
a,/ 4.78 a. En el ejercicio 4.77, encuentre la función de densidad del tiempo en el recorrido
aleatorio Y.
b. Use la densidad anterior para encontrar la prob;ibilidad de que un recorrido se
realice entre 7 y 7 horas y media.
f 4.79 Un comerciante que reali1.a ventas por teléfono registra la fracción de llamadas que
han sido contestadas antes de que el aparato suene tres veces. Se tiene como objeti-
vo que al menos el 80% de las llamadas (una proporción de 0.80) se contesten rápi-
damente. La proporción <liaria X se puede tratar como una variable aleatoria
continua con densidad
-t .8:.! a. l·.n el ejercicio 4.81. encuentre la función de dens1dad/1<.r> para un:i venia r.
h. 1-. ncuentrc la moda de Y, es decir, el valor .l' en el que la densidad akan1.:i su máximo.
f ·UD En~I ejercicio 4.77 consideramos Y, el licmpo requerido para completar una ruta de
entregas a los restaurantes. Y es un:i 'ariahle aleatoria continua con den~idad
fnh . .rl = 3-c{ 1 - .\'. l'}. para O < .\'. < 1 y O < 1 < 1
a. 1-'ncuentre la proh:ihilidad de que menos de la mitad de los tomates. pero m:is de
la mitad de: las Jechu¡,tas, recihan una calificación excepcional
h rncucntre l:is funciones de densidades m:uginales de X~ de r
e. fncuentre la probahilid;id de que X sea menor que 0.5 . Encuentre la proh;.ihilid:id
de que Y sea mayor que 0.5.
d ¡,Son X e Y independientes?
f 4 87 t-1 gerente del almacén del ejercicio 4.86 sospechó que )05 inspectores compensaban
l¡¡, haJ3S calificaciones de un alimento con alta" calificaciones para el otro. ~i la
ma~or parte de los tomate~ no recihi:in Ja más alta calificación, una propnrción de
lc1:hugas <;uperror al promedio recihia Ja m5<. alta cahticación ~ vi\:cversa
a. C\i la sospecha dd gerente es correcta, ¿cuál seria el \igno de l:i covarian1a (y de
la correlación) entre X e >"?
h. C:ileule I¡¡ covariani-a de X e Y ¿Tiene el signo que usted predijo en el inciso (a)'!
e. l·.ncuentre las desviaciones estándar de X) de Y. y la correlación entre X e Y. (,Es
fuerte la correlación? ,,Cuánto v:ilc?
f 4.88 Un mayorista reali1..a operaciones comerciales con ferreterías independientes y ano-
ta el tiempo medio entre dos pedidos consecutivos y la distrihución del tiempo trans-
currido entre los mismos. Si X= tiempo medio entre dos pedidos <:orrespondicntl! a
un:.i tienda ~clcccionada aleatoriamente e ) tiempo para que: esa tienda \ uelva
a hacer un pedido, l:i densidad conjunta de X e Y es
Ettud10 de caio Oistribuoón de probabi1dades 173
x: o o o 1 1 1 1 1 1 2 2 2 2 2 2
o o o o o o 1 1 o o 1 1 t
y:
z: o 1 2 o 1 2
l
o 1 2 o 1 ' º2 o 1 2
Free.: 98 45 10 125 110 28 171 20J J8 96 87 18 ISO 228 66
:e: 2 2 2 3 3 J 3 J J 3 3 3 3 3 3
y: o o o
.. o
2 2 2
1 2 o 1 2
1
o
1
l
2
2 o 1 2
2 2 )
o
J
1 2
3
Free.: 43 160 SI 11 15 10 37 78 29 13 51 22 10 23 34
pagados les gustaría tener m:is larjetas de débito que a aquéllos con muchas tarje-
tas o con muchos saldos pendientes. Utilice los resultados de la encuesta como si
represe~t.asen a la perfección al total de la población de los clientes habituales del
banco (ignorando por consiguiente toda \'ariación que deri"e de la muestra) para
investigar tal presentimiento. Escriha un breve informe dirigido al director de ser-·
vicios e"<plicando sus hallazgos; usted debería preparar un resumen de una cuarti-
lla, seguido por las evidencia!- que Jo sostienen. El director de servicios no recuerda
_.
la teoría de la probab1lidad, así que tenga cuidado con el uso del lenguaje técnico.
APÉNDICE 4.A Propiedades de los valores esperad~y las varianzas _____ __.
En esta sección presentamos algunos resultados matemáticos simples acerca de los
valores esperados y las varianzas. Los resultados se expresan en el lenguaje de las
variables aleatorias. Dado que las nociones de valor esperado y varianza de una va-
riable aleatoria son generalizaciones de los conceptos poblacionales correspondien-
tes, los mismos resultados se aplican a las poblaciones.
Los primeros resultados tienen que ver con el erecto de sumar o restar una
constante. Al analizar el probable rendimiento de una inversión, hay una estrecha
relación entre el rendimiento bruto (que no considera la inversión inicial) y el ren-
dimiento neto (que sustrae la inversión inicial).
= L yPr(}') + L aPr(}')
lodo y toda y
Apéndice '4.A Propiedades <W los v~es esperad°' y las vananzas 175
Inda V
= Var(Y)
EJEMPLO 4.23 Una empresa estadouniden~c tiene la oportunidad de invertir en Francia. La inver-
sión inicial es de 5,000,000 de francos. La empresa estima que el rendimiento bru-
to r tiene un valor esperado de 6,200,000 francos y una desviación estándar de
500.000 francos. Encuentre el valor esperado y la desviación estándar del rendi-
mi1mto neto en dólares. suponiendo un tipo de cambio de 5 francos por dólar.
• FI 'alor 3bsoluto en la fónnula para la dt'sviación esthdar toma t'n consideración la posibilidmd <W
multiplicar por un número nc¡p.llvo. Observe que J(-s}1 es ... S.
176 4 VAAIABt.ES AlEATOIUAS Y OISTRIBUCION DE PROBABlt.IDADES
SoluCJon Una manera de proceder es traba.1ar primero con d rendimiento neto en francos y
comertírlo después en dólares. El rendimiento neto es Y- S,000.000. de modo que
el \'alor esperado es E(}) - S,000,000 o 1,200,000 francos. y la des\'íacíón estándar
de 50c1.ooo fmncos no cambia. Par.i convertirlo en dólares, divida el \'alor esperado
y la des\ iación estándar de r entre 5. El rendimiento neto esperado es 2~0.000 dó-
lares y la desviación estándar es de 100,000 llólares. •
pues acabamos de demoslrar que µx+Y = µx + µr- Ahora desarrolle el cuadrado con
a= X - µX y b =y-µy:
+ L L (y - 2
µy} Px(x)Pr(Y)
!Oda• toda v
L (x -
toda t
2
.U.r} P.r(x)[) Pr(Y)J
1;t. y
= L (x -
toda •
µ.r) 2Px(x)[l] = Var(X)
El mismo procedimiento nos muestra que la tercera sumatoria doble es Var{ >')y, por
la definición de covarianza que vimos en la sección 4.7, la segunda de ellas es
2Cov(X, Y). Por consiguiente, en general
Var(X +Y)= Var(X) + 2Cov(X, Y)+ Var(Y)
En la sección 4. 7 demostramos que Cov(X, Y) =O cuando X e Y son indepen-
dientes (al igual que en algunos otros casos). Por lo tanto, si X e Y son independien-
tes, el término de covarianza en Var(X + Y) desaparece, y tenemos que
Var(X + Y) =Var(X) + Var( Y).
Los métodos del cálculo diferencial e integral no son decisivos para entender las
ideas esenciales de este texto, pero hay ocasiones en que es conveniente utilizar al-
gunas ideas básicas del mismo. Este apéndice contiene un breve repaso de los mé-
todos básicos del cálculo, mas no fue escrito como una introducción a este tema.
El primer concepto de importancia es el de función . Informalmente, una fun-
ción asigna un número "de salida", digamos i,, a un número "de entrada", digamos
'·de acuerdo con una regla específica. Como queremos reservar las letras/y F para
otros usos, utilizamos g y G para indicar funciones; escribimos w = g( r).
La derivada de una función gen un punto x = a se define informalmente como
la pendiente de g cuando x =a. Podemos pensar en una línea tangente a la curva
w"' g(x) en x =a, como en la figura 4.8. La derivada es la pendiente de la tangente.
La derivada se denota con
d
dx g(.x)
Tangente - , /
d
g(x) ;¡;g(x)
e, una tonsuntc o
;x"
e•
log,(l)
;x
se puede pensar como una funci ón definida en dos etapas. Transforme x en w = x2;
después convierta w en
v =e.,,= e" 1
Otra alternativa es escribir w = g 1(x) = x2 y v = g 2(w) =e", de modo que v -
g 1(g2(x)j. Para tales funciones ..escalonadas'' la derivada también se calcula en pa-
sos sucesivos. Primero, encuentre la derivada de g~(w), evaluada en w =g 1(x),
Apendice 4 B Breve repuo del cáJc:uto ddw.nc:ial • 1n1-.ra1 179
w = g(X)
pués multiplique por la derivada de g 1(.r). Al poner juntas todas la pie2llS, la regla
de In cadena afinna que
d g(x) -
d.'t - [dw
d e '"'][dx
d :e 2]
= [e•[2x] = 2xti'
a partir de las derivadas elementales.
lino de los usos más importantes de las derivadas es el de encontrar máximos
y mínimos relativos. En la figura ~ .9, obi.e!'e que. tanto en las cumbres como en los
valles de la función g(x), la pendiente (derivada) de g(\) es O
De este modo, para localizar un máximo o un mínimo de~('), debemos resol-
ver la ecuación (di'" )g(.\) =O para x. En los problemas que nos ocupan . por lo
general es obvio cuándo una solución particular es un máximo o un mínimo, y no
necesitamos realizar un análisis más complicado (lal como la prueba de la segunda
derivada).
Las ideas que acabamos de analizar se pueden extender a funciones de varias
variables, tales como
\\ = n(x¡.:<z ..l3) xft 3·'1 + log,.(x3)
Podcmo., tomar deril adas parciales con respecto a cada variable tratando (tempo-
r:llmente) las otras variables como constantes. Por ejemplo, la notación para la va-
riable parcial es
~ iJ
-
~
( e l....., 3 .1i +e ) ) =e 1 -(el.r')
:\
+e J
vx 2 cx 2
'
donde hemos aplicado Ja regla de Ja cadena para obtener
-
a e 3"• = (e 3.. ')-(3x
a ) = (e 3"')(3)
2
OX2 OX2
w = g{.x 1 .x 2 ) = (x, - 4)
2
+ (2x 1 + .x 2 - 4)
2
o
-[(x 1 - 4) 2 + (2x 1 + x 2 - 4) 2 ] = 2(x 1 - 4) + 24(2x 1 + x 2 - 4t =O
OX1
w = g(x)
8 b
r g(x)dx
Recordemos que una integral definida es el área bajo la curva determinada por g(x)
entre los puntos a y h. tal como se muestra en Ja figura 4.10. La forma hahitual de
evaluar integrales definidas es recurriendo al Teorema Fundamental del Cálculo. De
acuerdo con este teorema, deberíamos:
1. Encontrar una función G(x) que tenga derivadas g(x): lb mncb antidcriva-
d:1 de g(x).
J: =
2. Evaluar g(x)d.t G(x)I~ = G(b) - G(a).
En la tabla 4.2 mostramos algunas de las antiderivadas más útiles.
Por ejemplo. para evaluar
2
J:
2e 21 dt. encontramo~ la antiderivada de
g(x) = e-2.'. que es G(x) =e '/(-2) y observamos que la antiderivada de 2e 2.• es
2e-2.'/( -2) = -e-lr. Se deduce que
f.
O
y(x)Jx = lím
H;x.
f111 y(x)Jx
O
suponiendo que el límite existe. Por lo gener.11 el cálculo del límite es claro. pero en
algunas ocasiones requiere de algún truco. Considere la integral (véase la tabla 4.2)
Así,
laml'lién se puede integrar primero con respecto a .t2, y después con rcspecto a .t 1,
ot-teníéndosc el mismo resultac.lo: <>.3333.
,,
1.
CASOS ESPECIALES DE
'
DISTRIBUCIÓN DE
PROBABILIDADES
Las ideas, notaciones y resultados del capítulo anterior se pueden aplicar a tod:io; las
·;:iriables aleatorias y a todas las distribuciones de probabilidades. Vamos ahora a
identificar algunas distribuciones)' fórmulas c~pecíficas que se presentan con fre-
cuencia en la práctica. En particular, queremos describir las situacionc~ >las hipó-
tesis más importantes que ju!>tifican el uso de coda distribución.
Para llevar esta idea a Ja práctica, necesitamos un m¿todo que nos permita contar
los resultados posibles sin tener que enumerarlos. Esta sección contiene un breve
análisis de las fórmulas de recuento. Estas fórmulas son fundamentales en el desa·
rrollo de las distribuciones de probabilidad en las dos siguientes secciones. Ellas
surgen como respuesta a las siguientes preguntas:
.
suces iones y 1. ¿Cuántas succ,io ncs de k elementos se pueden formar a partir de un con-
subconj untos JUnto de r elementos distintos, utiliusndo cada elemento una sola vez?
2. ¿Cuántos <iubco njunto!\ de k elementos se pueden formar a partir de un
conjunto de r elementos distintos, u<>rmdo cadn elemento unn sola 'et'?
183
184 s CASOS ESPECIALES DE DISTRJBUCION DE PROBABILIDADES
r!
lP, = =r(r-l)···(r-k+I)
(r - k)!
• En inglis. 11 palabra 41\K se utiliza para las vuiacionH n M"""'ª"º"· No obstante, la vo7 ~rmuta
cton se ~K~ en la lcnsua espailola para el caso en que k es igual a r, n decir, ~D l:is vanacione~
de 11 elementos tomados de" en 11. (N. del T.)
S. I Recuento de los resuh.ados posibles 185
r!
(r _ k)! = (número de subconjuntos)k!
') r!
( k = k!(r - k)!
1:.1 símbolo (í) se Ice "k de r'', sugiriendo la elección de un subconjunto de k ob-
jetos tomado de un conjunto de r objetos.
la fórmula para lai. combinaciones ec; particularmente útil en el muestreo alea-
torio, pue'> seleccionar una mue<;tra de tamaño k. sin reemplazamiento de una pobla-
cion de tamaño r. es exactamc!nte lo mismo que escoger un subconjunto de le objetos
de un conjunto de r objetos. Por lo general, es irrele\antc el orden de los objetos o
elementos durante el muestreo, de modo que la fórmula para las ... ariaciones es. de
alguna manera, menos importante.
EJEMPLO 5. 1 Al auditar las 87 cuenus por pagar de una compañia, se inspecciona una muestra de
1O cuenta.s.• ¿Cuántas muestras posibles ha;(? Suponiendo que 13 de las cuentas con-
tienen un error, ¿cuántas muestras contienen exactamente dos cuentas incorrectas?
EJEMPLO 5.2 En un certamen de ventas entre 6 12 vendedores. los 10 primeros lugares reciben
premios. que \an desde unas vacaciones con gastos pagados para el primer lugar
hasi.l 50 dólares para el décimo lugar. ¿Cuánta.s listas con los nombres de los diez
ganadores se pueden formar?
186 S CASOS ESPECIALES DE OISTRIBUCION DE PR08A81LIDAOES
Solución En este caso el orden sí es relevante, de modo que lo correcto es aplicar Ja fórmula pa·
ralas variaciones. Hay 10 Pi. 1 ~ = 612!/602! =6,800,000.ooo.ooo.ooo.ooo.ooo.ooo.ooo
posihifoiades. •
5.1 En cier10 es1ado una corle de apelaciones csla formada por 7 jueces. Para un caso
rutinario, tres de ellos se eligen al :i?.:ir como jurado rara escuchar el ca~n y emitir
un dictamen. ¿Cuántos jurados distintos se pueden formar?
5.1 Suponga. en el ejercicio 5.1. que a 5 de lo:; 7 jueces de la corte de apelac1on~s se les
consider:i potcnci:ilmcnte rroch,es a cierto arg,umcn10 legal ¿Cuantos jurados se
pueden formar en que figuren exac1amen1e 2 jueces proclives? ¡,Cuantos jurados tie-
nen al menos 2 de tales jueces'!
5.3 Una tienda de comestiMes de~a proh:ir una behida de col:i de m:irca propia /\ un ca-
tador c;e le dan Rvasos sin etiqueta. 4 con la hehida de cola de marca propb ~ 4 con
una hehida de cola de marc:i conocida. /\1 catador se le: pide que idcnlllil¡uc los 4
vasos que contienen la bebida de marca propia. ¡,Cuantas elecciones distintas de: 4 \'a·
sos puede hacer el catador'?
54 En el ejercicio .S.3, 1.cuán1as elecciones inclu)cn 3 \'asos correclos y uno incorrec10.,
EJEMPLO 5.3 Analice si una serie de ensayos de Bemoulli proporciona un modelo razonable para
cada una de las siguientes situaciones.
a. Cada 15 minutos, de las 5:30 P.M. a las 10:00 P.~ .• un investigador hace lla-
madas teleíónicas a cierto número de hogares seleccionados al a1ar. A la persona
que contesta le pregunta si está viendo el programa de televisión de la cadena
ABC. Un ensayo consiste en llamar a un hogar y determinar si alguien en la casa
está viendo el programa de la ABC.
b. Un ejecutivo de un consorcio examina una muestra de listas de acciones de
la bolsa de valores de Nueva York para determinar si cada una de las accio-
nes ha subido de valor durante Ja semana pasada. Aquí un ensayo consiste en selec-
cionar una acción y detenninar si el precio ha subido o no durante la semana pasada.
c. Al término de un programa de capacitación, cada uno de los 50 gerentes re-
cién contratados recibe una calificación de sobresaliente, aceptable o insatisfactorio.
Un ensayo consiste en determinar la calificación para un gerente recién contratado.
Hay todavia un rasgo común a todas las situaciones del ejemplo 5.3. Estamos
contando el número de éxitos que suceden en un número fijo n de ensayos, sin to-
mar en consideración el orden panicular en el que suceden los éxitos y los fracasos.
Esto no seria cieno si, por ejemplo, el entrevistador telefónico llamase a los hoga-
res al azar hasta alcanzar 24 hogares en los que se estuviese viendo la televisión. En
esta situación, n no es fijo y el orden de los éxitos y fracasos si es relevante; está
gar.inti1.ado que el último ensayo (llamada) será un éxito.
Una colección con un número fijo /1 de ensayos de Bemoulli, en la que el in·
C\pcrimcnto \C'>tigador está interesado en el número total de éxitos, define un experimento hi·
hinomial nomial. A continuación enumeramos las propiedades de un experimento binomial.
'aria ble aleatoria La variahk aleatoria Y en un experimento binomial se llama 'ariabl(' alea-
hinorn i:t l toria hinomial Se trata de una variable aleatoria discreta que puede tomar cual-
di, trib udón d e quiera de los valores O, 1, 2, ... , n. La di\lril>ución d t prohabilidades b inomial
P (~'). que asigna probabilidades a cada valor de Y, se entiende mejor al conside-
probabilicl:1tk!I 1
binomi:tl rar un ejemplo sencillo.
Suponga que tomJmos una muestra aleatoria de 3 individuos de una pobla·
ción con una proporción n de éxitos. La figura 5.1 mue~tra un árbol de probabili-
dad para calcular la distribución de Y. Sumando las probabilidades de las
trayectorias pertinentes, podemos encontrar la distribución de probabilidades bi·
nomial para n - 3. Por ejemplo. las trayectorias segunda, tercera y quinta (con-
tando de arriba hacia ahajo) dan l ' 2; cada una de esas trayectorias tiene
probabilidad irl(l - ir). Para obtener la probahilidad P(f-' 2) sumamos las proba-
bilidades de las trayectorias, Py(2) = Ji(I n-) + ir( 1 1f) + ,r( 1- 1f) 3tr2(1- n-).
La distribución de probabilidades cornpkta es
y: o
P1 ( y): (1 - n»
52 Ensayos de Bernoulh y I~ d1$tnbuc1ón b.nom1al 189
E
3
E lt
F 1 . :t
2
E lt
E n
2
F 1 • lt
F 1 • 1l
11(1 · 1t) 2
E ll
2
E ll
F 1 • 11
lt( 1- lt) 2
F 1 • lt
E lt
1t{1· 11) 2
r: 1 • lt
F 1• lt
o {1 • 11) 3
So /uci6n Para economizar espacio, hemos hecho una lista con las tray~ctorias en vez <.le dibu-
jar el árbol. Quizá usted quiera construir el árbol de probabilidad correspondiente.
Todas las trayectorias correspondientes a un valor particular l ' ticnc.:n la misma pro-
babilidad. Por ejemplo, cada una de las 6 trayectorias que dan r - l tiene probabi·
lidad ,r( 1'- 1r) 2. Así. sumar las prohabilidadc'> de la trayectoria para un valor
particular y. equivale a multiplicar el número de trayectorias por la probabilidad
apropiada.
y: o 1 2 ) 4
Prfyl: 11 - J1C)
4
4itll - JIC)) b 1
(1 - .,~ 41f Jtl - lf) 1' ..
•
Necesitamos una fórmula para evitar la tarea de cont.3r trayectorias. Podemos
utiliZ'1r los m¿todos de la sección 5.1 . Una forma de especificar una trayectoria en
un experimento binomial consiste en determinar los ensayos en que 11ucede un éxi·
to. Por ejemplo, si n = 5. los éxitos sólo ocurren en los ensayos 1 y 4: en breve, E
en ( 1. 4). Esto especifica la trayectoria EFFEF. El orden de los números de ensayos
es irrelevante; E en (4, 1) también especifica la trayectoria EFFEF. Por consiguien-
te, en n ensayos el número de trayectorias que contienen y éxitos es el mismo que
el número de subconjuntos de tamaño y que se pueden formar con los primeros n
entero~. De la sección 5.1 sabemos que este número es
(n)y = (n!)
y!(n - y)!
Utiliz.-indo esta expresión para el número relevante de trayectorias en un árbol de
probabilidad binomial, obtenemos una expresión general para la distribución
de probabilidades binomial.
n!
Pr(J) = y.'(n - y)!
x'(I - .irr- 1
• para y= O. l, . . . ,n
La tabla 1 en el apéndice al final del libro contiene valores numéricos de las pro-
babilidades binomiales. Cada valor de n determina un bloque de probabilidades.
Para los valores de 1t por debajo de 0.5. sus valores se leen en la parte superior del
bloque y los de y a la izquierda. Para los valores de 11' por encima de 0.5, sus valo·
res se leen en la parte inferior. y los valores de y a la derecha.
) o 2 3 4 ,,.·'
•
EJEMPLO 5.6 A la larga, el 200/o de los gerentes que reciben capacit.ición ohticncn la calificación
de sobresaliente, el 500 o la de aceptable > el 30º o la de insatisfactorio. En una mucs-
tr.s de 20 gerentes seleccionados al a.t.ar, encuentre las siguientes probabilidades:
a. Exactamente 4 gerentes son calificados con sobresaliente.
b. Al menos 4 gerentes son calificados con sobresaliente.
c. ~x:.ictamente 15 gerentes son calificados con sobresaliente o aceptable.
d. Al menos 15 gerentes son calificados con sobresaliente o aceptable.
Supon~a que se trata dc un conjunto de ensayos de Bemoulli.
Solución a. Encucntrc el valor correspondiente a n = 20, Tr- 0.20 (en la parte superior del
bloque) e y =4 (a la izquierda). La probabilidad es O.2 182.
b. Sume los valores correspondientes a n - 20. 1C - 0.20 e y - 4, 5, 6, ... , 20
para obtener 0.5886.
c. La probabilidad de que una calificación sea sobrcsalknte o aceptable es
O 20 + 0.50 = 0.70. Encuentre el valor corre'ipon<.liente a n - 29, rr - 0.70 (en
la parte inferior del bloque) e y= 15 (a la derecha)· 0.1789. Otra alternativa es la
siguiente: esta probabilidad es igual a Ja probabilidad de tener exactamente 5
calificaciones insatisfactorias, ~rala que 1C = 0.30 e y= 5. Este razonamiento pro-
porciona el mismo valor en la tabla: 0.1789.
d. Sume los \atores correspondientes a n = 20, Tr- 0.70 e y- 15. 16, ... , 20
para obtener 0.4163. Alternativamente, sume los valores correspondientes a n - 20,
rr - 0.30 e y =5, 4, ... , O para obtener la probabilidad equivalente de 5 o menos ca-
li ticaciones de insatisfactorio. •
E( Y) e:: r!7!
El valor esperado que se ha obtenido para la variable aleatoria binomial parece in-
tuitivamente ra1onable. Si. en promedio, 30~o de los gcrenks capacitados son ca-
lificados como sobresalientes, en una muestra de 20 gerentes capacitados
deberíamos esperar que 20(0.3) = 6 reciban dicha calificación.
192 S CASOS ESPECIALES DE OISTRJBUCION DE PROBABILIDADES
5.5 ~.l >'una variable aleatoria binomial. Calcule Pr(V) en cada una de las siguientes
situaciones.
a. n .. 10, ir= .2. y 3
b. n -- 4, n - .4. y == 2
c. n= 16,ir,,..7,y• 12
5.6 Sea runa variable que tiene una d1strihución de probab1l1dades binomial con 11 • 6
y Ir = 0.25.
a. Calcule a m:mo P r (l') para y= 1, 2 y J. Compare sus result:idos con los que apa-
recen en la tabla 1 del apéndice.
b. Trace un histograma de P r (i·).
c. Encuentre la media y la desviación estándar de Y.
S. 7 Sea Y = número de éxitos en 20 ensa}os independientes. donde la probabilidad de
éxito en cualquier ensayo es 0.4. 1-. ncuentrc
a. P(Y ~ 4)
b. PI Y> 41
c. P(Y e;; 101
d. P(Y > 16)
5.8 Sea Y un:i variable aleatoria hinom1al con n "" 20 y Tr = 0.6. En~uentre /'(Y S 16) y
P( }' • 16 ). Compare estas probabilidades con las que encontró en los incisos (a)
y (b) del ejercicio 5.7.
5.9 Una cadena de moteles ha adoptado la política de hacer un descuento del J~o a los
clientes que p:iguen en cfcctl\o en vez de hacerlo con tarjeu de crédito Su ex,.ie-
riencia indica que el 30% de los chentcs aceptan el descuento. Sea Y• número de
persona.~ que aceptan el descuento entre los próximos 20 clientes.
a. ¿Cree usted que las hipótesis binomiales son razonables en esta situación?
b. Suponiendo que las probabilidades binomiales sean aplicables. encuentre Ja pro-
habilidad de que e\actamente 5 entre los próximos :!O clientes acepten el des-
cuento
c. Encuentre P(5 o menos clientes aceptan el descuento).
d. ¿Cuál es el numero más probable de personas que aceptarán el descuento entre
los próximos 20 clientes?
5.1 O En el ejercicio 5.9, encuentre el valor esperado y la des\ iación estándar del número
de personas que aceptan el descuento.
5. 11 1-.n el ejercicio 5.9, utilice la regla empírica para aproximar la probabilidad de que
)'esté a menos de una des\ iac1ón e"tándar del valor esperado. Utilice las tahlas bi-
nomiales para encontrar la probabilidad exacta. ¿1-.s buena la aproximación de la
regla empirica? ¿Qué tanto?
5. 12 Una comp:u'lia pequeib utiliza un servicio de paqueteri:i para enviar los pedidos de
quesos especiales que son para obsequios. l.a compallia ha encontrado que el 90%
de los paquetes se entregan a tiempo. Se en\ia un embarque de 100 poquetes. Sea
Y= numero de paquetes entregados a tiempo.
a. ¿P:irccen ra1onables las hipótesis binomiales en esta situación'?
b. Suponiendo que l:is prohabilidades binomiales se aplican, encuentre P( Y 2 85).
5.13 Suponiendo probabilidades binomiales. encuentre E( Y)) º>en el ejercic io 5.12.
S 14 Un fohrtc.3nte de medicamentos :ilirma que sólo el 1O'Yo de las mcdu:inas que re·
sultan efecti,as en las pruebas con animales pasan el resto de las que se exigen
para su comerciali1.ación. Actualmente. el fabricante tiene 8 nuc,os medicamentos
de probada efectividad en experimentos con animales y que espcr::n pasar en las
siguientes pruebas.
193
y= O, l .... ,n
• AW1quc por lo general utilizamos letras mayüsculu para denotar variables aleacoriu, esw lctnu "N" no
son vanablet aleatorias sino cons11ntes.
194 5 CASOS ESPECIALES DE DISTRJBUCION DE PROBABILIDADES
EJEMPLO 5.7 En el ejemplo 5.1 consideramos tomar una muestr.i de 10 de las ~7 cuentas de una
compal'lía. De las 87, 13 tenían errores Encuentre P(2 cuentas incorrectas en la
muestrl ).
Solueton Tenemos N= 87, n = 10. NF. = 13 y. por lo tanto, N>'- 74; i.¡ueremos P(Y 2).
EJEMPLO 5.8 Encuentre P(2 cuentas incorrectas) en el ejemplo 5. 7 utilizando una distribución de
probabilidades binomial.
1
Solucion Tomamos n - 10 y n = IJ/87 ""O. 149. Así. P(2 cuentas incorrectas) -(':)o.149)
(0.851}8 "'0.275. Esta probabilidad la hemos calculado utilizando la distribución
binomial. Es aproximadamente igual a 0.30. la probabilidad de 2 cuentas erróneas
i.¡uc habíamos calculado con la distribución de probabilidades hipcrgeométrica. A
medida que N aumenta, dichas probabilidades se hacen mas próximas entre sí. •
DISTRIBUCIONES GEOMÉTRICA Y
5.4 BINOMIAL NEGATIVA
y= '· 2. 3, .. .
donde JC es la probabilidad de éxito en c ualquier ensayo.
•
Estas probabilidades forman una serie geométrica. Si Ir= 0.2, las probabilida-
des son 0.2, 0.2(0.8). 0.2(0.8) 2,.. •• ·
EJEMPLO S.9 Las etiquetas en los frascos de Jos medicamentos se examinan con un lector óptico
para comprobar que están debidamente adheridas a las botellas. Suponga que la
probabilidad de descubrir una etiqueta mal adherida es 1f - 0.0001. Calcule la pro-
babilidad de que el proceso detecte una etiqueta con tales características en el pri-
mer ensayo. También calcule la probabilidad de que el proceso descubra por
primera vez una etiqueta mal adherida en la diezm:~~.,1ma botella.
Solución El evento "etiqueta mal adherida en el ensayo 1" es lo mismo que el evento
"Y"" I". donde Y= número de ensayos para encontrar la primera etiqueta
mal adherida. Dando por sentado que los ensayos son d~ Rernoulli. con P(éxi-
to) 1f == 0.000 l. cmrleamos una distribución geométrica. P( Y = 1) P y ( 1) =
(0.0001 )(0.9999) 1 1 = 0.0001. El evento "primera etiqueta mal adherida en
la botella 10,000" es lo mismo que el evento "Y 10,000" y tiene probabilidad
S.1 01smbuc1ones ceométnca y b1nom1al ne¡auva 197
• 1
l:.(Y) =-
n
1- lt
Var(Y) - - -
1-
"
donde rr es la probabilidad de éxito en cualquier ensayo.
•
EJEMPLO 5 . 1O Utilizando las hipótesis del ejercicio 5.9, encuentre el valor esperado y la varianza del
número de etiquetas examinadas hasta que se encuentra una etiqueta mal ..idhcridu.
EJEMPLO 5. 11 En el ejemplo 5.9 supusimos que la probabilidad de una etiqueta mal adherida era de
0.0001 . Suponga que se n«esitan 50 etiquetas mal adheridas para estudiar por qué
r:t76n ec;tán mol pegadas. Escriba una expresión para la probabilidad de que se re-
quieran 100,000 o más botellas hasta alcanzar la cifra de 50 etiquetas mal adheridas.
Solución Podemos considerar el número de éxitos (etiquetas mal adheridas) como fijo, y en-
contrar la prohabilidad de que Y = número requerido de botellas sea al menos
100,000:
"' (y - l)! ~
1
P( Y~ 100.000J = ~ (SO_ l)!(y _ SO)! (.0001)~ (.9999)'
0
•
Dado que la distribución binomial negativa es simplemente la extensión de la
distribución geométrica a le .> 1 éxitos. no nos sorprende que las expresiones para
la media y la \ arian1.a de la distribución binomial negativa 'iean extensiones de las
expresiones correspondientes parc1 la distribución geométrica.
k
F.( YJ .. -
7[
EJEMPLO 5. 12 Encuentre el valor esperado y la desviación estándar del número de hotellas reque·
rido para encontrar 50 etiquetas mal adheridas. suponiendo que la prohabtlidad de
una etiqueta mal adherida es de 0.0001 .
EJEMPLO 5. 13 E.n las tres situaciones descritas al comienzo de esta sección, ¿se cumplen las hipó-
tesis de Poisson?
• Llamada llJI rn honor a Simron Poisson. rl matemático que la derivó por primera vez.
200 S CASOS ESPECIALES DE DISTRIBUCION DE PROBABILIDADES
puesto que un barco grande puede chocar con otro, hundiéndose ambos, la hipóte-
sis de que los eventos suceden uno cada vez no se cumple. Aunque esto es realmen-
te posib~e. podemos suponer que tales accidentes son lo bnstnnte raro!> como para
que la distribución de Poisson sea un modelo acepuible de la probabilidad de que un
ba~co petrolero se hund<l en un periodo dado. En d centro de cálculo, todo depende
de l:i situación. Si hay tan sólo unas cuantas terminales y no se puede trabajar en
ellas mientras se ejecuta un trabajo, entonces se reduce la probabilidad de que se re-
ciba otro trabajo (de~d e la misma terminal) un poco más tarde. lo que viola la hipó-
tesis de independencia. Pero si hay muchas tenninales o en las tennmalec, se puede
c;eguar trabajando mientras se ejecutan los trabajos, las hipótesis de J>oisson no~ pa-
recen correctas. ¡Nos gustaría ver algunos dato~! •
y= o. 1, 2,. ..
donde µ es el número esperado de evento:-. que suceden en un periodo y
(' -:: 2. 71828 ...
EJEMPLO 5.14 Los sábados por la mañana. los dientes entran a una pequeña tiemla de un centro
comercial suburbano a una tasa esperada de 0.50 por minuto. Sea Y= número de
clientes que entran en un intervalo específico de 10 minutos Encuentre las siguien-
tes prnhabiltdades:
a . P( Y = 3)
b. P( Y S 3)
c. P(Y ~ 4)
d. P(4 $ Y $ 10)
Solución Las hipótesis de Pois!>on parecen ser ra.wnablcs en este contexto. üamo~ por sen-
tado que los clientes no llegan en grupos (o podemos contar al grupo entero <.:orno
un solo cliente) y que la entrada de un cliente no aumenta ni disminuye la probabi-
lidad de que llegue otro.
Para obtenerµ, observamos que a una tasa media de 0 .50 por minuto durante
un periodo de 1O minutos, podremos esperarµ (0.50)( 1O) 5.0 entradas. Para
encontrar las probabilidades, consultamos la tabla 2 del apéndice .
SS Oostnbuoón de Po.non
,.,
a. P(Y- 3) se lee directamente de Ja tabla 2 del apéndice, conµ,., 5 e y o J·
P(Y-3)-01403
b. P( Y <:, 3) = PO' - O) + P( Y = 1) + P( Y =2) + P( Y - 3) =O.0067 + O. 03 37
+ 0.0843 + 0.1403 =0.2650.
c. P(Y~4)= l - P(Y$3) - I 0.2650 0.7350
d. P(4 S Y .s; 10) ""'"P(Y= 4) + P(Y= 5) + ... + P(Y- 10) 0. 1755 + 0.1755
+ ... + 0.0181 = 0.7213 •
EJEMPLO 5.16 En un ensayo clínico, una muestra de 1000 pacientes están siendo tratados con un
nuc\ o medicamento. Si suponemos que 1í = 0.001, calcule la probabilidad de que
ninguno de los pacientes experimente efectos colaterales (náuseas, por ejemplo).
(t)0 e- 1 _
Pr(O) =- -!-
0
=t 1
= .3679
La probabilidad corres[)9ndiente calculada con la distribución de probabilidades
bi~omial es
0 1000
('c:'Xo.001)(0.999) .. 03677. •
202 5 CASOS ESPECIALES DE DISTRJBUCION DE PROBA81LIDADES
5.:!4
" Sea Y una variable aleatoria con una distribución de Poisson . Utilice la tabl:i 2 del
apéndice para calcular
a. Py(l)paraµ 0.4,µ=0.7yµ=4.8;
b. P(YS3)paraµ = l.6yµ = 7.0;
c. P(YS 10) pm µ = 2.1yµ ,.. 10.0.
5.25 Calcule la distribución de probabilidades de Poisson para µ O S y rcprcséntcla
gráficamente. ¿Es m:is o menos simétrica esta distrihución'?
5.26 IJna compa"ia que asegura casas contra incendios asume que las reclamaciones
por indemni1ación se solicitan de acuerdo con una distribución de 1•oisson a ra-
tón de 2.25 por semana. Sea Y el número de reclamaciones que aparecen en un pe-
riodo de 4 o;emanas. Encuentre (a) P( Y$ 10). (b) PC Y~ 7) y (e) f'( 7 < Y$ 11 ).
5.27 l~n el CJerc1c10 5.26 encuentre el valor esperado y la desviación e\tándar de Y.
5.2& En el ejercicio S.26, ¿puede usted pensar en algunas situac1onec; que hari:in 1rr:izo-
nablc la hipótesis de Poisson?
5.29 Los camiones para el transporte de troncos tienen problemas con loe; neum;íticos de-
bido a pinchaduras y cortes. Estos 'ehiculos se conducen a gr:in \clocidad sohre ca-
minos de tierra sinuosos. Suponga que tales ~sperfeetos suceden conforme a una
d1stnhución de Poisson, a una tasa media de 4.0 por cada 10.000 mill:is.
a. Si un camión recorre 1000 millas en una semana, ¿cuál es la probab1l id ad de que
sus neumáticos no sufran ningún daño'?
b. ¿Cuál es la prohahilid:id de que sufra al meno<. dos 3\erias?
5.JO En el ejercicio S.29. ¿cu:il es el valor esperado > la des\ iación ec;tándar del número
de dal\os en los neumáticos por cada 1000 millas de recorrido,,
5.31 l.:i distrihución de Poisson tambicn se aplica a e\entos que ocurren aleatoriamente
sohrc una superficie o un volumen. Los pedacitos de chocolate di<;persos en una
)'la'lt3 de galleta bien me1.clada tienden a seguir una distribución de Poisson IJna
panaderi:i produce galletas con un promedio de 8 pedacitos por galleta.
a. ¿Cuál es la probabilidad de que una galleta no tenga pedacitos de chocolate
( i horror!)?
b. Se considera que una galleta es aceptahle si tiene al meno<; 5 pedacitos. ¿Qué
fracción de las galletas son :iceptables?
_1_
b-a
y
8 b
V (Y)=(b-a)2
ar 12
(40 - 10)
= so = .ó
1
50
o 10 40 50
FIGURAS .3 Probab1hdades de una distribución uniforme
204 5 CASOS ESPECIALES DE DISTRIBUCION DE PROBABILIDADES
EJEMPLO 5.17 Una compaiHa que vende por correo programas de software para microcomputado-
ras. ha encontrado que entre el 5% y el 15% de los pedidos diarios requieren un en-
vío e9Pecial. Suponga que, como una primera aproximación. consideramos que la
distribución de Y= porcentaje de pedidos en un dia seleccionado al amr es unifor-
me sobre el intervalo que va de 5 a 15. Encuentre la media y la desviación están-
dar de Y y la probabilidad de que Y se encuentre entre 9 y 12.
Solución Tenemos que a= 5 y b = 15. Por consiguiente.
f(}') = (5 + 15) = 10
2
=(IS~ 5) = 8.3333
2
Var(Y)
= 3(.1) = .3
P(9 < Y< 12)
•
SECCIÓN S.6 EJERCICIOS
Densidad exponencial
Suponga que los eventos suceden aleatoriamente a lo largo del tiempo, con un
tiempo esperado entre eventos µ. Si W - tiempo para el siguiente evento. entonces
fw(w) = G-)e-•1
•,
E(W) = µ
Var(W)'"" µ 2
f (;)e-w 1
"dw = e-• 1
" - e-"~
La mayoría de las calculadoras y muchos programas de computadora e"·alúan auto·
mat1c;imcnte el numero e'.
( JEMPLO 5.18 El tiempo medio entre dos solicitudes de trabajo a una mncrocomputadora durante
un día de trabajo es de 2.5 minutos. Suponga que los trnbajos llegan aleatoriamen-
te a lo largo del tiempo a una tasa esperada consrnnte.
206 S CASOS ESPECIALES DE DISTRJBUCIÓN DE PROBABILIDADES
= .4493 - .1353
= .3140
EJEMPLO 5.19 En el ejemplo S.18 supusimos que los trabajos se envían a la computadora a inter-
valos de 2.5 minutos. Suponga que
a. La solicitud de un trabajo tiende a llevar tras de si la ~olicitud inmediata
de otro trabajo relacionado;
b. Los trabajos tienden a recibirse "en cierta hora", cuando los empleados
llegan o se van a una reunión.
Soluc1ón a Aquí t!Xiste una dependencia. Si un trabajo se solicita en un periodo, hay mayor
probabilidad de que otro trabajo se solicite casi de inmediato.
b. Aquí la tasa media de ocurrencias no es constante. La tasa es más alta
"en cierta hora". •
~ J 7 Utilice una calculador-J que evalúe e' para encontrar el valor de Ja función de den-
sidad cxponencial/rM paraµ 2.5 y y= O. 0 .5, 1 O, 1.5 y 2.0. Bosqueje la función
de densidad.
S 38 Calcule las siguientes probabilidades para una vari3hle aleatoria uponenc1al con
µ. 2.
Sección S 7 Ercrc1c1os 207
a. P( Y> 21
b. P(Y > 1)
c. Ptl < Y < 2)
d. P(I :S Y :S 2)
(Sugerencia: En el inciso (d}, utilice la lógica, no la calculadora.)
5.39 En un centro rural para la atención de emergencias el tiemrio entre llegadas sigue
una distribución e\ponencial con un tiempo medio entre llegadas de 1.25 horas.
Encuentre la probabilidad de que el tiempo entre llegadas sea ma~or que 1 hora. En-
cuentre la probabilidad de que el tiempo entre llegadas sea mayor que 2 horas.
5.40 En el ejercicio S.39. en vel de ocuparse del tiempo entre llcgad:is al centro de aten-
ción de emergencias, concéntrese en las llegadas en un lapso de tiempo dadt... Oh·
serve que las hipótesis par:i las distribuciones exponencial y de Poisson ~on
idénticas; observe también que un tiempo medio entre llegadas de 1.25 horas indi·
ca un promedio de 1t 1.25 • 0.80 llegadas por hora.
a. Utíli1.ando las probabilidades de Poisson, encuentre la probabilidad de que no
haya llegadas en un:i hora.
b. Encuentre Ja probabilidad de que no haya llegadas en 2 horas.
c. Compare sus respuestas en este ejercicio con las del ejercicio 5.39. ¡,Cuál es la
e..:plicaci6n?
5.41 En un:i aerolínea, el ticmrio para atender a los pas:ijeros sin billete en el mostrador
del acroriucrto sigue una distribución c..:ponencial con un:i media de S minutos.
a. Encuentre la probabilidad de un tiempo de atención menor que 2.5 minutos.
b. Encuentre la probabilidad de un tiempo de atención mayor que 1O minutos.
5.42 Considere la situación de atención a los pasajeros del ejercicio 5.41 .
a. ;.Cuál es el número esperado de pasajeros atendidos por minuto?
I'>. Encuentre la probabilidad de que al meno'> un pasajero sea atendido en menos de
2.5 minutos.
c. Encuentre la probabilidad de que ningún pasajero sea alendido en mc:nos de 1O
minutos.
5.43 En una cen1ral nuclear ocurren aleatoriamente a lo lilrgo del 1iempo "c\entos poco
comunes" (problemas menores de oricración). El tiempo medio entre dos eventos es
de 40 días.
a. ¿Cuál es la probahilidad de que el tiempo para el siguiente "evenlo poco común"
<;e encuentre entre 20 y 60 días?
b. Encuentre l;i desviación estándar del tiempo para el ~iguientc: "e' cnln poco comun".
5.44 Un análisis de los archivos de la central nuclear del ejercicio 5.43 muestra que los
"eventos poco comunes" suceden con mayor frecuenc ia los fines de semana. ¿Qué
hipótesis subyacente a sus respuestas en el ejercicio 5.43 se pone en duda?
5.45 Un equipo de béisbol de la liga ma)Or (Estados Unidos) vende boletos (billetes) en
una oficina del ccn1ro de la ciudad durante las horas de trabajo. 1.os aficionados lle·
gan a la olicin¡i uno a uno y en fonna aleatoria. a un:i tasa media de 12 por hora; di-
cha tas:i permanece esencialmente constante duranle el día.
a. Encuentre la probabilidad de que hay:i m:is de 5 llegadas en un rc:riodo de 1O mi-
nutos ( 1/6 horas).
b. Encuentre la probabilidad <.le que el siguiente aficionado llegue en !()S próximos)
mi nulos. Observe que el tiempo medio entre llegadas es de 1 12 horas. o 5 minulO!.
5.46 En el ejercicio 5.45, encuentre un número k tal que la rrohahilidad de Ir o más lle·
gadas en un cuarto de hora sea cercana a 0.10.
5.47 El tiempo entre "fallas del sistema" de cierta macrocomriutadora parece seguir llll.I
distribución exponencial. El tiempo medio es de 5 días.
208 5 CASOS ESPECIALES DE DISTRIBUCION DE PROBABILIDADES
Densidad normal
Las tabl.1'> p..1ra las áreas de las cul"\as normales (probab1hdadc~) siempre se
di,tribu ciún nor- dan para la di'llribución normal c\ tamlariLat.la (o tipificada). que tiene media O
rn:1I C\lancl:iri1ad<1 y des' i:ición estándar igual a l. La tabla 3 del apéndice nos da las áreas entre O y
P(O S Z S 1 ) = .3413
µ z= O
(J z"' 1
z
-2 -1 o 2
a. P(O~ Z S 1.96)
b. P(Z > 1.96)
c. P(- 1.96 ~ Z S 1.96)
d. PC- 1.00 S Z S 1.96)
Solución Una ilustración como la de la figura 5.5 facilita el uso de las tablas normales. El va-
lor para z - 1.96 (que se localiza en la fila 1.9 y la columna 0.06) es 0.4750. En
este caso la figura 5.6 es de gran utilidad.
a. P(O S Z S 1.96) = 0.4750.
b. Como el área a la derecha de Odebe ser 0.5000 (la curva normal es simé -
trica y el área total bajo la curva es 1), P(Z > 1.96) - 0.5000 0.4750
= 0.0250.
c. Por simetría, el área entre 1.96 y O también debe ser 0.4 750. Así,
P(- 1.96 s z s 1.96) = 0.4750 + 0.4750 - 0.9500.
d. P(- 1.00 S Z S 1.96) = 0.3413 + 0.4750 - 0.8163. (Haga un dibujo.) •
~l .. o
Oz .. 1
.0250 .0250
z
-1.96 o 1.96
z
-!<: o
FIGURA 5.7 Solución al ejemplo S.21
EJEMPLO 5.21 Encuentre k1 tal que P(O S Z S k1) = 0.40 y *2 tal que P(-ltz S Z :S' ~) = 0.60.
Solución En cierto sentido, este problema es opuesto al del ejemplo S.20. En ese problema,
se conocen los valores y se desconocen las probabilidades. En este caso, las proba-
bilidades están dadas y los valores son los que se tienen que encontrar. Nuevamen-
te, la representación gráfica es de gran utilidad (véase la figura 5.7).
a. Al buscar en la tabla 3 del apéndice el área correspondiente a 0.40. encon-
tramos que el valor de z más próximo es 1.28. Por consiguiente, P(O $ Z :S' 1.28) =
0.40; es decir, k 1 = 1.28.
b. Un área de 0.30 (Ja mitad de la probabilidad buscada como se muestra en
la figura S.7) corresponde a z.,0.84, de modo que P(-0.84 :S' Z :S' 0.84),.. 0.60; es
decir, k2 0.84 .
Cualq uier varfablc a lCJttoriíl norma l }' e pued e tra nsformar en una u -
riable a leatoria norm al estandar i.Lada (o tipificada) Z ustra)endo e l valo r c.s-
pcrado µ y tfü id icndo el r esultado e ntre la d es' iación est á nd a r o.
Z • Y-p
(1
ulo r esta nd arín- Para un valor dado de y, el valor correspondiente de z, llamado en ocasiones valor
d o z (o n lor z) est a ndarizado z. ~s el número de desviaciones estándar que y dista de µ. Si
µ = 100 y e= 20, un valor de y igual a 130 se encuentro 1.5 desviaciones estándar
por encima de (a la derecha de) la mediaµ y el valor z correspondiente es z - (130
100)/20 - 1.50. Un valor de y igual a 85 se encuentra O. 75 desviaciones estándar
por debajo de (a la izquierda de) la mediaµ y
EJEMPLO 5.22 Los ingresos anuales de los profesores de una universidad siguen aproximadamen-
te una distribución normal con una media de 18,600 dólares y una desviación es-
tándar de 2700 dólares. Encuentre Ja probabilidad de que un profesor seleccionado
al azar tenga (a) un ingreso anual inferior a 15,000 dólares; (b) un ingreso mayor
que 21 ,000 dólares.
S8 01stnbuc:t6n normal {'.! A..
-I • \
y
µ - 2o µ·o µ+o µ+2o
-2 -1 "'o 1 2 l
1867
y
15.000 18.600 21.000
FIGURA 5.9 Áreas mayores que 21,000 y menores que 15,000 paraµ = 18.600 y <1 o:: 2700
en el ejemplo 5.22
Solución En priml!r lugar traz.nmos una figura en la que se muestran las áreas en cuestión (la
figura 5.9). Ahora debemos determinar el área entre 15,000 y 18,600.
.5 - .4082 - .0918
Análogamente, para calcular la probabilidad de percibir un salario superior a
los 21.000 dólares determinamos el área entre 18,600 y 21,000:
Z
=y - " = 21,000 - 18,600 - 89
" 2700 .
212 S CASOS ESPECIALES DE OISTRIBUCION DE PROBABILIDADES
.5 - .Jl33 = .1867 •
EJEMPLO 5.23 Si }'tiene una distribución normal con una media igual a 500 y una desviación es-
tándar igual a 100, encuentre
ª· />(500 $ y s 696);
b. P( y 2: 696);
c. P(J04 s Y .s 696);
d. k tal que P(500 - k s Y s 500 + .k) =0.60.
Solución a. Un \'alor de y igual a 696 est:l a 1.96 desviaciones estándar por encima de la me-
dia;: - (696 - 500)/ l 00 = 1.96. Evidentemente, 500 está a cero desviaciones están-
dar por encima de la media, de modo que;: = (500 - 500Vl 00 = 0.00. Así. P(500 $
Y s 696) ..;. P(O s Z s 1.96) = 0.4750.
b. P( Y 2: 696) - P(Z ? 1.96) = 0.0250.
c. /'(304 $ }' $ 696) P( 1.96 $ Z :5 1.96) =0.950, pues 304 corresponde a
una= igual a (304 - 500) 100 = -1.96.
d. Al igual que en el ejemplo 5.21, P( .84 $ Z S 0.84) = 0.60, de modo que
queremos un rango para Y que vaya de!>dc 0.84 des' iaciones estf.indar por debajo de
Ja media µ - 500 hasta 0.84 des' iacioncs estándar por encima de la media:
P[500 - 0.84( 100) s Y s 500+0.84(100)] =P(4 l6 s Y S 584) - 0.60 (véase la fi-
gura 5.10). •
llv • 500
Oy • 100
y
416 500 584
a. Encuentre P( Y 2! 1000 ).
b. Encuentre P(Y S 940) .
.fe. Encuentre /'(960 S Y S 1060}.
5.55 Remítase a la variable aleatoria Y del ejercicio 5.54
a. Encuentre el valor de le que: satisface P( Y 2! /e) - 0.90
b. Encuent~ el \alor le tal que la probabilidad de que el rrccio de los bonos (un afio
después) exceda a le sea de 0.60.
5.56 Suponga que el salario por hora de un trabajador en una fábrica de ropa (qu.: se basa
en un sistema de pago a destajo) tiene una distribución normal con valor esperado
5. 1O dólares y desviación estándar 0.40.
a. Encuentre la probabilidad de que el ~lario por hora de un trabajador sea surerior
a 5 40 dt'>lares.
b. Encuentre la rrobabilídad de que el salario por hora se encuentre entre 4. 70 y
5.50 dólares.
c. Encuentre la probabilidad de que el salario por hora sea superior al salario mini·
mo contratado de J .90 dólares.
PI Y = 460) + P( Y = 459) + · · · + P( Y = 0)
! !abría en esta situación 461 probabilidades difíciles de calcular a c.-iusa de los fac-
toriales. Por ejemplo, la probabilidad de encontrar 460 electores a favor del forta-
lecimiento es
215
111>ro, ím ación nor- Para ciertos valores den y p, podemos aproximar la distribución binomial por
111.11 de la distribu- medio de una distribución normal. Este hecho lo podemos demostrar apoyándonos
ción binomial en el Teorema Central del Limite, que analizaremos en el siguiente capítulo. En vez
de demostrar dicho resultado en este lugar, mostraremos cómo y cuándo se puede
utilizar la aproximación. La idea básica consiste en suponer que la variable aleato-
ria binomial Y tiene una distribución normal ~ utilizar Ja media binomial µ "" n1f y
la desviación estándar ~mr.(1 n) Por ejemplo, podcmo-. tratar una variable bino-
mial con n "" 400 y /r - 0.20 como si tuviese una distribución normal con
µ = 400(0.20) .-.. 80 y <J= .J400(0.20X0.80) - 8. Para aproximar P( Y> 96) utilice
las tablas de la distribución normal para obtener P( Y> 96) = P[Z > (96 80)/8] =
P(Z > 2) - 0.0228, o 0.02, como valor aproximado.
EJEMPLO 5.24 Un::i compañia de seguros se ha fijado la meta de que el 10% de los clientes posi-
bles tome un seguro. Suponga que hay independencia entre los prospectos, de
modo que se pueden aplicar las probabilidade~ binomiales. ¿Cuál es la probabili-
dad de que de 600 clientes posibles, 30 o menos de ellos contraten un seguro?
Solución La solución exacta comprende probabilidades binomiales con n =600 y 1C - 0.1 Oen
caso de que se alcance la meta. Como no tenemos tablas para n = 600. utili1.amos
una aproximación normal con µ = ntr- 600(0. to) - 60 y a = , nn(I - n) =
.,/600(0.10)(0.90) = 7.348.
La razón por la que se hace la corrección por continuidad es que estamos uti-
lizando la curva normal continua para aproximar una distribución binomial discre-
ta. La situación es la que se muestra en la figura 5.11. La probabilidad binomial de
Y~ 5 es la suma de las áreas de los rectángulos correspondientes a 5, 4, 3, 2, 1 y O.
Podemos aproximar esta probabilidad (área) por medio del área, a la izquierda de 5,
bajo la cur.a normal superpuesta. Así, la aproximación normal ignora la mitad del
rectángulo sobre el 5. La corrección por continuidad simplemente incluye el área
216 S CASOS ESPECIALES DE.DISTRIBUCIÓN DE PROBABILIDADES
1t a30
n - 20
o 1 2 3 4 5 6 7 8 9 1o 11 12 13 14 15 16 17 18 19 20
P( Y 2: 14.5) = P ( Z 2:
14.5 -
.0
20) = P(Z 2: - 1.375)
4
EJEMPLO 5.26 Suponga que Y. el número de trabajos que llegan a un centro de calculo en un lap-
so de media hora, tiene una distribución de Poisson con una media de 0.2 por mi-
nuto Utilice una aproximación normal para em:ontrar P( Y<; l 0).
P( Y s. 10) '"' P ( Z s. 10 -
J6 6) P<Z S. 1.63) = 9.i8.i
Solución Seguimos teniendoµ= 6 y CI= J6. Aproxime P( Y$ 10) con P( Y :S 10.5 ). t lse una
figura p:ira ver por qué.
5.59 En un sistema de contabilidad computadorizado suceden 1.6 errores por cada 1000
datos introducidos a la computadora. ¿Bajo qué condiciones esperaría usted que las
"hipótesis de Poisson sean una aproximación razonable?
5.60 En el ejercicio S.59, suponga que las probabilidades de Poisson son adecuadas. Sea
Y "' número de errores en un conjunto de 5000 datos introducidos a la computadora.
a. Encuentre E( Y) y a,,.
b. Encuentre P(S ~ Y S 11 )
5.61 P:ira responder 31 inciso {b) del ejercicio 5.60, utilice una aproximación normal con
corrección por continuid3d.
RESUMEN
') r!
( le ª lc!(r - le)!
Resumen 219
~- Exixrimcnto binomial
a. Ha) "cosa) o~. cada uno de los cuales resulta en un éxito E o en un
fracaso F.
b. La prohabilidad de éxito P(E) = TC permanece constante para todos
los cnsa)OS;
p (F) = J Tr.
c. Los enSa) os son independientes.
d. La variable aleatoria de interés es Y. el número de cxitos en n ensayos.
3. Variahlc :ileatoria binomial
a. Distril"iución de probabilidades binomial
n'
P.(y)= . n:'(l-n:r-,
y!(n - y)!
f( n = mr
Var( }') = mr(l - 7r)
,-.:---
<1y = v nn( 1 - n)
-"1 ) ( N.. )
( r n- r
P.(}')= . (~) .
Var(Y) = n('.")(
....E 1 -
N
.\')N-n
--1: - -
N N-1
"r = Jn(NF.)(1
N - NE)!:!._:::_!_
N N-1
5. Variable aleatoria geométrica
a. Distrihución de probabilidades
.r- 1.2•...
220 S CASOS ESPECIALES DE DISTRJBUCION DE PROBASIUDADES
~ E{Y) = -1
n
1- 1t
Yar(Y) = - l-
Jt
CTr
~
=---
Tt
<1y = k~
7. Variable aleatoria de Pois~on
a. Distribución de probabilidades de Poisson
E( Y) =µ
Var(Y) • µ
CTy = .¡µ
1
fr(}') = --.
b-a
a+b
E(Y) =--
2
b-a
Var(Y) =- -
12
fJy =
Fa
.,¡12
9. Variable akatoria t!Xponencial
a. Función de densidad
E( Y)= I'
Var(Y) =µ 2
fJy =µ
10. Variable aleatoria normal
a. Función ele densidad
1 -. 5(~)1
/r(Y) = - - e "
Jiña
b. La media. la varianza y la desviación estándar son µ, <J 2 y a. respec-
ti, amcnte.
c. Variable aleatoria normal estandarizada,
Y-µ
Z=--
a
d. Usted puede obtener las áreas bajo una curva nonnal si calcula primero
un valor estandarizado; y después consulta la tabla 3 del apéndice.
11. Aproximaciones normales de las distribuciones de probabilidades bino-
mial y de Poisson
a. Para la aproximación normal de la distribución binomial, use una
J
distribución nonnal con media n1f y desviación estándar n 1t'(I - n},
siempre que
nn ~ 5 y n(I - it) ~ 5
CAPÍTULO 5 EJERCICIOS
5.62 'Una compallia que realiza ventas por te!Cfono pretende comprar una máquina que
sclecc1nna al azar y marca automáticamente nilmeros telefónico~. La compai\ia uli·
li.taría la máquina para llamar a las residencias <.Jurante la tarde: las llamadas que
correspondan a empresas serian un:i pérdida de tiempo. El fabricante de las maqui·
nas afirma que sr éstas se program:in ~e reduce la ta~a de llamadas a cmprc~as en un
15%. Como una prueba, se \an a seleccionar al a1ar 100 número.; telcfónrcos de
un conjunto muy grande de números posibles
a. ¿Se cumplen las hipótesis de la distribución binomial en este caso.,
b. Encuentre la probahilídad de que al rncnos ~.i de los números correspondan a
alguna empresa.
c . Si en realidad 24 de los 100 números son de empresas. ¿am)ja este hecho -;crías
dudas sohre la afirmación del fabricante'., l:.xplique'>e.
5.63 Rcmuase al ejercicio 5.62.
a . Encuentre el valor esperado y la varianza de Y, el nilmero de llamada<; a teléfonos
de empresas en la muestra.
b. Utilice aproximaciones normales (con y sin correcciones pm continuidad) para
encontrar PC Y~ 24). ¿Qué tan cercanas entre sí ~on las aproximaciones?
5.f>4 Se esuma que en una ciudad de Estados Unidos el 5'1o de las demandas por atención
médica deficiente son fraudulentas. Se toma una muestra aleatoria de 50 demandas.
a. e.Cuál es la probabilidad de que al menos una demand;i en 13 rnue:.tra sea frau-
dulenta?
b. ¿Cuál es la probabilidad de que al menos 4 demanda<> \Can fraudulentas'!
5.65 Remítase al ejercicio 5.64. U11licc una aprox1macion de Porsson para responder a
los apartados (a))' (b). ¡,Es bucn3 la aproximación?
5.66 En una ciudad, de 30.000 tarjetas de crcdilo bancarias en circulación, 300 han sido
anuladas (por huno o falta de pago). l;n comerciante recibe 100 tarjctas diferentes
en un día.
a. ¿Cuántos conjuntos distintos de 100 tarjetas puede recibir el comc::rc1antc'! No
realice ningún cálculo numcrico a menos que usted tenga un gusto sobrenatural
por los números muy grandes.
b. e.Cuántos conjuntos de 100 tarjetas oo contienen ningun;i tarjeta anulada? Nueva-
mente. evite la aritmctica.
c. Escriha una expresión para la probahilidad de no ohtc::ner tar:jetas anuladas en
una muestra de 1OO.
d. Escriha una expresión para la probahilidad de obtener dos o menos ta~jetas ;inu-
ladas en la muestra.
5.67 Remítase a los incisos (e) y (d) del ejercicio 5.66.
a. Escriba expresiones para Ja.s aproximaciones binomiales de estas probabi lidades.
b. lltilicc una aproximación de Po1sson para obtener respuestas numcncas que
correspondan a estas prohab1lidadcs.
5.6R Algunas personas afirman que hay una tcndc::ncia a despla1..nr a las mujc::rcs que ocu·
pan cargos gerenciales hacia áreas de menor relevancia, tales como las relaeioocs
púhlicas o la dirección de personal. en contraste con áreas centrales como la pro-
ducción. la comercialización y las finanzas. Suponga que un3 compai'lía tiene 24
hombres y 6 mujeres ocupando puestos gerenciales l>c estos cargos, 14 se conside·
ran como poco relevantes o marginales.
a. ¿De cuántas manera~ se pueden seleccionar los 14 gerentes de las áreas
marginales?
E¡erc:1c1os 223
h. ¡,De cuántas maneras ~e pueden seleccionar los gerentes de las áreas marginales.
de modo que 5 de las 6 mujeres estcn incluidas entre ellos?
c. Si los gerentes de las áreas margínah:s se seleccionan al atar. ¡.cuál es la proba-
bilidad de que al meno-; 5 de ellos sean mujeres"
5.69 Suponga que en una planta industrial ocurren accidentes que retrasan el trahajo >
que éstos siguen una distribución de Poísson con una medía de 0.12 por"día. Sea
Y= número de accidentes en un periodo de 1O días.
a. Encuentre /'(Y= 1) y P(YS 1).
b. Encuentre E( Y} y O"r
5.70 En el ejercicio 5.69. ¿,sería acertada la aproximación normal?
5. 71 Se supone que la demanda semanal de saco" de harina de 5 lihras en un supermer·
cado es aproximadamente normal. con una demanda medía de 72.0 saco~ y una
desviación estándar de 1.6 SllCOS. Sea r demanda en una ~emana panicular.
a. Encuentre P(>' ~ 72.8) y P(71.2 $ Y :S 72 .8).
h. Encuentre P( Y "2: 74.0).
c. La política de compras del supermercado es que la proba.hilidad de dcsahasto
(i.e. que la demanda supere a Ja ofena) sea del 1%. ¡,Cuántos sacos de harina se
deben tener en el almacén para alcan1..ar esta meta?
5.72 Remítase al ejercicio 5.71.
a. ¿Cuál es Ja probabilidad de que la demanda sea superior a los 73 sacos en una se-
mana particular?
b. ¡,Cuál es la prohabilidad de que la demanda sea superior a los 73 sacos en exac-
tamente 3 de 4 semanas consecutivas? Suponga que las demandas semanales son
independientes.
5.73 Al confeccionar uniformes mílitares se desperdicia ciena. cantidad de material. Un
fabricante encontró que el desperdicio sigue una distrihución normal con media
4.1 % y desviación estándar 0.6% de un lote a otro.
a. En un Jote particular, ¿cu~I es la probahilidad de que el desperdicio exce-
da del S%?
b. Si la cantidad de material necesaria para un lote es de 4700 yardas, y se dispone
de 5000 yardas de material. ¿,cu:il es la prohabilidad de que el material disponi-
ble sea suficiente?
5.74 Suponga. en el ejercício 5.73. que un conador panicular excede el 5% de desperdi-
cio en 8 de ca.da 10 lotes.
a . ¿Cuál es la probabilidad de exceder el 5% en al menos R de 10 lotes?
h. Un resultado de esta naturale1a. ¿iodicaria de forma concluyente que el con:idor
es ineficiente'!
5.15 Un modem es un aparato que permite que dos computadoras se comuniquen entre
si. Las especificaciones para estos disrositivos electrónicos exigen que el numero
medio de errores en Ja transmisión sea de 1 por cada 5000 palahras (o mejor). Se
pondrá a. prueba un modem particular efectuando una transmisión de 25.000 pala-
bras. Si ocurren 8 efTores o mi\s en la transmisión. el dispositivo será rechazado. Su-
ponga que las probahilídades de Poisson son aplicahles y que el modem justo
alcan".a el estandar de 1 por 5000.
a. ¿Cuál es la probahilidad de que el aparato sea aceptado?
b. ¿Puede usted pensar en alguna razón por la que las hipótesis de Poisson no se-
rían válidas?
5.76 Suponga que la distrihución de Poisson es aplicable en el ejercicio 5.15. pero que el
modem tiene una tasa de error media de 1 por ca.da 2500 palabras. de modo que no
cumple con las especificaciones. ¿Cuál es la probabilidad de que el dispositivo sea
aceptado?
.·
224 S CASOS ESPECIALES DE DISTRIBUCION DE PROBABILIDADES
5. 77 Los ejecutivos de una compaftia de bebidas gaseosas desean ensayar una fúrmula
novedosa para su principal producto. La nue\ a hebida se prueha en comparación
¡on la bebida actual. Se toma una muestra de 1000 clientes potenciales, )' a cada
uno de ellos se le da un vaso con la fórmula actual y un vaso con la nueva. l.os va-
sos están etiquetados con las letras 11 y K para evitar sesgos indeseados. Cada clien-
te indica una preferencia. Suponga que, de hecho. los clientes no pueden encontrar
ninguna diferencia y están, en efecto, adi\'ínando Defina Y como el número de
clientes (entre 1000) que muestran preferencia por la nueva hcb1da
a. ¿Qué distribución de prohabilidades se debería aplicar a Y? 1 as hipótesic; subya-
centes a esta distribución, ¿parecen plausibles en este cuntc>.to?
b. Encuentre la media y la desviación estándar de Y.
5.78 Encuentre la probabilidad aproximada de que la variahle aleatoria r del ejercicio
5. 77 no sea mayor que 460. ¿Debe ria ser exacta la aproximación?
5. 79 tina empresa considera la posibilidad de utilizar técnicas de venta por tele fono
(telemorketmg) como complemento de los método<; tradicionales. Se estima que
una de cada 100 llamadas resulta en una venia. Suponga que rn un día se hace n
250 llamadas.
a. Escriba una expresión para la pro h:lbilidad de que haya 5 o menos \cotas. No
haga ningún cálculo aritmético.
b. ¿Qué supuso usted al responder al inciso (a)? ¿Es alguna de estas suposiciones
francamente irrazonable?
5.80 a. Utilice una aproximación normal para encontrar el \alor numérico de la probabi-
lidad en el inciso (a) del ejercicio S.79.
b. Utilice una aproximación de Poisson par:i encontrar el valor numérico de la
misma probabilidad.
c. ¿Qué aproximación debería ser mejor? ¿Por qué?
5.& 1 Remítase al ejercicio 5.79. Sea Y= número de llamadas hechas hasta alcannr la
primera venta.
a. Encuentre la media y la des\ iación estándar de Y.
b. Encuentre P(Y .. 1) y P( Y~ 100). ¿Cuál es mayor.,
5.82 · En la situación descrita en el ejercicio 5.79, defina Y como el numero de ll:imadas
hechas hasta alcan1.ar la cuarta venta (incluyendo esta última llamada).
a. Escriba una expresión para la prohabilidad de que )'sea al menos 400. No nece-
sita usted hacer ningun cálculo aritmético.
b. Encuentre la varian1.a de Y.
5.83 El director general de una corporación debe seleccionar J personas para dmg1r la
campaí'la anual de beneficencia de Ja empresa. lla) tres divisiones (A. H y C) den-
tro de l:i empresa y 5, 6 y 4 individuos, respectivamente. dentro de la..; d1' isiones,
que podrfan ser seleccionados.
a. ¿Cuántas combinaciones de 3 individuos se pueden hacer, de modo que c:ida uno
de ellos provenga de una división distinta'!
b. Suponga que el director general selecciona los individuos al a1ar. ¿Cuál es la
probabilidad de que al menos 2 de ellos provengan de la división A?
5.84 Remítase al inciso (b) del ejercicio 5.83. Sea }' = nümero de individuos selecciona-
dos de la di\1s1ón A. Encuentre el valor esperado y la \.arian1a ck Y.
5.85 La computadora que controla los cajeros automáticos de un banco queda fuera de
servicio en ocasiones. El tiempo medio entre dos fallas es de S.O días. Defina Y
como el tiempo de espera hasta que sucede la siguiente falla.
a. Encuentre la probabilidad de que el sistema no falle en una semana (7 días).
b. Encuentre la rrobab1lidad de que el tiempo transcurrido hasla la siguiente falla
sea de al meno-; 2 semanas
E1erc1cios 225
5 94 Suponga que. en el juego de la lotto del ejercicio 5.91, un millún de jugadores es·
cogen independientemente 6 números.
'ti. 1.Qué dl\tnhuciún de probabilidad se aplica a la varfable aleatoria Y = número de
jugadorcc; que c~cogen los mismos 6 numeros'?
b l·ncucntre una expresión para/'( Y O). No realice ningún calculo aritmético.
c. Escriba una expresión para P( Y ~ 2).
S.95 a En el ejercicio 5.94 , encuentre el valor esperado y la varianta de la v:iriable
aleatoria Y.
b. l Jtilice una aproximación de Poisson para encontrar P( Y 0) y P( Y ~ 2). ¡,Cuán
preci"ll debería ser la aproximación?
c. Sí usted tiene una calculadora apropiada, encuentre el \alor numérico exacto de
la pmbabilidad y compárelo con la probabilidad aproximada que encontró en el
inciso (b).
S.96 En el ejercicio 5.94, ;,se dehcria utílinr una aproximación normal para c:ilcular
P(Y 0)yP{Y~2)?¿Porqué?
5.97 Si en el juego de la/.""" descrito en el ejercicio S.94 nadie escoge los 6 números
corrtttos, el premio principal no se repane. en ve1. de ello, el dinero se acumula
para el siguiente sorteo. Si no hay ganadores en varios sorteos consecutivos. el pre·
mio potencial puede llegar a ser de millones de dólares Suponga. como en el ejer·
cicio 5.94, que en cada sorteo un millón de jugadores escogen independientemente
6 numcros. Defina la variable aleatona X ~ número de sorteos necesarios par:i ohte·
ncr al menos un ganador.
a . ¿Que distribución de probahilidades se aplica a-~ Deliend.:i su afirmación.
b. Encuentre la media y la desviación esttmdar de X.
c. Escriha una expresión para P(X ~ 3). En términos de lo que sucede en el juego
de la lutto, ¡,qué significa el e\'ento X= 3?
5.98 Uay una ohjeción a lo dicho en el ejercicio 5.97. t-:n realidad, si no hay ganador en
l o 2 sorteos consecutivos. los noticieros informan del enorme premio potenc1:il. y
mucha mis gente participa en el juego. Demuestre que este hecho infringe una de
las hipótesis que se hicieron en el ejercicio 5 97.
5.99 En cierta ciudad, ocurren incendios en casas hahitadas a r:11.ón de uno cad:i dos di:u.
a. ¡,Cuál es el número esperado de incendios de casas hahitadas en un periodo de
7 días?
b. Encuentre la probabilidad de que haya al menos 4 inccnd10s en una semana.
c. ¡,Qué ba supuesto usted :icerca de la ocurrencia de incendios al responder al in·
ciso (b)? ;,Pa~ce alguna de las hipótesis francamente irratonable?
5.100 Rcmitase al ejercicio 5.99. Encuentre la probabilidad de que transcurran J dias
sin que haya ningún incendio. ¡,Cuál es el tiempo esperado entre 2 incendios con·
secutivos?
5.101 El operario de una macrocomputadora recibe peticiones imprevistas para montar
cintas de datos en el sistema. Como política, estas solicitudes deben ~er atendidas a
la hre\edad posible; debido a ello, se tiene que interrumpir el llujo del trabajo pro-
gramado. Los datos indican que la ta~ de tales peticiones durante el turno de 9 A.M.
a 5 r.M. es alredcdur de t .5 por bora. Sea Y = número de solicitudes recihidas en un
turno de 9 A .M. a 5 r . M
a . Encuentre la media) la des\'iacióo estándar de Y.
h. Encuentre P(Y> 8).
5.102 Remítase al ejercicio S.101. Encuentre la probabilidad de que el tiempo transcurri-
do entre dos solicitudes consecutivas sea al menos de dos hora.e;.
5.1 03 El gerente de sistemas del ejercicio 5.101 ohserva que la demanda para la in~tala
ción imprevista de cintas de datos \aria durante la jornada laboral normal. 1-.ntre lai;
Estudio de caso: 01stnbuc1ones especiales 227
La ley de lo!. rromedios dice que el mayor número de copiadoras en al4uiler debe
comrcn<..ar tales aumentos súbitos. de modo que no es necesario hacer un incremen-
to ~rororcional en el número de técnicos.
f-1 presidente le ha pedido a usted que examine el problema, panicularmente
el riesgo de postergar servicios para el día siguiente. El presidente tiene interés ~n
leer material técnico, pero no ha tenido ninguna educación formal en estadística,
así que usted tendr:í que exponer sus ideas con clandad
e ·~ /' Í TU l O
MUESTREO ALEATORIO Y
6 DISTRIBUCIONES MUESTRALES
Nos encontramos en una sicuación que nos permite combinar las ideas relativas a la sín-
tesis de datos del capítulo 2 con los conceptos de la probabilidad de los capirulos 3 - 5
para obtener la noción central de la estadística, la idea de distribución muestra! de un
estadístico. Los ~sLadísticos sumarios (que resumen Jos datos): medias, medianas,
desviaciones estándar, etc., varían de una muestra a otra. Esto ocurre porque las
muestras de una población !>C to man aleatoriamente, de modo que las medias (por
ejemplo) de dos muestras de la misma población pueden diferir en cierto grado.
Las muestras de procesos activos como la producción o las ventas se ven afectadas
por factores aleatorios que escapan de control, de modo que dos medias muestralcs
del mismo proceso diferirán aleatoriamente. La distribución muestra! de un estadís-
tico sumario es una fonna de describir la variabilidad de éste de una muestra a otra.
Bajo ciertas hipótesis, la teoría de la probabilidad se puede utilizar para obte-
ner una distribución muestra!. De hecho, la importancia de esa teorla en este texto
radica en su aplicación a las distribuciones muestrales. Algunos conceptos de la pro-
babilidad, como los de valor esperado y desviación estándar de una variable aleato-
ria, se utiliz.arán con insistencia en este capitulo.
la aleatoriedad y la probabilidad se relacionan con los estadísticos sumarios
por la vía del muestreo aleatorio. En la sección 6.1 explicaremos por qué es impor-
tante el muestreo aleatorio y cómo se lleva a cabo. Después, en la sección 6.2, recu-
rriremos a Ja definición básica del concepto de distribución muestra! y utilizaremos,
en la sección 6.3, el valor esperado y la desviación estándar ~n el contexto de las
distribuciones muestrales. En la sección 6.4 aplicaremos las ideas básicas al caso
especial más importante, a saber, el de media muestra!. En esta sección nos enfren-
Laremos en primer lugar con un resultado matemático crucial, d Teorema Central del
Límite, del que continuamente haremos uso de ahí en adelante. En la sección 6.5
consideraremos este teorema con más detalle: sus interpretaciones y falsos sentidos.
Por último, en la sección 6.6. consideraremos cómo se puede utili1.ar la computado-
ra para complementar las ideas matemáticas de este capítulo con simulaciones he·
chas con su ayuda.
Este capítulo es necesariamente teórico. Los resultados que en él exponemos ~e
utili.t.arán una y otra vez en los métodos de los capítulos subsiguientes. Dicho~ uso-.
229
230 6 MUESTREO ALEATORIO Y DISTRIBUCIONES MUESTRALES
tal vez no sean obvios en una primero lectura, pero le prometemos que podrá \ erlos
m~ adelante. Tenga paciencia.
'
6.1 MUESTREO ALEATORIO
La mayoría de los libros de estadística, incluyendo a éste. dicen que ha> que utili-
•
zar el muestreo aleatorio para reunir úatos. La razón fundamental para utiliz:ir un
muestreo aleatorio es la de asegurar que las inferencias que se hacen con base en
'l>C,go de 'elección los datos de la muestra no estén distorsionadas por un srsgo dr selecció n. Hay un
sesgo de selección siempre que hay una tendencia sistemátic.i a !iobrcMimar o sub-
estimar alguna parte de la población. Por ejemplo. una muestra telefónica de fami-
lias en una región, conducida entre las 9 A.M. y las 5 P.M.• tendría un se-..ero ~e~go
hacia las familias donde, por lo meno~ un miembro, no trabaja. Por lo tanto. cua~
les4uiera inferencias que se hiciesen con base en los datos de la muestra estarían
desviadas hacia los actitudes u opiniones de personas que no trabajan y podrían no
ser representativas de las familias de la región. Del mismo modo, una muestra de
cuentas úe crédito que se realiza con base en un conjunto de transacciones, C\taría
sesgada hacia las cuentas activas. con multitud úe operaciones com<?rciales, y ale-
jada de las inactivas. Las inferencias a partir de estos datos podrían no n:ílcjar las
característica\ del conjunto de todas las cuentas. Un plan de muestreo aleatorio. por
definición, evita este tipo de sesgos.
Ya hemos indicaúo que un muestreo aleatorio simple es un proceso en el cual
cada muestra posible de un tama1'o dado tiene la misma probabilidad de ser sekc-
cionada. Ohtcner uno muestra \ erdaderamente aleatoria, o al menos aproximada-
mente aleatoria, requiere de cierto raciocinio y esfuerzo Una muestra al<?atoria no es
una muestra casual o desordenada. La población objetivo se debe identificar. En
principio. se debería elaborar una lista de todos los elementos de la población y se-
leccionar aleatoriamente aquéllos que estarán incluidos en la muestra, utilw1ndo una
tabla de números aleatorios.
Solución f la) que definir en primer lugar la pohlación objetivo. ¿Se trntu di.: todoc; los cheques
per..orole!. e>.pediJos en un periodo dado? ¿O se trata de todo., lo~ cheques negocia-
do!. por la cámara úe compensación de la reserva federal durante dicho periodo de
tiempo'! Ha) una diferencia, pues un cheque que se paga en efocti\O en el banco en
el que fue expedido nunca llega a la cámara de comp1.:nsac1ón Suponga que se elige
la úefinición de la cámara de compensación. El s1gu1ente paso es cc,tablcccr un mé-
toúo de muestreo aleatorio. Uno podría, en principio. pon<?r una identificación numé-
rica a cada uno de los 326.274 (o el número que sea) cheques procesaúos por la
cámara en un día particular. Acto seguido. se podría extraer una mucstr..i aleatoria de
1000 chc¡,¡ues seleccionando. 1000 números aleatorios de seis dígitos y los cheques
corrc!.pond1entes (dejando tle lado 000000) cualquier numero mayor que 326,274).
6. 1 Muestreo aleatono
r 231
Obviamente. ésta seria una forma poco práctica y costosa de obtener una mues-
tra aleatoria. Tal método sólo sirve como una idealización con la que se pueden
comparar otros métodos más prácticos. Otra posibilidad es elegir sistemáticamente
un cheque de cada 300. Este método no es en rcnlidad un muestreo aleatorio, pues,
por ejemplo, en la muestra no podrian quedar incluidos dos cheques sucesivos. Sin
lugar a dudas, podriamos imaginar algunas situaciones en las que la elección de un
cheque de cada 300 podría introducir algún tipo de sesgo. No obstante, este proce-
so da la imprt.'Sión de que produce una buena aproximación a un muestreo aleatorio
y a un costo muy aceptable. •
recorremos la lila y utilizamos Jos tres primeros dígitos. Para obtener una muestra
aleatoria de 1O individuos tomados de una población de 916 individuos. numeramos
a los fr\dividuos en el marco de muestreo del 000 al 915 y seleccionamos los prime-
ros 1O números. a saber 24, 130 (utilizando sólo 241 ). 483(60). 225(27 ). 972(75),
763(93), 648(09), 151(79), 248(30). 493(40)) 320(81 ). Si uno de los numeros
aleatorios es ma)or que 91 S, como por ejemplo 972. lo ignoramo~ y obtenemos otro
número en su lugar. Por ejemplo, sustituimos 972 por 306(80). que es el siguiente
número de la tabla 9 del apéndice. Si queremos tomar una muestra sin
recmpla1.amicnto, •también ignoramos todas las repct1c1ones de los números. Por
supuesto, no es necesario depender de la tabla; pr:ícucarnente, cualquier programa de
computadora puede generar una serie de números aleatorios igualmente útilco;
EJEMPLO 6.2 Suponga que se va a tomar una muestra de 4 minoristas de un marco muestra[ de
1943 de ellos. Si consultamos Ja tabla 9 de números alentorios del apéndice en la
fila 3, columna 1, y leemos venicalmcnte las columnas, los primeros 1O registros
son 24,130, 42,167, 37,570, 77,921, 99,562, 96,301, 89,579, 85,475, 28,918,
63,553. ¿Qué minoristas debcrian integrar la muestra'!
Solución U na de las mu..: has maneras en que uno puede utilizar estos números consiste en ig-
norar el último dígito y seleccionar sólo valores entre 000 J y 1943, ambos inclusi-
ve; así, ignore 2143, 4216, y así sucesivamente. Continuando a lo largo de l:i
columna obtenemos los números 0942 (fila 13 ), 1036 ( fi Ja 14 ), 071 1 (fila 15) y
0236. Bajo la hipóiesis de que estamos haciendo un muestreo sin reemplazamiento,
ignoramos las rcpeliciones. (También podríamos haber utilizado una computadora
para seleccionar muestras aleatorias en el intenalo de 0001 a 1943.) •
• Se dice que hay un mucscn:o sin reempluamiento (o sin reemplazo) cuando los elementos ya 1eleccio.-·
dos 1e sepann de la población. de modo que no pueden volver a CS(Ogerst. (N. d~I T.)
6 2 Estadinicos muestrales y d1stribuc1ones muestrales 233
Una vez tomada una muestra y obtenidos los datos numéricos la primera tarea es
sintetizarlos. En el capítulo 2 definimos muchas medidas que resumen los datos,
tales como la media y la desviación estándar de la muestra. Cada una de ellas es un
c'ltadístico ejemplo de un estadístico muc~ tral
mucs trnl No se puede predecir con exactitud el valor numérico que tendrá un estadis-
tico muestra!. Aun si sabemos que la media poblacional µ es 216.3 7 dólares y que
la desviación estándar poblacional aes de 32.90 dólares (es más, aun si conoccmo'>
completamente la distribución poblacional) no podemos decir que la media muc!.tral
f será exactamente igual a 216.37 dólares. Un estadístico muestrol es una variable
234 6 MUESTREO ALEATO.IUO Y DISTRIBUCIONES MUESTRALES
aleatoria. Está sujeto a un:l variación aleatoria porque se hasa en una mucstm. t:lm·
bi~n aleatoria, de mediciones tomadas de la población de interés. Al igual que otras
variables aleatorias. los estadísticos muestrales tienen una distribuciún de probabi·
lidades A la distribución de prohabilidadcs teórica de un estadístico muestra! se le
lli\trihución llama di'ltrihución mu~st ral del estadístico_]
mnl"•lr:il Uno de los problemas básicos de la estadística matemática es la derivación de
distribuciones muestrales. Las técnicas que utilizamos inclu)·en los métodos hásicos
de la probabilidad del capitulo 3, los métodos de Montccarlo (que analizaremos en
Ja sección 6.6) y muchas otras fonnas de manipulación matemática. En esta sección
mostraremos cómo se puede obtener la distribución muestra! de f para una pobla-
ción simphficad::i. Más adelante. en otras secciones. presentaremos varios resultados
de alcance general.
EJEMPLO 6.3 Se va a calcular la media muestra! y a partir de una muestra aleatoria de tamar'lo
2 tom::ida de una población 4ue consiste en los 5 valores ($2, $3. $4, $5 y $6). En-
cuentre la d istribución muestra! de f con b3se en una muestr.i de tam::il'lo 2.
2/10
1110
2.5 3 35 4 4.5 5 55
FIGURA6.I D1stnbuc16n muestral de Y: ejemplo 6.3 •
6.2 Estadí1t1cos muestrales y d1str1bucK>nes muestrales 235
4
Py(2.5) + Pr(3) + Py(51 + Py(5.5) = -10
EJEMPLO 6.4 Rcmitase ul ejemplo 6.3. ¿Cómo podemos utili1.ar una computadora para aproxi-
mar la distribución muestra) de Y con base en n = 2 observaciones'!
So/uc1on
'
Suponga que decidimos simular 10,000 muestras de tam:iño 2 de la población
del ejemplo 6.3. Para generar 10,000 dígitos aleatorios (O, 1,. ,9) con una dis-
tribución uniforme podemos utilizar una computadora. Como señalamos en el
ejemplo 6.3, hay 1O muestras posibles. La muestra 2, 3 (.'v = 2 .5) se puede
asignar al dígito O, la muestra 2, 4 {.Í' =- 3), al dígito 1, ... • y la muestra S, 6
(.V = 5.5 ). al dígito 9. Así, cada muestra posible tiene la misma proh:ibdidad.
Esto resulta en 10,000 valores .v. A continuación mostramos los valores y las
frecuencias relativas correspondientes :
Valor de ¡: : 2.5 3O 3.5 4o 4 5 5.0 5.5
Frecuencia· 1024 991 2006 :?018 1975 1005 9HJ
frecuencia relativa: 10:?4 0991 2006 .:?OIH 1975 1005 09111
Observe ~ue estas frecuencias relativas simuladas son mu} cercanas a las probabi-
lidades teóricas 0.1, 0.1, 0.2, 0.2. 0.2, 0.1 y O. l. Este método siempre proporciona
distribuciones aproximadas que se pueden mejorar aumentandQ el número de repe-
ticiones (y. por lo lanto, el costo). •
EJEMPLO 6.5 Encontramos que la distrihución muestra) de Y en el ejemplo 6.4 asigna una pro-
hnbilidad de 2/ JO a .Y= 4.5. ¿Cómo se interpreta este resultado?
So/uc1on Ha} al menos e.los interpretaciones muy provechosas. Primero, podemos supo-
ner que se ha tomado un número mu)' grande de muestras de t:imaño 2 de ei.ta
población (conceptualmente, un número infinito de muestras). En tal caso. la
fracción de muestras que. en el límite, producirían una media muestral de .i.s
seria 0.2. Alternativamente. podemos suponer que se ha preparado una lista de
todas las muei.tras posibles de tamaño 2; de éstas, 2 de cada 1O tendrán u na
med1:1 muestra! de 4.5. •
En este libro dem aremos tan sólo algunas dbtnhuc1onci. (mucstralcs ) teoru.:as
muy simples. Las más complicadas requieren dt: unn matemática compleja que no
entra l!n nuestras prioridades. En camhio. nos concentraremos en las hipótesis sub-
yacentes a la teoría y en las consecuencias que trae consigo transgredir tales hipóte-
sis. Para la deducción de los resultados le sugerimos consulte un huen libro de
estadística matemática tal como Larsen y Marx l I 986)
Evidentemente, las d1stribuc1ones muestrale!> 1;imb1én se pueden calcular para
muestras que se toman con reemplazamiento. Sí, en el ejemplo 6.3. la muestra se
tom:i con reemplazamiento. Ja distribución muestra! de )'es la siguiente:
aleatorios de 2 dígitos permitiendo que cada uno de los números OO. 01, 02 y 03
corresponda a y "' 2. cada uno de los números desde 04 hasta 11 corresponda a
y :!.5. y así suceshamente. Las frecuencias rdativas de tal estudio serian mu~
cercanas ::i las probabilidades que se muestran. •
ECT) = µ + µ + .. · + 11 = nµ
Var(T) = ª2 +al + ... + o2 = naz
--- r
ar=, Var(T) =..,¡na
6 l Val«•s ..pe~s y errores ei~nd.,. de la1 sumu y lu. medias muenralu 239
EJEMPLO 6.6 Suponga que en una oficina regional del programa de asistencia m¿dica para perso-
nas mayores de 65 ailos (.Wedicart!, en Estados Unidos) el promedio en el límite del
número semanal de solicitudes de atención es de 62,000. y que la desviación están-
dar es de 7000. Si suponemos que las solicttudes semanales durante un período de
4 semanas constituye una muestra aleatoria de uimai\o 4, ¿cuál es el valor esperado
y la desviación estándar de solicitudes en este penodo?
EJEMPLO 6.7 Encuentre, en la 'iituación del ejemplo 6.6. el valor esperado y el error estánd:ir del
número de '\Olicitudes semanales durante un periodo de 4 semana~ .
EJEMPLO 6.8 Suponga 4ue el gerente de un supermercado ~uicre estimar el tiempo medio para
pagar la cuenta en las cajas que no son rápidas." Un asistente obtiene una muestra
aleatoria de 2 5 tiempos de pago. Si datos prevms sugieren que la des\ iación están-
dar de la población es de 1.1 O minutos. describa la probable desviación de } de la
media poblacinnal µ.hasta ahora desconocida.
Soluc1on La regla empírica indica que aproxim:idamente el 95% lle his \ ece!'. f se encuen-
tra a menos de uos errore.. cst:índar ( 2CJ r) de la media poblacional µ. Paran 2S,
., 2o- 2( 1.10)
-O"r - -
J11 = - --
5
=.44
• (jcneralm~nle, en ur>a c:ijm ripida no se ~rmilc d p:ago de 111ás de 10 anículos ~ ¿ste s~ llene 'lllC ha-
cer en cícctivo (N del T)
Sección 6 l E1erctetos 241
\
. /
muestra se incrementa, Si en el ejemplo 6.8 el tamaño de la muestra hubiese sido 50 /
o 1OO. en vez de 25. los errores probables ( 2<1 y) habrían sido, respectivamente,
0.31o0.22.
Cuando el tamaño muestra! tiende a infinito, el error estándar de la media
muestra! tiende a cero. Esto signific:i que cuando el tama1)0 de la muestra es muy
grande, el error esundar de la media es muy pequeño, y la media muestra! que se
basa en ella es muy próxima a la verdadera media poblacional, con una probabilidad
muy grande.
En la sección 2.3 definimos limites de control, sumando y restando tres des-
viaciones estándar del valor objetivo deseado. La desviación estándar en cuestión
es la desviación esundar de la media muestra), basada en el tamaño de la muestra
utilizada. Por ejemplo, con anterioridad analizamos el caso de las transmisiones au-
tomáticas en el que la presión interna buscada era de 35. La desviación estñndar de
las presiones de transmisiones particulares er:l de alrededor de 1.2, y cada día se to-
maba una muestra de 5 transmisiones. Así, la desviación estándar de Ja media
muestra! {error estándar) debería ser, teóricamente, 1.2 dividido entre la raíz cua-
drada de 5, o 0.54.
En el control de la calidad hay una fuente adicional de variabilidad que no se
encuentra en las muestras tomadas de poblaciones fijas. Aun cuando un proceso esté
bajo control, variará a lo largo del tiempo. Por ejemplo, la \crdadera presión media
de todas las transmisiones puede variar de algún modo (a lo largo del tiempo) en
tomo a 35, aun cuando el proceso sea básicamente satisfactorio. Esta variación adi-
cional con frecuencia hace que la desviación estándar real de las medias muestrales
-;ea un poco mayor que el valor teórico. En el ejemplo de las transmisiones, l:i des-
viación estándar real de las medias era de 0.60.
6.16 Rcmltase a la distribución muestra! del ejercicio 6.13. Demuestre que el valor espe-
rado y la varian7a encontrados en el eJercicio 6.13 concuerdan con los result:idos
teóricos de esta sección.
6. 17 Un asegurador de automóviles ha encontrado que las solicitudes de reparacion tie-
nen un monto promedio de 927 dólares y una desviación estándar de 871 dólares.
Suponga que las siguientes SO solicitudes se consideran como una muestra aleatoria
del proceso a largo plazo.
a. Encuentre el valor esperado y el error estándar del total de las siguientes
50 solicitudes.
b. Encuentre el valor esperado y el error estándar del promedio de las siguientes
SO solicitudes.
6.18 Se puede considerar que una simulación por computador;i es un ¡lroce<;o de mues-
treo. Surionga que se reali1:1 un estudio relall\O al tiempo requcndo para completar
una in\cstigac16n y desarrollar un pro)ecto !la} una incertidumbre considerable en
los tiempos requeridos para complet:ir las di<;tintas partes del proyecto, de modo que
el tiempo de realinc1ón total llene una 'anabilidad muy grande Suponga que el
tiempo de reaJ11..ación tiene una media de 28.2 meses y una desviación estándar de
6.9 meses.
a. S1 la simulación comprende: 1000 ensayos independientes del proyecto, encuentre el
valor tsperado y el error esl.ándar de la media (de la muestra) de la simulación.
b. F.ncuentre el valor esperado y el error estándar si se realizan 4000 simulaciones.
242 6 MUESTREO ALEATORIO Y DISTRIBUCIONES MUESTRALES
I'( Y> 12.00) = P(: > (12.00 - 12.10) 0.040) = P(: > 2.50)
= .5000 + J9l8 = .993R (a partir de la tabla 3 del apéndice)
EJEMPLO 6.9 Una compa1'ía maderera planea conar 400 árboles de un bosque muy grande con 50
años de antigüedad La madera que se extrae de cada árbol depende en gran medida
de su diámetro. Suponga que la distribución de los diámetros en el bosque es nom1al
con una medía de 44 pulgadas y una desviación estándar de 4 pulgadas. También su-
ponga (quizá irrcalmcnte) que l<l selección de 400 árboles es efectivamente aleatoria.
Encuentre la probabilidad de que el diámetro promedio de los árboles conados se
encuentre entre 43.S y 44.5 pulgadas.
Solucton ~e supone que 13 distribución poblacional (de los diámetros de todos los árbo-
les en el bosque) cs normal. De los resultados anteriores se sigue que la distri-
bución muestra! de f tambiC:n es normal. El v3lor esperado y el error estándar
.ipropi3dos son
6.'4 D1stribuc10nes muestrales para las medias y las sumas 243
µy=µ= 44
(1 4
<1y = Jñ = .. '400 = .20
.4938'
43.5 44 44.5
1 ,••. -f-.. . ~
FIGURA 6.2 Cálculo de ta probabilidad del ejercicio 6.9 •
• La única excepción que conocemos es el caso de las 11111\ada.s leyes estables, que en ocasiones ae uti·
lizan como modelos financ ieros.
244 6 MUESTREO ALEATORIO Y DISTRIBUCIONES HUESTAALES
01slnbuCt6n muestra!
de r
Una pregunta obvia es: ¿cuán grande es una muc:-.tra suticientcmcnte grande?
El Teorema Central del Limite es un teorema matematico; "n suficientemente gr.rn-
dc" se traduce en ..a medida que n tiende a infinito'', de modo que no contiene la
respuesta a esta pregunta. En un gran número de estudios se ha tratado de rcspomkr
a la cuestión utiliundo otros teoremas matemáticos y simul3c1ones con computado-
ra. Mucho:- libros de texto dan una regla general: utilice la aproximación normal
siempre que n exceda de 30.
Esta regla es una guía básica para utilizar el ícorema Central del Limite. Una
mejor regla consideraría el efecto de Ja asimetría. Si la distribución de la población
es asimétrica. la d1stribuc1ón muestra! real para n 30 o para /1 =40 tambi¿n será
de alguna m:mern asimétrica. tal \eZ menos que la distritiución poblacional, pero lo
suficiente como p::ira hacer de la aproximación normal algo mediocre. Si la distrihu-
ción poblacional es sim¿trica, aun una distribución muestra! con 11 =- 1O o algo así es
not:ihlernentc cercarui a la normal Una mejor regla se basaría en una gráfica de los
datos mucstrales: siempre es buena idea traz.ar una figura de los datos. Si un histo-
grama de los datos de la muestra exhibe una oh\ 1a a:-.imctria (y, por lo tanto, sugie-
re una asimetría para la distribución pot>ladonal), la aproximación normal se
dcbcna utilitar con escepticismo. a menos que" sea un\ :ilor pm,imo a 100 o más.
Si el histogrJma tiene una pcquci\a asimetría. se puede utilíz.-ir la aprox1111a1:ión nor-
mal con confian~. aun con unan igual a 15 o 20. •
• 1.3 c:ihdad de una aprox11nación normal también se \e hgcrlmcnlc a lcct.ida por l.1 forma de l:is colas
en 1;1 población. Aun ~1 l.1 pohlac1on es c.1~1 s1mctr1\"a, puede contener muchos m:h \alorcs extremada·
meme gr.mdc) o c:\trem.1damc111e pc.:¡uc1)0~ que un.1 d1)tnb11c1on c:m normal Una población con las
colas pesad.as en una muestra manifiesta la prcscl\l:Í3 de valores atipu:os. unos pocos \'alorcs indivi-
duales q~ caen muy ICJOS del resto de los datos. l:l 1ra1:1m1cnto de los valores alípkos lo analí1.arcmos
en capítulos posteriores
6 -4 Omnb..c1~s muestrales para las medial y lal sumas 245
EJEMPLO 6. 1O Se utili1ó un programa de cómputo para extraer 1000 muestras de tamaños 4. 10. 30
y 60 de un:i población exponencial que tiene una media )' una desviación estándar
iguales a l. (í·n la sección 6.6 anali7.amos cómo se pueden realizar tales !>Ímulacio-
ncs con una computadora.) L:.n la figura 6.4 se mueMran los histogramas de las me-
dias muestralcs . A medida que se incrementa el tam:iño de la muestra. ¿cómo
cambia la fom1a di.: la distribución de las medias (muestralcs) teóricas'? ¿Cómo cam-
bia la variabilidad de las medias muestralcs'.'
So/uc16n Para /1 = 4, la distribución de las media!> c!t claramente asimétrica hacia la derecha.
aunque no tanto como la distribución exponencial en si. A medida que se irx:rcmen-
ta el tarnar)o de la muestra, las asimetrías decrecen. Para un tamaño <le la mue~tr.i
igual a 60. la distribución <le las medias parece ser muy próxima a la normal. El
Tc!orema Central del Límite indica que la distribución teórica de las medias mues-
trales debería, en verdad, aproximarse a una distrihución normal a medida que d U·
maño de la muestra se incrementa.
Con la escala que se encuentra en la hase de cada histograma. podemos eva-
luar la variabilidad de las medi:is muestrales. A medida que /1 se incrementa, el ran-
go de las medias rnuestralcs decrece, indicando que la 1.aríahilidad también lo hace.
El hecho de que el error estándar de la media muestral decrece a me<lida que /1 se in-
crementa, indica que la variabilidad de las medias muestrales debería decrecer cuan-
do /1 se incrementa. •
FIGURA 6.4 Histogramas de las medias muestrales: (a) muestra de tamano -4; (b) muestra de
tamaño 1O; (e) muestra de tamano 30: (d) muestra de tamano 60
0.27 0.55 o83 1.11 1 39 1.67 1.95 2.23
(b)
EJEMPLO 6. 11 En el caso de los pagos en el supermercado del ejemplo 6.8, se obsen aron los si-
guientes tiempos reales en minutos (n - 251· 0.4. 0.4. 0 .5, 0.5, 0.5, 0.6, 0 .6. O.7. 0.8,
0 .9, 1.1. 1.2. 1.4, 1.S, 1.8. 2.0, 2.3. 2.6, V>. 3.4. 4.2. 5.0, 6 .6, 9 .2. 16.1 ( .ii 2. 70).
¿Es claro que una aproximación normal a la distribución muestra! de f (por ejem-
plo. para muestras futuras de tamaño /1 =25, ) seria sausfactoria?
C1
0.4 0. 4 0.5 0.5 0.5 0.6 0.6 0.7 0.8 0.9 1.1
1.2 1. 4 1.5 1. 8 2.0 2.3 2.6 2.9 3. 4 4.2 5.0
6.6 9.2 16.l
M1dpo1nt CO'.l\t
o 10
9
••••••••••
•••••••••
2
4 2 ••
6 2
a o
10 1 •
12 o
14 o
16 1 •
•
EJE MP LO 6.1 2 Una empresa que vende cortes de corne congelados de 9 on/a!. a los restaurantes
quiere valorar el contenido de grasa de los cortes. Sostiene que el contenido de gra·
su tiene una media de 8.1 % y una desviación estándar del 1.0%. Utilice una aproxi·
mación normal para encontrar la probabilidad de que el contenido medio de grasa
c!n una muestra alcatoria de 25 cortes exceda de 8.5%. ¿Esperaría usted que la
aproximación nonnal fuese precisa?
,, ---
ªt PCY < µ - la;) P(Y < µ - u,) P(Y > µ +u;) P( Y >µ + 2u;)
2 72.46 o o 2160 0336
4 51.23 o 1296 1965 .0521
K 36.23 o 1460 1594 0319
lb 25 62 .0173 . 1876 14R6 0.:!.9S
32 18. 11 .0127 .1543 . 1473 0340
Una de tales situaciones se presenta cuando cada valor i111lí\ idual en una po-
blacíón se piensa como una suma de n terminos independientes. El ejemplo 6.9 es
uno de t.:iles casos; el diámetro de un árbol individual es la suma de un número muy
gr.:mde de términos independiente$, en el que cada término es el crecimiento anual
de dicho árbol. No es irrazonable suponer que al'lo con ai\o los incrementos del diá:
metro son independientes. con distribuciones de probabilidad aproximadamente
iguales.• Por lo tanto, podemos esperar que los valores individuales de los diámc·
tros de los árboles (es decir, de la población) tengan una distribución aproximada·
mente normal. Esta interpretación del Teorema Central del Limite justifica por qué
podemos esperar que algunas poblaciones (mas no todas) tengan una distribución
aproximadamente norm:il.
La aproximación normal de la distribución de probabilidad binomial que pre-
sentamos en el capítulo 5 es otra consecuencia del Teorema Central del Limite. Su-
ponga que asignamos el valor 1 a todos los éxitos en la población y el valor O a los
frac:isos. La media poblacional es el número total de valores 1 dividido entre el ta-
mai'lo de la población; ésta es exactamente la proporción poblacional lí de éxitos.
La varían.la de la población viene a ser TC ( ( - 1r ). En una mue~tra de tamaño n, la
media muestra! Y es justamente la proporción ir de la muestra. De este modo.
Y-µ n-1t
z - - -- = -;::===-
, - JTC(I - l'C)
<1
Jn Jn
tiene un:i distribución aproximadamente normal si n es suficientemente grande. Es
más, la suma de la mue~tra es Y, el número de éxitos.
Y - nn
Z=-======-
, ' mr( l - l'C)
• Ouas n:rs1ones m.U irn:igmati~as del Teorema Central del l.lmitc son ~:\lidas :iun cuando estas hip6-
tcs1s no se satisfag.:in con ~xaetilUd,.
252 6 MUESTREO ALEATORIO Y DISTRIBUCIONES MUESTRALES
de la estadística matemática que concluyen que tal y tal estadístico tiene una distribu-
ción asiroximadamente normal cuando n es suficientemente grande. Las proporcio-
nes muestrales, las medianas, las varianzas y muchos otro!> estadísticos muestrales
tienen distribuciones aproximadamente nonnales para muestras muy grandes. Una
vez que se han encontrado los valores esperados )' los errores estándar para estos
estadísticos, se pueden calcular probabilidades aproximadamente normales.
No obstante, la distribución norm:il no siempre se puede aplicar. El Teorema
Central del Limite se ha malinterpretado para sugerir que toda distribución pobla-
ción, datos observados, o lo que sea, debe ser normal. En particular. algunos estu-
diantes creen que c:ualq111er población grande debe tener una d1stribuc1ón normal.
Los Teoremas Centrales del Límite por Jo general se refieren a '>Urnas o promedios
de muchos términos, pero a menos que estén implicado<; una suma o promedio. el
gran tamaño no significa normalidad por sí mismo. Por ejemplo. todos los indivi-
duos que viven en Estados Unidos constitu~en una enorme población. pero la distri-
bución de la riqueza entre estos individuos es extremadamente asimétrica /\ pesar
de la asimetría en la distribución de la riqueza entre estos individuos. el Teorema
Central del Límite garantiza que J.-1 distribución del ingreso medio de la muestra ( f)
es aproximadamente normal para valort!s suficientemente grandes de 11. Cuando tra-
tamos con datos indi,·iduales, los diagramas son la mejor manera de examinar la
normalidad. La normalidad de las distribuciones mucstrales teóricas se puede pro-
har con m¿todos de simulación, que consideraremos en la siguiente sección.
9 10 11 r2
F,<yl .37 79 1 ()()
P,tyl .n .e ""5
! 06
66 S1mulKt0n~s por compuu.dora 253
Así, al v;ilor simulado 11=0.59, que se encuentra entre 0.38 y 0.79, SI! le asigna el
v;ilor y: 1O(v¿ase la figura 6.5 ). Los demás valores simulados son valores y asig-
nados de l;i misma manera. Los valores de corte para U, a saber 0.37, 0.79, 0.9~ y
1.00, se tomaron de los valores de P,.(r) que se muestran en la figura 6.5.
Si bien este proceso da valores aleatorios Y. aún tenemos que dl!mostr;ir que
estos valores tienen las probabilidades correctas.
Est.is probabilidades concuerdan con las <kscadas. Es mós focil apreciar estas ideas
con una gráfica tal como la figuro 6.5. Se extrae un número aleatorio uni formc-
mcntc distribuido y se le asigna d valor apropiado de Y de la tabla de F.(v).
1.00 -
1
.75 -
1
------------------·
.so -
.25 -
1
1
1 1 1 y
9 10 11 12
FIGURA 6.S S1mulac1ón de valores para una variable aleatoria con fd, Fy(y)
254 6 MUESTREO ALEAT~O y DISTRIBUCIONES MUESTRAles
EJEMPLO 6. 13 Simule seis valores de Y en el caso del cuidado de enfermos coronarios que se ilus·
traen la sección 4.2. Suponga que un generador de núml.'r<h ak:1torios uniformes
prop~rc1ona los siguientes valores: 0.579, 0.286, 0.413. 0. !07, 0.962, 0.494 . A con·
tinuación reproducimos la tabl:i Ftú'):
r: o 2 ) 4 5 b 7 K
f,c 1). .001 .OOJ 006 .011 0:?4 061 IJ9 :?.?4 . J~6
y: 9 10 11 12 1) 14 1s 16 17
f',I rl: 510 672 .782 870 925 964 9KK W7 1 (XIO
método de La simulación, o método de Montecarlo (ignoramos por qué dicho casino reci-
\lon tcc:.a rlo be este honor) es un truco sumamente útil y muy empleado Con esla técnica. es mu)
fácil simular casi cualquier situación aleatoria una vct. que se han hecho las hipé>teo;1s
apropiadas. Modificando las hipótesis. uno puede hacer prucb:is de sen<;ibihdad (c.¡ue
.1-.p.:cto\ "ºn crucialc'>, cuales no lo wn tanto). Ha~ mucha-. otras aphcacione-. de esta
tclnica Podemos uulitar la computadora para calcul.ir el \.alor promedio de un e.-.ta-
distico, calculado sobre. digamos, 1000 muestras. Este promedio es una buena
aproximación a su valor esperado, que es el valor promedio teórico sobre un número
infinito de muestras. O podemos utilizar la computadom para calcular la desviación
estándar de un estadístico para 1000 muestras (o cualquier otro número). Esta desvia-
ción c'>tandar es uno buena aproximación al error estándar del estadlstico; recuerde
que el error estándar de un estadístico es su desviación estándar teórica sobre una in·
linidad de muestras. Para verificar la forma de Ja distribución teórica de un cstadisti·
co, podemos calcular su asimetría o la propensión a los valores atípicos, o trazar
histogramas. La simulación con computadora es una forma extremadamente nexiblc
de poner a prueba la validez de cualesquiera resultados teóricos.
Suponga que una computadora toma 1000 mui::.t~ aleatorias simples, cada
una de tamaño 25, de una población que tiene una distribución normal con media
100 y desviación estandar 15. y calcula la media para cada muestra. Además, supon-
ga que después de calcular todas las medias mucstrales, l:l computadora encuentra
que la media muestra! promedio es de 99.921. que las desviaciones estándar de las
medias muestralcs son 3.014 y que la mediana de las medias muestralcs es 100.003.
Teóricamente. el promedio en el limite debería ser el valor esperado de la media
muestra!. a saber, la media poblacional. El promedio simulado, 99.921, es muy
próximo al valor teórico, 1OO. También la desviación estándar simulada de las
66 S1mulwonft por computadora 255
EJEMPLO 6.14 Un programa de computador:i calcula las medianas de 1000 muestr:is de t:ima"o 25.
tomadas de una población normal que tiene media 100 y desviación estándar 15. l.a
nedi:ina promedio es 100.081, Ja desviación estándar de las medianas es 3. 763 y un
diagrama <le tallo y hojas de las mt'Clianas tiene una apariencia ca.si normal. ¿Qué
indica cada resultado acerca de la distribución muestra! de la mediana mucstrctl en
este caso?
DATA
75 . •
•
•
•
65.•
•
•••
••2• 2
2•
55.• 232
32
22
322*
•
45 . +
•••
••
•
•
15.• •••
•
•
•
25.+ •
•-----····•--·······•·--······+·········•·········••ICCl!S
·2 .5 ·1.5 ·0.5 0. 5 1.5 2.5
<•I
FIGURA 6.6 Diagramas normales para (a) datos con una d1smbuc1on normal; (b) datos con
asimetría hacia la derecha y (e) datos propensos a valores atípicos
2S6 6 MUESTREO ALEATORIO Y OISTRtBUCIONES MUESTAALES
DATA
7.5•
•
6.0•
4 . 5•
•
•
3.0• ••
•••
••
z
•
1.5•
··· ~z·2223
O.O• • • ••
• ··· ·· ·· ··•······ ···•· ··-··· · ·+····· ····•·········•llCOllEI
-2. 5 ·1.5 -0.5 0.5 '·' 2.5
(b)
DATA
6 .0•
•
•• •
3.0• ••
•
•
••2••
22nze
O.O+ ZJ2Z3ll
•zezz
•
•
• •••
-3. 0• •
•
-6 .0•
•
-9. 0•
•······ ··-•·········•·· · ······•·········•········· .. ICOlll
·1.5 •0.5 0.5 1.5 z.s
(C)
observa q04;: los daros asimétricos tienen (en eSt:ncia) un diagrama con fonna di: una
curva única. Los datos simétricos con valores atípicos tienen un diagr;irna con for-
ma de~. Al mirar un diagrama normal generado por una computadora, bu,4uc d
patrón básico gencr31 en ve1. <le buscar "cambios abruptos o en zigzag". l In diagra-
ma normal es particulannentc útil par.i estimar si los datos son propensos a los va-
lores atípicos; 13 forma de S en un diagrama nonnal es, en ocasiones, más fácil de
ver que las colas largas en un histograma. La figura 6.6 nos muestra di:igramas nor-
males generados con una computadora par.i Jatos con una distribución nonnal, da-
tos con asimetrías hacia la derecha y datos propensos a los valores atípicos,
respectivamente. Usted dcbena ser capaz de ver la recta, la curva única y la fonn:l
de S en los diagramas; para observar mejor los patrones, coloque una regla o cual-
quier otro objeto recto sobre el diagrama.
EJEMPLO 6. 15 En la figura 6.7 mostramos un diagrama normal de 1000 medias, cada una h:isaJa
en una muestra de tamaño 1O tomada de una población exponencial (véase.: la sec-
ción 6.7) ¿Indica el diagrama normal que en esta situación la distribución muestra!
de las medias es aproximadamente normal?
valores
...
,,,..
,
···'
..
valores normales
Solución No. Hay una curva muy clara en el diagrama, que indica que la distnbución mues-
tra) de las medias mucstrales es claramente asimétrica en esta situación. •
Las simulaciones por computadora son un complemento muy útil a las deriva-
ciones matemáticas de las distribuciones muestrales, no un sustituto de ellas. Una
simulación por compuwdora comprende necesariamente hipótesis muy específicas
acerca del estadístico y la población subyacente, mientras que un tcoremJ matemá-
tico por lo común se aplica de manera mucho más general. Pero en su cnhdad de
complemento, y de ilustración de resulmdos matemáticos. las simulaciones por com-
pur.adora pueden ser extremadamente valiosas.
EJEMPLO 6. 16 En la figura 6.8 se muestran diagramas normales de 1000 medias, b;isadas en muc!.-
tras de tamaño 30 y 60 de la distribución exponencial. ¿Cuál es el efecto de incrc-
ment.ar el tamaño de la muestra'?
valores
/
/
/
~· -
valores normales
(a)
FIGURA 6.8 Diagrama normal de las medias del e1emplo 6.1 6: (a) tamano de la muestra, 30,
(b) tamano de la muestra, 60
260 6 MUESTREO ALEATORIO Y OISTRJBUCIONES HUESTAALES
valores
....
. ... -..
valores normales
(b)
FIGURA6.8 (Concmuooón)
=--.
valores
./
valores l'lOl'males
(b)
FIGURA 6.9 Histograma (a) y diagrama normal (b) de las medianas de una población
de laplace; ejerc1c10 6.33
262 6 MUESTREO ALEATORIO Y DJSTRIBUCIONES HUESTRALES
6.3::? Se han calculado las medianas de 1000 muestras de t:una"o 30 tomadas de una po-
blación de Laplace (un:i poblaciún simétrica, con una ligera 1endenc1a hacia los va-
" lores atípicos). El promedio de las medianas es 0.0082 y la desviación estándar es
0.2070. ¿Qué indican estos resuhados acerca de la distribución (muestra() teórica de
la mcdian:i'?
6.33 En la figura 6 9 se mueslr.m un histograma y un diagrama normal de las medianas
calculadas en el ejercicio 6.32. " Indican éstos que la distribución tcúrica de la me-
di:ina es aproxim:id:imcnte normal en este caso'?
6.34 Se calculan las medias muestra les (de 1000 muestras cada una) de mu~-stras <le tama-
''ºs 10 y 30 tomadas de una población discrera que llene los valores posible~ 1, 2. ),
4 y 5, con probabilidades respectivas 0.1, 0.2, 0.4, U.2 y 0.1 . Los promedios y des-
viaciones estándar de estas mc<lias son los siguientes:
T:imaño de Des,·iaciún
la mue~tra Media estándar
IO 30076 .3563
30 29986 2006
Resumen
<1
<1y= -
" J;
7. Teorema Central c.lcl Límite para sum;L, y medias: para cualquier pohla-
ción. las distrihuc1oncs muestralés de Te Y son :irroximadamcnte nor-
males, sin es sulicientemcnt~ gr:inde.
CAPÍTULO 6 EJERCICIOS
6.37 Al demostr:ir eo sus semin3rios el papel de: la 'ariahi lidad en el control cstadl~tico
de 13 colidod, el invcstig3dor W. Ed\\ard~ lkming hace que los participantec; intro-
dutcan una p:ilcta de madera con 50 hoyos en un recipiente que contiene un 20°'0 de
holas rojas ~ un 80% de hol:is hl<mcas perfectamente: metcladas.
a. ¿Cuál piensa usted que seria el número esperado de bolas rojas en la "muestra de
la paleta" de 50 h-Olas?
b. Al responder al incisn (3) usted hito una hipótesis. ¿Cuál fue y cómo es quepo-
dría ser errónt:a'>
6 .38 En miles de repeticiones del experimento con las bolas del ejercicio 6.37. Ocming
reporta que el numero promedio de bolac; rojac; es aproximadomentc igual a 9.4.
¿Que indico e ste hecho acerca de la hipótesis que u~ted hito al responder el ejerci-
cio 6.37?
6.39 Una aplicación importante de la idea de muec;trco al control de la calidad es la ins-
pección Je partes o componentes suministrados por los proveedores. Para el monta-
je de una pucrt:i de automóvil, los proveedores deben suministrar los cristales para
las ventanas, los mec3nismos para subir y hajar los cristales. las m:inijas par3 las
puertas, los mecanismos de cerradur:i y los adomos mteriores. Todos estos compo-
nentes se pueden probar para ver si cumplen con las especificaciones de a,iustc ~ du-
rahihdad. Fn particul3r, suponga que un fahncante de automóviles especifica que
las cerraduras de l3S puertas dehcrán funcionar con SU3\ id ad al ser accionadas
S0,000 \eces.
a. ¿Por qué es ahsolutamente necesario utilií'..ar un muestreo al probar las ccrradur:Lc;?
b. l:n m~todo de muestreo posihle sería probar las primeras 5 cerraduras de cada
emharquc de 1000. ¿Por qué seri3 poco recomendable este método?
Ci.40 Una forma de espcci ficar un muestreo para la inspección de las partes de l:is puena'i
de los uutom6viles del ejercicio 6.39. es pedir que se tome un:i muc<;tra ale.itona del
os·~ de c:ida emharque de cada comrionentc y se pruehe. l.os tnmaños de los cmbar·
ques vori:in desde 1000 manijas para las puertas (enviados por un proveedor de ca
lidad desconocida) hasta S0,000 adornos mteriore<; (de un \'iejo proveedor de
calidad reconocida). ¿Seria la regla del 0.5% un criterio de inspección razon3hle'?
6 41 Suponga que se toma una muestra alcatona de 20 mecanismos eléctricos para abrir
y cerrar las ventanas de cada lote de SOOO suministrados al fabricante de automóvi-
les del ejercicio 6. 39. C3da mecanismo de la muestra se prueba sometiéndolo a un
ciclo continuo de ascensos y descensos hasta que falla. Suponga que, de todo el lote.
el tiempo medio hasta fallar (bajo estas condiciones de funcionamiento) es de 4200
ciclos y que 13 desviación estándar es 3400. Para cada muestra se registra el tiempo
medio hasta follar
a. ;.Cuál es el valor esperado de la media muestra!?
E1erc1c1os 265
ramailo de Error
lu muc~lra estándar I'~ f· < µ - 2or) /)( 5' < µ
- -
- "• 1
- ¡>4 r > JI + "i 1 l't Y >
- -¡i +- 2n;
-1
'.! l.l 'X) O.,KK llXHX oxxx .mxx
-1 1() 5-1 04Xl< 01<99 OX99 04XX
K 7.-15 .O:iJ3 1456 l.l56 .033.'
a . Para cada tamafto muestra!, calcule la prohahilidad exacta de que Yse encuentre
a menos de un error estandar de µ.
h. ¡,Es bueoa la aproximación normal para cada n" ¿Qué tanto?
c. Repita los incisos (a) y (b) para valores de Y4l menos de dos errores estándar deµ.
6 .5-1 Los archivos de personal de la oficina principal de una compailia de seguros contie-
nen datos sobre el número de dias de permiso (por enfermedad o por r;i;roncs pcrso-
n:iles) que ha tomado cada uno de los 533 empleados a lo largo del año. Los
números están almacenado~ en la columna 1 del conjunto Je Jatos 'CI l<iC l .DAI..
en el disco de datos de este libro.
a. Obtenga un histograma o un diagrama de tallo) hojas de los datos. ¿,Di ria usted
que los datos de la pohlacion tienen aproximadamente una distribución normal?
h . Obtenga la media ~ la des\'iación estándar. Un programa de computadora proba-
blemente considerará los datos como una muestra, no como una población. ¿Qué
efecto tendrá este hecho en los cálculos? ¿Qué tan importante es la diferencia en
términos numéricos?
c. llaga que la computadora extraiga '.?5 muestras aleatorias de la pohlación. cada
una de tamaño 20. ~ calcule la media de cada muestra.
Estudio de aso: Muestreo y d1stribuc1ones muestrales 267
Usted trabaja en una compai'lía telefónica que presta servicios de larga distancia y
que expide tarjetas de cargo a todo aquel que las solicite. La mayoría de los clientes
son agentes de ventas y ejecutivos de empresas pequei'las y medianas. En tales em-
presas, el pago de las cuentas telefónicas no tiene una prioridad muy alta, de modo
que su compai'lía tiene dificultades de pago con el 8% de sus tarjetas de cargo. Por
con'>iguiente, la compai'lia está considerando establecer un sistema de calificaciones
para el merecimiento de créditos (disponible en una empresa consultora) para deci-
dir si expide o no tarjetas de cargo a los empleados de una determinada empresa.
Para optar por el uso de este sistema en el futuro, Ja compai'lía planea tomar
una muestra de Jos actuales usuarios de su tarjeta de cargo y estimar la calificación
promedio según el sistema. Algunas de las variables del método de registro no es-
tán en la computadora de la compai'lía, de modo que para cada empresa de la mues-
tra se necesita que un empleado dedique cerca de una hora de su tiempo a encontrar
y dar entrada a la información. La compañía no puede decidir cómo tomar la mues-
tra: algunas personas quieren hacer un muestreo de los usuarios de las tarjetas en
fom1a individual, otros quieren tomar una muestra. de las empresas responsables del
pago de las cuentas telefónicas. Algunas personas quieren tomar una muestra de al-
rededor de 200 cuentas; otros dicen que tal muestra sería muy pequei'la comparada
con las (aproximadamente) 80,000 cuentas actuales de la compai\ía.
Nadie parece haber pensado con detenimiento cómo tomar la muestra. aunque
el grupo encargado de los sistemas de infonllación tiene a la mano una lista actua-
lizada de todas las cuentas, que podría clasificarse virtualmente en la forma que se
quisiera. Los especialistas no quieren decir cuál debería ser el promedio, aunque han
268 6 MUESTREO ALEATORIO Y DISTRIBUCIONES MUESTIW.ES
dicho que. en otras aplicaciones del sistema, la g~an mayoría de la~ empresa-. tien-
den a ohtener un valor entre 75 y 85, y que los registros entre 65 y 75 o entre 85 y
95 mJ1son r.iros
Escriba un documento breve acerca de estos problemas, fijando su atcnóón en
cómo se podría tomar la muestra. Dé recomendaciones sobre como seleccionar una
muestra de tamaño 200 o de cualquier otro tamaño Usted puede suponer que sus
lectores sabrán lo que es un promedio. J>t!ro no suponga que sahen mucho acerca de
cuestiones técnicas de Ja estadística. Ocherá tomar en cuenta que sus lectores súlo
podrón dedicar su atención a un texto de una página de longitud.
•
•
Algunos estudiantes quieren entender por c¡uJ la fórmula para el error cstúndar de
f tiene la forma que tiene. Para su beneplácito, este apéndice contiene un bosque-
jo de 13 demostración. Hay dos ideas fundamentales. cada una estahlccida en térmi·
nos de la varianza. En primer lugar, al multiplicar una variable aleatoria por una
con~tante se multiplica su varianza por el rnadruclo de la constante. Fn scgundo lu-
g:ir. la 'ari:in1..a de una suma de variables aleatorias imlepcndiente.\· es la suma de
J~s \arianzas de las componentes. Por lo tanto,
var1r1 = vare="Y.)
1 porque dividir cntrc n equivale a
= 11·, Var('°
L.
l ;) multiplicar por lln
porquc las variables indi' iduaks son,
por hipótesis, independientes
porque las varíahks se toman
de una poolaci<ln con varianz.a <i
""2 al
=-;;z-=-;-
Tomando la r:iíl cuadrada ohtenemos el error estándar de Y:
f1
=--¡=
.jn
ll11 l.as calificaciones de una prueba de aptitude$ para los trah3jadorcs de una cadcoa de
monta¡c tienen una distribución aproximadamente normal. con una media de ::!00 y
una desviación estándar de 40
E1erc1c1os de repaso para los capitulos ~-6 269
RJO ¿Qué hipótesis adicionales además de las ya establccidóis hií'o usted para responder
al ejercicio R29?
10 1 "Cierto programa de radio tiene un catálogo a travcs del cual los aficionados a 13 mü-
s1co pueden pedir discos o cintas. así como algunas prend:is de "recuerdo". Supon·
ga que el 40% Je los pedidos no incluyen discos ni cintas. el 300/o incluye un di<ieo
o cinta, el 15% incluye 2, el 10% incluye 3 y el 5% inclu)e 4 rara cada número po-
"ble de discos o cintas solicitados, el porcentaje de pedido~ con O, I, 2, 3, 4 o 5 "re-
cuerdos" es como se indico en la siguiente tabla:
Discos/cintas solicitados o 2 3 4 5
o o 60 30 5 ) :?
1 10 40 25 15 5 5
2 5 30 40 10 !< 7
) ) 15
.,.,
~~ 30 :?O 10
4 l 4 15 JO 40 10
_(4-.t)Cxy+I)
f (x,yl - 30(I + 2x) • X I, 2. ), )' ,. 0, J.2 ..l. 4
R-'9 encuentre los valores esperados y l¡¡s v::iriam·.as de X, Y y T •X+ r para las v::inahles
::ileatorias del ejercicio R47.
IUO .Suponga que en el ejercicio R47 redefinimos X e Y par:i cxpres:ul:is en segundos en
"ez de milésimas de segundo. Asi, ,'('"" 0.001 X e r" =0.001 Y. Encuentre los v:ilores
csper:idos )' las V3rianzas de x·. )" )'
T' =X'+ Y'.
R5 I Nos referimos nuevamente al ejcrcicín R4 7. Se elige una muestra aleatoria de '.?50
paquetes y se registra el ttemPQ de transmisión de cada uno de ellos.
a. Encuentre la probabilidad apro,imJda de que el tiempo promedio de 1ransnus1ón
de la muestra sea m.i~ or que 0.180 segundos
b. l.a probabilidad apro,imada que se calculó en el incisn (a). ,debería ser un:i hue·
na aproximación a la pmhabilid.l<.I cxact:i que desconocemos'! Explique por qué.
/,/. •.A1~
., ~
~
CAPÍTULO }l~
,
ESTIMACION PUNTUAL ~J
7
1
1
'· 1
,,
.7
Estimador
Un c'tinuulor 8 de un parámetro 6 es una función de los valores muestralcs alea-
torios Y1, }'2, •••• r,, que proporciona una estimnción puntual de 6 Un estimador es
en sí mismo una vnriable aleatoria y por consiguiente tiene una distribución (mues-
tra)) teórica.
•
Hay una distinción técnica entre un estim<ldar como una función de variables
aleatori::i.s y una t.•.~fimación como un único número. Es la distinción l'ntre un pro·
ceso (el estimador) y el resultado de dicho proceso (la estimación). Lo 4ue en rea-
lidad importa de esta definición es que nosotros sólo podemos definir huenos
procesos (estimadores). mas no garantizar buenos resultados (estimaciones). Por
ejemplo. más adelante mostraremos que cuando se toma una muestra de una po-
blación normal, la media muestra! es el mejor estimador. Sin embargo. no pode-
mos garantizar que el resultado sea óptimo todas las veces. Es decir. no podemos
garantizar que. para cada muestra, la media muestra! esté siempre más ccrca n la
media poblacional que. dignmos. la mediana muestra! Lo más que podemos hacer
es encontrar estimndores que den buenos resultados en el limite.
EJEMPLO 7.1 Si Yp }'~e }'~son los resultados (aleatorios) de una muestra de tres indi\'iduos
toma.da de una población. defina el estimador de la mctlia muestra!. Si en una
muestra concreta se ohtienen los valores 106.8. 102.0 y 105 O. (,cuál es la cst1ma-
ción resultante?
7 1 Emmadore$ puntuales 275
Solución La estimación
se puede interpretar como el proceso "toma una muestra de tres valores > prom¿dia-
los" En esta mut!stra concreta, y 1 = 106.8. \ ~ 102.0 e y, 105.0 > se obtiene
.Y = 104.6 como una estimación de Ja media poblacional hasada en esta mues-
tra específica. •
Estimador insesgado
Un t!sllmador () que es una función de los datos muestrales }'1• Y~ . ...• Y,. se cono-
ce como estimador inse!IJ:?ado del_ par.imetro poblac1onal ()si su 'alor esperado es
igu~I a 8. Dicho de otra manera, 9 es un estimador insesgado del parámetro () si
E( 8 ) - 9.
D1stnbuc1on D1stribuc1on
muestra! de muestral de
8, 82
(a) (b)
FIGURA 7.1 Ilustración de (a) un estimador msesgado y (b) un estimador sesgado
276 7 ESTIMACION PUNTUAL
EJEMPLO 7.2 Sur)(Jnga que }'" Y2 ••• , Yn representan los valores obtenidos en una mui:stra alea-
toria «imple tomada de una población que tiene media µ y varianza a~. Verifique
que f. la media muestra!, es un estimador insesgado deµ.
Estimador eficiente
Se dice que un estimador es l"I más eficiente par:i un problema particular cuando
tiene el error estándar más peque~o de todos los estim:>dore~ in!>esgados posibles.
9 8
(a) (b)
EJEMPLO 7.3 Un programa di! computadora selecciona 1000 muestras de t.ama~o JO de una pobla-
ción con distribución normal. media 50 y des\ iación estándar 1O. Para cada mues-
tra se calculan la media, la mediana y la media truncada (promedio del 80% de los
datos centrales). El valor promedio y la desvi::ición estándar de cad::i conjunto de es-
timaciones de las 1000 muestras son los siguientes:
¿Parecen ser insesgados los tres estadlsticos'? ¿Cuál de ellos parece ser el más
eficiente?
Solución hl valor promedio de cada estimador es (una aproximación ~11nulatl,1 a) '>U valor es-
perado. Dicho valor promedio resulta en cada caso muy próximo a la media pobla-
cional, 50. Esto último p::ircce indicar que. a l meno'> en esta situación, los tres
estimadores son insesgatlos. La desviación estándar de cada estimador es (una
• aproximación simulada a) su error estándar. Como la media muestra! tiene el me-
nor error estándar, todo parece indicar que en esta situación es el estimador más
eficiente . •
EJEMPLO 7.4 Se programó una computadora para tomar 1000 muestras, cada un.a de tama~o 30,
de una población con colas extremadamente anchas y sumamente procli'e a los
valore~atipicos. con una media igual a cero y una desviación estándar de 9.95 r>ara
cada muestra se calcularon la media, la mediana y algunas medias truncadas. Los
\ alorcs promedio)' las desviaciones estándar de las estimacione:, ~(m las siguientes:
¿Qué indican esto~ resultados acerca del sesgo y la eficiencia de los tres estimado-
res al tcimar mue)>tras de esta población?
Soluc1on Los tres promedios, aproximaciones a Jos \'alores esperados. son casi cero. de modo
que los tres estimadores parecen ser insesgados. En este i:aso, la desviación estándar
de la mediana parece ser mucho más pequc~a que la desviación estandar de la me·
dia y un poco más pequel'la que el de la media truncada. Así, para esta f>Oblaci6n
proclive a los valores atípicos, la mediana muestnil parece ser más eficiente que la
media truncada y mucho más eficiente que la rrn!dia muestra!. •
Estimador consistente
Un estimador es consistente si se aproxima al panímetro pohlacional con probabili·
dad uno a medida que el tamal'lo de la muestra tiende a infinito.
•
Por ejemplo, la medía muestra! Yde una muestra aleatoria tiene valor espera-
doµ y un error estándar que se aproxima a cero a medida que n tiende a infinito.
Por lo tanto, cuando el !amaño de la muestra tiende a infinito, f se aproxima aµ
tanto como se quiera. De acuerdo con la definición, Yes consistente. (Todos los es-
timadores que se analizan en este libro son consistentes siempre y cuando las hipó-
tesis establecidas se cumplan.)
Un estimador inconsistente es a todas luces un mal estimador. No es aconse-
jable dar una estimación imprecisa basada en una infinidad de datos. cosa que pue-
de suceder si el sesgo de un escimador no se aproxima a O a med1d3 que n cic:nde a
infinito. UtiliZA1r el 25 percentil de la muestra para estimar la mediana poblacional
produciría un cscimador inconsistenle. También habría inconsistencia si el error es-
tándar de un estimador no tiende a cero a medida que el tamaño mul!stral crece r>or
lo general, lo~ estimadores inconsiscentes son el resultado de alguna equivocación
o. lo que es más probable, resultan del fracaso de una hipótesis clave.
Sección 7.1 E1eraaos 279
7.1 Se toma una muestra aleatoria de 20 vicepresidentes (entre las 500 principales em·
presas según la rcvisla Fortune) y se determina el porcentaje del ingreso bruto que
cada uno pagó como impuesto federal sobre la renla. Los datos son
a. ¿,Qué sugiere en este caso el estudio acerca del sesgo de los tres estimadores'.'
b. ¿Cuál de los tres estimadores parece ser el más eficiente?
74 Una muestra de 30 ediciones de un periódico semanal revela los siguientes datos numé-
ricos sobre la longitud de las columnas de Olnuncios cl:uificados, mcdidn en pulg3das:
171 185 193 199 204 210 :!16 218 221 223
225 228 228 230 234 235 237 240 241 243
245 249 251 254 257 262 263 271 280 379
a. Calcule la media y la mediann.
b. Calcule la media truncnda al 20%, el promedio del 80°0 de los valores centrales.
280 7 EST'MACIÓN PUNTUAL
• - Y1 + ··· + Y4
µ, = y"" 4 )'
l.os resultados del capitulo -t indican que, para varíahles aleatorias independientes,
7.7 l~ n la figura 7.3 se muestran tres diagramas de caja para las medias, medias trunca·
das (eliminando el 10% superior y el 10% inferior de los datos) y mediana.<; para
muestras de tamar'lo 10 de una población de l.aplace (ligeramente propensa a valo·
res atípicos). La media de esta población es cero,
a. ¿Parecen insesgados los tres estimadores?
b. ¿Qué estimador parece ser el más eficiente?
·- *---11 11~- . . •
media
* *· - il 11--- .. 1
o
. . -------il 111------ - o
mediana
7.8 Los promedios y las desü.1ciones est:indar de los tres estimadores lid ejercicio 7.7
-;on los siguientes:
¿Son consistentes estos resultados con las respuestas que dio al ejercicio 7.7?
7. 9 Se toman muestras de ta mallo 30 de una pobl:ición uní forme . La media poblacional
es 0.500 > la varianza poblacional es 0.08333. l.a distribución poblacional es simé-
trica y absolutamente plana. No bay valores menores que cero ni mayores que uno.
de modo que no hay pos1bil1dad alguna de que existan valores atipicos. Se han ob·
tenido los siguientes promedios> desviaciones estándar:
*_____.¡ l·il.--· ..
media
FIGURA 7.4 Diagramas de caja para tres estimadores; población uniforme, n =30
282 7 ESTIMACIÓN PUNTUAL.
EJEMPLO 7.6 Suponga que se toma una muestra de tamaño 200 de una población de tamaño
20,000. Compare las varianzas y los errores estándar de las medias de la muestra
basadas en muestreos con y sin reemplazamiento. ¿Qué procedimiento de muestreo
proporciona el estimador más eficiente deµ?
7.l M~streo con y $In ~mpbllmtel\to 283
Solución
Método de
mueslreo Con reemplazamiento Sin rccmpla1..amiento
~ (2~.000 -
al
Var( Y) = 005a 1 200) ,,. .00495a:
200 200 .0.000 - 1
11 o J20.000 - 200 .. 07()4o
- - ...0707a ~
J200 " 200 20,000 - 1
El muestreo sin reemplazamiento nos da el error estándar más pequeño, pero la di-
ferencia ap:irece en el tercer dígito significativo del error estándar (el cuarto deci-
mal). Es poco probable que esta diferenci:i tenga alguna importancia prác1ica. •
EJEMPLO 7. 7 Considere las siguientes situaciones de muestreo en que Y se utilil'I para estimarµ .
a. Tome una muestra de 100 items (sin reemplal'lmiento) dc una población
de 1000.
b. Tome una muestra de 1000 itcms (sin reemplazamiento) de una población
de 1,000,000
Si todo lo demás se supone igual, ¿cuál de los dos procedimientos produce el error
estándar más pequeño para Y?
Solución En la situación (a) usted tomaria una muestra de una frac ció n m:h J!rnndc de la
pol>la l'ití n . mientras que en la situación (b) usted tendría un rn111aiio mi•" g r:111tlc:
d e la mu c~ tra Para ver cuál de estos procedimientos es más preciso, podemos cal-
cular el error esuíndar de Y en ambos casos:
C1 JI .000.000 - 1000
(b) r====
"1000
000000 1
l. • -
= .03 160
Suponiendo que las dos poblaciones tienen varianzas iguales (y por consiguiente
iguales desviaciones estándar), el error estándar de Y es mucho m:ís pequeño en
la situación (b). •
EJEMPLO 7 .8 Una computadora está programada para extraer 1000 muestras de tamaño 20 de
una población, tomando las muestras con y sin reemplazamiento. La distribución
de la población es
Individuos: 00 09 10 29 JO 69 70 89 90 99
Valor: r 2 J 4 5
(La media de la población es 3.) Se calculan las medias muestrales para todas ellas,
y se obtienen los promedios y las desviaciones estándar: 2.9996 y 0.249 con rcem-
plat.amiento y 3.008 y 0.216 sin reemplazamiento.
a . ¿Parece ser insesgada la media muestra!?
b. ¿Qué parece ser más eficiente, tomar las muestras con reemplazamiento o
sin él?
Solución a. Los promedios son muy próximos a 3.0, de modo que la media muestra! parece
ser insesgada en este caso.
b. Las desviaciones estándar (aproximaciones simuladas a los errores están-
dar) son más pequei\as en el caso del muestreo sin reemplazamiento. de modo que
el mueMreo sin reemplazamiento parece ser más diciente. •
EJEMPLO 7.9 Se repite la simulación del ejemplo 7.8, pero con los siguientes cambios. La pobla-
ción se conviene en
Jndh iduos· O 99 100 299 300 699 700 899 900 999
Valor: J 2 3 4 5
(Nue\amente, la media poblacional es 3.) En esta simulación, el tamai\o de la
muestra es 50. Obsene que en este caso el tamaño de la muestra es 2.5 veces el ta-
maño de la muestra del ejemplo 7.8. pero que la muestra es tan sólo el 5% de lapo·
blación, en contraste con el 20% del ejemplo :mterior. Se obtienen los siguientes
resultados: con reemplazamiento. promedio=- 3.002 y desviación estándar= 0.153;
sin reemplazamiento, promedio - 2. 997 y desviación estándar 20 O. 150.
¿,Qué indica una comparación entre este ejemplo> el ejemplo 7.8 acerca de la
importancia relativa de la fracción de la muestra y el tama1'o de la muestra?
Soluetón En cnda caso. la aproximación simulada al error estándar es más pequeña en este
ejemplo que en el 7 .8. Así, el efecto del incremento del tamaño de la muestra es m:ís
imponante que el efecto de considerar una fracción más pequeí'la de la población. •
7.1;\ F.n el ejercicio 7.11 se considera una muestra de 50 transmisiones automaticas to·
mada de una producción semanal de 2200. En las semanas con un día festivo la pro-
ducción se reduce en un 20%. a 1760 transmisiones. ¿Se desprende d1: lo anterior
7.l Estimadores de máxima wrositn1htud (J) 285
que el tJmar'o muestra! también se ruede reducir en un 20%, a 40, y tener la misma
precisión al estjmar d promedio semanal?
7 . 14 a. En el ejercicio 7.11, ¿esperaría usted que la muestra de las transm1s1oncs se to-
mase con reemplazamiento o sin él? e.Por qué?
h. Suponga que la muestra se tomará sin reempli11amicnto, que la des' iación están-
dar en el limite de las presiones es 2.40 libras por pulgada cuadrada y que el ta-
mai'lo muestra! es 50. ¿Es significativo para el e"or estánd:ir de '3 media muestra!
el que 111 producción semanal cambie de 2200 a 1760 transm1s1oncs? ¡,En qué
magnitud,,
7 . 15 l Jn poht1co que contiende por un c'\car'o en la legislatura estatal ohservó que en una
encuesta se hab1a tomado una muestra de 2000 electores registrados de un total de
8,000,000 (uno de cada 4000) y que la encuesta tenia un error probable de i 3 pun-
tns porcentuales. El candidato planea tomar una muestra, guardando la misma pro-
porción de los 40,000 electores de su distrito legislativo )' espera que el error
prohahle se:i igual. ¿En dónde cstfl equivocado el ra.mnamicnto del candidato'?
7 .16 Se toma una muestra de 90 individuos responsables de hacer pronósticos para cier-
tos b3ncos regionales. Hay 650 personas que pueden ser escogidas. Cada uno de los
individuos en la muestra predice el porcentaje del crecimiento del ingreso disponi-
hle real p3r;i el 31\o siguiente. Suponga que la desviación estándar de los pronósti-
cos de la roblación es 0,4o/o.
a. F.n la práctica, ¿se debería tom:ir la mue'itra con reemplazamiento o sin él?
b. Calcule el error estándar de la media suponiendo que la muestra es con
rec mplUól miento.
c. Calcule el error estándar de J;i media suponiendo que la inuc~tra e<; sin rccm-
pla1amiento.
d. ¿Qué error estándar es más pequcl\o? ¿Por cu!nto?
7. \ 7 I· n los di as de elecciones, con frecuencia los espectadores de televisión suelen escu-
char, en los progr3mas nocturnos, proyecciones acerca de quién ser;i el ganador en
un estado bas;idas en un peque~o porcentaje de l;i votación. Para cst3dos tales como
Nueva Yor~ y California, )3 proyección puede basarse en un 1% de los votos, pero
para cst;idos tales como W}oming y Dcl;i\\3re. la proyección tiene como b;ise un
porcentaje mucho más gr;inde. ¿Por qué'l
Soluci6n Si comenzamos con la tabla 1 del apéndice en 7t - O.OS paran = 20 e y ... 16, encon-
tramos que 13 probabilidad de 16 éxitos en 20 ensayos se incrementa cuando 'amos
de 1t - 0.05 a 1t = O.SO. Para seguir leyendo Ja tabla, debemos buscar en et extremo
derecho el valor de y. y en ta parte de abajo el valor de Jt. La probabilidad de 16 éxi-
tos en 20 ensayos se incrementa a medida que retrocedemos a lo largo de la tabla
hasta alcanzar un máximo (de 0.2182) en 1t = 0.80 Entre los valores de Jt que se
muestran en la tabla 1 del apéndice, 1t = 0.80 es la estimación de máxima verosimi-
litud cuando}' = 16 y n =20. •
Función de verosimilitud
Para datos discretos y" y 2, ••• , Yn• la función de verosimilitud les la probabilidad
de observar los datos que de hecho se están observando:
L(Y1·>'1·· ··· Y··O} = P{y1.Y1 ..... y.)
que consideramos como una funci6n del parámetro desconocido de la población, O.
Si los datos se toman de una distribución continua/r(y), la distribución de proba-
bilidad P se reemplaZ41 por la función de densidad/ :
L(y¡, Yi· ··· ·Y··O) = /(Y1.Y2···.,y,.)
Suponiendo que los valores muestrales se toman independientemente, podemos ob-
tener la probabilidad Po la densidad f como un producto:
L(Y1·Y2· ····Y··9) = P(y 1)P(y2) ... P(y,.)
o
EJEMPLO 7. 1 1 Suponga que, independientemente de los que sucede el resto de los días, el número
de trabajos que llegan en un día o un taller mecánico tiene una distribución de Pois-
son con media desconocidaµ. Suponga además que el primer dfa de la muc'itra lle-
go sólo un trabajo y que el segundo (y último} día llegan cuatro. Escriba la función
de- verosimilitud.
µ'
P()') = t-•-
y!
Los valores observados son y 1 "" 1 e y 2 =4. Lo verosimilitud es
EJEMPLO 7.12 Remítase a la función lle verosimilitud que se encontró en el ejemplo 7 . 11 . Indique
cómo podríamos utilizar uno tabla de probobilidades de Poisson para enc(lntrar la
estimación máximo verosímil deµ.
., 5! 2 3
L( ... n)-= !)! n (1 - tt)
2
2 3
---==O
n 1-n
EJEMPLO 7. 13 Remítase al ejemplo 7.11. Encuentre la estimación má.ximo verosímil deµ utilizan-
do el cálculo diferencial.
de modo que la estimación máximo verosímil deµ esµ = 512 2 5. Una vez más.
el resultado que se obtiene con el cálculo diferencial concuercfa con el resultado
que se encontró numéricamente. •
Para cualquier valor especifico de (T, digamos 3.72. la deri\'ada del logaritmo de la
veros1m1litud con resrccto aµ es
{}' - µ)
o+ o+¿ ~.122 ( o
1-.l estimador de máxima verosimilitud o;c encucntr.i rl.'sol\'iendo la ecuación que se
obtiene al igualar esta expresión a cero
'(}', µ) o
i...,3}22
Una forma de ver que µ - y es la solución de esta ecuacit'ln es ohsen ando que
t(y, - .v) =O. Obviamente, la elección de cualquier valor particular de a es irre-
levante para el cálculo del estimador de máxima verosimilitud de µ; nuestra elec-
ción de a 3.72 fue arbitraria y no tuvo ningún efecto en los cálculos 1 n gener.il.
cuando la distribución de la roblación es normal. la media muestral es el estimador
m:is diciente y tamhién el estimador de máxima \'Crosimilitud . /\si, saht!mos 4ue
cuando la población es normal, la media muestra! es un estimador de múxima ve-
rosimilitud de la media pohlacional y tarnhh!n, que la proporción muestra! es el es-
timador de máxima \erosimilitud de la probahilidad de éxito cn'un experimento
binomial.
SECCI Ó N 7 .3 EJERCICIOS
7 .18 Con frecuencia es factible suponer que loi; tiempos >'¡. Y~ . ... entre las llegadas de
clientes a una tienda tienen una d1 ~1r1h11ción cxpo~ncial negativa.
f,,(y) = º(' .,
290 7 ESTIMACIÓN PUNTUAL
l
o- ... -¿11-r.= r
7 .20 Una expresión de la función de densidad logarítmica normal está dJda por la si-
guiente función matemática:
.
Sugerencia: para maximinr la verosimilitud, minimice
¿ ººª r. - nil
1. 1
Re-sumen 791
se compara con una distribución nonnal, simétrica en tomo al valor de 9, pero tien-
de a presentar valores atípicos. Suponga que cinco observaciones tomadas de una
densidad de Laplace nos dan y 1 - 2.6, y 2 = 5.1, yl 4.7. y~,. 9.6 e Ys 5.0.
a. Encuentre la media y la mediana de los datos muestrales.
b. Calcule la función de verosimilitud cuando 9 es igual a cada uno de los valores
que se encontraron en el inciso (a).
c. ¿Puede ser la media muestra! el estimador de mbima verosimilitud de una po-
blación de Laplace? Explique su razonamiento
Resumen
•
Este capitulo es el primero que se dedica a hacer inferencias acerca de la población
(o proceso) subyacente basándose en los datos de la muestra. En él se introducen
algunos principios para elegir buenos estadísticos que resuman la muestra. Hay dos
criterios fundamentales: Los estadísticos deben ser insesgados (ser correctos en el
promedio) y deben ser eficientes (tener la menor variabilidad posible y, por consi-
guiente, el error estándar más peque~o posible). La ele<:ción del mejor estadístico
depende de las hipótesis que se hagan acerca de la población o del proceso subya-
cente. Por consiguiente, las gráficas de los datos son extremadamente útiles para
seleccionar estimadores razonablemente buenos.
La noción de eficiencia se puede aplicar al considerar muestras con reempla-
zamiento o sin él. Los resultados indican que tomar muestras sin reemplazamiento
es mós cticicntc. pero por un margen 1nsignificantc en la mayona de los casos. Los
resuh3dos también indican qu~ el tamai\o 3bsoluto muestra! es el factor primordial
al determinar la precisión de la estimación; y que, sorprendentemente, la fracción
de ta población de donde se toma la muestra tiene muy poca importancia.
CAPITuLO 7 EJERCICIOS
7.23 Una aplicación del método de Montecarlo incluye 5000 muestras, cada una de tama-
rto 30, de una población con colas anchas que tiene una media de 300 y una desvia-
ción estándar de 25. En cada muestra se calculan la media, la mediana y la media
truncada ni 20%:
o
.. ·-·--1 11 1 - - - - -- - ••
media
media truncada al
·+ -·
so•.
me dia na
·+ -
-6 .20 -4.68 ·3.16 ·1 .64 ·0.12 1.40 2.92 4 .44
FIGURA 7.5 Diagramas de ca1a de tres estimadores: población prope nsa a valores atípicos.
n=60
1i, _. .5 Y, + 5 Y1
¡,I .:? Y, + .ll )'!
til = .8 Y, + .2 Y2
P.() (y-1)! 11
'(I )'•
' }' - (k - l)!(y - k)! - JC
sa les
100. 11 98 .2 99 .9 99 .S 100.1 100 . 1 100.7 103 . 9 80 . S
99 .9 100 . 0 911 . 3 142.l 101.3 98 . 2 98 . 2 98.7 93 . 2
101.8 93 . 6 101.2 99 . 7 91 .7 100. l 119. 4 99. 3 101 . 6
84 .0 100.5 100. 3 99.1 99.6 100. 1 100 . 2 102. 1 100 . 2
100 .9 99 . 5 104 .8 102 . 7 109 .3 98 .0
HIN HAX 01 03
sales 80 .50 142 . 30 911 .60 101.22
HiStOiJr8111 of sales N = 42
Hidpoiot Count
80 1 •
85 1 •
90 o
95 2 ••
100 32 ••••••••••••• •• • ••••••••••••••••
105 3 •••
110 1 •
115 o
120 1 •
125 o
130 o
135 o
140 1 •
•
140•
sel es
120•
... . •
•
••
•
80• •
········+·····-···+·········•·········•·········•········nacorea
· 1.60 ·0. 80 0.00 0.80 1.60
FIGURA 7.6 Diagrama normal para los ejercicios 7.35-7.36 Minitab para el ejerc1c10 7.37
f r ac t t on
o. 157895 0. 160000 o. 105263 o. 142657 0.250000 0 . 166667 0.2 10526
o. 142857 0. 200000 0. 200000 o. 160000 0. 210526 o. 142857 o.2212n
0.090909 0.1 25000 o . 142857 o. 142857 0.21 0526 o. 130435 o. 136361.
0.269231 o. 13636' o. 176471 o. 2212n 0. 120000 0 . 176471 0. 210526
0.238095
0. 130435
0 . 210526
o. 192306
º· 111111
0.187500
0. 187500
0. 210526
o . 142857
o. 117647
0.095238
0. 200000
0. 210526
0 . 125000
0 . 230769 o . 190476 0 .062500 o. 166667 0.083333 0. 142857 0.150000
o . 153846
, o 6
4 o 899
7 1 011
14 1 2223333
24 1 4444444555
(6) , 6666n
20 1 8899
16 2 0001111 111
6 2 2233
,
2 z
z
5
6
MIN MAX 01 03
f r ect l on 0.06250 0. 26923 o. 13488 0. 21053
¿Hay algun3 razón para pcnsM que la media muesmll es un esum:idor ineficiente de
la media poblacional?
7.38 En la figura 7.7 se muestra un diagr:ima normal de los datos del ejercicio 7.37.
¿Confirma la forma del diagr;ima normal su respuesta al ejercicio 7.37?
7 39 Una compaJ'lla que alquila teléfonos celul:ires p:ira automóvil cst;i interesada en l:i
cap:icidad crediticia de sus clientes. Si los pagos dc:I alquiler no se hacen a uempo
(o simplemente no se hacen). la compaJ'lia sufre cu:intiosa~ pérdidas. En general, al-
rededo r dc:I 11 % de los alquileres presentan problemas crediticios. La compaJ'lia ha
decidido ensayar un sistema de registro de créditos para e\aluar a sus futuros clien-
tes. l· I s islcma utili;;a información contahlc de los clientes. tal como el cociente ca·
pital de trabajotgasto; med idas d e la cst:ibilidad del cliente, como el numero de aJ'lo~
en su dom icilio actual, y medidas de la estabilidad de la industria del cliente, como
la variabilidad de las utilidades de un aJ'lo a otro. Toda esta información se combina
para obtener una calificación: mientras mis alta sea éiaa más fiable será e l cliente.
La eompai\ia quiere hacer una estimación del 11 percentil ele la población de sus
cliente s actuales con este sistema de ealiíieaciones, pues planea utilizar dicha cali-
ficación como un limite para otorgar los créditos.
297
0.280+
•
fr 1ct ion-
•
2•
0.210+ 7
2 3
z2
2
2•2
o. 140• 2 7
• 22
•••
•
• •
0.070•
•
········•···-·--··•·········•···-·--··+·········•········nscorea
- 1.60 -0. 80 0.00 0.80 1.60
7.41 La compailla de alquiler de teléfonos del eje:-cicio 7.39 quisiera obtener una mues·
tra de los registros de crédito de 400 climtcs. Los datos se utili7.arian para estimar
no sólo el 11 perccntil, como en el ejercicio 7.39, sino también para estimar la mc-
'ttia. Como una "estimación h1potetica", la compai'Ua ~upone que la desviación es-
tándar de los ~gistros de 18,000 chentcs es alrededor de 12.0
a. Calcule el error estándar de la media mucsr.ral suponiendo un muestreo con reem·
pla7.amiento. llaga el mismo cálculo suponiendo que la muestra se toma sin él.
b. Oe hecho, ¿cómo deberla llevarse a cabo el muestreo? ¿Qué t:in gr.lnde es la di-
ferencia?
c. ¿Se deheria preocupar la compa"ia porque la muestra sólo toma en considera-
ción a menos del 3% de sus clientes?
7.42 l'n anísta hí10 cieno número de impresione~ de una litografia ~ de«pue-; deo;trU)Ó la
plancha. Nunca se re ..eló el número total de impresiones, pero cada copia tenia un
número de serie. lJn corredor de obras de arte se dio cuenta de que el 'alor de cada
copia dependi:l en gran medida del número que se hubiese hecho. También dcscu-
hrtó que las cuatro copias que se encontrahan en ese momento a la venta tenían nú-
meros de serie y 1 14, ) 2 • 4. l ¡ =21 e l '4 = 11. Parece rvonable rnponer que toda~
las copias tienen 13 misma probabilidad de estar a la \cnta, de mod(l que la d1-;1ribu-
ción del número de serie }' deheria ser uniforme:
P,(y)-= 110. para }' .. 1. 2•.. .•O
estimación
µ - 1 96(3) µ µ + 1.96(3)
• Nuevamente, ut1hz.arnos leins mayüsculas para las variables aleatorias y lctta.s minúsculas ¡art loa v1·
lor~s correspondientes. Asl, cuando planeamos tomar una muestra, consideramos probabilidades 1cer·
ca de Y. Cuando la mucstr1 nos proporciona los valon:s 90, 96, 100 y 106, y• 98.
302 8 ESTIMACION POR INTERVAl.05
'
µ 11 + 1.96(3)
y. 1.96(3)
y+ 1 96(3)
Y- =1111"r S: µ ~ Y+ z.,2"r
donde u, = u/ Jñ y za12 es el valor tabulado que tiene un área igual a (1)2 en la
cola derecha Je la distribución normal estándar o tipificada.
•
EJEMPLO 8. 1 Una aerolínea necesita estimar el numero promedio de pasajeros en un vuelo de re-
ciente apertura. Su experiencia es que los datos del primer mes de vuelos son poco
fiables, pero que despucs el número de pasajeros se estabiliza. Por consiguiente, el
número medio de pasajeros se calcula con base en los primeros 20 días hábiles del
segundo mes después de haber iniciado los vuelos (considerados como una mucstr:i
aleatoria de 20 días tomada de una población hipotética form::ida por los días entre
sem;ma). Si la media muestra! es 112.0 y se supone que la desviación estftndar de la
población es 25, encuentre un intervalo de confianza al 90% paro el numero medio
verdadero de pasajeros del vuelo, en el límite .
Solueton Suponemos que la hipoh!tica población del número de pasajeros diarios entre semana
no tiene un sesgo considerable. En tal caso. la distribución muestra! de Y es aproxi-
madamente normal y los resultados del intervalo de confianza son bastante correctos.
aun para un:i muema de sólo 20 días. Para este ejemplo, y 112.0. a;:: 25, y
81 Esumaoón pe< intenr~os de la media poblaoc>Nll con desv1ac160 ~itandar coooc1d1 303
CJ, =
CJI ./20 = 5.59. En tal caso, para un intenalo de confianza al 90%, utili-
zamosz0.os - 1.645 en la fórmula para obtener
EJEMPLO 8.2 Un estudio de Montecarlo considera 5000 muestras, cada una de tamai\o 40, toma-
das de una población aproximadamente normal. Para cada muestra, se calculan in-
tervalos de confianza de la media poblacional al 90% y 95%. Se lleva la cuenta de
aquellas muc)tras para las que la '>crdadcra media se encuentra por debajo. dentro
o por arriba del intervalo de confianza:
¿Cuáles son las frecuencias esperadas'! Compare las frecuencias teóricas (espera-
das) con las observadas.
l ,as frecuencias de la simulación son todas muy próximas a las frecuencias esperada!.•
304 B ESTIHACION POR INTERVALOS
El análisis que hemos realizado en esta sección incluye una hipóte~i ~ poco' ia-
hle: a saber. que se conoce Ja desviación estándar pohlacional. En la práctica. es di-
ficil e~contrar situaciones en las que se descono1ca la media pohlac1onal y se
wno1ca la desviación estánóar. Por lo general. tanto la meJin como la desviación
est:indar se tienen que estimar con base en la mueMra. Como (1 se estima con la
desviación cstanJar muestra!.~. el \erdadcro error estándar de la media. CJIFn. se
estima naturalmi:ntc con si.fñ. Esta estimación introduce otra fuente de error
aleatorio (s varía aleatoriamente, de una muestra a la otra. en torno a a) y, cstricta-
<1u-.tit11cio11 11l'' mente hahl:mdo, invalida nuestra fórmula para i:I intervalo de confian1.a. Afortuna-
r or <l <lamente, la fónnula sigue siendo una muy buena aproximación para muestra!. muy
gr::1ndes. Como regla muy gen,.ral. podemos utilizar esta fórmula cuando n es mayor
que 30;• en la sección 8.S se describe una mejor forma de resolver esta cuestión.
EJEMPLO 8.3 Suponga que la aerolínea del ejemplo 8. 1 torna una mucstr:i de 40 días y encuentra
una media muestra! de 112.0 y una desviación estándar de 25. Encuentre un inter-
valo de confianza al 95% para la media poblacional.
Solución Paro .f - 112, s 25 y n = 40, <J, =25 / ./40 =l95. Así, utili1ando : 0 .025 - 1.96, el
intervalo de confianza al 95% para µ es
112 ± 1.96~3.95) o 104.26 a 119.74 •
SECCIÓN 8. 1 EJERCICIOS
~--~--~----~----------~----~----~----~------------~
8.1 A continuación reproducimos los datos del ejercicio 7 .1 acerca de un.i muestra del
(Xlrccntaje del ingreso bnito que 20 ejecutivos pagaron como impuesto federal sobre
la renta
• Rt>sulta que csla rc¡la coincide con una regla cs1~ndar para rccumr al Teorema Ccn1ral del l.lm1tc.
bta úluma sólo es bueAa para dis1ribuc1oncs de población s1métncas o liscramcntc asimétncas
Secc160 8 1 E¡erocios 305
HT8 > z1nterval 95X conf1<knce ass11111ng s igma • 2.4 for 't1111eusect•
THE ASSUMEO SIGMA •2.40
N HEAN STOEV SE MEAN ~.O PEACENT C. I .
t1mcused 48 13 . 104 2 . 417 0.346 ( 12.424, 13 .784)
• Nnta l1Mc11tcJ • tiempo u1ili7..ado
a. Escriba el intervalo de confiani..a :11 95% rara la media. Indique qué significa la
cifr:.i del 95%.
b. ¿ Indica este intervalo que la media de este taller d11im: de los 12.S minutos del
estándar?
R.8 Tamb1~n se calculó con Minitab un intervalo de confianza al 90•1o para la media uti-
li1ando los mismos datos que en el ejercicio 8. 7.
MT8 > i i nterval 90X conf1~nce essi.níng s1 g11W • 2.4 f or •t1~us ect •
,,Indica este intervalo que: la media de este taller difiere dt: los 12.5 minul!ls del
estándar? ¿Por qué e~ diferente esta respuesta de 13 que se dio en el inciso (b)
del ejercicio 8. 7?
8 .Q El siguiente es un dia¡rama de caja de los datos del ejercicio R 7:
···-·! + !-··---··--·······--· •
+·-··--···+----·-·-·+·-··-·····----·····•···----··•-··-··ti191\9Mf
10.0 12.0 14.0 16.0 18.0 20.0
306 8 ESTIMAOON PORINT!RVALOS
Equivalentemente,
P(ii - 1.96'1. ~ n 5 ñ + J .96a.I ~ .95
Esta expresión tiene el aspecto de una fórmula par.:i el intenalo de confianza, pero
tiénl! el problcmn de qu..: d error e~tánd.u <J,. Jír( 1 ir) /1 comprende al paráme-
tro pohl::lcwnal 1r 4ue se desconoce. Así como podemo'> recmpl:11.ar a con .~ en <J f
cuando n es muy grande, <lcl mismo modo podemos reemplazar 1l( 1 - Jr) con ic ( 1
- ir) en C1ñ . Esto nos proporciona un:i íónnula muy práctica para el intervalo de
confianza de la proporción poblacional:
EJEMPLO 8.4 Suponga que en una muestra de 2200 familias con uno o más televisores, 471 \en
un progrjma particular en un momento dado. Encuentre un intervalo de confian:ta
al 1 >5% para la proporción de la población de familias que ven este programa.
Solucion J
La proporción muestra! es ir - .n 1/2200 = 0.214, y it(I: Tr)/ n =0.00874. El
v;1lor =de Ja tabla que corta un área de la cola derecha de 0.025 es 1.96. El inter-
valo de confiani.a es
apro~i.u:tci(m nor- El método del intervalo de confianza tiene como base una :tflrct\.imaciún
mal a h1 '\ di,tríbu- normal a h1 di,1rihudú11 hinomial que es adecuada para /1 suficientemente gran-
cíoncs binomiales de. La regla es que tanto ntc como n( 1 tr) deberían ser al menos 5, pcm, como Ir
es la proporci6n de la población que desconocemos, la regla se tiene que basar en
n ir y 11( 1 - ic ). Por lo general, si el tamaño muestra! infringe esta regla (o si !>Ólo
se aproxima a ella), el intervalo de confian1..a que se obtiene es <lem::isiado amplio
como para ser informativo. Por ejemplo, si n 20 y ir - 0.20, entonces n re 4 y
el intervalo de confianza al 95% para 1rcs 0.025 S 1!~ 0.375. fate intervalo <le con-
fianza es prácticamente inútil; no conocemos a ningún gerente de producto que
consideraría el enunciado "su participación en el mercado se encuentra entre 2.5%
y 37.5%" como realmente informativo. Sin embargo. aun cuando el tamaño <le la
muestra satisfaga la regla, no C1.tamos seguros de 4uc el intervalo ~ca informativo.
La regla juzga tan sólo la idoneidad del tama1'\o de la muestra y la precisión del in·
tervalo de conliani.a basándose en la aproximación nonnal. Es posible utilizar pro-
babilidades binomiales para encontrar intervalos de confianza exactos, aunque muy
amplios, al 90~o o 95%.
8.1 O El gerente de ventas de un mayorista en hardware encuentra que. Je las últimas 500
llamadas telefónicas a sus clientes (liencfas de computación), 22? resultaron en la
colocación de nuevos productos. Suponiendo que las 500 llamada" representan una
muestra aleatoria, encuentre un intervalo de conlian;r.a al 95% de Ja proporción en el
límite de colocaciones de nue\nS productos.
8. 11 Dé una interpretación vcrhal mu) Jetallada del intcr\'alo de conlian:1a que encontró
en el ejercicio 8.1 O.
8. l 2 Como pane de un estudio de mercado, en un:i muestra de 125 personas se encontró
que 84 de ellas tienen conocimiento de cierto producto Calcule un intcnalo de con-
fian1.a al 90% para la proporción de individuos de la población que tienen conoci-
mrento del producto.
8. 13 ¿Podemos considerar que la aproximación normal subyacente al inter\'alo de con·
fian1a Jel ejercicio 8.12 es adecuada?
308 8 ESTIMAOON POR INTERVALOS
z!,2112
n =--
E2
La amplitud del intervalo de contian1.a es 2E.
•
EJEMPLO 8.5 L's dirigentes sindicales están pn.:ocupados por los informes de 4ue una compar'tía
dentro de su jurisdicción está pagando salario<; interiores a sus empicados ~De qué
tamaño dl!bc ser la rnue:;tra para obtener un intervalo de cnnfian1a al 90° o para el
salario medio por hora de la pohlación. µ.que tenga amplitud igual a un dólar? Su-
ponga que (] - 4.00 dólares.
•
EJEMPLO 8.6 ¿De qué tamar'to debe ser una muestra para obtener un intervalo de confianza al 9S%
paraµ. con una amplitud de 2 décimas de una desviación est:indar (poblacional)?
Soluc1on L;i amplitud busc:ida es '2E =0.2CT. de modo que E= 0.1 CT. f>or lo t::into
3 10 8 ESllM.t.CION POR INTERVALOS
2
( l.%)211l
-(.111) 1
( 1.96)
--- ~
(. l)z
J
84 •
Oeterminar el tamaño rnuestral para d intcr'<alo <le confianza de una propor-
ción es un proceso similar. l.:i íúrmula correspondiente es
:: li(I - if)
E1
El único problema es que el tam:iño muestra! depende de ii. !lasta que se determi-
na el tamai'lo muestra! y se toma la muestra, desconocemos el valor de ii. ! la) va-
rias maneras de resolver este problema. Podemos sustituir ir"' 0.5 en la fórmula
para el tamaño muestra!, lo que resulta en un tam;iño muy conservador, por lo ge-
neral. más grande que el tam:iño requeri<lo. Otra posibilidad es sustituir un vulor de
.i ohtcnido ya ~ea en un estudio previo o en un estudio pi loto . ./\ con ti nuaciún mos-
tramos la fúrmula del tamaño mucstral para estimar una proporción binomial:
es
Nota: uuhce ii = 0.5 para tener un tamaño prudente (más bien grande) de 1:i mues-
trJ. o utilice el valor de ir de algún estudio previo (o estudio piloto). •
EJEMPLO 8.7 El director comercial de cierta compañía que reali1..a ventas por correo dehc preci-
sar con mucho cuidado sus polític:is de crédito. Suponga que la compañí::i sospcch::i
que los anuncios ..:n cierta n:vista han conducido a una tasa mu) elevada <le canc.:e-
laciones (cuentas considcrad;,is im:obrabks). La c.:ompañia quiere ddem1inar un in·
ten·alo de conlianza al 90% par:i Ja proporción d..: c::im.:eladoncs de esta re\'ÍSt:i con
una precisión de t.0.02
l. ¿De cunntas cuentus dehen form;,ir l::i muestra para alcanl'lr la meta'>
b. Si se toma un:i muestra con estas cu..:ntas y se determina que d 10% son
c:rncclacioncs. ¿que inten·alo de confianza al 90% result::i de ello'.'
Secc.On 8 3 E1erc1C1os
0.02 i:on -
. (':l.':
( 1.645 ¡i1.5 ¡l
11 =- -
(.02) 2
:::: 169 1
n = (1.645 )1 (.1)(.91
'02)
2 609
•
Tal como lo indica el ejemplo M.7, h~l\ur In tlctcr111in:1tio11 del tamaiw
mll<''lral en la hipólesis de que ir e' 0.5 1rncck 'cr e\ce .. i\ amente 1>rudcnlc.
Siempre que ha> a información que sugiera que la proporción muc'> tr.11 d11icn: <le
0.5, la l.U\titución ir 0.5 resulta en un tamaño rnuestral muy grande (en exceso).
El intervalo <le conlian1.a correspondiente tient! una amplitud más pt!qucña que el
que St! busca.
N. 15 3. Remitasc al ejemplo 8.5. ¿Oc qué tama"o se debe tom3r una mucslra para obtener
un intervalo de confian1a al 90% con amplitud SO.SO? <.Y con amplitud S0.25?
¿Y con 3mplitud S0.125?
b. En general, ¿cuánto se debe incrementar el tama"o mucstr:il rara reducir la.
amrlitud del intervalo de confian;r:t a la mit3d (utíli7.ando un nivel de confian1.a
específico),,
8.1(, Remítase al ejemplo 8 .6. ¡,Oc qué tamai\o debe ser un:i muestra para obtener una
am)">htud de 3 décimas de una desúaeión estand:ir? <.Y de 4 décimas''
R.17 lJn3 eomrai'ia que vende seguros de: automó,iles quiere encontr:tr el \ 3Jor prome-
dio de las c;olicitudes de reparación de carrocerioi.~ de los automóviles asegurados.
Sus registros combinan Jos importes corre!\pond1en1es 3 carrocerías con todos los dc-
mas, de modo que se debe tomar una muc~tr3 ele i1ohci1udcs indh 1duales. Se busca
un intervalo de confianza al 95o/o con una amplitud no mayor de 50 dólare~ . Se pien·
s:t que la desviación estándar es de alrededor de S400. ¿De qué tamal\o se necesita
13 muestra?
312 8 E511W.OONPORINITRVALOS
8.18 '\uponga que la des' iaciún estándar con.1eturad;i en el ejercicio 8.17 se cnn1cntra
entre los 300 y los -l50 dúlares.
• Calcule el tamai'o requerido muestra! para cr 300 ~ para a .i 'iO
h ¿Qué le sucederi3 a la amplrtud del intervalo de conft;m;ra si se utih1ase el\ alor
de /1 correspondiente a a - 450, cuando en realidad la llC~\iación estandar fuc,c
de 300 dól;ircs?
8. 19 ¡,Piensa usted que el l3mai'o mucstr;il utili1ado en el e1ercic10 8 17 serla adecuado
para suponer que Y tenía una distnhuci<ln muestra! apro:1.iniadaml·ntc normal''
8.'.!0 l In fohric;inte de cajas para dulces está preocupado por la proporción de ca.1as
con imrerfeccioncs (aquéllas que están cuarteadas. rota" o hacen poco apetitmos Jos
caramelos J.
3. ¡,De qué tama"o dche ~er una muc~tra para obtener un intervalo de eunlian1a al
95% para esta proporción, con una amplttud no m;i~nr de O O~'.' l ltilice la su'>ll-
tución consen ador;i 1f - 0.5.
t>. ¡,Cómo camhia la respuest;i al inciso (a) si suponemos que la proporción de c;i.1a~
imperfectas es al menos de 0.005 y no ma~or que 0.0W?
8.-t LA D ISTRIBUCIÓN t
•
Los procedimientos que presentnmos en la sección 8.1 para estimar la mcJi;1 pohb·
\.'tonal ¡i ti~nen como hase la h1pótes1s de l)Uc o <1 se comx:c o se rcali~ un núme-
ro sutic1ente de ohservac1ones (i . ~ .• JO o más) de tal forma que la Jcsviac1ón
estándar muestra! s puede reemplaz:ir a <Jen el error estándar para .Í' ::: CT ! ./ñ. Sin
embargo. hay ocasiones en qLX: es imposibk o mu) costoso ohtencr una muestra
sulici~ntcmcnte grande para hacer inferencias acerca Je la media pohlacional. Por
ej~mplo, realiur 30 ohservaciones del patrón que sigue el trático en las inmedia-
ciones de un puente los' ierncs por la tarde tomaría m:ís de 6 me<;es. fatc puede ser
un periodo mu) extenso de tiempo para proponer medidas com.-ct1vas.
\\'. S. Ciosset encaró un problema similar a principios dd siglo xx cuando. en
la cervecería Guinncss, donde trabajaba, se le pidió que hiciera un dict:\mcn acer·
ca de la calidad media de varias ccn·c1.as. Para akantar sus conclusion~s. tan solo
le proporcionnron algunas mucstrac; sumamente ~que?las.
Gosset creyó que al utiliL.ar el estadístico= para muestras pcqu~1,as
t - µo
q/.j;.
y sustituir o con s. se
~staba subestimando la' ariahilidad en el estadístico. lla-
h1éndose interesado por el problema. resol\'JÓ derivar la distrihución muestra! de
la cantidad
y µo
.~1Fi /
f - JI
s/Fn
y publicó sus resultados en 1908 bajo el seudónimo de "Student", ya que iba en
contra de la política de la compañia publicar sus resultados. Con frecuencia, al
estadístico
l= -
Y-µ
-
s/Jn
t tic Studc·nt se le nombra t de Student y a su distribución distribución t de Student Podemos
sinteti1.ar las propiedades de una distribución t comparándola con una dístribución
normal estándar(:).
o
FIGUAAB.3 Una d1stribuc16n t con una d1str1bución normal superpuesta
t=--
Y-µ
s/Jn
tiene una distribución t con g.I. =n - l.
4. A medida que n se incrementa (o, lo que es lo mismo, los g.I. se incremen-
tan), la distribución t se aproxima a la de.::.
•
314 8 ESTIMACIONPORINTERVALOS
o fa
FIGURA 8.4 Ilustración del área para la distribuc16n t que aparece en la tabl:i '4 del apend1ce
~rado" de libr rtad La definición general del ténnino 2rados dr libertad requiere de la geome-
tría n-dimcnsion:il y del conocimiento del álgebra lineal. En vez de abordar con de-
talle esLa cuestión, tr:i1.arcmo~ de dar una idea intuitiva del significado del término.
El término g.I. se refiere a la desvi:ici6n estándar estimada y se le utiliza para indi-
car el número de pie1.as de información disponibles para ella. La desviación están-
dar se basa en n desviaciones de la media, pero las desviaciones deben sumar O. de
modo que sólo n - 1 desviaciones pueden variar libremente. La última desviación
(la n-ési ma) cst:l determinada por las otras n - 1. Por consiguiente, se dice que el
estadístico t tiene n - l grados de libertad.
Aunque se puede proporcion:ir una fórmula para la función de densidad de la
distribución t, ésta carece de importancia ya que se cuenta con 13blas para evaluar
las probah1lidadcs t. Como / es simétrica, sólo se han tabulado los puntos porcen-
tualc' (áreas o probabilidades) de la cola superior de la distribución t. Éstos apare-
cen en la t:ibla 4 del apéndice. Los grados de libertad (g.1.) se enumeran a lo largo
de Ja columna izquierda de la página. Cada entrada en la tabla especifica un valor
de t, <ligamos t,., al que corresponde un área u hacia su derecha (véase la figura
8.4). A lo largo de la fila superior de la página aparecen varios valores de a. Así,
por ejemplo, con g.I. 0 7. el valor de 1 con un área de 0.05 a su derecha es t .895
(que se encuentra en la columna a - O.OS y en la fila g.I. = 7).
EJEMPLO 8.8 Si se toma una muestra aleatoria de tamai'lo n .::: 15 de una población con distribu-
ción normal, l!ncuentrc
·2.145 o 2.145
Y-µ )
P ( - 2. 145 s s/Jn s; 2.145 - .95
Y-µ
t=--
s/Jn
Cuando n es muy pequeJ'la, los valores de la tabla t son muy grandes, y para
g.I. - 2, un área de 0.025 en la cola derecha se corU en 4.303. A medída que g.I. se
íncrementa, los valores de la tabla 1, para un área dada de la cola, se reducen. En la
última fila, que corresponde a un número ínfmito de grados de libertad, la tabla t
contiene los valores de la distribución normal (z).
Este fenómeno se puede explicar si se considera cómo aparece la distribución
t. El estadístico t se obtiene al reempla1.ar la verdadera dc~viac ión estándar O' por la
desviación eslándar s muestra!, introduciendo de este modo una fuente adicional de
variación aleatoria. Cuando n es muy pequeJ'lo, el valor des puede diferir enorme·
mente del valor de O'. y la distribución t debe tener una varianza bastante grande.
A medida que n aumenta de valor, hay una menor variación aleatoria des con res·
pecto a O', y la varianza de la distríbución t se hace más pequci\a. Cuando n tiende
a infinito, s se aproxima a <J y la única fuente importante de aleatoriedad es f; la
distribución z explica Ja variación de Yen tomo a µ .
La primera vez que consideramos sustituir O' con sutilizamos la regla de que
se podían usar las tablas de zen caso de que n fuese mayor o igual a 30. Los valores
316 8 ESTlMAOON POR INTERVALOS
de la tabla t para 30 g.I. ~on muy próximos a los valores de la tahla normal. cxccpto
para áreas mu) pequeñas de la cola. No obstante, no hay ninguna necesidad de se-
guir ~onservando esta regla en adelante. En vez de ello podemos utilizar las tabl:is I
de manera rutinaria par.i todos los estadísticos t. Si el valor g.1. en curso no aparece
en la tabla. para casi todo lin práctico es sufil:iente hacer una interpolación aproxi-
mada. Otra altemali\a más conservadora consiste en utiliLar el valor mmcdioto in-
ferior de g.I. en la tabla.
EJEMPLO 8.9 Encuentre el punto de separación de un área de 0.025 en la cola derecha para una
muestra all!atoria de tamaño 46 tomada de una población normal: es decir. em:uen-
trc 'oms tal que
Y-µ
p (- Y > f OH
) = .025
s/""
So/uC1on Hay n - 1 - 45 g.I., y los entradas de la tabla para g.I. igual a .JO y 60 son 2 021 )'
2.000, respectivamente. Como el valor de g l. es más pnh1mo a 40 que a 60, t 0 02 \
debe ser más próximo a 2.021quea2 .000. Podemos utili1ar un d1agmma \imple. tal
como el que se muestra a continuación, para encontrar el valor de interpolación de t
g.I. 40 4S 60
8.21 Se v:i a tomar un:i muestra alc;11oria Je tama"o 4 Je una pohlaciún ll(>rrn"I con rnc-
dia µ - 100 Sea
y 100
1 =--=-
s//4
Calcule las siguientes probah1hdadc~:
8.22 Suponga que se asume equivocadamente que el estadístico / del ejercicio 8.21 tiene
una distribución normal (z). Evalúe P(t > 1.638) y P(ltl > 1.638) bajo esta errónea
suposición. ¿Ocasiona esta suposición una sobrestimación o una subestimación de
las probabilidades?
8.23 Se bacc un estudio de Montecarlo tomando 1100 muestras de tamai\o 4 de la pobla-
ción nonnal del ejercicio 8.21. El estadístico I está definido en ese ejercicio. Los re-
sultados del estudio son los siguientes:
Evento Frecuencia
( < -2.353 44
- 2.353 < 1 < - 1.638 59
-1.638 < I < 1.638 896
1638<1 < 2.353 47
t > 2 353 54
EJEMPLO 8. 1O Suponga que una muestra de tamaño n =25 tomada de una población aproxima-
damente normal proporciona una media muestra! igual a 96.2. Calcule un intervalo
de confianza al 95% para la media poblacional suponiendo que la desviación están-
dar de la población es l 5.0. Vuelva a calcular el intervalo suponiendo ahora que
se desconoce l;i desviación estándar de la población y que la desviación estándar
muestra! es 16.2.
Solución Con el primer problema podemos utilizar los procedimientos de la sección 8.1:
( 15.0) ( 15.0)
96.2 - 1.96 f:tt $ µ $ 96.2 + 1.96- -
" 2s J2s
90.32 $ µ $ 102.08
31 8
89.51 ~ µ $ 102.89
Este intervalo es más ancho que el anterior por dos ra.1.ones: por4uc t00 H > ::11 >'~·
y porque en este casos= 16.2 resulta ser mayor que la supuesta a- 15.0. •
- -
Y- 1., 2 fn:. s µ s Y+ r. 2 j;
1
.\
donde 1,, es el valor / tahulado que separa un área de a,2 en la cola derecha con
n- l g1
intenalo de cun- A la fórmula anterior a menudo se le denomina fórmula del in ten alo de confian-
fianL:t en m u c'- za para la mcdiu en mue!ltras pequeñas, :mnque es válida para muestras de cual-
tra!> p cqueitn'i c¡111er tamar1o Para una muestra J e gran tamai'lo, l~ diferencia entre utilizar la tabla
1 y la tabla :: es insignificante, de modo que la distinción entre t y:: sólo es impor-
tante para muestras de tamai'lo pequei'lo. La hipótesis de una población normal es
critica para muestras de tamai'lo pequei'o, para las que el Teorema Central del Li-
mite tiene un efecto relativamente pequei'lo.
EJEMPLO 8. 11 Una aerolínea tiene en un aeropuerto cuatro ventanillas para la venta de boletos. En
un intento por reducir los tiempos de espera de los clientes, la aerolinea introduce
el "sistema de única fila". En este sistema, todos los clientes forman una única fila
que se va distribuyendo entre las ventanillas. La persona que alcanza la primera po-
sición de la linea es atendida en la primera ventanilla que quede libre.
Durante tres semanas, el director del departamento de atcndón al cliente re-
gistró el tiempo de espcrn en minutos del primer cliente que llegaba a las ventani-
llas después de las 4 P.M. Una observación se excluyó a causa de una condición
inesperada: hubo neblina en el aeropuerto y muchos planes de vuelo debieron ser
cambiados. Los datos son
4.3 5.2 2.1 6.2 58 4.7 3.8 113 5.0 41 60 8.7 O.S 49
Encuentre un intervalo de confianza al 95% para el tiempo de espera medio i:n el
límite, e n días hábiles, bajo condiciones normales.
8S Intervalos de confianz:a para la dmnbuco6n 1 3 19
Solución Pnmero calcule y"" 5.043 y s = 2.266. El 'alor de la tabla I ( 13 g.I., y un área en
uní> cola igual a 0.025) es 2.160. El intervalo es
~ ~ (2.266) ., (2.266)
. 04. - 2.160 r.; s JJ s 5.043 + _,16() r.;
vl4 v l4
o
3.735 sµs 6.351
Lo mejor sería reportar este resultado como 3.7 S µ S 6.4, redondeado según la pre-
cisión de los datos. •
ta maiio m1H.''itrul Uno de los usos importantes de los intervalos de confianza es determinar el tama-
requerido para cs- ~o muestra! requerido para obtener un grado de precisión deseado. La precisión
limur µ está determinada por el nivel de confianza y la amplitud del intervalo. Recuerde
4uc cuando se conoce u y especificamos el nivel de confianza 100( 1 a)% y la
amplitud del intervalo de confianza deseado 2E, el tamaño muestra! buscado lo en·
contramos resolviendo la ecuación
Z•/l(I _ L'
Jn - r.
para"· Ahora nos gustaría encontrar n resolviendo 'u.:i-~ Jñ =E, pero hay dos difi-
cultades. En primer lugar, s se desconoce hasta que la mue!>tr'.t se toma), en segun-
do lugar. no tenemos g.I. para 147 hasta que n se especifica. El primer problema se
puede resol\ cr) a sea utilizando una aproximación al valor des o especificando la
amphtuJ tkseada como una fracción de una de!>v1aci6n C!>tóndar. (Un error de menos
de O O1 desviación estándar al estimar una media se ve ria empcque~ccido por la va-
riación de los vil lores individuales de la media, mientras que un error de 1.00 desvia·
ción estándar sería algo sustancial.) El segundo problema se puede ~solver haciendo
una suposición preliminar de que n es suficientemente grande como para que: se
pueda sustituir con l. Sí la n resultante es demasiado pcquc~a. por lo general se pue-
de obtener una respuesta rápida por ensayo y error (en la dirección creciente den).
EJEMPLO 8. 12 Suponga que en el ejemplo 8.11 se desea un intervalo de contianL.a al 95% con una
tolerancia de más-menos media desviación estándar. ¿De qué tama~o tiene que ser
la muestra?
Solución E ha de ser 0.5s. Por ahora, suponga que podemos utilizar el valor 1.96 de la tabla
: ~orno una aproximación de 'o.o~s· Resolviendo la ecuación
(l.96s) 2
n= 5
=1.4
(.5s) 2
320 8 ESTil"W:ION POR IN'TtKVAlOS
Paran= 16( 15 g.I.) utilizarfamos 'o.ols =2. 131 en vez de 1.96 para obtener el "ª-
lor real de E igual a
'2. l 3Js
{, ::::: .533(.t)
"16
que: es un poco grande. Trate n = 18 ( 17 g.l.); 'o.o:?s =2. 11 O y
2.1IOs
:::: .497(s)
' 1
de modo que bastará con n = 18. •
SECCIÓN 8.~E_R_C_IC_l_
O_S _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __
8.25 lJn fabricante de galletas y bocadillos n:aliza una pequclla revisión de la antigüedad
de uno de sus productos en los puntos de venta. Para llevarla a cabo. toma una
muestra aleatoria de 23 minori~tas en una región particular. En cada tienda se selec-
ciona el en\ase que se encuentra al frente del anaquel y se determina el número de
días transcurridos desde su fabricación por medio de un código que tiene impreso.
Los datos (dias transcurridos, ordenados de menor a mayor) son
27 34 36 ~6 lK 19 39 39 40 40 42 45 47 51 52
57 63 71 75 ~4 96 110 147
a. Verifique que y• S6.87 y s "' 28.97.
h. Calcule un inter\·alo de confian1a al 99% para el verdadero tiempo medio
transcurrido.
8 26 Suponga que el fabricante del ejercicio 8.26 quiere obtener un mtcrvalo de confian-
u al 90% con una amplitud no ma)or de seis días. Suponiendo que la desviación
estándar muestra! no cambia, ¿de qué tamallo necesita ser la muestra?
8.27 Un grupo de consumidores quiere estimar el precio de entrega medio de cierto mo-
delo de refrigerador en el área metropolitana de Nueva York. tos precios se deter-
minan por medio de las compras rcafü.adas por clientes en 14 tiendas seleccionadas
al uar en el área. Dichos precios son, en dólares (sin considerar los impuestos),
341 319 331 326 298 33S 351 316 307 335 320 J2Q 346
347
(¡¡lcule un intervalo de confianza al 9S% de la \erdadera media.
8.28 lJna muestra aleatoria de 20 catadores calific¡¡ la calidad de un nue\O produc10 en
una escala del O al 100. Las calificaciones son las siguientes:
16 20 31 SO SO SO SI S3 SJ 55 57 5'1 óO 60 61 6~
67 67 81 92
a. Calcule un intervalo de confianza al 95% para la calificación media pohlacíonal.
,se deberían utilitar tahlas to tablas:'!
b. Trace una gráfica de los datos. ¿ llar alguna ra1ón para pensar que es una mala
idea usar un intervalo de confian1.a basado en la media?
8.29 Un transportista de muebles calcula el peso real como una proporción del peso es-
timado en una muestra formada por los últimos 31 trabajos. La media muestra! es
1.13 ) la desviación estánd<lr es 0.16.
a. Calcule un intervalo de conlian1..a al 9S%, para la media poblacional utili1ando
tahl:is 1.
;t1
,,
l l......~
~
'·.
b. Suponga que la desviación estándar pohlacional es 0.16. Calcule un intcrvalo'de
conlian1..a al 95% para la media poblacional utilizando tablas : . ~ .
c. ¿Son aproximadamente del mismn tamar'o Jos intervalos calculados en los in~
sos (a) y (b)?
8.30 Cuando se traza una gráfica de los datos correspondientes al ejercicio 8.29, el ',·
diagrama muestra una fuerte asimetría hacia la derecha. ¿Indica este hecho que
el nivel de confian1a nominal del 95% puede estar equivocado?
8.6- - - --HIPÓTESIS
- - PARA LA ESTIMACIÓN POR INTERVALOS •
Cualquier método estadístico incluye hipótesis. Algunas de ellas son gene-ales y se
aplican a una gran variedad de métodos; otras son específicas pnra un método en
particular. En los próximos capítulos tendremos mucho que decir acerca de las hi-
pótesis. En vista de que Ja estimación por intervalos para un parámetro único (sea
éste una media, una proporción o una mediana) es un concepto relativamente sim-
ple, en este contexto podemos tratar con mayor claridad las cuestiones relativas a
las hipótesis y a su violación.
En primer lugar, queremos subrayar que los métodos de este capítulo sólo se
aplican a muestras aleatorias. La tolerancia de errores inherente a los intervalos de
confianza es sólo una concesión para el error aleatorio; no se tolera ningün sesgo
en la selección de datos. Si, por pereza, los datos en que se basa un intervalo de
confianza se han reunido con una muestra no muy buena, es mu> probable que el
intervalo de confianza no sea el adecuado, simplemente por los sesgos en la selec-
ción de datos. No se conocen métodos para compensar por los sesgos en las mues-
tras que se han seleccionado mal.
En las muestras aleatorias legitimas, hay algunas hipótesis específicas que
pueden ser problemáticas. Una hipótesis clave es Ja de independencia e ntre las
muestras. Todos los métodos descritos en este capítulo suponen que las observa-
ciones son independientes entre sí, aunque no todos Jos métodos de muestreo alea-
torio proporcionan observaciones independientes. Por ejemplo, suponga que un
a:-.esor en bienes raíces selecciona 22 manzanas (bloques de casas) en una tona re-
sidencial para evaluar, con base en las listas de impuestos de la ciudad, el valor de
mercado de las casas de cada manzana. Si se supone que la selección es realmente
aleatoria, no hay un sesgo sistemático en favor de las casas de escaso o alto valor.
Pero hay un problema de dependencia. Dada la clara tendencia a que las casas <le
alto valor se encuentren juntas (lo mismo que las de escaso valor), si una casa en la
muestra tiene un \alor mucho m:ís alto que el promedio, las casas adyacentes tam-
bién lo tendrán. Los datos podrán comprender, digamos, 300 casas; sin embargo, el
método no da 300 medidas separadas e independientes de valores de casas.
La fuente más común de problemas con la hipótesis de independencia c;c pre-
senta en los datos de series tempora les, que se reúnen s iguiendo un orden cronológi-
co bien definido. S uponga, por ejemplo. 4ue medimos el monto en dólares lle lo.,
pedidos pendientes de un fabricante en particular durante 20 vieme~ consecutívoi.. ¡.,
nuonable suponer que un volumen muy grundc de pedidos pendientes en un' icmc'
esté seguido también por otros viernes con' o lúmenes muy grandes, pudiéndo'>e <ll'L ir
lo mismo de los volúmenes bajos. Las fórmulas para el error cstándnr que util11.11nm
322 8 EmM...clON POR INTERVALOS
60•
1bscnces· •
45•
•
.. . • . . • •
• • •
• •
30• • •
•• • •• •
•
•
15•
•·····-···+·········•·····-·-·•·-···-··-+·········•··--··11eet,...
o.o 6 .0 12.0 18 .0 24 .0 30.0
medida que el tamai\o muestra! se incrementa, pero no hay ningún tamai\o que eli-
mine por completo la asimetría en su distribución muestra!.
El segundo problema trata con la eficienci:i de los procedimientos t y sólo re-
cientemente se le ha estudiado con seried:id. La conclusión :i la que se ha llegado
con estos estudios es casi un:inime: Cuando la distribución de la población es simé-
método<o robu''º' trica pero tiene colas pesadas, varios procedimientos robusto\ son más eficientes
que los procedimientos estándar t. Virtualmente todos los procedimientos robustos
eliminan o dan un peso muy bajo a las pocas observaciones mu) grandes o muy
pequci\as en la muestra. La media muestra! ordin:iri:i da un mismo peso a todas las
observaciones y es muy sensible! a los valores extremos. Por coni,iguicntc. cuando
la distribución pobl:icional tiem: colas muy pesadas, los proccd1m1entos robustos
tienden a producir estimaciones más precisas y errore~ eslánJar m;h pequei\os que
la media muestra! ordinaria.
Desafortunadamente, no se ha trabajado tanto en la efectividad de los proce·
dimientos robustos cuando la distribución de la población es asimétrica. Una me-
dia truncada al 20%, que promedia el 80% de los valores centrales, es
indudablemente un estimador sesgado de la media poblacional cuando la población
es asimétrica. Que este sesgo se vea compen'ia<lo por un crmr c<;tjnJar más pcque-
i\o es un problema matemático y conceptual :ibierto. No ohstante. seria un motivo
de preocupación tener un C!)timador con un error c">t:índar pequc1'\o que ~1..:mprc so-
brc~timasc el p:ir:imetro poblacion:il.
Entonces, ¡,qué debe hacer un gerente que no es expeno en la materia? En pri-
mer lugar, ob5cnar lo.\ d<1tos. Uno de los peligros más serios al utilizar el sofiware
c!itadistico disponible es que el análisis estadi•a1co '>C puede llevar a cabo sin que el
usuario haga ningún razonamiento. Un simple histograma de los datos o algún otro
recurso gráíico puede re\ ciar una fuerte asimetría o la presencia de valores atípicos.
También podemos calcular el coeficiente de asimetría para los datos de l:i muestra
(véase el capítulo 2). Si no hay una anormalidad evidente, las probabilidades nomi-
nales de la distribución t deberían ser razonahlerr.ente correctas y el procedimiento
324 8 ES'Tlt-WX>N POR INTERVALOS
t deberia ser razonablemente eficiente. Si los valores de los datos tienen una obvia
asimetría o colas pesadas, las probabilidades de la distribución t y la eficiencia del
proceaimiento / serán dudosas. Siempre que sea posible, usted debería intentar otro
método en estas situaciones. Por ejemplo, en la sección 8. 7 presentamos un inter-
\alo de confianza para la mediana poblacional. Dado que la mediana no se ve t:in
afect;1da por los valores atipicos como la media, aquélla se puede utili:zar como una
altemati\.a para el intervalo basado en el e!>tadi5llco t.
En este libro se mencionan otros procedimientos robustos, mas no podemos
hacerles justicia a todos ellos. Esperamos que en los at'los venideros estos procedi-
mientos se integren a los paquetes estadísticos para la computadora. Si tales pro-
gramas no están disponibles hoy en dia, un gerente debería al menos mostrarse
escéptico respecto de la precisión de las probabilidades set'laladas.
1. Para una muestra de tamaño n, utalice tablas binomiales con esa n y 1r:::
0.50. A~ada probabilidades hasta justo antes de que el total exceda de a/2.
87 Intervalos de conflanu pMll la ~~ 325
Soluetón Para n = 16 y al2 = 0.025, podemos ver en las tablas binomiales que
l f
4 13
Solución Aunque podríamos utilizar la tabla 1 del apéndice. otra posibilidad es la siguiente:
k es el mayor número entero menor que
.5n - .5Z,.¡2 j;
Para /1 100 y a/2 =O.OS, tenemos que
.5(100) - .5(1.645)10 = 41.775
326 8 ESTIMAOON POR INTERVALOS
de modo que le --= 41. Los límites de confianza pertim:ntes son los estadisticos de
orden 42 y 59. •
EJEMPLO 8.15 Una prueba del sabor de un nuevo producto comprende 50 individuos que valoran
el gusto en una escala que va desde O.O (lo mejor) a 9 .9 (lo peor). Se obtuvieron las
siguientes calificaciones:
08 1o 29 3.0 3.4 3.5 3.7 3.7 38 3.9 4.1 4 1 4.2
42 42 4.3 4.3 4.3 43 4.3 4.3 44 44 44 44 44
44 4 .5 45 4.5 45 45 4.S 46 46 46 46 47 4.7
4.7 48 48 48 H 4.9 49 5.1 5.1 67 68
La calificación media de los 50 degustadores es 4 .300; la desviación estándar
es0.966
a. Trace una gráfica de los datos. ¿Cuál es la forma general? ¿ Hay valo-
res atípicos?
b. Calcule un intervalo de confianza al 90° o para la media.
c. Calcule un intervalo de confianza al 90°0 para la mediana.
d. En conformidad con el inciso (a), ¿cuál de los intervalos deheria ser má!>
J)Cquei\o? ¿Lo es en realidad?
Soluc1ón a. lln d1agrJma de tallo;. hojas o un histograma indica que los datos son casi
si métricos. "A ojo" parece haber valores atípicos importantes. Los "cuartiles pri-
mero > tercero" (25 percentil y 75 percenttl) son 4 .2 y 4 . 7, lo que nos da un RIC de
4.7 - 4.2 ""0.5. Las b:meras interiores son 4 .2 1.5(0.5)"" 3.45 y 4 .7 +
=
1.5(0.5) 6.45. Siete de las 50 calific ac iones se encuentran fue ra de estas ba-
rrl!ras, sugiriendo que la mu~stra se ha tom;ido de una población propensa a los
valores atípicos.
b. No hay ninguna entrada en la tabla t para 50 1 = 49 g.I.; razonable-
mente, utilizamos el registro correspondiente a 40 g.I. y ( 1 - 0.90)/2 = 0 .05, 1.684.
El intervalo es
(0.966) (0.966)
4.300 - 1.684 ~ $ µ ~ 4.300 + 1.684 ~
..¡so " 50
o
407 ~ µ ~ 4.53
=
c. Sumando probabilidades binomiales de la tabla con n 50 y Tr 0.50, en- =
contramos que P(Y~ 18) = 0 .03 13 y P(Y~ 19) = 0 .0583. Entonces tomamos k = 18
Secciones 8.6 y 8 7 E1erctc105 327
EJEMPLO 8. 16 \fo~tramos un diagr:ima normal para los datos del ejemplo 8.15 hecho con Mini-
tab. ¿Confirma el diagrama la opinión que nos formamos acerca de la distrihución
de los datos en el ejemplo 8. 15?
ret lng • 2
3 3 3
3 6 6 6 4
4.0+
•
•
2.0•
. . •
Solución En el ejemplo 8.15 concluimos que los datos eran propensos a \'alores atípicos. El
diagrama normal muestra la forma de S que es característica de este tipo d.: d.lto •
I(?)
t t .07
(a)
!(..-'}
05
t .15
(b)
FIGURA8.7 D1stnbucr6n x2 con g.I. = S: (a) valor superior O.OS; (b) valor rnfenor O.OS
tiene un área izquierda de O.OS corresponde a un área derecha de 0.95. El valor ta-
bulado para a - O.95 y g.1. =S es 1.15. Un diagrama como el de la figura 8.7b acla-
ra la ~1tuación . Para valores muy grandes de g.I. un valor aproximado es
l~ ~(Ji- + J g.1. _ .s r
EJEMPLO 8.17 Utilice la tabla 5 del apéndice para encontrar valores que tengan áreas en la cola
derecha y en la cola izquierda iguales a 0.025, parn una distribución X~ con 29 g l.
Utilice la aproximación que consiste en tomar g.I. muy grandes para determinar los
mismo~ valores.
Aun para 29 g.I. l::i aproximación con g.I. grandes es razonablemente precisa. •
Por ejemplo, una cadena de moteles tiene un número 800 para recibir reser-
vaciones telefónicas. Un índice de la calidad de un servicio es el tiempo de espe-
ra, el tiempo que transcurre desde que el teléfono suena por vez primera hasta que
un agente responde, preparado para hacer las reservaciones. El estándar de la ca-
dena es que el tiempo promedio de e~pera no debería ser mayor de 30 segundos.
La cadena tiene inspectores que viajan a los distintos moteles y verifican todos los
aspectos del servicio. Estas personas realizan cada semana 30 llamadas para hacer
reservaciones y registran, entre otros indicadores, el tiempo de espera en cada una
de ellas. En una semana, los tiempos en segundos son 12, 13, 13, 14, 14, 14, 15,
15.16.17, 17, 18, 18, 19, 19.25,25,26,27,30, 33,34,35,-t0,40, 51,51,58, 59
y 83. En esta muestra, la media es 28.37 y la desviación estándar, 17.37. Podemos
utilizar los valores tabulados ( 16.05 y 45. 72) que encontramos en el ejemplo 8.17
para calculor un intervalo de confian.ra al 95% para la varianza poblacional y Ja
desviación estándar.
2
191.38 .S u S 545.16
Extrayendo raices cuadradas obtenemos el intervalo de confi:mJ'a al 95% para la
desviación estándar del tiempo de espera.
1383 s (1 s 13.35
El inten-alo indica que hay una gran \ariahilidad en los tiempos de espera, aun
cuanJo todo parece indicar que el estándar para l:i media si se alcanza
Solución Los cálculos uswles nos muestran que y= 25.097 y s1 2. l 5tn Como n = 30. hay
29 gJ. Consultando la tabla 5 del apéndice, los valores X.Í ª 1 }' X~~ para un inter-
valo de confianza al 95% son¡.~ m = 16.05 y x~ ou = 45.72 . Porlo tanto. el interva-
lo de conlia~ al 95% para cr es
2.1583 2 29 2.1583
<29> 45.72 .S ª .S ( ) 16.05
o
1.369 S a 1 S 3.900
Extrayendo raices cuadradas, el intervalo de confianza al 95% para <:1 es
.[1369 s t1 .s . . 3.900
o
1.17 s s
(1 1.97
La justificación de este intervalo de confianza es que el C\ ento
sz sz
(n - 1)-2- .S u 1 S (n - 1)-1- -
X.12 11 -.¡z
es algebra1camente idéntico al evento
3)2 8 ESTIHAOON POR INTERVALOS
Sabcmo~ que (n 1h:/d tiene una distribución X~ con n - 1 g.1. y que x?-a 2 y
x}, ~ tient:n áre:is en la cola izquierda y en l:u:ola derecha de u 2. rc:.pccti\ amente.
Laprob:d>ilidaddcl e'ento(el ni, el dcconfianai)esporlotantoel \alordel-.eado 1 a .
Las inferencias ji cuadrado acerca de la de-,, iaci<~n estándar o de la 'arianza
son panicularmente sensibles a la hipótesis de una pohlación o proceso normal. Si
la población no es normal, las probabilidades anunciadas como el nivel de conlian-
i'..O pueden ser erróneas. Un supuesto intervalo de confianza al 95% puede tener en
realidad sólo una prohabilidad del 80°'1> (o aún menos) de incluir el valor correcto.
La razón es que no hay nada en el procedimiento (excepto los valores tabulados.
que suponen normalidad) que dé cuenta de la incertidumbre de la 'arianza mws-
tral. El Teorema Central del Limite no prcst:i ninguna ayuda: éste es un teorema
acerca de las medias muestrales, no acerca de sus varianzas. Por consiguiente. en
esh: caso es aún más importante trazar diagramas con los datos; si éstos tienen un
aspecto no normal, el supuesto nivel de confianza no es creíble.
método j t1ckk11iji.• Otro método par:i determinar intervalos de confianza es el mHodo jflc/..k11ife,
que se basa en un enfoque de cómputo. Para llevar a cabo este melodo. cxclu~ a
cada vez y en forma consecutiva una observación muestra!, y vuelva a calcular l:i
varianza. Si usted omitió un valor típico. la varianz.:i no cambiará mucho: pero si
usted omitió un valor atípico, la varianza decrecerá se1,eramcnte. Así, el método
1ackknife le advertirá si está tratando con datos propensos a los valores atípicos.
pues las varianzas correspondientes a dichas exclusiones 'ariadn enormemente.
Como es de esperar. usted deberá aplicar el m¿lodo con una computadora, no a
mano; un programa para tales propchito' se hará cargo de los det:illcs técnicos.
(Para su conocimiento: la computadora calcub "scudovalores" por ejemplo. /1 \C·
ces el logaritmo de la varían~ menos 11 1 veces el logaritmo de las varianz.:is co·
rrespondientes a las exclusiones- y después encuentra un intervalo de confianza /
utilizando los seudovalores. Quizá tenga que reconvertir los logaritmo~. mas en
otro'\ aspectos usted puede dejar el trabajo pesado al programa.) l:I métodn jack-
knife no supone una población normal, y la prohahilidad bu-.c:HJa ::.e hace más pre-
cisa a medida que jUment¡¡ el tamai'\o de la muestra; por consiguiente, es más
fidedigno que el inlcr\'alo ji cuadrado en los casos en que un diagrama de los datos
sugiere que éstos ticn~·n una distribución no normal.
Los datos correspondientes a los tiempos de espera en el trámite e.le rescn a-
ciones considerados con anterioridad en esta sección son asimétricos a la derecha.
de modo que un intel"'\·alo de confi::in;.a determinado con estc método delierá ser
más digno de crédito que un inter\'alo x!El trabajo lo hizo un "macro·· de Miní-
tah; y nosotros consideraremos los resultados. no los cálculos.
l· I intervalo jaclclcnifc 136.87 ~ d S 781.33 es más amplio que el intervalo ·i
191.38 $ d ~ 545.16 que encontramos previamente. No obstante, la pretendida
conftanz;i al 95% del imervalojockkn~fe es más fidedigna que la corrl!spondiente al
95% dd inter\'alo parad, dada la no nonnalidad de los datos de la muestra.
EJEMPLO 8. 19 Con hase en los datos del ejemplo 8.18, el intervalo de conti::inza jocklcnife al 95%
para la desviación estándar de la potencia de las tabletas es 1.581 $ d ~ 3.034. Un
díagr.ima di! tallo y hojas de los datos es básicamente plano sin nada parecido a un
\ alor atípico. ¿Hay alguna ra1.ón para prefl!rir el intervalo 1ackk.nifi• en VC7 del in-
tcl"'\·alo 1.369 S <:i- ~ 3. 900 que se enconlró en el ejemplo 8.18?
Solución No hay ninguna indicación de asimetrías o valores atípicos, de modo que la preten-
dida confianza del intel"'\·alo X~ debería ser ra/'onablcmcnte precisa, al igual que el
nivcl de confian1..a del intervalo jocklcnife. Ambos son válidos. ma~ el intervalo
jaclclcnife es preferible por ser más pequei\o. •
S~lA
0.937 0.947 0.957 0.962 0.963 0. 963 0.964 0 . 967 0.970
" 0.970
0 .978
0.972
0.978
0.972
0 .978
0.973
0.979
0.974
0.979
0.974
0.980
o. 975
0.980
o.9n
0.981
o. 9n
0 .981
0.982 0.982 0.982 0.983 0.983 0.981. 0. 981. 0.985 0. 986
0.986 0.987 0.987 0.987 0.987 0.989 0.989 0.989 0.990
0.990 0.991 0.991 0.991 0.992 0.992 0. 992 0 . 992 0 .993
0.993 0.993 0.993 0 .994 0.995 0.995 0.997 0.997 0. 997
0 .998 0.998 0.998 0. 999 0.999 1.000 1.000 1.000 1.000
1.000 1.001 1.001 1 .002 1.002 , .002 1.002 1.002 1.002
1.003 1.003 1.003 1.004 1.004 1.005 1.005 1.005 1.006
1.006 1.006 1.007 1.008 1.008 1.008 , . 009 1.010 1 .011
1.011 1.011 1.012 1.012 1.015 1.015 1.017 1 .018 1. 019
1.020 1.021 1.023 1.023 1.024 1 .025 1.025 1.025 1.026
1.028 1.029 1.032 1.038
MT8 > describe •supplA'
Mlll ltAX 01 03
SupplA 0.93700 1.03800 0.98250 1 .00600
• /\'ottJ. supp/A ,. ptovtc:dor A
Suppl8
0.907 0.921 0.936 0.945 0.946 0.946 0.948 0.951 0.955
0.956 0.959 0.959 0.961 0.962 0.963 0.963 0.966 0.967
0.967 0.968 0.969 0.969 0.970 0.971 0.971 0.973 0.973
0.973 0.974 0.974 0.975 0.976 o.9n 0.978 0.978 0.979
0.980 0.981 0.981 0.982 0.982 0.984 0.985 0.985 0.985
0.987 0. 987 0.987 0.988 0.989 0.989 0.990 0.990 0.990
0.991 0.991 0.991 0.993 0.993 0.993 0.996 0.996 0.997
0.997 0.997 0.997 1.000 1.000 1 .000 1 .001 1.001 1.001
1. 001 1.002 , .003 1.004 1.004 1.004 1.004 1.004 1.005
1.005 1.005 1.006 1.006 , .007 1.008 1.009 1.009 1.010
1.010 1.011 1 .012 1.012 1.013 1.013 1. 015 1.016 1.017
1.017 , .018 1.019 , .019 1.023 1.024 l.027 1.027 1.029
1. 031 1.033 1.036 1.036 1.036 1.039 1.039 1.039 1.040
1.043 1.045 1.050 1.059
La estina:lción por intervalos nos pem1itc especificar límites ra1onables para los va-
lores de los parámetros de una población y nos da una ind1c:lción explícita del gra-
do de inccrtidumhre en una estimación. La forma de un intervalo de confianza para
la media de una población o proceso es
-± Ji(I -
1l Za¡2
i)
3. Tama~o
"
muestra) requerido para obtener un intervalo de coníianza al
100( 1 - a)% para µ, con amplitud 2E
z:12C12
n =---
E2
4. Tam:li'lo muestra! requerido para obtener un intervalo de confianza al
100( 1 - a)% para te, con amplitud 2E
337
Z~12i(l - Í!)
ti=-------
fl
donde ;r se puede estimar con base en un:l inform:ición previ:i o tomar.
de manera conservadora, como O 50
5. Intervalo de confianza al 100(1 - a)o/o paraµ
- s
>' ± le¡l ¡;.
donde la12 se basa en g.1. =n - 1
6. Intervalo de confian1..a al 100( 1 a)% para la mediana
estadístico de orden (k + 1) S mediana$ estadístico de orden (n .le)
donde
P(número de éxitos S k) $ aJ2
y
P(número de éxitos S k + 1) > aJ2
en la tabla 1 del apéndice, tr = 0.50. Para n muy grande,
k • 0.05n - 0.05zan.Jn.
7. Intervalo de confianza al 100{ 1 - a)% para la varianL.a
sl sl
(n - 1)-2- ~ u2 s (n - 1)-2- -
le/2 l1-e12
CAPÍTULO 8 EJERCICIOS
---------------
8.43 Una muestra aleatoria de los balances de fin de ai\o de 22 empresas pequei't:11s (con
ventas anuales inferiores a los S00,000 dólares) 1irrojo una media muestra! de los
beneficios brutos de las ventas del 5.2% y una desvit1ción estándar del 3.3%. Utili-
ce C'itos resultados para calcular un intervalo de confianza al 90% de J;i media po-
blac1onal, donde la población estÍI constituida por (el beneficio bruto de) los .. arios
miles de pequei'tas empresas de la ciudad.
8.44 Rcmftase al ejercicio 8.43. Obviamente, el beneficio bruto de un negocio saludable
no puede ser negativo. La regla cmplrica para dos desviaciones estándar indicaría
que una fracción sustancial de los negocios tienen beneficios brutos negativos.
a. ¿F.s probable que los datos de la muestra tuviesen una distribución cercana a
la normal?
b. ¿Qué indica su respuesta al inciso (a) acerca del intervalo de confianza que se
calculó en el ejercicio 8.43'?
8A5 Un pro)'ecto de investigación para una compaflia de seguros tiene como propósito de-
terminar el valor medio de las posesiones personales de los arrendadores de aparta-
mentos urbanos. Un estudio previo sugiere que la des' iación es~ndar de la población
deberi:i ser aproximadamente 10,000 dólares. Se pide un intenalo de coofian.1a al
95º• con una amplitud de 1000 dólares (más-menos 500 dólares) e.De que tamai\o se
debe tomar la muestra para obtener dicho inte~alo de conli3n1J"'
8 46 Se puede argumentar que los datos del ejercicio 8.45 podrían ser 3simétricos:
son pocas las personas que poseen propiedades de mucho valor. Por lo tanto (conti-
nú3 el argumento) el intervalo de confianza es totalmente inválido. 1, Es correcto
este argumento?
8.47 Mucho~ incfüiduo!> de más de 40 ai'los desarrollan intolerancia para la leche y otros
productos lácteos. Un fabricante ha elaborado una linea de productos sin lactosa que
338 8 ESTIMACION POR INTERVALOS
• l"i.!.:h3 ~n que las ~rSOl13S lis1cas 11cnm que pc~scnw su dt"dar3c1on de ingresos '-'fl r.,udos 1'mdos.
(,\' tft'I T.)
E¡ercicios H9
m:i~ grandes pero ninguno margenes miis pequeilos. ¡,Que indica este hec ho acerca
del inten.alo de confian1.a al 90% que se encon1ró?
8 56 Se obtu"o un:i mue~tra aleatoria de 100 registros. Los dalM y la \alicfo de Minitah
son los siguienles:
values
40 42 45 47 48 48 49 49 50 51 51 52 53
54 55 55 55 55 56 56 56 56 56 56 57 57
57 57 58 58 58 58 58 59 59 59 59 59 59
60 60 60 60 60 60 60 60 60 61 61 61 61
61 62 62 62 62 63 63 63 61, 61, 61, 65 65
65 65 65 66 66 66 66 66 67 67 67 67 67
67 67 68 68 68 68 69 69 69 69 70 70 72
72 72 7J 7J 74 76 79 81 81
values
2
•
75• ••
32
4 42
55 7
433
60• 6 9 5
6 45
24
•2•
• 22
45• •
•
•
+· • • • • · · · ·+· • • · · · · · ·+· • · · · · · · -•· • · • • - · · ·•· • • · • • • · ·•· · • • • ·nacor••
·3 . 0 · 2.0 · 1.0 o.o 1.0 2.0
340 8 ~STIHACIÓN POR INTERVALOS
IU8 l·.I dep:1r1amen10 de policía de una ciudad de rcgul3r t3m3ilo registró el tiempo de
respuesta a 13s ll3mada<; en las que se denuncian delílos. pero que no <;on emer-
gencias. como desvalijamiento de automó\'1les o robo a casas Como una muestra
' alc3toria del proce<¡o en curso, ~e tomaron los tiempos en minuto~ correspondiente~
a 29 llamadas registradas durante una .;emana. 11. cont1nuac1ón st: muestra 13 s3lida
de Minllah
IH B > print • res pt il!lf •
respt i 111t
24 25 18 zs 1S ,, 11 19 36 l9 1J 21 12
12 26 16 19 12 2t 12 12 18 11 19 16 24
14 23 17
MTB > descri ~ ' res ptilllf'
MIN MAX 01 03
respt iine 11.00 36.00 12.00 23.SO
MTB > zínte rva l w1th 901' conf1dence si gma • 6.0 da ta •r esptiN '
wei ghts • •
•
11.2•
• • 2 •
• • 2 3
• • • 4 •
• • 2 • 2 •
9.6+ • 2 • 2
• 3 • 2 • • •
• • • • • • •
• •
• •
8. 0• •
•
•
•
· ·····•·· ·· ·····•· ·· ······•········ ·•·········•·········•betcti
1.5 3.0 4.5 6. 0 7.5 9. 0
8.63 a. Utilice los dalos del ejercicio 8.60 para calcular un intervalo de confian1..a al 95%
de la desviación e<;tándar ¡'l(>hlacional.
h. El criadero espera una des"iación esr:indar de 0.75 on1;i~ en los pesos. ¡,Indica
el intervalo de confianla del inciso (a) que en este ca"o no se alcanzará dicho
o~jetivo?
8.M Un fabricante de m;illas metálícas trata de limit;ir el nümero de defectos a no más
de 5 por cada 1000 pies. Los defectos son por lo general alambres rotos en la mall:i
o hurbujas de pintura. Cada día. se inspecciona una n1ue .. tra de 2-J corte~ de tela me-
tálica, cada uno de 500 pie" de longitud. Los siguientes datoi; corresponden a los
defectos encontrados en lo" cortes de la muestra.
J ~ J o ti o 2 ~ ~ .¡ .1 ó
.i J .i 5 ~ o 5 2
11
'media
* medi;ina des\iac1ón
estándar
.:!4 2.917 300() 1. 7IJ 2
342 8 ES'TlMACION POR INTERVALOS
b.1dsects
4.92 10.20 12.88 1.05 12.09 4.54 5.96 7.36 17 .21
6.97 4.69 14.79 1S .53 12.43 8.00 7.97 4.85 0.94
3.91 0.49 7 .57 1.03 6.02 26.43 4 .19 7.07 48.93
S.47 26.03 0.6J 5.77 1.68 3 .68 31.68 3..~1 5.43
MTB > st ~ and leaf of 'badsects•
Ste111-end·leaf of badsects N • 36
leaf Unit " 1.0
14 o 00011 133344444
(11) o 55556677778
11 , 02224
6 1 57
4 2
4 2 66
2 3 1
1 3
1 4
1 4 8
ACHIEVED
N MEDIAN CONf IDENCE CONf" IDE NCE IN TERVAL POSIT JOli
badsects 36 5.990 0.9348 ( 4. 850, 7. 970) 13
0 .9500 ( 4.808, 7 . 978) llll
0.9712 ( 4 .690 , 8 .000) 12
• No1a. bC1dst'cl.1 '" sectores dallados.
48+ *
badsec ts·
32+ *
* *
16• * *
* * *
. . • *
2 2
*
*
*
•
*
•
2
O+ • z •
······•·········•·········•·-- -···-·•·-·· · ····•·· ·······•totRAll
2. 0 4.0 6. 0 8 .0 10 .0 12. 0
3.71 Una compal'lia arrendadora de automóviles compra unidades nue\as, las utilii'..a du-
rante unos seis meses y después las vende en subasta. En efecto, la compal'lia está en
el mercado de valores luturo~ de los automóviles usados. Por lo tanto. quiere tener
una estimación correcta del valor futuro de su flotilla actual de automóviles. Un
asesor propone un nue\o método para estimar el valor futuro. ~:ste se aplica a un:i
muestra de automóviles. Se hacen estimaciones iniciales, se utilii'an los autornóvi·
les ) después se obtiene el precio subastado de cada uno de ellos. Los datos soo el
c~iente entre el valor real y el valor estimado para cada uno de los 121 automóvi-
les que no sufrieron da1'o durante el periodo de arrendamiento. A continuación mos·
tramos los datos como los presenta la computadora.
344 8 ESTIMACION POR INTERVALOS
ect/Ut
" o .968n 1. 02 149 1.01100 1.03069 1.0 1039 1.03266 0 . 98667
1.01080 0 . 96833 l.01814 0.98233 0.989SO 1.00423 0.96911
0.94118 o.9n19 1.00409 1.00S9S 0 . 98702 0.97J97 1.01228
1.02320 0.97978 0.89570 1.02869 0.99\89 1.00378 0 .96988
1. 04872 1.01224 0.9S 713 0.96719 1.07646 1.00463 0 . 96637
0.96125 0.95879 0 .98965 0.97314 1.02847 1.01319 o. 9687S
0.99000 0. 99463 1.on83 0.98070 0.95106 1. 04667 0.98620
0 .96406 0.96311 1.01996 0.98937 0.99123 1.00000 1.04423
0.99622 1.06927 0.92623 1. 03237 0 . 99904 1.05807 0.99028
0.960 11 1.039S9 0.94857 0.9813S 0.93376 1. 00000 1.01877
1.00280 1.02494 0 .98779 0.96610 0.94118 0.99445 1. 02761
1.001 8.3 1.04700 0. 99011 1.04333 l . 06329 0.96900 0. 96613
1.01532 0. 99293 1 . 01865 1. 06040 1. 03927 0.96418 0 . 99283
1.00563 1.0S370 0 .99537 1.00424 1.00686 1.05361 0.97479
0.98227 0.97611 1.00074 l. 08310 1.01981 1.03604 1. 01578
1.00000 1.00579 0.95124 0.99522 0.961&4 0. 98S85 0 . 98786
0.95688 1. 02029 0 .9929S 1. 00000 1.00435 l .01088 1.02974
1. 07150 1 .01643
-·······---·-
• ······ ··· ····· ! • f······-···········
·· ··---····· ·
···· ··•· ·-·-····•·· ······ ·•·· ·······•·· ··-·- ··•· ······· ·•ectl••t
0.910 0 .945 0 .980 1. 015 1. 050 1.005
llTB > tlnte rvtl for '•ct/ est '
M MEAN STOEV SE MEAN 95 .0 PERCENT C. I .
I Ct/Ht 121 0 . 99964 0.03404 0 .00309 ( 0.99371, 1.00597)
ect / ut
•
121
MEDI AN
1.000
CONf lDENCE
0.9310
CONFIDENCE INTERVAL
( o . 992, 1.004 )
POS ITI ON
S1
0. 9500 ( 0. 991, 1.004) Nll
0.9545 ( 0. 991, 1.004 ) so
a. Basándose en los métodos t, determine el valor del intervalo de con fianza al 9S%
para la media.
b. ¡,Se puede interprel.;lr el inlervt1lo como la indicación de que el precio real se en·
cuenlra entre el 99.37 1'/o y el 100.597°0 d-: lo estimado para el 95% de los auto·
mó\·iles.,
8 .72 a. rara los datos que se muestran en el ejercicio 8. 71, determine el intervalo de con-
fian.ta al 95 45°11 part1 la mediana.
b. ¡,Son los inter\.alos de conlian1.a par.i la media y la mediana dt: estos daws mu)
distintos entre sí? Con base en el dia~rama de caja de los mismos, 1,dehcri:m d1-
fenr mucho entre sí los intervalos?
8. 73 a. Calcule un intervt1lo de confian1~ ~I 95o/o para la desviacióo estándar roblacional
con los datos del ejercicio 8.71.
b. Si la desviación estándar es tan grande cornil el limite superior del 1nter,alo de
conlian7.a, ¿qué podemos decir acerca de la precisión de la estimación del precio
individual de los autos?
ti .7-1 Para ver sí h:ibia alguna tendenci3. o;c trv.ó un t.li:il!ram3 de los d.ito~ Jel ckrcicio J
8 71 con respecto al precio real del automóvil. (,Encuentra u~tcLI alguna cc~t.lencia
crcc1entc del cocicnce Jd precio real entre el precio ei;timado a medida que el pre-
cio re:il se incremeota'>
MTB > plot •ect/est• vs •1c:tue1• 81
·'
ac:t/ut -
• *
1.050• •
•
2
* •
.. • •
••
•
.. • 2 ••
2• •
• • 2 •2•• •
•• • 2••2•2••
z ·2
2 • • • • •
0.980• • • ••
• • •
2 •
2 ••
•• • • •
••• • •
z
0.910•
l
• I
-··-•·-···-···•·········•··-····-·•·····-···•·····-···•··ect~l
7.5 9 .0 10.5 12.0 13 .S 1S.O
8.75 IJn rest:iurante tratb de incrementar la as1~tenc1a loo; lune\ pnr la oo'he. que tradi·
cionalmente es la noche más ílo1;i de la scman:i. ofreciendo los postres de su menú
e~pecial a un dólar promocionándolos con la fr:isc "¡Anímese!". Se registró el nú·
mero de cenas servidas los lunes durante l:ls doce semana\ en que estuvo vigente la
oferta Los datos fueron .
119 llY 112 126 121 l:!K IOX 63 l IX 105 131 14:!
media 117.67. cksvi:ición csúndar 20 65
8. 79 a. l.a maderería del ejercicio 8 78 tiene que decidir cuántas hojas f)or embarque se·
rin inspeccionadas. ¿De qué tamaño <;e debe tomar una muestra para obtener un
" intervalo de confianw al 95~o con una amplitud de 0.04 para la proporción de ho-
jas invendibles? Su¡x>nga que entre un 1O~o) un 20% del embarque es invendihle.
h l:.n esta situación. ¿seria útil calcular el tamallo muestra! con base en la hipótesis
extrema de que el 50% del embarque es invcn<hble?
8.!lO a. La muestra del ejercicio 8.78 siempre se toma de la plataforma ubicada en la par·
te posterior derecha del camión de carga. Cada plataforma contiene cuatro grue·
<;as (576 hojílS), de modo que la maderería seleccion<1 las 144 hojas de la muestra
por rotación: del primer embarque, las 144 de arriba a la i:tqu1erda: del siguien-
te embarque. las 14~ de arriba a la derecha, y así sucesivamente. ¿Por qué ésta
no es una muestra aleatoria de las hojas? ¿No podría un f)roveedor falto de ética
tomar \enta1a de c~re proceso?
b. fn ~u Of)tn1on, ¿seria factible tomar una muestra aleatoria s1mf)lc en esta situa-
ción? ¿Cómo tomaria la muestra para dificultar que un proveedor falto de ética
lo engaile'.' Ob\ iamente. no ha) una única respuesta correcta en este caso.
8.81 l na compañia electrica ofrece tarifas reducidas a aquellos clientes que han instala·
do medidores de "horas de máxima carga". Estos artefactos interrumpen todos los
dlas el suministro de energía a los aparatos eléctricos de alto consumo (principal-
mente lavaplatos y secadoras de ropa) durante las horas de máxima carga entre las
3 A.M. y las 9 P.M. 1.3 emprcs3 quiere inspeccionar una muestra de e~tos mcdidorc~
p3ra determinar la proporción de los que no están funcionando. >ª ~c3 porque no se
conectaron con el circuito central o porque el equipo ha fallado. lla) 45,300 medi-
dores en uso y la compailia no está en posibilid3d de in~peccionarlos todos.
a. Se quiere para la proporción un intervalo de confian1.a al 90% con una amplitud
no mayor que O 04. ;.Cuantoc; medidores se deben tomar en una rr.uestra si no se
hace ninguna h1potes1s particular acerca de la proporción correcta?
b. ¿Cuántos medidores se dehen considerar en la muestra si la compañia supone
que la verd3dcra proporción de la poblacion se encuentra entre O.OS )' 0.15?
e. ¿l'ermite la hipótec;is del inciso (b) reducir considerablemente el tamailo de la
muestra requerid3'l
R 82 1 a compailia eléctrica del ejercicio 8 K1 toma una muestra de MO medidores~ en-
cuentra que 61 de elloc; no ec;un runc1onando. ::?8 porque no se concct3ron al circulln ~
l 3 JlOr defectos en el equipo. Calcule mtel'\alos de confian1a al 90°0 para las proJlOr·
ciones de 13 población de los mcd1dorcc; füera del c1rcu1to ~ de lo<; 4ue han fallado
8.83 La mucc;tr3 del ejercicio 8.8::? se obtuvo inspeccionando todos los medidores de 16
c;ectores seleccionados aleatoriamente entre los 1062 del área de la comrallia. En
cada sector hay entre 30 y 50 medidores. ¿Por qué este procedimiento no reúne una
muestra aleatoria simple?
8.84 En el ejercicio 2.66 se consideraron las reclamaciones de pago (en miles de dólares)
hech:is a una compañia de seguros por averías por colisión de autom6\ 1les asegura-
dos. En la figura 8.8 se muestra un diagrama de caja de los d3tos. Junto con la fi.
sur:i se presenta un análisis utiliando el paquete Statgraph1cs.
a. Interprete el intervalo de confi3nw. para la media. ¡,Es importante si el inter\'alo
se nasa en las tablas ro en las tablas :?
b. Utilice el intervalo de confianza para la vari:in¿a para encontrar un tntcr\'alo de
confianza al 95% para la desviación estándar.
8.85 !-.1 diagrama de caja de la figura 8.8 indica que la distribuc1on de la ¡>Oblación sub-
) acente es asimétrica hacia la derecha. ¿Cómo :lfccta este hecho a la credibili·
dad de los intervalos de confianza del ejercicio 8 84? ¿Afecta igualmente la credi·
hthd.id de los intervalos para la media y la ,·arianza'l
E¡eretc101 347
_ _ _ _ _ _, 00 00 c?ln o
)1( )l
o 10 20 30 40
cantidad reclamada
FIGURA8.8 Diagrama de ca¡a para los datos sobre el monto de las redamac1ones de pago
c ta 11M i zir
S1111'pl e St • tl s tics: No..rrbe r of Obs . 187
Averege 5. 17754
Vtr i anee 27. 9194
Std. Oeviat 1on 5 .28388
Median l .5
Conf 1dence l nterval f or Mean: 95 Percent
S1111'pl e 1 4. 41 509 5. 93999 1860 . f .
Conf idcnc:e l nterval f or Var1anc:e : 95 Percent
Sairpl e 1 23.01 23 34 .5919 186 O. f .
8 .86 Mucho-; periódicos, al informar los resultados de las encuestas ¡iolitícas, afirman
que "los rc'lullados tienen un:i confian1a del 95% y un error nn ma) or de 3 pun· *
tos porcentuales". FI tamai'lo usual de las muestras es de aproximadamente 1500
persona<;. Se supone que el error permitido cubre tanto la variabilidad de la mue<;tra
como el efecto de pequei'los sesgos.
a. Suponga que la encuesta (muestra) indica que alrededor del 50% de los electores
piensa votar por un candidato en panicular. ¡,De qué tamar'lo dehe ser el término
± para un intervalo de confianza al 95% para la pro¡iorción de la población?
b. ¿Seria mu) distinto el tl!rmino ± si el 40% de los electores de la muestra favore·
ciese al candidato'?
c . ¿Por qué el margen mencionado de± O 03 es ma)or que el término± que usted
calculó en el inciso (a)"
8 87 Considere de nuc\.O 'ª"
encuestas políticas. Cuando hay muchos candidatM, como
en las etapas iniciales de las elecciones presidenciales primarias (de Estados Uni·
dos). un candidato espccirico puede ser favorecido por sólo el 2% de los panicipan·
tes en la encuesta. Dados los ± 3 ¡iuntos porcentuales ya mencionados, la broma
comün es que tal candidato puede tener una preferencia negativa. Con un inter,alo
de conrianza al 95•1o. ¿qué térmioo ±se debería aplicar si el candidato ei. favoreci-
do por 30 de los 1500 electores en la muestra?
R 88 l.a división de mercadotecnia de un fabricante de automóviles quiett estimu la satis-
facción de los compradores con un distribuidor particular, seis meses después de ha-
ber adquirido un auto. Los gerentes Je mercadotecnia no quieren utilizar
una encuesta ¡ior correo porque creen que: los cuestionarios que no sean contestados
producirán un sesgo importante. Es más factible hacer un muestreo por teléfono,
pues los números telefónicos de: los clientes aparecen en las pólizas de garantía.
348 8 ESTIMACIÓN POR INTERVALOS
Una pregunta clave seria la siguiente: ;_rccomendaria a este di~tribuidor con ~us
;1m1gos y vecinos? Los gerentes de mercadotecnia quieren estimar la proporción de
}Odos sus clientes que respondenan "sí" basándose en una muestra telefónica.
a 1,De qué tamar)o <,e dellc: tom:lr la muc~tra para ohtencr un intervalo de conliann
al 90°0 para esta proporción. con una amplitud de 0.10 (un término± de: 0.05)?
Utilice la estimación más conservadora, la que aphcarí:i en el peor de los casos.
b . S1 se duplica el tamaño muestra!. e.se reduciría la amplitud a 0.05?
H.89 a. Con la estimación más conservadora del ejercicio 8.88, que se utilizaría en el
peor de los casos. ¿qué está usted suponiendo acerca de la satisfacción de Jos
clientes con el distribuidor? ¿Piensa que ésta seria una hipótesis accptabk en la
práctica?
b. ¿Cómo cambiaría el tamaño de la muestra del inciso (a) del c1erc1eio !US8 si su-
pone que la proporción del "sí" dehcria estar en algún punto entre 0.80 y 0.<>5?
8. 90 Una revista para abogados tomii una muestra de 147 despachos para determinar el
costo del a lquiler que paga cada uno de ellos por sus oficinas (en dólares por pie
cuadrado al allo) Los datos se ano:ilizaron con MinilJlb. con los siguientes resultados :
· · ·I • t····· · ·· •• •• o o
-·•···--- ·· · • -·· · ·-- ··•·---·····•···----·· rent1l1
15 .0 20 . 0 25.0 30.0
¿Por qué los resultados "tintervaf' y ..s1nttrvaf' son tan distíntol' entre sí y ni si-
quiera se superponen?
8. 91 En una muestra de 21 S residen les urbanos entre 22 y 35 arios de edad se registran
todos los días durante un mes los gastos en díversiones } entretenimientos El total
de gastos de cad;i individuo, expresado como un porcentaje del ingreso mensual,
cslá almacenado en la columna 1 del archivo 'CB8CI .DAT' en el disco de dato~ .
(El número de individuos se encuentra en la columna 2.) Cargue los datos en algún
paquete estadístico que cslé a su disposición
a . Ohteng3 la media y la desviación e:.tándar mucstrales para los gastos.
h. Calcule (ya sea a mano o por medio de la computadora) un intervalo de conlian-
7.3 al 95% para la media pohlacional.
Estudio de caso estimación por intervalos 349
En una universidad le han pedido al director del departamento de personal que eva-
lú~ los costos de un sistema de prestaciones flexible que se ha propuesto. Bajo
JSO 8 ESTIMACIÓN POR INTCRVAL.OS
dicho plan, cada individuo elige una "canasta" de prestaciones como mejor se ajus-
te a sus necesidades. Las elecciones más importantes, en términos de lo que cuesta
a la uni' ersidad, ~on el monto del seguro de vida, el del S<!guro medico ) la apor-
taciófi al fondo para el retiro. El director del departamento de personal necesitaba
información acerca de la cantidad media de cada una de e~tas opc1onec; para deter-
minar el costo por empicado para la universidad. De acuerdo con este sistema, cada
trabajador pagaría parte del costo (por encima del mínimo pagado por la universi-
dad), pero el gasto de Ja universidad también se incrementaría en alguna medida
con el aumento de las prestaciones.
El director no quiso realii.ar una encuesta que abarcase a todo el cuerpo do·
cente y a todo el personal administrativo de la universidad. En primer lugar, porque
hay alrededor de 17,000 empicados elegibles, <le modo que la encuesta sería una
tarea dificil de realizar, y en segundo lugar porque el nue,·o plan aún no ha sido
aprobado. de modo que existe el peligro real de que una encuesta general se pudie-
se interpretar como una promesa de que el plan estaría pronto en acción. El direc-
tor escogió tomar una muestra de empleados que ya contaban con algún tipo de
prestaciones. A cada uno de ellos se le hizo una entrevista personal. en parte para
explicar las posibilidades y en parte para hacer hincapié en el caracter tentativo del
plan. Se obtuvieron datos para 61 empleados. Se calcularon los costos anuales (en
dólares) de las opciones que escogió cada uno de ellos. Son los siguientes:
""P' 1•
nv
med~a UH rem1 empl 14 ~ ... ,.,,,,
-
1 '19' tu 4t rn •" s 19
z '24 21' n.e w 74S llal 1161
J
4
07
•1•
,,.
tJO u.
IW
,1
5l
uo
1)9
t.70 70
no
s •SS
'"
ni
,.
u SZI
.,,
701 661
•
-
61)
7
SS9
6SI '"
..,..
114&
,,.,
m ,.u
t47
~J Sl9
66)
67•
,.,,•
)19 no
9 na 61'1) )7 .02 '"
llS
•IJ
nt
4~ ~I SOl
,,
~ 493 1120 l8l
-
97 )tl StO Tll 4&1 7(>1
ll 47' 1137 l'M 60 2'7 390 6'24
1J ll9 )9S ~ 61 ,, l'9 6.19
14 MI ns 6)J
IS zo 4n ~7
tal 492 76'
"'-
11 J\7 MiZ
'°'
•n
-
11) 60I
J)I Z4' ~
" 'º
20
Z1 J9S
ltli
74&
u
u '"
)IS
'°'
..,.,
4U 11)1
61.J
Z4 167 )6) '60
n 189
.,,..,
181 .SS
z• 7" m MT
17 lS. sn
'º'
..,..
ll
Zt
JO
4~ "'
llZJ
921
7'f
1157
,,
)1
Jl
20
~
. .1
740 ....
714
,,,
J4
'n
sn
'47
,..,
IZl7 ,.,
)S 17'
nu "'
,....
"'
)7
P)I
S79 1)1 ""
TOO
,.
-
JI ION Tl"O
m
-
SM
441
41
4l
4)
lSI
'61
l~
n
soo
, ..
10l4
IW 4119
411
w
44
,..
4S ))O
7J6
126.l
609
11114
'" 742
667
47 .01 71J 71'
Distribución x.2
Lu distribución x2 con n grados de lihena<l (g.I.) es la distribución de
¿o'¡ - µ12
U' = z ~ + ... + z; = -· -o- - - 2
D istribución muestraf de s 2
Paril una muestra aleatoria de tamaño n tomada de una población normal, el es·
tadístico
s1
(n - 1) -
ul
x2 con n -
tiene una distribución muestra! 1 g.I.
•
Recuerde que s 2 ==l(Y, -Yi /(n-1), de modo que (n-1Xs2 l<r) l(Y, -Y)2 /~.
La demostración de la distribución muestra) se basa en las ideas que ya desarro-
llamos en este apéndice. Aunque no podemos proporcionar una demostración ri-
gurosa dentro de la esfera de este libro, podemos indicar la idea básica.
La clave de la demostración es la identidad
¿ (Y, - µ) l = ¿,.J
"
Y, - -2
Y) + n( y- - µ) 2
(11 02 (11
x
tadísticos 2 con más grados de libenad, es razonable que el otro término l< r -
f )2 / o 2 también tenga una distribución x2 . Es más, como los grados de libenad
son aditivos, este término deberia tener n - 1 g.1. El único paso del argumento que
omitimos es la demostración de que los dos términos en el miembro derecho d~ la
ecuación son independientes; esto sólo se demuestra en textos avanudos.
Estos resultados preliminares acerca de las distribuciones x~ se utilizan al de·
sarrollar la distribución t. En primer lugar definimos la distribución t con v grados
de libenad (g.I.):
, ___
La distribución t con v grados de libertad es la distribución de
7.
J w¡11
Ap~ridoce l.» dosinbuoones t y j1 ~drado 353
Tomamos 2 como ( r µ) I ( <r- ..[t,) y W como (n - 1)(s2/ cr), que como aca-
b:imos d..: ver tiene una distribucion x!
con v = /1 - 1 g.l. (Se puede demostrar que
Z) W son independientes.) Por definición,
(y - JI)
tJ \, n Y- JI
1 = - - - -~~-1- - - -- s. fn
\J1 111 - 1)
a·
, (n 11
PRUEBAS O CONTRASTES
9 - ,
DE HIPOTESIS
A menudo los datos muestrales sugieren que algo relevante está sucediendo en la
población o proceso subyacente. Una muestra de clientes potenciales puede poner de
manifiesto que una mayor proporción prefiere una nueva marca sobre la ya existen-
te. Una muestra del tiempo que tardan los empicados de la oficina de reservaciones
en atender las llamadas telefónicas puede mostrar que hay un incremento en el tiem-
po medio de espera por parte del cliente. Una muc¡,tra de los cigOei'lales elaborados
con una nueva aleación puede mostrar una disminución en la desviación estándar de
la dureza del metal. En cada caso, los datos provienen de una muestra limitada y por
lo mismo están sujetos a cierto grado de variación aleatoria.
La pregunta es si el resultado o el efecto aparente en la muestra es una indica-
ción de que algo está sucediendo en la población (o proceso) subyacente o si el re-
sultado obsc"'ado es pos iblemente una casualidad, un fruto de la variación aleatoria.
Probar hipótesis e tadisticas es una manera de estimar si los resultados aparentes en
una muestra indican concluyentemente que en realidad algo está pasando. Este capí-
tulo está dedicado a Jos conceptos básicos de las pruebas de hipótesis.
Comen1amos en las secciones 9. 1 y 9.2 con el análisis de una prueba de hipó-
tesis para la proporción, basada en las probabilidades binomiales. Esto prueba tie-
ne alguna importanci.:i práctica, pero Ja estudiamos principalmente como un vehículo
idóneo para introducir las ideas sin cálculos complicados. Después dirigimos nues-
tra atención a una prueba para la media, que se utiliza más y está basada en proba-
bilidades normales. La mecánica de esta prueba: se expone en la sección 9 .3, y en
Ja sección 9.4 st estudian sus propiedades teóricas. El valor p de una prueba, un
método estándar para indicar cuán concluyente es el resultado de una pnu:ba, e~ el
objeto de la sección 9 S. Una vez establecida la teoría de las pruebas de hipótesis.
podremos anah.l.3r algunos métodos ampliamente utili?.ados: en la sección 9.6, una
prueba t para la media, en la sección 9. 7, una veriucac!ón est:lndar de las hipótesis;
en la sección 9.8, una prueba para la mediana, y en la sección 9.9, una prueba:
~proxim:ula para una proporción. Las pruebas de hipótesis y Jos intervalos de con-
lianza son dos formas de tratar con el problema de la variación aleatoria y la incer-
tidumbre en las muestras, por lo que en Ja sección 9 .1O se estudia la conexión entre
estos dos enfoques. Las pruebas para la desviación estándar y los intervalos de con-
fianza relacionados con ellas son el tema de la sección 9. 11. Por último, en la
354
9. 1 Una prU4tba para la proporc.00 b4noml&I lSS
sección 9.12 consideramos Jos pros y los contras de las pruebas de hipótesis como
un método para la toma de decisiones empresariales.
Las pruebas de hipótesis comprenden algunos conceptos y definiciones nue-
vos, más un cierto número de fórmulas para llevar a cabo los cálculos. Cuando tra-
baje con éstos, trate de no perder de vista la idea básica. Los datos de una muestra
están sujetos a la variación aleatoria, de modo que Jos resultados aparentes <le la
misma pueden ser engai\osos. ¿Cuán concluyente es la evidencia que nos dan los
datos de una muestra acerca de un efecto más que aleatorio en la población o proce-
so subyacente?
Casi siempre hay distintas maneras de llevar a cabo unn prueba de hipótesis.
Se puede n:ah1.ar una prueba fonnal utilizando un procedimiento en cinco p;1S0s que
se describe en este capítulo. o se puede calcular un valor p par.i realizar la rrueba, o
se puede utili1ar un inten ato de confiann como una prueba de hipótesis. Fstos mé-
todos son equivalentes y todos ellos llevan a la misma conclusión. El método fonnal
de los cinco pasos es más fácil de entender en un principio, el método dt!I valor pes
comúnmenll! utilizado por los paquetes de cómputo, y el enfoque del inten·alo de
conlianza es fácil de interpretar (y dificil de entender mal). Repetimos. todos ellos
son fonnas útiles y equivalentes de resolver el problema.
EJEMPLO 9.1 Una cadena de supermercados vende pan recién horneado. Los cálculos realizados
confonne a ta teoria de inventarios indican 4uc para balancear los co.,tos del pan no
vendido (por estar duro) y la satisfacción Je los el ientcs. la cadena debería agotar sus
existencias de pan el 20% de los días. Se elige una muestra aleatoria de 50 tiendas
y se determina la tasa de desabasto de esas tiendas en una fecha particular. Formule
una hipótesis nula del tipo "no hay problema". ¿Se debe considerar a la hipótesis al-
ternativa como unilateral o bilateral?
Solución La hipótesis nula se refiere a 1C, la proporción de todas las tiendas de la cadena (no
sólo las consideradas en la muestra) en las que que se agotó el pan en esa fecha. El
valor deseado para Tres 0.20, de modo que la hipótesis nula "no hay problema" es
H0 : Tr 0.20. En este problema, nos deberían preocupar las tasas de desabasto que
son o muy hajas (que resultan en dcmasiaJo pan duro) o muy altas (que resultan en
"'enta.-. perdidas e insatisfacción de los cliente~). Por consiguiente, deberíamos tomar
la hipótesis bilateral Hª: Tr ~ 0.20. •
EJEMP ~0 9. 2 En el ejemplo 9.1, Jfrepresentaba IJ propon:1ón de todas las tiendas que se queda-
ban sin abasto de pan en una fecha partu:ulur. Si Ja hipótesis nula es H0 : TC-=- 0.20 y
la hipótesis alternativa H,, es bilateral, ¿cu..'ll es un estadístico adecuado para la prue-
ba'! (,Qué valores de este estadístico contradirían la hipótesis nuln y por consiguien-
te apoyarían la hipótesis de alternativa?
En las pruebas de hipótesis es necesario tr;u..'.lr una linea entre los valores del
estadístico de la prueba que son relativamente probables dada la hipótesis nula y los
':llore~ que no lo son. ¿Fn qué \alor del estadístico de la prueba comen7..amos a de-
cir que los datos apoyan a la hipótesis altcmntiva'! Para contestar a e:.ta pregunta se
requiere conocer Ja distribución muestral del estadístico de la prueba. Los valores
del estadístico de la prueba que son sumamente improbables bajo la hipótesis nula
rc~ión de rccha10 (tal como los determina Ja distribución muestral) fonnan una región de rechazo
(R.R.) para la prueba estadística.
Cuando se especifica una región de rechazo se debe reconocer la posibilidad de
error Suponga que. para una muesu-a de 100 con!>umidorc~. fijamos la región de re-
chazo en y= 59 o más clientes que prefieren el nuevo producto. Aun si la hipótesis
nula H0 : te s; 0.50 es verdadera, hay una pequeña probabilidad de observar y 2. 59.
Si dicha situación ocurriese, los investigadores de mercado pensarían equivocada-
mente que el nuevo producto es superior al anterior. Esta clase de error· rechazar una
error tipo l hipótesis nula que es. de hecho, verdadera. se llama error tipo 1 Al establecer una
región de rechazo. un investigador debe especificar la máxima probabilidad tolera-
ble de un error tipo 1, denotada con a.
La prohahilidad a en la pmeba de una proporción podemos calcularla suman-
do prohabilidaJes binomiales de la tabla 1 del apéndice, pues el estadístico Y de la
prueba satisface todas las hipótesis de una variable aleatoria binomial En el ejem-
plo de la comparación de productos. si tenemos 11 - 100, H 0 : Tí S 0.50 y R R. :
y 2: 59, l!ntonces el riesgo a es•
a máxP(Y2:59jn~.50}
"
En principio, para encontrar a debemos calcular P( Y 2: 59) para cada valor de
tr S 0.50. Si buscamos en la tabla 1 del apéndice con n =100 y Jf - 0.50, encontra-
mos que
Solución Debemos ohservar que en el ejemplo 9.2 la región <le rechazo debería incluir tanto
valores muy grandes de 1· corno muy pequeños. La forma natural de proceder es lo·
calizar las dos partes de la región de rechazo a d istancia<> iguales del valor esperado
<le Y bajo H0 , a saber 50(0 20) 1O. En la tabla 1 del apéndice, con n = 50 y rr =
0.20, encontramos que
l = .20) =
P( Y <?: !6 tt 0308 y l
P( Y S 4 1t = .20) = .0185
y
EJEMPLO 9.4 Si en los ejemplos 9.1-9.3 se encuentra que 14 de las 50 tiendas se quedaron sin
abasto de pan en el problema de la \ enta de pan en los supennercados, ¿podemos
decir que los datos apoyan la hipótesis alternativa?
9.1 Suponga que la opinión prevaleciente entre los analistas de la bolsa de "ªlores es
que sólo ti 35% de las ofertas públicas de compra resultan en una adquisición real.
Un grupo de analistas cree que incluso este porcenlaje es muy elevado. Para poner
a prueba sus creencias, el grupo planea rastrear las siguientes 20 ofertas públicas de
compra para ver cuántas de ellas derivan en una adquisición.
360 9 PRUEBAS O CONTRASTES DE HIPOTESIS
Hasta ahora sólo nos hemos interesado en un tipo de error en las pruebas de hipóte-
sis: el error tipo 1, en los que se recha.t.a la hipótesis nula cuando ésta es verdadera.
En el ejemplo de la comparación de productos, un error tipo 1 sería una afirma-
ción de que el nuevo producto es mejor 4uc el anterior cuando en realidad no lo cs.
Ha) 01ro error posible; los in\e-,t1gadorc'> de mercado pueden afirmar que el nue\o
t•rror tipo 11 producto no es superior al anterior cuando, de hecho, si lo es. Es1c error, un error
tipo 11 , proviene de no recha1.ar la hipótesis nula cuando la hipótesis alternativa
es verdadera.
Cuando la hipótesis nula es negativa, como a menudo sucede, un error tipo 1se
puede llamar un error falso positivo, pues en él se llega a la conclusión equivocada
de que una hipótesis positiva Hu es verdadera. Análogamente, un error tipo 11 se
puede llamar un error falso negativo. la conclusión errónea de que una hipótesis
negativa H0 es verdadera.
EJEMPLO 9 .5 En el problema de la venta de pan en los supennercados que se analizó en los ejem-
plos 9.1-9.4, ¿cuáles son las consecuencias de los errores tipo 1 y 11 ?
La probabilidad de que se cometa un error tipo 11. dado que la h1pótes1s alter-
nativa es verdadera, se deno~ con /l La cantidad 1 - f3 se llama potencia de la prue-
ba; la potencia es la probabilidad de que la prueba apoye la h1pótc~1s alternativa
cuando ésta es verdadera. En la tabla 9.1 se presenta un resumen de los resultados
posibles de una prueba estadística y las probabilidades asociadas con ella.
)61 9 PRUEBAS O CONTRASTES DE HIPOTESIS
EJEMPLO 9.6 Remii.ase al ejemplo 9.5. Bajo cienas condiciones, la potencia de la prueba es 0.60.
¿Qué significa esto?
EJEMPLO 9.7 En el ejemplo 9.3 se vio que la región de rechazo correspondiente a a= 0.10 era
Y S 4 o Y ;? 16. Encuentre f3 y la potencia de la prueba cuando tr = 0.30 y cuando
tr - 0.35.
Solución Para encontrar fJ debemos sumar probabilidades para todos los valores de y que no
se encuentran en Ja región de rechaz.o, a saber, 5 S y S 15. La potencia es simplemente
Secc16n 9 2 E¡en::1cios 363
9.11 En el ejercicio 9.1 lenfamos H0 : tr • 0.35, H..: 11' < 0.35," 20, R.R.: Y S 3 y una a
real de 0.0445.
a. Suponga que, de hecho, tr 0.25. ¿Cuál es la probabilidad de que la hipótesis
nula no sea rechazada? ¿Cuál es el nombre técnico de esta probabilidad?
b. Si rr 0.25, ¿cuál es la probabilidad de que /10 será rcch:11ada? ¿Cuál es el nom-
bre técnico de esta probabilidad'?
9.12 ¿Cómo debería cambiar la probabilidad que se encontró en el ejercicio 9.11 inciso
(a). si 1f 0.20 en .. ez de 0.:!5? Sustente su respuesta en principios generales antes
que en un cálculo.
9. 13 En el ejercicio 9.3, suponga que. a la larga. el 10% de las residencias con piscin3
son compradas por la inmobili:iria. Encuentre la probabilidad de que la hipótesis
nula no sea recha.LD.da. ¿Es ésta una probabilidad a o {J?
9.14 Una clase de error que podemos cometer en la situación del ejercicio 9.3 es alirmar
que la probabilidad de que las residencias con piscina se compren bajo el plan es
mayor que Ja de las otras casas, cuando en realidad las res1denc1as con piscina tienen
la misma probabilidad que éstas. Acorde con el planteamiento del ejercicio 9.3, ¿es
este un error ttpo 1 o tipo 11?
9. 15 Suponga que la muestra del CJcrcic10 9. 3 se extiende a 100 casas y que el .. alor de a
sigue siendo 0.05. También suponga, como en el ejercicio 9.13, que, a la larga, el
10°0 de las residencias con piscina son compradas por la inmobiliaria.
a. La probabilidad de que la hipótesis nula no sea recha1.ada, ¿debería ser mayor o
menor que la probabilidad que se encontró en el ejercicio 9.13? Sustente su res-
puesta en principios generales antes que en el cálculo.
364 '1 PRUEBAS O CONTRASTES CE HIPOTESIS
b. La región de rechazo con n"' 100 y a - 0.05 se convierte en Y <!: 1O. Calcule Ja
probabilidad de que H0 no sea recha1.ada. ¿Confirma este resultado su respuesta
J al inciso (a)?
rcJ:ión tic r cchaLo R.R.: Para a- O.OS, rechace H0 : µ ~ 16 si el valor observado de .f se encuentra
u t iliLando ji más de 1.64 S <J r veces por debajo de µ = 16 (véase la figura 9 .1 ).
µ:: 16
.1
Rogión do
rechazo r 1.645ay
FIGURA 9.1 Región de rechazo para el estadístico y de la prueba (a = 0.05. una cola)
366 9 PRUEW O CONTRASTES DE HIPÓTESIS
-1.645 o
Rechace H0 1
FIGURA 9.2 Región de rechazo para el estadístico de la prueba z (a = 0.05, una cola)
región de rccbaio =
R.R.: para a = 0.05, rechace H 0 : µ 16 s i el valor calculado <le= es menor
utilizando z o igual a 1.645 (véase la figura 9.2).
En virtud de que esta última alternativa es más breve y quizá más simple, la utiliza-
remos a lo largo del texto.
Finalmente, suponga que el peso med io muestra! para una muestra de n = 25
cajas es 15.83 onzas. ¿Q ué puede concluir la ofic ina Je pesas ) medid as en relación
con la media poblac1onal (el llenado medio d ~ las cajai.)'> El estadístico =
z = 15.83 - 16 = -8.5
.11.fiS
indica que la med ia muestra! ( 15.83) se encuentra 8.5 e rrores estándar por debajo
de la media hipotética µ = 16. En virtud de que el valor c3lculado del estadístico
z ( -8.5) se encuentra en la región de rechazo muy por debaj o del valor criti-
co - 1.645, la oficina puede recha.zar la hipótesis nula y afinnar que la compa~ía no
llena correctamente las cajas. Una lista nos muestra el trabajo realizado por la oficina.
15.83 - 16
Conclusión: z = ~ = -8.5; rechace H0
.1 / ...¡¿_~
Nota : Para H 0 : µ =- µ 0 y H 0 : µ > µ 0 , la región de rec hazo para
esz ~
a = 0 .05 l .64S.
•
93 Una prue~ para la media poblaaonal con des11tac16n estándar conocida 367
Para las pruebas de hipótesis que comprenden tanto a µ como a Tr, hemos se-
i"talado que el valor limite de la hipótesis nula es el valor más importante. En el
ejemplo del peso de los cereales, suponga que habíamos tomado algún otro valor
dentro de H0 para la media, tal comoµ = 16.01 . El estadístico z correspondiente es-
taría aún más lejos dentro de la región de rechazo:
EJEMPLO 9 .8 Un investigador afinna que el tiempo que los nii"tos preescolares urbanos entre 3 y
5 ai"tos dedican a ver la televisión por semana tiene una media de 22.6 horas y una
desviación estándar de 6.1 horas. Una compai"tía de investigación de mercado cree
que la media proclama4a es muy pequeña. Para probar su hipótesis, se toma una
muestra aleatoria de 60 njños preescolares urbanos y se mide el tiempo que dedican
a ver la televisión, encargándole a los padres que lo anoten diariamente en una hoja
de registro. Si la media semanal del tiempo dedicado a ver la televisión es de 25.2
horas y se supone que Ja desviación estándar poblacional u es de 6.1 horas, ¿se de-
bería rechazar la atinnación de los investigadores con un valor a de O.O1?
",. 16
Aeg1on de
rechazo
o 1 645
Re91ón de
1 rechazo
FIGURA 9.3 Reg16n de redlazo para H 0 : µ > 16, con (a) y como estadístico de la prueba;
(b) z como estadlstico de la prueba
De nuestro análisis de las pruebas de una colo se sigue directamente w1a prue-
ba de dos colas para la hipótesis alternativa, Hu: µ~/Jo· Por ejemplo, el gerente de
la compañía que se interesa en el posible llenado excesivo o deficiente de las cajas
puede tomar como hipótesis alternativa que µ ~ 16. Tanto los valores grandes como
los valores peque~os de y se~alarlan el rechazo de H 0 : µ 16. Si la región de recha-
zo ~e divide unifonnemente cm.re las colas, para a - O.OS. ést;:1 sería como se mues-
tra en la figura 9.4a; la correspondiente región de rechazo basada en el estadístico:
~e muestra en la figura 9.4b.
Se puede escribir un cuadro para la prueba : cubriendo las tres formas de la
h1pótcs1s alternativa. Recuerde que : 0 es el valor z que tiene un área a en la cola de-
recha de la curva z. Así, zo.os - 1.645 y z0 ois - 1.96. Para una prueba de dos colas y
una a dada, los puntos de corte buscados son : 4 1 ) : 41 . Para a- 0.05, utilizamos
:-00 ~ ~ - 1.96 y - z0 02 s .. -1.96. Los pri"'.'eros cuatro pasos de la prueba estadística
para µ (<1 conocida) se muestran aquí. Estos enuncian el problema y determinan la
región de rechazo; el último paso consiste simplemente en llegar a una conclusión
9l Una prueba p~ la media pobladonal con desviac:16n eslindat conocida 369
.025
~ t ~
l=\eg¡ón de Región de
rechaio 1.96oy 1.96oy rechazo
(a)
·1.96 o 1 96
Región de Región de
rechazo rechazo
(b)
FIGURA 9.4 =
Región de rechazo para H0: µ 16, con (a) y como estadístico de la prueba;
(b) z como estadístico de la prueba
y- µo
E.P.: : = u/.¡;
'
R.R.: para la probabilidad de un error a tipo 1, rechace H 0 si
l. => ••
2. ::: < -z.
J. z > z.11 o z < - : 1112
EJEMPLO 9.9 Remítase a los datos del ejemplo 9.8. Ponga a prueba la hipótesis alternativa
H0 : µ ~ 22.6 ~tilizando a= O.O l.
H0 :µ= 16
H.: JI< 16
y-µ 0 15.83 - 16
E.P.: z ~ --= • - 14.167
s/...fñ . 12/~
EJEMPLO 9. 1O Suponga que la muestra del tiempo dedicado a ver Ja televisión del ejemplo 9.8 tie-
ne una desviación estándar de 5.8. Utilice este valor para probar la hipótesis alter-
nativa Hu: µ> 22.6, con a= 0.01.
;: = 25.2 - 22.6
= 3.47
5.8//60
Este valor se encuentra dentro de la región de rechazo z ~ 2.326, de modo que se
acepta Hu. •
Es así que la oficina tiene una pequeifa probabilidad ({J - 0.01) de no poder recha-
1..Jr H0 en coi.o de que el pc~o medio del llenado de las cajas sea 0.5°;o inferior a las
16 onzas establecidas. En otrJS palabras, con este procedimiento de prueba hay una
probabilidad muy alta ( 1 {3 O. 99} de descubrir el llenado defectuoso en un o.si¡.o
si éste se da.
Para las pruebas de dos colas se puede realizar un cálculo similar. El gerente
de producción de la compai'lía de cereales tenía una región de rechazo (con a=
0.05) de z ~ -t.96 o z ~ 1.96, o lo que es lo mismo,
- 16 - 1.96(.1) s 96 1 _ 16 + t.96(. 1) o~
y~ r.;; =I o y~ r:;-; :: 16. .19
..,¡ 25 ..,¡ 25
9 '4 La probablhdad /J para las pruebas z 373
15.92 15 9671
(a)
15.9671 16
(b)
FIGURA 9.5 Cálculo de fJ para una prueba z de una cola: d1stnbuc1on muestra! de
Yba,o (a) H.,: µ = 15.92; (b) H0 : µ = 16.00
Si 15.961 < .V < 16.039. H 0 no se rechaza. Así, si la 'crdadera media es l S. 92, Ja
probabilidad de aceptar incorrectamente H 0 es
/1 = P(l5.961 <Y <16.039jµ = 15.921
l5.961 - 1592 16.039 - 15.92)
= P( <1<----- -
.11Jii .11J2s
""' P12.05 < z < 5.95)
Observe que el limite superior S.95 {que corresponde al límite superior de
y::: 16.039) no tiene prácticamente ningún efecto, pues P(z ~ 5.95) es cero con
muchas cifras decimales. Por consiguiente, el valor de /3 es P(2 .05 < z < 5.95)
-= P(z > 2.05) = 0.02. En la figura 9.6 se ilustra este cálculo.
Afonunadamente, se c uenta con una versión abreviada de estos cálculos. Re-
cuerde que Jlo denota el valor límite de µ bajo H0; análogamente, denote con µ 0
cualquier \alor seleccionado deµ dentro de la hipótesis alternativa. El cálculo abre-
viado de f3 se muestra en el siguiente recuadro:
Prueba de dos colas: en la prueba de una cola, reemplace -=rr con ~zC!G •
374 9 PRUEBAS O CONTRASTES DE HIPOTESIS
15.92 15.961
(a)
15 961 16 16.039
(b)
EJEMPLO 9. 11 Calcule probabilidades fJ para las pruebas de una cola del ejemplo 9.8. Suponga
que la 'erdadera media es 25 .O.
{l = P(z ~
6.1/-;61)
- 2.326 + 125.0 60
... P(: ~ .72) = .2358 •
En el capitulo 8 se utilizaron los intervalos de contianw para determinar de
~ué tama1'0 debería ser la muestra. Otra allemativa es utilizar las pruebas de hipóte-
!.I!. para !.cleccionar el tamaño. Por ejemplo, una cadena de restaurantes económicos
especializados en carnes asadas obtiene gran parte de MIS ganancias de los "platos
extra" platos que no se incluyen en el menú y que se cobran por separado. En pro-
medio, los extra suponen 4.24 dólares por cuenta, C"~ una desviación estándar de
2.00 dólares. Se está considerando un programa de incentivos paro Jos meseros y las
meseras con la idea de vender más platos extra (i.e., incrementar la media). No obs-
tante, se tiene la preocupación de que el programa sea contraproducente y conduzca
a una reducción real. El objetivo es una media de 4.50 dólares ¡,Cuántas cuentas
deberla in<:luir una prueba que se llevase a cabo bajo el esquema de los incentivos?
Como se tiene la preocupación de que el programa sea contraproducente, se
debe utthmr una hipótesis bilateml. Para calcular el tamafto requerido de Ja mues-
tra es necesario especificar tanto a como {J. Suponga que enunciamos la hipótesis
9 '4 la probati.hdad Pp1r11 lu pruebas z 375
,,= p(z> -
fl
l 96+ 14.50 - r-:-:=
4.241)
2.00/.j400
= P(: > .64) = .5000 - 2389 - .2611
Para asegurar que la probabilidad /3 no es mayor que 0.1 O, debemos redondear ha-
cia arriba a n dándole el valor 622.
EJEMPLO 9. 12 Una compatlía que fabrica panes para máquinas de poca potencia (para trabajos li-
geros) utiliza en ocasiones obreros temporales que contrata a travé<; de una agencia.
Estos trabajadores tienen una producción media de 2250 artlculos por día y una
desviación estándar de 260 artículos por día. Los gerentes de la compai\ia quieren
obtener una muestra de trabajadores temporalc!. de una agencia diferente (una que
proclama tener nom1as más rigurosas) para ver si se incrementa la productividad.
Piensan realizar una prueba de una cola con a - 0.01. Si la productividad media
(poblacional) en el limite de los trabajadores temporales de la nueva agencia es
de hecho 2380 (media desviación estándar más alta). los gerentes quieren que
la prueba tenga una potencia de 0.95 . ¿Cuántos tr.ibJJadore!. temporales se deben
incluir en la prueba?
Redondeando hacia arriba. encontramos que los gerentes necesitan una muestra de
64 trabajadores temporales. Observe que puede ser muy dificil obtener una muestra
aleatoria; para ganarse al nuevo cliente, la agencia podría enviar a sus trabajadores
más productivos. •
.O .O .O .O .o .o .s .s .s 1.0 l.S
1S 2.0 2O 2.S 3.0 6.5 (media - 1 278)
Suponga que la desviación estándar poblac1onal es 1.60. Determine todas la.s partes
de una prueba z de H0 : µ l .S ¿Ocbcrfa 5er 11., de una o dos colas? l tihce a= 0.05.
9 24 Remítase al ejercicio 9.23. Calcule probabilidades fJ paraµ - 1.0, 1.2, 1.4, 1.6, 1.8
y 2.0. Trace una curva para /l
9.25 La teoria subyacente a la prueba del ejercicio 9.23 supone que Y tiene una distribu-
ción aproximadamente ñonnal. Con base en el aspecto de los datos. ¡,cree usted que
la apro,imación es huena para este problema?
9 .S El valor p ~ la prueba de una h1p6tes1s 377
EJEMPLO 9. 13 En el ~jemplo 9.1, encuentre el valor psi en una muestra de 50 tiendas se encuen-
tra que I 8 de ellas se han quedado sin pan.
Solución Las hipótesis nula y alternativa son H0 : 1r ~ 0.20 y H 0 : 1r > 0.20. Utilizando las ta·
hlas binomiales con n - 50 y probabilidad de éxito (carencia de pan) 1r = 0.20,
378 9 PRUEBAS O CONTRASTES DE HIPÓTESIS
P (Y ~ 18) - 0.0062. El valor pes aún más pequel'lo que O.O 1, indicando que H0 se
puede rechazar decididamente. •
"
Cuando la región de rechazo de la prueba tiene dos colas. el cálculo del valor
p se debe modificar ligeramente. Un valor aún más extremo que el del estadístico de
la prueba puede estar en la misma cola o en la cola opuesta. Si la distribución mues-
tra! del estadístico de la prueba es simétnca (como casi siempre sucede en el caso de
u lo r p de las pruebas de dos colas) el ,·a lor p de dos cola'! se puede calcular duplicando el
do'! colas valor de una cola. En el ejemplo de la comparación de productos. el valor p de una
cola correspondiente a y= 59 es 0.0444; si H., '>C hubiese considerado como bilate-
ral, H0 : 1t ~O.SO, el valor p sería 0.0888
El cálculo de los valores p es también muy simple para las pruebas z. En el
ejemplo de las cajas de cereal, para probar el peso medio del llenado, la oficina de
pesas} medidas utilizó una prueba de una cola con H 0· µ 16 y H., Jl < 16. El va-
lor observado del estadístico z fue 8.5 . Dado que la última entrada de la tabla 3 del
apéndice, 3.09, corresponde a un área de la cola igual a 0.001. el valor p, P(: ~
8.5 1 µ = 16), es más pequel'lo que 0.001 paro. esta prueba de una cola.
Para una prueba de dos colas, como la correspondiente a H0 : µ = 16, H0 : µ ;oi!' 16
en el ejemplo de las cajas de cereal, el valor p, P(z $ - 8.5 o z ~ 8.5 1 µ = 16), es
menor que 0.002. Las tablas z más detalladas indican que el valor p de una cola
es menor que 0.0000000001, una posibilidad en 10,000 millones. Con base en los
datos de la muestra, la oficina puede decididam~nte rechazar H 0 . El cálculo de
los va lores p basados en el estadístico z se hace de la siguiente manera:
EJEMPLO 9.1 4 Mucho~ programas de cómputo para el análisis estadístico calculan rutinariamente
valores p. usualmente en la fonna de dos colas.
a . Paro la siguiente salida, encuentre el valor p de una cola.
b. Verifique el cálculo del valor p utilizando tablas:.
c . ¿Se puede rechazar la hipótesis nula con a= 0.05?
HTB > ztest of mea~ • 150 asst.1T11ng slQft'lll • 20 data in •oata '
TEST OF HU • 150.000 VS MU N.E . 150.000
THE ASSUMEO SIGIU. a 20.0
N MEAN STDEV SE MEAN l P VALUE
Oata 25 156.'80 22.515 4.000 1.62 o.,,
Solución a . El valor p (de dos colas) es 0. 11. El valor p de una cola es la mitad de él,
aproximadamente 0.0515.
b. El estadístico: es 1.62. Con base en las tablas normales. el área a la dere-
cha de 1.62 es 0.5000 - 0.4~ 74 "" 0.0526.
c. Como el valor p no es menor que 0.05, no podemos rechazar H0 con a= 0.05,
aunque nos podemos acercar. Observe también que el valor p, 0.0526. no es menor
que 0.05 aunque esté próximo a serlo. •
SECCIÓN 9.5
-------- EJERCICIOS
9.26 Encuentre el valor p para la prueba en el ejercicio 9.20.
9.27 Una compailfa financiera encuentra que el 15% de sus clientes se retrasan en sus pa-
gos. Se pone a prueba un plan de préstamos re\is:ido con una mucstr.i aleatoria de
50 clientes. Si 4 de ellos se retrasan en sus pagos, dé un valor p para la prueba esta·
dística de H0 : tr • 0.15 contra H.: tr < 0. 15.
9 28 L tillce tablas normales en el ejercicio 9.27 para encontrar un valor p aproximado.
9.29 Un gerente de ventas cree que los agentes de ventas de la compañia deberían estar
de viaje cerca del 40% de los dias de trabajo. Si el tiempo que pas:in de viaje es
mucho menor, declinan las solicitudes de compra y, tanto el servicio de los agentes
como la recopilación de infonnación. no ron adecuados. Por el contrario. si pasan
viajando mucho más del 40• o del tiempo. los gastos consumen el aumento en las
ganancias. Un estudio de los últimos 5 me~c s ( 11 O dlas de trabajo) índica los si-
guientes datos (número de días que ha viajado cada agente)
32 36 41 45 48 48 51 54 57 M
(y 47.6. ·' = 9.65. n • 10)
A continuación se muestra una salida de la computadora para estos datos (b:isados
en una supuesta desviación estándar poblacional de 10 .0)
9.31 Se s upone que la pila eléctrica de una calculadora de mano puede realizar 20,000
cálculos antes de que se le tenga que 1,.ol"er a cargar. Una prueba de 114 pilas el~- d
tricas da un promedio de 19.695 cilculos y una desviación est:indar de 1103.
a. Formule las hipótesis nula y alternativa. ~'
b. Calcule el estadístico de la prueba y el valor p apropiados. -.
9.32 c:.Es estadísticamente significativo el resultado del ejercicio 9.31 con los niveles
usuales «!¿Diría usted que el resultado es significativo en la práctica?
EJEMPLO 9. 1S Una aerolínea establece un sistema de "única lila" en la línea de espera de sus ven-
tanillas a fin de reducir el tiempo de espera. En el sistema anterior el tiempo de es-
pera medio bajo condiciones especificas era de 6.1 minutos. Se toma una muestra de
14 tiempos de espera; los tiempos se miden en momentos suficientemente distantes
entre sí para eliminar la posibilidad de observaciones dependientes. La media de la
382 9 PRUEBAS O CONTRASTES DE HIPOTESIS
Solución FI parámetro poblacional <le interés esµ , el tiempo de espera medio. bajo condicio-
ne<; normales, uti lil.3ndo el sistema de única fila. La hipótesis alternativa es que la
media es menor que la media anterior, 6.1, de modo que H.,: µ < 6.1. Podemos to-
mar como hipótesis nula H0 : µ :;; 6.1 (no hay cambio). Como es usual. sólo nos te-
ncmo<; que preocupar por el valor límite de la hipótesis nula.
H0 µ = 6.1
H. : µ< 6.1
Solución Fn el ejemplo 9.15 vimos que corno I = -1. 75 es menor que t0 10• " ' ' '"'- 1.350, •
se puede rechazar H0 con a - O. l O. Por lo tanto, p < 0.1 O. Cuando lo intentamos
con a - O.OS, encontramos que no podemos rechazar H0 ; el valor t tabulado es
-1.os. 131 1. = - 1.771. Por consiguiente, p > 0.05. Podcmo<; sintetizar el valor p
aproximado como 0.05 < p < 0.1 O. •
• Se ut1li1an también como form3s de notación 1011(13). o hien tr1 111 (N. J,• lo R T.)
9 6 PruebaJ de h1pótes1s con la d1stribuc16n t 383
EJEMPLO 9 .1 7 Un ajustador de seguros utiliza dos talleres distintos para mandar a reparar los au-
tomóviles extranjeros que sufren d<IDos por colísión. Para probar si los talleres son
competitivos en precio, el ajustador obtiene estimaciones del costo de reparación en
ambos talleres para 15 automÓ\ íles. Ponga a prueba la hipótesis nula de que la di-
ferenc:1a m~d1a es cero contra la hipótesis alternativa apropiada ¿Qué se puedi::: de·
cir aci:::rca del valor p?
Solución La h1¡>ó1em nula es que la verdadera diferencia media µel es O Como no se ha espe-
cificado ninguna dirección particular para la hipótesis alternativa, tome Hª : µJ ~O.
Basamos la prueba en las diferencias (que, en este caso, son designadas con den vez
de y). El estadístico de Ja prueba es
r---
J-o
s,/J;
y se hasa en n - 1 =14 g.1. Un cálculo rutinario nos da d = 0.613 y sd"" 0394, de
modo que
- .613 - 603
1- r. -
.394/..¡ 15
El ma)Or valor tabulado t para 14 g.1. es 2.977, el cual corTespondc a un área de una
cola de 0.005. Así, aun para un a (de dos colas) igual a O.O 1, H0 se puede rechazar
f:ícilmente. El valor p debe ser menor que 0.01; de hecho, sospechamos que el va-
lor pes mucho más peque~o que 0.01. Formalmente, concluimos que los dos talle-
res tienen diferentes estimaciones medias. Es bastante claro que el taller l tiene
estimaciones medias más altas que el taller 2. •
y un valor para a. Por ejemplo. suponga que se realiza una prueba t utilizando
n = 25) <X O 05 (de do!. colas))' que suponemo!. que la verdadera media poblacio-
nal c:.tJ-0 ~ dci.\iacioncs cMándar por encima de la media de la hipótesis nula:
µ. - JJo = .8
En este caso,
"
p = P(z > -z912 + lµ;¡fnol)
P(z > - 1.96 + I/...¡·~)
2S
- P(: > 2.04) = .0207
aproximadamente. Se deduce que, bajo estas condiciones, la potencia es aproxima-
damente 1 - 0.0207 =0.9793. Como ya lo hemos sei!alado, el cálculo subestima f3
y sobrestima la potencia, así que ésta no es tan buena como el cálculo indica.
EJEMPLO 9. 18 En una simulación por computadora, se toman 1000 muestras de tamar'\o 30 de una
población normal que tiene media S5 y desviación estándar 1O. Con base en cada
muestra se prueba la hipótesis nula de que la media poblacional es 50. Se obtienen
los siguientes resultados:
Mu Si!llM n
55.000 10.0000 30
nurt>cr of times HO: 11111ten 1s 5011 is re jecte<:I in favor of
al pt\1 "llll!an > 50 11 "meen < 50" tot1l (alptle dcx.Cle<:I)
o. 100 919 o 919
0.050 856 o 856
0.025 7!;2 o 7!;2
0.010 624 o 624
0.005 541 o 541
Los valores a que se indican son para pruebas de una cola, mientras que el to-
la! que se muestra en la salida corresponde a una prueba de dos colas. Como se ve,
el valor a debería ser el doble. ¿Qué probabilidad ~e e~tá aproximando con la frac·
ción 919 1000? ¿Cuánto se acerca la aproximación a la probabilidad teórica calcu-
lada con la fórmula?
Solución En esta simulación la bipotcs1s nula es foil.a;µ es 55. no 50. La fracción 919 1000
aproxima la probabilidad de que la prueba rechace a la hipótesis nula cuando es fal-
sa. Por Jcfimción, dicha probabthdad es 1 - /J, la potencia de Ja prueba. Podemos
calcular el valor teórico fJ coo la fórmula. Para una prueba de una cola y ex= 0.1 O,
el valor tabulado es z0. 10 = 1.28; #Jo= SO, µ""' SS, a; 0.1O y n = 30. Por lo tanto,
9.33 L'n dic;tribu1dor de papel reciclado coloca contenedores \acios en \ ano<; lugJrc-., c~
IO'i ~ellenan gradualmente con IM periódico'! viejoq y matmale-. c;imilarc" que traen
varios indi\.iduo<; Los contenedores se recogen() se reempla1an con olm\ \ac1oc;)
siguiendo distintos itinerarios. 1-n uno de tales tra)ectos se hace la rccolccc1ón c,1da
dos semanas. Este plan es aconsejable si la cantidad media de papel reciclado en
cada periodo de dos semanas es mayor que 1600 pies cúbicos. Distintos re~istros
correspondientes a 18 periodos de dos semanas mucc;tran los siguientes volúmenes
(en pies cúbicos) para un lugar particular:
AutoMóvll
2 ,) .. 5 6 7
Mpg antes 19 1 199 17 6 W2 23 5 26 ll 21.7
Mpg desputs 200 237 18.7 22 J 238 19 ~ 24 6
Cambio 9 38 1.1 2. 1 3 -7.6 29
envían paquetes a cada uno de ellos por ambas rutas. Los tiempos de entrega, en
días. son los siguientes:
,¡
Destino
2 3 4 5 6 7 8 9 10
Servicio postal 3 4 5 4 8 9 7 10 ~ 9
Transportista privado 2 2 3 5 4 6 9 (i 7 6
D1ferenci:1 2 2 -1 4 ) -2 4 2 J
EJEM PLO 9. 19 En un estudio s imulado se tomaron 1000 muesm1s de tamaño JO de una pobl:ici6n
de Laplace, simétrica y moderadamente propensa a los valores atf picos. Se obtuvie-
ron los siguientes resultados:
Cheüing Alpha
Stll\Jlet1on of One Saftl>lt t·test (1000 Sal!"f>les)
Populat1on shape 1s moderately outlier prone.
Hu Sigma n
50.000 10.0000 30
one·ta1 l :
Solu ción La s::ilida de la computadora indica correctamente que H0 esµ 50, pues la media
poblacional es 50. Por lo tanto a, la probabilidad de un error tipo l. está aproxima-
da por f rocciones como 10411000. Éstas sólo son aproximaciones porque están ba-
sadas en 1000 muestras, no en un número infinito de ellas Observe que todas las
fracciones son muy cercanas a los valores nominales a. Por ejemplo, con un a de
una cola de 0.025, las fracciones observadas son 0.028 y 0.024. •
EJEMPLO 9.20 Olro estudio simulado comprende muesU"aS de tam~o JO tomadas de una población
de Laplace. En este estudio la media es 55, de modo que H0 : µ 50 es falsa. A con-
tinuación mostramos los resultados de una prueba t y de una prueba del signo (una
prueha para la mediano, que tombién es 55 debido a la simetría de la población
de Laplace):
Solución Recuerde quc la potencia es la probabilidad de que la hipótesis nula sea rechazada
i.uponiendo que es falsa. Observamos que para cada cr, excepto para 0.005 (de una
cola), la prueba del signo rechaza la hipótesis con más frecuencia que la prueba t.
Por consiguiente, la prueba del signo parece ser, en general, más poderosa para esta
población moderadamente propensa a los valores atlpicos. •
la población es una descripción más útil del valor central de una distribución que la
media poblacional.
Al igual que con los intervalos de confianza para la mediana. las pruebas de
hipótesis acerca de este estadístico no siguen el fonnato eslándar de las inferencias
acerca de la media. En vez de ello. el problema se puede refonnular para reducirlo
a una !>ltuación binomial. Para esclarecer estas ideas, suponga que la hipótesis nula
es que IJ calificación media en una prueba de aptitude!> para la progrJmac1ón es 60.
con una hipótesis alternativa de que la mediana es mas peque"ª La idea t:s que cada
ob'>el'\'ac1ón de una muestra aleatoria sea comparada con la mediana h1potet1ca de
60. Después, calificando como éxito a cada observación por encima de 60 ) como
fracaso a cada observación por debajo de 60, • el problema relativo a la mediana de
Ja población se traduce en uno relativo a una variable aleatoria binomial. Por defi-
prueba dr 1:1 mc- nición de la mediana. Ja hipótesis nula nos da una probabilidad de éxito de 0.5.
di:m:.1 en términos Si la hipótesis alternativa es verdadera, la probabilidad de éxito es algo menor que
de un:1 d b lribu- 0.5. Por lo tanto, se puede aplicar la prueba binomial descrita con anterioridad
ci{m binomial en este capítulo.
EJEMPLO 9.21 Realice una prueba para la mediana con los datos del ejemplo 9.17.
Solución fornamos H0 : la diferencia en la medrana es cero, contra una H., bilateral. Llame
éxito a cualquier diferencia mayor que cero. Como ninguna diferencia es igual a
cero, n = 15 y el número total de éxitos, Y. en los 1S ensayos es y - 14. Consultan-
do una tabla binomial con n = 15 y tr= 0.5, P.,J...v ~ 14)•0.0005. Para una prueba
de dos colas sumamos las dos probabilidades P.,J...v ~ 1) y Pr(y ~ 14) para obtener
un valor p igual a 0.0010. Nuevamente, H 0 se puede rechazar con toda seguridad .
•
EJEMPLO 9.22 Rcmít<bc! al ejemplo 9.20. ¿Qué índica el estudio de simulación acerca de la venta-
ja de utiliz.ar una prueba para la mediana en vez de una prueba ten el ca!>O de una
población propensa a los valores atípicos?
Solue16n Como ya indicamos en el ejemplo 9.20, la potencia de la prueba (signo) para Ja me-
diana es en general mejor para los datos propensos a los valores atípicos. •
• Si hay wlof'CS txaciamentr 1gmlcs a i.. nxdiana hipol'bca, no podemos decir si se les consldc:n J>Of enci-
ma o J>OC' debajo de ella La JOluc:ión mú fkil a este problema, adopada rn 11 mayoría de los paquetes de
computo, es dc:scanar 11ks valores y redL.1C1r nen el número descartado.
99 Prueba pani lli ¡.ol'()porción de una poblaciÓll utihundo la aproximac16n normal 389
b. Ponga a prueba l:i h1pótem nula de que la mediana de los precios es de 315 dó-
lares contra una 11., bilateral Encuentre cotas para el valor p.
c. <-Hay gran diferencia entre las conclusiones de los incisos (a) y (b)?
9.41 U11lw1ndo los datos del ejercicio 8.27, encuentre un intervalo de confian~ al 95%
para la verdadera mediana de los precioc;
9 42 Remítase a los datos del ejercicio 8.25.
a. Realice una prueba I de /10 • µ <;; 45 contra H.,:µ> 45. U1ilice a• 0.05.
b. fracc un:a gráfica de los dato:.. ¿lhl) alguna rwón para lomar con e'!cept1c1'1mO In
conclusión alcanzada en el 1nc1so (a)?
9.43 Nos referimos nuevamente al CJercicio 8.25.
a. Pons- a prueba Ja hipótesis nula de que ta verdadera mediana es menor o igual a
45. Utiliceª"' O.OS.
b. "lla) alguna diferencia de importancia entre las conclusiones que acaba usted de
obtener)' la!> que obtuvo en el ejercicio 9.42? S1 la ha). ¿cómo ~e explica la mi~ma'>
9.44 Se toman mue~tras nleatorias de tamni'lo 30 de una poblJc1ón normal que uene media
55 y desviación estándar 1O. Se realizan una prueba t y una prueba para la mediana
(prueba del signo), y ~ obtienen los siguientes resultados:
Mu Sigma n
55.000 10.0000 30
~ rof ti N s HO: "111ean is 50" is re j ect f'd in f avor of
e l phe "mean > 50" 0 ttan <
50" tota l (al pha ~t41d)
o. 100 91 9 o 9 19
o.oso 856 o 856
0.025 752 o 752
0.010 624 o 624
o.oos S41 o 541
siempre se tienen a mano tablas binomiales completas, ) en caw de que las haya,
éstas son fastidiosas y necesariamente limitadas. Por ejemplo, ¿cómo probaría la hi·
pótesis nula de que tr - 0.373 con n ""277? Aun con un buen programa de compu-
~
z=----- y- 117(
.Jmr( 1 - x)
De aquí que rechacemosH0 : tr= 0.50 para a : 0 .05 (Y para a = 0 .01). A continua-
ción presentamos un resumen del procedimiento aproximado para probar una pro-
porción de la población utilizando un estadístico =·
Ho : n ::a llo
H., : l. n > 1f0
2. n <no
3. n ~ lfo
E.P.: z = y - nno
Jnn0 (1-n0 )
. l
1.96 .s y - /!: $ 1 96
u/v"
Un poco de álgebra nos muestra que esto es equivalente a
(1 (J
J - 1.96--;:= $ JI S f' + 1.96-r
"" '\)11
y - µ > -1 645
a/J;. - .
Si se despeja µ, el resultado es
- (J
µ$y+ l.645r=
...¡n
intcnalo de con- que es un intcn alo de confianza unilateral En el ejemplo de las cajas de cereal,
fia1uu unilateral este intervalo esµ< 15.863; en vista de que el valor limite '11) - 16 no c;e encuentra
dentro de este intervalo, H0 : µ = 16 se puede rechazar utiliz.ando a - O.OS, de un3
cola. En lo que resta del texto utilizamos intervalos de confianza bilaterales, que sir-
ven para probar hipótesis alternativas bilaterales.
EJEMPLO 9.23 Para los datos del tiempo dedicado a ver la televisión del ejemplo 9.8, utilice un in-
tervalo de confianza al 99% para poner a prueba H0 : µ = 22.6 contra Hu:µ.~ 22.6.
Solución La hipótesis alternativa bilateral implica que podemos utilizar un intervalo de con-
fianza bilateral para poner a prueba la hipótesis nula. En el ejemplo 9.8, y =25.2,
n = SO y se supone que cr es 6. l. El intervalo de confianza al 99% es
6.1 6.1
25.2 - 2.576 (;";:\ $ µ ~ 25.2 + 2.576 r;:r. O 2J.~ ,S JI $ 27.2
vflJ ..¡60
Como el valor de µ bajo H 0 , 22.6, no se encuentra dentro del intervalo, rechaza-
mos H0 utilizando a= 0.01. Por supuesto, en el ejemplo 9.8 se obtuvo la mis-
ma conclusión. •
Sección 9 10 E¡eraGI09 393
SECCIÓN 9. 1O EJERCICIOS
9.45 En el ejercicio 2.66 consideramos las reclamaciones (en miles de dólares) hechas a
cierta compaiHa de seguros como pa¡¡o por los dai\os sufndos por automóviles acci-
dentados. En la figura 9.7 se mues1ta un diagrama de caja paro los datos CU)O aníli-
sis, realizado con el paquete Statgraphics, es el siguiente:
cla 1lftS Ue
S~le Stetistics : N~r of Obs . 187
olver-ve 5.1m4
Variance 27. 9194
Std. Oevi at ion 5.28368
Median 3.5
Diagrama de caja
______, co (1). o
)1(
o 10 20 30 40
Monto de la reclamación
FIGURA 9.7 Diagrama de e.aja para los datos de las reclamacio nes de daños por colis16n
9.46 El diagrama de caja de los datos de reclamaciones por dai'los de la figura 9.7 mues-
tra alguna asimetría. ¿Significa esto que las probabilidades afirmadas parn la prueba
de la media están equivocadas?
9.47 En el ejercicio 9.23 probamos la hipótesis nula de que el número medio de anuncios co-
merciales de servicio público era, en el Hmite, de 1.50. La prueba tenía como base una
muestra de 18 observaciones con una media muestra! de 1.278; 'e 'upu~o que la desvia-
ción e~tándar pohl:lc1onal era 1.60. La hipote5is nula no fue rcch.w1.<1,1 con a 0.05.
a. Calcule un intcn-alo de confianLa JI 95º o para la media pohlacional (media en el
limite). Bajo Ja suposición de que se conoce (j, utilice la tabla:.
b. Demuestre que este intervalo de confianza es consistente con la conclusión del
ejercicio 9.23 .
9.48 La hipótesis nula del ejercicio 9.29, que el número medio de dfas de 'iaJC para IJ po
hl:lcíón de representantes de ventas era de 44, apenas se pudo apo)aJ con ex O 20.
La media muestra! era 47.6; el tamailo de la muest~ 10, y la (jSupuest.a, 10.0.
a. Calcule un intervalo de confianza al 80% para la media poblacional; el valor z0 10
es 1.28.
b. ¿De qu~ mancr:i índica este inter\'alO de confianza que no debe rechuarse la hi-
pótesis nula?
c. ¿De q~ manera indica que H 0 apenas se puede retener?
9.49 En el eJcrcic10 Q 31 pusimos a prueba la afirmación de que la' ida media de una pila
ran calculadora~ era de 20,000 opernc1ones. En una muestra <le 114 pilas, la media
fue 19,695 y la des\ iacíón estándar 1103.
a. Calcule un intervalo de conliana al 99~ó para la vida medía poblac1onal.
b. Demuestre que con a • O.O 1 se del><: recha.73r la hipótesi<> nula de que la media
es 20,000.
c. ¿Serla razonable decir que, en vista del fuerte rechazo de 110 , la vida medía debe
ser mucho más baja que 20,000?
9.50 El principal camino de acceso a un centro comercial suburbano sufre en ocasiones
severos congestionamientos (atascos). Entre semana, excluyendo Jos dlas festivos. el
numero promedio de vehículos que van hacia el centro comercial entre las 9 A.M . y
las 7 P.M., registrados por un coni.idor electrónico, es de 11,260. El departamento de
tránsito trató de mejorar el ílujo vehicular cambiando los ciclos de los semáforos y
mejorando los carriles para dar vuelta. Durante los primeros cinco días no festivos
entre semana, los volúmenes fueron 10,690, 11,452, 12,316. 12,297 y 12,647. La
media de esta muestrn es 11,880.4 y Ja desviacióo estándar 798.68.
a. Calcule un intCT\alo de confianza al 95% para la media (poblacional) en el límite.
b. Demucstn: que con a 0.05 se debe retener la hipótesis nula de que la media si-
gue siendo 11,260.
9. 11 Prueba~ la desviao6n n~ar 395
9.51 Un polltico local revisó los resultados del ejercicio 9.50, >dijo que los datos demos-
traban que no había habido ninguna mejora en el volumen de tráfico. ¿Es esta una
interpretación razonable Jel inlenalo de confian1_a?
9.52 Se hace una lista de los datos del ejercicio 9.50 en orden temporal. ¿Hay indicios de
alguna tendencia o dependencia a lo largo del tiempo?
9.53 Un fabricante de ropa compra la tela en rollos y la cona. En el proceso, ciena can-
tidad de tela se desperdicia. Con los métodos estándar, el desperdicio es de 9.26%.
Un productor de máquinas controladas por computadora le permitió probar una de
sus máquinas con una muestra de 762 eones distintos. En la muestra, el desperdicio
medio fue de 9.11 % y la desviación estándar 1.07%.
a. Calcule un inten alo de contiani'.:i al 99°~ para el desperdicio medio cuando se
utiliza la máquina controlada por computadora.
b. Utilizando a - 0.01, demuestre que ha habido un camhio e\ladísticamemc per-
ceptible (significativo) en la media.
9.54 En el ejercicio 9.53, ¿puede el fabricante de la máquina decir Jc:g111mamcntc que las
pruebas estadí~ticas muestran que ésu reduce mucho el porcentaje de desperdicio?
9.55 Los datos en el ejercicio 9.53 eran asimétricos debido a la prc~cnci:i de algunos ca-
sos con un gran desperdicio. ¿Invalida este hecho el intervalo de contian1a y la
prueba del ejercicio 9.53?
Ho·u 2 =o-5
H. : t. n2 > t1~
2. n 2 < (J 5
3. '1 1 #: t1b
E.P.: Xl =(n l)sl/02
396 9 PRUEBAS O CONTRASTES DE HIPOTESIS
EJEMPLO 9.24 Suponga que una compañia farmacéutica quiere que Ja desviación estándar de las
potencias en cualquier lote de tabletas no sea mayor que 1.40. ¿Se puede rechazar
esta H0 para a= 0.1O si una muestra de 30 tableuis tiene una varianza de 2.1583?
1
_ s2 _ 29(2.1583) _
- (n - 1) ~ - 31 934
E.P.: l
0 - 1.
96
En este problema se tiene un buen argumento para decir 4ue <T - ( 1 -tO)~ es la
má xima vari:m.t.a pemlisible y que la hipótesis alternativa debería '>Cr H.,· <i < 1.96.
Ningún grupo de tabletas deberla ser pllesto a la venta a menos que el control de la
calidad apoye a <i < 1.96. Este es un estándar más severo; para los datos de
la muestra, <T < 1.96 es insostenible. •
9.56 Se toma una muestra de 25 ohservacioncs de una población con mediaµ descono-
cida y varianza u1 Defina
1 (11 - l)s 2
l ... ,,.1
• Ésr.a es la razón por la quie utiliumos el slmbolo H. en vez de, quizJ,. H,.
399
9.64 El contrato de un molino harinero con un \endcdor de granos estipula que el conle-
nido de proteína promedio del trigo de in' iemo debe ser al menos de 13.5%. En el
molino se anali?an varias muestras de cada embarque de granoc;. S1 el contenido es
inferior a 13.5% (en un porcentaje cc;tadlsticamcnte sign1ficat1\.0). el molino deduce
del pago una cmtidad como castigo para el vendedor
a. Formule las hipótesis nula > altcmativa para este problema.
b. ¿Qué acciones se siguen del rechazo y del no rechazo de la hipótesis nula?
c. ¿Cuál seria la consecuencia de fijar a en un valor muy peque/lo?
9.65 Suponga las siguientes condiciones en el ejercicio 9.64:
i. Imponer un castigo puede llevar a acciones legales; si se aplica un castigo y
posterionnente se encuentra que el embarque sausface el estándar de proteína,
el molino puede tener que pagar indemniuciones sustanciales.
ii. S1 todo el embarque es deficiente en proteínas, el molino puede complementar
el contenido proteínico a un bajo costo.
iii. El embarque pro\.iene de un vendedor bien establecido >esti formado por gra-
nos provenientes de una cosecha excelente.
¿Que implican estas consideraciones respecto de ta elección apropiada de los va.l o·
resay¡J?
400 9 PRUEBAS O CONTRASTES OE HIPÓTESIS
9.66 Un antiguo com1!>ionado de la Food and Drug A.dmm1strat1on (FlJA) comenta que
el Congreso se queja con mucha energía siempre que la FDA permite equivocada-
mente que un medicamento inseguro o inefectivo sea lanzado al mercado. pero ja-
6iá<; dice una palabra cuando no se permite que un medicamento efectivo > seguro
no se comercialice. Si tomamos como hipótesis altemati\a "el medicamento es se-
guro y efectivo", ¿qué implica el comentano del ex comisionado :icerc:i de los cos-
tos relativos de los erron:s tipo 1 y tipo 11?
Resumen
•
Las pruebas de hipótesis son un medio para que los gerentes decidan si un resulu-
do aparente en una muestra es probablemente una indicación de que hay un efecto
real en la población o proceso subyacente, o si el resultado es tal ve7. una casualidad
de Ja muestra particular. Fonnalmente. las pruebas de hipóte~i!. se utilizaron para
"contradecir" una hipótesis nula negativa que por lo común decía que no había nin-
gún efecto real. La hipótesis nula se "contradice", suponiendo que es verdadera, si
los datos muestralcs son poco probables. Las pruebas de hipótesis se pueden llevar
a cabo en cinco pasos: especificación de la hipótesis nulo, c!ipecificación de la hipú-
tesis alternativa (pudiendo ser ésta unilateral o bilateral), elección del estadístico de
Ja pnacba, especificación de una región de reeha7o y conclusi6n con base en los da-
tos reales.
La especificación de una región de rechazo requiere de la consideración de
posibles errores falsos positivos (tipo 1) y falsos negativos (tipo 11). Lo común es
especificar la probabilidad a de un error tipo 1y utilizarla para determinar 1íl región
de rechazo (R.R.). 1 a probabilidad JJ de un error tipo 11 (o potencia, el complemen-
to de la probabilidad {J) se puede calcular dada la R.R. y un valor particular de la
hipótesis de investigación
La técnica básica se introdujo en el contexto de una prueba binomial pjlra una
proporción, principalmente porque los cálculos eran fáciles en ese caso. Los mismos
pasos esenciales se aplican a la prueba z para una media con desviación estándar
poblacional conocida y :i una prueba t para una media con desviación estándar po-
blacíonal desconocida, así como a la prueba ji cuadrado para la desviación estánd:ir.
El valor p, ampliamente referido en los paquetes estadisticos y revistas profe-
sionales, es un indice de la evidencia de una prueba estadística. Mientras más pe-
queM es el valor p (el nivel de significación alcanzado), los datos apoyan con
mayor finneL.a la hipótesis alternativa. La significación estadística, estimada con el
valor p, mide el carácter concluyente de la prueba, pero no implica necesariamente
que haya un resultado práctico en los datos.
Las pruebas de hipótesis y los intervalos de confian.w son fonnas de inferen-
cia relacionadas entre si. Un intervalo de confianza da lugar de inmediato a una
prueba de hipótesis: rechace Ja hipótesis nula en el nivel indicado, siempre y cuan·
do el valor de Ja hipótesis nula no se encuentre en el intervalo de confianza. Un in-
tervalo de confianza mu) extenso indica una prueba de h1pótes1~ mu) pobre (de baja
potencia) y por lo tanto indica que ha} muy poca C\ idcncia en un sentido u otro.
Si las pruebas de hipótesis se \an a utilizar como método de decisión, un ge-
rente no sólo debe considerar las probabilidades de los dos tipos de error, sino tam-
bién el costo relativo de dichos errores y la credibilidad a priori de las dos hipótesis.
R.sumen 401
. . de 1a prueba: z
E~ta d 1st1co y - "º
= ---¡:::
a /...¡ n
CAPÍTUL09 EJERCICIOS
9.67 Un fabricante de productos de) ogur 1mpnme una fecha límite de venta en cada en-
vase. Los productos que no se venden al cumplimiento de esa fecha deben desechar-
se. Corno comprobación del sistema de fechado, 50 productos se conservan 8 días
más después de la fecha impresa en el envase. el tiempo máximo que el yogur dehe-
ria conscn.arse en un refrigerador casero. Bajo condiciones tan se\ eras, el fabrican-
te está d1~pue~to a consentir que el 1O~o de lo:. produc1os estén echados a perder.
Un porcentaje más alto indicaría la necesidad de cambiar la política de las fechas lí-
mite de venta. Suponga que 9 de los 50 productos están echados a perder. Lleve a
cabo una prueba estadística usando tablas binomiales y a= 0.05.
9.68 Encuentre el va!or p en el ejercicio 9.67.
9.69 La F.PA (Envmmmental Prote<:tion Agenc:v) de E~tados Unidos obtiene: valores no-
minales de los rendimientos por galón de todos los modelos de automóviles que se
venden en el país. Uno de estos valores pretende representar la distancia en millas
que pueden conducirse si se manej a tanto en c3mpo como en ciudad. Suponga que
un grupo realiza pruebas de manejo con 8 automóviles de un modelo con un rendi-
miento nominal EPA de 28.2 millas por galón. Si H0 esµ= 28.2, ¿qué argumento
nos llevarla a una hipótesis alternativa unilateral? ¿Cuál nos llevaría a una hipótesis
alternativa bilateral?
9. 70 En el ejercicio 9. 79, suponga que la desviación estándar poblacional es 2.1 y que el
rendimiento medio para los 8 automóviles es 26.7. ¿Se puede aceptar la hipótesis
alternativa hilateral con a= O.O 1?
9.71 Encuentre el valor p en el ejercicio 9.70.
9.72 Un oficial del grupo de consumidores interpreta los resultados del ejercicio 9.70 como
carentes de s1gnificac1ón estadística. Por con~igu1ente. conclu)e que se puede suponer
con toda confiaru~ que la verdadera media cs Je 28.2. ¿t-stá usted de acuerdo'>
9.73 l:.n el ejercicio 9.70. calcule un intenalo de confianza al 99~o para el 'erdadcro rendi-
miento medio. Utilice este intervalo para confinnar el resultado que i.e obtuvo antes.
¿Qué podemos suponer con "confian1a" acerca del \Crdadero rendimiento medio?
9. 74 En una encuesta de opinión por todo Estados Unidos, basada en una muestra aleato-
ria de 2417 personas, una pregunta es: "¿cómo califica usted la ética de los dirigen-
tes comerciales de las grandes compailías?" Una calificación de 3 significa "ni mejor
ni peor que la de la mayoría de la gente". Una calificación de 1 es "mejor que la de
la mayoría de la gente", y 5 es "peor que la de la mayoria de la gente". La califica-
ción media es 3.05 y la desviación cs!Andar es 0.62.
a. Calcule un intervalo de confian7...a al 95% para la calificación media poblacional.
b. ¿Se puede rechazar H0 : µ = 3.00 con a 0.05 (comparada con una alternati-
va bilateral)?
9.75 Un periódico que informa acerca de la encuesta del ejercicio 9.74 indica que "los
respondcntes calificaron la ética de los grandes negocios significativamente peor
que el promedio".
a. ¿Es cierta esta afirmación en el sentido estadístico?
b. ¿Piensa usted que podría confundir al público en general?
9.76 ¿Qué se puede decir acerca del valor p del ejercicio 9.74?
E¡erc1c101 403
9.77 En el ejercicio 8.58, el departamento de policía de una ciudad obtu\lo datos de Jos
tiempos de respuesta a las denuncias de delitos que no son emergencias. A continull-
ción reproducimos los datos y la salida de Minitab.
MTB > pr int •resptime'
respt 1me
24 2S 18 25 1S 11 11 19 36 29 13 21 12
12 26 16 19 12 21 12 12 18 11 19 16 24
14 23 17
MIN MAX Q1 Q]
respt1- 11.00 36.00 12.00 23. 50
HIN KAX Qt 03
r espti111e 11.00 36 .00 12.00 23.50
9.8 l En el ejercicio 8.60, en un criadero de peces existia preocupación de que el peso me-
dio {poblacional) de los peces puestos en libertad podría ser distinto de 1O.O onzas.
Las diferencias en cualquier dirección eran indeseables. A continuación reproduci-
mos los datos.
9.3 11.7 11.0 9.8 10.I 89 8.7 9.5 10 8 8.7 7.6
10.0 8 !( 9.J 9.2 81 9.9 94 8.3 10 J 9 !( 9.5
98 9.0 10.7 93 9.6 IOA 94 9K 98 9.2 11 .0
102 9. 1 11.0 94 9.7 12.I 98 7.1 8.J 10.J 106
10. 1 10 2 88 9.3 10.3 10 7 108 7.5 90 10 1 9.2
9.7 104 91 9.7 10.7 106
media 9.6803, desviación estándar 0.95983
a. Formule una hipótesis alternativa y una hipótesis nula.
b. Suponga que la desviación estándar poblacional es de 1.0 onz.a. Escriba un esta-
dístico de la prueba.
404 9 PRUEBAS O CONTRASTES DE HIPÓTESIS
c. Lleve a cabo l:is cinco partes de una prueba estadística con a - 0.1 O. Enuncie
cuidados:imente la conclusión.
9.82 Determine un valor p para el ejercicio 9.81. ¿Debería ser de una cola o de dos colas?
9.83 tn el ejercicio 9.81 obtuvimos, con una muestra de 61 peces. un peso medio mues·
tral de 9.6803 onzas y una desviación estándar muestra! de 0.95983 ona. Utilice
estos resultados para probar la hipótesis alternativa de que el peso medio poblacio-
nal no es igual a 10.0 onzas. No haga ninguna ~uposíción :icerca de la des,iación
estándar poblacional.
9 84 Determine cotas para un valor p de dos colas en el ejercicio 9.83.
9 85 Una muestra de 61 peces produjo en el ejercicio 9.81 una desviación estándar mues-
tral de O. 95983 on.l.'.1. Utilizando a - 0.1 O. pruebe la hipótesis alternativa de que la
desv1ac1ón estándar poblacional no es 1.0 on1a.
9.86 En el ejercicio 8.67, un fabricante de mallas metálicas estaba preocupado porque en
una sección de malla metálica de dos pies de longitud, el número medio de defec
tos podría. exceder de 2.5. Se tomó una muestra nleatoria de 24 secciones con los si-
guientes resultados:
3 4 3 o 6 o 2 1 3 4 4 3 6
4 4 3 4 5 2 o 5 2
desviación
n media mediana estándar
~4 2 917 lOOO 1.792
a. Util11ando u O.O 1. desarrolle lo~ cmco paso~ de un proced1m1cnto formal de pruc·
has de hipotes1s. Considere sí la hipotesis ahemati":i dehena ser unilateral o bilate-
ral,} ~¡ la des\ i:ición estándar indicada se refiere a 1.1 muestra o a la población
b. ¿F~ ra.t-Onablc concluir que la prueba demuestra que la media no es mnyor que 2.5'!
9.87 ¿Qué se puede decir en el ejercicio 9.86 acerca del tamallo del valor p?
9.88 Demuestre que un intel"alo de conli3JU.:i al 99°/o para la media poblacional lleva a la
conclusión alcanzada en el ejercicio 9.86. (Si usted quiere comprobarlo. dicho inter·
valo se calculó en el ejercicio 8.86.) ¿Cómo se relaciona la longitud de este intc!"·a·
lo con la respuesta al inciso (b) del ejercicio 9.86?
9.89 Un fabncante de discos flexibles para computadoras personales probó una muestra
de 36 discos buscando sectores dañados cu:indo se les formateaba en una PC. S1 hay
una clara evidencia de que el tamaoo medio de los sectores dat\:ldos excede de 7 5 K.
se realizará una prueba más extensa.
a. Formule "rcali7.ar una prueba más extensa" como una hipótesis esladlstica alternativa.
b. La media muestra! fue 9.49 y la desviación estándar de la muestra fue 10.02.
¿Hay un incremento estadísticamente significativo (a = 0.05) en el tamano de los
sectores dañados, por encima de 7.5 K?
9.90 ¿Qué se puede decir acerca del tamaño del valor p en el ejercicio 9.89?
9 .91 El siguiente es un dingrama de tallo y hojas de los datos del ejercicio 9 .89.
o 00011 1-¡ 3"144444
o 55SS667777K
02:?~4
57
:!
2 66
3 1
3
4
4 8
405
¿Indica este diagrama que las probabilidades determinadas en los ejercicios 9.89 y
9. 90 pueden ser erróneas?
9.92 En vista del crecimiento de la televisión por cable, las redes de televisión que
transmiten por sei'lal aérea y sus anunciantes se han preocupado por la cantidad
de tiempo que el auditono al que quieren llegar pasa viendo l:i televisión con·
vencional. Durante una scm:ina, se registró, con una precisión de media hora, el
tiempo que una muestra de personas, tomada de un grupo objetivo particular,
dedican a "er la tele"isión convencional. 1:.1 siguiente es un diagrama de tallo y
bojas hecho con Statgraphics:
Steftl·and·leaf display for hrswatched: 1r1it • 0.1 112 represents 1.2
LOl215,22S
4 24ol55
5 25• 10
5 25ol
7 26*1 00
9 26ol55
15 21· 1000000
21 270(555555
<5> 28*100000
18 2801555
15 29*)0000
,1 290155
9 30•10
Hll330,335,335,335,33S,390,415,435
a ¿Qué indican las entradas LO) 111 acerca de la forma de los datos?
b. ¿Serla correcto decir que los datos parecen tener una distribución casi normal?
9.93 l·n la figura 9.8 se muestra un diagrama de prohabilidad normal de los datos del
ejercicio 9. 92. (Observe que los datos están en el eje horizontal y que los registros
teóricos para 13. distribución normal están en el eje vertical, al contrario de los
otros diagramas normales que se muestran en este texto.) ¿Considera usted que
los datos se aproximan a la linea recta indicada? Si no, ¿qué clase de no normali·
dad está presente?
9.94 De acuerdo con una encue-;ta mu) c>;tcnsa real11ada hace dos ai'lo~. para la población
objetivo del ejercicio 9.92, la media() la mediana) obsel"\ ad.i de las horas fue 30.4.
Los datos del ejercicio 9.92 se anal11:1Jon con el paquete Statgraphics. con los si·
guientes resultados:
One·S~le An1lysis Results
hrswa tched
S.,,..:¡le Statistlcs: Nl.6Tbcr of Obs. 44
Average 2s.s9n
Var1ance 18.4486
Std. Oeviat1on 4.29518
Median 28
99.9
99
95
ee
se
28
D
o
5 o
o
o
1
e.1
21 26 29 33 3"1' 41 46
hrswatched
FIGURA 9.8 Diagrama de probabilidad normal: horas dedicadas a ver la telev1s16n
Hypothes ls Test for HO: M~an = 30.4 CQll'9Jt~ t st at lst1c • ·2. 32003
VS Alt: l l Si9. Level • 0.0125765
at Alpha • 0. 1 so reject HO.
b. ¿Es consistente su respuesta con la que dio al inciso (a) del ejercicio 9.94?
c. ¿Cómo es el valor p que se muestra en la s:llida? ¿Indica este valor que la hipó-
tesis nula se debería rechal.élr utih.iando a • 0. 1O?
9.97 Una compal\ía de comunicaciones tiene un programa de "incentivos" por medio del
c u:il los gerentes o empleados con ideas comerciales reciben bonos anuales basados
en la productividad de sus ideas. Los premios no son mu) grandes; el último ai\o, el
promedio fue de 3550 dólares. Este .mo se concedieron 144 honos. El director del
programa tenia la preocupacion de que el 'alor medio de los bonos decrecería a me-
dida que se utilizaran las ideas más evidente<;> pro,echo-;a <;. Se anali7..aron los datos
con Statgrorhics (expresados en miles de dólJrc' por premio), produciéndose la si-
g uiente salida:
a. Ut1li1ando a "' O.OS, demuestre que la salida indica que no ha habido una dismt·
nución estadísticamente significativa en el valor medio de los premios.
b. 1-.1 gerente interpretó la salida como una prueba de que no habla disminuido el
valor medio de los premios. ¿Es ésta una interpretación \'álid:i?
9 98 En la figura 9.9 se muestra un diagrama de caja producido con Statgraphics de los
datos del ejercicio 9.97.
Diagrama de caja
e 2 4 6 e 12
incentivo
que hay en la compallia) les ofrecieron bonos ~i el número promedio de dios de per-
miso se podía reducir del nivel actu31 de 5 7 por empl~do por ai'lo. Después de un
ai'lo, se calculó el número de días de permiso p:ira cada uno de ellos Lus datos
están almacenados en la column:i 1 del 3rchívo 'Cll9C3.DAI.. en el disco de d3los.
En la columna 2 se encuentra el número de 1dent11icación del empleado C;irgue los
datos en cualquier paquete estadístico que pueda utili7.ar.
a. Obtcng3 13 media, la mediana y la desviación estándar de los dias de permi~o que
se tomaron. ¿Qué sugiere esta información acerca de la asimetría de los datos?
b. Obtenga un diagrama de tallo y hojas o un histograma de los dato<;. ¿Confirma el
diagrama su impresión :icerc:i de Ja asimetrla de los datos·~
9.106 a. Ponga a prueba con la computadora 13 hipótesis nula de que la media de los di3s
de permiso sigue siendo 5.7. Posiblemente tendrá que reslar 5.7 de todos los da-
tos para probar la hipótesis de que 13 media es O.
b. Obtenga un \3lor p para la prueba. ¿Qué cipo de valor calcula la compuladora:
unil31eral o bilateral'? ¿Cuál prueba considera es mis apropiada en esta situación:
una unilateral o una bilateral?
R52 Una compai\ia que produce programas para computadora adquirió un nuevo editnr
para que éste fuese ulilizado p<>r una muestra aleatoria de sus programadores. Una
-·
vez que los programadores habían aprendido a utilizarlo razonablemente, la compa-
ilia midió el número de lineas de código depurado (i.e., libre de errores) que cada
uno de ellos produce. (Las tareas de programación lenian un grado de dificultad
comparnble.) Los datos fueron
178 183 199 101 204 210 218 2 llC 219 220 :?25 227 :!.'I
232 232 233 233 235 238 139 241 241 2-U 24t> 247 249
250 251 264 266 270 271 :!71 273 275 276 277 279 2X.'
28.t 285 286 289 289 298 303 306 315 315 345
El tamailo de la muestra es 50, la media muestra) es 253.32 y la desviación estándar
de la mueslra es 36.1.
a. La dc:sviaci6n estándar poblacional para el editor anlerior era 35.4. Suponga que
esta desviación estándar poblacional se aplica igualmenle al nuevo editor. Calcu-
le un intervalo de confianza al 99% para la media poblacional correspondiente al
nuevo edilor.
b. ¡,llay una clara evidencia en los datos de que la media muestra! es probablemen-
te un estimador ineficiente: de la media poblacional?
RS3 Remílase al inlervalo de confian1..a que se calculó en el inciso (n) del ejercicio R52.
La media poblacional correspondiente al viejo editor era 230.2. Con base en el inter-
valo de confianza, ¿podemos rechazar la hipótesis nula de que la media para el nue-
vo editor es 230.2, utilízando a = O.O 1?
R54 Con los datos del ejercicio R52, lleve a cabo una prueba formal de In hipótesis nula
de que la media poblacional sigue siendo 230.2, comparada con la hipótesis nlterna-
tiva de que no es igual a 230.2. Utilice a O.O1 ) suponga que la desviación están-
dar poblacional es 35.4.
R55 Para la prueba de tlipótesis que realizó en el ejercicio R 5~. det.:rmine un valor p.
" Dehc ser este unilateral o bilateral?
R56 Vueha a desarrollar los ejercicios R52- R55 sin la hipótesis de que la desviación eslán·
dar de la población es 35A. ¿Cambia sustancialmente alguna de sus conclusiones?
R57 Con los datos del ejercicio R52, calcule un intervalo de confianza al 99% para la
media poblacional. Con base en este intervalo, ¿podemos rechazar la hipótesis nula
de que la medía poblacional es 230, con a= O.O 1?
R58 ¿Cuál de los intervalos de confianw al 99% tiene mayor amplitud, el que se calculó
en el ejercicio R56 o el que se calculó en el ejercicio R57? ¿Qué sugiere su respues-
ta acerca de la eficiencia de la media muestra! comparada con la mediana muestra!
en este caso particular?
RS<> Se afirma que el 45% de todos los clientes potenciales que acuden a las oficinas de
una compañía de bienes raices compran eventualmente una casa a tra\·és de ella.
Para probar la afirmación, se considera a los siguientes 100 clientes como una mues-
tra aleatoria. Determine una prueba formal de la hipótesis alternativa de que la pro-
porción de la pohlación es menor que 0.45, utilizando a 0.05.
R60 (.Cómo cambia la región d.: rechazo en el ejercicio R59 si la máxima a permisible se
fija en O.O 1?
R6 I Suponga que la gerencia de la oficina de bienes raíces del ejercicio R59 determina
que el 32% de los clientes potenciales que acuden a las oficinas eventualmente com-
pran casas a través de ella. ¿Apoya este hecho a la hipótesis //u, si a se fija en 0.05?
R6:? El resultado que se indica en el ejercicio R61, ¿lleva al rechazo de H0 , si a se lija en
O.O1? ¿Qué indica su respuesta acerca del valor p para los datos?
11
E¡erc1cios de ~paso para Jos capítulos 7-9 .411
R63 Un silvicultor necesita probar un nuevo metodo para culti\'ar pinos maderables, disei'la-
do rara minimizar las pérdidas debi<las al ramoneo de los venados. Se requiere un ensa-
yo de cinco ai'los de duración. Se va a cultivar una muestra de 25 plantaciones
recurriendo al nuevo método en su cuidado. El procedimiento vigente tiene una media
de 272.6 y una desviación estándar de 67.3, en unidades de medida apropiadas.
a. Formule una hipótesis nula y otra alternativa, razonables. En particular, ¿cómo
deberla ser la hipótesis alternativa, unilateral o bilateral?
b. Determine las primeras cuatro partes de una prueba formal de la hipótesis nula.
Suponga que la desviación estándar poblacional sigue siendo la misma. El valor
a deseado es 0 .05.
R64 Suponga que la media poblacional que se obtiene bajo el nuevo método de cultivo
en el ejercicio R63 es 305. Calcule: la probabilidad de que la prueba del ejercicio
R63 no rechace la hipótesis nula. ¿Cuál es el nombre técnico de esta probabilidad?
R65 Suponga que la media poblacional del ej erc icio R64 es 295 en vez de la supuesta
media de 305. En relación con la probabilidad calculada en el ejercicio R64, ¿será
ma}or la probabilidad de que la hipótesis nula no sea rechazada utilizando la prue-
ba del ejercicio R63, o sen~ menor?
R66 Suponga que el experimento del ejercicio R64 tiene como resultados los siguien-
tes datos:
Suponga que se han registrado seis valores de X: x 1 5, .r2 = 8, .x3 = 2, .x4 = 9, .rs = O
y .l6 ~ 6 . Calcule la verosimililud de estos valores dando a n valores desde 0 .2 hasta
0 .5. Al ohscrvar los resultados numéricos, ¿cuál parece ser la mejor estimación de TT'!
R70 a. En relación con los datos del ejercicio R69, utilice el cálculo diferencial para en-
contrar el estimador de máx ima \erosimihtud.
b. Generalice el método derivado en el inciso (a) a valores arbitrarios x 1, .. . , x,,.
R 71 Se puede demostrar que el promedio en el limite (sobre muchas muestras) del esti·
mador que se encontró en el ejercicio R70 es mayor que n, aunque dicho promedio
decrece rápidamente hacia TC a medida que el tamallo de la muestra se incrementa.
¿Que propiedad deseable de un e stimador es violada (ligeramente) por este estima-
dor particular?
412 9 PRUEBAS O CONTAASTES DE HIPOTESIS
R72 Un centro de cómputo que presta servicios, entre otros clientes. 3 pequeftas asocia-
ciones de cr~dito y ahorro. nea:sita saber la proporción de trabajos de estos negocios
~e requieren de la inrervención del operador de la computadora. En una muestra
aleatoria de 133 trabajos, 22 requirieron la intervención del operador. Calcule un
intenalo de confianza al 95% para la proporción poblac1onal de trabajos que requie-
ren intervención.
R73 Suponga que el mtcnalo de confiana del e1erc1c10 R72 se considera demasiado am·
pho Calcule el ramafto de la muestra requerida para ohtencr un inter\Jlo de conli3n-
1.a al 95% con una amplitud de 0.06 (un lérmtno ± de 0.03) bajo cada una de las
siguientes suposiciones:
a. Suponiendo que la proporción muestra! sigue siendo igual a 221133.
b. Suponiendo que la proporción muestra) puede tomar cualquier valor.
R74 En los ejercicios R72 y R 73 se utilizó una apro>.1mac16n normal al responder. ¿Po-
demos tener confianta de que la :iprox1maci6n es buena?
R75 Un auditor quiere verificar los registros de las transacciones de una compa1'ía que
están dispuestos en un orden aleatorio. Uno de sus ayudantes conserva una copia
acumulativa de las cantidades de las transacciones en dólares; cada vez que el total
supera un incremento de 100,000 dólares (es decir. cuando el total pasa de
SI00,000, $200.000. S300,000. etc.). la transacción se separa para su verificación.
Muestre que este proceso no proporciona una muestra aleatoria de las transacciones
R76 El proceso del ejercicio R 75 proporciona 241 transacciones El tamailo medio de és-
tas es de 5381 dólares y la des.,iación estánd:ir de 2271. Cuando se tra1.a una gráfi-
ca de las cantidades, mueslran una asimetría sustancial hacia la derecha.
a. Calcule un supuesto intervalo de confiani.a al 95% par.a el tarnafto medio pobla-
cional de las transacciones.
b. Explique por qué es poco probable que este intervalo incluya el verdadero tama-
i'to medio poblacional de las transacciones.
R77 Un fabricante de productos químicos que realíu un estudio píloto sobre los rendi-
mientos, obtiene los resultados de una muestra de 26 lotes Los rendimientos, expre-
s:idos como porcentajes del máximo teórico, son
67.6 68.5 74.7 77.6 784 79.3 79.5 803 803 807 808 1108 1109
812 814 1114 81.5 82.5 82.5 82.9 829 83.8 844 84-4 1154 860
(y ... 80 37. l = 4.37)
R8 I ~~~
l:.I estudio piloto completo del ejercicio R 77 comprende eventualmente una muestra
de 150 lotes. Suponiendo que la desviación estándar poblac1onal es próxima a 4.4,
y que la media poblacional es 80A, encuentre la probabilidad de que H0 : media po-
blacional 82.0 sea rechazada. Suponga un a de 0.05.
R82 La prob:ibilidad que se calculó en el ejercicio R8 I no es un valor p. Explique por
qué no lo es.
R83 En ocasiones la función de densidad de Pareto se utiliza como un modelo, sobre
todo en reclamaciones de seguros, donde puede haber muchas peticiones de pago
E1ercic1os de repuo para los capitulos 7- 9 413
pequenas y unas pocas peticiones de pago enormes. Una de las formas que adopta la
función de densidad de Pareto es
1
/(y) = O(y + W 1- 1
,. para y > O
Encuentre una buena estimación de 8, para una muestra de valores con y 1=2.730,
.v2 = 5.124, y 3 = 0.798 e y 4 = 36.215.
R84 En el ejercicio R83, encuentre un buen estimador del parámetro 8 para valores ar-
b1trariC1s y 1, .. . , y,,.
R85 El estimador del ejercicio R84 tiene las siguientes propiedades: su valor medio en el
limite es 8, y entre todos los estimadores con un 'alor medio igual a 8, tiene el me·
nor error estándar. ¿Qué indican estas propiedades acerca del estimador'?