Funciones de Distribucion de Probabilidades

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 12

Distribuciones de

probabilidad discreta

5-1 Panorama general


5-2 Variables aleatorias
5-3 Distribuciones de probabilidad binomial
5-4 Media, varianza y desviación estándar
para la distribución binomial
5-5 Distribuciones de probabilidad de Poisson
OBLEM
PR

5 A PROBLEMA DEL CAPÍTULO


DEL

O
UL

C A PÍT

¿Los métodos estadísticos pueden


demostrar que el proceso de selección
de un jurado es discriminatorio?
Después de que un acusado ha sido condenado por algún bles para fungir como jueces y el hecho de que sólo fuera
crimen, en ocasiones se interpone una apelación con el ar- seleccionado el 39% de este grupo.
gumento de que el acusado fue condenado por un jurado En este capítulo analizaremos el problema de Cas-
de personas diferentes a él. Uno de los criterios es que el taneda contra Partida, en especial a partir las siguientes
proceso de selección del jurado debe garantizar que los preguntas fundamentales::
miembros representen a la población de la región. En un
1. Puesto que los méxico-estadounidenses constituyen
caso célebre, el doctor Benjamin Spock, escritor del libro
el 80% de la población y dado que Partida fue senten-
Baby and Child Care, fue condenado por conspiración al
ciado por un jurado de 12 personas, de las que sólo el
fomentar la resistencia al reclutamiento durante la guerra
58% (7 jueces) eran méxico-estadounidenses, ¿pode-
de Vietnam. Su defensor argumentó que el doctor Spock
mos concluir que este jurado fue elegido en un pro-
estaba en desventaja, pues los 12 miembros del jurado
ceso que discrimina a los méxico-estadounidenses?
eran hombres. Las mujeres se habrían mostrado más
2. Dado que los méxico-estadounidenses constituyen el
comprensivas, ya que, en general, se oponían más a la
80% de la población total de 181,535 habitantes y
guerra; además, el doctor Spock era muy reconocido
que durante un periodo de más de 11 años sólo el
entre el público femenino como médico infantil. Un es-
39% de los individuos llamados a servir como jueces
pecialista en estadística testificó que el jurado tenía una
eran méxico-estadounidenses, ¿podemos concluir
proporción consistentemente menor de mujeres que los
que el proceso de selección del jurado discriminó a
otros seis jurados del mismo distrito. La condena del
este grupo? (Sabemos que, debido al azar, las mues-
doctor Spock fue anulada por otras razones. En la actuali-
tras varían naturalmente hasta cierto punto de lo que
dad los integrantes de los jurados de las cortes federales
se esperaría a nivel teórico. Sin embargo, ¿la discre-
se deben elegir de manera aleatoria.
pancia entre la tasa del 80% de méxico-estadouni-
En 1972, Rodrigo Partida, méxico-estadounidense,
denses en la población y la tasa del 39% de méxico-
fue condenado por robo con intento de violación. Su con-
estadounidenses llamados a servir como jueces es lo
dena fue dictada en el condado de Hidalgo, que se localiza
suficientemente grande para explicarse por el azar?)
en Texas, en la frontera con México. En el condado de Hi-
dalgo había 181,535 personas que podían formar parte del Este ejemplo ilustra la importancia de una com-
jurado, y el 80% de ellas eran méxico-estadounidenses. prensión básica de los métodos estadísticos en el terreno
(Como el autor acaba de renovar su licencia poética, en legal. Es probable que los abogados que carecen de co-
este capítulo usará la cifra 80% en vez del valor más nocimientos estadísticos no puedan ofrecer un buen ser-
exacto del 79.1%). De las 870 personas llamadas a servir vicio a sus clientes. Una ocasión el autor testificó en la
como jueces, el 39% (339) eran méxico-estadouniden- Suprema Corte del estado de Nueva York y, al analizar
ses. Tiempo después, se apeló la condena de Partida la situación, se dio cuenta de que la falta de compren-
(Castaneda contra Partida) con base en la gran discre- sión de conceptos estadísticos básicos puede ser muy
pancia entre el 80% de méxico-estadounidenses disponi- perjudicial para el cliente de un abogado.
200 Capítulo 5 Distribuciones de probabilidad discreta

5-1 Panorama general


En este capítulo combinamos los métodos de estadística descriptiva presenta-
dos en los capítulos 2 y 3 con los de probabilidad que estudiamos en capítulo 4.
La figura 5-1 presenta un resumen visual de los objetivos de este capítulo. Como
se observa en la figura, utilizando los métodos de los capítulos 2 y 3, podría-
mos lanzar en repetidas ocasiones un dado para reunir datos muestrales y luego
describirlos con gráficas (como un histograma o una gráfica de cuadro), medidas
de tendencia central (como la media) y medidas de variación (como la desvia-
ción estándar). Si empleamos los métodos del capítulo 4 podríamos calcular la
probabilidad de cada resultado. En este capítulo combinaremos esos concep-
tos mientras creamos distribuciones de probabilidad que describan lo que pro-
bablemente sucederá, en vez de lo que en realidad sucedió. En el capítulo 2
elaboramos tablas de frecuencias e histogramas utilizando valores muestrales
observados que se reunieron en realidad; en este capítulo construiremos distribu-
ciones de probabilidad presentando los resultados posibles junto con las frecuen-
cias relativas que esperamos. En este capítulo estudiaremos las distribuciones
de probabilidad discretas y en el capítulo 6 las distribuciones de probabilidad
continuas.
La tabla que se encuentra en el extremo derecho de la figura 5-1 representa una
distribución de probabilidad que sirve como modelo para una distribución de fre-
cuencias poblacional teóricamente perfecta. En esencia, podemos describir la tabla
de frecuencias relativas para un dado que se lanzó un número infinito de veces.
Con este conocimiento de los resultados de la población, somos capaces de calcu-
lar sus características importantes, como la media y la desviación estándar. El resto
de este libro y la esencia de la estadística inferencial se basan en el conocimien-
to de las distribuciones de probabilidad. Comenzamos examinando el concepto de
una variable aleatoria y después estudiaremos distribuciones importantes que tienen
muchas aplicaciones reales.

x f
Reunir datos
muestrales, 1 8
Capítulos 2 10 Capítulo 5
2y3 después calcular 3 9 x = 3.6 Crear un modelo teórico que
estadísticos y 4 12 s = 1.7 describa la forma en que se
construir 5 11 espera que se comporte el
gráficas 6 10 experimento y luego obtener
sus parámetros.
x P(x)
1 1/6
2 1/6 m = 3.5
P(1) = 1/6 3 1/6 s = 1.7
Lanzar un dado
Calcular la P(2) = 1/6 4 1/6
probabilidad de 5 1/6
Capítulo 4 6 1/6
cada resultado
P(6) = 1/6

Figura 5-1 Combinación de métodos descriptivos y probabilidades para formar un modelo teórico
de comportamiento
5-2 Variables aleatorias 201

5-2 Variables aleatorias


Concepto clave En esta sección se presenta el importante concepto de una dis-
tribución de probabilidad, que indica la probabilidad de cada valor de una variable
que está determinada por el azar. Por otro lado, incluye procedimientos para el cálcu-
lo de la media y de la desviación estándar para una distribución de probabilidad.
Además del concepto de una distribución de probabilidad, se debe poner especial
atención a los métodos que se utilizan para distinguir entre resultados que pueden
ocurrir por azar y los resultados que son “poco comunes” en el sentido de que no
tienen probabilidad de ocurrir por azar.
Iniciamos con los conceptos relacionados variable aleatoria y distribución de
probabilidad.

Definiciones
Una variable aleatoria es aquella (casi siempre representada por x) que tiene
un solo valor numérico determinado por el azar, para cada resultado de un
procedimiento.
Una distribución de probabilidad es una distribución que indica la proba-
bilidad de cada valor de la variable aleatoria. A menudo se expresa como Tabla 5-1
gráfica, tabla o fórmula. Distribución de pro-
babilidad: probabilida-
des de números de
OBLEM
EJEMPLO Selección de miembros del jurado Se elegirá al méxico-estadouniden-
PR

5
A
DEL

ses en un jurado de 12
O

azar a 12 integrantes del jurado de una población en la que el 80% de


UL

C A PÍT
los habitantes son méxico-estadounidenses. Si suponemos que los miembros, suponiendo
que los miembros se
miembros del jurado se seleccionan al azar sin sesgo y si permitimos que
seleccionan al azar de
x 5 número de méxico-estadounidenses en un total de 12 miembros del jurado una población en la
que el 80% de los
entonces x es una variable aleatoria porque su valor depende del azar. Los valo-
habitantes son méxico-
res posibles de x son 0, 1, 2, . . . , 12. La tabla 5-1 incluye los valores de x, jun- estadounidenses
to con las probabilidades correspondientes. Los valores de probabilidad que son
muy pequeños, como 0.000000123, están representados por 01. (En la sección x
5-3 aprenderemos a calcular los valores de probabilidad, como los que se listan (méxico-
en la tabla 5-1). Puesto que la tabla 5-1 incluye la probabilidad para cada valor estadouni- P(x)
denses)
de la variable aleatoria x, esa tabla describe una distribución de probabilidad.
0 01
En la sección 1-2 hicimos una distinción entre los datos discretos y continuos. Las 1 01
variables aleatorias también pueden ser discretas o continuas, y las siguientes dos 2 01
definiciones son consistentes con las que se presentan en la sección 1-2. 3 01
4 0.001
Definiciones 5 0.003
Una variable aleatoria discreta tiene un número finito de valores o un nú- 6 0.016
mero de valores contable, donde “contable” se refiere al hecho de que podría 7 0.053
haber un número infinito de valores, pero que pueden asociarse con un proceso 8 0.133
de conteo. 9 0.236
Una variable aleatoria continua tiene un número infinito de valores, y esos 10 0.283
valores pueden asociarse con mediciones en una escala continua, de manera 11 0.206
que no existan huecos o interrupciones. 12 0.069
202 Capítulo 5 Distribuciones de probabilidad discreta

278

Contador

a) Variable aleatoria
discreta: contador del
número de asistentes
al cine..
Elección de números
de lotería Voltímetro

En una lotería estatal tradicio-


0 9
nal, usted selecciona seis nú-
meros diferentes. Después de
una selección aleatoria, los
boletos con la combinación b) Variable aleatoria
correcta comparten el premio. continua: voltaje medido
Como los números ganadores de una batería de un
se seleccionan al azar, cual- detector de humo.
quier elección de seis números
Figura 5-2 Aparatos que se utilizan para contar y medir variables aleatorias discretas y
tendrá la misma probabilidad continuas
que otra, pero algunas com-
binaciones son mejores que
otras. La combinación de 1, 2,
Este capítulo se refiere exclusivamente a variables aleatorias discretas, pero en los
3, 4, 5, 6 es una mala elección, siguientes capítulos se estudiarán las variables aleatorias continuas.
ya que muchas personas tien-
den a seleccionarla. En una EJEMPLO Los siguientes son ejemplos de variables aleatorias discretas y
lotería de Florida, con un pre- continuas:
mio de $105 millones, 52,000
1. Sea x 5 número de huevos que una gallina pone en un día. Ésta es una
boletos incluían 1, 2, 3, 4, 5,
variable aleatoria discreta porque sus únicos valores posibles son 0 o 1 o 2,
6; si esta combinación hubiera
etcétera. Ninguna gallina puede poner 2.343115 huevos, lo que sería
ganado, el premio hubiera sido posible si los datos provinieran de una escala continua.
de tan sólo $1000. Es más sen-
2. El conteo del número de estudiantes de estadística que asisten a una clase es
sato elegir combinaciones que
un número entero y, por lo tanto, una variable aleatoria discreta. El aparato
no seleccionen muchas otras
de conteo que se muestra en la figura 5-2a) es capaz de indicar únicamente
personas. Evite combinacio- un número finito de valores, por lo que se utiliza para obtener valores de una
nes que formen un patrón en el variable aleatoria discreta.
boleto.
3. Sea x 5 cantidad de leche que produce una vaca en un día. Ésta es una va-
riable aleatoria continua, ya que puede tomar cualquier valor en un tramo
continuo. En un solo día, una vaca produce una cantidad de leche cuyo va-
lor puede ser cualquiera entre 0 galones y 5 galones. Es posible obtener
4.123456 galones, ya que la vaca no está restringida a las cantidades dis-
cretas de 0, 1, 2, 3, 4 o 5 galones.
5-2 Variables aleatorias 203

4. La medida del voltaje de una batería de un detector de humo puede ser


cualquier valor entre 0 y 9 volts. Por lo tanto, se trata de una variable alea-
toria continua. El voltímetro que se ilustra en la figura 5-2b) indica valores
en una escala continua, de manera que permite obtener valores de una va-
riable aleatoria continua.

Gráficas
Existen varias formas para graficar una distribución de probabilidad, pero aquí
consideraremos solamente al histograma de probabilidad. La figura 5-3 es un
histograma de probabilidad muy similar al histograma de frecuencias relativas es-
tudiado en el capítulo 2, pero la escala vertical indica probabilidades en vez de
frecuencias relativas basadas en resultados muestrales reales.
En la figura 5-3, observe que a lo largo del eje horizontal, los valores de 0, 1, 2, .
. . , 12 se localizan en el centro de los rectángulos. Esto implica que cada uno de los
rectángulos mide una unidad, de manera que las áreas de los rectángulos son 01, 01,
01, 01, 0.001, 0.003, . . . , 0.069. Las áreas de estos rectángulos son iguales a las
probabilidades en la tabla 5-1. En el capítulo 6 y en capítulos posteriores veremos
que esta correspondencia entre el área y la probabilidad es muy útil en estadística.
Toda distribución de probabilidad debe satisfacer cada uno de los dos siguien-
tes requisitos.

Requisitos de una distribución de probabilidad


1. SP(x) 5 1 donde x asume todos los valores posibles. (Es decir, la su-
ma de todas las probabilidades debe ser 1).
2. 0 # P(x) # 1 para cada valor individual de x. (Es decir, cada valor de
probabilidad debe ubicarse entre 0 y 1, inclusive).

El primer requisito surge del simple hecho de que la variable aleatoria x repre-
senta todos los sucesos posibles en el espacio muestral completo, de manera que
tenemos la certeza (con probabilidad 1) de que uno de los sucesos ocurrirá. (En la

0.3
Probabilidad

0.2

0.1

0
0 1 2 3 4 5 6 7 8 9 10 11 12
Histograma de probabilidad para el número de méxico-
estadounidenses de un total de 12 miembros del jurado

Figura 5-3 Histograma de probabilidad del número de méxico-estadounidenses de un


total de 12 miembros del jurado
204 Capítulo 5 Distribuciones de probabilidad discreta

tabla 5-1, la suma de todas las probabilidades es 1, pero en otros casos, valores tales
como 0.999 o 1.001 son aceptables porque son el resultado de errores de redondeo).
Asimismo, la regla de probabilidad que establece que 0 # P(x) # 1 para cualquier
suceso A, implica que P(x) debe estar entre 0 y 1 para cualquier valor de x. Puesto
que la tabla 5-1 satisface ambos requisitos, es un ejemplo de una distribución de
probabilidad. Una distribución de probabilidad puede describirse como una tabla
(por ejemplo, la tabla 5-1), una gráfica (como la figura 5-3) o una fórmula.

Tabla 5-2 EJEMPLO ¿La tabla 5-2 describe una distribución de probabilidad?
Probabilidades de una
SOLUCIÓN Para ser una distribución de probabilidad, P(x) debe satisfacer los
variable aleatoria
dos requisitos anteriores. Pero
x P(x) SP(x) 5 P(0) 1 P(1) 1 P(2) 1P(3)
0 0.2 5 0.2 1 0.5 1 0.4 1 0.3
1 0.5 5 1.4 [lo que demuestra que SP(x) Þ 1]
2 0.4 Como no se satisface el primer requisito, concluimos que la tabla 5-2 no des-
3 0.3 cribe una distribución de probabilidad.

EJEMPLO ¿Determina P(x) 5 x>3 (donde x puede ser 0, 1 o 2) una distribu-


ción de probabilidad?
SOLUCIÓN Para la función dada, encontramos que P(0) 5 0>3, P(1) 5 1>3 y
P(2) 5 2>3, de manera que
0 1 2 3
1. SPsxd 5 1 1 5 51
3 3 3 3
2. Cada uno de los valores P(x) se encuentra entre 0 y 1.
Puesto que ambos requisitos se satisfacen, la función P(x) de este ejemplo es
una distribución de probabilidad.

Media, varianza y desviación estándar


En el capítulo 2 describimos las siguientes características importantes de los datos
(que pueden recordarse por medio de las siglas CVDVT “Cuidado con los Virus
que Destruyen el Valioso Trabajo”): 1. centro, 2. variación, 3. distribución, 4. valo-
res extremos y 5. tiempo (características de los datos que cambian con el tiempo).
El histograma de probabilidad puede darnos información acerca de la naturaleza o
forma de la distribución. Además, a menudo podemos calcular la media, la varian-
za y la desviación estándar de los datos, los cuales brindan información acerca de
otras características. La media, la varianza y la desviación estándar de una distribu-
ción de probabilidad se calcula al aplicar las fórmulas 5-1, 5-2, 5-3 y 5-4.
Fórmula 5-1 m 5 S3x ? Psxd4 media de una distribución
de probabilidad
Fórmula 5-2 s2 5 S3 sx 2 md2 ? Psxd4 varianza de una distribución
de probabilidad
Fórmula 5-3 s2 5 S3x 2 ? Psxd4 2 m2 varianza de una distribución
de probabilidad

Fórmula 5-4 s 5 2S3x 2 ? Psxd4 2 m2 desviación estándar de una


distribución de probabilidad
5-2 Variables aleatorias 205

Precaución: Evalúe S[x 2 # Psxd] elevando al cuadrado primero cada valor de x,


multiplicando después cada cuadrado por la probabilidad P(x) correspondiente y
después sumando.

Fundamentos de las fórmulas 5-1 a la 5-4


En vez de aceptar y aplicar fórmulas a ciegas, es mucho mejor comprender por
qué funcionan. La fórmula 5-1 logra lo mismo que la fórmula de la media para
una tabla de frecuencias. (Recuerde que f representa la frecuencia de clase y N re-
presenta el tamaño de la población). Al reescribir la fórmula de la media de una ta-
bla de frecuencias, de manera que se aplique a una población, y luego cambiando
su forma, obtenemos

gc d 5 g c x ? d 5 g 3x # Psxd4
Ssƒ ? xd ƒ?x ƒ
m5 5
N N N
En la fracción f>N, el valor de f es la frecuencia con que ocurre el valor x y N es el
tamaño de la población, así que f>N es la probabilidad del valor de x.
Un razonamiento similar nos permite tomar la fórmula de la varianza del capí-
tulo 3 y aplicarla a una variable aleatoria para una distribución de probabilidad; el
resultado es la fórmula 5-2. La fórmula 5-3 es una versión abreviada que siempre
producirá el mismo resultado que la fórmula 5-2. Aun cuando la fórmula 5-3 sue-
le ser más fácil de usar, la fórmula 5-2 es más fácil de comprender directamente.
Con base en la fórmula 5-2, podemos expresar la desviación estándar como
s 5 2S3 sx 2 md2 ? Psxd4
o como la forma equivalente dada en la fórmula 5-4.
Cuando utilice las fórmulas 5-1 a la 5-4, aplique esta regla para redondear los
resultados.

Regla de redondeo para M, S, y S2


Redondee los resultados llevando una posición decimal más que el número
de posiciones decimales utilizadas para la variable aleatoria x. Si los valores
de x son enteros, redondee m, s y s2 a una posición decimal.

En ocasiones es necesario usar una regla diferente de redondeo ante circuns-


tancias especiales, tales como resultados que requieren más decimales para ser
significativos. Por ejemplo, para aviones de propulsión a chorro de cuatro moto-
res, el número medio de motores que funcionan adecuadamente durante un vuelo
es de 3.999714286, que se convierte en 4.0 cuando se redondea a una posición de-
cimal más que los datos originales. Aquí, el 4.0 sería confuso, ya que sugiere que
todos los motores del avión de propulsión a chorro siempre funcionan bien. Nece-
sitamos más precisión para reflejar correctamente la media verdadera, como la
precisión en el número 3.999714.

Identificación de resultados poco comunes


con la regla práctica del intervalo
La regla práctica del intervalo (que se estudió en la sección 3-3) también resulta útil
para interpretar los valores de una desviación estándar. Según la regla práctica del in-
tervalo, la mayoría de los valores deben caer dentro de 2 desviaciones estándar de la
206 Capítulo 5 Distribuciones de probabilidad discreta

media; no es común que un valor difiera de la media en más de dos desviaciones es-
tándar. (El uso de dos desviaciones estándar no es un valor absolutamente rígido, y en
su lugar se pueden emplear otros valores como 3). De esta manera, podemos identifi-
car valores “poco comunes” si se determina que caen fuera de los siguientes límites:

Regla práctica del intervalo


valor máximo común 5 m 1 2s
valor mínimo común 5 m 2 2s

EJEMPLO La tabla 5-1 describe la distribución de probabilidad del número de


méxico-estadounidenses que integran un jurado de 12 miembros en el condado
de Hidalgo, Texas. Suponiendo que repetimos el proceso de selección aleatoria de
los 12 miembros del jurado y contamos el número de méxico-estadounidenses ca-
da vez, calcule la media del número de méxico-estadounidenses (de un total de 12),
la varianza y la desviación estándar. Utilice esos resultados y la regla práctica del
intervalo para calcular el valor máximo común y el valor mínimo común. Con ba-
se en los resultados, determine si un jurado que consta de 7 méxico-estadouniden-
ses de un total de 12 miembros es común o poco común.
SOLUCIÓN En la tabla 5-3, las dos columnas a la izquierda describen la dis-
tribución de probabilidad que se presentó antes en la tabla 5-1, y creamos las
tres columnas a la derecha para realizar los cálculos requeridos.
Al utilizar las fórmulas 5-1 y 5-3, así como los resultados de la tabla,
obtenemos
m 5 S3x ? Psxd4 5 9.598 5 9.6 (redondeado)

s2 5 S3x 2 ? Psxd4 2 m2
5 94.054 2 9.5982 5 1.932396 5 1.9 (redondeado)

La desviación estándar es la raíz cuadrada de la varianza, de manera que


s 5 21.932396 5 1.4 (redondeado)

Sabemos que cuando elegimos al azar a 12 miembros del jurado, la media del
número de méxico-estadounidenses es 9.6, la varianza es 1.9 “méxico-estadou-
nidenses al cuadrado” y la desviación estándar es 1.4 méxico-estadounidenses.
Si utilizamos la regla práctica del intervalo, ahora podemos calcular el valor
máximo común y el valor mínimo común de la siguiente manera:

valor máximo común: m 1 2s 5 9.6 1 2(1.4) 5 12.4


valor mínimo común: m 2 2s 5 9.6 2 2(1.4) 5 6.8

INTERPRETACIÓN Con base en estos resultados, concluimos que, para gru-


pos de 12 miembros del jurado elegidos al azar en el condado de Hidalgo, el nú-
mero de méxico-estadounidenses debe caer entre 6.8 y 12.4. Si un jurado consta
de 7 méxico-estadounidenses, no se trata de un suceso poco común y no serviría
como base para afirmar que el jurado se eligió de una manera que discrimina a los
méxico-estadounidenses. (El jurado que sentenció a Roger Partida incluyó a
7 méxico-estadounidenses, pero la acusación de un proceso de selección injusto
se basó en el proceso utilizado para seleccionar al Gran Jurado y no al jurado es-
pecífico que lo sentenció).
5-2 Variables aleatorias 207

Tabla 5-3 Cálculo de m, s y s2 para una distribución de probabilidad

x P(x) x ? P(x) x2 x2 ? P(x)

0 01 0.000 0 0.000
1 01 0.000 1 0.000
2 01 0.000 4 0.000
3 01 0.000 9 0.000
4 0.001 0.004 16 0.016
5 0.003 0.015 25 0.075
6 0.016 0.096 36 0.576
7 0.053 0.371 49 2.597
8 0.133 1.064 64 8.512
9 0.236 2.124 81 19.116
10 0.283 2.830 100 28.300
11 0.206 2.266 121 24.926
12 0.069 0.828 144 9.936

Total 9.598 94.054


c c
S3 x ? P(x) 4 S3 x2 ? P(x)4

Identificación de resultados infrecuentes


con probabilidades
Recomendación importante: Tome su tiempo para leer con cuidado y comprender
la regla del suceso infrecuente y el párrafo que le sigue. Esta breve discusión pre-
senta un método sumamente importante que se utiliza a menudo en estadística.

Regla del suceso infrecuente


Si, bajo un supuesto dado (como el supuesto de que una moneda está balancea-
da), la probabilidad de un suceso particular observado (como 992 caras en 1000
lanzamientos de una moneda) es extremadamente pequeña, concluimos que el
supuesto probablemente no sea correcto.

Las probabilidades se pueden utilizar para aplicar la regla del suceso infre-
cuente de la siguiente manera:
Uso de las probabilidades para determinar resultados infrecuentes
● Número de éxitos inusualmente alto: x éxitos en n ensayos es un número
inusualmente alto de éxitos si P(x o más) # 0.05.*
● Número de éxitos inusualmente bajo: x éxitos en n ensayos es un número
inusualmente bajo de éxitos si P(x o menos) # 0.05.*
Suponga que lanza una moneda para determinar si se ven favorecidas las caras y
suponga que 1000 lanzamientos dan como resultado 501 caras. Esto no es evidencia
de que la moneda favorezca las caras, ya que es muy fácil obtener un resultado de

*El valor de 0.05 se utiliza de forma regular, pero no es absolutamente rígido. Se podrían usar otros
valores, como 0.01, para distinguir entre sucesos que pueden ocurrir con facilidad por azar y suce-
sos que tienen muy pocas probabilidades de ocurrir por azar.
208 Capítulo 5 Distribuciones de probabilidad discreta

501 caras en 1000 lanzamientos por el azar. Sin embargo, la probabilidad de obtener
exactamente 501 caras en 1000 lanzamientos es bastante baja: 0.0252. Esta baja
probabilidad refleja el hecho de que, con 1000 lanzamientos, cada número específi-
co de caras tendrá una probabilidad sumamente baja. Sin embargo, no consideramos
que 501 caras en 1000 lanzamientos sea un suceso infrecuente, ya que la probabili-
dad de obtener al menos 501 caras es alta: 0.487.
OBLEM
PR EJEMPLO Selección de miembros del jurado Si el 80% de
5
A
DEL

las personas que pueden fungir como miembros del jurado en el conda-
O
C A PÍT UL
do de Hidalgo son méxico-estadounidenses, entonces un jurado de 12
individuos seleccionados al azar debe incluir 9 o 10 méxico-estadounidenses. (La
media del número de méxico-estadounidenses en los jurados es de de 9.6). ¿Siete
jueces méxico-estadounidenses, de un total de 12, es un número excepcionalmen-
te bajo? ¿La selección de sólo 7 méxico-estadounidenses en un total de 12 miem-
bros del jurado sugiere que existe discriminación en el proceso de selección?
SOLUCIÓN Usaremos el criterio de que 7 méxico-estadounidenses en un total
de 12 miembros del jurado es excepcionalmente bajo si P(7 o menos méxico-
estadounidenses) # 0.05. Si nos remitimos a la tabla 5-1, obtenemos el siguiente
resultado:
P(7 o menos méxico-estadounidenses en un total de 12 miembros del jurado)
5 P(7 o 6 o 5 o 4 o 3 o 2 o 1 o 0)
5 P(7) 1 P(6) 1 P(5) 1 P(4) 1 P(3) 1 P(2) 1 P(1) 1 P(0)
5 0.053 1 0.016 1 0.003 1 0.001 1 0 1 0 1 0 1 0
5 0.073

INTERPRETACIÓN Puesto que la probabilidad de 0.073 es mayor que 0.05,


concluimos que el resultado de 7 méxico-estadounidenses no es poco común.
Existe una alta probabilidad (0.073) de seleccionar a 7 méxico-estadounidenses
por azar. (Sólo una probabilidad de 0.05 o menor indicaría que el suceso es po-
co común). Ningún tribunal de justicia declararía que, en esas circunstancias, la
selección de sólo 7 méxico-estadounidenses es discriminatoria.

Valor esperado
La media de una variable aleatoria discreta es el resultado medio teórico de un nú-
mero infinito de ensayos. Podemos considerar esa media como el valor esperado
en el sentido de que constituye el valor promedio que esperaríamos obtener si los
ensayos pudieran continuar de manera indefinida. Los usos del valor esperado
(también llamado esperanza o esperanza matemática) son extensos y variados, y
desempeñan un papel muy importante en una área de aplicación denominada teo-
ría de la decisión.

Definición
El valor esperado de una variable aleatoria discreta se denota por E y
representa el valor promedio de los resultados. Se obtiene calculando el
valor de S3x ? Psxd4.
E 5 S3x ? Psxd4
5-2 Variables aleatorias 209

De la fórmula 5-1 vemos que E 5 m. Es decir, la media de una variable aleatoria


discreta es la misma que su valor esperado. Vea la tabla 5-3 y observe que al selec-
cionar a 12 miembros del jurado de una población en la que el 80% de los habitan-
tes son méxico-estadounidenses, la media del número de méxico-estadounidenses
es 9.6, por lo que se deduce que el valor esperado del número de méxico-estadouni-
denses también es 9.6.

EJEMPLO Lotería Kentucky Pick 4 Si usted apuesta $1 en el juego de lo-


tería Kentucky Pick 4, pierde $1 o gana $4999. (El premio ganador es de $5,000,
pero no le devuelven su apuesta de $1, por lo que la ganancia neta es de $4999). El
juego consiste en seleccionar un número de cuatro dígitos entre 0000 y 9999. Si
usted apuesta $1 al 1234, ¿cuál es el valor esperado de ganar o perder?
SOLUCIÓN Para esta apuesta existen dos resultados: usted pierde $1 o gana
$4999. Como existen 10,000 posibilidades de números de cuatro dígitos y sólo
una de ellas representa el número ganador, la probabilidad de perder es de
9,999>10,000 y la probabilidad de ganar es de 1>10,000. La tabla 5-4 resume la
distribución de probabilidad, y podemos ver que el valor esperado es E 5 250
centavos.

Tabla 5-4 Lotería Pick 4 de Kentucky

Suceso x P(x) x ? P(x)

Pérdida 2$1 0.9999 2$0.9999


Ganancia (neta) $4999 0.0001 $0.4999

Total 2$0.50
(o 50 centavos)

INTERPRETACIÓN En cualquier juego individual, usted pierde $1 u obtiene


una ganancia neta de $4999, pero el valor esperado indica que, a largo plazo,
usted espera perder un promedio de 50 centavos por cada apuesta de $1. Tal
vez esta lotería tenga cierto valor de entretenimiento limitado, pero, sin duda,
se trata de una inversión económica extremadamente inadecuada.

En esta sección aprendimos que una variable aleatoria tiene un valor numérico
asociado a cada resultado de algún procedimiento aleatorio, y que una distribución de
probabilidad tiene una probabilidad asociada a cada valor de una variable aleatoria.
Examinamos métodos para calcular la media, la varianza y la desviación estándar de
una distribución de probabilidad. Vimos que el valor esperado de una variable alea-
toria es, en realidad, igual a la media. Por último, un concepto sumamente importan-
te de esta sección es el uso de probabilidades para determinar cuándo los resultados
son poco comunes.

5-2 DESTREZAS Y CONCEPTOS BÁSICOS


Conocimientos estadísticos y pensamiento crítico
1. Distribución de probabilidad. Considere el ensayo de lanzar un dado, con los resulta-
dos 1, 2, 3, 4, 5 y 6. Construya la tabla que represente la distribución de probabilidad.

También podría gustarte