Estadistica 2018 P
Estadistica 2018 P
Estadistica 2018 P
Curso elemental de
Probabilidad y Estadı́stica
2018
Juan F. Olivares1
1Universidad de Atacama
Facultad de Ingenierı́a
Departamento de Matemática
Edición 1.0
1 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
Índice de contenidos
1 INTRODUCCIÓN
2 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
INTRODUCCIÓN
Contenidos de la unidad
1 INTRODUCCIÓN
MOTIVACIÓN
LA POBLACIÓN Y LA MUESTRA
ESTADÍSTICAS DESCRIPTIVAS E INFERENCIALES
PASOS PARA LA ESTADÍSTICA INFERENCIAL
CONSIDERACIONES FINALES
3 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
INTRODUCCIÓN
MOTIVACIÓN
Motivación
¿Qué es estadı́stica? ¿Ha conocido usted alguna vez a un experto en estadı́stica? ¿Sabe usted qué
hace? O quizá la simple mención de la palabra estadı́stica le causa temor. Puede que piense que
no sabe usted nada de estadı́stica, pero es casi inevitable que encuentre estadı́sticas en una forma
u otra cada vez que tome un periódico.
Artı́culos semejantes a éste son comunes en nuestros diarios en el periodo inmediato anterior a la
elección presidencial. El lenguaje de este artı́culo es muy conocido, pero deja al lector cuidadoso
con algunas preguntas sin contestar. ¿Cómo fueron seleccionadas las personas en la encuesta?
¿Darán la misma respuesta el dı́a de la elección? ¿Votarán, incluso? ¿Son representativas de
todos quienes votarán el dı́a de la elección? Es trabajo de un estadı́stico hacer estas preguntas y
hallar respuesta para ellas en el lenguaje de la encuesta.
4 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
INTRODUCCIÓN
MOTIVACIÓN
Motivación
Veamos el siguiente caso:
Después de creer durante más de un siglo que 37o C era la temperatura corporal normal para seres
humanos, los investigadores ahora dicen que normal ya no es normal. Para algunas personas a
ciertas horas del dı́a 37,7 grados podrı́a estar bien. Y lecturas de sólo 35,6 resulta que son muy
“humanas”. La norma de 37 fue obtenida por un médico alemán en 1868. Algunos médicos siempre
habı́an sospechado de la investigación del doctor. Su duda: un millón de lecturas, en una época sin
computadoras. Entonces, Mackowiak & Co. tomaron lecturas de temperatura a 148 personas sanas
en un periodo de tres dı́as y encontraron que la temperatura media era de 36,7 grados. Sólo 8 % de
las lecturas fue de 37. (The Press-Enterprise)
¿Qué preguntas le vienen a la mente cuando lee este artı́culo? ¿En qué forma el investigador
seleccionó las 148 personas, y cómo podemos estar seguros que los resultados basados en estas
148 personas son precisos cuando se aplican a la población en general? ¿Cómo registró el médico
alemán un millón de temperaturas en 1868? Otra vez encontramos un problema estadı́stico con
aplicaciones en la vida diaria.
La estadı́stica en una rama de las matemáticas que tiene aplicaciones en cada faceta de
nuestra vida. Es un lenguaje nuevo y poco conocido para casi todas las personas. Queremos
que “entrene su cerebro” para entender este nuevo lenguaje paso a paso. Una vez aprendido y
entendido el lenguaje de la estadı́stica, veremos que es una poderosa herramienta para el análisis
de datos en numerosos campos de aplicación diferentes.
5 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
INTRODUCCIÓN
LA POBLACIÓN Y LA MUESTRA
La población y la muestra
En la estadı́stica, uno de los conceptos elementales es el muestreo. En casi todos los problemas
de estadı́stica, un número especificado de mediciones o datos, es decir, una muestra, se toma de
un conjunto de mediciones más grande llamado población.
Para el experimento de la temperatura corporal, la muestra es el conjunto de mediciones de
temperatura corporal para las 148 personas sanas escogidas por el experimentador. Esperamos
que la muestra sea representativa de un conjunto mucho mayor de mediciones, la población, ¡las
temperaturas corporales de todas las personas sanas del mundo!
¿Cuál es el interés principal, la muestra o la población? En la mayor parte de los casos, estamos
interesados principalmente en la población, pero ésta puede ser difı́cil o imposible enumerar.
Imagine tratar de registrar la temperatura corporal de todas las personas sanas del mundo o ¡de la
preferencia presidencial de todo votante registrado en Chile! En cambio, tratamos de describir
o pronosticar el comportamiento de la población con base en información obtenida de una
muestra representativa de esa población.
Cuando usamos el lenguaje de la estadı́stica, distinguiremos entre el conjunto de objetos en el
cual las mediciones se toman y las mediciones mismas. Para los experimentadores, los objetos
en los que las mediciones se toman se denominan unidades experimentales. El estadı́stico que
estudia las muestras las llama elementos de la muestra.
6 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
INTRODUCCIÓN
ESTADÍSTICAS DESCRIPTIVAS E INFERENCIALES
Cuando primero se le presenta a usted un conjunto de mediciones, ya sea una muestra o una
población necesita encontrar una forma de organizarlo y resumirlo. La rama de la estadı́stica
que presenta técnicas para organizar y resumir conjuntos de mediciones se denomina estadı́stica
descriptiva.
El alumno ha visto estadı́sticas descriptivas en numerosas formas: gráficas de barras, gráficas de
pastel y gráficas de lı́neas presentadas por un candidato polı́tico; tablas numéricas en el periódi-
co; o el promedio de cantidad de lluvia informado por el pronosticador del clima en la televisión.
Las gráficas y resúmenes numéricos generados en computadoras son comunes en nuestra comu-
nicación de todos los dı́as.
Estadı́stica descriptiva
La estadı́stica descriptiva está formada por procedimientos empleados para resumir y describir
las caracterı́sticas importantes de un conjunto de mediciones.
7 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
INTRODUCCIÓN
ESTADÍSTICAS DESCRIPTIVAS E INFERENCIALES
El objetivo de la estadı́stica inferencial es hacer inferencias (es decir, sacar conclusiones, ha-
cer predicciones, tomar decisiones) acerca de las caracterı́sticas de una población a partir de
información contenida en una muestra.
8 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
INTRODUCCIÓN
PASOS PARA LA ESTADÍSTICA INFERENCIAL
¿Cómo puede hacer inferencias acerca de una población utilizando información contenida en una
muestra? La tarea se hace más sencilla si se entrena para organizar el problema en una serie de
pasos lógicos.
9 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
INTRODUCCIÓN
PASOS PARA LA ESTADÍSTICA INFERENCIAL
Seleccione la muestra y analice la información muestral: Sin importar que información con-
tenga la muestra, se debe usar un método de análisis apropiado para extraerla.
Muchos de estos métodos, dependen del procedimiento de muestro del paso
2, se explican en este curso.
Use la información del paso 3 para hacer una inferencia acerca de la población: Es posible
usar muchos procedimientos diferentes para hacer esta inferencia y algunos
son mejores que otros. Por ejemplo, podrı́a 10 métodos diferentes para estimar
la respuesta humana a un medicamento experimental, pero un procedimiento
podrı́a ser más preciso que los otros. Usted debe usar el mejor procedimiento
disponible para hacer inferencias (muchos de estos se explican en este curso).
Determine la confiabilidad de la inferencia: Como se está usando sólo una parte de la pobla-
ción para sacar las conclusiones descritas en el paso 4, ¡podrı́a estar en un
error! ¿Cómo puede ser esto? Si una agencia realiza una encuesta estadı́stica
para usted y estima que el producto de su compañı́a ganará el 34 % del mer-
cado este año, ¿cuánta confianza puede usted poner en esta estimación? ¿Es
precisa a no más de 1,5 o a 20 puntos porcentuales? ¿Es confiable lo sufi-
ciente para establecer metas de producción? Toda inferencia estadı́stica debe
incluir una medida de confiabilidad que dice cuánta confianza tiene usted en
los resultados.
10 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
INTRODUCCIÓN
CONSIDERACIONES FINALES
Consideraciones finales
Ahora que ya ha aprendido algunos de los términos y conceptos básicos del lenguaje de la es-
tadı́stica, otra vez hacemos la pregunta del principio de este análisis: ¿Sabe usted qué hace un
estadı́stico? Es el trabajo del estadı́stico poner en práctica todos los pasos procedentes. Esto
puede comprender preguntas al experimentador para asegurarse que la población de interés esté
claramente definida, desarrollar un plan apropiado de muestreo o diseño experimental para dar
máxima información al mı́nimo costo, analizar correctamente y sacar conclusiones usando la
información muestral y, por último, medir la confiabilidad de las conclusiones con base en los
resultados experimentales.
A medida que se avance en este curso, aprenderá cada vez más palabras, frases y conceptos de
este nuevo lenguaje de estadı́stica. Los procedimientos estadı́sticos, en su mayor parte, están
formados de pasos de sentido común que, con tiempo suficiente, es muy probable que haya
descubierto por sı́ mismo. Como la estadı́stica es una rama aplicada de las matemáticas, muchos
de los conceptos básicos son matemáticos, desarrollados y basados en resultados de cálculo o de
matemáticas más elevadas. No obstante, no tiene que derivar resultados para aplicarlos en una
forma lógica. En este curso usamos ejemplos numéricos y argumentos intuitivos para explicar
conceptos estadı́sticos, en lugar de argumentos matemáticos más complicados.
Cada unidad aumentará su conocimiento del lenguaje de estadı́stica y debe, en alguna forma,
ayudarlo a dar uno de los pasos aquı́ descritos. Cada uno de estos pasos es esencial para alcanzar
el objetivo general de la estadı́stica inferencial: hacer inferencias acerca de una población
usando información contenida en una muestra tomada de esa población.
11 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
Contenidos de la unidad
12 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
OBJETIVOS
Objetivos
Objetivos
Numerosos conjuntos de mediciones son muestras seleccionadas de poblaciones más grandes;
otros constituyen toda la población, como es el caso de un censo nacional. En esta unidad apren-
deremos qué es una variable, cómo clasificar variables en varios tipos y cómo se generan medi-
ciones o datos. Aprenderá entonces a usar gráficas para describir conjuntos de datos.
13 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
VARIABLES Y DATOS
Variables y datos
A continuación presentaremos algunas técnicas básicas de estadı́stica descriptiva. Una vez que
haya recolectado un conjunto de mediciones, ¿cómo puede mostrar este conjunto en una forma
clara, entendible y fácil de leer? Primero, debe tener aptitud para definir lo que se entiende por
medición o “datos” y clasificar los tipos de datos que probablemente se encuentre en la vida real.
Empezamos por introducir algunas definiciones, términos nuevos en el lenguaje de la estadı́stica
que es necesario saber.
Variable
Una variable es una caracterı́stica que cambia o varı́a con el tiempo y/o para diferentes personas
u objetos bajo consideración.
Por ejemplo, la temperatura corporal es una variable que cambia con el tiempo en una sola
persona; también varı́a de una persona a otra. La afiliación religiosa, el origen étnico, el ingreso,
la estatura, edad y número de hijos son todas ellas variables, es decir, caracterı́sticas que varı́an
según la persona seleccionada.
14 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
VARIABLES Y DATOS
Variables y datos
En la Introducción definimos una unidad experimental como el objeto en el que se toma una
medición. Del mismo modo, podrı́amos definir una unidad experimental como el objeto en el
que se mide una variable. Cuando una variable se mide en realidad en un conjunto de unidades
experimentales, resulta un conjunto de mediciones o de datos.
Unidad experimental
Una unidad experimental es el individuo u objeto en el que se mide una variable. Resulta una
sola medición o datos cuando una variable se mide en realidad en una unidad experimental.
Si se genera una medición para toda unidad experimental en toda la colección, el conjunto resul-
tante constituye la población de interés. Cualquier conjunto más pequeño de mediciones es una
muestra.
Población
Una población es el conjunto de mediciones de interés para el investigador.
Muestra
Una muestra es un subconjunto de mediciones seleccionado de la población de interés.
15 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
VARIABLES Y DATOS
Variables y datos
Ejemplo
De entre todos los estudiantes de la universidad se selecciona un conjunto de cinco estudiantes y
las mediciones se introducen en una hoja de cálculo, como se muestra a continuación.
Hay diversas variables en este ejemplo. La unidad experimental es la que se miden las variables
es un estudiante del plantel, identificado en la primera columna. Se miden cinco variables para
cada estudiante: promedio de calificaciones, género, año de ingreso a la universidad, especialidad
y número actual de créditos tomados. Cada una de estas caracterı́sticas varı́a de estudiante a otro.
16 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
VARIABLES Y DATOS
Variables y datos
Se puede ver que hay una diferencia entre una sola variable medida en una sola unidad experi-
mental y múltiples variables medidas en una unidad experimental como en el ejemplo anterior.
Datos univariados
Resultan datos univariados cuando se mide una sola variable en una sola unidad experimental.
Si se miden las temperaturas corporales de 148 personas, los datos resultantes son univariados.
En el ejemplo anterior, cinco variables se midieron en cada estudiante, lo que resultó en datos
multivariados.
17 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
TIPOS DE VARIABLES
Tipos de variables
Variables cualitativas y cuantitativas
Las variables cualitativas miden una cualidad o caracterı́stica en cada unidad experimental. Las
variables cuantitativas miden una cantidad numérica en cada unidad experimental.
Las variables cualitativas producen datos que se pueden clasificar de acuerdo a similitudes o di-
ferencias en clases, con frecuencia se denominan datos categóricos. Las variables como género,
año y especialidad en el ejemplo anterior son variables cualitativas que producen datos categóri-
cos. He aquı́ algunos otros ejemplos:
Las variables cuantitativas, con frecuencia representadas por la letra x, producen datos numéri-
cos, por ejemplo estos:
Tipos de variables
Observe que hay diferencia en los tipos de valores numéricos que pueden tomar estas variables
cuantitativas. El número de pasajeros, por ejemplo, puede tomar sólo los valores x = 0, 1, 2, . . .,
mientras que el peso de un paquete puede tomar cualquier valor mayor a cero, o sea 0 < x <
∞. Para describir esta diferencia, definimos dos tipos de variables cuantitativas: discretas y
continuas.
Variables discretas y continuas
Una variable discreta puede tomar sólo un número finito o contable de valores. Una variable
continua puede tomar infinitamente muchos valores correspondientes a los puntos en un inter-
valo de recta.
El nombre de discreta se refiere a las brechas discretas entre los posibles valores que la variable
puede tomar. Variables como el número de miembros de una familia, el número de ventas de autos
nuevos y el número de neumáticos defectuosos devueltos para cambio son todos ellos ejemplos
de variables discretas. Por el contrario, variables como la estatura, peso, tiempo, distancia y
volumen son continuas porque pueden tomar valores en cualquier punto a lo largo de un intervalo
de recta. Para cualesquiera dos valores que se escojan, un tercer valor siempre puede hallarse
entre ellos.
¿Por qué debe preocuparse por diferentes clases de variables y los datos que generan? La razón
es que los métodos empleados para describir conjuntos de datos dependen del tipo de datos que
haya recolectado. Para cada uno de los conjuntos de datos recolectados, la clave será determinar
qué tipo de datos tiene y ¡cómo puede presentarlos en forma más clara y entendible!
19 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
TIPOS DE VARIABLES
Tipos de variables
Ejemplo
Consideremos las siguientes variables:
1 El uso frecuente de su horno microondas (recalentar, descongelar, calentar, otros)
2 El número de consumidores que se niegan a contestar una encuesta por teléfono
3 La puerta escogida por un ratón en un experimento de laberinto (A o B)
4 El tiempo ganador para un caballo que corre en el Derby de Santiago
5 El número de niños de quinto básico que leen al nivel de ese curso o mejor
Las variables 1 y 3 son cualitativas porque sólo una cualidad o caracterı́stica se mide para cada
individuo. Las otras dos variables son cuantitativas. La variable 2, el número de consumidores,
es una variable discreta que puede tomar cualquiera de los valores x = 0, 1, 2, . . ., con un valor
máximo que depende del número de consumidores llamados. La variable 4, el tiempo ganador
para un caballo en el Derby de Santiago, es la única variable continua. El tiempo ganador,
si pudiera medirse con suficiente precisión, podrı́a ser 121 segundos, 121,5 segundos, 121,25
segundos o cualesquiera valores entre dos tiempos cualesquiera que hemos puesto en lista.
20 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CATEGÓRICOS
Frecuencia
Frecuencia relativa = Porcentaje = 100 × Frecuencia relativa
n
Se encontrará que la suma de las frecuencias es siempre n, la suma de las frecuencias relativas
es 1 y la suma de porcentajes es 100 %.
21 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CATEGÓRICOS
Las categorı́as para una variable cualitativa deben escogerse de modo que:
Por ejemplo, si se pueden clasificar a los estudiantes de la universidad de acuerdo con el tipo
de colegio de procedencia, se pueden usar estas categorı́as: municipal, subvencionado, privado,
otro. La categorı́a “otro” está incluida para tomar en cuenta la posibilidad de que una medición
no se pueda asignar a una de las categorı́as anteriores.
Una vez que a las mediciones se les haya dado categorı́as y resumidas en una tabla estadı́stica,
se puede usar ya sea una gráfica de pastel o una gráfica de barras para mostrar la distribución
de los datos. Una gráfica de pastel es la conocida gráfica circular que muestra la forma en que
están distribuidas las medidas entre las categorı́as. Una gráfica de barras muestra la misma
distribución de medidas en categorı́as, con la altura de la barra midiendo la frecuencia con la que
se observa una categorı́a en particular.
22 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CATEGÓRICOS
La siguiente tabla muestra las calificaciones junto con las frecuencias, frecuencias relativas, por-
centajes y ángulos de sector necesarios para construir la gráfica de pastel.
23 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CATEGÓRICOS
Regular
Mala
Muy buena
Buena
24 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CATEGÓRICOS
260
Frecuencia
93
35
12
0
Muy buena Buena Regular Mala
25 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CATEGÓRICOS
Mientras que las gráficas de pastel usan porcentaje para determinar los tamaños relativos de
las “rebanadas de pastel”, las gráficas de barras por lo general grafican frecuencias contra las
categorı́as.
El impacto visual de estas dos gráficas es un poco diferente. La gráfica de pastel se usa para
mostrar las relaciones de las partes con respecto al todo; la gráfica de barras se usa para destacar
la cantidad real o frecuencia para cada categorı́a. Como las categorı́as en el ejemplo anterior son
“calificaciones” ordenadas, no desearı́amos reacomodar las barras de la gráfica para cambiar su
forma. En una gráfica de pastel, el orden de presentación es irrelevante.
26 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CATEGÓRICOS
Una gráfica de barras en la que las barras están ordenadas de mayor a menor se denomina gráfica
de Pareto.
27 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CATEGÓRICOS
5
Frecuencia
0
Café Azul Verde Anaranjado Amarillo Rojo
28 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CATEGÓRICOS
Ejercicios
29 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CATEGÓRICOS
Ejercicios
30 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CATEGÓRICOS
Ejercicios
8. Cincuenta personas se agrupan en cuatro cate- de jeans se selecciona al azar de entre la base
gorı́as, A, B, C y D, y el número de personas de datos computarizada, registrándose la ciu-
que caen en cada categorı́a se muestra en la ta- dad en el que se produce:
bla: CO IQ IQ AN CO
Categorı́a Frecuencia CO CO AN AN AN
IQ IQ CO IQ AN
A 11 CO IQ AN AN AN
B 14 CO IQ IQ CO CO
C 20
D 5 a) ¿Cuál es la unidad experimental?
b) ¿Cuál es la variable que se mide? ¿ Es
a) ¿Cuál es la unidad experimental? cualitativa o cuantitativa?
b) ¿Cuál es la variable que se mide? ¿Es c) Construya una gráfica de pastel para des-
cualitativa o cuantitativa? cribir los datos.
c) Construya una gráfica de pastel y de ba- d) Construya una gráfica de barras para des-
rras para describir los datos. cribir los datos.
d) ¿La forma de la gráfica de barras del in- e) ¿Qué proporción de los jeans se hace en
ciso c) cambia, dependiendo del orden Antofagasta?
de presentación de las cuatro categorı́as? f) Si se desea averiguar si las tres plantas
¿Es importante el orden de presentación? produjeron iguales números de jeans, o
e) ¿Qué porcentaje de las personas no está si una produjo más jeans que las otras,
en la categorı́a B? ¿cómo se pueden usar las gráficas de las
9. Un fabricante de jeans tiene plantas en Iquique, partes c) y d) para ayudar? ¿Qué conclu-
Antofagasta y Copiapó. Un grupo de 25 pares siones puede sacar de estos datos?
31 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CATEGÓRICOS
Ejercicios
10. ¿Le gustarı́a ser presidente de Chile? Aun cuan- a) ¿Están consideradas todas las razones en
do muchos adolescentes piensan que podrı́a lle- esta tabla?
gar a ser presidente, muchos no desean el tra-
bajo. En una encuesta de opinión, casi 80 % b) ¿Usarı́a usted una gráfica de pastel o una
de los adolescentes no estaban interesados en de barras para describir gráficamente los
el trabajo. Cuando se les preguntaba: “¿Cuál es datos? ¿Por qué?
la principal razón por la que no querrı́a ser pre-
sidente?” dieron estas respuestas: c) Trace la gráfica escogida en el inciso b).
Otros planes de carrera 40 %
Demasiada presión 20 %
d) Si usted fuera a conducir la encuesta de
Demasiado trabajo 15 %
opiniones, ¿qué otros tipos de preguntas
No serı́a bueno para ello 14 %
desearı́a investigar?
Demasiadas discusiones 5%
32 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CUANTITATIVOS
Las variables cuantitativas miden una cantidad en cada unidad experimental. Si la variable
puede tomar sólo un número finito o contable de valores, es una variable discreta. Una variable
que puede tomar un número infinito de valores correspondientes a puntos en un intervalo de recta
se llama continua.
A veces la información se recolecta para una variable cuantitativa medida en segmentos diferen-
tes de la población, o para diferentes categorı́as de clasificación. Por ejemplo, se podrı́a medir el
promedio de ingresos de personas de diferentes grupos de edad, géneros diferentes, o que viven
en zonas geográficas diferentes del paı́s.
En tales casos, se pueden usar gráficas de pastel o gráficas de barras para describir los datos,
usando la cantidad medida en cada categorı́a en lugar de la frecuencia con que se presenta cada
una de las categorı́as. La gráficas de pastel muestra la forma en que está distribuida la cantidad
total entre las categorı́as y la gráfica de barras usa la altura de la barra para mostrar la cantidad
de una categorı́a en particular.
33 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CUANTITATIVOS
Ejemplo
Entre enero y octubre de 2016 el valor de las exportaciones (Sı́ntesis Económica Región de Ata-
cama, Corproa) de la Región de Atacama fue de $3133 (millones de dólares), en las categorı́as:
Minerı́a ($2863 millones de dólares), Silvoagropecuario ($146 millones de dólares), Industria
($96 millones de dólares) y Pesca ($28 millones de dólares). Dos variables están siendo medidas:
la categorı́a del rubro de exportación (cualitativa) y la cantidad exportada (cuantitativa).
La gráfica de barras muestra las categorı́as en el eje horizontal y las cantidades en el eje vertical.
Para la gráfica de pastel, cada “rebanada del pastel” representa la proporción de la exportación
($3133 millones de dólares) correspondientes a su categorı́a en particular. Por ejemplo, para el
rubro silvoagropecuario, el ángulo del sector es
146
× 360 = 16,8o
3133
Ambas gráficas muestran que el mayor valor por exportación para la Región de Atacama en el
periodo de enero a octubre de 2016 fue debido a la minerı́a. Como no hay un orden inherente
a las categorı́as, hay libertad para reacomodar las barras o sectores de las gráficas en cualquier
forma deseada. La forma de la gráfica de barras no tiene nada que ver con su interpretación.
34 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CUANTITATIVOS
3000
Exportaciones (millones de US$)
150
0
Mineria Silvoagropecuario Industria Pesca
35 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CUANTITATIVOS
Silvoagropecuario
Industria
Pesca
Mineria
36 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CUANTITATIVOS
Gráficas de lı́neas
Cuando una variable cuantitativa se registra en el tiempo a intervalos igualmente espaciados (por
ejemplo diario, semanal, mensual, trimestral o anual), el conjunto de datos forma una serie de
tiempo.
Los datos de una serie de tiempo se presentan con más efectividad en una gráfica de lı́neas
con el tiempo como eje horizontal. La idea es tratar de distinguir un patrón o tendencia que sea
probable de continuar en el futuro y luego usar ese patrón para hacer predicciones precisas para
el futuro inmediato.
37 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CUANTITATIVOS
Gráficas de lı́neas
Ejemplo
En el año 2025, una persona nacida en 1946 tendrá 79 años, y una nacida en 1965 tendrá 60
años. ¿Habrá suficientes fondos para las personas nacidas en 1946 para pensiones de jubilación?
El INE (Instituto Nacional de Estadı́stica) da proyecciones para la parte de la población chilena
que tendrá 80 años y más para los próximos años, como se muestra en la siguiente tabla.
La variable cualitativa “80 y más” se mide en 7 intervalos, creando ası́ una serie de tiempo que
se puede graficar con una gráfica de lı́nea. Los intervalos están marcados en el eje horizontal y
las proyecciones en el eje vertical. Los puntos de datos se enlazan luego por medio de segmentos
de lı́nea para formar las gráficas de lı́nea. Observe la marcada diferencia en las escalas verticales
de las dos gráficas. Contraer la escala en el eje vertical hace que grandes cambios aparezcan
pequeños y viceversa. Para evitar conclusiones erróneas, se deben ver con cuidado las escalas de
los ejes vertical y horizontal.
38 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CUANTITATIVOS
Gráficas de lı́neas
1388 ● 20000
1248 ●
80 años y más (miles)
827 ●
679 ●
561 ●
1388 ● ● ● ●
● ●
457 ● 457 ●
Año Año
Figura: Gráficas de lı́nea para la proyección del crecimiento de la población de 80 años o más.
39 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CUANTITATIVOS
Gráficos de puntos
Muchos conjuntos de datos cuantitativos están formados de números que no se pueden separar
fácilmente en categorı́as o intervalos. Entonces se hace necesaria una forma diferente de graficar
este tipo de datos.
La gráfica más sencilla para datos cuantitativos es la gráfica de puntos. Para un conjunto pe-
queño de mediciones, por ejemplo el conjunto
2 6 9 3 7 6
se pude simplemente graficar las mediciones como puntos en un eje horizontal. Ésta gráfica se
muestra en la siguiente figura (panel superior). Para un conjunto de datos, como el de la siguiente
figura (panel inferior), la gráfica de puntos puede ser nada informativa.
40 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CUANTITATIVOS
Gráficos de puntos
●
● ● ● ● ●
2 3 4 5 6 7 8 9
Conjunto pequeño
●
●
● ● ● ●
●●● ● ● ● ● ●
● ● ● ●●●●●● ● ●● ●● ●● ● ●●● ●● ● ● ●●
Conjunto grande
41 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CUANTITATIVOS
Una vez creada una gráfica o gráficas, para un conjunto de datos, ¿qué se debe buscar al tratar de
describir los datos?
Primero, verificar las escalas horizontales y verticales, de manera que haya claridad respec-
to a lo que se mide.
Examinar el lugar de la distribución de datos. ¿Dónde está el centro de distribución del eje
horizontal? Si se comparan dos distribuciones, ¿están centradas en el mismo lugar?
Examinar la forma de la distribución. ¿La distribución tiene un “máximo”, un punto que
es más alto de cualquier otro? Si es ası́, ésta es la medición o categorı́a que se presenta
con más frecuencia. ¿Hay más de un máximo? ¿Hay un número aproximadamente igual de
mediciones a la izquierda y derecha del máximo?
Buscar cualesquiera mediciones poco comunes o resultados atı́picos. Esto es, ¿hay medi-
ciones mucho mayores o menores que todas las otras? Estos resultados atı́picos pueden no
ser representativos de los otros valores del conjunto.
42 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CUANTITATIVOS
43 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CUANTITATIVOS
Ejemplo
Examinemos las gráficas de la siguiente figura. Notemos que, la primera gráfica de puntos (panel
superior) muestra una distribución relativamente simétrica con solo un máximo situado en x =
5. La segunda gráfica (panel central), no obstante, está lejos de ser simétrica. Tiene una larga
“cola derecha”, lo cual significa que hay unas pocas observaciones extraordinariamente grandes.
Esta distribución está sesgada a la derecha. Del mismo modo, la tercera gráfica de puntos (panel
inferior) con una larga “cola a la izquierda” está sesgada a la izquierda.
44 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CUANTITATIVOS
●
●
● ●
● ●
● ● ● ● ●
● ● ● ● ●
● ● ● ● ● ● ●
● ● ● ● ● ● ● ● ●
1 2 3 4 5 6 7 8 9
●
●
● ● ●
● ● ●
● ● ● ●
● ● ● ● ●
● ● ● ● ● ●
● ● ● ● ● ● ● ● ●
1 2 3 4 5 6 7 8 9
●
●
● ● ●
● ● ●
● ● ● ●
● ● ● ● ●
● ● ● ● ● ●
● ● ● ● ● ● ● ● ●
1 2 3 4 5 6 7 8 9
45 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CUANTITATIVOS
Ejemplo
Un asistente administrativo del departamento de educación fı́sica de la universidad está observan-
do los promedios de calificaciones de ocho miembros del equipo femenil de voleibol. El asistente
introduce los promedios en la base de datos pero por accidente coloca mal el punto decimal de
la última entrada.
4,8 5,0 5,0 5,3 4,4 5,4 5,0 0,41
La gráfica de puntos de este pequeño conjunto de datos se muestra en la siguiente figura (panel
superior). Claramente se puede ver el resultado atı́pico u observación poco común causada por
el error del asistente al introducir los datos. Una vez corregido el error, como en la misma figura
(panel inferior), se puede ver la distribución correcta del conjunto de datos. Como éste es un
conjunto muy pequeño, es difı́cil describir la forma de la distribución aun cuando parece tener
un valor máximo alrededor de 5,0 y parece ser relativamente simétrica.
46 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CUANTITATIVOS
●
●
● ● ● ● ●●
1 2 3 4 5
Promedio
●
●
● ● ● ● ● ●
Promedio
47 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
GRÁFICAS PARA DATOS CUANTITATIVOS
Cuando se comparan gráficas de dos conjuntos de datos, se deben comparar sus escalas de medi-
ción, ubicaciones y formas, y buscar mediciones poco comunes o resultados atı́picos. Recuerde
que estos últimos no siempre son causados por errores o introducción errónea de datos. A ve-
ces dan información muy valiosa que no debe ser soslayada. Es posible que sea necesaria más
información para determinar si un resultado atı́pico es una medición válida que sólo sea anor-
malmente grande o pequeña, o si ha habido algún tipo de error en la recolección de datos. Si las
escalas difieren en mucho, debe tenerse cuidado al hacer comparaciones, o ¡sacar conclusiones
que pudieran ser imprecisas!
48 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
HISTOGRAMA DE FRECUENCIA RELATIVA
Observación
Como regla práctica, el número de clases debe ser de 5 a 12; cuantos más datos haya, más
clases se requieren. Es posible emplear la siguiente tabla como guı́a para seleccionar un número
apropiado de clases. Esto es sólo una guı́a; puede usar más o menos clases de las recomendadas.
Tamaño de muestra 25 50 100 200 500
Número de clases 6 7 8 9 10
49 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
HISTOGRAMA DE FRECUENCIA RELATIVA
Las clases deben ser escogidas para que cada una de las mediciones caiga en una clase y sólo en
una. Consideremos la situación donde interesa calibrar una máquina de llenado de bolsas de 7,5
kilos, y para ello se toman primero las siguientes mediciones que corresponden al peso registrado
de 30 bolsas:
7,2 7,8 6,8 6,2 8,2 8,0 8,2 5,6 8,6 7,1
8,2 7,7 7,5 7,2 7,7 5,8 6,8 6,8 8,5 7,5
6,1 7,9 9,4 9,0 7,8 8,5 9,0 7,7 6,7 7,7
Entonces decidimos usar intervalos de peso de igual longitud. Como el intervalo de pesos de las
bolsas es
9,4 − 5,6 = 3,8
el ancho mı́nimo de clase necesario para cubrir el margen de los datos es 3,8/8 = 0,475. Para
más comodidad, redondearemos este ancho aproximado a 0,5. Empezando el primer intervalo
al valor más bajo, 5,6, formamos subintervalos de 5,6 hasta pero no incluyendo 6,1, y ası́ su-
cesivamente. Usando el método de inclusión izquierda e incluyendo el punto frontera de clase
izquierda pero no el punto frontera derecha en la clase, eliminamos cualquier confusión acerca
de dónde poner una medición que resulte caer en un punto de frontera de clase.
50 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
HISTOGRAMA DE FRECUENCIA RELATIVA
Para construir el histograma de frecuencia relativa, grafique las fronteras de clase a lo largo del
eje horizontal. Trace una barra sobre cada intervalo de clase, con altura igual a la frecuencia
relativa para esa clase. El histograma de frecuencia relativa para los datos de peso de bolsas de
cemento, muestra de un vistazo la forma en que están distribuidos los pesos en el intervalo de
5,6 a 9,4.
51 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
HISTOGRAMA DE FRECUENCIA RELATIVA
0.5
0.4
Frecuencia relativa
0.3
0.2
0.1
Figura: Histograma de frecuencia relativa para los pesos de las bolsas de cemento.
52 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
HISTOGRAMA DE FRECUENCIA RELATIVA
53 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
HISTOGRAMA DE FRECUENCIA RELATIVA
Como resumen, para construir un histograma de frecuencia relativa, podemos seguir los siguien-
tes pasos:
1 Escoja un número de clases, por lo general entre 5 y 12. Cuantos más datos se tengan, más
clases deben usarse.
2 Calcule el ancho aproximado de clase al dividir la diferencia entre los valores máximo y
mı́nimo entre el número de clases.
3 Redondee el ancho aproximado de clase hasta un número cómodo.
4 Si los datos son discretos, se puede asignar una clase para cada valor entero tomado de los
datos. Para un número grande de valores enteros, puede que sea necesario agruparlos en
clase.
5 Localice las fronteras de clase. La clase más baja puede incluir la medición más pequeña.
A continuación sume las clases restantes usando el método de inclusión izquierda.
6 Construya una tabla estadı́stica que contenga las clases, sus frecuencias y sus frecuencias
relativas.
7 Construya un histograma como una gráfica de barras, graficando intervalos de clase en el
eje horizontal y frecuencias relativas como las alturas de las barras.
54 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
HISTOGRAMA DE FRECUENCIA RELATIVA
La proporción de las medidas que caen en una clase o grupo particular de clases
La probabilidad de que una medida tomada al azar del conjunto caerá en una clase particular
o grupo de clases
Considere el histograma de frecuencia relativa para los datos del peso de bolsas de cemento.
¿Qué proporción de las bolsas tienen pesos de 7,6 o mayores? Esto abarca todas las clases de
más de 7,6 en la respectiva tabla. Como hay 17 bolsas en esas clases, la proporción de bolsas
con un peso de 7,6 o más es 17/30 = 0,57.
55 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
HISTOGRAMA DE FRECUENCIA RELATIVA
Al utilizar estas caracterı́sticas como guı́a, podrá interpretar y comparar conjuntos de datos usan-
do métodos gráficos, que son sólo la primera de numerosas herramientas estadı́sticas que pronto
tendrá a su disposición.
56 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
HISTOGRAMA DE FRECUENCIA RELATIVA
Ejercicios
57 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
HISTOGRAMA DE FRECUENCIA RELATIVA
Ejercicios
3. Una variable discreta puede tomar sólo los va- con éxito por un laberinto en cada uno de cin-
lores 0, 1 ó 2. Un conjunto de 20 mediciones co dı́as. Los resultados se muestran en la ta-
en esta variable se muestra: bla siguiente. Genere una gráfica de lı́neas para
1 2 1 0 2 describir los datos. ¿Piensa usted que hay algún
2 1 1 0 0 aprendizaje?
2 2 1 1 0 Dı́a 1 2 3 4 5
0 1 2 1 1
T 45 43 46 32 25
a) Construya un histograma de frecuencia
6. El valor de una variable cuantitativa se mide
relativa para los datos.
una vez al año durante un periodo de 10 años.
b) ¿Qué proporción de las mediciones es He aquı́ los datos:
mayor a 1?
c) ¿Qué proporción de las mediciones es Año Medición Año Medición
menor a 2?
1 61,5 6 58,2
d) Si una medición se selecciona al azar de 2 62,3 7 57,5
entre las 20 mediciones mostradas, ¿cuál 3 60,7 8 57,5
es la probabilidad de que sea un 2? 4 59,8 9 56,1
e) Describa la forma de la distribución. ¿Ve 5 58,0 10 56,0
algunos resultados atı́picos?
a) Genere una gráfica de lı́neas para des-
4. Considere el ejercicio anterior. Trace una gráfi- cribir la variable cuando cambie con el
ca de puntos para describir los datos. tiempo.
5. Un psicólogo experimental midió el tiempo (T ) b) Describa las mediciones usando la gráfi-
en segundos, que tardó una rata para navegar ca construida en el inciso a).
58 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
HISTOGRAMA DE FRECUENCIA RELATIVA
Ejercicios
59 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
Contenidos de la unidad
60 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
OBJETIVOS
Objetivos
Objetivo
Las gráficas son sumamente útiles para la descripción visual de un conjunto de datos, pero no
siempre son la mejor herramienta cuando se desea hacer inferencias acerca de una población a
partir de la información contenida en una muestra. Para este propósito, es mejor usar medidas
numéricas para construir una imagen mental de los datos.
61 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
Las gráficas pueden ayudar a describir la forma básica de una distribución de datos. Sabemos
que “una imagen vale por mil palabras” pero hay limitaciones para usar gráficas.
Una limitación es que las gráficas son un tanto imprecisas para usar en inferencia estadı́stica.
Por ejemplo, supongamos que desea usar un histograma muestral para hacer inferencias acerca
de un histograma poblacional. ¿Cómo puede medir las similitudes y diferencias entre los dos
histogramas en alguna forma concreta? Si son idénticas, podrı́a usted decir que son las mismas,
pero, si son diferentes, es difı́cil describir el grado de diferencia.
Una forma de superar estos problemas es usar medidas numéricas, que se pueden calcular para
una muestra o una población de mediciones. Se pueden usar los datos para calcular un conjunto
de números que llevarán una buena imagen mental de la distribución de frecuencia. Estas medi-
ciones se llaman parámetros cuando se asocian con la población y se denominan estadı́sticas
cuando se calculan a partir de mediciones muestrales.
Parámetros y estadı́sticas
Las mediciones descriptivas numéricas asociadas con una población de mediciones se llaman
parámetros; las calculadas a partir de mediciones muestrales reciben el nombre de estadı́sticas.
62 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE CENTRO
Medidas de centro
Media
La media aritmética o promedio de un conjunto de n mediciones es igual a la suma de las
mediciones dividida entre n.
63 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE CENTRO
Medidas de centro
Suponga que hay n mediciones en la variable x y que las llamamos x1 , x2 , . . . , xn . Para sumar
las n mediciones, usamos esta notación abreviada:
n
X
xi que significa x1 + x2 + · · · + xn
i=1
64 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE CENTRO
Medidas de centro
Ejemplo
Consideremos una pequeña muestra de n = 5 mediciones, dadas por 2, 9, 11, 5, 6. Para hallar
la media muestral, calculamos
P
xi 2 + 9 + 11 + 5 + 6
x̄ = = = 6,6
n 5
La siguiente Figura, muestra el gráfico de puntos para estos datos y la ubicación de la media
muestral.
65 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE CENTRO
Medidas de centro
x = 6.6
● ● ● ● ●
2 4 6 8 10
Mediciones
66 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE CENTRO
Medidas de centro
Recuerde que las muestras son mediciones tomadas de una población más grande que en general
es desconocida. Un uso importante de la media muestral x̄, es que es un estimador de la media
poblacional desconocida µ. Recordemos los datos de los pesos de las bolsas de cemento, estos
datos son una muestra de una población más grande y la distribución se muestra se muestra en el
respectivo histograma de frecuencias relativas. La media de los 30 pesos de las bolsas es:
P
xi 227,2
x̄ = = = 7,57
30 30
La media de toda la población de bolsas llenadas por la máquina es desconocida, pero si us-
ted tuviera que calcular su valor, su mejor estimación serı́a 7,57. Aun cuando cambia la media
muestral x̄ de una muestra a otra, la media poblacional µ sigue igual.
Una segunda medida de tendencia central es la mediana, que es el valor de la posición media en
el conjunto de mediciones ordenadas de menor a mayor.
Mediana
La mediana m de un conjunto de n mediciones es el valor de x que cae en la posición media
cuando las mediciones son ordenadas de menor a mayor.
67 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE CENTRO
Medidas de centro
Ejemplo
Para hallar la mediana del siguiente conjunto de datos 2, 9, 11, 5 y 6. Primero debemos ordenar
las n = 5 mediciones de menor a mayor:
2 5 6 9 11
68 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE CENTRO
Medidas de centro
Ejemplo
Para las n = 5 mediciones ordenadas (2, 5, 6, 9, 11), la posición de la mediana es (n + 1)/2 =
6/2 = 3 y la mediana es la tercera observación ordenada, o m = 6. Para las n = 6 medi-
ciones ordenadas (2, 5, 6, 9, 11, 27), la posición de la mediana es (n + 1)/2 = 7/2 = 3,5 y la
mediana es el promedio de las 3o y 4o observaciones ordenadas, o m = 7,5.
69 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE CENTRO
Medidas de centro
Aunque tanto la media como la mediana son buenas medidas del centro de una distribución, la
mediana es menos sensible a valores o resultados atı́picos. Por ejemplo, el valor x = 27 en los
ejemplos anteriores es mucho mayor que las otras mediciones. La mediana, m = 7,5, no se ve
afectada por el resultado atı́pico, en tanto que el promedio muestral,
P
xi 60
x̄ = = = 10
n 6
sı́ es afectado; su valor no es representativo de las cinco observaciones restantes.
Cuando un conjunto de datos tiene valores extremadamente pequeños u observaciones muy gran-
des, la media muestral se traza hacia la dirección de las mediciones extremas (véase la siguiente
Figura).
70 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE CENTRO
Medidas de centro
0.25
0.19
Frecuencia relativa
Frecuencia relativa
0.19
0.12
0.12
0.06
0.06
0 0
Figura: Distribuciones de frecuencia relativa mostrando el efecto de valores extremos en la media y mediana.
71 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE CENTRO
Medidas de centro
Si una distribución está sesgada a la derecha, la media se corre a la derecha; si una distribución
está sesgada a la izquierda se corre a la izquierda. La mediana no es afectada por estos valores
extremos porque los valores numéricos de las mediciones no se usan en este cálculo. Cuando una
distribución es simétrica, la media y la mediana son iguales. Si una distribución está fuertemente
sesgada por uno o más valores extremos, se debe emplear la mediana en lugar de la media como
medida de centro. Otra forma de localizar el centro de una distribución es buscar el valor de x
que se presenta con la frecuencia más alta. Esta medida del centro se denomina moda.
Moda
La moda es la categorı́a que se presenta con más frecuencia o el valor de x que se presenta
con más frecuencia. Cuando las mediciones es una variable continua se han agrupado como
histograma de frecuencia o de frecuencia relativa, la clase con el valor máximo o frecuencia se
llama clase modal, y el punto medio de esa clase se toma como la moda.
La moda por lo general se usa para describir conjuntos grandes de datos, mientras que la media
y la mediana se usan para conjuntos de datos grandes y pequeños.
Es posible que una distribución de mediciones tenga más de una moda. Estas modas aparecerı́an
como “máximos locales” en la distribución de frecuencia relativa. A veces las distribuciones
bimodales de tamaños o pesos reflejan una mezcla de mediciones, por ejemplo, tomadas de
machos y hembras. En cualquier caso, un conjunto o distribución de mediciones puede tener más
de una moda.
72 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE CENTRO
Ejercicios
73 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE CENTRO
Ejercicios
5. Un teléfono celular es un aparato común en casi media, mediana y moda a lo largo del eje
todas las personas en Chile. De hecho, casi to- horizontal. ¿Las respuestas a los incisos
das las personas tienen uno y otras tienen más a) y b) son correctas?
de uno. Una muestra de 25 personas produjo
las siguientes mediciones en x, el número de
teléfonos celulares que posee una persona: 6. ¿El orden de nacimiento tiene algún efecto en
la personalidad de una persona? Un informe so-
1 2 2 1 1 1 1 2 bre un estudio, hecho por un investigador del
1 2 1 1 2 3 2 1 MIT, indica que es probable que los hijos naci-
1 1 2 1 3 1 0 1 dos después del primogénito pongan a prueba
1 lo establecido, son más abiertos a nuevas ideas
a) La distribución de x, el número de teléfo- y aceptan más un cambio. De hecho, el núme-
nos celulares que posee una persona, ¿es ro de esta clase de hijos es creciente. Durante
simétrica o sesgada? Explique. los años de la Depresión en el decenio de 1930,
b) Calcule el valor de la moda, el valor de x las familias promediaban 2,5 hijos (59 % des-
que se presenta con más frecuencia. pués del primogénito), mientras que los padres
c) Calcule la media, la mediana y la moda de familia en la explosión demográfica prome-
para estas mediciones. diaban de tres a cuatro hijos (68 % después del
d) Trace un histograma de frecuencia relati- primogénito). ¿Qué quiere decir el autor con un
va para el conjunto de datos. Localice la promedio de 2,5 hijos?
74 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE CENTRO
Ejercicios
7. Un artı́culo en Consumer Report da el precio, c) Con base en lo que encuentre en los inci-
un promedio estimado de una lata de 180 gra- sos a) y b), ¿piensa usted que la distribu-
mos o un paquete 210 gramos, para 14 marcas ción de precios está sesgada? Explique.
diferentes de atún empacado en agua, basado
en precios pagados a nivel nacional en super- 8. A medida que los equipos de fútbol profesiona-
mercados: les hacen negocios cada vez más lucrativos, los
613 1189 762 527 402 salarios pagados a los jugadores también han
328 874 694 390 415 aumentado. De hecho, a las superestrellas de-
428 372 372 408 portivas se les pagan salarios astronómicos por
su talento. Si una compañı́a de administración
a) Encuentre el precio promedio para las 14 deportiva le pode a usted que describa la distri-
marcas diferentes de atún. bución de los salarios de los jugadores, en va-
b) Encuentre el precio mediano para las 14 rias categorı́as diferentes, ¿qué medida de cen-
marcas diferentes de atún. tro escogerı́a? ¿Por qué?
75 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE CENTRO
Ejercicios
76 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE VARIABILIDAD
Medidas de variabilidad
Los conjuntos de datos pueden tener el mismo centro pero con aspecto diferente por la forma
en que los números se dispersan desde el centro. Considere las dos distribuciones que se mues-
tran en la siguiente figura. Ambas distribuciones están centradas en x = 4, pero hay una gran
diferencia en la forma en que las mediciones se dispersan o varı́an. Las mediciones de la figura
(panel izquierdo) varı́an de 3 a 5; en la figura (panel derecho) las mediciones varı́an de 0 a 8.
77 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE VARIABILIDAD
Medidas de variabilidad
0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 7 8
78 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE VARIABILIDAD
Medidas de variabilidad
La variabilidad o dispersión es una muy importante caracterı́stica de los datos. Por ejemplo, si
fabrica tornillos, la variación extrema en los diámetros de los tornillos causarı́a un alto porcentaje
de productos defectuosos. Por el contrario, si estuviera tratando de discriminar entre trabajado-
res buenos y malos, tendrı́a problemas si el examen siempre produjera calificaciones con poca
variación, lo cual hace muy difı́cil la discriminación.
Las medidas de variabilidad pueden ayudar a crear una imagen mental de la dispersión de los
datos. La medida más sencilla de variación es el rango.
Rango
El rango, R, de un conjunto de n mediciones se define como la diferencia entre la medición más
grande y la más pequeña.
Para los datos de los pesos de las bolsas de cemento, las mediciones varı́an de 5,6 a 9,4. Por tanto,
el rango es 9,4 − 5,6 = 3,8. El rango es fácil de calcular, fácil de interpretar y es una medida
adecuada de variación para conjuntos pequeños de datos. Pero, para conjuntos grandes, el rango
no es una medida adecuada de variabilidad. Por ejemplo, las dos distribuciones de frecuencia
relativa de la siguiente figura tienen el mismo rango pero muy diferentes formas y por lo tanto,
diferente variabilidad.
79 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE VARIABILIDAD
Medidas de variabilidad
0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 7 8
80 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE VARIABILIDAD
Medidas de variabilidad
¿Hay una medida de variabilidad que sea más sensible que el rango? Considere, como ejemplo,
las mediciones muestrales 5, 7, 1, 2 y 4, mostradas como una gráfica de puntos en la siguiente
figura. La media de estas cinco mediciones es
P
xi 19
x̄ = = = 3,8
n 5
81 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE VARIABILIDAD
Medidas de variabilidad
x = 3.8
xi − x
● ● ● ● ●
0 1 2 3 4 5 6 7 8
Figura: Gráfica de puntos que muestran las desviaciones de puntos desde la media.
82 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE VARIABILIDAD
Medidas de variabilidad
Como se indica en figura anterior, las distancias horizontales entre cada punto (medición) y
la media x̄ ayudarán a medir la variabilidad. Si las distancias son grandes, los datos son más
dispersos o variables que si las distancias son pequeñas. Si xi es una medición en particular,
entonces la desviación de esa medición desde la media es (xi − x̄). Los valores de x y las
desviaciones para nuestro ejemplo si detallan en las columnas primera y segunda de la siguiente
tabla.
Como las desviaciones en la segunda columna de la tabla contienen información sobre variabi-
lidad, una forma de combinar las cinco desviaciones en una medida numérica es promediarlas.
Desafortunadamente, el promedio no funcionará por que algunas de las desviaciones son posi-
tivas, algunas son negativas y la suma es siempre cero. Para superar esta dificultad, se trabajará
con la suma de cuadrados. De la suma de desviaciones cuadradas, se calcula una sola medida
llamada varianza.
83 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE VARIABILIDAD
Medidas de variabilidad
Para distinguir entre la varianza de una muestra y la varianza de una población, usamos el
sı́mbolo s2 para una varianza muestral y σ 2 para una varianza poblacional.
Varianza poblacional
La varianza de una población de N mediciones es el promedio de los cuadrados de las desvia-
ciones de las mediciones alrededor de su media µ. La varianza poblacional se denota con σ 2 y
está dada por la fórmula
(xi − µ)2
P
σ2 =
N
La mayor parte de las veces, no tendremos todas las mediciones de la población disponible,
entonces necesitaremos calcular la varianza de una muestra de n mediciones.
Varianza muestral
La varianza de una muestra de n mediciones es la suma de las desviaciones cuadradas de las
mediciones alrededor de la media x̄ dividida entre (n − 1). La varianza muestral se denota con
s2 y está dada por la fórmula
(xi − x̄)2
P
s2 =
n−1
84 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE VARIABILIDAD
Medidas de variabilidad
Para el conjunto de n = 5 mediciones muestrales presentadas anteriormente, el cuadrado de la
desviación de cada medición se registra en la tercera columna. Sumando, tendremos
X
(xi − x̄)2 = 22,80
y la varianza muestral es
(xi − x̄)2
P
22,80
s2 = = = 5,70
n−1 4
La varianza se mide en términos del cuadrado de las unidades originales de medición. Tomando
la raı́z cuadrada de la varianza, obtenemos la desviación estándar, que regresa la medida de
variabilidad a las unidades originales de medición.
Desviación estándar
La desviación estándar de un conjunto de mediciones es igual a la raı́z cuadrada positiva de la
varianza.
Medidas de variabilidad
Formula computacional
( xi )2
X P
x2i −
s2 = n
n−1
Se puede preguntar por qué es necesario dividir entre (n − 1) en lugar de n cuando se calcula
la varianza poblacional. Ası́ como empleamos la media muestral x̄ para estimar la media pobla-
cional µ, se puede usar la varianza muestral s2 para estimar la varianza poblacional σ 2 . Resulta
que la varianza muestral s2 con (n − 1) en el denominador da estimaciones mejores de σ 2 de lo
que darı́a un estimador calculado con n en el denominador. Por esta razón, siempre dividimos
entre (n − 1) al calcular la varianza muestral s2 y la desviación estándar de la muestra s.
86 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE VARIABILIDAD
Ejercicios
87 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDIDAS DE VARIABILIDAD
Ejercicios
88 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
SOBRE LA SIGNIFICANCIA DE LA DESVIACIÓN ESTÁNDAR
Teorema de Tchebychev
Dado un número k mayor o igual a 1 y un conjunto de n mediciones, al menos 1 − (1/k2 ) de
las mediciones estarán dentro de k desviaciones estándar de su media.
89 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
SOBRE LA SIGNIFICANCIA DE LA DESVIACIÓN ESTÁNDAR
1
Al menos 1 −
k2
kσ kσ
µ − kσ µ µ + kσ
90 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
SOBRE LA SIGNIFICANCIA DE LA DESVIACIÓN ESTÁNDAR
En la siguiente tabla escogimos unos cuantos valores numéricos para k y calculamos 1−(1/k2 ).
k 1 − (1/k2 )
1 1−1=0
2 1 − 1/4 = 3/4
3 1 − 1/9 = 8/9
Aun cuando el primer enunciado no es útil en absoluto, los otros dos valores de k dan valiosa
información acerca de la proporción de mediciones que caen en ciertos intervalos. Los valores
k = 2 y k = 3 no son los únicos valores de k que se pueden usar; por ejemplo, la proporción
de mediciones que caen dentro de k = 2,5 desviaciones estándar de la media es al menos
1 − (1/2,52 ) = 0,84.
91 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
SOBRE LA SIGNIFICANCIA DE LA DESVIACIÓN ESTÁNDAR
Ejemplo
92 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
SOBRE LA SIGNIFICANCIA DE LA DESVIACIÓN ESTÁNDAR
Regla empı́rica
Dada una distribución de mediciones que tiene forma aproximada de campana:
El intervalo (µ ± σ) contiene aproximadamente 68 % de las mediciones.
El intervalo (µ ± 2σ) contiene aproximadamente 95 % de las mediciones.
El intervalo (µ ± 3σ) contiene aproximadamente 99,7 % de las mediciones.
93 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
SOBRE LA SIGNIFICANCIA DE LA DESVIACIÓN ESTÁNDAR
Ejemplo
En un estudio de tiempo efectuado en una planta manufacturera, el tiempo para completar una
operación especı́fica se mide para cada uno de los n = 40 trabajadores. Se encuentra que la
media y la desviación estándar son 12,8 y 1,7, respectivamente. Para describir estos datos mues-
trales usando la Regla empı́rica, primero calculamos los siguientes intervalos:
94 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
SOBRE LA SIGNIFICANCIA DE LA DESVIACIÓN ESTÁNDAR
95 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
SOBRE LA SIGNIFICANCIA DE LA DESVIACIÓN ESTÁNDAR
Ejercicios
96 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
SOBRE LA SIGNIFICANCIA DE LA DESVIACIÓN ESTÁNDAR
Ejercicios
4. Un conjunto de datos tiene una media 75 y una 1,08 0,99 0,97 1,18
desviación estándar de 5. Usted no sabe nada 1,41 1,28 0,83 1,06
más acerca del tamaño del conjunto de datos o 1,14 1,38 0,75 0,96
de la forma de la distribución de datos. 1,08 0,87 0,89 0,89
0,96 1,12 1,12 0,93
a) ¿Qué puede decir acerca de la proporción 1,24 0,89 0,98 1,14
de mediciones que caen entre 60 y 90? 0,92 1,18 1,17
b) ¿Qué puede decir acerca de la proporción
de mediciones que caen entre 65 y 85? a) Construya un histograma de frecuencia
c) ¿Qué puede decir acerca de la proporción relativa para mostrar la distribución de
de mediciones que sean menores de 65? los pesos. ¿La distribución es relativa-
5. El tiempo requerido para que el conductor de mente de forma de campana?
un automóvil responda a una situación parti- b) Encuentre la media y desviación estándar
cular de emergencia se registró para n = 10 del conjunto de datos.
conductores. Los tiempos (en segundos) fueron c) Encuentre el porcentaje de mediciones en
0,5; 0,8; 1, 1; 0,7; 0,6; 0,9; 0,7; 0,8; 0,7; el intervalo x̄ ± s, x̄ ± 2s y x̄ ± 3s.
8,0. Calcule la media y desviación estándar, d) Los porcentajes obtenidos en el inciso c),
utilice estos resultados para construir los inter- ¿cómo se comparan con los datos por la
valos de la Regla empı́rica e interprételos. Regla empı́rica? Explique.
6. Los datos que aparecen enseguida son los pa- e) ¿Cuántos de los paquetes pesan exacta-
sos (en libras) de 27 paquetes de carne molida, mente 1 libra? ¿Puede usted considerar
vistos en un supermercado: alguna explicación para esto?
97 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
SOBRE LA SIGNIFICANCIA DE LA DESVIACIÓN ESTÁNDAR
Ejercicios
7. ¿Es normal el ritmo respiratorio de usted? En dividió en dos grupos. Ella midió el contenido
realidad, no hay un ritmo estándar de respira- de titanio (Ti) de las muestras usando dos méto-
ción para seres humanos. Puede variar desde dos diferentes.
sólo cuatro respiraciones por minuto hasta 70 Método 1 Método 2
o 75 para una persona que realice un ejercicio
agotador. Suponga que los ritmos respiratorios 0,011 0,013 0,011 0,016
en reposo para estudiantes universitarios tiene 0,013 0,015 0,013 0,012
una distribución en forma de campana, con una 0,014 0,013 0,015 0,012
media igual a 12 y una desviación estándar de 0,010 0,013 0,017 0,013
2,3 respiraciones por minuto. ¿Qué fracción de 0,011 0,012 0,014 0,015
todos los estudiantes tendrı́a ritmos respirato- a) Construya gráficas de tallo y hoja para
rios en los siguientes intervalos? los dos conjuntos de datos. Visualmente
a) 9,7 a 14,3 respiraciones por minuto. compare sus centros y sus rangos.
b) 7,4 a 16,6 respiraciones por minuto. b) Calcule las medias muestrales y desvia-
c) Más de 18,9 o menos de 5,1 respiracio- ciones estándar para los dos conjuntos.
nes por minuto. ¿Los valores calculados confirman las
8. Una geóloga recolectó 20 muestras diferentes conclusiones visuales de usted del inciso
de mineral, todas del mismo peso, y al azar las a)?
98 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
SOBRE LA SIGNIFICANCIA DE LA DESVIACIÓN ESTÁNDAR
Ejercicios
9. Para calcular la cantidad de madera en un te- b) Calcule la media muestral x̄ como esti-
rreno maderero, un propietario determinó con- mación de µ, el número medio de árbo-
tar el número de árboles con diámetros mayores les para todos los cuadrados de 50 × 50
a 12 pulgadas en cuadrados de 50×50 pies se- pies del terreno.
leccionados al azar. Se escogieron 70 de estos
cuadrados y se contaron los árboles selecciona- 10. Los datos siguientes son 30 tiempos de espe-
dos de cada extensión. Los datos aparecen en ra entre erupciones del géiser Old Faithful del
seguida: parque nacional de Yellowstone.
7 8 7 10 4 8 56 89 51 79 58 82
6 8 9 10 9 6 52 88 52 78 69 75
4 9 10 9 8 8 77 72 71 55 87 53
7 9 3 9 5 9 85 61 93 54 76 80
9 8 7 5 8 8 81 59 86 78 71 77
10 2 7 4 8 5 a) Calcule el rango.
10 7 7 7 9 6 b) Calcule la desviación estándar de la
8 8 8 7 8 9 muestra s.
6 8 6 11 9 11 c) ¿Qué proporción de las mediciones se
7 7 11 7 9 13 encuentra a no más de dos desviacio-
10 8 8 5 9 9 nes estándar de la media? ¿Y a no más
8 5 9 8 de tres desviaciones estándar de la me-
dia? ¿Estas proporciones concuerdan con
a) Construya un histograma de frecuencia las proporciones dads por el teorema de
relativa para describir los datos. Tchebychev?
99 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDICIONES DE POSICIÓN RELATIVA
La media y desviación estándar se pueden usar para calcular un puntaje z, que mide la posición
relativa de una medición en un conjunto de datos.
Puntaje z
El puntaje z muestral es una medida de posición relativa definida por
x − x̄
puntaje z =
s
100 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDICIONES DE POSICIÓN RELATIVA
Debe apreciar con cuidado cualquier observación que tenga un puntaje z mayor a 3 en valor
absoluto. Quizá la medición fue registrada incorrectamente o no pertenece a la población que se
muestrea. Quizá es sólo una observación muy poco probable, pero válida, con todo.
101 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDICIONES DE POSICIÓN RELATIVA
Ejemplo
Consideremos las siguientes n mediciones:
1 1 0 15 2 3 4 0 1 3
102 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDICIONES DE POSICIÓN RELATIVA
Un percentil es otra medida de posición relativa y se usa con más frecuencia para conjuntos
grandes de datos. Los percentiles no son muy útiles para conjuntos pequeños de datos.
Percentil
Un conjunto de n mediciones de la variable x se ha reacomodado en orden de magnitud. El p-
ésimo percentil es el valor de x que es mayor a p % de las mediciones y es menor que el restante
(100 − p) %.
Ejemplo
Supongamos que un estudiante ha sido notificado que su calificación de 610, en la Prueba de
Selección Universitaria en lenguaje, lo ha colocado en el 60avo percentil en la distribución de
calificaciones. ¿Dónde está su calificación de 610 en relación a las calificaciones de los otros
que tomaron la prueba? Entonces calificar en el 60avo percentil significa que 60 % de todas las
calificaciones de examen fueron más bajas que la calificación de usted y 40 % fueron más altas.
103 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDICIONES DE POSICIÓN RELATIVA
60% 40%
60avo percentil x
Figura: El 60avo percentil mostrado en el histograma de frecuencia relativa para un conjunto de datos.
104 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDICIONES DE POSICIÓN RELATIVA
Como el área total bajo la distribución es 100 %, 60 % del área está a la izquierda y 40 % del área
está a la derecha del 60avo percentil. Recuerde que la mediana, m, de un conjunto de datos es
la medición central; esto es, 50 % de las mediciones son más pequeñas y 50 % son más grandes
que la mediana. Entonces, ¡la mediana es igual que el 50avo percentil!
Los percentiles 25avo y 75avo, llamados cuartiles inferior, Q1 , y superior, Q3 , junto con la
mediana (el 50avo percentil), localizan puntos que dividen los datos en cuatro conjuntos, cada
uno conteniendo un número igual de mediciones. Veinticinco por ciento de las mediciones serán
menores que el cuartil inferior (primero), 50 % serán menores que la mediana (el segundo cuartil,
Q2 ) y 75 serán menores que el cuartil superior (tercero).
De este modo, la mediana y los cuartiles inferior y superior están ubicados en puntos en el eje
x de modo que el área bajo el histograma de frecuencia relativa para los datos está dividida en
cuatro áreas iguales, como el muestra en la siguiente Figura.
105 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDICIONES DE POSICIÓN RELATIVA
Q1 m Q3
106 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDICIONES DE POSICIÓN RELATIVA
Cuartiles
Un conjunto de n mediciones en la variable x se ha acomodado en orden de magnitud. El cuartil
inferior (primer cuartil), Q1 , es el valor de x que es mayor a un cuarto de las mediciones y
es menor que los restantes tres cuartos. El segundo cuartil es la mediana. El cuartil superior
(tercer cuartil), Q3 , es el valor de x que es mayor a tres cuartos de las mediciones y es menor
que el restante un cuarto.
Para conjuntos de datos pequeños, con frecuencia es imposible dividir el conjunto en cuatro gru-
pos, cada uno de los cuales contiene exactamente 25 % de las mediciones. Por ejemplo, cuando
n = 10, usted necesita tener 2, 5 mediciones en cada grupo. Aun cuando usted efectúe esta tarea
(por ejemplo, n = 12), hay muchos números que satisfarı́an la definición precedente y, por lo
tanto, podrı́an ser considerados “cuartiles”. Para evitar ambigüedad, usamos la siguiente regla
para localizar cuartiles muestrales.
107 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDICIONES DE POSICIÓN RELATIVA
Ejemplo
Consideremos el conjunto de n = 10 mediciones: 16, 25, 4, 18, 11, 13, 20, 8, 11 y 9. Entonces,
ordenando las mediciones de menor a mayor:
4 8 9 11 11 13 16 18 20 25
Calculamos la
Como estas posiciones no son enteros, el cuartil inferior se toma como el valor 3/4 de la distancia
entre la segunda y tercera mediciones ordenadas, y el cuartil superior se toma como el valor 1/4
de la distancia entre la octava y novena mediciones ordenadas. Por tanto,
y
Q3 = 18 + 0,25(20 − 18) = 18 + 0,5 = 18,5
108 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
MEDICIONES DE POSICIÓN RELATIVA
Como la mediana y los cuartiles dividen la distribución de datos en cuatro partes, cada una de
ellas conteniendo alrededor de 25 % de las mediciones, Q1 y Q3 son las fronteras superior e
inferior para el 50 % central de la distribución. Podemos medir el rango de este “50 % central”
de la distribución usando una medida numérica llamada rango intercuartil.
Rango intercuartil
El rango intercuartil (RIC) para un conjunto de mediciones es la diferencia entre los cuartiles
superior e inferior; esto es, RIC = Q3 − Q1 .
109 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
EL RESUMEN DE CINCO NÚMEROS Y LA GRÁFICA DE CAJA
La mediana y los cuartiles superior e inferior dividen los datos en cuatro conjuntos, cada uno
de los cuales contiene igual número de número de mediciones. Si agregamos el número más
grande (máx) y el número más pequeño (mı́n) del conjunto de datos a este grupo, tendremos un
conjunto de número que da un rápido y aproximado resumen de la distribución de datos.
El resumen de cinco números consta del número más pequeño, el cuartil inferior, la mediana,
el cuartil superior, y el número más grande, presentados en orden de menor a mayor:
mı́n ←→ Q1 ←→ m ←→ Q3 ←→ máx
Por definición, un cuarto de las mediciones del conjunto de datos se encuentre entre cada uno de
los cuatro pares adyacentes de números.
El resumen de cinco números se puede usar para crear una gráfica sencilla llamada gráfica de
cajas a fin de describir visualmente la distribución de datos. De la gráfica de caja, rápidamente
se puede detectar cualquier sesgo en la forma de la distribución y ver si hay algunos resultados
atı́picos en el conjunto de datos.
110 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
EL RESUMEN DE CINCO NÚMEROS Y LA GRÁFICA DE CAJA
Un resultado atı́pico podrı́a aparecer al trasponer dı́gitos cuando se registra una medición, al leer
incorrectamente la carátula de un instrumento, por el mal funcionamiento de una pieza de equipo
o por otros problemas. Aun cuando no haya errores de registro o de observación, un conjunto de
datos puede contener una o más mediciones válidas que, por una u otra razón, difieren marcada-
mente de las otras del conjunto. Estos resultados atı́picos pueden causar una notable distorsión
en medidas numéricas de uso común tales como x̄ y s.
De hecho, los valores atı́picos pueden contener información importante no compartida con las
otras mediciones del conjunto. Por tanto, los resultados atı́picos aislados, si están presentes, son
un paso importante en cualquier análisis preliminar de un conjunto de datos. La gráfica de caja
está diseñada expresamente para este fin. Para construir una gráfica de caja:
1 Calcule le mediana, los cuartiles superior e inferior y el RIC para el conjunto de datos.
2 Trace una recta horizontal que represente la escala de medición. Forme una caja un poco
arriba de la recta horizontal con los extremos derecho e izquierdo en Q1 y Q3 . Trace una
recta vertical que pase por la caja en la ubicación de la mediana.
111 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
EL RESUMEN DE CINCO NÚMEROS Y LA GRÁFICA DE CAJA
Los lı́mites superior e inferior se muestran con lı́neas interrumpidas, pero no suelen ser trazadas
en la gráfica de caja. Cualquier medición a mayor distancia del lı́mite superior o inferior es
un resultado atı́pico; el resto de las mediciones, dentro de los lı́mites, no son inusuales. Por
último, la gráfica de caja marca el rango del conjunto de datos usando “bigotes” para conectar
las mediciones más pequeñas y más grandes (excluyendo resultados atı́picos) a la caja. Para
terminar la gráfica de caja:
112 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
EL RESUMEN DE CINCO NÚMEROS Y LA GRÁFICA DE CAJA
El valor x = 520, es el único resultado atı́pico que se encuentra fuera del lı́mite superior.
El resultado atı́pico se destaca fuera del lı́mite superior. Una vez excluido el resultado atı́pico,
encontramos las mediciones más pequeñas y más grande que forman los bigotes.
113 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
EL RESUMEN DE CINCO NÚMEROS Y LA GRÁFICA DE CAJA
Sodio
114 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
EL RESUMEN DE CINCO NÚMEROS Y LA GRÁFICA DE CAJA
Ejercicios
115 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
EL RESUMEN DE CINCO NÚMEROS Y LA GRÁFICA DE CAJA
Ejercicios
116 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
EL RESUMEN DE CINCO NÚMEROS Y LA GRÁFICA DE CAJA
Ejercicios
9. Estudios cientı́ficos informan de tiempos de su- c) Trace una gráfica de caja para describir
pervivencia para pacientes con hepatitis activa, los datos. Explique por qué la gráfica de
la mitad tratados con prednisona y la otra mitad caja confirma lo concluido por usted en
no reciben tratamiento. Los tiempos de supervi- el inciso b).
vencia (en meses) están adaptados de sus datos
para los tratados con prednisona. 10. Los estados de cuenta mensuales por consumo
eléctrico (en pesos) para una familia de Co-
8 127
piapó, se registraron durante 12 meses conse-
11 133
cutivos empezando en enero de 2016.
52 139
57 142 Mes Cantidad Mes Cantidad
65 144
87 147 Ene 17 596 Jul 19 081
93 148 Feb 10 171 Ago 20 882
97 157 Mar 14 657 Sep 21 381
109 162 Abr 10 123 Oct 14 117
120 165 May 11 649 Nov 13 008
Jun 17 990 Dic 14 345
a) ¿Al ver estos datos, se puede decir si es
más o menos simétrica? ¿O bien, es ses- a) Construya una gráfica de caja para los
gada? costos.
b) Calcule la media y mediana. Use estas b) ¿Qué nos dice la gráfica de caja acerca
medidas para determinar si los datos son de la distribución de costos por consumo
o no son simétricos o sesgados. eléctrico para esta familia?
117 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
Contenidos de la unidad
118 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
OBJETIVOS
Objetivos
Objetivo
A veces los datos que son recolectados están formados por observaciones para dos variables
en la misma unidad experimental. Técnicas especiales que se pueden emplear al describir estas
variables ayudarán al usuario a identificar posibles relaciones entre ellas.
119 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
DATOS BIVARIADOS
Datos bivariados
Es muy frecuente que investigadores se interesen en más de sólo una variable que se pueda medir
durante su investigación. Por ejemplo, una compañı́a aseguradora de autos podrı́a estar interesada
en el número de vehı́culos propiedad de un tenedor de pólizas, ası́ como en el número de quienes
conducen un vehı́culo en la familia. Un economista podrı́a necesitar medir la cantidad gastada
por semana en comestibles en una familia, y también el número de personas de esa familia. Un
agente de ventas de bienes raı́ces podrı́a medir el precio de venta de una propiedad residencial y
la superficie en metros cuadrados de la sala.
Cuando dos variables se miden en una sola unidad experimental, los datos resultantes se deno-
minan datos bivariados. ¿Cómo se deben presentar estos datos? No sólo son importantes ambas
variables cuando se estudian por separado, sino que el experimentador también puede explorar la
relación entre las dos variables. Los métodos para graficar datos bivariados, ya sean cualitativos
o cuantitativos, permiten estudiar las dos variables juntas. Al igual que con datos univariados,
se usan diferentes gráficas según el tipo de variables que se midan.
120 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
GRÁFICAS PARA VARIABLES CUALITATIVAS
Cuando al menos una de las dos variables es cualitativa, se pueden usar gráficas de pastel, ya
sean sencillas o más elaboradas, gráficas de lı́neas y gráficas de barras para presentar y describir
los datos. A veces habrá una variable cualitativa y una cuantitativa que se han medido en dos
diferentes poblaciones o grupos. En este caso, se pueden usar dos gráficas de pastel lado a lado
o una gráfica de barras en la que las barras para las dos poblaciones se colocan una al lado de la
otra. Otra opción es usar una gráfica de barras apiladas, en la que las barras para cada categorı́a
se ponen una sobre la otra.
121 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
GRÁFICAS PARA VARIABLES CUALITATIVAS
Ejemplo
El Informe de Equidad de Genero 2017 de la Región de Atacama (Corproa), concluye que la
Región de Atacama es una de las menos equitativas del paı́s en el aspecto laboral. La siguiente
tabla, muestra el ingreso medio (en miles de pesos) clasificado nivel educacional y genero.
Para presentar estos datos podemos usar una gráfica de barras lado a lado, como se muestra en la
siguiente figura. La altura de las barras es el ingreso medio, donde cada par de barras a lo largo
del eje horizontal representa el nivel educativo.
Aquı́, podemos notar que los ingresos medios son considerablemente más altos para los hombres
en cada nivel educativo, lo que indica que existe una brecha en los sueldos recibidos por las
mujeres y los hombres. Además, notamos que la brecha es mayor para aquellas personas que
tienen educación universitaria.
122 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
GRÁFICAS PARA VARIABLES CUALITATIVAS
1000
Ingreso medio (miles de pesos) Mujeres Hombres
800
600
400
200
0
Primaria Secundaria Universitaria
Nivel educacional
Figura: Gráfica de barras comparativas para el ingreso medio clasificado por género.
123 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
GRÁFICAS PARA VARIABLES CUALITATIVAS
Ejemplo
Junto con los ingresos medios de las personas del ejemplo anterior, en el Informe de Equidad
de Genero 2017 de la Región de Atacama, se muestra la información de dos variables cualitati-
vas para cada persona (unidad experimental): genero y el nivel educacional. La siguiente tabla
muestra el número de personas en cada una de las 2 × 3 = 6 categorı́as.
Los números de la tabla no son mediciones cuantitativas en una sola unidad experimental. Son
frecuencias, o cantidades, del número de personas que caen en cada categorı́a. Para comparar
los números de mujeres y hombres en cada nivel educacional, es necesario trazar gráficas de
pastel y mostrarla una junto a la otra, como en la siguiente figura. En esta figura, notamos que
la distribución de mujeres y hombres en cada nivel educacional es similar. De manera opcional,
se puede trazar ya sea una gráfica de barras apiladas o lado a lado. La gráfica de barras apiladas
se muestra en la siguiente figura, donde notamos que la frecuencia más alta la encontramos en la
categorı́a de educación secundaria y que la frecuencia de personas en las categorı́a de educación
primaria y universitaria es parecida.
124 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
GRÁFICAS PARA VARIABLES CUALITATIVAS
Mujeres Hombres
24% 24%
Educación primaria
52% Educación secundaria
55%
Educación universitaria
21% 24%
125 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
GRÁFICAS PARA VARIABLES CUALITATIVAS
60 Hombres
Mujeres
50
40
Frecuencia
30
20
10
0
Primaria Secundaria Universitaria
Nivel educacional
126 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
GRÁFICAS PARA VARIABLES CUALITATIVAS
Ejercicios
1. Los hombres y mujeres que contestaron un 2. Un grupo de artı́culos está clasificado de acuer-
cuestionario acerca de las diferencias de géne- do con cierto atributo (X, Y y Z) y de acuerdo
ro están clasificadas en tres grupos, según sus a la ciudad en el que se producen:
respuestas a la primera pregunta:
X Y Z
G1 G2 G3
Copiapó 20 5 5
Hombres 37 49 72 Caldera 10 10 5
Mujeres 7 50 31
a) Genere una gráfica de barras comparativa
a) Genere gráficas de pastel juntas para des- (una al lado de la otra) para comparar los
cribir estos datos. números de artı́culos de cada tipo hechos
b) Genere una gráfica de barras lado a lado en Caldera y Copiapó.
para describir estos datos. b) Genere una gráfica de barras apiladas pa-
c) Trace una gráfica de barras apiladas para ra comparar los números de artı́culos de
describir estos datos. cada tipo hechos en las dos ciudades.
d) ¿Cuál de las tres gráficas describe mejor c) ¿Cuál de los dos tipos de presentación en
la diferencia o similitud de las respuestas los incisos a) y b) se entiende con más
de hombres y mujeres? facilidad? Explique.
127 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
GRÁFICAS PARA VARIABLES CUALITATIVAS
Ejercicios
3. La tabla siguiente muestra las cantidades pro- gasto para hombres y mujeres?
medio gastadas (en dólares) por semana por d) ¿Cuál de los dos métodos empleados en
hombres y mujeres en cada una de cuatro ca- el inciso b) da una mejor gráfica descrip-
tegorı́as de gasto: tiva?
A B C D 4. Las distribuciones de colores para dos bolsas de
Hombres 54 27 105 22 dulces M&M, una sencilla y otra de manı́, se
Mujeres 21 85 100 75 muestran en la tabla siguiente. Escoja un méto-
do gráfico apropiado y compare las distribucio-
nes.
a) ¿Cuáles posibles métodos gráficos po-
drı́an usarse para comparar los patrones C A R N V
de gasto de mujeres y hombres?
S 15 14 12 4 11
b) Escoja dos métodos diferentes de graficar
M 6 2 2 3 8
y muestre los datos en forma gráfica.
c) ¿Qué se puede decir acerca de las simi- donde S: sencillo y M: manı́, además C: café,
litudes o diferencias en los patrones de A: amarillo, R: rojo, N: naranja y V: verde.
128 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
GRÁFICAS PARA VARIABLES CUALITATIVAS
Ejercicios
5. Cuando usted estaba en crecimiento, ¿sentı́a medidas en este estudio. ¿Las variables
que no tenı́a suficiente tiempo libre? Padres e son cualitativas o cuantitativas?
hijos tienen opiniones diferentes sobre este te- c) ¿Qué representan las entradas en las cel-
ma. Un grupo de investigación realizó una en- das?
cuesta a 198 padres y 200 niños y registró sus d) Use gráficas de pastel comparativas para
respuestas a la pregunta “¿Cuánto tiempo libre contrastar las respuestas de padres e hi-
tiene su hijo?” o “¿Cuanto tiempo libre tiene jos.
usted?” Las respuestas se muestran en la si-
e) ¿Cuáles otras técnicas gráficas podrı́an
guiente tabla.
usarse para describir los datos? ¿Algu-
a) Defina la muestra y la población de in- na de estas técnicas serı́a más informativa
terés para los investigadores. que las gráficas de pastel construidas en
b) Describa las variables que hayan sido el inciso d)?
129 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
GRÁFICAS DE DISPERSIÓN PARA DOS VARIABLES CUANTITATIVAS
Cuando las dos variables que hayan de presentarse en una gráfica son cuantitativas, una de ellas
se gráfica a lo largo del eje horizontal y la otra a lo largo del eje vertical. Es frecuente que a
la primera variable se le denomine x y, a la otra, y, de modo que la gráfica toma la forma de
una gráfica en los (x, y), que es más conocida. Cada par de valores de datos se gráfica como
punto en esta gráfica de dos dimensiones, llamada gráfica de dispersión. Es la extensión en
dos dimensiones de la gráfica de puntos que usamos para graficar una variable cuantitativa en
secciones previas.
Se puede describir la relación entre dos variables, x y y, usando los patrones que se muestran en
la gráfica de dispersión.
¿Qué tipo de modelo se muestra? ¿Hay una tendencia constante hacia arriba o hacia abajo
que siga un modelo en lı́nea recta? ¿Hay un modelo curvado? ¿No hay modelo en absoluto,
sino sólo una dispersión aleatoria de puntos?
¿Qué tan fuerte es el modelo? ¿Todos los puntos siguen exactamente el modelo, o la
relación es sólo débilmente visible?
¿Hay algunas observaciones poco comunes? Un resultado atı́pico es un punto que está
lejos del conglomerado de los puntos restantes. ¿Los puntos se apiñan en grupos? Si es ası́,
¿hay una explicación para las agrupaciones observadas?
130 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
GRÁFICAS DE DISPERSIÓN PARA DOS VARIABLES CUANTITATIVAS
Ejemplo
El número x de miembros de una familia, ası́ como la cantidad y (en dólares) gastada por semana
en comestibles, se miden para seis familias de una localidad.
x 2 2 3 4 1 5
y $95,75 $110,19 $118,33 $150,92 $85,86 $180,62
Marquemos el eje horizontal x y el eje vertical y. Grafique los puntos usando las coordenadas
(x, y) por cada uno de los seis pares. La gráfica de dispersión de la siguiente Figura muestra los
seis pares marcados como puntos. Se puede ver un modelo incluso con sólo seis pares de datos.
El costo semanal de alimentos aumenta con el número de miembros de la familia en una relación
aparente de lı́nea recta.
Supongamos que se encuentra que una séptima familia con dos miembros gastó $165 en alimen-
tos. Esta observación se muestra como una “×” en la figura. No se ajusta al modelo lineal de las
otras seis observaciones y está clasificada como un resultado atı́pico.
131 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
GRÁFICAS DE DISPERSIÓN PARA DOS VARIABLES CUANTITATIVAS
180 ●
160
●
140
y
120 ●
100
●
1 2 3 4 5
132 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
GRÁFICAS DE DISPERSIÓN PARA DOS VARIABLES CUANTITATIVAS
Ejemplo
Un distribuidor de vino realizó un estudio de la relación entre precio y demanda usando un tipo
de vino que se vende en $10,00 por botella. Vendió este vino en 10 lugares diferentes en un
periodo de 12 meses, usando cinco niveles diferentes de precio, $10 a $14. Los datos se dan en
la siguiente tabla.
Los 10 puntos de datos se grafican en la siguiente figura. Cuando el precio aumenta de $10
a $12, la demanda disminuye. No obstante, cuando el precio continúa aumentando, de $12 a
$14, la demanda empieza a aumentar. Los datos muestran un modelo en curva, con la relación
cambiando cuando cambia de precio. ¿Cómo se explica esta relación? Posiblemente, el precio
aumentando es una señal de mejor calidad para el consumidor, los cual causa el aumento en
demanda una vez que el costo pase de $12.
133 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
GRÁFICAS DE DISPERSIÓN PARA DOS VARIABLES CUANTITATIVAS
25 ●
●
22.5
●
Cajas
20 ●
● ●
●
17.5
●
15 ●
10 11 12 13 14
Precio
134 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS
Una tasa constante de aumento o disminución es quizá el modelo más común que se encuentra
en gráficas de dispersión bivariadas. La gráfica de dispersión para el gasto en comestible por
miembros en una familia exhibe este modelo lineal, es decir, una recta con los puntos de datos
arriba y debajo de la recta y a no más de una distancia fija desde la recta. Cuando éste es el caso,
decimos que las dos variables exhiben una relación lineal.
135 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS
Ejemplo
Los datos de la siguiente tabla son la superficie del área de descanso (en pies cuadrados), x, y el
precio de venta, y, de 12 residencias. La gráfica de dispersión de la siguiente Figura muestra un
modelo lineal en los datos.
136 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS
●
450
400
●
●
y
350
●
●
●
●
300 ●
●
●
●
250
137 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS
Para los datos del ejemplo anterior, se podrı́a describir individualmente cada variable x y y,
usando medidas descriptivas como lo son las medias x̄ y ȳ o las desviaciones estándar (sx y sy ).
No obstante, estas medidas no describen la relación entre x y y para una residencia en particular,
es decir, la forma en que el tamaño del espacio de descanso afecta el precio de venta de la casa.
Una medida sencilla que sirve a este propósito se denomina coeficiente de correlación, denotado
por r y se define como
sxy
r=
sx sy
Las cantidades sx y sy son las desviaciones estándar para las variables x y y, respectivamente.
La nueva cantidad sxy se denomina covarianza entre x y y, y está definida como
P P
P ( xi )( yi )
P
(xi − x̄)(yi − ȳ) xi yi −
sxy = o sxy = n
n−1 n−1
Se puede demostrar que el valor de r siempre está entre −1 y 1. Cuando r es positiva, x aumen-
ta cuando y aumenta, y viceversa. Cuando r es negativa, x disminuye cuando y aumenta, o x
aumenta cuando y disminuye. Cuando r toma el valor de 1 o −1, todos los puntos están exac-
tamente en una recta. Si r = 0, entonces no hay relación lineal aparente entre las dos variables.
Cuando más cercano sea el valor de r a 1 o a −1, será más fuerte la relación lineal entre las dos
variables.
138 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS
Ejemplo
El coeficiente de correlación para el número de pies cuadrados de área de descanso y el precio
de venta de una casa, se necesitan tres cantidades para calcular el coeficiente de correlación. Las
desviaciones estándar de las variables x y y son sx = 281,4842 y sy = 59,7592. Por último,
P P
P ( xi )( yi )
xi yi −
sxy = n
n−1
(20 980)(4043,5)
7 240 383 −
= 12 = 15 545,19697
11
Entonces
sxy 15 545,19697
r= = = 0,9241
sx sy (281,4842)(59,7592)
Este valor de r es bastante cercano a 1, lo cual indica que la relación lineal entre estas dos
variables es muy fuerte.
139 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS
A veces las dos variables, x y y, están relacionadas de una forma particular. Puede ser que
el valor de y dependa del valor de x; esto es, el valor de x en alguna forma explica el valor
de y. Por ejemplo, el costo de una casa (y) puede depender de su superficie de piso (x); el
promedio de puntos de calificación de un estudiante (x) puede explicar su calificación en un
examen (y). En estas situaciones, y se denomina variable dependiente, en tanto que x es la
variable independiente.
Si una de las dos variables se puede clasificar como la variable dependiente y y la otra como x,
y si los datos exhiben un modelo de lı́nea recta, es posible describir la relación que vincula y a x
usando una lı́nea recta dada por la ecuación
y = a + bx
140 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS
y = a + bx
y
b
b
a
0 1 2 3 4 5 6
141 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS
Como se puede ver, a es donde la recta cruza o interseca al eje y: a se denomina intersección y.
También se puede ver que para todo aumento unitario en x, y aumenta en una cantidad de b. La
cantidad b determina si la recta está aumentando (b > 0), disminuyendo (b < 0) o es horizontal
(b = 0) y muy adecuadamente se denomina pendiente de la recta.
Nuestros puntos (x, y) no caen en una recta, pero muestran una tendencia que podrı́a describirse
como modelo lineal. Podemos describir esta tendencia si ajustamos una recta a los puntos en la
mejor forma que podamos. Esta recta de mejor ajuste que relaciona a y con x y que se denomina
recta de regresión, o recta de mı́nimos cuadrados, se encuentra al reducir al mı́nimo la suma
de las diferencias cuadradas entre los puntos de datos y la recta misma, como se muestra en la
siguiente figura. Las fórmulas para calcular b y a, que se derivan matemáticamente, se muestran
a continuación:
sy
b=r y a = ȳ − bx̄
sx
y la recta de regresión de mı́nimos cuadrados es: y = a + bx
142 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS
y = a + bx
●
y
a ●
0 1 2 3 4 5 6
143 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS
144 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS
x 2 3 4 5 6 7
y 6,00 7,50 8,00 12,00 13,00 15,50
Por lo tanto, la recta de mejor ajuste es y = 1,590+1,943x. Esta recta se puede usar para estimar
el valor de la variable y cuando se conoce el valor de x. Por ejemplo, una persona solicita un
empleo y tiene tres años de experiencia (x), entonces su sueldo inicial por hora (y) serı́a
145 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS
●
15
●
12.5
●
y
10 y = 1.59 + 1.943x
●
7.5 ●
2 3 4 5 6 7
146 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS
147 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS
148 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS
Ejercicios
a) Trace una gráfica de dispersión para des- Año Medición Año Medición
cribir los datos. ¿Parece haber una rela- 1 61,5 6 58,2
ción entre x y y? Si es ası́, ¿cómo la des- 2 62,3 7 57,5
cribe? 3 60,7 8 57,5
b) Calcule el coeficiente de correlación r. 4 59,8 9 56,1
c) Encuentre la recta de mejor ajuste. Gra- 5 58,0 10 56,0
fique la recta en la gráfica de dispersión
del inciso a). ¿La recta pasa por medio de
los puntos? a) Trace una gráfica de dispersión para des-
cribir la variable cuando cambie con el
2. Considere este conjunto de datos bivariados:
tiempo.
x 1 2 3 4 5 b) Calcule el coeficiente de correlación r.
y 5,6 4,6 4,5 3,7 3,2 c) Encuentre la recta de mejor ajuste usando
a) Trace una gráfica de dispersión para des- los resultados del inciso a).
cribir los datos. ¿Parece haber una rela- d) Grafique la recta de mejor ajuste en su
ción entre x y y? Si es ası́, ¿cómo la des- gráfica de dispersión del inciso a). Des-
cribe? criba el ajuste de la recta.
149 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS
Ejercicios
4. Considere los datos que relacionan la cantidad tudio para determinar si el programa causó me-
gastada en alimentos por semana y el número jorı́a en medidas previas o posteriores y en va-
de miembros de una familia. loraciones de conducta. Las calificaciones antes
a) Encuentre la recta de mejor ajuste para y después de los exámenes para siete estudian-
estos datos. Además, grafique los puntos tes:
y la recta de mejor ajuste en la misma
Estudiante Antes Después
gráfica. ¿La recta resume la información
de los puntos de datos? Juan 101 113
b) ¿Qué estimarı́a usted que gasta por sema- Pedro 89 89
na una familia de seis en alimentos? ¿De- Marı́a 112 121
be usar la recta ajustada para estimar esta David 105 99
cantidad? ¿Por qué sı́ o por qué no? Rosa 90 104
5. Los datos que relacionan los pies cuadrados de Manuel 91 94
espacio de vivienda, ası́ como el precio de venta Fabiola 89 99
de 12 propiedades residenciales. Primero, en-
cuentre la recta de mejor ajuste que describa
estos datos y luego grafique la recta y los pun- a) Trace una gráfica de dispersión que rela-
tos de datos en la misma gráfica. Comente so- cione la calificación después del examen
bre la bondad de la recta ajustada, describiendo con la de antes del examen. ¿Ve usted al-
el precio de venta de una propiedad residencial guna tendencia?
como una función lineal de los pies cuadrados b) Calcule el coeficiente de correlación e in-
de área de vivienda. terprete o describa su valor. ¿Refuerza es-
6. Un programa de habilidades sociales, fue pues- to alguna relación que era evidente desde
to en práctica para siete estudiantes, en un es- la gráfica de dispersión? Explique.
150 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS
Ejercicios
7. Las ventas del auto Lexus han aumentado con- 8. Consumer Reports dio los precios (en dólares)
tinuamente. No obstante, el porcentaje de au- para los principales 10 televisores de pantallas
mento cambió en 1996 cuando Lexus introdujo LCD y HD, en la categorı́a de 30 a 40 pulga-
una lı́nea de camiones. Las ventas (en miles de das. ¿El precio de un televisor de pantalla LCD
vehı́culos) del Lexus de 1996 a 2005 se mues- depende del tamaño de ésta?
tran en la tabla siguiente.
Marca Precio Tamaño
Año Ventas Año Ventas 00
JVC 40 2900 40
1996 80 2001 224 00
Sony Bravia 32 1800 32
1997 100 2002 234 00
Sony Bravia 40 2600 40
1998 155 2003 260 Toshiba 3000 37
00
1999 180 2004 288 Sharp 1300 32
00
2000 210 2005 303 00
Sony Bravia 32 1500 32
00
Panasonic 1350 32
a) Grafique los datos usando una gráfica de 00
JVC 37 2000 37
dispersión. ¿Cómo describirı́a usted la re- 00
LG 2200 37
lación entre año y ventas del Lexus? 00
Samsung 1200 32
b) Encuentre la recta de regresión de mı́ni-
mos cuadrados que relacione las ventas ¿Cuál de las dos variables (precio y tamaño) es
del Lexus con el año que se mide. la variable independiente, y cuál es la variable
c) Si usted tuviera que predecir las ventas dependiente? Además, construya una gráfica de
del Lexus en el año 2017, ¿qué proble- dispersión para los datos. ¿La relación parece
mas podrı́an surgir con su predicción? lineal?
151 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
DESCRIPCIÓN DE DATOS BIVARIADOS
MEDIDAS NUMÉRICAS PARA DATOS CUANTITATIVOS BIVARIADOS
Ejercicios
9. Consulte el ejercicio anterior. Imagine que da- de 40 años antes de su muerte en 1992. De he-
mos por hecho que la relación entre x y y es cho, a medida que su carrera avanzaba, fue más
lineal. productivo en términos del número de libros es-
a) Encuentre el coeficiente de correlación, critos en un periodo determinado. Los datos si-
r. ¿Qué le dice este valor acerca de la guientes son los tiempos (en meses) requeridos
fuerza y dirección de la relación entre ta- para escribir sus libros, en incrementos de 100:
maño y precio? Número de libros Tiempo
b) ¿Cuál es la ecuación de la recta de re-
gresión empleada para predecir el precio 100 237
del televisor, con base en el tamaño de la 200 350
pantalla? 300 419
c) La Sony Corporation está introduciendo 400 465
00
un nuevo televisor de 37 de pantalla 490 507
LCD. ¿Cuál pronostica usted que será su
precio? a) Grafique el número acumulado de libros
d) ¿Serı́a razonable tratar de predecir el pre- como función del tiempo usando una
00
cio de un televisor de 45 de pantalla de gráfica de dispersión.
LCD? Explique. b) Describa la productividad del profesor
10. El profesor Isaac Asimov fue uno de los escri- Asimov en vista del conjunto de datos
tores más prolı́ficos de todos los tiempos. Es- graficado en el inciso a). ¿La relación en-
cribió cerca de 500 libros durante una carrera tre las dos variables parece ser lineal?
152 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
Contenidos de la unidad
153 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
OBJETIVOS
Objetivos
Objetivo
Ahora que ya ha aprendido a describir un conjunto de datos, ¿cómo puede usar datos muestra-
les para sacar conclusiones acerca de las poblaciones muestreadas? En esta técnica interviene
una herramienta estadı́stica llamada probabilidad y, para usarla correctamente, debe primero
entender cómo funciona. La primera parte de esta unidad le enseñará el nuevo lenguaje de la
probabilidad, presentando los conceptos básicos con ejemplos sencillos.
Objetivo
Las variables que medimos en las unidades anteriores se pueden definir ahora como variables
aleatorias, con valores que dependen de la selección de la probabilidad de los elementos de la
muestra. Usando la probabilidad como herramienta, se pueden crear distribuciones de probabi-
lidad que sirven como modelos para variables aleatorias discretas y usted puede describir estas
variables aleatorias usando una media y desviación estándar.
154 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
EL PAPEL DE LA PROBABILIDAD EN ESTADÍSTICA
Cuando lance al aire una sola moneda, verá cara (C) o sello (S). Si lanza la moneda varias
veces al aire, va a generar un número infinitamente grande de caras o sellos, es decir, toda
la población. ¿Qué aspecto tiene esta población? Si la moneda es imparcial, entonces la po-
blación debe contener 50 % de C y 50 % de S. Ahora lance al aire la moneda una vez más.
¿Cuál es la probabilidad de que resulte una cara? Casi todos dirı́an que la “probabilidad” es
1/2.
Ahora suponga que no está usted seguro de que la moneda sea imparcial, esto es, no sabe
con certeza si la composición de la población es 50 − 50 y decide hacer un experimento
sencillo. Lanza al aire la moneda n = 10 veces y observa 10 caras consecutivas. ¿Puede
concluir que la moneda es imparcial? Es probable que no, porque si ası́ fuera, observar 10
caras en fila serı́a muy improbable; esto es, la “probabilidad” serı́a muy pequeña. Es más
probable que la moneda esté “cargada”.
155 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
EL PAPEL DE LA PROBABILIDAD EN ESTADÍSTICA
Al igual que en el ejemplo de lanzar al aire una moneda, los expertos en estadı́stica usan la pro-
babilidad en dos formas. Cuando la población es conocida, se usa la probabilidad para describir
la probabilidad de observar un resultado muestral en particular. Cuando la población es desco-
nocida y sólo se dispone de una muestra de esa población, la probabilidad se usa para hacer
enunciados acerca de la composición de la población, es decir, hacer inferencias estadı́sticas.
En las siguientes unidades verá numerosas formas diferentes para calcular probabilidades. Su-
pondrá que la población es conocida y calculará la probabilidad de observar varios resultados
muestrales. Una vez que empiece a usar la probabilidad para inferencia estadı́stica, la pobla-
ción será desconocida y usará su conocimiento de probabilidad para hacer inferencias confiables
a partir de información muestral. Empecemos con algunos ejemplos sencillos para ayudarle a
captar conceptos básicos de probabilidad.
156 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
EVENTOS Y EL ESPACIO MUESTRAL
157 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
EVENTOS Y EL ESPACIO MUESTRAL
Evento simple
Un evento simple es el resultado que se observa en una sola repetición del experimento.
Ejemplo
Experimento: Lance un dado y observe el número que aparece en la cara superior. Cuando el dado
se lanza una vez, hay seis posibles resultados. Hay los eventos simples citados a continuación:
Evento E1 : observar un 1
Evento E2 : observar un 2
Evento E3 : observar un 3
Evento E4 : observar un 4
Evento E5 : observar un 5
Evento E6 : observar un 6
158 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
EVENTOS Y EL ESPACIO MUESTRAL
Ahora podemos definir un evento como un conjunto de eventos simples, a menudo denotado por
una letra mayúscula.
Eventos
Un evento es un conjunto de eventos simples.
Ejemplo
Podemos definir los eventos A y B para el experimento de lanzar al aire un dado:
159 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
EVENTOS Y EL ESPACIO MUESTRAL
Espacio muestral
El conjunto de todos los eventos simples se denomina espacio muestral, Ω.
A veces es útil visualizar un experimento usando una imagen llamada diagrama de Venn, que
se ilustra en la siguiente Figura. La caja exterior representa el espacio muestral, que con-
tiene todos los eventos simples, representados por puntos marcados. Como un evento es un
conjunto de uno o más eventos simples, los puntos apropiados están circulados y marcados
con la letra del evento. Para el experimento de lanzar al aire un dado, el espacio muestral es
Ω = {E1 , E2 , E3 , E4 , E5 , E6 } o bien, de un modo más simple, Ω = {1, 2, 3, 4, 5, 6}. Los
eventos A = {1, 3, 5} y B = {1, 2, 3} están circulados en el diagrama de Venn.
160 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
EVENTOS Y EL ESPACIO MUESTRAL
A B Ω
E6
E1 E2
E5
E3
E4
161 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
EVENTOS Y EL ESPACIO MUESTRAL
Ejemplo
Experimento: Lance al aire una sola moneda y observe el resultado. Éstos son los eventos sim-
ples:
El espacio muestral es Ω = {E1 , E2 }, o bien, dicho en forma más sencilla, Ω = {C, S}.
Ejemplo
Experimento: Registre el tipo de sangre de una persona. Los cuatro posibles resultados mutua-
mente excluyentes son estos eventos simples:
162 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
EVENTOS Y EL ESPACIO MUESTRAL
Ejemplo
Un técnico médico registra el tipo sanguı́neo y factor Rh de una persona. Entonces se hace
necesario un procedimiento de dos etapas para registrar las dos variables de interés. Los ocho
eventos simples del diagrama de árbol forman el espacio muestral:
Una forma alternativa para exhibir los eventos simples es usar una tabla de probabilidad, como
se muestra a continuación. Las filas y columnas muestran los posibles resultados en las etapas
primera y segunda, respectivamente y los eventos simples se muestran en las celdas de la tabla.
Tipo sanguı́neo
Factor Rh A B AB O
Negativo A− B− AB− O−
Positivo A+ B+ AB+ O+
163 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
EVENTOS Y EL ESPACIO MUESTRAL
+ E1 : A+
A
− E2 : A−
+ E3 : B+
B
− E4 : B−
+ E5 : AB+
AB
− E6 : AB−
+ E7 : O+
O
− E8 : O−
164 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
CÁLCULO DE PROBABILIDAD CON EL USO DE EVENTOS SIMPLES
Frecuencia
Frecuencia relativa =
n
donde la frecuencia es el número de veces que ocurrió el evento A. Si hacemos que el número
n de repeticiones del experimento se haga cada vez más grande (n → ∞), en última instan-
cia se genera toda la población. En ésta, la frecuencia relativa del evento A se define como la
probabilidad del evento A; esto es,
Frecuencia
P(A) = lı́m
n→∞ n
Como P(A) se comporta como una frecuencia relativa, P(A) debe ser una proporción que se
encuentre entre 0 y 1; P(A) = 0 si el evento A nunca ocurre, y P(A) = 1 si el evento A
siempre ocurre. Cuanto más cercano sea P(A) a 1, es más probable que A ocurra.
165 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
CÁLCULO DE PROBABILIDAD CON EL USO DE EVENTOS SIMPLES
Por ejemplo, si se lanza al aire un dado balanceado de seis caras un número de veces infinito,
se esperarı́a que la frecuencia relativa para cualesquiera de los seis valores, x = 1, 2, 3, 4, 5, 6,
fuera 1/6. Sobra decir que serı́a muy lento, si no imposible, repetir un experimento un número
infinito de veces. Por esta razón, hay métodos alternativos para calcular probabilidades que hacen
uso del concepto de frecuencia relativa.
Una consecuencia importante de la definición de frecuencia relativa de una probabilidad involu-
cra a eventos simples. Como los eventos simples son mutuamente excluyentes, sus probabilidades
deben satisfacer las siguientes dos condiciones:
Cuando es posible escribir los eventos simples asociados con un experimento y determinar sus
probabilidades respectivas, podemos hallar la probabilidad de un evento A si sumamos las pro-
babilidades de todos los eventos simples contenidos en el evento A.
Probabilidad
La probabilidad de un evento A es igual a la suma de las probabilidades de los eventos simples
contenidos en A.
166 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
CÁLCULO DE PROBABILIDAD CON EL USO DE EVENTOS SIMPLES
Si quisiéramos encontrar la probabilidad de observar exactamente una cara en los dos tiros, es
necesario hallar todos los eventos simples que resulten, es decir, E2 y E3 :
1 1 1
P(A) = P(observar exactamente una cara) = P(E2 ) + P(E3 ) = + =
4 4 2
167 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
CÁLCULO DE PROBABILIDAD CON EL USO DE EVENTOS SIMPLES
168 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
CÁLCULO DE PROBABILIDAD CON EL USO DE EVENTOS SIMPLES
Ejemplo
Un plato contiene un dulce amarillo y dos rojos. Usted cierra los ojos, del plato escoge dos dulces,
uno por uno y anota sis colores. ¿Cuál es la probabilidad de que ambos dulces sean rojos?
Como no se dan probabilidades, se debe hacer una lista de los eventos simples del espacio mues-
tral. La selección de los dulces en dos etapas siguiera un diagrama de árbol, que se muestra en
la siguiente figura. Hay dos dulces rojos en el plato, de modo que se pueden usar las letras R1 ,
R2 y Y para indicar que se el primero rojo, el segundo rojo o el dulce amarillo, respectivamente.
Como usted cerró los ojos cuando escogió los dulces, las seis opciones deben ser igualmente
probables y se les asigna la probabilidad 1/6. Si A es el evento de que ambos dulces sean rojos,
entonces
A = {R1 R2 , R2 R1 }
Entonces
1 1 1
P(A) = P(R1 R2 ) + P(R2 R1 ) = + =
6 6 3
169 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
CÁLCULO DE PROBABILIDAD CON EL USO DE EVENTOS SIMPLES
R2 R1 R2
R1
Y R1 Y
R1 R2 R1
R2
Y R2 Y
R1 Y R1
Y
R2 Y R2
170 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
CÁLCULO DE PROBABILIDAD CON EL USO DE EVENTOS SIMPLES
1 Haga una lista de todos los eventos simples del espacio muestral.
2 Asigne una probabilidad apropiada a cada evento simple.
3 Determine cuáles eventos simples resultan en el evento de interés.
4 Sume las probabilidades de los eventos simples que resulten en el evento de interés.
Cuando el espacio muestral es grande, es fácil de omitir sin intención algunos de los eventos
simples. Si esto ocurre, o si sus probabilidades asignadas son erróneas, sus respuestas no serán
útiles en la práctica.
Una forma de determinar el número requerido de eventos simples es usar las reglas de conteo
presentadas en la siguiente sección. Estas reglas se pueden usar para resolver problemas más
complejos, que generalmente comprenden un gran número de eventos simples.
171 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
CÁLCULO DE PROBABILIDAD CON EL USO DE EVENTOS SIMPLES
Ejercicios
1. Un experimento consiste en tirar un solo dado. 2. Un espacio muestral Ω está formado por cinco
Éstos son algunos eventos: eventos simples con estas probabilidades:
A : observar un 2 P(E1 ) = P(E2 ) = 0,15
B : observar un número par P(E3 ) = 0,40 P(E4 ) = 2P(E5 )
C : observar un número mayor a 2
D : observar A y B a) Encuentre las probabilidades para los
E : observar A o B o ambos eventos simples E4 y E5 .
F : observar A y C b) Encuentre las probabilidades para estos
dos eventos: A = {E1 , E3 , E4 } y
B = {E2 , E3 }.
c) Haga una lista de eventos simples que se
a) Haga una lista de eventos simples del es- encuentren en el evento A o en el evento
pacio muestral. B o en ambos.
b) Haga una lista de eventos simples en cada d) Haga una lista de eventos simples que se
uno de los eventos A al F . encuentre en el evento A y en el B.
c) ¿Qué probabilidades debe asignar a los 3. Un espacio muestral contiene 10 eventos
eventos simples? simples: E1 , E2 , . . . , E10 . Si P(E1 ) =
d) Calcule las probabilidades de los seis 3P(E2 ) = 0,45 y los restantes eventos sim-
eventos A al F sumando las probabili- ples son igualmente probables, encuentre las
dades apropiadas de evento simple. probabilidades de estos restantes eventos.
172 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
CÁLCULO DE PROBABILIDAD CON EL USO DE EVENTOS SIMPLES
Ejercicios
4. Una jugadora de baloncesto acierta en 70 % de a) Haga una lista de los eventos simples en
sus tiros libres. Cuando ella lanza un par de ti- Ω.
ros libres, los cuatro eventos simples y tres de b) ¿Cuál es la probabilidad de que la selec-
sus probabilidades asociadas se dan en la tabla: ción contenga la moneda de 500 pesos?
Primer Segundo c) ¿Cuál es la probabilidad de que la suma
E tiro tiro Prob. total sacada sea igual a 150 pesos o más?
1 Encesta Encesta 0,49 6. Un tazón contiene tres pelotas rojas y dos ama-
2 Encesta Falla ? rillas. Dos de ellas se seleccionan al azar y se
3 Falla Encesta 0,21 registran sus colores. Use un diagrama de árbol
4 Falla Falla 0,09 para hacer una lista de los 20 eventos simples
del experimento, teniendo en mente el orden en
a) Encuentre la probabilidad de que la juga-
el que se sacan las pelotas.
dora enceste en el primer tiro y falle en el
segundo. 7. Consulte el ejercicio anterior. Una pelota se se-
b) Encuentre la probabilidad de que la juga- lecciona al azar del tazón que contiene tres pe-
dora enceste en al menos uno de los dos lotas rojas y dos amarillas. Se toma nota de su
tiros libres. color, y la pelota se devuelve al tazón antes de
5. Un frasco contiene cuatro monedas: una de 10, seleccionar una segunda pelota. Haga una lis-
una de 50, una de 100 y una de 500 pesos. Se ta de los otros cinco eventos simples que deben
seleccionan al azar tres monedas del frasco. agregarse al espacio muestral.
173 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
CÁLCULO DE PROBABILIDAD CON EL USO DE EVENTOS SIMPLES
Ejercicios
8. Un estudio clasificó a un gran número de adul- b) El adulto necesita lentes para leer pero no
tos de acuerdo a si se considera que necesitan los usa.
lentes para corregir su vista para leer y si usan c) El adulto usa lentes para leer, los necesite
lentes cuando leen. Las proporciones que caen o no.
en las cuatro categorı́as se muestran en la ta-
9. El juego de la ruleta usa una rueda que contiene
bla siguiente. (Observe que una pequeña pro-
38 buchacas. Treinta y seis buchacas numera-
porción, 0,02, de adultos usaban lentes cuando
das 1, 2, . . . , 36 y las dos restantes están mar-
de hecho se considera que no los necesitan.)
cadas 0 y 00. La rueda se hace girar y una bu-
Usaban lentes chaca es identificada como la “ganadora”. Su-
Para leer ponga que la observación de cualquier buchaca
es igualmente probable que cualquier otra.
Considera que
necesita lentes Sı́ No a) identifique los eventos simples en un solo
giro de la rueda de la ruleta.
Sı́ 0,44 0,14 b) Asigne probabilidades a los eventos sim-
No 0,02 0,40 ples.
Si un solo adulto se selecciona de este grupo c) Sea A el evento que usted observa ya sea
grande, encuentre la probabilidad de cada even- 0 o 00. Haga una lista de los eventos sim-
to: ples del evento A y encuentre P(A).
d) Suponga que usted apostó en los números
a) Se considera que el adulto necesita len- del 1 al 18. ¿Cuál es la probabilidad de
tes. que uno de sus números sea el ganador?
174 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
CÁLCULO DE PROBABILIDAD CON EL USO DE EVENTOS SIMPLES
Ejercicios
10. Una compañı́a de alimentos planea efectuar un b) Haga una lista de eventos simples en S.
experimento para comparar su marca de té con
la de dos competidores. Una sola persona es c) Si el probador no tiene capacidad para
contratada para probar y clasificar cada una de distinguir una diferencia en gusto entre
las tres marcas de té, que no tienen marca ex- los tés, ¿cuál es la probabilidad de que
cepto por sı́mbolos de identificación A, B y C. el probador clasifique el té tipo A como
el más deseable? ¿Como el menos desea-
a) Defina el experimento. ble?
175 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLAS ÚTILES DE CONTEO
Regla mn
Considere un experimento que se realiza en dos etapas. Si la primera etapa se puede efectuar en
m formas y, para cada una de éstas, la segunda etapa se puede lograr en n formas, entonces hay
mn formas para efectuar el experimento.
Por ejemplo, supongamos que usted puede ordenar un auto en uno de tres modelos y en uno
de cuatro colores de pintura. Para averiguar cuántas opciones hay disponibles, puede considerar
primero escoger uno de los m = 3 modelos y luego seleccionar uno de los n = 4 colores de
pintura. Con el uso de la Regla mn, tiene mn = (3)(4) = 12 posibles opciones.
176 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLAS ÚTILES DE CONTEO
Ejemplo
Se tiran dos dados. ¿Cuántos eventos simples hay en el espacio muestral S? El primer dado puede
caer en una de m = 6 formas, y el segundo en una de n = 6 formas. Como el experimento
comprende dos etapas, que forma los pares de números que se muestran en las dos caras, el
número total de eventos simples en S es
mn = (6)(6) = 36
Ejemplo
Un plato de dulces contiene un dulce amarillo y dos rojos. Del plato se seleccionan dos dulces,
uno por uno, registrando sus colores. ¿Cuántos eventos simples hay en el espacio muestral S? El
primer dulce se puede escoger en m = 3 formas. Como un dulce ya no está ahora, el segundo se
puede escoger en n = 2 formas. El número total de eventos simples es
mn = (3)(2) = 6
177 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLAS ÚTILES DE CONTEO
Regla mn extendida
Si un experimento se realiza en k etapas, con n1 formas para efectuar la primera etapa, n2
formas para efectuar la segunda etapa, . . . , y nk formas para efectuar la k-ésima etapa, entonces
el número de formas para efectuar el experimento es
n1 n2 n3 · · · nk
Ejemplo
El chofer de un camión puede tomar tres rutas de la ciudad A a la ciudad B, cuatro de la ciudad
B a la C y tres de la ciudad C a la D. Si, cuando viaja de A a D, el chofer debe ir de A a B a
C a D, ¿cuántas rutas posibles de A a D hay? Sean
n1 = número de rutas de A a B = 3
n2 = número de rutas de B a C = 4
n3 = número de rutas de C a D = 3
Entonces, el número total de formas para construir una ruta completa, tomando una secundaria
desde cada uno de los tres grupos, (A a B), (B a C), (C a D), es n1 n2 n3 = (3)(4)(3) = 36.
178 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLAS ÚTILES DE CONTEO
¿En cuántas formas puede acomodar los tres libros en su estante? Hay las seis permutaciones:
El número de formas para ordenar todo un conjunto de n objetos distintos es Pnn = n!.
180 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLAS ÚTILES DE CONTEO
Ejemplo
Tres boletos de loterı́a se sacan de entre un total de 50. Si los boletos se han de distribuir a cada
uno de tres empleados en el orden en que son sacados, el orden será importante. ¿Cuántos eventos
simples están asociados con el experimento? El número total de eventos simples es
50!
P350 = = (50)(49)(48) = 117 600
47!
Ejemplo
Una máquina está compuesta de cinco partes que se pueden ensamblar en cualquier orden. Se ha
de realizar una prueba para determinar el tiempo necesario para cada orden de ensamble. Si cada
orden se ha de probar una vez, ¿cuántas pruebas deben efectuarse? El número total de pruebas es
5!
P55 = = (5)(4)(3)(2)(1) = 120
0!
181 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLAS ÚTILES DE CONTEO
Cuando contamos el número de permutaciones de los dos libros escogidos para su estante, em-
pleamos un método sistemático:
A veces el orden o acomodo de los objetos no es importante, sino sólo los objetos que se escogen.
En este caso, se puede usar una regla de conteo para combinaciones. Por ejemplo, puede que no
nos importe el orden en que los libros se coloquen en el estante, sino sólo cuáles libros podemos
poner en el estante. Cuando una comisión de cinco personas se selecciona de entre un grupo
de 12 estudiantes, el orden de la selección no es importante porque los cinco estudiantes serán
miembros iguales de la comisión.
182 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLAS ÚTILES DE CONTEO
Prn
Crn =
r!
Se puede ver que Crn resultan cuando se divide el número de permutaciones entre r!, el número
de formas de reacomodar cada grupo distinto de r objetos escogidos de entre el total n.
Ejemplo
Una tarjeta de circuito impreso se puede comprar de entre cinco proveedores. ¿En cuántas formas
se pueden escoger tres proveedores de entre los cinco? Como es sólo importante cuáles tres se
han escogido, no el orden de selección, el número de formas es
5! (5)(4)
C35 = = = 10
3!2! 2
183 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLAS ÚTILES DE CONTEO
3! 2!
Primera etapa : C23 = =3 Segunda etapa : C12 = =2
2!1! 1!1!
Aplicando la Regla mn, encontramos que hay nA = (3)(2) = 6 de los 10 eventos sencillos en
el evento A y P(A) = nA /N = 6/10 = 0,60.
184 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLAS ÚTILES DE CONTEO
Ejercicios
1. Usted tiene dos grupos de objetos muy dife- 6. ¿En cuántas formas se pueden seleccionar dos
rentes, 10 en el primer grupo y ocho en el se- personas de entre un grupo de 20 si el orden de
gundo. Si selecciona un objeto de cada grupo, selección es importante?
¿Cuántos pares diferentes puede formar?
7. Se tiran tres dados. ¿Cuántos eventos simples
2. Usted tiene tres grupos de objetos muy diferen- hay en el espacio muestral?
tes, cuatro en el primer grupo, siete en el segun-
do y tres en el tercero. Si selecciona un objeto 8. Se tiran al aire cuatro monedas. ¿Cuántos even-
de cada grupo, ¿cuántas ternas diferentes puede tos simples hay en el espacio muestral?
formar?
5 10
3. Evalúe las siguientes permutaciones: P3 , P9 , 9. Se seleccionan tres pelotas de una caja que con-
6 20 tiene 10 de ellas. El orden de selección no es
P6 y P1 . importante. ¿Cuántos eventos simples hay en el
5 espacio muestral?
4. Evalúe las siguientes combinaciones: C3 ,
10 6 20
C9 , C6 y C1 . 10. Usted tiene cuatro pares de jeans, 12 poleras
5. ¿En cuántas formas se pueden seleccionar cin- limpias y cuatro pares de zapatillas. ¿Cuántas
co personas de entre un grupo de ocho si el or- combinaciones de ropa (jeans, poleras y zapa-
den de selección es importante? tillas) puede crear?
185 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLAS ÚTILES DE CONTEO
Ejercicios
11. Una persona de negocios en Copiapó está pre- configuraciones son posibles de entre las
parando un itinerario para visitar seis ciudades. tras selecciones?
La distancia recorrida, y por tanto el costo de b) ¿Cuántas configuraciones hay en las que
viaje, dependerá del orden en el que planee su cada estudiante escoge una carta diferen-
ruta. ¿Cuántos itinerarios diferentes (y costos te?
de viaje) son posibles? c) ¿Cuál es la probabilidad de que los tres
12. Las vacaciones de su familia consisten en un estudiantes escojan exactamente la mis-
viaje en avión por el paı́s, rentar un auto y una ma carta?
estancia en un hotel de Santiago. Si usted pue- d) ¿Cuál es la probabilidad de que los tres
de escoger de entre cuatro lı́neas aéreas, cinco estudiantes escojan cartas diferentes?
agencias de renta de autos y tres cadenas ho-
teleras, ¿cuántas opciones hay para lugares en 14. Se seleccionan cinco cartas de entre un mazo
sus vacaciones? de 52 cartas para una mano de póquer.
13. Tres estudiantes están jugando a las cartas. De- a) ¿Cuántos eventos simples hay en el espa-
ciden escoger al primero en jugar al seleccionar cio muestral?
cada uno de ellos una carta de entre el mazo b) Una escalera real es una mano que con-
de 52 cartas y ver la de mayor valor y pinta. tiene el A, K, Q, J y 10, todas del mismo
Ordenar las pintas de menor a mayor: tréboles, palo. ¿Cuántas formas hay para obtener
diamantes, corazones y espadas. una escalera real.
a) Si la carta se devuelve al mazo después c) ¿Cuál es la probabilidad de recibir una
de que cada estudiante escoja, ¿cuántas escalera real?
186 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLAS ÚTILES DE CONTEO
Ejercicios
15. Consulte el ejercicio anterior. Usted tiene una entre un total de 90, ¿cuántas muestras diferen-
mano de póquer con cuatro de una clase. tes se pueden seleccionar?
a) ¿Cuántas manos de póquer posibles pue- 17. Se han de seleccionar dos miembros de un con-
de recibir? sejo municipal, de entre un total de cinco, para
b) ¿En cuántas formas puede recibir cuatro formar un subcomité para estudiar los proble-
cartas del mismo valor de cara y además mas de tránsito de la ciudad.
una carta de las otras 48 cartas?
c) ¿Cuál es la probabilidad de recibir cuatro a) ¿Cuántos subcomités diferentes son posi-
de una clase? bles?
16. Se va a efectuar un estudio en un hospital para b) Si todos los posibles miembros del con-
determinar las actitudes de las enfermeras ha- sejo tienen igual probabilidad de ser se-
cia diversos procedimientos administrativos. Si leccionados, ¿cuál es la probabilidad de
se selecciona una muestra de 10 enfermeras de que sean seleccionados Pedro y Marı́a?
187 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLAS ÚTILES DE CONTEO
Ejercicios
18. El Consejo de Relaciones Humanas formado 19. Una estudiante se prepara para un examen al
por ocho miembros consideró la queja de una estudiar una lista de 10 problemas; ella puede
mujer que alegaba discriminación, con base en resolver seis de ellos. Para el examen, el pro-
su género, por parte de una compañı́a local de fesor selecciona cinco preguntas al azar de la
encuestas. El consejo, compuesto de cinco mu- lista de 10. ¿Cuál es la probabilidad de que la
jeres y tres hombres, votó 5 − 3 a favor de la estudiante pueda resolver los cinco problemas
demandante, con las cinco mujeres votando por del examen?
ella y los tres hombres en contra. El abogado
20. A un mono se le dan 12 bloques: tres en for-
representante de la compañı́a apeló la decisión
ma de cuadrados, tres como rectángulos, tres
del consejo alegando sesgo de género de parte
como triángulos e igual número como cı́rculos.
de los miembros del consejo. Si el voto a favor
Si saca tres de cada clase en orden, es decir,
de la demandante fue 5 − 3 y los miembros del
tres triángulos, luego la misma cantidad de cua-
consejo no estuvieran sesgados por el género,
drados y ası́ sucesivamente, ¿sospecharı́a usted
¿cuál es la probabilidad de que el voto se divi-
que el mono asocia figuras que tengan forma
da en lı́neas de género (cinco mujeres a favor y
idéntica? Calcule la probabilidad de este even-
tres hombres contra)?
to.
188 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
RELACIONES DE EVENTO Y REGLAS DE PROBABILIDAD
Hay veces en que el evento de interés se puede formar como una combinación de algunos otros
eventos. Sean A y B dos eventos definidos en el espacio muestral S. Aquı́ hay tres relaciones
importantes entre eventos.
Unión
La unión de los eventos A y B, denotada por A∪B, es el evento en que ocurren A o B o ambos.
Intersección
La intersección de eventos A y B, denotada por A ∩ B, es el evento en que ocurren A y B.
Complemento
El complemento de un evento A, denotado por Ac , es el evento en que A no ocurre.
189 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
RELACIONES DE EVENTO Y REGLAS DE PROBABILIDAD
190 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
RELACIONES DE EVENTO Y REGLAS DE PROBABILIDAD
El concepto de uniones e intersecciones se puede ampliar a más de dos eventos. Por ejemplo, la
unión de tres eventos A, B y C, que se escriben como
A∪B∪C
A∩B∩C
191 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
RELACIONES DE EVENTO Y REGLAS DE PROBABILIDAD
Cuando podemos escribir el evento de interés en la forma de una unión, un complemento o una
intersección, hay reglas de probabilidad especiales que pueden simplificar nuestros cálculos. La
primera regla se refiere a uniones de eventos.
Regla de adición
Dados dos eventos, A y B, la probabilidad de su unión, A ∪ B, es igual a
Cuando dos eventos A y B son mutuamente excluyentes o disjuntos, significa que cuando ocu-
rre A, B no puede ocurrir, y viceversa. Esto significa que la probabilidad de que ambos ocurran,
P(A ∩ B), debe ser cero. Entonces, cuando dos eventos A yB son mutuamente excluyentes,
entonces P(A ∩ B) = 0 y la Regla de adición se simplifica a P(A ∪ B) = P(A) + P(B). La
segunda regla se refiere a complementos de eventos.
P(Ac ) = 1 − P(A)
192 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
RELACIONES DE EVENTO Y REGLAS DE PROBABILIDAD
Ejemplo
Una compañı́a de explotación petrolera planea perforar dos pozos de exploración. Se emplea
evidencia del pasado para tener acceso a los posibles resultados que se observan a continuación:
Calcule P(A∪B) y P(B∪C). Entonces, por su definición, los eventos A,B y C son mutuamente
excluyentes en forma conjunta porque el suceso de un evento impide que ocurra cualquiera de
los otros dos. Por tanto,
El evento A ∪ B se puede describir como el evento de que a lo sumo un pozo produce petróleo
o gas, y B ∪ C describe de que al menos un pozo produce gas o petróleo.
193 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
RELACIONES DE EVENTO Y REGLAS DE PROBABILIDAD
Ejemplo
En una encuesta telefónica hecha a mil adultos, a los que respondieron se les preguntó acerca del
gasto de una educación universitaria y la relativa necesidad de alguna forma de ayuda financiera.
Quienes respondieron fueron clasificados de acuerdo a si actualmente tenı́an un hijo en la uni-
versidad y si pensaban que la carga de un préstamo para casi todos los estudiantes universitarios
es demasiado alta, la cantidad correcta o es muy poco. Las proporciones de quienes contestaron
se muestra en la tabla de probabilidad siguiente:
194 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
RELACIONES DE EVENTO Y REGLAS DE PROBABILIDAD
Ejemplo (continuación)
1 El evento de que un entrevistado tenga un hijo en la universidad ocurrirá, cualquiera que sea
su respuesta a la pregunta acerca de la carga por el préstamo. Esto es, el evento D consta
de los eventos simples del primer renglón:
195 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD CONDICIONAL
Probabilidad condicional
Hay una regla de la probabilidad que se puede usar para calcular la probabilidad de la intersec-
ción de varios eventos, pero esta regla depende del importante concepto estadı́stico de eventos
independientes o dependientes.
Eventos independientes
Se dice que dos eventos, A y B, son independientes si y sólo si la probabilidad del evento B no
está influenciada o cambiada por el suceso del evento A, o viceversa.
196 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD CONDICIONAL
Probabilidad condicional
Ejemplo
Suponga que un observador ve el género de una persona y si ésta no distingue los colores rojo y
verde. ¿Cambia la probabilidad de que una persona sea daltónica, dependiendo de si es hombre
o no? Defina los eventos:
A : la persona es hombre
B : la persona es daltónica
En este caso, como el daltonismo es una caracterı́stica relacionada con el sexo masculino, la
probabilidad de que un hombre sea daltónico será mayor que la probabilidad de que una persona
escogida de la población general sea daltónica. La probabilidad del evento B, que una persona
sea daltónica, depende de si ha ocurrido o no ha ocurrido el evento A, que la persona sea hombre.
Decimos que A y B son eventos dependientes.
197 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD CONDICIONAL
Probabilidad condicional
Ejemplo
Considere tirar un solo dado dos veces y defina dos eventos:
Como la probabilidad del evento B no ha cambiado por el suceso del evento A, decimos que A
y B son eventos independientes.
198 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD CONDICIONAL
Probabilidad condicional
P(A ∩ B) = P(A)P(B|A)
o
P(A ∩ B) = P(B)P(A|B)
199 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD CONDICIONAL
Probabilidad condicional
Ejemplo
En un experimento, ocho juguetes se ponen en un recipiente. Los juguetes son idénticos excep-
to por el color, dos son rojos y seis son verdes. Se pide a un niño que escoja dos juguetes al
azar. ¿Cuál es la probabilidad de que el niño escoja los dos juguetes rojos? Se puede visuali-
zar el experimento usando un diagrama de árbol como se muestra en la siguiente figura. Defina
los eventos siguientes: R : se escoge juguete rojo y G : se escoge juguete verde. El evento A
(ambos juguetes son rojos) se puede representar como:
Como sólo hay juguetes rojos en el recipiente, la probabilidad de escoger el rojo en la primera es
2/8. No obstante, una vez que haya sido escogido este juguete rojo, la probabilidad del rojo en
la segunda selección depende del resultado de la primera selección, por tanto:
200 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD CONDICIONAL
Probabilidad condicional
Rojo (1/7) RR
Rojo (2/8)
Verde (6/7) RG
Rojo (2/7) GR
Verde (6/8)
Verde (5/7) GG
201 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD CONDICIONAL
Probabilidad condicional
Probabilidades condicionales
La probabilidad condicional del evento A, dado que el evento B ha ocurrido, es
P(A ∩ B)
P(A|B) = , si P(B) 6= 0
P(B)
P(A ∩ B)
P(B|A) = , si P(A) 6= 0
P(A)
202 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD CONDICIONAL
Probabilidad condicional
Ejemplo
Suponga que la población general, hay 51 % de hombres y 49 % de mujeres, y que las propor-
ciones de hombres y mujeres daltónicos se muestra a continuación:
Si una persona se escoge al azar de entre esta población y se encuentra que es hombre (evento
B), ¿cuál es la probabilidad de que el hombre sea daltónico (evento A)? Entonces,
P(A ∩ B) 0,04
P(A|B) = = = 0,078
P(B) 0,51
P(A ∩ B c ) 0,002
P(A|B c ) = = = 0,004
P(B c ) 0,49
Observe que la probabilidad del evento A cambió, dependiendo de si el evento B ocurrió. Esto
indica que estos dos eventos son dependientes.
203 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD CONDICIONAL
Probabilidad condicional
Cuando dos eventos son independientes, es decir, si la probabilidad del evento B es igual, ya sea
que el evento A haya o no haya ocurrido, entonces el evento A no afecta al evento B y entonces
P(B|A) = P(B)
P(A ∩ B) = P(A)P(B)
Del mismo modo, si A, B y C son eventos mutuamente independientes (todos los pares de
eventos son independientes), entonces la probabilidad de que A, B y C ocurran es
P(A ∩ B ∩ C) = P(A)P(B)P(C)
204 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD CONDICIONAL
Probabilidad condicional
Ejemplo
Tire al aire una moneda imparcial tres veces. ¿Cuál es la probabilidad de que en todos los tiros
salga “cara”? Defina estos eventos:
Como los tiros son independientes y como P(cara) = P(sello) = 0,5 para cualquiera de los tres
tiros,
P(A ∩ B ∩ C) = P(A)P(B)P(C) = (0,5)(0,5)(0,5) = 0,125
205 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD CONDICIONAL
Probabilidad condicional
¿Cómo se puede verificar si los dos eventos son independientes o dependientes? La solución más
fácil es redefinir el concepto de independencia en un modo más formal.
Verificación de independencia
Se dice que dos eventos A y B son independientes si y sólo si
P(A ∩ B) = P(A)P(B)
o bien,
P(B|A) = P(B)
De otro modo, se dice que los eventos son dependientes.
206 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD CONDICIONAL
Probabilidad condicional
Ejemplo
Tire al aire dos monedas y observe el resultado. Defina estos eventos:
¿Los eventos A y B son independientes? Entonces, de los ejemplos previos, sabemos que S =
{CC, CS, SC, SS}, ası́ con estos resultados podemos calcular las siguiente probabilidades:
1 1 1
P(A) = P(B) = P(A ∩ B) =
2 2 4
Como P(A)P(B) = (1/2)(1/2) = 1/4 y P(A∩B) = 1/4, tenemos P(A)P(B) = P(A∩B)
y los dos eventos deben ser independientes.
207 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD CONDICIONAL
Probabilidad condicional
Cuando dos eventos son mutuamente excluyentes o disjuntos, no pueden ocurrir los dos
cuando se realice el experimento. Una vez ocurrido el evento B, el evento A no puede
ocurrir, de modo que P(A|B) = 0, o viceversa. El suceso del evento B ciertamente afecta
la probabilidad de que el evento A pueda ocurrir.
Por tanto, los eventos mutuamente excluyentes deben ser dependientes.
Cuando dos eventos son mutuamente excluyentes o disjuntos:
208 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD CONDICIONAL
Ejercicios
209 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD CONDICIONAL
Ejercicios
210 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD CONDICIONAL
Ejercicios
11. Un experimento puede resultar en uno o ambos y reducir el ausentismo, accidentes y robos.
de los eventos A y B con las probabilidades Quienes se oponen a ello afirman que este pro-
que se muestran en esta tabla de probabilidad: cedimiento está creando una clase de gentes
c a quienes no se puede contratar y que algu-
A A nas personas pueden ser puestas en esta clase
B 0,34 0,46 porque los exámenes en sı́ no son 100 % con-
c
B 0,15 0,05 fiables. Suponga que una compañı́a utiliza un
examen que es 98 % confiable, es decir, co-
Encuentre las siguientes probabilidades: rrectamente identifica a una persona como que
a) P(A) consume drogas o que no las con probabilidad
b) P(B) 0,98 y, para reducir la probabilidad de error,
c) P(A ∩ B) se requiere que toda persona que solicite em-
d) P(A ∪ B) pleo se someta a dos exámenes. Si los resul-
e) P(A|B) tados de los dos exámenes en la misma perso-
f) P(B|A) na son eventos independientes, ¿cuáles son las
12. Consulte el ejercicio anterior. probabilidades de estos eventos?
a) ¿Los eventos A y B son mutuamente ex-
cluyentes? Explique. a) Un no consumidor no pasa en los dos
b) ¿Los eventos A y B son independientes? exámenes.
Explique
b) Un consumidor es detectado (es decir, él
13. Numerosas compañı́as están examinando em- o ella no pasa al menos un examen).
pleados prospectos para ver si consumen dro-
gas, con la intención de mejorar la eficiencia c) Un consumidor pasa ambos exámenes.
211 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD CONDICIONAL
Ejercicios
14. El hecho de que una propuesta para donación se 15. Dos personas entran a un cuarto y se registran
financie con frecuencia depende de los crı́ticos. sus cumpleaños (caso omiso a sus años).
Suponga que un grupo de propuestas de inves-
a) Identifique la naturaleza de los eventos
tigación fue evaluado por un grupo de expertos
simples en Ω.
en cuanto si las propuestas merecı́an ser finan-
b) ¿Cuál es la probabilidad de que las dos
ciadas. Cuando estas mismas propuestas fueron
personas tengan un par especı́fico de
enviadas a un segundo grupo independiente de
cumpleaños?
expertos, la decisión para financiar se invirtió
c) Identifique los eventos simples en el
en 30 % de los casos. Si la probabilidad es 0,2
evento A: ambas personas tienen el mis-
de que una propuesta sea juzgada por el primer
mo cumpleaños.
grupo de asesores de revisiones como digna de c
d) Encuentre P(A) y P(A ).
ser financiada, ¿cuáles son las probabilidades
de estos eventos? 16. Si n personas entran a un cuarto, encuentre es-
tas probabilidades: A: ninguna de las personas
a) Una propuesta digna de ser aprobada por
tiene el mismo cumpleaños, y B: al menos dos
ambos grupos.
de las personas tienen el mismo cumpleaños.
b) Una propuesta digna es desaprobada por Resuelva para
ambos grupos.
c) Una propuesta digna es aprobada por un a) n = 3.
grupo. b) n = 4.
212 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD CONDICIONAL
Ejercicios
17. Una estudiante universitaria frecuenta una de de producción, la probabilidad de que logre pa-
las dos cafeterı́as de su plantel, escogiendo A sar por el primer inspector es 0,1. De los que
el 70 % de las veces, y B el 30 % del tiempo. pasan el primer inspector, el segundo inspector
En cualquiera de estos lugares, ella compra un “pierde” cinco de 10. ¿Qué fracción de artı́cu-
café de moka en 60 % de sus visitas. los defectuoso logra pasar por ambos inspecto-
a) Las siguiente vez que vaya a una cafe- res?
terı́a en el plantel, ¿cuál es la probabili- 19. Un sistema detector de humo utiliza dos apa-
dad de que ella vaya a A y pida un café ratos, A y B. Si hay humo, la probabilidad
de moka? de que éste sea detectado por el aparato A es
b) ¿Los dos eventos del inciso a) son inde- 0,95; por el aparato B, 0,98; y por ambos apa-
pendientes? Explique. ratos, 0,94.
c) Si ella entra en una cafeterı́a y pide un
café de moka, ¿cuál es la probabilidad de a) Si hay humo, encuentre la probabilidad
que sea en B? de que éste sea detectado por el aparato
18. Cierto artı́culo manufacturado es inspecciona- A o el B o por ambos aparatos.
do visualmente por dos inspectores diferentes. b) Encuentre la probabilidad de que el humo
Cuando un artı́culo defectuoso pasa por la lı́nea no sea detectado.
213 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD CONDICIONAL
Ejercicios
20. Gregor Mendel fue un monje que sugirió en Suponemos que es igualmente probable que ca-
1865 una teorı́a de la herencia basada en la da padre dé cualquiera de los dos alelos y que,
ciencia de la genética. Él identificó individuos si uno de ellos o los dos alelos de un par es do-
heterocigotos de flores de color que tenı́an dos minante (R), el descendiente tendrá flores ro-
alelos (un r = alelo de color blanco y uno jas.
R = alelo dominante de color rojo). Cuan-
do estos individuos se apareaban, observó que a) ¿Cuál es la probabilidad de que un des-
3/4 de los descendientes tenı́an flores rojas y cendiente en este apareamiento tenga al
1/4 tenı́an flores blancas. La tabla siguiente re- menos un alelo dominante?
sume este apareamiento; cada padre da uno de
sus alelos para formar el gen del descendiente. b) ¿Cuál es la probabilidad de que un des-
cendiente tenga al menos un alelo recesi-
Padre 2 vo?
Padre 1 r R c) ¿Cuál es la probabilidad de que un des-
r rr rR cendiente tenga un alelo recesivo, dado
R Rr RR que el descendiente tiene flores rojas?
214 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLA DE BAYES
Regla de Bayes
Reconsideremos el experimento referente a daltonismo visto anteriormente. Observe que los dos
eventos
tomados juntos conforman el espacio muestral Ω, formado de hombres y mujeres. Como los
daltónicos pueden ser hombres o mujeres, el evento A, que es que una persona sea daltónica,
está formado de los eventos simples que están en A y además en B y de los eventos simples que
estén en A y además en B c . Como estas dos intersecciones son mutuamente excluyentes, se
puede escribir el evento A como
A = (A ∩ B) ∪ (A ∩ B c )
y
P(A) = P(A ∩ B) + P(A ∩ B c ) = 0,04 + 0,002 = 0,042
215 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLA DE BAYES
Regla de Bayes
A = (A ∩ S1 ) ∪ (A ∩ S2 ) ∪ · · · ∪ (A ∩ Sk )
Entonces
P(A) = P(A ∩ S1 ) + P(A ∩ S2 ) + · · · + P(A ∩ Sk )
Se puede avanzar un paso más y usar la Regla de la multiplicación para escribir P(A ∩ Si ) como
P(Si )P(A|Si ), para i = 1, 2, . . . , k. El resultado se conoce como la Ley de probabilidad
total.
Ley de probabilidad total
Dado un conjunto de eventos S1 , S2 , S3 , . . . , Sk que son mutuamente excluyentes y exhaustivos
y un evento A, la probabilidad del evento A se puede expresar como
216 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLA DE BAYES
Regla de Bayes
Ejemplo
Las zapatillas ya no son sólo para jóvenes. De hecho, casi todos los adultos tienen varios pares de
ellos. La siguiente tabla da la fracción de adultos estadounidenses de 20 años de edad o más que
tienen cinco o más pares de zapatillas en buen estado, junto con la fracción de adultos estadou-
nidenses de 20 años o más en cada uno de los cinco grupos de edad. Use la ley de probabilidad
total para determinar la probabilidad incondicional de un adulto de 20 años de edad o más que
tenga cinco o más pares de zapatillas en buen estado.
G1 G2 G3 G4 G5
20 − 24 25 − 34 35 − 49 50 − 64 ≥ 65
Con ≥ 5 pares 0,26 0,20 0,13 0,18 0,14
Adultos de 20 años o más 0,09 0,20 0,31 0,23 0,17
217 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLA DE BAYES
Regla de Bayes
Ejemplo (continuación)
Sea A el evento de que una persona seleccionada al azar de entre la población de adultos esta-
dounidenses de 18 años de edad y más tenga cinco o más pares de zapatillas en buen estado. Con
G1 , G2 , . . . , G5 represente el evento de que la persona seleccionada pertenezca a cada uno de
los cinco grupos de edades, respectivamente. Como los cinco grupos son exhaustivos, se puede
escribir el evento A como
A = (A ∩ G1 ) ∪ (A ∩ G2 ) ∪ (A ∩ G3 ) ∪ (A ∩ G4 ) ∪ (A ∩ G5 )
218 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLA DE BAYES
Regla de Bayes
219 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLA DE BAYES
Regla de Bayes
Regla de Bayes
Con S1 , S2 , . . . , Sk representaremos k subpoblaciones mutuamente excluyentes y exhaustivas
con probabilidades previas P(S1 ), P(S2 ), . . . , P(Sk ). Si ocurre un evento A, la probabilidad
de Si dada A es la probabilidad condicional
P(Si )P(A|Si )
P(Si |A) = , i = 1, 2, . . . , k
k
X
P(Sj )P(A|Sj )
j=1
Es frecuente que las probabilidad, P(Si |A) se conozcan como probabilidades posteriores, es
decir, probabilidades de las subpoblaciones (también llamados estados de naturaleza y a las
probabilidades P(Si ), se les llama probabilidades previas) que se han actualizado después de
observar la información muestral contenido en el evento A. Bayes sugirió que si las probabilida-
des previas son desconocidas, se pueden tomar como 1/k, lo cual implica que cada uno de los
eventos S1 a Sk es igualmente probable.
220 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLA DE BAYES
Ejercicios
1. Una muestra se selecciona de una de dos pobla- uno y sólo uno de los tres eventos mutuamen-
ciones, S1 y S2 , con probabilidades P(S1 ) = te excluyentes S1 , S2 y S3 , con estas pro-
0,7 y P(S2 ) = 0,3. Si la muestra se ha babilidades: P(S1 ) = 0,2, P(S1 ) = 0,5
seleccionado de S1 , la probabilidad de obser- y P(S1 ) = 0,3. Las probabilidades de que
var un evento A es P(A|S1 ) = 0,2. Del ocurra un cuarto evento A, dado que ocurre
mismo modo, si la muestra se ha selecciona- el evento S1 , S2 o S3 , son: P(A|S1 ) =
do de S2 , la probabilidad de observar A es 0,2, P(A|S2 ) = 0,1 y P(A|S3 ) =
P(A|S2 ) = 0,3. 0,3. Si se observa el evento A, encuentre
P(S1 |A),P(S2 |A) y P(S3 |A).
a) Si una muestra se selecciona al azar de
una de las dos poblaciones, ¿cuál es la
probabilidad de que ocurra el evento A? 3. Una población se puede dividir en dos sub-
grupos que se presentan con probabilidades de
b) Si una muestra se selecciona al azar y se
60 % y 40 %, respectivamente. Un evento A
observa el evento A, ¿cuál es la probabi-
ocurre 30 % del tiempo en el primer subgru-
lidad de que la muestra sea seleccionada
po y 50 % del tiempo en el segundo subgru-
de la población S1 ? ¿Y de la población
po. ¿Cuál es la probabilidad incondicional del
S2 ?
evento A, cualquiera que sea el subgrupo de
2. Si se realiza un experimento, puede ocurrir donde venga?
221 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLA DE BAYES
Ejercicios
4. Registros de delincuencia urbana muestran que 5. Una máquina operada por un trabajador pro-
20 % de todos los delitos son violentos y que duce un artı́culo defectuoso con probabilidad
80 % no lo son, abarcando robo, falsificación, 0,01 si el trabajador sigue exactamente las ins-
etc. Noventa por ciento de los delitos violentos trucciones de operación de la máquina y con
son denunciados contra 70 % de los no violen- probabilidad 0,03 si no las sigue. Si él sigue
tos. las instrucciones 90 % del tiempo, ¿qué pro-
porción de todos los artı́culos producidos por
a) ¿Cuál es el porcentaje general de denun-
la máquina será defectuosa?
cias por delitos urbanos?
b) Si un delito está ocurriendo y es denun- 6. Suponga que, en una ciudad en particular, el
ciado a la policı́a, ¿cual es la probabilidad aeropuerto A maneja 50 % de todo el tráfico
de que sea violento? ¿Cuál es la probabi- aéreo y los aeropuertos B y C manejan 30 %
lidad de que no sea violento? y 20 %, respectivamente. Los porcentajes de
c) Consulte el inciso (b). Si un crimen que detección de armas en los tres aeropuertos son
esté ocurriendo se denuncia a la policı́a, 0,90, 0,80 y 0,85, respectivamente. Si se en-
¿por qué es más probable que no sea vio- cuentra un pasajero en uno de los aeropuertos
lento? ¿No serı́a más probable que los llevando un arma por la puerta de abordar, ¿cuál
delitos violentos se denunciarán? ¿Puede es la probabilidad de que el pasajero esté usan-
usted explicar estos resultados? do el aeropuerto A? ¿Y el aeropuerto C?
222 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLA DE BAYES
Ejercicios
223 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
REGLA DE BAYES
Ejercicios
224 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
VARIABLES ALEATORIAS DISCRETAS
Variables aleatorias
En la Unidad 2, las variables se definieron como caracterı́sticas que cambian o varı́an con el
tiempo y/o para diferentes personas u objetos bajo consideración. Las variables cuantitativas
generan datos numéricos, en tanto que las variables cualitativas generan datos categóricos. No
obstante, incluso las variables cualitativas pueden generar datos numéricos si las categorı́as son
codificadas numéricamente para formar una escala. Por ejemplo, si se lanza al aire una sola
moneda, el resultado cualitativo podrı́a registrarse como “0” si es cara o como “1” si es sello.
Una variable x valuada numéricamente varı́a o cambia, dependiendo del resultado particular
del experimento que se mida. Por ejemplo, suponga que se tira un dado y se mide x, el número
observado en la cara superior. La variable x pude tomar cualquiera de seis valores: 1, 2, 3, 4, 5, 6,
dependiendo del resultado aleatorio del experimento. Por esta razón, la variable x se conoce
como variable aleatoria.
Variable aleatoria
Una variable x es variable aleatoria si el valor que toma, depende del resultado de un experi-
mento.
225 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
VARIABLES ALEATORIAS DISCRETAS
Variables aleatorias
Al igual que en la Unidad 2, las variables aleatorias cuantitativas se clasifican ya sea como dis-
cretas o como continuas, de acuerdo con los valores que x pueda tomar. Es importante distinguir
entre variables aleatorias discretas o continuas, porque se usan técnicas diferentes para describir
sus distribuciones. Nos concentramos en variables aleatorias discretas en el resto de la unidad;
las variables aleatorias continuas son el tema de la unidad siguiente.
226 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
VARIABLES ALEATORIAS DISCRETAS
Distribuciones de probabilidad
En las unidades anteriores, usted aprendió a construir la distribución de frecuencia relativa para
un conjunto de mediciones numéricas en una variable x. La distribución dio esta información
acerca de x:
Usted también aprendió a usar la media y desviación estándar para medir el centro y variabilidad
de este conjunto de datos.
En esta unidad, definimos la probabilidad como el valor limitando de la frecuencia relativa
cuando el experimento se repite una y otra vez. Ahora definimos la distribución de probabilidad
para una variable aleatoria x como la distribución de frecuencia relativa para toda la población
de mediciones.
Distribución de probabilidad
La distribución de probabilidad para una variable aleatoria discreta es una fórmula, tabla o
gráfica que da los posibles valores de X, y la probabilidad p(x) asociada con cada valor de x.
227 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
VARIABLES ALEATORIAS DISCRETAS
Distribuciones de probabilidad
Los valores de x representan eventos numéricos mutuamente excluyentes. Sumar p(x) sobre
todos los valores de x es equivalente a sumar las probabilidades de todos los eventos simples y
por tanto es igual a 1. Los requisitos para una distribución de probabilidad discreta son:
0 ≤ p(x) ≤ 1
X
p(x) = 1
x
228 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
VARIABLES ALEATORIAS DISCRETAS
Distribuciones de probabilidad
Ejemplo
Lance al aire dos monedas imparciales y sea x igual al número observado de caras. Los eventos
simples para este experimento con sus respectivas probabilidades se muestran en la siguiente
tabla:
Para cada valor de x, se puede calcular p(x) al sumar las probabilidades de los eventos simples
en ese evento. Ası́:
1 1 1
p(0) = P(E1 ) = p(1) = P(E2 ) + P(E3 ) = p(2) = P(E4 ) =
4 2 4
229 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
VARIABLES ALEATORIAS DISCRETAS
La distribución de probabilidad para una variable aleatoria discreta luce muy semejante a la
distribución de frecuencia relativa vista en las primeras unidades. La diferencia es que la distri-
bución de frecuencia relativa describe una muestra de n mediciones, en tanto que la distribución
de probabilidad se construye como un modelo para toda la población de mediciones. Ası́ como
la media x̄ y la desviación estándar s midieron el centro y dispersión de los datos muestrales,
usted puede calcular medidas similares para describir el centro y dispersión de la población.
La media poblacional, que mide el valor promedio de x en la población, también se denomina
valor esperado de la variable aleatoria x. Es el valor que se esperarı́a observar en promedio
si el experimento se repite una y otra vez. La fórmula para calcular la media poblacional es más
fácil de entender con un ejemplo. Lance otra vez al aire esas dos monedas imparciales, y sea x
el número de caras observado. Construimos esta distribución de probabilidad para x:
x 0 1 2
p(x) 1/4 1/2 1/4
230 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
VARIABLES ALEATORIAS DISCRETAS
Suponga que el experimento se repite un gran número de veces, por ejemplo n = 4 000 000
de veces. Intuitivamente, se esperarı́a observar alrededor de un millón de ceros, dos millones de
números 1 y un millón de números dos. Entonces el valor promedio de X serı́a igual a
Observe que el primer término de esta suma es (0)p(0), el segundo es igual a (1)p(1) y el tercero
es (2)p(2). El valor promedio de X, entonces, es
2
X 1 2
xp(x) = 0 + + =1
x=0
2 4
Este resultado da alguna justificación intuitiva para la definición del valor esperado de una varia-
ble aleatoria x discreta.
231 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
VARIABLES ALEATORIAS DISCRETAS
donde los elementos se suman sobre todos los valores de la variable aleatoria x.
Podrı́amos usar un argumento similar para justificar las fórmulas para la varianza poblacional
σ 2 y la desviación estándar de la población σ. Estas medidas numéricas describen la dispersión
o variabilidad de la variable aleatoria usando el “promedio” o “valor esperado” del cuadrado de
las desviaciones de los valores x desde su media µ.
Varianza
Sea x una variable aleatoria discreta con distribución de probabilidad p(x) y media µ. La va-
rianza de x es X
σ 2 = V(x) = E[(x − µ)2 ] = (x − µ)2 p(x)
x
donde la sumatoria es sobre todos los valores de la variable aleatoria X. La desviación estándar
σ de una variable aleatoria x es igual a la raı́z cuadrada positiva de su varianza.
232 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
VARIABLES ALEATORIAS DISCRETAS
en tanto
X
σ2 = (x − µ)2 p(x)
= (0 − 1,9)2 (0,10) + (1 − 1,9)2 (0,40) + . . . + (5 − 1,9)2 (0,05) = 1,79
√ √
yσ = σ 2 = 1,79 = 1,34.
233 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
VARIABLES ALEATORIAS DISCRETAS
Entonces
X
µ = E[x] = xp(x) = C(0,98) + (−10 000 + C)(0,02) = 0
o
0,98C + 0,02C − 200 = 0
Despejando C, se obtiene C = $200. Por tanto, si la compañı́a de seguros cobró una prima
anual de $200.
235 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
VARIABLES ALEATORIAS DISCRETAS
Ejercicios
236 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
VARIABLES ALEATORIAS DISCRETAS
Ejercicios
4. Sea x igual al número observado en el tiro de buena, al azar selecciona una de las tres llaves
un solo dado balanceado. restantes. Si tampoco es la buena, al azar selec-
a) Encuentre y grafique la distribución de ciona una de las dos últimas. Cada secuencia
probabilidad para x. diferente que pueda ocurrir al seleccionar las
b) ¿Cuál es el promedio o valor esperado de llaves representa uno de un conjunto de even-
x? ¿Cuál es la desviación estándar de x? tos simples igualmente probables.
c) Localice el intervalo µ ± 2σ en el eje x a) Haga una lista de los eventos simples en
de la gráfica del inciso a). ¿Qué propor- Ω y asigne probabilidades a los eventos
ción de todas las mediciones caerı́an en simples.
este intervalo? b) Sea x igual al número de llaves con las
5. Con x represente el número de veces que un que se intenta antes de hallar la que abre
cliente va a una tienda en un periodo de una se- la puerta (x = 1, 2, 3, 4). A continua-
mana. Suponga que ésta es la distribución de ción asigne el valor apropiado de x a ca-
probabilidad de x da evento simple.
x 0 1 2 3 c) Calcule los valores de p(x) y preséntelos
en una tabla.
p(x) 0,1 0,4 0,4 0,1
7. Una compañı́a tiene cinco solicitantes para dos
Encuentre el valor esperado de x, el número puestos de trabajo: dos mujeres y tres hombres.
promedio de veces que un cliente va a la tienda. Suponga que los cinco solicitantes son igual-
6. Un llavero contiene cuatro llaves de oficina que mente calificados y que no hay preferencia pa-
son idénticas en apariencia, pero sólo una abrirá ra escoger su género. Sea x igual al número de
la puerta de su oficina. Suponga que al azar se- mujeres escogidas para ocupar los dos puestos
lecciona una llave y prueba con ella. Si no es la de trabajo. Encuentre p(x).
237 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
VARIABLES ALEATORIAS DISCRETAS
Ejercicios
8. Una pieza de equipo electrónico contiene seis 10. Dos jugadores profesionales de tenis, A y B,
chips de computadora, dos de los cuales son están programados para jugar un partido: el ga-
defectuosos. Al azar se seleccionan tres chips, nador es el primer jugador en ganar tres sets
se retiran del equipo y se inspeccionan. Sea x de un total que no puede pasar de cinco sets.
igual al número de defectos observados, don- El evento en que A gane algún set es indepen-
de x = 0, 1 o 2. Encuentre la distribución de diente del evento de que A gane cualquier otro
probabilidad para x. y la probabilidad de que A gane cualquier set
es igual a 0,6. Sea x igual al número total de
9. La experiencia del pasado ha demostrado que,
sets del partido; esto es, x = 3, 4 o 5. Encuen-
en promedio, sólo uno de cada 10 pozos pro-
tre p(x).
duce petróleo. Sea x el número de perfo-
raciones hasta el primer éxito (se encuentra
11. Una persona puede asegurar un diamante de
petróleo). Suponga que las perforaciones repre-
$50 000 por su valor total si paga una prima de
sentan eventos independientes.
D dólares. Si la probabilidad de robo en un año
a) Encuentre p(1), p(2) y p(3). determinado se calcula que es 0,01, ¿qué pri-
b) Dé una fórmula para p(x). ma debe cobrar la compañı́a de seguros si desea
c) Grafique p(x). que la ganancia esperada sea igual a $1000?
238 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
VARIABLES ALEATORIAS DISCRETAS
Ejercicios
12. La duración máxima de patente para un nue- patente para nuevos medicamentos es como se
vo medicamento es 17 años. La resta del tiem- muestra a continuación:
po requerido por la FDA para probar y apro-
a) Encuentre el número esperado de años de
bar el medicamento da la vida real de patente
vigencia de patente para un nuevo medi-
del medicamento, es decir, el tiempo que una
camento.
compañı́a tiene para recuperar costos de inves-
b) Encuentre la desviación estándar de x.
tigación y desarrollo y obtener una utilidad. Su-
ponga que la distribución de tiempo de vida de c) Encuentre la probabilidad de que x caiga
en el intervalo µ ± 2σ.
x (años) 3 4 5 6 7 8 9 10
p(x) 0,04 0,05 0,10 0,10 0,14 0,20 0,20 0,17
239 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
VARIABLES ALEATORIAS DISCRETAS
Ejercicios
13. ¿Toma usted café? Si es ası́, ¿cuántos descansos b) ¿Cuál es la probabilidad de que un perso-
para tomar café se da cuando está en el trabajo na que toma café, seleccionada al azar, se
o en la universidad? Casi todas las personas que dé más de dos descansos para tomar café
toman café se dan un poco de tiempo para to- durante el dı́a?
marlo y muchas se dan más de un descanso al c) Calcule la media y desviación estándar
dı́a para tomarlo. La siguiente tabla, adaptada para la variable aleatoria x.
de USA Today muestra la distribución de proba-
d) Encuentre la probabilidad de que x caiga
bilidad para x, el número de descansos diarios
en el intervalo µ ± 2σ.
por dı́a que se dan quienes toman café:
x 0 1 2
14. Por experiencia, una compañı́a de transporte
p(x) 0,28 0,37 0,17 sabe que el costo de entregar un paquete pe-
x 3 4 5 queño antes de 24 horas es de $14,80 (dóla-
res). La compañı́a cobra $15,50 por el envı́o
p(x) 0,12 0,05 0,01 pero garantiza la devolución del cargo si no lo
a) ¿Cuál es la probabilidad de que una per- entrega antes de 24 horas. Si la compañı́a no
sona que toma café, seleccionada al azar, hace entregas en sólo 2 % de su paqueterı́a an-
no se dé descanso para tomar café duran- tes del periodo de 24 horas, ¿cuál es la ganancia
te el dı́a? esperada por paquete?
240 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
Contenidos de la unidad
241 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
OBJETIVOS
Objetivos
Objetivo
Las variables aleatorias discretas se emplean en numerosas aplicaciones prácticas. En esta uni-
dad presentamos tres variables aleatorias discretas importantes, la binomial, la de Poisson y la
hipergeométrica. Es frecuente que estas variables aleatorias se usen para describir el número de
sucesos de un evento, especificando en un número fijo de intentos o una unidad fija de tiempo o
espacio.
242 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN BINOMIAL DE PROBABILIDAD
243 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN BINOMIAL DE PROBABILIDAD
Veamos aquı́ algunas otras situaciones semejantes al experimento de lanzar al aire una moneda:
Cada persona muestreada es análoga a lanzar al aire una moneda, pero la probabilidad de una
“cara” no es necesariamente igual a 1/2. Aun cuando estas situaciones tienen diferentes objetivos
prácticos, todas exhiben las caracterı́sticas comunes del experimento binomial.
244 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN BINOMIAL DE PROBABILIDAD
Experimento binomial
Un experimento binomial es el que tiene estas cinco caracterı́sticas:
1 El experimento consiste en n intentos idénticos.
2 Cada intento resulta en uno de dos resultados. Por falta de un mejor nombre, el resultado de
uno se llama éxito, E, y el otro se llama fracaso F .
3 La probabilidad de éxito en un solo intento es igual a p y es igual de un intento a otro. La
probabilidad de fracaso es igual a (1 − p) = q.
4 Los intentos son independientes.
5 Estamos interesados en x, el número de éxitos observado durante los n intentos para x =
0, 1, 2, . . . , n.
245 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN BINOMIAL DE PROBABILIDAD
247 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN BINOMIAL DE PROBABILIDAD
Considere la diferencia entre estos dos ejemplos. Cuando la muestra (los n intentos idénticos)
vinieron de una población grande, la probabilidad de éxito p siguió siendo más o menos la misma
de un intento a otro. Cuando el tamaño poblacional N era pequeño, la probabilidad de éxito p
cambió en forma considerable de un intento a otro, y el experimento no fue binomial.
Regla práctica
Si el tamaño muestral es grande con respecto al tamaño poblacional, en particular si n/N ≥
0,05, entonces el experimento resultante no es binomial.
En la unidad anterior, tiramos al aire dos monedas justas y construimos la distribución de pro-
babilidad para x, el número de caras, un experimento binomial con n = 2 y p = 0,5. La
distribución binomial general de probabilidad se construye en la misma forma, pero el procedi-
miento se complica cuando n se hace grande. Afortunadamente, las probabilidades p(x) siguen
un modelo general. Esto nos permite usar una sola fórmula para hallar p(x) para cualquier valor
dado de x.
248 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN BINOMIAL DE PROBABILIDAD
Las fórmulas generales para µ, σ 2 y σ dadas en la unidad anterior, se pueden usar para obtener
las siguientes fórmulas más sencillas para la media y desviación estándar binomiales.
Media: µ = np
Varianza: σ 2 = np(1 − p)
p
Desviación estándar: σ = np(1 − p)
249 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN BINOMIAL DE PROBABILIDAD
Ejemplo
Encuentre P(x = 2) para una variable aleatoria binomial con n = 10 y p = 0,10. Entonces,
P(x = 2) es la probabilidad de observar 2 éxitos y 8 fracasos en una secuencia de 10 intentos.
Se podrı́a observar 2 éxitos, seguidos de 8 fracasos consecutivos:
E, E, F, F, F, F, F, F, F, F
250 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN BINOMIAL DE PROBABILIDAD
Ejemplo
¿Preferirı́a usted tomar un examen de opción múltiple o uno de recordatorio completo? Si no
sabe nada del material, tendrá una calificación de cero en un examen de recordatorio completo
pero, si le dan cinco opciones por cada pregunta, ¡tiene al menos una probabilidad en cinco de
adivinar correctamente! Si un examen de opción múltiple contiene 100 preguntas, cada una con
cinco posibles respuestas, ¿cuál es la calificación esperada para un estudiante que está adivinando
en cada pregunta? ¿Dentro de qué lı́mites caen las calificaciones de “no lo sabe”?
251 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN BINOMIAL DE PROBABILIDAD
Ejercicios
253 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN BINOMIAL DE PROBABILIDAD
Ejercicios
7. Una empresa de investigación de mercado con- dos personas de esta población se casan. ¿Cuál
trata operadores para realizar encuestas por es la probabilidad de que ambos tengan Rh ne-
teléfono. La computadora marca al azar un gativo, lo cual hace inevitable que sus hijos ten-
número telefónico y la operadora pregunta a gan Rh negativo?
quien conteste si tiene tiempo para contestar al-
gunas preguntas. Sea x el número de llamadas 10. La preferencia por el color de un auto cambia
telefónicas hechas hasta que el primer entre- con los años y de acuerdo al modelo particular
vistado está dispuesto a contestar las preguntas que seleccione el cliente. En un año reciente,
de la operadora. ¿Es éste un experimento bino- suponga que 10 % de todos los autos de lujo
mial? Explique. que se vendieron eran negros. Si 125 autos de
ese año y tipo se selecciona al azar, encuentre
8. El sistema de seguridad de una casa está di- las siguientes probabilidades.
señado para tener un 99 % de confiabilidad.
Suponga que nueve casas equipadas con este a) Al menos cinco autos son negros.
sistema experimentan un intento de robo. En- b) A lo sumo seis autos son negros.
cuentre las probabilidades de estos eventos:
c) Más de cuatro autos son negros.
a) Al menos una de las alarmas se activó.
b) Más de siete de las alarmas se activaron. d) Exactamente cuatro autos son negros.
c) Ocho o menos alarmas se activaron. e) Entre tres y cinco autos (inclusive) son
9. En cierta población, 85 % de las personas tie- negros.
nen tipo de sangre Rh positivo. Suponga que f) Más de 20 autos son negros.
254 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN BINOMIAL DE PROBABILIDAD
Ejercicios
11. Unos registros muestran que 30 % de todos estándar de X. ¿Qué se puede decir acerca de
los pacientes ingresados en una clı́nica médica la probabilidad de que X pase de 700? (Su-
no pagan sus cuentas y que, en última instan- gerencia: Use los valores de µ y σ, junto con
cia, esas cuentas son olvidadas. Suponga que el teorema de Tchebychev, para contestar esta
n = 4 nuevos pacientes representan una se- pregunta.)
lección aleatoria de entre un gran conjunto de
13. Suponga que 10 % de los campos en una re-
prospectos de pacientes atendidos por la clı́ni-
gión agrı́cola determinada están infestados con
ca. Encuentre estas probabilidades:
la mosca blanca de la remolacha. Se seleccio-
a) Las cuentas de todos los pacientes nan 100 campos de esta región y se inspeccio-
tendrán finalmente que olvidarse. nan para ver si están infestados.
b) Una tendrá que olvidarse. a) ¿Cuál es el número promedio de campos
c) Ninguna tendrá que olvidarse. muestreados que están infestados de la
12. Considere el problema de pagos al médico del mosca blanca?
ejercicio anterior en un escenario más realista. b) ¿Dentro de qué lı́mites esperarı́a usted
De todos los pacientes ingresados a una clı́ni- hallar el número de campos infestados,
ca médica, 30 % no pagan sus cuentas y las con probabilidad aproximada de 95 %?
deudas finalmente se olvidan. Si la clı́nica tra- c) ¿Qué podrı́a usted concluir si encuentra
ta 2000 pacientes diferentes en un periodo de que X = 25 campos estuvieran infes-
un año, ¿cuál es el número medio (esperado) tados? ¿Es posible que una de las carac-
de deudas que tienen que olvidarse? Si X es el terı́sticas de un experimento binomial no
número de deudas olvidadas del grupo de 2000 se satisfaga en este experimento? Expli-
pacientes, encuentre la varianza y desviación que.
255 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN BINOMIAL DE PROBABILIDAD
Ejercicios
14. En un experimento de psicologı́a, la investiga- llones de perros con dueño en Estados Unidos
dora planea probar la preferencia de color en ra- y alrededor del 40 % de todas las familias en
tones bajo ciertas condiciones experimentales. Estados Unidos tienen al menos un perro. Su-
Ella diseña un laberinto en el que el ratón debe ponga que la cifra del 40 % es correcta y que
escoger uno de dos caminos, en color ya sea ro- 15 familias se seleccionan al azar par un estu-
jo o azul, en cada uno de 10 cruceros. Al final dio sobre propiedad de mascotas.
del laberinto, el ratón recibe una recompensa
a) ¿Cuál es la probabilidad de que exacta-
en alimento. La investigadora cuenta el número
mente ocho de las familias tenga al me-
de veces que el ratón escoge el camino rojo. Si
nos un perro?
usted fuera la investigadora, ¿cómo usarı́a esta
b) ¿Cuál es la probabilidad de que al menos
cuenta para determinar si el ratón tiene alguna
cuatro de las familias tengan al menos un
preferencia por un color?
perro?
15. Según la Sociedad protectora de animales de c) ¿Cuál es la probabilidad de que más de
Estados Unidos, hay aproximadamente 65 mi- 10 familias tengan al menos un perro?
256 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN DE PROBABILIDAD DE POISSON
Otra variable aleatoria discreta que tiene numerosas aplicaciones prácticas es la variable aleato-
ria de Poisson. Su distribución de probabilidad da un buen modelo para datos que representan
el número de sucesos de un evento especificado en una unidad determinada de tiempo o espacio.
A continuación veamos algunos ejemplos de experimentos para los cuales la variable aleatoria x
puede ser modelada por la variable aleatoria de Poisson:
En cada uno de estos ejemplos, x representa el número de eventos que ocurren en un periodo
o espacio, durante el cual se puede esperar que ocurran un promedio de µ de estos even-
tos. Las únicas suposiciones necesarias, cuando uno usa la distribución de Poisson para modelar
experimentos tales como éstos, son que las cuentas o eventos ocurren al azar e independien-
temente uno de otros. La fórmula para la distribución de probabilidad de Poisson, ası́ como su
media y varianza, se dan a continuación.
257 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN DE PROBABILIDAD DE POISSON
Distribución de Poisson
Sea µ el número promedio de veces que ocurre un evento en cierto tiempo o espacio. La proba-
bilidad de k sucesos de este evento es
µk e−µ
p(k) = P(x = k) =
k!
para valores de k = 0, 1, 2, 3, . . . La media y desviación estándar de la variable aleatoria de
Poisson x son
Media: µ
√
Desviación estándar: σ = µ
El sı́mbolo e = 2,71828 . . . se evalúa usando su calculadora cientı́fica, que debe tener una
función como ex . Para cada valor de k, se puede obtener las probabilidades individuales para la
variable aleatoria de Poisson, igual que como hicimos para la variable aleatoria binomial.
258 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN DE PROBABILIDAD DE POISSON
Ejemplo
El número promedio de accidentes de tránsito en cierto cruce de carretera es dos por semana.
Suponga que el número de accidentes sigue una distribución de Poisson con µ = 2.
1 Encuentre la probabilidad de que no haya accidentes en este cruce de carretera durante un
periodo de 1 semana.
2 Encuentre la probabilidad de que a lo sumo haya tres accidentes en esta sección de carretera
durante un periodo de 2 semanas.
259 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN DE PROBABILIDAD DE POISSON
Ejemplo (continuación)
donde
40 e−4 42 e−4
p(0) = = 0,018316 p(2) = = 0,146525
0! 2!
41 e−4 43 e−4
p(1) = = 0,073263 p(3) = = 0,195367
1! 3!
260 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN DE PROBABILIDAD DE POISSON
261 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN DE PROBABILIDAD DE POISSON
Ejemplo
Suponga que una compañı́a de seguros de vida asegura las vidas de 5000 hombres de 42 años de
edad. Si estudios actuariales muestran que la probabilidad de que cualquier hombre de 42 años
muera en un año determinado es 0,001, encuentre la probabilidad exacta de que la compañı́a
tendrá que pagar X = 4 reclamaciones durante un año determinado. Entonces, la probabilidad
exacta está dada por la distribución binomial como
5000
P(x = 4) = p(4) = (0,001)4 (0,999)4996
4
donde calcular P(x = 4) sin ayuda de una computadora serı́a muy lento, pero la distribución
de Poisson se puede usar para dar una buena aproximación para P(x = 4). Calculando µ =
np = (5000)(0,001) = 5 y sustituyendo en la fórmula para la distribución de probabilidad de
Poisson, tenemos
µ4 e−µ 54 e−5
p(4) ≈ = = 0,175
4! 4!
262 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN DE PROBABILIDAD DE POISSON
Ejemplo
Una fabricante de podadoras para el pasto compra motores de 1 hp y 2 ciclos, en lotes de 1000, a
un proveedor. Ella entonces equipa cada una de las podadoras producidas por su planta con uno
de los motores. La historia muestra que la probabilidad de que cualquier motor del proveedor
resulte no satisfactorio es 0,001. En un embarque de 1000 motores, ¿cuál es la probabilidad de
que ninguno sea defectuoso? ¿Hay tres o más? ¿Hay cuatro?
263 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN DE PROBABILIDAD DE POISSON
Ejemplo
Éste es un experimento binomial con n = 1000 y p = 0,001. El número esperado de motores
defectuosos en un embarque de n = 1000 motores es µ = np = (1000)(0,001) = 1. Como
éste es un experimento binomial con np < 7, la probabilidad de x motores defectuosos en este
embarque puede aproximarse con
e−1 0,368
p(0) ≈ = = 0,368
0! 1
e −1 0,368
p(3) ≈ = = 0,061
3! 6
e−1 0,368
p(4) ≈ = = 0,015
4! 24
264 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN DE PROBABILIDAD DE POISSON
Ejercicios
1. Sea x una variable aleatoria Poisson con media 3. Sea x una variable aleatoria binomial con n =
µ = 2. Calcule estas probabilidades: 20 y p = 0,1.
a) P(x = 0) a) Calcule P(x ≤ 2)
b) P(x = 1) b) Use la aproximación de Poisson para cal-
c) P(x > 1) cular P(x ≤ 2).
d) P(x = 5) c) Compare los resultados de los incisos a)
y b). ¿Es precisa la aproximación?
2. Sea x una variable aleatoria Poisson con media
µ = 2,5. Calcule estas probabilidades: 4. Para ilustrar qué tan bien la distribución de pro-
babilidad de Poisson aproxima la distribución
a) P(x ≥ 5) binomial de probabilidad, calcule los valores
b) P(x < 6) aproximados de Poisson para p(0) y p(1) para
c) P(x = 2) una distribución binomial de probabilidad con
d) P(1 ≤ x ≤ 4) n = 25 y p = 0,05.
265 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN DE PROBABILIDAD DE POISSON
Ejercicios
5. El mayor número de pequeños aviones de vue- de cuidados intensivos en un hospital
los cortos en aeropuertos importantes ha au- particular, en un dı́a particular, sea dos?
mentado la preocupación por la seguridad en ¿Menor o igual a dos?
el aire. Un aeropuerto de cierta región ha regis- b) ¿Es probable que x exceda de 10? Expli-
trado un promedio mensual de cinco accidentes que.
que casi ocurren en aterrizajes y despegues en
los últimos 5 años. 7. Los padres preocupados porque sus hijos son
a) Encuentre la probabilidad de que durante “propensos a accidentes” pueden estar tranqui-
un mes determinado no haya accidentes los, de acuerdo a un estudio realizado por el
que casi ocurren en aterrizajes y despe- Departamento de Pediatrı́a de la Universidad de
gues en el aeropuerto. California, San Francisco. Los niños que se le-
b) Encuentre la probabilidad de que durante sionan dos o más veces tienden a sufrir estas le-
un mes determinado haya cinco acciden- siones durante un tiempo relativamente limita-
tes que casi ocurren. do, por lo general un año o menos. Si el núme-
c) Encuentre la probabilidad de que haya al ro promedio de lesiones por año para niños en
menos cinco accidentes que casi ocurren edad escolar es de dos, ¿cuáles son las probabi-
durante un mes particular. lidades de estos eventos?
6. El número x de personas ingresadas a una uni-
dad de cuidados intensivos en un hospital par- a) Un niño sufrirá dos lesiones durante el
ticular, en un dı́a, tiene una distribución de pro- año.
babilidad de Poisson con media igual a cinco b) Un niño sufrirá dos o más lesiones duran-
personas por dı́a. te el año.
a) ¿Cuál es la probabilidad de que el núme- c) Un niño sufrirá a lo sumo una lesión du-
ro de personas ingresadas a una unidad rante el año.
266 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN DE PROBABILIDAD DE POISSON
Ejercicios
267 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN HIPERGEOMÉTRICA DE PROBABILIDAD
Supongamos que usted está seleccionando una muestra de elementos de una población y que
registra si cada elemento posee o no posee cierta caracterı́stica. Usted está registrando la tı́pica
información de “éxito” y “fracaso” que se encuentra en el experimento binomial.
Si el número de elementos de la población es grande con respecto al número en la muestra, la
probabilidad de seleccionar un éxito en un solo intento es igual a la proporción p de éxitos en
la población. Debido a que la población es grande con respecto al tamaño muestral, esta proba-
bilidad permanecerá constante (para todos los fines prácticos) de un intento a otro y el número
x de éxitos en la muestra seguirá una distribución binomial de probabilidad. No obstante, si el
número de elementos en la población es pequeño con respecto al tamaño muestral (n/N ≥ 0,5),
la probabilidad de un éxito para un intento determinado depende de los resultados de intentos
precedentes. Entonces el número x de éxitos sigue lo que se conoce como una distribución
hipergeométrica de probabilidad.
Es fácil visualizar la variable hipergeométrica aleatoria x si se considera un tazón que con-
tenga M esferas rojas y N − M esferas blancas, para un total de N esferas en el tazón. Usted
selecciona n esferas del tazón y registra x, el número de esferas rojas que vea. Si ahora define
un “éxito” como una esfera roja, tendrá un ejemplo de la variable aleatoria x hipergeométrica.
La fórmula para calcular la probabilidad de exactamente k éxitos en n intentos se da a continua-
ción.
268 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN HIPERGEOMÉTRICA DE PROBABILIDAD
Distribución hipergeométrica
Una población contiene M éxitos y N − M fracasos. La probabilidad de exactamente k éxitos
en una muestra aleatoria de tamaño n es
M N − M
k n−k
P(x = k) = N
n
para valores de k que dependen de N , M y n. La media y la varianza de una variable aleatoria
hipergeométrica son muy semejantes a las de una variable aleatoria binomial con una corrección
para el tamaño finito de población:
M
µ=n
N
2 M N −M N −n
σ =n
N N N −1
269 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN HIPERGEOMÉTRICA DE PROBABILIDAD
Ejemplo
Un recipiente tiene 12 botellas de vinos, 3 de las cuales contienen vino que se ha echado a perder.
Una muestra de 4 botellas se selecciona al azar de entre la caja.
1 Encuentre la distribución de probabilidad para x, el número de botellas de vino echado a
perder de la muestra.
2 ¿Cuáles son la media y la varianza de x?
270 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN HIPERGEOMÉTRICA DE PROBABILIDAD
Ejemplo (continuación)
Para este ejemplo, N = 12, n = 4, M = 3 y (N − M ) = 9. Entonces:
1 Los valores posibles para X son 0, 1, 2 y 3, con probabilidades
39 39
0 4 = 0,25
p(0) = p(1) = 1 3
12 12 = 0,51
4 4
39 39
271 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN HIPERGEOMÉTRICA DE PROBABILIDAD
Ejemplo
Un producto industrial particular se envı́a en lotes de 20. Se deben hacer pruebas para determinar
si un artı́culo es defectuoso; por tanto, el fabricante muestrea la producción en lugar de usar un
plan de inspección del 100 %. Un plan de muestreo construido para reducir al mı́nimo el número
de piezas defectuosas, enviadas a los clientes, exige muestrear cinco artı́culos de entre cada lote y
rechazar el lote si se observa más de una pieza defectuosa. (Si el lote es rechazado, cada artı́culo
del lote se prueba entonces.) Si un lote contiene cuatro defectuosos, ¿cual es la probabilidad de
que sea aceptado?
Sea X el número de defectuosos en la muestra. Entonces N = 20, M = 4, (N − M ) = 16 y
n = 5. El lote será rechazado si X = 2, 3 o 4. Entonces
416 416
272 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN HIPERGEOMÉTRICA DE PROBABILIDAD
Ejercicios
1. Sea x el número de éxitos observado en una 3. Un plato de dulces contiene cinco dulces azules
muestra de n = 5 artı́culos seleccionados de y tres rojos. Un niño los alcanza y selecciona
entre N = 10. Suponga que, de los N = 10 tres dulces sin verlos.
elementos, 6 eran considerados “éxitos”.
a) Encuentre la probabilidad de no observar a) ¿Cuál es la probabilidad de que haya dos
éxitos. dulces azules y uno rojo en la selección?
b) Encuentre la probabilidad de observar al
menos dos éxitos. b) ¿Cuál es la probabilidad de que todos los
c) Encuentre la probabilidad de observar dulces sean rojos?
dos éxitos. c) ¿Cuál es la probabilidad de que todos los
2. Sea x una variable aleatoria hipergeométrica dulces sean azules?
con N = 15, n = 3 y M = 4.
a) Calcule p(0), p(1), p(2) y p(3). 4. Una pieza de equipo electrónico contiene seis
2
b) Calcule µ y σ . chips de computadora, dos de los cuales están
c) ¿Qué proporción de la población de me- defectuosos. Tres chips de computadora se se-
diciones cae en el intervalo (µ ± 2σ)? leccionan para inspeccionarlos y se registra el
¿En el intervalo (µ ± 3σ)? ¿Estos re- número de los defectuosos. Encuentre la distri-
sultados concuerdan con los dados por el bución de probabilidad para x, el número de
teorema de Tchebychev? chips de computadora defectuosos.
273 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES
LA DISTRIBUCIÓN HIPERGEOMÉTRICA DE PROBABILIDAD
Ejercicios
5. Una compañı́a tiene cinco solicitantes para dos drenados, húmedos. En un intento a pequeña
puestos de trabajo: dos mujeres y tres hombres. escala antes de un experimento a gran escala
Suponga que los cinco solicitantes están igual- para determinar qué dilución del fungicida apli-
mente calificados y que no se da preferencia pa- car, cinco semillas tratadas y cinco no tratadas
ra escoger género alguno. Sea x igual al núme- se plantaron en suelo arcilloso y se registró el
ro de mujeres escogido para ocupar las dos po- número de plantas que emergieron de las semi-
siciones. llas tratadas y de las no tratadas. Suponga que la
a) Escriba la fórmula para p(x), la distribu- dilución no fue eficaz y sólo emergieron cuatro
ción de probabilidad de x. plantas. Represente con x el número de plantas
b) ¿Cuáles son la media y la varianza de esta que emergieron de semillas tratadas.
distribución? a) Encuentre la probabilidad de que x = 4.
6. Es frecuente que las semillas sean tratadas con b) Encuentre P(x ≤ 3).
un fungicida para protegerlas de ambientes mal c) Encuentre P(2 ≤ x ≤ 3).
274 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
Contenidos de la unidad
275 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
OBJETIVOS
Objetivos
Objetivo
En las unidades anteriores, usted aprendió acerca de variables aleatorias y sus distribuciones
de probabilidad. En esta unidad veremos variables aleatorias continuas y sus distribuciones de
probabilidad, ası́ como una variable aleatoria continua muy importante, la normal. Usted verá
como calcular probabilidades normales y, bajo ciertas condiciones, cómo usar la distribución
normal de probabilidad para aproximar la distribución binomial de probabilidad.
276 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
VARIABLES ALEATORIAS CONTINUAS
Cuando una variable aleatoria x es discreta, se puede asignar una probabilidad positiva a cada
uno de los valores que x pueda tomar y obtener la distribución de probabilidad para x. La su-
ma de todas las probabilidades asociada con los diferentes valores de x es 1, pero no todos los
experimentos resultan en variables aleatorias que sean discretas. Las variables aleatorias con-
tinuas, por ejemplo estaturas y pesos, lapso de vida útil de un producto en particular o un error
experimental de laboratorio, pueden tomar los infinitamente numerosos valores correspondientes
a puntos en un intervalo de una recta. Si se trata de asignar una probabilidad positiva a cada uno
de estos numerosos valores, las probabilidades ya no sumarán 1, como es el caso con variables
aleatorias discretas. Por tanto, se debe usar un método diferente para generar la distribución de
probabilidad para una variable aleatoria continua.
Supongamos que usted tiene un conjunto de mediciones en una variable aleatoria continua y que
crea un histograma de frecuencia relativa para describir la distribución de las mismas. Para un
pequeño número de mediciones, se puede usar un pequeño número de clases; entonces, a medida
que se recolecten más y más mediciones, se pueden usar más clases y reducir el ancho de clase.
El perfil del histograma cambiará ligeramente, casi todo el tiempo haciéndose cada vez más
irregular, como se muestra en la siguiente Figura. Cuando el número de mediciones se hace muy
grande y los anchos de clase se hacen muy angostos, el histograma de frecuencia relativa aparece
cada vez más como la curva suave que aparece en la siguiente Figura (panel inferior derecho).
Esta curva suave describe la distribución de probabilidad de la variable aleatoria continua.
277 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
VARIABLES ALEATORIAS CONTINUAS
Figura: Histograma de frecuencia relativa para tamaños muestrales cada vez más crecientes.
278 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
VARIABLES ALEATORIAS CONTINUAS
279 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
VARIABLES ALEATORIAS CONTINUAS
f(x)
P(a< X <b)
a b x
Figura: La distribución de probabilidad f (x), P(a < X < b) es igual al área sombreada bajo la curva.
280 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
VARIABLES ALEATORIAS CONTINUAS
También hay una diferencia importante entre variables aleatorias discretas y continuas. Considere
la probabilidad de que x sea igual a algún valor en particular, por ejemplo a. Como no hay área
arriba de un solo punto, por ejemplo x = a, en la distribución de probabilidad para una variable
aleatoria continua, nuestra definición implica que la probabilidad es 0.
281 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
VARIABLES ALEATORIAS CONTINUAS
282 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
VARIABLES ALEATORIAS CONTINUAS
Ejemplo
La variable aleatoria uniforme se emplea para modelar el comportamiento de una variable alea-
toria continua cuyos valores estén uniforme o exactamente distribuidos en un intervalo dado. Por
ejemplo, es probable que el error x introducido al redondear una observación a la pulgada más
cercana tenga una distribución uniforme en el intervalo de −0,5 a 0,5. La función de densidad de
probabilidad f (x) serı́a “plana” como se muestra en la siguiente Figura. La altura del rectángulo
está fija en 1, de modo que el área total bajo la distribución de probabilidad es 1. ¿Cuál es la
probabilidad de que el error de redondeo sea menor a 0,2 en magnitud?
Solución: Esta probabilidad corresponde al área bajo la distribución entre x = −0,2 y x = 0,2.
Como la altura del rectángulo es 1,
283 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
VARIABLES ALEATORIAS CONTINUAS
f(x)
0
−0.5 −0.2 0 0.2 0.5 x
284 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
VARIABLES ALEATORIAS CONTINUAS
Ejemplo
La variable aleatoria exponencial se utiliza para modelar variables aleatorias continuas tales
como tiempos de espera o vidas útiles asociadas con componentes electrónicos. Por ejemplo, el
tiempo de espera en una caja de pago de un supermercado tiene una distribución exponencial con
un tiempo de espera promedio de 5 minutos. La función de densidad de probabilidad
1 −x/5
f (x) = e ,x>0
5
se ilustra en la siguiente Figura. Para hallar áreas bajo esta curva, se puede usar el hecho de que
P(x > a) = e−a/5 para a > 0. ¿Cuál es la probabilidad de que usted tenga que esperar 10
minutos o más en la caja de pago del supermercado?
Solución: La probabilidad a calcular es el área sombreada en la siguiente Figura. Use la fórmula
general para P(x > a) para hallar
285 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
VARIABLES ALEATORIAS CONTINUAS
f(x)
0.2
0.1
0
0 5 10 15 20 x
286 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
VARIABLES ALEATORIAS CONTINUAS
Su modelo puede no siempre se ajustara perfectamente la situación experimental, pero debe tratar
de escoger un modelo que mejor se ajuste al histograma de frecuencia relativa poblacional.
Cuanto mejor se aproxime el modelo a la realidad, mejores serán las inferencia. Por fortuna, mu-
chas variables aleatorias continuas tienen distribuciones de frecuencia de forma de campana, por
ejemplo los datos de la Figura al inicio de esta unidad. La distribución normal de probabilidad
da un buen modelo para describir este tipo de datos.
287 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
Las distribuciones de probabilidad continua puede tomar varias formas, pero un gran número
de variables aleatorias observadas en la naturaleza poseen una distribución de frecuencia que
tiene más o menos la forma de campana, o bien, como dirı́a un estadı́stico, es aproximadamente
una distribución normal de probabilidad. La fórmula que genera esta distribución se muestra a
continuación.
Distribución normal
(x−µ) 2
1 −
f (x) = √ e 2σ 2 , −∞ < x < ∞
σ 2π
Los sı́mbolos e y π son constantes matemáticas dadas en forma aproximada por 2,7183 y
3,1416, respectivamente; µ y σ (σ > 0) son parámetros que representan la media poblacio-
nal y desviación estándar, respectivamente.
288 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
f(x)
0
µ−σ µ µ+σ x
289 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
290 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
f(x)
0
0 x
291 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
Para hallar la probabilidad de que una variable aleatoria normal x se encuentre en el intervalo
de a a b, necesitamos hallar el área bajo la curva normal entre los puntos a y b. No obstante,
hay un número infinito de distribuciones normales, uno para cada media y desviación estándar
diferentes. Una tabla separada de áreas para cada una de estas curvas es obviamente impráctica;
en cambio, usamos un procedimiento de estandarización que nos permite usar la misma tabla
para todas las distribuciones normales.
Una variable aleatoria normal x está estandarizada al expresar su valor como el número de
desviaciones estándar (σ) que se encuentran a la izquierda o derecha de su media µ. Éste es
realmente sólo un cambio en las unidades de medida que usamos, como si estuviéramos midiendo
en pulgadas en lugar de centı́metros. La variable aleatoria normal estandarizada, z, se define
como
x−µ
z=
σ
o bien, lo que es equivalente,
x = µ + σz
292 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
f(x)
0
(−) 0 z0 (+) x
293 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
El área bajo la curva normal estándar a la izquierda de un valor especificado de z, por ejemplo
z0 , es la probabilidad P(z ≤ z0 ). Esta área acumulada esta registrada en la “Tabla normal
estándar” (al final del documento) y se muestra como el área sombreada en la Figura anterior.
Una versión abreviada de la Tabla se da a continuación.
Observe que la Tabla contiene valores positivos y negativos de z. La columna izquierda de la
Tabla da el valor de z correcto al décimo lugar; el segundo lugar decimal para z, corresponde a
las centenas, se da en la fila superior.
294 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
−2,9 0,0019 · · ·
−2,8 0,0026 · · ·
−2,7 0,0035 · · ·
−2,6 0,0047
−2,5 0,0062
·
·
−2,0 0,0228
·
·
0,0 0,5000 0,5040 0,5080 0,5120
0,1 0,5398 0,5438 0,5478 0,5517
0,2 0,5793 0,5832 0,5871 0,5910
0,3 0,6179 0,6217 0,6255 0,6293
0,4 0,6554 0,6591 0,6628 0,6700 ··· 0,6879
0,5 0,6915 · · ·
0,6 0,7257 · · ·
0,9 0,8159
·
·
2,0 0,9772
·
·
295 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
Ejemplo
Encuentre P(z ≤ 1,63). Esta probabilidad corresponde al área a la izquierda de un punto z =
1,63 desviaciones estándar a la derecha de la media (véase la siguiente Figura).
Solución: El área está sombreada en la siguiente Figura. Como la “Tabla normal estándar” da
áreas bajo la curva normal a la izquierda de un valor especificado de z, sólo se necesita hallar
el valor tabulado para z = 1,63. Baje por la columna izquierda de la Tabla hasta z = 1,6 y en
sentido horizontal en la parte superior de la Tabla hasta la columna marcada 0,03. La intersección
de esta combinación de fila y columna da el área 0,9484, que es P(z ≤ 1,63).
296 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
f(z)
0.9484
0
0 1.63 z
297 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
Ejemplo
Encuentre P(z ≥ −0,5). Esta probabilidad corresponde al área a la derecha de un punto z =
−0,5 de desviación estándar a la izquierda de la media (véase la siguiente Figura).
Solución: El área dada en la Tabla, es el área a la izquierda de un valor especificado de z.
Haciendo un ı́ndice de z = −0,5 en la Tabla, podemos hallar que el área A1 a la izquierda de
−0,5 es 0,3085.
Como el área bajo la curva es 1, encontramos
298 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
f(z)
A1 = 0.3085
0
−0.5 z
299 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
Ejemplo
Encuentre P(−0,5 ≤ z ≤ 1,0). Esta probabilidad es el área entre z = −0,5 y z = 10, como
se muestra en la siguiente Figura.
Solución: El área pedida es el área sombreada A2 en la siguiente Figura. De la “Tabla normal
estándar”, se puede hallar el área a la izquierda de z = −0,5 (A1 = 0,3085) y el área a la
izquierda de z = 1,0 (A1 + A2 = 0,8413). Para hallar el área marcada A2 , restamos las dos
entradas:
A2 = (A1 + A2 ) − A1 = 0,8413 − 0,3085 = 0,5328
Esto es, P(−0,5 ≤ z ≤ 1,0) = 0,5328.
300 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
f(z)
A1 = 0.3085 A2
0
−0.5 1 z
301 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
Ejemplo
Encuentre la probabilidad de que una variable aleatoria normalmente distribuida caiga dentro de
estos intervalos:
1 Una desviación estándar de su media.
2 Dos desviaciones estándar de su media.
Solución:
1 Como la variable aleatoria normal estándar z mide la distancia desde la media en unidades
de desviaciones estándar, es necesario hallar
Recuerde que usted calcula el área entre dos valores z al restar las entradas tabuladas para
los dos valores.
2 Al igual que en la parte 1, P(−2 ≤ z ≤ 2) = 0,9772 − 0,0228 = 0,9544.
Estas probabilidades concuerdan con valores aproximados de 68 % y 95 % en la Regla empı́rica
estudiada anteriormente.
302 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
Ejemplo
Encuentre el valor z, llámelo z0 , tal que 0,95 del área se encuentre a no más de ±z0 desviaciones
estándar de la media.
Solución: El área sombreada de la siguiente Figura es el área que se encuentra a no más de ±z0
desviaciones estándar de la media, que necesita ser igual a 0,95. Las “áreas de cola” bajo la curva
no están sombreadas y tiene un área combinada de 1 − 0,95 = 0,05.
Debido a la simetrı́a de la curva normal, éstas dos áreas de cola tienen la misma área, de modo
que A1 = 0,05/2 = 0,025 en la Figura. Entonces, toda el área acumulada a la izquierda de
z0 para igualar A1 + A2 = 0,95 + 0,025 = 0,9750. Esta área se encuentra en el interior
de la “Tabla normal estándar” en la fila correspondiente a z = 1,9 y la columna 0,06. En
consecuencia, z0 = 1,96.
303 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
f(z)
A2 = 0.95
A1 = 0.025
0
− z0 0 z0 z
304 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
Casi todo el tiempo, las probabilidades en las que estamos interesados contienen x, una variable
aleatoria normal con media µ y desviación estándar σ.
Entonces se debe estandarizar el intervalo de interés, escribiéndolo como el intervalo equiva-
lente en términos de z, la variable aleatoria normal estándar. Una vez hecho esto, la probabilidad
de interés es el área que se encuentra usando la distribución normal estándar.
305 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
Ejemplo
Sea x una variable aleatoria normalmente distribuida con media de 10 y una desviación estándar
de 2. Encuentre la probabilidad de que x se encuentre entre 11 y 13,6.
Solución: El intervalo de x = 11 a x = 13,6 debe ser estandarizado usando la fórmula para z.
Cuando x = 11,
x−µ 11 − 10
z= = = 0,5
σ 2
y cuando x = 13,6,
x−µ 13,6 − 10
z= = = 1,8
σ 2
La probabilidad deseada es, por tanto, P(0,5 ≤ z ≤ 1,8), el área que está entre z = 0,5 y
z = 1,8. De la “Tabla normal estándar”, se encuentra que el área a la izquierda de z = 0,5 es
0,6915, y el área a la izquierda de z = 1,8 es 0,9641. La probabilidad deseada es la diferencia
entre estas dos probabilidades, es decir,
306 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
Ejemplo
Estudios realizados demuestran que el uso de gasolina para autos compactos vendidos en Chile
está normalmente distribuido, con media de 10,8 km/lt y una desviación estándar de 1,91 km/lt.
¿Qué porcentaje de compactos recorre 13 km/lt o más?
Solución: Para resolver este problema, primero se debe hallar el valor z correspondiente a x =
13. Sustituyendo en la fórmula para z, resulta
x−µ 13 − 10,8
z= = = 1,15
σ 1,91
100(0,1251) = 12,51 %
307 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
El nuevo auto compacto del fabricante debe recorrer 13,94 km/lt para superar 95 % de los autos
compactos actualmente disponibles en el mercado en Chile.
308 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
Ejercicios
309 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
Ejercicios
a) x > 13,5 14. Una variable aleatoria normal x tiene una me-
b) x < 8,2 dia de 50 y desviación estándar 10. ¿Serı́a po-
c) 9,4 < x < 10,6 co común ver el valor x = 0? Explique su
respuesta.
11. Una variable aleatoria normal x tiene media
µ = 1,20 y desviación estándar σ = 0,15. 15. Una variable aleatoria normal x tiene una me-
Encuentre las probabilidades de estos valores dia y desviación estándar desconocidas. La pro-
x: babilidad de que x exceda de 4 es 0,9772 y la
probabilidad de que x exceda de 5 es 0,9332.
a) 1,00 < x < 1,10 Encuentre µ y σ.
310 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
Ejercicios
311 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
Ejercicios
19. Para un auto que corre a 30 millas por hora nas tiene una media igual a 1200 libras y una
(mph), la distancia necesaria de frenado hasta desviación estándar de 99 libras. ¿Cuál es la
detenerse por completo está normalmente dis- probabilidad de que el peso total de ocho perso-
tribuida con media de 50 pies y desviación nas exceda de 1300 libras? ¿Y de 1500 libras?
estándar de 8 pies. Suponga que usted está via- (Suponga que la distribución de probabilidad es
jando a 30 mph en una zona residencial y un aproximadamente normal.)
auto se mueve en forma abrupta en el camino
21. La descarga de sólidos suspendidos desde una
de usted, a una distancia de 60 pies.
mina de fosfato está normalmente distribuida,
a) Si usted aplica los frenos, ¿cuál es la pro- con una descarga media diaria de 27 miligra-
babilidad de que frene hasta detenerse en mos por litro (mg/lt) y una desviación estándar
no más de 40 pies o menos? ¿Y en no de 14 mg/lt. ¿Qué proporción de dı́as excederá
más de 50 pies o menos? de 50 mg/lt la descarga diaria?
b) Si la única forma de evitar una colisión
22. El número de veces x que un humano adulto
es frenar hasta detenerse por completo,
respira por minuto, cuando está en reposo, de-
¿cuál es la probabilidad de que evite la
pende de su edad y varı́a en gran medida de una
colisión?
persona a otra. Suponga que la distribución de
20. Supongamos que usted debe establecer reglas probabilidad para x es aproximadamente nor-
respecto al número máximo de personas que mal, con la media igual a 16 y la desviación
pueden ocupar un elevador. Un estudio de luga- estándar igual a 4. Si una persona se selecciona
res ocupados en un elevador indica que si ocho al azar y se registra el número x de respiracio-
personas ocupan el elevador, la distribución de nes por minuto cuando está en reposo, ¿cuál es
probabilidad del peso total de las ocho perso- la probabilidad de que x exceda de 22?
312 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
Ejercicios
23. Un método para llegar a pronósticos económi- dia de $85 (dólares) y una desviación estándar
cos es usar una propuesta de consensos. Se ob- de $20. Un comprador se selecciona al azar un
tiene un pronóstico de cada uno de un núme- domingo entre las 4 p.m. y las 6 p.m. y se le
ro grande de analistas y el promedio de es- pregunta sobre su forma de gastar.
tos pronósticos individuales es el pronóstico
a) ¿Cuál es la probabilidad de que él haya
de consenso. Suponga que los pronósticos in-
gastado más de $95 en el centro comer-
dividuales de la tasa de interés preferente de
cial? ¿Cuál es la probabilidad de que él
enero de 2008, hechos por analistas económi-
haya gastado entre $95 y $115 en el cen-
cos, están normalmente distribuidos en forma
tro comercial?
aproximada con la media igual a 8,5 % y una
b) Si dos compradores se seleccionan al
desviación estándar igual a ,02 %. Si al azar
azar, ¿Cuál es la probabilidad de que am-
se selecciona un solo analista de entre este gru-
bos compradores hayan gastado más de
po, ¿cuál es la probabilidad de que el pronósti-
$115 en el centro comercial?
co del analista de la tasa preferente tome es-
tos valores? Rebase de 8,75 %. Y sea menor a 25. La frecuencia de pulsaciones es una medida del
8,375 %. número de pulsaciones del corazón en un mi-
nuto. Suponga que estas frecuencias de pulsa-
24. Un artı́culo dice que más del doble de com- ciones están distribuidas normalmente en for-
pradores salen de compras los fines de sema- ma aproximada, con una media de 78 y una
na que durante la semana. No sólo eso, porque desviación estándar de 12.
esos compradores también gastan más dinero
en sus compras en sábados y domingos. Supon- a) ¿Qué proporción de adultos tendrá fre-
ga que la cantidad de dinero gastada en centros cuencias de pulsaciones entre 60 y 100?
comerciales, entre las 4 p.m. y las 6 p.m. los do- b) ¿Cuál es el 95avo percentil para las fre-
mingos tiene una distribución normal con me- cuencias de pulsaciones de adultos?
313 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
APROXIMACIÓN NORMAL A LA DISTRIBUCIÓN BINOMIAL
314 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
APROXIMACIÓN NORMAL A LA DISTRIBUCIÓN BINOMIAL
Como la distribución normal es continua, el área bajo la curva en cualquier punto individual es
igual a 0. Recuerde que este resultado se aplica sólo a variables aleatorias continuas. Como la
variable aleatoria binomial x es una variable aleatoria discreta, la probabilidad de que x tome
algún valor especı́fico, por ejemplo x = 11, no necesariamente será igual a 0.
La siguientes Figuras muestran los histogramas binomiales de probabilidad para n = 25 con
p = 0,5 y p = 0,1, respectivamente. La distribución de la primera Figura es exactamente
simétrica.
315 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
APROXIMACIÓN NORMAL A LA DISTRIBUCIÓN BINOMIAL
p(x)
0
0 5 7.5 10.5 20 x
Figura: Distribución binomial con n = 25 y p = 0,5 y la distribución normal de aproximación con media
µ = 12,5 y desviación estándar σ = 2,5.
316 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
APROXIMACIÓN NORMAL A LA DISTRIBUCIÓN BINOMIAL
p(x)
0 5 10 20 x
317 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
APROXIMACIÓN NORMAL A LA DISTRIBUCIÓN BINOMIAL
Usted debe tener cuidado de no excluir los extremos, cuando use la aproximación normal a la
distribución binomial. Este ajuste, llamado corrección de continuidad, ayuda a considerar el
hecho de que usted se aproxima a una variable aleatoria discreta con una variable aleatoria
continua. Si la corrección, su aproximación no será muy buena. Use esta corrección sólo para
probabilidades binomiales; no trate de usarla cuando la variable aleatoria ya sea continua.
¿Cómo saber cuándo es apropiado usar la aproximación normal a probabilidades binomiales?
La aproximación normal funciona bien cuando el histograma binomial es casi simétrico. Esto
ocurre cuando la distribución binomial no está “agrupada” cerca de 0 o n, es decir, cuando se
puede dispersar al menos dos desviaciones estándar desde su media sin exceder sus lı́mites, 0 y
n. Usando este criterio, se puede deducir esta sencilla regla práctica:
Regla práctica
La aproximación normal a las probabilidades binomiales será adecuada si
318 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
APROXIMACIÓN NORMAL A LA DISTRIBUCIÓN BINOMIAL
319 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
APROXIMACIÓN NORMAL A LA DISTRIBUCIÓN BINOMIAL
Ejemplo
La confiabilidad de un fusible eléctrico es la probabilidad de que un fusible, escogido al azar de
la producción, funcione bajo sus condiciones de diseño. Una muestra aleatoria de 1000 fusibles
se probó y se observaron x = 27 defectuosos. Calcule la probabilidad aproximada de observar
27 o más defectuosos, suponiendo que la confiabilidad de un fusible es 0,98.
Solución: La probabilidad de observar uno defectuoso cuando un solo fusible se prueba es p =
0,02, dado que la confiabilidad del fusible es 0,98. Entonces
p
µ = np = 20 σ = np(1 − p) = 4,43
np = 20 y n(1 − p) = 980
son mayores a 5.
320 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
APROXIMACIÓN NORMAL A LA DISTRIBUCIÓN BINOMIAL
Ejemplo (continuación)
El área normal empleada para aproximar P(x ≥ 27) es el área bajo la curva normal a la dere-
cha de 26,5, de modo que todo el rectángulo para x = 27 está incluido. Entonces, el valor z
correspondiente a x = 26,5 es
x−µ 26,5 − 20
z= = = 1,47
σ 4,43
y el área a la izquierda de z = 1,47 es 0,9292. Como el área total bajo la curva es 1, tenemos
321 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
APROXIMACIÓN NORMAL A LA DISTRIBUCIÓN BINOMIAL
Ejemplo
Una productora de bebidas gaseosas estaba completamente segura de que su marca tenı́a 10 % de
participación en el marcado. En un estudio de mercado que comprendı́a 2500 consumidores de
bebidas gaseosas, x = 211 expresaron una preferencia por la marca de ella. Si la cifra de 10 %
es correcta, encuentre la probabilidad de observar 211 o menos consumidores que prefieren la
marca de bebidas gaseosas de ella.
Solución: Si la productora tiene razón, entonces la probabilidad de que un consumidor prefiera
la marca de bebidas gaseosas de ella es p = 0,10. Entonces
p
µ = np = 250 σ = np(1 − p) = 15
La aproximación normal a esta probabilidad es el área a la izquierda de 211,5 bajo una curva
normal con una media de 250 y una desviación estándar de 15.
322 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
APROXIMACIÓN NORMAL A LA DISTRIBUCIÓN BINOMIAL
Ejemplo (continuación)
Primero calculamos
x−µ 211,5 − 250
z= = = −2,57
σ 15
Entonces
P(x ≤ 211) ≈ P(z ≤ −2,57) = 0,0051
La probabilidad de observar un valor de muestra de 211 o menos cuando p = 0,10 es tan
pequeña que se puede concluir que una de dos cosas ha ocurrido: o se ha observado una muestra
poco común aun cuando en realidad p = 0,10, o bien la muestra refleja que el valor real de p es
menor a 0,10 y quizá más cercana a la proporción muestral observada, 211/2500 = 0,08.
323 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
APROXIMACIÓN NORMAL A LA DISTRIBUCIÓN BINOMIAL
Ejercicios
324 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
APROXIMACIÓN NORMAL A LA DISTRIBUCIÓN BINOMIAL
Ejercicios
325 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
APROXIMACIÓN NORMAL A LA DISTRIBUCIÓN BINOMIAL
Ejercicios
326 / 327
PROBABILIDAD Y ESTADÍSTICA – 2018
LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD
APROXIMACIÓN NORMAL A LA DISTRIBUCIÓN BINOMIAL
Ejercicios
14. El artı́culo de la revista Time (ejercicio anterior) esta proporción es cercana a la probabilidad de
también informó que 80 % de hombres y 62 % que una persona seleccionada al azar indica una
de mujeres emplean más de 40 horas a la sema- preferencia por un producto Pepsi cuando esco-
na en el trabajo. Suponga que estos porcentajes ge una gaseosa.
son correctos para todas las personas y que se
selecciona una muestra aleatoria de 50 mujeres Gaseosa Participación
trabajadoras. PepsiCo 26 %
a) ¿Cuál es el número promedio de mujeres Coca-Cola 24 %
que emplean más de 40 horas a la sema- Marca privada 14 %
na en el trabajo? Cadbury Schweppes 10 %
b) ¿Cuál es la desviación estándar para el Nestle 6%
número de mujeres que emplean más de Otros 20 %
40 horas a la semana en el trabajo?
Se selecciona al azar un grupo de 500 consu-
c) Suponga que en nuestra muestra de 50
midores. Use la curva normal para aproximar
mujeres trabajadoras hay 25 que trabajan
las siguientes probabilidades binomiales:
más de 40 horas a la semana. ¿Considera
usted que esto es un suceso poco común? a) Entre 120 y 150 consumidores (inclusi-
15. Dos de los principales rivales en bebidas gaseo- ve) prefieren un producto Pepsi.
sas, Pepsi y Coca-Cola, están muy preocupa- b) Menos de 150 consumidores prefieren
dos de su participación en el mercado. Los si- un producto Pepsi.
guientes datos, que apareció en el sitio web de c) ¿Serı́a poco común hallar que 232 de los
la compañı́a en noviembre de 2006, dice que la 500 consumidores prefieran un producto
participación de Pepsi-Cola en el mercado esta- Pepsi? Si esto ocurriera, ¿qué conclusio-
dounidense de refrescos es 26 %. Suponga que nes sacarı́a usted?
327 / 327