Texto Guia ES1 (A y B) 2022-II Prof. Hugo Agurto
Texto Guia ES1 (A y B) 2022-II Prof. Hugo Agurto
Texto Guia ES1 (A y B) 2022-II Prof. Hugo Agurto
UD
EMPRESARIALES-CAMPUS LIMA
-L
PROGRAMA:
S
PU
ADMINISTRACIÓN DE EMPRESAS
M
CA
ASIGNATURA:
ESTADÍSTICA 1
CAPÍTULOS: 1, 2, 3, 4, 5, 6 y 7
E
PROFESOR:
AD
LIMA - PERÚ
22
2022
20
Índice general
EP
Índice de figuras VI
UD
Índice de tablas IX
1. Introducción a la estadı́stica 1
1.1. Definición de Estadı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
A
1.2. Estadı́stica Descriptiva y Estadı́stica Inferencial . . . . . . . . . . . . . . . . . 2
IM
2. Estadı́stica descriptiva 35
2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.2. Estadı́stica descriptiva:Técnicas tabulares y gráficas . . . . . . . . . . . . . . 35
2.2.1. Resumen de datos cualitativos . . . . . . . . . . . . . . . . . . . . . . 35
2.2.1.1. Tabla de frecuencias . . . . . . . . . . . . . . . . . . . . . . . 35
2.2.1.2. Diagrama de barras y gráfica de pastel . . . . . . . . . . . . 36
2.2.1.3. Diagrama de Pareto. . . . . . . . . . . . . . . . . . . . . . . . 37
2.2.2. Resumen de datos cuantitativos . . . . . . . . . . . . . . . . . . . . . . 40
E
AD
que” . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
22
ii
ÍNDICE GENERAL iii
2.3.5.5. Puntuaciones z . . . . . . . . . . . . . . . . . . . . . . . . . . 67
S
PU
discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
20
A. Tablas 303
A.1. Tabla de números aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
A.2. Tabla: Probabilidades Binomiales . . . . . . . . . . . . . . . . . . . . . . . . . 305
A.3. Tabla: Probabilidades de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . 311
A.4. Distribución normal estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . 317
A.5. Distribución t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318
EP
Bibliografı́a 321
UD
A
IM
S -L
PU
M
CA
E
AD
-I I
22
20
Índice de figuras
3.3. Diagrama de árbol del lanzamiento de dos monedas o de lanzar una moneda
dos veces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
3.4. Partición del espacio muestral S . . . . . . . . . . . . . . . . . . . . . . . . . . 123
3.5. Partición del aula en alumnos de segundo año, cuarto año y graduados . . . . 124
3.6. Diagrama de árbol para problema de clase de estadı́stica avanzada . . . . . . 125
3.7. Diagrama de árbol para problema de urnas A, B y C . . . . . . . . . . . . . . 125
cargado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
20
vi
ÍNDICE DE FIGURAS vii
5.10. Ilustración del cálculo de probabilidades con la tabla de áreas bajo la curva
UD
205
5.14. Ilustración del cálculo de P (X < 1) para X ∼ N (1.5, 0.252 ). . . . . . . . . . 206
-L
5.16. Ilustración del cálculo de a) P (24 < X < 54) y b) P (X > 39) para X ∼
N (45, 122 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
M
crédito. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
AD
5.22. Función de densidad de X con distribución uniforme en el intervalo [a, b]. . . 215
5.23. Función de distribución acumulada de una variable aleatoria X con distribu-
ción uniforme en el intervalo [a, b]. . . . . . . . . . . . . . . . . . . . . . . . . 216
5.24. Función de densidad de X con distribución exponencial con parámetro λ = 0.5.218
5.25. Función de de distribución acumulada de la variable X con distribución
exponencial con parámetro λ = 0.5. . . . . . . . . . . . . . . . . . . . . . . . . 218
6.2. Distribución de probabilidad de las medias muestrales del ejemplo dado. . . . 248
20
6.3. Aplicación del Teorema del lı́mite Central para diferentes poblaciones.(Lind
et al., 2012) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
6.4. Ilustración del cálculo de P X > 181 para X ∼ N 178, 22 . . . . . . . . . . 252
6.5. Ilustración del cálculo de P 175 < X < 181 para X ∼ N 178, 22 . . . . . . 253
ÍNDICE DE FIGURAS viii
6.6. Ilustración del cálculo de P X < 58 para X ∼ N 60, 1.52 . . . . . . . . . . 255
6.7. Ilustración del cálculo de P 57 < X < 63 para X ∼ N 60, 1.52 . . . . . . . 256
6.8. Ilustración del cálculo de P (p > 0.50) para p ∼ N 0.52, 0.0292 . . . . . . . . 260
6.9. Ilustración del cálculo de P (0.15 < p < 0.25) para p ∼ N 0.20, 0.042 . . . . . 262
6.10. Ilustración de P (p1 < p < p2 ) = 0.95 . . . . . . . . . . . . . . . . . . . . . . . 262
6.11. Ilustración de P (p1 < p < p2 ) = 0.95 y definición de Z2 = 1.96 y por simetrı́a
Z1 = −1.96 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
A
IM
S -L
PU
M
CA
E
AD
-I I
22
20
Índice de tablas
sobre el capital. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3. Número seleccionado de una muestra aleatoria estratificada proporcional. . . 12
2.3. Distribución de frecuencias del número de palabras leı́das por 120 disléxicos. . 41
-L
Plaza Lima. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
CA
y x=0,1,2,3,4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
4.5. Valores seleccionados de la tabla de probabilidad de Poisson para λ = 6 y
x=0,1,2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
7.1. Valores de “Z” para los niveles de confianza de uso común. . . . . . . . . . . 274
7.2. Extracto de la Tabla de Distribución t. En el Apéndice A.5 aparece una versión
más extensa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285
ix
ÍNDICE DE TABLAS x
7.3. Resumen de casos para realizar la estimación de intervalo para una media
poblacional (µ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
EP
UD
A
IM
S -L
PU
M
CA
E
AD
-I I
22
20
Capı́tulo 1
Introducción a la estadı́stica
EP
UD
Trabajo (OIT).
En nuestro dı́a a dı́a es común relacionar la estadı́stica con información numérica que
resume o explica determinado contexto económico, social, etc; o también con conjuntos de
-I I
medidas o respuestas). La Estadı́stica debe ser comprendida como una ciencia y como tal
20
1
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 2
obtener las conclusiones sobre la población siempre exista una pequeña probabilidad
S
Para comenzar a estudiar estadı́stica primero es necesario definir y tener claro algunos
términos básicos (Johnson y Kuby, 2008):
Debido a que las poblaciones suelen ser muy grandes, un objetivo común del uso de la
estadı́stica es obtener datos de una muestra para estudiarlos y emplear los resultados
para sacar una conclusión acerca de la población de la cual se extrajo la muestra.
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 3
valor puede ser un número, una palabra o un sı́mbolo. Por ejemplo, Roberto Jiménez
que labora en una empresa tiene 35 años, su estado civil es casado, mide 1.70 m y pesa
76 kg. Estas cuatro piezas de datos son los valores de las cuatro variables aplicadas a
Roberto Jiménez.
A
IM
5. Datos: Conjunto de valores recolectados para la variable de cada uno de los elementos
-L
experimento incluye las actividades para seleccionar los elementos y obtener los valores
de los datos.
7. Parámetro: Es una medida de resumen que describe una caracterı́stica de toda una
población (o un valor numérico que resume o describe a todos los datos de una
población). Por ejemplo, la edad promedio de los estudiantes universitarios en el Perú
o la proporción de votantes que apoyarán al candidato del partido A en las próximas
elecciones, son ejemplos de dos parámetros poblacionales. A menudo se utiliza una
letra griega para simbolizar la denominación de un parámetro. Estos sı́mbolos serán
E
asignados a medida que se estudien los parámetros más adelante (por ejemplo: µ
AD
8. Estadı́stico: Es una medida de resumen que se calcula para describir una caracterı́stica
de una muestra (o un valor numérico que resume o describe a todos los datos de una
muestra). Por ejemplo, la estatura promedio encontrada al utilizar el conjunto de 30
-I I
que apoyarán al candidato del partido A en las próximas elecciones son ejemplos de
20
estadı́sticos. Casi todos los estadı́sticos se determinan con ayuda de fórmulas y suele
asignárseles denominaciones simbólicas usando letras del alfabeto español (por ejemplo:
x, se emplea para simbolizar el promedio en una muestra; “s” para la desviación
estándar en una muestra, etc.)
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 4
2. Una muestra es cualquier subconjunto de esa población. Por ejemplo, una muestra
podrı́an ser los automóviles que pertenecen a los profesores del programa de
administración de empresas.
EP
UD
. . . , etc.).
-L
S
6. El experimento serı́an los métodos aplicados para seleccionar los automóviles que
PU
o de otras formas.
valor promedio de “todos los autos que pertenecen al cuerpo docente de la universidad” no
cambiarı́a. Esto ayuda a entender que el valor de los parámetros es fijo, mientras que el de
los estadı́sticos varı́a.
Ejercicio. 36 % de la población adulta en el Perú padece una alergia. En una muestra de
1200 adultos se encontró que 32 % tiene una alergia. Describa cada uno de los ocho términos.
1.4. Tipos de Variables
Continuando con los conceptos, veamos la clasificación de las variables según su
-I I
{60kg, 64kg, 65kg, 70kg} y {40 soles, 55 soles, 65 soles, 70 soles}. Por ejemplo, para
-L
operaciones aritméticas, como sumar y promediar, tienen sentido para datos que
M
Cada uno de estos tipos de variables (cualitativas y cuantitativas) puede subdividirse aún
más, como se aprecia a continuación:
E
AD
ambas, sus valores son cualidades o atributos que no tienen un orden o jerarquı́a entre
sı́.
aislados a lo largo de un intervalo o rango. Es decir, entre dos valores cualesquiera hay
UD
un “hueco”.
Variable Continua: Variable cuantitativa que puede asumir una cantidad incontable
de valores. Esta variable produce respuestas numéricas que surgen de una medición.
A
Intuitivamente, la variable continua puede asumir cualquier valor a lo largo de un
IM
intervalo o rango, incluyendo cualquier valor posible entre dos valores cualesquiera.
-L
Como se ha comentado en muchos casos es posible distinguir los dos tipos de variables
S
PU
decidiendo si las variables están relacionadas con un conteo o con una medición. La variable
“número de cursos en los que un alumno está matriculado actualmente” es un ejemplo de
M
contar, no es posible que ocurran valores fraccionarios. Otros ejemplos son: el número de hijos
de una familia, número de televisores vendidos en una semana, número de clientes atendidos
en una hora, etc. La variable “peso de un cargamento” o “la estatura de una persona” son
ejemplos de variables aleatorias continuas pues los valores se encuentran midiendo el peso o
la estatura. Al medir, puede ocurrir cualquier valor en un rango continuo o intervalo, según la
precisión del instrumento de medición. Por ejemplo, la estatura de una persona puede ser 167
cms, 167,5 cms, 167,58 cms o 167,584 cms, dependiendo de la precisión de los instrumentos
que están disponibles. En teorı́a, dos personas no podrı́an tener exactamente la misma
E
estatura, porque cuanto más refinado es el instrumento de medición que se utiliza, aumenta la
AD
posibilidad de detectar la diferencia entre las mediciones. Sin embargo, la mayor parte de los
dispositivos de medición no tienen la precisión suficiente para detectar pequeñas diferencias.
Por tanto, muchas veces se obtienen observaciones empatadas en los datos experimentales o
en encuestas, aun cuando la variable aleatoria es en realidad continua.
Cuando intente determinar si una variable es continua o discreta, recuerde analizar la
variable y piense en los valores que podrı́a ocurrir. No considere los valores de los datos que
se han registrado; pueden ser engañosos.
Considere la variable “calificación asignada por un juez” en una competencia de patinaje
-I I
artı́stico. Si se consideran algunas calificaciones que ya han sido asignadas: 9.9; 9.5; 8.8;
22
10.0, y observa la presencia de cifras decimales, podrı́a pensarse que todas las fracciones son
20
posibles y concluir que la variable es continua. Sin embargo, esto no es cierto. Una calificación
de 9.134 no es posible; ası́, entre los valores posibles hay huecos y la variable es discreta.
NOTA: No deje que la apariencia de los datos lo engañe respecto a su tipo. Las variables
cualitativas no siempre son fáciles de reconocer. Algunas veces se presentan como números.
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 7
La muestra anterior de distrito donde vive puede codificarse como: 1= San Borja, 2=Santiago
de Surco, 3 = Miraflores. Los datos de la muestra se verı́an como 1, 2, 3, 1, aunque siguen
siendo datos de atributos. Calcular el “distrito promedio” [(1+2+3+1)/4=1.75] carece de
sentido. Los distritos de residencia pueden identificarse usando códigos postales. El código
postal promedio tampoco tiene sentido; en consecuencia, el código postal también serı́a una
variable cualitativa.
Otro ejemplo de información engañosa es un número de identificación. Por ejemplo, el
DNI, número de vuelo: 256, número de cuenta de ahorros, parecen ser datos numéricos. El
256 no describe ninguna propiedad del vuelo: si está retrasado o a tiempo, la calidad del
EP
refrigerio servido, el número de pasajeros o cualquier cosa sobre el vuelo. El número solo
UD
identifica un vuelo especı́fico. Los números de licencias de conducir, DNI, seguro social, las
cuentas bancarias, son todos, números de identificación y por sı́ mismos no funcionan como
variables cuantitativas, si no como cualitativas.
Recuerde revisar la variable individual y un dato individual, y ası́ tendrá poca dificultad
A
IM
de distinguir entre variables cualitativas y cuantitativas. Para fines del análisis estadı́stico, la
diferencia que distingue a lo cualitativo de lo cuantitativo es que las operaciones aritméticas
-L
ordinarias sólo tienen sentido con los datos cuantitativos. Por ejemplo, cuando los datos son
S
PU
cuantitativos, sus valores se pueden sumar y después dividir entre la cantidad de valores
para calcular el valor promedio de ellos. Este promedio tiene sentido y, por lo general, se
M
CA
interpreta con facilidad. Sin embargo, cuando se registran datos cualitativos en forma de
valores numéricos, esas operaciones aritméticas producen resultados sin importancia.
Niveles o Escalas de Medición.
Otra clasificación de las variables es según su nivel de medición, donde una variable
puede ser: nominal, ordinal, de intervalo o de razón. La escala o nivel de medición determina la
cantidad de información contenida en los datos. Cuando se aplica la estadı́stica a problemas
reales, el nivel de medición de los datos ayuda a decidir qué procedimientos o métodos
estadı́sticos son apropiados para los datos.
Algunos autores explican esa clasificación haciendo referencia a otra forma de clasificar
E
los datos. Siguiendo Triola (2018) o Lind et al. (2012) tenemos las siguientes definiciones.
AD
El nivel nominal es la escala más elemental. Se caracteriza por datos que consisten
únicamente en nombres, etiquetas o categorı́as. Los datos carecen de un orden natural. Las
observaciones acerca de una variable con este nivel de medición sólo se clasifican y se cuentan.
A veces, para una mejor comprensión de lectura, estos conteos se convierten en porcentajes.
Ejemplos de variables con este nivel de medición pueden ser: Estado civil (Soltero, casado,
viudo, divorciado), Género (Masculino, femenino), Ciudad de Nacimiento de una persona o
preguntas de una encuesta que permiten respuestas “Sı́” o “No”, etc.
El nivel ordinal, es el nivel inmediato superior al nominal. Este nivel se caracteriza
-I I
por datos que además de exhibir las propiedades de los datos nominales también pueden
22
colocarse en cierto orden o tienen un orden inherente o natural. Ejemplos de variables con este
20
nivel de medición pueden ser: Calificación asignada en un curso (A=Muy bueno, B=Bueno,
C=promedio, D=malo, E=muy malo), Grado de escolaridad (Primaria, secundaria, técnico,
universitario, etc), Preferencia a la compra de un producto (siempre, frecuentemente,
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 8
El nivel de razón, es el nivel o escala más alta y se caracteriza por datos que tienen
todas las propiedades de los datos de intervalo y además la razón o proporción de dos valores
es significativa. Los datos en este nivel tienen un cero natural que expresa ausencia de lo que
está siendo medido. Ejemplos de escalas de razón son la edad, peso, estatura, salario, precio,
A
IM
volumen de ventas, número de teléfonos celulares que posee una persona, etc.
La Tabla 1.1 resume cuáles operaciones son apropiadas en cada uno de los cuatro niveles
-L
A pesar de que sólo se debe llamar muestra a un conjunto de datos representativos del
20
universo del cual fue extraı́da. En muchos casos dichos elementos se eligen con base en el
juicio o criterio del investigador (muestreo intencional u opinático). Como las muestras no
probabilı́sticas eligen a sus participantes sin conocer o tomar en cuenta sus probabilidades de
selección (y en algunos casos los participantes se autoseleccionan (muestreo voluntario)), no
se puede aplicar la teorı́a que se desarrolla para el muestreo probabilı́stico. Muchas compañı́as
realizan encuestas dando a los visitantes de su página de Internet la oportunidad de llenar
encuestas y entregarlas en forma de una respuesta electrónica. La respuesta a estas encuestas
puede proporcionar grandes cantidades de datos en poco tiempo, pero la muestra se compone
de usuarios de Internet que son seleccionados en forma automática. Para muchos estudios
EP
sólo se dispone de una muestra no probabilı́stica como una muestra subjetiva. En estos
UD
casos, la opinión de un experto en la materia es crucial para poder usar los resultados
obtenidos y realizar cambios en un proceso. Otros procedimientos comunes de muestreo no
probabilı́stico son el muestreo por cuotas (tı́picamente utilizado en estudios de mercado y
de opinión pública), el muestreo por grupos naturales, muestreo bola de nieve, etc. Éstos se
A
IM
rapidez y bajo costo. Por otro lado, hay dos desventajas importantes: falta de precisión
S
PU
debido al sesgo en la selección y falta de capacidad para generalizar los resultados, que
superan con mucho a las ventajas. En consecuencia, el uso de los métodos de muestreo no
M
CA
Se denomina muestra aleatoria simple a aquella que es seleccionada de tal forma que
AD
de una pequeña escuela de niños que tiene una población de 320 estudiantes y quisiéramos
22
como sigue: primero se enumera a los estudiantes del 001 hasta 320. Luego mediante el
uso de una tabla de números aleatorios (que como su nombre lo indica estos números han
sido generados por un proceso aleatorio) se cumple que para cada dı́gito de un número, la
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 10
1
la probabilidad de que aparezca cualquier dı́gito en cualquier punto de la secuencia es 10 .
La segunda condición significa que todas las combinaciones de dos dı́gitos son igualmente
probables, del mismo modo que todas las combinaciones de tres dı́gitos, y ası́ sucesivamente.
Volviendo a nuestro ejemplo, primero elegimos un número aleatorio de la tabla, que será el
A
IM
inicio (cualquier punto de comienzo servirá). Supongamos que elegimos el número 22368 (fila
2), como solo hay 320 estudiantes se utilizaran los tres primeros dı́gitos del número aleatorio
-L
de cinco cifras. De modo que 223 es el primer estudiante seleccionado en la muestra. A fin
S
PU
Cuando la población es muy grande y/o heterogénea, resulta muy difı́cil y costoso
conseguir la lista o marco poblacional actualizado de todos los elementos de la población. Por
ejemplo para estudiar la distribución del ingreso familiar en el distrito de Surco con base a una
muestra aleatoria simple, necesitaremos en principio, una lista o censo poblacional actualizado
de todas las familias residentes de dicho distrito, la cual no siempre está disponible. Por esta
razón, el muestreo aleatorio simple no resulta ser el procedimiento más común en la práctica.
Sin embargo, es importante prestar atención a este diseño muestral por dos razones:
1. Porque muchos de los diseños muestrales mas elaborados usan el muestreo aleatorio
simple en algún aspecto de su diseño y por lo tanto comprender el muestreo aleatorio
E
AD
Como se dijo, si el universo es de gran tamaño, puede resultar muy engorroso el muestreo
aleatorio simple pues se necesitarı́a mucho tiempo y/o dinero. Por eso una alternativa
al muestreo aleatorio simple es el muestreo sistemático. Para obtener una muestra
sistemática, primero se divide el tamaño de la población N entre el tamaño de la muestra
-I I
N
deseado n, y el resultado obtenido, k = , se redondea al entero más cercano, en caso de que
22
n
k no resulte ser entero. Luego, para obtener la muestra sistemática procedemos ası́: Elegimos
20
al primer elemento de la muestra entre los primeros k elementos de la lista poblacional usando
muestreo aleatorio simple y los otros elementos de la muestra se escogen cada k elementos a
partir del elemento seleccionado inicialmente. Ası́ k indicará, si cada décimo, cada onceavo,
o cada centésimo elemento en la población va a ser seleccionado.
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 11
Supóngase que una población está constituida por los 884 empleados de una empresa
comercial. Se desea seleccionar una muestra de 52 empleados de esa población. Según el
884
muestreo sistemático debemos calcular k, osea k = = 17, luego usando muestreo aleatorio
52
simple elegimos al primer empleado que conformará la muestra entre los 17 primeros de la
lista y a partir de allı́ cada 17 se van seleccionando los otros elementos de la muestra, hasta
completar 52 empleados. Si al llegar hasta el número final no se ha completado entonces se
sigue contando regresando al inicio de la lista.
Veamos otro ejemplo sencillo. Supóngase seleccionar una muestra sistemática de 45
estudiantes de la lista de 45,000 estudiantes en una universidad. Entonces el valor de k es
EP
1000. Luego usando muestreo aleatorio simple elegimos al primer estudiante que conformará la
UD
muestra entre los 1000 primeros de la lista. Supongamos que el elegido fue el alumno numerado
con 583. Entonces los estudiantes numerados con 583, 1583, 2583 y ası́ sucesivamente hasta
completar 45 estudiantes, conformarán la muestra deseada.
En una muestra estratificada, primero se dividen los N individuos o elementos de la
A
IM
se extrae una muestra, y por tanto la muestra final estará compuesta por el conjunto de estas
submuestras.
M
CA
El muestreo estratificado tiene la ventaja en algunos casos, de reflejar con mayor precisión
las caracterı́sticas de la población. Pero su costo de obtención es mayor que en una muestra
aleatoria simple del mismo tamaño, ya que la estratificación implica el trabajo adicional de
clasificar a la población en diversos estratos.
En el muestreo estratificado hay dos conceptos a tener en cuenta:
2. Afijación: Reparto del tamaño de la muestra en los diferentes estratos. Existen varios
criterios de afijación entre los que destacamos:
en la población.
Veamos el siguiente ejemplo extraı́do de Lind et al. (2012). Suponga que el objetivo de
un estudio consiste en determinar si las empresas con altos rendimientos sobre el capital
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 12
(una medida de rentabilidad) gastan en publicidad la mayor parte del dinero ganado que las
empresas con un registro de bajo rendimiento o déficit. Considere que la población consta
de 352 empresas. Para asegurar que la muestra a elegir sea una representación imparcial de
las 352 empresas, éstas se deben agrupar de acuerdo con su rendimiento porcentual sobre el
capital como se aprecia en la Tabla 1.2.
2 De 20 % a 30 % 35
UD
3 De 10 % a 20 % 189
4 De 0 % a 10 % 115
5 Déficit 5
A
IM
Tabla 1.2: Agrupación de las 352 empresas de acuerdo con su rendimiento porcentual sobre el capital.
-L
Si aplicara el muestreo aleatorio simple, observe que las empresas del tercero y cuarto
estratos tienen una probabilidad alta de que se les seleccione (87 %), mientras que las empresas
de los demás estratos tienen menos (13 %). Podrı́a no seleccionar ninguna de las empresas
que aparecen en los estratos 1 o 5 sencillamente por azar. No obstante, el muestreo aleatorio
estratificado garantizará que por lo menos una empresa de los estratos 1 o 5 aparezca en la
-I I
muestra. Considere una selección de 50 compañı́as para llevar a cabo un estudio minucioso.
22
50) empresa del estrato 1; 5 (10 % de 50), del estrato 2, etc. En este caso, el número
de empresas en cada estrato es proporcional al porcentaje del estrato en la población. El
muestreo estratificado ofrece la ventaja de que, en algunos casos, refleja con mayor fidelidad
las caracterı́sticas de la población que el muestreo aleatorio simple o el muestreo aleatorio
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 13
sistemático.
Por tanto, en algunos casos, el muestreo estratificado es más eficiente que el muestreo
aleatorio simple o el sistemático, porque garantiza la representación de individuos o elementos
de toda la población, lo que asegura una mayor precisión en las estimaciones de los parámetros
(poblacionales) fundamentales. Lo que proporciona la precisión, una vez combinados los
estratos, es la homogeneidad de individuos o elementos dentro de cada estrato.
En una muestra conglomerada, se dividen los N individuos o elementos de la
población en varios conglomerados, de manera que cada conglomerado sea representativo
de la población completa (un conglomerado es un subconjunto de la población que, en
EP
términos generales, posee una variabilidad parecida a la del global de dicha población respecto
UD
al carácter que estamos estudiando: podrı́a decirse que un conglomerado es una copia en
pequeño de la población). Después, se obtiene una muestra aleatoria de los conglomerados
y se estudian todos los individuos o elementos dentro de cada conglomerado seleccionado.
Los conglomerados pueden ser asignaciones naturales, como condados, distritos electorales,
A
IM
institutos se les divide por institutos (esos son los conglomerados). Como hemos decidido
que necesitamos una muestra de 700 profesores y sabiendo que el número de profesores
por instituto es aproximadamente de 35, los pasos a seguir para conseguir la muestra
conglomerada serı́an los siguientes:
3. Elegir por muestreo aleatorio simple o sistemático los 20 institutos (700/35=20) que
nos proporcionarán los 700 profesores que necesitamos.
E
AD
Los métodos de muestreo conglomerado pueden ser más eficientes (con relación a sus
costos) que los métodos de muestreo aleatorio simple, sobre todo si la población en cuestión
se encuentra esparcida en una vasta región geográfica. Sin embargo, los métodos de muestreo
conglomerado tienden a ser menos eficientes que los métodos de muestreo aleatorio simple o
de muestreo estratificado, y necesitan una muestra total más grande para obtener resultados
tan precisos como los que se obtienen con los procedimientos más eficientes.
Como conclusión, es conveniente tener en cuenta que el tipo de muestra que se debe
emplear depende de lo que se va a investigar, y para seleccionar ésta adecuadamente, en caso
-I I
que el universo sea grande y complicado, conviene estudiar con mucho más detalle la Teorı́a
22
del Muestreo.
20
como las bases de datos ya existentes, por ejemplo, la del Instituto Nacional de Estadı́stica
e Informática (INEI), Banco Central de Reserva del Perú (BCRP), etc.
UD
Por tanto como se ha comentado una fuente para recopilar datos es la experimentación.
En un experimento se ejerce un control estricto sobre los tratamientos; por ejemplo, en un
estudio para verificar la efectividad de un detergente para ropa, el investigador determinará
A
qué marcas son más efectivas para limpiar ropa manchada al lavar las prendas en lugar de
IM
preguntar a los consumidores cuál marca es la mejor. En general, los diseños experimentales
-L
adecuados son temas de estudio a niveles más avanzados, pues con frecuencia involucran
S
También una manera de recopilar datos es realizando una encuesta. En ella no se ejerce
M
control sobre el comportamiento de las personas que se investigan. Sólo se hacen preguntas
CA
Los estudios observacionales se presentan en formas muy variadas en las empresas; todos
AD
Management) en las empresas. TQM hace hincapié en la importancia del trabajo en equipo
20
e información estadı́stica. Casi todas las empresas mantienen sitios web que proporcionan
información general sobre la empresa, ası́ como datos sobre ventas, número de empleados,
número de productos, precios de productos y especificaciones de productos. Además, varias
compañı́as ahora se especializan en hacer que la información esté disponible a través de
Internet. Como resultado, uno puede obtener acceso a cotizaciones de acciones, precios de
comidas en restaurantes, datos de salarios y una variedad casi infinita de información.
Por último otra forma importante de obtener datos es consultar las fuentes gubernamen-
tales, industriales o individuales. De estas tres fuentes, el gobierno es el principal recopilador
de datos. La mayorı́a de las entidades gubernamentales que recopilan y procesan datos tam-
EP
bién hacen que los resultados estén disponibles a través de un sitio web. Existen también
UD
entidades privadas y publicaciones que se encargan de recopilar datos para realizar estudios
estadı́sticos de grupos o sectores especı́ficos.
1.7. Problemas propuestos.
A
1. Clasifique las siguientes variables según su naturaleza:
IM
d ) El peso que una persona ha perdido el mes pasado luego de seguir una dieta
CA
rigurosa.
e) La frecuencia de aplicación de protectores solares antes de exponerse al sol
(siempre, a menudo, algunas veces, rara vez, nunca).
f ) Lugar de procedencia
g) Número de teléfono
h) Profesión
i ) Nivel socioeconómico
E
j ) Placa de un auto
AD
Km
p) Velocidad en
22
h
20
q) El peso en Kg.
r ) Nivel educativo (primario secundario, superior).
s) Tipo de enseñanza (privada o pública).
t) Número de empleados de una empresa.
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 16
3. Suponga que la cafeterı́a del Campus vende jugos de fruta natural en tres presentaciones
o tamaños: pequeño, mediano y grande. Explique por qué el tamaño del jugo es una
variable categórica o cualitativa.
A
4. Suponga que se ha obtenido la siguiente información entre los estudiantes que salı́an
IM
5. Para una población de N =902, verifique cuántas filas de la tabla de números aleatorios
del Apéndice A.1 son necesarias para obtener una muestra de tamaño n=30 sin
E
AD
10. ¿Cuál es la diferencia entre una muestra estratificada y una muestra conglomerada?
22
20
11. ¿Cuál es la diferencia entre una variable aleatoria discreta y una continua?¿y la
semejanza?
12. ¿Cuál es la diferencia entre muestreo con reemplazo y muestreo sin reemplazo?
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 17
13. Identifique y sustente cuál de los tipos de muestreo probabilı́sticos vistos en clase, se
utiliza en cada uno de los siguientes ejercicios:
de estos grupos.
son representantes del grupo de hipertensos. Defina en términos del problema, cuál es:
S
PU
16. El departamento de inscripciones desea calcular el costo de los libros de texto que
E
resistencia media muscular de las estudiantes del campus. Para tal fin, el encargado,
20
a) La población d ) El parámetro
b) La muestra
c) La variable de interés. e) El estadı́stico
animales son representativos del grupo de animales con infecciones locales, conteste las
UD
siguientes preguntas:
19. Determine cuál de los niveles de medición es el más apropiado para la variable de
PU
b) Las temperaturas actuales, en grados Celsius, en los salones de clase del campus
lima.
c) La clasificación del hábito de fumar como: fumador ligero, fumador moderado,
fumador intenso.
d ) El número de respuestas “sı́” recibidas cuando se les preguntó a 1250 conductores
si habı́an usado alguna vez un teléfono celular mientras conducı́an.
e) El credo religioso de un grupo de personas.
E
21. Clasifique cada variable como cualitativa (nominal u ordinal) o cuantitativa (discreta
o continua).
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 19
m) Distancia de una estrella cualquiera del cosmos al sistema solar, en años luz.
S
PU
n) Nombres de establecimientos.
M
ñ) Opinión sobre una propuesta polı́tica (muy en contra, en contra, indiferente, a
CA
22. Las tiendas a nivel nacional dedicadas a la comercialización de artefactos eléctricos han
encargado realizar un estudio con la finalidad de obtener algunos indicadores. El estudio
se realizó tomando una muestra de 60 tiendas obteniéndose los siguientes resultados:
24. Determine y sustente cuál de los niveles de medición es el más apropiado para la variable
de interés en los siguientes casos:
A
IM
25. La empresa Aventis Pharmaceuticas realizó un estudio para medir los efectos colaterales
de Allegra, un medicamento que se utiliza en el tratamiento de alergias estacionales.
A un grupo de 679 personas que sufren alergias en EEUU se les administraron 60 mg
del medicamento dos veces al dı́a. Los pacientes informaron si durante ese periodo
experimentaron, o no, alivio de sus alergias, ası́ como si experimentaron cualquier
otro efecto colateral adverso (infección viral, náusea, somnolencia, etc). Fuente: Good
Housekeeping, febrero de 2005, p. 120.
b) ¿Cuál es la muestra?
c) ¿Cuáles son las caracterı́sticas (variables) de interés acerca de cada uno de los
elementos de la población?
d ) Los datos recolectados, ¿son cualitativos (¿de qué tipo?) o cuantitativos (¿de qué
tipo?)?
27. Identifique cuál de los tipos de muestreo vistos en clase, se utiliza en cada uno de los
siguientes ejercicios:
todos los propietarios de un Corvette. Ella quiere hacer una prueba piloto de la
PU
nueva estrategia de mercadotecnia, ası́ que enumera todos los sobres y ayudada
M
esos sobres.
f ) En un operativo de sobriedad de la policı́a se detenı́a y entrevistaba a cada quinto
conductor.
g) Una empresa encuestadora está planeando realizar una encuesta de salida en que
se elegirán aleatoriamente 100 locales electorales y se entrevistará a todos los
votantes conforme vayan saliendo de los locales.
h) Un investigador de una universidad encuesta a todos los pacientes del área de
cardiologı́a en cada uno de 30 hospitales seleccionados al azar.
E
AD
i ) Un experto en marketing está planeando una encuesta para MTV, en la cual 500
personas se elegirán aleatoriamente de cada grupo de edades de 10 a 19, 20 a 29,
etc.
El 20 % de pasajeros es peruano.
20
29. Identifique y sustente cuál de los tipos de muestreo probabilı́sticos vistos en clase, se
utiliza en el siguiente ejercicio: El sistema de cómputo de un gran hospital contiene
registros para 30 000 pacientes. Los registros están numerados del 1 al 30 000. Se
obtuvo una muestra de los registros, seleccionando a los pacientes cuyos números son
100, 200, 300,. . . , 30 000, obteniéndose ası́ una muestra de 300 enfermos.
EP
d ) En una muestra aleatoria simple todos los elementos de la población tiene la misma
S
31. Suponga que el número de resfriados que una persona cualquiera contrae
CA
el nuevo producto. Además se concluyó que el precio del producto deberı́a oscilar entre
1,50 y 2,5 soles. Determinar:
a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) La(s) variable(s) y su(s) respectivo(s) tipo(s) y nivel(es) de medición.
d ) Defina el(los) parámetro(s) de interés y proporcione su(s) valor(es)
-I I
a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) La(s) variable(s) y su(s) respectivo(s) tipo(s) y nivel(es) de medición.
d ) Defina el(los) parámetro(s) de interés y proporcione su(s) valor(es)
e) Defina el(los) estadı́stico(s) de interés y proporcione su(s) valor(es)
34. Determine y sustente (expresándose en términos del contexto), cuál de los niveles (o
escalas) de medición es el más apropiado para la variable de interés siguiente: Cantidad
EP
35. Una empresa realiza una encuesta sobre el uso de cajeros automáticos por parte de los
habitantes del distrito de San Martı́n de Porres. De las 1200 personas encuestadas se
tiene la siguiente información:
A
El 60 % usa la red de cajeros Unibanca.
IM
a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) La(s) variable(s) y su(s) respectivo(s) tipo(s) y nivel(es) de medición.
d ) Defina el(los) parámetro(s) de interés y proporcione su(s) valor(es)
e) Defina el(los) estadı́stico(s) de interés y proporcione su(s) valor(es)
36. En una prueba de aptitud conformada por 25 preguntas, 4 son de cultura general. A
un alumno se le asignarán 18 preguntas al azar para que haga una tarea. Si se define
E
37. La SUNAT hace una auditorı́a para verificar si las tiendas de abarrotes en el distrito de
San Juan de Lurigancho entregan boleta de venta a sus clientes y para tal fin selecciona
aleatoriamente a 100 de dichas tiendas encontrando que el 65 % de ellas entregaban
boleta de venta. Defina en términos del problema:
-I I
b) ¿Cuál es la muestra?
20
38. En el siguiente enunciado identifique (y sustente) qué variable (o variables) tienen nivel
de medición de intervalo: Para el jefe de agencia de un banco es importante el número
de clientes atendidos al dı́a, el grado de satisfacción de los clientes hacia la atención
recibida y la cantidad de dinero que un cliente mantiene mensualmente en su cuenta.
40. Piense bien y clasifique las siguientes variables según su nivel de medición:
PU
M
b) ¿Cuál es la muestra?
20
43. Identifique y sustente cuál de los tipos de muestreo probabilı́sticos vistos en clase, se
utiliza en el siguiente ejercicio. Se realizó una investigación para conocer las condiciones
en que viven los niños y adolescentes en los Centros de Atención Residencial del
INABIF. Para tal efecto se seleccionó al azar 6 de estos centros y se evaluó las
EP
44. Uno de los cuatro niveles o escalas de medición se denomina “de razón” ¿Por qué se le
denomina ası́? Explique claramente y exponga un ejemplo.
45. Clasifique las siguientes variables según su nivel de medición. Sustente la respuesta que
A
brinde en el apartado a) y c)
IM
b) Percepción de los usuarios del transporte público frente al servicio que se brinda,
PU
46. En el mes de Noviembre del 2011, se realizó un estudio en pacientes que pasaron consulta
en el servicio de cardiologı́a del Hospital Rebagliati, para conocer algo sobre: proporción
o porcentaje de pacientes con riesgos cardı́acos (si o no), peso promedio (kg),sexo del
paciente (masculino, femenino) y el grado de sedentarismo (alto, medio, bajo). Para
tal efecto, se eligieron aleatoriamente a 60 pacientes y se encontró que el 45 % tenı́an
E
AD
riesgo cardı́aco, el peso promedio fue de 75.2 kilos, el 70 % eran de sexo masculino y el
80 % tenı́an alto grado de sedentarismo. Defina en términos del problema:
47. Clasifique las siguientes variables según su nivel de medición. Sustente la respuesta que
20
a) El nivel educativo de una madre que vive en una comunidad de San Vicente de
Cañete y que se codifica con un número: 1 = Nivel Superior, 2 = Medio, 3 =
Básico, 4 = Ninguno
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 26
48. La empresa Informat S.A. llevó a cabo un estudio para analizar el mercado de
internautas que compran servicios de internet, en Lima Metropolitana. Para el estudio
se consideró una muestra probabilı́stica de 1500 personas. Algunos de los resultados de
la encuesta fueron:
EP
El número promedio de veces por semana que los encuestados usan el servicio de
Internet es 3.
El 80 % de los internautas opinó que el servicio de Internet es regular.
A
IM
b) La muestra.
CA
49. Determine y sustente (expresándose en términos del contexto), cuál de los niveles (o
escalas) de medición es el más apropiado para las variables de interés siguientes:
51. Con la finalidad de conocer en qué medida los propietarios de viviendas del distrito de
Lince pagan el impuesto predial, la Municipalidad correspondiente realizó un estudio.
De una muestra de 500 propietarios se obtuvo los siguientes resultados preliminares.
52. Identifique y sustente cuál de los tipos de muestreo probabilı́sticos vistos en clase, se
EP
gasolina en una ciudad. Para esto, los vehı́culos se clasificaron en: particulares (1),
públicos (2) y oficiales (3) y se eligieron al azar 100 automóviles de cada grupo.
53. El Ministerio de Comercio Exterior y Turismo realizó un estudio sobre el perfil del
A
turista nacional. Se define al turista nacional como aquel peruano que se traslada a
IM
alguna zona del paı́s diferente de donde reside. El estudio se llevó a cabo con hombres y
-L
El tiempo promedio (en dı́as) de permanencia por turista en estos lugares fue de
5 dı́as.
El gasto promedio diario por turista fue de 766 soles.
Los medios utilizados para búsqueda de información turı́stica: el 56 % por internet,
24 % por familiares, 12 % por folletos turı́sticos y por agentes turı́sticos 8 %.
b) La muestra.
AD
54. Clasifique las siguientes variables según su nivel de medición. Sustente la respuesta que
brinde en los apartados a) y d)
55. La empresa Mistercofi S.A., que entre otras cosas produce café, ha solicitado realizar
un estudio de mercado de las personas de clase media, de la ciudad de Lima, acerca del
consumo de dicho producto. Para realizar el estudio la empresa seleccionó una muestra
de 1200 personas de clase media de la ciudad de Lima. Algunos de los datos y resultados
de la encuesta fueron:
56. Identifique y sustente cuál de los tipos de muestreo probabilı́sticos vistos en clase, se
PU
utiliza en el siguiente ejercicio: Se realizó una investigación para conocer las condiciones
M
en que viven los presos en las cárceles peruanas. Para tal efecto se seleccionó al azar 5
CA
centros penitenciarios y se evaluó las condiciones de vida de todos los presos en cada
uno de esos centros.
57. Con la finalidad de conocer en qué medida los propietarios de automóviles del distrito
de Magdalena pagan el impuesto vehicular, el SAT realizó un estudio. De una muestra
de 600 propietarios se obtuvo los siguientes resultados preliminares.
c) ¿Cuáles son las variables de interés? ¿qué nivel de medición tiene cada una?
22
20
58. Suponga que se está investigando los tiempos obtenidos en una prueba de rendimiento
de observación visual en adolescentes de 17 años de edad que asisten a un curso de
un colegio de la ciudad de Lima. La prueba consiste en que se presentan dos dibujos
y se deben encontrar 7 errores, luego se toma el tiempo (en minutos) que tardan en
descubrirlos. La base de datos de la población es la siguiente:
EP
UD
A
IM
-L
b) Calcule el tiempo medio que emplean para descubrir los 7 errores, los 6 adolescentes
CA
59. Se realiza un estudio con el objetivo de estimar la relación entre la depresión y los
conflictos familiares en los adolescentes peruanos. Según una encuesta realizada a 342
participantes de entre 11 y 17 años, revela que la edad promedio de los encuestados es
de 13.7 años, el 52.6 % es de sexo masculino y el 16.7 % presenta un nivel de depresión
severa. Defina en términos del problema:
60. En una canasta se tienen 12 naranjas de las cuales 3 están malogradas. Imagı́nese
que usted elige al azar 5 naranjas de las 12 que hay en esa canasta y se define como
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 30
61. Una encuestadora realizó un estudio en el mes de julio con la finalidad de conocer
en qué medida las personas adultas que viven en la capital reaccionan ante el clima
de inseguridad existente. Se encuestó a 1200 adultos y se obtuvieron los siguientes
resultados preliminares.
tema de seguridad.
UD
El tipo de delito más frecuente del que han sido vı́ctimas fue el robo al paso (bolso,
cartera, celular) (60 %).
El 70 % de los encuestados opinan que el distrito en el que viven es poco seguro.
A
El 68 % de los encuestados dice no haber realizado la denuncia respectiva luego
IM
b) ¿Cuál es la muestra?
CA
c) ¿Cuáles son las variables de interés? ¿qué nivel de medición tiene cada una?
d ) parámetros de interés y proporcione sus valores.
e) estadı́sticos y proporcione sus valores.
62. El profesor de estadı́stica quiere investigar sobre el tiempo diario de estudio (en horas)
de 20 estudiantes de una clase. Los datos son:
A
IM
63. Una bolsa contiene 25 caramelos de limón y 15 de menta. Imagı́nese que usted elige al
-L
azar 10 caramelos de los 40 que hay en esa bolsa y se define como variable de interés el
S
64. Suponga que lo acaban de nombrar ejecutivo principal de mercadotecnia para Fun
Enterprise (F.E), compañı́a que se especializa en diseñar y construir parques de
diversiones cerca de grandes ciudades. F.E se interesa principalmente en un sitio al
Sur de Lima. Se realiza un estudio para poder averiguar la opinión acerca de la posible
instalación del parque de diversiones y el precio que en promedio las personas estarı́an
dispuestas a pagar en cada visita. La encuesta fue realizada a 1150 personas adultas
elegidas aleatoriamente y se encontró que el 90 % de los entrevistados declararon estar
a favor de la instalación del parque y que en promedio, el precio que ellas estarı́an
E
65. Clasifique las siguientes variables según su nivel de medición. Sustente la respuesta que
20
66. En un estudio que realizó una empresa de investigación de mercados, sobre la calidad del
servicio que brindan los supermercados en la ciudad de Lima, se aplicó una encuesta de
opinión a los clientes de dichos supermercados. Para realizar este estudio se seleccionó
EP
una muestra de 1200 clientes que asistieron a los supermercados de la ciudad de Lima.
Se presentan a continuación algunos de los resultados obtenidos:
UD
El número promedio de dı́as por semana que asisten los clientes seleccionados al
-L
15 minutos.
M
CA
67. Una caja contiene 12 artı́culos de los cuales 4 son defectuosos. Imagı́nese que usted
E
elige al azar 5 artı́culos de los 12 que hay en esa caja y se define como variable de
AD
seleccionando a los socios cuyos números de registro son: 120, 240, 360,. . . , 42
000, obteniéndose ası́ la muestra de socios requerida.
b) Identifique y sustente cuál de los tipos de muestreo probabilı́sticos vistos en clase,
se utiliza en el siguiente ejercicio (Sustente la respuesta): En una investigación se
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 33
Eti− N ombre del N úmero Distrito Eti− N ombre del N úmero Distrito
A
queta P aciente de caries queta P aciente de caries
IM
70. En una lista de 80 clientes que poseen tarjeta de crédito hay 10 clientes que no están al
dı́a en sus pagos (morosos). Imagı́nese que usted elige al azar 20 clientes de esa lista y
se define como variable de interés el número de clientes morosos dentro de los 20
CAPÍTULO 1. INTRODUCCIÓN A LA ESTADÍSTICA 34
A
IM
S -L
PU
M
CA
E
AD
-I I
22
20
Capı́tulo 2
2.1. Introducción
En este capı́tulo se van a estudiar las distintas formas de organizar, representar y describir
A
IM
conjuntos de datos. El objetivo es hacer que los datos sean más fáciles de ser entendidos
describiendo tendencias, medidas centrales, variaciones, etc. Las técnicas que emplea la
-L
tipo de presentaciones. Por tanto, es útil saber cómo se hacen y se interpretan. Se verán los
AD
métodos tabulares y gráficos para resumir datos que se refieren a una sola variable.
2.2.1. Resumen de datos cualitativos
2.2.1.1. Tabla de frecuencias
Para utilizar la información estadı́stica necesaria, debemos organizarla y resumirla. Una
manera simple y conveniente de resumir los datos es en una tabla llamada distribución de
frecuencias, la cual es un resumen tabular de datos que muestra cada una de las diferentes
clases excluyentes (o valores de la variable) y el número o conteo (frecuencia absoluta)
-I I
de elementos en cada una de ellas. En particular, una distribución de frecuencias nos ayuda
22
35
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 36
fi
que pertenecen a cada clase, es decir: , donde fi es la frecuencia absoluta de la clase i y n
n
es el tamaño de la muestra o cantidad de datos analizados. La frecuencia porcentual de una
clase es la frecuencia relativa multiplicada por 100.
Un detalle importante es que en una distribución de frecuencias: La suma de las
frecuencias absolutas es siempre igual al número de observaciones n, la suma de las frecuencias
relativas es siempre igual a 1, y la suma de los porcentajes es siempre igual a 100.
Con el ejemplo siguiente se muestra la elaboración e interpretación de una distribución
de frecuencia de datos cualitativos: Suponga que se encuesta a 123 personas para conocer su
opinión al respecto de diversos temas y dentro de la información que alcanzan se encuentra
EP
su estado civil.
UD
Para elaborar una distribución de frecuencia con estos datos, se cuenta el número de veces
que aparece cada categorı́a de estado civil. Supóngase que al contar, 25 personas son solteras,
50 son casadas, 20 divorciadas, 18 viudas y 10 tienen otros estados civiles que agruparemos
A
en “Otros”. Esto queda resumido en la distribución de frecuencias de la Tabla 2.1:
IM
25
Soltero 25 123 20.3
M
50
Casado 50 123 40.7
CA
20
Divorciado 20 123 16.3
18
Viudo 18 123 14.6
10
Otros 10 123 8.1
Total 123 1 100
Tabla 2.1: Distribución de frecuencias del estado civil de las personas encuestadas.
y al observar esta distribución de frecuencia, es claro que el estado civil más frecuente es
“casado”, “soltero” el segundo, “divorciado” el tercero, a continuación “viudo” y “otro”el
menos frecuente. En el cuadro 2.1 se presenta también la distribución de frecuencia relativa y
la distribución de frecuencia porcentual de los datos de estado civil. En esta tabla se observa
que la frecuencia relativa de “soltero” es 25/123=0.203, la de “casado” es 50/123=0.407,
etc. En la distribución de frecuencia porcentual, se muestra que 20.3 % de las personas son
solteros, 40.7 % casados, etc.
2.2.1.2. Diagrama de barras y gráfica de pastel
-I I
22
Una gráfica de barras o un diagrama de barras, es una gráfica para representar los
20
relativa o frecuencia porcentual. Después, empleando un ancho de barra fijo, se dibuja sobre
cada etiqueta de las clases una barra que se extiende hasta la frecuencia, frecuencia relativa o
frecuencia porcentual de la clase. Cuando se tienen datos cualitativos, las barras deben estar
separadas para hacer énfasis en que cada clase está separada o excluyente de las otras.
En la figura 2.1 se muestra una gráfica de barras correspondiente a la distribución
de frecuencia del estado civil de las 123 personas encuestadas. Advierta cómo en esta
representación gráfica se observa que “casado” y “otro” son las categorı́as de estado civil
con mayor y menor frecuencia respectivamente.
EP
UD
A
IM
S -L
PU
M
CA
(Berenson et al., 2006). Esto ocurre a medida que aumenta el número de clases o grupos
22
vitales”, de los “muchos triviales”, lo que permite dirigir la atención a las respuestas más
PU
Las barras con separación uniforme tienen el mismo ancho. El punto en el polı́gono de
porcentajes acumulados para cada categorı́a se centra en el punto medio de cada barra.
1
Wilfredo Pareto fue un economista italiano que, en el siglo XIX, presentó una fórmula que mostraba la
desigualdad en la distribución de los salarios.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 39
Al estudiar un diagrama de Pareto se buscan dos cosas: las magnitudes de las diferencias en
las longitudes de las barras que corresponden a las categorı́as adyacentes decrecientes y los
porcentajes acumulados de estas categorı́as adyacentes.
Con el ejemplo siguiente se muestra la elaboración de un diagrama de Pareto: El gerente
de operaciones de una planta empacadora de cereales indicó que, según su experiencia, casi
siempre hay nueve razones que dan como resultado la producción de cajas de cartón no
conformes al final del proceso de empaque: cartón roto (R), cartón abultado (G), cartón
agrietado (C), cartón sucio (D), agujeros en el cartón (H), peso de empaque inadecuado (I),
error de impresión (P), etiqueta ilegible (U) y tapa superior sin sello (S).
EP
Los datos sin procesar que se muestran a continuación representan una muestra de 50
UD
UGUSHDDRIUSUSUGCSUDRSUDUSSDPRSISUDGSSUSD
A
GSCUDDSSSU
IM
Para construir el diagrama de Pareto con estos datos, primero, elaboramos una tabla de
-L
Ahora empleamos esta tabla de resumen para construir el diagrama de Pareto que aparece
-I I
en la figura 2.3:
22
Al separar los “pocos vitales” de los “muchos triviales”, se determina que las tapas sin
20
sello (32 %), las etiquetas ilegibles (24 %) y los cartones sucios (18 %) representan el 74 % de
las razones de no conformidad. Las otras seis razones representan el 26 %.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 40
EP
UD
1. Establecer cuáles son los valores diferentes que se presentan en el conjunto de datos
(muestra o población), para la variable de interés, y ordenarlos según su magnitud.
E
AD
valores diferentes: 25, 26, 27, 28, 29 y 30. Al ser pocos valores diferentes para la variable
22
12
28 12 120 10
UD
10
29 10 120 8
2
30 2 120 2
Total 120 1 100
A
Tabla 2.3: Distribución de frecuencias del número de palabras leı́das por 120 disléxicos.
IM
-L
distribuyeron los valores del número de palabras leı́das por los 120 disléxicos. El resumen
PU
aporta más claridad y al observar esta distribución de frecuencia, es claro que el número de
M
el número de palabras leı́das en 15 segundos por 120 disléxicos se muestra en la figura 2.4.
-I I
22
20
Figura 2.4: Distribución de frecuencias para el número de palabras leı́das por 120 disléxicos.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 42
Figura 2.5: Diagrama escalonado: diagrama de frecuencias acumuladas del número de palabras leı́das.
E
Esta representación muestra las frecuencias acumuladas (absolutas o relativas) para los
AD
variable aleatoria discreta que posee demasiados valores diferentes), es conveniente agrupar
los datos en intervalos, pues la distribución de frecuencias no agrupada y el diagrama de
barras correspondiente serı́a muy extenso y no ayudarı́an a realizar un apropiado análisis
estadı́stico impidiendo aclarar en qué forma se distribuyen los datos.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 43
Es muy importante respetar la precisión con que los datos son medidos. Por ejemplo,
EP
si los datos representan diámetros de ciertas piezas cilı́ndricas, en mm.: 125.5; 127.3;
UD
124.0; etc; expresados con una cifra decimal, entonces los lı́mites de los intervalos a
formar se expresarán también con una cifra decimal. Si los datos están expresados
con una precisión de dos decimales entonces los lı́mites de los intervalos a formar se
expresarán también con dos cifras decimales, etc.
A
IM
Es recomendable que los intervalos tengan igual tamaño cuando se desea hacer
-L
K∼
= 1 + 3.3 ∗ log(n), donde : n = número de datos
E
AD
Rango
T IC ∼
= ,
K
4. Establecer los lı́mites de cada uno de los intervalos. Se debe tener en cuenta los siguientes
aspectos:
La observación de menor valor será el lı́mite inferior del primer intervalo. El lı́mite
-I I
valor.
20
5. Determinar las frecuencias absolutas (realizando el conteo, que consiste en asignar cada
observación al intervalo correspondiente).
6. Determinar las marcas de clase (o puntos medios de cada intervalo), las frecuencias
relativas y porcentajes.
5 3 3 1 4 4 5 5 12 6 3 5 1
1 14 1 2 4 4 4 3 2 5 6 7 6
8 4 7 6 5 9 11 4 3 7 6 5 1
A
1 10 8 9 2 12 6 6 4 6 4 15
IM
de dos semanas.
M
Para construir una distribución de datos agrupados hay que seguir los siguientes pasos:
CA
K∼
= 1 + 3.3 ∗ log(n) ∼
= 1 + 3.3 ∗ log(51) ∼
= 6.63 ⇒ tomamos K = 7
Rango ∼ 14
T IC ∼
= = ⇒ tomamos T IC = 2
K 7
E
AD
5. Determinar las frecuencias absolutas (realizando el conteo, que consiste en asignar cada
-I I
6. Determinar las marcas de clase (o puntos medios de cada intervalo), las frecuencias
relativas y porcentajes.
3
[9 − 11⟩ 10 3 51 6
UD
3
[11 − 13⟩ 12 3 51 6
2
[13 − 15] 14 2 51 4
Total 51 1 100
A
Tabla 2.5: Distribución de frecuencias de datos agrupados considerando la marca de clase de la
IM
Vale la pena aclarar que, dado un conjunto de datos, éstos se pueden agrupar de varias
PU
maneras, sin que se pueda decir en muchos casos que sólo una es la manera correcta.
M
Se podrı́a decir; sin embargo, que la mejor agrupación es aquella que se elabora de una
CA
forma rápida y que permite mostrar de una manera clara cómo se distribuyen los datos,
ya sea de forma tabular o gráfica.
en este capı́tulo.
AD
El histograma es una gráfica que expresa la frecuencia con que sucede cada clase o
intervalo. La forma que tenga el histograma permitirá formarse una idea no sólo de cómo
están distribuidos los datos, sino, en muchos casos, descubrir por qué causa los datos están
distribuidos de esa forma. En el eje de abscisas se identifica la variable de interés (X), ya sea
mediante los lı́mites de los intervalos o las marcas de clase. En el eje de ordenadas se expresan
las frecuencias de cada intervalo (o también la frecuencia relativa o los porcentajes). Cada
intervalo formará un rectángulo de altura igual a su frecuencia y base igual a la longitud del
intervalo.
El polı́gono de frecuencias se puede trazar fácilmente sobre el mismo histograma, uniendo
EP
los puntos medios de la parte superior de cada rectángulo, partiendo y finalizando en dos
UD
por las frecuencias de cada intervalo o clase (o también la frecuencia relativa o porcentajes), y
S
PU
que la base de estos rectángulos es el TIC (la longitud de intervalo o clase); se puede deducir
que el área que hay bajo el histograma, es exactamente igual que el área debajo del polı́gono.
M
CA
E
AD
Figura 2.6: Histograma y polı́gono de frecuencias del Número de veces que un cliente va al
supermercado.
-I I
22
20
A
IM
-L
Se puede concluir de la ojiva, que por ejemplo, el 84 % de los clientes del supermercado
M
utiliza para describir datos; comúnmente se le conoce como promedio. Si la media se calcula
20
con los datos de una muestra, la media se simboliza como x; y si se calcula con los datos de
una población, la media se simboliza con la letra griega µ.
La media se calcula con la suma de todas las observaciones en un conjunto de datos,
dividida entre el número de observaciones involucradas. Ası́, para una muestra que contiene
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 48
x1 + x2 + . . . + xn
x= (2.1)
n
n
X
xi
i=1
x= (2.2)
n
EP
n
X
donde xi significa la suma de todos los valores o datos de la variable X.
UD
i=1
Ahora, dado el conjunto de los N datos de una población, la media se define como:
N
X
xi
A
i=1
µ= (2.3)
IM
N
-L
(que miden la importancia relativa de cada observación), entonces la media está dada por:
M
n
X
CA
wi x i
i=1
x= n (2.4)
X
wi
i=1
k
X
ni xi
i=1
x= k
(2.5)
X
ni
i=1
los datos.
20
Un conjunto de datos sólo tiene una media (un único valor). Se considera a la media
como un punto de equilibrio para un conjunto de datos.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 49
La media es útil para comparar 2 o más poblaciones. Por ejemplo, para comparar el
rendimiento de los alumnos de una sección respecto a los de otra sección de la misma
asignatura.
La media es la única medida para la cual se cumple que la suma de las desviaciones de
cada valor con respecto a la media, siempre será cero. Es decir, en una muestra con n
observaciones: x1 , x2 , . . . , xn se cumplirı́a que:
n
X
(xi − x) = 0 (2.6)
EP
i=1
UD
propiedad.
-L
a la práctica N°2 y los datos obtenidos son: 12, 7, 5, 16, 21, 5, 9, 3, 11, 14 ¿Cuál es el
tiempo promedio de estudio?
Empleando la expresión (2.2), el tiempo medio de estudio serı́a:
10
X
xi
i=1 12 + 7 + 5 + 16 + 21 + 5 + 9 + 3 + 11 + 14
x= = = 10.3 horas
10 10
es decir, en esta muestra, en promedio por alumno estudiaron 10.3 horas. Como se
E
aprecia en este caso, es posible que el valor del promedio no necesariamente coincida
AD
con el valor de alguno de los datos analizados. Por esta razón, es un error redondear el
valor de la media a un valor entero, pues eso harı́a perder la noción de centralidad que
intenta describir esta medida en ese conjunto de datos.
2. Los siete miembros de un equipo de atletismo tienen las marcas de tiempo (en minutos)
para una cierta carrera: 4,2; 4,3; 4,7; 4,9; 5,0; 5,1; 9,0. ¿Cuál es el tiempo medio?
Empleando la expresión (2.3), el tiempo medio serı́a:
7
X
-I I
xi
22
7 7
Si se entiende que la frecuencia simplemente resume las veces que se repite una
determinada observación entonces, empleando la expresión (2.2), el número promedio
de palabras leı́das serı́a:
EP
120
X
xi
UD
i=1 25 ∗ 56 + 26 ∗ 24 + 27 ∗ 16 + 28 ∗ 12 + 29 ∗ 10 + 30 ∗ 2
x= = = 26.2 palabras
120 120
y la sección B obtuvo 14.6 ¿Cuál fue la nota promedio de las dos secciones en conjunto
PU
en la práctica 1?
M
Del problema tenemos que: n1 = 52, x1 = 12.3, n2 = 42, x2 = 14.6, luego empleando
CA
2
X
ni xi
i=1 52 ∗ 12.3 + 42 ∗ 14.6
x= = = 13.33
X2 52 + 42
ni
i=1
Si los datos (asumiendo que son de una muestra) están agrupados en una tabla de
AD
P
k
fc .xc
c=1
x= (2.7)
P
k
fc
c=1
donde: fc =frecuencia del intervalo “c” xc =Marca de clase del intervalo “c”
Para ilustrar el cálculo de la media con datos agrupados, lo haremos para el problema
-I I
clientes y que aparece en la Tabla 2.5. Con esa información nos preguntamos: ¿Cuántas veces
en promedio acuden los clientes al supermercado en el periodo de dos semanas?
Recordando la tabla de frecuencias agrupadas tenemos:
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 51
[11 − 13⟩ 12 3
UD
[13 − 15] 14 2
Total 51
A
Empleando la expresión (2.7), el número medio de veces que un cliente acude al
IM
supermercado serı́a:
-L
P
k
S
fc .xc
PU
c=1 2 ∗ 9 + 4 ∗ 14 + 6 ∗ 15 + 8 ∗ 5 + 10 ∗ 3 + 12 ∗ 3 + 14 ∗ 2
x= = = 5.84 veces
P
k 51
M
fc
c=1
CA
2.3.1.3. Mediana
Una desventaja de la media es su sensibilidad a valores extremos, es decir una puntuación
excepcional puede afectarla de manera drástica. La mediana resuelve, en gran medida, esa
desventaja.
Dado un conjunto de datos ordenados (en forma creciente o decreciente), la mediana es
el dato o valor que ocupa la posición central del conjunto, es decir que a lo sumo, la mitad
de los valores de los datos están por debajo de ella y la otra mitad por arriba de ella.
E
del conjunto de datos no puede existir más del 50 % de ellos que sean estrictamente menores
que la mediana ni más del 50 % de ellos que sean estrictamente mayores que la mediana, y
que por lo tanto la mediana está ubicada en una posición tal que por ninguno de los dos
lados se excede este porcentaje del 50 %.
Para calcular la mediana de un conjunto de datos no agrupados, se sigue el siguiente
procedimiento:
n
2. Calcular el “ı́ndice de posición”(i) de la mediana, haciendo: i =, donce n es el número
22
2
de datos del conjunto. El ı́ndice de posición es un valor que nos indica en dónde (en
20
3310, 3480, 3490, 3520, 3650, 3925, 3355, 3450, 3480. Calcule e interprete la mediana
-L
de dichos sueldos.
S
PU
3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3925
CA
11
Al tener 11 datos, calculamos el ı́ndice de posición de la mediana: i = = 5.5, como
2
“i” no es entero, se redondea, entonces i=6 e indica que la mediana será el dato que
ocupe dicha posición, entonces la mediana es 3490 soles. Eso quiere decir que a lo sumo
el 50 % de estos egresados gana menos de 3490 soles y a lo sumo el 50 % gana por
encima de esa cantidad.
2. Se toma una muestra de 12 personas y se les pregunta por su edad (años) y los datos
obtenidos son: 28,12,34,15,13,21,18,20,30,26,19,25 ¿Cuál es la mediana de estas edades?
E
Interprete.
AD
12 13 15 18 19 20 21 25 26 28 30 34
12
Al tener 12 datos, calculamos el ı́ndice de posición de la mediana: i = = 6, como el
2
valor de “i” es entero, quiere decir que la mediana está ubicada entre la posición “6”
y la posición “7”, por lo tanto la mediana será el promedio de los valores de los datos
ubicados en los lugares “6” y “7”, es decir:
-I I
22
20 + 21
mediana = = 20.5
20
Eso quiere decir que a lo sumo el 50 % de estas personas tiene menos de 20.5 años y a
lo sumo el 50 % tiene más de 20.5 años.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 53
Debemos tener claro que en la distribución elaborada, los datos ya están ordenados.
EP
Tampoco olvide que la frecuencia simplemente resume las veces que se repite una
UD
26 + 26
mediana = = 26
-L
2
S
PU
Eso quiere decir que a lo sumo el 50 % de estas personas disléxicas leyeron menos de
26 palabras y a lo sumo el 50 % leyó más de 26 palabras.
M
CA
donde:
E
Para ilustrar el cálculo de la mediana con datos agrupados, lo haremos para el problema
visto en la sección 2.2.2.6 donde se elaboró la distribución de frecuencias agrupadas de la
variable X: número de veces que un cliente va al supermercado para una muestra de 51
-I I
clientes y que aparece en la Tabla 2.5. Con esa información nos preguntamos: ¿Cuál es la
22
[11 − 13⟩ 12 3
UD
[13 − 15] 14 2
Total 51
A
dicha posición. Si entendemos que la frecuencia indica la cantidad de datos que están en un
IM
intervalo entonces por la posición de la mediana se deduce que ella está ubicada en el tercer
-L
intervalo: [5 − 7⟩. Ahora sabiendo en qué intervalo está ubicada la mediana empleamos la
S
n
51
M
− fA − 23
M ediana = l + 2 ∗i=5+
2
∗ 2 = 5.33 (2.9)
CA
f 15
Eso quiere decir que a lo sumo el 50 % de estos clientes van al supermercado menos de
5.33 veces y a lo sumo el 50 % acude más de 5.33 veces.
2.3.1.5. Moda
La moda de un conjunto de datos es el valor que se presenta con mayor frecuencia. Cuando
dos valores se presentan con la misma frecuencia y ésta es la más alta, ambos valores son
modas, por lo que el conjunto de datos es bimodal. Cuando más de dos valores se presentan
E
con la misma frecuencia y ésta es la más alta, esos valores son modas, por lo que el conjunto de
AD
datos es multimodal. Cuando ningún valor se repite (o se destaca por su mayor frecuencia),
se dice que no hay moda.
Algunas propiedades de la moda son:
Para Datos agrupados: La moda es el punto medio o marca de clase del intervalo con
22
mayor frecuencia.
20
3550, 3310, 3480, 3490, 3520, 3650, 3925, 3355, 3450, 3480. Calcule e interprete la moda
de dichos sueldos.
El sueldo que más se repite es 3480 soles (2 veces), por tanto esa es la moda, es decir,
el sueldo más frecuente de esos egresados es 3480 soles.
2. Se toma una muestra de 12 personas y se les pregunta por su edad (años) y los datos
obtenidos son: 28,12,34,15,13,21,18,20,30,26,19,25 ¿Cuál es la moda de estas edades?
Como no hay edad que se repita, en este conjunto no hay moda.
EP
3. Para ilustrar el cálculo de la moda con datos agrupados, lo haremos para el problema
visto en la sección 2.2.2.6 donde se elaboró la distribución de frecuencias agrupadas de
UD
[1 − 3⟩ 2 9
M
[3 − 5⟩ 4 14
CA
[5 − 7⟩ 6 15
[7 − 9⟩ 8 5
[9 − 11⟩ 10 3
[11 − 13⟩ 12 3
[13 − 15] 14 2
Total 51
E
Para datos agrupados, la moda es la marca de clase del intervalo con mayor frecuencia,
AD
Estas medidas nos proporcionan información adicional que nos permite juzgar la
confiabilidad de nuestra medida de tendencia central. Si los datos están muy dispersos la
posición central es menos representativa de los datos, como un todo, que cuando estos se
agrupan más estrechamente alrededor de la media.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 56
decir: R = Xmax − Xmin . Se dice que el rango mide la dispersión total en el conjunto de
datos.
UD
Es una medida que puede ser muy útil, dada la facilidad con que se calcula; pero en
ciertas ocasiones puede dar una idea equivocada de la variabilidad de los datos, ya que no
toma en cuenta cómo se distribuyen los datos entre el valor más grande y más pequeño; por
A
ejemplo, cuando uno de los datos difiere significativamente de los demás (se ve influido por
IM
Con los datos de la encuesta a 11 recién egresados del programa de administración donde
S
les preguntó sobre el sueldo mensual inicial (en soles) que recibieron y obtuvo los siguientes
PU
datos: 3540, 3550, 3310, 3480, 3490, 3520, 3650, 3925, 3355, 3450, 3480. El rango de sueldos
M
Suponga que uno de los recién egresados haya tenido $10 000 como sueldo inicial, entonces
el rango será: 10 000-3310 =6690 en lugar de 615. Un valor ası́ no serı́a muy descriptivo de la
variabilidad de los datos ya que 10 de los 11 sueldos se encuentran entre 3310 y 3650 soles.
Las descripciones más comprensibles de la dispersión son aquellas que tratan con la
desviación promedio con respecto a alguna medida de tendencia central. Veremos dos medidas
que nos dan una distancia promedio con respecto a la media de la distribución: la varianza
y la desviación estándar.
2.3.2.2. Varianza y desviación estándar o tı́pica
E
La varianza es una medida de variabilidad que utiliza todos los datos. La varianza está
AD
como sigue:
P
N
(xi − µ)2
i=1
σ2 = (2.10)
N
En la mayor parte de las aplicaciones de la estadı́stica, los datos a analizar provienen
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 57
de una muestra. Cuando se calcula la varianza muestral, lo que interesa es emplearla para
estimar la varianza poblacional σ 2 . Aunque una explicación detallada está más allá del alcance
de estos apuntes, es posible demostrar que si la suma de los cuadrados de las desviaciones
respecto de la media se divide entre n − 1, en lugar de entre n, la varianza muestral que se
obtiene constituye un estimador no sesgado de la varianza poblacional (Anderson y Sweeney,
2008). Por esta razón, la varianza muestral, que se denota por s2 , se define como sigue:
P
n
(xi − x)2
2 i=1
s = (2.11)
EP
n−1
UD
Las unidades de la varianza son las unidades de la variable en estudio, pero elevadas al
cuadrado (pesos al cuadrado, unidades al cuadrado, etc.) lo que hace que no sean claras o
fáciles de interpretar. Ante ese inconveniente surge la desviación estándar.
La desviación estándar se define como la raı́z cuadrada positiva de la varianza.
A
Continuando con la notación adoptada para la varianza muestral y para la varianza
IM
sigue: v
uN
uP
M
u 2
t i=1 (xi − µ)
CA
11 − 1 10
√
Luego la desviación estándar será: s = 26246.82 = 162 soles, es decir, que en promedio
lo que se aleja o desvı́a algunos de esos sueldos respecto del sueldo promedio de la muestra
es 162 soles.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 58
P
k
(xc − x)2 .fc
c=1
s2 = (2.14)
n−1
donde:
fc =frecuencia del intervalo respectivo xc =Marca de clase del intervalo respectivo
EP
Empleando los valores de dicha Tabla, primero se calcula la media de los datos agrupados
(ver sección 2.3.1.2), que resultó ser: x = 5.84 veces. Ahora aplicando la expresión (2.14)
M
calculamos la varianza:
CA
porcentaje. Esta medida estadı́stica se utiliza para comparar conjuntos de datos que tienen
diferentes unidades o cuyos valores medios son muy diferentes.
22
20
s σ
CV = ∗ 100 % : muestral CV = ∗ 100 % : poblacional (2.15)
x µ
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 59
Para ilustrar el cálculo del coeficiente de variación, suponga que el gerente de operaciones
de un servicio de paqueterı́a desea adquirir una nueva flotilla de vehı́culos. Cuando los
paquetes se guardan con eficiencia en el interior de los vehı́culos durante la preparación de
las entregas, se deben considerar dos restricciones principales: el peso (en libras) y el volumen
(en pies cúbicos) de cada paquete. Ahora suponga que en una muestra de 200 paquetes, el
peso promedio es 26,0 libras con una desviación estándar de 3.9 libras. Además, suponga que
el volumen promedio de cada paquete es 8.8 pies cúbicos con una desviación estándar de 2.2
pies cúbicos. ¿Cómo se puede comparar la variación del peso y el volumen?
Como las unidades de medida difieren para las restricciones de peso y volumen, si el
EP
gerente de operaciones desea comparar las fluctuaciones en estas medidas, debe considerar la
UD
Veamos otro ejemplo: un inversionista potencial piensa adquirir acciones en una de dos
compañı́as, A o B, listadas en la Bolsa de Valores de Lima. Si ninguna de las compañı́as
-L
ofrece dividendos a sus clientes y ambas tienen igual clasificación en términos de crecimiento
S
PU
promediado $ 50 en el último año, con una desviación estándar de $ 10. Además, suponga
CA
que durante el mismo periodo el precio promedio de las acciones en la compañı́a B fue de $ 12
con una desviación estándar de $4. ¿Cómo puede determinar el inversionista cuáles acciones
son más variables?
En términos de las desviaciones estándar, el precio de las acciones de A parece más
variable que el de las acciones de B. Sin embargo como los precios promedios por acción de
las dos compañı́as son tan diferentes, serı́a más conveniente que el inversionista potencial
considerara la variabilidad en precio respecto al promedio a fin de examinar la relación:
variabilidad / estabilidad de ambas acciones. Para la compañı́a, el coeficiente de variación
E
$10
es CVA = ∗ 100 % = 20 % y para la compañı́a B, el coeficiente de variación es
AD
$50
$4
CVB = ∗ 100 % = 33.3 %. Entonces, en relación con la media, el precio de las acciones B
$12
es mucho más variable que el de las acciones A.
Algunas propiedades del coeficiente de variación son:
No cambia de valor cuando se multiplica por una constante K a cada una de las
20
observaciones.
un conjunto que se encuentran dentro de k desviaciones estándar con respecto a la media del
conjunto es igual a:
-L
1
S
1− , (2.16)
k2
PU
donde k es cualquier positivo mayor que 1. Para ilustrar el uso del teorema de Chebyshev,
M
suponga que en una muestra de personas, la edad promedio es 30 años y la desviación estándar
CA
es 5 años. ¿Cuántas personas como mı́nimo tienen entre 20 y 40 años?, ¿y entre 22 y 38 años?
20 − 30
En el caso del intervalo de 20 a 40 se observa que: = −2, es decir 20 está dos
5
40 − 30
desviaciones estándar debajo de la media y que = 2, es decir, 40 está dos desviaciones
5
estándar por encima de la media, por lo tanto ese intervalo representa 2 desviaciones estándar
con respecto de la media, es decir, k=2. Entonces mediante el teorema de Chebyshev se
encuentra que:
1 1
1− = 1 − 2 = 0.75,
k2 2
E
AD
esto quiere decir, que de ese grupo de personas, por lo menos el 75 % tienen entre 20 y 40
años.
22 − 30
En el caso del intervalo de 22 a 38 se observa que: = −1.6, es decir 22 está
5
38 − 30
1.6 desviaciones estándar debajo de la media y que = 1.6, es decir, 38 está 1.6
5
desviaciones estándar por encima de la media, por lo tanto ese intervalo representa 1.6
desviaciones estándar con respecto de la media, es decir, k=1.6. Entonces mediante el teorema
de Chebyshev se encuentra que:
-I I
1 1
1− =1− = 0.61,
22
k 2 1.62
20
esto quiere decir, que de ese grupo de personas, por lo menos el 61 % tienen entre 22 y 38
años.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 61
los datos están igualmente dispersos por encima y por debajo de la media, el coeficiente de
UD
i=1
Pearson:
S
PU
3 ∗ (media − mediana)
Sk = (2.18)
M
s
CA
Con esta última expresión se busca describir la forma como se distribuyen los datos de un
conjunto, comparando la media y la mediana. Si ambas medidas son iguales, por lo general
se considera que los datos son simétricos (o con sesgo cero), por el contrario, los datos o
su distribución es asimétrica o sesgada, es decir: si la media excede a la mediana, los datos
se describen como sesgados a la derecha, o con sesgo positivo (el coeficiente de asimetrı́a es
positivo). Si la mediana excede a la media, los datos suelen llamarse sesgados a la izquierda,
o con sesgo negativo (el coeficiente de asimetrı́a es negativo).
El sesgo positivo surge cuando la media aumenta debido a algunos valores grandes y poco
usuales; el sesgo negativo ocurre cuando la media se reduce debido a algunos valores muy
E
AD
pequeños. Los datos son simétricos cuando en realidad no hay valores extremos en ninguna
dirección, de tal manera que la presencia de valores grandes y pequeños se equilibran.
La figura 2.8 muestra la forma de tres conjuntos de datos. Los datos en el cuadro (a) tienen
sesgo negativo o a la izquierda. Se observa una cola larga o distorsión hacia la izquierda,
causada por valores en extremo pequeños. Estos valores tan pequeños jalan a la media hacia
abajo y resulta menor que la mediana. Los datos en el cuadro (b) son simétricos; cada mitad
de la curva es la imagen de espejo de la otra mitad. Los valores grandes y pequeños se
compensan y la media es igual a la mediana. Los datos en el cuadro (c) tienen un sesgo
-I I
positivo o a la derecha. Se observa una cola larga o distorsión hacia la derecha, causada por
22
valores muy grandes. Estos valores en extremo grandes, jalan la media hacia arriba y resulta
20
No depende de las unidades de medida de las variables, por tanto, no tiene unidades.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 62
Para ilustrar el cálculo e interpretación del coeficiente de asimetrı́a, supongamos que una
muestra de digitadoras de textos reveló que su rapidez media de tecleo es de 87 palabras por
minutos, con una mediana de 73. La desviación estándar es de 16.9 palabras por minuto.
A
Para calcular el coeficiente de asimetrı́a empleamos la expresión (2.18) y tenemos:
IM
Sk = = = 2.49
s 16.9
S
PU
distribución de la rapidez de tecleo. Algunas operadoras muy rápidas hacen que la media sea
CA
n
X
22
(xi − x)4
20
i=1
k= −3 (2.19)
n ∗ s4
No depende de las unidades de medida de las variables, por tanto, no tiene unidades.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 63
este valor tiene dentro del conjunto analizado o distribución de valores de la variable.
-L
Los cuartiles son las medidas de posición “no central” que se utilizan con mayor
frecuencia y se emplean sobre todo para resumir o describir las propiedades de conjuntos
M
grandes de datos numéricos. Mientras que la mediana es un valor que parte el arreglo ordenado
CA
por la mitad (a lo sumo 50.0 % de las observaciones son menores, y 50.0 % son mayores), los
cuartiles son medidas descriptivas que parten los datos ordenados en cuatro partes.
Entonces, dado un conjunto de datos ordenados en forma ascendente, los cuartiles son
los valores que dividen en cuatro partes iguales al conjunto.
El primer cuartil, Q1 (o 25 % percentil) es un valor tal que, a lo sumo, la cuarta parte
de los datos es menor que Q1 , y, a lo sumo, las tres cuartas partes son mayores. El segundo
cuartil, Q2 , (o 50 % percentil) coincide con la mediana. El tercer cuartil, Q3 , (o 75 % percentil)
es un valor tal que, a lo sumo, las tres cuartas partes de los datos son menores que Q3 , y, a
E
existe un solo procedimiento para calcular percentiles, y las diferentes técnicas a menudo dan
20
resultados diferentes. Si utiliza una calculadora o un software que incluyan cuartiles, puede
obtener resultados que difieran un poco de las respuestas obtenidas utilizando la forma con
que se procederá en este texto.
El procedimiento de determinación de percentiles (cuartiles) será de la siguiente manera:
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 64
p
Como los cuartiles son percentiles especı́ficos para calcularlos hallaremos: i = ∗n ,
100
UD
teniendo en cuenta que para el primer cuartil, Q1 , (o 25 % percentil), p=25; y para el tercer
cuartil, Q3 , (o 75 % percentil), p=75.
Para ilustrar el cálculo e interpretación de los cuartiles suponga que tenemos el número de
rifas que han vendido 10 alumnos: 19,10,17,28,15,27,12,16,26,23. Para hallar los cuartiles de
A
IM
este conjunto de datos seguimos el procedimiento explicado lı́neas arriba. Primero debemos
ordenarlos:
S -L
10,12,15,16,17,19,23,26,27,28.
PU
M
2
el 50 % vendió por encima de esa cantidad.
Hallamos el ı́ndice
de posición
del tercer cuartil o sea del percentil 75 (p = 75), entonces:
p 75
i= ∗n = ∗ 10 = 7.5, como el valor de i no es entero, entonces se redondea
100 100
al valor entero inmediato mayor: i = 8, es decir, el percentil 75 o tercer cuartil, es el valor
ubicado en la posición i = 8, entonces: Q3 = 26 rifas, es decir, que a lo sumo el 75 % de estas
personas vendió menos de 26 rifas y el 25 % vendió por encima de esa cantidad.
Veamos otro ejemplo para el cálculo e interpretación de los cuartiles, suponga que tenemos
-I I
este conjunto de edades seguimos el procedimiento explicado lı́neas arriba. Primero debemos
20
12,13,15,18,19,20,21,25,26,28,30,34
Hallamos el ı́ndice de posición del primer cuartil o sea del percentil 25 (p = 25), entonces:
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 65
p
25
i= ∗n = ∗ 12 = 3, como el valor de i es entero, el percentil 25 o primer
100 100
cuartil, es el promedio de las edades ubicadas en los lugares i = 3 e i + 1 = 4, entonces:
15 + 18
Q1 = = 16.5 años, es decir, que el 25 % de estas personas tiene menos de 16.5 años
2
y el 75 % tiene una edad superior.
Hallamos el ı́ndice de posición del segundo cuartil (la mediana) o sea del percentil 50
(p = 50), entonces:
p 50
i = ∗n = ∗ 12 = 6, como el valor de i es entero, el percentil 50 o la
100 100
mediana, es el promedio de las edades ubicadas en los lugares i = 6 e i + 1 = 7, entonces:
EP
20 + 21
Q2 = = 20.5 años, es decir, que la mitad de estas personas tiene menos de 20.5 años
2
UD
1. Definir el resumen de cinco números del conjunto, es decir, identificar el valor mı́nimo,
el máximo y calcular los tres cuartiles (Q1 , Q2 , Q3 ).
2. Se dibuja una caja cuyos extremos se localicen en el primer y tercer cuartil. Esto
significa que la caja contiene el 50 % de los datos centrales.
caja.)
20
de los datos) va desde el extremo derecho de la caja hasta el máximo valor del conjunto
de datos.
Luego de dibujar el diagrama de caja-bigotes podemos identificar qué datos del conjunto
analizado son atı́picos. Para saberlo se sigue el siguiente proceso:
2. Calcular 1.5*RIC.
4. Los datos que sean menores que Q1 − 1.5 ∗ RIC y mayores que Q3 + 1.5 ∗ RIC, se
consideran observaciones atı́picas.
150,169,171,172,172,175,176,177,178,179,181,182,183,184,184.
M
del conjunto, es decir, identificar el valor mı́nimo, el máximo y calcular los tres cuartiles
(Q1 , Q2 , Q3 ). La estatura mı́nima es 150 y la máxima es 184. Enseguida hallamos los cuartiles
de las estaturas:
Hallamos el ı́ndice
de posición del primer cuartil o sea del percentil 25 (p = 25), entonces:
p 25
i= ∗n = ∗ 15 = 3.75, como el valor de i no es entero, entonces se redondea
100 100
al valor entero inmediato mayor: i = 4, es decir, el percentil 25 o primer cuartil, es el valor
ubicado en la posición i = 4, entonces: Q1 = 172 cm.
Hallamos el ı́ndice de posición del
segundo
cuartil (la mediana) o sea del percentil 50
p 50
E
Para identificar qué estaturas del conjunto analizado son atı́picas seguimos el proceso ya
22
descrito:
20
Min Max
Q1 Q2 Q3
EP
UD
Estatura (cm)
A
IM
4. Las estaturas menores que 157 cm y mayores que 197 cm., se consideran estaturas
atı́picas. Como se aprecia la única estatura atı́pica es 150 cm.
M
CA
2.3.5.5. Puntuaciones z
El valor o puntuación z, sirve para comparar valores de un mismo conjunto de datos o
para comparar valores de distintos conjuntos de datos (Triola, 2018).
Una puntuación z (o valor estandarizado) se calcula convirtiendo un valor a una escala
estandarizada, como se establece en la siguiente definición. Utilizaremos ampliamente las
puntuaciones z en el capı́tulo 5 y en capı́tulos posteriores, ya que son muy importantes.
Una puntuación z es el número de desviaciones estándar que un valor de la variable de
estudio se encuentra por arriba o por debajo de la media de la variable. Se calcula utilizando
las siguientes expresiones:
E
AD
x−x x−µ
z= : muestral o z= : poblacional (2.20)
s σ
conjuntos de datos distintos que tengan el mismo valor z tienen la misma localización relativa;
es decir, se encuentran al mismo número de desviaciones estándar de la media. Algunas
caracterı́sticas de las puntuaciones z son:
estándar de 12. ¿En qué examen obtuvo Natalia un mejor resultado, en comparación con el
UD
x−x 82 − 72
z= = = 1.25
s 8
S -L
El puntaje en matemáticas:
PU
x−x 86 − 68
M
z= = = 1.50
s 12
CA
Dado que ambos puntajes z son positivos, Natalia obtuvo un puntaje superior al promedio
en ambos exámenes, pero dado que su puntaje z para el examen de matemáticas es más alto
que su puntaje z para el examen de contabilidad, obtuvo mejor resultado en el examen de
matemáticas.
2.4. Problemas propuestos
1. Complete los espacios en blanco con la palabra o frases correctas.
datos.
AD
Si un conjunto de datos tiene una distribución con curtosis igual a cero se dice
que tiene una distribución denominada . . . . . . . . . . . .
22
20
2. Diez expertos clasificaron un producto de nuevo desarrollo con una calificación del 1 al
5. Sus calificaciones fueron las siguientes: 3.4 3.5 4.1 2.8 2.6 2.9 3.2 3.6
3.8 4.0. Determine la media, la mediana, el rango, la desviación estándar, la varianza,
el coeficiente de variación. Establezca, ası́ mismo, al menos una conclusión acerca de la
EP
dispersión.
UD
Mostrando cálculos:
S -L
5. Los siguientes datos son precios de renta mensual (en dólares) para una muestra de 10
departamentos en el centro de una ciudad grande, y una muestra de 10 departamentos
en un suburbio:
Centro de la ciudad : 955, 1000, 985, 980, 940, 975, 965, 999, 1247, 1119
E
Suburbio : 750, 775, 725, 705, 694, 725, 690, 745, 575, 800
AD
7. Suponga que una pequeña empresa de negocios emplea a ocho personas que gana entre
300 y 350 dólares al mes. El dueño de la empresa se remunera ası́ mismo con 1250
dólares al mes, y reporta al público en general que el salario medio en su empresa es
de 430 dólares al mes. Responda lo siguiente:
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 70
a) Aritméticamente ¿Es posible que 8 empleados ganen entre 300 y 350 dólares y que
uno gane 1250 dólares al mes y que la media sea 430 dólares? Explique.
b) Estadı́sticamente ¿Se basarı́a en el sueldo promedio para describir la tendencia
central del conjunto de sueldos de esta empresa? ¿si o no? ¿por qué?
lugar de cero, por lo cual cada uno de los tiempos fue medido con un excedente de 15
UD
segundos ¿ cuál fue entonces el tiempo medio correcto de los tres primeros finalistas?
un ingreso promedio de $1200000 con una desviación tı́pica de $180000 ¿En cuál de las
-L
10. Una compañı́a área estudia el peso de equipaje para cada pasajero. Para un grupo
grande de viajeros en vuelos nacionales, la media es 21.3 kg, con una desviación estándar
M
de 4.54 kg. Para un grupo grande de pasajeros de vuelos al extranjero, la media es 35.4
CA
kg y la desviación estándar, 6.8 kg. ¿Cuáles son más variables, los pesos de los equipajes
de los pasajeros de vuelos nacionales o los de vuelos al extranjero?
11. El promedio de sueldos de los empleados de una fábrica es una cierta cantidad. ¿Qué
contestarı́a usted, como jefe de personal, ante una queja de que nadie deberı́a ganar
por debajo del promedio, sea cual fuere éste?
12. Exprese cuál es la relación entre la mediana y la media de un conjunto de datos si dicho
conjunto tiene distribución con sesgo positivo. Explique a que se debe dicha relación.
E
AD
13. A continuación se presenta el número de cambios de aceite para los últimos 8 dı́as en
un taller de mantenimiento, localizado en San Borja: 41, 15, 39, 54, 31, 15, 56, 33.
Determine e interprete la media, la mediana,la moda, varianza, desviación estándar de
los datos.
14. ¿Cuál serı́a el valor modal que reportarı́a para un conjunto de observaciones si hay un
total de:
15. De un ejemplo de un conjunto de datos que sea trimodal, explicando por qué lo es.
20
16. Un hospital emplea 200 personas en su cuerpo de enfermeras. De ese personal, 50 son
ayudantes de enfermera, 50 son enfermeras prácticas y 100 son enfermeras registradas.
Las primeras reciben un sueldo de 615 soles mensuales, las segundas ganan 835 soles
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 71
mensuales, y las últimas 955 soles mensuales ¿Cuál es el sueldo promedio mensual
general?
Conjunto A: 7 5 11 8 3 6 2 1 9 8
Conjunto B: 7 5 6 6 6 4 8 6 9 3
Se le pide:
EP
a) Para cada conjunto hallar las medidas de tendencia central, variabilidad y posición.
UD
18. Una empresa productora de cı́tricos constata que las producciones de dos fincas son de
A
calidad distinta aunque utilizan la misma especie de árboles. Después de notar que los
IM
dos tipos de suelo son distintos (la finca A está constituida de suelo fino y homogéneo
-L
mientras que la finca B tiene una mezcla de suelo fino y suelo más grueso) decide hacer
S
PU
a) En base a la variabilidad relativa: ¿Qué son más variables: las densidades del suelo
de la finca A o las densidades del suelo de la finca B respecto de sus promedios
respectivos?
b) Considerando los datos de la muestra de la finca A ¿Entre qué valores deberán caer
al menos 75 % de dichas observaciones, de acuerdo con el teorema de Chebyshev?
coeficiente de asimetrı́a igual a cero se dice que tiene una distribución denominada
...............................
21. Un alumno al realizar un estudio sobre el número de hijos de las familias que viven en
cierta urbanización olvidó anotar información en la tabla siguiente:
(frecuencia)
0 10 0.25
1 22
2 30
A
IM
3 0.15
4
S -L
PU
a) Complete la tabla.
b) Calcule e interprete en términos del problema:la media, la mediana,la moda y la
M
23. Una medida útil para comparar la dispersión relativa de dos o más distribuciones de
datos, si están en distintas unidades, es el. . . . . . . . . . . . . . . . . . . . . . . .
24. Una muestra de ciudadanos de la tercera edad revelo que su ingreso anual de jubilación
tiene una media de 1340 soles. Puesto que la media se basa en una muestra, se dice que
-I I
27. La relación entre la media, la mediana y la moda, que se cumple en una distribución
asimétrica hacia la izquierda es . . . . . . . . . . . . . . . . . . . . . . . .
29. Se quiere comparar la variación en los precios anuales de acciones que se venden a
menos de 10 dólares y la variación en los precios de aquellas que se venden por arriba
de 60 dólares. El precio promedio de las acciones que se venden a menos de 10 dólares
es 5,25 dólares, y la desviación estándar es 1,52 dólares. El precio medio de las acciones
que se negocian a más de 60 dólares es 92,50 dólares, y su desviación estándar; 5,28
EP
dólares. ¿Qué medida de variabilidad emplearı́a para hacer la comparación? ¿por qué
UD
30. ¿Puede la varianza de un conjunto (suponga que el conjunto es una muestra) tener un
valor negativo? ¿si o no? ¿por qué?
A
IM
31. La producción media de papa, en toneladas, fue de 4000 con varianza de 3600 para el
departamento de Cuzco, mientras que para el departamento de Puno fue de 10 000 con
-L
varianza de 1440000 ¿en qué departamento se puede decir que la producción de papa
S
PU
es más homogénea?
M
de 11000 soles con una varianza de 2000. ¿Cuál serı́a el nuevo promedio y la nueva
varianza si se aumenta en 810 soles el salario de cada gerente? Demuestre y explique
cómo obtiene sus respuestas.
33. Para un determinado conjunto (muestra) de salarios, se obtuvo una media de $52,32 y
una desviación estándar de $10,25. Por efectos de recesión en el mercado, la gerencia
de la empresa se ve obligada a aplicar un factor de descuento k (0 < k < 1), a cada uno
de los salarios originales, es decir, cada salario queda multiplicado por esa constante
k. ¿Cuál serı́a el nuevo salario promedio y la nueva desviación estándar? ¿Cuál serı́a
E
34. Dados los siguientes datos calcular el primer, segundo y tercer cuartil.
955, 1000, 985, 980, 940, 975, 965, 999, 1247, 1119
35. El propietario de una pequeña empresa tiene asignado un salario de 4000 euros
mensuales. Los salarios de sus empleados son: 500, 550, 600, 700, 725, 770, 785, 800,
-I I
800, 825, 850, 900 930, 950, 1000, 1200, 1800. Considerando todos los salarios (incluido
el del propietario):
22
20
37. En una empresa el sueldo promedio por trabajador es de 360 dólares mensuales. Los
UD
38. Se tiene una muestra con media de 30 y desviación estándar de 5. Determine qué
A
proporción o porcentaje de los datos de dicha muestra se encuentran dentro de cada
IM
a) 20 a 40 c) 22 a 38 e) 12 a 48
S
PU
b) 15 a 45 d ) 18 a 42
M
CA
40. Se sabe que el 84 % de los sueldos en una compañı́a fluctúa entre 3000 y 8000 soles.
Sabiendo que la media de los sueldos es de 5500 soles, determine la desviación estándar.
41. La distribución de datos cuyo coeficiente de asimetrı́a es positivo se dice que tiene una
distribución. . . . . . . . . . . .
E
42. La distribución de datos cuyo coeficiente de curtosis es negativo se dice que tiene una
AD
distribución. . . . . . . . . . . .
44. Si las unidades de la variable a analizar son pulgadas, entonces las unidades de la
desviación estándar estarán en . . . . . . . . . . . . y las de la varianza en . . . . . . . . . . . .
45. Una empresa de jardinerı́a ofrece sus servicios por vı́a telefónica. A continuación se
indica el número de citas que se hizo en cada una de las últimas 25 horas de llamadas:
-I I
9 5 2 6 5 6 4 4 7 2 3 6 3 4 4 7 8 4 4 5 5 4 8 3 3
22
20
46. El gerente de un almacén esta interesado en el número de veces que un cliente compra
en su almacén durante un periodo de dos semanas. Las respuestas de 36 clientes fueron:
5 6 3 11 4 4 5 6 4
2 6 6 6 7 1 8 6 14
15 4 1 2 4 1 7 10 6
5 12 9 5 4 3 12 4 5
EP
47. Dos modos que usan los empleados para ir a trabajar diariamente son el transporte
público y el automóvil. A continuación vemos unas muestras de tiempos de cada modo.
A
Las cifras están en minutos.
IM
-L
Transporte público: 28 29 32 37 33 25 29 32 41 34
S
PU
Automóvil: 29 31 33 32 34 30 31 32 35 33
M
a) Calcule la media de la muestra del tiempo que se lleva en cada modo de transporte.
CA
48. El gobierno desea averiguar si el número medio de hijos por familia ha descendido
respecto de la década anterior. Para ello ha encuestado a 50 familias respecto al número
de hijos, y ha obtenido los siguientes datos:
E
0 0 1 2 1 1 2 2 2 1
AD
2 2 2 2 2 2 2 2 2 2
2 2 2 3 2 2 3 2 3 3
3 3 2 3 3 3 3 3 3 3
4 4 3 4 3 4 5 6 4 4
a) ¿Cuál es la variable en estudio? ¿De qué tipo es? ¿qué nivel de medición tiene?
b) Defina la frecuencia en términos del problema.
-I I
Una empresa ofrece asesorı́a financiera para solucionar deudas atrasadas con tarjetas
de crédito. Se realizó una encuesta a 12 jóvenes entre 18 y 25 años con una deuda en
su tarjeta de crédito por poco más de $ 5000, registrándose los montos (en dólares) que
cada uno de ellos pagó como abono a sus saldos el mes pasado:
439, 453, 457, 459, 475, 483, 526, 563, 566, 579, 599, 644.
51. Se sabe que el 84 % de los sueldos en una compañı́a fluctúa entre 3000 y 8000 soles.
También se sabe que el 75 % de los sueldos en dicha compañı́a fluctúa entre 3500 y 7500
-L
52. Una muestra de las compras de varios clientes de una gran tienda de almacenes dio por
M
X 1 2 3 4 5
f 6 10 9 8 7
53. Se identificó una muestra de estudiantes del campus que poseı́a automóviles y se registró
las marcas de los mismos. A continuación se presenta la muestra que se obtuvo ( T
-I I
TFTNTCFTVTFVNCNNTNCCTFTFTNCVNTCTTFNT
VCTFFCTTCTTFTF
acumulada
UD
25 0.05
26 5
27 37.5
A
28 24
IM
29 0.30
S -L
30
PU
M
a) Defina la variable de interés (X), de qué tipo es y qué nivel de medición tiene.
CA
55. Los siguientes datos ordenados son las edades de 50 personas que compraron televisores
plasma en la sucursal de Hiraoka en San Miguel, la semana anterior:
E
22 23 26 27 28 28 29 29 30 30
AD
30 31 31 31 32 32 32 32 33 33
33 34 35 35 35 35 36 36 36 36
37 37 37 38 40 40 40 41 41 41
42 43 44 45 46 48 50 51 55 56
Se le pide:
-I I
agrupados.
c) Calcular e interpretar los cuartiles de los datos agrupados.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 78
N° de hijos 0 1 2 3 4
N° de familias 23 84 69 19 5
57. El consumo de agua (en metros cúbicos.) de una muestra de hogares de Lima
A
Metropolitana se distribuye como sigue:
IM
-L
Consumo de agua (m3 ) [20 − 25⟩ [25 − 30⟩ [30 − 35⟩ [35 − 40⟩ [40 − 45]
S
N° de hogares 18 45 54 36 27
PU
58. Las edades de una muestra de los pacientes atendidos en la sección de Rayos X del
Hospital Almenara son las siguientes:
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 67 92 85 55 76
E
AD
52 10 64 75 78 25 80 95 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
Se le pide:
agrupados.
d ) Calcular e interpretar los cuartiles de los datos agrupados.
1, 76 1, 80 1, 90 2, 00 2, 05 2, 10 2, 18 2, 19 2, 21 2, 30 2, 34 2, 38
2, 40 2, 41 2, 46 2, 49 2, 55 2, 59 2, 60 2, 63 2, 64 2, 64 2, 68 2, 68
2, 71 2, 74 2, 76 2, 77 2, 80 2, 80 2, 85 2, 87 2, 89 2, 93 2, 93 3, 01
3, 05 3, 10 3, 11 3, 15 3, 22 3, 30 3, 35 3, 40 3, 50 3, 53
Se le pide:
agrupados.
d ) Calcular e interpretar los cuartiles de los datos agrupados.
60. La distribución del contenido de jugo (en mililitros o ml.) en una muestra de cajas de
A
IM
Volumen de jugo (ml.) [280 − 290⟩ [290 − 300⟩ [300 − 310⟩ [310 − 320⟩ [320 − 330]
N° de cajas 24 37 44 31 14
M
CA
61. Se realizó una encuesta sobre los diferentes medios tecnológicos domésticos y el empleo
de ellos por parte de personas de 12 años a más. Los siguientes datos ordenados
representan el tiempo (en horas) de empleo de computadoras personales en casa durante
E
1.5 3.4 4.1 5.7 8.8 1.5 3.5 4.2 5.9 9.2
1.6 3.7 4.3 5.9 9.5 2.0 3.7 4.4 6.1 10.3
2.8 3.9 4.7 6.1 10.4 3.0 3.9 4.8 6.1 10.8
3.1 4.0 5.4 6.2 11.1 3.1 4.1 5.6 7.1 12.1
3.1 4.1 5.7 7.2 12.9 3.3 4.1 5.7 7.6 14.8
-I I
a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
22
62. El volumen (en litros) de jugo de sauco que una máquina de llenado automático deposita
A
en botellas de 2 litros se controla periódicamente. La semana pasada se seleccionó una
IM
de jugo de sauco en cada una de esas botellas. A continuación se presentan los datos
S
1.894 1.908 1.938 1.941 1.941 1.947 1.951 1.951 1.953 1.957
CA
1.960 1.963 1.967 1.969 1.971 1.973 1.975 1.977 1.978 1.980
1.981 1.982 1.983 1.984 1.986 1.988 1.992 1.994 1.996 1.997
2.003 2.005 2.010 2.012 2.013 2.014 2.015 2.023 2.025 2.029
2.031 2.036 2.038 2.052 2.057 2.065 2.066 2.075 2.086 2.109
a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
la “frecuencia” en términos del problema.
b) Elabore una distribución de frecuencias agrupadas de la variable de estudio.
E
AD
63. Se han tomado muestras de 64 sacos de un alimento balanceado para ganado que han
enviado dos proveedores, para medir el porcentaje de proteı́na. En la siguiente tabla se
muestran los valores obtenidos.
a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
la “frecuencia” en términos del problema.
M
CA
64. Cierta fábrica tiene un departamento de producción y otro de ventas. Las tablas
-I I
a continuación muestran los salarios percibidos hasta fines de marzo de este año
22
a) ¿Cuáles son más variables: los salarios del departamento de producción o los
salarios del departamento de ventas?
b) Si compara la mediana y la media de los salarios respectivos: ¿Qué tipo de sesgo
tienen los salarios del departamento de producción?¿y los del departamento de
A
IM
ventas?
-L
de ventas?
M
65. Los siguientes datos ordenados representan los precios (en soles) de las acciones al
cierre de la bolsa para una muestra aleatoria de 50 emisiones negociadas en la Bolsa de
Valores de Lima.
E
AD
3.75 6.00 12.30 15.88 21.40 23.50 25.00 33.38 37.50 53.88
3.75 6.12 12.38 18.75 21.88 24.00 26.00 35.0 46.0 57.50
4.75 8.25 12.88 19.00 22.50 24.00 27.12 35.25 46.20 59.12
5.50 8.62 14.25 20.38 22.62 25.00 29.38 36.12 46.38 64.75
5.75 8.75 15.50 20.62 23.50 25.00 31.00 36.50 48.30 80.50
a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
-I I
0.094 0.101 0.106 0.109 0.111 0.113 0.117 0.119 0.122 0.129
-L
0.098 0.102 0.107 0.110 0.112 0.113 0.117 0.120 0.123 0.130
S
PU
0.099 0.103 0.107 0.110 0.112 0.115 0.118 0.120 0.124 0.132
M
0.100 0.103 0.108 0.111 0.112 0.115 0.118 0.121 0.126 0.134
CA
0.100 0.105 0.108 0.111 0.113 0.117 0.119 0.122 0.128 0.135
a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
la “frecuencia” en términos del problema.
b) Elabore una distribución de frecuencias agrupadas de los datos de la variable de
estudio.
c) Basándose en la distribución que ha elaborado, diga aproximadamente:
c.1 ¿Qué porcentaje de estudiantes reaccionan a un estı́mulo en menos de 0.106
E
segundos?
AD
de reacción?
22
estudiantes.
f ) Calcule exactamente el tiempo de reacción que es excedido por el 75 % de los
estudiantes.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 84
67. Se escogen 50 dı́as al azar y se computa el número de vehı́culos que usan una
determinada carretera. La media correspondiente a los datos obtenidos es 385; la
desviación tı́pica es 15. Calcule la proporción de dı́as en los que el número de autos que
usó dicha carretera estuvo entre 340 y 430.
68. Un agricultor obtuvo una gran cosecha de melones. De los 50 camiones que salieron
cargados, él seleccionó al azar un melón de cada uno y les midió el diámetro (en cm.).
Los resultados ordenados de esta muestra fueron los siguientes:
EP
UD
a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
la “frecuencia” en términos del problema.
b) Elabore una distribución de frecuencias agrupadas de la variable de estudio.
c) Calcule e interprete en términos del problema: la media, la mediana, la moda, la
varianza y la desviación estándar de los datos agrupados. ¿Qué tipo de sesgo tiene
E
AD
la distribución?
d ) Si acaba de calcular la media y la desviación estándar del conjunto de datos
agrupados, defina mediante el Teorema de Chebyshev, en qué intervalo se
encuentra, como mı́nimo, el 45 % de los datos.
e) ¿Cuál es el diámetro que es excedido por el 75 % de los melones?
f ) Represente gráficamente la distribución elaborada en el apartado b) a través de
un histograma de porcentajes y el polı́gono de porcentajes correspondiente.
-I I
69. En una compañı́a, se toma una muestra de 200 empleados y se observa que en dicha
22
A
IM
S -L
PU
M
CA
53, 55, 57, 73, 73, 78, 81, 83, 85, 87, 87, 88, 88, 88, 90, 93, 93, 94, 95, 96, 99.
72. La tabla adjunta indica la Distribución del Coeficiente Intelectual (CI) de una muestra
de 120 alumnos de un colegio:
[90 − 100⟩ 46
22
[100 − 110⟩ 35
20
[110 − 120⟩ 5
[120 − 130⟩ 3
[130 − 140] 1
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 86
73. El siguiente conjunto de datos ordenados representan el diámetro de cintura (en cm.),
A
IM
de una muestra de 40 pacientes, cuyas edades oscilan entre 17 y 58 años, que acudieron
al Instituto Nacional de Nutrición el lunes pasado:
S -L
PU
a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
la “frecuencia” en términos del problema.
b) Elabore una distribución de frecuencias agrupadas de los datos de la variable de
estudio.
E
c.1 ¿por encima de cuántos cm., mide el diámetro de cintura del 27.5 % de los
pacientes?
c.2 ¿Qué porcentaje de pacientes tiene menos de 92 cm. de diámetro de cintura?
c.3 Representar el histograma de porcentajes y el polı́gono de porcentajes
correspondiente
c.4 ¿Cuál es el diámetro promedio de cintura de esa muestra de pacientes?¿Cuál
es la mediana del diámetro de cintura? Interprete los resultados.
-I I
2, 3, 5, 0, 1, 4, 0, 6, 2, 1, 1, 0, 2, 4, 5, 3, 1, 2, 3, 2, 3, 1, 2, 4, 4,
2, 5, 4, 1, 3, 2, 6, 8, 2, 0, 1, 0, 2, 3, 1, 5, 10, 2, 1, 3, 6, 2, 0, 1, 3
EP
a) ¿Cuál es la variable en estudio y de qué tipo es? ¿Qué nivel de medición tiene?
UD
¿por qué?
b) Defina la frecuencia en términos del problema.
c) Elabore una distribución de frecuencias no agrupadas de los datos y grafı́quela.
d ) ¿Cuántas páginas presentan dos o más errores tipográficos, pero menos de 4?
A
IM
75. Los siguientes datos ordenados son los consumos en cafeterı́a (en soles) realizados por
M
CA
36, 37, 41, 44, 45, 47, 47, 49, 50, 50, 54, 55, 56, 56, 62, 63, 68, 75, 87, 88.
76. El sueldo medio de los obreros de una fábrica es de $980. Mostrando el planteamiento y
E
Empresa A Empresa B
Ingreso mensual Nro. de Ingreso mensual Nro. de
(cientos de soles) empleados (cientos de soles) empleados
-I I
a) ¿Cuáles son más variables: los ingresos mensuales de los trabajadores de la empresa
A o de la empresa B?
b) Si compara la mediana y la media de los ingresos mensuales respectivos: ¿Qué tipo
de sesgo tienen los ingresos de la empresa A?¿y en la empresa B?
c) Basándose en el rango intercuartı́lico, sustente ¿qué valores de ingreso mensual
se considerarı́an atı́picos en la empresa A? y ¿en la empresa B?
d ) ¿ Cuál es intervalo simétrico, alrededor del ingreso mensual promedio de la empresa
A, en el que se encuentra como mı́nimo el 72 % de los ingresos mensuales de los
EP
79. Explique (máximo en tres lı́neas) para qué sirve el Teorema de Chebyshev.
0.03 0.11 0.23 0.33 0.61 0.93 1.11 1.40 1.91 2.63
0.03 0.12 0.24 0.36 0.73 0.97 1.14 1.44 1.93 2.66
0.04 0.14 0.29 0.47 0.85 0.99 1.18 1.71 1.96 2.93
E
0.05 0.22 0.29 0.51 0.86 1.05 1.21 1.79 2.21 3.20
AD
0.07 0.22 0.31 0.60 0.86 1.06 1.35 1.88 2.34 3.53
a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
la “frecuencia” en términos del problema.
b) Elabore una distribución de frecuencias agrupadas.
c) Basándose en la distribución que ha elaborado, diga aproximadamente:
c.1 ¿Qué porcentaje de ratas sobreviven menos de 2 horas?
-I I
correspondiente
c.4 ¿Cuál es el tiempo promedio de sobrevivencia? Interprete el resultado.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 89
4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.
A
a) ¿Cuál es la variable en estudio y de qué tipo es? ¿Qué nivel de medición tiene?
IM
¿por qué?
-L
de horas-obrero totales requeridas para realizar cierta tarea. Los datos recogidos son:
AD
95,97,100,106,109,111,112,116,119,124,124,125,128,131,131,132,133,135,135,145
1, 4, 1, 3, 5, 3, 2, 4, 1, 0, 2, 3, 2, 3, 2, 1, 0, 3, 1, 0, 1
a) ¿Cuál es la variable en estudio y de qué tipo es? ¿Qué nivel de medición tiene?
¿por qué?
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 90
84. Javier Torres administra una cabina de internet y está buscando introducir mejoras
en el servicio. Para tal fin, Javier registró los tiempos (en minutos) que utilizaron 56
EP
a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
la “frecuencia” en términos del problema.
b) Elabore una distribución de frecuencias agrupadas de los datos de la variable de
estudio.
c) Basándose en la distribución que ha elaborado, diga aproximadamente:
c.1 ¿Qué porcentaje de usuarios emplean la cabina de internet por debajo de 28
minutos?
E
AD
c.2 ¿por encima de qué tiempo de uso se encuentran los tiempos de aproximada-
mente 26 % de los usuarios?
c.3 Representar el histograma de porcentajes y el polı́gono de porcentajes
correspondiente
d ) Calcule e interprete en términos del problema, la media, la mediana y la desviación
estándar de las tiempos agrupados. ¿Qué tipo de sesgo tiene la distribución de los
tiempos?
e) Calcule exactamente el tiempo que es excedido por el 75 % de los usuarios.
-I I
22
150,169,171,172,172,175,176,177,178,179,181,182,183,184,184.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 91
Peso (toneladas métricas) [5 − 25⟩ [25 − 45⟩ [45 − 65⟩ [65 − 85⟩ [85 − 105]
N° de barcos
UD
5 17 30 25 3
Mostrando cálculos:
N° de asignaturas (X) 1 2 3 4 5 6
CA
N° de alumnos (f) 15 16 30 25 9 5
Mostrando cálculos:
88. La distribución de las edades de una muestra de personas que contrajeron matrimonio
durante el año pasado en un distrito es la siguiente:
E
Edad (años) [18 − 28⟩ [28 − 38⟩ [38 − 48⟩ [48 − 58⟩ [58 − 68]
AD
N° de personas 80 136 46 16 6
Mostrando cálculos:
Se han estudiado 200 cajas de 100 bombillas cada una, obteniéndose la siguiente
22
distribución:
20
Mostrando cálculos:
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 92
90. En una comunidad formada por 100 vecinos, éstos han sido clasificados atendiendo al
número de personas que forman cada familia:
Mostrando cálculos:
EP
UD
91. Un vendedor opera con dos empresas de las que percibe semanalmente alrededor de
A
165,66 y 216,87 dólares de comisión respectivamente. El importe de las comisiones
IM
dólares/semana. ¿En cuál de las dos empresas el importe de las comisiones es más
M
92. Indique cuál serı́a la relación existente entre la media y la mediana en una distribución
de datos con sesgo negativo. Explique claramente a qué se debe dicha relación.
94. Un joven que desea adquirir un par de zapatillas deportivas, entra a un negocio donde
tienen a la venta una gran variedad de tipos y marcas de dichas zapatillas. Consulta a
un vendedor, quien le suministra una lista con todas las variedades y sus respectivos
precios. El joven calcula rápidamente el promedio y la desviación estándar de dichos
E
precios que resultan de $68 y $17 respectivamente. Luego consulta al vendedor acerca
AD
de las formas de pago posibles y éste le informa que los precios de la lista corresponden
a pagos al contado en efectivo, pero que además puede pagar con tarjeta. Si paga con
tarjeta, el precio de lista sufre un recargo de $2 en concepto de gastos administrativos.
95. Indique cuál serı́a la relación existente entre la mediana y la media en una distribución
20
de datos con sesgo positivo. Explique claramente a qué se debe dicha relación.(máximo
4 renglones)
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 93
97. La Asociación de Propietarios de Hoteles llevó a cabo una encuesta relativa a las tarifas
de hotel entre semana. A continuación aparece la tarifa (en dólares) por cuarto para
huéspedes de negocios en una muestra de 10 hoteles:
a) La desviación tı́pica.
b) Los cuartiles.
1 4 4 1 3 5 3 2 4 1 6 2 3 4
5 5 6 2 3 3 2 2 1 8 3 5 3 4 7 2 3.
-I I
22
a) ¿Cuál es la variable en estudio? ¿De qué tipo es? ¿qué nivel de medición tiene?
20
99. Actualmente, existe una competencia creciente entre los operadores de estaciones de
servicio (grifos) en la ciudad de Ica. Los siguientes datos ordenados representan las
ventas diarias (miles de nuevos soles) en 40 grifos de la ciudad:
EP
17.9 25.6 28.2 30.0 31.7 35.1 37.3 37.9 38.9 39.0
UD
39.2 39.8 40.6 41.5 42.6 45.0 45.6 47.9 49.1 50.3
51.4 51.9 52.5 52.7 53.9 54.7 55.2 58.3 58.6 61.7
63.0 65.2 66.2 67.9 68.1 68.3 72.7 72.8 77.2 87.0
A
IM
a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
-L
c.1. ¿Qué porcentaje de grifos tiene ventas diarias por debajo de 41000 nuevos
soles?
c.2. ¿por encima de qué nivel de ventas diarias se encuentran las ventas de
aproximadamente 23 % de los grifos?
c.3. Representar el histograma de porcentajes y el polı́gono de porcentajes
correspondiente.
d ) Calcule e interprete en términos del problema, la media, la mediana y la desviación
estándar de las ventas agrupadas. ¿Qué tipo de sesgo tiene la distribución de las
E
ventas?
AD
100. Se han medido los niveles de ozono alrededor de la costa norte. Las concentraciones de
magnitud alrededor de 220 unidades por billón pueden ocasionar quemaduras en los
ojos y son peligrosas para la vida animal. Se han obtenido los siguientes datos:
160 160 161 161 162 162 162 163 163 163 164 165 167 167 168
-I I
169 170 172 173 176 178 179 180 185 196
22
20
101. Una empresa ofrece asesorı́a financiera para solucionar deudas atrasadas con tarjetas
de crédito. Se realizó una encuesta a 10 jóvenes entre 18 y 25 años con una deuda en
su tarjeta de crédito por poco más de $5000, registrándose los montos (en dólares) que
cada uno de ellos pagó como abono a sus saldos el mes pasado:
435 465 495 505 515 545 550 555 565 630
a) La desviación tı́pica.
EP
b) Los cuartiles.
UD
102. En un negocio de ventas de frutas del paı́s, se examinó un lote de 25 cajas de manzanas,
cada una teniendo un contenido de 48 manzanas. El número de manzanas en mal estado
en cada caja fue:
A
IM
3 4 1 2 1 2 5 2 1 2 3 0 1
-L
0 3 3 2 0 2 1 3 4 1 2 2
S
PU
a) ¿Cuál es la variable en estudio? ¿De qué tipo es? ¿qué nivel de medición tiene?
M
103. El sueldo promedio de los empleados de una empresa es de 134400 unidades monetarias.
El 30 % de los empleados son hombres y el porcentaje restante son mujeres. Si se sabe
que el sueldo promedio de los hombres es 40 % superior al sueldo promedio de las
mujeres ¿Cuál es el sueldo promedio de los hombres?¿y el sueldo promedio de las
mujeres? Explique la simbologı́a que defina y cálculos que realice.
104. A 48 madres de familia se les preguntó respecto al número de veces a la semana que
incluyen carne de res en el menú del dı́a. Las respuestas obtenidas fueron las siguientes:
-I I
2, 2, 1, 1, 3, 4, 0, 0, 0, 1, 1, 1, 2, 2, 1, 0, 0, 0, 0, 5, 5, 1, 2, 2,
22
1, 1, 1, 2, 1, 3, 4, 3, 4, 1, 2, 1, 1, 1, 2, 2, 2, 3, 5, 0, 0, 0, 2, 1.
20
a) ¿Cuál es la variable en estudio y de qué tipo es? ¿Qué nivel de medición tiene?
¿por qué?
b) Defina la frecuencia en términos del problema.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 96
105. La empresa textil DELTA contrata a una empresa que se dedica a preparar dietas
con el fin de mejorar la calidad nutricional del menú diario brindado en el comedor de
UD
41.8 52.7 62.3 67.9 71.7 74.6 76.9 80.2 85.7 90.4
-L
44.8 57.3 63.7 68.8 72.3 75.6 77.1 81.7 86.8 94.4
S
PU
46.4 60.2 65.2 70.4 73.2 75.8 77.4 82.1 87.3 94.6
M
49.9 61.4 67.3 71.4 73.6 76.3 78.3 82.9 88.3 99.3
CA
a) Defina la variable de interés, de qué tipo es y qué nivel de medición tiene. Defina
la “frecuencia” en términos del problema.
b) Elabore una distribución de frecuencias agrupadas de los datos de la variable de
estudio.
c) Basándose en la distribución que ha elaborado, diga aproximadamente:
c.1 ¿Qué porcentaje de empleados pesa menos de 66 kg.?
c.2 ¿Cuánto pesa como mı́nimo, el 22 % de los empleados?
E
correspondiente
c.4 ¿Cuál es el peso promedio de esa muestra de empleados?¿Cuál es la mediana
de dichos pesos? Interprete los resultados.
c.5 Calcule e interprete en términos del problema la moda y la desviación estándar
de los pesos agrupados. ¿Qué tipo de sesgo tiene la distribución de los pesos?
c.6 ¿ Cuál es intervalo simétrico, alrededor del peso promedio, en el que se
encuentra por lo menos el peso del 70 % de los empleados?
-I I
2, 5, 0, 1, 3, 2, 3, 4, 2, 2, 1, 1, 0, 2, 3, 1, 0, 6, 2, 0,
0, 2, 3, 1, 2, 0, 4, 1, 1, 3, 4, 0, 2, 6, 1, 1, 4, 2, 2, 4
a) ¿Cuál es la variable en estudio y de qué tipo es? ¿Qué nivel de medición tiene?
¿por qué?
b) Defina la frecuencia en términos del problema.
c) Elabore una distribución de frecuencias no agrupadas de los datos y grafı́quela.
d ) ¿En cuántos dı́as ocurrieron entre 4 y 6 accidentes, inclusive?
EP
107. Se ha realizado un estudio sobre la amnesia postraumática tras una lesión en la cabeza.
A
Una variable estudiada es el tiempo de hospitalización en dı́as. Los datos ordenados
IM
8, 12, 20, 27, 30, 32, 35, 36, 40, 40, 40, 40, 41, 42, 45, 47, 50, 52, 61, 89, 108.
M
108. Se ha realizado una encuesta a 32 familias, y una de las preguntas realizadas hacı́a
referencia al número de celulares que poseen en el hogar. Las respuestas obtenidas han
sido las siguientes:
E
7, 6, 4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.
AD
a) ¿Cuál es la variable en estudio y de qué tipo es? ¿Qué nivel de medición tiene?
¿por qué?
b) Defina la frecuencia en términos del problema.
c) Elabore una distribución de frecuencias no agrupadas de los datos y grafı́quela.
d ) ¿Qué proporción de familias poseen menos de tres celulares?
e) ¿Cuántas familias poseen cuatro o más celulares pero menos de ocho?
-I I
22
aparatos?
g) ¿Cuál es el número promedio de celulares poseı́dos en una familia cualquiera de
las encuestadas?
h) Elabore un diagrama escalonado de porcentajes.
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 98
109. El profesor del curso está interesado en estudiar los hábitos de sueño de los estudiantes
cuando acuden a la sala de lectura del segundo piso de la biblioteca. El profesor
registra el tiempo (en minutos) que demoran en quedarse dormidos los estudiantes
desde que empiezan a leer su material de estudio. A continuación se presentan los
tiempos ordenados registrados en una muestra de alumnos:
10.5 11.3 11.9 12.0 12.3 12.3 12.5 12.7 13.4 13.7
13.8 14.2 14.8 15.1 15.3 16.7 16.8 18.8 20.8
EP
análisis con otra muestra de estudiantes que ocupan la sala de estudio de la bi-
blioteca. Registra los tiempos que demoran en quedarse dormidos esos estudiantes
-L
E
AD
[118 − 126⟩ 11
UD
[126 − 134] 2
su hijo?
S
PU
112. Las autoridades sanitarias de un municipio están interesadas en evaluar la calidad del
agua para consumo en términos de colonias de bacterias en un acuı́fero próximo a la
ciudad. Se toman muestras del agua y se obtienen los siguientes datos (del número de
colonias por 1000mm de agua) ordenados:
116, 139, 143, 147, 156, 156, 156, 158, 161, 161, 174, 188, 198, 220.
atı́pico. En caso de que existan diga cuáles son. Si no hay sustento se invalida
su respuesta.
A
IM
S -L
PU
M
CA
27.1 36.7 42.3 48.0 56.3 60.9 64.9 68.2 71.7 78.8
30.0 37.0 44.6 49.5 58.2 61.2 65.0 69.0 74.5 83.2
31.7 39.1 45.9 52.6 59.1 61.5 65.2 69.3 75.3 87.1
33.8 39.8 47.2 55.8 60.6 61.8 65.8 69.8 76.0 91.3
35.5 40.0 47.3 56.0 60.7 62.3 66.3 71.4 77.1 94.6
a) Defina la variable de interés, de qué tipo es y sustente qué nivel de medición tiene.
-I I
c.2 ¿Qué porcentaje de rı́os presentan una concentración menor a 56.2 ppm.?
c.3 Representar el histograma de porcentajes y el polı́gono de porcentajes
correspondiente
c.4 Calcule e interprete en términos del problema: la media, la mediana y la
desviación estándar de las concentraciones agrupadas.
c.5 Si compara la mediana y la media de las concentraciones agrupadas ¿Qué tipo
de sesgo tiene la distribución de las mismas?
c.6 ¿Cuál es intervalo simétrico, alrededor de la concentración promedio, en el
EP
114. En la empresa FusiónPerú S.A, el salario promedio mensual (en dólares) de los hombres
S
es 458.4 y el de las mujeres 425. Las desviaciones tı́picas de los salarios mensuales en los
PU
dos grupos son, respectivamente, 372.3 dólares y 311.25 dólares. Mostrando los cálculos
M
a) Relativamente,¿cuáles son más variables, los salarios de los hombres o los de las
mujeres?
b) El salario de Jorge es de 1200 dólares y el de Mariela es 1100 dólares.
Relativamente, ¿Cuál de ellos puede, dentro de su grupo, considerarse mejor
retribuı́do?
115. La empresa TELMIC S.A.C vende computadoras y ha llevado a cabo un estudio para
analizar el número de computadoras de escritorio que existe en pequeñas empresas del
distrito. Para tal efecto TELMIC S.A.C toma una muestra aleatoria de 40 pequeñas
E
AD
5 14
22
6 47.5
20
7 8
8 0.175
9
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 102
a) Defina la variable de interés (X), de qué tipo es y qué nivel de medición tiene.
b) Defina la “frecuencia” en términos del problema.
c) Complete la distribución de frecuencias no agrupada de la variable en cuestión.
d ) Interprete, en términos del problema, los valores sombreados.
e) ¿Qué porcentaje de las empresas analizadas poseı́an como mı́nimo 8 computado-
ras?
f ) ¿Cuántas empresas poseı́an menos de 5 computadores?
EP
116. Suponga que las calificaciones obtenidas en los exámenes parciales por 100 estudiantes
universitarios en un curso de estadı́stica para negocios tenı́an una media de 70
puntos y una desviación estándar de 5 puntos. ¿Qué porcentaje mı́nimo de alumnos
obtuvieron una calificación entre 58 y 82 puntos, en los exámenes? Muestre los cálculos
A
IM
117. En un examen final de lógica la puntuación media de un grupo de 150 estudiantes fue
S
PU
de 78 y la varianza 64. En álgebra, sin embargo, la puntuación media final del grupo
fue de 73 y la desviación tı́pica 7.6. Mostrando los cálculos correspondientes, responda
M
118. La empresa PAFPerú S.A.C instala puertas automáticas para cocheras. La siguiente
información indica el tiempo (en minutos) necesarios para tal instalación en una muestra
de 10 puertas:
24.6 28.3 32.4 32.7 38.2 40.0 42.7 44.4 46.0 54.5
a) La desviación tı́pica.
E
AD
b) Los cuartiles.
119. Se seleccionó una muestra de libros al azar de una biblioteca. Si la extensión media de
los libros de esta muestra fue de 300 páginas con una desviación estándar de 20 páginas,
¿cuál es el porcentaje mı́nimo de libros que debe tener entre 200 y 400 páginas? Muestre
los cálculos correspondientes para sustentar su respuesta.
120. En tres plantas industriales que pertenecen a una misma compañı́a, se producen ciertos
componentes electrónicos. La producción mensual de cada una de ellas se resume en el
-I I
siguiente cuadro:
22
20
a) Mostrando cálculos responda ¿Cuáles son más variables: las inversiones mensuales
de los clientes de CMAC Sullana o de CMAC Tacna?
b) Si compara la mediana y la media de las inversiones mensuales respectivas: ¿Qué
tipo de sesgo tiene la distribución de las inversiones en CMAC Sullana?
c) La microempresaria Milagros Ruiz es cliente de una de las CMAC mencionadas y
ha realizado una inversión mensual de 1580 dólares. Si dicha inversión no supera
el percentil 75, ¿De qué CMAC es cliente Milagros Ruiz? Sustente mostrando los
cálculos respectivos.
E
AD
122. La Figura 2.12 presenta las gráficas de caja y bigotes que muestran los datos de millas
por galón de gasolina utilizadas en la conducción en la ciudad para modelos de autos
pequeños y vehı́culos deportivos. Responda lo siguiente:
-I I
b) ¿Cuál es el valor del rango o amplitud de las millas por galón utilizadas para el
caso de los autos pequeños?
c) ¿Aproximadamente qué porcentaje de los autos pequeños obtienen menos de 29
millas por galón?
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 104
EP
UD
A
IM
S -L
PU
M
CA
E
AD
Figura 2.12: Millas por galón de gasolina utilizadas en la conducción para modelos de autos pequeños
y vehı́culos deportivos.
d ) ¿Cuál es el valor del rango intercuartı́lico de las millas por galón utilizadas para
el caso de los vehı́culos deportivos?
e) ¿Hay valores atı́picos en el conjunto de datos referente a los vehı́culos deportivos?
Sustente su respuesta.
-I I
Sustente su respuesta.
20
123. La Figura 2.13 presenta las gráficas de caja y bigotes de las duraciones (en segundos)
de las canciones de dos conciertos diferentes. Responda lo siguiente:
A
IM
S -L
PU
M
CA
E
AD
275 segundos?
b) ¿Cuál es el valor del rango intercuartı́lico de las duraciones en el concierto 1?
c) ¿Aproximadamente qué porcentaje de canciones en el concierto 1, duran menos
de 200 segundos?
d ) ¿Cuál es el valor del rango o amplitud de las duraciones en el concierto 2?
-I I
su respuesta.
20
124. La Figura 2.14 presenta las gráficas de caja y bigotes de la cantidad de clientes que
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 106
poseen los gimnasios situados en los distritos de San Miguel y Santiago de Surco.
Responda lo siguiente:
EP
UD
A
IM
S -L
PU
M
CA
E
AD
Figura 2.14: Cantidad de clientes que poseen los gimnasios situados en los distritos de San Miguel y
Santiago de Surco.
70 clientes?
d ) ¿Cuál es el valor del rango intercuartı́lico de la cantidad de clientes para el caso
de los gimnasios de Santiago de Surco?
CAPÍTULO 2. ESTADÍSTICA DESCRIPTIVA 107
A
IM
S -L
PU
M
CA
E
AD
-I I
22
20
Capı́tulo 3
Probabilidad
EP
UD
3.1. Introducción
En el Capı́tulo 2 nos centramos en la Estadı́stica descriptiva. En dicho capı́tulo se
organizó un conjunto de datos en una distribución de frecuencias para resumirla y también
A
se calcularon medidas para describir las propiedades de centralización, variabilidad, forma y
IM
posición del conjunto analizado. Por tanto, la Estadı́stica descriptiva se ocupa de hacer ver
-L
algo que ya ha ocurrido, pues se trabaja con datos que tomamos como información de algo
S
que ya ha acontecido.
PU
1. ¿Qué posibilidades hay de que disminuyan las ventas si aumentamos los precios?
defectuosas.
22
3.2. Probabilidad
20
108
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 109
Los valores de probabilidad son proporciones o fracciones que se encuentran en una escala
de 0 a 1. Los valores cercanos a 0 indican que las posibilidades de que ocurra un evento
son muy pocas. Los cercanos a 1 indican que es casi seguro que ocurra un evento. Otras
probabilidades entre cero y uno representan distintos grados de posibilidad de que ocurra
un evento. Por ejemplo, si considera el evento “que llueva mañana”, se entiende que si el
pronóstico del tiempo dice “la probabilidad de que llueva es cercana a cero”, implica que casi
no hay posibilidades de que llueva. En cambio, si informan que la probabilidad de que llueva
es 0.90, sabe que es muy posible que llueva. La probabilidad de 0.50 indica que es igual de
posible que llueva como que no llueva.
EP
genera resultados definidos. Y en cada una de las repeticiones del experimento, habrá uno
S
y sólo uno de los posibles resultados experimentales. Ejemplos de experimento pueden ser:
PU
Lanzar una moneda, lanzar un dado, elegir a una persona de un grupo de n personas, lanzar
M
n monedas o lanzar una moneda n veces, lanzar n dados o lanzar un dado n veces, Elegir k
CA
donde a cada evento (ei ) del espacio muestra le corresponde un número real:
X(ei ) = xi
Dado un espacio muestra, se pueden definir varias variables aleatorias sobre él.
22
1. Si el experimento es lanzar una moneda, luego los posibles eventos o resultados son
cara(C) o sello(S), entonces el espacio muestra del experimento será: Ω = {C, S}.
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 110
2. Un experimento consiste en lanzar 2 monedas (o lanzar una moneda dos veces), luego
los posibles eventos simples son cuatro: CC, CS, SC, SS, entonces el espacio muestra
del experimento será: Ω = {CC, CS, SC, SS}.
Gráficamente, este espacio muestra se puede representar de dos formas, como se muestra
en la figura 3.1
EP
UD
A
IM
S -L
PU
Para este espacio muestra se podrı́an definir por ejemplo las siguientes variables
aleatorias: X = N úmero de caras, Y = N úmero de sellos, Z = N úmero de caras −
N úmero de sellos, W = 2 ∗ N úmero de caras + (N úmero de sellos)2 , . . ., etc. En todos
estos casos la variable aleatoria es discreta.
3. Un experimento consiste en lanzar 2 dados (o lanzar un dado dos veces), luego los
posibles eventos simples son 36: (1,1), (1, 2), . . . , (6, 6), luego el espacio muestra del
experimento será: Ω = {(1, 1), (1, 2), . . . , (1, 6), . . . , (6, 6)}. En la figura 3.2 se representa
gráficamente este espacio muestra.
E
AD
Antes de iniciar, presentamos las siguientes notaciones básicas: P denota una probabili-
20
A
Figura 3.2: Representación de espacio muestra del lanzamiento de dos dados
IM
-L
P (A) = (3.1)
N úmero total de posibles resultados
Por ejemplo, si consideramos el experimento de lanzar un dado normal. ¿Cuál es la
probabilidad del evento C=obtener un número par? Los resultados posibles del experimento
son: 1, 2, 3, 4, 5, 6 y son igualmente probables de ocurrir. Luego hay tres resultados
“favorables” 2, 4, 6 en el conjunto de seis resultados posibles. Por lo tanto:
puesto que 383 de 751, o sea, 0.51 en términos de probabilidad, están en un campo laboral
diferente al de su área académica en la universidad, podemos emplear esto como una
estimación de la probabilidad. En otras palabras, con base en la experiencia, existe una
probabilidad de 0.51 de que un graduado en administración esté empleado en un campo
distinto al de su área principal de estudios.
Por último, el enfoque subjetivo se aplica, si existe poca o ninguna experiencia en la cual
se pueda basar una probabilidad. Fundamentalmente, esto significa evaluar las opiniones
disponibles y otra información subjetiva para después estimar o asignar la probabilidad.
Atinadamente a este concepto se le denomina probabilidad subjetiva. La probabilidad
EP
ejemplo de esto es cuando se trata de estimar la probabilidad de que mañana llueva y los
meteorólogos usan su conocimiento experto de las condiciones del tiempo para desarrollar
un estimado de la probabilidad. Otros ejemplos son responder a: ¿Cuál es la probabilidad de
que usted apruebe este curso? ¿Cuál es la probabilidad de que la selección peruana de fútbol
A
IM
una carta de una baraja ¿Cuál es la probabilidad de obtener una carta de diamante y trébol
CA
a la vez?
Complemento de un evento: El complemento de un evento A, consiste en todos los
resultados o eventos en los cuales dicho evento no ocurre. El complemento de A se denota
como A. Por ejemplo si lanzamos un dado normal y definimos el evento A=obtener 5, entonces
el complemento de A serı́a: A = No obtener 5.
Eventos mutuamente excluyentes: Un conjunto de eventos son mutuamente
excluyentes entre sı́, cuando realizado un experimento, dichos eventos no pueden ocurrir al
mismo tiempo. Por ejemplo: si lanzamos un dado normal y definimos los eventos: A=obtener
4 puntos o más, B=obtener 3 y C=Obtener 2 puntos o menos, podemos decir que A, B y C
E
AD
un dado.
22
colectivamente exhaustivos pueden ocurrir en cada uno de los “n” ensayos, el número de
-L
k k . . . ∗ k} = k n .
| ∗ k ∗{z (3.3)
“n” veces
M
Lo que se debe entender es que un experimento se describe como una sucesión de “n” pasos
CA
(ensayos) en los que hay siempre “k” resultados (mutuamente excluyentes y colectivamente
exhaustivos) en cada paso (ensayo).
Ejemplo: Suponga que lanza una moneda al aire 2 veces (o lanza al aire 2 monedas, una
vez) ¿Cuál es el número de diferentes resultados posibles (la secuencia de caras y sellos)? Si
consideramos el experimento de lanzar una moneda ensayado 2 veces (n=2), entonces en el
primer ensayo (lanzamiento) tenemos k=2 resultados posibles (cara y sello), en el segundo
lanzamiento también tenemos k=2 resultados posibles, por lo tanto siguiendo la expresión
(3.3) tenemos: N úmero de posibles resultados = k ∗ k = 2 ∗ 2 = 22 = 4, los cuales se aprecian
E
Ejemplo: Suponga que lanza un dado 2 veces (o lanza 2 dados una vez) ?Cuántos posibles
resultados diferentes pueden ocurrir? Si consideramos el experimento de lanzar un dado
ensayado 2 veces (n=2), entonces en el primer ensayo (lanzamiento) tenemos k=6 resultados
posibles (1,2,3,4,5,6), en el segundo lanzamiento también tenemos k=6 resultados posibles,
por lo tanto siguiendo la expresión (3.3) tenemos: N úmero de posibles resultados = k ∗ k =
62 = 36, los cuales se aprecian en el diagrama de la figura 3.2.
Regla de conteo N°2: Si hay “k1 ” eventos en el primer ensayo, “k2 ” eventos en
el segundo ensayo, y “kn ” eventos en el n-ésimo ensayo, entonces el número de posibles
-I I
resultados es igual a:
22
k1 ∗ k2 ∗ . . . ∗ kn . (3.4)
20
Ejemplo: El menú de un restaurante tienen un precio fijo para las cenas completas
que consisten en un aperitivo, un platillo principal, una bebida y un postre. Se tiene la
posibilidad de elegir entre 5 aperitivos, 10 platillos, tres bebidas y seis postres. ¿Cuál es
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 114
n! = n ∗ (n − 1) ∗ (n − 2) ∗ . . . ∗ 1, (3.5)
donde n! se conoce como factorial de n. (Nota: 0!=1). Ası́ pues, entiéndase que los arreglos
A
difieren por el orden en el que están dispuestos sus elementos.
IM
Ejemplo: ¿De cuántas maneras diferentes se pueden alinear en una fila cinco personas
-L
para tomarse una foto? Siguiendo la expresión (3.5), se tendrı́a que el número de maneras o
S
Regla de conteo N°4: En muchos casos se necesita saber el número de formas en las que
M
3! 3∗2∗1
P23 = = = 6 permutaciones
(3 − 2)! 1
Ejemplo: Si cinco corredores compiten en la final de los 100 m. ¿de cuántos maneras
pueden ganarse los tres primeros puestos? Analizar las maneras de ganar los tres primeros
puestos implica formar arreglos ordenados de x=3 corredores de los n=5 que compiten, por
tanto se trata de permutaciones, entonces siguiendo la expresión (3.6) tenemos:
-I I
5! 5 ∗ 4 ∗ 3 ∗ 2!
P35 = = = 5 ∗ 4 ∗ 3 = 60 maneras
22
(5 − 3)! 2!
20
Regla de conteo N°5: En muchos casos se necesita saber el número de formas en las que
un subconjunto de “x” elementos, de un grupo total de “n” elementos, puede arreglarse sin
considerar el orden de la selección. A cada posible resultado se le denomina combinación.
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 115
n!
Cxn = (3.7)
x!(n − x)!
3! 3 ∗ 2!
UD
C23 = = = 3 combinaciones
2!(3 − 2)! 2! ∗ 1!
personas de las n=12 que existen. Para formar el comité, no interesa el orden en que se
-L
12! 12 ∗ 11 ∗ 10 ∗ 9 ∗ 8 ∗ 7!
C512 = = = 792 maneras
CA
de todos los casos favorables es entonces igual al número de casos posibles. Por tanto:
7 5
22
B (o de que ambos ocurran), como único resultado de un experimento. Para aplicar esta ley
debemos entender si los eventos involucrados son mutuamente excluyentes o no.
Nota:Recuerde que dos eventos A y B son mutuamente excluyentes si, cuando un evento
ocurre, el otro no puede ocurrir. Por tanto, para que A y B sean mutuamente excluyentes,
se requiere que su intersección no contenga ningún evento en común.
Ley especial de la adición:
2 1 3 1
S
6 6 6 2
La ley especial de la adición se puede extender a 2 o más eventos mutuamente
M
excluyentes, ası́:
CA
Ejemplo: Suponga que lanza dos dados ¿Cuál es la probabilidad de que se obtenga
una suma igual a 5 ó una suma igual a 8 ó una suma igual a 10?
Se aprecia que el experimento es claramente, lanzar dos dados, el cual tie-
ne 36 resultados posibles. Si definimos los eventos: A= Obtener suma igual a
5={(1, 4); (2, 3); (3, 2); (4, 1)}, B= Obtener suma igual a 8={(2, 6); (3, 5); (4, 4); (5, 3); (6, 2)}
E
y C=Obtener suma igual a 10={(4, 6); (5, 5); (6, 4)}, claramente A,B y C son eventos
AD
mutuamente excluyentes entre sı́, por lo que, empleando la expresión (3.9), la probabili-
4 5 3
dad de que ocurra uno u otro serı́a: P (AoBoC) = P (A)+P (B)+P (C) = + + =
36 36 36
12 1
=
36 3
Ley general de la adición:
que en la baraja existen 2 ases que son rojos, es decir son comunes a ambos eventos.
S
PU
52 52 52 52 13
CA
En la sección 3.3.1 se presentó la ley de la suma para calcular P(A o B), la probabilidad de
20
que un solo ensayo tenga un resultado de A o B o ambos eventos. En esta sección se presenta
la ley básica de la multiplicación, la cual se utiliza para calcular P(A y B)1 , la probabilidad
1
En esta sección, P(A y B) sirve para denotar la probabilidad de que el evento A ocurra en un ensayo,
seguido por el evento B en otro ensayo. En la sección 3.3.1, P(A y B) denotó la probabilidad de que tanto
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 118
de que el suceso A ocurra en un primer ensayo y que el suceso B ocurra en un segundo ensayo,
es decir, un resultado entendido como una secuencia de eventos. Si el resultado del primer
evento A afecta de alguna forma la probabilidad del segundo evento B, es importante ajustar
la probabilidad de B para que refleje la ocurrencia del suceso A. La ley para el cálculo de
P(A y B) se denomina ley de la multiplicación porque implica multiplicar la probabilidad
del evento A por la probabilidad del evento B (donde la probabilidad del evento B se ajusta
por el resultado del evento A).
Para aplicar la ley de la multiplicación debemos entender si los eventos involucrados son
independientes o no.
EP
Ejemplo: Se lanzan dos monedas al aire ¿Cuál es la probabilidad de que ambas caigan
S
PU
cara?
M
experimento como si tuviéramos que lanzar una moneda dos veces, la naturaleza de
los resultados serı́an los mismos. Entonces con esa idea, el resultado pedido (obtener
2 caras) lo entendemos como la secuencia de eventos: A= Obtener cara en el primer
lanzamiento y B= Obtener cara en el segundo lanzamiento y claramente A y B son
eventos independientes entre sı́, por que lo que se obtenga en el primer lanzamiento no
influirá en el resultado del segundo. Ası́ empleando la expresión (3.12), la probabilidad
1 1 1
de que ocurra A y B en secuencia serı́a: P (AyB) = P (A) ∗ P (B) = ∗ = .
2 2 4
E
AD
Figura 3.3: Diagrama de árbol del lanzamiento de dos monedas o de lanzar una moneda dos veces
-I I
22
Como se aprecia en la Figura 3.3 cada resultado del experimento viene dado por un
20
camino del diagrama en árbol; si indicamos sobre cada rama su probabilidad, vemos que
A como B ocurran en el mismo ensayo. Por lo tanto, el verdadero significado de P(A y B) sólo se determina
sabiendo si nos referimos a dos ensayos en donde el evento A ocurra en el primer ensayo y el evento B ocurra
en el segundo o si nos referimos a un solo ensayo que puede tener resultados de A y B al mismo tiempo. Ası́
pues, el significado de P(A y B) dependerá del contexto que se enfrente.
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 119
D defectuoso. Luego al ser cada proceso independiente del otro, entonces al elegir
un producto del tipo A, esta elección no influirá en la elección de un producto del
tipo B, C o D. Luego al ser extracciones o elecciones independientes, empleando
la expresión (3.13), la probabilidad pedida será:
P (Ad y Bd y Cd y Dd ) = P (Ad )∗P (Bd )∗P (Cd )∗P (Dd ) = 0.03∗0.05∗0.05∗0.04 = 3∗10−6
P (Ad y Bd y Cb y Db ) = P (Ad )∗P (Bd )∗P (Cb )∗P (Db ) = 0.03∗0.05∗0.95∗0.96 = 1.368∗10−3
lanzamiento. Luego al ser cada lanzamiento independiente del otro (por que lo
que se obtenga en un lanzamiento no influirá en el resultado que se obtenga en
los otros lanzamientos) empleamos la expresión (3.13) para hallar la probabilidad
pedida:
apartado a) por ejemplo) por el número de formas en que podemos tener a los
3 seises dispuestos en los 5 lanzamientos, lo cual se calcula con C35 . Entonces la
M
P (A y B) = P (A) ∗ P (B \ A) (3.14)
probabilidad obtenida con la información adicional de algún otro evento que ya ocurrió.
Entonces de la expresión (3.14), puede calcularse P (B \ A), dividiendo la probabilidad de
que ambos eventos A y B ocurran entre la probabilidad del evento que ocurrió A:
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 121
P (A y B)
P (B \ A) = (3.15)
P (A)
La expresión (3.15) permite hallar la probabilidad condicionada a partir de las
probabilidades calculadas considerando todo el espacio muestral inicial del experimento
involucrado. Desde el punto de vista práctico, cuando se condiciona a un evento, realmente
se produce una reducción del espacio muestra: se sabe no sólo que el resultado obtenido es
un evento del espacio muestra sino que concretamente está en A, por lo que el conjunto de
posibles resultados de los que ahora se parte es A.
EP
Ejemplo: Una caja contiene 4 canicas azules y 6 rojas. Si se extraen dos aleatoriamente,
UD
resultado pedido (que las dos canicas sean azules) lo entendemos como la secuencia de
-L
eventos: Ai : la i-ésima canica extraı́da sea azul y Ri : la i-ésima canica extraı́da sea roja,
S
donde i=1,2. Luego al ser cada extracción dependiente de la otra (por que el muestreo
PU
es sin reemplazo, es decir, la segunda extracción se realiza teniendo una canica menos
M
4 3 12 2
P (A1 y A2 ) = P (A1 ) ∗ P (A2 \ A1 ) = ∗ = =
10 9 90 15
4 6 24 4
P (A1 y R2 ) = P (A1 ) ∗ P (R2 \ A1 ) = ∗ = =
10 9 90 15
E
P (al menos una azul) = P (Obtener una azul) + P (Obtener dos azules) =
4 6 6 4 4 3 60 2
= P (A1 y R2 ) + P (R1 y A2 ) + P (A1 y A2 ) = ∗ + ∗ + ∗ = =
-I I
10 9 10 9 10 9 90 3
22
o también:
20
P (al menos una azul) = 1 − P (Obtener ninguna azul) = 1 − P (Obtener dos rojas) =
6 5 30 60 2
= 1 − P (R1 y R2 ) = 1 − P (R1 ) ∗ P (R2 \ R1 ) = 1 − ∗ =1− = =
10 9 90 90 3
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 122
Ejemplo: Se lanza un dado y se sabe que el resultado fue impar ¿Cuál es la probabilidad
de que haya salido un cinco?
1
Si se lanza un dado, la probabilidad de que salga un cinco es:P (obtener 5) = , ya que
6
el espacio muestra es Ω = {1, 2, 3, 4, 5, 6}. Sin embargo, si sabemos que hemos obtenido
un resultado impar:{1, 3, 5}, la probabilidad de que haya salido un cinco es:P (obtener 5 \
1
{1, 3, 5}) = .
3
En este ejemplo tendrı́amos dos eventos B=obtener 5 y A={1, 3, 5}. Si sabemos que el
resultado obtenido ha sido impar, es decir, ha ocurrido A, en realidad el espacio muestral,
conjunto de los posibles resultados, se ha reducido a Ω∗ = A = {1, 3, 5}.
EP
1
P (A y B) P ({1, 3, 5} y {5}) 1
P (B \ A) = = = 6 =
3
A
P (A) P ({1, 3, 5}) 3
IM
6
-L
Supongamos que se tienen los siguientes datos (Tabla 3.1) , en miles de individuos:
PU
M
Usa internet 40 35 75
No usa internet 185 240 425
Total 225 275 500
500
AD
P (I y H) 0.08
P (I \ H) = = = 0.1b
7,
P (H) 0.45
-I I
ejemplos anteriores vemos que en general, la P (B \ A) no tiene porque ser igual a la P (B).
De hecho se tienen los siguientes casos:
En el ejemplo anterior, se deducı́a del cuadro 3.1 que:P (I) = 0.15; P (I \ H) = 0.1b
7. En
este caso, el evento I no es independiente del evento H. Es más, P (I) < P (I \ H), por lo que
la probabilidad de usar internet se incrementa cuando nos restringimos a los varones.
Por otro lado, si estudiamos la probabilidad de que una mujer escogida al azar use internet,
35 b < P (I), lo que nos dice que la probabilidad de usar
EP
200 90
Entonces: P (I) = = 0.40; P (I \ H) = = 0.40. En este caso, la probabilidad
M
500 225
de usar internet no varı́a cuando nos restringimos a los ciudadanos varones, por lo que I es
CA
independiente de H.
3.3.3. Teorema de la probabilidad total y Teorema de Bayes
La ley de multiplicación es útil para determinar la probabilidad de un evento que depende
o no de otros. En esta sección se verá otro modo de calcular la probabilidad de un evento
considerando a este como el resultado de la unión de otros eventos. Para esto es necesario
definir el concepto de partición del espacio muestral de un experimento, necesario para
poder enunciar luego el teorema de la probabilidad total y como consecuencia el teorema de
Bayes.
E
Sean los eventos E1 , E2 , E3 , . . . , EN una partición del espacio muestra S, es decir, todos
AD
mutuamente excluyentes, de tal forma que la unión de todos conformen el espacio muestral
S. Sea además un evento E, perteneciente a S, como se muestra (sombreado) en la figura 3.4:
-I I
22
20
P (E) = P (E y S) = P [E y (E1 o E2 o . . . o EN )]
P (E) = P (E y E1 ) o P (E y E2 ) o . . . o P (E y EN )
P (E) = P (E1 ) ∗ P (E \ E1 ) + P (E2 ) ∗ P (E \ E2 ) + . . . + P (EN ) ∗ P (E \ EN )
N
X
P (E) = P (Ei )P (E \ Ei ) (3.16)
i=1
EP
espacio muestra lo conforman los 50 estudiantes de esa clase. Ese espacio muestra se ha
particionado en tres eventos mutuamente excluyentes y colectivamente exhaustivos que son:
M
CA
E1=ser alumno de segundo año, E2=ser alumno de cuarto año y E3=ser alumno graduado,
como se muestra en la figura 3.5
E
AD
Figura 3.5: Partición del aula en alumnos de segundo año, cuarto año y graduados
P
P (E) = N i=1 P (Ei )P (E \ Ei ) donde i=1,2,3, es decir, la probabilidad de que un alumno
20
obtenga calificación A es igual a la probabilidad de que sea de segundo año por la probabilidad
de obtener calificación A dado que es de segundo año, más la probabilidad de que sea de
cuarto año por la probabilidad de obtener calificación A dado que es de cuarto año, más la
probabilidad de que sea graduado por la probabilidad de obtener calificación A dado que
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 125
EP
UD
exhaustiva de las probabilidades de todos los casos mutuamente excluyentes que conducen
S
PU
a dicho evento. Entonces la probabilidad de que un alumno elegido al azar haya obtenido
calificación A serı́a:
M
CA
Ejemplo:Tenemos tres urnas: A con 3 canicas rojas y 5 negras, B con 2 canicas rojas y
1 negra y C con 2 canicas rojas y 3 negras. Escogemos una urna al azar y de ella extraemos
una canica, ¿cuál es la probabilidad de que la canica extraı́da sea roja?
Claramente el experimento es seleccionar primero una urna y luego una canica de la
E
AD
urna elegida. Entonces si definimos los eventos: Llamamos R= extraer una canica roja y N=
extraer una canica negra, en el diagrama de árbol de la figura pueden verse las distintas
probabilidades de ocurrencia de los eventos R o N para cada una de las tres urnas.
-I I
22
20
Para calcular la probabilidad de que la canica elegida sea roja, P(R), por el Teorema de
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 126
en el siglo XVII, el teorema de Bayes es una extensión de lo que hemos aprendido hasta ahora
acerca de la probabilidad condicional.
UD
una información especial o una prueba del producto, se obtiene más información sobre estos
-L
eventos. Dada esta nueva información, se modifican o revisan los valores de probabilidad
S
mediante el cálculo de probabilidades revisadas a las que se les conoce como probabilidades
PU
El teorema de Bayes es aplicable cuando los eventos para los que se quiere calcular la
CA
P (Ai ) ∗ P (B \ Ai )
P (Ai \ B) = (3.17)
P (A1 ) ∗ P (B \ A1 ) + P (A2 ) ∗ P (B \ A2 ) + . . . + P (An ) ∗ P (B \ An )
Con las probabilidades a priori P (A1 ), P (A2 ), . . . , P (An ) y las probabilidades condiciona-
les adecuadas, P (B \ A1 ), P (B \ A2 ), . . . , P (B \ An ), se usa la expresión (3.17) para calcular
E
AD
P (E3 ) ∗ P (E \ E3 )
P (E3 \ E) =
P (E1 ) ∗ P (E \ E1 ) + P (E2 ) ∗ P (E \ E2 ) + P (E3 ) ∗ P (E \ E3 )
-I I
10 5
22
∗ 5
P (E3 \ E) = 50 10 = ≈ 0.28
20
10 3 30 10 10 5 18
∗ + ∗ + ∗
50 10 50 30 50 10
Ejemplo: Del problema de las tres urnas A, B y C, se nos plantea lo siguiente: Si elegimos
una urna al azar y extraemos una canica. Si la canica ha sido roja, ¿cuál es la probabilidad
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 127
P (A) ∗ P (R \ A)
P (A \ R) =
P (A) ∗ P (R \ A) + P (B) ∗ P (R \ B) + P (C) ∗ P (R \ C)
1 3
∗ 45
P (A \ R) = 3 8 = ≈ 0.26
1 3 1 2 1 2 173
∗ + ∗ + ∗
3 8 3 3 3 5
EP
1. Se ha desarrollado una nueva vacuna para curar el resfrı́o. Se aplicó a 50 pacientes para
probar su efectividad.
a) ¿Cuál es el experimento?
A
IM
d ) La probabilidad de que la nueva vacuna sea efectiva se calcula como -2. Comente
esto.
M
CA
3. El número de veces que ocurrió un evento en el pasado se divide entre el número total
de ocurrencias. ¿Cómo se denomina a este enfoque de la probabilidad?
4. Si es verdad que no existe ninguna probabilidad de que una persona se recupere después
de recibir 50 heridas de bala, ¿la probabilidad asignada a este evento es -1? ¿Por qué?
6. Si se lanza al aire una moneda siete veces, ¿Cuántos resultados diferentes son posibles?
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 128
7. Los sistemas comunes de alarma para casas tienen un código que consta de cuatro
dı́gitos. Los dı́gitos (0 hasta 9) pueden estar repetidos, aunque deben ingresarse en
el orden correcto. Suponga que usted planea tener acceso intentando códigos hasta
encontrar el correcto, ¿Cuántos códigos diferentes son posibles?
8. Angélica tiene para vestirse 2 pantalones, 3 polos y 4 pares de zapatillas, todas prendas
distintas. ¿De cuántas maneras podrı́a vestirse?
11. ¿Cuántos números de cinco cifras distintas se pueden formar con las cifras impares?
¿Cuántos de ellos son mayores de 70.000?
12. Si se elige un número de cinco cifras distintas, formado con las cifras impares, ¿Cuál es
A
la probabilidad de que el número elegido sea mayor de 70000?
IM
-L
13. Hay un club con 15 socios. Se desea elegir una mesa directiva formada por un presidente,
S
14. En una carrera de 500 metros participan doce corredores ¿De cuántas maneras pueden
CA
15. En una clase de 24 alumnos se quiere elegir un comité formado por tres alumnos
¿Cuántos comités diferentes se pueden formar?
a) ¿De cuántas formas podrá constituirse la comisión si todas las personas son
E
AD
elegibles?
b) ¿De cuántas formas podrá constituirse la comisión si un economista particular ha
de estar en esa comisión?
c) ¿De cuántas formas podrá constituirse la comisión si dos administradores concretos
no pueden estar juntos en esa comisión?
tendrán 8 miembros cada uno y el comité de Actividades tendrá 4. ¿De cuántas maneras
22
18. Escribir o definir el espacio muestra de cada uno de los siguientes experimentos:
c) El papá de un bebé próximo a nacer quiere que su hijo se llame: Juan, Camilo o
Felipe. La mamá por su parte pretende que se llame: Andrés o Paolo. Para que
ambos queden felices deciden combinar los nombres propuestos considerando que
primero irá el del padre y luego el de la mamá. Defina las formas que se pueden
proponer para el nombre del bebé.
19. En la tinka se extraen 6 diferentes números del 1 al 45. Un jugador gana o comparte
el premio mayor cuando escoge correctamente los 6 números. Calcule la probabilidad
de ganar el premio mayor de la tinka (No se requiere que el jugador seleccione los seis
EP
20. Una moneda se lanza 7 veces, calcular la probabilidad que aparezcan exactamente 4
caras.
21. De una baraja de 52 cartas se sacan 3 cartas. Determinar la probabilidad que todas
A
sean corazones.
IM
salga el seis.
CA
23. Si la probabilidad de que un bebé que va a nacer sea varón es de 0.5. Calcule la
probabilidad de que de los siete hijos de un matrimonio dos sean varones y cinco sean
mujeres.
24. Una caja contiene 12 naranjas, tres de las cuales están malogradas. Si seleccionamos al
azar 5 naranjas para preparar jugo:
25. Si cinco corredores compiten en la final de 100 metros planos, ¿De cuántos modos
pueden ganarse los tres primeros puestos?
-I I
22
27. En un grupo de teatro hay 10 hombres y 6 mujeres. Cuatro de los hombres pueden actuar
como actores masculinos principales y los otros actuarán en papeles secundarios, tres
de las mujeres pueden actuar en papeles femeninos principales y las otras en papeles
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 130
secundarios. ¿De cuántas maneras pueden elegirse los actores para una obra de teatro
que exige un actor principal, una actriz principal, dos actores secundarios y tres actrices
secundarias?
28. Se van a seleccionar cinco soldados de un grupo de doce voluntarios para una misión
peligrosa.
c) ¿Cuántas veces será incluido sólo uno de los dos más valientes?
UD
29. A usted le gustarı́a hacer una ensalada que contenga lechuga, tomate, pepino y
germinados. Se dirige hacia el supermercado con el fin de comprar un tipo de cada
uno de estos ingredientes. Ahı́ descubre que existen ocho tipos de lechugas, cuatro
tipos de tomates, tres tipos de pepinos y tres tipos de germinados en venta ¿Cuántos
A
IM
a) ¿Cuál es la probabilidad de que se obtenga una suma igual a 5 ó una suma igual
M
a 7?
CA
31. Al tirar un dado ¿cuál es la probabilidad de que caiga un uno o un dos o un seis?
De mantenimiento B 50
De producción C 1460
Gerencia D 275
Secretarial E 68
33. ¿Cuál es la probabilidad de que una carta elegida al azar de una baraja sea un rey o
una de corazones?
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 131
35. Al tirar un dado ¿cuál es la probabilidad de que se obtenga un número par o un número
menor de 3 o un número entre 2 y 4, inclusive?
36. Se lanzan dos monedas al aire,¿Cuál es la probabilidad de que ambas caigan cara?
37. Suponga que en una caja hay 10 rollos fotográficos, de los cuales 3 son defectuosos. Se
van a seleccionar aleatoriamente 2 rollos, uno después del otro ¿Cuál es la probabilidad
EP
de escoger un rollo con defecto seguido por otro con tal condición?
UD
39. La junta de directores de una compañı́a está formada por 8 hombres y 4 mujeres. Se
CA
a) ¿Cuál es la probabilidad de que sean mujeres los cuatro miembros del comité de
investigación?
b) ¿Cuál es la probabilidad de que los cuatro miembros sean hombres?
c) ¿La suma de las probabilidades para a) y b) es igual a 1? Explique su respuesta.
40. Una caja contiene 4 canicas blancas y 6 negras. Si se extraen dos aleatoriamente, una
E
AD
41. Una caja contiene 4 canicas azules y 6 rojas. Si se extraen dos aleatoriamente, una tras
otra y sin reemplazo:
-I I
42. Un lote consta de 10 artı́culos buenos, 4 con pequeños defectos y 2 con defectos graves.
e) Si se eligen dos artı́culos, uno tras otro, sin reemplazo. Encuentre la probabilidad
UD
h) Si se eligen dos artı́culos, uno tras otro, sin reemplazo. Encuentre la probabilidad
S
PU
i ) Si se eligen dos artı́culos, uno tras otro, sin reemplazo. Encuentre la probabilidad
CA
43. Se lanzan dos dados y se sabe que la suma resultó igual a 8 ¿Cuál es la probabilidad
de que la diferencia sea 2?
44. Se eligen 5 cartas de una baraja completa de 52. La baraja está conformada por cuatro
“palos” (corazones, espadas, tréboles y cocos) y por trece denominaciones (1, 2, ..., 13).
¿Cuál es la probabilidad de que:
E
AD
compre el lote?
46. José, Bruno y Mónica lanzan sucesivamente una moneda. Si el primero en obtener cara
gana el juego,¿Cuáles son las respectivas probabilidades de ganar el juego si cada uno
lanza sólo una vez?
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 133
47. En una urna hay siete esferas, que tienen marcadas las siguientes letras: C, A, L, C,
U, L, O. Si se extraen, una por una, las siete esferas, y se van colocando de izquierda
a derecha, ¿Cuál es la probabilidad de que se forme la palabra CALCULO?
48. Un estudiante de estadı́stica ha estimado que en 4 horas puede estudiar un tema para el
examen del dı́a siguiente. Comienza a estudiar a las 8 p.m. con el riesgo de que haya un
“apagón” en cualquier momento. ¿Cuál es la probabilidad de que, como consecuencia
de un “apagón”, lo que le falte estudiar sea menos de la quinta parte de lo que haya
estudiado? Asuma que el apagón puede ocurrir en cualquier instante.
EP
49. Suponga que en una habitación oscura hay seis cajas blancas, cada una conteniendo
UD
tres esferas verdes y cinco amarillas, y dos cajas negras, cada una conteniendo dos
esferas verdes y cuatro amarillas. Si usted entrara en la habitación y seleccionara
aleatoriamente una caja y después aleatoriamente tomara de ella una esfera, ¿Cuál
es la probabilidad de que se seleccionara una esfera amarilla?
A
IM
50. En el jardinero del señor Rodrı́guez no se puede confiar. La probabilidad de que olvide
-L
regar el rosal durante la ausencia del señor Rodrı́guez es 2/3. El rosal está en estado
S
51. En un almacén se encuentran 80 cajas con 100 fusibles cada una. Veinte cajas contienen
fusibles producidos por la máquina A, 30 cajas contienen fusibles producidos por
la máquina B y 30 tienen fusibles producidos por la máquina C. las cajas están
almacenadas al azar, sin que importe la máquina de procedencia. La máquina A
produce, en promedio, 5 % de fusibles defectuosos; la máquina B, 3 % y la máquina
C, 2 %.
E
52. Las caras numeradas 1, 2 y 3 de un dado, son de color rojo; las caras numeradas 4 y
5 son de color blanco, y la cara numerada 6 es azul. Al lanzar este dado, cuál es la
probabilidad:
-I I
53. Una compañı́a de seguros de automóviles clasifica a los conductores en tres clases: A,
alto riesgo, B, riesgo medio, y C bajo riesgo. La clase A constituye el 30 % de los
conductores que suscriben un seguro con la compañı́a; la probabilidad de que uno de
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 134
esos conductores sufra un accidente en un año es 0.1. Los datos correspondientes para
la clase B son 50 % y 0.03 y para la clase C son 20 % y 0.01.
54. Una compañı́a que fabrica zapatos tiene 3 fábricas. La primera produce 25 % de los
EP
por Rafael?
b) Si se selecciona al azar un votante y se encuentra que ha votado por Rafael, ¿Cuál
es la probabilidad de que sea del partido A?
57. Se nos dan dos urnas como sigue: Una urna A contiene 5 bolas rojas 3 blancas y 8
azules. La urna B contiene 3 Bolas rojas y 5 blancas. Se lanza un dado corriente, si
aparece el 3 o el 6, se escoge una bola de B, de lo contrario se escoge una de A. Hallar
la probabilidad de que:
-I I
22
58. Se nos dan dos urnas como sigue: Una urna A contiene 5 bolas rojas y 3 blancas. La
otra urna B contiene 1 bola roja y 2 blancas. Se lanza un dado corriente si aparece 3 o
6 se saca una bola de B y se pone en A y luego se saca una bola de A, de lo contrario
se saca una de A y se pone en B y luego se saca una de B.
existiendo depresión.
S
PU
60. Se lanza una moneda cinco veces. Muestre mediante un diagrama de árbol todos
M
consecutivas?
61. Una clase de estadı́stica avanzada está formada por 10 estudiantes de segundo año, 30
de cuarto año y 10 graduados. Tres estudiantes de segundo año, 10 de cuarto año y 5
graduados obtuvieron una calificación A.
62. Se ha observado que los hombres y las mujeres reaccionan de una manera diferente
en ciertas circunstancias; 70 % de las mujeres reaccionan positivamente en dichas
circunstancias, mientras que el porcentaje en los hombres es solamente del 40 %. Se
sometió a prueba a un grupo de 20 personas, 15 mujeres y 5 hombres, y se les pidió
llenar un cuestionario para descubrir sus reacciones. Una de las respuestas recogidas al
azar de las 20 resultó negativa, ¿Cuál es la probabilidad de que haya sido contestada
por un hombre?
-I I
63. En un conocido juego con dados el jugador participante lanza dos dados. Si obtiene
22
suma siete u once, gana. Si no, debe seguir lanzando hasta obtener el mismo resultado
20
del primer lanzamiento antes de que salga siete u once. Si sale siete u once antes de
conseguir el mismo resultado del primer lanzamiento, pierde.
1
Nota: Puede ser útil la siguiente fórmula: 1 + x + x2 + x3 + ... =
1−x
64. Las probabilidades que tienen tres alumnos de aprobar Estadı́stica son: 0,20; 0,40; 0,50.
Determine la probabilidad de que:
65. Suponga que hay tres semáforos entre la casa de Quique y la UDEP. Al llegar a cada
uno de ellos, éstos pueden estar en rojo (R) o verde (V). Considérese que el ámbar
dura un tiempo despreciable. Quique ha verificado que, en el primer semáforo, el rojo
dura tanto como el verde; pero en el segundo, el rojo dura el doble que el verde; y en
A
el tercero, el verde dura el doble que el rojo. ¿Cuál es la probabilidad de que en el
IM
66. El profesor Álvarez ha estado enseñando Matemática Básica durante varios años. Sabe
que 80 % de los estudiantes terminan los problemas asignados. Determinó que de los
alumnos que cumplen con su trabajo, 90 % aprobará el curso. De aquellos estudiantes
que no lo hacen ası́, 60 % será aprobado. Julio Manrique cursó Matemática básica
durante el semestre pasado con el profesor Álvarez y recibió una calificación aprobatoria.
¿Cuál es la probabilidad de que sı́ haya hecho las tareas?
67. Una familia tiene 5 hijos. Suponiendo que la probabilidad de que un hijo sea varón o
mujer es la misma, determine la probabilidad de que:
E
68. En un curso de Estadı́stica hay 5 alumnos del IV ciclo, 34 del V, 21 del VI, 5 del VII
y 2 del VIII. Si se eligiera un comité de 5 personas, ¿cuál es la probabilidad de que:
69. En una prueba de aptitud conformada por 25 preguntas, 4 son de cultura general. Si a
22
Miguel 15 años, Raúl 12 años, Mario 10 años, Ana 9 años, Lucı́a 6 años y David 5 años.
-L
73. Se va a elegir por sorteo un comité de seis personas a partir de un grupo de diez
hombres; tres de los cuales son profesionales. ¿Cuál es la probabilidad de que:
74. Dos amigos compraron pasajes para viajar en un pequeño ómnibus. El ómnibus consta
AD
ingenieros y 2 médicos.
22
20
76. Hay 8 amigos solteros y la probabilidad de que cualquiera de ellos se case en los próximos
1
15 años es . ¿Cuál es la probabilidad de que por lo menos uno se case?
4
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 138
78. En un distrito universitario los estudiantes se distribuyen entre las tres carreras que
pueden cursarse del siguiente modo: el 20 % estudian arquitectura, el 35 % medicina y
UD
79. Un método muy empleado por investigadores estadı́sticos para obtener información
es el de efectuar encuestas personales. A menudo resulta importante investigar sobre
S -L
temas muy personales, que pondrı́an en aprietos al sujeto encuestado, ocasionando que
PU
dé respuestas falsas o que no conteste, deformando ası́ los resultados de la encuesta.
M
Para aminorar este problema, Warner ideó la “Técnica de la respuesta aleatoria”, que
CA
permite que el encuestado escoja al azar una de dos preguntas: la pregunta personal,
motivo de la encuesta, o una pregunta de control. Ası́, sólo él sabrá qué pregunta
contestó en realidad, y se mantiene su privacidad. Por ejemplo, supóngase que se desea
estimar el porcentaje de alumnos secundarios de una ciudad que no resuelven por su
cuenta las tareas para la casa. Se hacen 1000 encuestas con las siguientes instrucciones:
Antes de contestar lance una moneda: si sale cara conteste la pregunta A, y si sale sello
conteste la pregunta B. Sólo conteste SÍ o NO.
A: ¿resuelve usted las tareas para la casa por su cuenta?
B: ¿nació su padre en enero, febrero, marzo, abril o mayo?
E
AD
Supóngase que, una vez efectuadas las encuestas, hay 455 respuestas afirmativas y 545
negativas. ¿Qué porcentaje de alumnos no resuelve por su cuenta las tareas para la
casa?
81. El comisario de la policı́a de El Agustino clasifica los delitos por edad (en años) del
-I I
82. Una tabla para jugar está conformada por 15 casilleros. En 11 de éstos se encuentran
PU
debe escoger, desconociendo lo que hay en cada casillero, casillero por casillero hasta
CA
que conforme la palabra ESTADISTICA, sin importar el orden. Por cada casillero en
blanco que se escoja, al jugador se le quita $20 de los $60 que le dan inicialmente. ¿Cuál
es la probabilidad de que el jugador:
83. Se lanza una moneda cuya probabilidad de que el resultado sea cara es 2/3. Si aparece
cara, se extrae una canica de una urna que contiene dos rojas y tres verdes. Si el
E
AD
resultado es sello, se extrae una canica de otra urna que contiene dos rojas y dos
verdes. ¿Cuál es la probabilidad de extraer una canica roja?
84. Se sabe que el veredicto dado por un jurado es un 90 % confiable cuando el sospechoso
es culpable y un 98 % confiable cuando es inocente. En otras palabras, declara inocente
al 10 % de los culpables y declara culpable al 2 % de los inocentes. Si el sospechoso se
selecciona entre un grupo de personas de las cuales sólo el 5 % ha cometido un delito
alguna vez, y el jurado lo declara culpable, ¿cuál es la probabilidad de que esa persona
sea inocente?
-I I
22
87. Suponga que en Campus Piura de la UDEP el 44 % de los alumnos estudian Ingenierı́a
y el 12 % de éstos son mujeres. Además, el 60 % de los otros programas son mujeres. Si
EP
88. Un profesor quiere escoger 8 alumnos de un conjunto de 15. ¿De cuántas formas puede
hacerlo? A
89. En un aula de 30 alumnos hay 20 deportistas, de los cuales 8 practican deportes
IM
d ) ¿En cuántos de los grupos donde todos son deportistas hay 3 que practican
deportes colectivos?
e) ¿En cuántos grupos hay al menos un alumno que no practica deportes individuales?
91. De una ciudad donde fuman el 30 % de los ciudadanos mayores de edad, se toma una
muestra de 6 de ellos. ¿Cuál es la probabilidad de que 3 de ellos fumen?
E
AD
93. Tenemos cien urnas de tres tipos. El primer tipo contiene 8 bolas blancas y 2 negras; el
segundo tipo, 4 blancas y 6 negras y el tercero tipo, 1 blanca y 9 negras. Se elige una
urna al azar y se extrae de ella una bola, que resulta blanca. Se devuelve la bola a la
16
urna y se repite el proceso, siendo ahora la bola extraı́da negra. Si sabemos que es
39
30
la posibilidad de que, siendo la bola blanca, proceda del primer tipo de urna y que
61
es la posibilidad de que, siendo la bola negra, proceda del segundo tipo de urna, calcule
el número de urnas de cada tipo.
94. Un banco ha estimado por experiencias anteriores que la probabilidad de que una
EP
95. Una persona lanza un dado cuyas seis caras muestran: un “1”, dos “2” y tres “3”. Si
-L
obtiene “1” en el primer lanzamiento, gana el juego. Si no obtiene “1” puede seguir
S
lanzando el dado y gana si repite el resultado del primer lanzamiento. Si obtiene “1”
PU
$70.
AD
SÍ o NO a una pregunta. En ningún caso la empresa encuestada indica qué pregunta ha
22
98. En un club de varios miembros, el número de mujeres es el doble del número de hombres.
Si se van a elegir tres miembros para conformar un comité, ¿cuál es la probabilidad
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 142
de que dos sean hombres y uno sea mujer? Nota: Exprese la probabilidad pedida en
función del número de hombres y mujeres que forman el club.
2
examen, resultando ser mujer. Si la probabilidad de que pertenezca al grupo D es .
15
UD
100. Un maestro de matemáticas de secundaria iba a preparar una tarea de ejercicios sobre
ecuaciones de segundo grado para sus alumnos. Sólo debı́a poner números, en lugar de
A
los coeficientes a, b y c en la ecuación: ax2 + bx + c = 0 , por lo que para cada ecuación
IM
decidió lanzar un dado tres veces y usar como coeficientes los números que salieran. Una
-L
vez que tuvo cinco ecuaciones, fue a sacar copias de la tarea; mientras tanto, se le ocurrió
S
que en algunas de esas ecuaciones podrı́a no haber raı́ces reales, además de recordar
PU
que aún no habı́a enseñado los números complejos. Para una ecuación cualquiera de
M
esa tarea, calcule la probabilidad de que las dos raı́ces sean reales.
CA
101. Se lanza un dado cuatro veces ¿Cuál es la probabilidad de que obtengamos al menos
un cinco?
E
Masculino 27 87 26
20
Femenino 14 25 3
a) Sea varón?
b) esté en edades de 35 a 54?
c) sea mujer o mayor de 54?
d ) sea varón o esté en edades de 35 a 54?
e) sea varón, dado que es menor de 35?
f ) sea mayor de 54, dado que es de género masculino?
g) sea mayor de 54, dado que es de género femenino?
EP
104. Un jurado formado por 3 miembros que deciden por mayorı́a, lo constituyen 2 personas
que deciden cada una de manera independiente el veredicto correcto con probabilidad
“p” y una tercera persona que lo decide lanzando una moneda.
A
a) Si un juez individual tiene una probabilidad “p” de dar el veredicto correcto ¿cuál
IM
acertar?
S
PU
105. Lanzamos un dado normal tres veces. Si el segundo resultado es mayor que el primero,
¿Cuál es la probabilidad de que el tercero sea mayor que el primero?
106. Los empleados de una compañı́a se encuentran separados en tres divisiones: adminis-
tración, operación de planta y ventas. La siguiente tabla indica el número de empleados
en cada división clasificados por sexo:
MUJER HOMBRE
Administración 20 30
E
Operaciones 60 140
AD
Ventas 100 50
107. En un examen de estadı́stica, un estudiante debe elegir siete preguntas de las diez
dadas. ¿Cuál es la probabilidad de que:
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 144
108. A una fiesta asistieron un cierto número de personas, si al saludarse se produjeron 435
apretones y todos gentiles entre sı́ ¿Cuántas personas asistieron?
109. Un dado normal se lanza tres veces y la suma de los números obtenidos fue 15. Encuentre
la probabilidad de que en el primer lanzamiento haya salido 4.
110. ¿Qué es más probable: Sacar al menos un 6 al lanzar 5 veces un solo dado o sacar al
EP
b) ¿Cuál es el número de alumnos que debe tener el grupo para que la probabilidad,
S
de que el dı́a de cumpleaños de algún alumno del grupo coincida con el dı́a del
PU
112. Tenemos dos urnas; una A con 4 bolas rojas y 6 blancas, y otra B con 7 bolas rojas
CA
y 3 blancas. Se selecciona al azar una urna, se extrae una bola y se coloca en la otra
urna. A continuación, se extrae una bola de la segunda urna. Calcular la probabilidad
de que las 2 bolas extraı́das sean del mismo color.
113. El jugador A lanza 6 dados y gana si obtiene por lo menos un “1”. El jugador B lanza
12 dados y gana si obtiene por lo menos dos “1” ¿Quién tiene la mayor probabilidad
de ganar?
114. Si se elige al azar un número de tres cifras distintas, formado con los dı́gitos: 1, 2, 3, 4
E
117. Se lanzan tres monedas, y, si se obtienen 2 caras y un sello, se extraen dos canicas,
20
aleatoriamente, de una urna que contiene canicas numeradas del 1 al 100. Si las tres
monedas muestran el mismo resultado (tres caras o tres sellos), se extraen dos canicas,
de otra urna que contiene canicas numeradas del 1 al 50. ¿Cuál es la probabilidad de
que las canicas muestren dos números consecutivos?
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 145
118. ¿Cuántos números impares de 3 cifras distintas, se pueden formar con los dı́gitos: 4, 5,
7, 8 y 9? ¿Cuántos de ellos son menores que 500?
119. Si se elige un número impar de tres cifras distintas, formado con los dı́gitos: 4, 5, 7, 8
y 9, ¿Cuál es la probabilidad de que el número elegido sea menor que 500?
121. Se lanza un dado 6 veces, ¿cuál es la probabilidad de obtener puntuación par en los
lanzamientos impares e impar en los lanzamientos pares.
A
IM
a) ¿Cuántos números diferentes de cuatro cifras pueden formarse sin que se repita
S
ninguna cifra?
PU
124. Una caja contiene 8 canicas rojas, 3 blancas y 9 azules. Si se eligen 3 canicas al azar
¿Cuál es la probabilidad de que:
E
126. Si se elige al azar un número de cinco dı́gitos, ¿cuál es la probabilidad de que al menos
dos de sus dı́gitos sean ”7”?
127. ¿Cuál es la probabilidad de que, en un grupo de “n” alumnos, por lo menos dos de ellos
coincidan en su cumpleaños?
cifra?
UD
área geográfica que le corresponde. De esas 10 ciudades: 5 son mercados grandes para
S
PU
130. Se le pide a tres personas que escriban al azar una vocal ¿Cuál es la probabilidad de
que las tres personas escriban la vocal “e”?
131. Tres personas lanzan cada una cuatro monedas al aire. Determinar la probabilidad de
E
2
22
133. Ana, Beto, y Carlos lanzan sucesivamente y en ese orden un dado cargado. La primera
20
persona que saque un 6 gana. Si la probabilidad de sacar un 6 con ese dado cargado es
“p”, ¿cuál es la probabilidad de que gane Ana? ¿y de que gane Beto? ¿y de que gane
Carlos?
1
Nota: Puede ser útil la siguiente fórmula: 1 + x + x2 + x3 + ... =
1−x
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 147
134. Si elige al azar tres puntos de los nueve marcados en el plano cartesiano indicado en la
figura ¿Cuál es la probabilidad de que ellos se ubiquen sobre una misma recta?
EP
UD
135. Si se elige un número de seis cifras, ¿Cuál es la probabilidad de que tenga al menos una
A
cifra par?
IM
136. Se lanza una moneda ocho veces. Calcular la probabilidad de que el número de caras
-L
obtenidas en los primeros cuatro lanzamientos sea igual al número de caras obtenidas
S
PU
137. ¿Qué es más probable: Sacar al menos un 5 al lanzar 3 veces un solo dado o sacar al
CA
138. Si se elige al azar un número de cinco dı́gitos, ¿cuál es la probabilidad de que al menos
uno de sus dı́gitos sea “8”?
139. ¿Cuál es la probabilidad de que, en un grupo de 5 personas, por lo menos dos de ellas
hayan nacido el mismo dı́a de la semana (es decir, en lunes, martes,etc.)?
140. Drásticos cambios en el alfabeto y en las reglas de escritura contiene la nueva edición de
Ortografı́a elaborada por la Real Academia Española (RAE). Entre las modificaciones
E
más llamativas está la eliminación de algunas letras del alfabeto. Éstas son la “ch” y
AD
“ll”, que fueron suprimidas formalmente de la tabla del alfabeto, por lo que las letras
del abecedario ahora pasan a ser 27. Tomando en cuenta esto, si se le pidiera a cuatro
personas que escriban al azar, cada una en un papel, una letra del alfabeto:
blancas y n-i negras. Si se elige al azar una urna y se extraen de ella k canicas, una
22
tras otra con reemplazo ¿Cuál es la probabilidad de que las k canicas extraı́das sean
20
blancas?
142. En una lista de 80 clientes que poseen tarjeta de crédito hay 10 clientes que no están
al dı́a en sus pagos (morosos). Si selecciona aletoriamente 20 clientes de esa lista, ¿cuál
es la probabilidad de que al menos 3 de ellos sean morosos?
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 148
144. Para requerir a sus deudores que cumplan con sus pagos, una compañı́a utiliza: el
teléfono, visita personal y correo electrónico. De los datos registrados se sabe que al
25 % se le sugiere por vı́a telefónica que paguen, 30 % son visitados personalmente
y al resto se le envı́a un correo electrónico. Las probabilidades de recibir respuesta
EP
positiva (que el cliente pague su deuda) al aplicar estos métodos son: 0.6, 0.8 y 0.4,
respectivamente.
UD
c) Si acaban de informar que un cliente acaba de hacer efectivo el pago de una deuda,
S
145. En una ciudad se estudia la cantidad de usuarios de internet según el sexo. Suponga
CA
146. En una asignatura universitaria asisten a clase 100 alumnos de los 150 alumnos
matriculados. Se sabe que aprueban la asignatura, el 90 % de los alumnos que asisten
a clase y el 30 % de los que no asisten. Si se elige al azar a un estudiante ¿Cuál es la
-I I
147. De una encuesta de opinión realizada a 318 personas, sobre las condiciones del mercado
laboral en Lima Metropolitana, se obtuvo la siguiente información:
CAPÍTULO 3. TEORÍA DE PROBABILIDAD 149
148. Una empresa recibe billetes de tres bancos: A, B y C. Del Banco A recibe el 60 % de
A
todos los billetes, del banco B recibe el 30 %, y el resto los recibe del Banco C. Se ha
IM
determinado que la proporción de billetes falsos que provienen del Banco A es 0.1 %,
-L
149. Se desea conocer la opinión de los habitantes de un distrito limeño sobre cierta propuesta
M
CA
A
IM
S -L
PU
M
CA
E
AD
-I I
22
20
Capı́tulo 4
4.1. Introducción
El capı́tulo 2 se dedicó a la estadı́stica descriptiva, permitiéndonos describir datos
recogidos (muestrales, generalmente) organizándolos en una distribución de frecuencias y
A
representando gráficamente dicha distribución. Igualmente, como parte de la descripción del
IM
estándar para describir la dispersión o variabilidad de los mismos, ası́ como otras medidas
PU
de importancia (de forma y posición) para completar la descripción. Por tanto, ese capı́tulo
M
A partir del Capı́tulo 3, el punto de interés cambió: se enfocó en examinar algo que
tal vez sucederı́a, es decir, se analizó la posibilidad de que ocurriera algún resultado de un
experimento estadı́stico realizado y entendimos que se cuantificaba dicha probabilidad de
ocurrencia con un valor que estaba entre 0 y l, inclusive, y además se examinó la forma
cómo pueden manejarse las probabilidades de ocurrencia de los eventos de un experimento
utilizando las reglas de conteo o las leyes de adición y multiplicación de probabilidades, etc.
En el presente capı́tulo combinaremos los conceptos de los capı́tulos 2 y 3 creando
distribuciones de probabilidad que describan lo que probablemente sucederá, en vez de
lo que en realidad sucedió. La diferencia con el capı́tulo 2 es que allı́ elaboramos tablas
E
AD
variable aleatoria, y en resumen lo que se decı́a es que una variable aleatoria proporciona un
20
medio para describir los resultados experimentales empleando valores numéricos. También
aprendimos que el valor numérico de la variable aleatoria depende del resultado del
experimento. Una variable aleatoria puede ser discreta o continua dependiendo del tipo de
151
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 152
valores numéricos que asuma. Ası́, una variable aleatoria discreta puede asumir una cantidad
limitada de valores especı́ficos en un determinado intervalo y por lo general, los valores de una
variable aleatoria discreta es el resultado de contar algo. En cambio una variable aleatoria
continua, puede tomar una cantidad infinitamente grande de valores dentro de un intervalo y
por lo general, los valores de una variable aleatoria continua eran el resultado de medir algo.
Un aspecto importante de entender a partir de ahora es que los medios utilizados ası́
como las interpretaciones de probabilidad, son diferentes tanto para las variables aleatorias
discretas como para las variables aleatorias continuas. En este capı́tulo nos centraremos en
el tratamiento de las variables discretas.
EP
función de cuantı́a. Entonces, dada una variable aleatoria discreta X, se define su función
-L
Para que una función f (x) sea una función de probabilidad discreta, se deben satisfacer
CA
1. Los valores de las probabilidades deben estar entre cero y uno, inclusive: 0 ≤ p(x) ≤ 1,
∀x.
2. Si llamamos n al conjunto de todos los valores que puede tomar X, entonces la suma
n
X
de las probabilidades de dichos valores debe ser igual a 1: p(xi ) = 1
i=1
fácil determinar la probabilidad de diversos eventos que pueden ser útiles para tomar
decisiones (Anderson y Sweeney, 2008).
El ejemplo más simple de una distribución de probabilidad discreta es la distribución de
probabilidad uniforme discreta. Su función de probabilidad está definida por
1
f (x) = (4.1)
n
donde, “n” es el número de valores que la variable aleatoria puede asumir.
-I I
X 1 2 3 4 5 6
1 1 1 1 1 1
f(x) 6 6 6 6 6 6
0 en otros casos
UD
0.2
0.1
0.0
1 2 3 4 5 6
y
f (y) =
21
Y 1 2 3 4 5 6
EP
1 2 3 4 5 6
f(y) 21 21 21 21 21 21
UD
función de probabilidad de Y
A
0.5
IM
-L
0.4
S
PU
0.3
f(y)
M
0.2
CA
0.1
0.0
1 2 3 4 5 6
Figura 4.2: Función de probabilidad de Y:Número de puntos obtenidos al lanzar dado cargado
E
Ejemplo: Suponga que se está interesado en el número de caras obtenidas al lanzar tres
AD
veces una moneda. El experimento claramente es lanzar una moneda repitiendo la experiencia
3 veces. Si definimos X: Número de caras obtenidas, los posibles resultados son: cero, uno,
dos y tres caras. ¿Cuál es la distribución de probabilidad de X?
La función de probabilidad de X será:
X 0 1 2 3
1 3 3 1
f(x) 8 8 8 8
-I I
función de probabilidad de X
0.5
0.4
0.3
f(x)
0.2
EP
0.1
UD
0.0
0 1 2 3
denota por F (x). La función de distribución de una variable discreta recoge la probabilidad
PU
de que la variable tome valores menores o iguales a un valor dado, es decir, acumula las
M
F (x) = P (X ≤ x) (4.2)
Para una variable aleatoria discreta X, F (x) satisface las siguientes propiedades:
Grafı́quela.
En la tabla 4.1 se elaboró la distribución de probabilidad o función de probabilidad
de X=Número de puntos obtenidos al lanzar un dado. Ahora para obtener la función de
distribución de X analizamos de la siguiente forma:
1 1
F (x = 1) = p(X ≤ 1) = p(X = 1) + p(X ≤ 0) = +0=
6 6
1 1 2
F (x = 2) = p(X ≤ 2) = p(X = 2)+p(X = 1)+p(X ≤ 0) = + +0 = , y análogamente
6 6 6
para los demás valores de X seguimos acumulando sucesivamente las probabilidades y
obtenemos:
-I I
22
X 1 2 3 4 5 6
20
1 2 3 4 5 6
F(x) 6 6 6 6 6 6
función de distribución de X
1.0
●
0.8
●
0.6
F(x)
●
0.4
●
0.2
EP
●
UD
0.0
0 1 2 3 4 5 6 7
A X
probabilidad discreta
M
misma y es un valor particular que sirve para representar una distribución de probabilidad.
Es el valor promedio a largo plazo de la variable aleatoria. A la media de una distribución
probabilı́stica se le denomina también valor esperado, E(x), o esperanza matemática.
La media, es un promedio ponderado para el que los valores posibles que se consideran
son afectados (o ”sopesados“) por las probabilidades correspondientes de ocurrencia. Por lo
tanto, para hallar µ ó E(x), se multiplica cada resultado posible de la variable aleatoria por
su probabilidad de ocurrencia: p(x), y luego se suman los productos obtenidos.
Por lo tanto, la media aritmética teórica o valor esperado de una distribución de
E
probabilidad discreta (o valor esperado de una variable aleatoria discreta) se expresa ası́:
AD
n
X
µ = E(X) = xi .p(xi ) (4.3)
i=1
dos distribuciones que tengan la misma media, pero diferentes dispersiones. La varianza de
una distribución de probabilidad discreta es:
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 157
n
X
σ 2 = E[(x − µ)2 ] = (xi − µ)2 .p(xi ) (4.4)
i=1
la desviación estándar se mide en las mismas unidades que la variable aleatoria y, por lo
tanto, a menudo se prefiere al describir la variabilidad de una variable aleatoria. La varianza
UD
dado, la cual aparece en la tabla 4.1, entonces el valor esperado de X, siguiendo la expresión
-L
(4.3), será:
S
PU
n
X 1 1 1 1 1 1
µ = E(X) = xi .p(xi ) = 1 ∗ + 2 ∗ + 3 ∗ + 4 ∗ + 5 ∗ + 6 ∗ = 3.5 puntos
6 6 6 6 6 6
M
i=1
CA
Es decir que, si un dado se lanza infinitas veces, el número de puntos que en promedio se
obtendrı́a serı́a 3.5.
Para hallar la varianza de X aplicamos de forma más simple la expresión (4.5):
n
X
σ 2 = E[x2 ] − [E(x)]2 = x2i .p(xi ) − µ2 =
i=1
1 1 1 35
= 12 ∗ + 22 ∗ + . . . + 62 ∗ − 3.52 = ≈ 2.92 puntos2
6 6 6 12
√
E
Luego la desviación estándar será: σ = 2.92 ≈ 1.71 puntos, es decir que, si un dado se
AD
lanza infinitas veces,en promedio, lo que se desvı́a el número de puntos obtenidos respecto
del número promedio de puntos obtenidos será aproximadamente 1.71.
Ejemplo. Supóngase que una caja contiene 20 pequeños paquetes, todos iguales con
excepción del contenido. Supóngase que 10 de estos paquetes contienen una moneda de
l céntimo cada uno, cinco paquetes contienen una moneda de 5 céntimos cada uno, tres
contienen una moneda de 10 céntimos cada uno y dos contienen una moneda de 50 céntimos
cada uno. Si se selecciona un paquete al azar, ¿cuál es el valor esperado de la moneda
contenida en él?
-I I
Si definimos la variable Y: Dinero (en céntimos) contenido en el paquete elegido, luego esta
20
variable puede tener los siguintes valores: 1, 5, 10, 50. Entonces la probabilidad de elegir un
10 5
paquete que contenga 1 céntimo es: , de elegir un paquete que contenga 5 céntimos es: ,
20 20
3
de elegir un paquete que contenga 10 céntimo es: y de elegir un paquete que contenga 50
20
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 158
2
céntimo es: . Por tanto la distribución de probabilidad de Y, será:
20
Y 1 5 10 50
10 5 3 2
f(y) 20 20 20 20
paquete se repitiera un gran número de veces bajo las mismas condiciones, el valor medio de
las cantidades obtenidas serı́a, aproximadamente, 8,25 céntimos.
Ejemplo. Juan Ramı́rez vende automóviles nuevos. Generalmente, negocia el mayor
A
número de vehı́culos, los dı́as sábado. Ha establecido la siguiente distribución probabilı́stica
IM
b) En un sábado común, ¿cuántos autos debe esperar vender Juan? El número medio
E
AD
Este valor indica que, para una gran cantidad de sábados, el Sr. Ramı́rez espera vender
en promedio 2.1 autos al dı́a. (Desde luego, no es posible vender exactamente 2.1 autos
en un sábado en particular.) Por tanto, a la media se le considera como la esperanza
-I I
nos proporciona la desviación estándar de 1.14 autos? Por ejemplo, si otro vendedor
UD
(Julio Pérez) también vendió una media de 2.1 autos los sábados, y la desviación
estándar en sus ventas fue 1.91 autos, se concluirá que existe más variabilidad en las
transacciones sabatinas de Julio Pérez que en las del Sr. Ramı́rez (debido a que 1.91 >
1.14).
A
IM
Ejemplo. Una persona juega a lanzar dos monedas y le dicen que recibirá $4 si aparecen
dos caras, perderá $2 si aparecen dos sellos y perderá $1 si en una moneda aparece cara y en
S -L
El experimento es “jugar lanzando una vez las dos monedas”, luego la variable definida
M
sobre ese experimentos es Y: Ganancia o pérdida obtenida, entonces los valores que puede
CA
tener esta variable son tres: ganar 4 dólares, perder 2 dólares y perder l dólar. A cada uno de
estos resultados esta asociado un valor de probabilidad que se obtiene de lo que obtenga al
lanzar las dos monedas, ası́ la probabilidad de ganar 4 dólares está asociada a obtener 2 caras,
1
la cual es igual a = 0.25, la probabilidad de perder 2 dólares está asociada a obtener 2
4
1
sellos, la cual es igual a = 0.25 y , la probabilidad de perder l dólar está asociada a obtener
4
1 1 1
una cara y un sello, la cual es igual a + = = 0.50. La distribución de probabilidad
4 4 2
para este juego serı́a:
E
Y:Ganancia o pérdida -2 -1 4
AD
1 1 1
Probabilidad, P(x) 4 2 4
Esto quiere decir que si la persona jugara (lanzando dos monedas) infinitas veces entonces se
-I I
discreta.
Sea X una variable aleatoria discreta y sean a, b, c constantes; se verifica que:
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 160
Ejemplo. Suponga que el número de autos que pasan por una estación de lavado un
domingo , entre las 12 y 16 horas, tiene la siguiente distribución de probabilidades:
EP
X:Número de autos 4 5 6 7 8 9
f(x) 0.083 0.083 0.25 0.25 0.17 0.164
UD
a) ¿Cuál es el valor esperado de autos que pasa por la estación un domingo cualquiera?
El número medio de autos que pasa por la estación un domingo cualquiera se calcula
A
IM
n
X
S
i=1
M
el dueño de la estación paga a su empleado por lavar autos ¿Cuál es el valor esperado
de dinero que va a ganar el empleado un domingo cualquiera? ¿Cuál es la desviación
estándar de Y?
La ganancia esperada para el empleado, un domingo cualquiera, se calcula usando la
expresión (4.7)
√
de Y: σ(Y ) = 8.52 ≈ 2.92
22
20
2. Dos resultados son posibles en cada ensayo. Nos referimos a un resultado como un éxito
y el otro como un fracaso.
en ensayo.
UD
Si las propiedades 2, 3 y 4 están presentes, decimos que los ensayos son generados por
un proceso de Bernoulli. Si, además, la propiedad 1 está presente, decimos que tenemos un
A
experimento binomial.
IM
en los “n” ensayos. Si permitimos que “x” denote el número de éxitos que ocurren en los “n”
S
ensayos, vemos que “x” puede asumir los valores de 0, 1, 2, 3,. . ., n. Debido a que el número de
PU
2. Hay dos resultados posibles para cada ensayo: obtener 5 o no obtenerlo. Podemos
E
AD
3!
tendrı́amos: , por lo tanto la probabilidad de que obtengamos 2 veces el número 5 en
2! × 1!
UD
el número de formas en que se puede obtener dos veces el número 5 en un total de tres
S
PU
lanzamientos.
Ejemplo. El 30 % de todos los vehı́culos que llegan por una calle a cierta intersección
M
8 autos detenidos por la luz roja del semáforo ¿cuál es la probabilidad de que giren hacia la
izquierda exactamente tres?
Entonces reconociendo las caracterı́sticas de una distribución binomial presentes en este
problema podemos decir, que el experimento consta de 8 ensayos idénticos, osea el número
de autos (8) en dicha intersección serian los “ensayos”. Cada ensayo implica lo que decida
hacer el conductor de un auto). Siguiendo con el análisis, sólo hay dos posibles resultados:
girar a la izquierda o no hacerlo. Ahora, la variable aleatoria o fenómeno de interés aquı́
es el “número de autos que giren a la izquierda” (aquı́, el girar a la izquierda está definido
E
como éxito), por ende si existen 8 carros en esa intersección el número de autos que giren
AD
de la multiplicación, para eventos independientes: 0.3 × 0.3 × 0.3 × 0.7 × 0.7 × 0.7 × 0.7 × 0.7,
sin embargo esto nos da la probabilidad asociada a un orden particular de éxitos (que los
tres primeros autos volteen a la izquierda y los 5 restantes no lo hagan). Si ahora se desea
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 163
8!
encontrar el número de maneras de seleccionar 3 autos de un total de 8 tendrı́amos:
3! × 5!
, por lo tanto la probabilidad de que exactamente 3 autos volteen a la izquierda será igual a:
8! 8!
P = 0.3 × 0.3 × 0.3 × 0.7 × 0.7 × 0.7 × 0.7 × 0.7 × = 0.33 × 0.75 = 0.2541
3! × 5! 3! × 5!
Entonces lo que hemos hecho para hallar la probabilidad pedida es aplicar la Regla
generalizada de la multiplicación, para eventos independientes, y hemos multiplicado por
el número de formas en que se pueden ordenar los 8 autos que conforman un subgrupo de 3
EP
Se puede notar que en los ejemplos anteriores, se calcula la probabilidad de que, de una
muestra de “n” elementos (número de ensayos), “x” tengan cierta caracterı́stica (número
de “éxitos”), y los restantes “n - x” no la tengan (número de “fracasos”); siendo constante
la probabilidad (p) de que un elemento cualquiera tenga dicha caracterı́stica; ası́ como la
A
probabilidad de que no tenga la mencionada caracterı́stica (q = 1 - p).
IM
n!
P (X = x) = px (1 − p)n−x (4.10)
M
x!(n − x)!
CA
binomial con parámetros “n” y “p”. La notación comunmente utilizada para expresar esto
es, X ∼ B(n, p).
Ejemplo. Tomando como referencia el problema de los autos, ¿Cuál serı́a la probabilidad
de que al menos 3 autos giren hacia la izquierda?
Para resolver esto debemos calcular: P(X=3), P(X=4), P(X=5), P(X=6), P(X=7) y
P(X=8); y sumar estas cantidades para obtener la probabilidad pedida. Entonces tendrı́amos:
P (X ≥ 3) = P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6) + P (X = 7) + P (X = 8)
-I I
8! 8! 8!
= × 0.33 × 0.75 + 0.34 × 0.74 + 0.35 × 0.73 +
3! × 5! 4! × 4! 5! × 3!
22
8! 8! 8!
20
“n” ensayos binomiales, siendo como ya se sabe “p” la probabilidad que se tenga éxito en un
ensayo.
UD
Por ejemplo, en la Tabla 4.2 para 6 ensayos (n=6) y probabilidad de éxito en un ensayo
de 0.05 (p=0.05); la probabilidad de 2 éxitos, (x=2) es 0.0305 (resaltado en negrita).
p
A
IM
Tabla 4.2: Valores seleccionados de la tabla de probabilidad binomial para el caso n=6, x=2, p=0.05
De la misma forma si quiséramos resolver del problema de los autos, la pregunta del
ejemplo anterior: ¿Cuál serı́a la probabilidad de que al menos 3 autos giren hacia la
E
izquierda? utilizando las tablas debemos buscar: n = 8 y luego p = 0.3, para determinar las
AD
probabilidades: P(X=3), P(X=4), P(X=5), P(X=6), P(X=7) y P(X=8), para luego sumarlas
y hallar la probabilidad de que por lo menos 3 vehı́culos giren hacia la izquierda, o sea:
En las tablas encontraremos, para n = 8, p = 0,30, las probabilidades: P(X=3), P(X=4),
P(X=5), P(X=6), P(X=7) y P(X=8) tal como se muestran resaltadas en la Tabla 4.3 y las
cuales al ser sumadas definirán el resultado que halláramos (0.4482).
Valor esperado y varianza para la distribución binomial
Si X ∼ b(n, p) entonces:
µ = E(X) = n × p (4.11)
-I I
V ar(X) = σ 2 = n × p × (1 − p)
22
(4.12)
20
Ejemplo. Del problema de los autos. ¿Cuántos autos se esperarı́a giren a la izquierda?,
¿Cuál es la desviación estándar del número de autos que giran a la izquierda?
Recordando que para este problema: n=8, p = 0.30 y q =1-p= 0.70; se tiene que:
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 165
p
n x 0.01 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40
8 0 0.9227 0.6634 0.4305 0.2725 0.1678 0.1001 0.0576 0.0319 0.0168
1 0.0746 0.2793 0.3826 0.3847 0.3355 0.2670 0.1977 0.1373 0.0896
2 0.0026 0.0515 0.1488 0.2376 0.2936 0.3115 0.2965 0.2587 0.2090
3 0.0001 0.0054 0.0331 0.0839 0.1468 0.2076 0.2541 0.2786 0.2787
4 0.0004 0.0046 0.0185 0.0459 0.0865 0.1361 0.1875 0.2322
EP
Tabla 4.3: Valores seleccionados de la tabla de probabilidad binomial para n=8, p=0.30 y
x=3,4,5,6,7,8.
S -L
PU
P (X < 5) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4)
AD
Entonces consultando las tablas binomiales, para n=8, p = 0.30, tomaremos los valores
de P(X=0), P(X=1), P(X=2), P(X=3), P(X=4); que aparecen en negrita como se aprecia
en la Tabla 4.4 y sumaremos estas cantidades para obtener la probabilidad pedida.
Luego la probabilidad pedida es:
P (X < 5) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4)
= 0.9420
-I I
22
Consideramos ahora una variable aleatoria discreta que a menudo es útil para estimar
el número de ocurrencias en un intervalo especı́fico de tiempo, longitud, área, espacio, etc.
Por ejemplo, la variable aleatoria de interés puede ser el número de vehı́culos que llegan a
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 166
p
n x 0.01 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40
8 0 0.9227 0.6634 0.4305 0.2725 0.1678 0.1001 0.0576 0.0319 0.0168
1 0.0746 0.2793 0.3826 0.3847 0.3355 0.2670 0.1977 0.1373 0.0896
2 0.0026 0.0515 0.1488 0.2376 0.2936 0.3115 0.2965 0.2587 0.2090
3 0.0001 0.0054 0.0331 0.0839 0.1468 0.2076 0.2541 0.2786 0.2787
4 0.0004 0.0046 0.0185 0.0459 0.0865 0.1361 0.1875 0.2322
EP
Tabla 4.4: Valores seleccionados de la tabla de probabilidad binomial para n=8, p=0.30 y x=0,1,2,3,4
S -L
espera de servicio en un restaurante, o los que aguardan a entrar a una de las atracciones en un
centro de diversiones, el número de accidentes en una carretera durante un perı́odo de tiempo
(tres meses, por ejemplo), etc. Si se satisfacen las dos propiedades siguientes, el número de
ocurrencias es una variable aleatoria descrita por la distribución de probabilidad de
Poisson.
Propiedades de un experimento de Poisson
e−λ × λx
P (X = x) = (4.13)
x!
donde:
P(X=x) : Probabilidad de “x” ocurrencias en un intervalo.
-I I
especı́fica).
20
√
La desviación estándar de una variable con distribución de Poisson es λ. La notación
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 167
comunmente utilizada para expresar que una variable sigue distribución de Poisson es,
X ∼ P (λ).
En aplicaciones prácticas, x eventualmente se volverá lo suficientemente grande como
para que f (x) sea aproximadamente cero y la probabilidad de que cualquier valor mayor de
x se vuelva insignificante (Anderson et al., 2014).
Ejemplo. Usted es el gerente de una tienda y sabe que, fuera del horario de mayor
demanda, entran en promedio, 6 clientes cada 10 minutos. ¿Cuál es la probabilidad de que
entren:
EP
identificamos que:
X: número de clientes que entram en un perı́odo de 10 minutos;
λ =6 clientes/10 minutos
A
IM
e−6 × 65
P (X = 5) = = 0.1606
5!
M
P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2)
e−6 × 60 e−6 × 61 e−6 × 62
= + +
0! 1! 2!
= 0.0025 + 0.0149 + 0.0446 = 0.062
P (X ≥ 3) = 1 − (P (X = 0) + P (X = 1) + P (X = 2))
e−6 × 60 e−6 × 61 e−6 × 62
= 1−( + + )
0! 1! 2!
-I I
1 y 2, para determinar las probabilidades: P(X=0), P(X=1), P(X=2), tal como se muestran
UD
resaltadas en la Tabla 4.5 y las cuales al ser sumadas definirán el resultado que halláramos
(0.062).
λ
A
IM
x 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 6.0
0 0.0061 0.0055 0.0050 0.0045 0.0041 0.0037 0.0033 0.0030 0.0027 0.0025
S -L
1 0.0311 0.0287 0.0265 0.0244 0.0225 0.0207 0.0191 0.0176 0.0162 0.0149
PU
2 0.0793 0.0746 0.0701 0.0659 0.0618 0.0580 0.0544 0.0509 0.0477 0.0446
M
3 0.1348 0.1293 0.1239 0.1185 0.1133 0.1082 0.1033 0.0985 0.0938 0.0892
CA
4 0.1719 0.1681 0.1641 0.1600 0.1558 0.1515 0.1472 0.1428 0.1383 0.1339
5 0.1753 0.1748 0.1740 0.1728 0.1714 0.1697 0.1678 0.1656 0.1632 0.1606
6 0.1490 0.1515 0.1537 0.1555 0.1571 0.1587 0.1594 0.1601 0.1605 0.1606
7 0.1086 0.1125 0.1163 0.1200 0.1234 0.1267 0.1298 0.1326 0.1353 0.1377
8 0.0692 0.0731 0.0771 0.0810 0.0849 0.0887 0.0925 0.0962 0.0998 0.1033
9 0.0392 0.0423 0.0454 0.0486 0.0519 0.0552 0.0586 0.0620 0.0654 0.0688
E
10 0.0200 0.0220 0.0241 0.0262 0.0285 0.0309 0.0334 0.0359 0.0386 0.0413
AD
11 0.0093 0.0104 0.0116 0.0129 0.0143 0.0157 0.0173 0.0190 0.0207 0.0225
12 0.0039 0.0045 0.0051 0.0058 0.0065 0.0073 0.0082 0.0092 0.0102 0.0113
13 0.0015 0.0018 0.0021 0.0024 0.0028 0.0032 0.0036 0.0041 0.0046 0.0052
14 0.0006 0.0007 0.0008 0.0009 0.0011 0.0013 0.0015 0.0017 0.0019 0.0022
15 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005 0.0006 0.0007 0.0008 0.0009
16 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002 0.0003 0.0003
-I I
17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001
22
20
1000!
P (X = x) = 0.001x (1 − 0.001)1000−x
UD
x!(1000 − x)!
No hay tablas binomiales que muestren las probabilidades requeridas y puede ocurrir
que las calculadoras tengan problemas con los grandes factoriales involucrados aquı́. La
distribución de Poisson surge como el lı́mite de una secuencia de distribuciones binomiales
A
cuando p → 0+ y n → ∞ de tal manera que “n × p = µ” es constante.
IM
probabilidad de éxito es muy pequeña y el número de ensayos es muy grande. Una pequeña
S
PU
“p” significa que el éxito es un evento raro. Algunos autores consideran que la aproximación
de la distribución binomial B(n, p) con una distribución de Poisson es aceptable si n ≥ 50 y
M
P (X ≤ 4) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4)
E
P (X ≤ 4) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4)
= 0.3677 + 0.3681 + 0.1840 + 0.0613 + 0.0153 = 0.9964
-I I
2. Una persona va a lanzar un par de dados y recibirá un número de soles igual a la suma
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 170
4. Una vendedora en un estadio local de fútbol debe decidir si vende helados o refrescos
A
IM
durante el juego de mañana. Ella piensa que el beneficio obtenido dependerá del clima.
La tabla de pagos es:
S -L
PU
ACCIÓN
M
Con base en su última experiencia en esta época del año, la vendedora estima la
probabilidad de que haga calor en 0.60
Probabilidad
Calificación de satisfacción en el trabajo Altos ejecutivos Mandos medios
1 0.05 0.04
2 0.09 0.10
3 0.03 0.12
4 0.42 0.46
5 0.41 0.28
EP
k
6. Determinar el valor de k para que la función P (x) = , donde x = 1, 2, 3, 4, sea la
x
función de probabilidad de x. Determinar P (1 ≤ x ≤ 3).
A
7. Una empresa ha medido el número de errores que cometen las secretarias recién
IM
contratadas a lo largo de los últimos tres años (X), encontrando que éstas cometen
-L
hasta cinco errores en una página de 20 lı́neas y que esta variable aleatoria representa
S
X 0 1 2 3 4 5
CA
X 0 1 2 3 4 5 6
f(x) 0.47 0.30 0.10 0.06 0.04 0.02 0.01
¿Cuál es el valor de E[X]? Supóngase que se selecciona al azar una de las 35 letras que
tiene la oración anterior. Si Y es el número de letras de la palabra en que aparece la
letra seleccionada ¿cuál es el valor de E[Y]?
11. Una urna contiene 8 canicas similares en todos los aspectos, con excepción del color.
EP
Cuatro de ellas son rojas, tres son blancas y una es negra. Se selecciona una canica al
UD
12. Una ruleta tiene 38 compartimientos numerados: 0, 00, 1, 2, ..., 36. La mitad de
A
los compartimientos entre 1 y 36 son rojos y la otra mitad son negros. Los dos
IM
compartimiento rojo, el jugador gana $1. De otra manera, pierde $1. ¿Qué deberı́a
PU
13. Suponga que selecciona al azar una palabra de la frase: ANOCHE ME ROBARON EL
CARRO MIENTRAS DORMÍA. Si la variable X es el número de letras de la palabra
seleccionada, calcule E(X) y σ(X).
14. Un inversionista tiene $1,000 para invertir. Tiene dos opciones. En una, puede invertir
en una cuenta que paga 5 % anualmente. En la otra puede comprar un bono. Si compra
el bono, tiene una probabilidad igual a de perder $300 y una probabilidad igual a de
ganar $700. ¿Cuál opción debe escoger?
E
AD
15. Una persona que participa en un juego lanza un dado. Si obtiene 5 ó 6 en el primer
lanzamiento gana $10. Si no, vuelve a lanzar el dado, y si repite el resultado del primer
lanzamiento, gana $8.Si no repite este resultado, pero obtiene un número mayor, gana
$4; pero si obtiene un número menor, lanza el dado por tercera vez. Si esta vez repite
el resultado del primer lanzamiento, se retira sin ganar ni perder; pero si no se repite
dicho resultado, pierde $20. ¿Cuánto espera la persona ganar o perder?
16. En una prueba de aptitud conformada por 25 preguntas, 4 son de cultura general. A
un alumno se le asignarán 20 preguntas al azar para que haga una tarea. Si se define
-I I
17. En una loterı́a se venden 200 boletos, de los cuales dos son ganadores de $1000, ocho de
$500, 10 de $200, 12 de $100 y 60 de $10. Sea X una variable aleatoria que representa
la ganancia de un jugador:
tenı́a menos de 15 años. Si fuera posible elegir una muestra aleatoria de la población
mundial formada por diez personas, ¿cuál es la probabilidad de que a lo sumo haya tres
M
20. Una universidad se entero de que el 20 % de sus alumnos se retiran del curso de
introducción a la fı́sica cuántica. Suponga que en este semestre se inscribieron 20
alumnos a ese curso.
21. Los registros hospitalarios indican que el 10 % de los casos de cierta enfermedad es
fatal. Si hay 10 pacientes que sufren la enfermedad, encontrar la probabilidad:
23. Una secretaria que debe llegar a su trabajo todas las mañanas a las 8:00 se retrasa
como mı́nimo 15 minutos el 20 % de las veces. El jefe de la oficina, que no llega sino a
las nueve la mayorı́a de las veces, pero llama ocasionalmente a la oficina entre las 8:00
y las 8:15 para enterarse de las novedades
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 174
24. Se sabe que X es una variable aleatoria binomial con un media igual a 8 y una desviación
estándar de 2. Elaborar la distribución de probabilidad de X.
25. Al probar una cierta clase de medicamento en 100 estudiantes se encontró que 25 de
EP
26. Suponga que selecciona al azar una palabra de la frase: SE ENSAYAN LOS BAILES
M
27. Un examen tipo test consta de diez preguntas, las cuales tienen cuatro posibles
respuestas, siendo solo una de ellas correcta. Si una persona contestase al azar , es
decir, eligiese de forma aleatoria una de las cuatro respuestas posibles de cada una de
las 10 preguntas:
preguntas?
AD
30. La probabilidad de que un compact disc, dure al menos un año sin que falle es de 0.95,
calcular la probabilidad de que en 15 de estos aparatos:
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 175
d) Para hacer rentable a la sociedad, cuando menos de tres de los pozos de exploración
S
32. En cada una de las siguientes situaciones diga si X tiene o no una distribución binomial.
M
por qué.
Lanzar una moneda justa 9 veces. Sea X el número de caras que usted observa.
El departamento de servicio de un concesionario de automóviles realiza un
seguimiento de cada atención de servicio con una encuesta de satisfacción del
cliente mediante una llamada telefónica. En un dı́a determinado, sea X el número
de clientes a los que debe llamar un representante de servicio hasta que el cliente
esté dispuesto a participar en la encuesta.
E
AD
33. Se sabe que un determinado medicamento produce mejorı́a de cierta enfermedad a dos
de cada tres pacientes. Se les administra a siete enfermos.
34. Carlos Pérez está a cargo de la sección electrónica de Ace Home Center de Surquillo.
Se ha dado cuenta de que la probabilidad de que un cliente que solamente se encuentre
curioseando compre algo es de 0.3. Suponga que 15 clientes visitan la sección de
-I I
a) ¿Cuál es la probabilidad de que al menos una de las personas que curiosea compre
algo durante una hora dada?
b) ¿Cuál es la probabilidad de que al menos 4 personas que curiosea compren algo
durante una hora dada?
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 176
35. Las llegadas de clientes a la tienda Wong de San Isidro siguen una distribución de
Poisson. Suponga que la llegada promedio de clientes es de 3 clientes por minuto.
36. Con base en la experiencia, se supone que el número de defectos por pie en rollos de
papel grado 2 sigue una distribución de Poisson con un promedio de 1 defecto por cada
5 pies de papel (0.2 defectos por pie).
A
a) ¿Cuál es la probabilidad de que en un rollo de 1 pie haya por lo menos 2 defectos?
IM
inclusive?
M
40. En una conocida intersección un policı́a de tránsito aplica en promedio 3 multas diarias.
Hallar la probabilidad de que un dı́a cualquiera levante: a) exactamente 5 infracciones,
b) menos de tres infracciones, c) Por lo menos 2 infracciones.
43. En una fábrica el número de accidentes por semana sigue una ley de Poisson con λ = 2.
Se pide la probabilidad de que haya 4 accidentes en dos semanas.
44. Suponga que en promedio una secretaria comete 3 errores de mecanografı́a por página.
Encuentre la probabilidad de que en una página tenga: a) Exactamente 5 errores, b)
Al menos 4 errores.
45. La probabilidad de que una persona muera de cólera o tifoidea por comer un caldo de
gallina en el centro de la ciudad es de 0.002. Encuentre la probabilidad de que mueran
menos de 5 de las siguientes 2000 personas que contrajeron estas enfermedades por
EP
46. Durante las horas de tráfico intenso los accidentes se presentan en una zona urbana con
una frecuencia de dos por hora. El periodo matutino de tráfico intenso dura una hora
y 30 minutos, y el vespertino dos horas.
A
IM
intenso?
M
tráfico intenso?
47. Los accidentes de trabajo que se producen en una fábrica por semana, siguen una ley de
16
Poisson tal que la probabilidad de que haya 5 accidentes es de que haya 2 accidentes.
15
Se pide:
del mismo nombre. Un concejal ha solicitado que el Congreso asigne fondos para
adquirir equipos que alejen a las aves del monumento. Un subcomité del congreso le
ha respondido que no puede asignarle fondos para tal fin a menos que la probabilidad
de que mueran más de 3 pájaros cada semana sea mayor a 0.70, ¿Deben destinarse los
fondos para dichos equipos?
49. Consideremos que el número de trozos de chocolate de una galleta sigue una distribución
de Poisson. Queremos que la probabilidad de que una galleta seleccionada al azar tenga
-I I
por lo menos tres trozos de chocolate sea mayor que 0.8. Encontrar el menor valor entero
22
50. Suponga que en una lı́nea aérea, el gerente se ha enterado que en promedio uno de
cada 150 vuelos se retrasan más de una hora. Si se hacen 1500 vuelos en un mes, ¿Cuál
es la probabilidad de que más de 5 vuelos se retrasen más de una hora? ¿Cuál es la
probabilidad de que menos de 4 vuelos se retrasen más de una hora?
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 178
minutos.
S -L
53. En la realización de un programa, el número de errores cometidos por página sigue una
PU
un programa de 20 páginas?
CA
54. Suponga que 1.5 % de los separadores de plástico producidos por una máquina de
inyección de moldeo de alta velocidad tienen defectos. Para una muestra aleatoria de
200 separadores,
55. En un proceso de fabricación de pelı́cula fotográfica aparece por término medio 1 defecto
por cada 20 metros de pelı́cula. Si la distribución de defectos es del tipo de Poisson,
E
57. Una caja contiene 20 canicas blancas y 2 negras. Se extraen sucesivamente “n” canicas
22
extracciones que deben hacerse para que la probabilidad de sacar una canica negra,
al menos una vez, sea superior a 0.5.
59. La probabilidad de que una persona muera de cáncer es de 0.0003. Si se hace la autopsia
a 20,000 personas fallecidas.
60. Una persona participa en un juego donde la probabilidad de ganar es 0.40, ¿Cuántas
veces debe jugar si quiere que la probabilidad de ganar al menos 3 veces sea mayor que
0.80?
A
61. Se ha comprobado que determinada prueba cultural es superada por el 70 % de las
IM
personas con estudio de grado medio y por el 55 % de las personas con estudios
-L
primarios. Un total de 10 personas (seis con estudios de grado medio y cuatro con
S
PU
63. Los mensajes que llegan a una computadora utilizada como servidor lo hacen de acuerdo
22
con una distribución de Poisson con un promedio de 0.1 mensajes por minuto.
20
64. Las llamadas de teléfono recibidas en una casa siguen un proceso de Poisson con un
valor medio de 2 llamadas por hora.
65. Una máquina produce piezas metálicas, de las cuales 5 % son de calidad excelente.
EP
¿Cuántas piezas deberán producirse para que la probabilidad de que haya por lo menos
una pieza de calidad excelente sea mayor a 0.5?
UD
67. La probabilidad de obtener cara al lanzar una moneda es igual a p. Suponga que
M
lanzamos tres veces dicha moneda. Sea la variable aleatoria X=Número de caras que
CA
69. Se sabe que el 5 % de las velas, producidas por una determinada marca, son defectuosas.
Las velas se empaquetan en cajas de 10 unidades y las cajas en bolsas de 100 cajas. Se
le pide:
-I I
a) La probabilidad de que al comprar una bolsa, ésta contenga todas las cajas con
22
b) La probabilidad de que en una bolsa, haya menos de 5 cajas, con 4 o más velas
defectuosas.
c) ¿Cuántas velas defectuosas esperarı́a encontrar en una caja?
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 181
70. Una empresa de limpieza recibe 100 euros diarios por la limpieza de unas oficinas. El
número de horas necesarias para la limpieza diaria varı́a de acuerdo con la siguiente
tabla:
4 0.10
UD
5 0.05
71. Supóngase que la producción de un dı́a de 850 piezas manufacturadas contiene 50 piezas
CA
que no cumplen con los requerimientos del cliente. Se seleccionan del lote dos piezas
al azar y sin reemplazo. Sea la variable aleatoria X igual al número de piezas de la
muestra que no cumplen con los requerimientos:
72. Los automóviles que llegan a un semáforo siguen un proceso de Poisson con media de
AD
73. Una urna contiene 2 esferas blancas y 3 negras. De la urna sacamos una esfera y la
22
esferas, una tras otra y sin reemplazo. Si salió negra, sacamos una esfera. Sea la variable
aleatoria Y igual al número de esferas negras extraı́das la segunda vez.
75. Se supone que el número de resfriados que una persona cualquiera contrae durante el
-L
76. Para cada una de las siguientes situaciones, identifique el experimento, cuál es la variable
de interés y sustente si dicha variable sigue o no una distribución binomial (en caso
E
AD
a) Extraemos diez cartas de una baraja (una tras otra y sin reemplazo) y nos interesa
contar cuántos ases obtenemos.
b) Lanzamos un dado cien veces y nos interesa el número de unos que obtenemos.
77. Una empresa electrónica observa que el número de componentes que fallan antes de
cumplir 100 horas de funcionamiento es una variable aleatoria de Poisson. Si el número
promedio de estos fallos es de ocho.
-I I
22
78. Una urna contiene 5 canicas rojas, 4 blancas y 2 verdes. Extraemos una canica,
anotamos su color y la devolvemos a la urna. Si repetimos la experiencia 7 veces:
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 183
79. Se supone que el número de bacterias por mm3 de agua en un estanque es una variable
UD
capacidad 1 mm3 ) y resulta que en dicha muestra hay alguna bacteria ¿Cuál es
-L
c) Si se tienen 4 tubos de ensayo (de capacidad 1 mm3 cada uno), llenados con dicha
PU
bacterias.
CA
d) Si se eligen al azar 3 artı́culos (uno tras otro con reemplazo) y se obtiene como
mı́nimo 1 artı́culo defectuoso ¿Cuál es la probabilidad de que se obtengan menos
de 3 artı́culos defectuosos?
e) Calcule e interprete el valor esperado y la desviación estándar de la variable de
interés del apartado a.
f) Calcule e interprete el valor esperado y la desviación estándar de la variable de
interés del apartado b.
-I I
81. Ana, Benito y Carlos comparten un departamento donde hay un teléfono fijo. Ana
22
2 2 1
recibe de todas las llamadas, Benito y Carlos . Evidentemente no siempre están
20
5 5 5
en casa para atender las llamadas. Ana está fuera el 50 % del tiempo, Benito el 75 %,
y Carlos, el más casero, el 25 %. Calcule la probabilidad de que:
82. En el directorio de una empresa se tienen un total de 20 asientos contables, de los cuales
6 están mal asentados y el resto está correctamente asentado. La SUNAT envı́a un
auditor y este selecciona al azar 4 asientos contables para inspeccionarlos. La empresa
deberá pagar una multa de 600 nuevos soles por cada uno de los asientos contables mal
asentados.
EP
85. Suponga que el número de denuncias que realizan los trabajadores de cierta empresa
20
número de pequeños negocios que se declaran en quiebra al mes sigue una distribución
-L
88. Un vendedor de seguros vende en promedio 3 pólizas por semana (7 dı́as). Se supone
CA
89. Se supone que el número de imperfecciones que puede encontrarse en una botella
de vidrio sigue una distribución de Poisson con media igual a 3. Si elegimos 6
botellas al azar ¿Cuál es la probabilidad de que menos de cuatro botellas contengan 2
imperfecciones?
90. Felipe Aldana es un agente de bolsa (también conocido como broker o corredor de
E
AD
bolsa). Suponga que el número de paquetes de 1000 acciones cada uno que Felipe
Aldana vende un dı́a jueves entre las 10 am y 11 am. es una variable aleatoria con la
siguiente distribución de probabilidad:
paquetes de acciones?
b) ¿Cuál es la probabilidad de que Felipe Aldana venda al menos 7 paquetes de
acciones un jueves cualquiera entre las 10 am y 11 am?
CAPÍTULO 4. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA 186
A
IM
S -L
PU
M
CA
E
AD
-I I
22
20
Capı́tulo 5
5.1. Introducción
En el capı́tulo 4 estudiamos la variable aleatoria discreta y su distribución de probabilidad
en general y resaltamos dos distribuciones probabilı́sticas discretas usuales: la distribución
A
binomial y la distribución de Poisson. Recuérdese que las mismas se basan en variables
IM
aleatorias discretas, que pueden tomar sólo valores especı́ficos en un intervalo. En este capı́tulo
-L
Una diferencia fundamental que distingue a las variables aleatorias discretas de las
M
continuas es la forma cómo se calculan las probabilidades. Para una variable aleatoria discreta,
CA
Debido a que el área bajo la gráfica de la fdp en cualquier punto particular es cero, una
de las implicaciones de la definición de probabilidad para las variables aleatorias continuas
es que la probabilidad de cualquier valor particular de la variable aleatoria es cero. Esto es
lo que distingue a los fenómenos continuos (que se miden) de los fenómenos discretos (que se
cuentan).
Cuando la variable es continua, no tiene sentido hacer una suma de las probabilidades
de cada uno de los valores de la variable, ya que el conjunto de valores que puede tomar la
variable es no numerable. En este caso, lo que generaliza de modo natural el concepto de
P R
-I I
sumatoria ( ) es el de integral .
22
Sea X una variable aleatoria continua, entonces una función de densidad de probabilidad
de X es una función f(x) tal que para dos números cualesquiera a y b, siendo a ≤ b
187
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 188
Z b
P (a ≤ X ≤ b) = f (x)dx, (5.1)
a
es decir, la probabilidad de que X tome un valor en el intervalo [a, b] es el área bajo la gráfica
de una función de densidad, dentro de este intervalo. La curva f (x) se llama función de
densidad.
Para que f (x) sea una función de densidad de probabilidad, se deben satisfacer las
siguientes condiciones:
EP
2. f (x)dx = 1.
−∞
F : R → [0, 1]
x → F (x) = P (X ≤ x)
E
La función de distribución acumulada, F (x), para una variable aleatoria continua X, está
AD
dF (x)
22
= f (x), (5.3)
dx
20
La Varianza es
-L
Z +∞
S
−∞
Ejercicios resueltos.
1. Sea X una variable aleatoria continua que tiene la siguiente función de densidad:
-I I
2
c.x si 0≤x≤2
22
f (x) =
20
0 en otros casos
Hallar:
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 190
−∞ 0 2
x3 2
UD
0+c +0 = 1
3 0
c 3
2 − 03 = 1
3
8
c = 1
A
3
IM
3
de lo cual obtenemos que c = . Por lo tanto, la función de densidad de la variable
-L
8
S
aleatoria continua X es
PU
3 2
M
8 x si 0≤x≤2
CA
f (x) =
0 en otros casos
−∞
AD
para 0 ≤ x < 2
Z Z Z
x 0 x
3 2 1 x x3
F (x) = f (y)dy = 0.dy + y dy = 0 + y 3 = .
−∞ −∞ 0 8 8 0 8
para x ≥ 2
Z Z Z Z
x 0 2
3 2 x
1 2 23
F (x) = f (y)dy = 0.dy + y dy + 0.dy = 0 + y 3 + 0 = =1
−∞ −∞ 0 8 2 8 0 8
-I I
22
0 si x<0
3
x
F (x) = si 0 ≤ x < 2
8
1 si x≥2
1.00
UD
0.75
A
IM
S -L
F(x)
PU
0.50
F(x)
M
CA
0.25
0.00
−4 −2 0 2 4
x
c) Calcular P (1 ≤ X ≤ 2).
Para este cálculo podemos utilizar la función de densidad o la función de
distribución acumulada. Por ejemplo empleando ésta última através de (5.5)
tenemos
23 13 7
P (1 ≤ X ≤ 2) = F (2) − F (1) = − = .
8 8 8
Si hubiéramos utilizado la función densidad procederı́amos como en (5.1)
-I I
Z 2
3 2
22
P (1 ≤ X ≤ 2) = x dx,
8
20
última tenemos
UD
Z +∞
σ 2 = V ar(X) = x2 .f (x)dx − µ2
−∞
Z 0 Z 2 Z +∞ 2
3 3
= x2 .0.dx +
x2 . x2 dx + x2 .0.dx −
8 2
A
−∞ 0 2
3 5 2
IM
9 3
= 0+ x +0 − =
40 0 4 20
S -L
PU
dı́a especificado.
Para este último apartado, tenemos expresada la ganancia en función de la v.a
continua X la cual sabemos que tiene una función densidad definida en el apartado
a). Entonces la función de la ganancia según el enunciado es
5x si 0 ≤ x ≤ 1
g(x) =
8x si 1 < x ≤ 2
E
AD
Por tanto para obtener la ganancia esperada del vendedor, usamos (5.11)
Z +∞
E(Y ) = g(x)f (x)dx
−∞
Z 0 Z 1 Z 2 Z +∞
= 0.0.dx + g(x)f (x)dx + g(x)f (x)dx + 0.0.dx
−∞ 0 1 2
Z Z
1
3x2 2
3x2 15x4 1 15 453x4 2
375
= 0+ 5x dx + 8x dx + 0 = + = + =
0 8 1 8 32 0 4 1 32 4 32
-I I
1 2
20
7 .x si x ∈ [1, 2]
f (x) =
0 si x ̸∈ [1, 2]
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 193
¿Puede ser esta, la función de densidad de alguna distribución continua? ¿Por qué?
Para que la función dada sea una función densidad debe cumplir las 2 condiciones
mencionadas en la sección 5.2. Como se aprecia f (x) es mayor que cero en los intervalos
definidos por
Z lo que se cumple la primera condición. Para saber si se satisface la segunda
+∞
condición: f (x)dx = 1; evaluamos cada uno de los intervalos en que está definida
−∞
la función densidad
Z 1 Z Z
2
x2 +∞
x3 2 1 3 1
0.dx + dx + 0.dx = 0 + +0= 2 − 13 = ̸= 1
−∞ 7 21 1 21 3
EP
1 2
10
-L
f (x) = k si 4≤x≤5
S
PU
0 en otros casos
M
CA
−∞
Z Z 5
AD
4
x
dx + kdx = 1
2 10 4
x2 4 5
+ kx = 1
20 2 4
12
+k = 1
20
2
k =
5
-I I
22
20
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 194
para 2 ≤ x < 4
-L
Z Z Z
x 2 x
y y 2 x x2 1
S
−∞ −∞ 2
M
para 4 ≤ x < 5
CA
Z Z ZZ x
x 2
y 4
2 y 2 4 2y x
F (x) = f (y)dy = 0.dy + dy + dy = 0 + + =
−∞ −∞ 2 10 4 5 20 2 5 4
12 2 2x
= + (x − 4) = −1
20 5 5
para x ≥ 5
Z x Z 2 Z 4 Z 5 Z +∞
2 y
F (x) = f (y)dy = 0.dy + dy + dy + 0.dy =
−∞ −∞ 2 4 5 10 5
y 2 4 2y 5 3 2
E
= 0+ + +0= + =1
AD
20 2 5 4 5 5
−1 si 4 ≤ x < 5
5
22
20
1 si x≥5
1.00
0.75
EP
F(x)
0.50
F(x)
UD
0.25
A
IM
S-L
0.00
PU
0 2 4 6 8
x
M
CA
Z 4 Z 4.5
x 2
P (3 ≤ X ≤ 4.5) = dx + dx,
3 10 4 5
si 2 ≤ x < 4
k
UD
1 si x≥4
función de distribución F (x). Dado que la forma de F (x) varı́a a lo largo del campo de
-L
para x < 0
d
M
f (x) = F (x) = 0,
dx
CA
para 0 ≤ x < 1
d d x3
f (x) = F (x) = = x2 ,
dx dx 3
para 1 ≤ x < 2
d d 1
f (x) = F (x) = = 0,
dx dx 3
para 2 ≤ x < 4
d d x2 + 2 2x
f (x) = F (x) = = ,
dx dx k k
E
para x ≥ 4
AD
d
f (x) = F (x) = 0,
dx
Por tanto la función de densidad será
x2 si 0≤x<1
2x
f (x) = si 2≤x<4
k
-I I
0 en otros casos
22
20
Ahora bien, para que la función de densidad quede perfectamente especificada, debemos
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 197
Z +∞
hallar el valor de k, que verifique: f (x)dx = 1.
−∞
Z 1 Z 4
2 2x
x dx + dx = 1
0 2 k
x3 1 x2 4
+ = 1
3 0 k 2
1 12
+ = 1
3 k
k = 18
EP
x2 si 0≤x<1
x
f (x) = si 2≤x<4
A
9
IM
0
-L
en otros casos
S
PU
los puntajes de una prueba, el coeficiente intelectual, los cambios diarios en los precios de
AD
las acciones al cierre, etc. Otro ejemplo es el de una máquina que produce (digamos) pernos
con una longitud nominal de 5 cm que en realidad producirá pernos de longitud ligeramente
variable (estas diferencias probablemente serı́an extremadamente pequeñas) debido a factores
como el desgaste de la maquinaria, ligeras variaciones en la presión del lubricante, etc. Esto
darı́a como resultado pernos cuya longitud varı́a, de acuerdo con la distribución Normal. Este
tipo de proceso es extremadamente común, con el resultado de que la distribución Normal a
menudo ocurre en situaciones cotidianas.
La segunda razón es que puede ser utilizada para calcular, de forma aproximada,
-I I
probabilidades para otras distribuciones, como por ejemplo, para la distribuición binomial.
22
2
1 − 1 ( x−µ
σ ) , −∞ < x < ∞
f (x) = √ e 2 (5.12)
σ 2π
donde:
La notación empleada para expresar que una variable X sigue una distribución normal
con media µ y varianza σ 2 es: X ∼ N (µ, σ 2 ).
A
La representación gráfica de (5.12), conocida como curva normal o “campana de Gauss”,
IM
x
µ−σ µ µ+σ
Es unimodal presentando un único pico (punto más alto de la curva) el cual está en la
AD
La curva normal decrece uniformemente en ambas direcciones a partir del valor central.
22
La curva normal es asintótica, lo cual significa que las colas de la curva se extienden
20
N (µ1 , σ 2 ) N (µ2 , σ 2 )
EP
UD
x
µ1 µ2
A
IM
Figura 5.4: Curvas normales con diferentes medias e igual desviación estándar.
S -L
N (µ3 , σb2 )
PU
σa > σb
M
CA
N (µ3 , σa2 )
x
µ3
Figura 5.5: Curvas normales con igual media y diferente desviación estándar.
E
N (µ5 , σ52 )
AD
N (µ4 , σ42 )
x
µ4 µ5
lo siguiente:
22
20
a) 68.3 % de los valores de una variable aleatoria normal están dentro de más una y menos
una desviación estándar de su media.
b) 95.4 % de los valores de una variable aleatoria normal están dentro de más dos y menos
dos desviaciones estándar de su media.
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 200
c) 99.7 % de los valores de una variable aleatoria normal están dentro de más tres y menos
tres desviaciones estándar de su media.
x
EP
µ − 3σ µ − 2σ µ − 1σ µ µ + 1σ µ + 2σ µ + 3σ
UD
0.683
0.954
0.997
Figura 5.7: Áreas bajo la curva comunmente utilizadas para cualquier distribución normal.
A
IM
-L
aleatoria, ası́ la notación empleada es Z ∼ N (0, 1). La Figura 5.8 muestra la curva normal
estándar. Tiene la misma apariencia general que otras distribuciones normales, pero con las
propiedades especiales de µ = 0 y σ = 1.
σ=1
-I I
22
z
20
normal estándar es mostrada en (5.13) y como se aprecia es una versión más simple de la
expresión (5.12).
1 − 12 z 2
f (z) = √
2π
e (5.13)
5.6.2. Estandarización
UD
puntuación z nos dice cuántas desviaciones estándar cae la observación original lejos de la
-L
media, y en qué dirección. Las observaciones mayores que la media son positivas cuando
S
PU
están estandarizadas, y las observaciones menores que la media son negativas cuando están
estandarizadas.
M
más que dar una escala común. Convierte todas las distribuciones normales en una sola
distribución, y esta distribución sigue siendo normal. La estandarización de una variable que
tiene una distribución normal produce una nueva variable que tiene distribución estándar
normal.
Cuando transformamos “X” en “Z”, lo que realmente hacemos es emplear una función
densidad normal que sea independiente de los valores y unidades que tenga la variable
continua analizada. Una ventaja de la puntuación z, es que nos permite comparar valores
provenientes de distribuciones normales diferentes, pues z no tiene unidades dimensionales.
E
Para la distribución normal estándar, han sido calculadas áreas bajo la curva y están
disponibles en tablas que son utilizadas para calcular probabilidades. Un ejemplo de esas
tablas es la que aparece en el Apéndice A.4. Esta tabla permite hallar el área que hay entre
la media (µz = 0) y “zc ” desviaciones estándar por arriba de la media. La Figura 5.9 ilustra
la probabilidad obtenida mediante la tabla que emplearemos: P (0 ≤ Z ≤ zc ).
Si tomáramos por ejemplo: zc = 1.63, entonces de la tabla obtenemos que:
-I I
P (0 ≤ Z ≤ 1.63) = 0.44845
22
20
a) P (−1.63 ≤ Z ≤ 0) =?
Esta probabilidad es igual a la P (0 ≤ Z ≤ 1.63) = 0.44845, debido a la simetrı́a de la
curva.
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 202
probabilidad
EP
UD
A 0 zc Z
IM
-L
b) P (Z ≥ 1.63) =?
CA
c) P (Z ≤ −1.63) =?
Esta probabilidad es igual a la P (Z ≥ 1.63) = 0.05155, debido a la simetrı́a de la curva.
d) P (0.46 ≤ Z ≤ 1.63) =?
Esta probabilidad es igual a: P (0 ≤ Z ≤ 1.63)−P (0 ≤ Z ≤ 0.46) = 0.44845−0.17724 =
0.27121.
E
e) P (−0.46 ≤ Z ≤ 1.63) =?
AD
−1.63 0 Z 0 1.63 Z
EP
UD
(a) (b)
A
IM
S -L
PU
−1.63 0 Z
M
0 0.46 1.63 Z
CA
(c) (d)
E
−0.46 0 1.63 Z
AD
(e)
Figura 5.10: Ilustración del cálculo de probabilidades con la tabla de áreas bajo la curva normal
estándar.
Suponga ahora que X sea una variable aleatoria con distribución normal, o sea, X ∼
N (µ, σ 2 ), con µ = 3 y σ 2 = 4, y queremos calcular P (2 ≤ X ≤ 5). Entonces empleando la
estandarización, expresión (5.14), tenemos
-I I
22
2−3 X −3 5−3
P (2 ≤ X ≤ 5) = P ≤ ≤
20
2 2 2
= P (−0.5 ≤ Z ≤ 1)
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 204
o sea,
P (2 ≤ X ≤ 5) = 0.5328
EP
UD
A
IM
-L
x
S
2 3 5
PU
M
CA
z
-0.5 0 1
Problemas resueltos.
E
AD
a) $ l0.000,00 o menos.
Tenemos que µ = 10000 y σ = 1500. Sea la variable aleatoria: X=“Depósito
efectuado en el mes de enero($)”, X ∼ N (10000, 15002 ).
-I I
10000 − 10000
22
P (X ≤ 10000) = P Z ≤ = P (Z ≤ 0) = 0.5 o 50 %
1500
20
Por tanto, la probabilidad de que X sea menor o igual que 10000, es igual a la
probabilidad de que Z sea menor o igual que cero (Figura 5.12 a)).
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 205
P (X ≥ 10000) = P (Z ≥ 0) = 0.50 o 50 %
Por tanto, la probabilidad de que X sea mayor o igual que 10000, es igual a la
probabilidad de que Z sea mayor o igual que cero (Figura 5.12 b)).
EP
UD
10000 X
10000 X
A
IM
0 Z 0 Z
-L
a) b)
S
PU
Por tanto P (12000 < X < 15000) es igual a P (1.33 < Z < 3.33) (Figura 5.13).
E
AD
0 1.33 3.33 Z
Figura 5.13: Ilustración del cálculo de P (12000 < X < 15000) para X ∼ N (10000, 15002 ).
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 206
2. Un estudio indica que las personas conservan sus teléfonos celulares, en promedio, 1.5
años antes de comprar uno nuevo. La desviación estándar es 0.25 años. Un usuario
de teléfono celular es seleccionado aleatoriamente. Calcule la probabilidad de que el
usuario conservará su teléfono actual por menos de 1 año antes de comprar uno nuevo.
Considere que el tiempo (años) que las personas conservan sus teléfonos sigue una
EP
distribución normal.
UD
Sea la variable aleatoria: X=“Tiempo que las personas conservan sus teléfonos (años)”,
X ∼ N (1.5, 0.252 ). Deseamos calcular, P (X < 1), entonces:
1 − 1.5
A
P (X < 1) = P Z < = P (Z < −2) = 0.5 − 0.47725 = 0.02275 o 2.28 %.
0.25
IM
-L
1 1.5 X
E
−2 0 Z
AD
3. Suponga que una vez fijado un horizonte de tiempo, la tasa de retorno de una acción
puede ser modelada como una variable aleatoria con distribución normal de media 20 %
y desviación estándar de 2 %. Suponga también que la tasa de retorno de un tı́tulo de
renta fija es de 17 %. Entonces la acción es en promedio mas rentable que el tı́tulo,
-I I
aunque esté más sujeta a riesgo. ¿Cuál es la probabilidad de que el retorno de la acción
22
17 20 X
EP
UD
−1.5 0 Z
A
IM
4. Una encuesta indica que, para cada ida al supermercado, un consumidor permanece
en el establecimiento en promedio 45 minutos, con varianza de 144 minutos2 . Asuma
M
CA
Por tanto P (24 < X < 54) es igual a P (−1.75 < Z < 0.75) (Figura 5.16 a)).
b) ¿Cuál es la probabilidad de que se quede más de 39 minutos? Deseamos calcular,
P (X > 39), entonces:
39 − 45
P (X > 39) = P Z > = P (Z > −0.5) = 0.19146 + 0.5 = 0.69146 o 69.15 %.
12
-I I
22
Por tanto P (X > 39) es igual a P (Z > −0.5) (Figura 5.16 b)).
20
24 45 54 X 39 45 X
EP
UD
a) b)
A
Figura 5.16: Ilustración del cálculo de a) P (24 < X < 54) y b) P (X > 39) para X ∼ N (45, 122 ).
IM
-L
minutos.
CA
Por tanto P (X < 30 o X > 51) es igual a P (Z < −1.25 o Z > 0.5) (Figura
5.17).
30 45 51 X
UD
A
IM
S -L
PU
M
CA
−1.25 0 0.5 Z
Figura 5.17: Ilustración del cálculo de P (X < 30 o X > 51) para X ∼ N (45, 122 ).
Ahora, vamos a la Tabla de Distribución normal estándar (TDNE) para saber que
valor de Z es el correspondiente al área de 0.25. Note que según la TDNE para
Z=0.67 el área correspondiente es 0.24857 y para Z=0.68 el área correspondiente
es 0.25175, entonces deducimos que un área de 0.25 será la correspondiente a un
E
AD
valor de Z entre 0.67 y 0.68. Pero, ¿Qué valor de Z tomaremos?, el criterio que
usaremos simplemente será tomar el valor de Z que defina el área más próxima a
la solicitada de 0.25. En este caso el área más próxima es 0.24857, ası́ el valor de
Z a emplear será 0.67. Entonces en la Figura tendremos que z2 = 0.67.
Ahora buscamos en la TDNE el área de 0.20 para saber qué valor de Z le
corresponde. Usando el mismo criterio, se deduce que aproximadamente un área
de 0.20 será la correspondiente a un valor de Z=0.52. Luego en la Figura 5.18
tendremos que por simetrı́a z1 = −0.52. Con la información obtenida definimos:
-I I
50 − µ
22
−0.52 =
σ
20
70 − µ
0.67 = ,
σ
0,20
0,25
0,30
EP
50 µ 70 X
UD
0,20 A
IM
-L
0,25
S
PU
0,30
M
CA
z1 0 z2 Z
Figura 5.18: Ubicación de los valores X = 50 y X = 70 para que se cumpla que P (X ≤ 70) = 0.75 y
P (X ≤ 50) = 0.30.
minutos?
AD
= = 0.3577 o 35.77 %
0.5 − 0.33398
22
20
situaciones.
S -L
P (X = c) P c − 0.5 < X ′ < c + 0.5 Para que incluya a “c”
M
P (X > c) P X ′ > c + 0.5 Para que no incluya a “c”
CA
P (X ≥ c) P X ′ > c − 0.5 Para que incluya a “c”
P (X < c) P X ′ < c − 0.5 Para que no incluya a “c”
P (X ≤ c) P X ′ < c + 0.5 Para que incluya a “c”
P (a ≤ X ≤ b) P a − 0.5 < X ′ < b + 0.5 Para que incluya “a” y “b”
P (a < X < b) P a + 0.5 < X ′ < b − 0.5 Para que no incluya “a” y “b”
P (a < X ≤ b) P a + 0.5 < X ′ < b + 0.5 Para que no incluya “a” pero si “b”
E
P (a ≤ X < b) P a − 0.5 < X ′ < b − 0.5 Para que incluya “a” pero no “b”
AD
Tabla 5.1: Casos de probabilidades binomiales y cómo aplicar el factor de corrección por continuidad
al utilizar la aproximación normal. Recuerde que a, b y c son números enteros.
-I I
22
20
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 212
Ejercicio resuelto.
Basados en la experiencia se sabe que el 40 % de los clientes de la estación de servicio
automotriz “M illenium” pagan sus compras con tarjeta de crédito. Si se selecciona una
muestra aleatoria de 200 clientes, ¿cuál es la probabilidad de que
Sea la variable aleatoria: X=“número de clientes que pagan sus compras con tarjeta de
UD
crédito”. Esta variable tiene las caracterı́sticas para considerar que X sigue distribución
binomial con parámetros n = 200 y p = 0.4, X ∼ b(200, 0.4). Lo que nos piden calcular
es: A
P (X ≥ 75) = P (X = 75) + P (X = 76) + . . .
IM
200! 200!
= × 0.475 × 0.6125 + 0.476 × 0.6124 + . . .
-L
binomial. Por tanto, la distribución binomial X ∼ b(200, 0.4) puede ser aproximada
por una distribución normal con µ = 200×0.4 = 80 y varianza, σ 2 = 200×0.4×0.6 = 48,
X ′ ∼ N (80, 48). Entonces utilizando el factor de corrección por continuidad y luego la
TDNE tenemos que:
74.5 − 80
P (X ≥ 75) ≈ P X ′ > 74.5 =P Z> √
48
= P (Z > −0.79) = 0.28524 + 0.5 = 0.78524 o 78.52 %,
E
AD
69.5 − 80
22
′
P (X < 70) ≈ P X < 69.5 =P Z< √ =
48
20
74.5 80 X´
UD
A
IM
S -L
PU
M
CA
−0.79 0 Z
Figura 5.19: Aproximación normal a la binomial con n=200 y p=0.4. Se muestra la probabilidad de
que al menos 75 clientes paguen con tarjeta de crédito.
′
67.5 − 80 73.5 − 80
P (68 ≤ X ≤ 73) ≈ P 67.5 < X < 73.5 =P √ <Z< √ =
48 48
= P (−1.80 < Z < −0.94) =
= 0.46407 − 0.32639 = 0.13768 o 13.77 %,
69.5 80 X´
UD
A
IM
S -L
PU
M
CA
−1.52 0 Z
Figura 5.20: Aproximación normal a la binomial con n=200 y p=0.4. Se muestra la probabilidad de
que menos de 70 clientes paguen con tarjeta de crédito.
Dados los números reales a y b (a < b), se dice que la variable aleatoria X tiene
AD
distribución uniforme en el intervalo [a, b], si su función de densidad f (x) es dada por (ver
Figura 5.22)
1
si a≤x≤b
f (x) = b−a
0 en otros casos
Para indicar que la variable aleatoria X sigue una distribución uniforme continua en el
intervalo [a, b] se denota de la siguiente forma: X ∼ U (a, b).
-I I
La distribución uniforme continua es el modelo más simple de ese tipo. Como se apre-
22
cia, aparece cuando una variable toma valores dentro de un intervalo [a, b] y su función de
20
densidad permanece constante dentro de ese intervalo. Esto implica que la probabilidad de
que la variable tome valores en subintervalos de igual amplitud es la misma. La distribución
uniforme también recibe el nombre de distribución rectangular.
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 215
EP
67.5 73.5 80 X´
UD
A
IM
S -L
PU
M
CA
−1.80 −0.94 0 Z
Figura 5.21: Aproximación normal a la binomial con n=200 y p=0.4. Se muestra la probabilidad de
que entre 68 y 73 clientes, inclusive, paguen con tarjeta de crédito.
E
AD
Figura 5.22: Función de densidad de X con distribución uniforme en el intervalo [a, b].
-I I
22
a+b (b − a)2
Se puede mostrar que si X ∼ U (a, b) entonces: E(X) = y V ar(X) = .
20
2 12
También no es difı́cil verificar que, en este caso, la función de distribución acumulada
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 216
A
IM
S -L
PU
M
CA
Figura 5.23: Función de distribución acumulada de una variable aleatoria X con distribución uniforme
en el intervalo [a, b].
Ejercicios resueltos.
1. Una empresa tiene una curva de costes que viene dada por la siguiente función:
C = 100+2X, donde X es la demanda. En el mercado vende cada unidad de su producto
a 5 dólares. Si la empresa considera que la demanda se distribuye uniformemente en el
intervalo [250, 300].
E
280 − 260
P (260 ≤ X ≤ 280) = = 0.40 o 40 %.
300 − 250
280
1 1
P (260 ≤ X ≤ 280) = dx = × (280 − 260) = 0.40 o 40 %.
300 − 250 300 − 250
UD
260
Este cálculo también podrı́a haber sido realizado usando la función de distribución
acumulada, siguiendo la expresión (5.5) tenemos
A
280 − 250 260 − 250 20
IM
Lima de la Udep. Hay solamente un ómnibus que le sirve y suele pasar por el paradero,
cercano a su casa, en cualquier instante entre las 7 am. y las 7:30am. Si en un cierto dı́a
M
Elena llega al paradero a las 7:24am, ¿cuál es la probabilidad de que ella pueda tomar
CA
el ómnibus?
Sea X el instante de la llegada del ómnibus al paradero. Note que la uniformidad de X
está implı́cita en el enunciado. Entonces X ∼ U (0, 30), donde X es medida en minutos
y 0 (cero) corresponde a las 7 am. Para que Elena pueda tomar el ómnibus, este debe
llegar después de las 7:24am. (o sea, entre 7:24 y 7:30 am.).
6
Tenemos que P (X > 24) = P (24 < X ≤ 30) = = 0.20 o 20 %.
30
Sea λ una constante positiva, decimos que la variable aleatoria X sigue una distribución
exponencial con parámetro λ, si su función de densidad es dada por
(
0 si x < 0
f (x) =
λe−λx si x ≥ 0
Para indicar que la variable aleatoria X sigue una distribución exponencial con parámetro
λ se denota de la siguiente forma: X ∼ Exp (λ).
-I I
1 1
Se puede mostrar que si X ∼ Exp (λ) entonces: E(X) = y V ar(X) = 2 . Esto es,
λ λ
1
tanto la media como la desviación estándar de la distribución exponencial son iguales a .
λ
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 218
0.5
0.4
0.3
f(x)
0.2
EP
0.1
UD
0.0
Figura 5.24: Función de densidad de X con distribución exponencial con parámetro λ = 0.5.
S -L
PU
También no es difı́cil verificar que la función de distribución acumulada F (x) está dada
por
M
(
0 si x < 0
CA
F (x) =
1 − e−λx si x ≥ 0
En la Figura 5.25 se muestra la función de distribución acumulada de la variable X con
distribución exponencial con parámetro λ = 0.5.
1.00
E
0.75
AD
F(x)
0.50
0.25
-I I
22
0.00
20
Figura 5.25: Función de de distribución acumulada de la variable X con distribución exponencial con
parámetro λ = 0.5.
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 219
La duración de vida de ciertos elementos que puede considerarse como el tiempo que
transcurre hasta que se produce la extinción, averı́a, falla, etc.
instante dado t0 hasta que ocurre un evento, no depende de lo que haya ocurrido antes del
UD
P (T > t0 + t1 | T > t0 ) = = =
P (T > t0 ) P (T > t0 )
M
de Poisson discutido en el capı́tulo 4. Para comprender un poco más la relación entre estas
AD
De hecho, suponga que X ∼ P (λt). Entonces, X=0 (es decir, no ocurre ningún evento en
-I I
el intervalo (0, t) si y sólo si T > t). Por tanto, P (X = 0) = P (T > t). Osea
22
e−λt × (λt)0
20
P (T > t) = P (X = 0) = = e−λt .
0!
Por tanto, la distribución exponencial se aplica a las mismas situaciones que la distribu-
ción de Poisson, siendo que la exponencial modela el tiempo entre ocurrencias y la Poisson
modela el conteo de esas ocurrencias.
Ejercicios resueltos.
1. El tiempo que transcurre antes de que una persona sea atendida en una cafeterı́a es una
variable aleatoria que tiene una distribución exponencial con una media de 4 minutos.
¿Cuál es la probabilidad de que una persona sea atendida antes de que transcurran 3
EP
Sea la variable aleatoria: T=“tiempo que transcurre antes de que una persona sea
atendida en una cafeterı́a (min)”. Esta variable se distribuye exponencialmente con
1
parámetro λ, T ∼ Exp(λ). Según el enunciado E(T ) = = 4, por lo tanto λ = 0.25.
λ
Luego la función de densidad f (t) es dada por
A
IM
(
0 si t < 0
-L
f (t) =
0.25e−0.25t si t ≥ 0
S
PU
Ahora calculamos la probabilidad de que una persona sea atendida antes de que
M
Z 3 3
P (T < 3) = 0.25e−0.25t dt = −e−0.25t = 0.5276 o 52.76 %.
0 0
P (X ≥ 4) = P (X = 4) + P (X = 5) + P (X = 6)
AD
6! 6!
= × 0.52764 × 0.47242 + × 0.52765 × 0.47241 +
4! × 2! 5! × 1!
6!
+ × 0.52766 × 0.47240
6! × 0!
= 0.2594 + 0.1159 + 0.0216 = 0.3969 o 39.69 %.
2. Suponga que el tiempo que necesita el cajero automático de un banco para atender a
un cliente tiene un distribución exponencial con una media de 40 segundos.
-I I
a) ¿Cuál es la probabilidad que el tiempo necesario para atender un cliente dado sea
22
= 1+ e − e = e = 0.1054 o 10.54 %.
UD
(
0 si t < 0
S
F (t) =
PU
t
− 40
1−e si t ≥ 0
M
120
60
P (60 < T < 120) = F (120) − F (60) = 1 − e− 40 − 1 − e− 40 =
3
= e− 2 − e−3 = 0.1733 o 17.33 %.
c) ¿Cuál es la probabilidad que el tiempo necesario para atender un cliente dado sea
menor de 50 segundos?
La probabilidad solicitada es P (T < 50). Empleando por ejemplo F (t) tenemos
50
P (T < 50) = F (50) = 1 − e− 40 = 0.7135 o 71.35 %.
1 −t
P (T < 50) = e 40 dt,
40
22
0
20
= = =
1 − F (30) 1 − 1 − e− 40
30
55
e− 40 25
= = e− 40 = 0.5353 o 53.53 %.
− 30
e 40
EP
3. En promedio, por un paradero de ómnibus poco transitado, pasan 3 ómnibus por hora
A
distribuidos según un proceso Poisson. ¿Cuál es la probabilidad de tener que esperar
IM
ómnibus
PU
4. En una tela, las fallas se distribuyen según un proceso Poisson, a razón de 1 falla cada
15 metros. ¿Cuál es la probabilidad de que la distancia entre la 4a falla y la 5a falla sea
E
AD
mayor a un metro?
Sea la variable aleatoria: X=“Número de fallas en una tela”. Esta variable se distribuye
1 f alla
según Poisson con media λ = . Entonces la variable aleatoria: D=“distancia
15 metros
1
entre fallas consecutivas” se distribuye exponencialmente con parámetro , ası́ T ∼
15
1
Exp . Por tanto, la probabilidad de que la distancia entre la 4a falla y la 5a falla
15
sea mayor a un metro es
Z Z 1
-I I
+∞
1 −t/15 1 −t/15 1
P (D > 1) = e dt = 1 − e dt = 1 + e−t/15 =
22
1 15 0 15 0
20
f (x) =
0 en otros casos
-L
Se pide:
S
PU
Hallar:
AD
a) El valor de a.
b) La media y la desviación estándar de x.
c) La función de distribución.
d) Sabiendo que X < 1.75, calcule la probabilidad de que X sea mayor que 1.5.
x si 0≤x<1
22
f (x) = 2 − x si 1≤x<2
20
0 en otros casos
0 si x≤0
F (x) = 3
kx si 0 < x ≤ 2
1 si x>2
A
a) ) Calcular k para que F (x) sea una verdadera función de distribución.
IM
1 3
b) ) Calcular P <x< .
-L
2 2
S
a(1 + x) si 0<x≤1
2
f (x) = si 1<x≤2
3
0 en otros casos
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 225
Se pide:
0 en otros casos
UD
Hallar:
c) La media y la varianza.
d) P (2 ≤ x ≤ 3).
S -L
PU
ax2 + b si 0≤x≤2
f (x) =
CA
0 en otros casos
1
Sabiendo que P <x<1 = 0.1357, determinar a y b.
2
12. La cantidad de pan (en cientos de kilos) que se vende diariamente en una panaderı́a
del distrito donde Ud. vive, es una variable aleatoria X cuya función de densidad es:
Ax si 0≤x<5
f (x) = A(10 − x) si 5 ≤ x ≤ 10
E
0 en otros casos
AD
a) Calcular el valor de la constante A para que f(x) sea una función de densidad.
b) Calcule la probabilidad de que, en un dı́a cualquiera, se vendan entre 240 y 715
kg. de pan.
c) Calcule la probabilidad de que, en un dı́a cualquiera, se vendan más de 350 kg. de
pan.
d) Calcule la probabilidad de que, en un dı́a cualquiera, se vendan menos de 830 kg.
-I I
de pan.
22
e) Si elegimos un dı́a al azar y resulta que ese dı́a se vendieron menos de 725 kg. de
20
13. Ciertos estudios demuestran que el consumo de gasolina tiene una distribución normal
EP
con un consumo medio de 25.5 Km. por galón y una desviación estándar de 4.5 km.
por galón.
UD
14. La lluvia estacional media anual en cierto poblado es de 18.75 pulgadas, con una
S
desviación estándar de 6.50 pulgadas. Se supone que la lluvia estacional tiene una
PU
distribución normal. ¿En cuántos años, de un perı́odo de 50, se podrá esperar una
M
15. Los salarios de los trabajadores en cierta industria son en promedio 11.90 dólares por
hora, y la desviación estándar es de 0.40 dólares. Si se supone que los salarios tienen
una distribución normal:
c) ¿Cuál debe ser el salario por hora si 19,5 % de los trabajadores de esta industria
AD
ganan menos?
b) Si la oficina abre a las 9:00 am y él sale de su casa a las 8:45 am diariamente,
22
c) Si deja su casa a las 8:35 am y en la oficina se sirve un café entre las 8:50 y las
9:00 am,¿Cuál es la probabilidad de que se pierda el café?
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 227
17. La variable X sigue distribución normal con media µ y desviación estándar σ. Se sabe
que la media de X es cinco veces su desviación estándar y que la P (X ≤ 6) = 0.84134.
Mostrando el planteamiento y los cálculos respectivos halle la media y la desviación
estándar de X.
18. Los rectores de universidades americanas reciben una prestación para vivienda que, en
promedio es de 26234 dólares anuales. Suponga que se aplica una distribución normal
a las compensaciones, y que la desviación estándar es de 5000 dólares.
vaso. La desviación estándar es de 0.10 onzas. Suponga que las cantidades de refresco
-L
c) ¿Cuál es la probabilidad de que la máquina sirva entre 6.8 onzas y 7.25 onzas?
d) ¿Cuánto refresco se sirve en el máximo 1 % de las bebidas?
20. Un productor de jugo de naranja compra todas sus naranjas en un huerto. La cantidad
de jugo que se exprime de cada naranja tiene una distribución normal aproximada con
una media de 4.70 onzas y una desviación estándar de 0.40 onzas.
21. Suponga se ha encontrado que el nivel de llenado de unas botellas de refresco tiene
una distribución normal con media de 2.0 litros y desviación estándar de 0.05 litros.
Las botellas que contienen menos de 95 % del contenido neto anunciado (1.90 litros
en este caso) pueden causar una multa al fabricante por parte de la oficina estatal de
protección al consumidor, mientras que las botellas que contienen un contenido neto
mayor que 2,10 litros pueden provocar un derrame del exceso al abrirlas.
-I I
22
b) ¿Qué proporción de botellas contendrá menos de 1.90 litros o más de 2.10 litros?
c) ¿Qué proporción de botellas contendrá entre 2.05 y 2.10 litros?
d) ¿Entre qué dos valores (con distribución simétrica) se espera encontrar el contenido
del 99 % de las botellas?
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 228
22. Las ventas anuales (en unidades monetarias, u.m.) de novelas policı́acas se distribuyen
normalmente con media y desviación estándar desconocidas. Un 40 % de las veces, las
ventas son por más de 470000 u.m. y 10 % de las veces son por más de 500000 u.m.
¿Cuál es el valor de la media y el de la desviación estándar?
23. Los salarios anuales de los ejecutivos de mandos medios en una compañı́a están
distribuidos normalmente, con una desviación estándar de $ 1200. Se tiene programado
un recorte de personal que implica el despido de aquellos que ganen menos de $ 18000. Si
tal medida representa el 9 % de los ejecutivos de mandos medios, ¿Cuál es actualmente
EP
24. Los resultados de una prueba objetiva de selección pasada a 200 personas indicaron que
la distribución de puntuaciones era normal, con media 60 puntos y desviación estándar
de 6 puntos.
A
a) ¿Cuántos examinados han sacado más de 63 puntos?
IM
25. Tras aplicar un test de cultura general se observa que las puntuaciones obtenidas siguen
M
una distribución normal con media de 65 puntos y una varianza de 324 puntos2 . Se desea
CA
clasificar a los examinados en tres grupos (de baja cultura general, de cultura general
aceptable y de excelente cultura general) de modo que haya en el primero un 19.5 % de
la población, un 65.5 % en el segundo y un 15 % en el tercero. ¿Cuáles han de ser las
puntuaciones que marcan el paso de un grupo al otro?
26. El tiempo necesario para terminar un examen final en determinado curso se distribuye
normalmente con 80 minutos de media y 10 minutos de desviación estándar. Con estos
datos conteste lo siguiente:
27. El Banco del Perú está revisando sus cobros por servicios y su polı́tica de pago de
intereses en las cuentas corrientes. El banco ha encontrado que el balance promedio
diario en las cuentas personales es de $55, con una desviación estándar de $15. Además,
-I I
22
a) ¿Qué porcentaje de las cuentas corrientes de los clientes tienen balances promedios
diarios mayores de $80?
b) ¿Qué porcentaje de las cuentas corrientes de los clientes tienen balances promedios
diarios menores de $70?
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 229
c) El banco está considerando pagar intereses a clientes que tengan balances promedio
diarios mayores que cierta cantidad. Si el banco no quiere pagar intereses a más
del 15 % de sus clientes, cual es el monto mı́nimo del balance promedio diario al
cual está dispuesto a pagar intereses?
28. Una compañı́a produce focos de luz cuyo tiempo de vida sigue una distribución normal
con una media de 1200 horas y una desviación estándar de 250 horas. Un foco se
selecciona aleatoriamente de la producción de la compañı́a:
29. El ancho (en mm.) de una pequeña pieza metálica sigue una distribución normal. Si se
estima que el 77 % de la producción miden menos de 12 mm. y el 85 % más de 7 mm.:
A
IM
30. Los postulantes a una escuela militar tienen estaturas que se distribuyen normalmente
M
alrededor de 1.72m. con una desviación estándar de 0.04m. Las calificaciones que
CA
31. Suponga que los promedios de prácticas de los alumnos de un curso están distribuidos
normalmente alrededor de 12. Si el 95 % de estos promedios están comprendidos entre
09 y 15. ¿Qué porcentaje de alumnos estarán aprobados? (Considere que la nota
aprobatoria mı́nima es 10.5)
E
AD
32. Supongamos que los pesos de una población de individuos tiene distribución normal
con media de 74 kg y desviación estándar de 7 kg. ¿Qué peso debe tener un individuo
para que el 16,6 % de la población pese más que él?
33. El peso de los adultos de una población numerosa se distribuye normalmente con
media 65 kg y desviación tı́pica 3 kg. Se eligen dos individuos al azar. Calculando
las correspondientes probabilidades, justifica qué es más probable:
a) Que cada uno de los individuos tenga un peso comprendido entre 63,5 y 66,5 kg.
-I I
b) Que uno de ellos tenga un peso comprendido entre 62 y 68 kg. y el otro tenga un
22
34. La estatura de los individuos de una población se distribuye normalmente con media
de 174 cm. y desviación estándar de 5cm. Se le pide lo siguiente:
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 230
35. El tiempo necesario para que una ambulancia llegue a un centro deportivo se distribuye
normalmente con una media 17 minutos y desviación tı́pica de 3 minutos.
en llegar es el 5 %?
36. Para aprobar unas oposiciones se necesita obtener 100 puntos, o más, en una prueba.
Por experiencias anteriores, se sabe que la distribución de los puntos obtenidos por los
A
opositores es una normal de media 110 puntos y desviación tı́pica 15.
IM
-L
b) Si sabemos que hay 1000 opositores y sólo 300 plazas, ¿Cuántos puntos se deberá
PU
37. En una ciudad, la temperatura máxima durante el mes de junio está distribuida
normalmente con una media de 26ºC y una desviación tı́pica de 4ºC. Calcular el número
de dı́as que se espera tengan temperatura máxima comprendida entre 22ºC y 28ºC.
39. Las calificaciones de los estudiantes de un curso siguen una distribución normal. Si las
puntuaciones estandarizadas o tipificadas de dos estudiantes fueron 0.8 y -0.4 y sus
notas reales fueron 88 y 67.4 puntos. ¿Cuál es la media y la desviación estándar de las
puntuaciones del examen?
40. Se supone que los resultados de un examen siguen una distribución normal con media
87 y varianza 81. Se pide:
-I I
42. Los ingresos diarios (en unidades monetarias) de una empresa tienen una distribución
normal con media 35560 um. y desviación tı́pica 2530 um. Justifica si es o no razonable
EP
el esperar obtener un dı́a unas ventas superiores a 55000 ptas. Calcular cuántos dı́as en
UD
43. Se supone que las retribuciones recibidas en una empresa se distribuyen normalmente
con media y desviación estándar desconocidas. Se conoce que el 1 % son superiores a
A
5800000 unidades monetarias y el 10 % inferiores a 1200000 unidades monetarias.
IM
-L
monetarias?
M
44. Se ha estimado que el peso neto de un paquete que contiene determinado alimento
CA
precocido sigue una distribución normal. Un tercio de los paquetes pesan menos de 870
grs. y sólo dos de cada mil paquetes pesan más de 1 kg. Se pide:
880 gr.
AD
45. Se tiene un examen con 50 preguntas de opción múltiple. Cada pregunta tiene cuatro
alternativas, de las cuales sólo una es correcta. Suponga que un alumno que ha asistido
a clases, estudiado e investigado tiene una probabilidad de 0.75 de contestar cualquier
pregunta en forma correcta.
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 232
46. El tiempo que tarda un camión que transporta materiales de construcción, entre la
bodega de carga y la obra de construcción, es aproximadamente normal con una media
de 25 minutos y una desviación estándar de 4 minutos. ¿A qué hora debe salir el camión
de la bodega, para tener una probabilidad del 90 % de estar en la obra de construcción
A
IM
a las 10 de la mañana?
-L
Corporation, en diciembre de 1997, por ligar su navegador de red Internet Explorer, con
PU
a) En una muestra de 800 personas, ¿cuántas espera el lector que coincidan en que
Microsoft es un monopolio?
b) En esa muestra, ¿cuál es la probabilidad de que 300 personas o menos coincidan
en que Microsoft es un monopolio?
c) Nuevamente en una muestra de 800 personas, ¿cuál es la probabilidad de que más
de 335 personas pero menos de 350 concuerden en que Microsoft es un monopolio?
E
48. Se sabe que el 30 % de los clientes de una tarjeta de crédito a nivel nacional dejan en cero
AD
sus saldos para no incurrir en intereses moratorios. Conteste las siguientes preguntas
para un grupo de 150 poseedores esa tarjeta.
49. La investigación sobre nuevos delincuentes juveniles que fueron puestos en libertad bajo
22
c) ¿Cuál es la probabilidad de que entre 30 y 40, inclusive, cometan otro acto ilı́cito?
50. En la lı́nea naviera Royal Express se informa que 80 % de sus camarotes se ocupa,
durante el mes de setiembre. En el caso de un navı́o que tenga 800 dormitorios, ¿Cuál
es la probabilidad de que de 650 a 665 dormitorios sean ocupados en dicho mes?
51. Tras una larga serie de observaciones, se llega a la conclusión de que sólo un 10 % de los
aspirantes superan una determinada prueba. Si la próxima convocatoria fuese firmada
por 500 aspirantes, ¿cuál es la probabilidad de que aprueben más de 80?
EP
52. Un examen tipo ”test ”tiene 100 preguntas y cada pregunta cuatro respuestas de las
UD
54. La cantidad de almendra que contiene una nueva barra de helado se distribuye
CA
la venta?
especificaciones.
22
56. Aproximando con una distribución normal, calcular la probabilidad de que al lanzar
una moneda 100 veces, el número de caras obtenido esté comprendido entre 45 y 55.
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 234
57. En una urna hay 3 bolas rojas, 2 blancas y 5 verdes. Sacamos una bola, anotamos
su color y la devolvemos a la urna. Si repetimos la experiencia 50 veces, ¿cuál es la
probabilidad de sacar roja en más de 20 ocasiones?
58. Lanzamos un dado 300 veces. ¿Cuál es la probabilidad de que obtengamos más de 70
“unos”?
59. El 7 % de los pantalones de una determinada marca salen con algún defecto. Se
empaquetan en cajas de 80 para distribuirlos por diferentes tiendas ¿cuál es la
probabilidad de que en una caja hay más de 10 pantalones defectuosos?
EP
UD
60. El 60 % de una población de 20000 habitantes tiene los ojos oscuros. Si elegimos al
azar 50 personas de esa población, ¿Cuál es la probabilidad de que haya menos de 30
personas con los ojos oscuros?
61. La empresa Amazing Marketing, una compañı́a de ventas por teléfono, considera la
A
IM
los números telefónicos. Esa compañı́a realiza la mayorı́a de sus llamadas durante la
S
62. El volumen que una máquina de llenado automático deposita en latas de una bebida
gaseosa tiene una distribución normal con media 340 ml y una desviación tı́pica 15 ml.
d) Si ahora tomamos 500 latas llenadas con la máquina tal y como figura
20
63. Se sabe que el tiempo que tarda un jefe de personal en entrevistar a un aspirante
para una vacante en su compañı́a sigue una distribución normal. Si el 10 % de los
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 235
64. El puntaje medio de las pruebas de acceso correspondientes a los estudiantes que
querı́an ingresar a una universidad en una facultad de economı́a, en una universidad
extranjera, era de 5.8 y la desviación estándar de 1.75. Fueron admitidos los estudiantes
que tuvieron un puntaje superior a 6.
65. Suponga que las calificaciones de un examen siguen una distribución normal con media
de 72.8 y la desviación estándar de 8.3. El profesor registra en su lista solo números
enteros del 0 al 100, pero reporta las calificaciones a dirección de estudios con letras:
A
4 % de las calificaciones más altas tiene A, 16 % siguiente tiene B, 40 % siguiente tiene
IM
C y el resto tiene NA (no acreditado). ¿Cuáles han de ser las puntuaciones que marcan
-L
66. Un grupo grande de alumnos hace un examen de Economı́a. Las notas se distribuyen
M
según una normal de media 70, además la probabilidad de que un alumno elegido al
CA
azar obtenga una nota menor que 85 es 0.9332. Se eligen cuatro estudiantes al azar;
¿cuál es la probabilidad de que al menos uno de ellos obtenga más de 80 puntos en el
examen?
67. El promedio de tiempo en que un automóvil de una marca japonesa empieza a dar
problemas es 3.5 años con una desviación estándar de 0.5 años; un automóvil de
fabricación alemana tiene una media de 4 años con una desviación estándar de 0.4
años. En ambos casos el tiempo en que un automóvil empieza a dar problemas, sigue
una distribución normal. Si se elige al azar un automóvil de cada marca, ¿Cuál es la
E
68. Una academia pre-universitaria de mucho prestigio cuenta con tres aulas A, B y C
con capacidades para 50, 70 y 80 alumnos, para administración de empresas. Como se
han presentado 500 alumnos, les han hecho rendir un examen de ingreso. Los puntajes
obtenidos por los 500 alumnos se distribuyen normalmente con media 151 y desviación
estándar 85. Si se desea seleccionar a los mejores en el aula A, B y C sucesivamente,
¿qué puntaje se debe establecer como mı́nimo para ingresar al aula A? ¿qué puntaje
-I I
mı́nimo se debe establecer para ingresar al aula B? y ¿qué puntaje como mı́nimo se
22
69. Cierta empresa tiene dos secciones de fabricación. Una de las secciones dispone de
maquinaria más antigua que la otra. En la sección en la que la maquinaria es más
antigua el número de piezas buenas que se fabrican es 7 veces mayor que el de las
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 236
piezas defectuosas. Calcule la probabilidad de que de las 400 piezas fabricadas en dicha
sección, más de 35 pero menos de 60 sean defectuosas.
70. El tiempo (en horas) que un estudiante necesita para aprender un tema de estadı́stica
es una variable aleatoria con distribución normal con media µ y desviación tı́pica σ. Si
el 83.147 % de los alumnos emplea más de tres horas y sólo el 2.275 % más de nueve.
¿Cuánto es el promedio y la desviación estándar del tiempo que necesitan los alumnos
para aprender dicho tema de estadı́stica?
71. Una empresa dedicada a la fabricación de abono ha adquirido una máquina de envasado.
EP
que proporciona por saco es una variable aleatoria normal con una media de 2000 gr.
y varianza de 2500gr2 . Sabiendo que un saco de abono se considera defectuoso si el
contenido de abono es inferior a 1900 gr:
A
a) Calcule la probabilidad de que un saco elegido al azar sea defectuoso.
IM
b) Si elegimos un saco al azar y resulta tener más de 2050 gr. de abono. ¿Cuál es la
-L
Hallar:
E
AD
k(x2 + 2) si 0≤x≤4
f (x) =
22
0 en otros casos
20
Hallar:
f (x) = 1
(11 − x) si 9 ≤ x < 11
8
UD
0 en otros casos
a) Obtener el valor de k
b) Calcular la recaudación media y la desviación estándar de la recaudación.
A
IM
por representar un alto costo. Deciden llamarla sólo los dı́as en que la recaudación
sea superior a 85000 soles ¿Cuál es la probabilidad de que vaya 10 dı́as al mes,
teniendo en cuenta que los almacenes están abiertos 26 dı́as al mes?
76. La variable aleatoria X representa la demanda de gasolina (en miles de galones), por
dı́a, en una refinerı́a. La función densidad de probabilidad de X es:
2cx si 0<x≤1
f (x) = c(3 − x) si 1<x≤3
0 en otros casos
Hallar:
UD
d) P (2 ≤ x ≤ 5).
-L
78. Una máquina fabrica tornillos cuyas longitudes se distribuyen normalmente con media
S
PU
79. La duración (en años) de la baterı́a de cierto modelo de teléfono celular es una variable
aleatoria continua X con función de densidad
(
k(x2 − 4x + 4) si 2≤x≤4
f (x) =
0 en otros casos
E
AD
a) Calcule el valor de k para que f (x) sea realmente una función de densidad.
b) Calcule e interprete la duración media y la desviación tı́pica de la duración de las
baterı́as.
c) Halle F (x).
d) Calcula la probabilidad de que una baterı́a dure más de 2 años y medio.
e) ¿Cuál es la probabilidad de que una baterı́a cualquiera dure 2.35 años?
f) Si se elige una baterı́a al azar y resulta que su duración es mayor a 1 año ¿Cuál
-I I
la probabilidad de que en una caja hayan alguna baterı́a que dure entre 3 y 3.5
años?
4
h) Si W = X + 1. Calcule E(W ) y σ 2 (W ).
5
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 239
80. Un estudio de la Dirección General de Transporte estima que el tiempo necesario (en
horas de práctica) para la obtención de la licencia de conducir sigue una distribución
normal con media de 24 y varianza de 9.
2
kx si 0≤x≤6
f (x) = 9k(10 − x) si 6 < x ≤ 10
0 en otros casos
vehı́culo.
d) Calcule la probabilidad de que un cliente tarde entre 3 y 5 años en renovar su
vehı́culo.
e) Si un cliente elegido al azar ha tardado más de 4 años en renovar su vehı́culo,¿Cuál
es la probabilidad de que tarde más de 5.5 años en renovarlo?
f) Si se eligen al azar a 5 nuevos clientes ¿Cuál es la probabilidad de que por lo menos
2 de ellos tarden más de siete años en renovar su vehı́culo?
-I I
vehı́culo.
82. Un saco que contiene 400 monedas honestas es vaciado sobre una mesa. Hallar:
83. En una industria, la venta mensual de cierto producto, en miles de Kg, es una variable
aleatoria X cuya función de densidad es:
x
k si 0≤x<2
7
EP
f (x) = (4 − x)
k si 2≤x≤4
UD
7
0 en otros casos
a) Determine el valor de k para que f (x) sea una función de densidad. Grafique f (x).
A
b) Calcule la probabilidad de que la venta de ese producto, en un mes cualquiera,
IM
e) Si elegimos un mes al azar y resulta que las ventas en ese mes no fueron mayores
a 3110 Kg. ¿Cuál es la probabilidad de que se haya vendido al menos 1750 Kg?
f) Calcule e interprete la venta mensual promedio y la desviación estándar de las
ventas de dicho producto.
g) ¿Cuál es la probabilidad de que, en un mes seleccionado al azar, se haya vendido
1860 kg de dicho producto?
h) Si se eligen al azar 6 meses de ventas ¿Cuál es la probabilidad de que por lo menos
E
84. El volumen de bebida energizante, que una máquina de llenado automático deposita en
latas de una conocida marca tiene una distribución normal con media de 340 ml. y una
desviación tı́pica de 15 ml. El llenado de una lata cualquiera se considera “incorrecto”
si la cantidad de bebida energizante vertida es inferior a 310 ml:
a) Calcule la probabilidad de que una lata elegida al azar haya sido llenada
incorrectamente.
b) Si elegimos una lata al azar y resulta tener más de 330ml. de bebida energizante
-I I
85. Suponga que tiene un dado cargado en el cual se cumple que la probabilidad de obtener
“5” es el doble de la probabilidad de obtener cualquiera de los restantes valores. Si se
lanza dicho dado 35 veces. ¿Cuál es la probabilidad de obtener “5” más de 20 veces?
86. El peso de ciertos paquetes es una variable aleatoria que sigue distribución normal tal
que el 15 % pesa más de 50 kg. y el 2,5 % pesa menos de 44 kg.
87. El kilometraje (en miles de kilómetros) que los automovilistas logran de cierto tipo de
neumáticos, es una variable aleatoria con función densidad:
A
1 e− 2k
x
si x>0
IM
f (x) = 20
0 en otros casos
S -L
Km.
CA
88. Un grupo grande de alumnos rinde un examen (sobre 100 puntos) de Finanzas. Los
puntajes obtenidos siguen una distribución normal y además se sabe que la probabilidad
de que un alumno elegido al azar obtenga un puntaje que supere los 65 puntos es 0.69847
E
90. Alberto y Beatriz realizan un juego bajo las siguientes condiciones: se lanza un dado,
si sale un número menor que 3, Alberto paga a Beatriz 6 dólares y si sale un número
mayor o igual que 3 Beatriz paga a Alberto 21 dólares. Se pide:
EP
a) Si juegan 300 partidas, hallar la probabilidad de que Alberto gane entre 190 y 212
UD
partidas, inclusive.
b) ¿Cuál es el beneficio esperado para Alberto en 300 partidas?¿y para Beatriz?
91. En una asignatura del colegio, la probabilidad de que saquen a un alumno a la pizarra
A
IM
en cada clase es del 12 %. A lo largo del año se tienen 125 clases de esa asignatura.
¿Cuál es la probabilidad de tener que salir a la pizarra más de 18 veces?
S -L
consumo mensual (medido en Kw/h) de una vivienda familiar, sigue una distribución
M
normal con media igual 300 Kw/h y desviación estándar igual a 50 Kw/h.
CA
93. Se sabe que el peso de los recién nacidos en un determinado poblado sigue una
distribución normal con media igual a 3600 gramos y varianza igual a 78400.
a) Calcule la probabilidad de que un recién nacido pese entre 3700 y 3800 gramos.
b) ¿Cuál es la probabilidad de que un recién nacido pese 3500 gramos?
E
c) Si se elige un recién nacido al azar y resulta que pesa más de 3450 gramos ¿Cuál
AD
94. Un inversionista debe decidir entre dos alternativas: una acción o un tı́tulo de renta
fija. Una vez fijado un horizonte de tiempo, la tasa de retorno de la acción puede ser
modelada como una variable aleatoria con distribución normal de promedio 20 % y
desviación estándar 2 %. Sabiendo que la probabilidad de que el retorno de la acción
-I I
95. Suponga que un inversionista está considerando dos alternativas para invertir su capital.
20
97. La cantidad de café diaria, en litros, que sirve una máquina que se localiza en el vestı́bulo
de un aeropuerto es una variable aleatoria X con distribución uniforme continua en el
A
intervalo [7, 10] . Encuentre la probabilidad de que en un dı́a dado la cantidad de café
IM
98. Suponga que la duración de la baterı́a del Mini iPad se distribuye uniformemente con
un valor esperado de 13.25 horas y una varianza igual a 3. ¿Cuál es la probabilidad de
que la duración de la baterı́a de un minipad esté entre 9.5 y 11.4 horas?
a) ¿ Cuál es la probabilidad de que reciba la primera llamada antes de las 8:15 am?
b) ¿ Cuál es la probabilidad de que reciba 4 llamadas en las dos primeras horas de
su jornada de trabajo?
c) Si lleva 10 minutos sin recibir ninguna llamada, ¿cuál es la probabilidad de que
reciba una nueva llamada en menos de 15 minutos?
-I I
22
100. El precio (en nuevos soles) de un determinado artı́culo sigue distribución normal con
20
media µ y desviación tı́pica σ. Se sabe que la probabilidad de que el precio del artı́culo
sea menor que 1000 soles es 0.975 y que la probabilidad de que el precio del artı́culo sea
mayor que 910 es 0.7823. Si Usted tuviera 930 nuevos soles, ¿Cuál es la probabilidad
de que no pueda comprar dicho artı́culo?
CAPÍTULO 5. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA 244
101. Las ventas diarias (X) en nuevos soles de una pequeña empresa tienen la siguiente fun-
ción de densidad:
1
si 300 ≤ x ≤ 600
300
f (x) =
0 en otros casos
E
AD
-I I
22
20
Capı́tulo 6
Distribuciones muestrales
EP
UD
6.1. Introducción
En el capı́tulo 1 destacamos dos conceptos importantes en un estudio estadı́stico: La
población y la muestra. La población es el conjunto de todos los elementos de interés en un
A
estudio y una muestra es un subconjunto de la población. También en ese capı́tulo definimos
IM
útiles en el análisis exploratorio de los datos provenientes de una muestra, como tablas o
CA
decisión.
Como en la práctica uno no analiza o trabaja con todos los elementos de la población de
interés sino con una parte, osea una muestra, es necesario entender que las medidas de una
muestra, es decir los estadı́sticos, especialmente la media muestral: x y la proporción muestral:
p, serán ahora las variables de interés y por tanto deberemos estudiar sus caracterı́sticas
y como se comportan o distribuyen. Por tanto en el capı́tulo 6 abordaremos un concepto
importante: las distribuciones muestrales, es decir, la distribución de los estadı́sticos de una
muestra, especı́ficamente la distribución de x y la distribución de p.
-I I
utilizar estadı́sticos calculados a partir de muestras para estimar los valores de los parámetros
de la población. En este capı́tulo aprenderemos sobre la media muestral, x, un estadı́stico
utilizado para estimar µ, la media poblacional (parámetro). También aprenderemos acerca de
245
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 246
distribución de p.
-L
la figura 6.1. Esto nos debe llevar a entender la generación de la Distribución muestral de
CA
x. Ası́, en cada repetición del proceso podemos anticipar la obtención de un valor distinto
de la media de la muestra x, la cual se convierte en la variable de interés. Por lo tanto, La
distribución de probabilidad de todos los valores posibles de la media de la muestra x se le
conoce como distribución muestral de la media de la muestra o distribución muestral de x.
Seleccionar
una muestra
Población con media µ =?
de tamaño n
de la población
E
AD
Calcular la media
Se emplea el valor
en la muestra
de x para hacer
seleccionada y
inferencias acerca
obtenemos un
del valor de µ
valor para x
Figura 6.1: Proceso para realizar inferencias acerca de la media de la población, µ, a partir de la
-I I
afirmaciones probabilı́sticas acerca del error incurrido cuando se usa x para estimar µ.
Comencemos considerando la media de todos los valores posibles de x, es decir, el valor
esperado de x.
Valor esperado de x (Propiedad de imparcialidad de la media muestral)
La media muestral es imparcial porque la media o promedio de todas las medias
muestrales posibles (de muestras con tamaño “n”) es igual a la media poblacional µ. Es
decir: E(x) = µ.
Esta propiedad se demuestra por medio de un sencillo ejemplo. Supogamos una población
de 4 valores: 1, 2, 3, 4. Si calculamos la media (µ) y la desviación estándar (σ) de esa población
EP
Consideremos ahora que tomamos muestras de tamaño igual a 2 de la población. Con sólo
4 valores en la población, hay únicamente 16 posibles muestras de tamaño igual a 2 (Recuerde
-L
realiza con reemplazo, es decir, se reemplaza cada valor seleccionado antes de realizar una
nueva elección. La Tabla 6.1 presenta las 16 muestras posibles con sus respectivos promedios.
M
CA
7 2,3 x7 =2.5
AD
8 2,4 x8 =3
9 3,1 x9 =2
10 3,2 x10 =2.5
11 3,3 x11 =3
12 3,4 x12 =3.5
13 4,1 x13 =2.5
-I I
14 4,2 x14 =3
22
16 4,4 x16 =4
Tabla 6.1: Las 16 muestras posibles de tamaño igual a 2 tomadas de la población de 4 valores.
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 248
Las 16 medias obtenidas forman la distribución de las medias de las muestras de tamaño
igual a 2 tomadas de la población de 4 valores. Si calcula el promedio de las medias de
las 16 muestras, la media de estos valores, µx = E(x), es igual a 2.5, que es también la
media poblacional µ. Puesto que la media de las 16 medias muestrales es igual a la media
poblacional, decimos que la media muestral es un estimador imparcial de la media poblacional.
Por lo tanto, aunque no sepa qué tan cercana está la media muestral de cualquier muestra
seleccionada a la media poblacional, al menos estará seguro de que la media de todas las
medias muestrales posibles que se pueden seleccionar es igual a la media poblacional.
En la Figura 6.2 aparece la distribución de probabilidad de las medias de las muestras de
EP
A
IM
S -L
PU
M
CA
E
AD
Figura 6.2: Distribución de probabilidad de las medias muestrales del ejemplo dado.
Se puede demostrar que, con muestreo aleatorio simple, la expresión para la desviación
estándar de x dependerá de si la población es finita o infinita. Según sea el caso, la desviación
estándar de x tendrá las siguientes expresiones:
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 249
Si la población es finita: r
N −n σ
σx = .√ (6.1)
N −1 n
Si la población es infinita:
σ
σx = √ (6.2)
n
donde:
σ= Desviación estándar de la población.
n= Tamaño de la muestra.
EP
N = Tamaño de la población. r
N −n
UD
expresión (6.2) se vuelve una aproximación muy buena para la desviación estándar de x
PU
(6.2) siempre y cuando la población sea infinita o la población sea finita y el tamaño de la
n
muestra sea como máximo el 5 % del tamaño de la población, esto es ≤ 0.05. En caso
N
n
que > 0.05 deberá tomarse en cuenta el factor de corrección para población finita para
N
calcular σx .
Un detalle importante al analizar la expresión (6.2) es que cuando el tamaño de la
muestra aumenta, la medida de dispersión σx disminuye. Es decir, a medida que el número
de observaciones obtenidas aumenta, el promedio de los valores observados estará más cerca
de µ.
Posteriormente veremos que el valor de σx es útil para determinar lo alejado que pueda
E
AD
del Lı́mite Central (TLC) para identificar la forma que tiene la distribución de x. Uno
de los enunciados del TLC aplicado a la distribución muestral de x es el siguiente:
Teorema del lı́mite central:Al seleccionar muestras aleatorias simples de tamaño
“n” de una población, la distribución muestral de la media x se puede aproximar con
una distribución normal, cuando el tamaño de la muestra es grande. Esta aproximación
mejora con muestras más grandes. Una muestra es grande en la práctica si el tamaño
de la misma es como mı́nimo de 30 elementos (n ≥ 30).
La figura 6.3 muestra cómo se aplica el teorema del lı́mite central para poblaciones con
EP
muestral de x cuando aumenta el tamaño de la muestra. Cuando las muestras son de tamaño
dos, vemos que la distribución muestral de x comienza a tener una apariencia distinta de la
distribución de la población. Para muestras de tamaño 6 vemos que las distribución muestral
de x comienzan a tener una apariencia acampanada. Finalmente, las muestras de tamaño 30
A
hacen que las distribuciones muestrales de x sean aproximadamente normales. Ası́ es que se
IM
E
AD
-I I
22
20
Figura 6.3: Aplicación del Teorema del lı́mite Central para diferentes poblaciones.(Lind et al., 2012)
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 251
x − µx x − µ
z= = σ (6.3)
σx √
EP
n
UD
Nota: Observe que para σx se está considerando la expresión (6.2), es decir, el caso de
población infinita. Si estuviera en el caso de población finita deberá usar para σx la expresión
(6.1).
A continuación presentamos algunos problemas resueltos para familiarizarse con el uso
A
IM
Problemas resueltos.
S
PU
1. Se sabe que los pesos de una población de novillos de 18 meses de edad tienen una
M
181 − 178
P X > 181 = P Z > = P (Z > 1.5) = 0.5 − 0.43319 = 0.06681.
2
Por tanto P X > 181 es igual a P (Z > 1.5) (Figura 6.4).
EP
UD
A
IM
178 181 X
S -L
PU
M
CA
0 1.5 Z
Figura 6.4: Ilustración del cálculo de P X > 181 para X ∼ N 178, 22 .
E
AD
20
Por tanto P 175 < X < 181 es igual a P (−1.5 < Z < 1.5) (Figura 6.5).
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 253
EP
A
IM
S -L
PU
M
CA
−1.5 0 1.5 Z
Figura 6.5: Ilustración del cálculo de P 175 < X < 181 para X ∼ N 178, 22 .
probabilidad de que el peso promedio de la muestra sea mayor que 177 kg?
22
20
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 254
2. La compañı́a de baterı́as RINDEMAX afirma que sus baterı́as tienen una vida media de
UD
por RINDEMAX.
M
meses?
AD
58 − 60
P X < 58 = P Z< = P (Z < −1.33) = 0.5 − 0.40824 = 0.09176
1.5
Por tanto P X < 58 es igual a P (Z < −1.33) (Figura 6.6).
EP
UD
A
IM
58 60 X
S -L
PU
M
CA
−1.33 0 Z
Figura 6.6: Ilustración del cálculo de P X < 58 para X ∼ N 60, 1.52 .
E
AD
20
Por tanto P 57 < X < 63 es igual a P (−2 < Z < 2) (Figura 6.7).
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 256
EP
57 60 63 X
UD
A
IM
S -L
PU
M
CA
−2 0 2 Z
Figura 6.7: Ilustración del cálculo de P 57 < X < 63 para X ∼ N 60, 1.52 .
Considere una variable categórica que cuente con dos clasificaciones: el cliente prefiere
20
van de 0 a 1.
UD
esta expresión indica que la media de todos los valores posibles de p es igual a la proporción
E
de la población, p.
AD
Si la población es finita:
-I I
r r
N −n p(1 − p)
22
σp = . (6.4)
N −1 n
20
Si la población es infinita: r
p(1 − p)
σp = (6.5)
n
donde:
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 258
p= proporción poblacional.
n= Tamaño de la muestra.
N = Tamaño de la población. r
N −n
Al observar las expresiones (6.4) y (6.5), la diferencia está en el factor , el cual
N −1
es llamado factor de corrección para población finita. En muchos casos prácticos de muestreo
se ve que la población que se maneja aunque finita, es bastante “grande” comparado r con el
N −n
tamaño de la muestra, el cual es relativamente “pequeño”. En esos casos el factor
N −1
es cercano a l. En consecuencia, la diferencia entre los valores de la desviación estándar de
EP
p para los casos de población finita e infinita se hace despreciable. Cuando esto sucede, la
UD
expresión (6.5) se vuelve una aproximación muy buena para la desviación estándar de p
aunque la población sea finita.
Entonces, cuando se desee calcular la desviación estándar de p se empleará la expresión
(6.5) siempre y cuando la población sea infinita o la población sea finita y el tamaño de la
A
n
muestra sea como máximo el 5 % del tamaño de la población, esto es ≤ 0.05. En caso
IM
N
n
que > 0.05 deberá tomarse en cuenta el factor de corrección para población finita para
-L
N
calcular σp .
S
PU
más cerca de p.
Posteriormente veremos que el valor de σp es útil para determinar lo alejado que pueda
estar la proporción de la muestra de la proporción de la población. Debido al papel que
desempeña σp en el cálculo de los errores posibles es que se le conoce como error estándar
de la proporción.
Forma de la distribución de p
La última caracterı́stica que nos hace falta para tener definida completamente la
distribución de p es lo que respecta a la forma de la misma. La forma de la distribución
E
n.p ≥ 5
n.(1 − p) ≥ 5
-I I
Como se comentó en 6.1, los estadı́sticos, en este caso la proporción muestral: p, es ahora
la variable de interés. Por lo tanto, cuando se trabaja con la distribución muestral de p la
expresión que se emplea para calcular la variable normal estándar Z, es la siguiente:
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 259
p−p p−p
z= =r (6.6)
σp p(1 − p)
n
Nota: Observe que para σp se está considerando la expresión (6.5), es decir, el caso de
población infinita. Si estuviera en el caso de población finita deberá usar para σp la expresión
(6.4).
A continuación presentamos algunos problemas resueltos para familiarizarse con el uso
EP
Problemas resueltos.
Ahora si se toma una muestra de 300 electores y la pregunta de este apartado hace
CA
Como se trabaja con una muestra 300 electores, aplicamos el Teorema del Lı́mite
Central para verificar si se cumplen las dos condiciones: n.p =≥ 5 y n.(1 − p) ≥ 5,
para concluir que la distribución de p se puede aproximar con una distribución
normal (Como se explica en la sección 6.4.1 referente a la Forma de la distribución
de p). Operando tenemos que n.p = 300×0.52 = 156 y n.(1−p) = 300×0.48 = 144,
verificándose que dichas condiciones se cumplen, por tanto la distribución de p se
puede aproximar con una distribución normal.
-I I
Entonces concluimos que: p ∼ N 0.52, 0.0292 . Sobre esta variable de interés deseamos
22
0.50 − 0.52
P (p > 0.50) = P Z > = P (Z > −0.69) = 0.25490 + 0.50 = 0.7549.
0.029
0.50 0.52 p
UD
A
IM
S -L
PU
M
CA
−0.69 0 Z
Figura 6.8: Ilustración del cálculo de P (p > 0.50) para p ∼ N 0.52, 0.0292 .
de teléfonos celulares en la muestra esté entre 0.15 y 0.25, entonces estamos ante
22
la variable de interés:
20
n.p = 100 × 0.20 = 20 y n.(1 − p) = 100 × 0.80 = 80, verificándose que dichas
condiciones se cumplen, por tanto la distribución de p se puede aproximar con
una distribución normal.
A
Entonces concluimos que: p ∼ N 0.20, 0.042 . Sobre esta variable de interés
IM
0.15 − 0.20 0.25 − 0.20
S
0.04 0.04
= P (−1.25 < Z < 1.25) = 0.39435 + 0.39435 = 0.7887.
M
CA
Por tanto P (0.15 < p < 0.25) es igual a P (−1.25 < Z < 1.25) (Figura 6.9)
b) Hay una probabilidad del 95 % de que la proporción muestral se encuentre ¿dentro
de cuáles lı́mites simétricos de la proporción poblacional?
Lo que se pide en este apartado es lo siguiente: P (p1 < p < p2 ) = 0.95, como se
aprecia en la Figura 6.10.
Entonces para hallar los lı́mites simétricos p1 y p2 respecto de la proporción
poblacional p=0.20, procedemos como sigue:
En la Tabla de distribución normal si leemos un área de 0.475, el valor de Z
E
AD
correspondiente será 1.96, por lo tanto Z2 = 1.96 y por simetrı́a Z1 = −1.96 (ver
Figura 6.11).
Conocidos Z1 y Z2 , podemos establecer las siguientes dos expresiones para despejar
y hallar p1 y p2 respectivamente:
p1 − 0.20
−1.96 =
0.04
p2 − 0.20
1.96 = ,
0.04
-I I
A
IM
S -L
PU
M
CA
−1.25 0 1.25 Z
Figura 6.9: Ilustración del cálculo de P (0.15 < p < 0.25) para p ∼ N 0.20, 0.042 .
0,475 0,475
E
AD
p1 0.20 p2 p
-I I
22
20
0,475 0,475
EP
p1 0.20 p2 p
UD
0,475 0,475
A
IM
S -L
PU
M
CA
Z1 = − 1.96 0 Z2 = 1.96 Z
Figura 6.11: Ilustración de P (p1 < p < p2 ) = 0.95 y definición de Z2 = 1.96 y por simetrı́a Z1 = −1.96
P <Z<
AD
0.04 0.04
= =
0.25 − 0.20
P Z<
0.04
P (−0.50 < Z < 1.25)
= =
P (Z < 1.25)
0.19146 + 0.39435
= = 0.6550 o 65.50 %
0.50 + 0.39435
-I I
22
20
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 264
valor?
d ) ¿Existe un 75 % de probabilidad de que el tiempo medio muestral sea mayor a qué
valor?
A
e) Existe un 90 % de probabilidad de que el tiempo medio muestral se encuentre
IM
¿entre cuáles dos valores simétricamente distribuidos alrededor del tiempo medio
-L
poblacional?
S
PU
2. Una muestra aleatoria simple de tamaño 50 se selecciona de una población con σ=10.
Calcule el error estándar de la media en cada uno de los casos siguientes:
3. El tiempo medio necesario para descargar la página de un sitio web fue de 0.8 segundos.
E
AD
Suponga que el tiempo de descarga tiene una distribución normal con una desviación
estándar de 0.2 segundos. Si se selecciona una muestra aleatoria de 30 tiempos de
descarga.
a) ¿Cuál es la probabilidad de que el tiempo medio en la muestra sea menor que 0.75
segundos?
b) ¿Cuál es la probabilidad de que el tiempo medio en la muestra se encuentra entre
0.70 y 0.90 segundos?
-I I
5. La dieta que utilizan en una granja para el engorde de pollos produce animales que pesan
en promedio 1950 gramos con una desviación estándar de 220 gramos. Una franquicia
de pollos a la brasa ha seleccionado al azar 30 pollos, calcule la probabilidad que:
EP
a) El peso medio de los pollos en la muestra sea menor que 1900 gramos.
UD
qué valor?
S
PU
población con media igual a 100 y desviación estándar igual a 20, ¿entre cuáles lı́mites
CA
provienen de clientes nuevos. Si se toma una muestra aleatoria simple de 100 pedidos:
10. Usted planea realizar un experimento de marketing en el que los estudiantes deben
probar dos marcas de bebidas gaseosas distintas. Su labor consiste en identificar
correctamente cuál es la marca que probaron. Usted selecciona una muestra aleatoria
de 200 estudiantes y supone que no cuentan con facultades para distinguir entre
ambas marcas. (Nota: Si un individuo carece de facultades para distinguir entre las
dos bebidas gaseosas, entonces ambas marcas tienen la misma probabilidad de resultar
EP
seleccionadas.)
UD
poblacional?
-L
11. De acuerdo con un estudio el 40 % de usuarios de teléfonos celulares cuenta con uno
de alta gama. Si se selecciona una muestra de aleatoria de 50 usuarios de teléfonos
celulares:
12. Una empresa dedicada a la investigación realizó un estudio sobre las mujeres que ocupan
cargos importantes en ambientes corporativos. El estudio concluyó que el 15 % de los
funcionarios corporativos de las empresas son mujeres. Suponga que se selecciona una
muestra aleatoria de 200 funcionarios corporativos:
-I I
13. En una determinada población el 30 % votarı́an por el candidato presidencial del partido
M en caso de que las elecciones fuesen mañana. Si seleccionamos al azar una muestra
de 200 electores y los encuestamos, obtenga la probabilidad de que:
14. En un distrito limeño la proporción de personas que manifiesta estar de acuerdo con el
incremento de multas contra aquellos que cometan acoso callejero es 0.75. Si se extrae
de manera aleatoria una muestra de 115 adultos que viven en ese distrito
A
IM
16. Un artı́culo analiza los planes de jubilación para personas con edades de 50 a 70 años que
fueron empleados de tiempo completo o parcial. De los entrevistados, el 29 % dijeron
que no pensaron trabajar para obtener un salario. Si usted selecciona una muestra
aleatoria de 400 personas con edades de 50 a 70 años que fueron empleados de tiempo
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 268
18. Un fabricante produce tabletas de chocolate cuyo peso en gramos sigue una distribución
normal de media 125 g. y desviación tı́pica 4 g.
b) Si los lotes fuesen de 64 tabletas, ¿cuál serı́a la probabilidad de que el peso medio
UD
20. Se sabe que el 48 % de los internautas que visitan una página web están satisfechos
A
IM
manifiesten satisfechas con los contenidos del sitio web sea superior a 0,54?
S
PU
años con una varianza de 36. Si se selecciona al azar una muestra de 40 personas que
CA
ven el programa:
22. La duración de las baterı́as de un determinado modelo de teléfono móvil sigue una
distribución desconocida cuya media es de 34,5 horas y su desviación tı́pica es de 6,9
horas. Si se tomara una muestra aleatoria simple de 38 de estas baterı́as:
y 36 horas?
c) Existe una probabilidad del 95 % de que la duración promedio de la muestra se
encuentre ¿entre cuáles dos valores simétricamente distribuidos alrededor de la
duración promedio poblacional?
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 269
23. Se sabe que el peso de los recién nacidos en un determinado poblado sigue una
distribución normal con media igual a 3600 gramos y varianza igual a 78400.
a) Calcule la probabilidad de que un recién nacido pese entre 3700 y 3800 gramos.
b) ¿Cuál es la probabilidad de que un recién nacido pese 3500 gramos?
c) Si se elige un recién nacido al azar y resulta que pesa más de 3450 gramos ¿Cuál
EP
f ) Si se toma una muestra aleatoria de 196 recién nacidos, existe una probabilidad
del 95 % de que el peso promedio de la muestra se encuentre ¿entre cuáles dos
-L
probabilidad de que el peso promedio de la muestra sea superado por qué valor?
CA
edificios antiguos.
20
25. Supongamos que el tiempo que un cliente pasa en un banco sigue distribución normal
con una media de 19 min y una desviación estándar de 5 min. Si selecciona una muestra
aleatoria simple de cinco clientes, ¿cuál es la probabilidad de que el tiempo promedio
empleado sea al menos 12 min?
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 270
26. Según eventos pasados, un concesionario de automóviles sabe que el 8 % de todos los
clientes que ingresan a la sala de exposición realizan una compra. Supongamos que 100
personas entran a la sala de exposición, ¿Cuál es la probabilidad de que la proporción
de clientes que realizan una compra en dicha muestra esté entre 0,05 y 0,10?
27. Se sabe que los sueldos de los trabajadores de una empresa tienen distribución
desconocida con una media de 800 dólares. Se toma una muestra aleatoria de 35
trabajadores y se encuentra que hay una probabilidad del 5 % de que el sueldo promedio
de la muestra exceda los 866 dólares. Hallar la desviación estándar de los sueldos de
EP
28. Muchos de los adultos peruanos alivian el estrés comiendo dulces. Según un estudio
del Ministerio de Salud, el 46 % de los adultos peruanos comen en exceso comidas
dulces cuando están estresados. Si se selecciona una muestra aleatoria de 100 adultos
peruanos, ¿Cuál es la probabilidad de que la proporción muestral de los que comen en
A
IM
29. Una fábrica de autos lanza al mercado el modelo SPIKE del que se sabe que sus pesos
S
siguen una distribución normal con media igual a 3100 kilos y una desviación estándar
PU
de 130 kilos.
M
30. Durante dos años las ventas han estado disminuyendo en la gran cantidad de sucursales
de una cadena de supermercados. Una empresa de análisis de datos ha determinado
que un 30 % de las sucursales tiene signos de una mala administración. Si se toma una
muestra aleatoria de 95 sucursales,
31. El peso de los paquetes de harina que produce cierta fábrica sigue una distribución
normal con media de 105 gramos y desviación estándar de 5 gramos.
a) Si se elige al azar un paquete ¿cuál es la probabilidad de que pese entre 106 y 111
gramos?
-I I
gramos?
20
c) Si se elige al azar un paquete resultando que pesa más de 107 gramos, ¿cuál es la
probabilidad de que pese menos de 110 gramos?
d ) Si se toma al azar una muestra de 6 paquetes ¿cuál es la probabilidad de que al
menos 4 paquetes pesen entre 107 y 110 gramos?
CAPÍTULO 6. DISTRIBUCIONES MUESTRALES 271
los paquetes vacacionales que incluyen un crucero, en la muestra, sea menor que
S
PU
27 %?
b) Calcular e interpretar el error estándar de la proporción para una muestra de 650
M
CA
clientes.
Estimación de parámetros
EP
UD
7.1. Introducción
En el Capı́tulo anterior, declaramos que un estimador puntual es un estadı́stico de la
muestra y se utiliza para estimar un parámetro de la población. Por ejemplo, la media
A
muestral x es un estimador puntual de la media poblacional µ y la proporción muestral p
IM
se entiende que la estimación puntual no es suficiente ya que no nos indica el error que se
PU
comete en la estimación. Por esa razón, un enfoque que nos arroja mayor información consiste
M
en presentar una estimación de intervalo, osea un intervalo de valores del que se espera que
CA
es la siguiente:
22
El objetivo de una estimación de intervalo es proporcionar información sobre qué tan cerca
está la estimación puntual, proporcionada por la muestra, al valor del parámetro poblacional
correspondiente.
272
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 273
x ± E (7.2)
donde E: Margen de error. La expresión (7.2) es lo mismo que decir que el intervalo de
EP
en el que la media de una muestra estima a una media poblacional, el error muestral es:
S -L
E =| x − µ | (7.4)
PU
para establecer márgenes de probabilidad acerca del tamaño del error muestral. Como la
distribución muestral de x indica cómo se distribuyen sus valores en torno o alrededor de µ,
nos proporciona información acerca de las diferencias posibles entre x y µ.
Es decir, se puede probabilı́sticamente afirmar cuál es el valor máximo para el error
muestral si:
el Capı́tulo 6, sección 6.3.1. De ello sabemos que X se aproxima a una distribución normal
(ya sea si la población sigue distribución normal o el Teorema del Lı́mite Central (TLC)
!
σ 2
ayude a identificar la forma que tiene la distribución de x), es decir, X ∼ N µ, √ ,
n
asumiendo que σ es conocido.
Respecto al punto 2, ¿Qué es el nivel de confianza? En el caso que el objetivo sea
estimar µ, se puede definir como, la probabilidad (1-α) de que la media muestral se encuentre,
como máximo, a una distancia E de la media poblacional µ (desconocida), como se aprecia
-I I
en la Figura 7.1. El nivel de confianza (1-α) es el área bajo la curva normal estándar entre
22
α
los valores −Zα/2 y Zα/2 . El área restante es en cada cola de la distribución. Por ejemplo
20
2
si la estimación se realiza con un nivel de confianza del 90 %, es decir, 1-α=0.90, entonces
α
=0.05, lo que hará que Zα/2 =1.645. Ası́, conociéndose el nivel de confianza obtenemos el
2
valor de Z a emplear. En la Tabla 7.1 aparecen, además del mencionado, otros niveles de
confianza de uso común.
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 274
EP
µ E X
UD
nivel de confianza
(1 − α)
A
IM
-L
α 2 α 2
S
PU
M
CA
− Zα 2 0 Zα 2 Z
Tabla 7.1: Valores de “Z” para los niveles de confianza de uso común.
AD
Basados en la explicación lı́neas arriba, decimos que: Dado un nivel de confianza (1-α),
el margen de error o error muestral (E) se calcula como:
E = Zα/2 × σx (7.5)
Para el caso de tratar con una población infinita la expresión (7.5) quedarı́a ası́:
-I I
σ
E = Zα/2 × √ (7.6)
n
22
20
No se olvide que para usar la expresión (7.5) asumimos que σ es conocida y el margen
de error está siendo medido en la distribución de la variable normal estándar (Z). En caso
que σ no sea conocida, debemos emplear la desviación estándar de la muestra “s” (de una
muestra grande, n ≥ 30) como un estimado puntual de σ. Por tanto estimaremos σx através
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 275
s
de Sx = √ , por lo que, el margen de error o error muestral (E) se calcula en este caso como:
n
s
E = Zα/2 × √ . (7.7)
n
Por tanto, empleando las expresiones (7.6) y (7.7) en la expresión (7.2), definimos algunos
casos para realizar la estimación de intervalo para una media poblacional (µ):
σ
x ± Zα/2 × √ (7.8)
n
A
IM
s
M
x ± Zα/2 × √ (7.9)
n
CA
muestra. Pero, ¿cuál es el tamaño de la muestra necesario para garantizar cierto nivel de
22
En caso que el cálculo del tamaño de la muestra n resulte un valor no entero deberá
redondear el resultado siempre al entero superior más próximo.
A
La expresión (7.10) es obtenida al despejar n de la expresión (7.6). Análogamente la
IM
la expresión (6.1).
S
PU
Problemas resueltos.
1. Se sabe que los pesos de una población de novillos de 18 meses de edad tienen una
distribución aproximadamente normal, con desviación estándar de 6 kg. Se tomó una
muestra de 9 novillos y se determinó que la media de esa muestra es de 180 kg.
E
AD
También sabemos por el enunciado que X sigue distribución normal, por tanto,
20
de x).
M
Entonces concluimos que: X ∼ N µ, 22 . De acuerdo a la expresión (7.6) tenemos
CA
σ
que el margen de error es: E = Zα/2 × √ . Como el nivel de confianza para la
n
estimación es del 95 % de acuerdo con la Tabla 7.1, el valor de “Z” que debemos
emplear es 1.96, por tanto, haciendo los reemplazos respectivos, el margen de error
o error muestral será:
σ 6
E = Zα/2 × √ = 1.96 × √ = 3.92 kg
n 9
novillos hay una probabilidad del 95 % de que el peso promedio de los 9 novillos
se aleje como máximo 3.92 kg. del peso promedio de la población de novillos.
d ) ¿Cuál es el intervalo de confianza de 95 % para el peso medio de la población de
novillos? Interpretar.
Por la información obtenida de este problema, para construir un intervalo de
confianza de 95 % para el peso medio de la población de novillos, µ, debemos
emplear la expresión (7.8), por lo que dicho intervalo de confianza será:
-I I
σ
22
x ± Zα/2 × √
n
20
180 ± 3.92 kg
x − E < µ < x + E.
el peso promedio de la población de novillos (µ) con cada una de las muestras,
UD
Antes de responder analicemos la respuesta del apartado c). En ese caso una
muestra de 9 novillos produjo un margen de error de máximo 3.92 kg en la
-L
estimación. Si ahora nos piden reducir el error de forma que sea no mayor a 2
S
PU
kg, con el mismo nivel de confianza y sabiendo que σ=6, entonces el tamaño de la
muestra deberá ser mayor. El tamaño de muestra requerido se hallará usando la
M
CA
expresión (7.10):
2
Zα/2 × σ 2 (1.96)2 × 62
n= = ≈ 34.57 = 35 novillos.
E2 22
σ 2.50
σx = √ = √ ≈ 0.36 dólares.
n 49
b) Con el nivel de confianza de 95 %, ¿Cuál es el margen de error?
Como se ha definido en el apartado anterior, la variable de interés es, X=“consumo
promedio en una muestra de 49 clientes (dólares)”. Como se explica en la sección
6.3.1, las caracterı́sticas de la distribución de X serán:
E(X) = µ, la cual es desconocida.
σ 2.50
Del apartado anterior sabemos que: σx = √ = √ ≈ 0.36 dólares.
n 49
EP
Entonces concluimos que: X ∼ N µ, 0.362 . De acuerdo a la expresión (7.6)
-L
σ
tenemos que el margen de error es: E = Zα/2 × √ . Como el nivel de confianza
S
n
PU
para la estimación es del 95 % de acuerdo con la Tabla 7.1, el valor de “Z” que
debemos emplear es 1.96, por tanto, haciendo los reemplazos respectivos, el margen
M
σ 2.50
E = Zα/2 × √ = 1.96 × √ = 0.70 dólares.
n 49
σ
x ± Zα/2 × √
n
-I I
x − E < µ < x + E.
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 280
de 200 vendedores de autos usados se obtuvo una ganancia promedio de $300 y una
desviación estándar muestral de $150. Con esa información defina e interprete un
estimado de intervalo de confianza de 90 % para la ganancia promedio de la población
A
de ventas de automóviles usados.
IM
Sea la variable aleatoria: X=“ganancia por venta de autos usados (dólares)”. Según
-L
lo que consideramos es desconocida. Esta variable como hemos dicho hace referencia a
CA
σ
o error estándar de la media se debe emplear la expresión (6.2), es decir: σx = √ .
AD
n
En esta ocasión, como se ha manifestado lı́neas arriba, no se conoce el valor de σ,
por lo que en realidad no podrı́amos calcular σx . Pero como se explicó en la sección
7.2, en caso que σ no sea conocida, debemos emplear la desviación estándar de una
muestra, “s” (debe ser una muestra grande, n ≥ 30) como un estimado puntual de
σ. En el enunciado del problema se dice que la desviación estándar encontrada en la
s
muestra es s = 150. Por tanto estimaremos σx através de Sx = √ , el cual es igual a
n
150
Sx = √ ≈ 10.61 dólares.
-I I
200
22
ha definido que la variable de interés es, X=“ganancia promedio por la venta de autos
usados en una muestra de 200 vendedores (dólares)”, entonces de acuerdo a la sección
6.3.1, las caracterı́sticas de la distribución de X serán:
150
Lı́neas arriba se ha estimado σx como Sx = √ ≈ 10.61 dólares.
200
Como en el problema no se menciona qué distribución tiene la variable poblacional
X=“ganancia por venta de autos usados (dólares)” y sabemos que la muestra
tomada es de 200 vendedores (n ≥ 30), aplicando el Teorema del Lı́mite Central
podemos afirmar que la distribución de X se puede aproximar con una distribución
normal (Como se explica en la sección 6.3.1 referente a la Forma de la distribución
de x).
Entonces concluimos que: X ∼ N µ, 10.612 . De acuerdo a la expresión (7.7) tenemos
EP
s
que el margen de error es: E = Zα/2 × √ . Como el nivel de confianza para la estimación
n
UD
es del 90 % de acuerdo con la Tabla 7.1, el valor de “Z” que debemos emplear es 1.645,
por tanto, haciendo los reemplazos respectivos, el margen de error o error muestral
será:
s 150
A
E = Zα/2 × √ = 1.645 × √ = 17.45 dólares.
n 200
IM
Esto quiere decir, que si seleccionamos una muestra de 200 vendedores y empleamos la
-L
ganancia promedio por la venta de autos usados de la muestra de 200 vendedores para
S
PU
Lo anterior es lo mismo que decir que el intervalo de confianza para µ es, de acuerdo a
la expresión (7.3):
x − E < µ < x + E.
cia promedio de la población de ventas de automóviles usados (µ) con cada una de las
muestras, esperamos que alrededor del 90 % de los intervalos construidos contengan la
ganancia promedio de la población de ventas de automóviles usados, µ.
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 282
Un caso no contemplado por las expresiones (7.8) y (7.9) para estimar un intervalo de
confianza para una media poblacional µ tiene que ver con la situación en que la desviación
estándar poblacional σ es desconocida y la muestra con la que contamos es
pequeña (n < 30). En muchas situaciones de la vida real la desviación estándar poblacional
σ es desconocida y además de eso, debido a limitaciones de tiempo y costo, no es posible
EP
confianza para una media poblacional µ en estas circunstancias se puede usar la llamada
distribución t-student (o simplemente distribución t), siempre y cuando la población de la
cual se extrae la muestra tenga distribución normal.
El uso de la distribución t surge porque nos vemos en la necesidad de emplear la
A
IM
desviación estándar (s) de una muestra pequeña (n < 30) para estimar la desviación estándar
poblacional σ. Esa estimación genera un mayor error muestral E el cual debe ser calculado o
-L
Z como ocurrió en los casos contemplados por las expresiones (7.8) y (7.9).
Si una variable aleatoria (poblacional) X sigue distribución normal (y σ es desconocido)
M
CA
x−µ
t= s (7.12)
√
n
sigue una distribución t.
La distribución t es una distribución de probabilidad continua al igual que la distribución
normal estándar Z. Algunas caracterı́sticas de la distribución t son:
No existe una sola distribución t, sino una familia de distribuciones t. Todas las
distribuciones t tienen una media de 0, y sus desviaciones estándares difieren de acuerdo
con el tamaño de la muestra, n. Existe una distribución t para un tamaño de muestra
de 20, otra para un tamaño de muestra de 22, etc. La desviación estándar de una
distribución t con 5 observaciones es mayor que en el caso de una distribución t con 20
observaciones.
(g.l.). Cuando usamos la distribución t para estimar uma media poblacional (µ), los
grados de libertad son iguales al tamaño de la muestra menos 1. (g.l. = n − 1).
22
20
La distribución t es más ancha y más plana en la parte central que la distribución normal
estándar (ver Figura 7.2). Como resultado de ello se tiene una mayor variabilidad en
las medias muestrales calculadas a partir de muestras más pequeñas. Sin embargo,
conforme se incrementa el tamaño de la muestra (y por ende, los grados de libertad),
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 283
Distribución Z
UD
Distribución t
(5 grados de libertad)
Distribución t
A
(2 grados de libertad)
IM
S -L
PU
M
CA
s
E = tα/2 × √ . (7.13)
22
n
20
s
x ± tα/2 × √ (7.14)
n
Nota: Como la distribución t de Student posee mayor dispersión que la distribución
z, el valor de t en un nivel de confianza dado tiene una magnitud mayor que el valor z
correspondiente.
EP
la Tabla 7.2. Para poder leer un valor de t en la Tabla debemos entrar con dos informaciones:
-L
los grados de libertad (a partir del tamaño de la muestra empleada) y el área en el extremo
S
de la muestra es 11.
Si el tamaño de la muestra es n = 11, los grados de libertad serán: g.l. = n − 1 = 11 − 1 =
10. Por otro lado, si el nivel de confianza es del 90 %, es decir, 1-α=0.90, entonces el área en
α
el extremo superior de la distribución será: =0.05. Entonces en la Tabla observamos que el
2
valor a emplear será t=1.8125.
Para familiarizarse con la estimación de intervalo para una media poblacional (µ) para
el caso mencionado en la expresión (7.14) donde usamos la Distribución t, presentamos a
continuación algunos problemas resueltos.
E
AD
Problemas resueltos.
Área (probabilidad)
en extremo superior
EP
0 t
UD
Tabla 7.2: Extracto de la Tabla de Distribución t. En el Apéndice A.5 aparece una versión más extensa.
s 10
E = tα/2 × √ = 2.1098 × √ = 4.97 partes/hora.
n 18
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 286
s
x ± tα/2 × √
n
UD
80 ± 4.97 partes/hora
Lo anterior es lo mismo que decir que el intervalo de confianza para µ es, de acuerdo a
A
la expresión (7.3):
IM
x − E < µ < x + E.
S -L
s 1.30
E = tα/2 × √ = 1.7291 × √ = 0.50 horas.
EP
n 20
UD
la muestra empleada es: x = 2.40 horas, entonces siguiendo la expresión (7.14), tenemos
CA
s
x ± tα/2 × √
n
Lo anterior es lo mismo que decir que el intervalo de confianza para µ es, de acuerdo a
la expresión (7.3):
x − E < µ < x + E.
E
AD
administradores, µ.
22
20
3. Se desea estimar el tiempo promedio diario que un estudiante del Campus Lima usa su
teléfono celular. Para ello se selecciona aleatoriamente a 9 estudiantes y se obtienen los
siguientes datos del tiempo (en minutos) de uso diario: 89, 72, 105, 117, 156, 116, 125,
101, 100. Obtenga e interprete un intervalo de confianza para el tiempo medio diario
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 288
de uso del celular de los estudiantes del Campus con un nivel de confianza del 95 %.
Suponga que el tiempo diario de uso de celular sigue distribución normal.
Sea la variable aleatoria: X=“Tiempo diario de uso de celular por los estudiantes
(minutos)”. Según el enunciado no hay información sobre la media µ de X, ya que
el objetivo va ser estimarla y tampoco se conoce la desviación estándar de X (variable
poblacional), σ. En el enunciado del problema se supone que X sigue distribución
normal, por lo que X ∼ N µ, σ 2 . Esta variable como hemos dicho hace referencia a
la población.
EP
uso del celular de los 9 estudiantes para estimar el tiempo promedio de uso de celular
S
PU
s 23.7
E = tα/2 × √ = 2.3060 × √ = 18.22 minutos.
E
n 9
AD
s
x ± tα/2 × √
n
Lo anterior es lo mismo que decir que el intervalo de confianza para µ es, de acuerdo a
la expresión (7.3):
x − E < µ < x + E.
promedio de uso de celular de la población de estudiantes (µ) con cada una de las
UD
Como conclusión de esta sección, en la Tabla 7.3 se muestra un resumen de los casos
A
vistos para realizar la estimación de intervalo para una media poblacional (µ).
IM
σ
1 Normal Conocida n < 30 No x ± Zα/2 × √
CA
n
2 Desconocida Conocida n ≥ 30 Sı́
s
3 Desconocida Desconocida n ≥ 30 Sı́ x ± Zα/2 × √
n
s
4 Normal Desconocida n < 30 No x ± tα/2 × √
n
Tabla 7.3: Resumen de casos para realizar la estimación de intervalo para una media poblacional (µ).
cierta caracterı́stica de interés, que representa una determinada porción de una población
de estudio. Por ejemplo, podemos estar interesados en saber qué proporción de estudiantes
del Campus Lima fueron al teatro por lo menos una vez el último mes, o la proporción de
clientes que preferirá un nuevo producto que se piensa lanzar al mercado, o la proporción
de hogares que está sintonizando un determinado programa de televisión en cierto horario,
o la proporción de consumidores satisfechos con los servicios prestados por una empresa de
telefonı́a, o la proporción de electores de la ciudad de Lima que votarı́an por un determinado
candidato en caso la elección presidencial se realizara mañana, o la proporción de ciudadanos
-I I
que está de acuerdo con la gestión del actual alcalde de la ciudad, etc. Para este tipo de
22
investigaciones se emplean procedimientos de cálculo que tienen que ver con proporciones.
20
Es por eso que en esta sección mostraremos cómo usar la distribución muestral de p para
determinar un estimado de intervalo de una proporción poblacional p.
Siguiendo la expresión (7.1) decimos que la forma general de una estimación de intervalo
de confianza para una proporción poblacional p es:
p ± E (7.15)
donde E: Margen de error. La expresión (7.15) es lo mismo que decir que el intervalo de
confianza para p es:
EP
E =| p − p | (7.17)
S
PU
para establecer márgenes de probabilidad acerca del tamaño del error muestral. Como la
distribución muestral de p indica cómo se distribuyen sus valores en torno o alrededor de p,
nos proporciona información acerca de las diferencias posibles entre p y p.
Es decir, se puede probabilı́sticamente afirmar cuál es el valor máximo para el error
muestral si:
revisar el Capı́tulo 6, sección 6.4.1. De ello sabemos que p se aproxima a una distribución
normal(aplicando el Teorema del Lı́mite Central (TLC) con ciertas condiciones). Por tanto
r !2
p(1 − p)
p ∼ N p, , asumiendo que la problación es infinita.
n
Respecto al punto 2, en el caso que el objetivo sea estimar p, el nivel de confianza se
puede definir como, la probabilidad (1-α) de que la proporción muestral se encuentre, como
máximo, a una distancia E de la proporción poblacional p (desconocida), como se aprecia
-I I
en la Figura 7.3. El nivel de confianza (1-α) es el área bajo la curva normal estándar entre
α
22
los valores −Zα/2 y Zα/2 . El área restante es en cada cola de la distribución. Por ejemplo
2
20
p E p
UD
nivel de confianza
(1 − α)
A
IM
-L
α 2 α 2
S
PU
M
CA
− Zα 2 0 Zα 2 Z
Basados en la explicación lı́neas arriba, decimos que: Dado un nivel de confianza (1-α),
el margen de error o error muestral (E) se calcula como:
E = Zα/2 × σp (7.18)
E
AD
Para el caso de tratar con una población infinita la expresión (7.18) quedarı́a ası́:
r
p(1 − p)
E = Zα/2 × (7.19)
n
r
p(1 − p)
E = Zα/2 × . (7.20)
n
Con el margen de error dado por la expresión (7.20), la expresión para la estimación de
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 292
existe y es fijo, por lo tanto dicho valor está o no en el intervalo construido. Por esta razón
-L
no es correcto decir: hay una probabilidad del (1 − α) × 100 % de que el valor de p esté en el
S
PU
intervalo construido.
La forma correcta de interpretar el intervalo de confianza serı́a: Si seleccionamos una gran
M
una de las muestras, esperamos que alrededor del (1−α)×100 % de los intervalos construidos
contengan la proporción poblacional, p.
muestra. Pero, ¿cuál es el tamaño de la muestra necesario para garantizar cierto nivel de
AD
N × Zα/2 × p × (1 − p)
n= 2 (7.23)
22
(N − 1)E 2 + Zα/2 × p × (1 − p)
20
En caso que el cálculo del tamaño de la muestra n resulte un valor no entero deberá
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 293
de p se suele emplear p = 0.5. La razón de usar 0.5 como valor de p cuando no hay
UD
(7.21) y del cálculo del Tamaño de muestra requerido si el objetivo es estimar una proporción
PU
Problemas resueltos.
1. Se realizó una encuesta a una muestra aleatoria simple de 100 votantes y 45 de ellos
dijeron que votarı́an por el congresista Pérez del partido NuestroPerú en las próximas
elecciones congresales. Usar esta información para estimar, con un nivel de confianza
de 95 % la proporción de electores que votarı́an por el congresista Pérez.
Del enunciado del problema encontramos que se pide estimar la proporción de electores
que votarı́an por el congresista Pérez en la población de votantes, osea p. Una estimación
puntual de p es la proporción de electores que votarı́an por el congresista Pérez en la
45
E
100
Como se trabaja con una muestra 100 votantes, aplicamos el Teorema del Lı́mite
Central para verificar si se cumplen las dos condiciones: n.p ≥ 5 y n.(1 − p) ≥ 5,
para concluir que la distribución de p se puede aproximar con una distribución normal
(Como se explica en la sección 6.4.1 referente a la Forma de la distribución de p).
Obviamente emplearemos p = 0.45, como estimación puntual de p. Operando tenemos
que n.p = 100 × 0.45 = 45 y n.(1 − p) = 100 × (1 − 0.45) = 55, verificándose que
dichas condiciones se cumplen, por tanto la distribución de p se puede aproximar con
una distribución normal.
-I I
22
Ahora, como el nivel de confianza para la estimación es del 95 % de acuerdo con la Tabla
20
7.1, el valor de “Z” que debemos emplear es 1.96, por tanto, siguiendo la expresión (7.20)
y haciendo los reemplazos respectivos, el margen de error o error muestral será:
r r
p(1 − p) 0.45(1 − 0.45)
E = Zα/2 × = 1.96 × ≈ 0.098.
n 100
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 294
r
p(1 − p)
p ± Zα/2 × .
n
0.45 ± 0.098.
Lo anterior es lo mismo que decir que el intervalo de confianza para p es, de acuerdo a
la expresión (7.16):
EP
p − E < p < p + E.
UD
con cada una de las muestras, esperamos que alrededor del 95 % de los intervalos
PU
en la población de votantes, p.
CA
2. Una empresa está pensando en lanzar un nuevo producto al mercado por lo que desea
estimar, con un nivel de confianza de 95 % y un margen de error del 4 %, la proporción
de clientes que lo comprarı́an. Calcule el tamaño de la muestra necesaria para realizar
la estimación correspondiente.
es del 95 % por lo que de acuerdo con la Tabla 7.1, el valor de “Z” que debemos
AD
2
20
polı́tico en campaña. Para hacer esto, debe establecer el tamaño de muestra de votantes
a ser entrevistados. Se desea un margen de error de 2.8 puntos porcentuales y un nivel
de 95 % de confianza. A
a) Estudios previos mostraron que el polı́tico tenı́a el 18 % de las preferencias de los
IM
votantes.
-L
En este caso debemos emplear la expresión (7.22) en que el valor de “Z” que
S
2
CA
n= = = 1225
AD
E2 0.0282
2
N × Zα/2 × p × (1 − p)
n= 2
(N − 1)E 2 + Zα/2 × p × (1 − p)
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 296
intervalo confianza del 90 % para el tiempo promedio que estudian fuera de sus horas
UD
2. Se desea estimar el gasto promedio mensual en dólares que una familia de la ciudad de
Lima gasta en embutidos.
A
IM
a) Calcule cuántas familias se deben tomar como muestra para que la estimación
tenga una confianza de 95 % y un margen de error de 2 dólares. Considere que σ=
-L
9 dólares.
S
PU
b) Realice el cálculo para una urbanización con 850 familias para que la estimación
M
que σ= 9 dólares.
3. Una empresa está pensando en lanzar un nuevo producto al mercado por lo que desea
estimar con un nivel de confianza de 95 % y un margen de error del 3 %, el porcentaje
de clientes que lo comprarı́an. Suponga que no cuenta con información de estudios o
encuestas previas sobre productos similares. Calcule el tamaño de la muestra necesaria
para realizar la estimación correspondiente.
4. Se desea estimar la demanda media diaria de un producto que registra una empresa.
Para ello se seleccionan 10 dı́as al azar con los siguientes valores en miles:
E
AD
35, 44, 38, 55, 33, 56, 67, 45, 48, 40.
8. Supongamos que el tiempo (en horas) dedicado por los estudiantes de una determinada
asignatura a estudiar para el examen final tiene una distribución normal. Se toma una
muestra aleatoria de 6 estudiantes cuyos tiempos de estudio fueron los siguientes:
A
IM
promedio poblacional
M
10. Una encuesta reunió datos acerca de cómo consideran los peruanos la calidad de la
información en los diarios y en TV. Una de las preguntas fue si el encuestado cree que
lo que se dice de la economı́a peruana es equilibrado, muy negativo o muy positivo. Los
estimados preliminares son de que un 50 % de la población cree que la información es
E
equilibrada.
AD
a) ¿Qué tamaño de muestra se recomienda para que el margen deseado de error sea
de 3.3 %? Emplee el 95 % de nivel de confianza.
b) ¿Qué tamaño se recomienda para que el error sea de 2.5 %, con 95 % de confianza?
13. El precio (en dólares) de ciertos electrodomésticos fabricados por una empresa, se puede
considerar una variable que sigue una distribución normal con desviación tı́pica igual a
100 dólares. Se toma una muestra aleatoria de 9 de estos electrodomésticos y el precio
de cada uno es:
14. Una empresa de cable desea conocer qué proporción de sus clientes se informan de
UD
las noticias a través de los noticiarios que difunden. Para ello seleccionó una muestra
aleatoria simple de 200 clientes y 110 respondieron que se informan a través de los
noticiarios televisivos. Calcular e interpretar un intervalo de confianza del 95 % para la
proporción poblacional de clientes que se informan a través de los noticiarios televisivos.
A
IM
15. El gasto semanal de fotocopias, en soles, de los estudiantes de una escuela de posgrado
-L
sigue distribución normal con varianza igual a 144. Se toma una muestra aleatoria
S
PU
de 9 de estos estudiantes resultando los valores siguientes para esos gastos:100, 150,
90, 70, 75, 105, 200, 120, 80. Con el análisis visto en clase, determine e interprete un
M
intervalo confianza del 90 %, para el gasto promedio semanal en fotocopias para todos
CA
b) El gerente cree que el costo de tal muestra serı́a muy alto y autoriza al consultor a
20
realizar un estudio piloto con una muestra de 100 personas para obtener una
estimación puntual de la proporción verdadera p. El estudio piloto indicó un
76 % de aceptación del nuevo producto. Con base en esa información, el consultor
recalcula el tamaño de la muestra necesaria. ¿Cuál es ese tamaño?
CAPÍTULO 7. ESTIMACIÓN DE PARÁMETROS 299
19. Un fabricante de una determinada marca de vehı́culos de lujo sabe que el consumo de
gasolina de sus vehı́culos se distribuye normalmente. Se selecciona una muestra aleatoria
de 6 automóviles (y observando el consumo cada 100 km.) se obtiene un promedio de
19.48 con una varianza de 0.96. Con el análisis visto en clase, determine e interprete
EP
20. En una ciudad se hace un estudio de marketing de una nueva crema dental y se toma una
muestra aleatoria simple de 50 mujeres residentes de la ciudad. El 60 % de esas mujeres
responde que les gustó la nueva crema dental. Encontrar e interpretar un intervalo de
A
IM
confianza del 90 % para la proporción de mujeres en la ciudad que les gustarı́a la nueva
crema.
S -L
21. Muchas veces los padres prestan el teléfono celular a sus pequeños hijos para
PU
promedio diario que un niño de entre 7 y 12 años usa el teléfono celular de sus padres
CA
para jugar. Para ello se seleccionó aleatoriamente a 8 niños con edades en ese rango y se
obtuvieron los siguientes datos del tiempo (en minutos) de uso diario: 116, 100, 116, 72,
156, 125, 89, 100. Obtenga e interprete un intervalo de confianza para el tiempo medio
diario de uso del celular por niños de entre 7 a 12 años con un nivel de confianza del
99 %. Suponga que el tiempo diario de uso de celular por los niños sigue distribución
normal.
22. Estamos interesados en conocer el consumo diario medio de cigarrillos entre los alumnos
de universidades de la ciudad. Seleccionada una muestra aleatoria simple de 100
E
23. Una cafeterı́a evalúa la posibilidad de poner una sala de fumadores si el porcentaje de
usuarios de la cafeterı́a que fuma supera el 60 %. Un estudio sobre 50 usuarios elegidos
aleatoriamente indica que 26 de ellos fuman y 24 no.
b) ¿A qué número de personas habrı́a que encuestar, con el mismo nivel de confianza
20
24. Una encuesta a una muestra 1,000 usuarios de smartphones encontró que el tiempo
diario promedio empleado en comunicación con el dispositivo era de 131.4 minutos. De
estudios anteriores, se supone que la desviación estándar poblacional es 21.2 minutos. La
comunicación incluye mensaje de texto, correo electrónico, redes sociales y conexiones.
Encuentre e interprete un intervalo de confiança de 95 % para el tempo medio diario
empleados en comunicación en un smartphone para la población de usuarios?
calentamiento global representarı́a una seria amenaza para su estilo de vida durante su
existencia. Encuentre e interprete un intervalo de confianza de 90 % para la proporción
UD
poblacional de personas que creen que el calentamiento global representará una seria
amenaza a su estilo de vida durante su existencia.
26. Imagine que un compañero de su sección llevó a cabo un estudio e informó que el
A
IM
la muestra que empleó era de 16, y de que el tamaño de la muestra era de por lo menos
S
PU
empleado.
CA
27. Deseamos determinar con un margen de error de 4 %, la proporción de amas de casa que
usan e-mail. Asumiendo que queremos uma confianza de 90 % en nuestros resultados,
determine el tamaño de la muestra si:
a) Un estudo piloto indicó que 16,9 % de las amas de casa utilizan e-mail.
b) No hay información previa que sugiera un posible valor para p.
28. Se realizó una encuesta de opinión en una gran empresa con el objetivo, entre otras
cosas, estimar el ı́ndice promedio de satisfacción de los empleados con las condiciones
E
cada empleado se puede medir en una escala de cero a cien puntos, y su variabilidad es
tal que la desviación estándar de la población es de 30 puntos.
a) Si 324 empleados fueron seleccionados al azar para ser encuestados ¿cuál es el nivel
de confianza a emplear para que el margen de error sea como máximo 3 puntos?
b) ¿Cuál deberı́a ser el tamaño de la muestra de empleados a ser encuestados para que
el margen de error sea como máximo 1.5 puntos con el mismo nivel de confianza
encontrado en el apartado a)? Comente el resultado obtenido.
-I I
22
29. En un estudio de mercado, 57 de las 150 personas entrevistadas dijeron que comprarı́an
cierto producto lanzado por una empresa. ¿Esta muestra es suficiente para estimar la
verdadera proporción de futuros compradores con un margen de error de 8 % y un 90 %
de confianza? En caso de no ser suficiente, calcule el tamaño de la muestra requerida.
30. Se desea realizar un estudio para estimar el salario promedio de los ejecutivos con
formación en Administración de empresas en el Perú. Para la estimación se establece
un nivel de confiança de 95 % y se admitirá un error máximo de 500 soles. Como no
se conoce la desviación estándar de los salarios de todos los ejecutivos con formación
EP
31. Una compañı́a de seguros quiere estimar el porcentaje de conductores que usan
sus teléfonos celulares mientras conducen. En una muestra de 850 conductores, 544
A
IM
32. En una encuesta aplicada a 10 personas se encontró que en promedio ven 2.5 horas de
PU
televisión al dı́a con una desviación estándar de 0.8 horas. Con un nivel de confianza del
M
por la población en ver televisión. Asuma que el tiempo empleado en ver televisión
sigue distribución normal.
34. Un operador de televisión por cable realizó una investigación de mercado con sus
suscriptores con el objetivo, entre otras cosas, estimar la proporción p de personas que
estarı́an dispuestas a contratar una mejora en el servicio que se les ofrece actualmente
a cambio de un cierto descuento en el precio.
-I I
A
IM
S -L
PU
M
CA
E
AD
-I I
22
20
UD
EP
Tablas
Apéndice A
CA
M
PU
S -L
IM
A
303
AD
E
20
22
-I I
UD
EP
A.1.
columna
1-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50 51-55 56-60 61-65 66-70
fila
CA
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207 20969 99570 91291 90700
2 22368 46573 25595 85393 30995 89198
M 37982 53402 93965 34095 52666 19174 39615 99505
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081 30680 19655 63348 58629
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004 00849 74917 97758 16379
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672 14110 06927 01263 54613
PU
6 77921 06907 11008 42751 27756 53498 18602S 70659 90665 15053 21916 81825 44394 42880
7 99562 72905 56420 69994 98872 31016 71194 18738 44013 48840 63213 21069 10634 12952
8 96301 91977 05463 07972 18876 20922 94595 56869 69014 60045 18425 84903 42508 32307
-L
9 89579 14342 63661 10228 17453 18103 57740 84378 25331 12566 58678 44947 05585 56941
10 85475 36857 53342 53988 53060 59533 38867 62300 08158 17983 16439 11458 18593 64952
IM
11 28918 69578 88231 33276 70997 79936 56865 05859 90106 31595 01547 85590 97610 78188
12 63553 40961 48235 03427 49626 69445 18663 72695 52180
A 20847 12234 90511 33703 90322
Tabla de números aleatorios
13 09429 93969 52636 92737 88974 33488 36320 17617 30015 08272 84115 27156 30613 74952
14 10365 61129 87529 85689 48237 52267 67689 93394 01511 26358 85104 20285 29975 89868
15 07119 97336 71048 08178 77233 13916 47564 81056 97735 85977 29372 74461 28551 90707
16 51085 12765 51821 51259 77452 16308 60756 92144 49442 53900 70960 63990 75601 40719
17 02368 21382 52404 60268 89368 19885 55322 44819 01188 65255 64835 44919 05944 55157
18 01011 54092 33362 94904 31273 04146 18594 29852 71585 85030 51132 01915 92747 64951
AD
19 52162 53916 46369 58586 23216 14513 83149 98736 23495 64350 94738 17752 35156 35749
20 07056
E
97628 33787 09998 42698 06691 76988 13602 51851 46104 88916 19509 25625 58104
21 48663 91245 85828 14346 09172 30168 90229 04734 59193 22178 30421 61666 99904 32812
22 54164 58492 22421 74103 47070 25306 76468 26384 58151 06646 21524 15227 96909 44592
23 32639 32363 05597 24200 13363 38005 94342 28728 35806 06912 17012 64161 18296 22851
24 29334 37001 87637 87308 58731 00256 45834 15398 46557 41135 10367 07684 36188 18510
25 02488 33062 28834 07351 19731 92420 60952 61280 50001 67658 32586 86679 50720 94953
26 81525 72295 04839 96423 24878 82651 66566 14778 76797 14780 13300 87074 79666 95725
27 29676 20591 68086 26432 46901 20849 89768 81536 86645 12659 92259 57102 80428 25280
28 00742 57392 39064 66432 84673 40027 32832 61362 98947 96067 64760 64584 96096 98253
29 05366 04213 25669 26422 44407 44048 37937 63904 45766 66134 75470 66520 34693 90449
30 91921 26418 64117 94305 26766 25940 39972 22209 71500 64568 91402 42416 07844 69618
31 00582 04711 87917 77341 42206 35126 74087 99547 81817 42607 43808 76655 62028 76630
32 00725 69884 62797 56170 86324 88072 76222 36086 84637 93161 76038 65855 77919 88006
33 69011 65795 95876 55293 18988 27354 26575 08625 40801 59920 29841 80150 12777 48501
34 25976 57948 29888 88604 67917 48708 18912 82271 65424 69774 33611 54262 85963 03547
35 09763 83473 73577 12908 30833 18317 28290 35797 05998 41688 34952 37888 38917 88050
20
22
-I I
APÉNDICE A. TABLAS 305
A
IM
S -L
PU
M
CA
E
AD
-I I
22
20
Tabla: Probabilidades Binomiales
UD
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 EP0,80 0,90 0,95
2 0 1 0,9801 0,9025 0,8100 0,7225 0,6400 0,5625 0,4900 0,4225 0,3600 0,3025 0,2500 0,1600 0,0900 0,0400 0,0100 0,0025
1 2 0,0198 0,0950 0,1800 0,2550 0,3200 0,3750 0,4200 0,4550 0,4800 0,4950 0,5000 0,4800 0,4200 0,3200 0,1800 0,0950
2 1 0,0001 0,0025 0,0100 0,0225 0,0400 0,0625 0,0900 0,1225 0,1600 0,2025 0,2500 0,3600 0,4900 0,6400 0,8100 0,9025
3 0 1 0,9703 0,8574 0,7290 0,6141 0,5120 0,4219 0,3430 0,2746 0,2160 0,1664 0,1250 0,0640 0,0270 0,0080 0,0010 0,0001
1 3 0,0294 0,1354 0,2430 0,3251 0,3840 0,4219 0,4410 0,4436 0,4320 0,4084 0,3750 0,2880 0,1890 0,0960 0,0270 0,0071
2 3 0,0003 0,0071 0,0270 0,0574 0,0960 0,1406 0,1890 0,2389 0,2880 0,3341 0,3750 0,4320 0,4410 0,3840 0,2430 0,1354
3 1 0,0001 0,0010 0,0034 0,0080 0,0156 0,0270 0,0429 0,0640 0,0911 0,1250 0,2160 0,3430 0,5120 0,7290 0,8574
4 0 1 0,9606 0,8145 0,6561 0,5220 0,4096 0,3164 0,2401 0,1785 0,1296 0,0915 0,0625 0,0256 0,0081 0,0016 0,0001
1 4 0,0388 0,1715 0,2916 0,3685 0,4096 0,4219 0,4116 0,3845 0,3456 0,2995 0,2500 0,1536 0,0756 0,0256 0,0036 0,0005
2 6 0,0006 0,0135 0,0486 0,0975 0,1536 0,2109 0,2646 0,3105 0,3456 0,3675 0,3750 0,3456 0,2646 0,1536 0,0486 0,0135
CA
3 4 0,0005 0,0036 0,0115 0,0256 0,0469 0,0756 0,1115 0,1536 0,2005 0,2500 0,3456 0,4116 0,4096 0,2916 0,1715
4 1 0,0001 0,0005 0,0016 0,0039 0,0081 0,0150 M
0,0256 0,0410 0,0625 0,1296 0,2401 0,4096 0,6561 0,8145
5 0 1 0,9510 0,7738 0,5905 0,4437 0,3277 0,2373 0,1681 0,1160 0,0778 0,0503 0,0313 0,0102 0,0024 0,0003
PU
1 5 0,0480 0,2036 0,3281 0,3915 0,4096 0,3955 0,3601 0,3124 0,2592 0,2059 0,1563 0,0768 0,0284 0,0064 0,0005
2 10 0,0010 0,0214 0,0729 0,1382 0,2048 0,2637 0,3087 0,3364 0,3456
S
0,3369 0,3125
-L 0,2304 0,1323 0,0512 0,0081 0,0011
3 10 0,0011 0,0081 0,0244 0,0512 0,0879 0,1323 0,1811 0,2304 0,2757 0,3125 0,3456 0,3087 0,2048 0,0729 0,0214
4 5 0,0005 0,0022 0,0064 0,0146 0,0284 0,0488 0,0768 0,1128 0,1563 0,2592 0,3602 0,4096 0,3280 0,2036
IM
5 1 0,0001 0,0003 0,0010 0,0024 0,0053 0,0102 0,0185 0,0313 0,0778
A 0,1681 0,3277 0,5905 0,7738
6 0 1 0,9415 0,7351 0,5314 0,3771 0,2621 0,1780 0,1176 0,0754 0,0467 0,0277 0,0156 0,0041 0,0007 0,0001
1 6 0,0571 0,2321 0,3543 0,3993 0,3932 0,3560 0,3025 0,2437 0,1866 0,1359 0,0938 0,0369 0,0102 0,0015 0,0001
2 15 0,0014 0,0305 0,0984 0,1762 0,2458 0,2966 0,3241 0,3280 0,3110 0,2780 0,2344 0,1382 0,0595 0,0154 0,0012 0,0001
3 20 0,0021 0,0146 0,0415 0,0819 0,1318 0,1852 0,2355 0,2765 0,3032 0,3125 0,2765 0,1852 0,0819 0,0146 0,0021
4 15 0,0001 0,0012 0,0055 0,0154 0,0330 0,0595 0,0951 0,1382 0,1861 0,2344 0,3110 0,3241 0,2458 0,0984 0,0305
AD
5 6 0,0001 0,0004 0,0015 0,0044
E 0,0102 0,0205 0,0369 0,0609 0,0938 0,1866 0,3025 0,3932 0,3543 0,2321
6 1 0,0001 0,0002 0,0007 0,0018 0,0041 0,0083 0,0156 0,0467 0,1176 0,2621 0,5314 0,7351
7 0 1 0,9321 0,6983 0,4783 0,3206 0,2097 0,1335 0,0824 0,0490 0,0280 0,0152 0,0078 0,0016 0,0002
1 7 0,0659 0,2573 0,3720 0,3960 0,3670 0,3115 0,2471 0,1848 0,1306 0,0872 0,0547 0,0172 0,0036 0,0004
2 21 0,0020 0,0406 0,1240 0,2097 0,2753 0,3115 0,3177 0,2985 0,2613 0,2140 0,1641 0,0774 0,0250 0,0043 0,0002
3 35 0,0036 0,0230 0,0617 0,1147 0,1730 0,2269 0,2679 0,2903 0,2918 0,2734 0,1935 0,0972 0,0287 0,0026 0,0002
4 35 0,0002 0,0026 0,0109 0,0287 0,0577 0,0972 0,1442 0,1935 0,2388 0,2734 0,2903 0,2269 0,1147 0,0230 0,0036
5 21 0,0002 0,0012 0,0043 0,0115 0,0250 0,0466 0,0774 0,1172 0,1641 0,2613 0,3177 0,2753 0,1240 0,0406
6 7 0,0001 0,0004 0,0013 0,0036 0,0084 0,0172 0,0320 0,0547 0,1306 0,2471 0,3670 0,3720 0,2573
7 1 0,0001 0,0002 0,0006 0,0016 0,0037 0,0078 0,0280 0,0824 0,2097 0,4783 0,6983
8 0 1 0,9227 0,6634 0,4305 0,2725 0,1678 0,1001 0,0576 0,0319 0,0168 0,0084 0,0039 0,0007 0,0001
1 8 0,0746 0,2793 0,3826 0,3847 0,3355 0,2670 0,1977 0,1373 0,0896 0,0548 0,0313 0,0079 0,0012 0,0001
20
2 28 0,0026
22 0,0515 0,1488 0,2376 0,2936 0,3115 0,2965 0,2587 0,2090 0,1569 0,1094 0,0413 0,0100 0,0011
3 56 0,0001 0,0054 0,0331 0,0839 0,1468 0,2076 0,2541 0,2786 0,2787 0,2568 0,2188 0,1239 0,0467 0,0092 0,0004
4 70 0,0004 0,0046 0,0185 0,0459 0,0865 0,1361 0,1875 0,2322 0,2627 0,2734 0,2322 0,1361 0,0459 0,0046 0,0004
-I I
5 56 0,0004 0,0026 0,0092 0,0231 0,0467 0,0808 0,1239 0,1719 0,2188 0,2787 0,2541 0,1468 0,0331 0,0054
6 28 0,0002 0,0011 0,0038 0,0100 0,0217 0,0413 0,0703 0,1094 0,2090 0,2965 0,2936 0,1488 0,0515
7 8 0,0001 0,0004 0,0012 0,0033 0,0079 0,0164 0,0313 0,0896 0,1977 0,3355 0,3826 0,2793
8 1 0,0001 0,0002 0,0007 0,0017 0,0039 0,0168 0,0576 0,1678 0,4305 0,6634
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95
Tabla: Probabilidades Binomiales
UD
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95
EP
9 0 1 0,9135 0,6302 0,3874 0,2316 0,1342 0,0751 0,0404 0,0207 0,0101 0,0046 0,0020 0,0003
1 9 0,0830 0,2985 0,3874 0,3679 0,3020 0,2253 0,1556 0,1004 0,0605 0,0339 0,0176 0,0035 0,0004
2 36 0,0034 0,0629 0,1722 0,2597 0,3020 0,3003 0,2668 0,2162 0,1612 0,1110 0,0703 0,0212 0,0039 0,0003
3 84 0,0001 0,0077 0,0446 0,1069 0,1762 0,2336 0,2668 0,2716 0,2508 0,2119 0,1641 0,0743 0,0210 0,0028 0,0001
4 126 0,0006 0,0074 0,0283 0,0661 0,1168 0,1715 0,2194 0,2508 0,2600 0,2461 0,1672 0,0735 0,0165 0,0008
5 126 0,0008 0,0050 0,0165 0,0389 0,0735 0,1181 0,1672 0,2128 0,2461 0,2508 0,1715 0,0661 0,0074 0,0006
6 84 0,0001 0,0006 0,0028 0,0087 0,0210 0,0424 0,0743 0,1160 0,1641 0,2508 0,2668 0,1762 0,0446 0,0077
7 36 0,0000 0,0003 0,0012 0,0039 0,0098 0,0212 0,0407 0,0703 0,1612 0,2668 0,3020 0,1722 0,0629
8 9 0,0001 0,0004 0,0013 0,0035 0,0083 0,0176 0,0605 0,1556 0,3020 0,3874 0,2985
9 1 0,0001 0,0003
CA 0,0008 0,0020 0,0101 0,0404 0,1342 0,3874 0,6302
10 0 1 0,9044 0,5987 0,3487 0,1969 0,1074 0,0563 0,0282 0,0135 0,0060 0,0025 0,0010 0,0001
1 10 0,0914 0,3151 0,3874 0,3474 0,2684 0,1877 0,1211 0,0725 0,0403
M 0,0207 0,0098 0,0016 0,0001
2 45 0,0042 0,0746 0,1937 0,2759 0,3020 0,2816 0,2335 0,1757 0,1209 0,0763 0,0439 0,0106 0,0014 0,0001
3 120 0,0001 0,0105 0,0574 0,1298 0,2013 0,2503 0,2668 0,2522 0,2150 0,1665 0,1172 0,0425 0,0090 0,0008
PU
4 210 0,0010 0,0112 0,0401 0,0881 0,1460 0,2001 0,2377 0,2508 0,2384
S 0,2051 0,1115 0,0368 0,0055 0,0001
5 252 0,0001 0,0015 0,0085 0,0264 0,0584 0,1029 0,1536 0,2007 0,2340 0,2461
-L 0,2007 0,1029 0,0264 0,0015 0,0001
6 210 0,0001 0,0012 0,0055 0,0162 0,0368 0,0689 0,1115 0,1596 0,2051
IM 0,2508 0,2001 0,0881 0,0112 0,0010
7 120 0,0001 0,0008 0,0031 0,0090 0,0212 0,0425 0,0746 0,1172 0,2150 0,2668 0,2013 0,0574 0,0105
8 45 0,0001 0,0004 0,0014 0,0043 0,0106 0,0229 0,0439 0,1209
A 0,2335 0,3020 0,1937 0,0746
9 10 0,0001 0,0005 0,0016 0,0042 0,0098 0,0403 0,1211 0,2684 0,3874 0,3151
10 1 0,0001 0,0003 0,0010 0,0060 0,0282 0,1074 0,3487 0,5987
11 0 1 0,8953 0,5688 0,3138 0,1673 0,0859 0,0422 0,0198 0,0088 0,0036 0,0014 0,0005 0,0000
1 11 0,0995 0,3293 0,3835 0,3248 0,2362 0,1549 0,0932 0,0518 0,0266 0,0125 0,0054 0,0007 0,0000
AD
2 55 0,0050 0,0867 0,2131 0,2866 0,2953 0,2581 0,1998 0,1395 0,0887 0,0513 0,0269 0,0052 0,0005
3 165 0,0002 0,0137 0,0710 0,1517 E
0,2215 0,2581 0,2568 0,2254 0,1774 0,1259 0,0806 0,0234 0,0037 0,0002
4 330 0,0014 0,0158 0,0536 0,1107 0,1721 0,2201 0,2428 0,2365 0,2060 0,1611 0,0701 0,0173 0,0017
5 462 0,0001 0,0025 0,0132 0,0388 0,0803 0,1321 0,1830 0,2207 0,2360 0,2256 0,1471 0,0566 0,0097 0,0003
6 462 0,0003 0,0023 0,0097 0,0268 0,0566 0,0985 0,1471 0,1931 0,2256 0,2207 0,1321 0,0388 0,0025 0,0001
7 330 0,0003 0,0017 0,0064 0,0173 0,0379 0,0701 0,1128 0,1611 0,2365 0,2201 0,1107 0,0158 0,0014
8 165 0,0002 0,0011 0,0037 0,0102 0,0234 0,0462 0,0806 0,1774 0,2568 0,2215 0,0710 0,0137
9 55 0,0001 0,0005 0,0018 0,0052 0,0126 0,0269 0,0887 0,1998 0,2953 0,2131 0,0867
10 11 0,0000 0,0002 0,0007 0,0021 0,0054 0,0266 0,0932 0,2362 0,3835 0,3293
11 1 0,0000 0,0002 0,0005 0,0036 0,0198 0,0859 0,3138 0,5688
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95
20
22
-I I
Tabla: Probabilidades Binomiales
UD
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95
EP
12 0 1 0,8864 0,5404 0,2824 0,1422 0,0687 0,0317 0,0138 0,0057 0,0022 0,0008 0,0002
1 12 0,1074 0,3413 0,3766 0,3012 0,2062 0,1267 0,0712 0,0368 0,0174 0,0075 0,0029 0,0003
2 66 0,0060 0,0988 0,2301 0,2924 0,2835 0,2323 0,1678 0,1088 0,0639 0,0339 0,0161 0,0025 0,0002
3 220 0,0002 0,0173 0,0852 0,1720 0,2362 0,2581 0,2397 0,1954 0,1419 0,0923 0,0537 0,0125 0,0015 0,0001
4 495 0,0021 0,0213 0,0683 0,1329 0,1936 0,2311 0,2367 0,2128 0,1700 0,1208 0,0420 0,0078 0,0005
5 792 0,0002 0,0038 0,0193 0,0532 0,1032 0,1585 0,2039 0,2270 0,2225 0,1934 0,1009 0,0291 0,0033 0,0000
6 924 0,0005 0,0040 0,0155 0,0401 0,0792 0,1281 0,1766 0,2124 0,2256 0,1766 0,0792 0,0155 0,0005
7 792 0,0000 0,0006 0,0033 0,0115 0,0291 0,0591 0,1009 0,1489 0,1934 0,2270 0,1585 0,0532 0,0038 0,0002
8 495 0,0001 0,0005 0,0024 0,0078 0,0199 0,0420 0,0762 0,1208 0,2128 0,2311 0,1329 0,0213 0,0021
9 220 0,0001 0,0004 0,0015 0,0048 0,0125 0,0277 0,0537 0,1419 0,2397 0,2362 0,0852 0,0173
10 66 0,0002 0,0008 0,0025 0,0068 0,0161 0,0639 0,1678 0,2835 0,2301 0,0988
CA
11 12 0,0001 0,0003
M 0,0010 0,0029 0,0174 0,0712 0,2062 0,3766 0,3413
12 1 0,0001 0,0002 0,0022 0,0138 0,0687 0,2824 0,5404
13 0 1 0,8775 0,5133 0,2542 0,1209 0,0550 0,0238 0,0097 0,0037 0,0013 0,0004 0,0001
PU
1 13 0,1152 0,3512 0,3672 0,2774 0,1787 0,1029 0,0540 0,0259 0,0113 0,0045
S 0,0016 0,0001
2 78 0,0070 0,1109 0,2448 0,2937 0,2680 0,2059 0,1388 0,0836 0,0453 0,0220 -L0,0095 0,0012 0,0001
3 286 0,0003 0,0214 0,0997 0,1900 0,2457 0,2517 0,2181 0,1651 0,1107 0,0660 0,0349
IM 0,0065 0,0006
4 715 0,0028 0,0277 0,0838 0,1535 0,2097 0,2337 0,2222 0,1845 0,1350 0,0873 0,0243 0,0034 0,0001
5 1287 0,0003 0,0055 0,0266 0,0691 0,1258 0,1803 0,2154 0,2214 0,1989 0,1571A 0,0656 0,0142 0,0011
6 1716 0,0008 0,0063 0,0230 0,0559 0,1030 0,1546 0,1968 0,2169 0,2095 0,1312 0,0442 0,0058 0,0001
7 1716 0,0001 0,0011 0,0058 0,0186 0,0442 0,0833 0,1312 0,1775 0,2095 0,1968 0,1030 0,0230 0,0008
8 1287 0,0001 0,0011 0,0047 0,0142 0,0336 0,0656 0,1089 0,1571 0,2214 0,1803 0,0691 0,0055 0,0003
9 715 0,0001
AD 0,0009 0,0034 0,0101 0,0243 0,0495 0,0873 0,1845 0,2337 0,1535 0,0277 0,0028
10 286 0,0001 0,0006 0,0022 0,0065 0,0162 0,0349 0,1107 0,2181 0,2457 0,0997 0,0214
11 78 E 0,0001 0,0003 0,0012 0,0036 0,0095 0,0453 0,1388 0,2680 0,2448 0,1109
12 13 0,0001 0,0005 0,0016 0,0113 0,0540 0,1787 0,3672 0,3512
13 1 0,0001 0,0013 0,0097 0,0550 0,2542 0,5133
14 0 1 0,8687 0,4877 0,2288 0,1028 0,0440 0,0178 0,0068 0,0024 0,0008 0,0002 0,0001
1 14 0,1229 0,3593 0,3559 0,2539 0,1539 0,0832 0,0407 0,0181 0,0073 0,0027 0,0009 0,0001
2 91 0,0081 0,1229 0,2570 0,2912 0,2501 0,1802 0,1134 0,0634 0,0317 0,0141 0,0056 0,0005
3 364 0,0003 0,0259 0,1142 0,2056 0,2501 0,2402 0,1943 0,1366 0,0845 0,0462 0,0222 0,0033 0,0002
4 1001 0,0037 0,0349 0,0998 0,1720 0,2202 0,2290 0,2022 0,1549 0,1040 0,0611 0,0136 0,0014 0,0000
5 2002 0,0004 0,0078 0,0352 0,0860 0,1468 0,1963 0,2178 0,2066 0,1701 0,1222 0,0408 0,0066 0,0003
6 3003 0,0013 0,0093 0,0322 0,0734 0,1262 0,1759 0,2066 0,2088 0,1833 0,0918 0,0232 0,0020
7 3431 0,0002 0,0019 0,0092 0,0280 0,0618 0,1082 0,1574 0,1952 0,2094 0,1574 0,0618 0,0092 0,0002
8 3003 0,0003 0,0020 0,0082 0,0232 0,0510 0,0918 0,1398 0,1833 0,2066 0,1262 0,0322 0,0013
20
9 2002 22 0,0003 0,0018 0,0066 0,0183 0,0408 0,0762 0,1222 0,2066 0,1963 0,0860 0,0078 0,0004
10 1001 0,0000 0,0003 0,0014 0,0049 0,0136 0,0312 0,0611 0,1549 0,2290 0,1720 0,0349 0,0037
11 364 0,0002 0,0010 0,0033 0,0093 0,0222 0,0845 0,1943 0,2501 0,1142 0,0259
-I I
12 91 0,0001 0,0005 0,0019 0,0056 0,0317 0,1134 0,2501 0,2570 0,1229
13 14 0,0001 0,0002 0,0009 0,0073 0,0407 0,1539 0,3559 0,3593
14 1 0,0001 0,0008 0,0068 0,0440 0,2288 0,4877
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95
Tabla: Probabilidades Binomiales
UD
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95
EP
15 0 1 0,8601 0,4633 0,2059 0,0874 0,0352 0,0134 0,0047 0,0016 0,0005 0,0001
1 15 0,1303 0,3658 0,3432 0,2312 0,1319 0,0668 0,0305 0,0126 0,0047 0,0016 0,0005
2 105 0,0092 0,1348 0,2669 0,2856 0,2309 0,1559 0,0916 0,0476 0,0219 0,0090 0,0032 0,0003
3 455 0,0004 0,0307 0,1285 0,2184 0,2501 0,2252 0,1700 0,1110 0,0634 0,0318 0,0139 0,0016 0,0001
4 1365 0,0049 0,0428 0,1156 0,1876 0,2252 0,2186 0,1792 0,1268 0,0780 0,0417 0,0074 0,0006
5 3003 0,0006 0,0105 0,0449 0,1032 0,1651 0,2061 0,2123 0,1859 0,1404 0,0916 0,0245 0,0030 0,0001
6 5005 0,0000 0,0019 0,0132 0,0430 0,0917 0,1472 0,1906 0,2066 0,1914 0,1527 0,0612 0,0116 0,0007
7 6435 0,0003 0,0030 0,0138 0,0393 0,0811 0,1319 0,1771 0,2013 0,1964 0,1181 0,0348 0,0035
8 6435 0,0005 0,0035 0,0131 0,0348 0,0710 0,1181 0,1647 0,1964 0,1771 0,0811 0,0138 0,0003
9 5005 0,0001 0,0007 0,0034 0,0116 0,0298 0,0612 0,1048 0,1527 0,2066 0,1472 0,0430 0,0019 0,0000
10 3003 0,0001 0,0007 0,0030 0,0096 0,0245 0,0515 0,0916 0,1859 0,2061 0,1032 0,0105 0,0006
CA
11 1365 0,0001 0,0006 0,0024 M 0,0074 0,0191 0,0417 0,1268 0,2186 0,1876 0,0428 0,0049
12 455 0,0001 0,0004 0,0016 0,0052 0,0139 0,0634 0,1700 0,2501 0,1285 0,0307
13 105 0,0001 0,0003 0,0010 0,0032 0,0219 0,0916 0,2309 0,2669 0,1348
PU
14 15 S0,0001 0,0005 0,0047 0,0305 0,1319 0,3432 0,3658
15 1 -L 0,0005 0,0047 0,0352 0,2059 0,4633
16 0 1 0,8515 0,4401 0,1853 0,0743 0,0281 0,0100 0,0033 0,0010 0,0003 0,0001 IM
1 16 0,1376 0,3706 0,3294 0,2097 0,1126 0,0535 0,0228 0,0087 0,0030 0,0009 0,0002
2 120 0,0104 0,1463 0,2745 0,2775 0,2111 0,1336 0,0732 0,0353 0,0150 0,0056 A
0,0018 0,0001
3 560 0,0005 0,0359 0,1423 0,2285 0,2463 0,2079 0,1465 0,0888 0,0468 0,0215 0,0085 0,0008
4 1820 0,0061 0,0514 0,1311 0,2001 0,2252 0,2040 0,1553 0,1014 0,0572 0,0278 0,0040 0,0002
5 4368 0,0008 0,0137 0,0555 0,1201 0,1802 0,2099 0,2008 0,1623 0,1123 0,0667 0,0142 0,0013
6 8008 0,0001 0,0028 0,0180 0,0550
AD 0,1101 0,1649 0,1982 0,1983 0,1684 0,1222 0,0392 0,0056 0,0002
7 11 439 0,0004 0,0045 0,0197 0,0524 0,1010 0,1524 0,1889 0,1969 0,1745 0,0839 0,0185 0,0012
8 12 868 0,0001 0,0009 0,0055
E 0,0197 0,0487 0,0923 0,1416 0,1812 0,1964 0,1416 0,0487 0,0055 0,0001
9 11 438 0,0001 0,0012 0,0058 0,0185 0,0442 0,0839 0,1318 0,1745 0,1889 0,1009 0,0197 0,0004
10 8007 0,0002 0,0014 0,0056 0,0167 0,0392 0,0755 0,1222 0,1983 0,1649 0,0550 0,0028 0,0001
11 4367 0,0002 0,0013 0,0049 0,0142 0,0337 0,0666 0,1622 0,2098 0,1200 0,0137 0,0008
12 1820 0,0002 0,0011 0,0040 0,0115 0,0278 0,1014 0,2040 0,2001 0,0514 0,0061
13 560 0,0002 0,0008 0,0029 0,0085 0,0468 0,1465 0,2463 0,1423 0,0359
14 120 0,0001 0,0005 0,0018 0,0150 0,0732 0,2111 0,2745 0,1463
15 16 0,0001 0,0002 0,0030 0,0228 0,1126 0,3294 0,3706
16 1 0,0003 0,0033 0,0281 0,1853 0,4401
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95
20
22
-I I
Tabla: Probabilidades Binomiales
UD
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95
EP
19 0 1 0,8262 0,3774 0,1351 0,0456 0,0144 0,0042 0,0011 0,0003 0,0001
1 19 0,1586 0,3774 0,2852 0,1529 0,0685 0,0268 0,0093 0,0029 0,0008 0,0002
2 171 0,0144 0,1787 0,2852 0,2428 0,1540 0,0803 0,0358 0,0138 0,0046 0,0013 0,0003
3 969 0,0008 0,0533 0,1796 0,2428 0,2182 0,1517 0,0869 0,0422 0,0175 0,0062 0,0018 0,0001
4 3876 0,0112 0,0798 0,1714 0,2182 0,2023 0,1491 0,0909 0,0467 0,0203 0,0074 0,0005
5 11 628 0,0018 0,0266 0,0907 0,1636 0,2023 0,1916 0,1468 0,0933 0,0497 0,0222 0,0024 0,0001
6 27 130 0,0002 0,0069 0,0374 0,0955 0,1574 0,1916 0,1844 0,1451 0,0949 0,0517 0,0085 0,0005
7 50 383 0,0014 0,0122 0,0443 0,0974 0,1525 0,1844 0,1797 0,1443 0,0961 0,0237 0,0022 0,0000
8 75 574 0,0002 0,0032 0,0166 0,0487 0,0980 0,1489 0,1797 0,1770 0,1441 0,0532 0,0077 0,0003
9 92 368 0,0007 0,0051 0,0198 0,0514 0,0980 0,1464 0,1770 0,1762 0,0976 0,0220 0,0013
10 92 368 0,0001 0,0013 0,0066 0,0220 0,0528 0,0976 0,1448 0,1762 0,1464 0,0514 0,0051
CA
11 75 574 0,0003 0,0018 0,0077 0,0233M 0,0532 0,0970 0,1441 0,1797 0,0980 0,0166 0,0002
12 50 382 0,0000 0,0004 0,0022 0,0083 0,0237 0,0529 0,0961 0,1797 0,1525 0,0443 0,0014
13 27 129 0,0001 0,0005 0,0024 0,0085 0,0233 0,0517 0,1451 0,1916 0,0955 0,0069 0,0002
PU
14 11 627 0,0001 0,0006 0,0024 S 0,0082 0,0222 0,0933 0,1916 0,1636 0,0266 0,0018
15 3876 0,0001 0,0005 0,0022
-L 0,0074 0,0467 0,1491 0,2182 0,0798 0,0112
16 969 0,0001 0,0005 0,0018 0,0175 0,0869 0,2182 0,1796 0,0533
17 171 0,0001 0,0003 0,0046 0,0358 0,1540 0,2852 0,1787
IM
18 19 A 0,0008 0,0093 0,0685 0,2852 0,3774
19 1 0,0001 0,0011 0,0144 0,1351 0,3774
20 0 1 0,8179 0,3585 0,1216 0,0388 0,0115 0,0032 0,0008 0,0002
1 20 0,1652 0,3774 0,2702 0,1368 0,0576 0,0211 0,0068 0,0020 0,0005 0,0001
2 190 0,0159 0,1887 0,2852 0,2293
AD 0,1369 0,0669 0,0278 0,0100 0,0031 0,0008 0,0002
3 1140 0,0010 0,0596 0,1901 0,2428 0,2054 0,1339 0,0716 0,0323 0,0123 0,0040 0,0011 0,0000
4 4845 0,0000 0,0133 0,0898 0,1821 0,2182
E 0,1897 0,1304 0,0738 0,0350 0,0139 0,0046 0,0003
5 15 504 0,0022 0,0319 0,1028 0,1746 0,2023 0,1789 0,1272 0,0746 0,0365 0,0148 0,0013
6 38 759 0,0003 0,0089 0,0454 0,1091 0,1686 0,1916 0,1712 0,1244 0,0746 0,0370 0,0049 0,0002
7 77 518 0,0020 0,0160 0,0545 0,1124 0,1643 0,1844 0,1659 0,1221 0,0739 0,0146 0,0010
8 125 960 0,0004 0,0046 0,0222 0,0609 0,1144 0,1613 0,1797 0,1623 0,1201 0,0355 0,0039 0,0001
9 167 940 0,0001 0,0011 0,0074 0,0271 0,0654 0,1158 0,1597 0,1770 0,1602 0,0710 0,0120 0,0005
10 184 734 0,0002 0,0020 0,0099 0,0308 0,0686 0,1171 0,1593 0,1762 0,1171 0,0308 0,0020
11 167 940 0,0005 0,0030 0,0120 0,0336 0,0710 0,1185 0,1602 0,1597 0,0654 0,0074 0,0001
12 125 954 0,0001 0,0008 0,0039 0,0136 0,0355 0,0727 0,1201 0,1797 0,1144 0,0222 0,0004
13 77 510 0,0002 0,0010 0,0045 0,0146 0,0366 0,0739 0,1659 0,1642 0,0545 0,0020
14 38 755 0,0002 0,0012 0,0049 0,0150 0,0370 0,1244 0,1916 0,1091 0,0089 0,0003
15 15 502 20 0,0003 0,0013 0,0049 0,0148 0,0746 0,1788 0,1745 0,0319 0,0022
16 4844 0,0000 0,0003 0,0013 0,0046 0,0350 0,1304 0,2182 0,0898 0,0133
17 1140 0,0000 0,0002 0,0011 0,0123 0,0716 0,2054 0,1901 0,0596
22
18 190 -I I 0,0002 0,0031 0,0278 0,1369 0,2852 0,1887
19 20 0,0005 0,0068 0,0576 0,2702 0,3774
20 1 0,0008 0,0115 0,1216 0,3585
n
n x x 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,60 0,70 0,80 0,90 0,95
APÉNDICE A. TABLAS 311
λ
x 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
0 0.9048 0.8187 0.7408 0.6703 0.6065 0.5488 0.4966 0.4493 0.4066 0.3679
1 0.0905 0.1637 0.2222 0.2681 0.3033 0.3293 0.3476 0.3595 0.3659 0.3679
2 0.0045 0.0164 0.0333 0.0536 0.0758 0.0988 0.1217 0.1438 0.1647 0.1839
3 0.0002 0.0011 0.0033 0.0072 0.0126 0.0198 0.0284 0.0383 0.0494 0.0613
4 0.0000 0.0001 0.0003 0.0007 0.0016 0.0030 0.0050 0.0077 0.0111 0.0153
5 0.0000 0.0000 0.0000 0.0001 0.0002 0.0004 0.0007 0.0012 0.0020 0.0031
EP
6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0003 0.0005
UD
7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
λ
A
x 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0
IM
0 0.3329 0.3012 0.2725 0.2466 0.2231 0.2019 0.1827 0.1653 0.1496 0.1353
1 0.3662 0.3614 0.3543 0.3452 0.3347 0.3230 0.3106 0.2975 0.2842 0.2707
-L
2 0.2014 0.2169 0.2303 0.2417 0.2510 0.2584 0.2640 0.2678 0.2700 0.2707
S
PU
3 0.0738 0.0867 0.0998 0.1128 0.1255 0.1378 0.1496 0.1607 0.1710 0.1804
4 0.0203 0.0260 0.0324 0.0395 0.0471 0.0551 0.0636 0.0723 0.0812 0.0902
M
5 0.0045 0.0062 0.0084 0.0111 0.0141 0.0176 0.0216 0.0260 0.0309 0.0361
CA
6 0.0008 0.0012 0.0018 0.0026 0.0035 0.0047 0.0061 0.0078 0.0098 0.0120
7 0.0001 0.0002 0.0003 0.0005 0.0008 0.0011 0.0015 0.0020 0.0027 0.0034
8 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0003 0.0005 0.0006 0.0009
9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002
λ
x 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0
0 0.1225 0.1108 0.1003 0.0907 0.0821 0.0743 0.0672 0.0608 0.0550 0.0498
1 0.2572 0.2438 0.2306 0.2177 0.2052 0.1931 0.1815 0.1703 0.1596 0.1494
E
2 0.2700 0.2681 0.2652 0.2613 0.2565 0.2510 0.2450 0.2384 0.2314 0.2240
AD
3 0.1890 0.1966 0.2033 0.2090 0.2138 0.2176 0.2205 0.2225 0.2237 0.2240
4 0.0992 0.1082 0.1169 0.1254 0.1336 0.1414 0.1488 0.1557 0.1622 0.1680
5 0.0417 0.0476 0.0538 0.0602 0.0668 0.0735 0.0804 0.0872 0.0940 0.1008
6 0.0146 0.0174 0.0206 0.0241 0.0278 0.0319 0.0362 0.0407 0.0455 0.0504
7 0.0044 0.0055 0.0068 0.0083 0.0099 0.0118 0.0139 0.0163 0.0188 0.0216
8 0.0011 0.0015 0.0019 0.0025 0.0031 0.0038 0.0047 0.0057 0.0068 0.0081
9 0.0003 0.0004 0.0005 0.0007 0.0009 0.0011 0.0014 0.0018 0.0022 0.0027
10 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 0.0006 0.0008
11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0002
12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
-I I
22
20
APÉNDICE A. TABLAS 312
λ
x 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4.0
0 0.0450 0.0408 0.0369 0.0334 0.0302 0.0273 0.0247 0.0224 0.0202 0.0183
1 0.1397 0.1304 0.1217 0.1135 0.1057 0.0984 0.0915 0.0850 0.0789 0.0733
2 0.2165 0.2087 0.2008 0.1929 0.1850 0.1771 0.1692 0.1615 0.1539 0.1465
3 0.2237 0.2226 0.2209 0.2186 0.2158 0.2125 0.2087 0.2046 0.2001 0.1954
4 0.1733 0.1781 0.1823 0.1858 0.1888 0.1912 0.1931 0.1944 0.1951 0.1954
5 0.1075 0.1140 0.1203 0.1264 0.1322 0.1377 0.1429 0.1477 0.1522 0.1563
EP
6 0.0555 0.0608 0.0662 0.0716 0.0771 0.0826 0.0881 0.0936 0.0989 0.1042
7 0.0246 0.0278 0.0312 0.0348 0.0385 0.0425 0.0466 0.0508 0.0551 0.0595
UD
8 0.0095 0.0111 0.0129 0.0148 0.0169 0.0191 0.0215 0.0241 0.0269 0.0298
9 0.0033 0.0040 0.0047 0.0056 0.0066 0.0076 0.0089 0.0102 0.0116 0.0132
10 0.0010 0.0013 0.0016 0.0019 0.0023 0.0028 0.0033 0.0039 0.0045 0.0053
11 0.0003 0.0004 0.0005 0.0006 0.0007 0.0009 0.0011 0.0013 0.0016 0.0019
A
12 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005 0.0006
IM
13 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002
14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
S-L
PU
λ
M
x 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 5.0
CA
0 0.0166 0.0150 0.0136 0.0123 0.0111 0.0101 0.0091 0.0082 0.0074 0.0067
1 0.0679 0.0630 0.0583 0.0540 0.0500 0.0462 0.0427 0.0395 0.0365 0.0337
2 0.1393 0.1323 0.1254 0.1188 0.1125 0.1063 0.1005 0.0948 0.0894 0.0842
3 0.1904 0.1852 0.1798 0.1743 0.1687 0.1631 0.1574 0.1517 0.1460 0.1404
4 0.1951 0.1944 0.1933 0.1917 0.1898 0.1875 0.1849 0.1820 0.1789 0.1755
5 0.1600 0.1633 0.1662 0.1687 0.1708 0.1725 0.1738 0.1747 0.1753 0.1755
6 0.1093 0.1143 0.1191 0.1237 0.1281 0.1323 0.1362 0.1398 0.1432 0.1462
7 0.0640 0.0686 0.0732 0.0778 0.0824 0.0869 0.0914 0.0959 0.1002 0.1044
8 0.0328 0.0360 0.0393 0.0428 0.0463 0.0500 0.0537 0.0575 0.0614 0.0653
9 0.0150 0.0168 0.0188 0.0209 0.0232 0.0255 0.0281 0.0307 0.0334 0.0363
E
10 0.0061 0.0071 0.0081 0.0092 0.0104 0.0118 0.0132 0.0147 0.0164 0.0181
AD
11 0.0023 0.0027 0.0032 0.0037 0.0043 0.0049 0.0056 0.0064 0.0073 0.0082
12 0.0008 0.0009 0.0011 0.0013 0.0016 0.0019 0.0022 0.0026 0.0030 0.0034
13 0.0002 0.0003 0.0004 0.0005 0.0006 0.0007 0.0008 0.0009 0.0011 0.0013
14 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005
15 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002
-I I
22
20
APÉNDICE A. TABLAS 313
λ
x 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 6.0
0 0.0061 0.0055 0.0050 0.0045 0.0041 0.0037 0.0033 0.0030 0.0027 0.0025
1 0.0311 0.0287 0.0265 0.0244 0.0225 0.0207 0.0191 0.0176 0.0162 0.0149
2 0.0793 0.0746 0.0701 0.0659 0.0618 0.0580 0.0544 0.0509 0.0477 0.0446
3 0.1348 0.1293 0.1239 0.1185 0.1133 0.1082 0.1033 0.0985 0.0938 0.0892
4 0.1719 0.1681 0.1641 0.1600 0.1558 0.1515 0.1472 0.1428 0.1383 0.1339
5 0.1753 0.1748 0.1740 0.1728 0.1714 0.1697 0.1678 0.1656 0.1632 0.1606
EP
6 0.1490 0.1515 0.1537 0.1555 0.1571 0.1584 0.1594 0.1601 0.1605 0.1606
7 0.1086 0.1125 0.1163 0.1200 0.1234 0.1267 0.1298 0.1326 0.1353 0.1377
UD
8 0.0692 0.0731 0.0771 0.0810 0.0849 0.0887 0.0925 0.0962 0.0998 0.1033
9 0.0392 0.0423 0.0454 0.0486 0.0519 0.0552 0.0586 0.0620 0.0654 0.0688
10 0.0200 0.0220 0.0241 0.0262 0.0285 0.0309 0.0334 0.0359 0.0386 0.0413
11 0.0093 0.0104 0.0116 0.0129 0.0143 0.0157 0.0173 0.0190 0.0207 0.0225
A
12 0.0039 0.0045 0.0051 0.0058 0.0065 0.0073 0.0082 0.0092 0.0102 0.0113
IM
13 0.0015 0.0018 0.0021 0.0024 0.0028 0.0032 0.0036 0.0041 0.0046 0.0052
14 0.0006 0.0007 0.0008 0.0009 0.0011 0.0013 0.0015 0.0017 0.0019 0.0022
-L
15 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005 0.0006 0.0007 0.0008 0.0009
S
PU
16 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002 0.0003 0.0003
17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001
M
CA
λ
x 6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 6.9 7.0
0 0.0022 0.0020 0.0018 0.0017 0.0015 0.0014 0.0012 0.0011 0.0010 0.0009
1 0.0137 0.0126 0.0116 0.0106 0.0098 0.0090 0.0082 0.0076 0.0070 0.0064
2 0.0417 0.0390 0.0364 0.0340 0.0318 0.0296 0.0276 0.0258 0.0240 0.0223
3 0.0848 0.0806 0.0765 0.0726 0.0688 0.0652 0.0617 0.0584 0.0552 0.0521
4 0.1294 0.1249 0.1205 0.1162 0.1118 0.1076 0.1034 0.0992 0.0952 0.0912
5 0.1579 0.1549 0.1519 0.1487 0.1454 0.1420 0.1385 0.1349 0.1314 0.1277
6 0.1605 0.1601 0.1595 0.1586 0.1575 0.1562 0.1546 0.1529 0.1511 0.1490
E
7 0.1399 0.1418 0.1435 0.1450 0.1462 0.1472 0.1480 0.1486 0.1489 0.1490
AD
8 0.1066 0.1099 0.1130 0.1160 0.1188 0.1215 0.1240 0.1263 0.1284 0.1304
9 0.0723 0.0757 0.0791 0.0825 0.0858 0.0891 0.0923 0.0954 0.0985 0.1014
10 0.0441 0.0469 0.0498 0.0528 0.0558 0.0588 0.0618 0.0649 0.0679 0.0710
11 0.0244 0.0265 0.0285 0.0307 0.0330 0.0353 0.0377 0.0401 0.0426 0.0452
12 0.0124 0.0137 0.0150 0.0164 0.0179 0.0194 0.0210 0.0227 0.0245 0.0263
13 0.0058 0.0065 0.0073 0.0081 0.0089 0.0099 0.0108 0.0119 0.0130 0.0142
14 0.0025 0.0029 0.0033 0.0037 0.0041 0.0046 0.0052 0.0058 0.0064 0.0071
15 0.0010 0.0012 0.0014 0.0016 0.0018 0.0020 0.0023 0.0026 0.0029 0.0033
16 0.0004 0.0005 0.0005 0.0006 0.0007 0.0008 0.0010 0.0011 0.0013 0.0014
17 0.0001 0.0002 0.0002 0.0002 0.0003 0.0003 0.0004 0.0004 0.0005 0.0006
-I I
18 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002
22
19 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001
20
APÉNDICE A. TABLAS 314
λ
x 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 8.0
0 0.0008 0.0007 0.0007 0.0006 0.0006 0.0005 0.0005 0.0004 0.0004 0.0003
1 0.0059 0.0054 0.0049 0.0045 0.0041 0.0038 0.0035 0.0032 0.0029 0.0027
2 0.0208 0.0194 0.0180 0.0167 0.0156 0.0145 0.0134 0.0125 0.0116 0.0107
3 0.0492 0.0464 0.0438 0.0413 0.0389 0.0366 0.0345 0.0324 0.0305 0.0286
4 0.0874 0.0836 0.0799 0.0764 0.0729 0.0696 0.0663 0.0632 0.0602 0.0573
5 0.1241 0.1204 0.1167 0.1130 0.1094 0.1057 0.1021 0.0986 0.0951 0.0916
6 0.1468 0.1445 0.1420 0.1394 0.1367 0.1339 0.1311 0.1282 0.1252 0.1221
EP
7 0.1489 0.1486 0.1481 0.1474 0.1465 0.1454 0.1442 0.1428 0.1413 0.1396
8 0.1321 0.1337 0.1351 0.1363 0.1373 0.1381 0.1388 0.1392 0.1395 0.1396
UD
9 0.1042 0.1070 0.1096 0.1121 0.1144 0.1167 0.1187 0.1207 0.1224 0.1241
10 0.0740 0.0770 0.0800 0.0829 0.0858 0.0887 0.0914 0.0941 0.0967 0.0993
11 0.0478 0.0504 0.0531 0.0558 0.0585 0.0613 0.0640 0.0667 0.0695 0.0722
12 0.0283 0.0303 0.0323 0.0344 0.0366 0.0388 0.0411 0.0434 0.0457 0.0481
13 0.0154 0.0168 0.0181 0.0196 0.0211 0.0227 0.0243 0.0260 0.0278 0.0296
A
14 0.0078 0.0086 0.0095 0.0104 0.0113 0.0123 0.0134 0.0145 0.0157 0.0169
IM
15 0.0037 0.0041 0.0046 0.0051 0.0057 0.0062 0.0069 0.0075 0.0083 0.0090
16 0.0016 0.0019 0.0021 0.0024 0.0026 0.0030 0.0033 0.0037 0.0041 0.0045
-L
17 0.0007 0.0008 0.0009 0.0010 0.0012 0.0013 0.0015 0.0017 0.0019 0.0021
S
18 0.0003 0.0003 0.0004 0.0004 0.0005 0.0006 0.0006 0.0007 0.0008 0.0009
PU
19 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002 0.0003 0.0003 0.0003 0.0004
20 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002
M
21 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001
CA
λ
x 8.1 8.2 8.3 8.4 8.5 8.6 8.7 8.8 8.9 9.0
0 0.0003 0.0003 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0001 0.0001
1 0.0025 0.0023 0.0021 0.0019 0.0017 0.0016 0.0014 0.0013 0.0012 0.0011
2 0.0100 0.0092 0.0086 0.0079 0.0074 0.0068 0.0063 0.0058 0.0054 0.0050
3 0.0269 0.0252 0.0237 0.0222 0.0208 0.0195 0.0183 0.0171 0.0160 0.0150
4 0.0544 0.0517 0.0491 0.0466 0.0443 0.0420 0.0398 0.0377 0.0357 0.0337
5 0.0882 0.0849 0.0816 0.0784 0.0752 0.0722 0.0692 0.0663 0.0635 0.0607
6 0.1191 0.1160 0.1128 0.1097 0.1066 0.1034 0.1003 0.0972 0.0941 0.0911
7 0.1378 0.1358 0.1338 0.1317 0.1294 0.1271 0.1247 0.1222 0.1197 0.1171
E
8 0.1395 0.1392 0.1388 0.1382 0.1375 0.1366 0.1356 0.1344 0.1332 0.1318
AD
9 0.1256 0.1269 0.1280 0.1290 0.1299 0.1306 0.1311 0.1315 0.1317 0.1318
10 0.1017 0.1040 0.1063 0.1084 0.1104 0.1123 0.1140 0.1157 0.1172 0.1186
11 0.0749 0.0776 0.0802 0.0828 0.0853 0.0878 0.0902 0.0925 0.0948 0.0970
12 0.0505 0.0530 0.0555 0.0579 0.0604 0.0629 0.0654 0.0679 0.0703 0.0728
13 0.0315 0.0334 0.0354 0.0374 0.0395 0.0416 0.0438 0.0459 0.0481 0.0504
14 0.0182 0.0196 0.0210 0.0225 0.0240 0.0256 0.0272 0.0289 0.0306 0.0324
15 0.0098 0.0107 0.0116 0.0126 0.0136 0.0147 0.0158 0.0169 0.0182 0.0194
16 0.0050 0.0055 0.0060 0.0066 0.0072 0.0079 0.0086 0.0093 0.0101 0.0109
17 0.0024 0.0026 0.0029 0.0033 0.0036 0.0040 0.0044 0.0048 0.0053 0.0058
18 0.0011 0.0012 0.0014 0.0015 0.0017 0.0019 0.0021 0.0024 0.0026 0.0029
19 0.0005 0.0005 0.0006 0.0007 0.0008 0.0009 0.0010 0.0011 0.0012 0.0014
-I I
20 0.0002 0.0002 0.0002 0.0003 0.0003 0.0004 0.0004 0.0005 0.0005 0.0006
21 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002 0.0002 0.0003
22
22 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001
20
APÉNDICE A. TABLAS 315
λ
x 9.1 9.2 9.3 9.4 9.5 9.6 9.7 9.8 9.9 10
0 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0000
1 0.0010 0.0009 0.0009 0.0008 0.0007 0.0007 0.0006 0.0005 0.0005 0.0005
2 0.0046 0.0043 0.0040 0.0037 0.0034 0.0031 0.0029 0.0027 0.0025 0.0023
3 0.0140 0.0131 0.0123 0.0115 0.0107 0.0100 0.0093 0.0087 0.0081 0.0076
4 0.0319 0.0302 0.0285 0.0269 0.0254 0.0240 0.0226 0.0213 0.0201 0.0189
EP
5 0.0581 0.0555 0.0530 0.0506 0.0483 0.0460 0.0439 0.0418 0.0398 0.0378
UD
6 0.0881 0.0851 0.0822 0.0793 0.0764 0.0736 0.0709 0.0682 0.0656 0.0631
7 0.1145 0.1118 0.1091 0.1064 0.1037 0.1010 0.0982 0.0955 0.0928 0.0901
8 0.1302 0.1286 0.1269 0.1251 0.1232 0.1212 0.1191 0.1170 0.1148 0.1126
9 0.1317 0.1315 0.1311 0.1306 0.1300 0.1293 0.1284 0.1274 0.1263 0.1251
A
10 0.1198 0.1210 0.1219 0.1228 0.1235 0.1241 0.1245 0.1249 0.1250 0.1251
IM
11 0.0991 0.1012 0.1031 0.1049 0.1067 0.1083 0.1098 0.1112 0.1125 0.1137
-L
12 0.0752 0.0776 0.0799 0.0822 0.0844 0.0866 0.0888 0.0908 0.0928 0.0948
S
PU
13 0.0526 0.0549 0.0572 0.0594 0.0617 0.0640 0.0662 0.0685 0.0707 0.0729
14 0.0342 0.0361 0.0380 0.0399 0.0419 0.0439 0.0459 0.0479 0.0500 0.0521
M
15 0.0208 0.0221 0.0235 0.0250 0.0265 0.0281 0.0297 0.0313 0.0330 0.0347
CA
16 0.0118 0.0127 0.0137 0.0147 0.0157 0.0168 0.0180 0.0192 0.0204 0.0217
17 0.0063 0.0069 0.0075 0.0081 0.0088 0.0095 0.0103 0.0111 0.0119 0.0128
18 0.0032 0.0035 0.0039 0.0042 0.0046 0.0051 0.0055 0.0060 0.0065 0.0071
19 0.0015 0.0017 0.0019 0.0021 0.0023 0.0026 0.0028 0.0031 0.0034 0.0037
20 0.0007 0.0008 0.0009 0.0010 0.0011 0.0012 0.0014 0.0015 0.0017 0.0019
21 0.0003 0.0003 0.0004 0.0004 0.0005 0.0006 0.0006 0.0007 0.0008 0.0009
22 0.0001 0.0001 0.0002 0.0002 0.0002 0.0002 0.0003 0.0003 0.0004 0.0004
23 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002
E
24 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001
AD
-I I
22
20
APÉNDICE A. TABLAS 316
λ
x 11 12 13 14 15 16 17 18 19 20
0 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
1 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
2 0.0010 0.0004 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
3 0.0037 0.0018 0.0008 0.0004 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000
4 0.0102 0.0053 0.0027 0.0013 0.0006 0.0003 0.0001 0.0001 0.0000 0.0000
5 0.0224 0.0127 0.0070 0.0037 0.0019 0.0010 0.0005 0.0002 0.0001 0.0001
EP
6 0.0411 0.0255 0.0152 0.0087 0.0048 0.0026 0.0014 0.0007 0.0004 0.0002
7 0.0646 0.0437 0.0281 0.0174 0.0104 0.0060 0.0034 0.0019 0.0010 0.0005
UD
8 0.0888 0.0655 0.0457 0.0304 0.0194 0.0120 0.0072 0.0042 0.0024 0.0013
9 0.1085 0.0874 0.0661 0.0473 0.0324 0.0213 0.0135 0.0083 0.0050 0.0029
10 0.1194 0.1048 0.0859 0.0663 0.0486 0.0341 0.0230 0.0150 0.0095 0.0058
11 0.1194 0.1144 0.1015 0.0844 0.0663 0.0496 0.0355 0.0245 0.0164 0.0106
12 0.1094 0.1144 0.1099 0.0984 0.0829 0.0661 0.0504 0.0368 0.0259 0.0176
A
IM
13 0.0926 0.1056 0.1099 0.1060 0.0956 0.0814 0.0658 0.0509 0.0378 0.0271
14 0.0728 0.0905 0.1021 0.1060 0.1024 0.0930 0.0800 0.0655 0.0514 0.0387
-L
15 0.0534 0.0724 0.0885 0.0989 0.1024 0.0992 0.0906 0.0786 0.0650 0.0516
S
16 0.0367 0.0543 0.0719 0.0866 0.0960 0.0992 0.0963 0.0884 0.0772 0.0646
PU
17 0.0237 0.0383 0.0550 0.0713 0.0847 0.0934 0.0963 0.0936 0.0863 0.0760
18 0.0145 0.0255 0.0397 0.0554 0.0706 0.0830 0.0909 0.0936 0.0911 0.0844
M
19 0.0084 0.0161 0.0272 0.0409 0.0557 0.0699 0.0814 0.0887 0.0911 0.0888
CA
20 0.0046 0.0097 0.0177 0.0286 0.0418 0.0559 0.0692 0.0798 0.0866 0.0888
21 0.0024 0.0055 0.0109 0.0191 0.0299 0.0426 0.0560 0.0684 0.0783 0.0846
22 0.0012 0.0030 0.0065 0.0121 0.0204 0.0310 0.0433 0.0560 0.0676 0.0769
23 0.0006 0.0016 0.0037 0.0074 0.0133 0.0216 0.0320 0.0438 0.0559 0.0669
24 0.0003 0.0008 0.0020 0.0043 0.0083 0.0144 0.0226 0.0328 0.0442 0.0557
25 0.0001 0.0004 0.0010 0.0024 0.0050 0.0092 0.0154 0.0237 0.0336 0.0446
26 0.0000 0.0002 0.0005 0.0013 0.0029 0.0057 0.0101 0.0164 0.0246 0.0343
27 0.0000 0.0001 0.0002 0.0007 0.0016 0.0034 0.0063 0.0109 0.0173 0.0254
28 0.0000 0.0000 0.0001 0.0003 0.0009 0.0019 0.0038 0.0070 0.0117 0.0181
29 0.0000 0.0000 0.0001 0.0002 0.0004 0.0011 0.0023 0.0044 0.0077 0.0125
E
30 0.0000 0.0000 0.0000 0.0001 0.0002 0.0006 0.0013 0.0026 0.0049 0.0083
AD
31 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0007 0.0015 0.0030 0.0054
32 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0004 0.0009 0.0018 0.0034
33 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0005 0.0010 0.0020
34 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0006 0.0012
35 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0007
36 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0004
37 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002
38 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
39 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
-I I
22
20
APÉNDICE A. TABLAS 317
0 Zc Z
UD
Zc 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
A
0.0 0.00000 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.02790 0.03188 0.03586
IM
0.1 0.03983 0.04380 0.04776 0.05172 0.05567 0.05962 0.06356 0.06749 0.07142 0.07535
0.2 0.07926 0.08317 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409
-L
0.3 0.11791 0.12172 0.12552 0.12930 0.13307 0.13683 0.14058 0.14431 0.14803 0.15173
S
0.4 0.15542 0.15910 0.16276 0.16640 0.17003 0.17364 0.17724 0.18082 0.18439 0.18793
PU
0.5 0.19146 0.19497 0.19847 0.20194 0.20540 0.20884 0.21226 0.21566 0.21904 0.22240
0.6 0.22575 0.22907 0.23237 0.23565 0.23891 0.24215 0.24537 0.24857 0.25175 0.25490
M
0.7 0.25804 0.26115 0.26424 0.26730 0.27035 0.27337 0.27637 0.27935 0.28230 0.28524
CA
0.8 0.28814 0.29103 0.29389 0.29673 0.29955 0.30234 0.30511 0.30785 0.31057 0.31327
0.9 0.31594 0.31859 0.32121 0.32381 0.32639 0.32894 0.33147 0.33398 0.33646 0.33891
1.0 0.34134 0.34375 0.34614 0.34849 0.35083 0.35314 0.35543 0.35769 0.35993 0.36214
1.1 0.36433 0.36650 0.36864 0.37076 0.37286 0.37493 0.37698 0.37900 0.38100 0.38298
1.2 0.38493 0.38686 0.38877 0.39065 0.39251 0.39435 0.39617 0.39796 0.39973 0.40147
1.3 0.40320 0.40490 0.40658 0.40824 0.40988 0.41149 0.41309 0.41466 0.41621 0.41774
1.4 0.41924 0.42073 0.42220 0.42364 0.42507 0.42647 0.42785 0.42922 0.43056 0.43189
1.5 0.43319 0.43448 0.43574 0.43699 0.43822 0.43943 0.44062 0.44179 0.44295 0.44408
1.6 0.44520 0.44630 0.44738 0.44845 0.44950 0.45053 0.45154 0.45254 0.45352 0.45449
1.7 0.45543 0.45637 0.45728 0.45818 0.45907 0.45994 0.46080 0.46164 0.46246 0.46327
1.8 0.46407 0.46485 0.46562 0.46638 0.46712 0.46784 0.46856 0.46926 0.46995 0.47062
1.9 0.47128 0.47193 0.47257 0.47320 0.47381 0.47441 0.47500 0.47558 0.47615 0.47670
E
2.0 0.47725 0.47778 0.47831 0.47882 0.47932 0.47982 0.48030 0.48077 0.48124 0.48169
AD
2.1 0.48214 0.48257 0.48300 0.48341 0.48382 0.48422 0.48461 0.48500 0.48537 0.48574
2.2 0.48610 0.48645 0.48679 0.48713 0.48745 0.48778 0.48809 0.48840 0.48870 0.48899
2.3 0.48928 0.48956 0.48983 0.49010 0.49036 0.49061 0.49086 0.49111 0.49134 0.49158
2.4 0.49180 0.49202 0.49224 0.49245 0.49266 0.49286 0.49305 0.49324 0.49343 0.49361
2.5 0.49379 0.49396 0.49413 0.49430 0.49446 0.49461 0.49477 0.49492 0.49506 0.49520
2.6 0.49534 0.49547 0.49560 0.49573 0.49585 0.49598 0.49609 0.49621 0.49632 0.49643
2.7 0.49653 0.49664 0.49674 0.49683 0.49693 0.49702 0.49711 0.49720 0.49728 0.49736
2.8 0.49744 0.49752 0.49760 0.49767 0.49774 0.49781 0.49788 0.49795 0.49801 0.49807
2.9 0.49813 0.49819 0.49825 0.49831 0.49836 0.49841 0.49846 0.49851 0.49856 0.49861
3.0 0.49865 0.49869 0.49874 0.49878 0.49882 0.49886 0.49889 0.49893 0.49896 0.49900
3.1 0.49903 0.49906 0.49910 0.49913 0.49916 0.49918 0.49921 0.49924 0.49926 0.49929
-I I
3.2 0.49931 0.49934 0.49936 0.49938 0.49940 0.49942 0.49944 0.49946 0.49948 0.49950
3.3 0.49952 0.49953 0.49955 0.49957 0.49958 0.49960 0.49961 0.49962 0.49964 0.49965
22
3.4 0.49966 0.49968 0.49969 0.49970 0.49971 0.49972 0.49973 0.49974 0.49975 0.49976
20
3.5 0.49977 0.49978 0.49978 0.49979 0.49980 0.49981 0.49981 0.49982 0.49983 0.49983
3.6 0.49984 0.49985 0.49985 0.49986 0.49986 0.49987 0.49987 0.49988 0.49988 0.49989
3.7 0.49989 0.49990 0.49990 0.49990 0.49991 0.49991 0.49992 0.49992 0.49992 0.49992
3.8 0.49993 0.49993 0.49993 0.49994 0.49994 0.49994 0.49994 0.49995 0.49995 0.49995
3.9 0.49995 0.49995 0.49996 0.49996 0.49996 0.49996 0.49996 0.49996 0.49997 0.49997
APÉNDICE A. TABLAS 318
A.5. Distribución t
Área (probabilidad)
EP
en extremo superior
UD
0 t
A
IM
S -L
PU
Anderson, D., Sweeney, D., Williams, T., Camm, J. y Cochran, J. (2014). Statistics for
UD
Educación.
S-
Lind, D., Marchal, W. y Wathen, S. (2012). Estadı́stica aplicada a los negocios y la economı́a.,
M
Ubøe, J. (2017). Introductory Statistics for Business and Economics. Theory, Exercises and
Solutions, Springer.
E
AD
-II
22
20
321