Estadistica I
Estadistica I
Estadistica I
ESTADISTICA I
INTRODUCCION
CONCEPTOS BASICOS
POBLACIÓN
Es un conjunto de elementos de naturaleza cualquiera de los cuales estamos interesados en estudiar
al menos una característica común y observable de dichos elementos en un determinado lugar y en
un momento dado.
Observación: La población en estudios debe estar definida sin ambigüedad de manera que no de
lugar a confusiones. Los elementos consideramos que se encuentran localizados en un determinado
lugar o región geográfica y en un periodo de tiempo dado.
EJEMPLO
El conjunto de todos los estudiantes matriculados en el RUCFA en el presente año.
Elementos: estudiantes.
Características : sexo, Nº asignaturas que lleva, estatura, edad, año que lleva, turno,procedencia,etc.
VARIABLES
Utilizaremos variables como X, Y, Z, etc. para representar las características de los elementos
Existen básicamente 2 tipos de variables:
Variables cualitativas: Son las que producen respuestas categóricas. ( atributos o modalidades )
Variables cuantitativas : Son las que producen respuestas numéricas. (valores)
Las variables cuantitativas pueden considerarse como variables discretas y variables contínuas.
Variables discretas: Son aquellas cuyos valores posibles tienen interrupción ( esto es, se separan
sin haber valores intermedios ) Por lo general provienen de un proceso de conteo.
DATOS ESTADISTICOS
Loa valores posibles de una característica X los denotaremos por x , mientras que los valores
realmente observados de esa característica X , los llamaremos datos y los denotaremos por x i donde
el valor del subíndice i nos indica que es la i-ésima observación de X.
Con frecuencia usaremos el término población para referirnos a la totalidad de datos que podrían
recopilarse en una situación dada.
x1 , x2 , … , xN
PARAMETROS
Es una medida que proviene de todos los datos de la población. Los parámetros son constantes que
representan por lo general características de la población. Generalmente se representan por letras
griegas.
Por ejemplo, la media poblacional es un parámetro que se denota y define como
MUESTRA
Es una parte de la población que se espera sea representativa de ella.
Con frecuencia usaremos el término muestra para referirnos a los datos muestrales x1 , x2 , … , xn
Población tamaño N
X
x1 muestra tamaño n
x2
. x1, x2,….xn
.
xN datos muestrales
ESTIMACION DE UN PARAMETRO
Es una medida que proviene de los datos muestrales. Las estimaciones varían de una muestra a otra
y representan características de las muestras.
Por ejemplo, la media muestral de un conjunto de datos x1 , x2 , … , xn se denota y define como
MUESTREO Y CENSO
Como el fin de la Estadística es llegar a conocer un parámetro esto podemos lograrlo haciendo:
3
¿ QUE ES LA ESTADISTICA ?
La Estadística estudia los métodos y procedimientos para recopilar, organizar, presentar y analizar
datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínsica de los mismos; así
como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en
su caso formular predicciones.
DIVISION DE LA ESTADISTICA
ESTADÍSTICA DESCRIPTIVA
Es la parte de la estadística que estudia los métodos de recopilación, organización, presentación y
caracterización o análisis de un conjunto de datos.
ESTADÍSTICA INFERENCIAL
Estudia los métodos que hacen posible la estimación de un parámetro en base a datos muestrales.
Recursos humanos
Para la selección del personal los empresarios suelen usar cada vez con más frecuencia resultados
obtenidos en tests de aptitudes y conocimientos deseables en la persona a contratar. Las técnicas
descriptivas son intrumentos adecuados para el tratamiento de las puntuaciones númericas
alcanzadas en dichos tests.
Auditoria
Uno de los nuevos instrumentos de que disponen los auditores de hoy, es el empleo de métodos de
muestreo, a fin de reducir la cantidad de revisión detallada que se necesita.
Suponga que una empresa tiene una cantidad muy grande de cuentas por cobrar. Un auditor puede
utilizar algún método de muestreo estadístico para seleccionar una muestra de cuentas y a partir de
ella estimar el saldo total de las cuentas. Si la cantidad que aparece en los libros de la empresa no
cae dentro de los límites de la estimación, el auditor puede considerar la posibilidad de hacer un
asiento de ajuste al valor en libros.
4
Marketing
Los estudios de mercado dirigidos al conocimiento de la demanda de productos, productos
competidores, efectos de campañas publicitarias, etc., se llevan a cabo con regularidad en la
empresa. Antes de sacar un producto al mercado se suele realizar una investigación al respecto
mediante muestreo con objeto de obtener alguna información. Las técnicas estadísticas permiten en
estas situaciones inferir valores de parámetros a partir de la información muestral. Por supuesto, a
partir de una muestra no se puede conocer con exactitud y precisión las características de toda la
población, siempre habrá un grado de incertidumbre sobre el verdadero valor del parámetro, el cual
puede ser cuantificado en términos de probabilidad.
Producción
En el proceso de fabricación de un producto intervienen innumerables factores (materias primas,
maquinarias, obreros, etc.) que afectan a las características de calidad de ese producto. En muchas
fábricas es corriente ver cómo los productos llegan a una banda transportadora en cuyo final hay una
máquina empacadora que los envía al almacen. Entre la banda transportadora y la máquina de
empacar suele haber un operario que observa atentamente los productos que llegan y
ocacionalmente arroja alguno a un cesto cercano. Está eliminando productos defectuosos.
Hoy día el control de calidad de la producción es básico para que los artículos producidos cumplan
los requisitos de calidad establecidos por las normas tanto nacionales como internacionales. Los
métodos estadísticos son una herramienta eficaz en esta área para mejorar los procesos de
producción y reducir sus defectos.
Finanzas
Resulta evidente que cualquier profesional de la empresa o los negocios debe adquirir una
formación básica en estadística en un proceso de aprendizaje, que le permita moverse con soltura en
el mundo que le rodea. Si ha de tomar decisiones en un entorno de fluctuaciones y riesgos, no
bastará con entender la terminología estadística, necesitará conocerla lo suficiente como para
aplicarla y hacer de ella una herramienta eficaz en el ejercicio de su actividad.
Las decisiones de una empresa de invertir en nuevos productos, locales, maquinarias, etc.,vendrán
condicionadas por los beneficios esperados del dinero. Para ello son de gran utilidad las técnicas de
predicción, que constituyen una auténtica necesidad en el mundo de los negocios.
5
OBJETIVOS.
1.1 INTRODUCCION
Este tema pretende introducir al estudiante en el manejo de datos numéricos, enseñarle a organizar y
presentar datos obtenidos de un estudio mediante la construcción de tablas y gráficas estadísticas.
También será de vital importancia poder condensar la información en medidas que la representen en
forma clara, por tal razón, trataremos de encontrar valores para esas medidas (estadísticos o
parámetros ) que logren sintetizar la información. Estas medidas expresarán la posición, dispersión,
asimetría y forma de los datos.
Hasta Ls
Más de Li
6
c = Ls – Li
j = 1, 2, ....., g
EJEMPLO 1.1
Los siguientes datos corresponden a consumos mensuales registrados (en cienes de córdobas) en 30
familias del barrio Costa Rica.
24 16 26 31 17 25 17 23 23 19
21 17 13 20 30 24 19 22 21 18
25 14 29 20 26 15 27 21 22 23
13 14 15 16 17 17 17 18 19 19
20 20 21 21 21 22 22 23 23 23
24 24 25 25 26 26 27 29 30 31
2. Determinar el rango
El límite inferior de la primera clase debe ser un número menor y cercano al dato menor.
El límite superior de la última clase debe ser mayor o igual, pero cercano, al dato mayor.
Tabla 1.2 Organización de los datos de la tabla 1.1 del ejemplo 1.1
7
30
EJEMPLO 1.2
Supongamos que los siguientes datos representan número de días de atraso en el pago de 10 cuentas
de crédito.
1, 2, 1, 0, 2, 1, 2, 3, 0, 2
8
Si X representa el número de días de atraso en el pago de las cuentas, podemos presentar esta
información en la siguiente tabla:
Tabla 1.3 Título: Distribución de frecuencias del número de días de atraso en el pago de 10 cuentas
de crédito.
xi fi
N° días N° cuentas
0 2
1 3
2 4
3 1
10
Fuente: BANPRO
EJEMPLO 1.3
Con los datos de la tabla 1.3 del ejemplo 1.2 obtenemos la siguiente figura.
Figura 1.1 Distribución de frecuencias del número de dias de atraso en el pago de 10 cuentas de
crédito.
faj : frecuencia acumulada hasta la clase j. Número de datos cuyos valores son inferiors o iguales al
límite superior de la clase j .
faj = f1 + f2 + … + fj
9
j=1,2,…,g
fraj : frecuencia relativa acumulada hasta la clase j. Proporción de datos cuyos valores son
inferiores o iguales al límite superior de la clase j
.
j=1,2,…,g
Cuando los datos están agrupados en clases diremos que forman una distribución de frecuencias , la
cual, puede ser presentada por una tabla estadística o una gráfica estadística.
EJEMPLO 1.4
Con los datos de la tabla 1.2 del ejemplo 1.1 obtenemos la siguiente tabla.
Tabla 1.4 TITULO : Distribuciones de frecuencias de los consumo mensuales de 30 familias del
barrio Costa Rica.
10
12 --- 16 14 4 0.13 4 0.13
16 --- 20 18 8 0.27 12 0.40
20 --- 24 22 10 0.33 22 0.73
24 --- 28 26 5 0.17 27 0.90
28 --- 32 30 3 0.10 30 1.00
34
30 1.00
EJEMPLO 1.5
Con datos de la tabla 1.4 del ejemplo 1.4 obtenemos la siguiente figura.
Figura 1.2 Histrograma de frecuencias de los consumos mensuales de 30 familias del barrio Costa
Rica.
POLÍGONO DE FRECUENCIAS
Se forman haciendo que cada marca de clase represente los datos de esa clase. Luego se toman las
frecuencias correspondientes a cada marca de clase para después unir los puntos resultantes con
segmentos. Algunos prolongan el polígono hasta las marcas de clase imaginarias inferior y superior
inmediata
EJEMPLO 1.6
Con datos de la tabla 1.4 del ejemplo 1.4 se ha dibujado el polígono de frecuencias de los consumos
mensuales de las 30 familias. Ver figura 1.3
11
Figura 1.3
EJEMPLO 1.7
Con datos de la tabla 1.4 del ejemplo 1.4 obtenemos la siguiente figura.
Figura 1.4 Polígono de frecuencias acumuladas ( Ojiva ) de los consumos mensuales de 30 familias
del barrio Costa Rica.
12
EJEMPLO 1.8
Tabla 1.5 Costo de la canasta básica en córdobas a nivel nacional durante el período 1991 – 2000.
Años 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Costo 750 780 820 880 1100 1200 1350 1550 1600 1700
GRAFICO DE LINEAS
Consiste en un conjunto de líneas o segmentos de recta que muestran los cambios que experimenta
una determinada variable, generalmente en función del tiempo. Las coordenadas se pueden graficar
en el centro del período de tiempo.
EJEMPLO 1.9
Con los datos de la tabla 1.5 del ejemplo 1.8 obtenemos la siguiente figura.
Figura 1.5 Gráfico de líneas del costo de la canasta básica en córdobas a nivel nacional durante el
período 1991 – 2000.
Observe que el costo de la canasta básica siempre crece durante el período 1991 – 2000, ocurriendo
un crecimiento a un ritmo mayor a partir de 1995.
13
EJEMPLO 1.10
Tabla 1.6 Salario mínimo del sector industrial a nivel nacional para el período 1991 – 2000.
Años 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Salarios 400 500 600 700 800 850 900 950 1000 1050
EJEMPLO 1.11
Con los datos de la tabla 1.6 y 1.5 de los ejemplos 1.8 y 1.10 respectivamente obtenemos la
siguiente figura.
Figura 1.6 Comparación del costo de la canasta básica y el salario mínimo del sector industrial para
el período 1991 – 2000.
Observe que el costo de la canasta básica siempre es mayor que el salario mínimo, ocurriendo la
diferencia más pequeña de C$ 180 en el año 1994.
De 1991 a 1994 el salario creció a un ritmo mayor que el costo de la canasta básica, pero de 1995 a
2000 el costo de la canasta básica creció a un ritmo mucho mayor que el salario.
De la figura anterior podemos comentar que el aparato industrial nicaragüense tiene poco desarrollo.
14
EJEMPLO 1.12
Tabla 1.7 Importaciones realizadas por Nicaragua de 545.3 millones de dólares en bienes
intermedios en el año 2000 según la actividad ecónomica.
Valor de la categoría
Angulo del sector = x 360°
Valor total de las categorías
EJEMPLO 1.13
Con los datos de la tabla 1.7 del ejemplo 1.12 obtenemos la siguiente figura.
Figura 1.7 Gráfica de pastel que ilustra las importaciones realizadas por Nicaragua según la
actividad ecónomica.
15
GRAFICA DE BARRAS
Este gráfico está constituido por un conjunto de barras o rectángulos , separados por distancias
iguales , cuyas alturas son el valor de los datos correspondientes al atributo que señalan sus bases.
EJEMPLO 1.14
Con los datos de la tabla 1.7 del ejemplo 1.12 obtenemos la siguiente figura.
Figura 1.8 Gráfica de barras que ilustra las importaciones realizadas por Nicaragua según la
actividad ecónomica.
EJEMPLO 1.15
Tabla 1.8 Precios promedios en dólares de los tres principales productos de consumo: frijol, pollo
y leche a nivel centroamericano.
EJEMPLO 1.16
Con los datos de la tabla 1.8 del ejemplo 1.15 obtenemos la siguiente figura.
Figura 1.9 Gráfica de barras que ilustra los precios promedios en dólares de los tres principales
productos de consumo: Frijol, Pollo y Leche.
Medidas de posición
Nos indican las posiciones o lugares alrededor de los cuales se distribuyen los datos.
Medidas de dispersión
Nos informan sobre la variabilidad de los datos alrededor de las medidas de posición.
Figura 1.10 Puntos sobre la recta real correspondientes a dos conjuntos de datos.
Si x1, x2,..........,xN representan todos los datos poblacionales entonces su media poblacional se
denota y define así
18
EJEMPLO 1.17
Los siguientes datos representan saldos en miles de córdobas de 5 cuentas de ahorro.
Elementos: cuentas
X : saldo
n=5
(en miles de C$ )
Datos repetidos
Si los datos forman una distribución de frecuencias de la variable X utilizaremos para la media
muestral la siguiente fórmula:
EJEMPLO 1.18
Dada la distribución de frecuencias de la tabla 1.3 del ejemplo 1.2 , calcule el número promedio de
días de atraso en el pago de las cuentas.
Tabla 1.9
xi fi xifi
0 2 0
1 3 3
2 4 8
3 1 3
10 14
días
19
EJEMPLO 1.19
La distribución de frecuencias de gastos en energía eléctrica en córdobas durante el mes de Julio en
50 casas del barrio la Primavera de Managua es dada por la siguiente tabla
.
Tabla 1.10
fj
Gastos mj No. casas mjfj uj ujfj
50 7375.0 20
Método ordinario:
EJEMPLO 1.20
Comprobación de que la suma algebraica de las desviaciones de los números 1, 3, 5, 7 con respecto
a su media es cero.
Tabla 1.11
xi xi - 4
1 -3
3 -1
5 1
7 3
16 0
Figura 1.11
1.5.1.1.2 LA MEDIANA
Para datos que contienen valores extremos es recomendable utilizar la mediana porque ésta no es
sensible a las observaciones extremas.
La mediana es el valor que se encuentra en el centro de una secuencia ordenada de datos.
Posición:
Posiciones: y
EJEMPLO 1.21
Consideremos el costo en córdobas de la canasta básica de 5 ciudades:
Me = 1200 Posición: 3
EJEMPLO 1.22
En 10 días un Banco tuvo 18, 13, 15, 12, 8, 3, 7, 14, 16 y 3 transacciones en moneda extranjera.
Determine la mediana.
2. Aplicar la fórmula
donde:
fa k-1 es la frecuencia acumulada de la clase que precede a la clase mediana.
Lik es el límite inferior de la clase mediana.
fk es la frecuencia de la clase mediana.
n es el número de datos.
EJEMPLO 1.23
Dada la distribución de frecuencias de la tabla 1.10 del ejemplo 1.19, calcule el gasto mediano en
energía eléctrica de las 50 casas.
fj
Gastos No. casas faj
75 ---- 100 4 4
100 ---- 125 8 12
125 ---- 150 15 27
150 ---- 175 13 40
175 ---- 200 7 47
200 ---- 225 3 50
50
2. Me
EJEMPLO 1.24
Los siguientes datos representan ventas anuales registradas en millones de córdobas en 80 tiendas
23
Tabla 1.12
Hasta 10 8 8
10 ---- 20 18 26
20 ---- 30 32 58
30 ---- 40 15 73
40 ---- 50 6 79
Más de 50 1 80
80
2. Me = 20 + = 20 +
1.5.1.1.3 LA MODA
La moda de un conjunto de datos es aquel valor que se presenta con más frecuencia.
La moda no es afectada por valores extremos. Sin embargo sólo se utiliza para propósitos
descriptivos porque es más variable para distintas muestras que las demás medidas de posición.
EJEMPLO 1.25
Los siguientes datos corresponden a ventas mensuales de una empresa registradas en millones de
córdobas durante el año pasado.
100, 80, 150, 60, 100, 90, 130, 100, 90, 100, 120, 100
Mo = 100
EJEMPLO 1.26
60, 74, 82, 85, 90 La moda no existe
EJEMPLO 1.27
50, 60, 70, 60, 50, 40, 80, 50, 60, 45
24
Mo = 50 y Mo = 60
2. Aplicar la fórmula
donde:
Lik es el límite inferior de la clase modal.
1 es la diferencia absoluta entre la frecuencia de la clase modal y la frecuencia de la clase
precedente.
2 es la diferencia absoluta entre la frecuencia de la clase modal y la frecuencia de la clase
siguiente.
EJEMPLO 1.28
Dada la distribución de frecuencias de la tabla 1.10 del ejemplo 1.19, calcule el gasto modal en
energía eléctrica de las 50 casas.
fj
GASTOS No. casas
75 ---- 100 4
100 ---- 125 8
125 ---- 150 15
150 ---- 175 13
175 ---- 200 7
200 ---- 225 3
50
1.5.1.2.1 PERCENTILES
Son medidas que dividen a una distribución en cien partes iguales.
El percentil r, denotado por Pr, donde r = 1, 2, ........, 99 es el valor por debajo del cual queda el r%
de los datos.
DATOS AGRUPADOS EN CLASES
1. Identificar la clase que contiene al Pr (k)
Es la primera clase con una frecuencia acumulada
2. Aplicar la fórmula
donde
n es el número de datos
Lik es el límite inferior de la clase que contiene al Pr
es el r% de n
fk es la frecuencia de la clase que contiene al Pr
fak-1 es la frecuencia acumulada de la clase que precede a la clase que contiene al Pr.
EJEMPLO 1.29
Dada la distribución de frecuencias de la tabla 1.10 del ejemplo 1.19, ¿ Por debajo de qué gasto en
energía eléctrica está el 90% de las casas ?
GASTOS fj fa
75 ----- 100 4 4
100 ----- 125 8 12
125 ----- 150 15 27
150 ----- 175 13 40
175 ----- 200 7 47
200 ----- 225 3 50
50
¿ Por debajo de qué gasto en energía eléctrica está el 60% de las casas ?
Figura 1.12
Cuando la dispersión de los datos se considera pequeña en comparación a la magnitud de los datos
decimos que la medida de posición es confiable, esto es, representativa de los datos.
Si x1, x2,..........,xn representan datos muestrales entonces su varianza muestral se denota y define
así
Fórmula abreviada
EJEMPLO 1.30
Los siguientes datos representan saldos en miles de córdobas de 5 cuentas de ahorro.
xi x2i
20 4 400
10 64 100
15 9 225
25 49 625
20 4 400
90 130 1750
a)
b)
Tanto la varianza como la desviación estándar de un conjunto de datos son medidas de variabilidad
de los datos alrededor de la media.
La desviación estándar puede interpretarse como una desviación promedio de los datos alrededor
de la media, en otras palabras, cuánto se alejan en promedio los datos de la media.
Para el ejemlo 1.30, podemos decir que la desviación promedio de los saldos de las cuentas
alrededor de C$ 18 es C$ 5.7009 o bien que los saldos se alejan en promedio C$ 5.7009 de la media.
c)
Este valor no tendrá sentido a menos que lo comparemos con otro conjunto de cuentas.
29 42.25 841
90 107.00 2132
a)
b)
c)
¿Qué conjunto de cuentas tiene el saldo más uniforme?
Datos repetidos
Si los datos forman una distribución de frecuencias de la variable X, la varianza muestral se define
así
EJEMPLO 1.31
Para la distribución de frecuencias de la tabla 1.3 del ejemplo 1.2 , calcule la desviación estándar
del número de días de atraso en el pago de las cuentas.
Recordemos que días.
xi fi
0 2 3.92
1 3 0.48
2 4 1.44
3 1 2.56
10 8.40
mj es la marca de la clase j
g es en número de clases
29
fj es la frecuencia de la clase j
EJEMPLO 1.32
En la siguiente tabla se dan los rendimientos en qq / mz. obtenidos en 60 plantaciones de algodón.
Tabla 1.13
Rendimientos N° Plantaciones
20 ---- 28 4
28 ---- 36 20
36 ---- 44 30
44 ---- 52 5
52 ---- 60 1
60
mj fj mjfj mj2fj
30
24 4 96 2304
32 20 640 20480
40 30 1200 48000
48 5 240 11520
56 1 56 3136
60 2232 85440
1.
2.
3.
mj fj
24 4 696.96
32 20 540.80
40 30 235.20
48 5 583.20
56 1 353.44
60 2409.60
EJERCICIO 1.1
Para la distribución de frecuencias de gastos de energía eléctrica en córdobas, del ejemplo 1.19,
verifique que la desviación estándar del gasto de energía eléctrica es s = C$ 32.73
DISTRIBUCIONES SIMETRICAS
Si en una distribución de frecuencias, la media, la mediana y la moda coinciden entonces decimos
que la distribución es simétrica. Ver figura 1.13
Figura 1.13
DISTRIBUCIONES ASIMETRICAS
Si los valores de la media , la mediana y la moda no coinciden entonces decimos que la distribución
es asimétrica.
Para distribuciones asimétricas unimodales las posiciones relativas de las tres medidas serán tales
que la mediana estará siempre entre la media y la moda. Ver figuras 1.14 y 1.15
Figura 1.14
La cola mayor se extiende a la izquierda o dirección negativa y por tanto la media es la menor de
las tres medidas.
< Me < Mo
Figura 1.15
La cola mayor se extiende a la derecha o dirección positiva motivo por el cual la media es la mayor
de las tres medidas.
Mo < Me <
- Mo = 3 - Me Mo = 3Me - 2
EJEMPLO 1.33
Retomando los datos de la tabla 1.10 del ejemplo 1.19 tenemos que:
EJEMPLO 1.34
Para la distribución de frecuencias de gastos de energía eléctrica en córdobas durante el mes de Julio
en 50 casas del barrio la Primavera del ejemplo 1.19 tenemos que:
, r = 0, 1, 2, .........
, r = 0, 1, 2, .......
m0 = 1 , m1 = 0 ¿Por qué? , m2 = s2 , m3 =
Si F = 0 , la distribución es simétrica.
Si F 0 , la distribución tiene asimetría negativa.
Si F 0 , la distribución tiene asimetría positiva.
EJEMPLO 1.35
El número de empleados de 10 pequeñas empresas fue el siguiente:
2, 3, 3, 4, 4, 4, 4, 5, ,5, 6
xi fi xifi
2 1 2 4 -8 16
3 2 6 2 -2 2
4 4 16 0 0 0
5 2 10 2 2 2
6 1 6 4 8 16
10 40 12 0 36
empleados empleados
La regla empírica
En un conjunto de datos moderamente asimétricos aproximadamente el 67% de los datos (la
mayoría de los datos) están comprendidos dentro de la distancia de una desviación estándar en
torno a la media, y aproximadamente entre un 90% y 95% de los datos están comprendidos dentro
de la distancia de dos desviaciones estándar en torno a la media.
Para el ejemplo 1.35 podemos decir que aproximadamente un 67% de las pequeñas empresas (la
mayoría de las pequeñas empresas) tienen un número de empleados que varían entre 4 – 1.1547 =
2.8453 empleados y 4 + 1.1547 = 5.1547 empleados.
Una vez que la asimetría ha sido determinada, podremos preguntarnos si la distribución es más o
menos apuntada. Este apuntamiento habrá que medirlo comparándolo con cierta distribución de
frecuencias que consideramos normal.
EJEMPLO 1.36
Para el número de empleados de las 10 pequeñas empresas tenemos que
Leptocúrtica
Mesocúrtica
Platicúrtica
Figura 1.16
1.2. Señale con una A las series constituidas por datos cualitativos (o atributos) y con una V los
datos cuantitativos.
1.3. Señale cual de las siguientes variables son continuas ( C ) y cuales son discretas ( D ).
2. Un cobrador de una empresa ha registrado el número de días que tarda en cobrar cada una de
sus cuentas de créditos. Se han obtenido los siguientes 30 registros:
17 57 10 35 26 3
21 11 7 72 5 86
6 20 95 40 14 42
12 32 28 13 19 28
45 8 19 21 38 20
3. La gran variedad de factores a considerar en la compra de una vivienda, lugar, precio, tasa de
amortización, tipo de construcción y otros hacen que el tiempo que un comprador tarda en llegar a
su decisión final sea muy variable. Los siguientes datos representan la duración de la búsqueda (en
semanas) de 25 compradores de vivienda en cierta población.
15 17 7 15 20
5 3 19 10 3
11 10 4 8 13
9 15 6 2 8
12 1 2 13 4
4. Los siguientes datos representan las declaraciones mensuales de impuestos sobre ventas (en
miles de córdobas) que los 30 establecimientos comerciales de la ciudad A presentaron ante el
correspondiente contralor.
9.0 10.3 11.1 9.6 14.5 13.0 6.7 11.0 8.4 10.3
13.0 11.2 7.3 5.3 12.5 8.0 11.8 8.7 10.6 9.5
11.1 10.2 9.9 9.8 11.6 15.1 12.5 14.0 8.6 5.3
a) Organice los datos anteriores en una distribución de frecuencias que contenga 5 clases.
b) Grafique el histograma de frecuencias y la ojiva.
2, 4, 2, 3, 2, 0, 1, 0
Determine:
a) El número promedio de equivocaciones.
b) El número mediano de equivocaciones.
c) El número modal de equivocaciones.
d) La desviación estándar del número de equivocaciones.
38
6. Una empresa industrial agrupó sus fábricas de acuerdo con el valor de la producción anual de
cada una; se obtuvo la siguiente distribución:
7. Durante un período de 15 años, los precios promedios de cierto producto fueron de C$ 125, con
una desviación estándar de C$ 25. En un período posterior de 12 años, tuvieron un precio promedio
de C$ 80 con una varianza de C$ 100. ¿En qué período hubo mayor estabilidad de precios?.
9. Dos países A y B venden la misma materia prima en el mercado mundial a los siguientes precio
por kilogramo, en el transcurso de 6 meses:
10. La tabla siguiente muestra la distribución por edades de cabezas de familia en un país dado
durante el año 2000.
11. El contador de un almacén desea estimar el balance promedio, en dólares de las 10,000 cuentas de crédito que
maneja el almacén. La distribución de frecuencias se representa en la tabla y fue construida a partir de una muestra de
100 cuentas seleccionadas al azar en los archivos de crédito del almacén.
Balance de la Cuenta N° de cuentas
0 – 20 10
20 – 40 15
40 – 60 40
60 – 80 22
80 – 100 13
100
a) Grafique:
Histograma, Polígono de frecuencias relativa, Polígono de frecuencia acumulada.
b) Calcule:
La media aritmética, La mediana, La moda
La varianza, desviación estándar y coeficiente de variación.
c) Calcule el coeficiente de asimetría de Pearson, y diga que tipo de asimetría tiene la distribución.
12. El resultado del ordeño de 100 vacas durante una semana computadas las cantidades diarias de
leche obtenidas por cada vaca, fue agrupada según la siguiente distribución.
Calcule:
1. El rendimiento promedio semanal de leche por vaca.
40
N° de hoteles 0 1 2 3
N° Ciudades 2 3 10 5
15. Los siguientes datos representan el número de interrupciones en 15 días de trabajo debidas a
fallas mecánicas en una planta procesadora de alimentos:
3 0 5 1 3 1 3 2 2 0 2 1 2 4 3
a) Resuma los datos en una distribución de frecuencias.
b) Calcule el número promedio de interrupciones y la desviación estándar del número de
interrupciones.
c) Calcule el coeficiente de asimetría de Fisher y diga que tipo de asimetría tiene la
distribución.
d) Calcule el coeficiente de aplastamiento de Fisher y diga que tan apuntada es la distribución.
16. Una autoridad urbana desea diseñar una gráfica que muestre a los contribuyentes que asiten a la
próxima reunión, lo que sucede con el dinero que pagan por impuestos. El monto total recolectado
41
es de C$ 2 millones (de córdobas). Los gastos fueron: C$ 440,000 para escuelas, C$ 1160,000 para
caminos, C$ 320,000 para administración y C$ 80,000 para suministros. Una gráfica de sectores
parece ideal para mostrar el porcentaje de los impuestos que se dedica a caminos, escuelas,
administración y suministros. Convierta las cantidades totales a porcentajes del total general y
represente los porcentajes en una gráfica de pastel.
17. En el Anuario Estadístico 1997 se señala que el valor total de todos los bienes y servicios
producidos en Nicaragua, era de 21 mil millones de córdobas incluyendo todos los sectores de la
economía.
Primarios 21.67
Secundarios 30.48
Terciarios 47.85
T O T A L 100.00
Años
TEMA 2. PROBABILIDADES
OBJETIVOS.
2.1 INTRODUCCION
Debido a l a tolerancia de varias formas de juegos para recreación de la nobleza de Francia e
Inglaterra a mediados del XVII, se suscitó un interés intenso por los juegos de azar, lo cual permitió
que matemáticos como Blaise Pascal, Pierre de Fermat, Jacob Bernoulli, Abraham de Moire y
Thomas Bayes desarrollaran la teoría de las probabilidades.
Como vivimos en un mundo donde somos incapaces de pronosticar el futuro con absoluta certeza, la
necesidad de sortear la incertidumbre nos lleva a estudiar la teoría de probabilidades para conocer
las reglas que nos permitirán estudiar los fenómenos aleatorios.
En la actualidad la teoría de la probabilidad constituye el fundamento de la Estadística Inferencial,
una rama de la Estadística con importantes aplicaciones a situaciones en que interviene la
incertidumbre. En tales circunstancias la Estadística Inferencial permitirá hacer estimaciones de
parámetros basados en la información muestral. Ver aplicaciones de la Estadística en Auditoría,
marketing y Control de calidad.
Comenzaremos este tema estudiando la terminología que usaremos
EJEMPLO 2.1
1: Un contador revisa 10 facturas de una empresa. Luego cuenta el número de facturas con algún
error en su valor total.
EJEMPLO 2.2
2: De una lista formada por todas las cuentas de ahorro de un Banco, seleccionar al azar una y luego
anotar su vida actual.
43
S1 = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }
Aquí decimos que S1 es un espacio muestral discreto porque sus resultados están representados por
valores que tienen interrupción.
Para el ejemplo 2.2
Supongamos una vida máxima registrada en el Banco de 15 años
S2 = ( 0, 15 ]
Aquí S2 es un espacio muestral contínuo porque sus resultados están representados por valores que
no tienen interrupción, es decir , que entre dos resultados posibles siempre existe otro.
EVENTOS
Un evento A respecto a espacio muestral S es un conjunto de resultados posibles del experimento,
esto es,
S
A
Figura 2.1
Para el ejemplo 2.1
Consideremos que el evento A representa “cuenta a lo más 3 facturas con algún error.”
Entonces A = { 0, 1, 2, 3 }
TIPOS DE EVENTOS
Evento imposible ( )
Es un evento que nunca ocurre. S
Para el ejemplo 2.1
Supongamos que el evento F representa “cuenta 12 facturas con algún error” , entonces F =
44
Evento seguro (S )
Es un evento que siempre ocurre.
Para el ejemplo 2.1
El evento S1 es un evento seguro.
Evento simple
Es el que describe solamente una carácterística.
Para el ejemplo 2.1
El evento A es simple.
Evento conjunto
Es el que describe dos o más características.
El evento conjunto de A y B denotado por AB ocurre cuando A y B ocurren juntos.
Para el ejemplo 2.1
Supongamos que el evento B representa “cuenta un número impar de facturas con algún error”, esto
es,
B = { 1, 3, 5, 7, 9 }
Entonces
AB representa “cuenta a lo más 3 y un número impar de facturas con algún error.”
S
A B
AB
Figura 2.2
Evento unión
El evento unión de A y B denotado por AB es aquel que ocurre si A ocurre ó B ocurre ó si ocurren
ambos.
AB = { 0, 1, 2, 3, 5, 7, 9 } y #(AB) = 7
45
Evento complementario
El evento complementario de A denotado por A’ es aquel que ocurre si A no ocurre.
A’ S
A
Figura 2.3
AB =
P(A)
La probabilidad de cualquier evento indicará que tan factible es que ocurra el evento, entre mayor
sea la probabilidad, más grande será la factibilidad de que ocurra el evento.
Ahora estaremos interesados en cómo obtener P(A)
46
EJEMPLO 2.3
Una empresa tiene 200 cuentas por cobrar de las cuales se sabe que 50 tienen un saldo menor que
C$ 12000. Un auditor selecciona una al azar, ¿ cuál es la probabilidad de que tenga un saldo menor
que C$ 12000 ?
Supongamos que el evento A representa que la cuenta tiene un saldo menor que C$12000.
Entonces P(A) =
Aquí suponemos que el experimento se realizó un número n (suficientemente grande) de veces del
cual se observó el número x veces que ocurrió el evento A. De manera que esta probabilidad
puede verse como una frecuencia relativa observada del evento A obtenida de repetir el
experimento un número grande de veces.
EJEMPLO 2.4
La demanda de un artículo durante 360 días de cierto año ha sido la siguiente:
Tabla 2.1
N° artículos N° días
1 100
2 40
3 90
4 50
5 80
360
Suponiendo que el comportamiento de la demanda para el próximo año será similar al anterior,
¿cuál es la probabilidad de que cierto día:
47
EJEMPLO 2.5
Suponga que un profesor de Estadística quiere determinar la probabilidad de que un determinado
estudiante de su clase pase el primer parcial.
Basado en lo que sabe del estudiante sobre:
i) La disciplina que muestra en clase
ii) Las preguntas que hace durante la clase
iii) Las respuestas que da cuando se le pregunta
iv) Las evaluaciones obtenidas en los sistemáticos
v) El grado de interés o esfuerzo que muestra en comprenderle a la asignatura
1. P ( ) = 0 y P(S)=1
P( A B ) = P( A) + P( B )
5. Regla de la adición.
Sean A y B eventos cualesquiera
P( A B ) = P( A ) + P( B ) – P( A B )
48
EJEMPLO 2.6
Supongamos que para cierto día de negociaciones de una acción, los siguientes eventos:
A representa que el precio se mantiene sin cambios
B representa que el precio sube
P( A’ ) = 1 – P( A ) = 1 – 0.64 = 0.36
P( A B ) = P( ) = 0
EJEMPLO 2.7
En una ciudad se seleccionó una muestra de 500 personas para determinar diversas informaciones
relacionadas con el comportamiento del consumidor. Entre las preguntas hechas, se encontraba
“¿Prefiere comprar productos nacionales o importados? ”. De 240 hombres 104 contestaron que
preferían productos nacionales. De 260 mujeres 36 preferían productos nacionales.
Tabla 2.2
i) sea mujer
P( M ) =
49
P( H ) = 1 – P( M ) = 1 – 0.52 = 0.48
P( I ) =
P( H I ) =
v) sea mujer o prefiera productos nacionales
P( M N ) =
Si B es finito entonces
S
B
A AB
Figura 2.4
50
EJEMPLO 2.8
Para el ejemplo 2.7
viii) Suponga que el entrevistado seleccionado es mujer, ¿ cuál es la probabilidad de que
prefiera comprar productos nacionales
P( N M ) =
P( N M ) =
ix) Suponga que el entrevistado seleccionado prefiere comprar productos importados , ¿cuál es
la probabilidad de que sea hombre?
P( H I ) =
Sabemos que
La probabilidad de A1 A2 es igual a la probabilidad del primer evento A1 por la probabilidad del
segundo evento A2 dado que el primer evento A1 ya ocurrió.
EJEMPLO 2.9
Para el ejemplo 2.7
EJEMPLO 2.10
Durante un período específico , el 80% de las acciones ordinarias de una industria que tiene 10
acciones, han aumentado en valor comercial.
Un inversionista selecciona aleatoriamente 2 de esas acciones:
A1
8/10
2/9 N2 (8/10 )( 2/9 ) = 16/90 = 0.1778
Figura 2.5
=
52
Supongamos un experimento aleatorio con su correspondiente espacio muestral S, decimos que los
eventos A1 , A2 ,.........., An forman una partición del espacio muestral S, si se cumple que:
i) Ai Aj = para todo i j
ii) A1 A2 .......... An = S
Cada vez que se realice el experimento aleatorio anterior podemos presentar mediante un árbol de
probabilidad todos sus resultados posibles con sus correspondientes probabilidades.
P(BA1) B
A1
P(A1) B’
P(A2) P(BA2) B
A2
B’
. .
P(An) . .
. .
.
. P(BA ) n B
An
B’
Figura 2.6
EJEMPLO 2.11
Un gerente de crédito clasifica las cuentas a su cargo en 3 tipos:
Tipo 1: buen pagador Tipo 2: pagador atrasado Tipo 3: mal pagador
De los archivos se estima que el 75%, 20% y 5% de las cuentas caen en las categorías 1, 2 y 3
respectivamente. Por experiencia en el trabajo el gerente considera que el 90% de los clientes con
cuentas del tipo 1 tienen casa propia, mientras que el 50% de los clientes con cuentas del tipo 2 y el
20% de los clientes con cuentas del tipo 3 tienen casa propia.
i) ¿ Cuál es la probabilidad de que una nueva aplicación de crédito corresponda a un cliente con
casa propia ?
ii) Suponga que la nueva aplicación corresponde a un cliente con casa propia, ¿ cuál es la
probabilidad de que sea pagador atrasado?
i)
P(B) = P(A1) P(BA1) + P(A2) P(BA2) + P(A3) P(BA3)
= 0.75(0.90) + 0.20(0.50) + 0.05(0.20) = 0.785
ii)
P(A2B) =
EJERCICIO 2.1
El departamento de crédito de una tienda informó que el 30% de sus ventas son en efectivo, el 30%
se pagan con cheques y el 40% son al crédito. Se tiene información de que las compras por más de
C$ 500 en efectivo, con cheques y al crédito son el 25%, 90% y 60% respectivamente
Un persona acaba de decidir comprar un artículo cuyo precio es de C$ 800, ¿ cuál es la probabilidad
de que pague con cheque ?
54
1. Para cada una de las siguientes situaciones, indique cuál de los enfoques (clásico a priori,
clásico empírico o subjetivo) sería más útil para determinar el valor de probabilidad adecuado.
a) La probabilidad de que de un envío de 20 repuestos, del cual se sabe que 3 son defectuosos,
un repuesto escogido aleatoriamente resulte defectuoso.
c) La probabilidad de que la demanda de un artículo, que produce una empresa, sea de 400
unidades para el próximo mes.
f) La probabilidad de que al seleccionar al azar una persona de una clase, que tiene 20 mujeres
y 8 hombres, el resultado sea una mujer.
g) La probabilidad de que las ventas de un artículo que producen una fabrica suban debido al
nuevo nombre.
2. Para cada uno de los siguientes casos, diga si los eventos que se crean son (i) mutuamente
excluyentes, (ii) colectivamente exhaustivos.
3. Determine el valor de probabilidad aplicable a cada una de las siguientes situaciones: Luego
diga qué enfoque utilizo.
a) La probabilidad de seleccionar aleatoriamente una cuenta por cobrar que está en mora, si el
5% de las cuentas están en mora.
55
b) La probabilidad de que una sucursal de una cadena de restaurantes tenga éxito financiero.
c) La probabilidad de accidentes de trabajo en una industria determinada sobre una base anual.
Una muestra al azar de 10 firmas que emplean un total de 8000 personas demostró que
ocurrieron 400 accidentes de trabajo durante un período reciente de 12 meses.
4. La probabilidad de que una nueva política de mercadeo tenga éxito (S) se calculó en 0.60. la
probabilidad de que los gastos para desarrollar la política de mercadeo puedan mantenerse dentro
del presupuesto inicial (B) es 0.50. la probabilidad de que se logren los dos objetivos es 0.30.
c) Tres cuentas (sin reposición), ¿Cuál es la probabilidad de que todas contengan error de
procedimiento?
6. De 100 personas que solicitaron empleo de operador de computadoras en una firma el año
pasado, 40 tenían experiencia anterior (E), 30 tenían certificado ( C ), y 20 tenían experiencia
anterior y certificado.
7. En los datos recolectados en una encuesta sobre la satisfacción de los empleados de la empresa
Omega realizada a una muestra de 400 empleados, los resultados con las categorías desglosadas en
satisfecho y no satisfecho, y progresado y no progresado en la organización, se presentan en la
siguiente tabla de contingencia:
Satisfacción en el Avance
trabajo Progresado ( P ) No progresado ( P’ ) Total
Satisfecho ( S ) 194 162 356
No satisfecho ( S’ ) 14 30 44
Totales 208 192 400
8. En una gran área metropolitana se seleccionó una muestra de 500 encuestados para determinar
información diversa respecto al comportamiento de los consumidores. Entre las preguntas
formuladas estaba “¿disfruta comprar ropa ?”. De 240 hombres, 136 respondieron que sí. De las
260 mujeres, 44 respondieron que sí.
a) Construya una tabla de contigencia para evaluar las probabilidades.
b) Dé un ejemplo de: un evento simple, un evento conjunto.
c) ¿Cuál es el complemento de “disfruta comprar ropa”?.
d) ¿Cuál es la probabilidad que un encuestado elegido aleatoriamente:
d.1. Sea hombre?
d.2. Disfrute comprar ropa?
d.3. Sea una mujer y disfrute comprar ropa?
d.4. Sea un hombre y no disfrute comprar ropa?
d.5. Sea una mujer o no disfrute comprar ropa’
e) Suponga que el encuestado elegido es un hombre. ¿Cuál es la probabilidad que no disfrute
comprar ropa?
f) ¿Disfrutar de comprar ropa y el sexo del individuo son estadísticamente independientes?.
9. El director de una gran agencia de empleo desea estudiar las diversas características de sus
solicitantes de trabajo. Se ha seleccionado una muestra de 200 solicitantes para su análisis. Sesenta
solicitantes habían tenido sus trabajos actuales durante al menos cinco años; ochenta de los
solicitantes son graduados universitarios; 25 de los graduados universitarios duraron en sus trabajos
al menos cinco años.
a) ¿Cuál es la probabilidad que un solicitantes escogido aleatoriamente?.
a.1. Sea un graduado universitario?
a.2. Sea un graduado universitario y haya tenido su trabajo al actual menos de cinco años?.
a.3. Sea un graduado universitario o haya tenido su trabajo actual al menos de cinco años?
57
10. Se han llevado acabo numerosos estudios intensivos de la planeación de los consumidores para
la compra de bienes duraderos como televisores, refrigeradores, lavadora, etc. En uno de estos
estudios se preguntó a 1000 individuos de una muestra aleatoriamente seleccionada si estaban
planeando comprar una nueva televisión en los siguientes 12 meses. Un año después se entrevistó a
las mismas personas para ver si realmente compraron una nueva T.V. la respuesta a ambas
entrevistas se tabula de manera cruzada a continuación.
11. Se ha emprendido una encuesta para determinar si existe una relación entre el lugar de
residencia y la propiedad de un automóvil. Se seleccionó una muestra aleatoria de 500 personas con
los resultados mostrados a continuación:
12. Una compañía embotelladora de refrescos mantiene registros respecto al número de botellas
inaceptables obtenidas de las máquinas de llenado y coronado. Basándose en datos anteriores, la
probabilidad de que una botella proviniera de la máquina I y fuera inaceptable era de 0.01 y la
probabilidad de que una botella proviniera de la máquina II y fuera inaceptable era 0.025. la mitad
de las botellas se llena en la máquina I y la otra mitad se llena en la máquina II.
Anuncio de
Televisión Recuerda ( R ) No recuerda ( R’ ) Total
Producto
14. Una profesora ha estado enseñando Estadística durante muchos años. Sabe que el 80% de los
estudiantes cumplen con los problemas asignados. Determinó que de los alumnos que hacen las
tareas, 90% aprobarán el curso. De aquellos estudiantes que no realizan la tarea, 40% aprobarán.
Miguel Sánchez tomó Estadística con la profesora y tuvo calificación aprobatoria ¿cuál es la
probabilidad de que sí haya hecho las tareas?.
15. Un comprador de ropa de una gran tienda departamental compra anualmente 20% de las piezas
a un fabricante A, 30% a un segundo fabricante B y el 50% restante a diversos proveedores. De la
ropa comprada a A se vende el 80%; 75% de la de B y 90% de los restantes. ¿Cuál es la
probabilidad de que una pieza que no se vendió al final de la temporada, provenga del fabricante B?
16. Martín Pérez, gerente del departamento de crédito de Epsilon, sabe que la compañía utiliza tres
métodos para exhortar a pagar a las personas con cuentas morosas. De los datos que se tienen
registrados, él sabe que 70% de los deudores son visitados personalmente, 20% se les sugiere que
paguen vía telefónica y el restante 10% se le envía una carta. Las probabilidades de recibir alguna
cantidad de dinero debido a los pagos de una cuenta con estos tres métodos son 0.75, 0.60 y 0.65,
respectivamente. El señor Pérez acaba de recibir el pago de una de las cuentas vencidas. ¿Cuál es la
probabilidad de que la petición de pago se haya hecho:
a) Personalmente?
b) Por teléfono?
c) Por correo?
17. El gerente de comercialización de una compañía fabricante de juguete está planeando introducir
un nuevo juguete en el mercado. En el pasado, 40% de los juguetes introducidos por la compañía
han tenido éxito y 60% no lo han tenido. Antes de que se comercialice el juguete, se lleva a cabo un
estudio de mercado y se compila un informe, ya sea favorable o desfavorable. Anteriormente, 80%
de los juguetes exitosos recibieron informes favorables y 30% de los juguetes no exitosos también
recibieron informes favorables.
a) Suponga que el estudio de mercado da un informe favorable sobre el nuevo juguete. ¿Cuál
es la probabilidad de que el nuevo juguete tenga éxito?
b) ¿Qué proporción de los juguetes nuevos reciben informes favorables de estudios de
mercado?.
18. Una empresa compra cierto tipo de pieza que es suministrada por tres proveedores: el 45%de las
piezas son compradas al primer proveedor resultando defectuoso el 1%. El segundo proveedor
suministra el 30% de las piezas, y de ellas es defectuoso el 2%. Las restantes piezas provienen del
tercer proveedor, siendo defectuoso el 3% de la mismas. En un control de recepción de artículos se
selecciona una pieza al azar y es defectuosa. Calcular la probabilidad de que la haya suministrado el
segundo proveedor.
60
19. Un analista de una empresa manufacturera estima que la probabilidad de que una empresa
competidora tenga planes para comenzar a fabricar equipo nuevo en los próximos tres años es de
0.30 y de 0.70 de que la empresa no tenga tales planes. Si la empresa de la competencia sí tiene
esos planes, definitivamente se construirá una nueva instalación fabril. Si la empresa de la
competencia no tiene esos planes, existe aún una probabilidad de 60% de que se construya la nueva
instalación fabril por otras razones,
a) Al utilizar E para la decisión de participar en el campo del equipo nuevo y F para la adición de
una nueva instalación fabril, ilustre los eventos posibles mediante un diagrama de árbol.
b) Suponga que la empresa de la competencia, de hecho, ha comenzado a trabajar en la nueva
fábrica. Con esa información, ¿cuál es la probabilidad de que la empresa haya decidido ingresar
al campo del nuevo equipo?
20. Ochenta por ciento de material de vinil que se recibe del vendedor A es de calidad excepcional,
en tanto que solo cincuenta por ciento de material de vendedor B es de calidad excepcional. Sin
embargo, la capacidad de fabricación del vendedor A es limitada y, por esa razón, solo cuarenta por
ciento del vinil que la empresa adquiere proviene de este vendedor. El sesenta por ciento restante se
compra al vendedor B. Se inspecciona un embarque de vinil que acaba de llegar y se encuentre que
es de excepcional calidad. ¿Cuál es la probabilidad de que provenga del vendedor A?
21. En cierta universidad, el 70% de los estudiante vienen de instituciones privadas y el 30% de
instituciones estatales. Se sabe que el 25% de los estudiantes que vienen de instituciones privadas y
el 10% que vienen de instituciones estatales poseen vehículo propio.
a) Si se selecciona un alumno al azar de esta universidad, ¿cuál es la probabilidad de que tenga
vehículo propio?
b) Si el alumno seleccionado posee vehículo propio, ¿cuál es la probabilidad de que sea de los
que vienen de instituciones estatales?
c) Si el alumno seleccionado posee vehículo propio, ¿cuál es la probabilidad de que sea de los
que vienen de instituciones privadas?
22. La constructora Cedro, S.A. trata de determinar si debería presentar licitación para la
construcción de un nuevo centro comercial. En el pasado, la principal competidora de Cedro, la
constructora Nardo, S.A. ha presentado licitaciones el 70% de las veces. Si Nardo no presenta
licitación sobre un trabajo, la probabilidad de que Cedro lo obtenga es del 0.50; si Nardo presenta
licitación, la probabilidad de que lo obtenga Cedro es de o.25.
a) Si la constructora Cedro obtienen el trabajo, ¿cuál es la probabilidad de que Nardo no haya
presentado licitación?
b) ¿Cuál es la probabilidad de que la constructora Cedro obtenga el trabajo?
61
3.1 INTRODUCCION
En el tema anterior utililizabamos letras como A, B, C, para representar eventos asociados a un
experimento aleatorio y nos interesaba calcular, digamos P(A). Ahora utilizaremos variables
aleatorias como X, Y, Z, para describir los eventos asociados al mismo experimento aleatorio, pero
ahora el interés será calcular la probabilidad de que la variable aleatoria , digamos X, tome algún
valor particular x. Por tanto, será de mucha utilidad práctica la construción de distribuciones de
probabilidad de una variable aleatoria X y la determinación de sus características principales.
Más adelante estudiaremos algunas distribuciones clásicas de probabilidad de variables aleatorias
discretas, que llamaremos modelos probabilísticos.
Por ahora podemos iniciar con el concepto de variable aleatoria.
VARIABLE ALEATORIA
Sea S el espacio muestral asociado a un experimento aleatorio. Una función X que signa a cada uno
de los elementos w de S un número x, se llama variable aleatoria.
w x R
X (w) = x
Figura 3.1
EJEMPLO 3.1
Una empresa tiene 100 cuentas por cobrar de las cuales 30 tienen su saldo incorrecto. Un auditor
selecciona al azar y sin reposición 2 de dichas cuentas y luego registra el número de cuentas con
saldos incorrectos.
62
S
C2 C1 C2
C1
2 C 1 I2
C2 I1 C 2
I1
I2 I1 I2
Figura 3.2
Como estamos interesados en registrar el número de cuentas que tienen su saldo incorrecto, es útil
definir una variable aleatoria X que asigne a cada elemento de S su número de cuentas con saldo
incorrecto, o bien de una manera más sencilla, que la variable aleatoria X represente el número de
cuentas con saldos incorrectos.
X
S R
C1 C2 0
C 1 I2
1
I1 C 2
I1 I2 2
Figura 3.3
Así, X ( C1 C2 ) = 0 ; X ( C1 I2 ) = 1 ; X ( I1 C2 ) = 1 ; X ( I1 I2 ) = 2
EJEMPLO 3.2
Registrar el tiempo que tarda un economista en revisar un documento de una empresa.
Como el resultado del experimento es ya la característica numérica que queremos registrar entonces
vamos a definir la variable aleatoria X como una función identidad que asigne a cada tiempo w
posible que tarda en revisar el documento el mismo tiempo w, esto es,
X( w ) = w
o bien de una manera más sencilla, que la variable aleatoria X represente el tiempo que tarda el
economista en revisar el documento.
Para el ejemplo 3.1, X es una variable aleatoria discreta porque su conjunto de valores posibles es
finito.
X es una variable aleatoria continúa si su conjunto de valores posibles es infinito no numerable, esto
es, para dos elementos cualesquiera de este conjunto siempre existirá otro entre ellos.
Para el ejemplo 3.2, X es una variable aleatoria continúa. Porque entre dos tiempos posibles
siempre existirá otro.
El conjunto de todas los elementos w de S que tienen asignado (Según X) un mismo valor particular
x, será un evento que denotaremos por X = x . Esto es,
{ w S | X( w ) = x } es equivalente a X = x.
X
S
x R
Figura 3.4
64
X x , X x , a X b , X x , X x , a X b , etc.
X = 1
X = 0.
“Registra al menos una cuenta con saldo incorrecto es equivalente a { C I , I C , I I } que también
es equivalente a
X 1
P( A | B ) = P( A )
Extendiendo esta idea, definimos que las variables aleatorias discretas X ,Y son independientes si
Para cualquier xi , yj , P( Y = yj ) | X = xi ) = P( Y = yj )
Para cualquier x, y , P( Y y ) | X x ) = P( Y y )
Esto es, la ocurrencia del evento X x no afecta en nada a la ocurrencia del evento Y y
La condición anterior también debe cumplirse para eventos expresados de cualquier otra forma.
65
Una distribución de probabilidad de una variable aleatoria X es una función que asigna a cada valor
posible xi un número f (xi ) = P ( X = xi ) llamado la probabilidad de xi tal que:
i) f ( xi ) 0
ii) f ( xi ) = 1
xi R
0 1
Figura 3.5
EJEMPLO 3.3
Recordando que X representa el número de cuentas con saldos incorrectos en el ejemplo 3.1,
construya la distribución de probabilidad de X.
Arbol de probabilidad
69/99 C2 C1 C2 0 0.4879
C1
70/100
30/99 I2 C 1 I2 1 0.2121
70/99 C2 I1 C 2 1 0.2121
30/100
I1
29/99 I2 I1 I2 2 0.0879
Figura 3.6
f ( 0 ) = P ( X = 0 ) = 0.4879
f ( 1 ) = P ( X = 1 ) = 0.2121 + 0.2121 = 0.4242
f ( 2 ) = P ( X = 2 ) = 0.0879
66
1. Una tabla
Tabla 3.1
xi f (xi )
0 0.4879
1 0.4242
2 0.0879
1.0000
3. Una gráfica.
Figura 3.7
EJEMPLO 3.4
Construir la función de distribución acumulada de la variable aleatoria X del ejemplo 3.1
Retomemos la distribución de probabilidad de la variable aleatoria X del ejemplo 3.3 y observemos
67
2. Una gráfica
Figura 3.8
Algunas características de F ( x )
d) f ( x ) = F ( x ) - F ( x – 1 ) si x es un número natural.
EJERCICIO 3.1
Las llegadas de clientes a un almacén durante 80 días escogidos aleatoriamente se presenta en la
siguiente tabla.
Tabla 3.2
No. Llegadas No. días
0 15
1 25
2 35
3 5
80
Sea f(xi ) una distribución de probabilidad de una variable aleatoria discreta X. La esperanza de X
o valor esperado de X se denota y define como:
E(X) = xi f ( xi )
E ( X ) puede considerarse como una media aritmética ponderada (donde la ponderación de cada x i
sería la probabilidad f(xi)) esto es la media que espero obtener de un gran número de observaciones
independientes de X, motivo por el cual escribiremos.
E(X) = X ( la media de X )
V (X) = E [ (X - X )2 ] = ( xi - X )2 f ( xi )
69
EJEMPLO 3.5
Un vendedor de computadoras tiene la oportunidad de trabajar con cierto comerciante. Supongamos
que el vendedor ha evaluado las posibilidades de la venta semanal de la manera indicada abajo.
Tabla 3.3
No. Computadoras Probabilidad
0 0.1
1 0.2
2 0.3
3 0.4
Hagamos que la variable aleatoria X represente el número de computadoras que podría vender por
semana.
xi f( xi ) xi f( xi ) xi2 f( xi )
0 0.1 0 0
1 0.2 0.2 0.2
2 0.3 0.6 1.2
3 0.4 1.2 3.6
E ( X ) = 2 computadoras y V ( X ) = 5 - [ 2 ]2 = 5 - 4 = 1 computadora2
EJEMPLO 3.6
Para la distribución de probabilidad de la variable aleatoria X del ejemplo 3.3
ii) Calcule la varianza y la desviación estándar del número de cuentas con saldos incorrectos
(interprete el resultado)
xi f ( xi ) xi f ( x i ) ( xi - X )2 f ( xi ) xi2 f ( xi )
0 0.4879 0 0.1756 0
1 0.4242 0.4242 0.0679 0.4242
2 0.0879 0.1758 0.1723 0.3516
i)
E(X) = = 0.6 cuentas con saldos incorrectos.
Este resultado podemos interpretarlo diciendo que a medida que el auditor vaya
seleccionando 2 cuentas de las 100 muchas veces esperamos en promedio que 0 (ninguna) ó
1 cuenta con saldo incorrecto, pero un poco más 1 que ninguna.
ii)
Este valor representa la variación de X alrededor de X. Esto quiere decir que el número de
cuentas con saldos incorrectos variará entre 0 (ninguna) y 1 la mayor parte de las veces que
el auditor seleccione 2 cuentas de las 100.
EJEMPLO 3.7
Un fabricante produce cierto artículo de tal modo que el 10% son defectuosos. Si se produce un
artículo defectuoso, el fabricante pierde C$ 10, mientras que un artículo no defectuoso le produce
una ganancia de C$ 50.
Determine la ganancia esperada por artículo. Interprete el resultado.
71
Supongamos que X representa la ganancia por artículo y que toma los valores – 10 si se produce un
artículo defectuoso y 50 si se produce no defectuoso.
xi f ( xi ) xi f (xi )
-10 0.10 -1
50 0.90 45
44
X = E ( X ) = C$ 44
Este resultado se interpreta así: Cuando el fabricante produzca muchos artículos espera una
ganancia promedio por artículo de C$ 44
EJERCICIO 3.2
Para la distribución de probabilidad de X del ejercicio 3.1
i) Calcule el número esperado de llegadas de clientes (interprete el resultado).
ii) Calcule la varianza y la desviación estándar del número de llegadas de clientes (interprete el
resultado).
1) E (c ) = c ; V(c) = 0
2) E ( c X ) = c E ( X ) ; V ( c X ) = c2 V ( X )
3) E (a + b X ) = a + b E ( X ) ; V ( a + b X ) = b2 V ( X )
EJEMPLO 3.8
Para el ejemplo 3.5 considere las siguiente situaciones:
1) Si el comerciante le ofrece al vendedor una comisión de C$ 500 por computador vendido
determine:
i) El ingreso semanal esperado del vendedor.
72
ii) Las desviación estándar del ingreso semanal. Interprete los resultados.
Entonces Y = 500X
Por tanto a medida que transcurran las semanas, el vendedor espera tener un ingreso semanal
promedio de C$ 1000 y su ingreso semanal variará la mayor parte de las veces entre C$ 500 y C$
1500.
2) Si el comerciante le ofrece al vendedor pagarle C$ 800 fijos por semana más C$ 400 por
computador vendidor, determine:
EJEMPLO 3.9
Un negociante posee dos restaurantes. Sean X , Y, que se suponen independientes entre sí, las
ventas diarias de dichos restaurantes. El negociante ha reunido datos de ventas durante muchos
73
años, y de acuerdo con sus registros, la media y la varianza de X son de C$ 5000 y C$ 100
respectivamente y la media y la varianza de Y son de C$ 7000 y C$ 200 respectivamente.
3.5.1 INTRODUCCION
Hay situaciones en las cuales el cumplimiento de ciertas condiciones experimentales nos lleva a
utilizar lo que llamaremos un modelo probabilístico, esto es , una distribución de probabilidad de
una variable aleatoria definida por una expresión matemática
Estos modelos tendrán un nombre y serán estudiados en esta tema.
Para poder comprender estas expresiones matemáticas necesitaremos estudiar los siguientes
conceptos:
EL FACTORIAL DE UN NUMERO
Sea n un número natural.
El factorial de n se denota y define así
n! = n ( n – 1 ) (n – 2 ) . . . . . . 1
Nota: 0! = 1
De manera que:
1! = 1
2! = 2 (1) = 2
3! = 3 (2) (1) = 6
4! = 4 (3) (2) (1) = 24
De manera que
75
, ,
calculemos ahora
INTRODUCCION
La distribución binomial es una distribución de probabilidad de una variable aleatoria discreta, que
será aplicable cada vez que se suponga un proceso de Bernoulli.
PROCESO DE BERNOULLI
Es un proceso de muestreo, esto es, una muestra de tamaño n que resulta de repetir un mismo
experimento aleatorio (que llamaremos ensayo) n veces y que cumple las siguientes condiciones:
1) Los resultados posibles de cada ensayo pueden clasificarse en dos eventos E y F mutuamente
excluyentes y exhaustivos que llamaremos posteriormente éxito y fracaso respectivamente.
2) Las probabilidades de (E) y (F) permanecen constantes en todos los ensayos, es decir, el
proceso es estacionario.
EL MODELO BINOMIAL
Supongamos que estamos ante un proceso de Bernoulli con n ensayos donde uno de los dos eventos
será el éxito y la probabilidad de que ocurra un éxito se representará por p.
Estaremos interesados en una variable aleatoria X que representará el número de éxitos en la
muestra, donde el objetivo principal será obtener una expresión matemática que defina a la
distribución de probabilidad de X
Puede demostrarse que la siguiente expresión matemática define una distribución de probabilidad de
X llamada distribución binomial con parámetros n y p , o modelo binomial con parámetros n y p.
76
CARACTERISTICAS.
V(X) = np(1–p)
EJEMPLO 3.10
En un archivo hay 5 documentos de la empresa A y 15 documentos de la empresa B. Seleccionar al
azar y con reposición 4 documentos anotando la empresa correspondiente de cada uno.
EJEMPLO 3.11
Debidos a las altas tasas de interés, una firma informa que 30% de sus cuentas por cobrar de otras
firmas comerciales están vencidas. Un contador escoge aleatoriamente una muestra de 5 cuentas.
3. Además cualquier serie de eventos V y V’, obtenidos de los 5 ensayos, constituyen eventos
independientes.
P(X1) = 1 - P(X=0)
= 1 - 0.1681 = 0.8319
EJEMPLO 3.12
La probabilidad de que un presunto cliente de un centro comercial escogido aleatoriamente haga una
compra es 0.20. Un vendedor visita a 15 presuntos clientes.
= 1 - 0.3980 = 0.602
2. Determine el número esperado de ventas del vendedor y la desviación estándar del número de
ventas.
E ( X ) = np = 15 ( 0.20 ) = 3 ventas
Interpretar el resultado
Cuando estamos ante un proceso de muestreo con n ensayos que sólo cumple la primera condición
del proceso de Bernoulli, significa que cada elemento se seleccionó sin reposición de una
población finita de tamaño N, lo cual provocó un cambio sistemático en la probabilidad de un
éxito y un fracaso a medida que se retiraron los elementos de la población. De manera que ahora no
estaremos ante un proceso de Bernoulli, pero será de interés una variable aleatoria X que
representará el número de éxitos en la muestra.
EL MODELO HIPERGEOMETRICO
Puede demostrarse que la siguiente expresión matemática define una distribución de probabilidad de
X llamada distribución hipergeométrica con parámetros n, N y A, o modelo hipergeométrico con
parámetros n, N y A.
donde
CARACTERISTICAS.
Hagamos que represente la proporción de éxitos en la población y que 1 – p representa
la proporción de fracasos en la población.
EJEMPLO 3.12
Un gerente selecciona aleatoriamente 3 individuos de un grupo de 10 empleados para asignarlos a
un estudio de clasificación de salarios. Suponga que 4 de los empleados trabajaron previamente en
proyectos semejantes.
Este es un proceso con n = 3 ensayos, que sólo cumple la primera condición de un proceso de
Bernoulli porque los 3 empleados se seleccionaron al azar sin reposición de una población finita
de tamaño N = 10.
Observe que el evento E (con experiencia) será el éxito y que por tanto tendremos que:
Como p =
EJEMPLO 3.13
Un producto industrial particular se envía en lotes de 200. Como la prueba para determinar si un
artículo está defectuoso es costosa, diseñó un plan de muestreo que recomienda muestrear 5
artículos de cada lote y rechazar el mismo si resulta más de un artículo defectuoso. Si se rechaza
se prueba cada artículo del lote. Suponga que un lote contiene 8 artículos defectuosos.
Aquí hay un proceso de muestreo con n = 5 ensayos que sólo cumple la primera condición de un
proceso de Bernoulli porque el muestreo se hace sin reposición de una población finita.
Observe que el evento D (sale defectuoso) es el éxito y que por tanto tendremos que:
N : representa el número de artículos del lote.
A : representa el número de artículos defectuosos en el lote.
n : representa el número de artículos en la muestra.
x : representa el número de artículos defectuosos en la muestra.
P (aceptar el lote) = P ( X 1 ) = P ( X = 0 ) + P ( X = 1 )
Esto es, el tamaño de la muestra es el 2.5% del tamaño de la población. Luego se cumple la relación
empírica de que n 0.05 N. Podemos utilizar una distribución binomial con parámetros n = 5
y como una aproximación de la distribución hipergeométrica con
parámetros n = 5, N = 200 y A = 8.
PROCESO DE POISSON.
Consideremos una unidad t de tiempo, longitud, superficie, volumen, etc. dividida en porciones t
muy pequeñas. Un proceso de muestreo resultante de la posible repetición de un mismo
experimento aleatorio ( que llamaremos ensayo y cuyos resultados posibles serán llamados
observaciones en la porción t ) será un proceso de Poisson si cumple las siguientes condiciones:
EL MODELO DE POISSON
En un proceso de Poisson estaremos interesados en una variable aleatoria X que representará el
número de éxitos en la unidad de tiempo, superficie, volumen, etc. Supongamos que (lambda)
representa el número promedio de éxitos en la unidad de tiempo, superficie, volumen, etc, y que este
valor se conoce por experiencia.
Entonces la distribución de probabilidad de X definida por la siguiente expresión matemática, será
la distribución de Poisson con parámetros , o simplemente el modelo de Poisson con parámetro .
, x = 0, 1, 2,
e = 2.71828
84
CARACTERISTICAS.
Cada vez que se especifica el parámetro se produce una distribuciónde Poisson particular.
EJEMPLO 3.14
Suponga que el número promedio de vehículos que llegan a un parqueo es de 10 por hora.
¿ Cuál es la probabilidad de qué en una hora determinada lleguen 4 vehículos ?
E : llega un vehículo.
F : no llega ninguno vehículo. Suponga que E es el éxito y F el fracaso.
EJEMPLO 3.15
Suponga que el número promedio de llamadas que llegan a una Central Telefónica es de 120 por
hora.
1) Construya la expresión matemática que define a la distribución de probabilidad del número de
llamadas que ocurren en 3 minutos.
i) Se reciban 2 llamadas
P(X 1) = 1 - P(X = 0)
P ( X 1 ) = 1 - 0.0025 = 0.9975
EJEMPLO 3.16
En una fábrica han ocurrido accidentes a razón de una cada dos meses. Suponga que ocurrieron en
forma independiente.
Entonces vamos a utilizar un modelo de Poisson con = = 0.50 accidentes por mes
= = 6 accidentes
EJEMPLO 16.
Se sabe que el 1% de las cuentas de ahorro de un banco están desactivadas. Se selecciona
aleatoriamente una muestra de 30 cuentas.
¿Cuál es la probabilidad de que 3 cuentas esten desactivadas?
Podríamos utilizar una distribución binomial con n = 30 y p = 0.01, pero como se cumple la
regla empírica podemos usar la distribución de Poisson con = 30 ( 0.01 ) = 0.30
1. En la siguiente tabla se muestra el número de camionetas que se han solicitado por día a, una
agencia que renta vehículos, en un período de 50 días.
3 10
4 16
5 18
6 4
7 2
50
1 5
2 8
3 6
4 1
20
3. El número de revistas vendidas por día en una tienda durante 30 días se presenta en la siguiente
tabla.
88
10 3
11 7
12 10
13 8
14 2
30
Si X representa el número de revistas vendidas por día.
7. Una empresa tiene 4 cuenta por pagar de las cuales una tiene un saldo mayor que C$ 10,000.
89
Un contador selecciona al azar una cuenta después de la otra, sin reponerla, hasta registrar inclusive
la que tiene un saldo mayor que C$ 10,000.
¿Cuántas cuentas espera seleccionar hasta registrar inclusive la que tiene un saldo mayor que C$
10,000 ? Interpretar el resultado.
9. Un vendedor ha descubierto que las probabilidades del número de ventas por día, se presentan
de la siguiente manera:
1 0.19
2 0.45
3 0.29
4 0.07
10. Un agente de ventas ha recibido una oferta de trabajo de una casa comercial que distribuye
cocinas eléctricas.
Suponga que X es la variable aleatoria que representa el número de cocinas vendidas en una semana
y que la distribución de probabilidad de esas ventas es.
x1 f ( xi )
0 0.30
1 0.35
2 0.25
3 0.10
Si la casa comercial ofrece al agente de ventas pagarle C$ 500 fijos por semana, más C$ 300 por
cada cocina que venda, determine.
a) El ingreso semanal esperado del agente de ventas después de muchas semanas.
b) La desviación estándar del ingreso semanal del agente. Interpretar el resultado.
90
11. Una compañía tiene una sucursal en una ciudad con ventas diarias en córdobas representada por
la variable aleatoria X y otra sucursal en otra ciudad con ventas diarias en córdobas representada por
la variable aleatoria Y. Al analizar los registros de la compañía por largos períodos anteriores, se ha
encontrado que la media y la varianza de X son C$ 4,500 y C$ 340 respectivamente, y la media y la
varianza de Y son C$ 5,500 y C$ 300 respectivamente.
Si la variable aleatoria Z representa el total de ventas diarias en ambas sucursales, determine:
a) Z
b) Z
12. Un vendedor de paraguas gana C$ 30 en días de lluvias; cuando hay días soleados (no lluvia)
pierde C$ 6. La probabilidad de que un día sea lluvioso es de 40% ¿Que ganancia espera tener por
día a largo plazo?
13. En una empresa de negocios una persona puede obtener ganancias diarias de $ 300 con una
probabilidad 0.6 o experimentar una pérdida de $ 100 con probabilidad de 0.4.
¿Qué ganancia espera tener por día a largo plazo?
14. Se tienen dos granjas para la siembra de cierto cultivo. Se calcula que en la primera granja el
cultivo en cuestión producirá una utilidad anual de $ 20,000 si tiene éxito, y una pérdida anual de $
2,000 si no lo tiene.
Se estima también que en la segunda granja el cultivo producirá una utilidad anual de $ 25,000 si
tiene éxito, y una perdida anual de $ 5,000 si no lo tiene. Si la probabilidad de éxito en cada granja
es ½.
¿En qué granja se debe sembrar el cultivo con el fin de elevar al máximo las utilidades
esperadas?
¿Como se afectaría la decisión si la probabilidad fuera ¼ en vez de ½ ?
15. Si la probabilidad de que, en un momento dado, el precio del barril de petróleo en el Mercado
Mundial se mantenga constante es 0.46; las probabilidades de que el precio aumente $ 0.50 ó $ 1.00
son respectivamente 0.17 y 0.23 y la probabilidad de que el precio disminuya $ 0.25 es 0.14, ¿Cuál
es el aumento esperado en el precio del barril de petróleo?
16. Suponga que el 40% de los empleados de una gran firma están a favor de la representación
sindical, y que se pide una respuesta anónima a una muestra aleatoria de 10 empleados.
17. La probabilidad de que un posible cliente haga una compra cuando un vendedor se comunique
con él es 0.40. Si un vendedor selecciona aleatoriamente de un archivo 3 posibles clientes y se
comunica con ellos.
a) Exactamente 3 empleados?
b) Menos de 3 empleados?
c) Por lo menos 4 empleados?
19. Un gerente de un banco sabe por experiencia que, en promedio, el 10% de los clientes de
préstamos fallan en sus pagos. Un día el gerente autoriza 7 préstamos.
2. ¿Cuántos clientes espero que fallen en sus pagos después de muchas autorizaciones de ese
tipo.
3. Calcule la desviación estándar del número de clientes que fallan en sus pagos.
20. Con base en la experiencia anterior, el 15% de las facturas de una compañía que vende libros por
correo están incorrectas. Si se selecciona una muestra aleatoria de 3 facturas actuales,
22. La probabilidad de que un vendedor de seguros efectúe la venta en su primer visita a un cliente
nuevo es de 0.25. Si el vendedor va a visitar hoy a 3 nuevos clientes,
23. Un auditor del Departamento del Impuesto sobre la Renta está seleccionando una muestra de 6
declaraciones de impuestos de personas de una profesión particular, para una posible auditoría. Si
dos o más de ellas indican deducciones “no autorizadas”, se auditará todo el grupo (población) de
100 declaraciones. ¿Cuál es la probabilidad de una auditoría más detallada si el porcentaje de
declaraciones incorrectas es:
a) 25 ?
b) 30 ?
c) Comente las diferencias en sus resultados dependiendo del porcentaje real de declaraciones
incorrectas.
25. Un auditor esta analizando los documentos por pagar de una empresa comercial. En este
momento hay 800 documentos firmados por esa empresa. Como el número de documentos es
relativamente elevado, el auditor decide extraer una muestra de 8 documentos e investigarlos. La
decisión de aprobar la cuenta o de seguir investigando depende del resultado de la nuestra. El
auditor decide certificar las cuentas por pagar, si a lo más uno de los 8 documentos muestreados es
erróneo, y continuar investigando si encuentra dos o más documentos erróneos.
Si en realidad hay 16 documentos erróneos.
a) ¿Cuál es la probabilidad de que el auditor certifique las cuentas?
b) ¿Cuál es la probabilidad de que decida continuar investigando?
Sugerencia: Aproxime las probabilidades con una distribución binomial.
26. Se embarcan motores eléctricos pequeños en lotes de50. Antes de que tal cargamento sea
aceptado, un inspector elige 5 motores y los inspecciona. Si ninguno de los motores probados es
defectuoso, el lote es aceptado. Si se encuentra que uno o más son defectuosos, se inspecciona el
cargamento completo. Suponiendo que en realidad hay 3 motores defectuosos en el lote.
¿Cuál es la probabilidad de que no sea necesaria una inspección completa?
27. Un representante de ventas debe visitar 6 ciudades en un viaje. Suponga que existen 10 ciudades
en el área geográfica a visitar, de las cuales 6 de ellas son mercados primarios para el producto en
cuestión, mientras que las otras 4 constituyen mercados secundarios. Si el vendedor elige en forma
aleatoria las 6 ciudades que va a visitar.
28. En la Contraloría General de la República (CGR) hay 20 solicitudes para trabajar como auditor.
Si se aprueban 10 solicitudes, ¿cuál es la probabilidad de qué se encuentren las 5 mejores de todas
las solicitudes?
29. El número promedio de llamadas por minuto recibidas en un taller de servicio de televisión es de
1.2
1. Determine la expresión matemática que define la distribución de probabilidad del número de
llamadas recibidas por minuto
28. Los empleados de una oficina del Banco Central atienden como promedio120 personas en una
hora de aglomeración. Si se sabe que como máximo estos empleados pueden atender 3 personas por
minuto, ¿Cuál es la probabilidad de que en un minuto dado:
a) no haya cola en la oficina?
b) haya cola en la oficina?
c) hayan 3 personas en la cola de la oficina?
29. Suponga que el número de defectos por yarda cuadrada de cierto tipo de tela tiene una
distribución de probabilidad de Poisson. Según la experiencia de la fábrica, el número promedio de
defectos es de 1.5. Calcular la probabilidad de que una yarda cuadrada tenga:
a) Tres defectos o menos.
b) Entre 3 y 5 defectos.
30. Una oficina policial del país Homicilandia reporta que en dicho país hay un número promedio de
2 homicidios diarios.
1. Construya la expresión matemática que define la distribución de probabilidad del número de
homicidios diarios.
2. Determine la probabilidad de que en un día determinado haya:
a) menos de 3 homicidios.
b) Al menos 2 homicidios.
31. Desde el año 1998, la clausura de bancos por problemas financieros ha ocurrido a razón de 5.7
clausuras por año, en promedio. Suponga que el número de cierres X en un determinado período de
tiempo tienen una distribución de probabilidad de Poisson.
a) Encuentre la probabilidad de que por lo menos tres bancos sean clausurados durante un año
determinado.
b) Encuentre la probabilidad de que ningún banco sea clausurado durante un período de 4
meses.
32. El conmutador telefónico de una empresa puede manejar un máximo de 5 llamadas por minuto.
Si la experiencia indica que recibe un promedio de 120 llamadas por hora, encuentre la probabilidad
de que en un determinado minuto el conmutador esté sobrecargado.
33. Se supone según la experiencia que el 2% de las facturas de una empresa que vende libros por
correo están incorrectas. Si se selecciona una muestra aleatoria de 20 facturas, encuentre la
probabilidad de que cuando menos una factura este incorrecta
Sugerencia: Aproxime la probabilidad con una distribución de Poisson.
34. Para el ejercicio 21 suponga que se expone una muestra de 30 insectos al insecticida.
¿Cuál es la probabilidad aproximada, según la distribución de Poisson, de que
a) sobreviva un insecto
b) no sobreviva ninguno
95
OBJETIVOS.
4.1 INTRODUCCION
Si x1, x2, , xk son todos los valores admisibles de una variable aleatoria discreta X entonces
cada valor xi contribuye con una cantidad f (xi) al total:
Cuando una variable aleatoria X es continua no tiene sentido hacer una suma de probabilidades en
el sentido anterior ya que su conjunto de valores posibles es no numerable.
En este caso, se generalizará el concepto de suma ( ) con el concepto de integral ( ).
Por tanto, cuando la variable aleatoria sea contínua será necesario introducir el siguiente concepto
que sustituya al de función de probabilidad de una variable aleatoria discreta.
Esto es, el área que existe entre la función, el eje x y las rectas x = a y x = b.
96
f(X)
a b X
Figura 4.1
No será interés hablar de la probabilidad de que X tome un valor particular a, ya que siempre
tendremos que:
P(X = a) = 0
Por esta razón, la probabilidad de que X tome un valor comprendido en un intervalo no se verá
afectada por el hecho de que este sea abierto o cerrado en cualquiera de sus extremos:
De todos los modelos probabilísticos contínuos que existen estudiaremos a continuación el más
importante según sus aplicaciones a situaciones reales.
CARACTERISTICAS.
97
1. Es una familia de distribuciones normales de tal forma que cada vez que se especifican los
parámetros y 2 se identifica al correspondiente miembro de la familia, esto es, se produce
una distribución normal particular.
E(X) =
V( X ) = 2 X =
- + X
Figura 4.2
4. La mediana y la moda coinciden con , y por lo tanto, es simétrica con respecto a , así que
P(X ) = P(X ) =
B
98
A C
1 2
Figura 4.3
En la figura 4.3 se dan tres funciones de densidad de probabilidad normales. Las funciones de
densidad de probabilidad A y B tienen la misma media 1 pero diferentes desviaciones estándar.
La desviación estándar de la función de densidad de probabilidad B es menor que la desviación
estándar de la función de densidad de probabilidad de A, motivo por el cual aparece más apuntada .
Por otra parte, las funciones de densidad de probabilidad A y C tienen la misma desviación estándar
pero medias diferentes. Más aún, las funciones de densidad de probabilidad de B y C tienen
diferentes medias y también diferentes desviaciones estándar.
Z = 1
Z = 0 Z
Figura 4.4
Cada vez que apliquemos una distribución normal a una situación dada será necesario identificar un
miembro de la familia, esto es, una variable aleatoria X que tenga distribución normal con
parámetros y , con el fin de poder calcular las probabilidades solicitadas.
99
Lo anterior significa que cada situación o problemas tendría su propia distribución normal, lo cual
resulta muy incómodo.
Para evitar ese inconveniente convertiremos la variable aleatoria X que tiene distribución normal
con media y desviación estándar a otra variable aleatoria Z que tenga distribución normal
estándar, mediante la siguiente fórmula de transformación:
Z = 1
X Z = 0 Z
Figura 4.5
0 z Z
Figura 4.6
z 0 Z
Figura 4.7
Con el propósito de no recurrir a los métodos de integración numérica se ha elaborado una tabla para
la función de distribución acumulada de Z, que nos permite leer directamente el valor de F ( z ) para
cualquier valor z.
USO DE LA TABLA
Note que la tabla consta de dos partes, una arriba, para los valores negativos de z y otra abajo para
los valores positivos de z.
Observe, para ambas partes de la tabla, que en el márgen izquierdo está el dígito unitario y una
décima de z, mientras que en el margen superior se encuentran las centésimas de z.
EJEMPLO 4.1
Encuentre P ( Z - 1.24 )
Para no calcular la integral definida anterior es que usaremos la tabla 1, que aparece en la página
111, de la siguiente manera: Bajamos sobre el márgen izquierdo o columna z, de la parte de arriba
de la tabla, hasta encontrar -1.2, luego buscamos en el margen superior el 4.
Ahora tracemos dos líneas imaginarias, una horizontal que pase por –1.2 y otra vertical que pasa
por 4. En la intersección de las líneas anteriores encontraremos el valor 0.1075.
De manera que F (-1.24 ) = 0.1075.
0.1075
- 1.24 0 Z
Figura 4.8
Caso 1.
El evento tiene la forma X c donde c es un valor determinado, queremos calcular P ( X c ).
Lo primero que tenemos que hacer es estandarizar la variable aleatoria X y el valor c.
Una ilustración gráfica sería la siguiente donde se ha sombreado el área que representa P ( X c )
A 1
A
c X 0 Z
Figura 4.9
Caso 2.
El evento tiene la forma X c donde c es un valor determinado, queremos calcular P ( X c ). Una
ilustración gráfica sería la siguiente donde se ha sombreado el área que representa P ( X c ).
c X
Figura 4.10
P(X c) = 1 - P(X c) = A
Esto es, el área acumulada a la derecha de c es igual a 1 menos el área acumulada a la izquierda
de c. El área acumulada a la izquierda de c, esto es, P ( X c ) se encuentra aplicando el Caso 1.
Caso 3.
a b X
Figura 4.11
EJEMPLO 4.2
Suponga para cierta marca y modelo de computadora, que el tiempo de operación en forma efectiva
(antes de la primera descompostura) sigue una distribución normal con una media de 350 horas y
una desviación estándar de 50 horas.
1. ¿Cuál es la probabilidad de qué una computadora de esa marca y modelo opere efectivamente:
Suponga que la variable aleatoria X representa el tiempo de operación en forma efectiva de las
computadoras.
= 50
A = 0.1587 A = 0.1587
300 = 350 X -1 0 Z
Figura 4.12
Una ilustración gráfica será la siguiente donde se ha sombreado el área representada por
P ( X 280 ).
A = 0.9192
280 = 350 X
Figura 4.13
P ( X 280 ) = 1 - P ( X 280 )
= F ( - 1.40 ) = 0.0808
A = 0.6967
Figura 4.14
105
2. Suponga que un momento dado se disponen de 500 computadoras de esa marca y modelo,
¿Cuántas espero que operen en formas efectiva después de 280 horas?.
A = 0.99
= 350 a X
Figura 4.15
P ( X a ) = 0.99
Estandarizando X y a obtenemos
466.5 horas
EJEMPLO 4.3
En la rama de la construcción está establecido por la ley un salario mínimo de C$ 12 por hora para
los obreros. Si suponemos que los salarios en esta rama están distribuidos normalmente con una
media de C$ 18 por hora y una desviación estándar de C$ 3.
i) ¿Qué porcentaje de los obreros podrían iniciar un proceso de demanda por incumplimiento a la
ley?
Supongamos que la variable aleatoria X representa al salario de los obreros.
Sabemos que X N ( = 18 , = 3 ).
Cuando el salario X no llega al mínimo se puede iniciar un proceso de demanda, esto es, cuando
X 12. Por tanto calcularemos P ( X 12).
=3
A = 0.0227 A = 0.0227
12 = 18 X -2 0 Z
Figura 4.16
ii) ¿Cuál es el menor salario que perciben los obreros que representan el 10% de los mejores
remunerados?
Suponga que c representa el menor salario que perciben el 10% de los mejores remunerados.
Entonces
P ( X c ) = 0.10
107
1 - P ( X c ) = 0.10 P ( X c ) = 0.90
Estandarizando X obtenemos
a) entre z = 0 y z = 0.94
b) entre z = -2.15 y z = 0
c) a la derecha de z = 0.92
d) a la derecha de z = - 0.93
e) a la izquierda de z = 0.84
f) a la izquierda de z = -0.35
a) A la derecha de z es 0.9983
b) a la derecha de z es 0.7324
c) a la izquierda de z es 0.1314
d) a la derecha de z es 0.2981
3. Las encuestas realizadas por una corporación financiera han revelado que la vida de una cuenta
regular de ahorros abierta en uno de sus bancos tiene una distribución normal con un promedio de
26 meses y una desviación estándar de 8.2 meses.
Si un depositante abre una cuenta en un banco que es miembro de esa corporación:
a) ¿Cuál es la probabilidad de que en esa cuenta haya todavía dinero después de 30 meses?
b) ¿Cuál es la probabilidad de que la cuenta haya sido cancelada antes de un año y medio?
4. La vida de un cierto tipo de tubo fluorescente está normalmente distribuida y su media es 1500
horas con una desviación estándar de 250. La UNAN colocará 1200 de ellos en el próximo año (en
el mes de Enero). Se calcula que esos tubos trabajarán 6 horas diarias, con 105 días de inactividad
en el año. Para confeccionar el plan de piezas de repuesto del próximo año, ¿Qué cantidad de tubos
habrá que tener de reserva para que se mantengan 1200 de ellos funcionando?
5. El número de días entre la facturación y el pago de las cuentas de crédito de un almacén tiene
una distribución aproximadamente normal con una media de 18 días y desviación estándar de 4 días.
7. El editor de una editorial calcula que transcurren en promedio 11 meses antes de terminar el
proceso de publicación, desde la elaboración del manuscrito hasta terminar con el libro, con una
desviación estándar de 2.4 meses. Piensa que la distribución normal describe bien los tiempos de
publicación. De 19 libros que tendrá a su cargo este año, ¿ aproximadamente cuántos finalizarán el
proceso en menos de un año ?
9. Suponga que el tiempo necesario para que germine una variedad de semillas de una planta está
normalmente distribuido con una media de 15 días y desviación estándar de 4 días.
10. Un análisis de duración de llamadas telefónicas locales hechas desde la oficina de una empresa
muestra que el tiempo de llamadas es una variable aleatoria que tiene una distribución
aproximadamente normal con una media de 125.7 segundos y una desviación estándar de 30
segundos. ¿Qué porcentaje de estas llamadas.
11. La dirección de carreteras de un estado se encuentra conque su ingreso anual por cuotas esta
normalmente distribuido con una media de 700000 dólares y una desviación de 50000. El gerente
desea saber:
a) La probabilidad de que queden cubiertos los gastos de operación del año próximo que
ascienden a 680000 dólares.
b) La probabilidad de que estos gastos queden cubiertos en los siguientes dos años (suponiendo
que el monto de ingreso de un año sea independiente del año anterior).
c) El monto del ingreso en el mejor 25% de los años.
12. En un estado hay x gasolineras cuyos ingresos son normalmente distribuidos con una media de
29000 dólares al año y una desviación estándar de 5100. Unas 189 gasolineras ganan entre 26000 y
31000 dólares al año. ¿Cuántas gasolineras hay en el estado?.
13. Supongamos que la vida útil de cierta marca de llanta de automóvil se distribuye
aproximadamente normal con media y desviación estándar iguales a 32,000 y 1000 millas
respectivamente.
b) Si una empresa ha tenido que reemplazar el 5% de las llantas vendidas, ¿Cuál fue la garantía
utilizada?
14. La demanda semanal de artículos que produce una empresa es una variable aleatoria
aproximadamente normal con una media de 20 artículos y una desviación estándar de 2 artículos.
15. Una empresa de jabonería y perfumería usa una máquina para llenar cajas con polvo facial. En
un informe del departamento de control estadístico de la calidad, se afirma que los pesos netos de las
cajas están distribuidos normalmente con una media igual a 15 onzas y desviación estándar igual a
0.8 onzas.
a) Se selecciona al azar una caja, ¿cuál es la probabilidad de que tenga un peso neto mayor de
14.5 onzas?
b) Si cierto día la máquina llena 1500 cajas, ¿cuántas cajas tendrán pesos netos menores que
14.5 onzas?
16. En un curso de Estadística el 15% de los estudiantes, los mejores, recibieron un premio y el
10%, los peores, perdieron el curso.
Suponiendo que las calificaciones del curso están distribuidas normalmente con una media de 76
y una desviación estándar de 15.
110
17. Se estima que aproximadamente la demanda semanal de diesel en una gasolinera estará
normalmente distribuida con una media de 1000 galones y una desviación estándar de 50 galones.
La gasolinera se abastecerá de diesel una vez a la semana. ¿Cuál debe ser la capacidad de su tanque,
si suponemos que la probabilidad de que se termine el diesel en una semana es 0.01.
.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753
.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
.4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879
.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8079 .8106 .8133
.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
1.0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8621
1.1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .8830
1.2 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .9015
1.3 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .9177
1.4 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .9319
1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
111
1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545
1.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9700 .9706
1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767
2.0 .9773 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .9817
2.1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .9857
2.2 .9861 .9864 .9868 .9871 .9875 .9878 .9881 .9884 .9887 .9890
2.3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .9916
2.4 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936
2.5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .9952
2.6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .9964
2.7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .9974
2.8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .9981
2.9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986
3. .9987
BIBLIOGRAFIA