Área de Ciencias - Verano 2023
Área de Ciencias - Verano 2023
Área de Ciencias - Verano 2023
Estadística Aplicada I
Cuaderno de trabajo
Los profesores del curso
La siguiente guía de trabajo contiene el material necesario para seguir las clases del curso
Estadística Aplicada I de la Universidad Peruana de Ciencias Aplicadas. Contiene la teoría,
ejercicios resueltos y propuestos de todo el curso.
Este material de enseñanza está basado en materiales y trabajo de los profesores del curso.
Esperamos que este material le sea de utilidad.
Los profesores del curso
Tabla de contenido
Logro
Al término de la unidad, el estudiante entiende claramente la información presentada en tablas y
gráficas. Asimismo, calcula resúmenes obtenidos a partir de un conjunto de datos y los utiliza para dar
solución a un problema dentro de un contexto real o de su especialidad.
Temario
Definiciones básicas
Organización de datos cualitativos: Tablas de distribución de frecuencias y
representaciones gráficas
Organización de datos cualitativos (diagrama de Pareto)
Organización de datos cuantitativos: Tablas de distribución de frecuencias y
representaciones gráficas para variables cuantitativas discretas y continuas
Tablas y gráficos comparativos para variables cuantitativas continuas
Medidas de tendencia central: media aritmética, mediana, moda, media ponderada.
Propiedades de la media
Medidas de posición: cuartiles, deciles y percentiles
Medidas de dispersión: rango, varianza, desviación estándar, coeficiente de variación y
rango intercuartil
Medidas de asimetría
Estadística Aplicada I – verano 2023 5
Definiciones básicas
Estadística
Es la ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar,
organizar, presentar y analizar datos con el fin de describirlos o realizar generalizaciones válidas.
Recopilar datos Organizar datos Presentar datos Analizar datos Tomar decisiones
Giuliana: o o o ……..
.. … …
… … …
Estadística Aplicada I – verano 2023 6
Estadística Aplicada I – verano 2023 7
Estadística descriptiva
Son métodos asociados a la caracterización, resumen y presentación de datos, que permiten
describirlos apropiadamente. Comprende el uso de gráficos, tablas e indicadores de resumen
obtenidos al realizar algunos cálculos.
Estadística descriptiva
Métodos de recolección, caracterización, resumen y
presentación de características de datos
Definiciones
Unidad elemental
También llamada unidad de análisis, unidad estadística o elemento. Es el objeto sobre el cual se hace
la medición. Por ejemplo, en estudios de poblaciones humanas, con frecuencia ocurre que las unidades
de análisis son los individuos.
Población
Es la totalidad de elementos que queremos estudiar y que están agrupados bajo una o más
características comunes y que conforman el universo a ser investigado. Pueden ser personas, objetos,
conceptos, etc. de los cuales intentamos sacar conclusiones a partir de una o más características
observables de naturaleza cualitativa o cuantitativa que se pueden medir en ellos.
Muestra
Parte o subconjunto de la población que se selecciona para su análisis y así obtener información acerca
de la población de la que proviene. Una muestra será representativa, en el sentido de que cada unidad
muestreada representará las características de una cantidad conocida de unidades en la población.
Dato
Son los valores numéricos o no numéricos que otorga la característica de interés de cada unidad
elemental.
Observación
Es el conjunto de datos de una unidad elemental. La observación se obtiene para cada unidad
elemental.
Dato
Observación
Unidad elemental
Ejemplo 2
En una empresa se tienen los datos de los trabajadores:
Ejercicios
1. De los ingenieros colegiados en la ciudad de Lima durante el presente año, se entrevistó al azar
85 de ellos para estimar el porcentaje de los que trabajan en empresas privadas. Determine la
población, muestra y unidad elemental.
Población
Muestra
Unidad elemental
2. De acuerdo con los Censos Nacionales de Población y Vivienda 2017, el 72% de los hogares en el
Perú no cuenta con conexión de Internet. Determine la población, muestra y unidad elemental
para el censo del 2017.
Población
Muestra
Unidad elemental
Estadística Aplicada I – verano 2023 10
3. En el Perú, según la ley N°29664, la vulnerabilidad es la susceptibilidad de sufrir daños por acción
de un peligro. El análisis de la vulnerabilidad es el proceso mediante el cual se evalúan las
condiciones existentes de la población expuesta y sus medios de vida. Para evaluar la
vulnerabilidad de una vivienda se miden las siguientes variables, entre otras.
• Material predominante en las paredes: ladrillo, adobe, quincha, madera, etc.
• Material predominante en el techo: concreto armado, madera, calamina, caña, etc.
• Material predominante en el piso: parquet, loseta, madera, cemento, tierra, etc.
• Tipo de servicio higiénico: red pública dentro, red pública fuera, pozo séptico, río, etc.
El Gobierno Municipal de Lima está preocupado por las consecuencias de la ocurrencia de un
sismo de alta intensidad en Lima. Por esta razón, ha decidido realizar un diagnóstico de la
situación de las viviendas en este distrito eligiendo a 2500 viviendas seleccionadas al azar.
a. Determine la población, muestra y unidad elemental del estudio.
Población Todas las viviendas del distrito de Lima
b. Para las variables mencionadas, indique un posible dato y una posible observación.
Dato posible Ladrillo
Observación
Ladrillo, concreto armado, parquet, red pública dentro
posible
4. En un estudio de ingeniería para investigar las fisuras por desgaste en aviones que llegaron al
aeropuerto Jorge Chávez el presente año, se tomó una muestra de 50 aviones a los que se les
hizo un estudio detallado de su estado. Determine la población, muestra y unidad elemental.
Población
Muestra
Unidad elemental
5. La empresa Star llevó a cabo un estudio entre los usuarios de Internet en Trujillo para analizar el
mercado de posibles compradores a través de este servicio. Como parte del estudio se recolectó
una muestra de 1500 usuarios.
Durante la recolección de datos se registró que uno de los usuarios tiene 28 años, dos
computadoras en casa con Internet, considera que la calidad del servicio prestado es buena,
diariamente usa el servicio de Internet 3,5 horas y la computadora con mayor uso del servicio de
Internet es Asus. De acuerdo con el texto, identifique un dato y una posible observación.
6. Saudi Aramco, la empresa estatal de petróleo y gas de Arabia Saudí fue la empresa más rentable
en 2019, según la prestigiosa Fortune Global 500, una lista de las primeras 500 empresas de todo
el mundo, medidas por los ingresos. La lista es compilada y publicada anualmente por la revista
Fortune. Determine la unidad elemental para la publicación de esta lista.
Estadística Aplicada I – verano 2023 11
Unidad elemental
Estadística Aplicada I – verano 2023 12
Definiciones
Variable
Es una característica de interés de la población definida por la investigación estadística y que puede
tomar dos o más valores en distintas unidades de análisis.
Tipos de variables
Cualitativa
Variable Discreta
Cuantitativa
Continua
Variable cualitativa
También son conocidas como categóricas. Es una variable que al ser medida queda expresada por una
etiqueta o nombre que se utiliza para identificar una característica o atributo.
Variable cuantitativa
Es una variable que al ser medida queda expresada por un número que se utiliza para identificar una
característica o atributo.
Estas a su vez pueden clasificarse en discretas o continuas.
Una variable es cuantitativa discreta si el conjunto de posibles valores que toma es finito o infinito
numerable, es decir, que sólo puede tomar ciertos valores en un intervalo determinado.
Una variable es cuantitativa continua si el conjunto de posibles valores es infinito no numerable, es
decir, que puede tomar cualquier valor en un intervalo determinado. (#s reales R )
Las siguientes variables son de una encuesta aplicada a un postulante a un trabajo de
ingeniería:
Escala de medición
Otra forma común de clasificar las variables es mediante el uso de cuatro niveles de medición; nominal,
ordinal, de intervalo y de razón. Cuando la estadística se aplica a problemas reales el nivel de medición
de las variables es un factor importante para determinar el procedimiento a usar.
Nominal
Se usa cuando los datos sólo pueden clasificarse en categorías o
modalidades. Si se le identificase mediante un número, este sólo se
utiliza como una etiqueta.
Ordinal
Se usa cuando los datos que reflejan diferentes grados de propiedad o
atributo de estudio. Se pueden ordenar en forma ascendente o
descendente (jerarquía), de tal manera que puedan expresar grados de
la característica medida.
Las variables con escalas ordinales pueden ser ordenadas o clasificadas
en relación con la cantidad del atributo poseído. Cada categoría puede
ser comparada con otra en relación de “mayor que” o “menor que”. Si
se le identificase mediante un número, este se utiliza para establecer el
orden del atributo estudiado.
Intervalo
Se utiliza cuando los datos miden cuantitativamente la intensidad del
atributo en estudio y, además, las diferencias iguales entre estos valores
indican diferencias iguales en las cuantías de los atributos medidos.
En esta escala el cero es relativo, es decir, no indica la ausencia de la
característica medida.
Razón
Si los cocientes o razones de los números asignados a las unidades
estadísticas reflejan los cocientes de las cuantías de las propiedades que
se miden.
En esta escala el cero indica la ausencia de característica de la medida.
También se le conoce como escala de proporción o cociente.
Estadística Aplicada I – verano 2023 14
Ejemplo 3
Solución
Ejercicios
7. La medición de la velocidad del pulso ultrasónico como una alternativa de prueba no destructiva
para evaluar la calidad del concreto se ha utilizado desde hace aproximadamente 50 años. La
técnica fue desarrollada por Leslie y Cheesman en Canadá (Malhotra y Carino, 1991) y se utilizó
con gran éxito desde la década de los sesenta para diagnosticar el estado del concreto. Además,
se han realizado estudios que permitan obtener modelos para predecir la resistencia a la
compresión del concreto en base a la velocidad ultrasónica. La clasificación del concreto en
categorías con base a intervalos de velocidad se presenta en el cuadro siguiente.
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
1000 Ducal 4 645 Mala 650 ml. 5,20
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
2000 Tropical 0 355 Buena 355 ml. 4,95
b. En base a cada resultado obtenido de la muestra identifique las variables en estudio, su tipo
y escala de medición.
Variable Tipo Escala de medición
10. Computer Soft es una compañía dedicada a brindar servicios integrales de informática y de
telecomunicaciones a empresas en todo el país. La gerencia de la compañía desea reforzar su
fuerza de ventas en Lima y, como parte de un estudio realizado, se analizó la información
correspondiente a una muestra de 30 empresas de la ciudad de Lima a las que se les brindó los
servicios informáticos de la compañía. Las variables consideradas en dicho estudio fueron:
• Lenguaje de programación (Cobol, Java, Informixs - 4gl, etc.)
• Cantidad de servidores por empresa.
• Costo de las licencias de software (en miles de dólares)
• Año de instalación del software.
• Sistema operativo (Windows NT, Unix, etc.)
Rpta. a. Todas las empresas de Lima a las que se les brindó los servicios informáticos de la
compañía; 30 empresas de Lima a las que se les brindó los servicios informáticos de la compañía;
una empresa de Lima a la que se le brindó los servicios informáticos de la compañía. b. Cualitativa,
nominal; cuantitativa discreta, razón; cuantitativa continua, razón; Cuantitativa discreta, intervalo;
Cualitativa, nominal
11. Indique el tipo de variable y la escala de medición de las variables observadas en una muestra de
secciones de tuberías de agua.
a. Diámetro de la tubería (pulgadas)
b. Material de la tubería (hierro negro, hierro galvanizado, PVC, bronce cobrado)
c. Ubicación (subterránea, aérea)
d. Longitud de la tubería (pies)
e. Estabilidad del suelo circundante (inestable, moderadamente estable o estable)
f. Corrosividad del suelo circundante (corrosivo o no corrosivo)
Rpta. a. Cuantitativa continua, razón; b. Cualitativa, nominal; c. Cualitativa, nominal; d.
Cuantitativa continua, razón; e. Cualitativa, ordinal; f. Cualitativa, nominal.
Estadística Aplicada I – verano 2023 18
Definiciones
Parámetro
Medida que describe una característica resumen de las unidades que componen una población.
Estadístico
Medida que describe una característica resumen de las unidades que componen una muestra.
La gerencia de la empresa Star llevó a cabo un estudio entre los usuarios de Internet en Trujillo para
poder analizar el mercado de posibles compradores a través de este servicio. Como parte del estudio
realizado se analizó la información correspondiente a una muestra de 1500 usuarios.
Por datos históricos de la empresa se sabe que, en promedio los usuarios utilizan el servicio de Internet
3,75 horas al día. Además, de la muestra de usuarios se obtuvo que el número promedio de
computadoras que cuentan con el servicio de Internet en sus casas es de 2,5 y el 12% piensan que la
calidad del servicio de Internet es regular. En base al enunciado y los resultados, complete la siguiente
tabla.
Solución
Parámetro o Nombre del parámetro o
Resultado Notación Valor
estadístico estadístico
En promedio, los usuarios
utilizan el servicio de Internet Parámetro Media 𝜇 3,75
3,75 horas al día.
El 12% de los usuarios piensan Proporción de usuarios que
que la calidad del servicio de Estadístico piensan que la calidad del 𝑝̂ 0,12
Internet es regular. Internet es regular
El número promedio de
computadoras que cuentan con Estadístico Media 𝑥̅ 2,5
el servicio de Internet es de 2,5.
Estadística Aplicada I – verano 2023 19
Ejercicios
12. Green es una empresa que se dedica a la producción de productos agroindustriales, cuenta con
4325 trabajadores. Para la aplicación efectiva de una filosofía de administración para la calidad
total (TQM) en toda la empresa y así incrementar la productividad, el consejo directivo de la
empresa ha puesto en marcha un estudio del perfil de sus trabajadores para medir la satisfacción
laboral. Para dicho estudio se tomó una encuesta a 175 trabajadores seleccionados de forma
aleatoria. A continuación, se presenta el modelo de la encuesta que fue utilizada en el estudio.
3. Posición en la empresa
9. Las oportunidades de obtener un ascenso, ¿Son mejores o peores para personas de su género?
11. ¿Rechazaría otro trabajo de mejor paga para quedarse en Green S.A.?
Ejemplo 8 Distribución de personas según el continente donde vive, 2020 (en miles)
Ejercicios
13. A un grupo de compradores de auto tomados al azar, se les preguntó sobre el color de su auto.
Los resultados obtenidos fueron:
Blanco Azul Verde Verde Verde Negro Rojo Negro Rojo Verde Blanco Azul
Negro Rojo Rojo Azul Azul Azul Rojo Verde Negro Azul Verde Negro
Azul Blanco Verde Blanco Blanco Rojo Blanco Rojo Azul Verde Blanco Negro
Negro Rojo Negro Rojo Rojo Verde Negro Negro Blanco Blanco Azul Blanco
14. Una tienda “ABC” que se dedica a la venta de productos electrónicos realiza un estudio sobre la
marca de laptop que prefieren sus clientes, para lo cual realizaron una encuesta a 30 de sus
clientes. Se obtuvieron los siguientes resultados:
Material de construcción 𝒇𝒊 𝒉𝒊 𝒑𝒊 = 𝒉𝒊 %
Ejemplo 13
Ejemplo 14 Distribución porcentual de peruanos según departamento de residencia
Estadística Aplicada I – verano 2023 26
Gráfico circular
En este caso las categorías de la variable cualitativa ocupan un espacio en el círculo que es proporcional
a la frecuencia que representan. También se denomina diagrama de sector circular, gráfico tipo torta
o pastel.
Si la variable cualitativa es de escala ordinal se recomienda usar el gráfico de barras.
Ejemplo 15
Ejemplo 17
Ejemplo 18
La universidad A realizó una encuesta a 30 estudiantes que están terminando el colegio con la finalidad
de conocer sus preferencias profesionales. De los datos obtenidos se construyó la siguiente tabla:
Ejemplo 19 Distribución de estudiantes según su preferencia profesional
Preferencia profesional 𝒇𝒊 𝒉𝒊 𝒑𝒊
Administración 5 0,1667 16,67%
Derecho 4 0,1333 13,33%
Gastronomía 6 0,2000 20,00%
Ingeniería 8 0,2667 26,67%
Negocios 3 0,1000 10,00%
Periodismo 4 0,1333 13,33%
Total 30 1 100%
Fuente: Universidad A
Solución
25%
20.0%
20% 16.7%
15% 13.3% 13.3%
10.0%
10%
5%
0%
Administración Derecho Gastronomía Ingeniería Negocios Periodismo
Preferencia profesional
Fuente: Universidad A
Solución
Negocios
10.0%
Derecho
13.3%
Ingeniería
26.7% Gastronomía
20.0%
Fuente: Universidad A
Estadística Aplicada I – verano 2023 28
Ejemplo 20
Se aplicó una encuesta a una muestra de 30 empleados de la empresa Motores A. Se preguntó por
la función que desempeña. Los datos se presentan a continuación:
Solución
Ejemplo 21 Distribución de empleados según función que desempeña
Función 𝒇𝒊 𝒉𝒊 𝒑𝒊
Total 30 1 100%
Fuente: Motores A
Solución
𝑓1 = 12. De un total de 30 empleados, 12 son obreros.
ℎ3 = 0,2. La proporción de empleados que son profesionales es 0,2.
𝑝2 = 16,67%. El 16,67% de los empleados son de producción.
Estadística Aplicada I – verano 2023 29
35%
30%
25%
20.00%
20% 16.67% 16.67%
15%
10% 6.67%
5%
0%
Obrero Producción Profesional Servicios Técnico
Función
Fuente: Motores A S.A.
Servicios Obrero
6.67% 40.00%
Profesional
20.00%
Producción
Fuente: Motores A S.A. 16.67%
Estadística Aplicada I – verano 2023 30
Diagrama de Pareto
El diagrama de Pareto es una representación gráfica que permite identificar y seleccionar los aspectos
prioritarios que hay que tratar en un determinado problema.
También se conoce como diagrama ABC o Ley de las prioridades 80 - 20, que dice: “el 80% de los
problemas que ocurren en cualquier actividad son ocasionados por el 20% de los elementos que
intervienen en producirlos” (pocos vitales, muchos triviales).
Según este concepto se tiene un problema con muchas causas, podemos decir que el 20% de las causas
resuelven el 80% del problema. Por ejemplo, en control de calidad, se puede mostrar que la mayoría
de los defectos surgen de un número pequeño de causas.
Los pasos para la elaboración del diagrama de Pareto son los siguientes:
1. Construya una tabla de distribución de frecuencias ordenando las categorías en forma descendente
respecto a la frecuencia.
La categoría Otros se coloca al final, no importa cuán grande sea, pues está compuesta por
categorías cuyas frecuencias son menores al valor de la variable con frecuencia más pequeña
listada individualmente.
Agregue a la tabla de distribución de frecuencias una columna para la frecuencia acumulada.
Fuente:
2. Dibuje los ejes verticales y horizontal, título, rótulos de los ejes y fuente.
En el eje horizontal, marque los espacios donde estarán dibujadas las barras para cada una de
las categorías incluida la categoría Otros.
Estadística Aplicada I – verano 2023 31
Frecuencia simple
75%
50%
25%
Variable
Fuente:
75%
50%
25%
Variable
Fuente:
4. Dibuje la línea de frecuencias acumuladas (curva de Pareto). Indique las etiquetas de datos
de las frecuencias simples y de las frecuencias acumuladas.
100% 100%
𝑃3
Frecuencia simple
75%
𝑃2
𝑃1
50%
25%
Variable
Fuente:
Estadística Aplicada I – verano 2023 32
Ejemplo 22
El gerente de producción de una empresa, que produce asientos de fibra de vidrio, quiere identificar
los problemas más frecuentes reportados en la fabricación de este producto, y planear soluciones de
acuerdo con la recurrencia del problema. Al extraer una muestra aleatoria de productos fallados,
obtuvo los siguientes resultados:
Ejemplo 23 Distribución de productos según problemas reportados de asientos de fibra de vidrio
Tipo de problema reportado Número de ocurrencias (𝒇𝒊 )
Color inadecuado 28
Forma no simétrica 16
Medidas fuera de norma 50
Superficie rugosa 71
Bordes afilados 9
Desprendimiento de capa protectora 12
Otros 14
Fuente: Gerencia de Producción
¿Cuáles son los problemas más frecuentes reportados en la fabricación, para que el gerente de
producción planifique soluciones de acuerdo con la recurrencia de los problemas?
Solución
Lo primero es ordenar los datos en orden descendente a la frecuencia fi. La categoría Otros va al final.
Luego, se calcula las frecuencias relativas y las relativas acumuladas.
Ejemplo 24 Distribución de productos según problemas reportados de asientos de fibra de vidrio
Tipo de problema reportado 𝒇𝒊 𝒉𝒊 𝒑𝒊 𝑷𝒊
Superficie rugosa 71 71 35,5 % 35,5 %
Medidas fuera de norma 50 121 25,0 % 60,5 %
Color inadecuado 28 149 14,0 % 74,5 %
Forma no simétrica 16 165 8,0 % 82,5 %
Desprendimiento de capa protectora 12 177 6,0 % 88,5 %
Bordes afilados 9 186 4,5 % 93,0 %
Otros 14 200 7,0 % 100,0 %
Fuente: Gerencia de Producción
Se puede realizar el gráfico usando las frecuencias simples absolutas 𝑓𝑖 y las frecuencias porcentuales
𝑃𝑖 .
Estadística Aplicada I – verano 2023 33
60.5%
120 60%
80 71 40%
35.5%
50
40 28 20%
16 12 14
9
0 0%
Superficie rugosa Medidas fuera de Color inadecuado Forma no simétrica Desprendimiento de Bordes afilados Otros
norma capa protectora
INTERPRETACIÓN: Los problemas más frecuentes en la producción de los asientos de fibra de vidrio
son: superficie rugosa, medidas fuera de norma y color inadecuado, los cuales representan un 74,5%
de los problemas.
Ejemplo 25
Termas S.A.C. es una empresa que fabrica y comercializa dentro y fuera del Perú, termas para el
calentamiento del agua para uso doméstico e industrial. Debido a la fuerte competencia de los
productos importados, la empresa se encuentra en un proceso de mejora continua, por este motivo el
jefe de control de calidad selecciona al azar 75 termas del área de reclamos.
A continuación, se presenta un resumen de los tipos de problemas reportados en termas seleccionadas.
Solución
Ordenamos la tabla de distribución de frecuencias en forma descendente por las frecuencias simples,
con la categoría Otros al final.
Distribución de termas según problemas reportados por los clientes
60.00%
60% 60%
Ejemplo 26
Emapa es una empresa de agua y alcantarillado que presenta muchos problemas en sus diferentes
procesos, los cuales generan pérdidas a la empresa y el malestar e insatisfacción de los usuarios.
Para conocer cuáles son las quejas más frecuentes reportadas por los clientes, que le permita a la
empresa establecer un plan de mejora, se elaboró un diagrama de Pareto con los 120 registros de las
quejas reportadas por los clientes en el último mes. Tal como se muestra a continuación:
Distribución de clientes según tipo de queja
Tipo de queja 𝒇𝒊 𝒉𝒊 𝒑𝒊 𝑷𝒊
Si los dos tipos de queja más frecuentes acumulan más del 70% de las quejas se va a realizar un plan
de mejora enfocándose en esos dos tipos de queja. Indique lo que hará la empresa.
Utilice las cinco dimensiones de la competencia de razonamiento cuantitativo.
Solución
Interpretación
Decidir si se va a implementar un plan de mejora.
Representación
La variable el tipo de queja reportada.
La herramienta estadística para utilizar es el diagrama de Pareto.
Cálculo
El cálculo es realizar el gráfico de Pareto.
Estadística Aplicada I – verano 2023 36
98.33% 100.00%
120 91.67% 100%
70%
80
60%
46.67%
60 56 50%
40 40%
40
30%
20%
20 14
8 10%
2
0 0%
Rotura de red Problemas en el Rotura de red Filtraciones en la otros
pública medidor domiciliaria conexión
Tipo de queja
Fuente: Emapa S.A.C.
Análisis y Argumentación
El porcentaje de quejas reportadas por los clientes se centran en rotura de red pública y problemas en
el medidor es del 80% que es mayor al 70%.
Por lo tanto, se va a realizar un plan de mejora enfocándose en esos dos tipos de queja, rotura de red
pública y problemas de medidor.
Estadística Aplicada I – verano 2023 37
Ejercicios
16. La Italiana es una empresa dedicada a la fabricación de embutidos cárnicos, su proceso de
producción se enfoca en mejorar y optimizar sus productos para qué de esta forma, puedan
cumplir con los estándares del mercado e incluso superarlos. La empresa está interesada en
identificar los problemas principales que se pueden encontrar en la elaboración de embutidos
crudos curados.
En base a la información presentada, determine los principales problemas a ser atendidos con
prioridad por la empresa, con el procedimiento estadístico más adecuado.
64.10%
60% 60%
48.72%
40% 40%
25.64%
23.08%
25.64% 15.38%
20% 14.10% 12.82% 20%
8.97%
0% 0%
Embutición Textura Nitrificación Embarrado Sabor Otros
Problema más importante
Fuente: La Italiana
17. En la empresa Metal S.A.C. presentan fallas en una pieza AWR-3500 que sirve de repuesto en
aviones comerciales. Durante todo el mes de febrero del 2019 se observaron las piezas con algún
defecto y se registró el tipo de defecto identificado.
Si Metal S.A.C. desea reducir al menos el 75% de los defectos ¿cuáles de esos defectos deben
de resolverse?
Estadística Aplicada I – verano 2023 39
La empresa APS ha registrado, durante 20 días, los reclamos de un producto defectuoso elaborado
por una de sus máquinas industriales. De los datos obtenidos se construyó la siguiente tabla:
f 2: 4
h3%: 35%
<2 y >3
20%
20%
10%
10%
5%
0%
0 1 2 3 4 5
Número de reclamos
Fuente: Empresa APS
Estadística Aplicada I – verano 2023 41
Ejemplo 28
Los siguientes datos corresponden al número de capacitaciones recibidas por los colaboradores
(trabajadores) de la empresa Creativa S.A. en lo que va del año.
0 0 0 1 1 1 1 1 1 1 1 1 1 1 1
1 1 2 2 2 2 2 2 2 2 2 2 3 3 5
Número de capacitaciones 𝒇𝒊 𝒉𝒊 𝑭𝒊 𝑯𝒊
0 3 0.1000 3 0.1000
1 14 0.4667 17 0.5667
2 10 0.3333 27 0.9000
3 2 0.0667 29 0.9667
5 1 0.0333 30 1.0000
Total 30 1.0000
Fuente: Empresa Creativa S.A.
b. Interprete:
𝒇𝟐 De 30 colaboradores, 14 han recibido solo una capacitación al año.
𝑭𝟐 De 30 colaboradores, 17 han recibido de una a menos capacitaciones al año.
La proporción de colaboradores que han recibido solo una capacitación al año es
𝒉𝟐
0,4667.
𝑷𝟐 = H 2% El 56,67% de los colaboradores han recibido de una a menos capacitaciones al año.
12
10
10
6
3
4
2
1
2
0
0 1 2 3 4 5 6
Número de capacitaciones recibidas
Fuente: Empresa Creativa S.A.
Estadística Aplicada I – verano 2023 42
Ejercicios
18. El gerente de un banco está interesado en estudiar el comportamiento del número de cuentas de
ahorros cerradas por día. La información disponible para este fin se muestra a continuación:
0 3 1 2 1 0 2 3 0 1 4 1 4 4 0 4 3 1 2 2
1 5 0 5 4 1 0 2 1 3 0 3 2 1 1 2 5 4 0 1
19. El jefe de control de calidad de una empresa agroindustrial está interesado en estudiar el
comportamiento del número de productos defectuosos por lote. La información disponible para
este fin se muestra a continuación:
0 0 0 0 0 0 0 0 1 1
1 1 1 1 1 1 1 1 1 2
2 2 2 2 2 2 3 3 3 3
3 4 4 4 4 4 4 5 5 5
25.0%
20.0%
Porcentaje de lotes
20.0% 17.5%
15.0%
15.0% 12.5%
10.0% 7.5%
5.0%
0.0%
0 1 2 3 4 5
Número de productos defectuosos por lote
Fuente: Elaboración propia
Estadística Aplicada I – verano 2023 44
𝑘 = 1 + 3,322 𝑙𝑜𝑔(𝑛)
El número de intervalos 𝑘 es siempre un número entero. Si la estimación tiene decimales, se toma
el entero más próximo. Ejemplo: K = 6,67 7 / K = 7,32 7 / K = 7,5 8
En Excel: =REDONDEAR( , 0 )
En Excel: =REDONDEAR.MAS( , )
d. Determine los límites de cada intervalo.
Partiendo del dato de menor valor 𝑋𝑚𝑖𝑛 se determinan cada uno de los límites de intervalos
sumando la amplitud de clase a cada valor obtenido.
Si los datos son cuantitativos continuos, el límite superior de un intervalo es el límite inferior
del siguiente intervalo. Se considera que el intervalo es abierto en el límite inferior y cerrado
Estadística Aplicada I – verano 2023 45
en el límite superior, con excepción en el primer intervalo en el que los dos límites son
cerrados.
La marca de clase es el punto medio de cada clase. Se calcula como la semisuma de los límites de
cada clase. Representa a todos los datos que están contenidos en dicha clase.
Límite inferior + Límite superior 𝐿𝑖𝑘 + 𝐿𝑠𝑘
𝑥𝑘´ = =
2 2
f. Construya la tabla de distribución de frecuencias realizando la agrupación y conteo de los datos
según la clase a la que corresponda.
𝐿𝑖2 + 𝐿𝑠2 𝑓2
]𝐿𝑖2 − 𝐿𝑠2 ] 𝑥2´ = 𝑓2 ℎ2 = 𝐹2 = 𝑓2 + 𝐹1 𝐻2 = ℎ2 + 𝐻1
2 𝑛
⋮ ⋮ ⋮ ⋮ ⋮ ⋮
𝐿𝑖𝑘 + 𝐿𝑠𝑘 𝑓𝑘
]𝐿𝑖𝑘 − 𝐿𝑠𝑘 ] 𝑥𝑘´ = 𝑓𝑘 ℎ𝑘 = 𝑛 1,00
2 𝑛
Total 𝒏 1
Fuente:
Estadística Aplicada I – verano 2023 46
𝑓2
𝑓1
𝑓3
𝑓4
𝑓5
𝐿𝑖1 𝐿𝑠1 = 𝐿𝑖2 𝐿𝑠2 = 𝐿𝑖3 𝐿𝑠3 = 𝐿𝑖4 𝐿𝑠4 = 𝐿𝑖5 𝐿𝑠5
Variable
Fuente: Unidad de medición
ℎ2
ℎ1
ℎ3
ℎ4
ℎ5
𝐿𝑖1 𝐿𝑠1 = 𝐿𝑖2 𝐿𝑠2 = 𝐿𝑖3 𝐿𝑠3 = 𝐿𝑖4 𝐿𝑠4 = 𝐿𝑖5 𝐿𝑠5
Variable
Fuente: Unidad de medición
𝑝2
𝑝1
𝑝3
𝑝4
𝑝5
𝐿𝑖1 𝐿𝑠1 = 𝐿𝑖2 𝐿𝑠2 = 𝐿𝑖3 𝐿𝑠3 = 𝐿𝑖4 𝐿𝑠4 = 𝐿𝑖5 𝐿𝑠5
Variable
Fuente: Unidad de medición
Estadística Aplicada I – verano 2023 47
Polígono de frecuencias
Es la representación por medio de una figura poligonal cerrada, que se obtiene uniendo con segmentos
de recta los puntos de intersección de las marcas de clase con las frecuencias.
Cada punto del polígono se obtiene levantando desde la marca de clase en el eje horizontal una
vertical que corresponde a su respectiva frecuencia (relativa o absoluta).
En este gráfico se usan las marcas de clase y no los límites de los intervalos.
El polígono siempre va cerrado en los extremos. Para esto, considere marcas de clase adicionales
con frecuencia cero al inicio y al final del polígono.
En el eje horizontal va la escala de la variable. Su título debe indicar el nombre de la variable y sus
unidades de medición.
En el vertical va la escala de la frecuencia.
75%
𝑃3
𝑃2
50%
𝑃1
25%
Ejemplo 29
El jefe de la Oficina de Rentas de una municipalidad ha realizado un estudio sobre los impuestos que
pagan los vecinos del distrito. Los datos de los pagos de impuestos, en soles, de 48 viviendas elegidas
al azar en el 2022 son:
145,1 216,3 252,5 303,6 196,9 234,8 265,2 317,2 206,5 242,9 289,1 331,7
151,0 225,9 257,1 305,8 202,6 238,4 271,0 320,2 208,0 244,0 291,0 344,6
159,0 227,1 259,2 315,4 204,9 239,9 286,7 324,8 208,0 247,7 291,9 346,7
195,6 231,2 262,5 315,5 206,1 241,1 288,1 331,1 209,3 249,5 294,5 351,1
Solución
a. Elabore la tabla de frecuencias para la variable “Pago por impuestos municipales” para el presente
año.
10
8 7 7
6
6
4 3 3
0
145.1 - 174.6 - 204.1 - 233.6 - 263.1 - 292.6 - 322.1 - 351.6
Pago de impuesto municipal
Fuente: Oficina de Rentas de la Municipalidad
20.84%
20%
14.58% 14.58%
15% 12.50%
10%
6.25% 6.25%
5%
0%
130.35 159.85 189.35 218.85 248.35 277.85 307.35 336.85 366.35
Pago de impuesto municipal
Fuente: Oficina de Rentas de la Municipalidad
159,85 – w 336.85 + w
Estadística Aplicada I – verano 2023 50
70%
58.34%
60%
50%
40% 33.34%
30%
20% 12.50%
6.25%
10%
0%
145.1 174.6 204.1 233.6 263.1 292.6 322.1 351.6
Pago de impuesto municipal
Fuente: Oficina de Rentas de la Municipalidad
Estadística Aplicada I – verano 2023 51
Ejercicios
20. Se ha llevado a cabo un estudio para evaluar el tiempo, en horas, que utiliza cada trabajador de
una planta hidroeléctrica para verificar el normal funcionamiento de la tubería de presión y las
válvulas de control. Para ello se eligieron al azar 45 de ellos.
0,15 0,18 0,19 0,71 0,75 0,82 0,84 0,92 0,96 1,16 1,17 1,19 1,23 1,40 1,47
1,59 1,61 2,01 2,16 2,38 2,42 3,07 3,22 3,53 3,76 3,94 4,50 4,59 4,75 5,41
5,42 5,45 5,61 5,62 5,71 6,19 6,23 6,43 6,71 7,12 7,45 7,54 7,93 9,12 10,0
21. Los datos corresponden a los ingresos, en cientos de soles, de una muestra de 60 clientes del
banco A.
5.25 7.22 8.53 9.27 9.54 10.21 10.32 10.45 10.52 10.76
10.85 11.25 11.56 12.42 13.27 14.65 15.72 16.85 17.22 18.56
19.32 20.56 21.72 22.85 23.12 24.32 25.65 26.72 28.72 29.65
31.42 32.71 33.55 34.28 35.21 37.45 38.32 39.65 41.22 43.28
45.72 47.32 49.45 51.27 52.38 54.75 55.81 56.27 57.45 58.22
59.32 61.45 63.75 65.72 66.85 69.32 69.54 72.30 75.81 77.42
22. La empresa Computadoras S.A., es una compañía distribuidora de equipos de cómputo. Jean
Carlos jefe del área de logística preocupado por la disminución de las ventas diarias, propondrá
al directorio la implementación de la promoción del pago en 12 cuotas sin intereses, siempre que
más del 18% de días registren como máximo un monto de venta de 151 soles. A continuación, se
presenta algunos resultados de una muestra de 50 días:
52,0 94,7 95,1 97,5 102,5 104,1 106,0 125,2 125,6 146,0
146,8 158,6 158,7 162,6 166,2 166,2 166,2 166,2 168,2 169,7
196,0 204,9 204,9 204,9 204,9 208,3 215,2 217,5 218,1 218,1
218,1 218,1 220,9 226,2 235,0 239,7 242,2 259,6 261,6 277,2
286,5 287,0 297,8 313,9 315,0 316,2 338,6 359,9 363,1 398,3
¿La empresa debe implementar la promoción de las ventas en cuotas sin interés?
Estadística Aplicada I – verano 2023 53
Comparación de distribuciones
(NO ENTRA EN NINGUNA EVALUACIÓN)
Si se va a agrupar datos de dos o más muestras para analizarlas comparativamente, tome en cuenta
adicionalmente lo siguiente:
El rango se determina tomando el dato mayor de todas las muestras menos el dato menor de todas
las muestras.
Si las muestras tienen tamaño distinto, para determinar el número de intervalos se toma el tamaño
de muestra más grande.
Al agrupar los datos en clases, los datos de cada muestra se agrupan independientemente, de tal
manera que haya tantas tablas de distribución como muestras, pero todas empleando las mismas
clases.
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
𝐿𝑖𝑘 + 𝐿𝑠𝑘
]𝐿𝑖𝑘 − 𝐿𝑠𝑘 ] 𝑥𝑘´ = 𝑓𝑘 ℎ𝑘 𝑛1 1,00 𝑓𝑘 ℎ𝑘 𝑛2 1,00
2
Total 𝒏𝟏 1 𝒏𝟐 1
Fuente:
Ejemplo 30
La empresa Fico presenta a continuación los datos correspondientes a la duración (en horas) de una
muestra de 40 focos de 100 watts producidos de la marca A y una muestra de 35 focos de 100 watts
de la marca B.
Marca A
684 697 720 773 821 831 835 848 852 852
859 860 868 870 876 893 899 905 909 911
922 924 926 926 938 939 943 946 954 971
972 977 984 1005 1014 1016 1041 1052 1080 1093
Marca B
819 836 888 897 903 907 912 918 942 943
952 959 962 986 994 1004 1005 1007 1015 1016
1018 1020 1034 1038 1072 1077 1077 1096 1100 1113
1113 1116 1153 1154 1172
Estadística Aplicada I – verano 2023 54
a. Elabore las tablas de distribución de frecuencias de los datos de ambas muestras de tal manera
que permita su comparación apropiadamente.
Para la marca A, el valor máximo es 1093 horas y el valor mínimo es 684 horas.
Para la marca B, el valor máximo es 1172 horas y el valor mínimo es 819 horas.
El rango 𝑅 para los intervalos comunes se calcula con:
𝑅 = 𝑋𝑚á𝑥(𝐴,𝐵) − 𝑋𝑚í𝑛(𝐴,𝐵) = 1172 − 684 = 488
Para la marca A, el tamaño de muestra es 𝑛1 = 40.
Para la marca B, el tamaño de muestra es 𝑛2 = 35.
Siguiendo la regla de Sturges, se elige el mayor de los dos tamaños de muestra, en este caso
𝑛1 = 40, por tanto, el número de intervalos 𝑘 es:
𝑘 = 1 + 3,322 𝑙𝑜𝑔10 (𝑛) = 1 + 3,322 𝑙𝑜𝑔10 (40) = 6,3
El número de intervalos es un valor entero y se usa redondeo simple, por tanto, 𝑘 = 6.
La amplitud se calcula por:
𝑅 488
𝑤=
= = 81,3
𝑘 6
Usamos redondeo por exceso a cero decimales debido a que los datos tienen no tienen
decimales, por tanto, 𝑤 = 82 horas.
A continuación, se muestra la tabla de distribución de frecuencias.
Distribución de focos según la duración, en horas, por marca
Marca A Marca B
Duración 𝒙’𝒊
𝒇𝒊 𝒉𝒊 𝑭𝒊 𝑯𝒊 𝒇𝒊 𝒉𝒊 𝑭𝒊 𝑯𝒊
684 766 725 3 0,075 3 0,075 0 0,0000 0 0,0000
766 848 807 5 0,125 8 0,200 2 0,0571 2 0,0571
848 930 889 16 0,400 24 0,600 6 0,1715 8 0,2286
930 1012 971 10 0,250 34 0,850 10 0,2857 18 0,5143
1012 1094 1053 6 0,150 40 1,000 9 0,2571 27 0,7714
1094 1176 1135 0 0,000 40 1,000 8 0,2286 35 1,0000
Total 40 1 35 1
Fuente: Fico S.A.
Estadística Aplicada I – verano 2023 55
40% 40.0%
35%
Porcentaje de focos
28.6%
30% 25.7%
25% 22.9%
25.0%
20% 17.2%
15% 15.0%
12.5%
10% 5.7%
7.5%
5%
0%
643 725 807 889 971 1053 1135 1217
Duración (en horas)
Marca A Marca B
Fuente: Fico S.A.
c. Por norma ISO 9001, la duración de un foco debe ser mayor de 930 horas. ¿Qué marca de foco es
la que cumple en mayor porcentaje con esta norma?
Comparación de distribuciones
23. El ingeniero de control de calidad de la fábrica de aluminio G&E, por las constantes quejas que
recibe sobre la longitud de dichas láminas decide comparar las longitudes de las láminas en dos
turnos existentes, si se sabe que la longitud de la lámina debe estar entre 300 ∓ 8 mm. A
continuación, se muestra la longitud de las láminas en cada turno.
Tarde
290 290 290 290 291
293 294 295 295 298
298 300 304 305 306
313 314 315 321 327
Noche
282 286 296 296 297
298 298 300 301 304
306 310 310 310 311
312 313 313 315 315
316 317 319 319 319
320 320 320 321 322
324 324 325 328
Construya los intervalos comunes, marcas de clase y frecuencia absoluta simple para las
distribuciones de frecuencias, de manera que permita realizar comparaciones entre los dos turnos.
Utilice la regla de Sturges.
24. Una empresa emprendió un estudio para determinar el comportamiento de un sistema de
grabación de programas informáticos en el que para que el proceso funcione adecuadamente la
señal debe estar entre 9,2 y 10 voltios. Se instalaron sistemas de grabación tanto en una ubicación
antigua como en una nueva ubicación y se tomaron lecturas. Los datos registrados se muestran
en la siguiente tabla:
Ubicación antigua
8,05 8,72 8,72 8,80 9,55 9,70 9,73 9,80 9,80 9,84
9,84 9,87 9,87 9,95 9,97 9,98 9,98 10,0 10,01 10,02
10,03 10,05 10,05 10,12 10,15 10,15 10,26 10,26 10,29 10,55
Ubicación nueva
8,51 8,65 8,68 8,72 8,78 8,8 8,82 8,82 8,83 9,14
9,19 9,27 9,35 9,36 9,37 9,39 9,43 9,48 9,49 9,54
9,55 9,60 9,63 9,64 9,70 9,75 9,85 9,87 9,95 9,98
10,01 10,03 10,05 10,05 10,09 10,1 10,12 10,12 10,15 10,15
a. Elabore las tablas de distribución de frecuencias de los datos de ambas muestras de tal manera
que permita su comparación apropiadamente.
b. Elabore los polígonos de frecuencias para su comparación.
c. Elabore un informe sustentado de sus conclusiones.
Estadística Aplicada I – verano 2023 57
Moda
Cuartil
Decil
Varianza
Desviación estándar
Coeficiente de variación
Interpretación de la media
Según el contexto se puede interpretar de la siguiente manera:
La variable 𝑋 se aproxima a…………
La variable 𝑋 está alrededor de………
La variable 𝑋 tiende a………….
Características de la media
• Se calcula para un conjunto de datos medido en escala de intervalo o razón.
• El valor de la media es sensible a los valores extremos (mínimo y máximo), por lo que la presencia
de valores inusuales la distorsionan.
• La media tiene propiedades matemáticas valiosas para poder usarlas en otros cálculos.
Ejemplo 31
Los siguientes datos corresponden al número de defectos por cada placa integrada, en una muestra
de 30 placas seleccionadas al azar de un proceso de producción.
4 2 4 2 1 3 3 1 3 3 4 1 1 4 1
5 5 5 3 1 3 1 4 1 1 2 4 1 4 1
Solución
La media del número de defectos de las 30 placas es de 2,6 defectos por placa.
Esto significa que:
El número de defectos por placa en el proceso productivo se aproxima a 2,6 defectos por placa
El número de defectos por placa en el proceso productivo está alrededor de 2,6 defectos por placa
El número de defectos por placa en el proceso productivo tiende a 2,6 defectos por placa.
Ejemplo 32
Los siguientes datos corresponden al espesor, en pulgadas, de una muestra aleatoria de varillas de
fierro corrugado.
1,73 1,73 1,84 1,71 1,61 1,50 1,78 1,50 1,90 1,81 1,72 1,84 1,75 1,69 1,63
Estadística Aplicada I – verano 2023 60
1,51 1,77 1,81 1,77 1,80 1,68 1,56 1,71 1,78 1,49 1,57 1,71 1,82 1,66 1,69
Solución
El promedio del espesor de la muestra de varillas de fierro corrugado es 1,702 pulgadas. El espesor de
las varillas de fierro corrugado está alrededor de 1,702 pulgadas.
Ejemplo 33
A continuación, se muestra la distribución del número de máquinas que se sobrecalientan por día en
la planta REX S.A.
Distribución de días según número de máquinas que se sobrecalientan
Número de máquinas que se sobrecalientan
𝒇𝒊 𝒉𝒊 𝒑𝒊
xi
0 13 0,434 43,4%
1 10 0,333 33,3%
2 4 0,133 13,3%
3 3 0,100 10,0%
Total 30 1 100%
Fuente: REX. S.A.
Solución
Calculemos la media:
∑𝑘𝑖=1 𝑥𝑖 𝑓𝑖
𝑥̅ =
𝑛
0 × 13 + 1 × 10 + 2 × 4 + 3 × 3
𝑥̅ = = 0,9
30
El número de máquinas que se sobrecalientan está alrededor de 0,9 máquinas por día.
Estadística Aplicada I – verano 2023 61
Ejercicios
25. A continuación, se muestra la distribución del número de computadoras que fallan por día:
26. A continuación, se presenta el peso (en gramos) en forma agrupada para una muestra de
cargadores de celulares. Calcule e interprete la media.
27. En la siguiente tabla se muestra la distribución del tiempo, en horas, de duración de los
componentes electrónicos de las marcas Alpha y Beta sometidos a un trabajo continuo:
Calcule e interprete la media para el tiempo de duración de los componentes de las marcas Alpha
y Beta respectivamente.
SOLUCIÓN: Se trata de datos agrupados de Variable Continua
Estadística Aplicada I – verano 2023 62
Mediana
La mediana es el valor que ocupa la posición central de un conjunto de 𝑛 datos ordenados de una
variable en estudio.
Si 𝑛 es par:
𝑋[𝑛] + 𝑋[𝑛+1]
2 2
𝑚𝑒 =
2
Interpretación de la mediana
El 50% de las unidades elementales tienen un valor de la variable 𝑋 menor o igual a la mediana.
El 50% de las unidades elementales tienen un valor de la variable 𝑋 hasta la mediana.
El 50% de las unidades elementales tienen un valor de la variable 𝑋 como máximo la mediana.
Características de la mediana
Se calcula todo conjunto de datos medidos en escala de ordinal, intervalo o razón.
El valor de la mediana depende del número de datos observados.
La mediana es un estadístico robusto, es decir, no se ve afectada por valores extremos (mínimo y
máximo). Por eso se utiliza cuando hay datos inusuales o el polígono de frecuencias no es
simétrico.
La mediana no tiene propiedades matemáticas valiosas para poder usarlas en otros cálculos.
Ejemplo 34
A continuación, se muestra el tiempo de vida (en días) de 12 baterías de litio seleccionadas al azar.
Halle e interprete la mediana del tiempo de vida de las baterías.
479 510 487 465 473 504 517 485 516 536 462 511
Solución
Como 𝑛 = 12 es par.
𝑋[𝑛] + 𝑋[𝑛+1] 𝑋 12 + 𝑋 12
2 2 [2] [ 2 +1] 𝑋[6] + 𝑋[7] 487 + 504
𝑚𝑒 = = = = = 495,5
2 2 2 2
El 50% de las baterías de litio tienen un tiempo de vida de hasta 495,5 días.
Ejemplo 35
Estadística Aplicada I – verano 2023 64
A continuación, se muestra el tiempo de vida (en días) de 11 baterías de litio seleccionadas al azar.
Halle e interprete la mediana del tiempo de vida de las baterías.
487 489 498 571 571 560 530 509 495 461 500
Solución
Como 𝑛 = 11 es impar.
𝑚𝑒 = 𝑋 𝑛+1 = 𝑋 11+1 = 𝑋[6] = 500
[ 2 ] [ 2 ]
El 50% de las baterías de litio tienen un tiempo de vida de 500 días o menos.
Ejemplo 36
Los datos corresponden a una muestra de baterías cuyas lecturas de voltaje (en voltios) son:
9,99 10,00 10,00 10,26 25,00 9,84 9,96 9,98 10,05 10,12
Solución
Primero, se ordena los datos de menor a mayor.
𝑋[1] 𝑋[2] 𝑋[3] 𝑋[4] 𝑿[𝟓] 𝑿[𝟔] 𝑋[7] 𝑋[8] 𝑋[9] 𝑋[10]
9,84 9,96 9,98 9,99 10,00 10,00 10,05 10,12 10,26 25,00
Como 𝑛 = 10 es par.
𝑋[𝑛] + 𝑋[𝑛+1] 𝑋 10 + 𝑋 10
2 2 𝑋[5] + 𝑋[6] 10 + 10
[2] [ 2 +1]
𝑚𝑒 = = = =
= 10
2 2 2 2
El 50% de las baterías tienen una lectura de como máximo de 10 voltios.
Estadística Aplicada I – verano 2023 65
Ejercicios
28. Los siguientes datos corresponden al número de accidentes laborales que sucede semanalmente
en un taller mecánico.
1 2 0 2 1 3 3 1 3 0 5 1 3 1 3 1 2 1
29. El siguiente gráfico muestra de los salarios de los trabajadores españoles durante el año 2017.
Interprete la mediana.
Estadística Aplicada I – verano 2023 66
Moda
La moda es el valor que presenta la mayor frecuencia de un conjunto de datos observados de una
variable. Se denota por mo.
Interpretación de la moda
Es el valor más frecuente.
Características de la moda
Es la única medida de tendencia central que se obtiene para cualquier escala de medición.
El valor de la moda no se ve afectada por valores extremos.
La moda no siempre es un valor único. En una serie de datos se puede tener dos modas (bimodal)
o más de dos modas (multimodal).
En un conjunto de datos no necesariamente se va a encontrar moda.
Ejemplo 37
Los siguientes datos corresponden al número de piezas producidas (en cientos de piezas) diariamente
para una muestra aleatoria de 26 días.
4 2 4 2 2 3 3 1 3 3 4 1 1 5 5 5 3 1 3 2 4 2 1 5 2 3
Solución
En este caso, el resultado de la moda es igual a 3 piezas diariamente. Esto significa que la cantidad de
piezas producidas con mayor frecuencia equivale a 3 piezas diariamente.
Ejemplo 38
El tiempo, en minutos, que toma en producirse cada una de nueve piezas metálicas tomadas al azar
de la empresa Indus Metal se muestran a continuación:
Tiempo 47 42 27 39 57 37 33 37 42
Solución
Tiempo 47 42 27 39 57 37 33 37 42
𝑚𝑜1 = 37 y 𝑚𝑜2 = 42
Es un caso bimodal (dos modas). Los tiempos más frecuentes en producir una pieza metálica son 37 y
42 minutos.
Ejemplo 39
A continuación, se muestra la distribución de trabajadores según número de piezas producidas.
Número de piezas vendidas 𝒇𝒊 𝒑𝒊
2 6 20,00%
3 8 26,67%
4 12 40,00%
5 3 10,00%
6 1 3,33%
Total 30 100%
Fuente: Elaboración propia
Ejercicios
30. A continuación, se presenta una muestra aleatoria de 13 telas de fibra de algodón registrando el
porcentaje de algodón y la resistencia a la tensión (N/m²).
Porcentaje de algodón 18 20 21 31 21 24 30 26 22 31 31 28 31
Resistencia a la tensión (N/m²) 54 54 54 84 73 70 76 88 68 61 71 75 87
Calcule e interprete la moda para el porcentaje de algodón y la resistencia a la tensión de las telas.
31. Renacer es una empresa que fabrica hornos microondas, la gerencia encargó al jefe de control de
calidad que informe cuál es el problema más frecuente encontrado en los hornos microondas. Se
tomó una muestra del área de reparaciones y se encontró la siguiente información:
32. El jefe de control de calidad de una empresa agroindustrial está interesado en estudiar el
comportamiento del número de productos defectuosos por lote. La información disponible para
este fin se muestra a continuación:
0 0 0 0 0 0 0 0 1 1
1 1 1 1 1 1 1 1 1 2
2 2 2 2 2 2 3 3 3 3
3 4 4 4 4 4 4 5 5 5
1 2 3 4 0 0 2 3 0 1 4 1 4 4 0 4 3 1 2 2
1 5 0 5 4 1 0 2 1 3 0 3 2 1 1 5 4 3 2 1
antigua como en una nueva ubicación y se tomaron lecturas, en voltios. Los datos registrados se
muestran en la siguiente tabla:
Ubicación antigua
8,05 8,72 8,72 8,80 9,55 9,7 9,73 9,80 9,80 9,84
9,84 9,87 9,87 9,95 9,97 9,98 9,98 10,00 10,01 10,02
10,03 10,05 10,05 10,12 10,15 10,15 10,26 10,26 10,29 10,55
Ubicación nueva
8,51 8,65 8,68 8,72 8,78 8,8 8,82 8,82 8,83 9,14
9,19 9,27 9,35 9,36 9,37 9,39 9,43 9,48 9,49 9,54
9,55 9,60 9,63 9,64 9,70 9,75 9,85 9,87 9,95 9,98
10,01 10,03 10,05 10,05 10,09 10,1 10,12 10,12 10,15 10,15
Ejemplo 40
A continuación, se muestra el salario mensual (en soles) para diferentes ingenieros en una empresa
exportadora de tecnología emergente.
Tipo de ingeniero Salario mensual Porcentaje de ingenieros
Electrónico 5200 35%
Sistemas 4600 10%
Industrial 4200 15%
Mecánico 4000 40%
Solución
5200 × 35 + 4600 × 10 + 4200 × 15 + 4000 × 40
𝑥̅𝑤 = = 4510
100
El salario de los ingenieros de la empresa exportadora de tecnología emergente está alrededor de 4510
soles.
Estadística Aplicada I – verano 2023 71
Ejercicios
36. El ingreso promedio de los obreros de una empresa es de 2264 soles. Si el 60% de los obreros
tiene menos de 30 años y recibe el 20% del ingreso total, calcule el ingreso promedio por obrero
de menos de 30 años.
37. Una fábrica de ensamblado de autopartes cuenta con cuatro máquinas (A, B, C y D), siendo el
costo semanal para cada máquina de 650, 520, 450 y 380 nuevos soles. Si el 45% de las autopartes
son ensambladas por la máquina A, el 35% por la B, el 15% por la C y el resto por la máquina D.
Calcule el costo promedio semanal de las máquinas.
38. Un profesor del curso de metalúrgica para ingeniería tuvo a su cargo dos secciones el ciclo pasado.
En la primera sección, donde tuvo 40 alumnos, la media de las notas del examen parcial fue 13 y
en la segunda sección, con 35 alumnos, la media de dicho examen fue 12,5. Calcular la media de
las notas de todos los estudiantes que tuvo a su cargo.
40. Se cuenta con tres alternativas para la localización de una nueva planta de fabricación. Para ello,
se ha identificado un conjunto de criterios y se ha distinguido el grado de importancia de cada
una de las alternativas en una escala de 0 a 10. Todo ello se recoge en la siguiente tabla:
Alternativas
Criterios Peso relativo (%)
A B C
Proximidad a proveedores 30 7 7 10
Costos laborales 30 5 9 7
Transportes 20 9 6 6
Impuestos 15 6 6 7
Costos instalación 5 7 8 2
41. Una empresa de construcción utiliza tres tipos de trabajadores en obra (operario, maestro y
capataz). La empresa actualmente tiene a su cargo dos obras, en las que los trabajadores
participan de acuerdo con la siguiente tabla. ¿Cuál de las obras tiene un mayor promedio de
salario por hora?
Ejemplo 41
Se sabe que el tiempo promedio para derretir un metal pesado con un método estándar es de 5,5
minutos, actualmente en el mercado existen dos alternativas modernas (A y B) para derretir el metal.
La empresa Iron Forte S.A. desea adquirir una de las dos alternativas, y para ello se conoce lo
siguiente:
El tiempo para derretir el metal disminuye en 12,5% si se utiliza la alternativa A.
El tiempo para derretir el metal disminuye en un 10% si se utiliza el método B y adicional disminuye
un minuto fijo por contar con radiación electromagnética.
¿Cuál de las dos alternativas permitirá a la empresa derretir el metal pesado en un tiempo promedio
más rápido?
Solución
Definamos las variables:
𝑋 ≔ tiempo para derretir el metal pesado con el método estándar
𝑌 ≔ tiempo nuevo con las alternativas modernas.
Alternativa A
𝑦̅ = 𝑎𝑥̅ + 𝑏
𝑦̅ = (1 − 0,125) 5,5 + 0 = 4,8125
El tiempo promedio para derretir un metal pesado con la alternativa A es 4,8125 minutos.
Alternativa B
𝑦̅ = 𝑎𝑥̅ + 𝑏
(1
𝑦̅ = − 0,1) 5,5 − 1 = 3,95
El tiempo promedio para derretir un metal pesado con la alternativa B es 3,95 minutos.
La alternativa que permitirá a la empresa derretir el metal pesado con un tiempo promedio más rápido
se obtiene al utilizar la alternativa B.
Ejemplo 42
Se sabe que los ingresos mensuales que perciben los trabajadores de una planta de producción tienen
un promedio de 2800 soles, determine el nuevo ingreso promedio que se obtendría luego de realizar
los siguientes aumentos:
a. los ingresos de los trabajadores se incrementan en 250 soles.
b. los ingresos se incrementan en un 7,5%.
c. los ingresos se incrementan en un 12,5% más una bonificación de 125 soles.
Solución
Definamos las variables:
Estadística Aplicada I – verano 2023 74
Solución
𝑦̅ = 𝑎𝑥̅ + 𝑏
𝑦̅ = (1 − 0) 2800 + 250 = 3050
b. los ingresos se incrementan en un 7,5%, entonces:
Solución
𝑦̅ = 𝑎𝑥̅ + 𝑏
𝑦̅ = (1 + 0,075) 2800 + 0 = 3010
c. los ingresos se incrementan en un 12,5% más una bonificación de 125 soles, entonces:
Solución
𝑦̅ = 𝑎𝑥̅ + 𝑏
𝑦̅ = (1 + 0,125) 2800 + 125 = 3275
Estadística Aplicada I – verano 2023 75
Ejercicios
42. Un fabricante desea adquirir una máquina para el llenado de bolsas de 150 gramos. Se realizan
20 ensayos con la máquina obteniéndose los siguientes pesos, en gramos:
143 145 146 148 149 150 150 150 150 150
150 150 150 150 150 151 152 154 155 155
Si el equipo de medición que se empleó para medir los pesos de las bolsas producidas por la
máquina estaba descalibrado y los verdaderos pesos serían 10% menores a los pesos medidos y,
además, con una constante de menos dos gramos, ¿cuál es el peso promedio verdadero de bolsas de
la máquina?
43. Una empresa de transporte gasta $ 400 en latas de conserva que cuestan $ 10 la docena; $500
en latas que cuestan $ 12,5 la docena; $ 600 más en latas que cuestan $ 20 la docena y $ 300 en
otras que cuestan $ 25 la docena. Calcular el costo promedio por docena de las latas de conserva.
44. En una empresa textil, la distribución de salarios tiene una media aritmética de 300 dólares. Como
solución a un conflicto laboral, la gerencia propone un reajuste por medio de dos alternativas.
Propuesta I
Un aumento general del 60% de los salarios.
Propuesta II
Un aumento general del 40% de los salarios y una bonificación adicional de 60 dólares a cada
trabajador.
¿Cuál de las alternativas propuestas conviene aceptar al sindicato?
45. En una cotización para adquirir drones, la empresa A ofrece las siguientes alternativas:
• La primera consiste en un aumento del precio en un 5% por contar con garantía de dos años.
• La segunda consiste en una disminución del precio en un 3% más 200 dólares por garantía de
dos años.
Indique la alternativa más conveniente del precio promedio de los drones, si el precio promedio
actual es de 1800 dólares.
Estadística Aplicada I – verano 2023 76
Percentiles
Dividen el conjunto de datos en 100 partes porcentualmente iguales.
𝑃𝑘
Cuartiles
Dividen el conjunto de datos en cuatro partes porcentualmente iguales.
Se les denota como 𝑄1 , 𝑄2 y 𝑄3 .
Su equivalente en percentiles es 𝑄1 = 𝑃25 , 𝑄2 = 𝑃50 = 𝑀𝑒, 𝑄3 = 𝑃75 .
Deciles
Dividen el conjunto de datos en 10 partes porcentualmente iguales.
Se les denota como 𝐷1 , 𝐷2 , 𝐷3 , …, 𝐷9 respectivamente.
Su equivalente en percentiles es 𝐷1 = 𝑃10 , 𝐷2 = 𝑃20 , 𝐷3 = 𝑃30 ,…, 𝐷9 = 𝑃90 .
Ejemplo
Si queremos determinar el puntaje mínimo para estar en el quinto superior, debemos calcular el
percentil 80.
Cálculo de un percentil
1. Primero, ordenamos los datos de manera ascendente.
2. Calculamos la posición 𝑖 del percentil 𝑘.
𝑛+1
𝑖=( ) 𝑘 = 𝐸, 𝑑
100
3. Luego, calculamos el percentil 𝑘.
Si 𝑑 = 0, entonces 𝑃𝑘 = 𝑋[𝐸]
Si 𝑑 ≠ 0, entonces 𝑃𝑘 = 𝑋[𝐸] + 0, 𝑑(𝑋[𝐸+1] − 𝑋[𝐸] )
Ejemplo 43
Se cuenta con los datos de los tiempos, en minutos, de ensamblaje de CPUs de 12 trabajadores.
Calcule e interprete el percentil 45.
15 12 18 22 24 10 9 13 25 18 12 14
Solución
Primero, ordenemos los datos ordenados.
𝑋[1] 𝑋[2] 𝑋[3] 𝑋[4] 𝑿[𝟓] 𝑿[𝟔] 𝑋[7] 𝑋[8] 𝑋[9] 𝑋[10] 𝑋[11] 𝑋[12]
9 10 12 12 13 14 15 18 18 22 24 25
Ejercicios
46. En una empresa, el jefe de Recursos Humanos está interesado en analizar el impacto en los
empleados al suprimir las horas extras de trabajo pagadas. Con este fin se extrae una muestra
aleatoria de 60 empleados tomando los datos de un día al azar. A continuación, se muestran las
horas de trabajo por día de cada empleado.
7,6 7,7 8,0 8,0 8,0 8,1 8,1 8,2 8,2 8,2 8,2 8,2 8,2 8,3 8,3
8,3 8,4 8,4 8,4 8,4 8,5 8,5 8,5 8,6 8,6 8,7 8,7 8,7 8,8 8,8
8,9 8,9 8,9 9,0 9,1 9,1 9,3 9,4 9,6 9,7 9,7 9,8 9,9 9,9 10,0
10,0 10,3 10,5 10,5 10,6 10,8 11,0 11,2 11,6 11,7 12,2 12,5 12,9 13,3 14,5
a. Calcule el número de pernos máximo, fabricados semanalmente, para estar en el 15% de los
operarios con menor rendimiento.
=PERCENTIL.EXC(B77:J80;0.15) 566,05
b. Calcule el número de pernos mínimo, fabricados semanalmente, para estar en quinto superior
de los operarios con mayor rendimiento.
= PERCENTIL.EXC(B77:J80;0.80) 884,6
48. La empresa Computronix es una compañía distribuidora de equipos de cómputo. Jean Carlos jefe
del área de logística preocupado por la disminución de las ventas diarias, propondrá al directorio
la implementación de la promoción del pago en 12 cuotas sin intereses, siempre que más del 18%
de días registren como máximo un monto de venta de 151 soles.
¿La empresa debe implementar la promoción de las ventas en cuotas sin interés?
49. Se ha registrado el número de problemas con el celular de 25 clientes de telefonía móvil en Lima,
usuarios de la operadora A, tal como se muestra a continuación:
4 7 4 7 6 8 7 5 7 5 7 4 7
8 6 5 6 6 5 6 6 7 4 6 4
La operadora A planifica hacer un descuento especial al 20% de los clientes que registra el
mayor número de problemas con el celular, ¿A partir de qué número de problemas, al cliente se va
a hacer el descuento especial?
= PERCENTIL.EXC(B87:N88;0.80) 7
Estadística Aplicada I – verano 2023 80
Rango
El rango (alcance, amplitud o recorrido) de un conjunto de datos observados es la diferencia entre dato
mayor y el dato menor:
𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛
donde:
𝑋𝑚𝑎𝑥: valor máximo observado de la variable
𝑋𝑚𝑖𝑛: valor mínimo observado de la variable
Ejemplo 45
El jefe de control de calidad de la empresa industrial de termas eléctricas Thermosol S.A. selecciona
una muestra al azar de 12 termas, y registra el número de defectos que presenta cada terma. Calcule
el rango.
2 1 2 4 1 3 2 3 2 0 5 1
Solución
El valor máximo es
𝑋𝑚𝑎𝑥 = 5
El valor mínimo es
𝑋𝑚𝑖𝑛 = 0
Luego el rango es 𝑅 = 5 – 0 = 5. Esto indica que la amplitud del número de defectos en las ternas es de
5.
Estadística Aplicada I – verano 2023 81
Varianza
Es una medida del grado de dispersión o variación de los valores de una variable con respecto a su
media o promedio.
Desviación estándar
La desviación estándar es la raíz cuadrada positiva de la varianza, mide la cantidad típica en la que los
valores del conjunto de observaciones difieren de la media.
Poblacional
𝜎 = √𝜎 2
Muestral
𝑠 = √𝑠 2
Ejemplo 46
Estadística Aplicada I – verano 2023 82
A continuación, se presenta la cantidad de plomo en una muestra de agua potable, en miligramos por
litro. Halle la varianza y la desviación estándar.
45 62 30 25 36 60 47 19 16 38 10 35 31 21 22 25
Solución
Varianza
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑠2 = = 224,3833
𝑛−1
Desviación estándar
𝑠 = √224,3833 = 14,9794
Coeficiente de variación
El coeficiente de variación de un conjunto de datos observados expresa la desviación estándar como
un porcentaje de la media. A diferencia de otras medidas de dispersión, el coeficiente de variación es
una medida relativa. Es útil al comparar la variabilidad de dos o más series de datos que se expresan
en distintas o iguales unidades.
Se calcula preferentemente en variables medidas en escala de razón (algunos autores sugieren que se
debe evitar su calcular para variables medidas en escala de intervalo).
Población
𝜎
𝐶𝑉 = × 100%
𝜇
Muestra
𝑠
𝐶𝑉 = × 100%
𝑥̅
Ejemplo 47
Solución
Se usa como indicador el coeficiente de variación:
𝑠1 1,10
𝐶𝑉1 = × 100% = × 100% = 36,67%
𝑥̅1 3
Estadística Aplicada I – verano 2023 83
𝑠2 1,66
𝐶𝑉2 = × 100% = × 100% = 33,207%
𝑥̅2 5
En el grupo 1, el número de mediciones es más disperso, puesto que su coeficiente de variación es
mayor.
Ejemplo 48
La fábrica de colchones Rímac S.A. cuenta con dos plantas (A y B), el área de seguridad industrial
desea analizar la variabilidad del número de accidentes industriales en las plantas. Para el estudio
tomó como referencia una muestra aleatoria de 100 días laborables para cada una de las plantas. La
información se muestra a continuación:
Distribución de días laborables según número Distribución de días laborables según número
de accidentes en la planta A de accidentes en la planta B
Número de accidentes Número de días Número de accidentes Número de días
0 10 0 15
1 15 1 10
2 30 2 35
3 35 3 25
4 10 4 15
Total 100 Total 100
Fuente: Rímac S.A. Fuente: Rímac S.A.
¿En cuál de las dos plantas el número de accidentes presenta mayor homogeneidad? Justifique su
respuesta.
Solución
Se obtiene con las opciones de la calculadora:
La media y desviación estándar para la planta A es:
0 × 10 + 1 × 15 + 2 × 30 + 3 × 35 + 4 × 10
𝑥̅𝐴 = = 2,2
100
𝑠𝐴 = 1,1282
La media y desviación estándar para la planta B es:
0 × 15 + 1 × 10 + 2 × 35 + 3 × 25 + 4 × 15
𝑥̅𝐵 = = 2,15
100
𝑠𝐵 = 1,2422
El coeficiente de variación para la planta A es:
𝑠𝐴
𝐶𝑉𝐴 = × 100%
𝑥̅𝐴
1,1282
= × 100% = 51,28%
2,2
El coeficiente de variación para la planta B es:
𝑠𝐵
𝐶𝑉𝐵 = × 100%
𝑥̅𝐵
1,2422
= × 100% = 57,78%
2,15
Estadística Aplicada I – verano 2023 84
Se observa que en la planta A, el coeficiente de variación es menor, por lo tanto, en esta planta existe
mayor homogeneidad en el número de accidentes.
Estadística Aplicada I – verano 2023 85
Ejercicios
50. A continuación, se presentan los tiempos de transmisión de un archivo, en segundos, evaluados
en empresas que adoptaron la tecnología A y la tecnología B bajo condiciones similares.
Tecnología A 138 126 125 124 119 119 137 110 119 155
Tecnología B 130 126 129 130 127 129 132 128 124 132
Determine con cuál de las dos tecnologías, los tiempos de transmisión de un archivo son más
homogéneos.
51. La empresa Electro S.A. dedicada a la venta de artefactos electrónicos para el hogar, opera 200
tiendas en diferentes lugares del país. Los últimos informes indican que las ventas semanales han
descendido a tal punto que se han tenido que cerrar algunas tiendas. El gerente, con el fin de
enfrentar el problema, ha determinado que es necesario un estudio estadístico de las ventas
semanales (en miles de unidades) de un producto electrónico en dos de sus principales tiendas:
Cesca y Risco. Las muestras tomadas al azar de cada tienda arrojaron los siguientes datos:
Determine en cuál de las tiendas las ventas realizadas son más homogéneas.
52. Se tiene tres marcas de bombillas A, B y C. Se presenta a continuación la duración (en días)
registrada de cierto número de bombillas de cada marca.
¿Qué marca compraría usted y por qué? Sustente su respuesta a base del análisis de las medidas
de dispersión de los datos presentados.
53. El ingeniero de control de calidad de la fábrica de cobre R&J, por las constantes quejas que recibe
sobre la longitud de dichas láminas decide comparar las longitudes de las láminas en dos turnos
existentes. A continuación, se presenta la longitud de las láminas tomadas al azar en cada turno.
Tarde
290 290 290 290 291 293 294 295 295 298 298 300 304 305 306
Estadística Aplicada I – verano 2023 86
Noche
282 286 296 296 297 298 298 300 301 304 306 310 310 310 311
Rango intercuartil
Es la diferencia entre el tercer y primer cuartil.
Cálculo del rango intercuartil
𝑅𝑎𝑛𝑔𝑜 𝑖𝑛𝑡𝑒𝑟𝑐𝑢𝑎𝑟𝑡𝑖𝑙 = 𝑅𝐼𝐶 = 𝑄3 − 𝑄1 = 𝑃75 − 𝑃25
Nota
Si la pregunta es “comparar variabilidad” se calcula coeficiente de variación.
Si la pregunta es “comparar variabilidad en el 50% central” se calcula el rango intercuartil.
Estadística Aplicada I – verano 2023 88
Ejercicios
56. Los siguientes datos corresponden a las mediciones de la emisión diaria (en toneladas) de óxido
de azufre de una planta industrial.
7,7 9,4 11,0 11,2 13,9 15,2 15,8 17,3 18,5 20 22,7 23,9 24,5 26,4
3 4 4 4 5 5 6 8 8
8 8 8 9 9 11 11 11 11
11 12 13 13 14 15 15 17 17
1,2 2,1 2,2 2,2 2,5 2,5 2,6 2,6 2,7 2,8
3,0 3,0 3,2 3,2 3,2 3,4 3,4 3,5 3,5 3,6
Diagrama de cajas
El diagrama de cajas o box plot es una gráfica que describe la distribución de un conjunto de datos
tomando como referencia los valores de los cuartiles como medida de posición y el valor del rango
intercuartil como medida de referencia de dispersión.
Valor atípico
Es un dato inusualmente grande o pequeño con respecto a los otros datos.
Se considera valor atípico a cualquier punto mayor al límite superior (a la derecha) o menor al límite
inferior (o a la izquierda); es decir, que se encuentre fuera de los límites.
Un valor atípico aparece cuando:
Hay un elemento extraño en la muestra.
2. Trace un rectángulo con los extremos del percentil 25 y percentil 75, en cada categoría. En la caja
trace una recta horizontal en el lugar del percentil 50.
Estadística Aplicada I – verano 2023 90
𝑃75
Variable 1 (Cuantitativa)
𝑃50
Unidad de medición
𝑃25
3. Ubique los límites inferior y superior mediante el rango intercuartil, el límite superior está a 1,5
RIC arriba del P75, mientras que, el límite inferior está a 1,5 RIC debajo del P25.
o Trace los bigotes desde los extremos de las cajas hasta los valores mínimo y máximo dentro de
los límites inferior y superior.
o Marque con asteriscos (*) las localizaciones de los valores atípicos.
*
𝑃75
Variable 1 (Cuantitativa)
𝑃50
Unidad de medición
𝑃25
*
Categoría 1 Categoría 2 Categoría 3
Fuente: Variable 2
Estadística Aplicada I – verano 2023 91
En el diagrama de cajas, también se puede poner las categorías en el eje vertical, con lo que las
cajas y los bigotes estarán de forma horizontal.
Categoría 1
*
Categoría 2
Variable 2
Categoría 3
Variable 1 (Cuantitativa)
Fuente: Unidad de medición
Estadística Aplicada I – verano 2023 92
En la construcción del diagrama de cajas se pueden presentar dos casos, cuando el valor mínimo o
máximo son valores atípicos.
Caso 1: Cuando el valor mínimo es un valor atípico
Si el valor mínimo es un valor atípico, entonces el bigote debe llegar hasta el dato siguiente al valor
mínimo, considerando a este valor como nuevo valor mínimo.
Por ejemplo, si el límite inferior 𝐿𝑖 = 1,7; el percentil 25 𝑃25 = 3,5 y los datos son:
1,5 1,8 2,2 3,4 4,2 … … … 5,8 6,7
Entonces:
Entonces:
*
Valor atípico 6,7
Límite superior 𝐿𝑠 = 6,2
Valor máximo dentro de los límites 5,8
Bigote superior
3,8 Percentil 75 𝑃75
Estadística Aplicada I – verano 2023 93
Valor atípico *
P75 *
P50
Variable cuantitativa
Máximo
P25
Rango Asimetría
RIC
Asimetría en el
50% central
Valor atípico
*
Mínimo
Ejemplo 49
Tentel S.A. desea comparar el tiempo de conexión a Internet en los teléfonos celulares de sus clientes
de acuerdo con sus dos principales usos: Facebook y WhatsApp. Para llevar a cabo la comparación se
desea elaborar un diagrama de cajas. Complete la gráfica:
100
90
80
68.25
63
60
54 57.00
40
33.25
20 24
15
0
Facebook WhatsApp
Fuente: Telnet S.A. Tipo de uso de Internet
a. Complete la gráfica con el diagrama de cajas del tiempo de uso del WhatsApp. Utilice los siguientes
datos:
24 30 30 33 34 38 49 53
61 62 62 66 69 90 118 132
b. En el 50% central, indique el tipo de asimetría de la distribución del tiempo de uso de Facebook.
c. En el 50% central, ¿qué tiempos de uso son más homogéneos?
d. ¿Los tiempos de uso del WhatsApp tiene valor atípico? Si fuera así, ¿cuál es el valor?
Solución
a. Complete la gráfica con el diagrama de cajas del tiempo de uso del WhatsApp.
Solución
Calculamos los percentiles 25, 50 y 75 con los datos de los tiempos de los clientes que usan el
WhatsApp.
La posición del percentil 25 es:
𝑘 × (𝑛 + 1) 25 × (16 + 1)
𝑖= = = 4,25
100 100
El cálculo del percentil 25 es:
𝑃𝑘 = 𝑋[𝐸] + 0, 𝑑(𝑋[𝐸+1] − 𝑋[𝐸] )
𝑃25 = 𝑋[4] + 0,25(𝑋[4+1] − 𝑋[4] ) = 33 + 0,25 × (34 − 33) = 33,25
24 30 30 33 34 38 49 53
61 62 62 66 69 90 118 132
Estadística Aplicada I – verano 2023 95
𝑘 × (𝑛 + 1) 50 × (16 + 1)
𝑖= = = 8,5
100 100
El cálculo del percentil 50 es:
𝑃50 = 𝑋[8] + 0,5(𝑋[8+1] − 𝑋[8] ) = 53 + 0,5 × (61 − 53) = 57
24 30 30 33 34 38 49 53
61 62 62 66 69 90 118 132
24 30 30 33 34 38 49 53
61 62 62 66 69 90 118 132
El extremo del bigote superior = 118, pues el límite superior es 120,75 y, por tanto, el máximo
de los valores dentro los límites es 118. El valor 132 será un valor atípico.
24 30 30 33 34 38 49 53
61 62 62 66 69 90 118 132
100
90
80
68.25
63
60
54 57.00
40
33.25
20 24
15
0
Facebook WhatsApp
Fuente: Telnet S.A. Tipo de uso de Internet
Solución
b. En el 50% central, la distribución del tiempo de uso del Facebook tiene asimetría positiva.
c. En el 50% central, son más homogéneos con el uso del WhatsApp, pues su rango intercuartil es 35
minutos es menor que el rango intercuartil del uso de Facebook que es de 36 minutos.
d. El valor 132 de los tiempos de uso del WhatsApp es un valor atípico, pues está fuera de los límites.
Estadística Aplicada I – verano 2023 97
Ejercicios
59. Un ingeniero eléctrico está realizando una investigación acerca de la duración de los focos
eléctricos fabricado por dos empresas, para ello ha recolectado dos muestras aleatorias con datos
correspondientes a la duración (en horas) de una muestra de 40 focos de 100 watts producidos
por la empresa Alfa y una muestra de 40 focos de 100 watts producidos por la empresa Gamma.
El ingeniero afirma que las duraciones de los focos fabricados por la empresa Alfa están
concentradas en valores altos y las duraciones de los focos fabricados por la empresa Gamma
están concentrados en valores bajos, y por lo tanto los focos fabricados por Alfa son más
confiables.
¿Serán confiables los focos fabricados por Alfa? Utilice dimensiones para su solución. Complete
el diagrama de cajas.
60. La empresa Tricon realiza un estudio sobre el tiempo de espera en las obras. Considera que esta
variable es necesaria pues el concreto premezclado tiene un tiempo de vida de aproximadamente
tres horas. A continuación, se presentan los datos de los tiempos de espera, en minutos, de las
45 obras a las cuales se envió el concreto premezclado desde la planta de los Olivos:
23 34 37 38 41 43 44 46 47 48 49 49 51 51 52
53 54 55 57 58 58 58 58 59 59 60 60 60 60 61
62 62 62 63 63 63 64 65 70 73 74 76 78 88 89
También se presenta el diagrama de cajas de los tiempos de espera (en minutos) para las plantas
de Lurín y Callao, desde donde se envía el concreto premezclado.
TiempoDistribución
de esperadedel concreto
obras premezclado
según tiempo porplanta
de espera por planta
( en minutos)
80
74
Tiempos de espera, en minutos
70 67
60 58 56.75 58
53
Datos
50 49.5
40 39 39,25
30
23 25
20
LURIN CALLAO OLIVOS
Medidas de asimetría
Las medidas de asimetría permiten determinar la forma de una distribución para un conjunto de datos.
Si los datos se distribuyen con igual frecuencia y alejados por debajo y por encima de la media, se
dice que la distribución es simétrica.
Si los datos que son menores a la media son más frecuentes que aquellos por encima de la media
o viceversa, se dice que la distribución es asimétrica.
Si la distribución es asimétrica positiva; existe mayor concentración de valores a la izquierda de la
media. (valores bajos)
Si la distribución es asimétrica negativa; existe mayor concentración de valores a la derecha de la
media. (valores altos)
Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una
concentración de datos en los valores altos.
Si un grupo de datos tiene un coeficiente de asimetría nulo, esto significa que hay una
concentración de datos alrededor de la media.
Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una
concentración de datos en los valores bajos.
Estadística Aplicada I – verano 2023 100
Ejemplo 50
Se tomó una muestra aleatoria de seis piezas de engranaje de un almacén para ser utilizados en
maquinarias industriales y se calculó los siguientes estadísticos para la variable antigüedad en años,
los resultados fueron los siguientes:
14 15 16 16 20 21
Solución
Primero, calculemos la media y la desviación estándar muestral.
𝑥̅ = 17
𝑚𝑒 = 16
𝑠 = 2,8284
Luego, calculemos el coeficiente de asimetría.
3(𝑥̅ − 𝑚𝑒)
𝐴𝑠 =
𝑠
3(17 − 16)
𝐴𝑠 =
2,8284
𝐴𝑠 = 1,0607
Como el 𝐴𝑠 > 0, entonces existe asimetría positiva, por lo que la concentración de la antigüedad de las
piezas de engranaje se encuentra en los valores bajos.
Ejemplo 51
Los siguientes datos corresponden a la distribución del número de piezas defectuosas producidas en
una muestra aleatoria de 30 días.
Número de piezas defectuosas 𝒙𝒊 𝒇𝒊
3 6
4 8
5 12
6 3
7 1
Total 30
Fuente: Empresa A
Solución
Primero, calculemos la media y la desviación estándar muestral.
𝑥̅ = 4,5
𝑚𝑒 = 5
𝑠 = 1,0422
Estadística Aplicada I – verano 2023 101
𝐴𝑠 = −1,4393
Como el 𝐴𝑠 < 0, entonces existe asimetría negativa, por lo que la concentración del número de piezas
defectuosas se encuentra en los valores altos.
0.30 0.27
0.25 0.20
0.20
0.15 0.10
0.10
0.03
0.05
0.00
0 1 2 3 4 5 6 7 8
Número de piezas defectuosas
Fuente: Empresa A
Estadística Aplicada I – verano 2023 102
Ejercicios
61. Con base en un célebre experimento, Henry Cavendish (1731 -1810) ofreció evidencias directas
de la ley de la gravitación universal de Newton. En el experimento se determinó el peso de masas
de objetos, la medida de la fuerza de atracción se usó para calcular la densidad de la Tierra. Los
valores de la densidad de la Tierra, en orden temporal por filas son:
5,1 5,27 5,29 5,29 5,3 5,34 5,34 5,36 5,39 5,42 5,44 5,46
5,47 5,53 5,57 5,58 5,62 5,63 5,65 5,68 5,75 5,79 5,85 5,82
1,2 2,1 2,2 2,2 2,5 2,5 2,6 2,6 2,7 2,8 3,0 3,0 3,2 3,2 3,2
3,4 3,4 3,5 3,5 3,6 3,6 3,6 3,6 3,7 3,8 3,9 3,9 4,0 4,0 4,0
mantenimiento a las maquinas tejedoras. Para tal propósito ha seleccionado una muestra
aleatoria de 16 piezas de telas, los datos se muestran a continuación:
3 4 4 4 5 5 6 6 8 8 8 8 8 9 9 9
Unidad 2. Aplicaciones de
distribuciones de probabilidad
Logro
Al término de la unidad, el estudiante utiliza las distribuciones de probabilidad para modelar variables
dentro de situaciones de incertidumbre en contextos reales.
Temario
Probabilidad: concepto, experimento aleatorio, espacio muestral y evento.
Operaciones con eventos
Probabilidad de eventos
Probabilidad condicional
Probabilidad total
Teorema de Bayes
Definición de variable aleatoria discreta y continua
Función de probabilidad de una variable aleatoria discreta
Estadística Aplicada I – verano 2023 105
Conceptos
Experimento aleatorio
Es un proceso que, al ser realizado u observado repetidas veces, bajo las mismas condiciones, genera
más de un posible resultado que no puede ser determinado de antemano. Se denota por ε.
Ejemplo 52
𝜀1 Lanzamiento de un dado
𝜀2 Traslado de productos de un almacén al centro de distribución
𝜀3 Selección de un producto para la inspección de calidad
𝜀4 Registrar el tiempo de vida de un celular en meses
Espacio muestral
Es el conjunto de todos los posibles resultados de un experimento aleatorio. Se le suele simbolizar
como 𝑆.
Ejemplo 53
• Si lanzamos un dado y anotamos el número que muestra la cara superior, entonces el espacio
muestral es:
𝑆 = {1, 2, 3, 4, 5, 6}
• Si trasladamos productos de un almacén al centro de distribución y anotamos el tiempo de traslado
en minutos, el espacio muestral es:
𝑆 = {𝑡/𝑡 > 0}
donde 𝑡 es el tiempo de traslado.
• Si seleccionamos un producto para la inspección, el espacio muestral es:
𝑆 = {defectuoso, no defectuoso}
• Si registramos el tiempo de vida de un celular y anotamos el tiempo en meses, el espacio muestral
es:
𝑆 = {𝑡/𝑡 > 0}
donde 𝑡 es el tiempo de vida del celular en meses.
Evento
También denominado suceso. Un evento es cada tipo posible de ocurrencia o conjunto de ocurrencias
del experimento estudiado, es decir, un evento es cualquier subconjunto del espacio muestral 𝑆
asociado al experimento. Se le suele simbolizar con cualquier letra mayúscula.
Estadística Aplicada I – verano 2023 106
Ejemplo 54
Evento simple
Es un evento definido por una sola característica.
Ejemplo 55
Ejemplo 56
Ejemplo 57
Complemento de un evento
Para un evento 𝐴 cualquiera se define su complemento 𝐴𝐶 como el evento consistente en todos los
puntos de 𝑆 que no están en 𝐴. Se tiene que:
𝑃(𝐴𝑐 ) = 1 − 𝑃(𝐴)
𝐴𝑐 se expresa como: “El evento A no ocurre”.
Ac
Ejemplo 58
entonces
𝐴𝑐 = {1, 3, 5, 6}
Estadística Aplicada I – verano 2023 108
Ω
A B
Ejemplo 59
Eventos independientes
Son aquellos eventos en los que la ocurrencia de un evento no influye en la ocurrencia de otro o de
otros eventos.
Ejemplo 60
Un sistema está conformado por tres componentes que funcionan independientemente. Sean los
siguientes eventos:
A = {El primer componente funciona correctamente}
B = {El segundo componente funciona correctamente}
C = {El tercer componente no funciona correctamente}
Estadística Aplicada I – verano 2023 109
Análisis combinatorio
Principio de la multiplicación
El número de resultados posibles de 𝑘1 eventos en el primer intento, 𝑘2 eventos en el segundo intento,
. . ., 𝑘𝑛 eventos en el n-ésimo intento.
También es el número de resultados posibles si una operación puede realizarse de 𝑘1 formas y por
cada una de éstas una segunda operación se puede realizar de 𝑘2 formas, ... y la n-ésima operación se
puede realizar de 𝑘𝑛 formas.
𝑘1 × 𝑘2 × 𝑘3 × ⋯ × 𝑘𝑛
Ejemplo 61
Un producto se arma en tres etapas, para la primera etapa se tienen disponibles cinco líneas de
armado, para la segunda cuatro y para la tercera seis ¿de cuántas maneras distintas se puede armar el
producto?
Etapa I Etapa II Etapa III
5 4 6
Solución
Por la regla de multiplicación un producto se puede armar de 5 x 4 x 6 = 120 formas
Principio de la adición
El número de formas posibles de realizar alguna de n operaciones si una operación puede realizarse
de 𝑘1 formas, una segunda operación se puede realizar de 𝑘2 formas, ... y la n-ésima operación se
puede realizar de 𝑘𝑛 formas y además todas las operaciones son mutuamente excluyentes.
𝑘1 + 𝑘2 + 𝑘3 + ⋯ + 𝑘𝑛
Ejemplo 62
Una persona puede viajar de una ciudad a otra por carretera de tres formas y por tren de dos formas.
¿De cuántas formas puede viajar la persona de una ciudad a otra?
Carretera Tren
3 2
Solución
Por la regla de la adición se puede viajar de 3 + 2 = 5 maneras.
Estadística Aplicada I – verano 2023 110
Reglas de conteo
Permutaciones
El número de formas en que 𝑛 objetos distinguibles se pueden ordenar es:
𝑛!
Ejemplo 63
¿De cuántas maneras diferentes se pueden ordenar para su presentación en público a cinco oradores?
Solución
Del enunciado,
𝑛 = 5! = 5 × 4 × 3 × 2 × 1 = 120
La cantidad de maneras es 120.
Permutaciones
Cualquier secuencia ordenada de 𝑟 objetos tomados de un conjunto de 𝑛 objetos distintos se llama
permutación de tamaño 𝑟 de los objetos. El número de permutaciones de tamaño 𝑟 que puede
construirse con los 𝑛 objetos (donde sí importa el orden).
𝑛!
𝑃𝑟𝑛 =
(𝑛 − 𝑟)!
Ejemplo 64
Hay 20 personas para formar un comité. ¿De cuántas maneras diferentes se pueden formar un comité
en el que haya un presidente, un tesorero y un secretario?
Solución
En este caso el orden en el que se escogen las personas es importante. Donde 𝑛 = 30 y 𝑟 = 3 tenemos:
30!
𝑃330 = = 24360
(30 − 3)!
Ejemplo 65
En un campeonato de fútbol participan 12 equipos ¿De cuántas maneras se pueden ocupar los tres
primeros puestos?
Solución
12!
𝑃312 = = 1320
(12 − 3)!
Combinaciones
Es el número de formas de seleccionar 𝑟 objetos de un total de 𝑛 objetos distinguibles sin tomar en
cuenta el orden.
𝑛!
𝐶𝑟𝑛 =
𝑟! (𝑛 − 𝑟)!
Estadística Aplicada I – verano 2023 111
Ejemplo 66
Hay 30 persona para formar un comité de tres personas. ¿De cuántas formas distintas se puede formar
el comité?
Solución
En este caso el orden con que se escojan las personas carece de importancia y ninguna va a ser escogida
dos o más veces. Entonces aplicando la regla de combinaciones 𝑛 = 20 y 𝑟 = 3 tenemos:
30!
𝐶330 = = 4060
3! (30 − 3)!
Ejemplo 67
Una persona realiza una jugada de la Tinka, que es un juego de lotería que consiste en elegir 6
números de 45 números posibles. ¿De cuántas maneras diferentes puede elegir esa jugada?
Solución
45!
𝐶645 = = 8 145 060
6! (45 − 6)!
Estadística Aplicada I – verano 2023 112
Ejercicios
68. El jefe de planta de una empresa embutidos desea efectuar algunas remodelaciones y requiere
los servicios de un distribuidor de máquinas industriales de cocina, de un contratista plomero y
de un contratista electricista. Si, en la zona, hay tres distribuidores de máquinas industriales de
cocina, diez contratistas plomeros y siete contratistas electricistas. ¿De cuántas formas se pueden
seleccionar estos tres servicios?
69. Un producto electrónico se vende en tres mercados. En el primer mercado se tienen disponibles
cinco tiendas, en el segundo cuatro y en el tercer mercado, seis tiendas. ¿De cuántas maneras
puede venderse el producto?
70. Una empresa industrial ha empezado un proyecto que tiene como objetivo incrementar la
capacidad de una de sus plantas en el cono Norte. El proyecto ha sido dividido en dos etapas:
etapa 1 (diseño) y etapa 2 (construcción). La etapa 1 se puede realizar en tres posibles periodos:
2, 3 ó 4 meses y la etapa 2 se puede realizar en 6, 7 u 8 meses. Calcule todas las posibles maneras
de que se realice el proyecto.
71. La empresa A desea contratar un profesional de ingeniería industrial a través de un concurso. Si
a la entrevista se presentan diez profesionales. ¿De cuántas formas distintas se pueden adjudicar
el orden de mérito de los diez profesionales?
72. Una empresa fabricante de electrodomésticos cuenta en su almacén de productos terminados
con un lote de diez refrigeradoras, de las cuales tres de ellas presentan algún tipo de falla. Un
comerciante compra tres de ellas, la empresa hace la elección de las refrigeradoras en forma
aleatoria, se pide determinar lo siguiente:
a. Calcule el número de partidos se deben programar si cada integrante jugará con cada uno de
los demás sin partido de revancha.
b. Calcule el número de partidos se deben programar si cada integrante jugará con cada uno de
los demás con partido de revancha.
74. Cinco matrimonios acuden juntos al teatro. El día anterior reservaron por teléfono diez butacas
contiguas en una misma fila. Retiran las entradas y las reparten aleatoriamente entre los diez.
75. Una caja contiene cuatro bombillas de 40W, cinco de 60W y seis de 100W. En una única
extracción.
d. ¿De cuántas maneras se pueden seleccionar tres bombillas de manera que las tres tengan la
misma potencia?
Estadística Aplicada I – verano 2023 114
Concepto de probabilidad
Las decisiones que toma un ingeniero a menudo se basan en un análisis de situaciones como las
siguientes:
¿Cuál es la posibilidad de que el nuevo método de ensamble incremente la productividad?
¿Qué tan probable es que el proyecto se termine a tiempo?
¿Cuál es la posibilidad de que el producto entregado por el proveedor cumpla las especificaciones
técnicas solicitadas?
Probabilidad
La probabilidad es la evaluación numérica de la posibilidad de que un evento ocurra. Los valores de
probabilidad siempre se asignan en una escala de 0 a 1.
0 ≤ 𝑝 ≤ 1
Un valor de probabilidad cercano a 0 indica que es muy improbable que ocurra el evento, mientras
que una probabilidad cercana a 1 indica que es casi seguro que ocurra el evento.
El objetivo del cálculo de probabilidades es el obtener un valor numérico asociado con la ocurrencia
de determinado acontecimiento para facilitar la toma de decisiones relacionada con él.
EJEMPLO:
En el salón hay 36 alumnos de los cuales 16 son mujeres
P ( H ) = 20 / 36
P ( M ) = 16 / 36
Axiomas de probabilidad
En Matemáticas, un axioma es cada uno de los principios indemostrables sobre los que, por medio de
un razonamiento deductivo, se construye una teoría. Los axiomas de probabilidad fueron establecidos
en 1933 cuando Andréi Kolmogorov publicó su libro Los fundamentos de la teoría de la probabilidad.
Los tres axiomas son los siguientes:
Estadística Aplicada I – verano 2023 115
EJEMPLO:
Sea el experimento: Lanzar un dado = S = { 1, 2, 3, 4, 5, 6}
A1 = { 3, 5, 6}
A2 = {1, 3, 4}
A3 = { 2 }
A4 = { 5 }
P ( A1 ) = 3/6 = ½ = 0,5
P ( A2 U A3 U A4 ) = P ( A2 ) + P ( A3 ) + P ( A4 ) = 3/6 + 1/6 +1/6 = 5/6
“eventos mutuamente excluyentes” significa que los eventos no tienen intersección de elementos
Teoremas de probabilidad
Si f es el evento vacío, entonces:
𝑃(f) = 0
Si 𝐴 y 𝐵 son eventos cualesquiera, entonces:
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) – 𝑃(𝐴 ∩ 𝐵)
EJEMPLO:
A1 = { 3, 5, 6}
A2 = {1, 3, 4}
SEGÚN TEOREMA: P ( A1 U A2 ) = P ( A1 ) + P ( A2 ) - P ( A1 A2 ) = 3/6 + 3/6 – 1/6 = 5/6
Operaciones con eventos
Diagramas de Venn
Una primera herramienta muy útil para mostrar la relación entre el espacio muestral y los eventos que
lo componen es el diagrama de Venn (teoría de conjuntos) donde el espacio muestral, representado
por un rectángulo, es el equivalente al conjunto universo y los eventos del espacio muestral,
representados por figuras geométricas cerradas, generalmente por círculos dentro del rectángulo,
equivalen a los conjuntos.
Los diagramas de Venn fueron desarrollados por John Venn 12 (Drypool, 4 de agosto de 1834 -
Cambridge, 4 de abril de 1923), matemático y lógico británico.
Unión de eventos
Para dos eventos 𝐴 y 𝐵, la unión de los eventos 𝐴 y 𝐵 expresado como 𝐴 ∪ 𝐵 es el evento que
contienen todos los puntos de 𝑆 que pertenecen a 𝐴 o a 𝐵 o a ambos.
Estadística Aplicada I – verano 2023 116
A B
Intersección de eventos
Para dos eventos 𝐴 y 𝐵, la intersección de los eventos 𝐴 y 𝐵 expresado como (𝐴 ∩ 𝐵) es el evento que
contienen todos los puntos de 𝑆 que pertenecen tanto a 𝐴 como a 𝐵.
A B
Diferencia de eventos (A – B)
Para dos eventos A y B, la diferencia de los eventos A y B es el evento que contienen todos los puntos
de S que pertenecen a A y no pertenecen a B.
A B
A B
Ejercicios
76. El 30% de los estudiantes en una universidad son limeños, el 10 % estudian ingeniería, el 1%
estudian ingeniería y son limeños. Si se selecciona al azar un estudiante:
Ejemplo 68
Ingenieros de la planta mecánica de la empresa Indumental prueban una nueva técnica de soldadura
de arco. Se muestreo 300 soldaduras, las cuales fueron analizadas y clasificadas según el resultado de
la prueba de apariencia, así como por el resultado de la prueba de inspección de rayos X, tal como se
muestra en la siguiente tabla:
Distribución de soldaduras según apariencia y resultados de inspección de rayos X
Apariencia
Inspección de rayos X Total
Mala (M) Normal (N) Buena (B)
Mala (X) 45 21 9 75
Normal (Y) 39 63 39 141
Buena (Z) 21 36 27 84
Total 105 120 75 300
Fuente: Indumetal S.A.
𝑃(𝐴∩𝐵)
PROBABILIDAD CONDICIONAL: 𝑃(𝐴⁄𝐵 ) = 𝑃(𝐵)
P ( B / Z ) = 27 / 84 P ( Z B ) = P ( Z B ) = 27 / 300 3. P ( Z / B ) = 27 / 75
Del total de las inspecciones Del total de las inspecciones
¿Cuál es la probabilidad de las
Buenas de rayos X, ¿Cuál es la Buenas de Apariencia, ¿Cuál
soldaduras inspeccionadas dieron un
probabilidad de la apariencia de es la probabilidad de las
buen resultado en apariencia y buen
las soldaduras inspeccionadas soldaduras inspeccionadas
resultado en rayos x?
sean buenas? sean buenas en Rayos X?
X Z = f P( f ) = 0 P ( BC X ) = 66 /
P ( N Y ) = 63 / 300 P ( YC N ) = 57 / 300
P ( X Z ) = 0 / 300 = 0 300
P ( MC ZC ) = / 300 P ( NC MC ) = 75 / 300 P ( M / X ) = 45 / 75 P ( Y / N ) = 63/120
Solución
Definamos los eventos necesarios:
Estadística Aplicada I – verano 2023 120
b. Calcule la probabilidad de que el resultado tenga una apariencia que sea buena.
Solución
Definamos los eventos necesarios:
𝐵 ≔ La prueba de apariencia resulta buena para la soldadura seleccionada.
La probabilidad pedida es:
75
𝑃(𝐵) = = 0,25
300
Apariencia
Inspección de rayos X Total
Mala (M) Normal (N) Buena (B)
Mala (X) 45 21 9 75
Normal (Y) 39 63 39 141
Buena (Z) 21 36 27 84
Total 105 120 75 300
Solución
Definamos los eventos necesarios:
𝑋𝑐 ≔ La prueba de inspección de rayos X no resulta mala para la soldadura seleccionada.
La probabilidad pedida es:
𝑃(𝑋𝐶 ) = 𝑃(𝑌) + 𝑃(𝑍)
141 84
𝑃(𝑋𝐶 ) = + = 0,75
300 300
Apariencia
Inspección de rayos X Total
Mala (M) Normal (N) Buena (B)
Mala (X) 45 21 9 75
Estadística Aplicada I – verano 2023 121
Solución
Definamos los eventos necesarios:
𝑀𝑐 ≔ La prueba de apariencia no resulta mala para la soldadura seleccionada. 𝑍 ≔ La prueba
de inspección de rayos X resulta buena para la soldadura seleccionada.
La probabilidad pedida es:
𝑃(𝑀𝐶 ∪ 𝑍) = 𝑃(𝑀𝐶 ) + 𝑃(𝑍) − 𝑃(𝑀𝐶 ∩ 𝑍)
(120 + 75) 84 (36 + 27)
𝑃(𝑀𝐶 ∪ 𝑍) = + −
300 300 300
𝑃(𝑀𝐶 ∪ 𝑍) = 0,72
Apariencia
Inspección de rayos X Total
Mala (M) Normal (N) Buena (B)
Mala (X) 45 21 9 75
Normal (Y) 39 63 39 141
Buena (Z) 21 36 27 84
Total 105 120 75 300
Estadística Aplicada I – verano 2023 123
Ejercicios
77. La empresa Plast&Cos fabrica placas circulares plásticas de policarbonato, pero últimamente sus
productos han sido devueltos por la baja resistencia encontrada. Por ello, el área de control de
calidad ha seleccionado al azar 300 placas circulares y analizado la resistencia a las rayaduras y a
los impactos. Los resultados se encuentran en la siguiente tabla.
78. Se presenta una tabla donde se resume los pedidos realizados durante el último año clasificado
por tamaño de empresa, ciudad donde se ubica el proveedor y si el pedido sufrió algún retraso.
Distribución de pedidos de madera según tamaño de la empresa, ciudad y retraso del pedido
Pedido con retraso Pedido sin retraso
Tamaño de empresa Total
Pucallpa(P) Ucayali(U) Satipo(T) Pucallpa(P) Ucayali(U) Satipo(T)
Mediana (A) 5 20 10 30 5 15 85
Pequeña (B) 15 30 15 20 10 15 105
Microempresa © 20 40 25 12 3 10 110
Total 40 90 50 62 18 40 300
Fuente: Elaboración propia
Probabilidad condicional
Sean los eventos 𝐴 y 𝐵 ∈ Ω, entonces la probabilidad de que ocurra el evento 𝐴 teniendo como
condición que el evento 𝐵 ya ocurrió, se denomina probabilidad condicional.
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴⁄𝐵 ) =
𝑃(𝐵)
A B
𝑃(𝐴 ∩ 𝐵) 𝑃(𝐵)
Ejemplo 69
En una muestra aleatoria de 30 alumnos de la universidad A los resultados se clasifican por sexo y
por carrera. El resumen de los resultados se muestra en la siguiente tabla:
Distribución de alumnos según sexo y carrera
Sexo
Total
Carrera Femenino (F) Masculino (M)
Ingeniería en Gestión Minera (A) 1 5 6
Ingeniería de Sistema de Información (B) 3 2 5
Ingeniería de Software © 2 2 4
Ingeniería en Gestión Empresarial (D) 4 1 5
Ingeniería Industrial (E) 2 8 10
Total 12 18 30
Fuente: Universidad A
Solución
La probabilidad pedida es:
2
𝑃(𝐵 ∩ 𝑀) 30
𝑃(𝐵 ⁄𝑀) = = = 0,1111
𝑃(𝑀) 18
30
Sexo
Total
Carrera Femenino (F) Masculino (M)
Ingeniería en Gestión Minera (A) 1 5 6
Ingeniería de Sistema de Información (B) 3 2 5
Ingeniería de Software © 2 2 4
Ingeniería en Gestión Empresarial (D) 4 1 5
Ingeniería Industrial (E) 2 8 10
Total 12 18 30
Solución
La probabilidad pedida es:
𝑃(𝐵 ∩ 𝐹) 3
𝑃(𝐵 ⁄𝐹) = = = 0,25
𝑃(𝐹) 12
Sexo
Total
Carrera Femenino (F) Masculino (M)
Ingeniería en Gestión Minera (A) 1 5 6
Ingeniería de Sistema de Información (B) 3 2 5
Ingeniería de Software © 2 2 4
Ingeniería en Gestión Empresarial (D) 4 1 5
Ingeniería Industrial (E) 2 8 10
Total 12 18 30
Estadística Aplicada I – verano 2023 126
Solución
La probabilidad pedida es:
𝑃(𝐸𝑐 ∩ 𝑀) 5 + 2 + 2 + 1
𝑃(𝐸 𝑐 ⁄𝑀) = = = 0,5556
𝑃(𝑀) 18
Sexo
Total
Carrera Femenino (F) Masculino (M)
Ingeniería en Gestión Minera (A) 1 5 6
Ingeniería de Sistema de Información (B) 3 2 5
Ingeniería de Software © 2 2 4
Ingeniería en Gestión Empresarial (D) 4 1 5
Ingeniería Industrial (E) 2 8 10
Total 12 18 30
Estadística Aplicada I – verano 2023 127
Ejercicios
79. Un estudio de mejoramiento de la producción del fabricante de semiconductores Indumetal
proporcionó información en una muestra de 530 placas de silicio. La información se presenta en
la siguiente tabla:
80. Flama Gas S. A. es una empresa que fabrica y comercializa termas a gas para uso doméstico e
industrial. La empresa cuenta con dos plantas de producción ubicadas en Ate y Callao. En la
siguiente tabla se muestra información acerca de la producción de termas:
Distribución de termas a gas según ubicación de la planta, tipo de combustible y capacidad
Ubicación Ate (P) Ubicación Callao (Q)
Capacidad Total
Dual (D) GLP (E) GN (F) Dual (D) GLP (E) GN (F)
10 litros (A) 18 2 38 16 4 20 98
14 litros (B) 6 8 6 10 6 18 54
18 litros © 10 4 6 14 6 8 48
Total 34 14 50 40 16 46 200
Fuente: Flama Gas S. A
Se selecciona una terma al azar.
a. Calcule la probabilidad que sea de capacidad de 14 litros o que haya sido producida en la
planta de producción del Callao. Rpta. 0,61
P ( B U Q ) = P ( B ) + P ( Q ) - P ( B Q ) = 54/200 + 102/200 – 34/200 = 122/200 = 0,61
b. Calcule la probabilidad que sea de capacidad de 10 litros y que haya sido producida en la planta
de Ate. Rpta. 0,29
P ( A P ) = 58 /200 = 0,29
c. Calcule la probabilidad que sea de capacidad de 18 litros o que use solo gas natural. Rpta. 0,65
d. Si se sabe que fue producida en la planta de Ate ¿cuál es la probabilidad que sea de capacidad
de 14 litros? Rpta.
0,20408
P ( B / P ) = 20 / 98 = 0,2041
e. Calcule la probabilidad de que la terma utilice gas dual y sea de una capacidad de 10 litros, si
se sabe que ha sido producida en la planta de producción de Ate. Rpta.
0,18367
P ( (D U A ) / P ) = 18 / 98 = 0,1837
81. La mayoría de las estaciones de servicio Súper Gas S.A. venden tres tipos de gasolina: 90 octanos,
95 octanos y 97 octanos. Con frecuencia, alguna de cada está enriquecida con un aditivo. La tabla
siguiente ilustra la cantidad de clientes que prefieren cada tipo.
82. Los equipos usan tres tipos de lubricantes (mineral, sintético y semisintético) que incluyen o no
cierto aditivo. La tabla siguiente ilustra la cantidad de equipos averiados del área de producción
de colchones, distribuidos por marca y tipo de lubricante empleado (con y sin aditivo).
Shell (S) 5 10 5 10 15 5 50
Mobil (M) 15 20 40 40 30 20 165
Chevron © 45 25 30 100 60 25 285
Estadística Aplicada I – verano 2023 129
Eventos independientes
Son aquellos eventos en los que la ocurrencia de un evento no influye en la ocurrencia de otro u otros
eventos.
Propiedades
Si los eventos 𝐴 y 𝐵 son independientes, entonces también son independientes:
𝐴 y 𝐵𝑐 , es decir, 𝑃(𝐴 ∩ 𝐵𝑐 ) = 𝑃(𝐴)𝑃(𝐵𝑐 )
𝐴𝑐 y 𝐵, es decir, 𝑃(𝐴𝑐 ∩ 𝐵) = 𝑃(𝐴𝑐 )𝑃(𝐵)
𝐴𝑐 y 𝐵𝑐 ,es decir, 𝑃(𝐴𝑐 ∩ 𝐵𝑐 ) = 𝑃(𝐴𝑐 )𝑃(𝐵𝑐 )
Ejemplo 70
El dispositivo de un submarino tiene cuatro válvulas que funcionan de manera independiente, cuyas
probabilidades de fallar son, respectivamente, iguales a 0,08; 0,12; 0,22 y 0,34.
a. ¿Cuál es la probabilidad de que falle al menos una de las válvulas?
Solución
Definamos los eventos necesarios y sus probabilidades:
𝑉1 ∶= que falla la válvula 1 𝑃(𝑉1 ) = 0,08
𝑉2 ∶= que falla la válvula 2 𝑃(𝑉2 ) = 0,12
𝑉3 ∶= que falla la válvula 3 𝑃(𝑉3 ) = 0,22
𝑉4 ∶= que falla la válvula 4 𝑃(𝑉4 ) = 0,34
𝑃(𝑉)
Se cumple que:
𝑃(𝑉) = 1 − 𝑃(𝑉 𝑐 ) = 1 − 𝑃(𝑉1𝑐 ∩ 𝑉2𝑐 ∩ 𝑉3𝑐 ∩ 𝑉4𝑐 )
Como los eventos 𝑉1 , 𝑉2 , 𝑉3 y 𝑉4 son eventos independientes.
= 1 − 𝑃(𝑉1𝑐 )𝑃(𝑉2𝑐 )𝑃(𝑉3𝑐 )𝑃(𝑉4𝑐 )
= 1 − (0,92 × 0,88 × 0,78 × 0,66)
= 1 − 0,4168
𝑃(𝑉) = 0,5832
b. ¿Cuál es la probabilidad de que falle sólo una de las válvulas?
Solución
Definamos los eventos necesarios:
𝐴 ≔ falle solo la válvula 1
𝐵 ≔ falle solo la válvula 2
𝐶 ≔ falle solo la válvula 3
𝐷 ≔ falle solo la válvula 4
𝑆 ≔ que falle solo una válvula
𝑃(𝐴) = 𝑃(𝑉1 ∩ 𝑉2𝑐 ∩ 𝑉3𝑐 ∩ 𝑉4𝑐 ) = 0,08 × 0,88 × 0,78 × 0,66 = 0,0362
𝑃(𝐵) = 𝑃(𝑉1𝑐 ∩ 𝑉2 ∩ 𝑉3𝑐 ∩ 𝑉4𝑐 ) = 0,92 × 0,12 × 0,78 × 0,66 = 0,0568
𝑃(𝐶) = 𝑃(𝑉1𝑐 ∩ 𝑉2𝑐 ∩ 𝑉3 ∩ 𝑉4𝑐 ) = 0,92 × 0,88 × 0,22 × 0,66 = 0,1176
𝑃(𝐷) = 𝑃(𝑉1𝑐 ∩ 𝑉2𝑐 ∩ 𝑉3𝑐 ∩ 𝑉4 ) = 0,92 × 0,88 × 0,78 × 0,34 = 0,2147
La probabilidad pedida es:
𝑃(𝑆) = 𝑃(𝐴 ∪ 𝐵 ∪ 𝐶 ∪ 𝐷)
Como 𝐴, 𝐵, 𝐶 𝑦 𝐷 son eventos mutuamente excluyentes:
𝑃(𝑆) = 𝑃(𝐴) + 𝑃(𝐵) + 𝑃(𝐶) + 𝑃(𝐷)
𝑃(𝑆) = 0,0362 + 0,0568 + 0,1176 + 0,2147
𝑃(𝑆) = 0,4253
Estadística Aplicada I – verano 2023 132
Ejercicios
83. Para señalar las emergencias que pudieran presentarse en una fábrica se ha instalado dos alarmas
que funcionan independientemente. La probabilidad que la alarma A funcione durante una
emergencia es igual a 0,95 y de que la alarma B funcione es 0,90. Calcule la probabilidad que
durante una emergencia se logre activar sola una alarma. Rpta. 0,14
84. El análisis de confiabilidad constituye la rama de la ingeniería que se dedica al cálculo de las tasas
de fallas de los sistemas. Un sistema contiene dos componentes, A y B, conectados en serie como
se muestra en el diagrama siguiente:
A B
88. Un sistema está conformado por cinco componentes que funcionan independientemente. La
probabilidad de que un componente funcione correctamente es 0,70.
a. Calcule la probabilidad de que al menos un componente funcione correctamente.
Rpta. 0,99757
b. Calcule la probabilidad de que al menos un componente no funcione correctamente.
Rpta. 0,83193
89. El número de trabajadores que se necesitan para reparar un cierto equipo es 3. En un día les
corresponde reparar a Andrés, Marcos y Fernando. La probabilidad de que Andrés falle en su
tarea es 0,05; Marcos falle es 0,06; Fernando falle es 0,08. Los tres trabajadores realizan su tarea
de manera independiente. Calcule la probabilidad que al menos uno de ellos falle en su tarea.
Estadística Aplicada I – verano 2023 133
Estadística Aplicada I – verano 2023 134
𝐴1 ∪ 𝐴2 ∪ ⋯ ∪ 𝐴𝑘 = Ω
𝐴1 𝐴2 … 𝐴𝑘
EJEMPLO:
En una fábrica se elabora un artículo en 3 procesos, en el proceso A, se avanza 30% del producto, en
el proceso B, se avanza el 45% del producto y en el proceso C, se termina el artículo a elaborar. Durante
el proceso A se genera un 2% de artículos defectuosos, durante el proceso B se generan un 10% de
artículos defectuosos y durante el proceso C, se genera un 5% de artículos defectuosos.
1. Selecciona un artículo de la fábrica al azar, halle la probabilidad de que sea defectuoso.
2. Si el artículo es defectuoso, cual es la probabilidad de que haya sido elaborado en el
proceso B.
𝑃(𝐷⁄𝐴) = 0,02
𝑃(𝐴) = 0,30
𝑃(𝐷𝑐 ⁄𝐴) = 0,98
𝑃(𝐷⁄𝐵) = 0,10
𝑃(𝐵) = 0,45
𝑃(𝐷𝑐 ⁄𝐵) = 0,90
𝑃(𝐷⁄𝐶 ) = 0,05
𝑃(𝐶 ) = 0,25
𝑃(𝐷𝑐 ⁄𝐶 ) = 0,95
𝑃(𝐵) = ∑ 𝑃(𝐵 ∩ 𝐴𝑖 )
𝑖=1
𝑘
𝐴1 𝐴2 … 𝐴𝑘
𝐵
Estadística Aplicada I – verano 2023 136
𝑃 (𝐵 ⁄ 𝐴 ) 𝑃 (𝐴 ∩ 𝐵 )
𝑃 ( 𝐴)
𝑃 (𝐵 𝑐 ⁄ 𝐴 ) 𝑃 (𝐴 ∩ 𝐵 𝑐 )
𝑃 (𝐵⁄𝐴𝑐 ) 𝑃(𝐴𝑐 ∩ 𝐵)
𝑐)
𝑃 (𝐴
𝑃(𝐵𝑐 ⁄𝐴𝑐 ) 𝑃(𝐴𝑐 ∩ 𝐵𝑐 )
Teorema de Bayes
Si los 𝑘 eventos 𝐴1 , 𝐴2 , 𝐴3 , ⋯ , 𝐴𝑘 constituyen una partición del espacio muestral Ω y 𝑃(𝐴𝑖 ) ≠ 0 para
todo 𝑖 = 1, 2, 3, … , 𝑘; entonces para un evento 𝐵 cualquier contenido Ω tal que 𝑃(𝐵) ≠ 0
𝑃(𝐴𝑖 ∩ 𝐵)
𝑃(𝐴𝑖 ⁄𝐵) =
𝑃(𝐵)
𝑃(𝐴𝑖 )𝑃(𝐵 ⁄𝐴𝑖 )
𝑃(𝐴𝑖 ⁄𝐵) = 𝑘
∑𝑖=1 𝑃(𝐴𝑖 )𝑃(𝐵/𝐴𝑖 )
Ejemplo 71
Una empresa de manufactura recibe embarques de una determinada pieza de dos proveedores.
Actualmente el 65% de las piezas adquiridas por la empresa provienen del proveedor 1 y 35%
restante del proveedor 2.
La calidad de las piezas adquiridas varía con la fuente de suministro. Con base a los datos
históricos se sabe que la probabilidad que una pieza del proveedor 1 sea defectuosa es 0,02 y la
probabilidad de que una pieza del proveedor 2 sea defectuosa es 0,05.
Si seleccionamos al azar una de las piezas adquiridas por la empresa, calcule la probabilidad de
que sea defectuosa.
Solución
Se definen los siguientes eventos.
𝐸1 = que la pieza provenga del proveedor 1, luego 𝑃(𝐸1 ) = 0,65
𝐸2 = que la pieza provenga del proveedor 2, luego 𝑃(𝐸2 ) = 0,35
𝑃(𝐸1 ) = 0,65
𝑃 (𝐴𝑐 ⁄𝐸1 ) = 0,98 𝑃(𝐸1 ∩ 𝐴𝑐 )
𝑃(𝐷⁄𝐵) = 0,01
𝑃(𝐵) = 0,35
𝑃(𝐷𝑐 ⁄𝐵) = 0,99
𝑃(𝐷⁄𝐶 ) = 0,02
𝑃(𝐶 ) = 0,25
𝑃(𝐷𝑐 ⁄𝐶 ) = 0,98
2. Si el producto seleccionado no fue defectuoso, ¿cuál es la probabilidad de que haya sido producido
por la máquina tipo B
𝑃(𝐴𝑖 )𝑃(𝐵 ⁄𝐴𝑖 )
𝑃(𝐴𝑖 ⁄𝐵) = 𝑘
∑𝑖=1 𝑃(𝐴𝑖 )𝑃(𝐵/𝐴𝑖 )
P ( B / D ) = (0,35 * 0,99) / 0,9795 = 0,3538
Estadística Aplicada I – verano 2023 138
Solución
Se definen los siguientes eventos.
𝐴: = el artículo es producido por la máquina tipo A, luego se tiene que 𝑃(𝐴) = 0,40
𝐵: = el artículo es producido por la máquina tipo B, luego se tiene que 𝑃(𝐵) = 0,35
𝐶: = el artículo es producido por la máquina tipo C, luego se tiene que 𝑃(𝐶) = 0,25
𝐷: = el artículo es defectuoso.
𝐷 𝑐 : = el artículo no es defectuoso.
Estadística Aplicada I – verano 2023 139
𝑃(𝐷⁄𝐴) = 0,03 𝑃 (𝐴 ∩ 𝐷 )
𝑃(𝐴) = 0,40
𝑃(𝐷𝑐 ⁄𝐴) = 0,97 𝑃 (𝐴 ∩ 𝐷 𝑐 )
𝑃(𝐷⁄𝐵) = 0,01 𝑃 (𝐵 ∩ 𝐷 )
𝑃(𝐵) = 0,35
𝑃(𝐷𝑐 ⁄𝐵) = 0,99 𝑃 (𝐵 ∩ 𝐷 𝑐 )
𝑃(𝐷⁄𝐶 ) = 0,02 𝑃 (𝐶 ∩ 𝐷 )
𝑃(𝐶 ) = 0,25
𝑃(𝐷𝑐 ⁄𝐶 ) = 0,98 𝑃 (𝐶 ∩ 𝐷 𝑐 )
Solución
𝑃(𝐴 ∩ 𝐷 𝑐 ) 0,4 × 0,97
𝑃(𝐵𝑐 ∪ 𝐶 𝑐 ⁄𝐷 𝑐 ) = 𝑃(𝐴⁄𝐷 𝑐 ) = = = 0,3961
𝑃(𝐷 𝑐 ) 1 − 0,0205
Ejemplo 73
Para la empresa tecnológica A, se estima que la probabilidad de hacer un servicio en Lima es de 0,60 y
en el interior del país es de 0,40.
Si el servicio es en Lima, la probabilidad de que sea:
para instalación de equipos es 0,3
para help desk es 0,6
para reparación de equipos es 0,1.
Si el servicio es en el interior del país, la probabilidad de que sea:
para instalación de equipos es 0,5
para help desk es 0,15
para reparación de equipos es 0,35.
Solución
Se define los eventos necesarios:
𝐿: = Contratan a la empresa para un servicio en Lima
𝐿𝑐 : = Contratan a la empresa para un servicio en el interior del país
𝐼: = Contratan a la empresa para un servicio de instalación de equipo
𝐻: = Contratan a la empresa para un servicio de help desk
𝑅: = Contratan a la empresa para un servicio de reparación de equipo
Solución
𝑃(𝐼 ⁄𝐿) = 0,30 𝑃 (𝐿 ∩ 𝐼 )
𝑃(𝐿) = 0,60 𝑃 (𝐻 ⁄𝐿) = 0,60 𝑃 (𝐿 ∩ 𝐻 )
𝑃(𝑅⁄𝐿) = 0,10 𝑃 (𝐿 ∩ 𝑅 )
Solución
Usando el teorema de Bayes, se tiene:
𝑃(𝐿 ∩ 𝐻 𝑐 )
𝑃(𝐿⁄𝐻 𝑐 ) =
𝑃(𝐻 𝑐 )
0,60 × 0,30 + 0,60 × 0,10 0,24
= = = 0,4138
1 − 0,42 0,58
Ejemplo 74
Los clientes acostumbran a evaluar en forma preliminar el diseño de sus productos. En el pasado, 95%
de sus productos de gran éxito recibieron críticas favorables, 60% de los productos con éxito moderado
recibieron críticas favorables y 10% de los productos sin mucho éxito recibieron críticas favorables.
Además, 40% de los productos han sido de gran éxito, 35% han sido de éxito moderado y 25% han sido
productos sin mucho éxito.
Solución
Se definen los eventos necesarios:
𝐺: El producto ha tenido gran éxito
𝑀: El producto ha tenido éxito moderado
𝑃: El producto ha tenido poco éxito
𝐹: El producto tuvo crítica favorable
𝑃(𝐹⁄𝐺 ) = 0,95 𝑃 (𝐺 ∩ 𝐹 )
𝑃(𝐺 ) = 0,40
𝑃(𝐹 𝑐 ⁄𝐺 ) = 0,05 𝑃 (𝐺 ∩ 𝐹 𝑐 )
𝑃(𝐹⁄𝑀) = 0,60 𝑃 (𝑀 ∩ 𝐹 )
𝑃(𝑀) = 0,35
𝑃(𝐹 𝑐 ⁄𝑀) = 0,40 𝑃 (𝑀 ∩ 𝐹 𝑐 )
Estadística Aplicada I – verano 2023 141
𝑃(𝐹⁄𝑃) = 0,10 𝑃 (𝑃 ∩ 𝐹 )
𝑃(𝑃) = 0,25
𝑃 (𝐹 𝑐 ⁄𝑃) = 0,90 𝑃 (𝑃 ∩ 𝐹 𝑐 )
Solución
Usando el teorema de la probabilidad total, se tiene:
𝑃(𝐹) = 0,40 × 0,95 + 0,35 × 0,60 + 0,25 × 0,10
𝑃(𝐹) = 0,380 + 0,210 + 0,025 = 0,615
b. Si un diseño nuevo obtiene una crítica favorable, ¿cuál es la probabilidad de que sea un diseño de
gran éxito?
Solución
Usando el teorema de Bayes, se tiene:
𝑃(𝐺 ∩ 𝐹)
𝑃(𝐺 ⁄𝐹 ) =
𝑃(𝐹)
0,40 × 0,95
= = 0,618
0,615
c. Si un producto no consigue una crítica favorable, ¿cuál es la probabilidad de que sea un producto
de gran éxito?
Solución
Usando el teorema de Bayes, se tiene:
𝑃(𝐺 ∩ 𝐹 𝑐 ) 0,40 × 0,05
𝑃(𝐺 ⁄𝐹 𝑐 ) = = = 0,052
𝑃(𝐹 𝑐 ) 1 − 0,615
Estadística Aplicada I – verano 2023 142
Ejercicios
90. Una compañía de desarrollo urbano está considerando la posibilidad de construir un centro
comercial y una autopista en un sector de la ciudad.
Si el Consejo Municipal aprueba esta autopista, hay una posibilidad de 0,90 que la compañía
construya el centro comercial, en tanto que, si la autopista no es aprobada, la probabilidad que
construya el centro comercial es del 0,20. Basándose en la información disponible el presidente
de la compañía estima que hay una probabilidad de 0,60 de que apruebe la autopista.
a. Calcule la probabilidad que la compañía construya el centro comercial. Rpta. 0,62
b. Dado que el centro comercial se ha construido, calcule la posibilidad de que la autopista haya
sido aprobada. Rpta. 0,87097
91. Dos empresas A y B consideran la posibilidad de competir en una licitación para la construcción
de una carretera, la cual puede ser concedida o no dependiendo del monto de la propuesta. La
empresa A hace una propuesta y la probabilidad de que gane la licitación es 0,75 siempre y
cuando B no se haya presentado. La probabilidad de que B se presente a la licitación es 0,80 y, en
ese caso, la probabilidad de que la empresa A gane la licitación es sólo de 1/3. ¿Cuál es la
probabilidad de que A gane la licitación? Rpta. 0,4167
92. Una empresa de manufactura utiliza tres líneas de producción diferentes, A1, A2 y A3, para
fabricar un componente en particular. De lo fabricado por la línea A1, 5% necesita volver a
trabajarse para corregir un defecto, en tanto que 8% de los componentes de A2 necesitan volver
a trabajarse para corregir un defecto y 10% de los de A3 necesitan volver a trabajarse para
corregir un defecto. Se sabe que el 50% de todos los componentes son producidos por la línea
A1, en tanto que 30% son producidos por la línea A2 y el 20% vienen de la línea A3. Si se extrae
un componente al azar, calcule la probabilidad de que este componente necesite volver a
trabajarse para corregirle un defecto. Rpta. 0,069
93. Tres máquinas, A, B y C producen el 45%, 30% y 25% respectivamente del total de las piezas
producidas en una fábrica. Los porcentajes de producción de defectuosos de estas máquinas son
del 3%, 4% y 5% respectivamente.
94. Suponga que tres ingenieros industriales (Luis, Juan y Pedro) de diferentes áreas de la empresa A
están cerca de jubilarse, dichos ingenieros solicitan sus pedidos al proveedor de servicios. Se sabe
que Luis solicita el 50% de los pedidos, Juan el 20% y Peter el 30%. Se conoce que Luis comete
cinco errores por cada 100 pedidos; Juan se equivoca el 9% de las veces, y Peter la mitad de las
veces que Juan.
Calcule la probabilidad de que un pedido sea solicitado con error. Rpta. 0,0565
a. Si un pedido ha sido solicitado con error, calcule la probabilidad de que el
ingeniero Luis haya solicitado el pedido.
Rpta. 0,44248
95. Dercosa es una próspera empresa que lidera el mercado de reparación de autos en el Cono Norte.
Del total de servicios que brindaron el año pasado, aproximadamente el 40% fueron del área
mecánica, el 35% del área mantenimiento y el resto de otras áreas. Además, se sabe que el costo
de mantenimiento de un servicio es mayor a mil soles, en el 1%, 2% y 5% de las áreas mecánicas,
Estadística Aplicada I – verano 2023 143
Variable aleatoria
Se denomina variable aleatoria a toda función que asocia cada elemento de un espacio muestral Ω a
un número real.
La variable aleatoria es una función que atribuye a cada evento un número que no es aleatorio o
imprevisible, sino fijo y predeterminado. Lo que es aleatorio es el resultado del experimento sobre
cuyo espacio muestral se define la variable aleatoria.
Ejemplo 75
A continuación, se describen algunas variables aleatorias.
El experimento aleatorio es la inspección de un lote de 75 celulares; la variable aleatoria es el
número de celulares defectuosos y su rango 𝑅𝑋 = {0, 1, 2, 3, … , 75}.
El experimento aleatorio es la recepción de llamadas de 100 clientes; la variable aleatoria es el
número de ventas realizadas y su rango 𝑅𝑋 = {0, 1, 2, 3, … , 100}.
El experimento aleatorio es la construcción de nueva biblioteca; la variable aleatoria es el
porcentaje del proyecto terminado luego de 6 meses y su rango 𝑅𝑋 = [0%; 100%].
El experimento aleatorio es el funcionamiento de un almacén; la variable aleatoria es el número
de clientes que entran en un día y su rango 𝑅𝑋 = {0, 1, 2, 3, … }.
Solución
La variable aleatoria 𝑋 es <número de buses que entran al taller para algún servicio> y su rango es
𝑅𝑋 = {𝟎, 𝟏, 𝟐, 𝟑, 𝟒, 𝟓}
Distribución de probabilidad de una variable aleatoria discreta
La distribución de probabilidad de una variable aleatoria discreta 𝑋 es una función 𝑓(𝑥) que asigna a
todo número real 𝑥, la probabilidad de que 𝑋 asuma ese valor, esto es:
Condición 1
𝑓(𝑥) ≥ 0
Condición 2
∑ 𝑓(𝑥) = 1
𝑅𝑋
Condición 1
𝑓(𝑥) ≥ 0
Condición 2
∑ 𝑓(𝑥) = 1
𝑅𝑋
Solución
a. ¿Cuál es la probabilidad de que se demanden 18 platos?
Solución
La probabilidad pedida es:
𝑃(𝑋 > 18) = 𝑃(𝑋 = 20) + 𝑃(𝑋 = 25)
𝑃(𝑋 > 18) = 0,14 + 0,09 = 0,23
c. Calcule la probabilidad de que se demanden a lo más 17 platos.
Solución
La probabilidad pedida es:
𝑃(𝑋 ≤ 17) = 𝑃(𝑋 = 10) + 𝑃(𝑋 = 15) + 𝑃(𝑋 = 17) = 0,57
d. Calcule la probabilidad que se demanden al menos 15 platos, pero no más de 20 platos.
Solución
La probabilidad pedida es:
𝑃(15 ≤ 𝑋 ≤ 20) = 0,12 + 0,35 + 0,20 + 0,14 = 0,81
e. Calcule la probabilidad que se demanden menos de 25 platos.
Solución
En este caso se usa la propiedad del complemento. La probabilidad pedida es:
Estadística Aplicada I – verano 2023 147
Solución
La probabilidad pedida es:
𝑃(15 < 𝑋 ≤ 18) 0,55
𝑃(𝑋 > 15 / 𝑋 ≤ 18) = = = 0,7143
𝑃(𝑋 ≤ 18) 0,77
Ejemplo 78
Calcule “𝑎” para que la siguiente función sea una función de probabilidad y grafique 𝑓(𝑥).
𝑓(𝑥) = 𝑎𝑥 𝑥 = 1, 2, 3, 4, 5
Solución
Como 𝑓(𝑥) es una función de probabilidad, se cumple que ∑5𝑥=1 𝑓(𝑥) = 1.
𝒙 1 2 3 4 5
𝒇(𝒙) a 2ª 3ª 4ª 5ª
∑ 𝑓(𝑥) = 1𝑎 + 2𝑎 + 3𝑎 + 4𝑎 + 5𝑎 = 1
𝑥=1
De donde
𝑎 = 1/15
𝒙 1 2 3 4 5
𝒇(𝒙) 1/15 2/15 3/15 4/15 5/15
Ejercicios
96. En una tienda de venta de artefactos electrónicos, la demanda mensual de impresoras es una
variable aleatoria con la siguiente función de probabilidad.
𝑿: número de impresoras demandadas 80 90 100 120 130 140
3k = k=
𝒇(𝒙) 0,25 0,35 0,10 0,10
0,15 0,05
Responda a cada una de las siguientes preguntas.
a. Determine el valor de 𝑘.
3k + 0,25 + 0,35 + 0,10 + 0,10 + k = 1 4 k = 1 – 0,80 k = 0,05
b. Calcule la probabilidad de que se demanden 80 impresoras.
c. Calcule la probabilidad de que se demanden menos de 100 impresoras.
d. Calcule la probabilidad de que se demanden a lo más 90 impresoras.
e. Calcule la probabilidad que se demanden más de 100 impresoras, pero no más de 130
impresoras.
P ( 100 < X ≤ 130 ) = 0,20
f. Calcule la probabilidad que se demanden más de 80 impresoras.
g. Si se sabe que hoy la demanda será mayor a 90 impresoras, ¿cuál es la probabilidad que se
demanden a lo más 130 impresoras?
Estadística Aplicada I – verano 2023 149
Probabilidad Condicional:
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴⁄𝐵 ) =
𝑃(𝐵)
𝑃(𝐴∩𝐵) 𝑃 (100 ≤ X ≤130 ) 0,55
P ( X ≤ 130/X > 90 ) = = = 0,60 = 0,9167
𝑃(𝐵) 𝑃(𝑋>90)
𝜇𝑋 = 𝐸(𝑋) = ∑ 𝑥𝑖 ∗ 𝑓(𝑥𝑖 )
𝑖=1
Se interpreta como el valor que se espera obtener en promedio al experimentar una y otra vez.
Propiedades de la varianza
𝜎𝑋2 = 𝑉(𝑋) = 𝐸(𝑋2 ) − 𝐸(𝑋)2
𝜎𝑋2 = 𝑉(𝑋) = 𝐸(𝑋2 ) − 𝜇2
Si 𝑎 y 𝑏 son constantes, entonces:
𝑉(𝑏) = 0
𝑉(𝑎𝑋) = 𝑎2 𝑉(𝑋)
𝑉(𝑋 + 𝑏) = 𝑉(𝑋)
Estadística Aplicada I – verano 2023 150
Coeficiente de variación
Una de las medidas de variabilidad que podríamos usar es el coeficiente de variación, tal como lo
usamos en la unidad de medidas de resumen. Esta vez definiremos el coeficiente de variación 𝐶𝑉 de
la siguiente manera:
𝜎𝑋 𝜎𝑋
𝐶𝑉 = × 100% = × 100%
𝐸(𝑋) 𝜇𝑋
Estadística Aplicada I – verano 2023 151
Ejemplo 79
La cantidad de almuerzos demandados al día en el comedor universitario se modela con una variable
aleatoria 𝑋 que tiene la siguiente distribución de probabilidad.
𝒙 10 15 17 18 20 25
𝒇(𝒙) 0,10 0,12 0,35 0,20 0,14 0,09
El costo de cada almuerzo es de seis soles y las vende a diez soles. Todo almuerzo no vendido en el día
se desecha. Calcule el valor esperado y la variabilidad relativa (C. V.) de la utilidad diaria.
Solución
E ( X ) = 10 × 0,10 + 15 × 0,12 + 17 × 0,35 + 18 × 0,20 + 20 × 0,14 + 25 × 0,09 = 17,4
Utilidad de un plato = precio de venta – precio de costo = 10 – 6 = 4 soles.
Por tanto, para 𝑋 platos demandados se tiene que la utilidad será: 𝑈(𝑋) = 4 𝑋
𝑋 𝜎
Variabilidad relativa (C. V.) de la utilidad diaria 𝐶𝑉 = 𝐸(𝑋) × 100%
Varianza de una variable aleatoria discreta: 𝜎𝑋2 = 𝑉(𝑋) = 𝐸(𝑋 2 ) − 𝐸(𝑋)2
E ( X ) = 17,4
𝑛
𝐸(𝑋2 ) = ∑ 𝑥𝑖 2 ∗ 𝑓(𝑥𝑖 )
𝑖=1
𝐸(𝑋2 ) = 102 × 0,10 + 152 × 0,12 + 172 × 0,35 + ⋯ + 252 × 0,09 = 315,2
𝜎𝑋2 = 𝑉(𝑋) = 𝐸(𝑋2 ) − 𝐸(𝑋)2 = 315,2 − 17,42 = 12,44
𝐸(𝑋) = ∑ 𝑥𝑖 𝑓(𝑥𝑖 )
𝑖=1
𝐸(𝑋2 ) = 102 × 0,10 + 152 × 0,12 + 172 × 0,35 + ⋯ + 252 × 0,09 = 315,2
Reemplazando los valores en la varianza de 𝑋, tendremos:
2
𝑉(𝑋) = 𝐸(𝑋2 ) − (𝐸(𝑋))
= 315,2 − 17,42 = 12,44
Ahora calculemos la varianza de la utilidad diaria es:
2
𝜎𝑈(𝑋) = 𝑉(𝑈(𝑋))
= 𝑉(4𝑋)
= 42 𝑉(𝑋)
= 42 × 12,44 = 199,04
La desviación estándar de la utilidad es:
𝜎𝑈 = √199,04 = 14,1082
La variabilidad relativa de la utilidad diaria es el coeficiente de variación.
𝜎𝑈(𝑋)
𝐶𝑉𝑈(𝑋) = × 100%
𝜇𝑈(𝑋)
14,1082
𝐶𝑉𝑈(𝑋) = × 100% = 20,39%
69,2
Estadística Aplicada I – verano 2023 153
Ejemplo 80
𝒙 0 1 2 3 4
𝒇(𝒙) 0 0,10 0,20 0,30 0,40
a. Calcule 𝐸(3𝑋 + 8)
Solución
Primero, calculemos el valor esperado de 𝑋:
0 1 2 3 4
𝐸(𝑋) = 0 × +1× +2× +3× +4× =3
10 10 10 10 10
Por propiedad de valor esperado:
𝐸(3𝑋 + 8) = 3𝐸(𝑋) + 8 = 3 × 3 + 8 = 17
𝒙 0 1 2 3 4
𝒇(𝒙) 0 0,10 0,20 0,30 0,40
𝐸(𝑋2 ) = ∑ 𝑥𝑖 2 ∗ 𝑓(𝑥𝑖 )
𝑖=1
0 1 2 3 4
𝐸(𝑋2 ) = 02 ×
+ 12 × + 22 × + 32 × + 42 × = 10
10 10 10 10 10
𝜎𝑋2 = 𝑉(𝑋) = 𝐸(𝑋2 ) − 𝐸(𝑋)2 = 10 − 32 = 1
Por propiedad de varianza, se tiene que: 𝑉(𝑎𝑋) = 𝑎2 𝑉(𝑋) Y 𝑉(𝑋 + 𝑏) = 𝑉(𝑋)
V ( 2X – 7 ) = 22 V ( X ) V ( 2X – 7 ) = 4 * 1 = 4
Solución
Primero, calculemos el valor esperado de 𝑋2
𝑛
Ejercicios
97. En una tienda de venta de artefactos electrónicos, la demanda mensual de impresoras es una
variable aleatoria con la siguiente función de probabilidad.
𝜇𝑋 = 𝐸(𝑋) = ∑ 𝑥𝑖 ∗ 𝑓(𝑥𝑖 )
𝑖=1
𝜇𝑋 = 𝐸(𝑋) = 80 ∗ 0,15 + 90 ∗ 0,25 + 100 ∗ 0,35 + 120 ∗ 0,10 + 130 ∗ 0,10 + 140 ∗ 0,05 = 101,5
RPTA.: la media de la demanda mensual es 101,5 impresoras
b. Calcule la desviación estándar de la demanda mensual.
𝐸(𝑋 2 ) = ∑ 𝑥𝑖 2 ∗ 𝑓(𝑥𝑖 )
𝑖=1
𝐸(𝑋2 ) = 802 ∗ 0,15 + 902 ∗ 0,25 + 1002 ∗ 0,10 + 1202 ∗ 0,10 + 1302 ∗ 0,10 + 1402 ∗ 0,05
= 10595
𝜎𝑋2 = 𝑉(𝑋) = 𝐸(𝑋2 ) − 𝐸(𝑋)2 = 10595 − 101,52 = 292,75
Desviación estándar de una variable aleatoria discreta: 𝜎𝑋 = √𝑉(𝑋)
𝜎𝑋 = √𝑉(𝑋) = √292,75 = 17,1099
𝐸 (𝑋 2 ) = ∑ 𝑥𝑖 2 ∗ 𝑓 (𝑥𝑖 )
𝑖=1
2
𝑓(𝑥) = {𝑘 𝑥 𝑥 = 1, 2, 3, 4, 6
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a. Calcule 𝑘 para que la función sea una función de probabilidad. Rpta. 0,25
b. 𝑃(2 ≤ 𝑋 < 4) Rpta. 0,3125
c. 𝑃(𝑋 ≤ 4/𝑋 > 1)
99. La demanda diaria de una herramienta en el almacén es una variable aleatoria 𝑋 cuya distribución
de probabilidades está dada por la tabla que sigue:
𝒙 1 2 3 4 5
𝒇(𝒙) 𝑎 = 1/16 4 / 16 𝑏 = 6/16 𝑐 = 4/16 1/16
𝒙 12 14 16 18 20
𝒇(𝒙) 𝑎 = 1/16 4 / 16 𝑏 = 6/16 𝑐 = 4/16 1/16
100. Una empresa produce artículos perecibles. A continuación, se presenta una tabla con los datos
históricos de las demandas semanales obtenidas en las últimas 50 semanas y el número de
semanas de ocurrencia.
101. Considere un grupo de cinco donantes de sangre, de los cuales solo dos tienen sangre ORh+. Se
obtiene cinco muestras de sangre, una de cada individuo y en forma aleatoria son analizadas una
por una, hasta identificar una muestra ORh+. Si se quiere calcular la probabilidad de encontrar
una muestra de dicho tipo de sangre luego de una cantidad de pruebas.
𝐶27 7 Shift , ÷ 2 = 21
𝐶49 9 Shift , ÷ 4 = 126
DISTRIBUCIÓN BINOMIAL:
Se dice que la variable aleatoria 𝑋 sigue una distribución binomial con parámetros “𝑛” y “𝑝” y se
denota:
𝑋 ~ 𝐵 (𝑛, 𝑝)
El rango de la variable 𝑋 es 𝑅𝑋 = 0, 1, 2, ⋯ , 𝑛
Entonces para “𝑛” intentos y la probabilidad “p” de éxito en cualquier intento, la probabilidad de tener
𝑥 éxitos en los “𝑛” intentos está dada por:
𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝐶𝑥𝑛 ∗ 𝑝 𝑥 ∗ (1 − 𝑝)𝑛−𝑥 𝑥 = 0,1,2, ⋯ , 𝑛
Datos:
P = 0,25
Estadística Aplicada I – verano 2023 158
n=6
𝑷(𝑿 = 𝟒) = 𝑪𝟔𝟒 ∗ 𝟎, 𝟐𝟓𝟒 ∗ (𝟏 − 𝟎, 𝟐𝟓)𝟔−𝟒 = 𝟎, 𝟎𝟑𝟑𝟎
P = 0,14
n=4
𝑷(𝑿 < 𝟐) = 𝑷(𝑿 ≤ 𝟏) = 𝑷(𝑿 = 𝟎) + 𝑷(𝑿 = 𝟏) =
𝑪𝟒𝟎 ∗ 𝟎, 𝟏𝟒𝟎 ∗ (𝟏 − 𝟎, 𝟏𝟒)𝟒−𝟎 + 𝑪𝟒𝟏 ∗ 𝟎, 𝟏𝟒𝟏 ∗ (𝟏 − 𝟎, 𝟏𝟒)𝟒−𝟏 = 𝟎, 𝟗𝟎𝟑𝟐
En Excel: =DISTR.BINOM.N(1;4;0,14;1) 0,9032
n = 12
P(X>3)=1–P(X≤3)
P(X≥3)=1-P(X≤2)
P(X<3)=P(X≤2)
Media: 𝜇𝑋 = 𝐸(𝑋) = 𝑛 ∗ 𝑝
Varianza: 𝜎𝑥2 = 𝑛 ∗ 𝑝 ∗ (1 − 𝑝)
8! = 40320
0! = 1
𝑒 −4 = 0,0183
DISTRIBUCIÓN POISSON:
Se dice que la variable aleatoria 𝑋 sigue una distribución de Poisson con parámetro “” y se denota:
𝑋 ~ 𝑃()
El rango de la variable 𝑋 es 𝑅𝑋 = 0, 1, 2, ⋯
La probabilidad de tener 𝑥 resultados en un intervalo dado o en una región específica es:
𝑒 −𝜆 ∗ 𝜆𝑥
𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝑥 = 0, 1, 2, …
𝑥!
Datos:
= 4,3
𝑒 −4,3 ∗ 4,32
𝑷(𝑿 = 𝟐) = = 𝟎, 𝟏𝟐𝟓𝟒
2!
= 3,8
𝑷(𝑿 > 𝟐) = 𝟏 − 𝑷(𝑿 ≤ 𝟐) = 𝟏 − (𝑷(𝑿 = 𝟎) + 𝑷(𝑿 = 𝟏) + 𝑷(𝑿 = 𝟐)) =
𝑒 −3,8 ∗3,80 𝑒 −3,8 ∗3,81 𝑒 −3,8 ∗3,82
𝟏−( + + ) = 𝟎,7311
0! 1! 2!
Estadística Aplicada I – verano 2023 159
Media: 𝑋 = 𝐸(𝑋) =
Varianza: 𝜎𝑋2 = 𝜆
Estadística Aplicada I – verano 2023 160
Características
Independientemente de los valores de 𝑛, se tiene que:
• para 𝑝 = 0,5 entonces la función de probabilidad 𝑓(𝑥) es simétrica.
• para valores de 𝑝 < 0,5 la función de probabilidad 𝑓(𝑥) tiene sesgo derecho.
• para valores de 𝑝 > 0,5 la función de probabilidad 𝑓(𝑥) tiene sesgo izquierdo.
Estadística Aplicada I – verano 2023 161
Para valores de 𝑛 suficientemente grandes (𝑛 > 50), y sólo tomando en cuenta los valores relevantes
de probabilidad, la distribución es prácticamente simétrica.
Media
𝜇𝑋 = 𝐸(𝑋) = 𝑛𝑝
Varianza
𝜎𝑥2 = 𝑛𝑝(1 − 𝑝)
Estadística Aplicada I – verano 2023 162
Ejemplo 81
Se sabe que una máquina que está funcionando normalmente, el 10% de las piezas producidas resultan
defectuosas. Supongamos que seleccionamos al azar tres piezas producidas con la máquina y que
estamos interesados en el número de piezas defectuosas encontradas.
a. Calcule la probabilidad de encontrar menos de dos piezas defectuosas.
b. Calcule el valor esperado y desviación estándar del número de piezas defectuosas.
Solución
a. Calcule la probabilidad de encontrar menos de dos piezas defectuosas.
Solución
Dado el experimento descrito, definimos la variable aleatoria como:
𝑋: = número de piezas defectuosas
Verificamos las cuatro características del experimento para que la variable 𝑋 siga una
distribución binomial:
El experimento se puede describir como una secuencia de tres intentos idénticos, un intento
por cada una de las tres piezas seleccionadas.
Para cada uno de los intentos son posibles dos resultados: pieza defectuosa y pieza no
defectuosa. En concordancia a cómo hemos definido la variable aleatoria, encontrar una pieza
defectuosa será éxito y una no defectuosa será fracaso.
La probabilidad de pieza defectuosa es 0,10 y la de pieza no defectuosa es 0,90 y se supone
que se mantiene constante para todas las piezas.
La condición de una pieza defectuosa es independiente de la condición de otras piezas.
0.5
0.4
0.3 0.243
0.2
0.1 0.027
0.001
0
0 1 2 3 4
Número de piezas defectuosas
Solución
El valor esperado de la variable 𝑋 es:
𝜇𝑋 = 𝐸(𝑋) = 𝑛𝑝 = 3 × 0,10 = 0,30
La varianza de la variable 𝑋 es:
𝜎𝑋2 = 𝑛𝑝(1 − 𝑝) = 3 × 0,10 × (1 − 0,10) = 0,27
La desviación estándar de la variable 𝑋 es:
𝜎𝑋 = √𝑛𝑝(1 − 𝑝) = √0,27 = 0,52
Estadística Aplicada I – verano 2023 164
Ejercicios
102. Un aparato de cocina tiene 16 partes funcionales, cada una de las cuales tiene una probabilidad
de 0,99 de funcionar correctamente hasta el fin del período de garantía del producto. Las partes
funcionan de manera independiente, pero si dos o más no funcionan, el aparato tampoco. ¿Cuál
es la probabilidad de que uno de estos aparatos seleccionado al azar funcione bien durante todo
el periodo de garantía?
103. Una compañía encuestadora va a entrevistar a 50 personas en un área rural. Se sabe que la
probabilidad de que una persona en el área rural esté indocumentada es de 0,10; calcule la
probabilidad de que se entreviste al menos a cinco personas indocumentadas.
104. Una aerolínea tiene la política de vender hasta 22 boletos para viajar en un avión que cuenta con
20 asientos para pasajeros. Estudios anteriores revelaron que solo el 90% de los pasajeros que se
registran en un determinado vuelo, se presentan al aeropuerto para viajar en ese vuelo. Calcular
la probabilidad de que no haya suficientes asientos disponibles para los pasajeros, en un vuelo en
el que se vendieron 22 boletos.
P(X=1)=
En Excel: =DIST.BINOM.N(1;16;0,99;0)
105. El ingeniero de control de calidad de la fábrica de láminas de aluminio G&E afirma que, conforme
a los registros históricos, de cada 10 láminas que se inspecciona, en promedio 1,2 láminas
presentan fallas de longitud y de arqueo. Considere que las fallas se presentan de forma
independiente.
a. Justifique qué distribución tiene la variable <cantidad de láminas de aluminio que presentan
fallas de longitud y de arqueo en un total de 10 láminas inspeccionadas>. Indique en forma
explícita el valor de los parámetros de la distribución identificada. Rpta.
B(10;0,12)
Estadística Aplicada I – verano 2023 165
106. Una empresa fabrica diariamente una cantidad invariable de productos. La probabilidad de que
un producto resulte defectuoso es constante de tal manera que la cantidad de productos
defectuosos fabricados diariamente tiene un promedio de 3 y una varianza de 2,4. Si los
productos se fabrican independientemente uno de otro, calcule la probabilidad de que en un día
en particular se fabrique más de tres productos defectuosos. Rpta. 0,3518
107. El ingeniero internista de Transmin sabe que del total de operarios que ingresan a las galerías
mineras el 20% de estos presentan problemas de adaptación. Para rediseñar la selección de los
operarios desea obtener algunas probabilidades:
Variable X: Cantidad/Número de operarios que ingresan a las galerías mineras que presentan
problemas de adaptación
p = 0,20 presentan problemas de adaptación
a. Calcule la probabilidad de que al seleccionar 15 operarios a lo más dos operarios presentan
problemas de adaptabilidad. Rpta. 0,3980
n = 15
Distribución a usar: Binomial X B (n = 15 ; p = 0,20)
P(X≤2)=P(X=0)+P(X=1)+P(X=2)
En Excel: =DISTR.BINOM.N(2;15;0,20;1) = 0,3980
b. Si se seleccionan a 25 operarios ¿cuántos operarios con problemas de adaptabilidad
esperaríamos encontrar? Rpta. 5
n = 25 , p = 0,20
Valor esperado = Promedio = Esperanza = Media: 𝜇𝑋 = 𝐸(𝑋) = 𝑛 ∗ 𝑝
𝐸(𝑋) = 𝑛 ∗ 𝑝 = 25 ∗ 0,20 = 5
c. El ingeniero decidirá modificar el diseño de selección, si al seleccionar a 15 operarios la
probabilidad de que al menos tres de ellos presentan problemas de adaptabilidad supere a
0,50. ¿Cuál será la decisión del ingeniero? Rpta. 0,602, modificará
n = 15
Distribución a usar: Binomial X B (n = 15 ; p = 0,20)
P ( X ≥ 3 ) = 1 – P ( X ≤ 2) = 1 – ( P ( X = 0 ) + P ( X = 1 ) + P ( X = 2 ) ) = 0,6020
En Excel: =1 - DISTR.BINOM.N(2;15;0,20;1) = 0,6020
Estadística Aplicada I – verano 2023 166
Distribución Poisson
Se usa en situaciones en los que el experimento da lugar a valores numéricos discretos de una variable
aleatoria que ocurren durante un intervalo dado o una región específica.
El intervalo puede ser cualquier lapso como minutos, días, semanas, etc. y la región específica puede
ser una línea, un área o quizá una pieza de material, una carretera, etc.
El experimento que origina una variable aleatoria que sigue una distribución de Poisson se denomina
proceso de Poisson y posee las siguientes propiedades:
El número de resultados que ocurren en un intervalo o región de espacio cualquiera es
independiente del número que ocurre en cualquier otro intervalo o región del espacio disjunto.
La probabilidad de que ocurra un solo resultado durante el intervalo muy corto o región muy
pequeña es proporcional a la longitud del intervalo o al tamaño de la región y no depende del
número de resultados que ocurren fuera del intervalo o región.
La probabilidad de que ocurra más de un resultado en tal intervalo corto o caiga en tal región
pequeña es insignificante.
Se dice que la variable aleatoria 𝑋 sigue una distribución de Poisson con parámetro y se denota:
𝑋~𝑃()
El rango de la variable 𝑋 es 𝑅𝑋 = 0, 1, 2, ⋯
La probabilidad de tener 𝑥 resultados en un intervalo dado o en una región específica es:
𝑒 −𝜆 𝜆𝑥
𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝑥 = 0, 1, 2, …
𝑥!
donde:
𝑥 = número de éxitos por unidad
= número esperado de éxitos por unidad de tiempo o región
𝑒 = 2,71828…
Características
Siempre es una distribución sesgada a la derecha. A medida que aumenta y se toma en cuenta solo
los valores relevantes de probabilidad, la distribución tiende a hacerse simétrica.
Media
𝑋 = 𝐸(𝑋) =
Estadística Aplicada I – verano 2023 167
Varianza
𝜎𝑋2 = 𝜆
Ejemplo 82
El ingeniero encargado del área de producción de Desternit, se sabe que por cada cinco horas de
trabajo continuo se obtiene en promedio 1,5 láminas con defectos de arqueo.
a. Calcule la probabilidad que en una jornada de CINCO horas de trabajo se hayan producido dos
láminas con defectos de arqueo.
𝑒 −𝜆 𝜆𝑥 𝑒 −1,5 ∗1,52
P(X=2)= = = 0,2510
𝑥! 2!
En Excel: =POISSON.DIST(2;1,5;0) = 0,2510
b. Calcule la probabilidad que en una jornada de DIEZ horas de trabajo se hayan producido dos
láminas con defectos de arqueo.
𝑒 −𝜆 𝜆𝑥 𝑒 −3 ∗32
P(X=2)= = = 0,2240
𝑥! 2!
En Excel: =POISSON.DIST(2;3;0) = 0,2240
𝑒 −𝜆 𝜆𝑥 𝑒 −1,5 ∗1,52
P(X=2)= = = 0,2510
𝑥! 2!
En Excel: =POISSON.DIST(2;1,5;0) = 0,2510
Solución
𝑋: = número de láminas con defectos de arqueo por cada 5 horas de trabajo
𝑋 ~ 𝑃(𝜆 = 1,5)
Rango: 𝑅𝑋 = 0, 1, 2, 3, …
𝑒 −1,5 × 1,52
𝑃(𝑋 = 2) = = 0,2510
2!
c. Calcule la probabilidad de que en una jornada de ocho horas de trabajo se hayan producido más
de una lámina con defectos de arqueo.
Solución
Por cada cinco horas de trabajo continuo λ = 1,5, aplicando regla de tres simple, diremos que
por cada ocho horas de trabajo continuo.
1,5 × 8
𝜆= = 2,4
5
La probabilidad pedida es:
Estadística Aplicada I – verano 2023 168
110. La única cajera de una agencia bancaria sabe por experiencia que entre las cinco y las seis de la
tarde (hora en que cierra el banco) llegan a su agencia en forma aleatoria un promedio dos
personas por minuto. La cajera está obligada a atender a todas las personas que llegan hasta las
seis de la tarde. Tres minutos antes de las seis de la tarde no hay nadie en la cola y en ese
momento ella recibe una llamada telefónica que la obliga a ausentarse de su puesto durante cinco
minutos. Calcule la probabilidad de que al volver a su puesto hayan más de tres personas en la
cola. Rpta. 0,8488
111. El departamento de congestión y tránsito vehicular de la Municipalidad de Lima maneja
información que en la intersección de las avenidas Primavera y Miro Quesada, ocurren en
promedio 0,8 accidentes de tránsito por día (24 horas). El jefe a cargo del departamento desea
implementar algunos cambios en la señalización y para esto requiere de algunas probabilidades.
𝑒 −𝜆 𝜆𝑥 𝑒 −0,6 ∗0,62
P(X=2)= = = 0,0988
𝑥! 2!
En Excel: =POISSON.DIST(2;0,6;0) = 0,0988
De acuerdo a los resultados obtenidos la Municipalidad de Lima asignará un policía de tránsito
en horas punta, porque la probabilidad hallada supera el 8%.
112. El número de torres de alta tensión que se caen por año en una ciudad puede modelarse por una
variable aleatoria de Poisson, con una desviación estándar de 1,5 torres por año. El costo de
reparar una torre caída es 200 000 dólares y la compañía destina como máximo 600 000 dólares
anuales para reparar torres. Calcule el gasto anual esperado en la reparación de torres.
∫ 𝑓(𝑥)𝑑𝑥 = 1
−∞
Se cumple que:
𝑏
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥
𝑎
𝐸(𝑎𝑋 + 𝑏) = 𝑎𝐸(𝑋) + 𝑏 = 𝑎 𝜇𝑋 + 𝑏
• Como casos particulares se tiene:
𝐸(𝑏) = 𝑏
𝐸(𝑋 + 𝑏) = 𝐸(𝑋) + 𝑏 = 𝜇𝑋 + 𝑏
𝐸(𝑎𝑋) = 𝑎 𝐸(𝑋) = 𝑎 𝜇𝑋
• Si 𝑋 e 𝑌 son variables aleatorias, 𝑎 y 𝑏 son constantes, entonces:
𝑛 𝑛
𝐸 (∑ 𝑎𝑖 𝑋𝑖 ) = ∑ 𝑎𝑖 𝐸(𝑋𝑖 )
𝑖=1 𝑖=1
Propiedades de la varianza
Si 𝑎 y 𝑏 son constantes, entonces:
𝑉(𝑏) = 0
𝑉(𝑎𝑋) = 𝑎2 𝑉(𝑋)
𝑉(𝑋 + 𝑏) = 𝑉(𝑋)
Si 𝑋 e 𝑌 son dos variables aleatorias independientes, 𝑎 y 𝑏 son dos constantes, entonces:
𝑉(𝑎𝑋 + 𝑏𝑌) = 𝑎2 𝑉(𝑋) + 𝑏 2 𝑉(𝑌)
Si 𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑛 son 𝑛 variables aleatorias independientes, y 𝑎1 , 𝑎2 , 𝑎3 , … , 𝑎𝑛 son 𝑛 constantes,
entonces:
𝑛 𝑛
𝑉 (∑ 𝑎𝑖 𝑋𝑖 ) = ∑ 𝑎𝑖2 𝑉(𝑋𝑖 )
𝑖=1 𝑖=1
𝑓(𝑥)
P( x x0 ) 1 e x0 /
X
X0
Características
La variable puede tomar valores de 0 a +, no toma valores negativos.
La gráfica es descendente con sesgo a la derecha.
Existe una curva para cada valor de 𝛽.
Media
𝜇𝑥 = 𝐸(𝑋) = 𝛽
Varianza
𝜎𝑋2 = 𝛽 2
Estadística Aplicada I – verano 2023 173
𝑎+𝑏 𝑎
− +
=𝑒 𝛽 𝛽
𝑏
−
=𝑒 𝛽 = 𝑃(𝑋 > 𝑏)
Es decir que:
𝑃(𝑋 > 𝑎 + 𝑏 ⁄𝑋 > 𝑎) = 𝑃(𝑋 > 𝑏)
Ejemplo 83
El ingeniero de planta de una línea aérea sabe que la duración promedio de los neumáticos de las
avionetas es de 1,5 años. Si la duración de los neumáticos tiene una distribución exponencial.
a. ¿Cuál es la probabilidad de que los neumáticos duren a lo más 1,6 años?
Solución
Definamos la variable aleatoria 𝑋: duración de neumáticos de las avionetas.
𝑋~𝐸𝑥𝑝(𝛽 = 1,5)
La probabilidad pedida es:
1,6
−
𝑃(𝑋 ≤ 1,6) = 𝐹(1,6) = 1 − 𝑒 1,5 = 0,6558
b. ¿Cuál es la probabilidad de que los neumáticos duren más de 2 años?
Solución
La probabilidad pedida es:
𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2)
2
−1,5
= 1 − 𝐹(2) = 1 − (1 − 𝑒 ) = 0,2636
Solución
Interpretación
Determinar si se va a cambiar de proveedor.
Representación
Se debe calcular el percentil 75 de la variable <duración de neumáticos de las avionetas>.
Cálculo
El tiempo mínimo del 25% de los neumáticos que tienen una mayor duración lo representamos
por 𝑡𝑚𝑖𝑛 .
𝑃(𝑋 ≥ 𝑡𝑚𝑖𝑛 ) = 0,25
𝑃(𝑋 ≥ 𝑡𝑚𝑖𝑛 ) = 1 − 𝑃(𝑋 < 𝑡𝑚𝑖𝑛 )
𝑡𝑚𝑖𝑛
− 1,5
= 1 − 𝐹(𝑡𝑚𝑖𝑛 ) = 1 − (1 − 𝑒 )
𝑡𝑚𝑖𝑛
− 1,5
=𝑒 = 0,25
𝑡
− 𝑚𝑖𝑛
Tomamos logaritmo neperiano a ambos lados de la ecuación 𝑒 1,5 = 0,25
𝑡
− 𝑚𝑖𝑛
𝑙𝑛 (𝑒 1,5 ) = 𝑙𝑛(0,25)
𝑡𝑚𝑖𝑛
= −1,3863
1,5
Ejercicios
113. El tiempo, en minutos, que demora una llamada telefónica se modela con una variable
exponencial con una media de 5 minutos. Calcular la probabilidad de que la duración de una
llamada sea mayor a seis minutos.
114. El tiempo que toma ajustar las máquinas que están produciendo láminas de aluminio con
defectos de arqueo, tiene una distribución exponencial con media de dos horas.
a. Calcule la probabilidad de que el tiempo de ajuste de una máquina que produce láminas de
aluminio con fallas de arqueo supere las 2,5 horas. Rpta. 0,28650
b. Determine el máximo tiempo de ajuste de una máquina que produce láminas de aluminio con
fallas de arqueo para que esté considerado dentro del 20% de los ajustes más rápidos.
Rpta. 0,4463
115. El tiempo de vida de un tipo de marcapasos puede modelarse por una variable con distribución
exponencial con media de 12 años.
a. Calcule la probabilidad de que un marcapasos de este tipo se malogre antes de los 15 años de
funcionamiento.
b. Si el marcapasos lleva funcionando correctamente cinco años en un paciente, ¿cuál es la
probabilidad de que se malogre antes de 15 años?
116. El tiempo de duración, en meses, de un tipo de resistencia eléctrica del modelo XFF se modela
con una variable aleatoria continua con la siguiente función de densidad de probabilidad:
−0,5𝑥
𝑓(𝑥) = {0,5𝑒 𝑥≥0
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a. Calcule la probabilidad de que una resistencia dure más de cuatro meses. Rpta. 0,13534
b. Si una resistencia eléctrica ya duró cuatro meses, calcule la probabilidad que dure como
máximo un mes más. Rpta. 0,39347
c. Las normas técnicas indican que el percentil 75 del tiempo de duración de la resistencia debe
ser mayor a los tres meses, ¿la resistencia eléctrica del modelo XFF cumple con las normas
técnicas? Rpta. No; 2,77
d. Si se prueban diez resistencias eléctricas, ¿cuál es la probabilidad de que ninguna dure más de
cuatro meses. Rpta. 0,23359
117. La empresa Sysmat ofrece equipos de aire acondicionado para galerías mineras al jefe de área de
logística de Trasmin. El representante de ventas de Sysmat indica que el tiempo de vida de los
equipos de aire acondicionado sigue una distribución exponencial con tiempo promedio de dos
años.
a. Sysmat indica que si un equipo se malogra antes de 1,8 años será repuesto por uno nuevo. Si
la probabilidad de que no se llegue a usar la garantía ofrecida por Sysmat es mayor al 50%;
Trasmin evaluará comprar los equipos de Sysmat. Rpta. No; 0,41
b. Con el fin de comprar definitivamente los equipos de Sysmat. El jefe de logística plantea la
siguiente situación: Si selecciona al azar un equipo de aire acondicionado que ya duró 2 años,
la probabilidad que dure como máximo medio año más es mayor a 0,2; se compran los equipos
a Sysmat. ¿Cuál será la decisión de Trasmin? Rpta. 0,22120
c. ¿Cuál sería el tiempo de vida máximo que tendría el 50% de los equipos de aire acondicionado
que compraría Trasmin? Rpta. 1,386
Estadística Aplicada I – verano 2023 176
En Excel: =DISTR.NORM.N(x;media;desv_estándar;acumulado)
En Excel: =DISTR.NORM.N(2,3;3,5;1,43;1) 0,20069
Distribución NORMAL
Función de densidad
1 1 𝑥−𝜇 2
−2∗( 𝜎 )
𝑓(𝑥) = ∗𝑒 𝑥∈ℝ
𝜎√2𝜋
Se dice que la variable aleatoria 𝑋 sigue una distribución normal con parámetros “” y “2“ y se
denota:
Estadística Aplicada I – verano 2023 177
𝑋 ~ 𝑁( , 2 )
Características
La función de densidad es simétrica y tiene forma de campana Gauss.
Las medidas de tendencia central coinciden, es decir, Media = Mediana = Moda
Su rango es - a +.
El eje 𝑋 representa una asíntota de la grafica (la campana de Gauss)
Estandarización
Se toma como referencia una distribución normal estándar ( = 0 y = 1).
Se trabaja 𝑍 que es el número de desviaciones estándar que un dato X se aleja de la media .
𝑋−𝜇
𝑍=
𝜎
En la primera columna de este valor buscamos el valor de las unidades y las décimas.
En la fila correspondiente al valor de la columna buscamos el valor de las centésimas.
Su intersección nos dará la probabilidad.
La tabla normal estándar siempre nos dará el valor del área hacia la izquierda de Z.
𝑎−𝜇
𝑃 𝑍≤
𝜎
𝑎−𝜇
-4 -3 -2 -1 00 1 2 3 4
𝜎
Cálculo de una probabilidad de una variable normal usando Excel
Con Excel, se usa la función =DISTR.NORM.N(x;media;desv_estándar;acumulado)
x: es el valor para el que desea la distribución.
media: es la media aritmética de la distribución.
desv_estándar: es la desviación estándar de la distribución, un número positivo.
acumulado: Use acumulado = 1 para calcular la probabilidad.
Ejemplo 84
Solución
Primera forma: Usando la tabla de la normal estándar
Estandarizando la variable para usar la tabla de la normal estándar.
𝑃(𝑋 ≤ 37,8)
𝑋 − 𝜇 37,8 − 𝜇
= 𝑃( ≤ )
𝜎 𝜎
37,8 − 30
= 𝑃 (𝑍 ≤ )
5
= 𝑃(𝑍 ≤ 1,56)
Usando la tabla de la distribución normal estándar.
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
Tenemos que:
𝑃(𝑍 ≤ 1,56) = 0,94062
0,94062
-4 -3 -2 -1 0 11,562 3 4
0, 𝑘
𝑃𝑘 − 𝜇
-4 -3 -2 -1 00 1 2 = 𝑐3 4
𝜎
El valor del percentil se obtiene de la ecuación:
𝑃𝑘 = 𝜇 + 𝑐 𝜎
Cálculo de un percentil de una variable normal usando Excel
Con Excel, se usa la función =INV.NORM(probabilidad;media;desv_estándar)
probabilidad: es un número entre 0 y 1. Por ejemplo, para calcular el percentil 70; use 0,7.
media: es la media aritmética de la distribución.
desv_estándar: es la desviación estándar de la distribución, un número positivo.
Estadística Aplicada I – verano 2023 181
Ejemplo 85
0,94950
-4 -3 -2 -1 0 1 𝑃𝑘 2 3 4
Solución
Primera forma: Estandarizando la variable X para usar la tabla de la normal estándar.
𝑃(𝑋 ≤ 𝑃𝑘 ) = 0,94950
𝑋 − 𝜇 𝑃𝑘 − 𝜇
𝑃( ≤ ) = 0,94950
𝜎 𝜎
𝑃𝑘 − 30
𝑃 (𝑍 ≤ ) = 0,94950
5
Usando la tabla de la distribución normal estándar.
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
Ejemplo 86
El ingeniero de operaciones de una aerolínea es el encargado de monitorear el tiempo de vuelo de los
aviones destinados a Sudamérica. Una de las rutas que generalmente presenta problemas es al
aeropuerto de Río de Janeiro. Sabe que el tiempo de vuelo tienen una distribución normal con una
media de 4 horas y desviación estándar de 0,25 horas. Dicho ingeniero desea calcular algunas
probabilidades para presentar el informe anual.
Estadística Aplicada I – verano 2023 182
Solución
La variable 𝑋 ∶= tiempo de vuelo de un avión destinado a Río de Janeiro, en minutos
𝑋~𝑁(𝜇 = 240; 𝜎 2 = 152 )
La probabilidad pedida es:
𝑃(𝑋 < 230)
Estandarizando que consiste en restar la media y dividir entre la desviación estándar:
𝑋 − 𝜇 230 − 240
= 𝑃( < )
𝜎 15
= 𝑃(𝑍 < −0,66667)
Si vamos a usar la tabla de distribución normal estándar, siempre se redondea −0,66667 a dos
decimales, por redondeo simple, es decir:
= 𝑃(𝑍 < −0,67) = 0,25143
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
Observe que la respuesta es ligeramente diferente, debido al redondeo a dos decimales al usar
la tabla normal estándar.
b. Calcule la probabilidad de que el vuelo supere los 286 minutos.
Solución
La probabilidad pedida es:
𝑃(𝑋 > 286)
Como la tabla normal siempre nos da el área hacia la izquierda, usaremos el complemento.
𝑃(𝑋 > 286) = 1 − 𝑃(𝑋 ≤ 286)
Estandarizando.
𝑋 − 𝜇 286 − 240
= 1−𝑃( ≤ )
𝜎 15
Estadística Aplicada I – verano 2023 183
= 1 − 𝑃(Z ≤ 3,06667)
Si vamos a usar la tabla de distribución normal estándar, siempre se redondea −3,06667 a dos
decimales, por redondeo simple, es decir:
= 1 − 𝑃(𝑍 ≤ 3,07)
= 1 − 0,99893 = 0,00107
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,998650 0,998694 0,998736 0,998777 0,998817 0,998856 0,998893 0,998930 0,998965 0,998999
3,1 0,999032 0,999065 0,999096 0,999126 0,999155 0,999184 0,999211 0,999238 0,999264 0,999289
Solución
La probabilidad pedida es:
𝑃(230 ≤ 𝑋 ≤ 270)
Estandarizando en ambos extremos de la expresión, se tiene:
230 − 240 𝑋 − 𝜇 270 − 240
= 𝑃( ≤ ≤ )
15 𝜎 15
= 𝑃(−0,67 ≤ 𝑍 ≤ 2,00)
= 𝑃(𝑍 ≤ 2,00) − 𝑃(𝑍 < −0,67)
Buscando en la tabla normal estándar o en un programa informático.
= 0,97725 − 0,25143 = 0,72582
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
d. Se sabe que el 10% de los vuelos que tardan más recibirán asistencia técnica ni bien lleguen al
aeropuerto, cuál será el tiempo mínimo de vuelo para que dicho avión reciba asistencia técnica.
Solución
Denominemos 𝑡𝑚𝑖𝑛 al tiempo mínimo de vuelo para que dicho avión reciba asistencia técnica.
La condición para que reciba asistencia técnica es:
𝑃(𝑋 ≥ 𝑡𝑚𝑖𝑛 ) = 0,10
𝑃(𝑋 ≥ 𝑡𝑚𝑖𝑛 ) = 1 − 𝑃(𝑋 < 𝑡𝑚𝑖𝑛 ) = 0,10
Estadística Aplicada I – verano 2023 184
𝑡𝑚𝑖𝑛 − 240
= 1,28
15
𝑡𝑚𝑖𝑛 = 259,2
El tiempo mínimo de vuelo para que dicho avión reciba asistencia técnica es 259,2 minutos.
En Excel, se usa la función =INV.NORM(0.9;240;15).
e. Si se seleccionan ocho vuelos que van a Rio de Janeiro, ¿cuál es la probabilidad de que a lo más
uno supera los 286 minutos de tiempo de vuelo.
Solución
Definimos la variable:
𝑌 =: número de vuelos que superan los 286 minutos de tiempo de vuelo de una muestra de ocho
vuelos.
𝑌~𝐵(𝑛; 𝑝)
Debemos determinar los parámetros de la distribución binomial.
𝑛 ∶= número de repeticiones, es decir, 𝑛 = 8
𝑝 = 𝑃(é𝑥𝑖𝑡𝑜) = 𝑃(𝑋 > 286)
De la parte b, se sabe que la probabilidad de que el vuelo supere los 286 minutos es 0,00107.
Por lo tanto:
𝑌~𝐵(𝑛 = 8; 𝑝 = 0,00107)
La probabilidad pedida es:
𝑃(𝑌 ≤ 1) = 𝑃(𝑌 = 0) + 𝑃(𝑌 = 1) = 𝑓(0) + 𝑓(1)
𝑃(𝑌 ≤ 1) = 𝐶08 × 0,001070 × (1 − 0,00107)8 +𝐶18 × 0,001071 × (1 − 0,00107)7
𝑃(𝑌 ≤ 1) = 0,99997
Usando Excel
En Excel, se usa la función 𝑃(𝑌 ≤ 1) =DISTR.BINOM.N(1;8;0.00107;1) = 0,99997.
Ejemplo 87
Una compañía telefónica ha determinado que el tiempo total de duración de las llamadas realizadas
mensualmente por sus clientes, medido en minutos, sigue una distribución normal de media 100 y
desviación estándar 25.
Solución
Estadística Aplicada I – verano 2023 185
Definamos la variable:
𝑋 ≔ tiempo total de duración de las llamadas realizadas mensualmente por un cliente, en minutos
𝑋~𝑁(𝜇 = 100; 𝜎 2 = 252 )
a. Calcular la probabilidad de que un cliente facture menos de dos horas en
llamadas.
Usando Excel
La probabilidad pedida es:
𝑃(𝑋 < 120) = 0,78814
Se usa la función =DISTR.NORM.N(120;100;25;1)
b. ¿Cuál es la probabilidad de que un cliente facture entre 80 y 110 minutos?
Usando Excel
La probabilidad pedida es:
Estadística Aplicada I – verano 2023 186
Solución
Interpretación
Determinar si se va a incentivar a los clientes que facturan poco con un sistema de retribuciones.
Representación
Vamos a usar la distribución normal y calcularemos la duración total en minutos que debe
acumular como máximo un cliente para ser incluido en la promoción.
Cálculo
Para calcular la duración total en minutos que debe acumular como máximo un cliente para ser
incluido en la promoción debemos calcular el percentil 4.
Usando tabla de distribución normal estándar
Nos piden calcular el percentil 4.
𝑃(𝑋 ≤ 𝑃4 ) = 0,04
Estandarizando, se tiene que:
𝑃4 − 100
𝑃 (𝑍 ≤ ) = 0,04
25
Buscamos dentro de la tabla el valor más cercano a 0,04; en este caso, es 0,04006. Luego,
salimos a los bordes de la tabla, obteniendo el valor -1,75.
Z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370
𝑃4 = 56,25 minutos
Usando Excel
En Excel, se usa la función 𝑃4 =INV.NORM(0.04;100;25) = 56,23
Análisis
La duración total en minutos que debe acumular como máximo un cliente para ser incluido en
la promoción es 56,23 minutos que es menor a 60 minutos.
Argumentación
Por tanto, sí se va a incentivar a los clientes que facturan poco con un sistema de retribuciones,
pues 56,25 minutos es menor a 60 minutos.
Ejemplo 88
La corporación Metálica S.A. fabrica barras de construcción de acero. Se sabe que los pesos de las
barras de construcción de 5/8” de diámetro tienen distribución normal con media de 4,5 kg y varianza
de 0,64 kg2. Según disposición de la norma técnica si el peso de una barra de construcción se encuentra
entre 4,46 y 4,66 kilogramos se considera dentro de la especificación técnica.
¿Cuál es la probabilidad de que el peso de una barra seleccionada aleatoriamente se encuentre fuera
de la especificación técnica?
Solución
Definamos la variable:
𝑋 ≔ pesos de una barra de construcción de 5/8” de diámetro, en kilogramos
𝑋~𝑁(𝜇 = 4,5; 𝜎 2 = 0,64)
La probabilidad pedida es:
𝑃(𝑋 < 4,46) + 𝑃(𝑋 > 4,66) = 1 − 𝑃(4,46 < 𝑋 < 4,66)
= 1 − 0,09920 = 0,9008
En Excel, se usa la función =1-(DISTR.NORM.N(4.66;4.5;0.8;1)-DISTR.NORM.N(4.46;4.5;0.8;1))
Estadística Aplicada I – verano 2023 188
Ejemplo 89
La empresa de bebidas gasificadas Coke’s tiene por política hacer un informe técnico del sistema de
embotellado de sus productos. Las normas indican que una máquina embotelladora está ajustada para
servir en promedio de 500 mililitros por botella. Si la cantidad de refresco se distribuye normalmente
con una desviación estándar de nueve mililitros.
a. ¿Cuál es la probabilidad que una botella contenga menos de 505 mililitros?
Solución
Definamos la variable:
𝑋 ≔ contenido de una botella en mililitros
𝑋~𝑁(𝜇 = 500; 𝜎 2 = 92 )
La probabilidad pedida es:
𝑃(𝑋 < 505) = 0,71074
En Excel, se usa la función =DISTR.NORM.N(505;500;9;1)
b. Las normas técnicas de llenado establecen que el contenido del líquido debe estar en el rango de
[490 – 510] mililitros. Si en la producción de un día, más del 25% de las botellas no cumplen las
normas técnicas se tendrá que parar la producción. ¿Cuál será la decisión?
Interpretación
Determinar si se tendrá que parar la producción.
Representación
Vamos a usar la distribución normal y calcularemos una probabilidad.
Cálculo
La probabilidad pedida es:
𝑃(490 ≤ 𝑋 ≤ 510) = 0,73348
En Excel, se usa la función =DISTR.NORM.N(510;500;9;1)-DISTR.NORM.N(490;500;9;1)
Análisis
El porcentaje de botellas que no cumplen las normas técnicas es de 26,652% que es mayor al
25%.
Argumentación
Por tanto, sí se tendrá que parar la producción, pues 26,652% > 25%.
c. Si el llenado de botellas admite como máximo 520 mililitros ¿Cuántas botellas aproximadamente se
derramarán en las siguientes 1000 botellas?
Solución
La probabilidad de que derrame una botella es:
𝑃(𝑋 > 520) = 0,013134
La cantidad de botellas que se derramarán aproximadamente es 1000 x 0,013134 = 13,1 botellas
Solución
Calcularemos el percentil 27.
𝑃(𝑋 ≤ 𝑃27 ) = 0,27
En Excel, se usa la función =INV.NORM(0.27;500;9)
𝑃27 = 494,4847
Estadística Aplicada I – verano 2023 189
e. Si se selecciona una muestra de seis botellas, ¿cuál es la probabilidad que ninguna de estas botellas
contenga más de 505 mililitros?
Solución
Definamos una nueva variable.
𝑌 ≔ número de botellas que contengan más de 505 mililitros
𝑌~𝐵(𝑛 = 6; 𝑝 = 0,289257)
Calculemos la probabilidad de éxito.
𝑝 = 𝑃(é𝑥𝑖𝑡𝑜) = 𝑃(𝑋 > 505) = 0,289257
La probabilidad pedida es:
𝑃(𝑌 = 0) = 0,128906
En Excel, se usa la función =DISTR.BINOM.N(0;6;0.289257;0)
f. Calcule el contenido mínimo para estar en el 10% de las botellas con mayor contenido.
Solución
Calcularemos el percentil 90.
𝑃(𝑋 ≤ 𝑃90 ) = 0,9
En Excel, se usa la función =INV.NORM(0.9;500;9)
𝑃90 = 511,534
El contenido mínimo para estar en el 10% de las botellas con mayor contenido es 511,534
mililitros.
Estadística Aplicada I – verano 2023 190
Ejercicios
118. La vida útil de una lavadora automática se modela con una variable normal con una media de 3,1
años y una desviación estándar de 1,2 años. La lavadora tiene garantía de un año y, por tanto,
será reemplazada por una nueva si se malogra antes de un año. Calcule la probabilidad de que
una lavadora sea reemplazada por una nueva. Rpta. 0,0401
119. La corporación Metálica fabrica barras de construcción de acero. Se sabe que los pesos de las
barras de construcción de 5/8” de diámetro tienen distribución normal con media de 1,552 kg y
varianza de 0,16 kg2 por cada metro. Según disposición de la norma técnica si el peso de una barra
de construcción se encuentra entre 1,512 kg y 1,598 kg se considera dentro de la especificación
técnica.
a. Calcule la probabilidad de que el peso de una barra seleccionada aleatoriamente se encuentre fuera de
la especificación técnica. Rpta. 0,91439
X:
µ = 1,552
2 = 0,16 kg2 = 0,4 kg
P ( 1,512 < X < 1,598 ) está dentro de la especificación técnica
A B
Si P ( A ≤ X ≤ B) = P ( X ≤ B ) - P ( X ≤ A-1 )
3 4 5 …. 11 12 13 14
Si P ( 4 ≤ X ≤ 12) = P ( X ≤ 12 ) - P ( X ≤ 3 )
b. Si el jefe de producción, al ver que es muy probable que las barras no cumplan las especificaciones
técnicas, desea saber cuál es el peso máximo del 45% de las barras que presentan menos peso.
Rpta. 1,50
45%
?????
µ = 1,552
2 = 0,16 kg2 = 0,4 kg
120. Un blíster es un envase con una cavidad en forma de ampolla donde se aloja el producto, de tal
forma que permite presentarlo en el punto de venta y protegerlo de golpes. El proceso de colado
es la actividad final en la producción de las tabletas antes del blisteado. El tiempo de colado se
considera una variable aleatoria normalmente distribuida con media de 17 segundos y una
desviación estándar de 2,5 segundos. Según el departamento de producción el tiempo de colado
debe encontrarse entre 15 y 25 segundos.
121. Los bastidores que utilizan las máquinas torneadoras deben ser de muy buena calidad y acabado
para alargar el tiempo de vida útil de las máquinas. Según datos anteriores, el tiempo de vida útil
de una máquina torneadora tiene una distribución normal con media 600 días con una
variabilidad de 1089 días2. Si una máquina torneadora viene trabajando 570 días, calcule la
probabilidad de que su vida útil sea menor a 610 días. Rpta. 0,5345
122. El tiempo de incapacidad debido a un accidente laboral leve que tiene un trabajador de una
empresa durante un mes se modela con una variable normal con una media de 90 horas y una
desviación estándar de 18 horas. Si una persona ya tuvo 80 horas de incapacidad, calcule la
probabilidad de que tenga por lo menos 20 horas más. Rpta. 0,4071
123. Las notas finales del curso de Estadística Aplicada siguen aproximadamente una distribución
normal con una media de 12. Si el 95,44 % de los estudiantes que siguieron el curso obtuvieron
calificaciones entre 8 y 16.
Calcule la probabilidad que una botella contenga menos de 503 mililitros. Rpta. 0,7257
a. Las normas técnicas de llenado establecen que el contenido del líquido debe estar en el rango
de [495 – 505] mililitros. Si en la producción de un día, más del 25% de las botellas no cumplen
las normas técnicas se tendrá que parar la producción. Indique si se detendrá la producción.
Rpta. 0,68269; se detendrá
b. Si por error se toman botellas con capacidad de llenado máximo de 510 mililitros, ¿cuántas
botellas se espera que se derramen en las siguientes cien mil botellas? Rpta. 2275
¿Debajo de qué valor se obtiene el 25% de botellas con menor contenido? Rpta. 496,63
c. Si se selecciona una muestra de seis botellas, calcule la probabilidad de que ninguna de botella
contenga más de 505 mililitros. Rpta.
0,35467
𝑋−𝜇
𝑍=
𝜎
Propiedad reproductiva de la Distribución Normal
Igual que sucede con otras distribuciones, como la de Bernoulli, la Binomial o la de Poisson, la variable
aleatoria de la distribución normal es reproductiva; esto quiere decir que, si sumamos variables
aleatorias de distribución normal, la variable suma también es otra variable de distribución normal.
La reproductividad de la variable normal nos asegura que un histograma de estos valores tendrá el
aspecto de la curva de Gauss. La forma de saber los parámetros concretos (media y desviación
estándar) de la variable suma nos la da el siguiente resultado teórico.
𝑆 = 𝑐1 𝑋1 + 𝑐2 𝑋2 + ⋯ + 𝑐𝑛 𝑋𝑛 = ∑ 𝑐𝑖 𝑋𝑖 ~ 𝑁(𝜇𝑆 ; 𝜎𝑆2 )
𝑖=1
donde 𝑐1 , 𝑐2 , … , 𝑐𝑛 son constantes.
Media
𝑛
𝐸(𝑆) = 𝜇𝑆 = 𝑐1 𝜇1 + 𝑐2 𝜇2 + ⋯ + 𝑐𝑛 𝜇𝑛 = ∑ 𝑐𝑖 𝜇𝑖
𝑖=1
Varianza
𝑛
𝑉(𝑆) = 𝜎𝑆2 = 𝑐12 𝜎12 + 𝑐22 𝜎22 + ⋯ + 𝑐𝑛2 𝜎𝑛2 = ∑ 𝑐𝑖2 𝜎𝑖2
𝑖=1
Como caso particular, si tenemos que 𝑐𝑖 = 1.
𝑛 𝑛 𝑛
𝑆 = 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 = ∑ 𝑋𝑖 ~ 𝑁 (∑ 𝜇𝑖 ; ∑ 𝜎𝑖2 )
𝑖=1 𝑖=1 𝑖=1
Como casos particulares, si 𝑋1 y 𝑋2 tienen distribuciones normales 𝑋1 ~ 𝑁(𝜇1 ; 𝜎12 ) y 𝑋2 ~ 𝑁(𝜇2 ; 𝜎22 )
respectivamente, entonces:
𝑆 = 𝑋1 + 𝑋2 ~ 𝑁(𝜇1 + 𝜇2 ; 𝜎12 + 𝜎22 )
𝑆 = 𝑋1 − 𝑋2 ~ 𝑁(𝜇1 − 𝜇2 ; 𝜎12 + 𝜎22 )
Ejemplo 90
3 3 3
𝑆 = 𝑋1 + 𝑋2 + 𝑋3 = ∑ 𝑋𝑖 ~ 𝑁 (∑ 𝜇𝑖 ; ∑ 𝜎𝑖2 )
𝑖=1 𝑖=1 𝑖=1
3
𝑆 = 𝑋1 + 𝑋2 + 𝑋3 = ∑ 𝑋𝑖 ~ 𝑁(54; 0,09)
𝑖=1
Solución
Definamos la variable aleatoria:
𝑆 ∶= tiempo total de ensamblaje
𝑆 = 𝑋1 + 𝑋2 + 𝑋3
𝑆 = 𝑋1 + 𝑋2 + 𝑋3 ~𝑁(𝜇𝑌 = 𝜇1 + 𝜇2 + 𝜇3 ; 𝜎𝑌2 = 𝜎12 + 𝜎22 + 𝜎32 )
𝑆 = 𝑋1 + 𝑋2 + 𝑋3 ~𝑁(𝜇𝑌 = 12 + 24 + 18; 𝜎𝑌2 = 0,02 + 0,03 + 0,04)
𝑆~𝑁(𝜇𝑌 = 54; 𝜎𝑌2 = 0,09)
b. ¿Cuál es la probabilidad de que el tiempo total de ensamblaje supere los 55 minutos?
P ( X > 55 ) = 1 – P ( X < 55 )
3
∑ 𝑋𝑖 ~ 𝑁(54; 0,09)
𝑖=1
𝑋−𝜇 55 − 54
𝑍=
= = 3,3333 3,33
𝜎 𝑅𝐴𝐼𝑍(0,09)
= 1 – P ( Z < 3,33 ) = 1 – 0,99957 = 0,00043
En Excel: = 1 – DISTR.NORM.N(55;54;RAIZ(0,09);1) 0,00043
Solución
La probabilidad pedida es:
𝑃(𝑆 > 55) = 1 − 𝑃(𝑆 ≤ 55)
Estandarizando:
55 − 54
= 1 − 𝑃 (𝑍 ≤ )
0,3
= 1 − 𝑃(𝑍 ≤ 3,3333)
Se redondea a dos cifras en la parte decimal para buscar en la tabla normal estándar.
= 1 − 𝑃(𝑍 ≤ 3,33) = 1 − 0,9996 = 0,0004
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08
3,2 0,999313 0,999336 0,999359 0,999381 0,999402 0,999423 0,999443 0,999462 0,999481
3,3 0,999517 0,999534 0,999550 0,999566 0,999581 0,999596 0,999610 0,999624 0,999638
3,4 0,999663 0,999675 0,999687 0,999698 0,999709 0,999720 0,999730 0,999740 0,999749
P ( X ≤ 54,6) =
Estadística Aplicada I – verano 2023 195
∑ 𝑋𝑖 ~ 𝑁(54; 0,09)
𝑖=1
𝑋−𝜇 54,6 − 54
𝑍= = = 2,00
𝜎 𝑅𝐴𝐼𝑍(0,09)
= P ( Z ≤ 2,00) = 0,97725
En Excel: = DISTR.NORM.N(54,6;54;RAIZ(0,09);1) 0,97725
Solución
La probabilidad pedida es:
𝑃(𝑆 ≤ 54,6)
Estandarizando.
54,6 − 54
= 𝑃 (𝑍 ≤ )
0,3
= 𝑃(𝑍 ≤ 2) = 0,9772
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537
𝑆 = 𝑋1 + 𝑋2 + ⋯ + 𝑋100 = ∑ 𝑋𝑖 ~ 𝑁 (∑ 𝜇𝑖 ; ∑ 𝜎𝑖2 )
𝑖=1 𝑖=1 𝑖=1
100 100 100
∑ 𝑋𝑖 ~ 𝑁 (∑ 14 + 14 + 14 + ⋯ 14 ; ∑ 32 + 32 + 32 + ⋯ 32 )
𝑖=1 𝑖=1 𝑖=1
100
∑ 𝑋𝑖 ~ 𝑁(1400; 900)
𝑖=1
Solución
Estadística Aplicada I – verano 2023 196
= 1– 0,95254 = 0,04746
Cálculo usando Excel
En Excel, se usa la función
𝑃(𝑆 > 1450) =1-DISTR.NORM.N(1450;1400;30;1) = 0,04779
b. El jefe de logística establece la siguiente condición, si el valor de la probabilidad de que el costo de
transportar 100 productos supere los 1450 dólares es mayor al 10%, optará por subcontratar a una
empresa de transporte alternativa para abaratar sus costos; caso contrario, Urbaner se establecerá
como el único distribuidor de productos para el Cono Norte de Lima.
P ( X > 1450 ) =
= 1 – P ( Z < 1,67 ) = 1 – 0,95254 = 0,04746 4,746% < 10%
Argumentación: De acuerdo a los resultados obtenidos, el jefe de logística establecerá que
Urbaner sea el único distribuidor de productos para el Cono Norte de Lima.
Solución
La probabilidad pedida es:
𝑃(𝑆 > 1450) = 0,04746
Como la probabilidad es menor al 10% (4,746% < 10%), por lo tanto, Urbaner sería el único
distribuidor de productos para el Cono Norte de Lima.
variabilidad de:
4 gramos2 Varianza
Estadística Aplicada I – verano 2023 197
Ejemplo 92
La temperatura de un contenedor es muy importante para mantener la calidad y peso de un producto
hasta llegar a su destino final.
• Un producto es empacado con un peso promedio de 20 gramos y una variabilidad de 4 gramos 2,
cuyo peso se distribuye normalmente.
• Los registros de pérdida de peso por evaporación de dicho producto empacado muestran una
pérdida media de 6,45 gramos con una desviación estándar de 1,3 gramos, la pérdida de peso tiene
una distribución normal.
El ingeniero de producción desea determinar el peso restante del producto al llegar a su destino final.
a. ¿Cuál es la probabilidad de que el peso restante del producto al llegar a su destino sea
mayor a 15 gramos?
P ( X > 15 ) = 1 – P ( X < 15 )
𝑋1 ~ 𝑁(𝜇1 = 20 ; 𝜎12 = 4) Peso del producto empacado
𝑋2 ~ 𝑁(𝜇2 = 6,45; 𝜎22 = 1,32 ) Pérdida del peso por evaporación
S = Peso final del producto en el destino:
𝑆 = 𝑋1 − 𝑋2 ~ 𝑁(𝜇1 − 𝜇2 ; 𝜎12 + 𝜎22 )
𝑋1 − 𝑋2 ~ 𝑁(20 − 6,45; 4 + 1,32 )
𝑋1 − 𝑋2 ~ 𝑁(13,55; 5,69)
𝑋−𝜇 15 − 13,55
𝑍=
= = 0,60787 0,61
𝜎 𝑅𝐴𝐼𝑍(5,69)
= 1 – P ( Z < 0,61 ) = 1 – 0,72907 = 0,27093
En Excel: = 1 - DISTR.NORM.N(15;13,55;RAIZ(5,69);1) 0,27164
Solución
Sean las variables:
𝑋1 ∶= peso del producto al empacar
Como dice que la variabilidad es de 4 gramos2, se refiere a la varianza pues está en unidades al
cuadrado.
𝑋1 ~𝑁(𝜇1 = 20; 𝜎12 = 4)
𝑋2 ∶= pérdida de peso por evaporación
𝑋2 ~𝑁(𝜇2 = 6,45; 𝜎22 = 1,32 )
𝑆 ∶= peso final del producto
Por la propiedad reproductiva de la normal, la distribución de 𝑆 es:
𝑆 = 𝑋1 − 𝑋2 ~𝑁(𝜇1 − 𝜇2 ; 𝜎12 + 𝜎22 )
𝑆 = 𝑋1 − 𝑋2 ~𝑁(𝜇1 − 𝜇2 = 20 − 6,45; 𝜎12 + 𝜎22 = 4 + 1,32 )
𝑆~𝑁(13,55; 5,69)
La probabilidad pedida es:
Estadística Aplicada I – verano 2023 198
P ( X > 15 )
= 1 – P ( Z < 0,61 ) = 1 – 0,72907 = 0,27093 27,093% > 25%
Argumentación: De acuerdo a los resultados obtenidos, el ingeniero de producción sí optará
por transportar sus productos a su destino final usando contenedores aislantes para evitar la pérdida
de peso por evaporación.
Solución
Ya hemos calculado que:
𝑃(𝑆 > 15) = 0,2709
Como la probabilidad es mayor al 25% (27,09% > 25,00%), por lo tanto, el ingeniero de control
usará contenedores aislantes.
Estadística Aplicada I – verano 2023 199
Ejercicios
125. La empresa fabricante de detergentes Clean tiene asignada una máquina para el llenado y sellado
de las bolsas de detergente. El peso de detergente que la máquina deposita en las bolsas se
modela con una variable normal con media de 130 gramos y desviación estándar de 4 gramos y
que el peso de las bolsas vacías utilizadas en el embolsado del detergente se modela con una
variable normal con media 20 gramos y una desviación estándar de 1,2 gramos.
a. Se toma al azar una bolsa llena de detergente a la salida del proceso de embolsado. Calcule la
probabilidad de que tenga un peso mayor a 155 gramos. Rpta. 0,11560
b. Calcule el peso mínimo de una bolsa llena de detergente para estar considerada en el 14,46%
de las bolsas con mayores pesos. Rpta. 154,43
85,54% 14,46%
126. En la estación de servicio se vende gasolina de 90, 95 y 97 octanos, los precios por galón son 12,8;
15,6 y 16,2 soles respectivamente.
Sean 𝑋1 , 𝑋2 , 𝑋3 la cantidad de galones vendidos de cada tipo en un día en particular. Además, se
sabe que 𝑋1 , 𝑋2 , 𝑋3 son variables independientes y se distribuyen normalmente con medias 960,
1600 y 300 galones y desviaciones estándares de 90, 150 y 25 galones, respectivamente.
Determine la media y la desviación estándar del ingreso por la venta de gasolina en un día en
particular. Rpta. 42108; 2639,46
𝑉(𝑆) = 𝜎𝑆2 = 𝑐12 𝜎12 + 𝑐22 𝜎22 + ⋯ + 𝑐𝑛2 𝜎𝑛2 = ∑ 𝑐𝑖2 𝜎𝑖2
𝑖=1
𝜎 = 𝑅𝐴𝐼𝑍(6966729) = 2639,46
127. Dos baterías de las marcas A y B tienen una durabilidad que se modela con dos variables aleatorias
independientes normales con medias 4000 y 4200 horas y desviaciones estándares de 36 y 38
horas respectivamente. Calcule la variabilidad relativa de la diferencia de la durabilidad de las
baterías de la marca B y la marca A. Rpta. CV = 26,17%
128. El peso de un adulto peruano puede modelarse con una variable aleatoria normal. El peso medio
para los varones es de 72 kilos y de 64 kilos para las mujeres, mientras que sus desviaciones
estándar fueron de ocho kilos y cuatro kilos, respectivamente.
a. Si se elige, al azar, a un hombre y una mujer, calcular la probabilidad de que la mujer pese más
que el hombre.
b. Si se elige a dos hombres y a dos mujeres, calcular la probabilidad de que la suma total de
pesos supere los 260 kilos.
c. Si en un grupo de peruanos, el 60% de las personas son varones y se elige a una persona al
azar, calcule la probabilidad de que dicha persona pese entre 65 y 72 kilos.
Estadística Aplicada I – verano 2023 201
Unidad 3. Distribuciones
muestrales en muestreo
Logro
Al término de la unidad, el estudiante aplica los conceptos de distribuciones muestrales para la toma
de decisiones y estima un tamaño de muestra óptimo para dar respuesta a un problema en el ámbito
de su especialidad.
Temario
Distribución muestral de la media
Teorema central del límite
Introducción al muestreo
Tamaño de muestra
Distribución muestral
A partir de la población se puede tomar muestras del mismo tamaño (𝑛). Los estadísticos tomarán
diferentes valores de muestra en muestra. Una distribución muestral es la lista de posibles valores de
un estadístico y la probabilidad asociada a cada valor. Se puede construir varias distribuciones
muestrales a partir de una población y dependerá del tipo de estadístico que se tome como referencia.
Estadística Aplicada I – verano 2023 202
̅)
Distribución probabilística de la media muestral ( 𝑿
La distribución probabilística de la variable media muestral 𝑋̅ es la lista de todas las medias posibles
de tamaño 𝑛 tomadas de una población específica.
La media de la media muestral es:
𝜇𝑋̅ = 𝜇𝑋
La varianza de la media muestral es:
𝜎𝑋2
𝜎𝑋2̅ =
𝑛
𝑋 es una variable aleatoria 𝑋 es una variable aleatoria con 𝑋 es una variable aleatoria y 𝑛 ≥
distribución normal y 𝑛 ≥ 2 30
No conoces la distribución de los
Conoces que la distribución de los
No conoces la distribución de los datos
datos es Normal
datos
DICES:
APLICANDO EL TEOREMA DE
No PODEMOS RESOLVER LÍMITE CENTRAL
el tamaño de la población 𝑁 no se el tamaño de la población 𝑁 no se el tamaño de la población 𝑁 no se
conoce: conoce: conoce:
𝜎2 𝜎2 𝜎2
𝑋̅ ~ ? (𝜇; ) 𝑋̅ ~ 𝑁 (𝜇, ) 𝑋̅ ≈ 𝑁 (𝜇, )
𝑛 𝑛 𝑛
𝐸(𝑋̅) = 𝜇𝑋̅ = 𝜇𝑋
𝜎2
𝜎𝑋2̅ =
𝑛
𝜎2
𝑋̅ ~ ? (𝜇; )
𝑛
• Si el muestreo es sin reemplazo o si la población es finita, es decir, el tamaño de la población 𝑁 se
conoce, el esperado y la varianza para la variable aleatoria media muestral 𝑋̅ son:
𝐸(𝑋̅) = 𝜇𝑋̅ = 𝜇𝑋
Estadística Aplicada I – verano 2023 203
𝜎2 𝑁 − 𝑛
𝜎𝑋2̅ = ∗( )
𝑛 𝑁−1
𝜎2 𝑁 − 𝑛
𝑋̅ ~ ? (𝜇; ∗( ))
𝑛 𝑁−1
Entonces se cumple que, para 𝑛 ≥ 30, la media muestral 𝑋̅ se aproxima (tiende) a una distribución
normal, no se conoce el tamaño poblacional
𝜎2
𝑋̅ ≈ 𝑁 (𝜇, )
𝑛
Si, además, se conoce el tamaño poblacional, entonces la distribución de la media muestral es:
𝜎2 𝑁 − 𝑛
𝑋̅ ≈ 𝑁 (𝜇, ∗( ))
𝑛 𝑁−1
Ejemplo 93
La duración de una pila tiene distribución normal con media 100 horas y desviación estándar de 20
horas. Si se selecciona una muestra aleatoria de 16 pilas, calcule la probabilidad de que la media
muestral sea mayor a 105 horas.
𝜇 = 100
𝜎 = 20
n = 16
N = NO HAY
𝜎2
𝑋̅ ~ 𝑁 (𝜇, ) = 𝑁(𝜇 = 100, 𝜎𝑋2̅ = 25)
𝑛
𝑋̅ − 𝜇 105 − 100
𝑍= = = 1,00
𝜎𝑋̅ 𝑅𝐴𝐼𝑍(25)
Solución
Definamos las variables necesarias.
𝑋:= tiempo de duración de una pila, en horas
𝑋~𝑁(𝜇 = 100, 𝜎 2 = 202 )
𝑋̅:= media muestral del tiempo de duración de las 16 pilas, en horas
𝜎 2 202
𝑋̅~𝑁 (𝜇 = 100, = )
𝑛 16
𝑋̅~𝑁(100; 25)
𝑋̅~𝑁(100; 52 )
La probabilidad pedida es la probabilidad de que la media muestral sea mayor a 105 horas, es decir:
𝑃(𝑋̅ > 105)
Cálculo usando la estandarización de la variable
Estandarizando
𝑃(𝑋̅ > 105) = 1 − 𝑃(𝑋̅ ≤ 105)
105 − 100
= 1 − 𝑃 (𝑍 ≤ )
5
= 1 − 𝑃(𝑍 ≤ 1) = 1 − 𝐹(1)
De la tabla normal estándar.
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
= 1 − 0,8413 = 0,1587
La probabilidad de que la media muestral supere las 105 horas es 0,1587.
Ejemplo 94
La distribución del ingreso familiar en Lima Metropolitana es asimétrica, con sesgo hacia la derecha. El
último censo revela que el ingreso familiar medio es de 1667 soles con una desviación estándar de
200 soles. En una muestra aleatoria de 180 familias, calcule la probabilidad de que el ingreso familiar
medio de la muestra difiera (diferencia) del ingreso familiar medio de la población en menos de 35
soles.
Solución
𝜇 = 1667
𝜎 = 200
n = 180
N = NO HAY
Como n = 180 > 30, aplicando el Teorema de Límite Central (TLC), la distribución se aproxima a una
normal,
𝜎2 𝜎 2 2002
𝑋̅ ≈ 𝑁 (𝜇, 𝜎𝑋2̅ = ) = (𝜇 = 1667, 𝜎𝑋2̅ = = )
𝑛 𝑛 180
𝜎2
𝑋̅ ≈ 𝑁 (𝜇, ) = 𝑁(𝜇 = 1667, 𝜎𝑋2̅ = 222,2222)
𝑛
|𝑋̅ − 𝜇| < 35 Por propiedad de Valor absoluto: |𝑎| < 𝑏 -b < a < b
𝑋̅ − 𝜇 1702 − 1667
𝑍= = = 2,3479 2,35
𝜎𝑋̅ 𝑅𝐴𝐼𝑍(222,2222)
𝑋̅ − 𝜇 1632 − 1667
𝑍= = = −2,3479 − 2,35
𝜎𝑋̅ 𝑅𝐴𝐼𝑍(222,2222)
En Excel:
= DISTR.NORM.N(1702;1667;RAIZ(222,2222);1) - DISTR.NORM.N(1632;1667;RAIZ(222,2222);1)
0,98112
D = 18
J = 20
D difiere de J en 2 años
P = 22
R = 20
P difiere de R en 2 años
D = 18
X = 16
D difiere de X en 2 años
Estadística Aplicada I – verano 2023 206
−35 𝑋̅ − 𝜇 35
𝑃( 𝜎 < 𝜎 < 𝜎 )
√𝑛 √𝑛 √𝑛
Reemplazando los valores de la desviación estándar y del tamaño de muestra:
−35 35
𝑃( <𝑍< )
14,9071 14,9071
𝑃(−2,35 < 𝑍 < 2,35)
Usando la tabla normal estándar.
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390
Se pide la probabilidad de que esté fuera de los límites establecidos 1 - P ( 11,75 < 𝑋̅ < 12,25)
𝜎2 𝜎 2 0,0625
𝑋̅ ~ 𝑁 (𝜇, 𝜎𝑋2̅ = ) = (𝜇 = 12, 𝜎𝑋2̅ = = )
𝑛 𝑛 6
𝜎2
𝑋̅ ~ 𝑁 (𝜇, ) = 𝑁(𝜇 = 12, 𝜎𝑋2̅ = 0,0104)
𝑛
𝑋̅ − 𝜇 12,25 − 12
𝑍= = = 2,4515 2,45
𝜎𝑋̅ 𝑅𝐴𝐼𝑍(0,0104)
𝑋̅ − 𝜇 11,75 − 12
𝑍= = = −2,4515 − 2,45
𝜎𝑋̅ 𝑅𝐴𝐼𝑍(0,0104)
En Excel:
= 1- ( DISTR.NORM.N(12,25; 12;RAIZ(0,0104);1) - DISTR.NORM.N(11,75; 12;RAIZ(0,0104);1) )
0,01423
Estadística Aplicada I – verano 2023 208
Solución
Definamos las variables necesarias.
𝑋 ≔ contenido de gaseosa en una botella
𝑋~𝑁(𝜇 = 12; 𝜎 2 = 0,0625)
𝑋̅ ≔ media muestral de los contenidos de gaseosa de las seis botellas
𝜎 2 0,0625
𝑋̅~𝑁 (𝜇 = 12; = )
𝑛 6
𝑋̅~𝑁(12; 0,0104167)
La probabilidad pedida es que el contenido promedio de las seis botellas esté fuera de los límites
establecidos, es decir:
𝑃(𝑋̅ < 11,75) + 𝑃(𝑋̅ > 12,25)
Cálculo usando Excel
𝑃(𝑋̅ < 11,75) + 𝑃(𝑋̅ > 12,25) = 0,00715 + 0,00715 = 0,01430
Se usa
𝑃(𝑋̅ < 11,75) =DISTR.NORM.N(11.75;12;0.1020621;1) = 0,00715
𝑃(𝑋̅ > 12,25) =1-DISTR.NORM.N(12.25;12;0.1020621;1) = 0,00715
Ejemplo 96
El tiempo que demora un cliente en ser atendido con un nuevo sistema en cierta agencia bancaria es
una variable aleatoria con media igual a 1,5 minutos y desviación estándar de 0,35 minutos. Suponga
que esta agencia bancaria cuenta con un total de 200 clientes y 𝑿𝟏 , 𝑿𝟐 , …,𝑿𝟒𝟎 es una muestra sin
reemplazo de esta población.
Calcule la probabilidad de que el tiempo promedio de atención de la muestra de clientes esté entre
1,40 y 1,75 minutos.
𝜇 = 1,5
𝜎 = 0,35
n = 40
N = 200
Como n = 40 > 30, aplicando el Teorema de Límite Central (TLC), la distribución se aproxima a una
normal,
𝜎2 𝑁 − 𝑛 𝜎2 𝑁 − 𝑛 0,352 200 − 40
𝑋̅ ≈ 𝑁 (𝜇, 𝜎𝑋2̅ = ∗( )) = (𝜇 = 1,5, 𝜎𝑋2̅ = ∗( )= ∗( ))
𝑛 𝑁−1 𝑛 𝑁−1 40 200 − 1
𝜎2 𝑁 − 𝑛
𝑋̅ ≈ 𝑁 (𝜇, ∗( )) = 𝑁(𝜇 = 1,5, 𝜎𝑋2̅ = 0,0025)
𝑛 𝑁−1
𝑋̅ − 𝜇 1,75 − 1,5
𝑍= = = 5 5,00
𝜎𝑋̅ 𝑅𝐴𝐼𝑍(0,0025)
𝑋̅ − 𝜇 1,40 − 1,50
𝑍= = = −2 − 2,00
𝜎𝑋̅ 𝑅𝐴𝐼𝑍(0,0025)
0,97725
Solución
Definamos las variables necesarias.
𝑋 ≔ tiempo que demora un cliente en ser atendido con un nuevo sistema en una agencia bancaria
𝑋~¿ ? (𝜇 = 1,5; 𝜎 2 = 0,352 )
𝑋̅ ≔ media muestral de los tiempos que demoran 40 clientes en ser atendidos
𝜎2 𝑁 − 𝑛 0,352 200 − 40
𝑋̅~¿ ? (𝜇 = 1,5; ( )= ( ))
𝑛 𝑁−1 40 200 − 1
Z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275
-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
Ejemplo 97
El tiempo (en minutos) hasta que ocurra el primer pedido de acceso a una base de datos cada día es
descrito como una variable aleatoria continua exponencial T con media igual a dos minutos. Si de 36
días escogidos al azar se sumaran los tiempos hasta que ocurra el primer pedido de cada día, ¿cuál es
la probabilidad de que dicha suma supere los 84 minutos?
X Exp ( )
=2
Media: 𝜇𝑥 = 𝐸(𝑋) = 𝛽
Varianza: 𝜎𝑋2 = 𝛽 2
𝜇 =2
𝜎2 = 4
n = 36
N = NO HAY
84
P ( 𝑋̅ > = 2,3333 ) = 1 - P ( 𝑋̅ < 2,3333 )
36
Como n = 36 > 30, aplicando el Teorema de Límite Central (TLC), la distribución se aproxima a una
normal,
𝜎2 𝜎2 4
𝑋̅ ≈ 𝑁 (𝜇, 𝜎𝑋2̅ = ) = (𝜇 = 2, 𝜎𝑋2̅ = = )
𝑛 𝑛 36
𝜎2
𝑋̅ ≈ 𝑁 (𝜇, ) = 𝑁(𝜇 = 2, 𝜎𝑋2̅ = 0,1111)
𝑛
𝑋̅ − 𝜇 2,3333 − 2
𝑍= = = 0,99995 1,00
𝜎𝑋̅ 𝑅𝐴𝐼𝑍(0,1111)
Solución
Definamos las variables necesarias.
𝑇 ≔ tiempo (en minutos) hasta que ocurra el primer pedido de acceso a una base de datos cada día
𝑇~𝐸𝑥𝑝(𝛽 = 2)
La media de 𝑇 es:
𝜇=𝛽=2
La varianza de 𝑇 es:
𝜎 2 = 𝛽2 = 4
𝑆 ≔ suma muestral de los tiempos (en minutos) hasta que ocurra el primer pedido de los 36 días
La probabilidad pedida es que dicha suma supere los 84 minutos, es decir:
𝑃(𝑆 > 84)
Vamos a dividir la suma entre 𝑛 para obtener la media muestral.
𝑆 84
𝑃( > )
𝑛 𝑛
84
= 𝑃 (𝑇̅ > ) = 𝑃(𝑇̅ > 2,3333)
36
Definamos la variable 𝑇̅.
𝑇̅ ≔ media muestral de los tiempos hasta que ocurra el primer pedido de los 36 días
𝜎2 4
𝑇̅~¿ ? (𝜇 = 2; = )
𝑛 36
Como el tamaño de muestra 𝑛 = 36 ≥ 30, usaremos el teorema del límite central.
𝜎2 4
𝑇̅ ≈ 𝑁 (𝜇 = 2; = )
𝑛 36
𝑇̅ ≈ 𝑁(2; 0,111111)
Luego, se tiene que la probabilidad pedida es:
𝑃(𝑆 > 84) = 𝑃(𝑇̅ > 2,3333) = 0,158679
En Excel, se usa =1-DISTR.NORM.N(2.3333;2;0.333333;1)
Ejemplo 98
Se sabe que el tiempo de producción de fierros de construcción tiene una distribución normal con
media igual a 15 minutos y varianza igual a 2,1 minutos2. Se toma al azar una muestra de 25 fierros y
se pide calcular lo siguiente:
a. Calcule la probabilidad que la media del tiempo de producción se encuentre entre 12 y 16 minutos.
b. El área de calidad determina que, si el porcentaje que el tiempo promedio de producción se
encuentra entre 12 y 16 minutos es mayor que 60%, entonces comprará otra máquina laminadora.
¿Se comprará otra máquina laminadora?
c. ¿Cuál es el tiempo promedio que se requiere para estar en el 40,129% de los tiempos de
producción más bajos?
Solución
Estadística Aplicada I – verano 2023 212
a. Calcule la probabilidad que la media del tiempo de producción se encuentre entre 12 y 16 minutos.
Solución
Definamos las variables necesarias.
𝑋 ≔ tiempo de producción de fierros de construcción
𝑋~𝑁(𝜇 = 15; 𝜎 2 = 2,1)
𝑋̅ ≔ media muestral de los tiempos de producción de 25 fierros de construcción
𝜎 2 2,1
𝑋̅~𝑁 (𝜇 = 15; = )
𝑛 25
𝑋̅~𝑁(15; 0,084)
La probabilidad pedida es que la media del tiempo de producción de los 25 fierros se encuentre
entre 12 y 16 minutos, es decir:
𝑃(12 < 𝑋̅ < 16) = 0,99972
En Excel se usa =DISTR.NORM.N(16;15;0.289828;1)-DISTR.NORM.N(12;15;0.289828;1).
b. El área de calidad determina que, si el porcentaje que el tiempo promedio de producción se
encuentra entre 12 y 16 minutos es mayor que 60%, entonces comprará otra máquina laminadora.
¿Se comprará otra máquina laminadora?
Solución
La probabilidad pedida es que la media del tiempo de producción de los 25 fierros se encuentre
entre 12 y 16 minutos, es decir:
𝑃(12 < 𝑋̅ < 16) = 0,99972
Como el porcentaje pedido es mayor al 60% (99,972% > 60%), por tanto, sí comprará otra máquina
laminadora.
c. ¿Cuál es el tiempo promedio que se requiere para estar en el 40,129% de los tiempos de
producción más bajos?
Solución
Tenemos que:
𝑋̅~𝑁(15; 0,084)
Nos piden calcular el percentil 40,129, que es 14,9275 minutos.
En Excel, se usa =INV.NORM(0.40129;15;RAIZ(0.084)).
Estadística Aplicada I – verano 2023 213
Ejercicios
129. La duración de un componente eléctrico sigue una distribución exponencial con una media de
1000 horas.
a. Calcular la probabilidad de que la media de las duraciones de 50 componentes esté entre 980
y 1020 horas.
b. Calcular la probabilidad de que la suma de las duraciones de 50 componentes sea de más de
54000 horas.
130. Sea 𝑋 una variable aleatoria normal que denota la concentración de cierto contaminante con una
media de 10 partes por millón y una desviación estándar de 1,25 partes por millón. Se considera
tóxica una concentración cuando posee más de nueve partes por millón. Se toma una muestra
aleatoria de nueve concentraciones de este contaminante, calcule la probabilidad de que la
concentración promedio muestral sea mayor a nueve partes por millón. Rpta. 0,9918
131. El tiempo de descarga de una batería de cierto modelo de celular se modela con una variable
exponencial con media igual a 18 horas. ¿Cuál es la probabilidad de que la suma del tiempo de
las descargas de una muestra aleatoria de 36 de estas baterías supere las 666 horas?
Rpta. 0,4338
132. Se sabe que el tiempo de producción de fierros de construcción tiene una distribución normal con
media igual a 15 minutos y varianza igual a 2,1 minutos 2. Se toma al azar una muestra de 25
fierros, calcule la probabilidad que la media del tiempo de producción se encuentre entre 12 y 16
minutos.
133. El tiempo, en minutos, que se tarda una persona en realizar una tarea puede modelarse por una
variable aleatoria con la siguiente función de densidad.
𝑥
0 < 𝑥 < 10
𝑓(𝑥) = {50
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Si se toma al azar una muestra de 32 personas, calcule la probabilidad de que el tiempo medio
que se tardan en realizar dicha tarea sea más de 7 minutos.
134. Se lanza un dado mil veces y se registra el número de la cara superior. Calcule la probabilidad de
que la media muestral de los mil lanzamientos esté entre 3,4 y 3,6.
Estadística Aplicada I – verano 2023 214
Introducción al muestreo
Un gran objetivo de la Estadística es hacer inferencias acerca de una población con base en información
en una muestra. Esto motiva el estudio del problema del muestreo. Muchos estudios estadísticos se
inician con la selección de una muestra. Este proceso recibe el nombre de muestreo el cual comprende:
Definición de la población objetivo y búsqueda del marco muestral.
Determinación del tamaño de la muestra.
Elección del tipo de muestreo y selección de las unidades.
Registro de las observaciones.
Unidad elemental
Es el objeto sobre el cual se hace la medición. También llamada unidad de observación, unidad de
análisis. unidad estadística o elemento. Por ejemplo, en estudios de poblaciones humanas, con
frecuencia ocurre que la unidad elemental es cada individuo. También podría ser, por ejemplo, una
empresa, un colegio o un día, dependiendo de los objetivos y de la información que se quiere
recolectar.
Población muestreada
Es el conjunto de todas las unidades elementales posibles que podrían extraerse en una muestra; es
decir, es la población de donde se extrae la muestra.
Unidad de muestreo
Es la unidad donde realizamos la muestra.
Por ejemplo, podríamos querer estudiar a las personas, pero no tenemos una lista de todos los
individuos que pertenecen a la población objetivo. En vez de eso, la unidad de muestreo es cada familia
y la unidad elemental es cada individuo que vive en una familia.
Marco muestral
Es una lista de las unidades de muestreo que están disponibles para elección. Generalmente la unidad
elemental es la unidad de muestreo, pero no siempre.
Muestreo no probabilístico
El muestreo no probabilístico es una técnica de muestreo donde las muestras se recogen en un proceso
que no brinda a todos los individuos de la población iguales oportunidades de ser seleccionados. A
diferencia del muestreo probabilístico, no es un producto de un proceso de selección aleatoria. Los
sujetos en una muestra no probabilística generalmente son seleccionados en función de su
accesibilidad o a criterio personal e intencional del investigador.
La desventaja es que esta muestra no es representativa. Por lo tanto, los resultados de la investigación
no pueden ser utilizados en generalizaciones respecto de toda la población.
Muestreo probabilístico
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de
ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de
tamaño n tienen la misma probabilidad de ser seleccionadas.
Estadística Aplicada I – verano 2023 215
Ficha técnica
La ficha técnica es el documento donde consta la metodología y el proceso que se ha seguido para
realizar un estudio social o de mercado.
En el caso de los estudios cuantitativos, la información a incluir es la siguiente:
Descripción del universo
Metodología de selección de la muestra
Tamaño muestral
Nivel de confianza y margen de error con el que se presentan los resultados
Técnica aplicada para realizar el trabajo de campo
Período de recogida de la información
Elección de la muestra
Se seleccionará los elementos del marco de muestreo que conformarán la muestra aplicando la
técnica de muestreo apropiada para el estudio que se desea llevar a cabo.
Estadística Aplicada I – verano 2023 218
Ejemplo 99
Se desea seleccionar una muestra de cinco clientes usando muestreo aleatorio simple y se tiene el
marco muestral, la lista enumerada de la población de clientes de la empresa de 350 clientes. Use las
columnas C6, C15 y C4.
Marco muestral
Número Cliente
001 Carlos Torres
002 Manuel Benavides
003 Ricardo Montoya
004 Rosario Castro
⋮ ⋮
349 Julia Martín
N = 350 Renato Alvarado
Solución
Se debe seleccionar cinco números del 1 al 350 sin reemplazo, es decir sin que se repitan. El número
máximo por seleccionar es 350 que tiene tres dígitos, entonces tomaremos de la tabla de números
aleatorios tres columnas consecutivas.
Comenzaremos con la columna C6 para iniciar la selección. Se tomarán tres columnas consecutivas
hacia la derecha a partir de C6, esto es: C6 C7 C8. Los números deben estar comprendidos entre 1 y
350.
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
Los números seleccionados serán: 84; 40; 124; 245 y 332. Las columnas C15 y C4 no se usarán.
Estadística Aplicada I – verano 2023 222
Ejemplo 100
El gerente de una empresa automotriz que tiene un total de 150 empleados requiere seleccionar a 12
empleados al azar para que conformen un equipo de prueba, utilizando un nuevo método de
transporte y para estimar el ingreso mensual.
A continuación, se muestra el número o código del colaborador y su ingreso quincenal en soles.
Trabajadores registrados (Marco muestral)
Ingreso Ingreso Ingreso Ingreso
Nº Nº Nº Nº
quincenal quincenal quincenal quincenal
1 2300 39 2600 77 1800 115 1700
2 2800 40 2700 78 1700 116 2600
3 2400 41 2100 79 1700 117 1600
4 2500 42 2300 80 1700 118 1800
5 2300 43 1700 81 1700 119 2100
6 2100 44 2200 82 2100 120 1700
7 1700 45 2900 83 2600 121 2400
8 2000 46 1800 84 2400 122 2600
9 2200 47 2100 85 2600 123 2100
10 2100 48 2000 86 1900 124 2100
11 1700 49 2000 87 1600 125 2400
12 2500 50 2900 88 1900 126 1700
13 2800 51 2100 89 2100 127 2600
14 2400 52 2100 90 1700 128 2400
15 1700 53 1800 91 2100 129 2700
16 2400 54 2000 92 1700 130 2100
17 2200 55 2100 93 2300 131 1600
18 2200 56 1900 94 2500 132 2100
19 2300 57 2000 95 2600 133 1900
20 2800 58 2300 96 1900 134 2100
21 2100 59 2000 97 2500 135 2200
22 1700 60 1700 98 1800 136 2400
23 2500 61 1900 99 1700 137 1800
24 2400 62 2000 100 2000 138 2600
25 2700 63 2400 101 2400 139 2700
26 1700 64 1700 102 1700 140 2500
27 1600 65 1700 103 2500 141 2500
28 2600 66 2400 104 1700 142 1900
29 2500 67 2500 105 2400 143 2100
30 2500 68 2600 106 2400 144 1700
31 2700 69 2100 107 1900 145 1500
32 1700 70 1900 108 1700 146 1800
33 1600 71 2000 109 2100 147 2100
34 2400 72 1800 110 2000 148 2700
35 1900 73 2100 111 2000 149 1800
36 1800 74 2300 112 2500 150 2100
37 1800 75 2700 113 1700
38 2400 76 2800 114 2500
a. Seleccione una muestra de 12 trabajadores usando muestreo aleatorio simple. Elabore un listado
con el número o código seleccionado y el valor del ingreso quincenal. Considere las columnas C4,
Estadística Aplicada I – verano 2023 223
C8, C11 y C15 de la tabla de números aleatorios para la selección. ¿A qué colaboradores
seleccionará para conformar el equipo de prueba?
Seleccionaremos 12 elementos del marco muestral. Como el marco muestral tiene 150
elementos y este valor tiene 3 cifras o dígitos, entonces se utilizarán 3 columnas consecutivas para
seleccionar los elementos, se iniciará la selección con las columnas C4 C5 C6.
Número Ingreso quincenal Número Ingreso quincenal
114 2500 105 2400
081 1700 098 1800
134 2100 126 1700
148 2700 064 1700
039 2600 109 2100
097 2500 122 2600
Ejercicios
135. La empresa de telecomunicaciones RVTV tiene 120 empleados de los cuales tiene información de
las variables: ingreso mensual, en soles; nivel de educación y años en la empresa (Años).
a. Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use las
columnas C1, C4, C8, C9, C17.
b. Con la muestra, calcule la proporción de empleados que tienen más de 12 años en la empresa.
a. Usando muestreo simple aleatorio obtenga una muestra de tamaño 10 y con esa muestra
calcule el porcentaje de empleados que respondieron que el clima laboral era regular. Use C3.
b. Calcule el porcentaje poblacional de empleados que respondieron que el clima laboral era
regular.
137. Una empresa de telecomunicaciones tiene un total de 150 empleados y ha registrado en la tabla
que se muestra a continuación información acerca de las variables: nivel educativo y años
cumplidos en la empresa (años).
Aplique el muestreo aleatorio simple para seleccionar una muestra de tamaño 13 empleados.
Elabore un listado con la posición seleccionada y el valor de los años cumplidos en la empresa y
nivel educativo. Utilice la columna C7, C10 y C15 de la tabla de números aleatorios. Con la muestra
obtenida, estime e interprete para la variable, años en la empresa el promedio y la mediana. Obtenga,
además, la proporción de empleados con nivel técnico.
138. Telecom es una empresa que brinda soluciones integrales en infraestructura de
telecomunicaciones. Cuenta con más de 12 años de experiencia en diferentes proyectos con los
principales operadores y fabricantes de equipos del sector, junto a un equipo de ingenieros,
técnicos y consultores de larga trayectoria profesional, nacional e internacional.
La empresa está interesada en saber si existe una alta rotación de personal, debido a ello, el
departamento de recursos humanos ha hecho un censo. Los resultados se muestran en la base de
datos siguiente.
Marco muestral
Número Permanencia Grado de Remuneración
Posición Sexo Edad Motivo de cese
de hijos (meses) instrucción bruta
1 M 0 33 26 Titulado 5000 Renuncia voluntaria
2 M 1 34 10 Titulado 12075 Renuncia voluntaria
3 M 0 30 11 Titulado 3000 Renuncia voluntaria
4 F 0 28 3 Titulado 1500 Renuncia voluntaria
5 M 0 27 2 Titulado 800 Renuncia voluntaria
6 M 0 28 28 Titulado 3000 Renuncia voluntaria
7 F 1 39 12 Post grado 5575 Renuncia voluntaria
8 F 1 38 32 Técnico completa 2000 Renuncia voluntaria
9 F 0 32 1 Técnico completa 2700 Renuncia voluntaria
10 F 0 26 0 Técnico completa 2575 Renuncia voluntaria
Estadística Aplicada I – verano 2023 227
Se desea seleccionar una muestra de 13 trabajadores usando muestreo simple aleatorio. Use las
columnas C3, C1, C14 y C12 de la tabla de números aleatorios y encuentre el porcentaje de
trabajadores cuyo motivo de cese fue por renuncia voluntaria.
Estadística Aplicada I – verano 2023 229
139. Los siguientes datos han sido extraídos de una investigación realizada por La Defensoría del
Pueblo, Comisión de la Verdad y Reconciliación, Comité Internacional Cruz Roja y Coordinadora
Nacional de Derechos Humanos sobre un total de 150 personas extraviadas en el Perú entre los
años 1980 y 1996 en los tres principales departamentos donde hubo el brote terrorista:
Ayacucho, Huánuco y San Martín. Las variables que se consideraron fueron: Lugar de procedencia
(lugar), sexo y edad al momento de la desaparición. Los datos se presentan a continuación:
Nº Lugar Sexo Edad Nº Procedencia Sexo Edad Nº Lugar Sexo Edad Nº Lugar Sexo Edad
1 Ayacucho M 12 39 Ayacucho M 22 77 Ayacucho M 33 115 Huánuco M 28
2 Ayacucho M 40 40 Ayacucho F 23 78 Ayacucho M 22 116 Huánuco M 36
3 Ayacucho M 20 41 Ayacucho M 50 79 Ayacucho M 70 117 Huánuco M 27
4 Ayacucho M 43 42 Ayacucho M 26 80 Ayacucho M 34 118 Huánuco M 24
5 Ayacucho M 28 43 Ayacucho F 19 81 Ayacucho M 69 119 Huánuco M 45
6 Ayacucho M 12 44 Ayacucho M 54 82 Ayacucho F 31 120 Huánuco M 21
7 Ayacucho F 15 45 Ayacucho M 13 83 Huánuco M 21 121 Huánuco M 66
8 Ayacucho M 28 46 Ayacucho M 46 84 Huánuco M 27 122 Huánuco F 70
9 Ayacucho M 13 47 Ayacucho M 28 85 Huánuco F 19 123 Huánuco F 26
10 Ayacucho M 45 48 Ayacucho M 46 86 Huánuco M 27 124 Huánuco M 26
11 Ayacucho M 10 49 Ayacucho M 42 87 Huánuco M 20 125 Huánuco M 14
12 Ayacucho F 25 50 Ayacucho M 40 88 Huánuco M 25 126 Huánuco M 18
13 Ayacucho M 24 51 Ayacucho M 44 89 Huánuco M 18 127 Huánuco M 28
14 Ayacucho M 32 52 Ayacucho M 39 90 Huánuco M 47 128 San Martín M 25
15 Ayacucho M 48 53 Ayacucho M 17 91 Huánuco M 28 129 San Martín M 32
16 Ayacucho M 23 54 Ayacucho F 19 92 Huánuco M 32 130 San Martín M 22
17 Ayacucho F 7 55 Ayacucho M 24 93 Huánuco M 18 131 San Martín M 21
18 Ayacucho F 5 56 Ayacucho F 15 94 Huánuco M 22 132 San Martín M 28
19 Ayacucho M 4 57 Ayacucho M 17 95 Huánuco M 28 133 San Martín M 18
20 Ayacucho F 9 58 Ayacucho M 22 96 Huánuco M 31 134 San Martín M 29
21 Ayacucho M 6 59 Ayacucho M 50 97 Huánuco M 34 135 San Martín M 20
22 Ayacucho M 66 60 Ayacucho M 42 98 Huánuco M 25 136 San Martín M 18
23 Ayacucho M 18 61 Ayacucho M 19 99 Huánuco M 27 137 San Martín M 21
24 Ayacucho F 36 62 Ayacucho M 21 100 Huánuco M 19 138 San Martín M 26
25 Ayacucho M 26 63 Ayacucho M 15 101 Huánuco M 24 139 San Martín M 23
26 Ayacucho M 17 64 Ayacucho M 43 102 Huánuco M 28 140 San Martín M 35
27 Ayacucho M 28 65 Ayacucho M 16 103 Huánuco F 4 141 San Martín M 17
28 Ayacucho M 30 66 Ayacucho M 30 104 Huánuco F 2 142 San Martín M 32
29 Ayacucho F 19 67 Ayacucho M 48 105 Huánuco M 33 143 San Martín F 32
30 Ayacucho M 17 68 Ayacucho M 45 106 Huánuco M 25 144 San Martín M 41
31 Ayacucho F 20 69 Ayacucho M 41 107 Huánuco M 21 145 San Martín M 26
32 Ayacucho M 21 70 Ayacucho M 23 108 Huánuco M 21 146 San Martín M 20
33 Ayacucho M 37 71 Ayacucho M 22 109 Huánuco M 30 147 San Martín M 21
34 Ayacucho M 58 72 Ayacucho M 20 110 Huánuco M 21 148 San Martín M 15
35 Ayacucho M 18 73 Ayacucho M 22 111 Huánuco M 21 149 San Martín M 22
Estadística Aplicada I – verano 2023 230
Nº Lugar Sexo Edad Nº Procedencia Sexo Edad Nº Lugar Sexo Edad Nº Lugar Sexo Edad
36 Ayacucho F 18 74 Ayacucho M 16 112 Huánuco M 54 150 San Martín M 45
37 Ayacucho M 19 75 Ayacucho M 45 113 Huánuco M 38
38 Ayacucho M 18 76 Ayacucho F 56 114 Huánuco M 16
a. Aplique el muestreo aleatorio simple para obtener una muestra de 10 personas desaparecidas.
Elabore un listado con el elemento seleccionado y el valor de la edad al momento de la
desaparición.
b. Con la muestra obtenida calcule el promedio de la edad al momento de la desaparición.
140. El director de una empresa tiene la lista de todo su personal y desea obtener una muestra
aleatoria de los colaboradores para conocer el grado de satisfacción que estos tienen en su centro
de trabajo y estimar el tiempo promedio de servicio. El siguiente cuadro presenta el número o
código del colaborador, el tiempo de servicio en meses y la edad en años.
35 91 43 75 91 47 115 90 36
36 106 45 76 86 41 116 98 30
37 106 45 77 93 42 117 88 59
38 91 43 78 91 47 118 123 40
39 104 63 79 91 47 119 98 30
40 104 53 80 86 45 120 88 59
Nivel de confianza
Es la probabilidad de que el intervalo construido en torno a un estadístico contenga al verdadero valor
del parámetro. El nivel de confianza lo fija el investigador, el valor más usual es 95%.
𝛼
Con este nivel de confianza, se obtiene el valor 𝑍1−𝛼, que corresponde al percentil (1 − ) × 100% de
2 2
la distribución normal estándar.
Variabilidad
Cuando una población es más homogénea la varianza es menor y el número de entrevistas necesarias
será más pequeño.
Generalmente la variabilidad es un valor desconocido y hay que estimarlo a partir de datos de estudios
previos, muestra piloto o estudios anteriores similares.
Margen de error o error de estimación
El margen de error o error de estimación es la diferencia entre un estadístico y el parámetro
correspondiente.
Nos da una idea clara de hasta dónde y con qué probabilidad una estimación basada en una muestra
se diferencia del valor del parámetro, que se hubiera obtenido por medio de un censo completo.
Un estadístico será más preciso cuando su error sea más pequeño.
En un estudio, el margen de error lo fija el investigador. Por ejemplo, si queremos estimar el valor de
la media del gasto mensual en transporte de una persona en Lima, el margen de error podría
establecerse en cuatro soles; mientras que si queremos estimar el porcentaje de personas que están
a favor de una cierta ley, el margen de error podría establecer en 2,8%.
Estadística Aplicada I – verano 2023 233
0,95
0,90
0,05 0,05
-4 -3 -2 -1 0 1 2 3 4
Buscando en la tabla el valor más cercano a la suma de 0,90 y 0,05; es decir; a 0,95 que es 0,94950.
Una vez hallado el valor hallado el valor más cercano a 0,95; salimos a los bordes de la tabla normal
estándar.
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
Cuando no se conoce el tamaño de la población 𝑁 (es un valor muy grande) se asume población infinita
y no se incluye N en la fórmula.
Tamaño de muestra si se conoce N (población finita)
Cuando se conoce el tamaño de la población 𝑁 (es un valor no muy grande) se asume población finita
y se realiza un ajuste al valor del tamaño de muestra obtenido con la fórmula anterior y se corrige n
con la siguiente fórmula:
𝑛
𝑛𝑐 = 𝑛
1+
𝑁
𝑛𝑐 ≔ tamaño de muestra corregido.
El valor de 𝑛 obtenido en la fórmula anterior se ingresa con cuatro decimales por redondeo simple.
El valor final 𝑛𝑐 se redondea al entero superior.
Estadística Aplicada I – verano 2023 235
Ejemplo 101
Un estudiante realiza un estudio para conocer el ingreso familiar promedio y la asignación de estos
ingresos en cada rubro, como alimentación, educación, salud y otros, en la ciudad de Lima. ¿A cuántas
familias deberá considerar en el estudio si se desea tener un nivel de confianza del 95%, un error
máximo de 500 soles, y mediante una muestra piloto se obtuvo una desviación estándar del ingreso
familiar de 3600 soles?
Solución
Se quiere estimar la media del ingreso familiar, en soles, por tanto, la fórmula es:
2
𝑍(1−𝛼) 𝑠
2
𝑛=( )
𝑒
0,975
0,95
0,025 0,025
-4 -3 -2 -1 0 1 2 3 4
𝑍0,975 = 1,96
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
Ejemplo 102
Universal es una nueva emisora de carácter político y a una semana de estar al aire cuenta con 3000
radioescuchas. El gerente desea realizar un estudio para estimar el tiempo de conexión promedio de
los oyentes. Al seleccionar una muestra piloto se obtuvieron los siguientes resultados, en horas:
3,2 4,8 5,3 9,1 6,3 8,2 6,5 9,6 10,3 8,6
6,3 7,9 8,2 7,9 6,9 9,3 8,6 6,8 10,1 9,0
¿Cuál debe ser el tamaño de muestra de oyentes que se necesita si desea tener un error de estimación
de 0,15 horas con un nivel de confianza del 94%?
Solución
Se quiere estimar la media poblacional del tiempo de conexión 𝜇.
El margen de error es:
𝑒 = 0,15
La desviación estándar muestral es:
𝑠 = 1,8600
El nivel de confianza del 94% entonces:
(1 − 𝛼) = 0,94
El valor del nivel de confianza (1 − 𝛼) = 0,94 lo colocamos en el centro de la distribución normal
estándar y buscamos dentro de la tabla el valor más cercano ala suma de 0,94 y 0,03; es decir; 0,97.
0,97
0,94
0,03 0,03
-4 -3 -2 -1 0 1 2 3 4
𝑍0,97 = 1,88
En la tabla normal buscamos el valor más cercano a 0,97 que es 0,96995; luego salimos a los bordes y
obtenemos el valor 1,88.
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
1,88 × 1,8600 2
𝑛=( ) = 543,4493
0,15
Como el tamaño de la población es conocida, la población es finita, se debe corregir la muestra:
𝑛
543,4493
𝑛𝑐 =
𝑛= = 460,1
1+ 543,4493
𝑁 1 +
3000
El valor del tamaño de muestra siempre se redondea por exceso, por tanto, se necesita entrevistar a
461 radioescuchas.
Estadística Aplicada I – verano 2023 238
Cuando no se conoce el tamaño de la población 𝑁 o es un valor muy grande, se asume que la población
es infinita y, por tanto, no se incluye 𝑁 en la fórmula del tamaño de muestra.
Tamaño de muestra si se conoce 𝑵 (población finita)
Cuando se conoce el tamaño de poblacional 𝑁, la población será finita y se realiza un ajuste al valor
del tamaño de muestra obtenido con la fórmula anterior y se corrige 𝑛 con la siguiente fórmula:
𝑛
𝑛𝑐 = 𝑛
1+
𝑁
𝑛𝑐 ≔ tamaño de muestra corregido
El valor de 𝑛 obtenido en la fórmula anterior se ingresa con cuatro decimales por redondeo simple.
El valor final 𝑛𝑐 se redondea al entero superior.
Estadística Aplicada I – verano 2023 239
Ejemplo 103
Una compañía de investigación de mercado quiere estimar el porcentaje de hogares que tienen
Internet en casa, ¿cuántos hogares debe considerarse en el estudio si desea tener una confianza del
95% de que el porcentaje muestral difiera del poblacional a lo más en 4,5%.
Solución
La variable en estudio es tenencia de Internet y es una variable cualitativa.
Se quiere estimar 𝑝 = proporción poblacional de hogares con Internet, por tanto, la fórmula es:
2
𝑍1−𝛼 𝑝̂ (1 − 𝑝̂ )
2
𝑛=
𝑒2
El margen de error es la diferencia de la proporción muestral y poblacional, por tanto, 𝑒 = 0,045.
No se cuenta con una estimación previa de 𝑝, entonces se usa 𝑝̂ = 0,5.
El valor del nivel de confianza (1 − 𝛼) = 0,95 lo colocamos en el centro de la distribución normal
estándar y buscamos dentro de la tabla el valor más cercano ala suma de 0,95 y 0,025, es decir, 0,975.
0,975
0,95
0,025 0,025
-4 -3 -2 -1 0 1 2 3 4
𝑍0,975 = 1,96
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
Ejercicios
141. Calcule el tamaño de muestra si se desea estimar el tiempo promedio, en horas, que demoran los
estudiantes en llegar a la universidad, de un total de 6400 estudiantes, si se considera un nivel de
confianza del 96% y un error de estimación de 0,1 horas. De una muestra piloto de ocho alumnos,
se obtuvo los siguientes resultados:
142. Infodata es una empresa privada que asesora en temas informáticos al Ministerio de Educación y
quiere realizar un estudio sobre el tiempo que llevan los usuarios de la Biblioteca Nacional en las
salas de búsqueda computarizada. Para realizar dicho estudio tomó una muestra piloto de 20
usuarios de la Biblioteca Nacional, obteniéndose los siguientes tiempos en minutos.
5,4 4,6 10,1 8,0 6,6 7,0 4,6 9,9 4,0 12,1
9,8 5,5 4,5 6,7 7,8 4,9 5,0 6,4 4,4 5,9
¿Cuál es el tamaño de muestra que se debe seleccionar para hacer una encuesta, si se desea tener
un margen de error de medio minuto con un nivel de confianza del 98%?
143. La gerencia de una compañía de seguros ha observado el creciente uso de teléfonos celulares de
parte de los conductores, teniendo como resultado un mayor número de accidentes
automovilísticos, considerando implementar tarifas más altas en sus seguros. Se desea estimar el
porcentaje de conductores que hablan por teléfono mientras conducen, con un margen de error
de 3% y un nivel de confianza del 90% ¿cuál es el tamaño de muestra?
144. Se quiere estimar el porcentaje poblacional de productos defectuosos de una línea de producción
¿Qué tamaño de muestra debe obtener el ingeniero encargado, si se quiere tener una confianza
del 99% con un margen de error de 2,5%? En una muestra piloto de 360 productos se obtuvo 15
de productos defectuosos.
145. En una encuesta realizada entre estudiantes universitarios de Lima, el 32% de los encuestados
dijeron que la situación económica del país había mejorado en el último año. ¿Qué tan grande se
necesita que sea la muestra de estudiantes para una nueva encuesta, si se desea tener una
confianza de 95% y un margen de error de 2,2%?
146. El alcalde de un distrito desea estimar la proporción de residentes que conocen la propuesta
respecto al uso de fondos municipales para mejorar la limpieza del distrito. En una muestra piloto
de 120 residentes, 75 no conocen dicha propuesta. ¿Qué tamaño de muestra necesita seleccionar
si requiere una confianza del 98% y un margen de error del 4%?
147. Para estimar el porcentaje de electores a favor de un candidato, una encuestadora debe
determinar el tamaño de la muestra de una población de diez mil electores. ¿Qué tan grande
debe ser la muestra si se quiere tener una confianza del 97% y un margen de error del 2,8%?
Estadística Aplicada I – verano 2023 242
Z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,00003 0,00003 0,00007 0,00004 0,00004 0,00004 0,00004 0,00004 0,00005 0,00005
-3,8 0,00005 0,00005 0,00005 0,00006 0,00006 0,00006 0,00006 0,00007 0,00005 0,00007
-3,7 0,00008 0,00008 0,00008 0,00009 0,00009 0,00009 0,00010 0,00010 0,00010 0,00011
-3,6 0,00011 0,00012 0,00012 0,00013 0,00013 0,00014 0,00014 0,00015 0,00015 0,00017
-3,5 0,00017 0,00017 0,00018 0,00019 0,00019 0,00020 0,00021 0,00022 0,00022 0,00023
-3,4 0,00024 0,00025 0,00026 0,00027 0,00028 0,00029 0,00030 0,00031 0,00033 0,00037
-3,3 0,00035 0,00036 0,00038 0,00039 0,00040 0,00042 0,00043 0,00045 0,00047 0,00048
-3,2 0,00050 0,00052 0,00054 0,00056 0,00058 0,00060 0,00062 0,00064 0,00066 0,00067
-3,1 0,00071 0,00074 0,00076 0,00079 0,00082 0,00085 0,00087 0,00090 0,00094 0,00097
-3,0 0,00100 0,00104 0,00107 0,00111 0,00114 0,00118 0,00122 0,00126 0,00131 0,00135
-2,9 0,00139 0,00144 0,00149 0,00154 0,00159 0,00164 0,00169 0,00175 0,00181 0,00187
-2,8 0,00193 0,00199 0,00205 0,00212 0,00219 0,00226 0,00233 0,00240 0,00248 0,00256
-2,7 0,00264 0,00272 0,00280 0,00289 0,00298 0,00307 0,00317 0,00326 0,00336 0,00347
-2,6 0,00357 0,00368 0,00379 0,00391 0,00402 0,00415 0,00427 0,00440 0,00453 0,00466
-2,5 0,00480 0,00494 0,00508 0,00523 0,00539 0,00554 0,00570 0,00587 0,00604 0,00621
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275
-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515 0,03593
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363 0,04457
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370 0,05480
-1,5 0,05592 0,05705 0,05821 0,05938 0,06057 0,06178 0,06301 0,06426 0,06552 0,06681
-1,4 0,06811 0,06944 0,07078 0,07215 0,07353 0,07493 0,07636 0,07780 0,07927 0,08076
-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510 0,09680
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866
-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
-0,0 0,46414 0,46812 0,47210 0,47608 0,48006 0,48405 0,48803 0,49202 0,49601 0,50000
Estadística Aplicada I – verano 2023 243
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,99865 0,99869 0,99874 0,99878 0,99882 0,99886 0,99889 0,99893 0,99897 0,99900
3,1 0,99903 0,99907 0,99910 0,99913 0,99916 0,99918 0,99921 0,99924 0,99926 0,99929
3,2 0,99931 0,99934 0,99936 0,99938 0,99940 0,99942 0,99944 0,99946 0,99948 0,99945
3,3 0,99952 0,99953 0,99955 0,99957 0,99958 0,99960 0,99961 0,99962 0,99964 0,99965
3,4 0,99966 0,99968 0,99969 0,99970 0,99971 0,99972 0,99973 0,99974 0,99975 0,99976
3,5 0,99977 0,99978 0,99978 0,99979 0,99980 0,99981 0,99982 0,99982 0,99983 0,99984
3,6 0,99984 0,99985 0,99985 0,99986 0,99986 0,99987 0,99987 0,99988 0,99988 0,99989
3,7 0,99989 0,99990 0,99990 0,99991 0,99991 0,99991 0,99992 0,99992 0,99992 0,99993
3,8 0,99993 0,99993 0,99993 0,99994 0,99994 0,99994 0,99994 0,99995 0,99995 0,99995
3,9 0,99995 0,99995 0,99996 0,99996 0,99996 0,99996 0,99996 0,99996 0,99997 0,99997
Estadística Aplicada I – verano 2023 244
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Estadística Aplicada I – verano 2023 245
Índice