Probabilidad y Estadística
Probabilidad y Estadística
Probabilidad y Estadística
1. En las siguientes situaciones identifique los siguientes conceptos : población, elementos, variable
y tipo de variable. Además redacte un título para una posible tabla de frecuencia.
Ejemplo
Se desea analizar el número de accidentes por turno en un mes de un grupo de trabajaores per-
tenecientes a la empresa Metalcom Ltda.
Población : Empresa Metalcom Ltda.
Elementos : Trabajadores.
Variable : Número de accidentes por turno en un mes determinado.
Tipo de variable : Cuantitativa – discreta.
Título : Distribución de trabajadores según el número de accidentes por turno en un mes deter-
minado en la empresa Metalcom Ltda.
1
2. Considere los siguientes datos sobre el tipo de problema de salud ( J = articulación hinchada,
F = fatiga, B = dolor de espalda, M = debilidad muscular, T = tos, N = nariz con flujo
o irritación, O = otro) presentado por agricultores. Obtenga una tabla de frecuencia lo más
O O N J T F B B F O
J O O M O F F O O N
O N J F J B O T J O
J J F N O B M O J M
O B O F J O O B N T
O O O M B F J O F N
completa posible y comente algunas inquietudes que Ud. tenga con respecto al contexto del
problema. La información que Ud. extraiga a de ser coerente con los resultados publicados en el
artículo científico “Physiological Effects of Work Stress and Pesticide Exposure in Tree Planting
by British Columbia Silviculture Workers". Ergonomics, 1993, pp.951-961).
3. Unos traductores de temperatura de cierto tipo se embarcan en lotes de 50. Se seleccionó una
muestra de 60 lotes y se determinó la cantidad de traductores en cada lote que no se apegaban
a las especificaciones de diseño; y resultaron los siguientes datos:
2 1 2 4 0 1 3 2 0 5 3 3 1 3 2 4 7 0 2 3
0 4 2 1 3 1 1 3 4 1 2 3 2 2 8 4 5 1 3 1
5 0 2 3 2 1 0 6 4 2 1 6 0 3 3 3 6 1 2 3
a) Determine las frecuencias absolutas y relativas para los valores observados de x : cantidad de
traductores defectuosos en un lote.
b) ¿Qué proporción de lotes en la muestra tienen cuando más cinco traductores defectuosos?.
¿Qué proporción tienen menos que cinco?. ¿Qué proporción tienen cuando menos cinco
unidades defectuosas?.
c) Trace una representación gráfica y comente.
0 2 0 1 3 4 0 2 1 3 0 2 2
1 0 5 2 6 1 2 1 4 1 1 0 1
1 1 2 0 5 2 0 4 3 2 4 3 2
1 6 2 3 3 5 1 3 6 1 3 4 5
2
5. La siguiente información corresponde al peso (en Kilos) de un lote de 40 sacos de mineral en la
Empresa minera Santa María en agosto de 2012:
i Peso Ci ni
1 [100 , 110] 105 2
2 (110 , 120] 115 6
3 (120 , 130] 125 6
4 (130 , 140] 135 7
5 (140 , 150] 145 18
6 (150 , 160] 155 1
Total 40
U 6.0 5.0 11.0 33.0 4.0 5.0 80.0 18.0 35.0 17.0 23.0
C 4.0 14.0 11.0 9.0 9.0 8.0 4.0 20.0 5.0 8.9 21.0 9.2 3.0 2.0 0.3
11 11 15 15
u2i , c2i .
P P P P
a) Obtenga los valores de ui , ci y
i=1 i=1 i=1 i=1
b) Determine la media muestral de cada muestra, usando la información obtenida en a). ¿Cómo
se comparan?.
c) Determine la media muestral de cada muestra, usando la calculadora.
d) Determine la mediana muestral de cada muestra. ¿Cómo se comparan?. ¿Por qué es la me-
diana de la muestra urbana tan diferente de la media de dicha muestra?.
7. Se determinó el valor del módulo de Young (GPa) de placas fundidas compuestas de ciertos
sustratos intermetálicos y se obtuvieron las siguientes observaciones muestrales (“Strength and
Modulus of a Molybdenum-Coated Ti- 25A1-10Nb-3U-1Mo Intermetallic”, J. of Materials Engr.
and Performance, 1997: 46-50):
3
8. Los siguientes valores de gravedad especifíca para diferentes tipos de madera usadas en cons-
trucción aparecieron en el artículo “Bolted Connection Desing Values Based on European Yield
Model"(J. of Structural Engr., 1993, pp. 2169 - 2186)
9. Los siguientes datos de octanaje de varias mezclas de gasolina fueron tomados de un artículo en
Technometrics (vol. 19, p. 425), revista dedicada a las aplicaciones estadísticas en ciencias físicas
e ingeniería.
88.5 95.6 88.3 94.2 89.2 93.3 89.8 87.7 93.3 87.6
92.7 88.3 91.8 89.6 83.4 94.7 84.3 93.2 85.3 92.3
87.4 86.7 91.1 86.7 91.0 87.9 90.4 88.9 87.5 91.0
88.2 90.3 88.6 90.1 91.2 91.5 94.2 90.8 93.4 90.9
93.0 89.3 88.6 87.8 88.3 88.5 89.0 88.7 94.4 100.3
89.9 98.8 90.1 96.1 89.9 92.7 91.8 90.4 92.2 91.6
89.3 92.2 90.4 89.7 91.2 91.1 90.3 91.0 92.6 91.6
92.2 89.8 90.5 90.0 90.6 93.7 90.7 91.1 92.7 93.7
a) Construya una tabla de frecuencias lo más completa posible para los datos proporcionados,
escríbale un título y anéxele un gráfico adecuado.
b) Con la tabla construida anteriormente responda lo siguiente
i) Obtenga e Interprete n6 , F5 , N3 y f4 .
ii) Obtenga e interprete P28 y Q3 .
iii) Obtenga e interprete la moda y la mediana.
iv) Si el 15 % de las muestras con menor octanaje son consideradas como de mala calidad,
el 20 % de las muestras con mayor octanaje se consideran de calidad superior y las
demás muestras son consideradas como normales.¿Entre qué valores una muestra será
considerada como normal?.
v) Determine el porcentaje de muestras con un octanaje superior o igual a 89.0.
m m
Ci2 ni .
P P
c) Obtenga los valores de Ci n i ,
i=1 i=1
d) Con la información obtenida en c), obtenga la media aritmética y la desviación estándar.
e) Use calculadora para obtener los valores de la media aritmética y la desviación estándar.
4
10. La tabla siguiente corresponde al peso de 127 sacos de mineral (en Kgs). obtenidos en la empresa
minera Cerro Amarillo en agosto de 2013.
i Peso ni
1 [40 ; 50] 2
2 (50 ; 60] 12
3 (60 ; 70] 36
4 (70 ; 80] 40
5 (80 ; 90] 28
6 (90 ; 100] 5
7 (100 ; 110] 4
11. La siguiente tabla muestra el análisis de la edad de 200 trabajadores de la empresa constructora
Ladrillos Ltda. en marzo de 2008.
i Edad ni fi Ni Fi
1 [15 ; 25] 16
2 (25 ; 35] 0.23 0.31
3 (35 ; 45] 52 114
4 (45 ; 55] 0.76
5 (55 ; 65] 30
6 (65 ; 75] 0.09
12. Un diagrama de Pareto es una variación de un histograma para datos categóricos resultantes
de un estudio de control de calidad. Cada categoría representa un tipo diferente de inconformi-
dad con el producto, o problema de producción. Las categorías están ordenadas de modo que
aquella que tiene la frecuencia más grande aparece a la extrema izquierda, luego la categoría
con la segunda frecuencia más grande, y así sucesivamente. Suponga que se obtiene la siguiente
información por inconformidad en paquetes de circuito : componente con falla, 126; componente
incorrecto, 210; soldadura insuficiente, 67; soldadura excesiva, 54; y componente faltante, 131.
Construya un diagrama de Pareto y comente.
5
13. I) En años recientes, se ha utilizado con éxito un resumen gráfico llamado gráfica de caja o
Box Plot para describir varias de las características más prominentes de un conjunto de
datos. Estas características incluyen 1) el centro, 2) la dispersión, 3) el grado y naturaleza
de cualquier alejamiento de la simetría y 4) la identificación de las observaciones “extremas
o apartadas” inusualmente alejadas del cuerpo principal de los datos.
El diagrama se basa en cinco cantidades xmin , P25 , mediana, P75 y xmax . Primero, se traza
una escala vertical de medición. A continuación, se pone un rectángulo sobre este eje; su orilla
inferior está en P25 y la superior en P75 , por lo que el ancho de la caja = fs (fs = P75 − P25 ).
Se traza un segmento de recta horizontal dentro del rectángulo, en lugar de la mediana. Por
último, se trazan bigotes o brazos que salen de ambos lados del rectángulo, hacia las obser-
vaciones mínima y máxima.
Observación
a) La posición del símbolo de la mediana en relación a las dos orillas plasma la información
de asimetría en el 50 % intermedio de los datos.
b) Toda observación inferior a P25 −1,5fs o bien superior a P75 +1,5fs es inusual. Un valor
inusual es extremo o atípico si es inferior a P25 − 3,0fs o bien superior a P75 + 3,0fs ,
y es moderado en cualquier otro caso.
II) Se determinó la cantidad de contaminación de aluminio, en ppm, en determinado plástico,
con una muestra de 26 especímenes, y se obtuvieron los siguientes datos (“The Lognor-
mal Distribution for Modeling Quality Data when the Means Is Near Zero", J. of Quality
Technology, 1990, pp. 105 - 110) Trece un diagrama de caja y comente sus particularidades.
14. Dado el siguiente gráfico correspondiente a la distribución de 40 sectores según el nivel de con-
taminación en el Área Metropolitana Septiembre 2010,responda
6
15. El jefe de servicio donde usted trabaja le pide que dado el siguiente gráfico
a) Obtener e interpretar n2 , f3 , N4 y F3
b) Calcular e interpretar el nivel medio de colesterol de los trabajadores.
c) Calcular e interpretar la moda.
d) Calcular e interpretar la mediana.
16. Una empresa realiza su trabajo diario en tres turnos: A, B y C. Los números de trabajadores
por turno están en relación 7 : 5 : 4, constituyendo un total de 160 trabajadores. Los salarios
promedios diarios, por turno, son: $ 8000, $ 10000, $ 12000, y sus correspondientes desviaciones
estándar, son: $ 1200, $ 900, $ 1000, respectivamente. Si la empresa piensa hacer un aumento
salarial según el siguiente criterio: reajuste de 15 % más un bono de $ 1000, para cada trabajador
del turno A, reajuste del 18 % para cada trabajador del turno B, y sólo un bono de $ 700 para
cada trabajador del turno C.
a) ¿Conseguiría la empresa hacer más homogéneos los sueldos de todos los trabajadores en su
conjunto?. Justifique estadísticamente su respuesta.
b) Si la gerencia establece que la plantilla diaria no debe aumentar más del 12 %, por lo que decide
modificar el bono de los trabajadores del turno A. ¿Cuál es el mayor bono, en cantidades
enteras, que puede otorgar al turno A, además del reajuste, para lograr el objetivo de la
empresa?.
17. Una fábrica produce tres tipos de artículos: ropa, electrodomésticos y juguetes. La producción de
ropa es el doble que la de electrodomésticos y la tercera parte que la de juguetes. El costo medio
de la ropa es de $ 52000 y su desviación estándar es de $ 100.6, el costo medio de los juguetes es
de $ 3500 con una varianza de 19684.09, resultando un costo medio de todos los artículos de $
4000 y un coeficiente de variación total de 50 %. Se requiere aumentar los costos para lograr un
costo medio total de $ 5000 aumentando en un 3 % el costo de la ropa y en un 7 % el costo de
los electrodomésticos.
7
18. Uno de los problemas más desafiantes que enfrenta el campo de control de la contaminación del
agua lo presenta la industria del curtido de pieles. Los desechos de las curtidurías son química-
mente complejos. Se caracterizan por los altos valores de demanda bioquímica de oxígeno, sólidos
volátiles y otras medidas de contaminación. Considérese los siguientes datos experimentales, que
se obtuvieron de 40 muestras de desechos químicamente tratados en un estudio que realizó el
Instituto Politécnico y Universidad Estatal de Virginia. Se registraron las lecturas de X : reduc-
ción porcentual de sólidos totales, e Y : reducción porcentual en la demanda química de oxígeno
para las 40 muestras.
X 170 172 173 174 174 175 176 177 180 180 180 180
Y 0.84 1.31 1.42 1.03 1.07 1.08 1.04 1.80 1.45 1.60 1.61 2.13
X 180 181 181 182 182 182 182 184 184 185 186 188
Y 2.15 0.84 1.43 0.90 1.81 1.94 2.68 1.49 2.52 3.00 1.87 3.08
8
20. En una planta mecánica se analiza la relación entre la velocidad X de un motor (revoluciones
por minuto) y la temperatura Y (en o C) obteniéndose la siguiente información.
X \Y [50 ; 60] (60 ; 70] (70 ; 80] (80 ; 90] (90 ; 100] Total
[600 ; 800] 4 2 0 0 0 6
(800 ; 1000] 3 6 1 0 0 10
(1000 ; 1200] 0 1 5 2 0 8
(1200 ; 1400] 0 0 3 2 1 6
Total 7 9 9 4 1 30
a) Construya una tabla completa y un gráfico adecuado para mostrar la velocidad de los motores
y en la tabla calcule e interprete, N3 , F2 y la mediana.
b) Para la temperatura de los motores determine un intervalo centrado en la media aritmética
y de longitud dos veces la desviación estándar. ¿Qué porcentaje de casos cae dentro de este
intervalo?.
c) El encargado del Departamento de control considera que el 20 % de los motores de más baja
temperatura y el 15 % de los motores de más alta temperatura no cumplen las normas de
calidad. Determine los límites de calidad para tomar tal decisión.
d) El mecánico jefe afirma que la velocidad de los motores es más homogénea cuando la tempe-
ratura está entre 60 o C y 70 o C que cuando la temperatura está entre 70 o C y 80 o C. ¿Qué
opina usted al respecto?. Justifique su respuesta con cifras estadísticas indicadoras.
21. Responda las siguientes situaciones justificando con conceptos estadisticos vistos en clases y
realizando un desarrollo adecuado cuando sea necesario.
a) ¿Qué tipo de gráficos son adecuados para representar la distribución de frecuencias de una
variable cuantitativa discreta?. Nómbrelos.
b) Sea Y − 2X = 3, 2 =3
SX y X = 40. Calcule el valor de Y y SY .
c) Los registros del peso de 10 sacos de mineral, marcan en promedio 200 kg. En la oficina de
control se pierde el registro del peso de un saco y se sabe que el promedio del resto es 190
kg. ¿Cuál es el peso del saco al que le perdieron su registro?.
d) ¿Qué información se puede obtener al calcular la covarianza entre dos variables?.
e) El promedio y la desviación estándar de la longitud de los tornillos producidos en una fábrica
son 5 cm. y 1.5 cm., respectivamente. Si el instrumento con el cual se ha medido la longitud
está descalibrado, registrando sólo el 90 % de la longitud correcta, más 0.5 cm. Obtenga el
coeficiente de variación de la longitud correcta de los tornillos.
f ) Para comparar la variabilidad relativa de la tensión arterial diastólica y el nivel de colesterol
en la sangre de un grupo de trabajadores, ¿Qué medida estadística es la adecuada para
hacer la comparación?.
g) ¿Qué gráficos son adecuados para representar la distribución de frecuencias de una variable
cualitativa ordinal?.
h) ¿Qué tipos de gráficos es adecuado para representar la distribución de frecuencias de una
variable cuantitativa discreta?.
i) El promedio y la desviación estándar de la longitud de los tornillos producidos en una fábrica
son 5 cm. y 1.5 cm., respectivamente. Si el instrumento con el cual se ha medido la longitud
está descalibrado, registrando sólo el 90 % de la longitud correcta, más 0.5 cm. Obtenga el
coeficiente de variación de la longitud correcta de los tornillos.
j) Los registros del peso de 10 sacos de mineral, marcan en promedio 200 kg. En la oficina de
control se pierde el registro del peso de un saco y se sabe que el promedio del resto es 190
kg. ¿Cuál es el peso del saco al que le perdieron su registro?.
9
k) Para comparar la variabilidad relativa de la tensión arterial diastólica y el nivel de colesterol
en la sangre de un grupo de trabajadores, ¿Qué medida estadística es la adecuada para
hacer la comparación?.
l) ¿Cuál es la medida del ángulo del sector circular, en un gráfico sectorial o circular, que repre-
senta a una categoría, cuya frecuencia absoluta es 80, de un total de 400 datos?
m) Para comparar la dispersión relativa del índice de masa corporal y el peso de un grupo de
trabajadores, ¿Qué medida estadística es la adecuada para hacer la comparación?
n) El sueldo promedio de todos los trabajadores de una fábrica es de $580000. Si el sueldo
promedio pagado a hombres y mujeres es de $620000 y $520000 respectivamente. ¿Cuál es
el porcentaje de hombres y mujeres que hay en la fábrica?.
ñ) ¿Qué medida de tendencia central se puede obtener sin importar la naturaleza de la variable?.
10
FORMULARIO
ESTADISTICA DESCRIPTIVA
PROBABILIDAD Y ESTADÍSTICA
n m
1 P 1 P
Media Aritmética x= n xi x= n Ci n i
i=1 i=1
h i
ni −ni−1
Moda Mo Mo = Lim Inf i + (ni −ni−1 )+(ni −ni+1 ) A
h n −N i
i−1
Mediana Me Me = Lim Inf i + 2
ni A
i·n
−Nk−1
Percentiles Pi Pi = Lim Inf k + 100
nk A
n m
1 1
Sx2 = x2i − x2 Sx2 = Ci2 ni − x2
P P
Varianza n n
i=1 i=1
Sx Sx
Coeficiente de Variación C.V = x 100 % C.V = x 100 %
(n + 1) · i (n + 1) · i
Pi = (k + 1) − x(k) + − k x(k+1)
100 100
11
Media Aritmética Total para k-submuestras
k
1X
xT = ni xi
n i=1
k
X ni
= pi xi , donde pi = i = 1, 2, . . . , k.
i=1
n
k k
!2
1X 1X
ST2 = ni (Si2 + xi 2 ) − ni xi
n i=1 n i=1
k k
!2
X X ni
= pi (Si2 2
+ xi ) − pi xi , donde pi = i = 1, 2, . . . , k.
i=1 i=1
n
12