Promeblas Resueltos
Promeblas Resueltos
Promeblas Resueltos
Ciencias de La Tierra
Geoestadìstica
Problemario 1er parcial
Integrantes
Arrona Herrera Alan Josué
Carlos Lorenzo Joan Ernesto
Gonzales Becerra Erik Fernando
Hernández Mendoza José Carlos
Lanestosa Vidal Víctor Manuel
Paniagua Alamilla Nathalia Guadalupe
Ciudad de México, 2018
3. El artículo “Finding Occupational Accident Patterns in the Extractive Industry Using a Systematic Data Mining
Approach” (Reliability Engr. And System Safety, 2012; 108 – 122) se presentaron las siguientes categorías por tipo de
actividad física, cuando ocurrió un accidente industrial:
A. Trabajo con herramientas manuales
B. Movimiento
C. Portar a mano
D. Manipulación de objetos
E. Operación de una Máquina
F. Otros
Construya una distribución de frecuencias, incluyendo frecuencias relativas y un histograma para los datos adjuntos de
100 accidentes (los porcentajes concuerdan con los del artículo citado):
A B D A A F C A C B E B A C F D B C D A A C B E B C E A B A A A B C
C D F D B B A F C B A C B E E D A B C E A A F C B D D D B D C A F A
A B D E A E D B C A F A C D D A A B A F D C A C B F D A E A C D
INTERVALO FRECUENCIA FREC. RELATIVA
A 28 .28
B 19 .19
C 18 .18
D 17 .17
E 9 .9
F 9 .9
+Este histograma presenta poca dispersión. Su valor representativo es la categoría A=(Trabajo por herramientas
manuales).
25
20
Conteo
15
10
0
A B C D E F
ACCIDENTES
5. Los siguientes valores de densidad relativa para
diversos tipos de madera usados en la construcción
aparecieron en el artículo “Bolted Connection
Design Values Based on European Yield Model” (J. of Structural Engr.,1993: 2169 – 2186):
.31 .35 .36 .37 .38 .40 .40 .40 .41 .41 .42 .42 .42 .42 .42
.43 .44 .45 .46 .46 .47 .48 .48 .48 .51 .54 .54 .55 .58 .62
Trace un diagrama de tallo y hojas que use tallos repetidos y haga comentarios sobre las características interesantes
que aprecie.
Tallo: Decimos
1 3 1 Hojas: Centésimos
5 3 5678
8 5 58 Huecos: uno
122.2 124.2 124.3 125.6 126.3 126.5 126.5 127.2 127.3 127.5 127.9
128.6 128.8 129.0 129.2 129.4 129.6 130.2 130.4 130.8 131.3 131.4
131.4 131.5 131.6 131.6 131.8 131.8 132.3 132.4 132.4 132.5 132.5
132.5 132.5 132.6 132.7 132.9 133.0 133.1 133.1 133.1 133.1 133.2
133.2 133.2 133.3 133.3 133.5 133.5 133.5 133.8 133.9 134.0 134.0
134.0 134.0 134.1 134.2 134.3 134.4 134.4 134.6 134.7 134.7 134.7
134.8 134.8 134.8 134.9 134.9 135.2 135.2 135.2 135.3 135.3 135.4
135.5 135.5 135.6 135.6 135.7 135.8 135.8 135.8 135.8 135.8 135.9
135.9 135.9 135.9 136.0 136.0 136.1 136.2 136.2 136.3 136.4 136.4
136.6 136.8 136.9 136.9 137.0 137.1 137.2 137.6 137.6 137.8 137.8
137.8 137.9 137.9 138.2 138.2 138.3 138.3 138.4 138.4 138.4 138.5
138.5 138.6 138.7 138.7 139.0 139.1 139.5 139.6 139.8 139.8 140.0
140.0 140.7 140.7 140.9 140.9 141.2 141.4 141.5 141.6 142.9 143.4
143.5 143.6 143.8 143.8 143.9 144.1 144.5 144.5 147.7 147.7
a. Construya un diagrama de tallo y hojas de los datos eliminando (truncando) primero el dígito de las decenas y
luego repitiendo cada valor del tallo cinco veces (una vez para las hojas 1 y 2, una segunda vez para las hojas 3 y 4,
etc.) ¿Por qué es relativamente fácil identificar un valor de resistencia representativo?
+Es fácil identificar el valor representativo en un diagrama de tallo y hoja ya que será el valor que tenga más hojas
ò será el que tenga una mayor expansión hacia el lado derecho. Este diagrama presenta simetría, su valor
representativo es el 13 y presenta poca dispersión.
12
12 2
12 445
12 6667777
12 889999
13 00011111111
13 2222222222333333333333333
13
44444444444444444455555555555555555555
13 6666666666667777777777
13 888888888888999999
14 0000001111
14 2333333
14 444
14 77
14
b. Construya un histograma usando las clases de igual amplitud con la primera clase con un límite inferior de 122 y
un límite superior de 124. Luego comente acerca de cualquier característica interesante del histograma.
+El histograma sobre la resistencia última a la tensión para el diseño estructural de vehículos aeroespaciales
presenta simetría, poca dispersión, un valor representativo, el cual es el intervalo de resistencia 134-136, así
también, este histograma no presenta valores atípicos.
35
30
25
Frecuencia
20
15
10
0
124 128 132 136 140 144 148
RESISTENCIA
7. En el artículo “Study on the life Distribution of Microdrills” (J. of Engr. Manufacture, 2002: 301- 305) aparecen las
observaciones siguientes, listadas en orden creciente, del tiempo de vida de un taladro (número de agujeros que
maquina un taladro antes de romperse) cuando se hacen agujeros en cierta aleación de latón.
11 14 20 23 31 36 39 44 47 50
59 61 65 67 68 71 74 76 78 79
81 84 85 89 91 93 96 99 101 104
105 105 112 118 123 136 139 141 148 158
161 168 184 206 248 263 289 322 388 513
a. ¿Por qué no se puede basar una distribución
de frecuencias en los intervalos de clase 0 -50, 50 –
100, 100 – 150, etc.?
b. Construya una distribución de frecuencias y un histograma con los datos usando los límites de
clase 0, 50, 100, …, y comente acerca de las características interesantes.
c. Construya una distribución de frecuencias e histograma de logaritmos naturales de las observaciones de tiempo
de vida media y comente acerca de las características interesantes.
d. ¿Qué proporción de las observaciones de tiempo de vida de la muestra son menores que 100? ¿Qué proporción
de las observaciones son por lo menos 200?
b)
15
Frecuencia
10
0
0 50 100 150 200 250 300 350 400 450 500 550
Número de agujeros que maquina un taladro antes de romperse
c)
12
10
Frecuencia
0
2.0 2.4 2.8 3.2 3.6 4.0 4.4 4.8 5.2 5.6 6.0 6.4
Número de agujeros que maquina un taladro antes de romperse
9. Un artículo publicado en Electrical Manufacturing & Coil Winding Conference Proceedings (1995, pág. 829) presenta
los resultados del número de embarques devueltos, según los registros de cierta empresa. La compañía está interesada
en saber por qué fueron regresados los embarques. A continuación se muestran resultados. Construya un diagrama
de Pareto e interprete los datos.
Cancelación 5 000
Otra 15 000
+Se puede observar en el diagrama de Pareto que el valor representativo son los embarques devueltos por el motivo
“rechazados”.
10. Los datos siguientes son mensuales y se obtuvieron durante el período de 1985 a 1989. Cada valor es la radiación solar
promedio en la banda de 385 a 530 nm como porcentaje de la radiación total (“Global Energy in the Different Spectral
Bands at Dhahran, Saudi Arabia”, J. Solar Energy Engr. 1991: 290 294). Comente acerca de las características de los
datos.
20.9 19.6 20.4 20.3 20.8 20.6 20.5 20.4 19.9 19.8
19.5 20.2 16.5 18.3 18.7 19.6 20.0 20.0 19.5 19.6
19.1 18.8 18.3 17.6 17.2 17.8 18.7 19.0 19.0 18.6
18.8 19.0 18.5 18.3 17.5 16.9 17.0 17.8 18.1 18.8
18.9 18.9 19.1 18.8 18.4 17.8 17.0 16.8 17.9 18.4
19.0 19.4 19.7 19.5 19.5 19.5 19.0 18.7 18.1 17.9
c. Construya una gráfica de series de tiempo y comente sobre observaciones que no se percibieron en el diagrama del
inciso (a).
20
19
CONTEO
18
17
16
1 6 12 18 24 30 36 42 48 54 60
RADIACIÒN SOLAR
+Se puede observar que las radiaciones solares mensuales siempre variaron, ninguna mantuvo una radiación constante
durante mínimo dos meses.
11.La concentración de sólidos en agua de río es una característica ambiental importante. Un artículo científico reportó
sobre la concentración (en partes por millón, o ppm) en varios ríos diferentes. Supongamos que se obtuvieron las
siguientes 50 observaciones para un río en particular:
55.8 60.9 37.0 91.3 65.8 42.3 33.8 60.6 76.0 69.0
45.9 39.1 35.5 56.0 44.6 71.7 61.2 61.5 47.2 74.5
83.2 40.0 31.7 36.7 62.3 47.3 94.6
56.3 30.0 68.2
75.3 71.4 65.2 52.6 58.2 48.0 61.8 78.8 39.8 65.0
60.7 77.1 59.1 49.5 69.3 69.8 64.9 27.1 87.1 66.3
1 2 7
4 3 013
9 3 56799
12 4 024
17 4 57789
18 5 2
23 5 56689
(8) 6 00011124
19 6 55568999
11 7 114
8 7 5678
4 8 3
3 8 7
2 9 14
b. ¿Por qué una distribución de frecuencias no puede basarse en los intervalos de clase 0 – 10, 10 – 20, 20- 30,…, 90 –
100?
Porque no se puede incluir el 10 en dos intervalos, ni tampoco el 20 en dos intervalos y así sucesivamente
c. Construya una distribución de frecuencias con intervalos de clase 20 - <30, 30 - <40,…, 90 - < 100.
Intervalos Frecuencia Frecuencia Relativa Frecuencia Relativa
Acumulada
20 ≤ x < 30 1 0.02 0.02
30 ≤ x < 40 8 0.16 0.18
40 ≤ x < 50 8 0.16 0.34
50 ≤ x < 60 6 0.12 0.46
60 ≤ x < 70 16 0.32 0.78
70 ≤ x < 80 7 0.14 0.92
80 ≤ x < 90 2 0.04 0.96
90 ≤ x < 100 2 0.04 1
50 1
16
14
12
Frecuencia
10
0
20 30 40 50 60 70 80 90 100
Concentración ppm En Varios Ríos
d. ¿Qué proporción de las observaciones de concentración fue menor de 50?, y ¿por lo menos 60?
Solo 17 de las muestras fueron menores al 50 ppm de concentración y en 60 ppm de concentración fueron 23 muestras.
g. La media muestral, para los datos de concentración dados y compare estas mediciones.
𝑥̅ = 58.54
12. Se obtuvieron quince muestras de aire de determinada región y se determinó la concentración de monóxido de
carbono en cada una. Los resultados, en ppm fueron los siguientes:
9.3 10.7 8.5 9.6 12.2 15.6 9.2 10.5 9.0 13.2 11.0 8.8 13.7 12.1 9.8
9.3+10.7+8.5+9.6+12.2+15.6+9.2+10.5+9.0+13.2+11.0+8.8+13.7+12.1+9.8
Tallo: Enteros
Hojas: Decimos
2 8 58
7 9 02368
(2) 10 57
6 11 0
5 12 12
3 13 27
1 14
1 15 6
b. Comente sus observaciones sobre los dados
(simetría, dispersión, valores representativos y atípicos, etc.)
Valor representativo: 9
Dispersión: Poca
Huecos: uno
4
Frecuencia
0
8 9 10 11 12 13 14 15 16
Muestras De Aire
9.3 + 10.7 + 8.5 + 9.6 + 12.2 + 15.6 + 9.2 + 10.5 + 9.0 + 13.2 + 11.0 + 8.8 + 13.7 + 12.1 + 9.8
𝑥̅ =
15
𝑥̅ = 10.88
𝑠 = 2.0655
h. s2 usando el método breve
𝑠 2 = (2.0655)2 = 4.2662
U: 6.0 5.0 11.0 33.0 4.0 5.0 80.0 18.0 35.0 17.0 23.0
F: 4.0 14.0 11.0 9.0 9.0 8.0 4.0 20.0 5.0 8.9 21.0 9.2 3.0 2.0 0.3
14. Los datos siguientes corresponden a las temperaturas (°F) de los anillos sellos (O-rings) para cada encendido de prueba
o lanzamiento real del motor del transbordador espacial (Presidential Commission on the Space Shuttle Challenger
Accident, vol.1, pp. 129 – 131):
84 49 61 40 83 67 45 66 70 69 80 58 68 60 67 72 73 70
57 63 70 78 52 67 53 67 75 61 70 81 76 79 75 76 58 31
35 42 49 56 63 70 77 84
TEMPERATURA
+Se puede percibir un sesgo negativo, probables valores atípicos y mucha dispersión.
𝑥̅ = 65.861
𝑠 = 12.158
+El promedio de temperatura para los anillos en ºF es de 65.861 y la dispersión en este conjunto de datos es de 12.158.
c. Omita la observación más pequeña y la mayor y calcule de nuevo las cantidades del inciso (b). Comente los resultados
y compárelos con los del inciso (b). Calcule ¿qué porcentaje se recortó?
𝑥̅ = 66.352
𝑠 = 10.476
+Al omitir la observación más pequeña y la más grande, la media incremento .491 y la desviación estándar muestral
disminuyo 1.682.
15. Se determinó el valor del módulo de elasticidad, en GPa de placas coladas, formadas por varios sustratos
intermetálicos y se obtuvieron las siguientes observaciones muestrales (“Strength and Modulus of a Molybdenum-
Coated Ti-25 Al-10 Nb-3 U-1Mo Intermetallic”, Journal of Material Engineering and Performance, 1997, pp. 46-50):
b. Use las desviaciones que calculó en el inciso a para obtener la varianza y la desviación estándar muestrales.
. 822 +. 322 + (−.982 ) + (−.382 ) +. 222
𝑠2 = = .482
5−1
𝑠 = √. 482 = .694
c. Calcule s 2 con el método breve
𝑠 2 =. 6942 = .4816
d. Reste 100 de cada observación para obtener una muestra de valores transformados. Ahora calcule la varianza
muestral de esos valores trasformados y compárela con s2 para datos originales.
16.4 15.9 14.6 15.2 15.8
16.4 + 15.9 + 14.6 + 15.2 + 15.8
𝑥̅ = = 15.58
5
(16.4 − 15.58)2 + (15.9 − 15.58)2 + (14.6 − 15.58)2 + (15.2 − 15.58)2 + (15.8 − 15.58)2
𝑠2 = = .482
5−1
+La varianza muestral es la misma en los valores transformados y en los datos originales.
17. El artículo “Oxygen Consumption During Fire Suppresión: Error of Heart Rate Estimation” (Ergonomics, 1991)
presentó los datos siguientes sobre el consumo de oxígeno en ml/ kg/min, para una muestra de 10 bomberos que hicieron
una simulación de combate de incendio:
29.5 49.3 30.6 28.2 28.0 26.3 33.9 29.4 23.5 31.6
30 35 40 45 50
CONSUMO DE OXÌGENO
c. ¿Cuánto debe valer una observación para considerarse como inusual? ¿Cómo valor extremo?
𝑋𝑚𝑎𝑥 = 31.6 + (3𝑥3.6) = 42.4
𝑋𝑚𝑖𝑛 =28-(3x3.6)= 17.2
d. ¿Cuánto podría disminuir la observación más grande sin que afecte a fs?
+Podría disminuir 6.9
18. Se determinó la cantidad de contaminación de
aluminio, en ppm, en determinado plástico, con
una muestra de 26 especímenes y se obtuvieron los
siguientes datos (“The Lognormal Distribution for Modeling Quality Data when the Means Is Near
Zero”, J. of Quality Technology, 1990, pp. 105 – 110):
30 30 60 63 70 79 87 90 101
Trace un diagrama de caja que muestre los valores atípicos y comente sus particularidades.
+El diagrama presenta un sesgo positivo, mucha dispersión y también presenta un valor atìpico, en este caso se puede
visualizar como un valor atípico extremo.
20. La corrosión por fricción es un proceso de desgaste que resulta de los movimientos oscilatorios tangenciales de
pequeña amplitud en las piezas de una máquina. El artículo “Grease Effect on Fretting Wear of Mild Steel”
(Industrial Lubrication and Tribology, 2008: 67 – 78) incluye los siguientes datos sobre el desgaste de volumen
(10-4mm3) para los aceites base que tienen cuatro diferentes viscosidades.
Viscosidad Desgaste
20.4 55.8 30.8 27.3 29.9 17.7 76.5
30.2 44.5 47.2 48.7 41.6 32.8 18.3
89.4 73.3 57.1 66.0 93.8 133.2 81.1
252.6 30.6 24.2 16.6 38.9 28.7 23.6
a. El coeficiente de variación muestral (100𝑠/𝑥̅ ) evalúa el grado de variabilidad con respecto a la media
(específicamente, la desviación estándar como porcentaje de la media). Calcule el coeficiente de variación para la
muestra en cada viscosidad. Después, compare los resultados y coméntelos.
Viscosidad 1.- 55.53%
Viscosidad 2.- 29.68%
Viscosidad 3.- 32.29%
Viscosidad 4.- 27.85%
+La viscosidad uno tiene una mayor variación con respecto a su media ya que es la menor viscosidad
de las estudiadas en este ejercicio.
Gráfica
b. Construya una gráfica de de
cajacaja de Relacion
comparativa Viscosidad-Desgaste
de los datos y comente las características interesantes.
140
120
100
80
Desgaste
60
40
20
0
20.4 30.2 89.4 252.6
Viscosidad
+ Se puede observar que las primeras tres viscosidades presentan una dispersión grande en comparación con la viscosidad
4 que más bien presenta simetría, las 4 viscosidades no presentan valores atípicos y la viscosidad 1 y 3 presentan un sesgo
positivo, mientras que la viscosidad 2 presenta un sesgo negativo.
19. Se determinó la cantidad de contaminación de aluminio, en ppm, en determinado plástico, con una muestra de 26
especímenes y se obtuvieron los siguientes datos (“The Lognormal Distribution for Modeling Quality Data when the
Means Is Near Zero”, J. of Quality Technology, 1990, pp. 105 – 110):
30 30 60 63 70 79 87 90 101
Trace un diagrama de caja que muestre los valores atípicos y comente sus particularidades.
Gráfica de caja de cantidad de contaminaciòn
+El diagrama presenta un sesgo positivo, mucha dispersión y también presenta un valor atìpico, en este caso se puede
visualizar como un valor atípico extremo.
21. La corrosión por fricción es un proceso de desgaste que resulta de los movimientos oscilatorios tangenciales de
pequeña amplitud en las piezas de una máquina. El artículo “Grease Effect on Fretting Wear of Mild Steel”
(Industrial Lubrication and Tribology, 2008: 67 – 78) incluye los siguientes datos sobre el desgaste de volumen
(10-4mm3) para los aceites base que tienen cuatro diferentes viscosidades.
Viscosidad Desgaste
20.4 55.8 30.8 27.3 29.9 17.7 76.5
30.2 44.5 47.2 48.7 41.6 32.8 18.3
89.4 73.3 57.1 66.0 93.8 133.2 81.1
252.6 30.6 24.2 16.6 38.9 28.7 23.6
c. El coeficiente de variación muestral (100𝑠/𝑥̅ ) evalúa el grado de variabilidad con respecto a la media
(específicamente, la desviación estándar como porcentaje de la media). Calcule el coeficiente de variación para la
muestra en cada viscosidad. Después, compare los resultados y coméntelos.
Viscosidad 1.- 55.53%
Viscosidad 2.- 29.68%
Viscosidad 3.- 32.29%
Viscosidad 4.- 27.85%
+La viscosidad uno tiene una mayor variación con respecto a su media ya que es la menor viscosidad de las
estudiadas en este ejercicio.
d. Construya una gráfica de caja comparativa de los datos y comente las características interesantes.
Gráfica de caja de Relacion Viscosidad-Desgaste
140
120
100
80
Desgaste
60
40
20
0
20.4 30.2 89.4 252.6
Viscosidad
+ Se puede observar que las primeras tres viscosidades presentan una dispersión grande en comparación con la viscosidad
4 que más bien presenta simetría, las 4 viscosidades no presentan valores atípicos y la viscosidad 1 y 3 presentan un sesgo
positivo, mientras que la viscosidad 2 presenta un sesgo negativo.
21. Los siguientes datos sobre el contenido de alcohol destilado (%) para una muestra de 35 vinos de Oporto fueron
extraídos del artículo “A Method for the Estimation of Alcohol in Fortified Wines Using Hydrometer Baumé and
Refractometer Brix” (Amer. J. Enol. Vitic., 2006; 486 – 490). Cada valor es un promedio de dos medidas por duplicado.
16.35 18.85 16.20 17.75 19.58 17.73 22.75 23.78 23.25 19.08 19.62 19.20
20.05 17.85 19.17 19.48 20.00 19.97 17.48 17.15 19.07 19.90 18.68 18.82
19.03 19.45 19.37 19.20 18.00 19.60 19.33 21.22 19.50 15.30 22.25
Utilice los métodos estudiados incluyendo un diagrama de caja que muestre los valores atípicos para describir
y resumir los datos.
15 3
16 23
17 14778
18 0688
19 0001223344556699
20 00
21 2
22 27
23 27
12
10
Frecuencia
8
6
15.6 16.8 18.0 19.2 20.4 21.6 22.8 24.0
ALCOHOL DESTILADO (%) 4
0
15.0 16.5 18.0 19.5 21.0 22.5 24.0
ALCOHOL DESTILADO (%)
15 16 17 18 19 20 21 22 23 24
ALCOHOL DESTILADO (%)
+ Los valores atípicos se pueden observar claramente en la gráfica de puntos y el diagrama de caja, aunque en este caso,
el diagrama muestra a detalle que los valores atípicos existentes solo son dos, en cambio en los otros diagramas se puede
especular que se podría tener más valores atípicos o que no tenga ningún valor atípico.