Promeblas Resueltos

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 23

Escuela Superior de Ingeniería y Arquitectura, Unidad Ticomàn

Ciencias de La Tierra

Geoestadìstica
Problemario 1er parcial

Mtra. Rosa Ma. Aguilar Rivera

Integrantes
Arrona Herrera Alan Josué
Carlos Lorenzo Joan Ernesto
Gonzales Becerra Erik Fernando
Hernández Mendoza José Carlos
Lanestosa Vidal Víctor Manuel
Paniagua Alamilla Nathalia Guadalupe
Ciudad de México, 2018

3. El artículo “Finding Occupational Accident Patterns in the Extractive Industry Using a Systematic Data Mining
Approach” (Reliability Engr. And System Safety, 2012; 108 – 122) se presentaron las siguientes categorías por tipo de
actividad física, cuando ocurrió un accidente industrial:
A. Trabajo con herramientas manuales
B. Movimiento
C. Portar a mano
D. Manipulación de objetos
E. Operación de una Máquina
F. Otros
Construya una distribución de frecuencias, incluyendo frecuencias relativas y un histograma para los datos adjuntos de
100 accidentes (los porcentajes concuerdan con los del artículo citado):

A B D A A F C A C B E B A C F D B C D A A C B E B C E A B A A A B C
C D F D B B A F C B A C B E E D A B C E A A F C B D D D B D C A F A
A B D E A E D B C A F A C D D A A B A F D C A C B F D A E A C D
INTERVALO FRECUENCIA FREC. RELATIVA
A 28 .28
B 19 .19
C 18 .18
D 17 .17
E 9 .9
F 9 .9

+Este histograma presenta poca dispersión. Su valor representativo es la categoría A=(Trabajo por herramientas
manuales).

HISTOGRAMA DE ACCIDENTES INDUSTRIALES


30

25

20
Conteo

15

10

0
A B C D E F
ACCIDENTES
5. Los siguientes valores de densidad relativa para
diversos tipos de madera usados en la construcción
aparecieron en el artículo “Bolted Connection
Design Values Based on European Yield Model” (J. of Structural Engr.,1993: 2169 – 2186):

.31 .35 .36 .37 .38 .40 .40 .40 .41 .41 .42 .42 .42 .42 .42

.43 .44 .45 .46 .46 .47 .48 .48 .48 .51 .54 .54 .55 .58 .62

.66 .66 .67 .68 .75

Trace un diagrama de tallo y hojas que use tallos repetidos y haga comentarios sobre las características interesantes
que aprecie.

Resultados para: Diversos Tipos De Madrea

Diseño de tallo y hoja: Valores Densidad Relativa

Tallo y hoja de Valores Densidad Relativa N = 35


Unidad de hoja = 0.010

Tallo: Decimos

1 3 1 Hojas: Centésimos
5 3 5678

17 4 000112222234 Valor representativo: 0.4

(7) 4 5667888 Simetría: Sesgo positivo

11 5 144 Dispersión: Poca

8 5 58 Huecos: uno

6 6 2 Valores atípicos: 0.75


5 6 6678
1 7
1 7 5
6. Las propiedades mecánicas permisibles para
diseño estructural de vehículos aeroespaciales
metálicos, requiere un método aprobado para
analizar estadísticamente los datos de prueba empíricos. En el artículo “Establishing Mechanical
Property Allowables for Metals” (J. of Testing and Evaluation, 1998: 293 – 299), se emplearon los datos adjuntos de
resistencia última a la tensión (ksi) como base para superar dificultades en el desarrollo del método.

122.2 124.2 124.3 125.6 126.3 126.5 126.5 127.2 127.3 127.5 127.9

128.6 128.8 129.0 129.2 129.4 129.6 130.2 130.4 130.8 131.3 131.4

131.4 131.5 131.6 131.6 131.8 131.8 132.3 132.4 132.4 132.5 132.5

132.5 132.5 132.6 132.7 132.9 133.0 133.1 133.1 133.1 133.1 133.2

133.2 133.2 133.3 133.3 133.5 133.5 133.5 133.8 133.9 134.0 134.0

134.0 134.0 134.1 134.2 134.3 134.4 134.4 134.6 134.7 134.7 134.7

134.8 134.8 134.8 134.9 134.9 135.2 135.2 135.2 135.3 135.3 135.4

135.5 135.5 135.6 135.6 135.7 135.8 135.8 135.8 135.8 135.8 135.9

135.9 135.9 135.9 136.0 136.0 136.1 136.2 136.2 136.3 136.4 136.4

136.6 136.8 136.9 136.9 137.0 137.1 137.2 137.6 137.6 137.8 137.8

137.8 137.9 137.9 138.2 138.2 138.3 138.3 138.4 138.4 138.4 138.5

138.5 138.6 138.7 138.7 139.0 139.1 139.5 139.6 139.8 139.8 140.0

140.0 140.7 140.7 140.9 140.9 141.2 141.4 141.5 141.6 142.9 143.4

143.5 143.6 143.8 143.8 143.9 144.1 144.5 144.5 147.7 147.7

a. Construya un diagrama de tallo y hojas de los datos eliminando (truncando) primero el dígito de las decenas y
luego repitiendo cada valor del tallo cinco veces (una vez para las hojas 1 y 2, una segunda vez para las hojas 3 y 4,
etc.) ¿Por qué es relativamente fácil identificar un valor de resistencia representativo?
+Es fácil identificar el valor representativo en un diagrama de tallo y hoja ya que será el valor que tenga más hojas
ò será el que tenga una mayor expansión hacia el lado derecho. Este diagrama presenta simetría, su valor
representativo es el 13 y presenta poca dispersión.

Diseño de tallo y hoja: Resistencia última a la tensión


Tallo y hoja de resistencia N = 153
Unidad de hoja = 1.0

12

12 2

12 445

12 6667777

12 889999

13 00011111111
13 2222222222333333333333333

13
44444444444444444455555555555555555555

13 6666666666667777777777

13 888888888888999999

14 0000001111

14 2333333

14 444

14 77

14

b. Construya un histograma usando las clases de igual amplitud con la primera clase con un límite inferior de 122 y
un límite superior de 124. Luego comente acerca de cualquier característica interesante del histograma.
+El histograma sobre la resistencia última a la tensión para el diseño estructural de vehículos aeroespaciales
presenta simetría, poca dispersión, un valor representativo, el cual es el intervalo de resistencia 134-136, así
también, este histograma no presenta valores atípicos.

RESISTENCIA ÙLTIMA A LA TENSIÒN


40

35

30

25
Frecuencia

20

15

10

0
124 128 132 136 140 144 148
RESISTENCIA

7. En el artículo “Study on the life Distribution of Microdrills” (J. of Engr. Manufacture, 2002: 301- 305) aparecen las
observaciones siguientes, listadas en orden creciente, del tiempo de vida de un taladro (número de agujeros que
maquina un taladro antes de romperse) cuando se hacen agujeros en cierta aleación de latón.

11 14 20 23 31 36 39 44 47 50

59 61 65 67 68 71 74 76 78 79

81 84 85 89 91 93 96 99 101 104

105 105 112 118 123 136 139 141 148 158

161 168 184 206 248 263 289 322 388 513
a. ¿Por qué no se puede basar una distribución
de frecuencias en los intervalos de clase 0 -50, 50 –
100, 100 – 150, etc.?
b. Construya una distribución de frecuencias y un histograma con los datos usando los límites de
clase 0, 50, 100, …, y comente acerca de las características interesantes.
c. Construya una distribución de frecuencias e histograma de logaritmos naturales de las observaciones de tiempo
de vida media y comente acerca de las características interesantes.
d. ¿Qué proporción de las observaciones de tiempo de vida de la muestra son menores que 100? ¿Qué proporción
de las observaciones son por lo menos 200?

a) Porque no se puede incluir el 50 en dos intervalos, ni tampoco el 100 en dos intervalos

b)

Intervalos Frecuencia Frecuencia Relativa Frecuencia Relativa


Acumulada
0 ≤ x < 50 9 0.18 0.18
50 ≤ x < 100 19 0.38 0.56
100 ≤ x < 150 11 0.22 0.78
150 ≤ x < 200 4 0.08 0.86
200 ≤ x < 250 2 0.04 0.90
250 ≤ x < 300 2 0.04 0.94
300 ≤ x < 350 1 0.02 0.96
350 ≤ x < 400 1 0.02 0.98
400 ≤ x < 450 0 0 0.98
450 ≤ x < 500 0 0 0.98
500 ≤ x < 550 1 0.02 1.00
50 1
Histograma De Tiempo De Vida De Un Taladro
20

15
Frecuencia

10

0
0 50 100 150 200 250 300 350 400 450 500 550
Número de agujeros que maquina un taladro antes de romperse

c)

Intervalos Frecuencia Frecuencia Relativa Frecuencia Relativa


Acumulada
2.0 ≤ x < 2.4 1 0.18 0.18
2.4 ≤ x < 2.8 1 0.38 0.56
2.8 ≤ x < 3.2 2 0.22 0.78
3.2 ≤ x < 3.6 2 0.08 0.86
3.6 ≤ x < 4.0 4 0.04 0.90
4.0 ≤ x < 4.4 11 0.04 0.94
4.4 ≤ x < 4.8 13 0.02 0.96
4.8 ≤ x < 5.2 8 0.02 0.98
5.2 ≤ x < 5.6 4 0 0.98
5.6 ≤ x < 6.0 3 0 0.98
6.0 ≤ x < 6.4 1 0.02 1.00
50 1
Histograma De Tiempo De Vida De Un Taladro
14

12

10
Frecuencia

0
2.0 2.4 2.8 3.2 3.6 4.0 4.4 4.8 5.2 5.6 6.0 6.4
Número de agujeros que maquina un taladro antes de romperse

9. Un artículo publicado en Electrical Manufacturing & Coil Winding Conference Proceedings (1995, pág. 829) presenta
los resultados del número de embarques devueltos, según los registros de cierta empresa. La compañía está interesada
en saber por qué fueron regresados los embarques. A continuación se muestran resultados. Construya un diagrama
de Pareto e interprete los datos.

Causa Número de clientes

Rechazados 195 000

Selección equivocada 50 000

Respuesta equivocada 68 000

Cancelación 5 000

Otra 15 000

TIPO FRECUENCIA FREC. RELATIVA FREC. RELATIVA ACUMULADA


Rechazados 195000 .585 .585
Respuesta 68000 .204 .789
equivocada
Selección 50000 .150 .939
equivocada
Otra 15000 .045 .984
Cancelación 5000 .015 .999

+Se puede observar en el diagrama de Pareto que el valor representativo son los embarques devueltos por el motivo
“rechazados”.

10. Los datos siguientes son mensuales y se obtuvieron durante el período de 1985 a 1989. Cada valor es la radiación solar
promedio en la banda de 385 a 530 nm como porcentaje de la radiación total (“Global Energy in the Different Spectral
Bands at Dhahran, Saudi Arabia”, J. Solar Energy Engr. 1991: 290 294). Comente acerca de las características de los
datos.

20.9 19.6 20.4 20.3 20.8 20.6 20.5 20.4 19.9 19.8

19.5 20.2 16.5 18.3 18.7 19.6 20.0 20.0 19.5 19.6

19.1 18.8 18.3 17.6 17.2 17.8 18.7 19.0 19.0 18.6

18.8 19.0 18.5 18.3 17.5 16.9 17.0 17.8 18.1 18.8

18.9 18.9 19.1 18.8 18.4 17.8 17.0 16.8 17.9 18.4

19.0 19.4 19.7 19.5 19.5 19.5 19.0 18.7 18.1 17.9

a. Construya un diagrama de puntos y dígitos para la serie de tiempo adjunta.


Gráfica de puntos de radiaciòn solar promedio

16.8 17.4 18.0 18.6 19.2 19.8 20.4 21.0


RADIACIÒN SOLAR PROMEDIO

b. Comente acerca de las características importantes que observa.

+Presenta mucha dispersión, su valor representativo es el 19 y es asimétrico.

c. Construya una gráfica de series de tiempo y comente sobre observaciones que no se percibieron en el diagrama del
inciso (a).

Gráfica de series de tiempo de radiaciòn solar


21

20

19
CONTEO

18

17

16
1 6 12 18 24 30 36 42 48 54 60
RADIACIÒN SOLAR

+Se puede observar que las radiaciones solares mensuales siempre variaron, ninguna mantuvo una radiación constante
durante mínimo dos meses.

11.La concentración de sólidos en agua de río es una característica ambiental importante. Un artículo científico reportó
sobre la concentración (en partes por millón, o ppm) en varios ríos diferentes. Supongamos que se obtuvieron las
siguientes 50 observaciones para un río en particular:

55.8 60.9 37.0 91.3 65.8 42.3 33.8 60.6 76.0 69.0

45.9 39.1 35.5 56.0 44.6 71.7 61.2 61.5 47.2 74.5
83.2 40.0 31.7 36.7 62.3 47.3 94.6
56.3 30.0 68.2

75.3 71.4 65.2 52.6 58.2 48.0 61.8 78.8 39.8 65.0

60.7 77.1 59.1 49.5 69.3 69.8 64.9 27.1 87.1 66.3

a. Construya un diagrama de tallo y hoja

Resultados para: Solidos En Agua De Río

Diseño de tallo y hoja: Concentración ppm En Varios Ríos

Tallo y hoja de Concentración En Varios Ríos N = 50

Unidad de hoja = 1.0

1 2 7

4 3 013

9 3 56799

12 4 024

17 4 57789

18 5 2

23 5 56689

(8) 6 00011124

19 6 55568999

11 7 114

8 7 5678

4 8 3

3 8 7

2 9 14

b. ¿Por qué una distribución de frecuencias no puede basarse en los intervalos de clase 0 – 10, 10 – 20, 20- 30,…, 90 –
100?

Porque no se puede incluir el 10 en dos intervalos, ni tampoco el 20 en dos intervalos y así sucesivamente

c. Construya una distribución de frecuencias con intervalos de clase 20 - <30, 30 - <40,…, 90 - < 100.
Intervalos Frecuencia Frecuencia Relativa Frecuencia Relativa
Acumulada
20 ≤ x < 30 1 0.02 0.02
30 ≤ x < 40 8 0.16 0.18
40 ≤ x < 50 8 0.16 0.34
50 ≤ x < 60 6 0.12 0.46
60 ≤ x < 70 16 0.32 0.78
70 ≤ x < 80 7 0.14 0.92
80 ≤ x < 90 2 0.04 0.96
90 ≤ x < 100 2 0.04 1
50 1

Solidos En Agua De Río


18

16

14

12
Frecuencia

10

0
20 30 40 50 60 70 80 90 100
Concentración ppm En Varios Ríos

d. ¿Qué proporción de las observaciones de concentración fue menor de 50?, y ¿por lo menos 60?
Solo 17 de las muestras fueron menores al 50 ppm de concentración y en 60 ppm de concentración fueron 23 muestras.

e. Calcule la mediana muestral.


60.7 + 60.9
µ̅ =
2
µ̅ =60.80

f. La media recortada al 25% y al 10%


𝑥̅ 25% = 58.42
𝑥̅ 10% = 58.35

g. La media muestral, para los datos de concentración dados y compare estas mediciones.

𝑥̅ = 58.54

12. Se obtuvieron quince muestras de aire de determinada región y se determinó la concentración de monóxido de
carbono en cada una. Los resultados, en ppm fueron los siguientes:

9.3 10.7 8.5 9.6 12.2 15.6 9.2 10.5 9.0 13.2 11.0 8.8 13.7 12.1 9.8

9.3+10.7+8.5+9.6+12.2+15.6+9.2+10.5+9.0+13.2+11.0+8.8+13.7+12.1+9.8

a. Construya un diagrama de tallo y hojas con los datos.


Resultados para: La Concentración De monóxido De Carbono

Diseño de tallo y hoja: Muestras De Aire

Tallo y hoja de Muestra De Aire N = 15

Unidad de hoja = 0.10

Tallo: Enteros

Hojas: Decimos

2 8 58

7 9 02368

(2) 10 57

6 11 0

5 12 12

3 13 27

1 14

1 15 6
b. Comente sus observaciones sobre los dados
(simetría, dispersión, valores representativos y atípicos, etc.)

Valor representativo: 9

Simetría: Sesgo positivo

Dispersión: Poca

Huecos: uno

Valores atípicos: No tiene

c. Trace un histograma con la frecuencia relativa en el eje vertical

Histograma De La Concentración De monóxido De Carbono

4
Frecuencia

0
8 9 10 11 12 13 14 15 16
Muestras De Aire

d. ¿Cómo describiría la forma del histograma?


No es simétrica y tiene sesgo positivo

e. Halle el intervalo de la muestra


8 ≤ x < 10, 10 ≤ x < 12, 12 ≤ x < 14 , 14 ≤ x < 16
f. La varianza muestral s2 de la definición (es
decir calcular primeramente las desviaciones con
respecto a la media y luego elevarlas al cuadrado, etc.)

9.3 + 10.7 + 8.5 + 9.6 + 12.2 + 15.6 + 9.2 + 10.5 + 9.0 + 13.2 + 11.0 + 8.8 + 13.7 + 12.1 + 9.8
𝑥̅ =
15
𝑥̅ = 10.88

𝐷1 = 9.3 − 10.88 = −1.58


𝐷2 = 10.7 − 10.88 = −0.18
𝐷3 = 9.6 − 10.88 = −1.28
𝐷4 = 12.2 − 10.88 = 1.32
𝐷5 = 15.6 − 10.88 = 4.72
𝐷6 = 9.2 − 10.88 = −1.68
𝐷7 = 10.5 − 10.88 = −0.38
𝐷8 = 9.0 − 10.88 = −1.88
𝐷9 = 13.2 − 10.88 = 2.32
𝐷10 = 11.0 − 10.88 = −0.88
𝐷11 = 8.5 − 10.88 = −2.36
𝐷12 = 8.8 − 10.88 = −0.28
𝐷13 = 13.7 − 10.88 = −2.82
𝐷14 = 12.1 − 10.88 = 1.22
𝐷15 = 9.8 − 10.88 = −1.08

𝐷12 + 𝐷22 + ⋯ + 𝐷152


𝑠2 = = 4.2662
15 − 1

g. La desviación estándar muestral

𝑠 = 2.0655
h. s2 usando el método breve

𝑠 2 = (2.0655)2 = 4.2662

13. La exposición a productos microbianos, especialmente endotoxina, puede tener un impacto en la


vulnerabilidad respecto a enfermedades alérgicas. El artículo “Dust Sampling Methods for Endotoxin-An
Essential, But Underestimated Issue” (Indoor Air, 2006; 20 – 27) consideró temas asociados con la
determinación de la concentración de endotoxina. Los siguientes datos sobre concentración (EU/mg) en polvo
asentada en una muestra de hogares urbanos y otra de casas campestres fueron proporcionados por los autores
del artículo citado:

U: 6.0 5.0 11.0 33.0 4.0 5.0 80.0 18.0 35.0 17.0 23.0

F: 4.0 14.0 11.0 9.0 9.0 8.0 4.0 20.0 5.0 8.9 21.0 9.2 3.0 2.0 0.3

a. Determine la media muestral de cada muestra. ¿Cómo se comparan?


𝑥𝑢
̅̅̅=21.54 𝑥̅𝐹 =8.56
+Se puede observar que en las casas urbanas existe una media más elevada de la concentración de
endotoxina a pesar de ser menos casas que en la otra muestra.
b. Determine la mediana muestral de cada muestra. ¿Cómo se comparan? ¿Por qué la mediana de la muestra
urbana es tan diferente de la media de dicha muestra?
𝑥̃ ̃
𝑈 = 17 ; 𝑋𝐹 = 8.9
+La mediana urbana es diferente a su media ya que la media muestral es un promedio respecto a todos los
datos y la mediana es el dato que está en medio de estos datos cuando están en forma ordenada.
c. Calcule la media recortada de cada muestra eliminando la observación más pequeña y la más grande.
¿Cuáles son los porcentajes de recorte correspondientes? ¿cómo se comparan los valores de estas medias
recortadas con las medias y medianas correspondientes?
̅
𝑋𝑟𝑒𝑐𝑈 = 17 ; 𝐶𝑜𝑛 𝑒𝑙 18% 𝑑𝑒 𝑟𝑒𝑐𝑜𝑟𝑡𝑒
𝑋̅𝑟𝑒𝑐𝐹 = 8.23 ; 𝐶𝑜𝑛 𝑒𝑙 13.33% 𝑑𝑒 𝑟𝑒𝑐𝑜𝑟𝑡𝑒
+Estas medias recortadas se podrían tomar como una media optima ya que eliminamos los valores que
podrían ser valores atípicos que nos cambiarían drásticamente la media, y la mediana sigue siendo la misma
ya que se eliminan la misma cantidad de valores de cada extremo.

14. Los datos siguientes corresponden a las temperaturas (°F) de los anillos sellos (O-rings) para cada encendido de prueba
o lanzamiento real del motor del transbordador espacial (Presidential Commission on the Space Shuttle Challenger
Accident, vol.1, pp. 129 – 131):

84 49 61 40 83 67 45 66 70 69 80 58 68 60 67 72 73 70

57 63 70 78 52 67 53 67 75 61 70 81 76 79 75 76 58 31

a. Construya un diagrama de puntos de los datos de la temperatura.


Gráfica de puntos de C2

35 42 49 56 63 70 77 84
TEMPERATURA

+Se puede percibir un sesgo negativo, probables valores atípicos y mucha dispersión.

b. Calcule e interprete los valores de la media y la desviación estándar muestrales.

𝑥̅ = 65.861
𝑠 = 12.158
+El promedio de temperatura para los anillos en ºF es de 65.861 y la dispersión en este conjunto de datos es de 12.158.

c. Omita la observación más pequeña y la mayor y calcule de nuevo las cantidades del inciso (b). Comente los resultados
y compárelos con los del inciso (b). Calcule ¿qué porcentaje se recortó?
𝑥̅ = 66.352
𝑠 = 10.476
+Al omitir la observación más pequeña y la más grande, la media incremento .491 y la desviación estándar muestral
disminuyo 1.682.

15. Se determinó el valor del módulo de elasticidad, en GPa de placas coladas, formadas por varios sustratos
intermetálicos y se obtuvieron las siguientes observaciones muestrales (“Strength and Modulus of a Molybdenum-
Coated Ti-25 Al-10 Nb-3 U-1Mo Intermetallic”, Journal of Material Engineering and Performance, 1997, pp. 46-50):

116.4 115.9 114.6 115.2 115.8

a. Calcule x y las desviaciones respecto a la media


116.4 + 115.9 + 114.6 + 115.2 + 115.8
𝑥̅ = = 115.58
5
𝐷116.4 = 116.4 − 115.58 = .82
𝐷115.9 = 115.9 − 115.58 = .32
𝐷114.6 = 114.6 − 115.58 = −.98
𝐷115.2 = 115.2 − 115.58 = −.38
𝐷115.8 = 115.8 − 115.58 = .22
Si es resultado es positivo significa que está por encima de la media, y si es negativo está por debajo de la media.

b. Use las desviaciones que calculó en el inciso a para obtener la varianza y la desviación estándar muestrales.
. 822 +. 322 + (−.982 ) + (−.382 ) +. 222
𝑠2 = = .482
5−1
𝑠 = √. 482 = .694
c. Calcule s 2 con el método breve
𝑠 2 =. 6942 = .4816
d. Reste 100 de cada observación para obtener una muestra de valores transformados. Ahora calcule la varianza
muestral de esos valores trasformados y compárela con s2 para datos originales.
16.4 15.9 14.6 15.2 15.8
16.4 + 15.9 + 14.6 + 15.2 + 15.8
𝑥̅ = = 15.58
5
(16.4 − 15.58)2 + (15.9 − 15.58)2 + (14.6 − 15.58)2 + (15.2 − 15.58)2 + (15.8 − 15.58)2
𝑠2 = = .482
5−1
+La varianza muestral es la misma en los valores transformados y en los datos originales.

17. El artículo “Oxygen Consumption During Fire Suppresión: Error of Heart Rate Estimation” (Ergonomics, 1991)
presentó los datos siguientes sobre el consumo de oxígeno en ml/ kg/min, para una muestra de 10 bomberos que hicieron
una simulación de combate de incendio:

29.5 49.3 30.6 28.2 28.0 26.3 33.9 29.4 23.5 31.6

a. ¿Cuáles son los valores de los cuartiles, y cuál es el valor de fs?


𝑄1 = 28 𝑄2 = 31.6 𝑓𝑠 = 31.6 − 28 = 3.6
b. Trace un diagrama de caja basado en el resumen de cinco números y comente sus características?
+Presenta un sesgo positivo y presenta mucha dispersión.

Gráfica de caja de consumo de oxìgeno

30 35 40 45 50
CONSUMO DE OXÌGENO

c. ¿Cuánto debe valer una observación para considerarse como inusual? ¿Cómo valor extremo?
𝑋𝑚𝑎𝑥 = 31.6 + (3𝑥3.6) = 42.4
𝑋𝑚𝑖𝑛 =28-(3x3.6)= 17.2
d. ¿Cuánto podría disminuir la observación más grande sin que afecte a fs?
+Podría disminuir 6.9
18. Se determinó la cantidad de contaminación de
aluminio, en ppm, en determinado plástico, con
una muestra de 26 especímenes y se obtuvieron los
siguientes datos (“The Lognormal Distribution for Modeling Quality Data when the Means Is Near
Zero”, J. of Quality Technology, 1990, pp. 105 – 110):

30 30 60 63 70 79 87 90 101

102 115 118 119 119 120 125 140 145

172 182 183 191 222 244 291 511

Trace un diagrama de caja que muestre los valores atípicos y comente sus particularidades.

Gráfica de caja de cantidad de contaminaciòn

0 100 200 300 400 500


CONTAMINACIÒN DEL ALUMINIO

+El diagrama presenta un sesgo positivo, mucha dispersión y también presenta un valor atìpico, en este caso se puede
visualizar como un valor atípico extremo.

20. La corrosión por fricción es un proceso de desgaste que resulta de los movimientos oscilatorios tangenciales de
pequeña amplitud en las piezas de una máquina. El artículo “Grease Effect on Fretting Wear of Mild Steel”
(Industrial Lubrication and Tribology, 2008: 67 – 78) incluye los siguientes datos sobre el desgaste de volumen
(10-4mm3) para los aceites base que tienen cuatro diferentes viscosidades.

Viscosidad Desgaste
20.4 55.8 30.8 27.3 29.9 17.7 76.5
30.2 44.5 47.2 48.7 41.6 32.8 18.3
89.4 73.3 57.1 66.0 93.8 133.2 81.1
252.6 30.6 24.2 16.6 38.9 28.7 23.6

a. El coeficiente de variación muestral (100𝑠/𝑥̅ ) evalúa el grado de variabilidad con respecto a la media
(específicamente, la desviación estándar como porcentaje de la media). Calcule el coeficiente de variación para la
muestra en cada viscosidad. Después, compare los resultados y coméntelos.
Viscosidad 1.- 55.53%
Viscosidad 2.- 29.68%
Viscosidad 3.- 32.29%
Viscosidad 4.- 27.85%
+La viscosidad uno tiene una mayor variación con respecto a su media ya que es la menor viscosidad
de las estudiadas en este ejercicio.
Gráfica
b. Construya una gráfica de de
cajacaja de Relacion
comparativa Viscosidad-Desgaste
de los datos y comente las características interesantes.
140

120

100

80
Desgaste

60

40

20

0
20.4 30.2 89.4 252.6
Viscosidad
+ Se puede observar que las primeras tres viscosidades presentan una dispersión grande en comparación con la viscosidad
4 que más bien presenta simetría, las 4 viscosidades no presentan valores atípicos y la viscosidad 1 y 3 presentan un sesgo
positivo, mientras que la viscosidad 2 presenta un sesgo negativo.

19. Se determinó la cantidad de contaminación de aluminio, en ppm, en determinado plástico, con una muestra de 26
especímenes y se obtuvieron los siguientes datos (“The Lognormal Distribution for Modeling Quality Data when the
Means Is Near Zero”, J. of Quality Technology, 1990, pp. 105 – 110):

30 30 60 63 70 79 87 90 101

102 115 118 119 119 120 125 140 145

172 182 183 191 222 244 291 511

Trace un diagrama de caja que muestre los valores atípicos y comente sus particularidades.
Gráfica de caja de cantidad de contaminaciòn

0 100 200 300 400 500


CONTAMINACIÒN DEL ALUMINIO

+El diagrama presenta un sesgo positivo, mucha dispersión y también presenta un valor atìpico, en este caso se puede
visualizar como un valor atípico extremo.

21. La corrosión por fricción es un proceso de desgaste que resulta de los movimientos oscilatorios tangenciales de
pequeña amplitud en las piezas de una máquina. El artículo “Grease Effect on Fretting Wear of Mild Steel”
(Industrial Lubrication and Tribology, 2008: 67 – 78) incluye los siguientes datos sobre el desgaste de volumen
(10-4mm3) para los aceites base que tienen cuatro diferentes viscosidades.

Viscosidad Desgaste
20.4 55.8 30.8 27.3 29.9 17.7 76.5
30.2 44.5 47.2 48.7 41.6 32.8 18.3
89.4 73.3 57.1 66.0 93.8 133.2 81.1
252.6 30.6 24.2 16.6 38.9 28.7 23.6

c. El coeficiente de variación muestral (100𝑠/𝑥̅ ) evalúa el grado de variabilidad con respecto a la media
(específicamente, la desviación estándar como porcentaje de la media). Calcule el coeficiente de variación para la
muestra en cada viscosidad. Después, compare los resultados y coméntelos.
Viscosidad 1.- 55.53%
Viscosidad 2.- 29.68%
Viscosidad 3.- 32.29%
Viscosidad 4.- 27.85%
+La viscosidad uno tiene una mayor variación con respecto a su media ya que es la menor viscosidad de las
estudiadas en este ejercicio.
d. Construya una gráfica de caja comparativa de los datos y comente las características interesantes.
Gráfica de caja de Relacion Viscosidad-Desgaste
140

120

100

80
Desgaste

60

40

20

0
20.4 30.2 89.4 252.6
Viscosidad
+ Se puede observar que las primeras tres viscosidades presentan una dispersión grande en comparación con la viscosidad
4 que más bien presenta simetría, las 4 viscosidades no presentan valores atípicos y la viscosidad 1 y 3 presentan un sesgo
positivo, mientras que la viscosidad 2 presenta un sesgo negativo.

21. Los siguientes datos sobre el contenido de alcohol destilado (%) para una muestra de 35 vinos de Oporto fueron
extraídos del artículo “A Method for the Estimation of Alcohol in Fortified Wines Using Hydrometer Baumé and
Refractometer Brix” (Amer. J. Enol. Vitic., 2006; 486 – 490). Cada valor es un promedio de dos medidas por duplicado.

16.35 18.85 16.20 17.75 19.58 17.73 22.75 23.78 23.25 19.08 19.62 19.20
20.05 17.85 19.17 19.48 20.00 19.97 17.48 17.15 19.07 19.90 18.68 18.82
19.03 19.45 19.37 19.20 18.00 19.60 19.33 21.22 19.50 15.30 22.25

Utilice los métodos estudiados incluyendo un diagrama de caja que muestre los valores atípicos para describir
y resumir los datos.

INTERVALO FRECUENCIA FRECUENCIA RELATIVA


15 < x < 16.5 3 .085
16.5 < x < 18 5 .142
18 < x < 19.5 14 .4
19.5 < x < 21 8 .228
21 < x < 22.5 2 .057
22.5 < x < 24 3 .085

Tallo y hoja de contenido de alcohol destilado N = 35

Unidad de hoja = 0.10

15 3
16 23

17 14778

18 0688

19 0001223344556699

20 00

21 2

22 27

23 27

Gráfica de puntos de contenido de alcohol destilado Histograma de alcohol destilado


14

12

10

Frecuencia
8

6
15.6 16.8 18.0 19.2 20.4 21.6 22.8 24.0
ALCOHOL DESTILADO (%) 4

0
15.0 16.5 18.0 19.5 21.0 22.5 24.0
ALCOHOL DESTILADO (%)

Gráfica de caja de contenido de alcohol destilado

15 16 17 18 19 20 21 22 23 24
ALCOHOL DESTILADO (%)

+ Los valores atípicos se pueden observar claramente en la gráfica de puntos y el diagrama de caja, aunque en este caso,
el diagrama muestra a detalle que los valores atípicos existentes solo son dos, en cambio en los otros diagramas se puede
especular que se podría tener más valores atípicos o que no tenga ningún valor atípico.

También podría gustarte