0% encontró este documento útil (0 votos)
73 vistas25 páginas

Taller#2 1

Descargar como pdf o txt
Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1/ 25

UNIVERSIDAD DEL ATLANTICO

UA

TALLER #2

PRESENTADO POR:

MELANNY BARRIOS
VICTOR CABALLERO
DALIA ROSALES
PABLO VILLAMIZAR

ESTADISTICA

GRUPO 2 Código 22302

BARRANQUILLA ATLANTICO

Noviembre 2020
UNIVERSIDAD DEL ATLANTICO

TALLER 2

ACTIVIDADES ACADÉMICAS COMPLEMENTARIAS PARA


DESARROLLAR EL INTELECTO

1.- Considérese los datos que contienen la resistencia a la comprensión


de unos productos deportivos en libras por pulgada cuadradas de unos
ejemplares de una combinación con aluminio-litio sujeta a evaluación por
unos expertos. (Ver base de datos al final);

a.- Con los datos, escoger una muestra aleatoria utilizando el


procedimiento de los números aleatorios en Excel y construye una
distribución de frecuencias con las clases adecuadas mínimo 7 clases. De
igual manera, la muestra será del 15% al 25% de la base de datos.
¿Análisis exploratorio de datos a través, el gráfico de puntos, el diagrama
de tallo y hojas y el diagrama de caja y bigotes? ¿Hay datos atípicos en
extremo? ¿Qué solución propones; sacar una nueva muestra o retirar los
datos en extremo y realizar la tabla con menos datos?

b.- Construye la gráfica adecuada y explica ¿cuántos en % de datos son


mayores 150? ¿El % Entre 130 y 230? ¿El % de Más de 110? ¿En % de
228 o menos?

c.- Has un resumen de las medidas interpreta los datos, explica ¿cuál el
comportamiento de estos indicadores?

d.- Determina la cantidad de observaciones que estarían por fuera del

Intervalo verifica la regla de Chebyshev y compárala con de Distribución


empírica de Gauss. PÀGINA 49 CAPÌTULO1,
ANEXOS BASES DE DATOS:

BASE DE DATOS acerca de la resistencia PUNTO 1.

Resistencias Resistencias Resistencias Resistencias Resistencias Resistencias

184 180 186 178 76 147 153 175


167 180 146 170 90 89 77 176
188 190 176 90 77 89 155 176
176 149 160 140 115 120 156 180
155 159 186 150 79 200 157 181
149 159 186 155 150 79 158 181
159 160 196 189 120 149 158 183
189 160 180 178 121 149 158 184
76 147 153 175 123 149 160 186
87 147 154 176 133 150 160 190
101 148 155 176 133 150 163 193
110 148 156 180 135 150 165 194
115 148 157 181 135 150 167 199
118 149 158 181 141 150 167 200
120 149 158 183 142 150 168 201
121 149 158 184 143 151 169 202
123 149 160 186 145 151 170 229
133 150 160 190 146 152 171 237
133 150 163 193 147 152 171 174
135 150 165 194 174 152 172 175
135 150 167 199 190 153 140 155
141 150 167 200 199,6 179,3 180,5 189,3
142 150 168 201 136,3 138,3 188,5 187,4
143 151 169 202 133,6 127,7 131,6 137,3
145 151 170 229 155,3 165,3 187,4 188,3
146 152 171 237 187,3 107,5 105,6 101,5
147 152 171 174 176,9 179,6 180,3 180,7
174 152 172 175 165,4 132,5 123,7 188,4
170,8 153 139,7 140,5 166,7 165,9 137,3 136,8
200,5 201,7 200,8 200,7 200,5 200,6 208,3 189,7
190.7 198.6 187.5 175.7 165.3 163.5 167.4 169.8
145.7 154.8 150.7 179.3 176 185.3 179.4 177,2
178.3 177.2 125.2 135.8 122.6 132.9 133.6 135.7
111.2 101.5 189.7 207.5 204,6 209.1 223.1 217.4
167.3 176.4 189 4 156.3 179.5 167.9 189.4
180,7 145,3 165,2 98,5 94,7 87,6 88,5 97,2
110 148 156 180 135 150 165 194
115 148 157 181 135 150 167 199
118 149 158 181 141 150 167 200
120 149 158 183 142 150 168 201
121 149 158 184 143 151 169 202
123 149 160 186 145 151 170 229
133 150 160 190 146 152 171 237
133 150 163 193 147 152 171 174
135 150 165 194 174 152 172 175

135 150 167 199 190 153 140 155


141 150 167 200 199,6 179,3 180,5 189,3
142 150 168 201 136,3 138,3 188,5 187,4
143 151 169 202 133,6 127,7 131,6 137,3
145 151 170 229 155,3 165,3 187,4 188,3
146 152 171 237 187,3 107,5 105,6 101,5
147 152 171 174 176,9 179,6 180,3 180,7
174 152 172 175 165,4 132,5 123,7 188,4
170,8 153 139,7 140,5 166,7 165,9 137,3 136,8
200,5 201,7 200,8 200,7 200,5 200,6 208,3 189,7
190.7 198.6 187.5 175.7 165.3 163.5 167.4 169.8
a) De los datos anteriores se escogió una muestra aleatoria correspondiente al 24%
(108) de los datos totales, mediante una hoja de cálculo de Excel
(ALEATORIO.ENTER):

MUESTRA ALEATORIA MUESTRA ORDENADA


190 13 51 7 68 169
16 135 236 12 70 169
184 205 85 13 74 169
233 140 132 16 75 169
51 48 98 21 75 173
65 79 60 21 79 173
173 113 127 21 81 175
215 144 230 22 83 177
25 59 22 23 85 177
48 21 74 24 89 182
98 130 70 24 89 182
116 223 169 24 94 184
159 24 59 25 95 189
68 98 201 34 98 190
75 75 67 41 98 193
169 189 147 42 98 198
177 51 198 42 103 201
81 42 60 42 105 205
208 141 95 46 109 205
109 121 105 47 113 207
147 21 23 48 113 207
193 89 235 48 116 207
225 207 42 51 117 208
42 117 230 51 121 211
126 113 177 51 126 214
182 207 221 53 127 215
64 94 34 53 130 220
24 89 214 55 130 221
220 182 83 59 132 223
173 130 53 59 135 225
55 12 41 60 140 230
169 46 21 60 141 230
103 211 207 61 144 231
169 7 231 64 147 233
205 47 53 65 147 235
61 175 24 67 159 236
 Diagrama de puntos:

 Diagrama de tallo y hojas

DIAGRAMA DE TALLO Y HOJA


0 7
1 2,3,6
2 1,1,1,2,3,4,4,4,5
3 4
4 1,2,2,2,6,7,8,8
5 1,1,1,3,3,4,9,9
6 0,0,1,4,5,7,8
7 0,4,5,5,9
8 1,3,5,9,9
9 4,5,8,8,8
10 3,5,9
11 3,3,6,7
12 1,6,7
13 0,0,2,5
14 0,1,4,7,7
15 9
16 9,9,9,9
17 3,3,5,7,7
18 2,2,4,9
19 0,3,8
20 1,5,5,7,7,7,8
21 1,4,5
22 0,1,3,5
23 0,0,1,3,5,6
𝑛𝑃
𝐶𝑜𝑚𝑜 → 𝑖 =
100

108 ∗ 25
𝑖 = = 27
100

108 ∗ 50
𝑖 = = 54
100

108 ∗ 75
𝑖 = = 81
100

Teniendo en cuenta esto, entonces:

𝑄 = 53

𝑄 = 105

𝑄 = 177

𝑅𝐼 = 𝑄 − 𝑄 → 𝑅𝐼 = 177 − 53 = 124

 Diagrama de caja y bigote:


- Bigote izquierdo:

𝐵𝐼 = 𝑄 − 1,5(𝑅𝐼)

𝐵𝐼 = 53 − 1,5(124)

𝐵𝐼 = −133

Se obtiene que el bigote izquierdo es menor al número más pequeño de la muestra, por lo
que este cubre al lado izquierdo de la muestra.

- Bigote derecho:

𝐵𝐷 = 𝑄 − 1,5(𝑅𝐼)

𝐵𝐷 = 177 − 1,5(124)

𝐵𝐷 = 363

Se obtiene que el bigote derecho es mayor al número más grande de la muestra, por lo
que este cubre al lado derecho de la muestra.
Teniendo en cuenta estos resultados podemos observar que los datos se encuentran
normalmente distribuidos tanto a la izquierda como a la derecha, por lo que no se
encuentran datos atípicos en esta muestra.

 Distribución de frecuencias

Para la distribución de tablas de frecuencia primero se deben conocer lo siguiente:

𝑅𝑎𝑛𝑔𝑜 = 𝑑𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝑑𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟

𝑁° 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 → 𝐶 = 1 + 3,3 log (𝑛)

𝑅𝑎𝑛𝑔𝑜
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 → 𝑤 =
𝐶

1
𝑃𝑢𝑛𝑡𝑜 𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑢𝑛𝑖𝑑𝑎𝑑 𝑑𝑒 𝑚𝑒𝑑𝑖𝑑𝑎 → = 0,5
2

𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 → 𝐼 = 𝑑𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 − 𝑃. 𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑢𝑛𝑖𝑑𝑎𝑑

𝐼𝑛𝑡𝑒𝑣𝑎𝑙𝑜 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 → 𝐼 = 𝐼 +𝑤

Datos tabla de distribución de frecuencia


Punto
Intervalos de Amplitud de Intervalo Intervalo
Rango medio de la
clase clase inferior superior
unidad
229 9 26 0,5 6,5 33
Tabla de distribución de frecuencias
Intervalo Inferior Intervalo Superior F FR FA XI
6,5 33 13 0,12 13 20
33 59 17 0,16 30 46
59 85 15 0,14 45 72
85 111 10 0,09 55 98
111 137 11 0,10 66 124
137 163 6 0,06 72 150
163 189 13 0,12 85 176
189 215 13 0,12 98 202
215 241 10 0,09 108 228

b)
- Se encuentran 37 datos - Se encuentran 53 datos
mayores a 150 por lo que: mayores a 110 por lo que:
37 53
𝑥100 = 34,3 % 𝑥100 = 49,1 %
108 108

- Se encuentran 38 datos - Se encuentran 102 datos


entre el 130 y 230 por lo muestra iguales o menores
que: que 228 por lo que:
38 102
𝑥100 = 35,2 % 𝑥100 = 94,4 %
108 108

Valores %
Mayores a 150 34,3
Entre 130 y 230 35,2
Mayores a 110 49,1
Menores de
94,4
228

Gráfica de porcentajes
100
90
80
70
Porcentajes (%)

60
50
40
30
20
10
0
Mayores a 150 Entre 130 y 230 Mayores a 110 Menores de 228
c) Medidas de los datos:

MEDIDAS
Moda 169
media 116,583333
Media geométrica 90,7711626
media armónica 61,7495038
mediana 107
Rango 229
desviación estándar 69,6339058
varianza 4848,88084
desviación media 61,1080247
CV 60%
primer sesgo -0,75274632
segundo sesgo 0,41287358
curtosis -1,30929502

El coeficiente de variación nos indica que estos datos tienen una alta
variabilidad. El primer sesgo y la curtosis es negativa por lo que tiene
asimetría hacia la izquierda y que la muestra de datos tiene un
comportamiento platicúrtica, es decir, que hay una menor concentración
de datos en torno a la media.

d) Regla de tchevychev y regla de gauss:

- Regla de tchevychev:
Para k = 2
𝑥̅ − 𝑘𝜎 = 116,583 − (2)(69,6339058) = −22,69
𝑥̅ + 𝑘𝜎 = 116,583 + (2)(69,6339058) = 255,85

Intervalo = [-22,69;255,85]

Para k = 3
𝑥̅ − 𝑘𝜎 = 116,583 − (3)(69,6339058) = −92,31
𝑥̅ + 𝑘𝜎 = 116,583 + (3)(69,6339058) = 325,48

Intervalo = [-92,31;325,48]

Para k = 3,5
𝑥̅ − 𝑘𝜎 = 116,583 − (3,5)(69,6339058) = −127,14
𝑥̅ + 𝑘𝜎 = 116,583 + (3,5)(69,6339058) = 360,30

Intervalo = [-127,14;360,30]
Regla de Tchebychev Intervalo 𝑥̅ ∓ 𝑘𝜎
k 2 75% -22,68 255,85 Todos los datos se encuentran
k 3 89% -92,32 325,49 en los intervalos y cumplen la
k 3,5 92% -127,14 360,30 regla de tchevychev

- Regla de Gauss (68-95-99,7)


 El 68,27 % de los datos están en el intervalo [µ-σ; µ+σ]
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 → [46,95; 186,22]

 El 95,45 % de los datos están en el intervalo [µ-2σ; µ+2σ]


𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 → [−22,68; 255,85]

 El 99,7 % de los datos están en el intervalo [µ-3σ; µ+3σ]


𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 → [−92,32; 325,49]

99,70%

95,45%

68,27%

-92,32 -22,68 46,95 186,22 255,85 325,49

7 116,5833333 236

Todos los datos se encuentran dentro de los intervalos por lo que se cumple la regla de
gauss.

También podría gustarte