TAREA DE M EJERCICIOS 2 Y 4

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 10

2.

Un fabricante de componentes electrónicos se interesa en determinar el


tiempo de vida de cierto tipo de batería. Una muestra de 10 baterías
seleccionadas de manera aleatoria, son probadas y se obtiene en horas de vida
los siguientes valores:

123, 116, 122, 110, 175, 126, 125, 111, 118, 117
a) Calcule la media y la mediana de la muestra

Valores
123, 116, 122, 110, 175, 126, 125, 111, 118, 117

Sumamos los valores


123 +116 +122 +110 +175 +126 +125 +111 +118 +117 = 1,237

Número de valores = 10

1237
Media = = 123.7 horas
10

Mediana
Ordenamos los datos de menor a mayor:
110, 111, 116, 117, 118, 122, 123, 125, 126, 175

Como el número de valores es 10, un numero par, la mediana se calcula como


el promedio de los dos valores centrales (5º y 6º)
o 5º valor: 118
o 6º valor: 122

118+122 240
Mediana = = = 120 horas
2 2

b) ¿Qué característica en este conjunto de datos es la responsable de


la diferencia sustancial entre ambas?
La presencia de un valor atípico (175 horas), los valores atipicos son
observaciones cuyos valores son muy diferentes a las otras observaciones del
mismo grupo de datos, estos pueden distorsionar la media, haciendo que sea
más alta o más baja que la mediana, que es una medida más robusta para
describir la tendencia central cuando hay valores extremos en el conjunto de
datos.
4. Las siguientes puntuaciones representan la calificación en el examen
final para un curso de métodos estadísticos obtenidos por los alumnos:

a) Elabore un diagrama de tallo y hojas para las calificaciones del


examen, donde los tallos sean 1, 2, 3,...,9.

Ordenando los datos de menor a mayor


10, 15, 17, 22, 23, 25, 32, 34, 36, 41, 41, 43, 46, 48, 50, 51, 52, 52, 54, 55, 57,
57, 60, 60, 61, 62, 63, 64, 64, 64, 65, 67, 67, 68, 69, 70, 71, 72, 74, 74, 74, 74,
75, 76, 76, 77, 78, 78, 79, 79, 80, 80, 80, 80, 81, 81, 82, 82, 83, 84, 84, 85, 85,
85, 86, 88, 89, 90, 90, 92, 95, 98, 98

Diagrama de Tallo y Hojas

Tallo | Hojas
1 | 0, 5, 7
2 | 2, 3, 5
3 | 2, 4, 6
4 | 1, 1, 3, 6, 8
5 | 0, 1, 2, 4, 7, 7
6 | 0, 0, 1, 2, 3, 4, 7, 7, 8, 9
7 | 0, 1, 4, 4, 4, 5, 6, 7, 8, 8, 9, 9
8 | 0, 0, 0, 1, 1, 2, 4, 5, 5, 5, 6, 8, 8, 9
9 | 0, 0, 2, 5, 8, 8

b) Elabore una tabla de frecuencias y construya el histograma de


frecuencias relativas, trace un estimado de la gráfica de la distribución
y analice la asimetría de la distribución (busque algunos coeficientes
que sirven para evaluar la asimetría).
Datos Ordenados (de menor a mayor)

10, 15, 17, 22, 23, 25, 32, 34, 36, 41, 41, 43, 46, 48, 50, 51, 52, 52, 54, 55,
57, 57, 60, 60, 61, 62, 63, 64, 64, 64, 65, 67, 67, 68, 69, 70, 71, 72, 74, 74,
74, 74, 75, 76, 76, 77, 78, 78, 79, 79, 80, 80, 80, 80, 81, 81, 82, 82, 83, 84,
84, 85, 85, 85, 86, 88, 89, 90, 90, 92, 95, 98, 98

Tabla de Frecuencias

Con intervalos de 10 puntos


Intervalo Frecuencia Frecuencia Frecuencia
relativa acumulada
10 -19 3 0.0375 3
20 – 29 3 0.0375 6
30 – 39 3 0.0375 9
40 – 49 8 0.1000 17
50 – 59 10 0.1250 27
60 – 69 14 0.1750 41
70 – 79 18 0.2250 59
80 – 89 23 0.2875 82
90 – 99 11 0.1375 93

Histograma de frecuencias relativas

Frecuencia relativa
0.35

0.3
Frecuencia relativa

0.25

0.2

0.15

0.1

0.05

0
10-19 20 – 29 30 – 39 40 – 49 50 – 59 60 – 69 70 – 79 80 – 89 90 – 99
Intervalo
Calculando los coeficientes de asimetría para el conjunto de datos
proporcionado, usaremos el coeficiente de asimetría de Pearson y el
coeficiente de asimetría de Fisher:

Media
Donde n = 80
10 +15 +17+⋯+98 +98 5285
Media = = ≈ 66.06
80 80

Mediana
Dado que n = 80 (número par), la mediana es el promedio de los valores en
las posiciones 40 y 41

Valores en posiciones 40 y 41
74, 74

74+74
Mediana = = 74
2

Desviación Estándar (s)

∑(𝑥𝑖 − ̅̅̅
𝑥)2
𝑠= √
𝑛−1

̅̅̅2 𝑝𝑎𝑟𝑎 𝑐𝑎𝑑𝑎 𝑣𝑎𝑙𝑜𝑟 𝑥𝑖 𝑒𝑛 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠


𝐶𝑎𝑙𝑐𝑢𝑙𝑎𝑛𝑑𝑜 ∑(𝑥𝑖 − 𝑥)

𝑠 ≈ 21.19

Coeficiente de Asimetría de Pearson


𝟑(𝑴𝒆𝒅𝒊𝒂 − 𝑴𝒆𝒅𝒊𝒂𝒏𝒂)
𝒔

3(66.06 − 74)
≈ −1.13
21.19

Coeficiente de Asimetría de Fisher


𝑛 ̅̅̅3
∑(𝑥𝑖 −𝑥)
Asimetría de Fisher = (𝑛−1)(𝑛−2) ⋅ 𝑠3
̅̅̅𝟑 es aproximadamente −227783.75
La suma de ∑(𝒙𝒊 − 𝒙)

80 −227783.75
Asimetría de Fisher = (80−1)(80−2) ⋅ ≈ −1.54
21.193

Interpretación
El coeficiente de asimetría de Pearson es aproximadamente −1.13, esto
indica un sesgo negativo, o una distribución sesgada hacia la izquierda.
El coeficiente de asimetría de Fisher es proximadamente −1.54, esto indica
también un sesgo negativo más pronunciado.

c) Calcule la media, la mediana y la desviación estándar de la muestra,


tanto para los datos agrupados en la tabla de frecuencia y para los datos
individuales y compare sus resultados.

o Datos individuales

Media
Donde n = 80

10 +15 +17+⋯+98 +98 5285


Media = = ≈ 66.06
80 80

Mediana
Dado que n = 80 (número par), la mediana es el promedio de los valores en
las posiciones 40 y 41

Valores en posiciones 40 y 41
74, 74

74+74
Mediana = = 74
2
Desviación Estándar (s)

̅̅̅2
∑(𝑥𝑖 − 𝑥)
𝑠= √
𝑛−1

𝐶𝑎𝑙𝑐𝑢𝑙𝑎𝑛𝑑𝑜 ∑(𝑥𝑖 − ̅̅̅


𝑥)2 𝑝𝑎𝑟𝑎 𝑐𝑎𝑑𝑎 𝑣𝑎𝑙𝑜𝑟 𝑥𝑖 𝑒𝑛 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠

𝑠 ≈ 21.19

o Datos agrupados en la tabla de frecuencia

Media
Calculando la media de datos agrupados, usamos la fórmula:

donde:
𝑓𝑖 es la frecuencia absoluta del intervalo i
𝑥𝑖 es el punto medio del intervalo i
N es el número total de datos (suma de todas las frecuencias absolutas)

Datos
Intervalo Frecuencia Absoluta (𝑓𝑖 ) Punto Medio (𝑥𝑖 ) 𝑓𝑖 ∙ 𝑥𝑖
10 - 19 3 14.5 43.5
20 - 29 3 24.5 73.5
30 - 39 3 34.5 103.5
40 - 49 8 44.5 356.0
50 - 59 10 54.5 545.0
60 - 69 14 64.5 903.0
70 - 79 18 74.5 1341.0
80 - 89 23 84.5 1943.5
90 - 99 11 94.5 1039.5

Cálculo de la media
Suma de 𝑓𝑖 ∙ 𝑥𝑖
∑(𝒇𝒊 ∙ 𝒙𝒊 ) = 43.5 + 73.5+ 103.5 + 356.0+ 545.0 + 903.0 +1341.0 + 1943.5 +
1039.5 = 5458.0

Número total de datos (N)


N = 3 + 3 + 3 + 8 + 10 + 14 + 18 + 23 + 11= 93

Media
5458.0
𝑥̅ = ≈ 58.63
93

Mediana
𝑁+1 93+1
Posición de la mediana = = = 47
2 2

La mediana está en el intervalo cuyo límite acumulado es mayor o igual a 47

Intervalo Frecuencia Acumulada


10 - 19 3
20 - 29 6
30 - 39 9
40 - 49 17
50 - 59 27
60 - 69 41
70 - 79 59
80 - 89 82
90 - 99 93

La mediana está en el intervalo 70 - 79


Usando la fórmula de interpolación para calcular la mediana:

o L es el límite inferior del intervalo mediano (70)


o N es el número total de datos (93)
o F es la frecuencia acumulada antes del intervalo mediano (41)
o f es la frecuencia del intervalo mediano (18)
o h es el ancho del intervalo (10)

Mediana = 70 + (47−4118) ⋅ 10 = 70 + (6/18) ⋅ 10 = 70 + 3.33 = 73.33

Desviación estándar
Usando la fórmula:

Calculando (𝒙𝒊 − ̅̅̅


𝒙)𝟐

Intervalo Punto Frecuencia ̅


𝒙𝒊 − 𝒙 (𝒙𝒊 − ̅̅̅
𝒙)𝟐 𝒇𝒊 ∙ (𝒙𝒊 − ̅̅̅
𝒙)𝟐
Medio (𝒙𝒊 ) Absoluta (𝒇𝒊 )
10 - 19 14.5 3 14.5 - 1944.52 5833.55
58.63 = -
44.13
20 - 29 24.5 3 24.5 - 1161.17 3483.52
58.63 = -
34.13
30 - 39 34.5 3 34.5 - 581.18 1743.54
58.63 = -
24.13
40 - 49 44.5 8 44.5 - 199.68 1597.42
58.63 = -
14.13
50 - 59 54.5 10 54.5 - 17.06 170.58
58.63 = -
4.13
60 - 69 64.5 14 64.5 - 34.39 481.38
58.63 =
5.87
70 - 79 74.5 18 74.5 - 252.48 4544.62
58.63 =
15.87
80 - 89 84.5 23 84.5 - 670.11 15415.69
58.63 =
25.87
90 - 99 94.5 11 94.5 - 1286.83 14155.15
58.63 =
35.87

∑(𝑓𝑖 ∙ (𝑥𝑖 − ̅̅̅


𝑥)2 ) = 5833.55 + 3483.52 + 1743.54 + 1597.42 + 170.58 + 481.38
+ 4544.62 + 15415.69 + 14155.15 = 49646.43

Desviación Estándar (s):


49646.43
𝑠= √ = √534.85 ≈ 23.14
93−1

Comparación
Los valores obtenidos en media, mediana y desviación estándar de ambos datos,
son cercanos, la cercanía en media y mediana refleja una distribución de datos
que no está sesgada, y que los cálculos probablemente están bien realizados si
los datos no están sesgados o tienen una distribución normal, la cercanía en
desviación estándar muestra que la medida de dispersión es consistente y que
los datos tienen una variabilidad que se mantiene estable entre los análisis, por
lo tanto, la distribución es probable que sea simétrica y la cantidad de variabilidad
en los datos también es consistente, lo que muestra que la distribución de los
datos es relativamente normal o al menos no está sesgada de manera
significativa.

También podría gustarte