Taller 1 Estadistica
Taller 1 Estadistica
Taller 1 Estadistica
Taller #2
___________________________________________________________________________
Presentado por
Estadística
2020-2
1.- Considérese los datos que contienen la resistencia a la comprensión de unos productos
deportivos en libras por pulgada cuadradas de unos ejemplares de una combinación con
aluminio-litio sujeta a evaluación por unos expertos. (Ver base de datos al final);
a.- Con los datos, escoger una muestra aleatoria utilizando el procedimiento de los números
aleatorios en Excel y construye una distribución de frecuencias con las clases adecuadas
mínimo 7 clases. De igual manera, la muestra será del 15% al 25% de la base de datos.
¿Análisis exploratorio de datos a través, el gráfico de puntos, el diagrama de tallo y hojas y
el diagrama de caja y bigotes? ¿Hay datos atípicos en extremo? ¿Qué solución propones;
sacar una nueva muestra o retirar los datos en extremo y realizar la tabla con menos datos?
Solución:
Dato
No selección aleatoria No. Jerarquía
s Selección
Diagrama de Tallo y Hoja para Muestra: unidad = 1,0 1|2 representa 12,0
3 7|
3 8|
3 9|
3 10|
5 11|05
8 12|133
14 13|233778
23 14|002288999
45 15|0000000111225556667899
(9) 16|035777999
40 17|156
37 18|0000000444677777999
18 19|003399
12 20|000011488889
Gráfico de dispersión:
Gráfico de Dispersión
Donde RI es el rango Inter cuartil. Para obtener los limites F1 y F2 se tiene que:
F 1=Q1−2∗(1.5∗RI ) (3)
A partir de las ecuaciones anteriores y con base a los siguientes datos tenemos que:
Cuartiles Valor
Q1 148,75
Media 159,5
Q3 186,325
Rango (RI) 37,575
Intervalos Valor
f1 92,3875
F1 36,025
f2 242,6875
F2 299,05
Se observa que los datos 77 y 79 se encuentran en el intervalo F1-f1 por lo tanto se
consideran valores atípicos normales.
b.- Construye la gráfica adecuada y explica ¿cuántos en % de datos son mayores 150? ¿El
% Entre 130 y 230? ¿El % de Más de 110? ¿En % de 228 o menos?
Solución:
Histograma
18
15
12
frecuencia
0
70 100 130 160 190 220
Muestra
c.- Has un resumen de las medidas interpreta los datos, explica ¿cuál el comportamiento de
estos indicadores?
No Datos 70
Promedio 164,452
Desviación Estándar 28,8087
Coeficiente de Variación 17,52%
Mínimo 77
Máximo 209,1
Rango 132,1
Sesgo Estandarizado -2,86337
Curtosis Estandarizada 1,65356
Para determinar el coeficiente de variación de Pearson aplicamos la siguiente formula:
σ
CV = ∗100(5)
media aritmética
Remplazando tenemos:
σ
CV = ∗100=17.51 %
media aritmética
Grado de variabilidad CV
Baja Menos de 10%
moderada De 10% a 30%
Alta Más de 30%
A partir de la anterior se puede afirmar que el grado de variabilidad para esta muestra es
moderado. Por otra parte el sesgo negativo nos indica que la distribución esta asimétrica
hacia la izquierda tal como lo muestra la siguiente figura:
Se observa un valor para la curtosis positivo por lo tanto se puede afirmar que la
distribución es de tipo leptocúrtica
1. μ ∓2 σ
2. μ ∓3 σ
3. μ ∓3.5 σ
Solución:
1
[
[ x́+ Kσ ] es al menos un 100 1−
K2
%
]
Podemos simplificar los valores que deben cumplir para cada K en la siguiente tabla:
1 2 3 4 5 5 6 7 8 9 10 11 12 13 14 15 16 18 19 20
^x =¿ 5
~ 9+10
x=¿ =9,5
2
N
b.- hallar los cuatro primeros momentos con respecto a la media, sí:
∑ ( xi−x́)r
i
mr =
n
n
∑ ( xi−x́ )1
= ( 4−9,9 ) + ( 7−9,9 ) + ( 5−9,9 ) + ( 9−9,9 ) + ( 8−9,9 ) + ( 3−9,9 ) + ( 6−9,9 ) +(5−9,9)1+ …+ ¿ ¿
i 1 1 1 1 1 1 1
m 1=
n 20
( 2−9,9 )1+ (1−9,9 )1 + ( 10−9,9 )1+ ( 12−9,9 )1 + ( 14−9,9 )1 + ( 18−9,9 )1+ ( 15−9,9 )1 +(11−9,9)1 +…+ ¿ ¿
20
∑ ( xi−x́ )2
=( 4−9,9 ) + ( 7−9,9 ) + ( 5−9,9 ) + ( 9−9,9 ) + ( 8−9,9 ) + (3−9,9 ) + ( 6−9,9 ) +(5−9,9)2 +…+ ¿ ¿
i 2 2 2 2 2 2 2
m 2=
n 20
( 2−9,9 )2+ ( 1−9,9 )2 + ( 10−9,9 )2+ ( 12−9,9 )2 + ( 14−9,9 )2 + ( 18−9,9 )2 + ( 15−9,9 )2+(11−9,9)2+ …+ ¿ ¿
20
∑ ( xi−x́ )3
=( 4−9,9 ) + ( 7−9,9 ) + ( 5−9,9 ) + ( 9−9,9 ) + ( 8−9,9 ) + ( 3−9,9 ) + ( 6−9,9 ) +(5−9,9)3 +…+ ¿ ¿
i 3 3 3 3 3 3 3
m 3=
n 20
( 2−9,9 )3+ ( 1−9,9 )3 + ( 10−9,9 )3 + ( 12−9,9 )3+ (14−9,9 )3+ (18−9,9 )3 + ( 15−9,9 )3 +(11−9,9)3 +…+ ¿ ¿
20
∑ ( xi −x́ ) 4
=( 4−9,9 ) + ( 7−9,9 ) + ( 5−9,9 ) + ( 9−9,9 ) + ( 8−9,9 ) + (3−9,9 ) + ( 6−9,9 ) +(5−9,9)4 + …+ ¿ ¿
i 4 4 4 4 4 4 4
m4 =
n 20
( xi− A)r
c.- hallar los cuatro primeros momentos con respecto al origen 7; Sí: ḿr =∑
n
donde A es con respecto al origen; r-ésimo momento respecto a cualquier origen A
( xi−7)1
=( 4−7 ) + ( 7−7 ) + (5−7 ) + ( 9−7 ) + ( 8−7 ) + ( 3−7 ) + ( 6−7 ) +(5−7)1 +…+ ¿ ¿
1 1 1 1 1 1 1
ḿ 1=∑
n 20
( 2−7 )1+ (1−7 )1 + ( 10−7 )1+ (12−7 )1 + ( 14−7 )1 + ( 18−7 )1+ (15−7 )1 +(11−7)1 +…+ ¿ ¿
20
( 2−7 )2+ (1−7 )2 + ( 10−7 )2+ ( 12−7 )2 + ( 14−7 )2 + ( 18−7 )2 + ( 15−7 )2+(11−7)2+ …+ ¿ ¿
20
( xi−7)3
= ( 4−7 ) + ( 7−7 ) + ( 5−7 ) + ( 9−7 ) + ( 8−7 ) + ( 3−7 ) + (6−7 ) +(5−7)3 + …+ ¿ ¿
3 3 3 3 3 3 3
ḿ3=∑
n 20
( 2−7 )3+ ( 1−7 )3 + ( 10−7 )3 + ( 12−7 )3 + ( 14−7 )3+ (18−7 )3 + ( 15−7 )3 +(11−7)3 +…+ ¿ ¿
20
(xi−7)4
= ( 4−7 ) + ( 7−7 ) + ( 5−7 ) + ( 9−7 ) + ( 8−7 ) + ( 3−7 ) + ( 6−7 ) +(5−7)4 +…+ ¿ ¿
4 4 4 4 4 4 4
ḿ 4 =∑
n 20
d.- Verificar las relaciones entre momentos sí: m 2=ḿ2−ḿ12; m3=ḿ3−3 ḿ1 ḿ2 +2 ḿ13;
m 4 =ḿ 4−4 ḿ 1 ḿ3 +6 ḿ12 ḿ 2−3´m 14
m 4 =ḿ 4−4 ḿ 1 ḿ3 +6 ḿ12 ḿ 2−3´m 14 =4078,1−4 ( 2,9 ) ( 341,6 ) +6 ( 2,9 )2 ( 40,7 ) −3 ( 2,9 )4=1957
x́−^x
e.- Determina el primer sesgo si: sesgo = ; Y EL SEGUNDO SESGO
s
~
3( X́ − X )
COEFICIENTE DE PEARSON SÌ: SESGO=
S
x́−^x 9,9−5
Primer sesgo, sesgo = = =0,313
s 15,645
~
3( X́ − X ) 3 (9,9−9,5)
Segundo sesgo coeficiente de Pearson, sesgo= = =0,077
S 15,645
m4
f.- Determina el coeficiente momento de curtosis sí: Cmc =a4 =
m22
m4 1951,077
Cmc =a4 = 2
= =1,877
m 2 (32,29 )2
3 - suponga que en el mismo estudio se obtuvieron datos de preferencias de los clientes por
diferentes tipos y marcas de pastas, representados en el siguiente cuadro:
Responda:
TIPO DE PRODUCTO
Spagueti Fideo finos Corbatines Total
MARCA Nuria 3 12 21 36
La muñeca 17 7 5 29
Constanza 9 14 12 35
Total 29 33 38 100
TABLA DE FRECUENCIA
TIPOS DE PASTAS
TABLA DE FRECUENCIA CON REPECTO A LA PASTA
F Fr FA Xi %Fr
spagueti 29 0,29 29 0,29 29%
fideos finos 33 0,33 62 0,62 33%
corbatines 38 0,38 100 1 38%
total 100 1 100%
HISTOGRAMA
5 18 0,30 42 100
15
Total 60 1
10
5
0
1 2 3 4 5
Escala númerica
2.- Edades de los estudiantes.
Datos Frecuencia Frecuencia relativa Frecuencia acumulada Frecuencia relativa acumulada [%]
19 6 0,1 6 10
20 3 Histograma 0,05 9 15
21 5 0,0833 14 23,33
9
22 2 0,0333 16 26,67
8
23 7 0,1167 23 38,33
7
24 5 0,0833 28 46,67
25
6 6 0,1000 34 56,67
Frecuencia
26
5 4 0,0667 38 63,33
27 8 0,1333 46 76,67
4
28 7 0,1167 53 88,33
3
29 5 0,0833 58 96,67
2
30 1 0,0167 59 98,33
1
32 1 0,0167 60 100,00
Total
0 60 1
19 20 21 22 23 24 25 26 27 28 29 30 32
Edades
30
29
28
27
26
M F
Género
c.- Trace un resumen de los datos en forma gráfica de barras y de diagrama circular.
Gráfica de barras
25
20
15
10
5
0
1
2
3
4
5
Diagrama circular
1
7%
2
5 13%
33%
3
20%
4
27%
2.- Edades de los estudiantes.
Diagrama circular
30 32 19
29 2%2% 10%
8%
20
5%
28
12%
21
8%
22
3%
27
13%
23
12%
26
7% 24
25 8%
10%
3.- Género de los estudiantes.
Gráfico de barras
32
31
30
Frecuencia
29
28
27
26
M
F
Género
Driagama circular
M
47%
F
53%
d.- Con base en sus resúmenes, haga comentarios sobre la evaluación general del curso
por parte de los alumnos.
( x 1 f 1+ x2 f 2 + …+ x n f n)
X́ =
∑ f ij
(600 )( 10 ) + ( 1200 ) ( 15 ) + ( 1800 ) ( 20 ) +(2400)(15)
X́ = =1600
10+15+20+15
Intervalos f FA
0-600 10 10
600-1200 15 25
1200-1800 20 45
1800-2400 15 60
Pn (70)(60)
i= = =42
100 100
Pn
P70=Li + A
100
(
−Fi−1
fi
= 1200+ 600 )
42−25
20
=1710 ( )
Entonces, la ayuda máxima concedida al 70% de los proyectos menos favorecidos será de
1710 mil euros.
Intervalos f FA
0-600 10 10
600-1200 15 25
1200-1800 20 45
1800-2400 15 60
Pn (65)(60)
i= = =39
100 100
Pn
P65=Li + A
100
−Fi−1
fi (
= 1200+ 600
39−25
20 )
=1620 ( )
Entonces, la ayuda mínima concedida al 65% de los proyectos más favorecidos será de
1620 mil euros.
https://www.youtube.com/watch?v=3YhQAiHTS2c