Yadithza (Estadistica)

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 16

Solución

1.
 Organizando los datos de menor a mayor para determinar con mayor facilidad la
frecuencia o veces en los que se repiten los datos.
1
1
1
2
2
2
2
2
2
3
3
3
3
3
3
3
3
4
4
4
4
4
5
5
5
5
6
6
7
8
Hay un total de 106
 ¿Qué proporción de hogares está compuesto por tres o menos personas? ¿Qué
proporción de individuos vive en hogares de tres o menos miembros?
En ambos casos preguntan lo mismo, de diferentes maneras
Proporción = 17 /30 =0,566 
 Dibuja el diagrama de frecuencias absolutas y el diagrama de frecuencias
acumuladas.

Hitograma frecuencias relativas acumuladas


0.50
0.45
0.40
0.35
0.30
0.25
0.20
0.15
0.10
0.05
0.00
9 22 28 30

 Agrupa por intervalos de amplitud 2 los valores de la variable, calcule su


distribución de frecuencias y represente con los correspondientes gráficos las
frecuencias absolutas y acumuladas
intervalo f F h N Xi Gl
s
[1-3) 9 9 0.30 0.30 2 4
[3-5) 13 22 0.43 0.73 4 8
[5-7) 6 28 0.20 0.93 6 12
[7-9) 2 30 0.07 1.00 162 16
Totales 30

2.
 Calcular la distribución de frecuencias de la variable obteniendo las frecuencias
absolutas, relativas y sus correspondientes acumuladas
sucursales nº empleados empleado/sucurs
empleado Fr. relativa
s Fr. absoluta Fr. absoluta al Fr. relativa acumulada
acumulada fn
ni ii
xi FNii
Ni
N N
9 2 2 0,04 0,04
10 4 6 0,08 0,12
11 10 16 0,20 0,32
12 10 26 0,20 0,52
13 5 31 0,10 0,62
14 3 34 0,06 0,68
15 6 40 0,12 0,8
16 5 45 0,1 0,9
17 2 47 0,04 0,94
18 2 49 0,04 0,98
19 1 50 0,02 1
50 1

 ¿Qué proporción de sucursales tiene más de 15 empleados?


n8 n9 n10 n11  5  2  2  1  10

10
% sucursales con más de 15 empleados  .100  20%

 Diagrama de barras y diagrama acumulativo de frecuencias correspondientes.

 Agrupar en intervalos de amplitud 3 los valores de la variable,


calcular su distribución de frecuencias y representar el histograma
y su polígono de frecuencias acumuladas.
sucursale nº empleado/sucur Fr. densida
Intervalos emple amplit
s empleados sal Fr. relativa relativa d
ados ud
[Li F. F. abs acumulad (altura)
absoluta acumulada f
Li1) xi nii a ci  d
ni
ni Ni F i
N N ii c
i

N
8 ‐ 11 9,5 6 6 0,12 0,12 3 2
11 ‐ 14 12,5 25 31 0,50 0,62 3 8,33
14 ‐ 17 15,5 14 45 0,3 0,90 3 4,67
17 ‐ 20 18,5 5 50 0,10 1 3 1,67
50 1 12

 Calcular la mediana y el coeficiente de asimetría de Fisher en datos


agrupados en intervalos de amplitud 3.
3.
Empresa A
X f fx fx2
800 15 12000 9600000
1000 20 20000 20000000
1200 30 36000 43200000
1500 20 30000 45000000
7500 15 112500 843750000
Suma 100 210500 961550000

210500
=2105
100
√ 961550000−( 21052) =2234.5
100
2234.5∗100
= 103.9%
2105

Empresa B
X f fx fx2
800 10 8000 6400000
1000 30 30000 30000000
1200 35 42000 50400000
1500 24 36000 54000000
7500 1 7500 56250000
Suma 10 123500 197050000
0

123500
=1235
100

√197050000−(12352 ) =667.3
100

667.3∗100
= 54. %
1235

Se puede apreciar que el coeficiente de variación de la empresa ha es casi el doble del


CV de la empresa B. Esto indica que en la empresa B hay mayor equidad en la distribución
de los salarios en comparación con la empresa A.
4.
 Obténgase una distribución de datos en intervalos de amplitud 5, siendo el primer
intervalo [50; 55].
Como se trata de efectuar una distribución de datos agrupados, debemos obtener primero los
intervalos correspondientes, situando los datos en sus lugares respectivos:
ni Ni
Li-1 - Li
[50;55) 2 2
[55; 60) 7 9
[60; 65) 17 26
[65;70) 30 56
[70; 75) 14 70
[75; 80) 7 77
[80; 85] 3 80
80

 Calcúlese el porcentaje de personas de peso menor que 65 Kg.


Observando la columna de frecuencias acumuladas se deduce que existen N3 = 26
individuos cuyo peso es menor que 65 Kg., que en términos de porcentaje
corresponden a:
26∗100
=32.5 %
80

 ¿Cuántas personas tienen peso mayor o igual que 70 Kg. pero menor que
85?
n5 + n6 + n7 = 14 + 7 + 3 = 24

lo que es equivalente a: N7 – N4 = 80 – 56 = 24
5.
 Construya una distribucion de frecuencia
intervalos marcas frecuencias frecuencias relativas
de clase absolutas
fi fa fi Fr
235-240 237,5 5 5 0,083 8,3
240-245 242,5 8 13 0,133 13,3
245-250 247,5 27 40 0,45 45
250-255 252,5 15 55 0,25 25
255-260 257,5 5 60 0,083 8,3
N=60
 Contruya el histograma

 ¿Qué Clase es la de mayor frecuencia?


Para empezar debemos definir las marcas o clases entonces, buscamos los
tipos de longitudes que hay, tenemos cilindros de medidas. Como me da
pereza ponerme a buscar las marcas podemos emplear una de las
herramientas de la estad´ıstica que son los gr´aficos de conteo, en ´este caso
podemos usar el de tallo y hoja que nos facilita bastante, si das cuenta
todos empiezan con 2 (centenas), y siguen con el 3, 4 y 5 (decenas) es
decir predomina los nu´meros 23, 24 y 25 las unidades son las que var´ıan.
Entonces los tallos van a ser 23, 24 y 25, y las hojas corresponder´an a
las unidades segu´n vayamos encon- trando, entonces,
T H O J A S
all
o
23 9 8 6 8 8
24 9 4 7 3 9 9 7 6 5 3 8 6 8 5 7 9 9 2 9 2819697
25 4 3 3 9 2 0 1 5 0 8 1 0 13 1 9 0 9 7 0021000121

´este recuadro llamado tallo y hoja nos ayuda a sintetizar todos los
resultados de una forma m´as visible. El orden de las hojas est´an segu
´n vas leyendo los datos del comienzo, para verlos au´n mejor, podemos
ordenar las hojas agrupando segu´n las unidades o si prefieres orden
ascendente, descendente como quieras, yo las agrupar´e por unidades para
poder contar cuantos cilindros hay con cierta longitud, as´ı:

T H O J A S
all
o
23 8 8 8 6 9
24 9 9 9 9 9 9 9 9 4 7 7 7 73 3 6 6 6 5 588812 2
25 4 3 3 3 9 9 9 2 2 2 0 0 0 0 0 0 0 0 0 1111111587
Listo, ya tenemos las marcas, ahora solo es cosa de contar cuántas veces cada
hoja de cada carca se repite más veces.

 la marca 238 se repite 3 veces


 la marca 236 se repite 1 vez
 la marca 239 se repite 1 vez
 la marca 249 se repite 8 veces
 la marca 244 se repite 1 vez
 la marca 247 se repite 4 veces
 la marca 243 se repite 3 veces
 la marca 245 se repite 2 veces
 la marca 246 se repite 2 veces
 la marca 248 se repite 3 veces
 la marca 241 se repite 1 veces
 la marca 242 se repite 2 veces
 la marca 254 se repite 1 veces
 la marca 253 se repite 3 veces
 la marca 259 se repite 3 veces
 la marca 252 se repite 3 veces
 la marca 250 se repite 9 veces
 la marca 251 se repite 7 veces
 la marca 255 se repite 1 veces
 la marca 258 se repite 1 veces
 la marca 257 se repite 1 veces

RESPUESTA: la marca 250se repite 9 veces


 ¿Qué clase es la de menor frecuencia?
la marca 236, 239,254, 255, 258, 257 se repiten 1 vez la marca
6.
 Obtener la tabla de frecuencias para ese conjunto de datos. Interpretar la tabla.
El primer paso para construir la tabla de frecuencias es determinar el número de valores
diferentes en observación, k, que en este caso es 7. A continuación
podemos ver que esos 7 valores van desde el 1, x 1 , al 7 7 , y podemos determinar la
frecuencia absoluta y relativa de cada uno de esos valores. Una vez calculadas las
frecuencias resulta la siguiente tabla de frecuencias.

x1 (nº horas) 1 2 3 4 5 6 7
ni (nº coches) 5 8 12 15 10 6 4
fi (%coches) 8.3 13.33 20 25 16.67 10 6.6
3 7
En esta tabla aparecen por filas el número de horas que permanecen los coches en el
aparcamiento, el número de coches que han aparcado durante cada número de horas y la
proporción de coches en % que han estado aparcados durante cada número de horas.
Una de las columnas, por ejemplo la cuarta, nos dice que 15 coches, que representa el
25% de los coches analizados, han estado aparcados durante 4 horas en el aparcamiento.
 Determinar e interpretar la tercera cuartilla y el centil del 42%.
La tercera cuartilla es el centil 75%, luego el ser N = 60 calculamos 0.75*60=45 que al
ser entereo, la fórmula aplicada será
X 45 + X 46 5+5
c 0.75= = =5horas
2 2
Su significado es que el 75% de los coches analizados estacionan en el aparcamiento a
lo sumo, o como máximo, 5 horas.
Para calcular el centil 42% hallamos 0.42*60=25.2, que al no ser entero, deberemos
utilizar la otra fórmula.
c0.42  x([ 25.2]1)  x(26)  4 horas

Su significado es que el 42% de los coches analizados estacionan en el aparcamiento a


lo sumo, o como máximo, 4 horas.
 Calcular el tiempo medio de permanencia de los coches en el aparcamiento.
Interpretar el resultado y los elementos que intervienen.
Según la primera fórmula, el tiempo medio de permanencia de los coches en el
aparcamiento es
231
X= =3.85 horas
60
Se calcula dividiendo el tiempo total de permanencia de todos los coches en el
aparcamiento, 231 horas, entre los coches analizados, 60.
En la segunda fórmula se calcula el tiempo medio como resultado de las aportaciones
que hacen a dicho valor los productos de los diferentes valores del número de horas que
han estado los coches aparcados, x i , por la proporción de
lcoches, f i , que han estado aparcados durante cada número de horas. Por tanto,

X  
f * xi = 3.85 horas
i

En promedio, cada coche ha estado estacionado 3 horas y 51 minutos, y el tiempo total


de permanencia en el aparcamiento de los 60 coches ha sido 231 horas.
7.
52.452 50.432 37.748 51.831 73.808 61.065 35.807 57.277
48.698 65.854 75.850 36.949 75.548 69.010 61.477 65.585
44.411 41.886 34.754 59.888 59.449 67.632 89.116 69.483
63.692 70.003 65.996 55.989 49.677 46.502 67.467 64.398
84.588 40.709 50.238 61.390 85.720 45.313 46.724 61.752
55.643 55.912 46.681 66.519 59.168 66.313 35.884 28.625
47.012 71.360 78.635 41.715 72.635 41.463 48.996 48.172
79.426 67.662 53.324 49.011 29.480 41.128 30.252 33.412
48.240 57.884 55.257 84.656 48.662 10.504 60.951 38.420
74.239 60.727 56.155 86.070 90.565 53.751 76.580 68.629
51.179 74.582 58.708 48.035 67.124 41.830 61.030 58.267
61.979 4.3068 41.539 62.215 51.269 82.919 34.182 37.654
80.502 35.342 44.719 37.402

 Construir una taba de frecuencias para esos datos tomando como número de
intervalos el que proporciona la fórmula de Sturgess. Interpretas la tabla.
La fórmula de Sturgess propone como número k de intervalos, para agrupar un conjunto
de N observaciones en intervalos.
k=1+ [3.3*log N]
En este caso N=100, luego k=7. ahora debemos propones el límite inferior del primer
intervalo y el límite superior del último intervalo. Al ser el valor mínimo 4.3068 se
propone 4 como límite inferior del primer intervalo, y al ser 7 intervalos se propone
como anchura 13 para cada uno de ellos, para que sea un valor entero, con lo cual el
límite superior del último intervalo es 95.
La tabla de frecuencias será:

Intervalo 4x 17  x  30  x 
_ Ii 17 30 43
Frecuenci
a 2 2 19
absoluta _
ni
Frecuenci
a .02 .02 .19
relativa _
fi

I 43  x  56  x  69  x  82  x 
i 56 69 82 95
n 27 29 14 7
i
f .27 .29 .14 .07
i

En esta tabla aparecen por filas los intervalos, junto con la frecuncia absoluta y la frecuencia
relativa. Por ejemplo la cuarta columna se puede interpretar diciendo que el 27% de estos
neumáticos han recorrido entre 43000 y 5600 Km hasta que se ha producido un pinchazo o
reventón

 Construir las tablas de frecuencias acumuladas ascendente y descendente.


La tabla de frecuencias acumuladas ascendente sería:

Intervalos (4, (17, (30, (43, (56, (]69, (82,


_ Ii 17] 30] 43] 56] 69] 82 95]
i

 2 4 23 50 79 93 100
nj
j
1

la tabla de frecuencias acumuladas descendente quedaría:

Intervalos (4, (17, (30, (43, (56, (69, (82,9


_ Ii 17] 30] 43] 56] 69] 82] 85]
k

 100 98 96 77 50 21 7
n
jj
1

 Dibujar el histograma de frecuencias relativas sin acumular y acumulado.


 Calcular las principales medidas de tendencia central e interpretarlas.
Para calcular las medidas de tendencia central trabajamos con la tabla de frecuencias del
apartado a. resulta que la media aritmética es
X = 55870 Km
Se interpreta diciendo que son los 100 neumáticos analizados se han recorrido 5587000
de Km antes de un pinchazo o reventón.
La mediana será
Me = 56000 Km
Significa que la mitad de los neumáticos han recorrido a lo sumo 56000 Km antes de un
pinchazo o reventón.
La moda será
2
Mo = 56 + 13* = 57529 Km
2+ 15
Significa que la cantidad más frecuente, de kilómetros recorridos antes de un pinchazo,
a sido 57529 Km.
 Obtener las medidas de dispersión más importantes e interpretarlas.
La desviación típica es
s = 16899 Km
y nos informa sobre lo que se dispersan los kilómetros recorridos por los diferentes
neumáticos respecto del kilometraje medio.
El coeficiente de variación de Pearson será:
s
g= *100%=30.24
x
Al tomar un valor inferior al 100% resulta que la mediana es representativa, y al ser dicho valor
del 30% nos informa que el valor de la desviación típica es el 30% del valor de la media.

 Analizar la asimetría y el apuntamiento de la distribución de frecuencias


resultante.
Los coeficientes de asimetría de Pearson son en este caso

55.87−57.529
vi = =-0.09817
16.899
55.87−56.00
vi = =-0.02308
16.899
Para calcular el coeficiente g 1 calculamos

m3  ∑ f i( x i−x)  421.39015
i

Luego g =-0.08732, resultado de dividir m entre s a la vista de este coeficiente de


asimetría la distribución resulta ser ligeramente asimétrica a la izquierda, lo que
significa que algo menos de la mitad de los neumáticos pinchan o revientan antes de los
5600 Km, valor mediano de la distribución.
Para el cálculo del coeficiente de curtosis g2 necesitamos:

=  f (x  x )  234594.7408
Luego:

g= -0.12343

Esto significa que la distribución es de tupo platicúrtica, algo menos apuntada


que la distribución normal de media 55870 km y desviación típica 16899 km.
Por tanto, en los intervalos X ± ks con k  habrá menos proporción de
observaciones que en dicha distribución normal

 Si el fabricante quiere proponer un kilometraje para realizar el cambio de


neumáticos, ¿qué valor propondría para que solo 3 de cada 10 coches hayan
tenido un pinchazo o reventón antes de ese kilometraje?

Propondría un kilometraje tal que el 70% de los neumáticos no hayan pinchado


o reventado antes de este kilometraje. Por tanto, buscamos el centil del 30%,
que vendrá dado por:

c 0.3 =43+13 ( 277 )=46.3


Luego el fabricante propondría cambiar los neumáticos a los 46370 km
Te amo…

También podría gustarte