UNIDAD II. Distribución de Frecuencias
UNIDAD II. Distribución de Frecuencias
UNIDAD II. Distribución de Frecuencias
Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor
y el nmero total de datos.
Se puede expresar en tantos por ciento y se representa por ni.
xi
27
28
29
30
Recuento
I
II
fi
1
2
6
Fi
1
3
9
ni
0.032
0.065
0.194
Ni
0.032
0.097
0.290
16
0.226
0.516
31
32
33
34
8
24
0.258
0.774
III
3
27
0.097
0.871
III
3
30
0.097
0.968
I
1
31
0.032
1
31
1
Este tipo de tablas de frecuencias se utiliza con variables discretas.
Representacin grfica
Los grficos que representan de manera adecuada una distribucin de frecuencias son:
Histograma de frecuencia
Est formado por un conjunto de rectngulos, cada uno levantado para cada intervalo,
de tal manera que la base ser igual a la amplitud C y la altura est dado, ya sea por
la frecuencia absoluta o por la relativa. En el ejemplo de las ventas, (tabla anterior)
tenemos:
Polgono de frecuencia
Con la misma informacin que fue utilizada para elaborar el histograma de frecuencia se
puede dibujar el polgono de frecuencia. Se establece los puntos medios del intervalo,
denominados marca de clase, que se colocan en el eje horizontal o abscisa. Para cada
valor de la variable corresponder un valor de la frecuencia sealndose en el plano
cartesiano por un punto; luego de establecidos todos los puntos, se unen mediante lneas
rectas, las que en conjunto forman el polgono. El polgono de frecuencia para el ejemplo
anterior es:
Ojiva
Es el grfico de las frecuencias acumuladas. Para el trazado de esta grafica, en primer lugar,
se ubican los puntos en el plano cartesiano. Dichos puntos se determinan teniendo en cuenta
la marca de clase (eje x) y las frecuencias absolutas o relativas acumuladas (eje y) tal como
se presenta a continuacin:
57-59 4 3 12
54-56 5 2 10
51-53 7 1 7 x = 49 + 2.05
48-50 8 0 0
45-47 5 -1 -5 x = 51.05
42-44 3 -2 -6
39-41 2 -3 -6 El puntaje medio es: 51.05
36-38 1 -4 -4
33-35 2 -5 -10
METODO DIRECTO. (Mtodo largo)
Pasos para calcular la media aritmtica, usando ste mtodo:
1.- Se elabora una columna con los puntos medios xi de cada clase.
2.- En otra columna se escribe el producto entre las frecuencias y el punto medio de cada
clase (fi.xi)
3.- Se obtiene la sumatoria de los valores de la columna fi.xi
4.- Se reemplazan los valores obtenidos en la frmula siguiente:
EJEMPLO:
CLASE fi xi fixi
66-68 1 67 67
63-65 2 64 128
60-62 4 61 244
57-59 4 58 232 x= 2246
54-56 5 55 275 44
51-53 7 52 364 x = 51.05
48-50 8 49 392
45-47 5 46 230
42-44 3 43 129
39-41 2 40 80
36-38 1 37 37
33-35 2 34 68
N=44 Efixi= 2246
LA MEDIANA. (Md)
Para calcular la mediana a partir de un conjunto de datos que han sido organizados
previamente en una tabla de distribucin de frecuencias, se procede de la siguiente manera:
1.- Se anexa a la tabla dada una columna fa de frecuencias acumuladas.
2.- Se divide entre 2 el nmero total de casos, obteniendo N/2.Es decir,se determina el
nmero de casos que han de estar por debajo y por encima de la mediana.(En la tabla del
ejemplo que usaremos, N=38 por lo tanto N/2= 38/2= 19. Luego, la mediana es el valor que
deja 19 observaciones tanto por debajo como por encima de l.
3.- Se identifica en la columna fa, un valor que sea igual o inmediato superior a N/2; En sta
clase est la mediana.(En la tabla del ejemplo dado, en la columna fa, el valor 24 es
inmediato superior a 19 por lo cual, la clase 90-94 contiene a la mediana.)
4.- Se identifica la frecuencia acumulada fa de la clase anterior a la que contiene a la
mediana. ( En el ejemplo, 14 es la frecuencia acumulada de la clase 85-89 que precede a 9094 que contiene a la mediana.)
5.- Se identifica la frecuencia fi de la clase que contiene a la mediana. En el ejemplo sta es
10.
6.- Se identifica el lmite real inferior de la clase que contiene a la mediana. En el ejemplo,
ste es 89.5.
7.- Se reemplazan stos valores en la frmula
EJEMPLO:
CLASE fi fa
95-99 14 38
90-94 10 24
85-89 6 14 Md = 89.5 + 2.5
80-84 4 8
75-79 2 4 Md = 92
70-74 2 2
N=38
Interpretacin:
Por encima y por debajo de 92,se encuentra el 50% de los casos, es decir, 19.
LA MODA O EL MODO. (Mo)
Se define como el punto medio de la CLASE de mayor frecuencia.
En el primer ejemplo, Mo=49.
En el segundo ejemplo, Mo=97
MEDIDAS DE VARIABILIDAD
Las medidas de variabilidad nos informan sobre el grado de concentracin o dispersin que
presentan los datos respecto a su promedio. Llamaremos homognea, concentrada o poco
dispersa a aquella distribucin en la que todos los datos estn cercanos al centro, como 4 4 5
5 5 5 6 6 6 6 7, y heterognea o dispersa a la distribucin con datos ms separados del
centro, como 1 3 5 8 10 16 20.
Existen muchas formas de medir la variabilidad. Se Destacan las ms importantes:
RANGO
Tambin llamado Recorrido o Amplitud total, es la diferencia entre el mximo valor del
conjunto de datos y el mnimo de ellos. A mayor rango, mayor dispersin.
El rango del conjunto 4 6 4 7 8 6 5 3 4 7 7 9 6 5 es 6, la diferencia entre el mximo 9 y el
mnimo 3.
A veces se usa el Rango verdadero que consiste en considerar cada dato rodeado de una
unidad, por efecto de los redondeos, con lo que en el ejemplo anterior el mnimo sera 2,5 y
el mximo 9,5. Con ello el rango se convertira en 7.
No es una medida buena, pues ignora todo lo que ocurre dentro de ese rango.
DESVIACIN MEDIA
Es una medida de la dispersin consistente en la media aritmtica de las desviaciones
individuales respecto a la media, tomadas en valor absoluto. Tambin se usan desviaciones
respecto a la mediana.
VARIANZA
Es una medida muy sensible de la variabilidad y base de muchas tcnicas estadsticas.
Junto con la media forma el conjunto ms importante de medidas.
Es propia de las medidas de intervalo o razn. Su inconveniente es que no usa la misma
unidad que los datos, sino su cuadrado.
No se deben comparar varianzas en conjuntos de unidades muy distintas, como estatura e
inteligencia.
En teora del muestreo se sustituye por la cuasi-varianza, de idntica frmula, pero con
cociente N-1 en lugar de N. En este caso no sera vlida la segunda frmula.
DESVIACIN TPICA
Es la raz cuadrada de la anterior. Su objeto es conseguir medir la variabilidad en las mismas
unidades que los datos. As, un conjunto medido en metros, tendr la varianza medida en
metros cuadrados, pero la desviacin tpica en metros.
Como en la varianza, para datos aislados basta con suprimir las frecuencias ni.
La desviacin tpica s es base de muchas tcnicas, al igual que la media y la varianza. Su
gran ventaja es estar medida en las mismas unidades que los datos y la media, lo que
permite establecer razones y proporciones entre ellas.
La desviacin tpica cumple la llamada desigualdad de Tchebychev: segn la cual, los datos
que se alejan de la media una distancia igual o menor que s, multiplicado por un coeficiente k
suponen ms de la proporcin 1-1/k2. As, el 75% de los datos al menos, se encuentra a
menos de dos desviaciones tpicas y el 89% a menos de tres.
Coeficiente de Variacion
El coeficiente de variacin es la relacin entre la desviacin tpica de una muestra y su
media.