Medidas de Dispersión
Medidas de Dispersión
Medidas de Dispersión
MEDIDAS DE DISPERSIÓN
Las medias de tendencia central o posición nos indican donde se sitúa un dato
dentro de una distribución de datos. Las medidas de dispersión, variabilidad o
variación nos indican si esos datos están próximos entre sí o sí están dispersos, es
decir, nos indican cuán esparcidos se encuentran los datos. Estas medidas de
dispersión nos permiten apreciar la distancia que existe entre los datos a un cierto
valor central e identificar la concentración de los mismos en un cierto sector de la
distribución, es decir, permiten estimar cuán dispersas están dos o más
distribuciones de datos.
Estas medidas permiten evaluar la confiabilidad del valor del dato central de un
conjunto de datos, siendo la media aritmética el dato central más utilizado. Cuando
existe una dispersión pequeña se dice que los datos están dispersos o acumulados
cercanamente respecto a un valor central, en este caso el dato central es un valor
muy representativo.
En el caso que la dispersión sea grande el valor central no es muy confiable.
Cuando una distribución de datos tiene poca dispersión toma el nombre de
distribución homogénea y si su dispersión es alta se llama heterogénea.
Las medidas de tendencia central se utilizan con bastante frecuencia para resumir
un conjunto de cantidades o datos numéricos a fin de describir los datos
cuantitativos que los forman, las medidas de dispersión son la varianza, la
desviación media, la desviación estándar y el coeficiente de variación.
1. DESVIACIÓN MEDIA
La desviación media o desviación promedio es abreviada por MD. Mide la
desviación promedio de valores con respecto a la media del grupo, sin tomar en
cuenta el signo de la desviación, su expresión matemática es.
Donde:
𝑥̅ es el promedio
𝑥𝑖 es la marca de clase
𝑓𝑖 es la frecuencia absoluta
N es el total de datos
| | indica valor absoluto
ESTADISTICA
2. VARIANZA
La varianza es la media aritmética de los cuadrados de las desviaciones respecto a
la media aritmética, es decir, es el promedio de las desviaciones de la media
elevadas al cuadrado, su expresión matemática es.
∑ 2
(𝑥𝑖 − 𝑥̅ ) ∗ 𝑓𝑖
S2 =
𝑛−1
Donde:
S 2 varianza
Σ sumatoria
𝑥𝑖 marca de clase
𝑥̅ es el promedio
𝑓𝑖 es la frecuencia absoluta
𝑛 − 1 es el total de datos de la muestra menos 1.
Para el cálculo de la varianza de una muestra se divide por n-1 en lugar de N,
debido a que se tiene n-1 grados de libertad en la muestra. Otra razón por la que se
divide por n-1 es debido a que una muestra generalmente está un poco menos
dispersa que la población de la cual se tomó. Al dividir por n-1 en lugar de N se
cumple con la tendencia y sentido lógico de que la varianza y desviación estándar
de la muestra deben tener un valor más pequeño que la varianza y desviación
estándar de la población.
3. DESVIACION TIPICA O ESTANDAR
La desviación típica o desviación estándar (denotada con el símbolo σ o s,
dependiendo de la procedencia del conjunto de datos) es una medida de dispersión
para variables de razón (variables cuantitativas o cantidades racionales) y de
intervalo.
La desviación estándar o desviación típica es la raíz de la varianza. La varianza y la
desviación estándar proporcionan una medida sobre el punto hasta el cual se
dispersan las observaciones alrededor de su media aritmética, su expresión
matemática es.
∑(𝑥𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖
𝑆 = √𝑆 2 = √
𝑛−1
4. COEFICIENTE DE VARIACION
El coeficiente de variación, también denominado como coeficiente de variación de
Pearson, es una medida estadística que nos informa acerca de la dispersión relativa
de un conjunto de datos. Es decir, nos informa al igual que otras medidas de
dispersión, de si una variable se mueve mucho, si el coeficiente de variación es
menor a 25% los datos de la muestra son homogéneas y si es mayor a 25%
entonces los datos son heterogéneos, su expresión matemática es.
𝑆
𝐶. 𝑉 =
𝑥̅
El coeficiente de variación se suele expresar en porcentajes:
.
𝑆
𝐶. 𝑉 = ∗ 100%
𝑥̅
Donde
𝐶. 𝑉 coeficiente de variación
𝑆 desviación estándar
𝑥̅ es la media aritmética o promedio
EJEMPLO
Continuamos con el ejemplo de los recién nacidos, para visualizar las medias de
dispersión.
DESVIACION MEDIA
Iniciemos calculando la desviación media, para ello vamos a agregar algunas
columnas a nuestra tabla, como se observa a continuación, recuerda que el valor
absoluto es siempre positivo.
ESTADISTICA
Aplicamos la formula
19.2
𝐷𝑀 = = 0.384
50
Observa que la desviación media es 0.384 kg, es la diferencia media entre un
dato y otro.
VARIANZA
2
∑(𝑥𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖
S =
𝑛−1
11.465
S2 = = 0.234
49
La varianza entre los datos es de 0.234 kg.
DESVIACION ESTANDAR
Ahora calculemos la desviación estándar mediante la formula
∑(𝑥𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖
𝑆 = √𝑆 2 = √
𝑛−1
ESTADISTICA
𝑆 = √0.234 = 0.483
La desviación estándar entre los datos es de 0.483 kg.
COEFICIENTE DE VARIACION
Por ultimo calculemos el coeficiente de variación para ver si los datos son
homogéneos o heterogéneos, mediante la fórmula.
𝑆
𝐶. 𝑉 = ∗ 100%
𝑥̅
0.483
𝐶. 𝑉 = ∗ 100%
̅̅̅̅
2.9
𝐶. 𝑉 = 16.6%
Como podrás observar, los datos son homogéneos, es decir, no están muy
alejados uno del otro.
HISTOGRAMAS
EJEMPLO
Para finalizar nuestro ejercicio de los pesos en kilogramos de 50 recién nacidos,
vamos a obtener el histograma y el polígono de frecuencias para visualizar cómo se
comportan los datos, para ello vamos a utilizar nuestra tabla de distribución para
obtener los datos correspondientes.
𝑓𝑖
𝐹𝑖