Medidas de Dispersión

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 8

ESTADISTICA

MEDIDAS DE DISPERSIÓN

Las medias de tendencia central o posición nos indican donde se sitúa un dato
dentro de una distribución de datos. Las medidas de dispersión, variabilidad o
variación nos indican si esos datos están próximos entre sí o sí están dispersos, es
decir, nos indican cuán esparcidos se encuentran los datos. Estas medidas de
dispersión nos permiten apreciar la distancia que existe entre los datos a un cierto
valor central e identificar la concentración de los mismos en un cierto sector de la
distribución, es decir, permiten estimar cuán dispersas están dos o más
distribuciones de datos.
Estas medidas permiten evaluar la confiabilidad del valor del dato central de un
conjunto de datos, siendo la media aritmética el dato central más utilizado. Cuando
existe una dispersión pequeña se dice que los datos están dispersos o acumulados
cercanamente respecto a un valor central, en este caso el dato central es un valor
muy representativo.
En el caso que la dispersión sea grande el valor central no es muy confiable.
Cuando una distribución de datos tiene poca dispersión toma el nombre de
distribución homogénea y si su dispersión es alta se llama heterogénea.
Las medidas de tendencia central se utilizan con bastante frecuencia para resumir
un conjunto de cantidades o datos numéricos a fin de describir los datos
cuantitativos que los forman, las medidas de dispersión son la varianza, la
desviación media, la desviación estándar y el coeficiente de variación.
1. DESVIACIÓN MEDIA
La desviación media o desviación promedio es abreviada por MD. Mide la
desviación promedio de valores con respecto a la media del grupo, sin tomar en
cuenta el signo de la desviación, su expresión matemática es.

Donde:
𝑥̅ es el promedio
𝑥𝑖 es la marca de clase
𝑓𝑖 es la frecuencia absoluta
N es el total de datos
| | indica valor absoluto
ESTADISTICA

2. VARIANZA
La varianza es la media aritmética de los cuadrados de las desviaciones respecto a
la media aritmética, es decir, es el promedio de las desviaciones de la media
elevadas al cuadrado, su expresión matemática es.

∑ 2
(𝑥𝑖 − 𝑥̅ ) ∗ 𝑓𝑖
S2 =
𝑛−1
Donde:
S 2 varianza
Σ sumatoria
𝑥𝑖 marca de clase
𝑥̅ es el promedio
𝑓𝑖 es la frecuencia absoluta
𝑛 − 1 es el total de datos de la muestra menos 1.
Para el cálculo de la varianza de una muestra se divide por n-1 en lugar de N,
debido a que se tiene n-1 grados de libertad en la muestra. Otra razón por la que se
divide por n-1 es debido a que una muestra generalmente está un poco menos
dispersa que la población de la cual se tomó. Al dividir por n-1 en lugar de N se
cumple con la tendencia y sentido lógico de que la varianza y desviación estándar
de la muestra deben tener un valor más pequeño que la varianza y desviación
estándar de la población.
3. DESVIACION TIPICA O ESTANDAR
La desviación típica o desviación estándar (denotada con el símbolo σ o s,
dependiendo de la procedencia del conjunto de datos) es una medida de dispersión
para variables de razón (variables cuantitativas o cantidades racionales) y de
intervalo.
La desviación estándar o desviación típica es la raíz de la varianza. La varianza y la
desviación estándar proporcionan una medida sobre el punto hasta el cual se
dispersan las observaciones alrededor de su media aritmética, su expresión
matemática es.

∑(𝑥𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖
𝑆 = √𝑆 2 = √
𝑛−1

𝑆 desviación estándar o típica


ESTADISTICA

4. COEFICIENTE DE VARIACION
El coeficiente de variación, también denominado como coeficiente de variación de
Pearson, es una medida estadística que nos informa acerca de la dispersión relativa
de un conjunto de datos. Es decir, nos informa al igual que otras medidas de
dispersión, de si una variable se mueve mucho, si el coeficiente de variación es
menor a 25% los datos de la muestra son homogéneas y si es mayor a 25%
entonces los datos son heterogéneos, su expresión matemática es.
𝑆
𝐶. 𝑉 =
𝑥̅
El coeficiente de variación se suele expresar en porcentajes:
.
𝑆
𝐶. 𝑉 = ∗ 100%
𝑥̅
Donde

𝐶. 𝑉 coeficiente de variación
𝑆 desviación estándar
𝑥̅ es la media aritmética o promedio

EJEMPLO
Continuamos con el ejemplo de los recién nacidos, para visualizar las medias de
dispersión.
 DESVIACION MEDIA
Iniciemos calculando la desviación media, para ello vamos a agregar algunas
columnas a nuestra tabla, como se observa a continuación, recuerda que el valor
absoluto es siempre positivo.
ESTADISTICA

Aplicamos la formula

19.2
𝐷𝑀 = = 0.384
50
Observa que la desviación media es 0.384 kg, es la diferencia media entre un
dato y otro.
 VARIANZA

Ahora calculemos la varianza, para ello vamos a agregar otras 2 columnas a


nuestra tabla, como se muestra a continuación.

Aplicamos la fórmula de la varianza

2
∑(𝑥𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖
S =
𝑛−1
11.465
S2 = = 0.234
49
La varianza entre los datos es de 0.234 kg.

 DESVIACION ESTANDAR
Ahora calculemos la desviación estándar mediante la formula

∑(𝑥𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖
𝑆 = √𝑆 2 = √
𝑛−1
ESTADISTICA

𝑆 = √0.234 = 0.483
La desviación estándar entre los datos es de 0.483 kg.
 COEFICIENTE DE VARIACION
Por ultimo calculemos el coeficiente de variación para ver si los datos son
homogéneos o heterogéneos, mediante la fórmula.
𝑆
𝐶. 𝑉 = ∗ 100%
𝑥̅
0.483
𝐶. 𝑉 = ∗ 100%
̅̅̅̅
2.9
𝐶. 𝑉 = 16.6%
Como podrás observar, los datos son homogéneos, es decir, no están muy
alejados uno del otro.

HISTOGRAMAS

Un histograma es la representación gráfica en forma de barras, que simboliza la


distribución de un conjunto de datos. Sirven para obtener una "primera vista"
general, o panorama, de la distribución de la población, o de la muestra, respecto a
una característica, cuantitativa y continua.
ESTADISTICA

En un histograma el eje de las (o abscisas) consiste del rango en el cual se


encuentran los datos. Ahora, las bases de los rectángulos consisten de los
intervalos en los cuales agrupamos dichos datos.

Por otro lado, en el eje de las (u ordenadas) tenemos más opciones,


dependiendo estas opciones es el tipo de histograma que tenemos. Los dos tipos
principales de histogramas son los siguientes:

Histograma de frecuencias absolutas. Representa la frecuencia absoluta


mediante la altura de las barras.

Histograma de frecuencias relativas. Representa la frecuencia relativa mediante


la altura de las barras.

 Así, ya que conocemos las características de un histograma, tenemos que


para construir uno, dado un conjunto de datos, debemos seguir los siguientes
pasos.
 Dibujamos el eje de las abscisas de tal forma que incluya como mínimo el
rango de los datos y, posteriormente, dividimos este rango en los intervalos
dados.
 Dibujamos el eje de las ordenadas representando las frecuencias absolutas
o relativas según sea el caso.
 Se dibujan los rectángulos de anchura igual y proporcional al intervalo y de
altura igual a la frecuencia absoluta o relativa, según sea el caso.

POLÍGONO DE FRECUENCIAS ASOCIADO A UN HISTOGRAMA

Un polígono de frecuencias es un gráfico que se utiliza para variables


cuantitativas discretas. Se representa mediante puntos que señalan la frecuencia
absoluta de cada valor y líneas que unen los puntos consecutivos.
Se puede dibujar un polígono de frecuencias a partir de un histograma. Para ello se
deben unir los puntos medios de las bases superiores de los rectángulos.
ESTADISTICA

También se puede construir un histograma o su polígono de frecuencias, colocando


en ordenadas las frecuencias acumuladas.

EJEMPLO
Para finalizar nuestro ejercicio de los pesos en kilogramos de 50 recién nacidos,
vamos a obtener el histograma y el polígono de frecuencias para visualizar cómo se
comportan los datos, para ello vamos a utilizar nuestra tabla de distribución para
obtener los datos correspondientes.

Empecemos con el histograma de las frecuencias absolutas y queda de la


siguiente manera.

𝑓𝑖

Ahora calculemos el histograma de las frecuencias absolutas acumuladas, y


queda de la siguiente forma.
ESTADISTICA

𝐹𝑖

Ahora dibujemos el polígono de frecuencias absolutas, y queda como se muestra


a continuación.
Polígono de frecuencias absolutas 𝑓𝑖

Por ultimo dibujemos el polígono de frecuencias absolutas acumuladas, y queda


así.

Polígono de frecuencias absolutas acumuladas 𝐹𝑖

También podría gustarte