Medidas de Dispersión

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 3

ESTADÍSTICA GENERAL

Docente: Marco Antonio Achahui Follana

MEDIDAS DE DISPERSION

Una de las funciones de la estadística se relaciona con el cálculo de la variabilidad. Conocer las medidas de dispersión
(variación) es de suma importancia, ya que la no consideración de diferencias puede conducir a errores de juicio en la
toma de decisiones (Sánchez, 1992). Una medida particular de tendencia central da lugar a un valor que, en cierto
sentido, "representa" a todos los valores que toma la variable estadística en estudio (Glass & Stanley, 1974). Sin
embargo, cuando se usa cualquier medida de tendencia central, ésta nos da sólo un cuadro incompleto de un conjunto
de datos y, por consiguiente, podría conducir a conclusiones erróneas o distorsionadas (Levin, 1979), porque este
proceso pasa por alto las diferencias entre las puntuaciones en sí (Glass & Stanley, 1974). Sería incorrecto concluir
que dos conjuntos de datos son iguales sólo porque tienen las mismas medidas de tendencia central, es decir, que el
valor de la media aritmética sea el mismo para ambos conjuntos, cuando las distancias de los datos de ambos
conjuntos se distribuyen de una forma diferente (Elorza, 1987).
Para describir una distribución en forma más completa o para interpretar con más detalle una calificación, necesitamos
información adicional acerca de la dispersión de las calificaciones con respecto a nuestra medida de tendencia central
(Haber & Runyon, 1992). Es necesario un índice de cómo están diseminados los valores alrededor del centro de la
distribución. A tales distancias se les suele denominar medidas de dispersión o variación.
Las medidas de dispersión, también conocidas como medidas de variación o variabilidad, indican el grado en que los
sujetos se dispersan respecto al centro de la distribución. A través de las mismas el investigador verifica cuán
homogéneos, parecidos o estables son los elementos bajo estudio, en contraste con otros grupos de interés (Sánchez,
1992). Si todos los valores son los mismos, no existe dispersión; si no todos son los mismos, hay dispersión en los
datos. La magnitud de la dispersión puede ser pequeña, cuando los valores, aunque diferentes, están próximos entre sí
y si los valores están ampliamente separados, la dispersión es mayor.
Las medidas de dispersión o variabilidad más conocidas son:
Rango o recorrido
Varianza y Desviación estándar
Coeficiente de variación

RANGO
Una manera de medir la variación en un conjunto de valores es calculando el rango. El rango es la más sencilla y
directa de las medidas de dispersión (Runyon & Haber, 1992) y a la vez la menos confiable (Sánchez, 1992). Se trata
simplemente de la distancia entre el valor menor y el valor mayor en un conjunto de observaciones. El hecho de que
sólo tome en consideración dos valores, hace que la medida sea muy pobre. Nótese que, si hay un valor extremo en la
distribución, se tendrá la impresión de que la dispersión es grande cuando, en realidad, si hiciéramos caso omiso de
esa calificación, podríamos encontrar que dicha distribución es, por el contrario, una distribución "compacta". El
rango o recorrido refleja únicamente las dos calificaciones extremas de la distribución (Runyon & Haber, 1992), es
decir, solamente dos puntuaciones exactas de un grupo son las que los determina, ignorando así, todas las demás
puntuaciones.
El rango no puede darnos una idea precisa con respecto a la dispersión y en el mejor de los casos, debe considerarse
sólo como un índice preliminar o muy aproximado (Levin, 1977). Puede expresarse de la siguiente manera:
R = XMax - XMin
Xmax := valor máximo de los datos observados
Xmin := valor mínimo de los datos observados

VARIANZA Y DESVIACIÓN ESTÁNDAR


La desviación estándar es la medida de dispersión más adecuada para la estadística descriptiva (Haber & Runyon,
1992). Tanto en la escala de intervalo como en las de razones, la varianza y la desviación estándar son las mejores
medidas de dispersión. Toman en consideración todos los valores y controlan por el efecto de valores extremos. La
desviación estándar permite una interpretación precisa de las calificaciones dentro de una distribución (Runyon &
Haber, 1992). Si todos los sujetos son iguales en una característica (por ejemplo, índice académico), entonces el
resultado será igual a cero. Por el contrario, si aumentan las diferencias, aumentará el índice, alejándose más y más
del punto cero. La varianza se define como las desviaciones cuadradas medias respecto a la media.
Varianza
La varianza también está definida como el promedio de las diferencias elevadas al cuadrado entre cada valor que se
tiene en la muestra (xi) y la media aritmética X .

 (x  X ) i
2

1  k 2 
- Varianza para datos no agrupados: S2     xi  nX 2 
n 1 n  1  i 1 
k

 n (x  X )
i i
2
1  k 
- Varianza para datos agrupados: S2  i 1
   ni xi2  nX 2 
n 1 n  1  i 1 
m m

 (ni  1)Si2   ni ( X i  X )2
- Varianza para submuestras: S2  i 1 i 1

n 1

PROPIEDADES DE LA VARIANZA

Sean dos" x" e " y " a


dos variables aleatorias con varianza finita y
, se tiene las siguientes propiedades:
1. Var(x) 0 lavar ianzadeunavar iableesmayor oigualacero
2. Var(a) 0 lavar ianzadeunaconstanteescero
2
3. Var(ax) a Var(x) var ianzadelproductodeunaconstantepor unavar iable
4. Var(x y) Var(x) Var(y) 2Cov(x,y) Cov(x,y)eslacov arianzade xe y
5. Var(x y) Var(x) Var(y) var ianzaparavar iablesaleatoriasindependientes

Ejemplo:
Los siguientes datos son la cantidad de glucosa en miligramos encontrada en muestras de sangre de algunos pacientes,
14.2, 12.1, 15.6, 18.1, 14.3, determine su varianza.

Solución:
Lo primero que hay que calcular es la media aritmética de la muestra como ya se ha hecho anteriormente.

 14.2  12.1  15.6  18.1  14.3 74.3


x   14.86mg
5 5
2 2 2
( 14.2  14.86 )  ( 12.1  14.86 )  ....  ( 14.3  14.86 )
s2  
5 1

0.4356  7.6176  0.5476  10.4976  0.3136 19.412 2


s2    4.853mg
4 4

Desviación estándar
Es la desviación o diferencia promedio que existe entre cada valor de la muestra y la media aritmética de la muestra. Y
se obtiene a partir de la varianza, sacándole raíz cuadrada.
S = S2

Ejemplo
Por tanto, la desviación estándar de la muestra anterior sería;

2
S= 4.853mg  2.2029mg

La interpretación de este resultado sería, que la cantidad de glucosa encontrada en la muestra es en promedio de 14.86
miligramos y que la cantidad de glucosa en la muestra se aleja o dispersa en promedio 2.2029 mg alrededor de la
media.
COEFICIENTE DE VARIACIÓN

Otra medida de dispersión que se suele utilizar es el coeficiente de variación (CV). Es una medida de dispersión
relativa de los datos y se calcula dividiendo la desviación típica muestral por la media y multiplicando el cociente por
100.
S
CV = x 100%
X
Su utilidad estriba en que nos permite comparar la dispersión o variabilidad de dos o más grupos o comparar
dispersiones a escalas distintas pues es una medida invariante ante cambios de escala. Sirve para comparar variables
que están a distintas escalas pero que están correlacionadas estadísticamente y sustantivamente con un factor en
común. Es decir, ambas variables tienen una relación causal con ese factor. Es importante que todos los valores sean
positivos y su media por tanto un valor positivo. A mayor valor de C.V. mayor heterogeneidad de los valores de la
variable; y a menor C.V., mayor homogeneidad en los valores de la variable

Ejemplo
Si tenemos el peso de 5 pacientes (70, 60, 56, 83 y 79 Kg) cuya media es de 69,6 kg. y su desviación típica de 10,44 y
la TAS de los mismos (150, 170, 135, 180 y 195 mmHg) cuya media es de 166 mmHg y su desviación típica de 21,3.
La pregunta sería: ¿qué distribución es más dispersa, el peso o la tensión arterial? Si comparamos las desviaciones
típicas observamos que la desviación típica de la tensión arterial es mucho mayor; sin embargo, no podemos comparar
dos variables que tienen escalas de medidas diferentes, por lo que calculamos los coeficientes de variación:
S 10, 44
CV de la variable peso =   0,15
X 69, 6

S 21,3
CV de la variable TAS =   0,128
X 166
A la vista de los resultados, observamos que la variable peso tiene mayor dispersión.

También podría gustarte