Módulo 3
Módulo 3
Módulo 3
Las medidas de dispersin o variabilidad son nmeros reales que miden el grado o
nivel de separacin de los datos con respecto a un valor central, que generalmente
es la media aritmtica. Las principales medidas de dispersin son:
El rango,
El rango intercuartil,
La varianza,
La desviacin estndar, y
El coeficiente de variacin.
R = xmax - xmin
El rango de los datos es una medida de dispersin muy fcilmente calculable, pero
es muy inestable, ya que depende nicamente de los dos valores extremos de los
datos. Su valor puede cambiar grandemente s se aade o elimina un slo dato.
Por tanto, su uso es muy limitado. Por ejemplo, las dos series de datos:
a) 1, 4, 4, 5, 5, 5, 5, 6, 6, 9
b) 1, 2, 3, 4, 5, 6, 7, 8, 9
RI = Q3 Q1
El rango intercuartil es una medida que excluye el 25% superior (cuarto superior) y
el 25% inferior (cuarto inferior), dando un rango dentro del cual se encuentra el
50% central de los datos observados y a diferencia del rango de los datos no se
encuentra afectada por los valores extremos.
El rango semiintercuartil denotado por RSI, es igual al rango intercuartil dividido por
2.
Si la distribucin de frecuencias de los datos es simtrica, entonces, los cuartiles
Q1 y Q3 son equidistantes de la mediana Q2. En este caso, el rango intercuartil es
equivalente a Q2 RSI. Por lo tanto, Q2 RSI contiene tambin exactamente el
50% de los datos.
Si la distribucin es casi simtrica, se concluye que el intervalo: mediana RSI
contiene aproximadamente el 50% de los datos.
9.1.3.1 La varianza
La varianza entendida como una media cuadrtica calculada de una muestra ser
denotada por 2 y si es calculada de una poblacin se denotar por 2. Los
mtodos de clculo las dos varianzas son idnticos, por esto, el mtodo es
conocido como mtodo de poblacin (ver nota sobre varianza poblacional).
Esto es:
= 2
Clculo de la varianza
1) Varianza de datos no agrupados
La varianza de n mediciones x1, x2, xn de alguna variable cuantitativa X cuya
media es , es el nmero real.
=1(1 )
2
2 = =
Por lo tanto:
2
=1 1
2 = 2
Ejemplo 1
Solucin
2670
n= 45 , =1 = 26705, = = 59.333, =1 12 = 1643052
45
2
=1 1 164530
2 = 2 = (59.333)2 = 135.77852
45
= 2 = 135.778 = 11.625
=1 1 (1 )
2
2 = =
2
=1 1 1
Por lo tanto, 2 = 2
Ejemplo 2
Calcule la varianza y la desviacin estndar de la distribucin de frecuencias del
nmero de hijos de la muestra de 20 familias del Cuadro 3.1
Solucin
La distribucin del Cuadro 3.1 se repite en el Cuadro 9.2 donde, se ha insertado
una columna de produccin 1 12 para el cmputo de la varianza.
0 1 0 0
1 4 4 4
2 7 14 28
3 6 18 54
4 2 8 32
Total 20 44 118
44
Entonces, n =20, k = 5, =1 = 44 = 20 = 22, =1 2 = 118
2
=1 118
2 = 2 = (2.2)2 = 1.06 2
20
=1 ( )
2
2 = =
Se comprueba que:
=1 ( )2 = =1 2 = 2
Por lo tanto:
2
=1
2 = 2
Solucin
Salarios mi fi
[26,34[ 30 1 30 900
[34,42[ 38 2 76 2888
[42,50[ 46 4 184 8464
[50,58[ 54 10 540 29160
[58,66[ 62 16 992 61504
[66,74[ 70 8 560 39200
[74,821 78 4 312 24336
Total 45 2694 166452
2
=1 166452 2694 2
2 = 2 = ( ) = 114.916$2
45 45
Y la varianza es el nmero: 2 = =1 2 - 2
La varianza 2 de una poblacin finita de N datos x1, x2, ,xk sin agrupar y cuya
media es se define por:
=1( )
2 2
=1
2 = = - 2
1
=2.
Para que el promedio de todas las varianzas sea igual a 2 se aplica la varianza
2
1 = =1( )2 /( 1) (mtodo de muestra) que se obtiene de multiplicar a 2
por n(n-1). Por esta razn, algunos autores de esa materia definen la varianza (en
estadstica descriptiva) con denominador n-1.
Cada poblacin tiene una varianza, que se simboliza con 2-(sigma cuadrada). Para
calcular la varianza de una poblacin, dividimos la suma de las distancias al
cuadrado entre la media y cada elemento de la poblacin entre el nmero total de
observaciones de dicha poblacin. Al elevar al cuadrado cada una de las distancias,
logramos que todos los nmeros que aparecen sean positivos y, al mismo tiempo,
asignamos ms peso a las desviaciones ms grandes.
()2 2
2 = = 2 Ecua. 9.1
en la que:
2 = varianza de la poblacin
()2
En la ecuacin 9.1, la expresin es la definicin de 2. La ltima expresin
2
- 2 , es matemticamente equivalente a la definicin, pero a menudo resulta
en la que:
x = observacin
= media de la poblacin
N = nmero total de elementos de la poblacin
= suma de todos los valores (x - )2, o todos los valores x2
= desviacin estndar de la poblacin
2 = varianza de la poblacin
La raz cuadrada de un nmero positivo puede ser tanto positiva como negativa,
pues a2 = (-a)2. Cuando tomamos la raz cuadrada de la varianza para calcular la
desviacin estndar, sin embargo, los estadsticos solamente consideran la raz
cuadrada positiva.
resultado pero con un poco menos de trabajo, ya que no tenemos que calcular las
desviaciones con respecto a la media.) Tomando la raz cuadrada de 2, podemos
calcular la desviacin estndar, 0.058 por ciento.
0.051 0.4643
= = (0.166)2
15 15
Ecua. 9.2
= 2
= 0034
= 0.058%
Fig. 9.1
en la que:
Resultado estndar = Ecua. 9.4
0.1080.166
=
0.058
0.058
=
0.058
= -1
Resultado estndar = Ecua. 9.4
0.2820.166
=
0.058
0.116
=
0.058
=2
El resultado estndar indica que una impureza de 0.282% se desva de la media en
2(0.058) = 0.116 unidades, que es igual a +2, en trminos de unidades de
desviacin estndar, alejado de la media.
En el ejemplo de inicio del presente captulo, los datos con respecto a las ventas en
100 restaurantes de comida rpida ya se encontraban agrupados en una
distribucin de frecuencias. Con tales datos, podemos utilizar las siguientes
frmulas para calcular la varianza y la desviacin estndar:
()2 2
2 = = 2 Ecua. 9.5
y
()2 2
= 2 = = 2 Ecua. 9.6
En donde:
2 = varianza de la poblacin
= desviacin estndar de la poblacin
f = frecuencia de cada una de las clases
x = punto medio de cada clase
= media de la poblacin
N = tamao de la poblacin
En la tabla 9.6 se muestra cmo aplicar estas ecuaciones para hallar la varianza y
la desviacin estndar de las ventas en 100 restaurantes de comida rpida.
Dejamos como ejercicio para el lector curioso verificar que la segunda mitad de la
2
ecuacin 9.5, 2 2 .
( )2 2 2
2 = = - Ecua. 9.6
1 1 1
y
( )2 2 2
s= 2 = = Ecua. 9.7
1 1 1
en las que:
s2 - varianza de la muestra
s = desviacin estndar de la muestra
x = valor de cada una de las n observaciones
= media de la muestra
n - 1 = nmero de observaciones de la muestra menos 1
= 66,800
= 258.5 desviacin estndar = $258,500
(
)2 1,593,770 23,496,182 2
( )2
s2 3-17
1
1,593,770
=
11
s = 2 3-18
o = 144,888
2 2
s2 = 3-17
1 1
23,496.182 12(1,351)2
=
11 11
1,593,770
=
11
= 144,888
Resultado estndar de la muestra = Ecua.9.8
8631,351
=
380.64
488
=
380.64
= -1.28
50 56 55 49 52 57 56 57 56 59
54 55 61 60 51 59 62 52 54 49
17 21 18 27 17 21 20 22 18 23
CV = , o en%
1 14 2 14
CV = = = 0.875, 87.5% 2 = = = 127 127%
1 16 2 11
Z=
Ejemplo 4
Solucin
1413
En Matemticas z = = 0.333
3
1617
En Historia z= = -0.25
4
2 2
=1 1 ( + )
=1 1
2 = -( )2 , donde =
I- por ciento
2
x 100%
2
Por ejemplo, el intervalo [ 2 , + 2s], contiene por lo menos el I - =
22
3
75%, del total de los datos. El porcentaje de datos que se ubican fuera del
4
intervalo es menos de 25%.
Ejemplo 5
Solucin
Y = 1.30X + 50
65
Coeficiente de variacin en julio es: CVY = = = 0.2097.
310
Ejemplo 6
Si los salarios no agrupados de 120 obreros tienen una media de $300 y una
desviacin estndar de $30
Solucin
a) = $300, s = $30, de la relacin
c) Fuera del intervalo [$210, $390] est menos del 11.11% de los salarios. Si
el mnimo es $210, entonces, el porcentaje de salarios mayores que $390
es menos de 11.11%.
Ejemplo 7
Solucin
2 + 2 ) + (2 + 2 )
1 1 (1 3019200 +130000
= 1 1 1 1 1
2 = (230)2 = 1090$
80
6442448