Unidad 4 Estadist Desc C
Unidad 4 Estadist Desc C
Unidad 4 Estadist Desc C
UNIDAD
DIDÁCTICA UNA VARIABLE MEDIBLE (II):
PRINCIPALES MEDIDAS
4 DE DISPERSIÓN Y
MEDIDAS DE FORMA
OBJETIVOS DE LA UNIDAD
1. Medidas de dispersión
1.1. Error cuadrático medio (ECM) y error absoluto medio (EAM)
1.2. La varianza
1.3. La desviación estándar, desviación típica o desviación tipo
1.3.1. Aplicaciones de la desviación típica. Teorema de Chebyshov (Tchevychev o Tchebycheff)
1.3.2. Tipificación de variables
1.4. Coeficiente de variación
1.5. La mediana de las desviaciones absolutas (meda)
2. Medidas de forma
2.1. Medidas de simetría
2.1.1. Coeficientes de asimetría (sesgo) de Pearson
2.1.2. Coeficiente de asimetría de Fisher
2.2. Medidas de apuntamiento o curtosis
2.2.1. Coeficiente de apuntamiento o curtosis de Fisher
ACTIVIDADES DE AUTOCOMPROBACIÓN
ACTIVIDADES DE REPASO
TEST DE AUTOEVALUACIÓN
REFERENCIAS BIBLIOGRÁFICAS
www.udima.es 135
"Todos los derechos reservados. Cualquier forma de reproducción, distribución, comunicación pública o transformación de esta Unidad sólo puede ser realizada con la autorización de la Universidad a Distancia de Madrid, UDIMA, salvo excepción
prevista por la ley. Diríjase a CEDRO (Centro Español de Derechos Reprográficos, www.cedro.org) si necesita fotocopiar o escanear algún fragmento de esta obra (www.conlicencia.com; 91 702 19 70 / 93 272 04 47)".
ESTADÍSTICA DESCRIPTIVA
OBJETIVOS DE LA UNIDAD
En muchas ocasiones, las medidas de centralización no son suficientes para resumir las caracterís-
ticas principales de una distribución. Por ello, en esta Unidad didáctica estudiamos otro grupo de
parámetros y estadísticos que las complementen. Entre estos valores encontramos las medidas de dis-
persión, que permiten establecer si los datos muestrales analizados se encuentran más o menos cerca-
nos a las medidas de centralización definidas para la variable (varianza, desviación típica y coeficiente
de variación), y las medidas de forma, cuyo cometido será describir el grado de simetría con el que los
datos se agrupan en torno a sus valores centrales (coeficientes de sesgo) y si esta mayor o menor con-
centración da lugar a distribuciones más o menos apuntadas (coeficientes de apuntamiento o curtosis).
136 www.udima.es
"Todos los derechos reservados. Cualquier forma de reproducción, distribución, comunicación pública o transformación de esta Unidad sólo puede ser realizada con la autorización de la Universidad a Distancia de Madrid, UDIMA, salvo excepción
prevista por la ley. Diríjase a CEDRO (Centro Español de Derechos Reprográficos, www.cedro.org) si necesita fotocopiar o escanear algún fragmento de esta obra (www.conlicencia.com; 91 702 19 70 / 93 272 04 47)".
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
1. MEDIDAS DE DISPERSIÓN
Las medidas de centralización que hemos estudiado en la Unidad didáctica anterior permiten buscar
números reales que representan a la distribución de los datos en su conjunto. El problema es que
ninguno de estos valores centrales nos mide la representatividad o validez de la elección realizada. Una
medida como la media o la mediana solo da una idea del centro de los datos pero no dice nada acerca
de la dis- persión de los mismos. Por ejemplo, podemos tener una media de 5 con los siguientes datos
(5, 4, 6, 5, 5) pero también podemos tener una media de 5 con los datos (10, 0, 5, 9, 1). Evidentemente,
el primer gru- po de valores tiene menos variabilidad respecto al valor medio 5 ya que todos los datos
son 5 o valores muy cercanos a él. Por tanto, si hay muchos valores distintos del valor central elegido
dentro de la mues- tra, este será poco representativo.
Un valor pequeño en una medida de dispersión implica que los datos están situados muy próxi-
mos alrededor de la medida aritmética de forma que dicha media se considera representativa de dichos
datos. Por el contrario, un valor grande de la medida de dispersión supone que la media aritmética no
es fiable como representante de los datos.
Las medidas de dispersión pueden ser absolutas, cuando dependen de las unidades de medida de la
va- riable, o relativas, cuando se definen a través de un cociente y, por tanto, no dependen de las unidades
de medida de la variable analizada. Cuando las medidas de dispersión son absolutas, solo tienen sentido si
van acompañadas de un valor promedio. En este caso, las medidas de dispersión nos indicarán la
variabilidad de los datos en torno a su valor promedio, es decir si se encuentran muy o poco esparcidos en
torno a su centro. Las medidas relativas permiten comparar las dispersiones de distintas distribuciones
entre ellas.
Las unidades en las que se expresan las medidas de dispersión pueden ser las mismas en que vienen
me- didos los datos, en unidades al cuadrado, o pueden ser magnitudes escalares independientes de las
unidades de medida (como veremos al desarrollarlas en esta Unidad didáctica y en la siguiente). Pero a
efectos de compa- rar las dispersiones en dos o más variables estadísticas expresadas en las mismas o en
distintas unidades se utiliza el coeficiente de variación de Pearson que analizaremos con más detalle en un
epígrafe posterior.
Una forma de medir la representatividad que un determinado dato muestral, d, puede tener sobre
un conjunto de datos x1 , x 2 ,..., x n , es calcular el error cuadrático medio (ECM) y el error absoluto
medio (EAM).
Dada una muestra x1 , x 2 ,..., x n , decimos que el ECM cometido al tomar el número real d, como
representante de la muestra, es la expresión:
1
n 2
ECM d x d
n i 1 i
Por su parte, el EAM cuando tomamos el número real d como representante de la muestra, es:
1
EAM d n
n x d
i1 i
www.udima.es 137
ESTADÍSTICA DESCRIPTIVA
Cuando estos dos errores den lugar a valores pequeños indicarán que los datos de la muestra están
agrupados en torno al valor d escogido. Entonces, ¿qué valor d seleccionamos para representar la muestra?
Según utilicemos el ECM o EAM para medir la dispersión, el valor d representativo de la muestra será dis-
tinto, pero como el ECM es una función que presenta mejores propiedades desde el punto de vista
matemáti- co y estadístico, es la más utilizada para seleccionar el número real d que mejor resume los
datos muestrales.
De hecho, es posible demostrar (aunque no lo vamos a hacer) que si seguimos el criterio del
ECM, el mejor representante de la muestra será aquel valor real que minimice dicho error y, casual-
mente, ese valor real que minimiza el ECM es la media muestral. Adoptando el criterio del EAM, la
media muestral ya no resultaría el mejor valor representativo de la muestra, sino que en este caso di-
cho valor vendría dado por la mediana.
1.2. LA VARIANZA
La varianza es una de las medidas de dispersión absolutas más utilizadas y, de forma genérica,
podemos definirla (tanto de una población como de una muestra) como la media aritmética de las des-
viaciones, elevadas al cuadrado, del conjunto de datos analizados respecto a su valor medio.
La varianza poblacional, y por tanto para todas las observaciones estudiadas, se denota por 2 y
se define como, 1
2
N
2
N i1 i
x
donde es la varianza de la población, (siendo , la letra griega sigma minúscula) y se lee sigma al
2
1
La varianza mide la mayor o menor dispersión de los valores respecto a la media aritmética, de
forma que si la dispersión es muy grande, la media no será representativa. Además es siempre no ne-
gativa (es positiva o nula) y será 0 solo cuando todas las observaciones sean iguales. En general, cuan-
to más dispersas sean las observaciones, mayores serán las desviaciones respecto a la media y, por
tanto, mayor el valor numérico de la varianza.
El proceso que debemos seguir para calcular la varianza cuando la frecuencia absoluta de los da-
tos es unitaria es el siguiente:
Cuando la frecuencia absoluta de los datos muestrales no es unitaria, esto es, cuando x1 , x 2 ,..., x m
son los distintos valores de la muestra, ordenados de forma creciente, con frecuencias absolutas,
n1 , n 2 ,..., n m respectivamente, entonces la varianza muestral puede reescribirse como sigue:
1
m 2
2
s
n i1
ni xi x
n
mos expresar la varianza muestral también como:
f x x
2
s 2
i i
i1
Por ejemplo, consideremos la variable X: gasto mensual (en euros) en teléfono móvil cuyos valo-
res asociados a una muestra de 10 individuos son:
Teniendo en cuenta que la media aritmética de la muestra es 112,5 euros (calculada en la Unidad
didáctica anterior) y que la frecuencia absoluta de los valores muestrales es unitaria, para calcular la
varianza o dispersión de los datos respecto a este valor medio aplicamos la siguiente fórmula:
1
s2 n
x x
2
n i1 i
1
34.926,5 3.492,65
10
En muchas ocasiones la fórmula que se utiliza para calcular la varianza muestral difiere un poco de
la que acabamos de exponer en los párrafos anteriores. En lugar de dividir la suma de las desviaciones
al cuadrado entre el número total de observaciones de la muestra, n, se divide entre n–1, esto es,
2 1 n 2
sn1
n 1 i1
xi x
si la frecuencia absoluta de los datos es unitaria, o bien:
2 1
2
m
sn1 xi x
n 1 ni
i1
cuando los datos tienen una frecuencia absoluta diferente de la unidad.
www.udima.es 139
ESTADÍSTICA DESCRIPTIVA
En este caso, el valor obtenido se conoce con el nombre de cuasivarianza y su uso se justifica
porque al utilizar n para realizar los cálculos de la media y la varianza muestrales estamos subestiman-
do la varianza poblacional (como veremos en profundidad en Unidades didácticas y asignaturas poste-
riores, su interés está relacionado con su importancia como estimador: cuando tomamos datos de una
muestra estadísticamente representativa y queremos inferir resultados sobre la población total, la me-
dia muestral puede utilizarse como estimador de la media poblacional. Sin embargo, la varianza y la
desviación típica muestrales no son estimadores adecuados para extraer conclusiones acerca de la va-
rianza y la desviación típica poblacional). De esta forma, incluyendo n–1 en el denominador corregi-
mos adecuadamente esta tendencia.
s
ni n
ci x
i
f c x
i
1 i 1 i1
n c .
m
siendo x i i
n i1
Otra expresión para calcular la varianza en este caso, más operativa, es la siguiente:
1 m
1 2
n i n m i 1
m
i i
i
i
n
n c n c 2 x
2
n c
2
s2
i 1
i 1 i 1
• La varianza nunca puede ser negativa, ya que es una suma de cuadrados y por tanto su va-
lor (como ya hemos comentado antes) siempre será cero o positivo,
s2 0
• Si multiplicamos los valores de una distribución de frecuencias por una constante, la va-
rianza queda multiplicada por la constante elevada al cuadrado.
140 www.udima.es
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
EJEMPLO 1
En la siguiente tabla se presentan los kilómetros recorridos por 10 automóviles de diferentes marcas du‐
rante una hora y media:
Automóvil Km
A1 125
A2 125
A3 150
A4 135
A5 150
A6 145
A7 130
A8 145
A9 130
A10 145
A partir de la tabla de frecuencias y la media aritmética de los kilómetros recorridos, calculadas en el mismo
ejemplo de la Unidad didáctica 3, determina la varianza de la muestra.
Solución:
Km=xi ni Ni fi Fi
Y:
m
1 250 260 135 435 300
x
n n i x i
i1
10
138
s
2
f i 1
i xi x 2
…/…
www.udima.es 141
ESTADÍSTICA DESCRIPTIVA
…/…
xi xi x
xi xi x xi x 2
• Seguidamente multiplicamos cada una de las diferencias elevadas al cuadrado obtenidas por su co‐
rrespondiente frecuencia relativa:
f i xi x 2
xi xi x xi x 2
• Finalmente, sumamos todos los valores obtenidos y el resultado es la varianza de la variable km re‐
corridos por los 10 automóviles de diferentes marcas:
s2 f x x
i1
i
2
33,8 12,8 0,9 14,7 28,8 91 km 2
142 www.udima.es
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
EJEMPLO 2
Supongamos que la distribución de los salarios brutos anuales (en €) de los 10.000 empleados de una de‐
terminada empresa multinacional es la que aparece en la siguiente tabla:
0‐15.000 2.145
15.000‐20.000 1.520
20.000‐25.000 840
25.000‐30.000 955
30.000‐35.000 1.110
35.000‐40.000 2.342
40.000‐50.000 610
50.000‐100.000 328
100.000‐300.000 150
A partir del salario bruto anual medio por trabajador calculado en el mismo ejemplo de la Unidad didáctica 3,
determina la varianza de la variable analizada.
Solución:
Como la variable salario bruto anual por trabajador, objeto de estudio en este ejemplo, se presenta en forma
agrupada, para determinar su varianza utilizamos la siguiente fórmula,
m
1
n c x
2
s2
n i
i1
0‐15.000 7.500
15.000‐20.000 17.500
20.000‐25.000 22.500
25.000‐30.000 27.500
30.000‐35.000 32.500
35.000‐40.000 37.500
40.000‐50.000 45.000
50.000‐100.000 75.000
100.000‐300.000 200.000
…/…
www.udima.es 143
ESTADÍSTICA DESCRIPTIVA
…/…
Salarios ci x
c i x
2
Salarios c i x
• A continuación multiplicamos cada una de las diferencias elevadas al cuadrado obtenidas por su
correspondiente frecuencia absoluta y sumamos los resultados obtenidos:
ci x ci x 2 ni
2
Salarios c i x ni
144 www.udima.es
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
Para evitar el inconveniente que presenta la varianza al medirse en unidades de la variable al cua-
drado, suele operarse con la raíz cuadrada positiva de dicho parámetro (cuando trabajamos con una
población) o estadístico (cuando trabajamos con una muestra).
Entonces, llamamos desviación típica, desviación tipo o desviación estándar de una población
a la raíz cuadrada positiva de la varianza poblacional, es decir:
x
i
2
i1
N
De forma equivalente, llamamos desviación típica, tipo o estándar de un conjunto de valores o
muestra x1, x2,...,xn, a la raíz cuadrada positiva de la varianza muestral, cuya fórmula viene dada
por cualquiera de las siguientes expresiones, según la tipología de los datos analizados,
x i x
2
s i 1
n
cuando los datos presentan una frecuencia absoluta unitaria, o bien:
n x
i
2
i x m
s i 1 o s f x
i i x
2
n i1
s s2 91 9,53939 9,54
Las propiedades principales de la desviación típica, deducidas fácilmente a partir de las de la va-
rianza, son las siguientes:
• Es siempre un valor mayor o igual que 0 (por convenio, solo se selecciona como desvia-
ción típica la raíz cuadrada positiva de la varianza). Solo será nula cuando todas las ob-
servaciones coincidan con el valor de la media.
• Es una medida de dispersión óptima (es la mínima desviación cuadrática).
www.udima.es 145
ESTADÍSTICA DESCRIPTIVA
x i x
2
sn 1 i 1
n 1
o bien,
m
n x i
2
i x
sn 1 i 1
n 1
cuya única diferencia con la desviación típica es, como en el caso de la varianza, que en su formula-
ción el denominador vale n – 1 en lugar de n.
Basándose en este hecho, el matemático ruso Pafnuti Lvóvich estableció un teorema que nos
permite determinar el número mínimo de valores que se encuentran a cierta cantidad de desviaciones
de la media. Formalmente el teorema de Chebyshov se enuncia como sigue:
146 www.udima.es
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
Por tanto, la desigualdad de Chebyshov indica que, para cualquier variable estadística, al menos
1
el 1 de las observaciones dista de la media aritmética menos de k veces la desviación
100% 2
k
1
típica o, lo que es igual, al menos el 2 100% de las observaciones dista de la media aritmética
k
más de k veces la desviación típica.
Así, por ejemplo, cuando trabajamos con poblaciones grandes cuya distribución es simétrica (o tie-
ne forma de campana), la aplicación de este teorema permite asegurar que por los menos el 68% de las
observaciones se encuentra entre la media más una desviación estándar y entre la media menos una des-
viación estándar; el 95% de las observaciones se encuentra entre la media más dos desviaciones estánda-
res y entre la media menos dos desviaciones estándares y casi todas las observaciones se encuentran
entre la media más y menos tres desviaciones estándares. Estas relaciones que implican la desviación
estándar con la media se conocen con el nombre de regla empírica o regla normal.
Las variables estadísticas tipificadas, estandarizadas o reducidas tienen media cero y varianza (o
desviación típica) unitaria. Además, la distribución de frecuencias asociada a una variable de estas
características también se denomina distribución tipificada.
Como hemos indicado, tanto la varianza como la desviación estándar vienen influidas por la unidad
en la que se mide la variable. De esta forma, si cambiamos de medición, realizando, por ejemplo, un
cambio de escala, los valores de estos estadísticos se ven a su vez modificados. Para eliminar la
influencia de la
www.udima.es 147
ESTADÍSTICA DESCRIPTIVA
unidad de medida y poder realizar comparaciones de la desviación existente entre distintas distribuciones
entre sí, se define el coeficiente de variación (también llamado coeficiente de variación de Pearson).
Además, como tanto en el cálculo de la desviación típica como de la media han intervenido todos
los valores de la distribución, el CV presenta la garantía, frente a otros coeficientes que estudiaremos
en unidades posteriores, de que utiliza toda la información disponible.
Conviene señalar en este punto el caso particular para el cual el coeficiente de variación no es
significativo. Si x 0, el CV tiende a infinito y por tanto no es de utilidad, ya que su resultado numé-
rico nos puede llevar a conclusiones estadísticas erróneas.
Retomando el enunciado del ejemplo 1 de esta Unidad didáctica, en el que se analiza una muestra
de los km recorridos por 10 vehículos de diferentes marcas, el coeficiente de variación asociado a
dicha muestra se obtendría como,
s
CV s
x o bien CV 100% x
donde s es la desviación estándar cuyo valor asciende a 9,53939 y x es la media de los kilómetros
recorridos que, en este caso, vale 138. A partir de estos datos, el coeficiente de variación resulta,
9,53939
CV 0,06913
138
148 www.udima.es
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
o bien, expresado en porcentaje, 6,913%. Como dicho coeficiente es menor que la unidad (expresado
en términos absolutos) e inferior a 0,5, podemos decir que la media representa adecuadamente la dis-
tribución de frecuencias analizada.
Para el ejemplo 2, en el que se analizan los salarios brutos anuales de los trabajadores de una
empresa multinacional, el coeficiente de variación vale,
25.783,5335
CV 0,87758 87,76%
29.380
que, a diferencia del caso anterior, muestra una representatividad baja de la media para el conjunto de
datos analizados puesto que su valor es superior a 0,5 y está muy cercano a la unidad.
La meda es una medida de dispersión que permite expresar la variabilidad de las observaciones
alrededor de la mediana de la distribución.
Se define como la mediana de las desviaciones absolutas, esto es, una vez construidas las desvia-
ciones de los datos respecto a la mediana,
Meda Mediana x1
x2 Mediana ,..., xn Mediana
Mediana ,
Por ejemplo, supongamos que las desviaciones de los datos asociados a una muestra respecto a su
mediana son los siguientes:
y calculamos la mediana de los mismos, que al ser un número impar de datos corresponderá al valor
central, esto es, 1,6.
Entre las principales ventajas de la meda se encuentra que, igual que sucede con la mediana, no se
ve afectada por los valores extremos (tanto por exceso como por defecto) de la distribución. (A las
medidas que presentan esta propiedad se las conoce con el nombre de medidas robustas o resisten-
tes). Además, si tenemos una distribución de datos no agrupados de la cual conocemos su media y su
meda, podemos afirmar que al menos el 50% de dichos datos se encuentran situados en los intervalos
x meda y x meda .
2. MEDIDAS DE FORMA
Hasta ahora hemos sintetizado toda la información estadística asociada a un conjunto de datos a
través de las medidas de centralización y de dispersión. Pero parece evidente que analizar datos no
consiste solamente en calcular una media y una varianza. No sería correcto realizar una interpretación
global del colectivo que tenga como hipótesis básica un comportamiento de todos los elementos que lo
integran constante e igual a la media. Necesitamos saber más acerca de la conducta de la distribución
estudiada porque existe una disparidad entre los datos del colectivo que no podemos ignorar al realizar
un estudio estadístico completo. Esta variedad de comportamiento, que se traduce en los distintos va-
lores de xi que tenemos en una distribución, se hace más visible al realizar su representación gráfica.
Pues bien, lo que vamos a exponer a continuación son una serie de indicadores que miden la forma de
la representación gráfica de la distribución de frecuencias sin necesidad de llevarla a cabo.
Las medidas de forma pueden clasificarse en dos categorías: las medidas de asimetría y las medi-
das de apuntamiento o curtosis.
Estas medidas indican el grado de concentración de los valores de la distribución en torno a sus
valores centrales, normalmente la media aritmética o la mediana.
Se conoce con el nombre de sesgo (o simplemente asimetría o simetría) el grado de asimetría que
presenta una distribución. Hay tres formas básicas de distribuciones: simétrica, con sesgo negativo
(asimétrica a la izquierda) y con sesgo positivo (asimétrica a la derecha). Decimos que un conjunto de
observaciones es simétrico si la media y la mediana son iguales y los datos se dispersan de manera
uniforme en torno a ellos. Dicho de otro modo, una distribución es simétrica si al lado derecho de la
media o de la mediana queda la misma cantidad de frecuencias que al lado izquierdo. (Visualmente
detectamos que una distribución es simétrica si el gráfico que la representa es simétrico respecto de la
recta x o respecto de la recta x = mediana y tiene forma de campana o campaniforme).
x
150 www.udima.es
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
Generalmente son más comunes las distribuciones con sesgo positivo, como por ejemplo en el ca-
so de la variable distribución salarial de los empleados de una empresa. De hecho, el análisis descrip-
tivo de la mayor parte de las variables estadísticas estudiadas da lugar a distribuciones asimétricas (a la
derecha o a la izquierda) por ello, en la práctica diremos que una distribución es simétrica cuando lo
sea de forma aproximada, esto es, cuando el coeficiente de asimetría que vamos a definir a continua-
ción esté próximo a 0.
x
Sesgo media Moda
desviación típica Mod
as
x Moda Mediana
En el caso de la distribución asimétrica negativa, la media se sitúa por debajo de la moda, esto es:
x Moda 0
Así pues tenemos que,
Para evitar el uso de la moda, se puede definir una fórmula alternativa de medición del sesgo a
partir de la mediana,
3 media Mediana 3 x Mediana
Sesgo
s
desviación típica
De acuerdo con esta última expresión, el sesgo de una distribución puede variar entre –3 y 3, de
forma que un valor próximo a –3 indica un sesgo negativo considerable. Un valor entre 1 y 2, como
por ejemplo 1,56, indica un sesgo positivo moderado. Un valor de 0, que se produce cuando la media y
la mediana son iguales, indica que no existe ningún sesgo y que, por tanto, la distribución es simétrica.
Estos dos coeficientes que acabamos de definir se conocen con el nombre de primer y segundo
coeficiente de sesgo de Pearson. En general, valores nulos de estos coeficientes indican que se trata
de una distribución simétrica. Por otra parte, valores positivos indican que la distribución es asimétrica
a la derecha (de la moda o de la mediana) y valores negativos que es asimétrica a la izquierda (de la
moda o de la mediana).
EJEMPLO 3
Continuando con el enunciado del ejemplo 1, en el que se describen los km recorridos por 10 automóviles de diferentes marcas durante una hora y media
Automóvil Km
A1 125
A2 125
A3 150
A4 135
A5 150
A6 145
A7 130
A8 145
A9 130
A10 145
Solución:
Los coeficientes de asimetría de Pearson se definen respectivamente como,
Sesgo x Moda
s
Sesgo 3 x Mediana
s
…/…
152 www.udima.es
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
arlos, además de la media y la desviación estándar que ya hemos obtenido en los epígrafes anteriores, debemos conocer la moda y la mediana de la distrib
da es el valor que más veces se repite en la muestra, es decir, el valor con mayor frecuencia absoluta que en nuestro ejemplo resulta ser 145, puesto que ap
138 145
Sesgo 0,733799 0,7338
9,53939
Para determinar el segundo coeficiente de asimetría de Pearson, debemos obtener la mediana de la distribu‐
ción, para lo cual resulta preciso recurrir a la tabla de distribución de frecuencias de la variable analizada:
Km=xi ni Ni fi Fi
Entonces, la mitad del número de observaciones es 5 (10/2), por tanto, como existe un valor de la frecuen‐
cia absoluta acumulada que coincide con 5, concretamente 135, la mediana será la media aritmética de di‐ cho valor, 135, y del siguiente, 145, esto es:
135 145
Mediana 140
2
enidos para ambos coeficientes, resulta que como tanto el primero como el se‐
mos afirmar que se trata de una distribución asimétrica hacia la izquierda, es decir, acumula un mayor número de valores a la izquierda de la moda o de la
Este coeficiente de asimetría viene dado por la siguiente expresión para datos muestrales y de fre-
cuencia absoluta unitaria,
n
x x 3
i
CA g1 i1
n s3
donde s es la desviación típica, que en la fórmula está elevada al cubo. Esta división por el cubo de la
desviación típica se hace para que el coeficiente resultante sea adimensional, por tanto, comparable
entre diferentes muestras.
www.udima.es 153
ESTADÍSTICA DESCRIPTIVA
n x x
3
CA g1
i1
n
s3
n c x
3
CA g1
i1
n
s3
g1 es una cantidad que no tiene unidades y si vale 0 significa que la distribución es simétrica en torno
a la media. Adicionalmente, si g1 0, implica que la distribución es asimétrica a la derecha de la media y
entonces, de las dos ramas de la curva que separa la ordenada que pasa por la media, la de la derecha es
más larga que la de la izquierda. Para valores negativos de g1 , g1 0 , la distribución es asimétrica a la
izquierda de la media y, de las dos ramas de la curva que separa la ordenada que pasa por la media, la de la
izquierda es más larga que la de la derecha.
(Cuando la muestra analizada tiene un número de observaciones superior a 150, n>150, para me-
dir el sesgo podemos utilizar el coeficiente de asimetría de Fisher estandarizado, definido como:
g
gs 1
)
6
n
Intervalo ni
0‐2 2
EJEMPLO 4
3‐5 6
Dada la siguiente distribución de frecuencias, 6‐8 10
9‐11 2
determina el coeficiente de asimetría de Fisher e interpreta el resultado obtenido para el mismo.
…/…
154 www.udima.es
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
…/…
Solución:
x
3
n i
CA g i1
1
c
n s3
Intervalo ci ni
0‐2 1 2
3‐5 4 6
6‐8 7 10
9‐11 10 2
Para poder aplicar la fórmula calculamos en primer lugar la media aritmética de los datos,
m
ni c i
2 1 6 4 10 7 2
5,8
x i1
10
n
20
m
i i
n x x
2
s i 2,4
1
n 20
Intervalo ci ni ci x
Intervalo ci ni ci x ci x 3
…/…
A continuación, multiplicamos cada uno de los valores obtenidos por su correspondiente frecuencia
absoluta:
Intervalo ci ni c i x ci x 3 n c x
i i
3
El coeficiente de asimetría obtenido es negativo, lo que significa que la distribución es asimétrica hacia la
izquierda, es decir, tiene una concentración de valores mayor a la izquierda de la media que a la derecha.
Las medidas de apuntamiento o curtosis analizan la distribución de frecuencias de los datos mues-
trales estudiados en la zona media, es decir, si la mayor o menor concentración de los valores de la
variable estadística alrededor de la zona media dará lugar a una distribución más o menos puntiaguda.
156 www.udima.es
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
Cuando tomamos como referencia la curva de la distribución normal decimos que una distribu-
ción es leptocúrtica si tiene un pico alto, es decir, si es más apuntada o puntiaguda que la distribución
normal y decimos que es platicúrtica si es aplastada, o menos apuntada que la distribución normal. La
distribución normal que no es ni muy puntiaguda ni muy aplastada se llama mesocúrtica.
CAp g2 i1
n s4
n x x
4
CAp g2
i1
n
s4
n i i
n c x
4
CAp g2
i1
n
s4
Este coeficiente adimensional alcanza valores mayores cuanto más puntiaguda es la distribución,
teniendo un valor 3 para la distribución mesocúrtica (normal), mayor que 3 para la leptocúrtica y me-
nor que 3 para la platicúrtica.
La idea del apuntamiento de una distribución apareció comparando las frecuencias de los valores
centrales de la distribución analizada con la frecuencia de dichos valores en una distribución normal
con media y varianza iguales a las de la distribución con la que se comparaba. El coeficiente de apun-
tamiento (en cualquiera de sus tres versiones) para la distribución normal es igual a 3, por ello, para
www.udima.es 157
ESTADÍSTICA DESCRIPTIVA
poder establecer conclusiones acerca de las distribuciones analizadas comparándolas con la distribu-
ción normal, se define dicho coeficiente referenciado a dicha distribución como:
n n n
x x
4
ni x x
4
n c
i x
4
i i
i
CAp g2 i1
3 , CAp g 2 i1
3 o bien CAp g 2 i1 3
n s4 ns ns4
4
De esta forma, si el CAp referido a la curva normal es positivo ( g2 0 ), la distribución será lep-
tocúrtica, si es negativo ( g2 0 ) será platicúrtica y si es 0 ( g2 0 ) será la distribución normal.
EJEMPLO 5
Calcula el coeficiente de apuntamiento o curtosis para la distribución de frecuencias analizada en el ejem‐ plo 4. Interpreta el resultado obtenido.
Solución:
Para determinar el coeficiente de apuntamiento o curtosis de los datos analizados debemos aplicar la si‐
guiente fórmula:
n c x
m
4
ii
CAp g2 i 1 3
ns4
rtir de las diferencias entre cada marca de clase y la media (obtenidas también en el ejem‐ plo 4 anterior) calculamos el valor de dichas diferencias eleva
Intervalo ci ni c i x c i x 4
0‐2 1 2 –4,8 (–4,8)4 = 530,8416
3‐5 4 6 –1,8 (–1,8)4 = 10,4976
6‐8 7 10 1,2 (1,2)4 = 2,0736
9‐11 10 2 4,2 (4,2)4 = 311,1696
La distribución analizada es platicúrtica, es decir, tiene un pico más bajo que el de una distribución normal.
158 www.udima.es
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
xi x x x
4
4
i
CAp g2 i1
o bien CAp g2 i1
3.
ns n
4
s4
• Coeficiente de asimetría de Fisher. Mide la concentración de los valores de la distribu-
n
x x
i
3
• Error cuadrático medio (ECM). Error cometido al tomar el número real d como repre-
1n
sentante de la muestra, ECM d n x i 2 .
i1
d
• Medidas de apuntamiento o curtosis. Analizan la distribución de frecuencias de los da-
tos analizados en la zona media, de forma que miden si la mayor o menor concentración
de los valores de la variable analizada alrededor de la zona media dará lugar a una distri-
bución más o menos puntiaguda.
• Mediana de las desviaciones absolutas (meda). Medida de dispersión asociada a la me-
diana que permite expresar la variabilidad de las observaciones alrededor de este valor.
www.udima.es 159
ESTADÍSTICA DESCRIPTIVA
x i x
2
zados, s i1
n
ACTIVIDADES DE AUTOCOMPROBACIÓN
A partir del contenido de la presente Unidad didáctica, se propone la realización de las siguientes
actividades de autocomprobación por parte del alumno, como ejercicio general de repaso y asimilación
de la información básica proporcionada por el texto.
Enunciado 1
Los valores del precio de cierre de una acción negociada en la Bolsa de Madrid durante 23 días de
un determinado mes han sido los siguientes:
17,4; 18,3; 17,4; 16; 18,7; 17; 19,1; 17,1; 17,6; 18,7; 17,9; 17,3;
17,6; 17,8; 17,9; 18,2; 19,3; 15,7; 16,6; 16,8; 16,9; 17,2; 17,1
Enunciado 2
Km por litro Número de recorridos
En la siguiente tabla se muestra el rendimiento de
la gasolina, en km por litro, obtenido en una muestra de 24‐26 4
25 recorridos realizados por los vehículos de una 26‐28 2
empresa: 28‐30 3
30‐32 10
32‐34 5
34‐36 1
Determina la varianza, la desviación estándar y el
coeficiente de variación del rendimiento de la gasolina
para la muestra analizada.
160 www.udima.es
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
Enunciado 3
En la siguiente tabla se muestran los datos de la cuantía individual de los siniestros pertenecientes
al ramo de responsabilidad civil de una determinada compañía de seguros, para el último año:
0‐10.000 20
10.000‐20.000 30
20.000‐30.000 10
30.000‐40.000 8
40.000‐50.000 2
Enunciado 4
Después de finalizar el segundo semestre del año, una agencia mayorista realiza una encuesta sobre
una muestra aleatoria de 25 clientes. Cada cliente evalúa los servicios de la agencia con un sistema de
calificación del 1 al 100, de forma que se obtienen los siguientes resultados agrupados en intervalos:
0‐20 1
20‐40 5
40‐60 10
60‐80 7
80‐100 2
Enunciado 5
En la siguiente tabla se presentan los diferentes niveles de renta (en €) de los empleados de tierra
de una determina línea área:
500‐1.000 50
1.000‐1.500 100
1.500‐2.000 200
2.000‐2.500 100
2.500‐3.000 50
www.udima.es 161
ESTADÍSTICA DESCRIPTIVA
Solución 1
Para determinar la varianza del precio de la acción necesitamos en primer lugar construir la tabla
de frecuencias de la variable analizada,
xi ni fi
15,7 1 0,043478261
16 1 0,043478261
16,6 1 0,043478261
16,8 1 0,043478261
16,9 1 0,043478261
17 1 0,043478261
17,1 2 0,086956522
17,2 1 0,043478261
17,3 1 0,043478261
17,4 2 0,086956522
17,6 2 0,086956522
17,8 1 0,043478261
17,9 2 0,086956522
18,2 1 0,043478261
18,3 1 0,043478261
18,7 2 0,086956522
19,1 1 0,043478261
19,3 1 0,043478261
23
de donde deducimos que la fórmula a utilizar para realizar dicho cálculo será,
2 1
2
m
s xi x
n
o bien: ni
i1
f x x
2
s 2
i i
i 1
Entonces, a partir de la media calculada en el mismo ejercicio de la Unidad didáctica 3, cuyo va-
lor es,
23
x i
403,
6 17,5478261 17,5478
i1
x
23
23
162 www.udima.es
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
xi ni fi xi x
xi ni fi xi x x i x 2
www.udima.es 163
ESTADÍSTICA DESCRIPTIVA
Seguidamente multiplicamos cada una de estas diferencias al cuadrado por su correspondiente fre-
cuencia relativa:
fi xi x 2
xi ni fi xi x xi x 2
Finalmente, la varianza se obtiene sumando los valores f i xi obtenidos en la última co-
x
2
lumna de la tabla:
f
23
s2 17,5478 0,78510397
2
i
i
1
xi
La volatilidad del precio de la acción es la raíz cuadrada positiva de la varianza, esto es la desvia-
ción típica:
s s 2 0,78510397 0,886060929
Solución 2
Como la muestra analizada en este ejercicio se presenta agrupada en intervalos, utilizamos la marca
de clase o punto medio del intervalo para representar a todos los valores que caen dentro de un intervalo
de clase dado.
Km por litro ni ci fi
A continuación se presenta una tabla con los cálcu-
los de la marca de clase, las frecuencias absolutas y las 24‐26 4 25 0,16
frecuencias relativas de los datos del enunciado: 26‐28 2 27 0,08
28‐30 3 29 0,12
30‐32 10 31 0,4
32‐34 5 33 0,2
34‐36 1 35 0,04
25
164 www.udima.es
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
donde ci es la marca de clase de cada intervalo y x es la media, cuyo valor ya ha sido calculado en el
mismo ejercicio de la Unidad didáctica anterior,
m m
1
x
n
n i ci f i ci 30,04
i1 i1
Km por litro ni ci fi ci x
25
fi ci x
Km por litro ni ci fi ci x ci x 2 2
25
www.udima.es 165
ESTADÍSTICA DESCRIPTIVA
f c 30,04 8,0384
2
s2 i i
i1
La desviación estándar se calcula como la raíz cuadrada positiva de la varianza, esto es:
s s 2 8,0384 2,83520722
Con estos valores que acabamos de obtener, el coeficiente de variación, definido como el cociente
entre la desviación estándar y la media, resulta:
s 2,83520722
CV 0,09438107
x 30,04
o 9,438107%. Este valor, al ser menor que la unidad y menor que 0,5, indica que la media es una me-
dida representativa de la muestra analizada.
Solución 3
Como la cuantía individual de los siniestros se presenta agrupada en intervalos, para calcular la
varianza en este caso debemos aplicar la siguiente fórmula,
2 1 m
2
2
m
s
n i1
n i ci fi ci x
x i1
donde el valor de la variable se sustituye por la marca de clase o punto medio del intervalo para repre-
sentar a todos los valores que caen dentro del mismo,
0‐10.000 20 5.000
10.000‐20.000 30 15.000
20.000‐30.000 10 25.000
30.000‐40.000 8 35.000
40.000‐50.000 2 45.000
70
y, como vimos en el mismo ejercicio de la Unidad didáctica anterior, la cuantía media de los sinies-
tros es:
1
n c f c
m m
x i i i i 16.714, 2857 16.714, 29
n
i1 i1
166 www.udima.es
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
Cuantía ni ci ci x
70
Cuantía ni ci ci x ci x 2
70
Cuantía ni ci ci x ci x 2 fi
70
70
www.udima.es 167
ESTADÍSTICA DESCRIPTIVA
f c 16.714,29 111.346.938,8
2
s 2
i i
i1
s s 2 111.346.938,8 10.552,10589
cuyo valor, al ser en ambos casos superior a 0,5, indica que la media tiene una baja representatividad.
Solución 4
Por tanto, para calcularlos necesitamos conocer la media, la moda, la mediana y la desviación
estándar de los datos.
Como dichos datos vienen agrupados en intervalos, para calcular la media necesitamos obtener la
marca de clase de cada intervalo,
Calificación ni ci
20 0
0‐20 1
2 10
20 40
20‐40 5 30
2
40 60
40‐60 10 50
2
60 80
60‐80 7 70
2
80 100
80‐100 2 90
2
de forma que la media aritmética se puede calcular fácilmente aplicando la siguiente fórmula:
15
x ci ni 110 5 30 10 50 7 70 2
n i1 53,2
90
25
Para obtener la desviación estándar debemos calcular primero la varianza como sigue,
1 10 53,2 1 30 53,2 5 50 53,2 10
5 2 2 2
1
n n
2 c x 2
i
i1
i
25 70 53,22 7 90 53,22 2
9.344
373,76
25
373,76 19,3328736
Como los datos de la muestra están agrupados en intervalos para determinar la mediana de la dis-
tribución debemos calcular las frecuencias absolutas acumuladas,
Calificación ni ci Ni
0‐20 1 10 1
20‐40 5 30 1+5=6
40‐60 10 50 1 + 5 + 10 = 16
60‐80 7 70 1 + 5 + 10 + 7 = 23
80‐100 2 90 1 + 5 + 10 + 7 + 2 = 25
25
y el valor de la mitad de los datos, 12,5. Entonces, como no existe ningún valor de la frecuencia
2
absoluta acumulada Ni que sea igual al número de términos de la muestra partido por 2, la mediana se
www.udima.es 169
ESTADÍSTICA DESCRIPTIVA
encontrará en el primer intervalo cuyo valor de frecuencia absoluta acumulada supere a 12,5, en nues-
tro caso 40-60, y su valor será ci de dicho intervalo, en nuestro caso 50, o bien el valor que resulte de
aplicar la siguiente fórmula:
n
N
i1 12,5 6
Mediana Li1 2 a 40 20 53
i
10
ni
Finalmente, como todos los intervalos tienen la misma amplitud, la moda se encontrará en el in-
tervalo que presenta mayor frecuencia absoluta, en nuestro caso 40-60, y su valor puede ser la marca
de clase del intervalo, 50, o bien puede determinarse aplicando la siguiente fórmula:
Moda Li1
ni1 7
n a 40 5 20 51,667
i 7
i1 i1
Con todos estos valores calculados, el primer y segundo coeficiente de sesgo de Pearson son:
o bien:
x Moda
Sesgo 53,2 50 0,16552118
s 19,3328736
o bien:
Entonces, como los dos coeficientes de sesgo de Pearson son positivos, podemos concluir que la
distribución de las calificaciones realizadas por los 25 clientes analizados de la empresa mayorista es
asimétrica hacia la derecha.
Solución 5
Para los datos analizados, al encontrarse agrupados en intervalos, los coeficientes de asimetría de
Fisher y de apuntamiento o curtosis se definen respectivamente como:
m i
m i i
i
n c s x n c
3
CA g1
i1 3
y CAp i1
n g2 n s4
x
4
3
170 www.udima.es
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
Renta ni ci
875.000
500 1.750
Con la media aritmética calculada, estamos ya en condiciones de obtener la diferencia entre cada
marca de clase y dicho valor:
Renta ni ci ci x
500
c x
2
Renta ni ci ci x
c i
n i1 i
1
500 1.000.000 50 250.000 100 0 200 250.000 100 1.000.000 50
150.000.000
500 300.000
s 300.000 547,72256
Para determinar el coeficiente de asimetría de Fisher necesitamos elevar los valores c i al cubo,
x
Renta ni ci ci x c
x
3
El valor obtenido para el coeficiente de asimetría de Fisher indica que la distribución es simétrica
respecto a la media, puesto que dicho coeficiente vale 0. Ello implica que se acumula el mismo núme-
ro de valores a la derecha y a la izquierda del valor central.
Para obtener el coeficiente de apuntamiento, elevamos a la cuarta las diferencias entre la marca de
clase y la media,
Renta ni ci ci x c i x 4
500‐1.000 50 750 –1.000 (–1.000)4 = 1.000.000.000.000
1.000‐1.500 100 1.250 –500 (–500)4 = 62.500.000.000
1.500‐2.000 200 1.750 0 (0)4 = 0
2.000‐2.500 100 2.250 500 4
(500) = 62.500.000.000
2.500‐3.000 50 2.750 1.000 4
(1.000) = 1.000.000.000.000
500
172 www.udima.es
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
n c x
4
i i
i1
CAp g2 3
ns4
1 1.000.000.000.000 50 62.500.000.000 100 0 200
3
500 62.500.000.000 100 1.000.000.000.000 50
547,722564
2,5 3 0,5
ACTIVIDADES DE REPASO
Enunciado 1
En un mes determinado una central de energía nuclear del norte de Francia registró los siguientes
accidentes menores en los 13 departamentos que la componen:
2, 0, 0, 3, 3, 12, 1, 0, 8, 1, 0, 5, 1
Enunciado 2
xi ni
1‐3 4
4‐6 5
7‐9 6
10‐12 8
13‐15 7
16‐18 4
19‐21 2
Enunciado 3
El Consorcio de Compensación de Seguros dispone de los siguientes datos sobre las reclamacio-
nes de los ciudadanos en conceptos de daños por inundaciones durante el último año:
0‐6.000 10
6.000‐12.000 90
12.000‐18.000 66
18.000‐24.000 20
24.000‐30.000 10
30.000‐60.000 4
Enunciado 4
Determina la desviación estándar en la venta de este tipo de artículos de lujo, el coeficiente de va-
riación y el coeficiente de asimetría de Fisher. Interpreta los resultados obtenidos.
Enunciado 5
En la tabla a continuación se muestra la distribución por edades de los alumnos de una escuela de
barrio de educación primaria:
1‐3 15
4‐6 20
7‐9 10
10‐12 5
174 www.udima.es
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
Solución 1
Solución 2
• Varianza: 25,40972222
• Desviación típica: 5,040805712
• Coeficiente de variación: 0,48391735
Solución 3
• Varianza: 49.950.000
• Desviación típica: 7.067,531394
• Cuasivarianza: 50.201.005,03
• Cuasidesviación típica: 7.085,266758
• Coeficiente de variación (calculado con la desviación estándar): 0,52352084
• Coeficiente de variación (calculado con la cuasidesviación estándar): 0,52483457
Solución 4
Solución 5
www.udima.es 175
ESTADÍSTICA DESCRIPTIVA
TEST DE AUTOEVALUACIÓN
4, 7, 5, 2, 4, 5, 6, 4, 7, 3, 7, 4, 3, 4, 4, 3, 4, 3, 2, 4, 4, 1, 10, 2, 5, 3,
2, 2, 5, 3, 3, 8, 12, 3, 2, 2, 5, 4, 1, 5, 8, 6, 6, 1, 3, 15, 16, 6, 7, 12
a) 4,94
b) 10,78
c) 3,282
d) 0,6645
2,2 7,6 5,1 5,3 3,2 5,8 2,9 20,1 16,3 4,6 15,9 2,3
P13 P14 P15 P16 P17 P18 P19 P20 P21 P22 P23 P24
5,9 5,5 4,1 3,2 1,7 40,5 7,4 3,4 9,1 32,7 6,7 3,9
a) 91,604
b) 9,571
c) 8,975
d) 1,066
3. El importe de las facturas de una empresa del sector aeroespacial se recoge en la siguiente
tabla de frecuencias:
0‐50.000 81
50.000‐100.000 13
…/…
176 www.udima.es
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
…/…
100.000‐200.000 10
200.000‐500.000 13
500.000‐700.000 8
a) 2.453.705.600
b) 110.800
c) 162.152,2741
d) 22.145,36
a) 162.152,27
b) 68,33%
c) 1,463468178
d) 0,000004214
5. La siguiente tabla muestra la distribución del importe de las compras realizadas por una
cadena hotelera a sus diversos proveedores:
0‐100.000 20
100.000‐150.000 40
150.000‐210.000 42
210.000‐500.000 28
www.udima.es 177
ESTADÍSTICA DESCRIPTIVA
Intervalo ni
3‐6 37
6‐11 198
11‐16 191
16‐21 149
21‐26 79
26‐31 46
31‐41 55
41‐51 51
51‐76 26
76‐101 25
101‐201 25
201‐501 11
501‐1.000 2
7. Una multinacional europea tiene dos oficinas en Estados Unidos, una en Nueva York y
otra en Los Ángeles. Un estudio realizado sobre los salarios brutos anuales (en miles de €)
de los directivos de cada oficina permite extraer los resultados que se muestran en la
siguiente tabla:
Salario ni Salario ni
50‐100 22 50‐100 20
100‐150 53 100‐150 50
150‐200 20 150‐200 15
200‐300 15 200‐300 10
300‐400 7 300‐400 5
400‐500 3 400‐500 0
Los coeficientes de variación de las oficinas de Nueva York y Los Ángeles respectiva-
mente son:
a) 0,524 y 0,459
b) 84,398 y 67,210
c) 161,041 y 146,25
d) 1,9081 y 2,1760
178 www.udima.es
Análisis numérico de una variable medible (II):
M.ª J. Pérez Fructuoso principales medidas de dispersión y medidas de forma
8. Para analizar los resultados de la plantación de una serie de cultivos en una determinada
zona de secano, el sindicato de agricultores de la zona realiza la siguiente tabla, en la que
se recoge el número de años que se necesitaron para recolectar el número de kilos óptimo
de producto cosechado:
4 65
5 142
6 138
7 100
8 25
9. Utilizando los datos del enunciado anterior, establece cuál de las siguientes afirmaciones
es cierta:
a) La distribución de datos analizada es asimétrica a la izquierda puesto que el coefi-
ciente de asimetría de Fisher es negativo.
b) La distribución de datos analizada es leptocúrtica porque el coeficiente de asimetría
de Fisher es positivo.
c) La distribución de datos analizada es asimétrica a la derecha porque el coeficiente
de apuntamiento o curtosis es positivo.
d) La distribución de datos analizada es platicúrtica porque el coeficiente de apunta-
miento o curtosis es negativo.
10. En una muestra de 15 individuos asiduos a una determinada cafetería cercana a su lugar
de trabajo se observaron los siguientes importes de las consumiciones (en €), ordenadas
de forma creciente:
0,10; 0,10; 0,25; 0,25; 0,25; 0,35; 0,40; 0,53; 0,90; 1,25; 1,35; 2,45; 2,71; 3,09; 4,10
www.udima.es 179
ESTADÍSTICA DESCRIPTIVA
1 b)
2 b)
3 c)
4 c)
5 b)
6 d)
7 a)
8 d)
9 d)
10 c)
REFERENCIAS BIBLIOGRÁFICAS
DURÁ PEIRÓ, J.M. y LÓPEZ CUÑAT, J.: Fundamentos de estadística. Estadística descriptiva y modelos probabilísticos
para la inferencia, Barcelona: Ariel Economía, 1988.
KAZMAIER, L.J.: Estadística aplicada a administración y economía, Madrid: McGraw-Hill Interamericana, 2006.
LIND, D.A.; MARCHAL, W.G. y WATHEN, S.A.: Estadística aplicada a los negocios y la economía, Madrid: McGraw-
Hill Interamericana, 2008.
NEWBOLD, P; CARLSON, W.L. y THORNE, B.: Estadística para administración y economía, New Jersey: Pearson Pren-
tice Hall, 2008.
PEÑA SÁNCHEZ DE RIVERA, D.: Estadística. Modelos y métodos. 1. Fundamentos, Madrid: Alianza Editorial. Alianza
Universidad Textos, 1989.
PEÑA, D. y ROMO, J.: Introducción a la estadística para las ciencias sociales, Madrid: McGraw-Hill, 1997.
WONNACOTT, T.H. y WONNACOTT, R.J.: Introducción a la estadística, México: Limusa SA. Grupo Noriega Editores,
1999.
180 www.udima.es