Distribucion Normal Internet
Distribucion Normal Internet
Distribucion Normal Internet
LA DISTRIBUCIÓN NORMAL
1
Profesor Titular, División de Anestesiología, Pontificia Universidad Católica de Chile.
116
LA DISTRIBUCIÓN NORMAL
Para evitar la confusión muchos usan Normal con Las fórmulas para el cálculo de los parámetros
mayúsculas y aquí haremos lo mismo; otros hablan poblacionales de la distribución Normal son senci-
de distribución gaussiana o de campana de Gauss llas:
a pesar que fue Abraham de Moivre el primero en
describirla y Gauss solo la popularizó. Mediana:
La distribución Normal:
1) Tiene forma de campana.
2) Es simétrica.
3) Alcanza su máximo en µ (la media). Donde la letra griega Σ, sigma mayúscula, in-
4) La media es también la moda y la mediana. dica la sumatoria de los valores individuales de X,
5) Es asintótica al eje de las abscisas y, como no lo cifra que es dividida por el número de mediciones.
toca nunca, cualquier valor de X entre -infinito La variabilidad de los valores se calcula como
y +infinito es teóricamente posible. un promedio de las desviaciones con respecto a la
6) La posición relativa en el eje de las abscisas lo media. Como ya vimos, ya que la mitad de los va-
determina µ (más a la derecha mientras mayor lores son mayores que la media y la otra mitad son
sea) y su mayor o menor aplastamiento o ancho menores, el resultado final sería 0. Para eliminar el
lo determina σ (la desviación estándar), siendo signo negativo de la mitad menor, se eleva al cua-
más aplanada mientras mayor sea su magnitud drado cada desviación. Este promedio de desvia-
(Figura 1). Esta característica se denomina cur- ciones elevadas al cuadrado desde la media es la
tosis (del griego, curvado): angosta o leptocúrti- varianza.
ca (literalmente, curva angosta), media o meso-
cúrtica y ensanchada o platicúrtica (literalmen- Varianza:
te, curva ancha) (Figura 2). La altura de la curva
carece de importancia o uso en la práctica.
La varianza se expresa con el cuadrado de las calcular separadamente para cada valor. Sin embar-
unidades de la medición (cm2, kg2, mmHg2) y, ade- go, pueden ser puestas en una escala comparable
más, es más difícil de visualizar e interpretar por el usando equivalentes estandarizados. Como se vio,
hecho de ser un cuadrado. Por ello es más común cualquier posición en el eje horizontal puede ser
que se use la desviación estándar: la raíz cuadrada descrita como una distancia expresada en desvia-
de la varianza. ciones estándar desde la media con valor negativo
o positivo. Esta unidad se conoce como desviación
Desviación estándar: Normal estándar o puntaje z. Es equivalente a una
distribución Normal con una media de 0 y una des-
viación estándar de 1, una distribución Normal es-
pecial conocida como Normal estándar o Normal
típica.
La transformación requerida es:
Figura 3. Curva Normal estándar o típica. Se señalan las proporciones del área bajo la curva por sobre o debajo de
distintos valores de z. Como el área bajo la curva es igual a uno, las proporciones indican también probabilidad. Nótese
que para valores negativos de z sólo es necesario contar el límite hacia la izquierda de la media (D y E que corresponden
al valor negativo de z en B y C). También se puede observar en F que valores de z de + 1,96 o de -1,96 separan áreas
del 2,5% del total. Este detalle tiene especial importancia a la hora de discutir la inferencia estadística, los valores de p
y la significación estadística.
buena es esa estimación. Una aproximación es su- estará dentro de 1,96 errores estándar por sobre o
poner que podríamos obtener una serie grande de debajo de la media de nuestra muestra. Es evidente
muestras aleatorias de un determinado tamaño de que mientras mayor sea el tamaño de la muestra,
esa población. Matemáticamente se conoce como más pequeño es el error estándar y menor el rango
el teorema del límite central, y se puede demos- entre los límites de confianza.
trar que la distribución de las medias de esas mues- Se debe recalcar que el error estándar no es una
tras tienen las siguientes características: medida de la variabilidad de la muestra y no debe ser
usado con ese fin. Este es uno de los errores más fre-
1) La distribución de todas las medias de las mu- cuentemente detectados en la literatura médica, ya sea
chas muestras tomadas es Normal si la distri- por ignorancia o premeditadamente para dar la impre-
bución de los valores en la población es Nor- sión de una menor imprecisión de las estimaciones.
mal. Además, la distribución de las medias de
las muestras será aproximadamente Normal, no
importando cual sea la distribución de la varia- TRANSFORMACIONES HACIA UNA
ble en la población, siempre que las muestras DISTRIBUCIÓN NORMAL
sean suficientemente grandes.
2) El promedio de las medias de todas las muestras El coeficiente de sesgo o bies es una medida
posibles es igual a la media de la población. de la simetría. Una distribución simétrica tiene un
3) La desviación estándar de las medias de las coeficiente igual a cero. Una distribución sesgada
muestras, que se conoce como el error estándar hacia la izquierda, lo más frecuente, tiene un co-
de la media, depende de la variabilidad de la eficiente positivo y una desviada hacia la derecha
población y del tamaño de las muestras. tiene un coeficiente negativo. Para valores que no
pueden ser negativos, se puede inferir que una dis-
tribución es sesgada cuando la desviación estándar
Error estándar: es mayor que la mitad de la media. Lo contrario no
es necesariamente así, pero un histograma revelará
rápidamente cuándo una distribución es sesgada.
Una posibilidad de describir una población sesgada
es usar parámetros distintos que los de una distri-
Como no conocemos σ, usamos la desviación
bución Normal simétrica, generalmente la mediana
estándar de la muestra para una estimación del
y percentiles y para la inferencia se usarán pruebas
error estándar:
no paramétricas. Otra alternativa es usar una trans-
formación de los datos de manera que tengan una
Estimación del error estándar:
distribución más simétrica. La transformación más
frecuente es la de obtener logaritmos de los datos. El
antilogaritmo de la media aritmética de los valores
transformados es la media geométrica. Si la trans-
formación fue exitosa en eliminar el sesgo, la media
Se puede también calcular los límites de con-
geométrica será similar a la mediana y algo menor
fianza de la estimación de la media:
que la media aritmética de los datos originales. No
tiene sentido obtener el antilogaritmo de la desvia-
Límites de confianza:
ción estándar de los valores transformados. No se
debe asumir que una distribución sesgada puede ha-
cerse más simétrica con una transformación como la
mencionada por lo que debe comprobarse el efecto
Esto es, esperamos, con un 95% de confianza mirando un histograma de los datos transformados
de estar en lo cierto, que la media de la población o bien con pruebas como la W de Shapiro-Wilk.
Correspondencia a:
Dr. Jorge Dagnino S.
jdagnino@med.puc.cl