07 - Distribucion Normal
07 - Distribucion Normal
07 - Distribucion Normal
www.senati.edu.pe
OBJETIVO
Elaborar gráfico de distribución normal a partir de una gran cantidad de datos.
www.senati.edu.pe
LA DISTRIBUCIÓN NORMAL.
DEFINICIÓN.
www.senati.edu.pe
La distribución normal fue reconocida por primera vez por el francés Abraham de
Moivre (1667-1754).
Figura 1. Gráfica de una distribución normal y significado del área bajo la curva
www.senati.edu.pe
CARACTERÍSTICAS.
www.senati.edu.pe
Figura 2. Ejemplos de distribuciones normales con diferentes parámetros.
(a) Distribución normal con distinta (b) Distribución normal con diferentes
desviación estándar e igual media medias e igual desviación estándar
www.senati.edu.pe
EJERCICIOS RESUELTOS.
1.- El tiempo medio en realizar una misma tarea por parte de los empleados de una empresa se distribuye según una distribución normal, con
media de 5 días y desviación típica 1 día. Calcular el porcentaje de empleados que realizan la tarea en un tiempo inferior a 7 días.
t1 = -¥ y t2 = (7 -5) /1 = 2
En la tabla la probabilidad acumulada para el valor 2 (equivalente a un tiempo inferior a 7 días.). Esta probabilidad es 0,9772. Por lo
tanto, el porcentaje de empleados que realizan la tarea en un tiempo inferior a 7 días es del 97,7
2.- La vida media de una lámpara, según el fabricante, es de 68 meses, con una desviación típica de 5. Se supone que
se distribuye según una distribución normal En un lote de 10.000 lámparas.
¿Cuántas lámparas superarán previsiblemente los 75 meses?
¿Cuántas lámparas se estropearán antes de 60 meses?
www.senati.edu.pe
3.- El consumo medio bimestral de energía eléctrica en una ciudad es de 59 Kw/h., con una desviación típica de 6
Kw/h. Se supone que se distribuye según una distribución normal.
a) ¿Cuántos Kw/h. tendría que consumir bimestralmente para pertenecer al 5% de la población que más
consume?
b) Si usted consume 45 Kw/h. ¿qué % de la población consume menos que usted?
a.- Buscamos en la tabla el valor de la variable tipificada cuya probabilidad acumulada es el 0,95 (95%), por lo
que por arriba estaría el 5% restante. Este valor corresponde a t = 1,645. Ahora calculamos la variable normal X
equivalente a ese valor de la normal tipificada:
1,645 = (X -59) /6 Þ X = 67,87
Por lo tanto, tendría usted que consumir más de 67,87 Kw/h. bimestralmente para pertenecer al 5%
de la población que más consume.
b.- Vamos a ver en qué nivel de la población se situaría usted en función de los 45 Kw/h. consumidos.
Calculamos el valor de la normal tipificada correspondiente a 45 Kw/h. t = (45 -59) /9 = -
2.333
P (X ≤ 45) = P (t ≤ -2,333) = P (t > 2,333) = 1 - P (t≤ 2,333) = 1 - 0,9901 = 0,0099
Luego, tan sólo un 1,39% de la población consume menos que usted.
www.senati.edu.pe
4.-Una empresa instala en una ciudad 20.000 bombillas para su iluminación. La duración de una
bombilla sigue una distribución normal con media 302 días y desviación típica 40 días. Calcular.
Entonces el 0,71% de las lámparas, es decir 20.000 ∙ 0.0071 = 142 bombillas durarán más de
400 días.
www.senati.edu.pe
5.-El tiempo medio de los electricistas de una empresa en realizar el montaje de un determinado cuadro eléctrico es de 4 días, con una
desviación típica de 1 día. Se supone que se distribuye según una distribución normal. Calcular:
a.- t= (3 -4)/1 = -1
P (X ≤ 3) = P (t ≤ -1)
P (t ≤ -1) = P (t > 1)
P (t > 1) = 1 - P (t ≤ 1) = 1 - 0,8413 = 0,1587
Luego, el 15,87 % de los electricistas emplean un tiempo inferior a 3 días.
b.- Buscamos en la tabla el valor de la variable tipificada cuya probabilidad acumulada es el 0,9 (90%), lo que quiere decir que por
encima se sitúa el 10% superior. Este valor corresponde a t = 1,282. Ahora calculamos la variable normal X equivalente a ese valor de la
normal tipificada:
1,282 = (X -4) /1 Þ X = 5,282
Despejando X, su valor es 5,282. Por lo tanto, el 10% de los electricistas que más tardan en realizar un cuadro lo hacen
en 5.28 días.
www.senati.edu.pe
c.- Buscamos en la tabla el valor de t cuya probabilidad acumulada es el 0,8 (80%). Como sabemos que hasta la media la
probabilidad acumulada es del 50%, quiere decir que entre la media y este valor hay un 30% de probabilidad. Por otra parte, al
ser la distribución normal simétrica, entre -t y la media hay otro 30% de probabilidad. Por lo tanto, el segmento (-t, +t)
engloba al 60% de los electricistas con tiempo medio.
El valor de t que acumula el 80% de la probabilidad es 0,842, por lo que el segmento viene definido por (-
0,842, +0,842). Ahora calculamos los valores de la variable X correspondientes a estos valores de t.
Los valores de X son 3,158 y 4,158. Por lo tanto, los electricistas con tiempos comprendidos entre 3,158 días y
4,158 días constituyen el 60% de la población con un tiempo medio de realización del cuadro.
www.senati.edu.pe
EJERCICIOS PROPUESTOS.
www.senati.edu.pe
4.- Se supone que el ancho de una herramienta utilizada en la fabricación
de semiconductores tiene una distribución normal con media 0.5
micrómetros y desviación estándar 0.05.
a.- ¿Cuál es la probabilidad de que ancho de la herramienta sea mayor
que 0?2 micrómetros?
b.- ¿Cuál es la probabilidad de que ancho de la herramienta se encuentre
entre 0?47 y 0.63 micrómetros?
c.- ¿Cuál es el valor del ancho de la herramienta para el cual el 90 % las
herramientas tienen un ancho mayor?
www.senati.edu.pe
5.- El diámetro de un eje metálico tiene una distribución normal con media de
0.2508 pulgadas y desviación estándar de 0.0005 pulgadas. Las especificaciones de
fabricación indican que el diámetro de los ejes debe estar entre 0.2485 y 0.2515
pulgadas. Se requiere determinar el porcentaje de ejes producidos que cumplan con
las especificaciones.
www.senati.edu.pe
6.- El diámetro de los remaches fabricados por un proceso sigue una
distribución normal con media 12.50 mm. y desviación estándar 0.02 mm.
Aquellos remaches cuyo diámetro se exceda de 12.55mm se reprocesan y
aquellos cuyos diámetros estén por debajo de 12.45 mm. se desechan. ¿Qué
porcentaje de producto se desecha y que porcentaje de producto se reelabora?
www.senati.edu.pe
7.- Un análisis estadístico de 1000 llamadas telefónicas de larga distancia hechas
desde una central indica que la duración de esas llamadas tiene una distribución
normal con media de 129.5 segundos y una desviación estándar de 30 segundos.
a.-¿Cuál es la probabilidad de que una llamada haya durado más de 180
segundos?
b.-¿Cuál es la probabilidad de que una llamada haya durados entre 89?5 y 169.5
segundos?
c.- ¿Cuántas llamadas duraron más de 60 segundos?
www.senati.edu.pe
8.- El tiempo de reacción de cierto experimento psicológico aplicado a un grupo
de personas tiene una distribución normal con media de 20 segundos y
desviación estándar de 4 segundos.
a.- ¿Cuál es la probabilidad de que una persona tenga un tiempo de reacción
menor a 14 segundos?
b.- ¿Cuál es la probabilidad de que una persona tenga un tiempo de reacción
entre 25 y 30 segundos?
c.- ¿Cuál debe ser el tiempo de reacción si solo el 1% de todas las personas
tienen un tiempo de reacción mayor?
www.senati.edu.pe
www.senati.edu.pe
Tabla 1. Áreas bajo la curva normal estándar. Los valores de la tabla que no se muestran en negrita representan la probabilidad
de observar un valor menor o igual a z. La cifra entera y el primer decimal de z se buscan en la primera columna, y el segundo
decimal en la cabecera de la tabla.
z 0.00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
0.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753
0.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
0.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
www.senati.edu.pe
www.senati.edu.pe
¿Qué es normal, o qué se aparta de la normalidad?
www.senati.edu.pe
HISTOGRAMA
www.senati.edu.pe
Distribución normal
La mayor parte de los fenómenos del comportamiento humano se representan de la siguiente
manera:
Ejemplo:
Distribución del coeficiente intelectual de las personas:
Pocas personas presentan déficit o retardo
Pocas personas son genios
La mayoría somos personas medianamente inteligentes
www.senati.edu.pe
•La distancia entre la línea trazada en la media y el punto de
inflexión de la curva es igual a una desviación estándar
www.senati.edu.pe
Gráfica de una distribución normal y significado del área bajo la curva.
www.senati.edu.pe
Valores de tensión arterial sistólica en una muestra de 1000 pacientes
isquémicos ingresados en UCI.
www.senati.edu.pe
Variacion de la altura y amplitud de la campana de Gauss
www.senati.edu.pe
Histogramas y gráficos de probabilidad normal de los
valores de peso y edad en dos muestras de pacientes.
www.senati.edu.pe
La importancia de la distribución normal se debe a que hay variables asociadas a
fenómenos naturales que siguen el modelo de la normal.
• Caracteres morfológicos de individuos (personas, animales, plantas,...) de una especie,
p.ejm. tallas, pesos, envergaduras, diámetros, perímetros,...
www.senati.edu.pe
Probabilidad de Ocurrencia
Supongamos que frente a una determinación de glucosa en la sangre
tengamos que definir si este valor es normal o no.
www.senati.edu.pe
Probabilidad de Ocurrencia
1. Para calcular el área bajo la curva, lo cual corresponde a la
probabilidad de ocurrencia, se han construido tablas de áreas
de la normal.
• Pero sería imposible tener una tabla para cada posible distribución normal,
www.senati.edu.pe
Puntaje “z”
1. La variable transformada se llama variable normal estándar y se simboliza con “z”
2. Las puntuaciones “z” son transformaciones que se hacen a los valores observados,
con el propósito de analizar su distancia respecto a la media en unidades de desviación
estándar.
z = x – promedio
D.E.
www.senati.edu.pe
Veamos el ejemplo de la glucosa
z = x – promedio
D.E. 90 se encuentra a 1,75 del promedio
z = 90 – 83 = 7 = 1,75 La desviación Standar ( S ) es 1,75 del promedio
4 4
Este valor se busca en la Tabla de puntajes “z”, para determinar la probabilidad de encontrar
glicemias iguales o superior a 90 mg por 100 ml de sangre.
El valor encontrado en la Tabla es 0,0401, lo que significa que es probable que haya un
4,01% de individuos sanos con valores iguales o superior a 90 mg por 100 ml de sangre.
www.senati.edu.pe
Veamos otro ejemplo:
Valor observado: 50
Promedio: 60
Desviación estándar: 10
z = 50 – 60 = -10 = -1
10 10
Podemos decir que el valor “50” está localizado a una desviación estándar por debajo de la
media de la distribución .
www.senati.edu.pe
www.senati.edu.pe
Tabla 1. Áreas bajo la curva normal estándar. Los valores de la tabla que no se muestran en negrita representan la probabilidad
de observar un valor menor o igual a z. La cifra entera y el primer decimal de z se buscan en la primera columna, y el segundo
decimal en la cabecera de la tabla.
z 0.00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
0.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753
0.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
0.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
www.senati.edu.pe
1. RECORDEMOS
2. ALGUNOS CONCEPTOS
www.senati.edu.pe
Esquema de procedimiento de la estadística
inferencial.
Inferencia de
RECOLECCION DE los parámetros
LOS DATOS CALCULO DE
mediante
MEDIANTE UNA ESTADIGRAFOS
MUESTRA
técnicas
estadísticas
apropiadas.
www.senati.edu.pe
Diagrama
Población Parámetros
Muestra Estimadores
www.senati.edu.pe
¿Qué es una distribución muestral?
Una distribución muestral es un conjunto de valores sobre una
estadística, calculada de todas las muestras posibles de determinado
tamaño.
www.senati.edu.pe
www.senati.edu.pe
¿En qué consiste la prueba de hipótesis?
Es una proposición respecto a uno o varios parámetros.
www.senati.edu.pe
¿CÓMO PODREMOS SABER SÍ LA HIPÓTESIS ES
CONSISTENTE O NO LO ES?
¿Al trabajar con una sola muestra , necesitamos saber si el
estadígrafo de esta muestra, está cerca del estadígrafo de la
distribución muestral?
Para ello , es útil el
www.senati.edu.pe
¿QUÉ DICE EL T. L. C. ( teorema del limite central )?
“ Es una proposición de que aún en muestras de tamaño
moderado ( más de 100 casos) , la distribución de las muestras
será aproximadamente normal.”
www.senati.edu.pe
Por lo tanto, podemos decir que el TLC
Cuanto mayor es el tamaño de la muestra , menos es la
variabilidad y por lo tanto más similar a la media de la
población será la media obtenida de la muestra
www.senati.edu.pe
Qué hace el investigador......
El investigador tiene que evaluar si la probabilidad de
que la media de la muestra esté cerca de la media de la
distribución muestral es grande o es pequeña.
www.senati.edu.pe
¿Qué se entiende por nivel de significancia o nivel α ?
www.senati.edu.pe
¿Cómo se relacionan la distribución muestral y el nivel
de significancia?
Área total es de
0,05
0,01
1,0
www.senati.edu.pe
Para ver si tenemos o no confianza al generalizar acudimos a la distribución
muestral ; ya que el nivel de significancia lo tomamos como un área bajo la
distribución muestral.
www.senati.edu.pe
Aplicado el concepto de probabilidad a la distribución muestral podemos
tomar el área de ésta como “1”.
Es aquí donde entra el nivel de significancia o nivel alfa (α) => nivel de probabilidad de
equivocarse.
www.senati.edu.pe
¿Qué hacemos para ver si nuestra hipótesis sobre la media
poblacional es aceptada o rechazada?
Debemos recordar que:
- La distribución muestral es una distribución normal de puntuaciones z
www.senati.edu.pe
Si nos dieran 95 boletos de 100 para la rifa de un automóvil ¿tendríamos
confianza en que el auto será nuestro?....
www.senati.edu.pe
¿ con qué porcentaje tiene confianza el investigador para
generalizar?
El nivel de significancia de 0.05, el cual implica que el investigador tiene
el 95% de seguridad para generalizar sin equivocarse.
www.senati.edu.pe
VEAMOS EL PROCEDIMIENTO
1. Establecer una hipótesis acerca del parámetro poblacional.
www.senati.edu.pe
Es importante recordar:
Recordar que la distribución muestral es una distribución normal
de puntuaciones “z”, o unidades de desviación estándar.
www.senati.edu.pe
¿ALGUNA DUDA? MUCHAS
Y GRACIAS
www.senati.edu.pe