07 - Distribucion Normal

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 62

DISTRIBUCION NORMAL

CALIDAD TOTAL www.senati.edu.pe


AGENDA
LA DISTRIBUCIÓN NORMAL.
 Características.
 Estandarización.
 Uso de la Tabla de Áreas de la Curva Normal Estandarizada.
 Índice de capacidad del Proceso

www.senati.edu.pe
OBJETIVO
Elaborar gráfico de distribución normal a partir de una gran cantidad de datos.

www.senati.edu.pe
LA DISTRIBUCIÓN NORMAL.

DEFINICIÓN.

La distribución normal es una de las más importantes de las distribuciones, por la


frecuencia que se la encuentra y por las aplicaciones teóricas, esta también es llamada
distribución GUASSIANA.

La aplicación de esta distribución es muy alta como caracteres morfológicos de individuos,


animales plantas, de su especie como talla, peso, diámetro, perímetro, etc.

También a caracteres sociológicos como el consumo de ciertos productos por un grupo de


individuos, otro ejemplo aplicativo en la teoría de errores por ejemplo los errores que
cometemos cuando medimos algunas magnitudes

www.senati.edu.pe
La distribución normal fue reconocida por primera vez por el francés Abraham de
Moivre (1667-1754).

Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más profundos y


formuló la ecuación de la curva; de ahí que también se la conozca, más comúnmente,
como la "campana de Gauss".

La distribución de una variable normal está completamente determinada por dos


parámetros, su media y su desviación estándar, denotadas generalmente por µ y δ.

Con esta notación, la densidad de la normal viene dada por la ecuación:


Donde:
δ= desviación estándar
µ= media
X= variable
www.senati.edu.pe
Que determina la curva en forma de campana que tan bien conocemos (figura 1):

Figura 1. Gráfica de una distribución normal y significado del área bajo la curva

www.senati.edu.pe
CARACTERÍSTICAS.

La distribución de probabilidad normal presenta las siguientes características:

- Tiene una única moda, que coincide con su media y su mediana.


- La curva normal es asintótica al eje de abscisas. Por ello, cualquier valor entre
- ∞ y +∞ es teóricamente posible.
- El área total bajo la curva es, por tanto, igual a 1.
- Es simétrica con respecto a su media µ.
- Según esto, para este tipo de variables existe una probabilidad de un 50% de
observar un dato mayor que la media, y un 50% de observar un dato menor.
- La distancia entre la línea trazada en la media y el punto de inflexión de la
curva es igual a una desviación típica (δ). Cuanto mayor sea δ, más aplanada
será la curva de la densidad.
www.senati.edu.pe
- El área bajo la curva comprendida entre los valores situados aproximadamente a
dos desviaciones estándar de la media es igual a 0.95. En concreto, existe un 95%
de posibilidades de observar un valor comprendido en el intervalo (µ -1.96δ; µ +
1.96δ).
- La forma de la campana de Gauss depende de los parámetros µ y (δ Figura 2).
La media indica la posición de la campana, de modo que para diferentes valores
de µ la gráfica es desplazada a lo largo del eje horizontal. Por otra parte, la
desviación estándar determina el grado de apuntamiento de la curva. Cuanto
mayor sea el valor de δ, más se dispersarán los datos en torno a la media y la
curva será más plana. Un valor pequeño de este parámetro indica, por tanto, una
gran probabilidad de obtener datos cercanos al valor medio de la distribución.

www.senati.edu.pe
Figura 2. Ejemplos de distribuciones normales con diferentes parámetros.

(a) Distribución normal con distinta (b) Distribución normal con diferentes
desviación estándar e igual media medias e igual desviación estándar

www.senati.edu.pe
EJERCICIOS RESUELTOS.
1.- El tiempo medio en realizar una misma tarea por parte de los empleados de una empresa se distribuye según una distribución normal, con
media de 5 días y desviación típica 1 día. Calcular el porcentaje de empleados que realizan la tarea en un tiempo inferior a 7 días.
t1 = -¥ y t2 = (7 -5) /1 = 2
En la tabla la probabilidad acumulada para el valor 2 (equivalente a un tiempo inferior a 7 días.). Esta probabilidad es 0,9772. Por lo
tanto, el porcentaje de empleados que realizan la tarea en un tiempo inferior a 7 días es del 97,7

2.- La vida media de una lámpara, según el fabricante, es de 68 meses, con una desviación típica de 5. Se supone que
se distribuye según una distribución normal En un lote de 10.000 lámparas.
¿Cuántas lámparas superarán previsiblemente los 75 meses?
¿Cuántas lámparas se estropearán antes de 60 meses?

a.- t = (75 -68) /5 = 1,4


P (X > 75) = (t > 1,4) = 1 - P (t ≤ 1,4) = 1 - 0,9192 = 0,0808
Luego, el 8,08% de las lámparas (808 lámparas) superarán los 75 meses

b.- t = (60 -68) /5 = -1,6

P (X ≤ 60) = (t ≤ -1,6) = P (t> 1,6) = 1 - P (t ≤ 1,6) = 0,0548


Luego, el 5,48% del lote (548 lámparas) no llegarán probablemente a durar 60 meses.

www.senati.edu.pe
3.- El consumo medio bimestral de energía eléctrica en una ciudad es de 59 Kw/h., con una desviación típica de 6
Kw/h. Se supone que se distribuye según una distribución normal.

a) ¿Cuántos Kw/h. tendría que consumir bimestralmente para pertenecer al 5% de la población que más
consume?
b) Si usted consume 45 Kw/h. ¿qué % de la población consume menos que usted?

a.- Buscamos en la tabla el valor de la variable tipificada cuya probabilidad acumulada es el 0,95 (95%), por lo
que por arriba estaría el 5% restante. Este valor corresponde a t = 1,645. Ahora calculamos la variable normal X
equivalente a ese valor de la normal tipificada:
1,645 = (X -59) /6 Þ X = 67,87

Por lo tanto, tendría usted que consumir más de 67,87 Kw/h. bimestralmente para pertenecer al 5%
de la población que más consume.

b.- Vamos a ver en qué nivel de la población se situaría usted en función de los 45 Kw/h. consumidos.
Calculamos el valor de la normal tipificada correspondiente a 45 Kw/h. t = (45 -59) /9 = -
2.333
P (X ≤ 45) = P (t ≤ -2,333) = P (t > 2,333) = 1 - P (t≤ 2,333) = 1 - 0,9901 = 0,0099
Luego, tan sólo un 1,39% de la población consume menos que usted.

www.senati.edu.pe
4.-Una empresa instala en una ciudad 20.000 bombillas para su iluminación. La duración de una
bombilla sigue una distribución normal con media 302 días y desviación típica 40 días. Calcular.

a.- ¿Cuántas bombillas es de esperar que se fundan antes de 365 días?

b.- ¿Cuántas durarán más de 400 días?

Explica razonadamente las respuestas.


a) Tipificamos el valor 365 Þ t = (365 -302) /40 = 1,575
P (X ≤ 365) = P (t ≤1,575) = 0,9418
Luego el 94,18% de las lámparas, es decir 20.000 ∙ 0.9418 = 18.836 bombillas se
fundirán antes de 365 días
Tipificamos el valor 400 Þ t = (400-302) /40 = 2,45
P (X > 400) = P (t >2,45) = 1- P (t ≤2,45) = 1 - 0,9929 = 0,0071

Entonces el 0,71% de las lámparas, es decir 20.000 ∙ 0.0071 = 142 bombillas durarán más de
400 días.

www.senati.edu.pe
5.-El tiempo medio de los electricistas de una empresa en realizar el montaje de un determinado cuadro eléctrico es de 4 días, con una
desviación típica de 1 día. Se supone que se distribuye según una distribución normal. Calcular:

a) Porcentaje de electricistas que tardan menos de 3 días.


b) Tiempo a partir del cual del cual se sitúa el 10% de los electricistas que más tiempo emplean en realizar el cuadro.
c) Tiempos mínimo y máximo que engloba al 60% de los electricistas con tiempo medio.

a.- t= (3 -4)/1 = -1
P (X ≤ 3) = P (t ≤ -1)
P (t ≤ -1) = P (t > 1)
P (t > 1) = 1 - P (t ≤ 1) = 1 - 0,8413 = 0,1587
Luego, el 15,87 % de los electricistas emplean un tiempo inferior a 3 días.

b.- Buscamos en la tabla el valor de la variable tipificada cuya probabilidad acumulada es el 0,9 (90%), lo que quiere decir que por
encima se sitúa el 10% superior. Este valor corresponde a t = 1,282. Ahora calculamos la variable normal X equivalente a ese valor de la
normal tipificada:
1,282 = (X -4) /1 Þ X = 5,282
Despejando X, su valor es 5,282. Por lo tanto, el 10% de los electricistas que más tardan en realizar un cuadro lo hacen
en 5.28 días.

www.senati.edu.pe
c.- Buscamos en la tabla el valor de t cuya probabilidad acumulada es el 0,8 (80%). Como sabemos que hasta la media la
probabilidad acumulada es del 50%, quiere decir que entre la media y este valor hay un 30% de probabilidad. Por otra parte, al
ser la distribución normal simétrica, entre -t y la media hay otro 30% de probabilidad. Por lo tanto, el segmento (-t, +t)
engloba al 60% de los electricistas con tiempo medio.

El valor de t que acumula el 80% de la probabilidad es 0,842, por lo que el segmento viene definido por (-
0,842, +0,842). Ahora calculamos los valores de la variable X correspondientes a estos valores de t.

-0,842 = (X -4) /1 Þ X = 3,158


0,842 = (X -4) /1 Þ X = 4,158

Los valores de X son 3,158 y 4,158. Por lo tanto, los electricistas con tiempos comprendidos entre 3,158 días y
4,158 días constituyen el 60% de la población con un tiempo medio de realización del cuadro.

www.senati.edu.pe
EJERCICIOS PROPUESTOS.

1.-Sea Z una variable aleatoria normal, encuentre las siguientes


probabilidades:
a) P (-1.20 < z < 2.40)
b) P (1.23 < z < 1.87)
c) P (-2.35 < z < -0.50)

2.- Encuentre el valor de z que resuelva la siguiente probabilidad: a)


P (Z > z) = 0.1
www.senati.edu.pe
3.- Se ha ajustado el proceso de fabricación de un tornillo de manera que la
longitud promedio de los tornillos es de 13.0 cm. y la desviación estándar de la
longitud de los tornillos es 0.1 cm. Se sabe que la distribución de las longitudes
es normal.
a.- Determine la probabilidad de que un tornillo elegido al azar tenga una
longitud entre 13.0 y 13.2 cm?

b.- Determine la probabilidad de que la longitud de un tornillo elegido al azar se


exceda de 13.25 cm?

www.senati.edu.pe
4.- Se supone que el ancho de una herramienta utilizada en la fabricación
de semiconductores tiene una distribución normal con media 0.5
micrómetros y desviación estándar 0.05.
a.- ¿Cuál es la probabilidad de que ancho de la herramienta sea mayor
que 0?2 micrómetros?
b.- ¿Cuál es la probabilidad de que ancho de la herramienta se encuentre
entre 0?47 y 0.63 micrómetros?
c.- ¿Cuál es el valor del ancho de la herramienta para el cual el 90 % las
herramientas tienen un ancho mayor?

www.senati.edu.pe
5.- El diámetro de un eje metálico tiene una distribución normal con media de
0.2508 pulgadas y desviación estándar de 0.0005 pulgadas. Las especificaciones de
fabricación indican que el diámetro de los ejes debe estar entre 0.2485 y 0.2515
pulgadas. Se requiere determinar el porcentaje de ejes producidos que cumplan con
las especificaciones.

www.senati.edu.pe
6.- El diámetro de los remaches fabricados por un proceso sigue una
distribución normal con media 12.50 mm. y desviación estándar 0.02 mm.
Aquellos remaches cuyo diámetro se exceda de 12.55mm se reprocesan y
aquellos cuyos diámetros estén por debajo de 12.45 mm. se desechan. ¿Qué
porcentaje de producto se desecha y que porcentaje de producto se reelabora?

www.senati.edu.pe
7.- Un análisis estadístico de 1000 llamadas telefónicas de larga distancia hechas
desde una central indica que la duración de esas llamadas tiene una distribución
normal con media de 129.5 segundos y una desviación estándar de 30 segundos.
a.-¿Cuál es la probabilidad de que una llamada haya durado más de 180
segundos?
b.-¿Cuál es la probabilidad de que una llamada haya durados entre 89?5 y 169.5
segundos?
c.- ¿Cuántas llamadas duraron más de 60 segundos?

www.senati.edu.pe
8.- El tiempo de reacción de cierto experimento psicológico aplicado a un grupo
de personas tiene una distribución normal con media de 20 segundos y
desviación estándar de 4 segundos.
a.- ¿Cuál es la probabilidad de que una persona tenga un tiempo de reacción
menor a 14 segundos?
b.- ¿Cuál es la probabilidad de que una persona tenga un tiempo de reacción
entre 25 y 30 segundos?
c.- ¿Cuál debe ser el tiempo de reacción si solo el 1% de todas las personas
tienen un tiempo de reacción mayor?

www.senati.edu.pe
www.senati.edu.pe
Tabla 1. Áreas bajo la curva normal estándar. Los valores de la tabla que no se muestran en negrita representan la probabilidad
de observar un valor menor o igual a z. La cifra entera y el primer decimal de z se buscan en la primera columna, y el segundo
decimal en la cabecera de la tabla.

Segunda cifra decimal del valor de z

z 0.00 .01 .02 .03 .04 .05 .06 .07 .08 .09

0.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359

0.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753

0.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141

0.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517

www.senati.edu.pe
www.senati.edu.pe
¿Qué es normal, o qué se aparta de la normalidad?

1. Para establecer los límites entre lo habitual y lo raro, es


necesario conocer la distribución de la variable en estudio, en
individuos normales.

2. Las frecuencias de escalas de intervalos continuos se


representan gráficamente con histogramas.

3. La suma de las superficies de todas las barras equivale al


100% de las observaciones.

www.senati.edu.pe
HISTOGRAMA

1. Eje horizontal: valores hallados para


una determinada variable

2. Eje vertical: número de casos


encontrados para cada valor o
frecuencia de aparición

3. El histograma permite obtener una


primera impresión visual sobre la
distribución de los datos

www.senati.edu.pe
Distribución normal
La mayor parte de los fenómenos del comportamiento humano se representan de la siguiente
manera:

1. La mayoría de las puntuaciones se concentran en el centro de la distribución

2. Tanto en el extremo inferior como en el superior, encontraremos sólo algunos casos

Ejemplo:
 Distribución del coeficiente intelectual de las personas:
 Pocas personas presentan déficit o retardo
 Pocas personas son genios
 La mayoría somos personas medianamente inteligentes

www.senati.edu.pe
•La distancia entre la línea trazada en la media y el punto de
inflexión de la curva es igual a una desviación estándar

•La distribución queda completamente definida por el


promedio y la desviación estándar:

El promedio ± 1 D.E = 68,3% de los casos.


El promedio ± 2 D.E = 95,4% de los casos.
El promedio ± 3 D.E = 99.7% de los casos.

www.senati.edu.pe
Gráfica de una distribución normal y significado del área bajo la curva.

www.senati.edu.pe
Valores de tensión arterial sistólica en una muestra de 1000 pacientes
isquémicos ingresados en UCI.

www.senati.edu.pe
Variacion de la altura y amplitud de la campana de Gauss

www.senati.edu.pe
Histogramas y gráficos de probabilidad normal de los
valores de peso y edad en dos muestras de pacientes.

www.senati.edu.pe
La importancia de la distribución normal se debe a que hay variables asociadas a
fenómenos naturales que siguen el modelo de la normal.
• Caracteres morfológicos de individuos (personas, animales, plantas,...) de una especie,
p.ejm. tallas, pesos, envergaduras, diámetros, perímetros,...

• Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de


una misma cantidad de abono.

• Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo


grupo de individuos, puntuaciones de examen.

• Caracteres psicológicos, por ejemplo: cociente intelectual, grado de adaptación a un


medio,...

 Errores cometidos al medir ciertas magnitudes.

 Valores estadísticos muéstrales, por ejemplo : la media.

 Otras distribuciones como la binomial o la de Poisson son aproximaciones normales,


...
www.senati.edu.pe
Cálculos de áreas bajo la curva

www.senati.edu.pe
Probabilidad de Ocurrencia
Supongamos que frente a una determinación de glucosa en la sangre
tengamos que definir si este valor es normal o no.

Aceptamos que la glucosa sanguínea tiene una distribución normal con


promedio 83 y desviación estándar 4

Supongamos que un paciente con glucosa de 90, para determinar si es


habitual tener ese valor , o superior, debemos conocer la probabilidad
con que esto ocurre

www.senati.edu.pe
Probabilidad de Ocurrencia
1. Para calcular el área bajo la curva, lo cual corresponde a la
probabilidad de ocurrencia, se han construido tablas de áreas
de la normal.

2. Esta tabla se trabajo, con el concepto de


curva normal estandarizada => media = 0 y S = 1

3. Para poder usar estas tabulaciones es necesario transformar la


variable original en que están todos los datos, de manera que
su promedio y su desviación estándar tengan esos valores.
www.senati.edu.pe
Estandarización de las variables
• Para calcular probabilidades, con variables que siguen una distribución normal se usan
tablas

• Pero sería imposible tener una tabla para cada posible distribución normal,

• Solamente tenemos la tabla de la distribución normal estándar.

• Necesitaremos, pues, ser capaces de transformar las variables X "normales" N (µ,s)

• En variables Z que sigan una distribución normal estándar N (0,1).

• Este proceso se llama tipificación o estandarización de la variable.

www.senati.edu.pe
Puntaje “z”
1. La variable transformada se llama variable normal estándar y se simboliza con “z”

2. Las puntuaciones “z” son transformaciones que se hacen a los valores observados,
con el propósito de analizar su distancia respecto a la media en unidades de desviación
estándar.

z = x – promedio
D.E.

www.senati.edu.pe
Veamos el ejemplo de la glucosa

z = x – promedio
D.E. 90 se encuentra a 1,75 del promedio
z = 90 – 83 = 7 = 1,75 La desviación Standar ( S ) es 1,75 del promedio
4 4
Este valor se busca en la Tabla de puntajes “z”, para determinar la probabilidad de encontrar
glicemias iguales o superior a 90 mg por 100 ml de sangre.

El valor encontrado en la Tabla es 0,0401, lo que significa que es probable que haya un
4,01% de individuos sanos con valores iguales o superior a 90 mg por 100 ml de sangre.

www.senati.edu.pe
Veamos otro ejemplo:
Valor observado: 50
Promedio: 60
Desviación estándar: 10

z = 50 – 60 = -10 = -1
10 10
Podemos decir que el valor “50” está localizado a una desviación estándar por debajo de la
media de la distribución .

El valor “30” estará a tres desviaciones estándar por debajo de la media.

www.senati.edu.pe
www.senati.edu.pe
Tabla 1. Áreas bajo la curva normal estándar. Los valores de la tabla que no se muestran en negrita representan la probabilidad
de observar un valor menor o igual a z. La cifra entera y el primer decimal de z se buscan en la primera columna, y el segundo
decimal en la cabecera de la tabla.

Segunda cifra decimal del valor de z

z 0.00 .01 .02 .03 .04 .05 .06 .07 .08 .09

0.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359

0.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753

0.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141

0.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517

www.senati.edu.pe
1. RECORDEMOS
2. ALGUNOS CONCEPTOS

www.senati.edu.pe
Esquema de procedimiento de la estadística
inferencial.
Inferencia de
RECOLECCION DE los parámetros
LOS DATOS CALCULO DE
mediante
MEDIANTE UNA ESTADIGRAFOS
MUESTRA
técnicas
estadísticas
apropiadas.

La estadística inferencial puede ser utilizada para dos procedimientos:


 Probar hipótesis
 Para estimar parámetros

www.senati.edu.pe
Diagrama

Población Parámetros

Muestra Estimadores

www.senati.edu.pe
¿Qué es una distribución muestral?
 Una distribución muestral es un conjunto de valores sobre una
estadística, calculada de todas las muestras posibles de determinado
tamaño.

 Las distribuciones muestrales de medias, son las más comunes

 Si calculamos la media de todas las medias de las muestras posibles,


obtendríamos el valor de la media poblacional.

 Es más bien un concepto estadístico para los investigadores; lo que


comúnmente se hace es extraer una sola muestra.

www.senati.edu.pe
www.senati.edu.pe
¿En qué consiste la prueba de hipótesis?
 Es una proposición respecto a uno o varios parámetros.

 Lo que el investigador hace a través de la prueba de hipótesis


es determinar si la hipótesis es consistente con los datos
obtenidos en la muestra.

 Hipótesis consistente => valor aceptable


del parámetro

 Hipótesis no es consistente => se rechaza la Hip.

www.senati.edu.pe
¿CÓMO PODREMOS SABER SÍ LA HIPÓTESIS ES
CONSISTENTE O NO LO ES?
¿Al trabajar con una sola muestra , necesitamos saber si el
estadígrafo de esta muestra, está cerca del estadígrafo de la
distribución muestral?
Para ello , es útil el

Teorema del Límite central

www.senati.edu.pe
¿QUÉ DICE EL T. L. C. ( teorema del limite central )?
“ Es una proposición de que aún en muestras de tamaño
moderado ( más de 100 casos) , la distribución de las muestras
será aproximadamente normal.”

“ Especifica que la distribución muestral tiene una media


igual a la de la población , una varianza igual a la varianza de
la población dividida por el tamaño de la muestra y se
distribuye normalmente, donde la varianza puede estimarse
por la desviación estándar de la muestra.”

¿PARA QUE SIRVE?

“ Para hacer estadística inferencial sobre los valores de


una población”

www.senati.edu.pe
Por lo tanto, podemos decir que el TLC
 Cuanto mayor es el tamaño de la muestra , menos es la
variabilidad y por lo tanto más similar a la media de la
población será la media obtenida de la muestra

 Cuanto menor sea el grado de la variabilidad (σ/√n), más


ajustada a la media de la población serán las medias
que obtengamos de una muestra.

www.senati.edu.pe
Qué hace el investigador......
 El investigador tiene que evaluar si la probabilidad de
que la media de la muestra esté cerca de la media de la
distribución muestral es grande o es pequeña.

 Si es pequeña, el investigador dudará de generalizar a


la población y viceversa

www.senati.edu.pe
¿Qué se entiende por nivel de significancia o nivel α ?

El nivel alfa (α) es un nivel de probabilidad de equivocarse y se fija antes


de probar hipótesis inferenciales.
¿Y con qué porcentaje tiene confianza el investigador para
generalizar?
 El nivel de significancia del 0,01

 El nivel de significancia del 0,05

Por lo tanto; el nivel de significancia es un valor de certeza que


fija el investigador “a priori”

www.senati.edu.pe
¿Cómo se relacionan la distribución muestral y el nivel
de significancia?

La distribución muestral El nivel de significancia se


también se expresa como expresa en términos de
probabilidad probabilidad

Área total es de
0,05
0,01
1,0

www.senati.edu.pe
Para ver si tenemos o no confianza al generalizar acudimos a la distribución
muestral ; ya que el nivel de significancia lo tomamos como un área bajo la
distribución muestral.

EL NIVEL DE SIGNIFICANCIA REPRESENTA AREAS DE RIESGO O CONFIANZA EN


LA DISTRIBUCIÓN MUESTRAL.

www.senati.edu.pe
Aplicado el concepto de probabilidad a la distribución muestral podemos
tomar el área de ésta como “1”.

 Cualquier área comprendida entre dos puntos corresponderá a la probabilidad de


la distribución.

Para probar hipótesis inferenciales respecto a la media, el investigador debe evaluar si


es alta o baja la probabilidad de que la media de la muestra esté cerca de la media de
la distribución muestral.
Si es baja el investigador dudará de generalizar a la población.
Si es alta, el investigador podrá hacer generalizaciones.

Es aquí donde entra el nivel de significancia o nivel alfa (α) => nivel de probabilidad de
equivocarse.

www.senati.edu.pe
¿Qué hacemos para ver si nuestra hipótesis sobre la media
poblacional es aceptada o rechazada?
Debemos recordar que:
- La distribución muestral es una distribución normal de puntuaciones z

- Las puntuaciones z son distancias que indican áreas bajo la distribución


normal

- Área de riesgo => área de rechazo de la hipótesis


Área de confianza => área de aceptación de la hipótesis

- Se habla de una hipótesis acerca del parámetro

www.senati.edu.pe
Si nos dieran 95 boletos de 100 para la rifa de un automóvil ¿tendríamos
confianza en que el auto será nuestro?....

Lo mismo hace el investigador, obtiene una estadística en una muestra y


analiza que porcentaje tiene de confianza en que dicha estadística se
acerque al valor de la distribución muestral (universo), busca una
probabilidad elevada para inferir con seguridad dicho resultado a la
población general.

www.senati.edu.pe
¿ con qué porcentaje tiene confianza el investigador para
generalizar?
 El nivel de significancia de 0.05, el cual implica que el investigador tiene
el 95% de seguridad para generalizar sin equivocarse.

 El nivel de significancia de 0.01, el cual implica que el investigador tiene


el 99% para generalizar sin temor a equivocarse y 1% en contra.

 No se acepta un nivel de 0.06 (94% a favor de la generalización confiable),


ya que se busca hacer ciencia y no intuición)

www.senati.edu.pe
VEAMOS EL PROCEDIMIENTO
1. Establecer una hipótesis acerca del parámetro poblacional.

2. Definir el nivel de significancia

3. Recolectar los datos en una muestra representativa

4. Estimar la desviación estándar de la distribución muestral de la media

5. Transformar la media de la muestra en una puntuación z

6. En la tabla de áreas bajo la curva normal, buscar valor z

7. Comparo la media de mi muestra transformada a puntuación z con el valor 1,96. ; si


es menor acepto la hipótesis y si es mayor la rechazo.

www.senati.edu.pe
Es importante recordar:
 Recordar que la distribución muestral es una distribución normal
de puntuaciones “z”, o unidades de desviación estándar.

 Las puntuaciones “z” son distancias que indican áreas bajo la


distribución normal. En este caso, áreas de probabilidad.

 El área de riesgo es tomada como el área de rechazo de la hipótesis


y el área de confianza es tomada como el área de aceptación de la
hipótesis.

www.senati.edu.pe
¿ALGUNA DUDA? MUCHAS
Y GRACIAS

www.senati.edu.pe

También podría gustarte