Diapositiva de Distribucion Muestral

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 63

DISTRIBUCIONES MUESTRALES

Profesor: Kennedy Hurtado Ibarra.


Licenciado en Matemática y Física
Especialista en Estadística Aplicada
Magister en Estadística Aplicada
Doctor en Ciencias de la Educación

Celular: 3002426058
Kennedyhurtado@mail.uniatlantico.edu.co

Referencia: Llinas Humberto, Estadística Inferencial.


Canavo George, Probabilidad y Estadística Aplicaciones y Métodos.
Montgomery Douglas. Probabilidad y Estadística para Ingeniería.
CONTENIDO.

Muestras aleatorias y distribuciones


muéstrales.

• Introducción
• Distribución muestral para la media.
• Distribución muestral para una proporción
muestral.
• Distribución muestral de diferencia de dos
proporciones muéstrales.
• Distribución muestral de diferencia de medias.
• Distribución muestral para la varianza.
• Distribución muestral para la razón de varianza.
INTRODUCCIÓN.
Introducción:
En este capitulo, dedicaremos gran parte de nuestra atención a analizar
problemas que tienen por objeto averiguar algo acerca de las propiedades de
una población a partir de la información proporcionada por una muestra de
dicha población. Este es el objetivo de la estadística inferencial. La razón
principal para observar una muestra en lugar de la población completa es el
hecho de que la población es grande. Incluso en los casos en que se dispone
recursos suficientes para analizar la población completa, puede resultar
preferible dedicar esos recursos a un subconjunto pequeño de la población,
con la esperanza que tal concentración de esfuerzos produzca medidas más
precisas.
Definición: El error muestral es la diferencia entre un estadístico de la
muestra y el parámetro correspondiente de la población.
Definición: El sesgo muestral es la tendencia sistemática a favorecer la
selección de ciertos elementos de una muestra en lugar de otros.

TECNICAS DE MUESTREOS ALEATORIOS


El sesgo muestral puede suprimirse, o minimizarse, usando el principio de
aleatorización. Este principio se refiere a cualquier proceso de selección
de una muestra de la población en el que la selección es imparcial o no
está sesgada. Una muestra elegida con procedimientos aleatorios se
llama muestra aleatoria. Los tipos más comunes de técnicas de muestreo
aleatorio son:
• El muestreo aleatorio simple.
• El muestreo estratificado.
• El muestreo por conglomerados.
• El muestreo sistemático.
Muestreo aleatorio simple.
Definición: Un procedimiento de muestreo aleatorio simple es aquel en el que
todas las posibles muestras del mismo tamaño tienen la misma probabilidad
de ser escogidas. A las muestras obtenidas por procedimientos de este tipo se
las denomina muestras aleatorias simples.
Muestreo estratificado.
Definición : Suponga que una población de N individuos puede subdividirse
en K grupos mutuamente excluyentes (disyuntos), llamados estratos. El
muestreo (aleatorio) estratificado es la selección de muestras aleatorias
simples independientes de cada uno de los estratos de la población.

Muestreo por conglomerados.


Definición: Supongamos que una población puede dividirse
convenientemente en unidades relativamente pequeñas y
geográficamente compactas llamadas conglomerado. En el muestreo por
conglomerados, se selecciona de la población una muestra aleatoria simple
de conglomerados, y se contacta con cada individuo de los conglomerados
de la muestra, es decir, se lleva a cabo un censo completo en cada uno de
los conglomerados elegidos.
Muestreo sistemático

Definición: El muestreo sistemático es una técnica de muestreo que


requiere de una selección aleatoria inicial de observaciones seguida de otra
selección de observaciones obtenida usando algún sistema o regla.
Definición de inferencia estadística.

Es el proceso de sacar conclusiones de la población basada en la


Información de una muestra tomada de ella.

Objetivos de la estimación:

•Estimación de parámetros.
•Intervalos de confianzas.
•Pruebas de hipótesis.
DEFINICION DE POBLACIÓN.
Una población es el conjunto total de objetos que son de interés para un
problema dado. Los objetos pueden ser personas, animales, productos
fabricados, etc. Cada uno de ellos recibe el nombre de elemento o
individuo de la población.
Ejemplo: población estudiantil de la Universidad del atlántico, los niños
de una ciudad, enfermos de un hospital, etc.
DEFINICIÓN DE MUESTRA.
Una muestra es un subconjunto de la población. Ejemplo: Si todos los
estudiantes de la Universidad del Atlántico es una población, los
estudiantes nacidos en determinado mes del año pueden constituir una
muestra.

.
 
DEFINICION DE ESTADÍSTICOS Y PARÁMETROS.
Definición de estadístico: Son valores que se obtienen de una
. muestra, y se consideran como estimadores de los parámetros.
Media aritmética muestral
Desviación estándar muestral: S
Varianza muestral: S2
Proporción muestral:  

Definición de parámetros: Son valores que se obtienen de una


población.
Media aritmética poblacional: µ
Desviación estándar poblacional: σ
Varianza poblacional: σ 2

Proporción poblacional: P
Definición de inferencia estadística.

Es el proceso de sacar conclusiones de la población basada en la


Información de una muestra tomada de ella.

Objetivos de la estimación:

•Estimación de parámetros.
•Intervalos de confianzas.
•Pruebas de hipótesis.
Definición: Distribución muestral.

La distribución de un estadístico muestral recibe el nombre de distribución


muestral, o distribución en el muestreo y se define como la distribución de
probabilidades de los valores que puede tomar el estadístico a lo largo de
todas las posibles muestras con el mismo numero de observaciones que
pueden ser extraídas de la población.
Definición: Distribución muestral.

  𝒙𝟏 + ´
´ 𝒙𝟐 + ´
𝒙𝒏  
𝝈
´ =
𝑿 𝝈 𝒙=
𝒏 √𝒏
 
Distribución muestral de la media

Si sacamos muestras aleatorias de tamaños n de una población con


media µ y desviación estándar σ, entonces la distribución muestral
tiene las siguientes propiedades.
•El promedio de todos los valores posibles de medias muéstrales es
igual al parámetro µ .
= µ = E(x)
•Error estándar de la media muestral.
Es la desviación estándar de las posibles medias muéstrales,
 
• Si la población original tiene distribución normal , entonces para cualquier
tamaño muestral n la distribución de la media muestral es también normal.
( Teorema de limite central)
X ~ N(µ, σ), entonces, la distribución de la media muestral ~ N (µ, σ/)

• Si la población original no es normal, pero n es suficientemente grande la


distribución de la media es aproximadamente normal

X ~ N(µ, σ), entonces, la distribución de la media muestral ~ N (µ, σ/)


 
El caso para muestras grandes.

Teorema: Sea la media de una muestra aleatoria de tamaño n tomada de una


población con media µ y varianza σ > 0
2

Supongamos que se cumple alguna de las siguientes condiciones:


a)La población es normal y es σ 2 conocida (no importa el tamaño de n).

b) La población es normal, σ2es desconocida y n ≥ 30

c)La forma de la población es desconocida (o no normal), σ 2

es conocida o desconocida y n ≥ 30.


Entonces, la distribución muestral de la media muestral es normal con media µ y
varianza σ2
 
Como consecuencia de este teorema, se puede concluir que la variable aleatoria
Z=
Está distribuida normalmente con media 0 y varianza 1. Además,
en los casos en que la varianza sea desconocida y n ≥ 30, reemplazamos la desviación
poblacional σ por la desviación muestral s.
 
Ejemplo:
Supongamos que el incremento porcentual de los salarios de los funcionarios
de todas las corporaciones medianas se distribuye siguiendo una normal con
media 12,2% y desviación típica 3,6%. Se toma una muestra aleatoria de nueve
observaciones de esta población de incrementos porcentuales de salario.
¿Cuál es la probabilidad de que la media muestral sea mayor del 10%?.
Solución:
Tenemos que µ = 12,2, σ = 3,6 y n = 9.
Nos piden calcular P(X > 10). Como no conocemos el tamaño de la población,
supondremos que esta es infinita. Entonces, por el teorema, la media y el
error estándar de la distribución muestral de son:
= µ = 12,2 y = = = 1,2.
P( > 10) = P(Z > ( ) = P[Z > ( = P(Z > −1,83) = 1−P(Z ≤−1,83)
 
Ahora, como la población es normal y la varianza poblacional es conocida,
entonces, por el teorema, la distribución muestral de la media muestral es
normal o, lo que es equivalente, la variable Z tiene normal estándar .

Por tanto, teniendo que φ es la función de distribución normal estándar,


entonces, de la tabla normal,
Tenemos que:

P( > 10) = 1−P(Z ≤−1,83) = 1− φ(−1,83) = 1−0,0336 = 0,9664 ≈ 97%.

Concluimos, entonces, que la probabilidad de que la media muestral sea mayor


que un 10% es aproximadamente del 97%.
 
Ejemplo:
Un fabricante declara que la duración de las bujías que él fabrica sigue
una distribución normal con una media de 36.000 kilómetros y una
desviación estándar de 4.000 kilómetros. Para una muestra aleatoria
de dieciséis bujías, se obtuvo una duración media de 34.500
kilómetros. Si la afirmación del fabricante es correcta, ¿cuál es la
probabilidad de obtener una media muestral tan pequeña como esta o
menor?
Solución:
Tenemos que µ = 36.000, σ = 4.000 y n = 16.
Nos piden calcular P( < 34.500).
Como no conocemos el tamaño de la población, supondremos que
esta es infinita. Entonces, por el teorema, la media y el error estándar
de la distribución muestral de son:
 
= µ = 36.000 y
= σ /=
4.000 / = 1.000.
Entonces:
P( < 34.500) = P[Z < ()= P[Z < (
= P(Z < −1,5)
Ahora, como la población es normal y la varianza poblacional es conocida,
entonces, por el teorema, la distribución muestral de la media muestral es
normal o, lo que es equivalente, la variable Z tiene normal estándar.
Por tanto, teniendo que φ es la función de distribución normal estándar,
entonces, de la tabla normal.
Tenemos que:
P( < 34.500) = P(Z < −1,5) = φ(−1,5) = 0,0668 ≈ 6,68%.
 
Ejemplo:
Los tiempos requeridos para que unos trabajadores terminen cierta labor, se
distribuyen normalmente con media de 30 minutos y una desviación estándar de
9 minutos. Si de la planta de trabajadores se toma una muestra aleatoria de 25,
encuentre la probabilidad de que la media del tiempo requerido para concluir la
tarea en la muestra, esté entre 28 y 33 minutos.
Solución:
En este ejemplo
µ = 30, σ=9 y n = 25.
Nos piden calcular P(28 < < 33).
Como no conocemos el tamaño de la población, supondremos que esta es
infinita. Entonces, por el teorema, la media y el error estándar de la distribución
muestral de X son:
= µ = 30 y = = = 1,8
 
Por consiguiente, la probabilidad requerida es:
P(28 < < 33) = P(< Z <)
P[( < Z < ]
= P(−1,11 < Z < 1,67) = P(Z < 1,67) − P(Z < −1,11).
Ahora, como la población es normal y la varianza poblacional es conocida,
entonces, la variable Z tiene normal estándar.
Por tanto, de la tabla normal.
Tenemos que P(28 < < 33) = P(Z < 1,67) − P(Z < −1,11) = φ(1,67) − φ(−1,11) =
0,819 ≈ 82%.
Por consiguiente, la probabilidad pedida es aproximadamente del 82%.
 
Distribución muestral de la media muestral para muestras pequeñas
Teorema:
Si el muestreo se hace en una población normal con varianza desconocida y si las
muestras seleccionadas son de tamaño n < 30, entonces, la distribución muestral de
la media muestral es la t de Student con n−1 grados de libertad.
Este teorema implica que la variable aleatoria t =
tiene distribución t – estudent con v= n − 1 grados de libertad.
La distribución t, de la misma manera que la distribución normal
estándar, tiene forma de campana y tiene media igual a 0, alrededor
de la cual es simétrica. Su varianza, en cambio, es mayor que 1,
hecho que origina que la típica distribución t sea menos aguda en el
centro y “más alta” en las colas que la distribución normal estándar.

El área total bajo la distribución t es igual a 1. Hay una distribución t


diferente para cada valor de n − 1 (llamado grado de libertad).
 
Ejemplo:
Suponga que de una población normal con media 20 se toma una muestra
de tamaño 16. Si la desviación estándar muestral es 4, encuentre la
probabilidad de que la media muestral sea estrictamente mayor que 21,753.
Solución:
Tenemos que µ = 20, s = 4 y n = 16.
Debido a que la población es normal con σ desconocida y a que n < 30,
entonces, aplicaremos el teorema. Es decir,
la distribución muestral de la media muestral es la t de Student con v= n−1 =
15 grados de libertad.
Entonces: = µ = 20 y = = = 1.
Con esto, encontramos el valor de t para 21,753. Debido a que:

t = = = 1,753
 
y teniendo en cuenta la tabla t de Student con 15 grados de libertad,
entonces, la probabilidad pedida será.

P( > 21,753) = P(t > 1,753) = 0,05 = 5%.

Ejemplo:
Una muestra aleatoria de seis autos de un determinado modelo consumen
las siguientes cantidades en kilómetros por litro:
18,6 18,4 19,2 20,8 19,4 20,5. Determine la probabilidad de que el consumo de
gasolina medio muestral de los automóviles de este modelo sea menor que
17,6 kilómetros por litro, suponiendo que la distribución de la población es
normal con media 17.
 
Tenemos que µ = 17 y, en este caso, la muestra escogida es de tamaño
n = 6.
La media de la muestra es =19.4833 y S = 0.98.
Debido a que la población es normal con varianza desconocida y a que n < 30, entonces,
por el teorema, la distribución muestral de la media muestral es la t de Student con n−1 =
5 grados de libertad.,
Encontramos que:
= µ = 17 y =s / = 0,98 /≈ 0,4.

Con esto, el valor de t para 17,6 es t == = 1,5


Con ayuda de la tabla t de Student con 5 grados de libertad, entonces, la probabilidad
pedida será:

P( ≤ 17,6) = P(t ≤ 1,5) = 1−P(t > 1,5) ≈ 1−0,10 = 0,90.


 
Distribución muestral de una proporción muestral
Sea X el número de éxitos en una muestra binomial de n observaciones,
donde la probabilidad de éxito es p. Entonces, la proporción de éxitos en la
muestra = recibe el nombre de proporción muestral.
Teorema:
Sea la proporción de éxitos en una muestra aleatoria de n observaciones. Sea
la proporción de éxitos en la población. Entonces, la distribución muestral de la
proporción muestral tiene media µp = y varianza σ 2 dada: por:
= si la población es infinita,
= , si la población es finita, de tamaño N y si N no es demasiado grande en
comparación con n.
 
Teorema:
(Teorema de De Moivre-Laplace) Sea la proporción de éxitos en una muestra
aleatoria de n observaciones. Si se cumple alguna de las dos condiciones
siguientes:
• n ≥ 30, o
• np ≥ 5 y n(1−p) ≥ 5,
Entonces, la distribución muestral de la proporción muestral se puede
aproximar con una distribución normal.
 
Ejemplo:
Se toma una muestra de 250 casas de una población de edificios antiguos para
estimar la proporción de casas de este tipo cuya instalación eléctrica resulta
insegura. Supongamos que, de hecho, el 30% de todos los edificios de esta
población tienen una instalación insegura. Hallar la probabilidad de que la
proporción de edificios de la muestra con instalación insegura esté entre 0,25 y
0,35.
Solución:
Tenemos que p0= 0,30 y n = 250. Por consiguiente, tenemos que:
P(0,25 < p < 0,35) =
= = = 0.029
P(0,25 < p < 0,35 = =
= P(−1,72 < Z < 1,72) = P(Z < 1,72) − P(Z < −1,72).
Ahora, como n ≥ 30, entonces, por el teorema de De Moivre-Laplace , la
variable Z tiene distribución normal estándar. Por tanto, de la tabla normal,
tenemos que:

P(0,25 < p < 0,35) = P(Z < 1,72) − P(Z < −1,72) = φ (1,72) − φ (−1,72) =

0,9573 − 0,0427 = 0,9146.

Por tanto, la proporción de casas con instalación insegura estará dentro de


este rango para, aproximadamente, el 91,5% de las muestras de 250
observaciones de esta población.
 
Ejemplo: Se desea estudiar una muestra de 20 personas para saber la
proporción de ellas que tienen más de 40 años. Sabiendo que la proporción
en la población es del 40%, ¿cuál es la probabilidad de que la proporción en la
muestra sea menor del 50%?
SOLUCIÓN:
Aquí, n = 20 y p0= 0,4. tenemos que:
= = = 0,1095
Por consiguiente, la probabilidad pedida es:
P(p < 0,5) =P = P = P(Z< 0,91)
Ahora, observe que n < 30. Pero, debido a que
• np = 8 ≥ 5
• n(1−p) = 12 ≥ 5,
entonces, por el teorema de De Moivre-Laplace, la variable Z tiene
distribución normal estándar. Con esto y con la tabla normal, tenemos que:

P(p < 0,5) = P(Z < 0,91) = φ (0,91) = 0,8186.

Por tanto, la probabilidad de que la proporción en la muestra sea menor del


50% es aproximadamente del 82%.
Distribución muestral de diferencia de dos proporciones muestrales.
En muchas situaciones practicas el investigador necesita hacer inferencias
sobre la diferencia entre dos proporciones poblacionales. A continuación se
dan algunos ejemplos:
Medicina. ¿Es más alto el porcentaje de los casos de cáncer pulmonar en una
población que fuma que en otra compuesta por no fumadores?
Administración. ¿Hay diferencia entre los porcentajes de hombres y mujeres
en posiciones gerenciales?
 
TEOREMA:
Sea la proporción de éxitos observada en una muestra aleatoria de tamaño ,
procedente de una población con proporción de éxitos, y sea la proporción de
éxitos observada en una muestra aleatoria independiente de tamaño ,
procedente de una población con proporción de éxitos . Si los tamaños
muestrales son grandes, entonces, la distribución muestral de − es la normal
con media − y varianza

+ .
Esto implica que: z = , tiene distribución normal
 
estándar. Además, esta aproximación es valida si se cumple alguna de las dos
condiciones siguientes:
• ≥ 30 y ≥ 30.
• ≥ 5, (1−) ≥ 5,
≥ 5 y (1−) ≥ 5.
Ejemplo:
Los hombres y mujeres adultos radicados en una ciudad grande del norte de
cierto país difieren en sus opiniones sobre la promulgación de la pena de
muerte para personas culpables de asesinato. Se cree que el 12% de los
hombres adultos están a favor de la pena de muerte, mientras que sólo el 10%
de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias, una
de 150 hombres y otra de 100 mujeres, su opinión sobre la promulgación de la
pena de muerte para personas culpables de asesinato, determine la
probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor
que el de mujeres
 
Representemos con:
el porcentaje de hombres a favor de la pena de muerte
el de mujeres.
− = 0,12−0,10 = 0,02
El error estándar de las diferencias entre las proporciones muestrales es:
= = = 0,04

Entonces, el valor Z para − = 0,03 esta´ dado por:


Z = = = = 0,25
Fácilmente, podemos verificar que se cumplen las condiciones que se
necesitan para poder utilizar la aproximación del teorema. Por tanto, por este
teorema, la probabilidad pedida será:
P( − ≥ 0,03) = P(Z ≥ 0,25) = 1 − P(Z ≤ 0,25) = 1 − 0,5987 = 0,4013.
Distribución muestral de diferencia de medias

En muchas situaciones practicas el investigador concentra su investigación en


dos poblaciones. A menudo se desea sacar inferencias acerca de la diferencia
entre dos medias poblacionales. El método apropiado para analizar esta
información depende del procedimiento empleado al seleccionar las muestras.
Para ello se deben considerar las dos posibilidades siguientes:
• Datos pareados (o muestras dependientes)
• Muestras independientes
 
Datos pareados (o muestras dependientes)
Teorema:
Supongamos que disponemos de una muestra aleatoria de datos pareados
procedentes de distribuciones con medias y . Sean d y la media y la
desviación estándar muestral para las n < 30 diferencias di = xi −yi. Si se asume
que la distribución de las diferencias es normal, entonces, la distribución
muestral del D = X −Y es la t de Student con n−1 grados de libertad.

Ejemplo: La tabla de abajo recoge los datos de consumo de gasolina


correspondiente a una muestra aleatoria de 8 automóviles norteamericanos
de dos modelos diferentes. Se formaron pares con las dos muestras y cada
elemento de un determinado par fue conducido por la misma ruta y por el
mismo piloto.
xi = Autos A 19,4 18,8 20,6 17,6 19,2 20,9 18,3 20,4
yi = Autos B 19,6 17,5 18,4 17,5 18,0 20,0 18,8 19,2

(a) Determine la media y la desviación muestral de las diferencias en el


consumo de gasolina.
(b) Suponiendo que la distribución de las diferencias poblacionales es normal
con media -0,807, encuentre la probabilidad de que el consumo promedio de
gasolina del auto A sea mayor que el del auto B.
SOLUCIÓN:
(a) En la siguiente tabla se incluyen las diferencias di entre los datos de la
tabla anterior. Estas diferencias forman una muestra aleatoria procedente de
una población cuya media es µA−µB, la diferencia entre las medias
poblacionales entre dos modelos de autos.
ǣ ͝
͕ Ǥ
͘ ͕ ǡ͜ ͖͔ ǡ͚ ͛
͕ ǡ͚ ͝
͕ ǡ͖ ͖͔ ǡ͝ ͕ ǡ͗ ͖͔ ǡ͘
‹ ͜ ͜
—–‘
ǣ ͝
͕ ǡ͚ ͛
͕ ǡ͙ ͕ ǡ͘ ͛
͕ ǡ͙ ͕ ǡ͔ ͖͔ ǡ͔ ͕ ǡ͜ ͝
͕ ǡ͖
‹ ͜ ͜ ͜
—–‘ ›
†‹ ͔ ǡ͖
Ǧ ͕ ǡ͗ ͖ ǡ͖ ͔ ǡ͕ ͕ ǡ͖ ͔ ǡ͝ ͔ ǡ͙
Ǧ ͕ ǡ͖

 
d = 0,775 v = n -1 = 7

Por lo que

- = -0,807

= = 0,3413

P(d1>d2) = P =P(t>2,3645) = 0,025


 
Muestras independientes
Consideremos dos poblaciones con medias , y varianzas y respectivamente, y
supongamos que se seleccionan dos muestra aleatorias independientes de
tamaños , , con medias , y varianzas y, respectivamente. El objetivo también es
determinar la distribución muestral de −. Para ello distinguiremos los siguientes
casos:
Primer caso: varianzas poblacionales conocidas o desconocidas y muestras
grandes.
Si las dos poblaciones son normales, entonces, − también es normal. Por tanto,
la variable aleatoria,
Z = ,tiene una distribución normal estándar.
 
Teorema:
Sean las medias de muestras aleatorias independientes de tamaños y de
poblaciones con medias y varianzas y respectivamente. Supongamos que se
cumple alguna de las siguientes condiciones:
(a) Ambas poblaciones son normales y ambas varianzas poblaciones son
conocidas.
(b) Ambas poblaciones son desconocidas o no normales, ambas varianzas
poblacionales y son conocidas o desconocidas y ≥ 30, ≥ 30.
Ejemplo:
En un estudio para comparar los pesos promedios de niños y niñas de sexto
grado en una escuela de instrucción media, se usará una muestra aleatoria de
20 niños y otra igual de 25 niñas. Se sabe que, tanto para niños y niñas, los
pesos siguen una distribución normal. El promedio de los pesos de todos lo
niños de sexto grado de esa escuela es de 100 libras y su desviación estándar
es de 14,142, mientras que el promedio de los pesos de todas las niñas del
sexto grado es de 85 libras y su desviación estándar es de 12,247. Encuentre
la probabilidad de que el promedio de los pesos de los 20 niños sea al menos
20 libras más grande que el de los de las 25 niñas.
 
Supongamos que representa el promedio de los pesos de 20 niños y , el promedio
de los pesos de una muestra de 25 niñas. Nos piden calcular P(−> 20). Como las
dos poblaciones en cuestión son normales y con varianzas conocidas, entonces, por
el teorema, tenemos.
La distribución muestral de − es aproximadamente normal.

La media de la distribución muestral de es igual a − = 100 -85 = 15.


La varianza de la distribución muestral de − es:
= 16
 
Entonces, para determinar P(−> 20), encontramos el valor Z para una diferencia
de 20 libras.

= 1,25,

P(−> 20) = P(Z ≥ 1,25) = 1 − P(Z ≤ 1,25) = 1 − 0,8944 = 0,1056.

Por tanto, la probabilidad de que el promedio de los pesos de la muestra de


niños sea al menos 20 libras más grande que el de la muestra de las niñas es
0,1056.
 
. Segundo caso: varianzas poblacionales desconocidas, iguales y muestras
pequeñas.
Considere el caso en que se desconocen y , pero iguales, digamos, Entonces,
la variable aleatoria tiene − media y varianza:

+ , Además, se puede probar que si las dos poblaciones son normales,


entonces, − también es normal. Por tanto, la variable aleatoria
 
t =
.

= ; varianza muestral combinada.


Teorema:
Si son iguales y desconocidas, entonces, la distribución muestral de la media
tiene media y varianza estimada igual a , siendo es la varianza muestral
combinada. Además, si las dos poblaciones en cuestión son normales y los
tamaños de las muestras son pequeños (es suficiente considerar que sean
estrictamente menores que 30), entonces, la variable aleatoria
 
t = esta distribuida se según la distribución t con
.
v= grados de libertad.

Ejemplo:
Suponga que dos drogas A y B, de las que se dice que reducen el tiempo de
respuesta de las ratas a determinado estimulo, se están comparando en un
experimento de laboratorio. El experimentador supone que las respectivas
poblaciones de los tiempos de respuesta al estimulo no están distribuidos
normalmente y tienen varianzas iguales. Se administra la droga A a 12 ratas y la
droga B a 13. Cuando se lleva a cabo el experimento, la reducción promedio de
tiempo de respuesta al estimulo por parte de las ratas que están recibiendo la
droga A es 30,45 milisegundos con una desviación típica de 5 milisegundos.
.
Los datos correspondientes a la droga B son 24,9 y 6 milisegundos. ¿Cual es
la probabilidad de que la diferencia entre la reducción promedio de tiempo
de respuesta al estimulo por parte de las ratas que están recibiendo la
droga A y la reducción promedio de tiempo de respuesta al estimulo por
parte de las ratas que están recibiendo la droga B sea menor o igual a la
que se observo´ en el experimento? Suponga que no hay diferencia alguna
entre las dos drogas con respecto a la reducción promedio en tiempos de
respuestas y que las drogas son igualmente efectivas.

SOLUCIÓN: Como las dos poblaciones en cuestión son normales y los


tamaños de las muestras son pequeñas (obsérvese que los tamaños
muestrales son estrictamente menores que 30)
 
La distribución muestral de − es aproximadamente la t de Student con + − 2 =
12 + 13 − 2 = 23 grados de libertad.

Debido a que no hay diferencia alguna entre las dos drogas con respecto a la
reducción promedio en tiempos de respuestas y que las drogas son igualmente
efectivas, entonces, . Por nsiguiente, la media de la distribución muestral de − =
0.

= = 30,74

entonces, la varianza de la distribución muestral de − es:

= = 4,92
 
Con base en los datos, el valor t está dado por:

t =

Por consiguiente
 
Tercer caso: varianzas poblacionales desconocidas, diferentes y muestras
pequeñas.
En este situación supondremos que las poblaciones originales están distribuidas
normalmente, que las varianzas poblacionales son desconocidas y diferentes y
que las muestras son pequeñas. En este caso, se utilizaran las varianzas
muéstrales en vez de las varianzas poblacionales desconocidas , respectivamente
Teorema:
Si son diferentes y desconocidas, entonces, la distribución muestral de la media
tiene media − y varianza estimada igual a
+ . Además, si las dos poblaciones en cuestión son normales y los tamaños de las
muestras son pequeños (es suficiente considerar que sean estrictamente
menores que 30), entonces, la variable aleatoria
 
t =
esta´ distribuida según la distribución t de Student con:

V= grados de libertad
 
Ejemplo:
Repita el ejemplo anterior, pero ahora suponiendo que las poblaciones no tienen
distribución normal, que los tamaños muéstrales son menores que 30 (digamos =
12 y = 13) y que las varianzas poblacionales son diferentes.
V = = = 22,78 se aproxima 23

De nuevo, la media de la distribución muestral de − = 0.


La varianza de la distribución muestral de es − es:

t = = = 2,52
 
Por consiguiente,
P(−≤ 5,55) = P(t ≤ 2,52) ≈ 0,01.

Es decir, la probabilidad de que la diferencia entre la reducción promedio de


tiempo de respuesta al estimulo por parte de las ratas que están recibiendo
la droga A y la reducción promedio de tiempo de respuesta al estimulo por
parte de las ratas que están recibiendo la droga B sea menor o igual a la que
se observo´ en el experimento es aproximadamente del 1%.
 
Distribución muestral de la varianza muestral
Definicion: Sea una muestra aleatoria de una población. La cantidad

recibe el nombre de varianza muestral. Su raíz cuadrada, s, se denomina


desviación típica muestral.

Teorema: Si es la varianza de una muestra aleatoria de tamaño n de una


población distribuida normalmente con media µ y varianza , entonces, la
distribución muestral de , es una distribución chi- cuadrado con v = n – 1
grados de libertad.
 
EJEMPLO:
Cuando un proceso de producción esta´ funcionando correctamente, la
resistencia en ohmios de los componentes que produce sigue una distribución
normal con desviación típica 3,6. Se toma una muestra aleatoria de cuatro
componentes. ¿Cual es la probabilidad de que la varianza muestral sea mayor a
27?

SOLUCI´ON: Tenemos que n = 4 y σ = 3,6 y como la población en cuestión es


normal, entonces, podemos aplicar el teorema. Por tanto, teniendo en cuenta la
tabla del apéndice, la probabilidad que se nos pide es:

P( > 27) =
 
P( > 27) =P

=P

En consecuencia, la probabilidad de que la varianza muestral sea mayor


a 27 es aproximadamente del 10%
 

Teorema: Si y son las varianzas de muestras aleatorias independientes de


tamaño y tomadas de poblaciones normales con varianzas y ,
respectivamente, entonces, la variable aleatoria

F=
tiene una distribución F con = −1 y = −1 grados de libertad.
 
Ejemplo:
En una prueba sobre la efectividad de dos tipos de píldoras para dormir, A y
B, se utilizaran dos grupos independientes de personas con insomnio. A un
grupo de tamaño 61 se le administrara´ la píldora A y al otro grupo, de
tamaño 41, se le administrara´ la B, registrándose el numero de horas de
sueño de cada individuo participante en el estudio. Suponiendo que el
número de hora de sueño de quienes usan cada tipo de píldora se distribuye
normalmente y que = , calcule la probabilidad de que la razón de las
varianzas muestrales de A y B sea mayor que 1,64.
LIDERAZGO REGIONAL

También podría gustarte