Hipotesis Estadisitica 2 Usac

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 5

Universidad de San Carlos de Guatemala

Facultad de Ingeniería
Estadística 2
Sección N
Aux. Nixon Noriega

CLASE VIERNES 19/06/2020

MUESTRAS PAREADAS

También denominadas pares correspondientes, las muestras pareadas


involucran un procedimiento en el cual varios pares de observaciones se
equiparán de la manera más próxima posible, en términos de características
relevantes. Los dos grupos de observación son diferentes sólo en un aspecto o
“tratamiento”. Toda diferencia subsiguiente en los dos grupos se atribuye a dicho
tratamiento. Las ventajas de las muestras pareadas son:
1) Pueden utilizarse muestras más pequeñas
2) Se encuentran varianzas más pequeñas
3) Menos grados de libertad
4) Resulta un error de muestreo más pequeño (la variación entre
observaciones se reduce debdo a que corresponden de la forma más
próxima posible).
Las muestras pareadas se denominan pares correspondientes dos
observaciones que son lo más similares posibles entre sí. Sólo difieren en un
aspecto relevante. Supongamos que un investigar médico desea probar los
efectos de nuevos medicamentos sobre los niveles de presión sanguínea en los
pacientes. Veinte personas en un grupo se les hace corresponder de la manera
más próxima posible con 20 personas de un segundo grupo en términos de peso,
edad, sexo, nivel de actividad, colesterol y cualquier otro factor que puedan
afectar la presión sanguínea. Tendremos entonces 20 pares de “gemelos
idénticos”. A uno de los grupos se les proporciona una nueva droga, y el otro
recibe otra medicina. Sólo el investigador sabe cuál grupo recibe cada
medicamento. Toda diferencia subsiguiente, buena o mala, en las presiones
sanguíneas de los “gemelos” se atribuye a las medicinas debido a que se han
“corregido” todos los otros factores relevantes que afectan la presión sanguínea
(como la edad y el sexo); es decir, se han elaborado pares de observaciones
(gemelos) que son idénticos en términos de los demás factores relevantes.
Las muestras pareadas tienen ciertas ventajas ya que las muestras más
pequeñas con frecuencia conducirán a resultados más precisos; si controla los
demás factores importantes, el investigador no tendrá que tomas muestras
grandes para reducir el error de muestreo.
Universidad de San Carlos de Guatemala
Facultad de Ingeniería
Estadística 2
Sección N
Aux. Nixon Noriega

Ejemplo:
En el siguiente problema se asume que se tienen puntajes de 10 empleados
antes y después de haberles impartido capacitación laboral adicional. Los
puntajes aparecen en la tabla siguiente:
Tabla 1

Puntaje antes Puntaje


de la después de la
Empleado
capacitación capacitación
𝒅𝒊 𝒅𝒊 𝟐
en el trabajo en el trabajo
1 9.0 9.2 -0.2 0.04
2 7.3 8.2 -0.9 0.81
3 6.7 8.5 -1.8 3.24
4 5.3 4.9 0.4 0.16
5 8.7 8.9 -0.2 0.04
6 6.3 5.8 0.5 0.25
7 7.9 8.2 -0.3 0.09
8 7.3 7.8 -0.5 0.25
9 8.0 9.5 -1.5 2.25
10 7.5 8.0 -0.5 0.25
Totales 74.0 79.0 -5 7.38

La media de las diferencias entre todos los pares sería entonces:


∑ 𝒅𝒊
̅=
𝒅
𝒏
−5
𝑑̅ = = −0.5
10
La desviación estándar de las diferencias entre las observaciones pareadas es
la siguiente:

∑ 𝒅𝒊 𝟐 − 𝒏𝒅
̅𝟐
𝒔𝒅 = √
𝒏−𝟏

7.38 − 10(−0.5)^2
𝑠𝑑 = √ = 0.736
10 − 1
Universidad de San Carlos de Guatemala
Facultad de Ingeniería
Estadística 2
Sección N
Aux. Nixon Noriega

Como n<30 y la desviación estándar de las diferencias de los puntajes 𝝈𝒅


es desconocida, se requiere el uso del estadístico t. Si n hubiera sido mayor que
30 o 𝝈𝒅 fuera conocido, el estadístico Z se hubiera podido utilizar. Además, debe
asumirse que los valores d siguen una distribución normal. La distribución de los
puntajes puros en sí misma es inmaterial, pero los valores d deben ser normales.
Continuando con el problema anterior, si se tiene un nivel de confianza
del 90% y n-1=9 grados de libertad, un intervalo de confianza para la media de
la diferencia en los puntajes antes y después de la capacitación es:
𝒔𝒅
̅±𝒕
𝑰. 𝑪. 𝒑𝒂𝒓𝒂 𝝁𝒅 = 𝒅
√𝒏
0.736
𝜇𝑑 = −0.5 ± (1.833)
√10
−0.927 ≤ 𝜇𝑑 ≤ −0.073
Debido a que se restaron los puntajes posteriores al entrenamiento de los
puntajes anteriores al entrenamiento, produciendo valores negativos, se puede
estar 90% seguro que la media de los puntajes posteriores al entrenamiento está
entre 0.073 y 0.927 puntos.

Prueba de hipótesis con datos por pareados


Las muestras por pares para realizar una prueba de hipótesis ofrecen las
mismas ventajas que en la construcción de intervalos de confianza. Se
experimenta menos error de muestreo debido a la reducción en la variación entre
observaciones porque se hace la correspondiente tan cerca como sea posible.
̅ − (𝝁𝟏 − 𝝁𝟐 )
𝒅
𝒕= 𝒔𝒅
√𝒏
En donde 𝒅 ̅ es la media de las diferencias en las observaciones pareadas
y 𝒔𝒅 es el error estándar de dichas diferencias y se halla utilizando la fórmula:

∑ 𝒅𝒊 𝟐 − 𝒏𝒅
̅𝟐
𝒔𝒅 = √
𝒏−𝟏

Del ejemplo anterior se preparo un estimado de intervalo del 95% para la


diferencia de los puntajes de la capacitación. Si se desea probar una hipótesis
sobre la igualdad de los resultados:
𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
Universidad de San Carlos de Guatemala
Facultad de Ingeniería
Estadística 2
Sección N
Aux. Nixon Noriega
𝑯𝒊: 𝝁𝟏 ≠ 𝝁𝟐
−𝟎. 𝟓 − (𝟎)
𝒕= = −𝟐. 𝟏𝟒𝟖𝟐
𝟎. 𝟕𝟑𝟔
√𝟏𝟎
Dado que 𝒕𝜶/𝟐 = ±𝟐. 𝟐𝟔𝟐𝟐

Regla de decisión: Como la t de prueba se encuentra en el intervalo de la 𝒕𝜶/𝟐,


no se rechaza la hipótesis nula.

EJERCICIOS
Problema No.1
Midwest Products planea comercializar un nuevo producto sólo si por lo menos
al 40% del público le gusta. El departamento de investigación selecciona 500
personas y encuentra que 225 lo prefieren al de la competencia más cercana.
¿A un nivel de significancia del 2%, Midwest debería comercializar el producto?

Problema No.2
La gerencia de First Bank of America está planeando basar los cargos para las
cuentas corrientes en el saldo diario promedio. El gerente de cuentas
preferenciales desea probar la hipótesis de que las cuentas tienen un promedio
de $312. Se selecciona una muestra de 200 cuentas, dando una media de
$298.10 con s=$97.30. Para minimizar la probabilidad de un error tipo I, se
selecciona un valor α de 1%.

Problema No.3
Un negocio debe pagar horas extra dada la demanda incierta de su producto,
por lo cual en promedio se pagan 50 horas extra a la semana; el gerente de
recursos humanos considera que siempre se ha tenido una varianza de 25 en
las horas extras demandadas. Si se toma una muestra de 16 semanas se obtiene
una varianza muestral de 28.1. Determine con α = 0.10 si la varianza poblacional
de las horas extras demandadas a la semana puede considerarse igual a 25.
Universidad de San Carlos de Guatemala
Facultad de Ingeniería
Estadística 2
Sección N
Aux. Nixon Noriega

Problema No.4
Recientemente Johnson Manufacturing ha experimentado un incremento en el
número de unidades defectuosas. El supervisor de producción considera que el
turno de la noche produce una proporción una proporción más elevada de
defectos que los del turno del día. Para comparar la proporción de defectos, se
toma una muestra de 500 unidades de la producción del turno de día y revela 14
defectos. Una muestra de 700 unidades del turno de la noche muestra 22
defectos. Si una proporción más grande de defectos se origina en la producción
nocturna, el supervisor pretende instituir un programa de capacitación para que
los trabajadores mejoren sus destrezas laborales. ¿A un nivel del 5%, debería
implementarse el programa?

Problema No.5
Una compañía de perforación prueba dos brocas de barrena calando a un
máximo de 112 pies y registrando el número de horas que tomó el procedimiento.
La primera broca se utilizo en 12 casos, resultando un tiempo promedio de
x1=27.3 horas y s1=8.7 horas. Se excavaron 10 pozos con una segunda broca,
produciendo un x2=31.7 horas y s2=8.3 horas. ¿Parece que una broca es más
efectiva que la otra? Sea α=0.10

También podría gustarte