Universidad Tecnologica Metropolitana de

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 30

UNIVERSIDAD TECNOLÓGICA METROPOLITANA

DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Estimaciones puntuales e intervalos de confianza

Def.- Estimación puntual. Es el valor calculado a partir de la información de muestreo, que se


emplea para estimar el parámetro de la población.

La media muestral , es una estimación puntual de la media poblacional, µ; ρ es una estimación


puntual de y, asimismo, s es una estimación puntual de σ: Supóngase que una empresa desea
calcular la edad promedio de compradores de equipos estéreo. Se selecciona una muestra aleatoria
de 50 adquirientes recientes, se determina la edad de cada uno y se calcula la edad media de los
seleccionados. El valor medio de esa muestra es una estimación puntual de la media poblacional.
Sin embargo, un valor estimado puntual representa sólo una parte de la historia. Al tiempo que se
espera que la estimación puntual se acerque al parámetro de la población, quisiéramos medir qué
tan cerca se encuentra. Un intervalo de confianza cumple con este propósito.

Def. Intervalo de Confianza: Corresponde a una gama de valores obtenidos a partir de datos de
muestreo, de modo que el parámetro ocurre dentro de esa variedad a una probabilidad específica. La
probabilidad específica en cuestión se denomina nivel de confianza.

Por ejemplo, se calcula la media de ingreso anual para los trabajadores de construcción en el área
de Nueva York – Nueva Jersey, como igual a $ 65000 (dólares). La variación de este cálculo podría
ser de $61000 a $69000. Al realizar una declaración de probabilidad, se puede describir la
confianza que se tiene en que el parámetro de la población, se encuentre en el intervalo. Por
ejemplo, puede afirmarse que se está 90% seguro de que la media del ingreso anual de los
trabajadores de la construcción en el área Nueva York – Nueva Jersey, está entre $61000 y
$69.000.

La información desarrollada acerca de la nueva distribución de muestreo de medias muestrales, lo


cual significa una distribución de muestreo de , permite localizar un intervalo que tenga una
probabilidad específica de incluir a la media de población µ. Para muestras razonablemente
mayores, se puede utilizar el teorema de límite central y afirmar lo siguiente:

1. Un 95% de las medias muestrales seleccionadas de una población estará dentro de 1.96
desviaciones estándares respecto de la media poblacional, µ.
2. Un 99% de las medias muestrales se encontrará dentro de 2.58 desviaciones estándares
respecto de la media de la población.

La desviación estándar mencionada aquí es la desviación estándar de la distribución de muestreo de


medias muestrales.

_______________________________________________________________________ 1

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Los intervalos calculados de esta manera se denominan el intervalo de confianza de 95% y el


intervalo de confianza de 99%. ¿Cómo se obtienen los valores de 1.96 y 2.58? El 95% y el 99% se
refieren al porcentaje de tiempo que los intervalos construidos similarmente incluirían el parámetro
que se estima. Por ejemplo, el de 95% se refiere al 95% central de las observaciones. Por lo tanto el
5% restante se divide por igual entre los dos extremos.

_______________________________________________________________________ 2

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

_______________________________________________________________________ 3

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Def.-Error Estándar de la Media Muestral.


En la sección anterior, la desviación media estándar de la distribución de muestreo de medias
muestrales dio como $200(dólares). Esto se conoce como el error estándar de la media muestral
y se representa por el símbolo , el cual se lee “sigma sub X con barra”. Frecuentemente se acorta
el nombre a error estándar.

Error estándar de la media muestral: Desviación estándar de la distribución de muestreo de las


medias muestrales.

El error estándar es una media de la variabilidad de la distribución de muestreo de la media


muestral. Se calcula mediante:

Error estándar de la media, cuando se conoce la desviación estándar


de la población.

Donde:

σ¯x : es el estándar de la media, también denominado desviación estándar de la distribución


de muestreo de la media.
σ : es la desviación estándar de la población.

n :es el tamaño de la muestra.

En la mayoría de los casos, se desconoce la desviación estándar de la población, por lo tanto, se


reemplaza con la desviación estándar de la muestra, esto es, se cambia por s. Después se escribe la
fórmula como sigue:

ERROR ESTÁNDAR DE LA MEDIA CON BASE EN LA DESVIACIÓN ESTÁNDAR DE LA


MUESTRA:

_______________________________________________________________________ 4

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Dos valores afectan el tamaño del error estándar. El primero es la desviación estándar. Si esta es
grande, entonces el error estándar también lo será. Sin embargo, el tamaño de la muestra también
afecta al error estándar. Al aumentar el tamaño de la muestra, el error estándar disminuye,
indicando esto que hay menor variabilidad en la distribución de las medias muestrales. Esta
conclusión es lógica, ya que una estimación realizada de una muestra grande debe ser más precisa
que un cálculo a partir de una muestra más pequeña.

Cuando el tamaño de la muestra, n, es al menos igual a 30, generalmente se acepta que el teorema
de límite central asegurará una distribución normal de las madias muestrales. Esta es una
consideración importante. Si las medias muestrales se distribuyen en forma normal, en los cálculos
se puede utilizar la distribución estándar normal, esto es, z.

INTERVALO DE CONFIANZA DE 95% PARA UNA MEDIA


1.96

INTERVALO DE CONFIANZA DE 99% PARA LA MEDIA

2.58

Como de descubrió antes, lo valores de 1.96 y 2.8 se refieren a los valores z correspondientes al
95% al 99% centrales de las observaciones, respectivamente.

Otros niveles de confianza pueden ser empleados. Para estos casos el valor z cambia
correspondientemente. En general, un intervalo de confianza de la media se calcula por:

INTERVALO DE CONFIANZA PARA UNA MEDIA

Donde z es el nivel de confianza. Entonces, para un intervalo de confianza de 92%, la fórmula es:

_______________________________________________________________________ 5

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Consideraciones

Intervalo de confianza para una proporción de la población.

La teoría y el procedimiento para determinar un estimador puntual y un estimador de intervalo para


una proporción de población se asemejan mucho a los descritos en la sección anterior. Una
estimación puntual para una proporción poblacional se obtiene dividiendo un número de éxitos de la
muestra, entre un número total muestreado. Supóngase que 100 de las 400 personas muestreadas
afirmaron que prefieren un nuevo refresco que probaron, en comparación con el que consumen
regularmente. La mejor estimación de la proporción de la población que está a favor de la nueva
bebida es 0.25 o sea 25%, que se obtiene dividiendo 100/400. Obsérvese que una proporción se
basa en un conteo del número de éxitos con relación al número total muestreado.

¿Cómo se estima el intervalo de confianza para una proporción de población?

INTERVALO DE CONFIANZA UTILIZANDO UNA PROPORCIÓN DE LA


POBLACIÓN

Donde es el error estándar de la proporción:

ERROR ESTÁNDAR DE LA PROPORCIÓN MUESTRAL:

Por lo tanto el intervalo de confianza se establece mediante:

INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN MUESTRAL

ρ (1 − ρ )
ρ±z
n

_______________________________________________________________________ 6

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Donde:

ρ es la proporción muestral

z es el valor z del grado de confianza seleccionado

n tamaño de la muestra

Ejemplo.-

Suponga que 1600 de 2000 trabajadores del sindicato de la empresa dijeron que planean poner a
votación una propuesta para unirse a una federación. Si se utiliza un nivel de confianza del 95% :

a) ¿Cuál es la estimación del intervalo para la proporción poblacional?

b) ¿A que conclusión se llegaría con base en el intervalo de confianza?

ρ (1 − ρ ) 0.80(1 − 0.80)
a) ρ±z = 0.80 ± 1.96
n 2000

= 0.80 ± 1.96 0.00008


[0.782 0.818]

Límites de confianza 78.2% y 81.8%

b) Con base en los resultados de la muestra, cuando votan todos los trabajadores sindicados,
la propuesta probablemente será aceptada debido a que el 75% esta por debajo del intervalo

Factor de Corrección para la población finita


Consideraciones

Cuando la población muestreada no es infinita y ni siquiera es muy grande, entonces se necesita


hacer algunos ajustes en la forma en que se calcula el error estándar de medias muestrales y el de
proporciones de muestra.

_______________________________________________________________________ 7

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

ERROR ESTÁNDAR DE LAS MEDIAS MUESTRALES


UTILIZANDO UN FACTOR DE CORRELACIÓN

σ N −n
σx =
n N −1

ERROR ESTÁNDAR DE LAS PROPORCIONES DE MUESTRA


UTILIZANDO UN FACTOR DE CORRELACIÓN

ρ (1 − ρ ) N − n
σρ =
N N −1

n
Sí la razón es menor que 0.05, se omite el factor de corrección para la población finita
N

Ejemplo.-

Hay 250 familias en Cochrane bajo. Una encuesta con 40 de ellas reveló que la media anual a la
iglesia es de $45000 con una desviación estándar de $7500. Establezca un intervalo de confianza
del 95% para la contribución media anual.

Respuesta

n 40
= = 0.16 . Por lo tanto se aplica factor de corrección
N 250

s  N −n $7500  250 − 40 


x± z⋅   = $45.000 ± 1.96 ⋅  
n  N − 1  40  250 − 1 

= $45.000 ± $2.324.27408 ⋅ 0.8434

= $45.000 ± 2.134,5392

= [$42.865,4608 $47.134,5392]

_______________________________________________________________________ 8

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Selección de un tamaño de muestra


Cuando se diseña un estudio estadístico una de las preocupaciones es determinar cuantos elementos
deben incluirse en la muestra. Si es demasiado grande se derrocha inútilmente dinero en la
recolección de datos, por otro lado si la muestra es demasiado pequeña, las conclusiones resultantes
podrían ser incorrectas. El tamaño correcto de la muestra depende de tres factores:

1.- Nivel de confianza deseado

2.- El máximo error permisible por el investigador

3.- Homogeneidad (variación) en a población que se estudia

Tamaño de la muestra para estimar una media

 z ⋅ s 
2

n =  
 E 

Donde:

n: es el tamaño de la muestra

z: es el valor normal estándar correspondiente al nivel de confianza deseado

s: es un estimado de la desviación estándar de la población (se debe conocer

Antes

E: es el máximo error permisible

Ejemplo.-

Legislador desea determinar el ingreso medio de los concejales de las comunas de todo Chile. El
error al estimar la media es de $10.000 con un nivel de confianza de 95%. Se sabe por la dirección
del trabajo que la desviación estándar se estima en $100.000¿Cuál es el tamaño de muestra
requerido.

_______________________________________________________________________ 9

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

 1,96 ⋅ $20000 
2

n=  = (13.07) = 170.82


2

 $3000 
Se requiere una muestra de 171 para cumplir con las especificaciones

Observación:- Si se aumenta el nivel de confianza al 99%, entonces la muestra debe tener el


siguiente tamaño.

 2,58 ⋅ $20000 
2

n=  = (17.02) = 289,68


2

 $3000 
Se requiere una muestra de tamaño 290, para cumplir con las especificaciones.

Tamaño de una muestra para una proporción

Se deben considerar tres aspectos

1.- El nivel de confianza deseado, generalmente 95% a 99%

2.- El margen de error que se requiere en la proporción

3.- Un estimado de la proporción poblacional

TAMAÑO DE LA MUESTRA PARA UNA PROPORCIÓN

2
 z 
n = p (1 − p )  
 E 

_______________________________________________________________________ 10

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Observación.- Es posible utilizar un cálculo de p , si se ha realizado algún plan piloto o se ha


obtenido de alguna otra fuente; de otra manera se utiliza p = 0,50 .

Ejemplo.-

Un estudiante desea determinar la proporción de ciudades que cuentan con fiscales regionales. El
estudiante quiere que el cálculo se halle dentro de 0,10 de la proporción de la población, el nivel
deseado de confianza es de 90%, y no hay estimación disponible para la proporción de población
¿Cuál es el tamaño requerido de la muestra.

Sol.- E = 0,10 z 90% = 1,65 p = 0.50

2
 1, 65 
n = ( 0 , 50 )( 0 , 50 )   = 68 , 0625
 0 ,10 

El estudiante necesita una muestra aleatoria de 69 ciudades

Pruebas de Hipótesis
Def.- Hipótesis: Enunciado acerca de una población elaborado con el propósito de ponerlo a
prueba.

Consideraciones

En la mayoría de los casos la población es tan grande que por diversas razones no sería posible
estudiar todos los elementos, objetos o personas de la población. Por ejemplo sería prácticamente
imposible entrevistar a todos los profesores para averiguar su ingreso mensual. De igual modo un
departamento de aseguramiento de la calidad no puede verificar la resistencia a la ruptura de cada
ampolleta producida, para determinar si está entre 5 y 20 psi (libras por pulgada cuadrada), no
quedaría nada para la venta.

Una alternativa de medir o entrevistar a la población completa es tomar una muestra de la población
de interés. Por tanto, es posible probar una afirmación a fin de determinar si la evidencia empírica
de la muestra fundamenta o no la afirmación concerniente a la población.

_______________________________________________________________________ 11

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Def.- Prueba de hipótesis: Procedimiento basado en la evidencia muestral y en la teoría de la


probabilidad que se emplea para determinar si la hipótesis es un enunciado razonable.

Procedimiento de cinco pasos para probar una hipótesis

Plantear Seleccionar Identificar Formular Tomar una


hipótesis nula una regla de muestra y
Un nivel de El valor decisión llegar a una
y alternativa
significación estadístico
decisión
de prueba

Paso 1 Paso 2 Paso 3 Paso 4 Paso 5

Rechazar
Aceptar
Ho y
H0 aceptar
H1

Paso 1.- Plantear la hipótesis Nula ( H 0 ) y la hipótesis Alternativa ( H 1 )

El primer paso es plantear la hipótesis que ha de ser probada. Se le denomina hipótesis nula H 0 :
afirmación (o enunciado) acerca de un parámetro poblacional

Observaciones.-

1.- Hay que subrayar que si la hipótesis nula se acepta con base en la evidencia muestral, no es
posible afirmar que tal hipótesis es verdadera. En otras palabras aceptarla no significa que H 0 se
cumple, sino que más bien no se pudo refutar H 0 .

H 1 : Hipótesis alternativa o de investigación. Afirmación que se aceptará si los datos muestrales


proporcionan amplia evidencia de que la hipótesis nula es falsa.

_______________________________________________________________________ 12

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Paso 2.- Seleccionar el nivel de significancia


Definir el nivel de significancia. Probabilidad de rechazar la hipótesis nula cuando es verdadera, se
denota mediante α (también se denomina nivel de riego)

Error de Tipo I ( α ).- Rechazar la hipótesis nula H 0 , cuando en realidad es verdadera

Error de Tipo II ( β ).- Aceptar la hipótesis nula cuando en verdad es falsa

Resumiendo

Investigador

Hipótesis nula Se acepta H 0 Se rechaza H 0

H 0 es verdadera Decisión Correcta Error de Tipo I

H 0 es falsa Error de Tipo II Decisión Correcta

Paso 3.- Calcular el valor estadístico de prueba


Existen muchos valores estadísticos de prueba, a saber:

a) z se utiliza en las pruebas de hipótesis para la media µ

x − µ
Se Conoce σ (desviación estándar poblacional) z = (*)
σ
n

El valor z se basa en la distribución muestral de x , que se distribuye de manera normal cuando la


muestra es razonablemente grande (n>30), con una media µ x igual a µ , y una desviación
σ
estándar σx = . De esta manera se puede determinar si la diferencia entre x y µ es
n
estadísticamente significativa encontrando el número de desviaciones estándares que x a partir de
µ , aplicando (*)

_______________________________________________________________________ 13

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

x − µ
Se desconoce σ ( desviación estándar poblacional) z = (*)
s
n

b) z se utiliza en las pruebas de hipótesis para la diferencia entre dos medias

cuando ( n 1 > 30 y n 2 > 30 )

x1 − x 2
z=
s12 s 22
+
n1 n 2

c) t se utiliza en las pruebas de hipótesis para la media µ , cuando n < 30

x − µ
t =
s
n

Grados de libertad: n − 1

(∑ x) 2
∑ ( x − x) 2 ∑ x2 − n
Donde: s= ó s=
n −1 n −1

_______________________________________________________________________ 14

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

d) t se utiliza en las pruebas de hipótesis para la diferencia entre dos medias

cuando ( n 1 < 30 y n 2 < 30 )

x1 − x 2
t =
1 1
s 2p [ + ]
n1 n2

(n1 − 1) s12 + (n2 − 1) s 22


Donde: varianza combinada S p2 =
n1 + n2 − 2

e) F se utiliza en las pruebas para varianzas iguales

S12
F= (n1 − 1) grados de.libertad numerador
Prueba para varianzas iguales S 22
(n2 − 1) grados de libertad deno min ador

Paso 4.- Formular la regla de decisión


Una regla de decisión es un enunciado de las condiciones según las que se acepta o se rechaza la
hipótesis nula. La región de rechazo define la ubicación de todos los valores que son demasiado
grandes o demasiado pequeños, por lo que es muy remota la probabilidad de que ocurran según una
hipótesis nula verdadera

Valor Crítico: Número que es el punto divisorio entre la región de aceptación y la región de
rechazo, de la hipótesis nula.

Paso 5.- Tomar una decisión


Tomar la decisión de rechazar o aceptar la hipótesis nula basada en la información muestral

_______________________________________________________________________ 15

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Prueba de significancia de una y dos colas


1.- Prueba estadística de dos colas: es aquella que sitúa la región crítica entre ambas colas de la
distribución muestral de la estadística de prueba

H 0 : µ = µ0 Hipótesis Nula
H1 : µ ≠ µ0 Hipótesis alternativa

Ejemplo 1.-

La empresa Nacional de muebles fabrica y ensambla escritorios y otros muebles para oficina, en
las diversas plantas que tiene en el país. La producción semanal del escritorio modelo desk en la
planta valdivia, se distribuye normalmente con una media de 200 y una desviación estándar de 16.
Recientemente debido a la expansión del mercado, se han introducidos nuevos métodos de
producción y se han contratado más empleados. El gerente de producción de la empresa, desea
saber si ha habido un cambio total en la producción semanal del citado mueble de oficina.
Planteado en otra forma ¿El número de escritorios producidos en la planta mencionada es diferente
de 200?, el número medio de escritorios producidos en el último año (n=50 semanas) es de 203,5.
Utilice nivel de significancia de 0,01

_______________________________________________________________________ 16

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Paso 1.-

H 0 : µ = 200 Hipótesis Nula


H 1 : µ ≠ 200 Hipótesis alternativa

Esta prueba es de dos colas ya que la hipótesis alternativa no establece la dirección

Paso 2.- Como se puede observar se utiliza el nivel de significancia α = 0,01 , o sea la
probabilidad de cometer un error de tipo I. De modo que es la probabilidad de rechazar una
hipótesis verdadera.

α 0,01
= = 0,005 , luego (1 − α ) = (1 − 0,01) = 0,99 distribuido en dos colas
2 2

(1 − α ) 0,99
= = 0,4950
2 2

Paso 3.- El valor estadístico de prueba para este tipo de problemas es z

Paso 4.- La regla de decisión se formula hallando el valor de z

p ( z ) = 0,4950 ⇒ −2,58 ≤ z ≤ 2,58



zona aceptación H 0

Paso 5.- Se toma una muestra de la población (producción semanal, se calcula el estadístico de
prueba y con base en la regla decisoria , se decidirá rechazar H 0 o no rechazarla

x − µ 203 , 5 − 200
z = = = 1 , 55
σ 16
n 50

Puesto que 1,55 no cae en la región de rechazo, H 0 no se descarta. De modo que se concluye que la
media de la población no es distinta de 200, así que se reporta al gerente de producción que la
evidencia muestral no refleja que la tasa productiva haya cambiado de 200 por semana. La
diferencia de 3,5 unidades entre la tasa de producción semanal histórica, y la del año anterior, puede
atribuirse al azar.

_______________________________________________________________________ 17

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

2.- Prueba estadística de una cola: es aquella en que la región de rechazo se localiza solamente en
un extremo de la distribución muestral de la estadística de prueba

Ejemplo 2.-

La empresa Nacional de muebles fabrica y ensambla escritorios y otros muebles para oficina, en
las diversas plantas que tiene en el país. La producción semanal del escritorio modelo desk en la
planta valdivia, se distribuye normalmente con una media de 200 y una desviación estándar de 16.
Recientemente debido a la expansión del mercado, se han introducidos nuevos métodos de
producción y se han contratado más empleados. El gerente de producción de la empresa, desea
saber si ha habido un cambio total en la producción semanal del citado mueble de oficina.
Planteado en otra forma ¿El número de escritorios producidos en la planta mencionada es menor
que 200?, el número medio de escritorios producidos en el último año (50 semanas) es de 203,5

Utilice nivel de significancia de 0,01

Paso 1.-

H 0 : µ ≤ 200 Hipótesis Nula


H 1 : µ > 200 Hipótesis alternativa

_______________________________________________________________________ 18

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Esta prueba es una cola ya que la hipótesis nula establece la dirección

Paso 2.- Como se puede observar se utiliza el nivel de significancia α = 0,01 , o sea la
probabilidad de cometer un error de tipo I. De modo que es la probabilidad de rechazar una
hipótesis verdadera.

Paso 3.- El valor estadístico de prueba para este tipo de problemas es z

Paso 4.- La regla de decisión se formula hallando el valor de z

p ( z ) = 0.4900 ⇒ z ≤ 2,33

zona aceptación H 0

Paso 5.- Se toma una muestra de la población (producción semanal, se calcula el estadístico de
prueba y con base en la regla decisoria , se decidirá rechazar H 0 o no rechazarla

x − µ 203 , 5 − 200
z = = = 1 , 55
σ 16
n 50

Puesto que 1,55 no cae en la región de rechazo, H 0 no se descarta. De modo que se concluye que la
media de la población es menor que 200, así que se reporta al gerente de producción que la
evidencia muestral refleja que la tasa productiva fue menor de 200 por semana. La diferencia de
3,5 unidades entre la tasa de producción semanal histórica, y la del año anterior, puede atribuirse al
azar.

Ejemplos misceláneos

Ejemplo 3.-

Se utilizan bloques de concreto en los cimientos de varios edificios. Las especificaciones indican
que la media aritmética mínima de las resistencias a la compresión de los bloques debe ser igual a
1.000 libras por pulgada cuadrada (psi). Si dos compañías envían muestras de bloques que tienen
tales resistencias superiores a la mínima (1.000 psi), entonces las especificaciones estipulan que
deben tomarse una de dos acciones:

1) Si se aplica una prueba estadística a los resultados muestrales, que indican que ambas
muestras pueden venir de poblaciones iguales o idénticas, el contrato para la adquisición de
bloques se dividirá en partes iguales.
_______________________________________________________________________ 19

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

2) Si los valores estadísticos de muestra señalan que las medias no son iguales, la compañía
que presente los bloques con mayor resistencia a la compresión, obtendrá el contrato.

Una obra de construcción extensa requiere un gran número de bloques de concreto. Dos
proveedores, Grau y Silfa, han surtido ese material a la constructora anteriormente y les interesa
suministrarlo ahora para dicho proyecto de construcción. Se seleccionó al azar un total de 81
bloques de Grau y 64 bloques de Silfa. Los valores estadísticos muestrales son:

Grau Silfa

x1 = 1070 x 2 = 1055

n1 = 81 n1 = 64

s1 = 63 psi s1 = 57 psi

Con un nivel de significancia de α = 0,01 . Determine si hay diferencia en la resistencia media a la


compresión de ambas compañías

1.- Plantear hipótesis

H 0 : µ1 = µ 2
H 1 : µ1 ≠ µ 2

Paso 2.- Como se puede observar se utiliza el nivel de significancia α = 0,01 , o sea la
probabilidad de cometer un error de tipo I. De modo que es la probabilidad de rechazar una
hipótesis verdadera.

α 0,01
= = 0,005 , luego (1 − α ) = (1 − 0,01) = 0,99 distribuido en dos colas
2 2

(1 − α ) 0,99
= = 0,4950
2 2

Paso 3.- El valor estadístico de prueba para este tipo de problemas es z

_______________________________________________________________________ 20

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Paso 4.- La regla de decisión se formula hallando el valor de z , se toma una muestra de la
población (producción semanal, se calcula el estadístico de prueba

p ( z ) = 0,4950 ⇒ −2,58 ≤ z ≤ 2,58



zona aceptación H 0

x1 − x2 1070 − 1055 15
z= = = = 1,50
s12 s 22 (63) 2 (57) 2 9,99
+ +
n1 n 2 81 64

Paso 5.- Con base en la regla decisoria , se decidirá rechazar H 0 o no rechazarla

Cae en el área de aceptación de la hipótesis nula. Por tanto no es posible rechazar la hipótesis de
que la resistencia media a la compresión de los bloques es la misma, la diferencia de 15 es
atribuible al azar. Luego la decisión final es distribuir el contrato entre ambos proveedores.

Ejemplo 4.-

El departamento de reclamaciones de la aseguradora Intercontinental, revela que en promedio


cuesta $60.000 la realización de todos los trámites, manejar todo el papeleo, pagar al investigador y
otros. Este costo se considera muy alto comparado con los de las otras compañías aseguradoras y se
instauraron medidas para rebajar los costos. A fin de evaluar el impacto del costo de tales medidas.
La empresa seleccionó una muestra aleatoria de 26 demandas y encontró que la media muestral
tenía el valor de $57.000 y con desviación estándar de $10.000. En el nivel de significancia de 0,01,
se puede concluir que las medidas realmente redujeron el costo?

Paso 1.-

H 0 : µ ≥ 60.000 Hipótesis Nula


H 1 : µ < 60.000 Hipótesis alternativa

_______________________________________________________________________ 21

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Paso 2.- Seleccionar nivel de significancia: Se nivel α = 0,01

Paso 3.- El valor estadístico de prueba para este tipo de problemas es t

Paso 4.- La regla de decisión se formula hallando el valor de t

con g.l. = 26 − 1 = 25 y α = 0,01 ( para una cola ) en Tabla t


p(t ) = 0.4900 ⇒ t ≥ −2,485

zona aceptación H 0

x − µ $ 57 . 000 − $ 60 . 000
t = = = − 1 , 530
s 10 . 000
n 26

Paso 5.- tomar una decisión

Puesto que -1,530 se encuentra en la región a la derecha de -2,485, la hipótesis nula no se


rechaza al nivel de significancia del 0.01, no hay una diferencia estadística importante entre

x y µ . Esto indica que las medidas para reducir el costo no han bajado el costo medio por
reclamación a menos de $60.000; con base en los resultados muestrales.

Ejemplo 5.-

La longitud promedio de una barra de acero es de 43 mm. Se cree que los ajustes en la máquina que
produce los elementos han cambiado la longitud de estos. La hipótesis nula es que no hay cambios
en la longitud media ( µ = 43) . La hipótesis alternativa es que ha ocurrido un cambio ( µ ≠ 43) .
Pruebe lo anterior con un nivel de significancia de 0.02.

Se seleccionaron aleatoriamente 12 elementos de la producción. Sus longitudes en milímetros


fueron:

42, 39, 42, 45, 43, 40, 39, 41, 40, 42, 43, 42

_______________________________________________________________________ 22

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Paso 1.- Se enuncia hipótesis nula y alternativa

H 0 : µ = 43
prueba de 2 colas
H 1 : µ ≠ 43

Paso 2.- Nivel de significancia α = 0,02 g.l. = (12 - 1) = 11

Paso 3.- El valor estadístico de prueba para este tipo de problemas es t

Paso 4.- La regla de decisión se formula hallando el valor de t

α
con g.l. = 12 − 1 = 11 y α = 0,02 ( para dos colas) ⇒ = 0,01 en Tabla t
2
p(t ) = 0.4900 ⇒ −2,718 ≤ t ≤ 2,718

zona aceptación H 0

x=
498
= 41,5 s=
∑ ( x − x) 2

=
35
= 1,78
12 n −1 12 − 1

x − µ 41 , 5 − 43 . 0
t = = = − 2 , 92
s 1 , 78
n 12

Paso 5.- tomar una decisión

Se rechaza la hipótesis nula con un nivel de significancia del 0.02 porque el valor t = −2,92 se
encuentra en el región de rechazo de la hipótesis nula. Con base en los resultados de la muestra se
concluye que la máquina se encuentra desajustada.

_______________________________________________________________________ 23

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Ejemplo 6.-

La empresa Pérez & Pérez fabrica y bobina motores para maquinarias de la gran minería que se
envían a distintas regiones del país. Se han propuesto dos procedimientos ajustar la bobina. La
pregunta es ¿existe alguna diferencia en el tiempo medio para ajustar las bobinas? .El primer
método fue creado por Juanito Pérez (procedimiento 1) y el segundo método por Luchito Pérez.
Para evaluar los dos métodos propuestos, se decidió efectuar un estudio de movimientos y tiempos.
Una muestra de 5 empleados se consideró utilizando el método 1 y otra de 6 aplicando el
procedimiento 2; los resultados en minutos se muestran a continuación.

¿Existe alguna diferencia en los tiempos medios de ajuste?. Utilice nivel de significancia de 0,10

Procedimiento 1 (en minutos) Procedimiento 2 (en minutos)

2 3

4 7

9 5

3 8

2 4

Paso 1.- Establecer hipótesis nula y alternativa

H 0 : µ1 = µ 2 Hipótesis Nula
H 1 : µ1 ≠ µ 2 Hipótesis alternativa

α
Paso 2.- Nivel de significancia α = 0,02 ⇒ = 0.01
2

Paso 3.- El valor estadístico de prueba para este tipo de problemas es t

Paso 4.- La regla de decisión se formula hallando el valor de t

_______________________________________________________________________ 24

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

α
con g.l. = 5 + 6 − 2 = 9 y α = 0,02 ( para dos colas) ⇒ = 0,01 en Tabla t
2
p(t ) = 0.4900 ⇒ −1,833 ≤ t ≤ 1,833

zona aceptación H 0

Paso 5.-

Procedimiento 1 (en minutos) Procedimiento 2 (en minutos)

x1 x12 x2 x 22

2 4 3 9

4 16 7 49

9 81 5 25

3 9 8 64

2 4 4 16

3 9

20 114 30 172

(∑ x ) 2 (20) 2
∑x 2

n
114 −
5 = 2,9155
s1 = =
n −1 5 −1

(∑ x) 2 (30) 2
∑ x2 − n
172 −
6 = 2,0976
s2 = =
n −1 6 −1

_______________________________________________________________________ 25

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Combinar varianzas muestras

(n1 − 1) s12 + (n2 − 1) s 22 (5 − 1)(2,9155) 2 + (6 − 1)(2,0976) 2


S p2 = = = 6,2222
n1 + n2 − 2 5+6−2

Luego

x1 − x 2 4 − 5
t = = = − 0 , 662
1
+
1 1 1 
6 , 2222  + 
2
s p[ ]
n1 n2 5 6 

Cae dentro de la región de aceptación de la hipótesis nula, luego se concluye que no existe
diferencia en el tiempo de ajuste de las bobinas, entre los dos métodos.

EJERCICIOS PROPUESTOS
1.- El Dr. González tiene cinco estudiantes que realizan un estudio independiente especial este
semestre. Para evaluar el avance en la lectura, el Dr. Aplicó un examen de cinco preguntas con
respuestas verdadero/falso. A continuación se presenta el número de respuestas correctas para cada
estudiante.

Estudiante Número Correcto

Araya 4

Díaz 3

Carrasco 5

Donoso 3

Gómez 2

¿Cuántas muestras de 2 estudiantes pueden tenerse de esa población?

a) Enuncie todas las muestras posibles de tamaño 2 y calcule las medias muestrales.

b) Organice las medias muestrales en una distribución de muestreo

c) Calcule la media de las medias muestrales y confróntela con la media de la población

_______________________________________________________________________ 26

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

d) Compare la forma de la población con la de la distribución de muestreo de muestras.

2.- Un estudio reciente de 50 estaciones de servicio en la región Metropolitana, reveló que el


precio de la gasolina de 95 octanos era de $680 el litro , y la desviación estándar de 30. Determine
un intervalo de confianza de 99% para el precio medio poblacional por litro de dicha gasolina.

3.- Una empresa constructora limita sus negocios a la reparación de andenes, construcción de
patios y edificaciones de cobertizo. El tiempo medio para la realización de cada uno de estos tres
trabajos es 12 horas, pero la desviación estándar es de 3 horas para reparar un andén, 6 horas para
un patio, y 8 para un cobertizo. Esta información se basa en muestras de 40 de cada tipo de trabajo:

a) Antes de realizar cualquier cálculo, ¿Cuál de los tres tipos de obra tendrá el menor intervalo de
confianza para el tiempo medio de la construcción . Utilice 99%.

b) Calcule un intervalo de confianza para el tiempo medio de construcción correspondiente a cada


tipo de trabajo.

4.- La Dra. Pérez, profesora readministración, estudia la relación entre los honorarios de trabajo y
la vida familiar. En una muestra de 120 personas que laboraban solamente en un turno de noche,
encontró lo siguiente

a) El tiempo medio a la semana que pasan cuidando a sus hijos fue de 27,2 horas, con una
desviación estándar de 10,3 horas. Determine un intervalo de confianza del 95% para el número
medio de las horas que pasan cuidando a sus hijos.

b) Un total de 18 indicó que sus padres también habían trabajado en u horario nocturno. Determine
el intervalo de confianza del 90% para la proporción de empleados cuyos padres también laboraron
en un turno de noche.

5.- Se llevará a cabo una encuesta de muestreo para determinar el ingreso familiar medio en cierta
área. La pregunta es ¿Cuántas familias deben ser encuestadas?. A fin de obtener mayor información
acerca del área, se realizó un pequeño estudio piloto y se calculó la desviación estándar de la
muestra en $50.000. El patrocinador del estudio desea que se utilice 95% de confianza y el error
máximo permisible es $10.000. ¿Cuántas familias deben ser entrevistadas?

6.- El banco Nacional al igual que otros bancos grandes, encuentra que el uso de cajeros
automáticos reduce el costo de las transacciones bancarias de rutina. Tal banco instaló un cajero
automático en las oficinas corporativas de la compañía. La máquina es para uso exclusivo de los
605 empleados del edificio corporativo. Después de varios meses de operación, una muestra de 100
empleados reveló que en un mes usan cajero automático como sigue:

_______________________________________________________________________ 27

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Nº de veces usa cajero Frecuencia

automático

0 25

1 30

2 20

3 10

4 10

5 5

Total 100

a) ¿Cuál es el estimado de la proporción de empleados que no usan el cajero en un mes?

b) Establezca un intervalo de confianza del 95% para ese cálculo¿ puede el banco tener la
seguridad de que al menos 40% de los empleados de la empresa utilizará el cajero
automático?

c) ¿Cuántas transacciones al mes utiliza el empleado promedio de la compañía?

d) Establezca un intervalo de confianza del 95% para el número medio de transacciones


durante un mes.

e) ¿Es posible que la media esperada de la población sea 0. Explique su respuesta.

7.- Una empresa de venta de bienes raíces agrícola a nivel nacional, tiene consignado en sus
registros que el tiempo medio de venta de una parcela agrícola es de 90 días. Debido a recientes
condiciones de sequía, estima que el tiempo medio de ventas será ahora mayor de 90 días.

Un estudio a nivel estatal de 100 parcelas agrícolas vendidas recientemente reveló que el tiempo
de ventas medio era de 94 días, con una desviación estándar de 22 días. Al nivel de significancia del
10 % ¿Se puede concluir que el tiempo de venta ha aumentado?

8.- La empresa de semillas envasa su abono de corteza de pino en sacos de 50 kilos. Desde hace
mucho tiempo el departamento de envasado reporta que la distribución es normal y que la
desviación estándar de este proceso es de 3 kilos por saco. Al final de cada día. El supervisor de la
empresa pesa 10 sacos y calcula el peso medio de la muestra. A continuación se presentan los pesos
de 10 sacos de la producción de hoy.

_______________________________________________________________________ 28

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

45.6 47.7 47.6 46.3 46.2

47.4 49.2 55.8 47.5 48.5

a) ¿Puede el supervisor concluir que el peso medio de los empaques es menor que 50 kilos? .
Utilice el nivel de significancia de 0.01.

b) En un reporte breve, diga porque el supervisor puede utilizar una distribución z como
valor estadístico de prueba.

9.- Un ingeniero industrial de una empresa desea determinar si se producen más unidades en el
turno de la tarde que en el de la mañana. Una encuesta de 54 trabajadores del turno de la mañana
mostró que el número medio de unidades fue de 345 , con una desviación estándar de 21. U a
muestra de 60 trabajadores de la tarde indicó que el número medio de unidades producidas fue de
351, con una desviación estándar de 28 unidades. Al nivel de significancia de 0.05¿Es mayor el
número de unidades elaboradas en el turno de la tarde?.

10.- La empresa Watch Corporation de Suiza , afirma que sus relojes, en promedio , no se
adelantan ni se atrasan durante una semana. Una muestra de 18 relojes revelo los siguientes
tiempos de adelanto (+) o de atraso (-) en segundos, por semana¿ se puede concluir que vale 0 el
tiempo medio de adelanto o de atraso en los relojes?. Utilice el nivel de significancia de 0.05.

-0.38 -0.20 -0.38 -0.32 +0.32 -0.23 +0.30 +0.25 -0.10

-0.37 -0.61 -0.48 -0.47 -0.64 -0.04 -0.20 -0.68 +0.05

11.- La financiera Mega , estudia el uso de sus cajeros automáticos . De interés particular es si los
jóvenes (menores de 25 años) utilizan más tales máquinas que los adultos mayores. Para ampliar la
investigación se seleccionaron muestras de clientes menores de 25 años y mayores de 60 años. El
número de transacciones en el mes pasado en el cajero , se determinó para cada persona
seleccionada y los resultados se muestran a continuación. Al nivel de significación de 0.10 ¿ Puede
la gerencia del banco concluir que los jóvenes clientes usan más los cajeros automáticos?

_______________________________________________________________________ 29

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez
UNIVERSIDAD TECNOLÓGICA METROPOLITANA
DEPARTAMENTO DE MATEMÁTICA
_________________________________________________________________________________________________________

Edad Número de transacciones

Menores 10 10 11 15 7 11 10 9
de 25

Mayores 4 8 7 7 4 5 1 7 4 10 5
de 60

12.- Juan Pérez es el gerente de recursos humanos de una gran compañía de manufactura. En años
recientes ha observado, un aumento en el ausentismo y cree que está relacionado con la salud
general de los empleados. Hace 4 años, en un intento por mejorar la situación, dio inicio a un
programa de acondicionamiento, en el que los empleados realizaban ejercicios físicos durante su
hora de almuerzo. Para evaluar el programa seleccionó a una muestra aleatoria e 8 participantes y
determinó el número de días que cada uno se había ausentado en los 6 meses antes de que
comenzara dicho plan y en los últimos 6 meses . A continuación se presentan los resultados. Al
nivel de significancia de 0.05¿ Puede el gerente de recursos humanos concluir que el número de
ausencias ha disminuido?

Empleado Antes del Después Empleado Antes del Después


del del
Programa Programa
Programa Programa

1 6 5 5 4 3

2 6 2 6 3 6

3 7 1 7 5 3

4 7 3 8 6 7

_______________________________________________________________________ 30

Intervalos de Confianza
Dra. Ing. Teresa Brand Domínguez

También podría gustarte