EII Intervalos de Confianza

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 41

Estadística II

Docente: Oveida Rosa Bustos Polo


Universidad Ponticia Bolivariana

2022
Introducción

En esta unidad hacemos hincapié en las armaciones inferenciales sobre la


estimación de un parámetro poblacional, basadas en la información que
contiene una muestra aleatoria. Centramos la atención en los métodos para
estimar una media poblacional o una proporción de los miembros de la
población que poseen una determinada característica.
Primero presentamos dos métodos de estimación. En primer lugar,
estimamos un parámetro poblacional desconocido por medio de un único
número llamado estimación puntual. Y un segundo método, que tiene en
cuenta esta variación estableciendo un intervalo de valores en el que es
probable que se encuentre la cantidad que queremos estimar
Propiedades de los estimadores puntuales

Cualquier inferencia extraída de la población se basa en estadísticos


muestrales. La elección de los estadísticos adecuados dependerá de cuál sea
el parámetro poblacional que interese. El valor de ese parámetro será
desconocido y uno de los objetivos del muestreo es estimar su valor. Debe
hacerse una distinción entre los términos estimador y estimación.
Estimador y estimación
Un estimador de un parámetro poblacional es una variable aleatoria que
depende de la información de la muestra; su valor proporciona
aproximaciones a este parámetro desconocido. Un valor especíco de esa
variable aleatoria se llama estimación.
Estimador puntual y estimación puntual
Consideremos un parámetro poblacional como la media poblacional k o la
proporción poblacional P . Un estimador puntual de un parámetro
poblacional es una función de la información de la muestra que genera un
único número llamado estimación puntual. Por ejemplo, la media muestral
X es un estimador puntual de la media poblacional, µ, y el valor que toma
X para un conjunto dado de datos se llama estimación puntual, x .
Estimador insesgado
Para buscar un estimador de un parámetro poblacional, lo primero que
debe ser es un estimador insesgado.
Estimador Insesgado
Se dice que un estimador puntual es un estimador insesgado de un
parámetro poblacional si su valor esperado es igual a ese parámetro; es
decir, si
E (θ̂) = θ

entonces θ̂ es un estimador insesgado de θ.


Observación:Obsérvese que el hecho de que un estimador sea insesgado
no signica que un determinado valor de θ̂tenga que ser exactamente el
valor correcto de θ; lo que signica es que tiene la capacidad de estimar el
parámetro poblacional correctamente en promedio. Un estimador insesgado
es correcto en promedio.
Intervalos de conanza

Estimador de intervalos de conanza


Un estimador de un intervalo de conanza de un parámetro poblacional es
una regla para hallar (basándose en la información muestral) un intervalo
que es probable que incluya ese parámetro. La estimación correspondiente
se llama estimación de un intervalo de conanza.
Intervalo de conanza y nivel de conanza

Intervalo de conanza y nivel de conanza


Sea θ un parámetro desconocido. Supongamos que, basándose en la
información muestral, se hallan variables aleatorias A y B tales que
P(A < θ < B) = 1 − α, donde α es cualquier número comprendido entre 0
y 1. Si los valores muestrales especícos de A y B son a y b, entonces el
intervalo de a a b se llama intervalo de conanza de θ al 100(1 − α) %.
La cantidad 100(1 − α) % se llama nivel de conanza del intervalo. Si se
extraen repetidamente muestras aleatorias de la población, el verdadero
valor del parámetro θ se encontrará en el 100(1 − α) % de los intervalos
calculados de esta forma. El intervalo de conanza calculado de esta forma
se expresa de la manera siguiente: a < θ < b a un nivel de conanza del
100(1 − α) %.
Intervalos de conanza de la media de una población que
sigue una distribución normal: varianza poblacional conocida

Primero suponemos que se toma una muestra aleatoria de una población


que sigue una distribución normal y que tiene una media desconocida y una
varianza conocida. Nuestro objetivo es hallar un intervalo de valores, en
lugar de un único número, para estimar una media poblacional. Este
problema a veces es poco realista, ya que en raras ocasiones se conoce
exactamente la varianza poblacional y, sin embargo, la media es
desconocida, pero algunas veces sucede.
Intervalos de conanza de la media de una población que sigue una
distribución normal: varianza poblacional conocida
Consideremos una muestra aleatoria de n observaciones extraídas de una
población que sigue una distribución normal de media µ y varianza σ2 . Si
la media muestral es x , entonces el intervalo de conanza al 100(1 − α) %
de la media poblacional, cuando la varianza es conocida, viene dado por :
x − zα/2 √σn < µ < x + zα/2 √σn

donde ME , el margen de error (también llamado error de muestreo) y la


amplitud, w , que es igual al doble del margen de error son:
ME = zα/2 √σn y w = 2(ME )

El límite superior de conanza, LSC, El límite inferior de conanza, LIC,


es: es:
LSC = x + zα/2 √σn LIC = x − zα/2 √σn
Ejemplo 1: Tiempo en la tienda de alimentación (intervalo de
conanza)
Supongamos que el tiempo que permanecen los clientes en una tienda local
de alimentación sigue una distribución normal. Una muestra aleatoria de 16
clientes tenía un tiempo medio de 25 minutos. Supongamos que σ = 6
minutos. Halle el error típico, el margen de error y la amplitud del intervalo
de conanza de la media poblacional, µ, al 95 por ciento.
Solución:
El error típico y el margen de error son:
Error típico= √σn = √616 = 1,5

Margen de error=ME=zα/2 √σn = (1,96)(1,5) = 2,94

Utilizando excel podemos calcular:


zα/2 = INV .NORM.ESTAND(1 − α/2) = INV .NORM.ESTAND(1 − (0,05/2)) = 1,96
ME=INTERVALO.CONFIANZA.NORM(α; σ; n) = INTERVALO.CONFIANZA.NORM(0,05; 6; 16) = 2,94
Ejemplo 1
Por lo tanto, la amplitud es igual a w = 2(2, 94) = 5, 88 y el intervalo de
conanza al 95 % para µ es:

σ σ
x − zα/2 √ < µ < x + zα/2 √
n n
25 − 2,94 < µ < 25 + 2,94
22,06 <µ< 27,94
Basándonos en una muestra de 16 observaciones, el intervalo de conanza
de la media poblacional desconocida al 95 por ciento va de alrededor de 22
minutos a alrededor de 28 minutos.Ahora bien, esta muestra no es más que
una de las muchas que podrían haberse extraído de la población.
Imaginemos que tomamos un número muy grande de muestras aleatorias
independientes de 16 observaciones de esta población y que a partir de cada
resultado muestral calculamos el intervalo de conanza al 95 por ciento.
Ejemplo 1
El nivel de conanza del intervalo implica que a largo plazo el 95 por ciento
de los intervalos obtenidos de esta forma contiene el verdadero valor de la
media poblacional. Es en este sentido en el que se dice que hay una
conanza del 95 por ciento en nuestra estimación del intervalo. Sin
embargo, no se sabe si nuestro intervalo es uno de los que pertenecen al 95
por ciento de los buenos o al 5 por ciento de los malos sin conocer µ.

Gráca 1: Descripción esquemática de intervalos de conanza al 95 por


ciento.
Ejercicio 1
Un proceso produce bolsas de azúcar renado. El peso del contenido de
estas bolsas sigue una distribución normal que tiene una desviación típica
de 12 gramos. El contenido de una muestra aleatoria de 25 bolsas tiene un
peso medio de 198 gramos. Halle el límite superior de conanza y el inferior
del intervalo de conanza al 99 por ciento del verdadero peso medio de
todas las bolsas de azúcar producidas por el proceso.
Reducción del margen de error
¾Puede reducirse el margen de error (y, por consiguiente, la amplitud) de
un intervalo de conanza? Consideremos los factores que afectan al margen
de error: la desviación típica poblacional, el tamaño de la muestra n y el
nivel de conanza. Manteniendo todos los demás factores constantes,
Reducir la desviación típica poblacional cuanto más puede
reducirse la desviación típica poblacional, σ, menor es el margen de
error. Las empresas se esfuerzan en reducir la variabilidad en la
medición de los productos. Cuando es posible, ése debe ser el primer
paso para reducir la amplitud. Sin embargo, a veces no es posible
reducir la desviación típica poblacional.
Aumentar el tamaño de muestra Otra manera de reducir el margen
de error es aumentar el tamaño de la muestra. De esa forma se reduce
la desviación típica de la distribución de la media muestral en el
muestreo y, por lo tanto, el margen de error. Es decir, manteniendo
constantes todos los demás factores, un aumento del tamaño de la
muestra n reduce el margen de error. Cuanta más información se
obtiene de una población, más precisa debe ser la inferencia sobre su
media.
Reducir el nivel de conanza manteniendo todos los demás factores
constantes, si se reduce el nivel de conanza (1 − α), el margen de
error disminuye. Por ejemplo, un intervalo de conanza al 95 por
ciento es menor que un intervalo de conanza al 99 por ciento basado
en la misma observación. Advertencia: la reducción del nivel de
conanza reduce la probabilidad de que el intervalo contenga el valor
del verdadero parámetro poblacional.
La siguiente gura muestra algunos de los efectos del tamaño de la
muestra n, la desviación típica poblacional σ y el nivel de conanza (1 − α)
en los intervalos de conanza de la media de una población que sigue una
distribución normal; la media muestral es en todos los casos 19,80.
Intervalos de conanza de la media: varianza poblacional
desconocida
Estudiaremos el caso en el que no se conoce el valor de la varianza
poblacional y que tiene considerable importancia práctica.
Intervalos de conanza de la media: varianza poblacional desconocida
Supongamos que tenemos una muestra aleatoria de n observaciones
extraídas de una distribución normal de media µ y varianza desconocida. Si
la media y la desviación típica muestrales son, respectivamente, x y s ,
entonces los grados de libertad v = n − 1 y el intervalo de conanza al
100(1 − α) % de la media poblacional, cuando la varianza es desconocida,
viene dado por:
x − tα/2;n−1 √sn < µ < x + tα/2;n−1 √sn

y el margen de error es:


ME = tα/2;n−1 √sn
Ejemplo 2: Camiones: consumo de gasolina (intervalo de conanza)
Los precios de la gasolina experimentaron una vertiginosa subida en los
primeros años de este siglo. Supongamos que se ha realizado recientemente
un estudio con camioneros que tenían más o menos el mismo número de
años de experiencia para comprobar el comportamiento de 24 camiones de
un determinado modelo en la misma autopista. Estime la media poblacional
del consumo de combustible de este modelo de camión con una conanza
del 90 por ciento suponiendo que el consumo de combustible, en millas por
galón, de estos 24 camiones es
15,5 21,0 18,5 19,3 19,7 16,9 20,2 14,5
16,5 19,2 18,7 18,2 18,0 17,5 18,5 20,5
18,6 19,1 19,8 18,0 19,8 18,2 20,3 21,8
Ejemplo 2
Solución:
1ero. Vericar que nuestros datos sigan una distribución normal, para ello
lo podemos vericar observando el siguiente gráco:

2do. Ahora calculando la media y la desviación típica, tenemos que:


x = 18, 68 ,s = 1, 69526 tn−1,α/2 = t23,0,05 = 1, 714

y reemplazando en la fórmula, tenemos que:


Ejemplo 2

s s
x − tα/2;n−1 √ < µ < x + tα/2;n−1 √
n n
1, 69526 1, √
69526 
18,68 − (1,714) √ < µ < 18,68 + (1,714)

24 24
18,1 <µ< 19,3
Utilizando excel podemos calcular:
tα/2;n−1 = INV .T ,2C (α; n − 1) = INV .T ,2C (0,1; 23) = 1,714
ME=INTERVALO.CONFIANZA.T (α; s; n) == INTERVALO.CONFIANZA.T (0, 1; 1, 69526; 24) = 0,5930

La interpretación del intervalo de conanza es importante. Si se seleccionan


repetidamente muestras aleatorias independientes de 24 camiones de la
población y se calculan intervalos de conanza de cada una de las
muestras, en un número muy grande de pruebas repetidas el 90 por ciento
de estos intervalos contendrá el valor del verdadero consumo medio de
combustible de este modelo de camión. Sin embargo, en la práctica no se
extraen repetidamente muestras independientes
Ejercicio 2
Una clínica ofrece un programa de adelgazamiento. Según sus historiales,
una muestra aleatoria de 10 pacientes había experimentado las siguientes
pérdidas de peso en kilos al término del programa:
18 25 6 11 15 20 16 19 12 17
1. Halle el intervalo de conanza de la media poblacional al 99 por ciento.
2. Explique sin realizar los cálculos si el intervalo de conanza de la
media poblacional al 90 por ciento sería mayor, menor o igual que el
obtenido en el apartado (1).
Intervalos de conanza de la proporción de la población
(grandes muestras)

Intervalos de conanza de la proporción de la población (grandes


muestras)
Sea p̂ la proporción observada de éxitos en una muestra aleatoria de n
observaciones procedentes de una población que tiene una proporción de
éxitos P . En ese caso, si n es lo sucientemente grande para que
(n)(P)(1.P) > 9, el intervalo de conanza al 100(1 − α) % de la
proporción de la población viene dado por:
q q
p̂(1−p̂) p̂(1−p̂)
p̂ − zα/2 n < p < p̂ + zα/2 n
donde ME , el margen de error (también llamado error de muestreo) es
q
p̂(1−p̂)
ME = zα/2 n
Ejemplo 3: Plan de pluses modicado (intervalo de conanza)
La dirección quiere una estimación de la proporción de los empleados de la
empresa que es partidaria de un plan de pluses modicado. Se ha observado
que en una muestra aleatoria de 344 empleados, 261 están a favor de este
plan. Halle una estimación del intervalo de conanza al 90 por ciento de la
verdadera proporción de la población que es partidaria de este plan
modicado.
Solución:
Si P representa la verdadera proporción de la población y p4la proporción
muestral, los intervalos de conanza de la proporción de la población se
obtienen por medio de la ecuación anterior:
q q
p̂(1−p̂) p̂(1−p̂)
p̂ − zα/2 n < p < p̂ + zα/2 n
Ejemplol 3
donde, en el caso de un intervalo de conanza al 90 por ciento, α = 0, 10,
por lo que a partir de la distribución normal estándar, y
zα/2 = z0,05 = 1, 645.
Se deduce que n = 344, p̂ = 261/344 = 0, 759 y y zα/2 = 1, 645
Por lo tanto, el intervalo de conanza de la proporción de la población al
90 por ciento es:
s s
p̂(1 − p̂) p̂(1 − p̂)
p̂ − zα/2 <p< p̂ + zα/2
n n
s s
(0, 759)(1 − 0, 759) (0, 759)(1 − 0, 759)
0, 759 − (1,645) <p< 0, 759 + (1,645)
344 344
0,721 <p< 0,797

Podríamos decir que a largo plazo alrededor del 76 por ciento (con un
margen de error del 4 por ciento al nivel de conanza del 90 por ciento) de
la población de todos los empleados de esta empresa es partidario del plan
modicado
Ejercicio 3:
En una muestra aleatoria de 95 empresas manufactureras, 67 han indicado
que su empresa ha obtenido la certicación ISO en los dos últimos años.
Halle el intervalo de conanza al 99 por ciento de la proporción poblacional
de empresas que han recibido la certicación en los dos últimos años.
Intervalos de conanza de la diferencia entre las medias de
dos poblaciones normales

Muestras dependientes: Consideramos que las muestras son


dependientes si en los valores de una de las muestras inuyen los de la
otra. En este sistema, los miembros de la muestra se eligen por pares,
uno de cada población, por lo que este método se conoce a menudo
con el nombre de datos pareados.
Muestras independientes, varianzas poblacionales conocidas o
desconocidas En este sistema, se extraen muestras
independientemente de las dos poblaciones que siguen una distribución
normal y tienen varianzas poblacionales conocidas, por lo que en la
pertenencia a una de las muestras no inuye la pertenencia a la otra.
Intervalos de conanza de dos medias: muestras dependientes (datos
pareados)
Supongamos que tenemos una muestra aleatoria de n pares de
observaciones enlazadas procedentes de distribuciones normales de medias
µX y µY . Es decir, sean x1 , x2 , ..., xn los valores de las observaciones de la
población que tiene la media µX ; e y1 , y2 , ..., yn los valores
correspondientes de la población que tiene la media µY . Sean d y sd la
media y la desviación típica muestrales observadas de las n diferencias
di = xi − yi . Si se supone que la distribución poblacional de las diferencias
es normal, entonces se obtiene un intervalo de conanza al 100(1 − a) % de
la diferencia entre las medias es:
d − tn−1;α/2 √sdn < d < d + tn−1;α/2 √sdn

donde
desviación típica de la diferencias de di
sd :
Margen de error = ME = tn−1;α/2 √sdn .
Ejemplo 4:Estudio sobre la reducción del colesterol (intervalo de
conanza)
Se realiza un estudio médico para comparar la diferencia de ecacia de dos
medicamentos para reducir el nivel de colesterol. El grupo de investigación
utiliza un enfoque de datos pareados para controlar la variación de la
reducción que podría deberse a factores distintos del medicamento. Los
miembros de cada par tienen las mismas características de edad, peso,
estilo de vida y otros factores pertinentes. Se administra el medicamento X
a una persona seleccionada aleatoriamente en cada par y el medicamento Y
a la otra persona del par. Tras un determinado periodo de tiempo, se mide
de nuevo el nivel de colesterol de cada persona. Supongamos que se
selecciona de las grandes poblaciones de participantes una muestra
aleatoria de ocho pares de pacientes que tienen problemas conocidos de
colesterol. La Tabla muestra el número de puntos en que se ha reducido el
nivel de colesterol de cada persona, así como las diferencias, di = xi − yi ,
correspondientes a cada par. Estime con un nivel de conanza del 99 por
ciento la diferencia media de ecacia entre los dos medicamentos, X e Y,
para reducir el colesterol.
Ejemplo 4

A partir de la Tabla, calculamos la media muestral, d , y la desviación típica


muestral observada, sd , de las diferencias de reducción del colesterol:
d = 1,625, sd = 3,777 y tn−1;α/2 = t7;0,01/2 = 3,499
Reemplazando en la fórmula, se tiene que:
sd sd
d − tn−1;α/2 √ < d < d + tn−1;α/2 √
n n
3,777 3√
,777
1,625 − (3,499) √ <d < 1,625 + (3,499)
8 8
−3,05 < d < 6,30
Ejemplo 4
Como el intervalo de conanza contiene el valor de cero, podemos concluir
que d podría ser positivo, lo que sugeriría que el medicamento X es más
ecaz; que d podría ser negativo, lo que sugeriría que el medicamento Y es
más ecaz; o que d podría ser cero, lo que sugeriría que el medicamento X
y el Y son igual de ecaces. Por lo tanto, no es posible saber si uno de los
dos medicamentos es más ecaz para reducir el nivel de colesterol.
Ejercicio 4:
Se desea hallar el intervalo de conanza de la diferencia entre las medias de
dos poblaciones que siguen una distribución normal basándose en las
siguientes muestras dependientes:

1. Halle el margen de error a un nivel de conanza del 90 por ciento.


2. Halle el LSC y el LIC a un nivel de conanza del 90 por ciento.
3. Halle la amplitud del intervalo de conanza al 95 por ciento.
Intervalos de conanza de la diferencia entre medias: muestras
independientes (distribuciones normales y varianzas poblacionales
conocidas)
Ejemplo 5: ¾Qué materia exige más tiempo de preparación de las
clases? (intervalo de conanza)
Ejemplo 5
Intervalos de conanza de dos medias: varianzas poblacionales
desconocidas que se supone que son iguales
Ejemplo 6:Multas de tráco (intervalo de conanza)
Ejemplo 6:Multas de tráco (intervalo de conanza)
Ejercicio 5:
Se encuesta a personas recién licenciadas en administración de empresas
que trabajan a tiempo completo y que declaran que su origen
socioeconómico es relativamente alto o bajo. La remuneración total media
de una muestra aleatoria de 16 personas de origen socioeconómico alto es
de 34.500 $ y la desviación típica muestral es de 8.520 $. La remuneración
total media de una muestra aleatoria independiente de 9 personas de origen
socioeconómico bajo es de 31.499 $ y la desviación típica muestral es de
7.521 $. Halle el intervalo de conanza al 90 por ciento de la diferencia
entre las dos medias poblacionales.
Intervalos de conanza de la diferencia entre medias:
muestras independientes (distribuciones normales y
varianzas poblacionales desconocidas diferentes).
Intervalos de conanza de la diferencia entre medias: muestras
independientes (distribuciones normales y varianzas poblacionales
desconocidas diferentes.)
Ejemplo 7: Auditores (intervalo de conanza)
Ejemplo 7: Auditores (intervalo de conanza)
Solución:
Ejercicio 6:
Se observa que en una muestra aleatoria de seis estudiantes de un curso de
introducción a la economía nanciera que utiliza técnicas de aprendizaje de
grupo la calicación media es de 76,12 y la desviación típica muestral es de
2,53. En una muestra aleatoria independiente de nueve estudiantes de otro
curso de introducción a la economía nanciera que no utiliza técnicas de
aprendizaje de grupo, la media y la desviación típica muestrales de las
calicaciones de los exámenes son 74,61 y 8,61, respectivamente. Estime
con una conanza del 95 por ciento la diferencia entre las dos calicaciones
medias poblacionales. Suponga que las varianzas poblacionales no son
iguales.

También podría gustarte