Tema 11 Teoria Del Muestreo

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 60

ESTADÍSTICA y PROBABILIDADES

TEMA 12: TEORIA DE MUESTREO

Ing. César Verano Serruto


TEORIA DE MUESTRO
MUESTREO:
Es un procedimiento por medio del cual se estudia una parte de la
población llamada muestra, con el objetivo de inferir los resultados
obtenidos en la muestra, al total de la población.
Es importante relacionar el muestreo con lo que es el censo, el cual se
define como la enumeración completa de todos los elementos de la
población de interés.

Ing. Cesar A. Verano Serruto


VENTAJAS DEL MUESTREO:

a) Costos reducidos.
b) Mayor rapidez para obtener resultados.
c) Mayor exactitud o mejor calidad de la información:
debido a los siguientes factores
c.1 Volumen de trabajo reducido.
c.2 Puede existir mayor supervisión en el trabajo.
c.3 Se puede dar más entrenamiento al personal.
c.4 Menor probabilidad de cometer errores durante el
procesamiento de la información.
d) Factibilidad de hacer el estudio cuando la toma de datos implica
técnicas destructivas, por ejemplo:
- Pruebas de germinación.
- Análisis de sangre.
- Control de calidad.

Ing. Cesar A. Verano Serruto


VENTAJAS DEL CENSO:
Sin embargo, también se debe mencionar que el censo
tiene algunas ventajas que son las siguientes:
a) Existe una cobertura total.
b) Tiene aceptación pública.
c) No se requieren grandes conocimientos de
estadística.

Ing. Cesar A. Verano Serruto


TIPOS DE MUESTREO:
A. MUESTREO NO PROBABILISTICO:
Denominado también muestras dirigidas o intencionales, Los elementos de la
muestra no son seleccionados por procedimientos al azar o con
probabilidades conocidas de selección. Por lo tanto es imposible determinar
el grado de representatividad de la muestra.

Dentro de los tipos de muestreo no Probabilístico, podemos mencionar los


siguientes:

1. Muestreo por Juicio, Selección Experta o Selección Intencional:

El investigador toma la muestra seleccionado los elementos que a él le


parecen representativos o típicos de la población, por lo que depende del
criterio del investigador.

Ing. Cesar A. Verano Serruto


2. Muestreo casual o fortuito:
Se usa en los casos en no es posible seleccionar los elementos, y
deben sacarse conclusiones con los elementos que estén disponibles.
Por ejemplo: en el caso de voluntarios para pruebas de medicamentos
de enfermedades como el corazón, cáncer, etc.

3. Muestreo de cuota:
Se utiliza en estudios de opinión de mercado. Los enumeradores,
reciben instrucciones de obtener cuotas especificas a partir de las
cuales se constituye una muestra relativamente proporcional a la
población.

4. Muestreo de poblaciones móviles:

Este tipo de muestreo utiliza métodos de captura, marca y recaptura.


Se utiliza mucho en el estudio de migración de poblaciones de
animales y otras características.

Ing. Cesar A. Verano Serruto


B. MUESTREO PROBABILISTICO.
(ALEATORIO O ESTOCASTICO):

Es el método más recomendable si se está haciendo


una investigación cuantitativa porque todos los
componentes de la población tienen la misma
posibilidad de ser seleccionados en la muestra.

TIPOS DE MUESTREO PROBABILISTICO:


Entre los principales y más utilizados tenemos:

Ing. Cesar A. Verano Serruto


1) Muestreo aleatorio simple (m.a.s.)

Este método es uno de los más sencillos de aplicar, se


caracteriza porque cada unidad que compone la
población tiene la misma probabilidad de ser
seleccionado.

Fig. 1. Muestreo aleatorio simple. A partir de la población en estudio,


se seleccionan al azar el número de sujetos necesario para
completar la muestra necesaria a estudiar.

Ing. Cesar A. Verano Serruto


2) Muestreo Estratificado.
Este tipo de muestreo se caracteriza por la división de la
población en subgrupos o estratos debido a que las
variables que deben someterse a estudio en la población
presentan cierta variabilidad o distribución conocida que es
necesario tomar en cuenta para extraer la muestra.
En este tipo de muestreo, debe garantizarse, que la varianza
entre estratos sea la máxima y la varianza dentro de cada
estrato se mínima.

Fig. 2. Muestreo aleatorio estratificado. Se seleccionan al azar una muestra


de los 4 centros hospitalarios (estratos), que componen la población total de una
región del país (población bajo estudio); y de cada estrato, se selecciona
un número de sujetos que lo representan.

Ing. Cesar A. Verano Serruto


3) Muestreo Sistemático.

Este procedimiento se realiza a través del cálculo del intérvalo que regirá la selección
de los componentes de la muestra. "Algunos investigadores lo consideran como
técnica importante para realizar investigaciones sobre problemas sociales de gran
magnitud".
Para esto, se Procede al cálculo del intérvalo numérico que servirá de base para la
selección de la muestra. Este, se calcula dividiendo (N/m) el total de la población (N)
entre la muestra (m).

Fig. 3. Muestreo aleatorio sistemático. Se selecciona en forma


sistemática cada iésimo caso de la población en estudio.

Ing. Cesar A. Verano Serruto


4) Muestreo por conglomerados.
Este tipo de muestreo se usa en particular cuando no se dispone de una lista
detallada y enumerada de cada una de las unidades que conforman la población y
resulta muy complejo elaborarla. Se denomina conglomerado porque la población
es agrupada en conjuntos, manzanos, bloques, áreas, zonas, etc. No es lo mismo
que el estratificado porque en este procedimiento se agrupa según las variables a
estudiar y se puede identificar exactamente a la población.

Fig. 4. Muestreo por conglomerados. Se seleccionan al azar una muestra de 4 consultorios


de salud (conglomerados), de los 15 existentes en una localidad; y de cada conglomerado,
se mide la variable de interés a todos los sujetos que deben consultar en ellos.

Ing. Cesar A. Verano Serruto


PRINCIPALES ETAPAS DE UN ESTUDIO POR
MUESTREO:
1. Definición de objetivos:
Esta etapa comprende la identificación del problema y el establecimiento de
las metas del estudio.
2. Definición del marco de muestreo;
El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una población. Este generalmente puede ser de dos tipos:
a) Marco lista: Es una lista depurada (sin traslapes o duplicaciones) que
permite identificar a cada unidad de muestreo. Por ejemplo, una lista que
contenga el nombre de todos los proveedores de caña de azúcar de un
ingenio. Es recomendable que además de identificar a cada unidad muestral,
incluya algunas otras características de interés, por ejemplo, tamaño de la
finca de cada proveedor.
b) Grafico: Es un plano o mapa que permite identificar pequeñas áreas
usadas como unidades de muestreo en las que se ha dividido el área total.

Ing. Cesar A. Verano Serruto


3. Variables a medir y Métodos de medición:
• Es importante considerar el tipo de variable a medir, por
ejemplo: si se va a estudiar el rendimiento de caña de
azúcar, la variable es de tipo continuo, si interesa estimar
la proporción de agricultores que utilizan herbicidas para
el control de malezas, se medirá una variable de tipo
binomial. El tipo de variable a medir ayuda a definir el
esquema o tipo de muestreo.
Los métodos de medición deben de tener las siguientes
características:
• a) uniformidad.
• b) practicabilidad.
• c) deber ser comprensibles para el grupo de trabajo.

Ing. Cesar A. Verano Serruto


4. Tipo o Esquema de Muestreo:
• Existen actualmente una gran variedad de tipos o
esquemas de muestreo que han sido desarrollados para
diferentes situaciones, entre los mas usados están:
muestreo simple aleatorio, muestreo aleatorio
estratificado, muestreo sistemático.
5. Determinación del tamaño de muestra (n):
• Este punto se describirá detalladamente más adelante, y
depende de que es lo que se desea estimar y el esquema
o tipo de muestreo seleccionado.
6. Selección de las unidades de muestreo:
• Consiste en extraer un número n de unidades muéstrales
de una población de tamaño N.

Ing. Cesar A. Verano Serruto


7. Pre muestreo y pruebas de campo:
• En un estudio, es conveniente someter el método a
un prueba previa por las siguientes razones:
• a) Algunas veces es imprescindible realizar un pre
muestreo para tener una estimación preliminar de la
variabilidad de la población.
• b) Verificar la funcionalidad de un método de
muestreo.
• c) Estimar costos.
• d) Conocer la eficiencia de la organización del trabajo
de campo.
• e) Captar la aceptación, rechazo o dificultad para
obtener la información.

Ing. Cesar A. Verano Serruto


8. Organización del trabajo de campo:
• Incluye la capacitación de personal y todas las
operaciones necesarias para obtener la información
buscada
9. Análisis y Edición de resultados:
• Consiste en la representación e interpretación de
distribuciones simples, tabulaciones, gráficas o puede
considerar un análisis estadístico más complejo
(Estimación, pruebas de hipótesis, etc.) este análisis
dependerá básicamente de los objetivos de la
Investigación.

Ing. Cesar A. Verano Serruto


2. TAMAÑO DE MUESTRA PARA ESTIMAR LA MEDIA CON M.A.S. (PARA EL CASO DE
POBLACIONES FINITAS)

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente
relación:

donde:
n = tamaño de la muestra.
N = tamaño de la población.
Zα/2 = variable estandarizada de distribución normal.
S² = varianza de la muestra.
d = precisión del muestreo. (error muestral)
α = Nivel de significancia.

Generalmente es necesario hacer un pre muestreo de 30 elementos, con el objetivo


de hacer una primera estimación de S².

Ing. Cesar A. Verano Serruto


Ejemplo:
En un lote de frascos para medicina, con una
población de 8000 unidades, se desea estimar
la media de la capacidad en centímetros
cúbicos de los mismos.
A través de un pre muestreo de tamaño 35 se
ha estimado que la desviación estándar es de
2 centímetros cúbicos. Si queremos tener una
precisión 0.25 cms3, y un nivel de significancia del
5% . De que tamaño debe de ser la muestra ?.

Ing. Cesar A. Verano Serruto


DATOS:
• S = 2 cms3 ; N = 8000 ; d = 0.25 cms3 ; α = 0.05
(5%); Zα/2 = 1.96

Reemplazando:

Solo faltaría muestrear 203 frascos, pues los datos de


los 35 frascos del pre muestreo siguen siendo válidos.

Ing. Cesar A. Verano Serruto


Ing. Cesar A. Verano Serruto
en este caso para la estimación de la varianza, tenemos
dos opciones:
a) hacer un pre muestreo.
b) asumir varianza máxima. (p*q=0.5*0.5)
Ejemplo:
En un estudio, se desea determinar en que proporción
los niños de una región toman leche pasteurizada en el
desayuno. Si se sabe que existen 1,500 niños y
deseamos tener una precisión del 10 por ciento, con un
nivel de significancia del 5% . De que tamaño debe de
ser la muestra?.

Ing. Cesar A. Verano Serruto


Ing. Cesar A. Verano Serruto
EJEMPLOS
1. Calcular el tamaño de la muestra de una población de 500 elementos con
un nivel de confianza del 95%, varianza de 0.5 y un error máximo
permisible de 0.05.
2. Calcular el tamaño de la muestra de una población de 500 elementos con
un nivel de confianza del 99%, varianza de 0.5 y un error de muestreo de
0.05.
3. Calcular el tamaño de la muestra de una población de 500 elementos con
un nivel de confianza del 95%, varianza de 0.5 y un error máximo
permisible de 0.06.
4. Calcular el tamaño de la muestra de una población de 500 elementos con
un nivel de confianza del 99%, varianza de 0.5 y un error máximo
permisible de 0.06.

Ing. Cesar A. Verano Serruto


5. Una empresa eléctrica fabrica focos que tienen una
duración aproximadamente normal con una desviación
estándar de 40 horas. ¿De qué tamaño se necesita una
muestra si se desea tener 95% de confianza que la
media real esté dentro de 10 horas de la media
OBSERVADA?
6. Suponga que en el ejercicio anterior se tiene una
población de 300 focos, y se desea saber de que
tamaño debe de ser la muestra. El muestreo se
realizará sin reemplazo.

Ing. Cesar A. Verano Serruto


Ing. Cesar A. Verano Serruto
Ing. Cesar A. Verano Serruto
MUESTREO ESTRATIFICADO
• El objetivo del diseño de estudios por muestreo, es maximizar la
cantidad de información para un costo dado. El muestreo simple
aleatorio, es el diseño básico de muestreo y suele suministrar buenas
estimaciones de parámetros Poblacionales a un costo bajo.
• En esta parte, utilizaremos un segundo procedimiento de muestreo,
el muestreo aleatorio estratificado, el cual en muchas ocasiones
incrementa la cantidad de información para un costo dado.

Ing. Cesar A. Verano Serruto


DEFINICION DE MUESTREO ALEATORIO
ESTRATIFICADO:
• Una muestra aleatoria estratificada es la obtenida
mediante la separación de los elementos de la
población en grupos que no presenten traslapes,
llamados estratos y la selección posterior de una
muestra irrestrictamente aleatoria simple en cada
estrato.
• En resumen, los motivos principales para utilizar un
muestreo aleatorio estratificado son los siguientes:

Ing. Cesar A. Verano Serruto


a) La estratificación puede producir un error de
estimación más pequeño que el que generaría el
M.A.S. del mismo tamaño. Este resultado es
particularmente cierto si las mediciones dentro de
los estratos son homogéneas.
b) El costo por observación en la encuesta puede ser
reducido mediante la estratificación de los
elementos de la población en grupos
convenientes.
c) Se pueden obtener estimaciones de parámetros
poblacionales para subgrupos de la población. Los
subgrupos deben de ser entonces estratos
identificables.
Lo anterior debe de tomarse en cuenta cuando se
está planeando estratificar o no una población o
decidiendo en que forma se definirán los estratos.

Ing. Cesar A. Verano Serruto


TAMAÑO DE MUESTRA PARA ESTIMAR LA MEDIA CON M.A.E.
• Para estimar la media poblacional utilizando una variable aleatoria
continua se utiliza la siguiente relación:

• En donde:
• Ni = tamaño del i ésimo estrato.
• N = tamaño de la población.
• S²i = varianza del i ésimo estrato.
• wi = importancia o peso del i ésimo estrato.

D = ------ B = precisión.
4

Ing. Cesar A. Verano Serruto


Ejemplo 01:
• En un Ingenio, desea hacer una estimación del promedio de
grados Brix con que llega la caña a la fabrica. Para el efecto
desea realizar un muestreo aleatorio estratificado, puesto que
la caña puede provenir de tres tipos de proveedores.
• Proveedor tipo A (estrato 1) la caña proviene de lotes de la
misma finca.
• Proveedor tipo B (estrato 2) la caña proviene de fincas de
particulares en donde el ingenio ha prestado servicios.
• Proveedor tipo C (estrato 3) la caña proviene de fincas de
particulares en donde el ingenio no ha tenido ningún servicio.
• De estudios anteriores, se conoce el tamaño y desviación
estándar de cada estrato y además se desea tener una
precisión de un grado brix en el estudio. De que tamaño debe
de ser la muestra total y de cada estrato?.

Ing. Cesar A. Verano Serruto


ESTRATO Ni Si

1 558 3.5

2 190 5.4

3 250 6.2

Ing. Cesar A. Verano Serruto


SOLUCION EJEMPLO 01:
AFIJACIÓN PROPORCIONAL AL TAMAÑO DE LA MUESTRA
ESTRATO Ni Si Wi (N2*S2)/Wi Ni*S2 ni
1 558 3.5 0.56 6821829 6835.5 45
2 190 5.4 0.19 5529319.2 5540.4 15
3 250 6.2 0.25 9590780 9610 20
998 1.00 21941928.2 21985.9 81

D=B2/4 D= 0.25

n= 21941928.2/(0.25*9982+21985.9)
n= 81

Ing. Cesar A. Verano Serruto


PRUEBAS DE HIPÓTESIS
La prueba de hipótesis involucra una suposición sobre el valor de un parámetro de la población.
A partir de la información proporcionada por la muestra se verificará la suposición sobre el parámetro estudiado.
La hipótesis que se contrasta se llama hipótesis nula (Ho).
Partiendo de los resultados obtenidos de la muestra, o bien rechazamos la hipótesis nula a favor de la alternativa,
o bien no rechazamos la hipótesis nula y suponemos que nuestra estimación inicial del parámetro poblacional
podría ser correcto. El hecho de no rechazar la hipótesis nula no implica que ésta sea cierta. Significa
Simplemente que los datos de la muestra son insuficientes para inducir un rechazo de la hipótesis nula.
TIPOS DE ERRORES

Conclusión
Condición de la Población No rechazar H0 Rechazar H0
H0 Verdadera Conclusión correcta Error de tipo I= α
H0 Falsa Error de tipo II=β Conclusión correcta

Ing. Cesar A. Verano Serruto


Ing. Cesar A. Verano Serruto
Ing. Cesar A. Verano Serruto
Prueba de hipótesis para la media poblacional: µ

A continuación consideramos el caso donde se supone que la población sigue una distribución
normal y la desviación estándar de la población σ no es conocida, por lo tanto, se estimará
mediante la desviación estándar muestral, s. En este caso se puede utilizar la distribución t
para hacer inferencia acerca del valor de la media de la población.

Procedimiento para realizar la prueba de hipótesis

Ing. Cesar A. Verano Serruto


ZONA DE NO RECHAZO
DE HO

ZONA DE NO RECHAZO
DE HO

ZONA DE NO RECHAZO
DE HO

Ing. Cesar A. Verano Serruto


5. Decisión: Rechazar Ho o No rechazar Ho.
6. Concluir.
Ejemplos
1. El fabricante de una marca de cigarrillos le afirma a un publicista que sus cigarrillos contienen en promedio a lo más
18 miligramos de nicotina por cigarrillo. El publicista para verificar esta afirmación y colocarla en el cartel publicitario
examina una muestra de 20 cigarrillos. Con un nivel de significancia del 2,5% ¿podrá concluir que la afirmación dada
por su cliente es cierta si la muestra arrojó un contenido promedio de 19,2 miligramos con desviación estándar de 2
miligramos? Suponga que el contenido de nicotina se distribuye normalmente.
Solución:
Sea X: contenido de nicotina en los cigarrillos (en miligramos)

Ing. Cesar A. Verano Serruto


Ing. Cesar A. Verano Serruto
2. Los reportajes de un programa televisivo de noticias últimamente se transmiten con algunas deficiencias de
edición que podrían corregirse. El equipo de edición afirma que tienen poco tiempo para editarlos y aseguran que
a lo más tienen un tiempo medio de 28 horas para editarlos ya que las filmaciones no se terminan en las fechas
programadas por diversos factores y que debería contratarse personal de apoyo. Para verificar lo expuesto se
tomó una muestra de 15 reportajes y se obtuvo un tiempo medio de 36 horas con una desviación de 7,8 horas. Si
se asume que los tiempos para la edición se distribuyen normalmente ¿se contratará personal de apoyo? Use
α=5%.

Ing. Cesar A. Verano Serruto


Ing. Cesar A. Verano Serruto
Ing. Cesar A. Verano Serruto
EJERCICIO
De una empresa que se dedica a la venta de cámaras fotográficas profesionales se tomó una
muestra aleatoria de estos artículos y se registró el precio, en nuevos soles. Los datos se presentan
a continuación:

Asumiendo que las ventas siguen una distribución normal. Pruebe la hipótesis que señala que el
verdadero precio promedio de las cámaras fotográficas es superior a 770 nuevos soles. Utilice un
nivel de significación del 2%.

Ho: X<=700
H1: X>770

Ing. Cesar A. Verano Serruto


Prueba de hipótesis para una proporción poblacional

Esta prueba se realiza para verificar una suposición que se hace sobre una proporción poblacional. En
este caso se utilizará la distribución Z para realizar la inferencia.

Procedimiento para realizar la prueba de hipótesis

Ing. Cesar A. Verano Serruto


Ing. Cesar A. Verano Serruto
Ejemplo
1. El administrador de un diario de circulación nacional afirma que menos del 5% de los diarios presentan error de
impresión. Si en una muestra aleatoria de 60 diarios se encontró que 6 de ellos presentan error de impresión. Con
un nivel de significación del 2,5%, ¿se puede afirmar que el administrador tiene razón?

6. Conclusión: Con un nivel de significancia del 2,5% no se puede


afirmar que menos el 5% de los diarios presenta error de impresión.
La afirmación del administrador no es cierta.

Ing. Cesar A. Verano Serruto


2. Un programa que se transmite en cable encontró el año pasado que el 40% de las denuncias que recibían sus
investigadores por correo electrónico eran por estafa. En el presente año se realizó un estudio similar, en el que al
seleccionar una muestra de 420 mensajes electrónicos se encontró que en 188 de ellos eran denuncias por estafas.
A un nivel de significación del 5%, ¿usted afirmaría que aumentó la proporción de denuncias por estafa?

Ing. Cesar A. Verano Serruto


Intervalos de confianza

Ing. Cesar A. Verano Serruto


Ante situaciones así, se hace más factible seleccionar una muestra estadística. Por
ejemplo, 500 personas. Y sobre dicha muestra, calcular la media. Aunque
seguiríamos sin saber el verdadero valor poblacional, podríamos suponer que este
se va a situar cerca del valor muestral. A esa media le sumamos el margen de error y
tenemos un valor del intervalo de confianza. Por otro lado, le restamos a la media
ese margen de error y tendremos otro valor. Entre esos dos valores estará la media
poblacional.

En conclusión, el intervalo de confianza no sirve para dar una estimación puntual del
parámetro poblacional; Si, nos va a servir para hacernos una idea aproximada de
cuál podría ser el verdadero de este. Nos permite acotar entre dos valores en dónde
se encontrará la media de la población.

Ing. Cesar A. Verano Serruto


Factores de los que depende un intervalo de confianza
El cálculo de un intervalo de confianza depende principalmente de los siguientes
factores:
•Tamaño de la muestra seleccionada: Dependiendo de la cantidad de datos que se
hayan utilizado para calcular el valor muestral, este se acercará más o menos al
verdadero parámetro poblacional.
•Nivel de confianza: Nos va a informar en qué porcentaje de casos nuestra
estimación acierta. Los niveles habituales son el 95% y el 99%.
•Margen de error de nuestra estimación: Este se denomina como alfa y nos informa
de la probabilidad que existe de que el valor poblacional esté fuera de nuestro
intervalo.
•Lo estimado en la muestra (media, varianza, diferencia de medias…): De esto va a
depender el estadístico pivote para el cálculo del intervalo.
Ing. Cesar A. Verano Serruto
INTERVALO PARA LA MEDIA
Dada una variable aleatoria con distribución Normal N(μ σ), el objetivo es la
construcción de un intervalo de confianza para el parámetro μ, basado en una
muestra de tamaño n de la variable.

Desde el punto de vista didáctico hemos de considerar dos posibilidades sobre la


desviación típica de la variable: que sea conocida o que sea desconocida y
tengamos que estimarla a partir de la muestra. El caso de σ conocida, ya
comentado anteriormente, no pasa de ser un caso académico con poca aplicación
en la práctica, sin embargo es útil desde del punto de vista didáctico.

Caso de varianza conocida

Dada una muestra X1, ..., Xn, el estadístico

se distribuye según una Normal estándar. Por tanto, aplicando el método del
pivote podemos construir la expresión

donde zα/2 es el valor de una distribución Normal estándar que deja a su derecha
una probabilidad de α/2 de la que se deduce el intervalo de confianza

Ing. Cesar A. Verano Serruto


Ing. Cesar A. Verano Serruto
El intervalo de confianza, sería la parte de la distribución que queda sombreada en azul.
Los 2 valores acotados por este serían los correspondientes a las 2 líneas de color rojo.
La línea central que divide a la distribución en 2, sería el verdadero valor poblacional.

Es importante resaltar que en este caso, dado que la función de densidad de la


distribución N(0,1) nos da la probabilidad acumulada (desde la izquierda hasta el valor
crítico), tenemos que encontrar el valor que nos deja a la izquierda 0,975% (este es
1,96).

Ing. Cesar A. Verano Serruto


Caso de varianza desconocida

Dada una muestra X1, ..., Xn, el estadístico

se distribuye según una t de Student de n − 1 grados de libertad. Por tanto, y


siguiendo pasos similares a los del apartado anterior, el intervalo de confianza
resultante es

donde tα/2 es el valor de una distribución t de Student con n − 1 grados de libertad


que deja a su derecha una probabilidad de α/2

Con el programa siguiente podemos calcular el intervalo de confianza para la


media de una distribución Normal con desviación típica desconocida.

Caso de varianza desconocida

Dada una muestra X1, ..., Xn, el estadístico

se distribuye según una t de Student de n − 1 grados de libertad. Por tanto, y


siguiendo pasos similares a los del apartado anterior, el intervalo de confianza
resultante es

donde tα/2 es el valor de una distribución t de Student con n − 1 grados de libertad


que deja a su derecha una probabilidad de α/2

Ing. Cesar A. Verano Serruto


EJEMPLO
Se dispone de las estaturas de 15 personas:
tallas (X - X)^2
1 167 41.82
2 167 41.82
3 168 29.88
4 168 29.88
5 168 29.88
6 169 19.95
7 171 6.08
8 172 2.15
9 173 0.22
10 175 2.35
11 175 2.35
12 175 2.35
13 177 12.48
14 182 72.82
15 195 463.68
suma 2602 757.73
Media 173.47
Varianza 54.12
DE 7.36
e= 1.90
LI= 177.52 173.47+(2.1315*1.90)
LS= 169.42 173.47-(2.1315*1.90)
t (tablas)= 2.1315

Ing. Cesar A. Verano Serruto


Intervalo de confianza para una proporción

Dada una variable aleatoria con distribución Binomial B(n, p), el objetivo es la
construcción de un intervalo de confianza para el parámetro p, basada en una
observación de la variable que ha dado como valor x. El mismo caso se aplica si
estudiamos una Binomial B(1, p) y consideramos el número de veces que ocurre
el suceso que define la variable al repetir el experimento n veces en condiciones
de independencia.

Existen dos alternativas a la hora de construir un intervalo de confianza para p:

• Considerar la aproximación asintótica de la distribución Binomial en la


distribución Normal.
• Utilizar un método exacto.

Ing. Cesar A. Verano Serruto


Aproximación asintótica

Tiene la ventaja de la simplicidad en la expresión y en los cálculos, y es la más


referenciada en la mayoría de textos de estadística. Se basa en la aproximación

que, trasladada a la frecuencia relativa, resulta

Tomando como estadístico pivote

Ing. Cesar A. Verano Serruto


que sigue una distribución N(0, 1), y añadiendo una corrección por
continuidad al pasar de una variable discreta a una continua, se obtiene el
intervalo de confianza asintótico:

donde zα/2 es el valor de una distribución Normal estándar que deja a su derecha
una probabilidad deαpara un intervalo de confianza de (1 − α) · 100 %Las
condiciones generalmente aceptadas para considerar válida la aproximación
asintótica anterior son:

El intervalo obtenido es un intervalo asintótico y por tanto condicionado a la


validez de la aproximación utilizada. Una información más general sobre los
intervalos de confianza asintóticos puede encontrase

Ing. Cesar A. Verano Serruto


Ing. Cesar A. Verano Serruto

También podría gustarte