Intervalos de Confianza
Intervalos de Confianza
Intervalos de Confianza
- Intervalos de Confianza
En estadística, se llama intervalo de confianza a un par o varios pares de números entre los cuales se estima que
estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números
determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parámetro
poblacional. La probabilidad de éxito en la estimación se representa con 1 - α y se denomina nivel de confianza. En
estas circunstancias, α es el llamado error aleatorio o nivel de significación, esto es, una medida de las posibilidades
de fallar en la estimación mediante tal intervalo.
Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la muestra, que posiblemente
incluya el valor de un parámetro de población desconocido. Debido a su naturaleza aleatoria, es poco probable que
dos muestras de una población en particular generen intervalos de confianza idénticos. Sin embargo, si usted
repitiera muchas veces su muestra, un determinado porcentaje de los intervalos de confianza resultantes incluiría
el parámetro de población desconocido.
En este caso, la línea negra horizontal representa el valor fijo de la media desconocida de la población, µ. Los
intervalos de confianza azules verticales que se sobreponen a la línea horizontal contienen el valor de la media de
la población. El intervalo de confianza rojo que está completamente por debajo de la línea horizontal no lo
contiene. Un intervalo de confianza de 95% indica que 19 de 20 muestras (95%) de la misma población generarán
intervalos de confianza que contendrán el parámetro de población.
Utilice el intervalo de confianza para evaluar la estimación del parámetro de población. Por ejemplo, un fabricante
desea saber si la longitud media de los lápices que produce es diferente de la longitud objetivo. El fabricante toma
una muestra aleatoria de lápices y determina que la longitud media de la muestra es 52 milímetros y el intervalo de
confianza de 95% es (50,54). Por lo tanto, usted puede estar 95% seguro de que la longitud media de todos los
lápices se encuentra entre 50 y 54 milímetros.
El intervalo de confianza se determina calculando una estimación de punto y luego determinando su margen de
error.
Estimación de punto
Este valor individual estima un parámetro de población usando los datos de su muestra.
Margen de error
Cuando usted utiliza estadísticos para estimar un valor, es importante recordar que sin importar lo bien que esté
diseñado su estudio, su estimación está sujeta a error de muestreo aleatorio. El margen de error cuantifica este
error e indica la precisión de su estimación.
Usted probablemente ya entiende el margen de error, porque está relacionado con los resultados de las encuestas.
Por ejemplo, una encuesta política podría indicar que el nivel de popularidad de un candidato es de 55% con un
margen de error de 5%. Esto significa que el nivel de popularidad real es +/- 5% y, por lo tanto, se ubica entre 50% y
60%.
Para un intervalo de confianza bilateral, el margen de error es la distancia desde el estadístico estimado hasta el
valor de cada intervalo de confianza. Cuando un intervalo de confianza es simétrico, el margen de error es la mitad
del ancho del intervalo de confianza. Por ejemplo, la longitud media estimada de un árbol de levas de un auto es
600 mm y el intervalo de confianza oscila entre 599 y 601. El margen de error es 1.
Mientras mayor sea el margen de error, más ancho será el intervalo y menos seguro podrá estar usted del valor de
la estimación de punto.
El nivel de confianza indica qué tan probable es que el parámetro de población, como por ejemplo la media, esté
dentro del intervalo de confianza.
Un nivel de confianza de 95% por lo general es adecuado. Esto indica que 19 de 20 muestras (95%) de la misma
población generarán intervalos de confianza que contendrán el parámetro de población.
El nivel de confianza representa el porcentaje de intervalos que incluirían el parámetro de población si usted
tomara muestras de la misma población una y otra vez. Por lo tanto, si usted recogió cien muestras y creó cien
intervalos de confianza de 95%, cabría esperar que aproximadamente 95 de los intervalos incluyeran el parámetro
de población, como se muestra en la siguiente figura.
En este caso, la línea negra horizontal representa el valor fijo de la media desconocida de la población, µ. Los
intervalos de confianza azules verticales que se sobreponen a la línea horizontal contienen el valor de la media de
la población. El intervalo de confianza rojo que está completamente por debajo de la línea horizontal no lo
contiene. Un nivel de confianza de 95% indica que 19 de 20 muestras (95%) de la misma población generarán
intervalos de confianza que incluirán el parámetro de población.
Si el intervalo de confianza es demasiado ancho, usted no puede estar muy seguro del verdadero valor de un
parámetro que estimó, como por ejemplo la media. Sin embargo, puede utilizar varias estrategias para reducir el
ancho de un intervalo de confianza y hacer que la estimación sea más precisa. El tamaño de la muestra, la variación
de los datos, el tipo de intervalo y el nivel de confianza afectan la anchura del intervalo de confianza.
Reducir la variabilidad
Mientras menos varíen los datos, con mayor precisión se podrá estimar un parámetro de población. Eso se debe a
que al reducirse la variabilidad de los datos disminuye la desviación estándar y, por ende, el margen de error de la
estimación. Aunque la variabilidad de los datos puede ser difícil de reducir, a veces es posible hacerlo mediante el
ajuste del experimento diseñado, como por ejemplo usando un diseño por parejas para comparar dos grupos.
También podría reducir la variabilidad al mejorar el proceso del cual proviene la muestra o al mejorar el sistema de
medición para que mida los elementos con mayor precisión.
Ejemplo:
1. Se quiere obtener un intervalo de confianza para el valor de las ventas medias por dia que se producen en un
kiosco . Para ello se realiza una muestra consistente en elegir al azar las ventas que se realizaron durante 1000 dias
distintos ; muestra cuyos resultados fueron : ventas medias por dia Q. 4000, y varianza de dicha muestra Q. 4000 al
cuadrado . Obtener dicho intervalo con un nivel de confianza del 95.5 %.
Se quiere construir un intervalo para la media con las siguientes características :
tamaño muestral = n =1000 , muestreo aleatorio simple poblacional no es normal
ni se conoce su varianza , el resultado de la muestra es : , si bien se trata de
un intervalo para la media con varianza desconocida y población no normal , dado que el tamaño muestral
es grande se supone normalidad y tomar como varianza poblacional a la muestral así :
dado que para nivel de confianza del 95,5% las valores de
se tendrá el intervalo :