Guia Teorica N°6
Guia Teorica N°6
Guia Teorica N°6
DEFINICIONES PREVIAS
8.1 ESTADISTICA
Es la ciencia que se ocupa de los métodos y procedimientos para recoger, clasificar, resumir,
y analizar datos, siempre y cuando la variabilidad e incertidumbre sea una causa de los
mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de
decisiones y en su caso formular predicciones.
1
MÉ TODOS ESTADISTICOS SESIÓ N 8
8.4 POBLACION
Es el conjunto de elementos que contienen una o mas característica observable de
naturaleza cualitativa o cuantitativa que se pueden medir en ellos.
8.7 VARIABLE
Se denomina variable estadística a una característica definida en la población por la
tarea o investigación estadística, que puede tomar dos o mas valores o modalidades.
8.8 DATO
Es el resultado de medir una característica observable de una unidad de análisis.
8.9 INFORMACION
Es el resultado que se obtiene al procesar un conjunto de datos.
8.10 PARAMETRO
Se denomina parámetro a una medida descriptiva que resume una característica,
calculada a partir de los datos observado en toda la población.
8.11 MUESTRA
Se denomina muestra a una parte de la población seleccionada de acuerdo con un plan o
regla, con el fin de obtener información acerca de la población de la cual proviene.
8.12 ESTADIGRAFO
Se denomina estadígrafo a una medida descriptiva que resume una característica, calculada a
partir de los datos observado en una muestra aleatoria.
8.14 MUESTREO
El muestreo es la selección de una parte representativa de la población que permita estimar los
parámetros de la población.
2
MÉ TODOS ESTADISTICOS SESIÓ N 8
Hay muchas razones por las cuales el estudio de una muestra es preferible al de la totalidad de
la población. Ante todo, es evidente que el estudio de muestras es el único practicable cuando
se trata de poblaciones infinitas o de poblaciones limitadas pero muy extensas, pues ningún
investigador sería capaz de estudiarlo en su totalidad. Lo mismo es valedero para aquellas
investigaciones en las cuales el proceso de investigación destruye al individuo que se estudia,
como en el caso en que se prueba la acción de ciertos venenos en animales de
experimentación.
Pero aún en el caso en que se quiera estudiar una poblaci6n perfectamente limitada, debemos
decidirnos por la muestra, pues su utilizaci6n tiene las siguientes ventajas:
En efecto, como será menor el número de personas que intervengan en el estudio, será mucho
más fácil conseguir buenos especialistas y entrenarlos uniformemente; como se necesitarán
menos instrumentos de investigación, éstos podrán vigilarse y calibrarse más cuidadosamente.
La única desventaja del uso de muestras es el llamado error de muestreo, el cual sumado a los
tres tipos de error antes mencionado, podría invalidar nuestro estudio.
Este error de muestreo es una consecuencia de la variabilidad de las poblaciones. Como los
individuos de una población son muy variables, los diferentes grupos o muestras que podemos
formar con ellas diferirán también unas de otras y como nosotros estudiamos una muestra para
generalizar luego a toda la población, los resultados serán algo distintos según la muestra que
hayamos escogido. Esta diferencia entre el valor dado por la muestra y el verdadero valor de la
población, constituye el error por muestreo.
Ejemplo:
Supongamos que una población de 4 personas tienen un capital de S/. 5 000, S/. 7 000, S/.
6 000 y S/. 10 000 soles respectivamente.
El capital promedio de esta población es
Si no se conociera dicho promedio y para averiguarlo se tomara una muestra de dos personas,
digamos los 2 primeros (5 000, 7 000), concluiríamos que el capital promedio de cada persona de
la población es S/. 6,000, cuando en realidad vemos que fue S/. 7 000, esta diferencia de S/. 1
000 entre el valor de la muestra y el valor de la población constituye el error por muestreo.
La presencia del error por muestreo parecería indicar que el estudiar una muestra en vez de la
población, es desfavorable y no ventajosa como hemos indicado. Sin embargo, conviene tener
presente:
- En primer lugar, que el error por muestreo suele ser mucho menos importante que los errores
debidos al observador, al método de observación y a los individuos estudiados, y
3
MÉ TODOS ESTADISTICOS SESIÓ N 8
-en segundo lugar, que el error por muestreo puede medirse estadísticamente y en cierto modo,
puede disminuirse a voluntad, tan solo con aumentar el tamaño de la muestra.
Errores en el Muestreo
Cuando se utilizan valores muestrales, o estadísticos para estimar valores poblacionales, o
parámetros, pueden ocurrir dos tipos generales de errores: el error muestral y el error no muestral.
El error muestral se refiere a la variación natural existente entre muestras tomadas de la misma
población.
Cuando una muestra no es una copias exacta de la población; aún si se ha tenido gran cuidado para
asegurar que dos muestras del mismo tamaño sean representativas de una cierta población, no
esperaríamos que las dos sean idénticas en todos sus detalles. El error muestral es un concepto
importante que ayudará a entender mejor la naturaleza de la estadística inferencial.
Los errores que surgen al tomar las muestras no pueden clasificarse como errores muestrales y se
denominan errores no muestrales.
El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere a una tendencia
sistemática inherente a un método de muestreo que da estimaciones de un parámetro que son, en
promedio, menores (sesgo negativo), o mayores (sesgo positivo) que el parámetro real.
Los tipos más comunes de técnicas de muestreo aleatorios son el muestreo aleatorio simple, el
muestreo estratificado, el muestreo por conglomerados y el muestreo sistemático.
4
MÉ TODOS ESTADISTICOS SESIÓ N 8
5
MÉ TODOS ESTADISTICOS SESIÓ N 8
6
MÉ TODOS ESTADISTICOS SESIÓ N 8
NZ 2 P (1 P )
n PARA LA PROPORCION
( N 1) E 2 Z 2 P (1 P )
7
MÉ TODOS ESTADISTICOS SESIÓ N 8
NZ 2
n PARA LA MEDIA
( N 1) E 2 Z 2
EJEMPLO
Se tiene una población de 200 personas, determinar si se trabaja con toda la población o
muestra; y si se trabaja con una muestra determinar el tamaño y escoger la muestra.
EJEMPLO
Se tiene una población de 400 personas, determinar si se trabaja con toda la población o
muestra; y si se trabaja con una muestra determinar el tamaño escoger la muestra por
muestro aleatorio sistemático.
MUESTREO ALEATORIO ESTRATIFICADO: Una muestra es estratificada cuando los
elementos de la muestra son proporcionales a su presencia en la población. La presencia de un
elemento en un estrato excluye su presencia en otro. Para este tipo de muestreo, se divide a la
población en varios grupos o estratos con el fin de dar representatividad a los distintos factores
que integran el universo de estudio. Para la selección de los elementos o unidades
representantes, se utiliza el método de muestreo aleatorio.
En síntesis, requiere de separar a la población según grupos llamados estratos, y de elegir
después una muestra aleatoria simple en cada estrato. La información de las muestras
aleatorias simples de cada estrato constituiría entonces una muestra global.
EJEMPLO
Para realizar un control de calidad para determinar en que estado viene la caña se realiza
un muestreo aleatorio simple, puesto que la caña puede provenir de tres tipos de proveedores.
Proveedor tipo A (estrato 1) la caña proviene de lotes de la misma finca.
Proveedor tipo B (estrato 2) la caña proviene de fincas de particulares en donde el
ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la caña proviene de fincas de particulares en donde el
ingenio no ha tenido ningún servicio.
DATOS:
8
MÉ TODOS ESTADISTICOS SESIÓ N 8
ESTRATO Ni
1 560
2 190
3 250
En el muestreo por conglomerados, éstos se forman para representar, tan fielmente como sea
posible, a toda la población; entonces se usa una muestra aleatoria simple de conglomerados
para estudiarla. Los estudios de instituciones sociales como iglesias, hospitales, escuelas y
prisiones se realizan, generalmente, con base en el muestreo por conglomerados.
EJEMPLO
Para un estudio que se realiza en un AA.HH el cual esta formado por 20 manzanas escoger
una muestra mediante muestreo aleatorio simple.
1 20 6 10 11 25 16 20
2 25 7 25 12 20 17 20
3 30 8 20 13 30 18 25
4 10 9 30 14 10 19 30
5 15 10 40 15 15 20 10
MUESTREO POR CUOTAS.- Se aplica en la última fase del muestreo, y consiste en facilitar al
entrevistador el perfil de las personas que tiene que entrevistar dejando su criterio, la elección de
las mismas, siempre y cuando cumplan con el perfil.
9
MÉ TODOS ESTADISTICOS SESIÓ N 8
comprobación de otro tipo, no es posible saber si los casos típicos lo son en realidad, y tampoco
se conoce como afecta a esos casos típicos los posibles cambios que se producen.
Error Muestral
Cualquier medida conlleva algún error. Si se usa la media para medir, estimar, la media poblacional ,
entonces la media muestra, como medida, conlleva algún error. Por ejemplo, supongamos que se ha
obtenido una muestra aleatoria de tamaño 25 de una población con media = 15: si la media de la
muestra es x=12, entonces a la diferencia observada x- = -3 se le denomina el error muestral. Una
media muestral x puede pensarse como la suma de dos cantidades, la media poblacional y el error
muestral; si e denota el error muestral, entonces:
Ejemplo 1.5
Se toman muestras de tamaño 2 de una población consistente en tres valores, 2, 4 y 6, para simular
una población "grande" de manera que el muestreo pueda realizarse un gran número de veces,
supondremos que éste se hace con reemplazo, es decir, el número elegido se reemplaza antes de
seleccionar el siguiente, además, se seleccionan muestras ordenadas. En una muestra ordenada, el
orden en que se seleccionan las observaciones es importante, por tanto, la muestra ordenada (2,4) es
distinta de la muestra ordenada (4,2). En la muestra (4,2), se seleccionó primero 4 y después 2. La
siguiente tabla contiene una lista de todas las muestras ordenadas de tamaño 2 que es posible
seleccionar con reemplazo y también contiene las medias muéstrales y los correspondientes errores
muéstrales. La media poblacional es igual a
= (2+4+6)/3 = 4. Ver la tabla en la siguiente página.
x = (3+4+3+4+5+5+2+4+6)/9 = 4
(2,2) 2 2 – 4 = -2
(2,4) 3 3 – 4 = -1
(2,6) 4 4–4=0
(4,2) 3 3 – 4 = -1
10
MÉ TODOS ESTADISTICOS SESIÓ N 8
(4,4) 4 4–4=0
(4,6) 5 5–4=1
(6,2) 4 4–4=0
(6,4) 5 5–4=1
(6,6) 6 6–4=2
En consecuencia, si x se usa para medir, estimar, la media poblacional , el promedio de todos los
errores muestrales es cero.
Distribuciones Muéstrales
Las muestras aleatorias obtenidas de una población son, por naturaleza propia, impredecibles. No se
esperaría que dos muestras aleatorias del mismo tamaño y tomadas de la misma población tenga la
misma media muestral o que sean completamente parecidas; puede esperarse que cualquier
estadístico, como la media muestral, calculado a partir de las medias en una muestra aleatoria, cambie
su valor de una muestra a otra, por ello, se quiere estudiar la distribución de todos los valores posibles
de un estadístico. Tales distribuciones serán muy importantes en el estudio de la estadística inferencial,
porque las inferencias sobre las poblaciones se harán usando estadísticas muestrales. Como el análisis
de las distribuciones asociadas con los estadísticos muestrales, podremos juzgar la confiabilidad de un
estadístico muestral como un instrumento para hacer inferencias sobre un parámetro poblacional
desconocido.
Como los valores de un estadístico, tal como x, varían de una muestra aleatoria a otra, se le puede
considerar como una variable aleatoria con su correspondiente distribución de frecuencias.
Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población grande. Se
calcula la madia muestral x para cada muestra; la colección de todas estas medias muestrales recibe el
nombre de distribución muestral de medias, lo que se puede ilustrar en la siguiente figura:
11
MÉ TODOS ESTADISTICOS SESIÓ N 8
Suponga que se eligen muestras aleatorias de tamaño 20, de una población grande, y se calcula la
deviación estándar de cada una. La colección de todas estas desviaciones estándar muestrales se
llama distribución muestral de la desviación estándar, y lo podemos ver en la siguiente figura:
Ejemplo 1.6
, la media poblaciona.
Además, grafique las frecuencias para la población y para la distribución muestral de medias.
Solución:
12
MÉ TODOS ESTADISTICOS SESIÓ N 8
13
MÉ TODOS ESTADISTICOS SESIÓ N 8
De aquí que
Como para cualquier variable aleatoria, la dsitribución muestral de medias tiene una media o valor
esperado, una varianza y una desviación estándar, se puede demostrar que la distribución muestral de
medias tiene una media igual a la media poblacional. Esto es:
14