Introduccion A La Estadistica PDF
Introduccion A La Estadistica PDF
Introduccion A La Estadistica PDF
INTRODUCCIÓN A LA ESTADÍSTICA
Desde un punto de vista más amplio, podemos decir que la Estadística se utiliza como
tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman
parte de su naturaleza.
Historia de la Estadística:
Su raíz: STATUS=cosas del estado.
Durante el siglo pasado, era considerada
como la Ciencia del Estado.
Sus orígenes: El recuento.
Las civilizaciones antiguas recogían datos
sobre población, producción agrícola y renta.
Tal cantidad de información debía ser
resumida en valores numéricos para su
interpretación y uso en la toma de decisiones
políticas.
Definición:
incertidumbre sea una causa intrínseca de los mismos; así como de realizar
inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su
caso formular predicciones.
Cuando nos referimos a una determinada característica (p.ej. nivel de ácido úrico) en
los individuos de una población nos estamos refiriendo a una distribución de valores.
La observación de un determinado grupo de pacientes nos proporciona información
acerca de esta distribución. Los resultados que observamos se relacionan con la
distribución poblacional. Sin embargo, observaciones distintas proporcionan resultados
distintos (aunque compatibles), por ejemplo un mismo tratamiento aplicado a grupos
distintos de pacientes proporcionará resultados distintos.
Estimador: función de los valores de una muestra que se elabora para indagar el valor
de un parámetro de la población de la que procede la muestra.
Los parámetros poblacionales se denotan con letras del alfabeto griego, mientras que
los estimadores muestrales se denotan con letras de nuestro alfabeto.
Así, por ejemplo, la media del colesterol en una población, que se denotaría por μ, es
un parámetro que se estima a partir de la media de los valores de colesterol en una
muestra obtenida en esa población, que se representaría por x .
Variables cualitativas:
Se usan con datos que representan categorías que son mutuamente excluyentes,
aunque se utilicen números para cada categoría no representan cantidades. Para su
medición usamos escalas:
Nominales: no hay relación entre las categorías. Una escala nominal sólo
permite clasificar (no jerarquizar ni ordenar).
Ej.: Género, nacionalidad, situación geográfica
Es buena idea codificar las variables cualitativas asignando un código numérico a cada
categoría (“etiqueta”) para poder procesarlas con facilidad.
¡Ojo! Aunque se codifiquen como números, debemos recordar siempre el verdadero
tipo de las variables con las que estamos trabajando y su significado cuando vayamos
a usar programas estadísticos.
Variables cuantitativas:
Se usan con datos que se expresan mediante cantidades numéricas que permiten
hacer operaciones matemáticas. Existen los siguientes tipos:
Figura 1.1
Figura 1.2
1.3 MUESTREO
Cuando se decide cuantificar sólo una parte de las unidades de una población y a
partir de esta información estimar sus parámetros, entonces estamos planteando un
problema de muestreo.
POBLACIÓN
Muestreo
MUESTRA
Inferencia
Figura 1.3
El error que se comete debido al hecho de que se sacan conclusiones sobre cierta
población, a partir de la observación de sólo una parte de ella, se denomina error de
muestreo.
Ejemplo 1.1.
Puesto que hay tres procesos escalonados de selección, existen en este caso las
llamadas unidades de muestreo de primera, segunda y tercera etapa.
Figura 1.4
Podemos resumir en estos cuatro puntos las ventajas que la utilización de muestras
presenta con respecto a la enumeración completa de la población:
Coste reducido. Si los datos se obtienen de una pequeña fracción del total, los
gastos de recogida y tratamiento de los datos se reducen. Incluso si la
obtención de información en toda la población es factible, suele ser mucho más
eficiente la utilización de técnicas de muestreo.
Mayor rapidez. Los datos pueden ser más fácilmente recolectados y estudiados
si se utiliza una muestra que si se emplean todos los elementos de la
población. Por tanto, el uso de técnicas de muestreo es especialmente
importante cuando se necesita la información con carácter urgente.
La teoría de muestreo persigue un doble objetivo. Por un lado, estudia las técnicas
que permiten obtener muestras representativas de la población de forma eficiente. Por
otro lado, indica cómo utilizar los resultados del muestreo para estimar los parámetros
poblacionales, conociendo a la vez el grado de incertidumbre de las estimaciones.
Los métodos para seleccionar una muestra representativa son numerosos, podemos
clasificarlos en:
MUESTREO PROBABILISTICO
Ejemplo 1.2
Muestreo sistemático
Ejemplo 1.3
Muestreo estratificado
Ejemplo 1.4
Tenemos una población con N= 10.000 y queremos distribuir una muestra de tamaño
n= 600 personas en L= 3 estratos.
Ejemplo 1.5
Si queremos extraer una muestra para un estudio epidemiológico en niños
escolarizados en Zaragoza, con edades comprendidas entre 5 y 14 años, a partir de
una lista completa de las aulas de todos los centros escolares, podemos elegir
aleatoriamente un cierto número de aulas (conglomerados) de manera que la muestra
estaría formada por todos los niños de las aulas seleccionadas.
Muestreo polietápico
Ejemplo 1.6
Para obtener una muestra de pacientes diabéticos ingresados en nuestro país, en una
primera etapa se escoge una muestra de hospitales, y en la segunda etapa, una
muestra de pacientes diabéticos ingresados en los hospitales elegidos.
MUESTREO NO PROBABILISTICO
Los métodos de muestreo no probabilístico son aquellos en los que las unidades de
análisis se recogen según criterios del investigador y no utilizando métodos en los que
interviene el azar, de modo que no es posible estimar la probabilidad que tiene cada
elemento de ser incluido en la muestra y no todos los elementos tienen posibilidad de
ser incluidos. No garantizan la representatividad de la muestra y por lo tanto no
permiten realizar estimaciones inferenciales sobre la población.
Al igual que en los anteriores existen diferentes tipos de muestro no probabilístico: por
cuotas, por conveniencia, método bola de nieve,…
Una vez abordados los diferentes diseños de muestreo es decir, como se obtiene la
muestra, uno de los puntos que preocupa a la mayoría de los investigadores es
cuantos individuos debe tener la muestra es decir que tamaño.
Buscamos una fórmula que nos de un "número mágico" de sujetos que formen nuestra
muestra. No vamos a entrar en fórmulas de cálculo de tamaño muestral (ver material
de apoyo) puesto que para comprender su desarrollo necesitamos tener algunos
conceptos estadísticos que todavía no hemos desarrollado.
Cuanto más complejo es el diseño que utilizamos, mayor será la muestra que
necesitaremos, puesto que el efecto del diseño nos hace aumentar el tamaño
de la muestra para conseguir el mismo grado de precisión.