Tema 1-Inferencia

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 48

Tema 1

Inferencia
Isabel Benítez Baena
Índice

• Conceptos básicos

• ¿Qué es la inferencia estadística?


• Clasificación de los procedimientos de inferencia
• Problemas que aborda la estadística inferencial

• Tipos de muestreo
• Muestreo no probabilístico
• Muestreo probabilístico
Conceptos básicos

Herramientas
inferenciales
Herramientas
descriptivas
Recopilación
de datos
Conceptos básicos

• Estadística descriptiva: parte de la estadística que se


encarga de clasificar los datos obtenidos en una
muestra y de representarlos mediante un conjunto de
estadísticos (media, varianza, correlación …)

• Estadística inferencial: parte de la estadística cuya


finalidad es extraer conclusiones acerca de la
población a la que pertenecen los datos de la
muestra.
Conceptos básicos

Estadística descriptiva Estadística inferencial

Caracterización de la Generalización de la
muestra muestra a la población

La muestra debe ser


representativa de la
población

Técnicas de muestreo
Conceptos básicos

Observación Proceso de Generalización


de la muestra inducción a la población

Riesgo

Procedimientos
estadísticos para el
“control” del riesgo:
análisis de datos
Conceptos básicos
La inferencia estadística es un razonamiento que permite extraer conclusiones
generales a partir de la observación de aspectos particulares.

Muestra Población
Conceptos básicos

• Población: Conjunto completo de individuos, objetos o


elementos que el investigador está interesado en
estudiar
• Muestra: subconjunto de individuos de la población
sobre los que se realiza el estudio para, a partir e ellos,
realizar generalizaciones para toda la población

MUESTRA de tamaño n
POBLACIÓN
Conceptos básicos
¿Puede ser una persona muestra de más de una población?

¿De qué grupo sois vosotros población?

¿De qué grupo sois muestra?

La descripción de la muestra es posterior a la descripción de la población


¿Qué es la inferencia estadística?

• Objetivo

Obtener conclusiones de las propiedades de la


población a partir de las características de las muestras

A dichas conclusiones o generalizaciones se les


denomina inferencias y suelen aparecer expresadas en
términos probabilísticos o en términos de
grados de confianza
¿Qué es la inferencia estadística?

• Las inferencias se realizan a partir de los estadísticos


de las muestras y se referirán a los parámetros
poblacionales.
¿Qué es la inferencia estadística?

• Los resultados a los que se llega en la Inferencia


estadística se basan en Teoremas del Cálculo de
Probabilidades
• A la hora de aplicarlos y sacar conclusiones hemos
de especificar claramente que los resultados son
de tipo probabilístico; es decir, están asociados a las
inferencias que realizamos,
• Siempre se encuentra un nivel de confianza o un nivel
de significación, que se ha de especificar claramente.
¿Qué problemas aborda la
Estadística Inferencial?

•Estimación puntual: se toma como valor del parámetro poblacional desconocido el


calculado por el estadístico de la muestra o por cualquier otro estimador que el
investigador considere oportuno.
•Estimación por intervalos: calcula un intervalo dentro del cuál puede encontrarse el
parámetro poblacional desconocido, con un nivel de confianza determinado
•Contraste de hipótesis: procedimiento que permite identificar si la información
recabada en la muestra es o no compatible con una o más hipótesis planteadas
previamente. La decisión última será rechazar una hipótesis o no, en función de si el
proceso previo establece que es o no incompatible con los datos muestrales recogidos,
con un nivel de confianza determinado.
Conceptos básicos
Conceptos básicos

• Variable: Cualquier propiedad o característica de algún


evento, objeto o persona, que puede tener diversos
valores en diferentes instantes según las condiciones.
Algunos ejemplos son la altura, el tiempo de reacción
o la dosis de un medicamento
• Unidades de análisis: se les denomina también casos o
elementos
• Datos: valores numéricos que se obtienen como
medida de un aspecto de interés
Conceptos básicos

• Todo estudio estadístico tiene por objeto analizar


determinadas características en una población.
• Lo ideal es poder observar dicha característica en
todos los individuos de la población, pero en la
mayoría de casos es imposible. Por eso, habitualmente
estudiamos una parte de la población →muestra.
-Ejemplo: Nos puede interesar saber los niveles de depresión de todos los
españoles (parámetro poblacional ) a partir de los datos
obtenidos en una muestra (estadístico muestral 𝑋)ҧ

• Al trabajar con muestras, hay que diferenciar entre los estadísticos


observados en la muestra de los parámetros reales correspondientes a la
población.
Esquema

Estadística descriptiva Estadística inferencial

Caracterización de la Generalización de la
muestra muestra a la población

La muestra debe ser


representativa de la
población

Técnicas de muestreo
Técnicas de muestreo

• La fiabilidad de las conclusiones acerca de la


población, obtenidas a partir de una muestra,
dependerá de lo representativa que sea la muestra
elegida. De ahí la importancia de una buena elección
de la muestra.

• El muestreo permite optimizar el tiempo y los recursos, ya


que estudiamos únicamente las variables en una muestra
en lugar de realizar análisis de toda la población.
Técnica de muestreo

• Desventaja o riesgo que conlleva la utilización de


muestras:
Debemos asegurarnos de que la muestra sea
representativa de toda la población con el objetivo
fundamental de proceder a la generalización de las
características e hipótesis que permitan construir y/o
probar teorías que expliquen a la población o
fenómeno.
La obtención de muestras apropiadas se consigue
mediante el seguimiento de un procedimiento correcto y
una técnica adecuada.
Técnica de muestreo
El procedimiento correcto para seleccionar una muestra adecuada
incluye los siguientes pasos:

1. Definir los casos (participantes u otros seres vivos, objetos,


fenómenos o comunidades) sobre los que se recogerán los
datos.
2. Delimitar la población

3. Elegir el método de selección de la muestra: probabilístico o no


probabilístico
4. Precisar el tamaño de la muestra requerido
5. Aplicar el procedimiento de selección
6. Obtener la muestra
Técnica de muestreo
Muestreo no probabilístico

• Circunstancial: la muestra se elige por razones de


comodidad.

Por ejemplo: un psicólogo escolar decide presentar los


resultados que ha ido obteniendo con los niños del
colegio en que trabaja tras aplicar un determinado
procedimiento de aprendizaje de la lectura.
Muestreo no probabilístico

• Intencional: cuando el investigador que selecciona la


muestra procura que ésta sea representativa de la
población según su propio criterio.

Por ejemplo, un psicólogo clínico especializado en


depresión desea observar la adherencia al tratamiento en
las terapias antidepresivas y envía un cuestionario a todos
los pacientes pertenecientes a los centros de salud de
Granada y toma como datos los resultados de los
informes que recibe de los pacientes.
Muestreo no probabilístico

• Por cuotas y por rutas: en este caso la investigación es llevada a cabo por
varias personas. Se asigna a cada colaborador un número de unidades de las
que ha de tomar los datos, dejando a su propia elección como seleccionarlas.

Por ejemplo, el psicólogo de recursos humanos de una empresa quiere llevar a


cabo un estudio de motivación de trabajadores en diferentes empresas. Elige
como colaboradores a becarios que realizan las prácticas en este centro que
tienen que realizar un determinado número de encuestas a trabajadores de
diferentes empresas.

Podría suceder que se proporcionara a los becarios una lista de trabajadores a los
que podría pasar la encuesta y ellos seleccionan los que les parecen convenientes
(por cuotas).

Pero también se le podría marcar a los becarios la progresión de las entrevistas,


basándonos en algún criterio, por ejemplo cercanía de las empresa en la que se
encuentran los trabajadores de su vivienda (por rutas)
Muestreo no probabilístico

• Bola de nieve: Se parte de un conjunto de individuos, que


conducen a otros, y estos a otros, y así hasta conseguir una
muestra suficiente.
Al conjunto de individuos de partida les pedimos que nos
indiquen personas que compartan sus características y/o en
otros casos que sean de características opuestas. Entonces
entrevistaremos a nuevos individuos y continuaremos del
mismo modo hasta que obtengamos el número de individuos
considerados en la muestra.
Este tipo se emplea muy frecuentemente cuando se hacen
estudios con poblaciones “especiales”.
Muestreo no probabilístico

• El problema de éstas técnicas es que no garantizan la


representatividad de las muestras, fundamentalmente por
la subjetividad que conllevan.

• Generalmente sólo darán como resultado muestras


representativas de la población en caso de que ésta sea
muy homogénea con respecto a la que se estudia.

• Pero aún así, no nos permiten calcular la probabilidad de


error que podemos cometer al realizar las inferencias de la
muestra a la población. Por ello es preferible, siempre que
sea posible, el uso de técnicas probabilísticas o aleatorias
Muestreo probabilístico o
aleatorio
El muestreo aleatorio se refiere a todo proceso que garantice a todos
los elementos de la población la misma probabilidad de ser incluidos
en la muestra. En el muestreo probabilístico se puede calcular de
antemano la probabilidad de obtener cada una de las muestras que
es posible seleccionar a partir de la población de referencia.
Para generalizar de manera válida de una muestra a la población, la
muestra no puede ser cualquier subconjunto de la población, es
crucial que sea aleatoria.
El muestreo aleatorio permite construir instrumentos adecuados
mediante los cuales podemos hacer inferencias estadísticas,
determinando además la probabilidad de error contenido en las
mismas.
Muestreo probabilístico o
aleatorio

Muestreo aleatorio simple: se hace una lista de elementos de la


población y se selecciona, aleatoriamente, a un número específico de
participantes que serán las personas que compondrán la muestra. El
proceso se realiza a través de la selección aleatoria de números que
representan a los participantes.
Muestreo probabilístico o
aleatorio

Muestreo aleatorio sistemático: se hace una lista de elementos de la


población y se selecciona uno cada k elementos (k es el coeficiente de
elevación=tamaño población/tamaño muestra)

Supongamos que la población consta de N elementos ordenados y


enumerados desde 1 hasta N, y deseamos extraer una muestra
de tamaño n. Dicha población la podemos dividir en n
subconjuntos, cada unos de ellos con k=N/n elementos.
Supongamos que la población consta de 100 elementos ordenados
y enumerados desde 1 hasta 100, y deseamos extraer una
muestra de tamaño 10. Dicha población la podemos dividir en N
subconjuntos, cada unos de ellos con k=100/10 elementos.
Muestreo probabilístico o
aleatorio
Supongamos que tenemos la lista, N, de todos los alumnos de una
universidad, que se encuentran ordenados de acuerdo con la inicial de su
apellido y deseamos obtener una muestra de tamaño n de alumnos que
estén distribuidos homogéneamente a lo largo de esa lista. Para ello
elegimos aleatoriamente un alumno de entre los N/n=k primeros y luego
vamos eligiendo sistemáticamente el que esté situado k lugares después
del primero elegido, k lugares después del segundo elegido, etc.

Así, por ejemplo, si la población consta de 10.000 alumnos y deseamos


obtener una muestra de tamaño 50, elegimos al azar un alumno entre los
10.000/50=200 primeros alumnos. Supongamos que tal alumno ocupa el
lugar 115. Pues bien, la muestra estará compuesta por los alumnos 115,
(115+200) 315, 515…
Muestreo probabilístico o
aleatorio
• Muestreo aleatorio estratificado: se divide a la población
en subpoblaciones (estratos) y se obtiene una submuestra
de cada una → suma de submuestras=muestra final.
Consideramos la población N, dividida en k subpoblaciones de
tamaño N1, N2…Nk. Dichas poblaciones son disjuntas y cumplen
que N1 + N2+…+ Nk = N. Cada una de las subpoblaciones se
denominan estratos. Los estratos han de ser lo más
homogéneos posible dentro de sí y heterogéneos entre ellos.
Si deseamos obtener una muestra de tamaño n de la población
inicial, seleccionamos de cada estrato una muestra aleatoria de
tamaño ni, de manera que n1+ n2 +…+nk=n
Ejemplo: Si conocemos que el 70% de los estudiantes de psicología son mujeres y el
30% son hombres, y deseamos que en una muestra de 1000 estudiantes el 70% sean
mujeres y el 30% hombre, dividimos a la población en dos estratos hombres y mujeres
y elegimos 700 mujeres y 300 hombres.
Muestreo probabilístico o
aleatorio
Muestreo por conglomerados: La población se divide en
unidades o grupos, llamados conglomerados, que deben ser
lo mas representativas posibles de la población, y
extraemos aleatoriamente uno o varios de ellos entre la
totalidad, la muestra estaría formada por todos los
elementos de los conglomerados elegidos previamente de
modo aleatorio.
Ejemplo: En vez de elegir una muestra de niños en una ciudad,
elegimos al azar un conjunto de colegios donde poder pasar
las evaluaciones
Esquema

Observación Proceso de Generalización


de la muestra inducción a la población

Riesgo

Procedimientos
estadísticos para el
“control” del riesgo:
análisis de datos
Proceso inductivo vs.
deductivo

Lógico (deductivos) Empíricos (inductivos)

Parten de la teorización Parten del dato empírico

Métodos racionales Llegan a la teoría


Proceso inductivo vs.
deductivo
Lógica deductiva

Teoría Datos

Lógica inductiva
Proceso inductivo vs.
deductivo
• Parte de la observación de la realidad
Inferencia para llegar a la generalización
• Si algo es cierto en una situación,
inductiva también lo será en situaciones
similares

• Parte de la ley general para deducir


Inferencia consecuencias lógicas aplicables a la
realidad. De lo general a lo particular.
deductiva
Tipos de variables

Escala de medida

Existen cuatro clases de escalas que permiten medir


variables cualitativas y cuantitativas:

– Nominal
– Ordinal
– De intervalo
– De razón o proporción
Tipos de variables

• La escala nominal sólo permite asignar un nombre al elemento


medido. Esto la convierte en la menos informativa de las escalas
de medición.
– Nacionalidad.
– Uso de gafas.

• A pesar de que algunos valores son formalmente numéricos, sólo


están siendo usados para identificar a los individuos medidos. Los
números son etiquetas!
• Relaciones de igualdad-desigualdad
Tipos de variables

Los valores de estas variables son categorías, por lo que no


admiten un orden natural de los datos.
Ejemplo 1: ¿De qué color tiene los ojos?

(los valores numéricos asignados a estas categorías son los datos puntuales que se
meterán en el programa)

1. Azul
2. Negros
3. Marrones
4. Otro

Ejemplo 2: ¿Está usted estudiando actualmente?

1. sí
2. no
Tipos de variables

• La escala ordinal, además de las propiedades de la escala


nominal, permite establecer un orden entre los elementos
medidos.

• Establece relaciones de orden.


– Frecuencia de consumo.
– Etapa de desarrollo de un ser vivo.
– Clasificación de películas por una comisión especializada.
Tipos de variables

Los valores de respuesta están ordenadas (por eso, el nombre ordinal)

Ejemplo 1: ¿Cómo de satisfecho está usted con la atención recibida en


su centro de salud?
1. Muy satisfecho
2. Algo satisfecho
3. No muy satisfecho
4. Nada satisfecho

Los valores numéricos (1, 2, 3, y 4) tienen un significado, porque implican


orden entre ellos (por ejemplo, sabemos que un “2” es más satisfecho que un
“4”), pero aun los valores reflejan categorías independientes.
Tipos de variables

Los valores de respuesta están ordenadas (por eso, el nombre ordinal)

Ejemplo 2: ¿Cuántos años tienes?”


1. 0-15 años
2. 16-30 años
3. 31-45 años
4. 46+ años

Igualmente, los valores numéricos (1, 2, 3, y 4) tienen un


significado, porque implican orden entre ellos, es decir un “2” es
más joven que un “4”, pero aun los valores reflejan categorías de
edad independientes.
Tipos de variables

• La escala de intervalo, además de todas las propiedades de la escala


ordinal, hace que tenga sentido calcular diferencias entre las
mediciones.

• Estas escalas tienen las características de las dos anteriores, pero ahora
las distancias numéricas iguales representan distancias iguales en las
características que se miden.

• Dan información acerca de la magnitud con que un individuo representa


una característica en relación con otro, e indica cuánto más se presenta
esa magnitud al contar con una unidad de medida, sin que tenga
importancia que esa unidad de medida y el origen de la escala (el cero)
sean arbitrarios.
Tipos de variables

• Una limitación es que no se puede afirmar que un individuo tiene


el doble o la mitad de cantidad que otro, puesto que la escala parte
de un inicio arbitrario. Es decir, parte de un 0 que no indica
ausencia de cantidad. Por ejemplo, la temperatura se incluiría en
este tipo de escalas. No existe la “ausencia de temperatura”, y por
tanto no podríamos decir que 20 grados centígrados es la mitad
que 40 grados
• Posee las propiedades de magnitud e igualdad de intervalo entre
las unidades adyacentes, pero no tiene cero absoluto
• Además de determinar si A>B, A<B ó A=B, nos permite determinar
si A-B=A-C, A-B>A-C ó A-B<A-C
Tipos de variables

• La escala de razón permite, además de lo de las otras escalas,


comparar mediciones mediante un cociente. Es la superación de las
limitaciones del resto de escalas

• Tiene todas las propiedades de una escala de intervalos y además


posee un cero absoluto o natural que indica la ausencia de cantidad.
Sin éste no se pueden calcular las proporciones con las lecturas de la
escala.

• Por tanto se permite sacar conclusiones sobre la igualdad o


desigualdad de diferencias en una característica, además de sobre la
igualdad o desigualdad de los cocientes entre ellas (sobre si es la
mitad, el doble, etc.).
Tipos de variables

Ejemplos

– Cantidad de litros de agua consumido por una persona en un


día.
– Velocidad de un coche en la carretera.
– Número de goles marcados por un jugador de fútbol en un
partido.
Tipos de variables

• Diferencia clave entre la escala de intervalo y de razón:


• La escala de intervalo tiene un cero que se establece por
convención y puede tener variaciones. Es arbitrario. Por otra
parte, la escala de razón tiene un cero real, fijo, no sujeto a
variaciones; es propio de la medición hecha.
• En la escala de razón cada valor representa un determinado
número de UNIDADES.
Tipos de variables

En contraste a las anteriores variables, los valores de las variables


cuantitativas SÍ reflejan algo real sobre un individuo, presentando
un orden natural y un valor numérico.

Ejemplo 1: ¿Cuánto años tiene? _____ años.


En este caso, el valor de la EDAD refleja algo real sobre el que responde,
concretamente refleja el número de años que han transcurrido desde su
nacimiento.
En el caso de medir la EDAD como variable ordinal, si el sujeto tiene 34 años, le
corresponde el valor 3, este valor numérico no tiene en sí ningún
significado.

Por lo tanto, los valores de una variable cuantitativa no son categorías,


son los valores reales proporcionados por la persona que responde.

También podría gustarte