TEMA 4 Psicometría

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 6

TEMA 4 La validez

1. Aproximación histórica

Definición Convencional: Grado en que un test mide lo que pretende medir.

El aspecto de la medición psicológica vinculado con la comprobación y estudio del


significado de las puntuaciones obtenidas en el test, para garantizar las correctas inferencias
basadas en esas puntuaciones.

Se validan las inferencias hechas a partir de un test, no el test en sí mismo

2. Concepto

Un test se considera válido si cumple su objetivo de realizar bien la medida de aquello para
lo que se construyó. Es válido si mide adecuadamente aquello para lo que se construyó. Hay
tres grandes tipos de validez:

- Validez de contenido
- Validez predictiva o validez relativa al criterio
- Validez de constructo
3. Validez de contenido

Hace referencia a la necesidad de asegurar que el contenido del test es una muestra
representativa del rasgo o conducta que se quiere medir.

Para conseguir esta validez, se enumeran todas las áreas del contenido que sean
imprescindibles y se asegura que la prueba contiene ítems de todas ellas. □ Se determina a
través de juicios subjetivos.

No existen procedimientos ni índices estadísticos para estimarla.

En la práctica, la validación de contenido exige examinar los contenidos del test para
determinar si es una muestra de ítems relevante y representativa.

Relevante: Una puntuación es relevante para el uso pretendido cuando todos los ítems del
test están dentro del dominio de interés.

Representativa: Los ítems representan o reproducen las características esenciales de la


conducta que se quiere medir.

¿Cómo obtengo evidencia de la validez de contenido?

- Definiendo sistemáticamente el dominio de contenidos (definición operacional). Esto


se hace antes de desarrollar el test.
- Juicio de los expertos acerca del grado en que el contenido del test es relevante y
representativo de dicho universo (procedimiento estructurado que permita emparejar
los ítems con el dominio).
3.1. Juicio de expertos

Se seleccionan dos jueces o expertos, por lo menos, a fin de que juzguen de manera
independiente la “bondad” de los ítems del instrumento.

En términos de relevancia o congruencia de los reactivos (items) con el universo de


contenido, la claridad en la redacción y los sesgos en la formulaciones de los ítems.
Cada experto recibe suficiente información escrita acerca del propósito del test y la
conceptualización del rasgo (definición operacional).

Cada juez recibe un instrumento de validación (en forma de tabla), cuyo fin es recoger la
información de cada experto. Dicho instrumento (tabla) normalmente contiene las siguientes
categorías de información por cada ítem: congruencia ítem-dominio, claridad, sesgo y
observaciones.

Se recogen y analizan los instrumentos de validación (las tablas rellenadas por los expertos)
y se toman la decisiones siguientes:

- Los items con 100% acuerdo, ACEPTAR


- Los items con 100% desacuerdo, DESCARTAR
- Los items con coincidencia parcial se revisan, se reformulan y validan nuevamente.
3.2. Validez aparente

Es un tipo especial de validez de contenido que hace referencia a la necesidad de que el


test dé la impresión a los participantes que es adecuado y tiene sentido para medir lo que se
pretende.

Tiene su importancia de cara a la motivación y actitud de los participantes.

4. Validez predictiva/relativa al criterio

Este tipo de validez indica → el grado de eficacia del test en la predicción o pronóstico de
algún tipo de comportamiento del sujeto a partir de las puntuaciones del sujeto en el test

El test será válido, en la medida en que pueda predecir las puntuaciones que puede sacar
el sujeto en el criterio estudiado

Este tipo de validez es importante en los test diseñados para predecir el estatus de una
persona en un criterio externo (p. ej. Rendimiento universitario para admisión de candidatos,
rendimiento en el trabajo en selección de personal).

Es necesario que la relación entre el test y el criterio sea significativa, por tanto, se dedica a
evidenciar la relación entre el test y el criterio.

La relación entre el test y el criterio se define como coeficiente de validez (que es la


correlación entre el test y el criterio) cuanto mayor es la correlación más preciso serán los
pronósticos derivados del test.

4.1. Operativización del criterio

La elección de la medida del criterio es importante

Situación ejemplo: Si el criterio va a ser el rendimiento que tiene un sujeto en el trabajo en


una fabrica, tenemos que buscar el modo de reflejar ese constructo en puntuaciones

Ejemplos:

- Datos de producción: cantidad (nº de piezas hechas), duración, calidad (nº errores) y
ganancias
- Datos personales: nº ausencias, nº retrasos, nº de accidentes
- Datos de juicios de supervisores, de compañeros
Y, ¿cuántos criterios?

- Un criterio: Correlación
- Varios criterios: Regresión lineal múltiple y análisis discriminante
4.2. Cuándo medir el criterio

Las medidas en la variable criterio pueden hacerse al mismo tiempo que se administra el
test o en momentos diferentes. En base a el tiempo transcurrido se distinguen tres tipos de
validez de criterio:

- Concurrente o en el mismo momento: Ambas medidas, el test y criterio se toman al


mismo tiempo, o al menos en momentos tan contiguos como para que no pueda
considerarse que se producen cambios ni en los sujetos ni en las condiciones. Se utiliza
cuando nos interesa la validez de un posible comportamiento futuro
- Predictiva: En este caso, transcurre un periodo de tiempo entre la medición del
predictor (test) y el criterio. En ese periodo se produce algún tipo de intervención en
los sujetos (se gana experiencia, conocimientos, etc.).
- Retrospectiva: Pasa un periodo de tiempo entre medidas. Primero se realiza la medida
del criterio luego la medida del test
4.3. Interpretación

La validez de criterio de un test suele venir indicada por el coeficiente correlación de


Pearson entre las puntuaciones en dicho test y la medida del criterio

El cuadrado de la r de Pearson es el coeficiente de determinación que indica el % de la


varianza del criterio que puede predecirse a partir del test.

4.4. Criterios empleados habitualmente

Un test puede ser validado frente a tantos criterios como usos posibles pueda tener. Es
decir, puede ser validado con un criterio para cada uso. Ejemplos:

- En los test de inteligencia y en los test de aptitud o competencia que se hacen en las
escuelas, se utilizan criterios paralelos al rendimiento académico:
- La mayoría de veces se utilizan criterios como: las notas de un examen, promociones y
graduaciones, honores y menciones especiales, evaluaciones de los profesores, etc
5. Validez de constructo

Se refiere a la recogida de evidencia empírica que garantice la existencia de un constructo


psicológico en el amparo de un modelo o teoría psicológica científica. Mediante este tipo de
validez se puede ver como se reflejan los constructos en ítems.

Habitualmente, se utilizan dos procedimientos metodológicos para obtener la validez de


constructo:

- El análisis factorial → validez factorial


- La matriz multirrasgo-multimétodo → validez convergente-divergente
6. Validez factorial

El término análisis factorial es una técnica de análisis multivariado cuyo objetivo es


representar un conjunto de variables observadas (items) en función de un menor número de
hipóteticas variables latentes denominadas factores. Se supone que las variables observadas
(items) son indicadores de los factores.

Por tanto, el análisis factorial nos ayuda a determinar si los ítems se agrupan de la forma
indicada en la teoría (validez factorial).

Existen dos aproximaciones al análisis factorial, análisis factorial exploratorio y análisis


factorial confirmatorio.

6.1. Análisis factorial exploratorio

En este caso el investigador no conoce la estructura subyacente al conjunto de variables


(items) y su interés está en encontrar un número, en principio indeterminado, de factores
comunes, que expliquen las correlaciones observadas entre las variables (items).

En la fase de interpretación juega un papel preponderante la teoría y el conocimiento


sustantivo.

A efectos prácticos se sugieren dos pasos en el proceso de interpretación:

- Estudiar la composición de las saturaciones factoriales significativas de cada factor.


- Intentar dar nombre o "etiquetar" los factores; nombre o etiqueta que se debe dar de
acuerdo con la estructura de sus saturaciones, es decir, en función de su contenido.

Dos cuestiones que pueden ayudar a la interpretación son:

- La eliminación de las cargas factoriales bajas, generalmente aquellas que están por
debajo de 0,30 (suprimir saturaciones menores que … en SPPS)
- Ordenar la matriz rotada de forma que las variables (items) con saturaciones altas en
un factor aparezcan juntas (ordenar por tamaño en SPSS)
6.2. Análisis factorial confirmatorio.

Llamaremos variable compleja a aquella que satura altamente en más de un factor y que
no debe ser utilizada para dar nombre a los factores (fenómeno de solapamiento).

Factores monopolares son aquellos en los que todas las saturaciones tienen el mismo signo
(negativo o positivo). Factores bipolares son aquellos en los que unas variables saturan
positivamente (signo positivo) y otras poseen saturaciones negativas (signo negativo).

El investigador tiene alguna hipótesis explícita acerca de la estructura de las variables


latentes. Este conocimiento se basa en la teoría o/y en la investigación empírica previa.

No lo hacemos con SPSS. Existen otros programas estadísticos que podemos utilizar:
LISREL, EQS, AMOS, M-PLUS
7. Validez convergente-discriminante

Para calcular este tipo de validez necesitamos la matriz multirrasgo-multimétodo.

Tal y como indica su nombre es una matriz de correlaciones en la que aparecen varios
rasgos psicológicos medidos por varios métodos.

Por tanto, necesitamos dos o más métodos de medir el constructo de interés y además,
necesitamos medir otros constructos diferentes que se puedan medir con los mismos métodos
utilizados para medir el constructo de interés.

Se selecciona una muestra de N sujetos a los que se les aplica todas las medidas de cada
constructo y cada método.

7.1. Validez convergente

Se dice que hay validez convergente si las correlaciones entre las medidas de un mismo
rasgo por distintos métodos son elevadas, es decir, las medidas de un mismo rasgo convergen,
aunque se hayan hecho por diferente método.

7.2. Validez discriminante

Se dice que hay validez discriminante cuando las correlaciones entre las medidas de un
rasgo mediante diferentes métodos son claramente superior a las correlaciones entre las
medidas de distintos rasgos por el mismo método.

7.3. Matriz multimétodo-multirasgo

Coeficientes de Fiabilidad en la diagonal principal. Correlaciones entre medidas del mismo


constructo usando el mismo método de medida. Deberán ser muy elevadas

Coeficientes de Validez Convergente (corresponde a los valores que están encerrados en un


óvalo). Correlaciones entre medidas del mismo constructo - rasgo- empleando diferentes
métodos de medida que deberían ser elevados.

Coeficientes de Validez Divergente (corresponde a los valores en marrón). Correlaciones


entre medidas de diferentes constructos usando el mismo método de medida. Deberían exhibir
valores bajos (y mayores que las correlaciones entre diferentes constructos medidas a través
de diferentes métodos de medida) Además, y lo más importante, estos coeficientes deberían
ser sustancialmente más bajos que los de validez convergente.
8. Validez y fiabilidad

El coeficiente de validez se obtiene mediante la correlación entre el test y el criterio. Por


tanto, los errores de medida cometidos al calcular cada uno de ellos (la fiabilidad) influyen en
el valor del coeficiente de validez.

Cuanto mayor el error de medida, menor la validez.

En otras palabras, al aumentar la fiabilidad, aumenta la validez.

9. Validez y longitud del test

Recordando… una de las formas de aumentar la fiabilidad de un test era aumentando su


longitud, siempre que se deba a la adición de elementos paralelos.

A su vez, la mejora de la fiabilidad de un test repercute favorablemente sobre su validez.

Por tanto, al aumentar la longitud de un test aumenta su validez. Porque también aumenta
su fiabilidad

La relación entre longitud y validez viene dada por la siguiente fórmula…

9.1. Formula

N = veces por las que se multiplica el test N = veces por las que se multiplica el test

Rxy = validez Rxy = validez

Rxx’ = fiabilidad RXY = nueva validez

Rxx’ = fiabilidad

También podría gustarte