TEMA 4 Psicometría

TEMA 4 La validez
1. Aproximación histórica
Definición Convencional: Grado en que un test mide lo que pretende medir.
El aspecto de la medición psicológica vinculado con la comprobación y estudio del

significado de las puntuaciones obtenidas en el test, para garantizar las correctas inferencias
basadas en esas puntuaciones.
Se validan las inferencias hechas a partir de un test, no el test en sí mismo
2. Concepto
Un test se considera válido si cumple su objetivo de realizar bien la medida de aquello para
lo que se construyó. Es válido si mide adecuadamente aquello para lo que se construyó. Hay
tres grandes tipos de validez:
- Validez de contenido
- Validez predictiva o validez relativa al criterio
- Validez de constructo
3. Validez de contenido
Hace referencia a la necesidad de asegurar que el contenido del test es una muestra
representativa del rasgo o conducta que se quiere medir.
Para conseguir esta validez, se enumeran todas las áreas del contenido que sean
imprescindibles y se asegura que la prueba contiene ítems de todas ellas. □ Se determina a
través de juicios subjetivos.
No existen procedimientos ni índices estadísticos para estimarla.
En la práctica, la validación de contenido exige examinar los contenidos del test para
determinar si es una muestra de ítems relevante y representativa.
Relevante: Una puntuación es relevante para el uso pretendido cuando todos los ítems del
test están dentro del dominio de interés.
Representativa: Los ítems representan o reproducen las características esenciales de la

conducta que se quiere medir.
¿Cómo obtengo evidencia de la validez de contenido?
- Definiendo sistemáticamente el dominio de contenidos (definición operacional). Esto

se hace antes de desarrollar el test.
- Juicio de los expertos acerca del grado en que el contenido del test es relevante y
representativo de dicho universo (procedimiento estructurado que permita emparejar
los ítems con el dominio).
3.1. Juicio de expertos
Se seleccionan dos jueces o expertos, por lo menos, a fin de que juzguen de manera
independiente la “bondad” de los ítems del instrumento.
En términos de relevancia o congruencia de los reactivos (items) con el universo de

contenido, la claridad en la redacción y los sesgos en la formulaciones de los ítems.
Cada experto recibe suficiente información escrita acerca del propósito del test y la
conceptualización del rasgo (definición operacional).
Cada juez recibe un instrumento de validación (en forma de tabla), cuyo fin es recoger la
información de cada experto. Dicho instrumento (tabla) normalmente contiene las siguientes
categorías de información por cada ítem: congruencia ítem-dominio, claridad, sesgo y
observaciones.
Se recogen y analizan los instrumentos de validación (las tablas rellenadas por los expertos)
y se toman la decisiones siguientes:
- Los items con 100% acuerdo, ACEPTAR

- Los items con 100% desacuerdo, DESCARTAR
- Los items con coincidencia parcial se revisan, se reformulan y validan nuevamente.
3.2. Validez aparente
Es un tipo especial de validez de contenido que hace referencia a la necesidad de que el

test dé la impresión a los participantes que es adecuado y tiene sentido para medir lo que se
pretende.
Tiene su importancia de cara a la motivación y actitud de los participantes.
4. Validez predictiva/relativa al criterio
Este tipo de validez indica → el grado de eficacia del test en la predicción o pronóstico de
algún tipo de comportamiento del sujeto a partir de las puntuaciones del sujeto en el test
El test será válido, en la medida en que pueda predecir las puntuaciones que puede sacar
el sujeto en el criterio estudiado
Este tipo de validez es importante en los test diseñados para predecir el estatus de una
persona en un criterio externo (p. ej. Rendimiento universitario para admisión de candidatos,
rendimiento en el trabajo en selección de personal).
Es necesario que la relación entre el test y el criterio sea significativa, por tanto, se dedica a
evidenciar la relación entre el test y el criterio.
La relación entre el test y el criterio se define como coeficiente de validez (que es la

correlación entre el test y el criterio) cuanto mayor es la correlación más preciso serán los
pronósticos derivados del test.
4.1. Operativización del criterio
La elección de la medida del criterio es importante
Situación ejemplo: Si el criterio va a ser el rendimiento que tiene un sujeto en el trabajo en

una fabrica, tenemos que buscar el modo de reflejar ese constructo en puntuaciones
Ejemplos:
- Datos de producción: cantidad (nº de piezas hechas), duración, calidad (nº errores) y
ganancias
- Datos personales: nº ausencias, nº retrasos, nº de accidentes
- Datos de juicios de supervisores, de compañeros
Y, ¿cuántos criterios?
- Un criterio: Correlación
- Varios criterios: Regresión lineal múltiple y análisis discriminante
4.2. Cuándo medir el criterio
Las medidas en la variable criterio pueden hacerse al mismo tiempo que se administra el
test o en momentos diferentes. En base a el tiempo transcurrido se distinguen tres tipos de
validez de criterio:
- Concurrente o en el mismo momento: Ambas medidas, el test y criterio se toman al

mismo tiempo, o al menos en momentos tan contiguos como para que no pueda
considerarse que se producen cambios ni en los sujetos ni en las condiciones. Se utiliza
cuando nos interesa la validez de un posible comportamiento futuro
- Predictiva: En este caso, transcurre un periodo de tiempo entre la medición del
predictor (test) y el criterio. En ese periodo se produce algún tipo de intervención en
los sujetos (se gana experiencia, conocimientos, etc.).
- Retrospectiva: Pasa un periodo de tiempo entre medidas. Primero se realiza la medida
del criterio luego la medida del test
4.3. Interpretación
La validez de criterio de un test suele venir indicada por el coeficiente correlación de

Pearson entre las puntuaciones en dicho test y la medida del criterio
El cuadrado de la r de Pearson es el coeficiente de determinación que indica el % de la

varianza del criterio que puede predecirse a partir del test.
4.4. Criterios empleados habitualmente
Un test puede ser validado frente a tantos criterios como usos posibles pueda tener. Es
decir, puede ser validado con un criterio para cada uso. Ejemplos:
- En los test de inteligencia y en los test de aptitud o competencia que se hacen en las
escuelas, se utilizan criterios paralelos al rendimiento académico:
- La mayoría de veces se utilizan criterios como: las notas de un examen, promociones y
graduaciones, honores y menciones especiales, evaluaciones de los profesores, etc
5. Validez de constructo
Se refiere a la recogida de evidencia empírica que garantice la existencia de un constructo

psicológico en el amparo de un modelo o teoría psicológica científica. Mediante este tipo de
validez se puede ver como se reflejan los constructos en ítems.
Habitualmente, se utilizan dos procedimientos metodológicos para obtener la validez de

constructo:
- El análisis factorial → validez factorial

- La matriz multirrasgo-multimétodo → validez convergente-divergente
6. Validez factorial
El término análisis factorial es una técnica de análisis multivariado cuyo objetivo es

representar un conjunto de variables observadas (items) en función de un menor número de
hipóteticas variables latentes denominadas factores. Se supone que las variables observadas
(items) son indicadores de los factores.
Por tanto, el análisis factorial nos ayuda a determinar si los ítems se agrupan de la forma
indicada en la teoría (validez factorial).
Existen dos aproximaciones al análisis factorial, análisis factorial exploratorio y análisis

factorial confirmatorio.
6.1. Análisis factorial exploratorio
En este caso el investigador no conoce la estructura subyacente al conjunto de variables

(items) y su interés está en encontrar un número, en principio indeterminado, de factores
comunes, que expliquen las correlaciones observadas entre las variables (items).
En la fase de interpretación juega un papel preponderante la teoría y el conocimiento

sustantivo.
A efectos prácticos se sugieren dos pasos en el proceso de interpretación:
- Estudiar la composición de las saturaciones factoriales significativas de cada factor.

- Intentar dar nombre o "etiquetar" los factores; nombre o etiqueta que se debe dar de
acuerdo con la estructura de sus saturaciones, es decir, en función de su contenido.
Dos cuestiones que pueden ayudar a la interpretación son:
- La eliminación de las cargas factoriales bajas, generalmente aquellas que están por
debajo de 0,30 (suprimir saturaciones menores que … en SPPS)
- Ordenar la matriz rotada de forma que las variables (items) con saturaciones altas en
un factor aparezcan juntas (ordenar por tamaño en SPSS)
6.2. Análisis factorial confirmatorio.
Llamaremos variable compleja a aquella que satura altamente en más de un factor y que
no debe ser utilizada para dar nombre a los factores (fenómeno de solapamiento).
Factores monopolares son aquellos en los que todas las saturaciones tienen el mismo signo
(negativo o positivo). Factores bipolares son aquellos en los que unas variables saturan
positivamente (signo positivo) y otras poseen saturaciones negativas (signo negativo).
El investigador tiene alguna hipótesis explícita acerca de la estructura de las variables

latentes. Este conocimiento se basa en la teoría o/y en la investigación empírica previa.
No lo hacemos con SPSS. Existen otros programas estadísticos que podemos utilizar:
LISREL, EQS, AMOS, M-PLUS
7. Validez convergente-discriminante
Para calcular este tipo de validez necesitamos la matriz multirrasgo-multimétodo.
Tal y como indica su nombre es una matriz de correlaciones en la que aparecen varios
rasgos psicológicos medidos por varios métodos.
Por tanto, necesitamos dos o más métodos de medir el constructo de interés y además,
necesitamos medir otros constructos diferentes que se puedan medir con los mismos métodos
utilizados para medir el constructo de interés.
Se selecciona una muestra de N sujetos a los que se les aplica todas las medidas de cada
constructo y cada método.
7.1. Validez convergente
Se dice que hay validez convergente si las correlaciones entre las medidas de un mismo
rasgo por distintos métodos son elevadas, es decir, las medidas de un mismo rasgo convergen,
aunque se hayan hecho por diferente método.
7.2. Validez discriminante
Se dice que hay validez discriminante cuando las correlaciones entre las medidas de un
rasgo mediante diferentes métodos son claramente superior a las correlaciones entre las
medidas de distintos rasgos por el mismo método.
7.3. Matriz multimétodo-multirasgo
Coeficientes de Fiabilidad en la diagonal principal. Correlaciones entre medidas del mismo

constructo usando el mismo método de medida. Deberán ser muy elevadas
Coeficientes de Validez Convergente (corresponde a los valores que están encerrados en un

óvalo). Correlaciones entre medidas del mismo constructo - rasgo- empleando diferentes
métodos de medida que deberían ser elevados.
Coeficientes de Validez Divergente (corresponde a los valores en marrón). Correlaciones

entre medidas de diferentes constructos usando el mismo método de medida. Deberían exhibir
valores bajos (y mayores que las correlaciones entre diferentes constructos medidas a través
de diferentes métodos de medida) Además, y lo más importante, estos coeficientes deberían
ser sustancialmente más bajos que los de validez convergente.
8. Validez y fiabilidad
El coeficiente de validez se obtiene mediante la correlación entre el test y el criterio. Por

tanto, los errores de medida cometidos al calcular cada uno de ellos (la fiabilidad) influyen en
el valor del coeficiente de validez.
Cuanto mayor el error de medida, menor la validez.
En otras palabras, al aumentar la fiabilidad, aumenta la validez.
9. Validez y longitud del test
Recordando… una de las formas de aumentar la fiabilidad de un test era aumentando su

longitud, siempre que se deba a la adición de elementos paralelos.
A su vez, la mejora de la fiabilidad de un test repercute favorablemente sobre su validez.
Por tanto, al aumentar la longitud de un test aumenta su validez. Porque también aumenta
su fiabilidad
La relación entre longitud y validez viene dada por la siguiente fórmula…
9.1. Formula
N = veces por las que se multiplica el test N = veces por las que se multiplica el test
Rxy = validez Rxy = validez
Rxx’ = fiabilidad RXY = nueva validez
Rxx’ = fiabilidad

TEMA 4 Psicometría

Cargado por

Copyright:

Formatos disponibles

TEMA 4 Psicometría

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

TEMA 4 Psicometría

Cargado por

Copyright:

Formatos disponibles

TEMA 4 La validez

Definición Convencional: Grado en que un test mide lo que pretende medir.

El aspecto de la medición psicológica vinculado con la comprobación y estudio del

Se validan las inferencias hechas a partir de un test, no el test en sí mismo

No existen procedimientos ni índices estadísticos para estimarla.

Representativa: Los ítems representan o reproducen las características esenciales de la

¿Cómo obtengo evidencia de la validez de contenido?

- Definiendo sistemáticamente el dominio de contenidos (definición operacional). Esto

En términos de relevancia o congruencia de los reactivos (items) con el universo de

- Los items con 100% acuerdo, ACEPTAR

Es un tipo especial de validez de contenido que hace referencia a la necesidad de que el

Tiene su importancia de cara a la motivación y actitud de los participantes.

4. Validez predictiva/relativa al criterio

La relación entre el test y el criterio se define como coeficiente de validez (que es la

4.1. Operativización del criterio

La elección de la medida del criterio es importante

Situación ejemplo: Si el criterio va a ser el rendimiento que tiene un sujeto en el trabajo en

- Concurrente o en el mismo momento: Ambas medidas, el test y criterio se toman al

La validez de criterio de un test suele venir indicada por el coeficiente correlación de

El cuadrado de la r de Pearson es el coeficiente de determinación que indica el % de la

4.4. Criterios empleados habitualmente

Se refiere a la recogida de evidencia empírica que garantice la existencia de un constructo

Habitualmente, se utilizan dos procedimientos metodológicos para obtener la validez de

- El análisis factorial → validez factorial

El término análisis factorial es una técnica de análisis multivariado cuyo objetivo es

Existen dos aproximaciones al análisis factorial, análisis factorial exploratorio y análisis

6.1. Análisis factorial exploratorio

En este caso el investigador no conoce la estructura subyacente al conjunto de variables

En la fase de interpretación juega un papel preponderante la teoría y el conocimiento

A efectos prácticos se sugieren dos pasos en el proceso de interpretación:

- Estudiar la composición de las saturaciones factoriales significativas de cada factor.

Dos cuestiones que pueden ayudar a la interpretación son:

El investigador tiene alguna hipótesis explícita acerca de la estructura de las variables

Para calcular este tipo de validez necesitamos la matriz multirrasgo-multimétodo.

7.1. Validez convergente

7.2. Validez discriminante

7.3. Matriz multimétodo-multirasgo

Coeficientes de Fiabilidad en la diagonal principal. Correlaciones entre medidas del mismo

Coeficientes de Validez Convergente (corresponde a los valores que están encerrados en un

Coeficientes de Validez Divergente (corresponde a los valores en marrón). Correlaciones

El coeficiente de validez se obtiene mediante la correlación entre el test y el criterio. Por

Cuanto mayor el error de medida, menor la validez.

En otras palabras, al aumentar la fiabilidad, aumenta la validez.

9. Validez y longitud del test

Recordando… una de las formas de aumentar la fiabilidad de un test era aumentando su

A su vez, la mejora de la fiabilidad de un test repercute favorablemente sobre su validez.

La relación entre longitud y validez viene dada por la siguiente fórmula…

Rxy = validez Rxy = validez

Rxx’ = fiabilidad RXY = nueva validez

También podría gustarte