VAlidez y Fiabilidad

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 3

Validez y fiabilidad de tests y escalas

La validez se refiere al grado en que la


Tests o escalas: instrumentos con los que evidencia y la teoría apoyan las
medimos un único rasgo con varios ítems cuyas interpretaciones de los tests de acuerdo con
respuestas se suman en un total, que es el que el uso que se va a hacer de estos tests (APA,
se utiliza e interpreta 1999, Standards for Educational and
Psychological Testing)
Si se trata de un
cuestionario con Un cuestionario es válido si:
preguntas 1) Se pregunta lo que se
independientes quiere preguntar
(no se van a sumar las Validez Fiabilidad
respuestas), la validez 2) Los sujetos entienden
es básicamente bien lo que se les
conceptual: pregunta
¿Estoy ‘midiendo’ ¿Con qué
lo que digo que precisión, margen
1
Pedro Morales, Universidad Rafael Landívar, Guatemala

mido, lo que quiero de error, estoy


medir …? midiendo …?
La validez Principios
de los tests básicos
Podemos Hay que calcularla
1
El concepto de validez Hay distintos ‘tipos’ de validez suponerla por la en cada nueva
no es un concepto y unos tipos de validez no
unívoco suponen los otros información muestra (APA); no
obtenida en otras se ‘prueba’
La validez no es una propiedad Unas interpretaciones investigaciones aduciendo la
2 del instrumento, sino de las pueden ser muy claras y
obtenida en otros
inferencias e interpretaciones otras no tanto

La validez no se van acumulando datos y análisis que


estudios
3 se prueba en apoyan determinadas interpretaciones
sentido propio y usos (validar es investigar)
En sentido propio Sí hay un
La validez es más una fiabilidad alta es
4 importante que la compatible con una no hay un único coeficiente que
fiabilidad; validez dudosa …
3
coeficiente que expresa el grado de
Pedro Morales, Universidad Rafael Landívar, Guatemala sintetice la validez fiabilidad de un test
de un instrumento

Fiabilidad: Consistencia interna


(α de Cronbach)
Básicamente … 1 El coeficiente de fiabilidad es Morales Vallejo, P. (2008). Estadística
2 una estimación de la aplicada a las Ciencias Sociales. Madrid,
correlación que hubiéramos Universidad Pontificia Comillas
El coeficiente de fiabilidad
obtenido con un test
indica en qué medida el
semejante…
test diferencia a unos Morales Vallejo, P. (2006). Medición de
sujetos de otros; es un en qué grado los sujetos actitudes en Psicología y Educación, 3ª
indicador del poder hubieran quedado ordenados
discriminatorio del test de manera semejante … edición, Madrid, Universidad Pontificia
Comillas
3
Probablemente la utilidad mayor entre qué puntuaciones Morales Vallejo P. (2010). Guía para
de los coeficientes de fiabilidad máxima y mínima se construir escalas de actitudes.
es que nos permiten calcular el encuentra cada sujeto …
error típico de la medida, http://www.upcomillas.es/personal/peter/o
8 trosdocumentos/Guiaparaconstruirescala
sdeactitudes.pdf
Morales Vallejo P.; Urosa Sanz, B. y
Fiabilidad: Consistencia interna Blanco Blanco, A. (2003). Construcción de
(α de Cronbach) escalas de actitudes tipo Likert, una guía
práctica. Madrid, La Muralla.
Básicamente … 1 El coeficiente de fiabilidad es
De especial
2 una estimación de la
utilidad si se van a
correlación que hubiéramos
El coeficiente de fiabilidad tomar
obtenido condecisiones
un test
indica en qué medida el
sobre sujetos
semejante…
test diferencia a unos
sujetos de otros; es un concretos
en qué grado los sujetos
indicador del poder (intervalos
hubieran de
quedado ordenados
discriminatorio del
σe = σtot √ 1- test
fiabilidad de maneraconfianza)
semejante …

3
Probablemente la utilidad mayor
de los coeficientes de fiabilidad entre qué puntuaciones
es que nos permiten calcular el máxima y mínima se
error típico de la medida, encuentra cada sujeto …
9
2

Fiabilidad: Consistencia interna Bloques de ítems muy relacionados


(α de Cronbach) entre sí pero apenas relacionados
Es alta en la medida en
con los ítems de otros bloques
La fiabilidad depende que los sujetos tienden pueden contribuir a una fiabilidad
de las relaciones entre
los ítems
= a puntuar alto o bajo en alta en todo el test sin que esté
los mismos ítems claro qué se está midiendo…
• muchos ítems
• poco relacionados El coeficiente de fiabilidad apoya
entre sí, (pero no prueba) la
interpretación de que todos los La fiabilidad no es un
• sobre todo en
muestras grandes ítems miden el mismo rasgo indicador ‘absoluto’ de la
calidad de un test o escala
pueden dar una sin estar midiendo un
fiabilidad muy alta rasgo bien definido
9

Fiabilidad: Consistencia interna Para aumentar la fiabilidad


(α de Cronbach) puede ser preferible
amentar el número de
La fiabilidadLadepende
fiabilidad tiendelos
a ser mayor
sujetos tienden a
respuestas en vez del
de las relaciones entre
Cuando hay muchos ítems
los ítems
=
puntuar alto o bajo
en los mismos ítems número de ítems
Si se dan estas
Con más respuestas en los
ítems ítems condiciones los
• muchos apoya (perotienden
no prueba)
sujetos Criterios orientadores sobre la magnitud
• poco relacionados
En muestras grandes la interpretación de
entre sí, a quedar más de la fiabilidad:
que todos los ítems
Cuando
• sobre todo ense miden rasgos diferenciados
miden el mismo rasgo
definidos
muestras de manera más
grandes entre sí, mejor Aceptable: en torno a .70 (Nunnally, 1978)
simple, con ítems muy ‘ordenados’
parecidos Para trabajos de investigación: .50 es
pueden dar una sin estar midiendo un
fiabilidad muy alta rasgo bien definido
aceptable (Guilford, 1954: 388-389)
12
Fiabilidad media (frecuente): .83 (Osborne,
2003)

Fiabilidad: Consistencia interna En tests de Cattell (que miden rasgos


(α de Cronbach) complejos), inferior a .50 (Gómez
Fernández, 1981).
La fiabilidadLadepende
fiabilidad tiendelos
a ser mayor
sujetos tienden a (citas en Morales, 2008, Estadística
de las relaciones entre
Cuando hay muchos ítems
los ítems
=
puntuar alto o bajo
en los mismos ítems
aplicada a las Ciencias Sociales).
Con más respuestas en los En estos casos
ítems ítems
• muchos la no
fiabilidad
apoya (pero prueba)
• poco relacionados
En muestras grandes puede serde
la interpretación alta Los tests o escalas que miden rasgos
entre sí, conlos
que todos muy pocos
ítems definidos con un mayor nivel de
Cuando
• sobre todose
enmiden rasgos miden elítems
mismo (cuatro,
rasgo
definidos de manera más tres, dos …)
complejidad requieren un mayor número
muestras grandes
simple, con ítems muy de ítems y la fiabilidad suele ser menor
parecidos
pueden dar una sin estar midiendo un
fiabilidad muy alta rasgo bien definido
13
Pedro Morales, Universidad Rafael Landívar, Guatemala

La validez de los tests


Modos de comprobación
Tipos de Analizando el Comprobación
contenido experimental Dos tipos de validez se refieren a
inferencias
(validez lógica) (validez experimental) cómo comprobar la validez
Sobre el Planificación Necesaria siempre;
significado previa y análisis Estrategias :
del contenido Validez convergente
¿Qué es ‘validar’ un test?
(validez de Necesaria pero Habrá que clarificar de qué estamos
constructo) Validez divergente
insuficiente hablando …
Sobre la
utilidad del Útil para formular Necesaria siempre
instrumento hipótesis Análisis correlacionales
(validez Insuficiente
predictiva)
17
Pedro Morales, Universidad Rafael Landívar, Guatemala

Dos tipos de validez se refieren a la interpretación y uso de los tests


3

La validez de los tests


Modos de comprobación En tests y escalas de nueva construcción
Habitualmente
Tipos de Analizando el Comprobación lo más importante en primer lugar es
lo más importante
inferencias contenido experimental asegurar la validez lógica: que los ítems
(validez lógica) (validez experimental) expresan adecuadamente el rasgo que se
Sobre el Planificación Necesaria siempre;
quiere medir
significado previa y análisis Estrategias :
del contenido Validez convergente
(validez de Necesaria pero
constructo) Validez divergente
insuficiente
Sobre la El análisis de ítems suele modificar
Planificación previaÚtil
al construir un test
utilidad del para formular
¾ Definición y componentes
Necesaria siempre
La planificación el plan inicial
instrumento hipótesis previa puede
Análisis correlacionales
¾ Importancia relativa de los diversos quedar modificada
(validez (tabla Insuficiente
componentes de después del análisis
predictiva)
especificaciones) de ítems
¾ Ítems: manifestaciones o indicadores
19
Pedro Morales, Universidad Pontificia Comillas, Madrid

La validez de los tests


Modos de comprobación
¿Quiénes son
Habitualmente
Tipos
losde Analizando Importancia
expertos? el de revisar la
Comprobación
lo más importante primera versión; los ítems: Para asegurar la validez lógica
inferencias contenido experimental
(validez1.
lógica) (validezdel
¿Son indicadores experimental)
rasgo (conceptual) del instrumento
¿Uno o que queremos
Planificación medir? siempre;
Necesaria
Sobre el
varios
significado previa y 2. ¿Están bien
análisis formulados,
Estrategias : son
profesores? claros, contienden más de
del contenido
(validez de Validez convergente
Necesariauna peroidea? Validez divergente
constructo) insuficiente
3. ¿Los entienden bien los
Alguien
que van a responder?
Sobre la
informado o con Se verifican relaciones plausibles con el
Planificación
utilidad delprevia
cierta al
Útil construir
para un test
formular Necesaria siempre
La planificación
¾ Definición y componentes
experiencia hipótesis previa puede
significado.
instrumento Análisis correlacionales
¾ Importancia relativa de los diversos Una pequeña muestra
quedar modificada
(validez (tabla Insuficiente
componentes de de los sujetos que van
después del análisis Además se amplía y matiza el
predictiva)
especificaciones)
Depende en cada caso … a responder de ítems significado de lo que se está midiendo:
¾ Ítems: manifestaciones o indicadores
21 con qué otras variables se relaciona
Pedro Morales, Universidad Pontificia Comillas, Madrid

La validez de los tests La validación experimental es


importante sobre todo en tests de nueva
Modos de comprobación construcción
Tipos de Analizando el Comprobación
inferencias contenido experimental Las mismas tesis y trabajos de
(validez lógica) (validez experimental) investigación en los que se utiliza alguna
Sobre el Planificación Necesaria siempre; escala o test ya suelen aportar
previa y análisis
significado
del contenido
Estrategias : información sobre la validez
(validez de Validez convergente
Necesaria pero Validez divergente (la validación experimental está
constructo) insuficiente
integrada en la misma investigación)
Sobre es
¿Porqué la a) En las respuestas pueden influir variables
ajenas
utilidad del Útil para a lo que se Necesaria
formular quiere medir
siempre
necesaria la (capacidad lectora,
hipótesis memoria, deseo de
instrumento Análisis correlacionales
presentar una buena imagen, etc.;
validación
(validez Insuficiente La validez confirmada
depende del rasgo medido);
experimental?
predictiva) b) El rasgo puede estar mal conceptualizado experimentalmente en otros estudios
22
suele ser suficiente para juzgar que el
Pedro Morales, Universidad Pontificia Comillas, Madrid test o escala mide lo que se pretende
(no es necesario proba la validez en
cada nueva investigación)
simplificando Validez Fiabilidad
No es aplicable el
Análisis concepto de fiabilidad
cuestionarios
conceptual (α de Cronback)
Sí cabe calcular los
intervalos de
confianza
Tests
y escalas Se calcula en cada Estrategia útil en cualquier
nueva muestra investigación (sobre todo, pero no sólo,
Cada nueva si se utilizan escalas y tests de nueva
Nueva Planteamiento
investigación construcción): añadir en el instrumento
construcción experimental
aporta preguntas específicas que puedan
Estudios información confirmar la validez de constructo o su
Ya utilizados previos sobre la validez27 validez predictiva.
Pedro Morales, Universidad Rafael Landívar, Guatemala

También podría gustarte