R5 U3 Ortiz 31 05 2023
R5 U3 Ortiz 31 05 2023
R5 U3 Ortiz 31 05 2023
Guanajuato
Licenciatura en Ciencias del
Comportamiento Humano
Psicometría V1
Reto 5 Reto ¿Para qué sirve la fiabilidad y
validez de los test?
Tahiry Peralta Ortiz
Querubín Falconi Bocanegra
Fecha de elaboración: 29/05/2023
Matricula: 22006866
Reporte de análisis:
Introducción:
Estos dos conceptos hacen referencia a la fase que hemos denominado de recolección de datos,
que otros llaman de medición y, por tanto, se habla de error de medición. No entrarían los
problemas o errores derivados de la selección de sujetos ni los referentes al tratamiento o análisis
de datos.
La Fiabilidad se focaliza en conocer la posibilidad de reproducir el resultado e indica, el grado
en que un procedimiento concreto de traducción de un concepto en variable produce los mismos
resultados en pruebas repetidas con el mismo instrumento de investigación como viene siendo la
estabilidad, o con instrumentos equivalentes.
La fiabilidad se suele asociar al error aleatorio.
Desarrollo:
Los psicólogos utilizan diversos procedimientos estandarizados para obtener muestras de la conducta
de las personas. Estos recursos, genéricamente denominados test, incluyen un procedimiento de
puntuación que permite obtener medidas que pueden ser usadas con distintos propósitos: estimar el
nivel de las personas en un constructo (ansiedad, calidad de vida, visualización espacial…), evaluar
la competencia tras un periodo de aprendizaje, clasificar a los pacientes en categorías diagnósticas o
seleccionar a los aspirantes más aptos para un puesto de trabajo. La legitimidad y eficiencia de estas
prácticas depende de su fiabilidad y validez. A continuación, se describen, de forma conceptual, estas
dos características psicométricas y los procedimientos más frecuentes para evaluarlas. De entrada,
hay que prevenir al lector de dos frecuentes malentendidos. El primero consiste en considerar que la
fiabilidad y la validez son características de los test. Por el contrario, corresponden a propiedades de
las interpretaciones, inferencias o usos específicos de las medidas que esos test proporcionan. El
segundo se refiere a la consideración de que la fiabilidad y la validez se poseen o no, en lugar de
entenderlas como una cuestión de grado.
FIABILIDAD
La fiabilidad se concibe como la consistencia o estabilidad de las medidas cuando el proceso de
medición se repite. Por ejemplo, si las lecturas del peso de una cesta de manzanas varían mucho en
sucesivas mediciones efectuadas en las mismas condiciones, se considerará que las medidas son
inestables, inconsistentes y poco fiables. La carencia de precisión podría tener consecuencias
indeseables en el coste de ese producto en una ocasión determinada. De esta concepción se sigue
que de la variabilidad de las puntuaciones obtenidas en repeticiones de la medición puede obtenerse
un indicador de la fiabilidad, consistencia o precisión de las medidas. Si la variabilidad de las medidas
del objeto es grande, se considerará que los valores son imprecisos y, en consecuencia, poco fiables.
De manera semejante, si una persona contestase a un test repetidamente en las mismas condiciones,
de la variabilidad de las puntuaciones podría obtenerse un indicador de su grado de fiabilidad. La
imposibilidad de lograr que las medidas se lleven a cabo exactamente en las mismas condiciones es
uno de los problemas de las medición psicológica y educativa. El nivel de atención y de motivación de
una persona puede variar al contestar repetidamente a la misma prueba, la dificultad de dos test
pretendidamente iguales construidos para medir el mismo constructo puede ser desigual, las muestras
de examinadores que califican un examen de selectividad pueden diferir en el grado de severidad, etc.
Por tanto, el esfuerzo de los evaluadores ha de centrarse en estandarizar el procedimiento de medición
para minimizar la influencia de aquellas variables extrañas que pueden producir inconsistencias no
deseadas. La estandarización del procedimiento implica obtener las medidas en todas las ocasiones
en condiciones muy semejantes: con el mismo tiempo de ejecución, las mismas instrucciones,
similares ejemplos de práctica, tareas de contenido y dificultad equivalentes, similares criterios de
calificación de los evaluadores de exámenes, etc. El estudio de la fiabilidad parte de la idea de que la
puntuación observada en una prueba es un valor concreto de una variable aleatoria consistente en
todas las posibles puntuaciones que podrían haber sido obtenidas por una persona en repeticiones
del proceso de medida en condiciones semejantes.
VALIDEZ
El concepto de validez ha experimentado transformaciones importantes provocadas por los diversos
objetivos a los que se han destinado los test, el uso principal de las pruebas consistió en predecir
alguna variable de interés denominada criterio (por ejemplo, el rendimiento laboral o académico). En
la actualidad este enfoque sigue siendo de suma importancia cuando se emplean las pruebas para
seleccionar a los candidatos más aptos para un empleo, en los programas de admisión, en la
adscripción de pacientes a tratamientos, etc. En estos casos, la evaluación de la utilidad de la prueba
suele cuantificarse mediante la correlación entre sus puntuaciones y las de alguna medida del criterio
(coeficiente de validez). Sin embargo, el éxito de este tipo de justificación depende de la calidad de la
medida del criterio, especialmente de su representatividad. De ahí que el énfasis se desplazase a la
justificación de que la puntuación en el criterio procedía de una muestra de indicadores que
representase de forma apropiada el dominio o contenido a medir. Por tanto, esta fase inicial de
desarrollo del concepto terminó con la propuesta de dos vías regias para establecer la validez de las
pruebas: la validación de criterio (la correlación entre las puntuaciones del test y las puntuaciones en
el criterio) y la validación de contenido (la justificación de que los ítems para medir el criterio son una
muestra representativa del contenido a evaluar). La validación de contenido se extendió desde el
análisis del criterio al de la validez de los test predictores: una prueba no puede considerarse válida si
los ítems que la componen no muestrean adecuadamente el contenido a evaluar. La validación de
contenido es un enfoque especialmente fértil cuando las facetas del dominio a medir pueden
identificarse y definirse claramente. Es éste el caso de los test dirigidos a evaluar el rendimiento
académico que puede especificarse en función de los objetivos de la instrucción.
CONCLUSIÓN:
La vida humana actual se ha vuelto cada vez más compleja, tanto en el ámbito personal y familiar, como
en el colectivo: social, laboral y empresarial. Su estudio y evaluación no puede realizarse en forma
adecuada con procedimientos que, si se consideraron válidos en tiempos pasados, hoy día son juzgados
como inconsistentes e indefendibles epistemológica y metodológicamente por sus dificultades
intrínsecas insuperables.
Esta complejidad requiere un paradigma sistémico y una metodología esencialmente crítica en todas sus
fases, no sólo la relacionada con los instrumentos usados en una medición puntual o en la precisión de
una réplica, como son la validez y la confiabilidad clásicas, sino que, dada la intrincada trama de
variables que conforman la vida moderna, se vuelve absolutamente indispensable un examen crítico a
lo largo de todo el proceso de investigación.
Meneses, J. (coord.) (2014) psicometría Barcelona, España: Editorial UOC. Versión en línea
https://www.researchgate.net/publication/293121344_Psicometria
Tornimbeni, S. Pérez, E. Y Olaz, F. (2008). Introducción a la psicometría buenos aires argentina. Paidós
https://www.paidosdep.com.ar/html/indices/ind21085.pdf