Baremo Psicológico
Baremo Psicológico
Baremo Psicológico
Autores:
Los mejores items para la prueba serán aquellos que tengan, al mismo
tiempo, los mejores valores de sus estadísticos.
Procedimientos para construir
un baremo
Construcción de baremo
2 Debe decidir qué estadísticos va a utilizar para evaluar la calidad de los reactivos de
la prueba que está diseñando, centrándose solo en la respuesta correcta. Para el
análisis de los mismos sólo se podrán correr uno de los siguientes grupos de
estadísticos, si se corren todos, se obtendrán resultados redundantes o repetitivos.
o Media (índice de dificultad), Desviación Típica (Capacidad discriminativa) y
Coeficiente de correlación puntobiserial (correlación item-test).
o Media (índice de dificultad), Varianza (Capacidad discriminativa) y Coeficiente de
correlación puntobiserial (correlación item-test).
o Asimetría (índice de dificultad), Desviación Típica o varianza (Capacidad
discriminativa) y Coeficiente de correlación puntobiserial (correlación item-test).
o Kurtosis (índice de dificultad), Desviación Típica o varianza (Capacidad
discriminativa) y Coeficiente de correlación puntobiserial (correlación item-test).
Construcción de baremo Respuesta Correcta
3 Especificar, por estadístico, los rangos que considere idóneos para la evaluación de los
reactivos.
Ejemplo 1
El constructor de prueba de conocimiento en historia universal
establece que ésta debe contener únicamente items con dificultad
moderada, con una elevada capacidad discriminativa. Esto implica que
se prefieren items de dificultad media y alta correlacionen con la escala
total, en consecuencia, construye el siguiente baremo:
Ejemplo 2
Un psicólogo está diseñando una prueba para seleccionar aspirantes a un cargo, estableciendo
que ésta debe contener únicamente items con dificultad alta, y se mide una variable
heterogénea. Es así que prepondera los valores de los estadísticos en los siguientes términos
Correlacionan de manera negativa con la escala total (𝒓𝒑𝒃 ), lo cual implica que
quienes escogen un distractor (respuesta incorrecta) tienen un pobre desempeño
en la prueba.
Item 17
Opciones 𝒓𝒑𝒃
A Opción Correcta 0,89
B Opción Incorrecta -0,20
C Opción Incorrecta -0,50
D Opción Incorrecta -0,18
Construcción de baremo Distractores
Continuación del punto 4
Para el análisis de los distractores de los items de la prueba, se incluye en el baremo una fila como
se muestra en el siguiente ejemplo:
Observe que para la
Estadístico Rangos Puntaje primera situación, los
distractores son de
p=p=p 2 calidad al poseer un
porcentaje
p p=p≠p 1 relativamente igual de
personas que
p≠p≠p 0 escogieron las
opciones incorrectas,
Todas las 𝑟𝑝𝑏 bajas y negativas 2
además, deben tener
un coeficiente 𝒓𝒑𝒃 bajo
y negativo. Se
rpb Algunas las 𝑟𝑝𝑏 bajas y negativas 1
consideran indeseables
Ninguna 𝑟𝑝𝑏 baja y negativa
0
aquellos distractores
con un valores de p
desiguales y con un
coeficiente 𝒓𝒑𝒃 mayor
El número de p y rpb va en función de la cantidad de distractores que posee el item, por ejemplo, que 0,11
si un item tiene 5 opciones incorrectas, en el baremo deberían aparecer cinco p o rpb.
Construcción de baremo
5 En lo que respecta al peso o puntaje que se le asigna a los rangos por estadístico
escogido, convención, siempre el rango que es considerado como el ideal o excelente
tendrá el mayor peso. Es decisión del constructor establecer el puntaje de inicio.
En n el baremo ejemplo, a lo “ideal” se le asignó un puntaje de 2, lo “regular 1 y lo
“menos deseable” 0.
Estadísti
Rangos Puntaje
co
≥0.70 2
Respuesta Correcta
pi Entre 0.40 y 0.69 1
≤0.39 0
≥0.80 2
Recapitulando rpbj Entre 0.50 y 0.79 1
≤0.49 0
p=p=p 2
p p=p≠p 1
Distractores
p≠p≠p 0
Todas las 𝑟𝑝𝑏 bajas y negativas 2
rpb Algunas las 𝑟𝑝𝑏 bajas y negativas 1
Ninguna 𝑟𝑝𝑏 baja y negativa 0
Construcción de baremo Totalizando puntaje para cada item
6 Luego de asignar un peso a cada uno de los elementos requeridos para el análisis,
corresponde asignarle un puntaje único al item como totalidad.
Nótese que en el baremo ejemplo el puntaje límite por cada rango es 2, y
como estamos considerando cuatro aspectos ( p, rpb, de la Respuesta
Correcta y p, rpb de los distractores) lo máximo que puede totalizar un item
son 8 puntos (todos sus estadísticos tienen los valores ideales) y lo menos
que puede puntuar es cero (todos los estadísticos tiene los valores menos Total Decisión
favorecedores).
6a8 Aceptado
Lo anterior implica que cada item puede calificar entre 0 y 8 puntos y lo que
hace ahora el constructor es presentar las decisiones a tomar según el
puntaje recibido por cada reactivo, que puede ser como se muestra en el
siguiente ejemplo
4o5 Modificable
0 1 2 3 4 5 6 7 8 0a3 Rechazado
Respuesta Correcta
pi Entre 0.40 y 0.69 1
punto. Culminada la evaluación de la respuesta
≤0.39 0
correcta del item, se procede a la evaluación de los
distractores que lo constituyen; como se puede ≥0.80 2
observar, sus p son parecidas entre ellas, por ende, rpbj Entre 0.50 y 0.79 1
se obtienen 2 puntos, y finalmente, en relación con
sus rpb, poseen índices que se ubican dentro del ≤0.49 0
p≠p≠p 0
Todas las 𝑟𝑝𝑏 bajas y negativas 2
rpb Algunas las 𝑟𝑝𝑏 bajas y negativas 1
Ninguna 𝑟𝑝𝑏 baja y negativa 0
Aplicando el baremo a los items
Ejemplo 2
En este ejemplo se puede apreciar que la respuesta correcta del item tiene una p igual a 0,24, contrastando este
resultado con el baremo, este item obtiene 0, porque su p es menor que 0,39; con relación con su coeficiente rpb,
éste se encuentra por debajo de 0,49, por lo que logra obtener 0. Tomando en consideración los distractores que
conforman el item en cuestión, sus p son desiguales
Estadístico Rangos Puntaje
entre ellas, por ende, el reactivo obtiene un puntaje
igual a 0, y en relación con sus rpb, poseen índices ≥0.70 2
Respuesta Correcta
que se ubican dentro del rango -0,01 y -0,30, pi Entre 0.40 y 0.69 1
asignando, en este sentido, 2 puntos. ≤0.39 0
≥0.80 2
rpbj Entre 0.50 y 0.79 1
≤0.49 0
p=p=p 2
p p=p≠p 1
Distractores
p≠p≠p 0
Todas las 𝑟𝑝𝑏 bajas y negativas 2
rpb Algunas las 𝑟𝑝𝑏 bajas y negativas 1
Ninguna 𝑟𝑝𝑏 baja y negativa 0
Aplicando el baremo a los items
B Al culminar con la evaluación cada item, se puede proceder a preparar una
tabla como la que se muestra a continuación, la cual incluiría los resultados
obtenidos en cada estadístico, con sus puntuaciones individuales, puntaje total
y decisión final.
p rpb
items p Ptos rpb Ptos Ptos Ptos Puntaje Total Condición
D1 D2 D3 D1 D2 D3
Un baremo nos ofrece una visión sistémica del funcionamiento de los reactivos de una prueba, por
ejemplo, si la versión preliminar de una prueba estaba constituida por 50 reactivos y luego de pasar
a través de un baremo quedó con 25, se nos informa, como constructores de prueba, que 25 items
no cumplen con los requerimientos exigidos, por lo tanto, son catalogados como deficientes.
Simultáneamente a que se examinan los estadísticos de los items a través del baremo,
es menester que se lean los textos de los mismos; será el juicio aguzado del
constructor, conformado a la luz del manejo teórico del constructo teórico que se
evaluará con la prueba y su conocimiento acerca de los objetivos de la misma lo que
llevará a tomar las decisiones pertinetes.
Ventajas y desventajas de un baremo
Ventajas
o Permite realizar una evaluación objetiva de la calidad de los reactivos que constituyen una prueba.
o Permite determinar, independientemente del juicio o gusto del constructor, cuáles reactivos contribuyen
con el proceso de medición de la variable y cuáles no.
o Ofrece una visión integral del funcionamiento de los reactivos, ya que se evalúa, simultáneamente tanto
su respuesta correcta como sus distractores considerando la multiplicidad de estadísticos disponibles.
Desventajas
o Requiere de una adecuada comprensión de los estadísticos de los items y de la prueba ya que un
conocimiento deficiente puede llevar a tomar decisiones erradas o a cometer sesgos.
o Conduce a omitir el texto de los items, por lo que un constructor poco ducho podría desestimar
aspectos conceptuales relevantes..