Construccion de Escalas
Construccion de Escalas
Construccion de Escalas
de escalas
• Objeto y finalidad
• Este paso parecerá muy obvio, sin embargo, la selección del tema debería realizarse
de manera cuidadosa y asegurarse de contar con las fuentes bibliográficas necesarias,
un marco teórico de referencia y antecedentes de estudios similares.
• Establezca con claridad cuáles son los objetivos de la prueba, considerando que esta
definición puede condicionar los requerimientos de calidad psicométrica para valorar
la prueba. La finalidad de la prueba puede ser: investigación, clasificación, selección
o diagnóstico.
• Marco conceptual
• Operacionalización
• Definición operacional
Como lo afirma Dancer (1990), a diferencia de algunos otros componentes de la
investigación científica, las definiciones no requieren de prueba. En consecuencia, las
definiciones son, en cierto modo, arbitrarias. Dado su carácter arbitrario, una pregunta
importante que necesita ser abordada es “¿Qué propiedades deben caracterizar a una
definición con el fin de sea útil a la comunidad científica, útil para facilitar la investigación
empírica y útil para promover resultados acumulativos?”
• Definición operacional
• Frase configurativa
• Canter (1983) indica que una forma de resumir el conjunto completo de todos los
perfiles de acciones posibles es mediante una "frase configurativa", la cual se define
como "un enunciado verbal del dominio y del rango de un mapa (trazado o ruta)
incluyendo conexiones entre facetas como en el lenguaje ordinario".
• Frase configurativa
• Es una tabla de doble o triple entrada en la cual se consigan las dimensiones del
constructo a evaluar.
• Elaboración de la TE
• Tabla de especificaciones
• Una tabla de especificaciones tendría este aspecto y en cada celda deberá indicarse el
número de reactivos.
• Redacción de ítems
• Prepare el primer conjunto de reactivos considerando que los mismos deben ser
claros, concisos y simples.
• Asuma la posición de la persona encuestada y haga su mayor esfuerzo para que los
reactivos sean accesibles a la comprensión y faciliten un compromiso de sinceridad y
exactitud en las respuestas.
• Redacción de ítems
• Adopte formulaciones consistentes a lo largo de toda la prueba: en la estructura del
enunciado (persona, número, género, tiempos verbales), en la extensión de cada
reactivo, en el tono de las expresiones, en el nivel de formalidad (o tuteo), etc.
• Redacción de ítems
Diferencial Semántico.
Listado de Sustantivos.
Listado de adjetivos.
• Evaluación de jueces
• Evaluación de jueces
• Para ello se solicita a un panel de jueces que indique el grado en que el reactivo es:
– Esencial
– No necesario
Para evaluar el dominio propuesto.
• A partir de la evaluación de cada ítem, por parte de cada juez (en forma
independiente), se calcula la “Razón de Validez de Contenido”:
𝐶𝑉𝑅=��𝑛�𝑒�−𝑁/2�𝑁/2�
En donde,
CVR = Content Validity Ratio (Razón de Validez de Contenido).
ne = Número de jueces que consideró el ítem como esencial.
N/2 = El número total de jueces divido por dos.
• Interrogatorio cognitivo
• Interrogatorio cognitivo
• Para esta etapa se requiere la participación de por lo menos diez personas que
representen diversas características de la población: sexo, edad, nivel de instrucción y
comprensión, etc. (considere los factores que podrían incidir en la comprensión de la
prueba).
• La tarea principal consiste en solicitar a cada persona evaluada que responda el ítem y
luego indique qué pensó cuando lo respondió, es decir, cuál fue su interpretación y de
qué manera construyó su respuesta.
• Validez de contenido
• Considere que cada sujeto representa a una probable proporción de la población, por
lo que cualquier dificultad o distorsión en la comprensión deberá ser atendida para
mejorar la redacción del reactivo.
• Revise cuidadosamente cada reactivo, incorpore las observaciones realizadas por los
jueces expertos y los comentarios que hayan hecho los participantes del interrogatorio
cognitivo. Prepare una versión de la prueba lista para aplicar y ejecute una prueba pre-
piloto:
• Prueba pre-piloto
• Si ha obtenido varias formas de plantear un ítem incluya a todas para que pueda optar
por aquella que presente mejores índices psicométricos. Asimismo puede preparar
versiones de la prueba que incluya diferentes formas o niveles de respuesta
(dicotomías, opciones en cantidades pares e impares, etc.), sin embargo considere que
esto lo obligará a aplicar las diferentes versiones a una misma persona o a duplicar o
triplicar el tamaño de la muestra para poner a prueba cada versión y optar por la que
muestre mejor rendimiento.
• Prueba pre-piloto
• Prueba pre-piloto
• Asegúrese de que las condiciones de aplicación del instrumento sean las más
adecuadas a la finalidad de la evaluación de la prueba, debe quedar claro que en el
interés se enfoca en el funcionamiento de la prueba más que en las características de
las personas evaluadas por lo que deberá controlar cualquier factor que pudiera incidir
sobre las respuestas que no fueran los propios reactivos del instrumento.
• Revisión de la prueba
• Registre todos los aspectos críticos de la prueba: duración, consulta sobre reactivos
que no han resultado claros, actitud ante la prueba, etc.
• Seleccione los reactivos que se ajusten a los índices que haya establecido como
preferibles. Resulta crucial que se establezcan parámetros de aceptación antes de
realizar los cálculos:
• Selección de ítems
• Incorpore las modificaciones que considere necesarias, prepare una versión preliminar
de la prueba y proceda con la prueba piloto:
– Realice un plan de muestreo que asegure la obtención de índices psicométricos
consistentes (de 5 a 10 personas por reactivo) y la representatividad de la
población de estudio (considere la necesidad de realizar un muestreo
estratificado o por conglomerados), se recomienda un mínimo de 300 o 500
personas, recomendación que debe ser considerada críticamente en cada caso.
– Seleccione a los participantes siguiendo en forma rigurosa el plan de muestreo
planificado.
– Asegúrese de que las condiciones de aplicación favorezcan las mejores
respuestas.
• Plan de muestreo
– Tipo de muestreo.
– Marco de la muestra.
– Tamaño de la muestra.
– Parámetro a estimar:
• Modelo del error muestral.
𝛼=��𝑘�𝑘−1���1−��𝑖=1�𝑘��𝑆�𝑖�2����𝑆�𝑡�2���
• Y la otra:
𝛼=�𝑘��𝑟��𝑖��1+��𝑟��𝑖��𝑘−1��
En donde:
𝑘= número de ítems
��𝑟��𝑖� = promedio de las correlaciones entre ítems que sería la
sumatoria de todas las relaciones �𝑟�𝑖𝑗� dividido por k.
• Prepare la versión final de la prueba junto con un informe del desarrollo de la escala,
especifique los procedimientos para la corrección e interpretación de las
puntuaciones. Prepare tablas normativas provisorias (recuerde que los estudios
normativos y de validación requieren un nuevo muestreo y procedimientos de
confirmación de los supuestos específicos para cada tipo de validez en cuestión).
• Martínez (1996) recomienda que para la elaboración del manual de uso del test, se
consignen, necesariamente, los siguientes aspectos (p. 54):
– Usos a los que se puede dedicar el test.
– Instrucciones completas para su administración.
– Tablas de normas para convertir las puntuaciones brutas en otras interpretables.
– Coeficientes de fiabilidad y precisión de la medida del test.
– Datos sobre la validez del test para la finalidad o finalidades para las que fue
construido (…).
– Sugerencias sobre el posible uso de las puntuaciones del test.
• Bibliografía recomendada
Arce, C. (1994). Técnicas de construcción de Escalas Psicológicas. Madrid: Síntesis.
Bilsky, W. (2002). La Teoría de las Facetas: Informaciones Básicas y Aplicaciones
Paradigmáticas. Paraíba, Brasil: Autor.
Canter, D. (1983). The Potential of Facet Theory for Applied Social Psychology. Quality &
Quantity, 17, 35-67.
Canter, D. (1985). Facet Theory. Approaches to Social Research.
New York: Springer-Verlag.
Carretero-Dios, H. y Pérez, C. (2005). Normas para el desarrollo y revisión de estudios
instrumentales. IJCHP, 5 (3) 521-551.
Cea D’Ancona, M.A. (2002). Análisis Multivariable. Teoría y Práctica en la investigación
social. Madrid: Síntesis.
Clark, L. A. & Watson, D. (1995). Constructing Validity: Basic Issues in Objective Scale
Development. Psychological Assessment, 7 (3) 309-319.
Dancer, L. S. (1990). Introduction to Facet Theory and its Applications.
Applied Psychology: An International Review, 39 (4) 365-377.
• Bibliografía recomendada
DeVellis, R. F. (2003). Scale Development. Theory and Applications. 2nd Ed. California:
SAGE Publications.
Diener, E., Emmons, R. A., Larsen, R. J. y Griffin, S. (1985). The Satisfaction with Life
Scale. Journal of Personality Assessment, 49, 71-75.
Edwards, A. L. y Kilpatrick, F. P. (1976). Una técnica para elaborar escalas de actitudes. En
Summers, G. F. (Ed.). Medición de actitudes (pp. 311-323). México: Trillas.
(Reimpreso de Edwards, A. L. y Kilpatrick, F. P., A technique for the construction of
attitude scales. Journ. Appl. Psych., 1948, 32, 374-384).
Fitzpatrick, A. R. (1983). The Meaning of Content Validity. ApPsyMeas, 7 (1) 3-13.
Guttman, L. (1976). Bases para elaborar técnicas con datos cualitativos.
En Summers, G. F. (Ed.), Medición de actitudes (pp. 311-323). México: Trillas.
(Reimpreso de L. Guttman, A basis for scaling qualitative data. American Sociological
Review, 1944, 9, 139-150).
Guttman, R. & Greenbaum, Ch. W. (1988). Facet Theory: Its Development and Current
Status. European Psychologist, 3, 1, pp. 13-36.
• Bibliografía recomendada
Kerlinger, F. y Kaya, E. (1976). Elaboración y validación analítico factorial de escalas para
medir actitudes hacia la educación. En Summers, G. F. (Ed.), Medición de actitudes
(pp. 311-323). México: Trillas. (Reimpreso de Kerlinger, F. N. & Kaya E., The
predictive validity of scales constructed to measure attitudes toward education. Educ.
psychol. Measmt., 1959, 19, 305-317).
Lawshe, C. H. (1975). A Quantitative Approach to Content Validity. Personnel Psychology,
28, 563-575.
Levy, S. (1976). Use of Mapping Sentence for Coordinating Theory and Research: A cross-
cultural example. Quality and Quantity, 10, 117-125.
Likert, R. (1976). Una técnica para medir actitudes. En Summers, G. F. (Ed.). Medición de
actitudes (pp. 311-323). México: Trillas. (Reimpreso de Likert, R., A Technique for the
Measurement of Attitudes. Arch. Psych., 1932, 140).
Martínez, R. (1996). Psicometría: Teoría de los tests psicológicos y educativos. Madrid:
Síntesis.
Morales, P. (2006). Medición de actitudes en psicología y educación. 3ª ed. Madrid:
Comillas.
• Bibliografía recomendada
Morales, P. (2010). Guía para construir cuestionarios y escalas de actitudes. Madrid:
Comillas.
Muñiz, J., Fidalgo, A. M., García-Cueto, E., Martínez, R. y Moreno, R. (2005). Análisis de
los ítems. Madrid: Muralla.
Nunnally, J. C. & Bernstein, I. J. (1995). Teoría Psicométrica. 3a ed. México: McGraw-
Hill.
Osgood, Ch. E., Suci, G. J. y Tennenbaum, P .H. (1976) Medición de actitudes. En
Summers, G. F. (Ed.). Medición de actitudes (pp. 277-276). México: Trillas.
(Reimpreso parcialmente de Osgood, Ch. E., Suci, G. J. y Tennenbaum, P .H., 1959,
The Measurement of Meaning. Illinois: Illinois Press).
Osterlind, S. J. (1988/2002). Construct- Test Items: Multiple-Choice, Constructed-
Response, Performance, and Other Formats. 2nd ed. Dordrecht: Kluwer.
Rodríguez Osuna, J. (1991). Métodos de Muestreo. Madrid: CIS.
Rovinelli, R. J. y Hambleton, R. K (1976) On the Use of Content Specialists in the
Assessment of Criterion-Referenced Test Item Validity. Laboratory of Psychometric
and Evaluative Research Report No. 24.
• Bibliografía recomendada
Seiler, L. H. y Hough R. L. (1976). Comparaciones empíricas entre las técnicas de
Thurstone y Likert. En Summers, G. F. (Ed.). Medición de actitudes
(pp. 311-323). México: Trillas.
Seiler, L. H. y Hough R. L. (1976). Comparaciones empíricas entre las técnicas de
Thurstone y Likert. En Summers, G. F. (Ed.). Medición de actitudes
(pp. 311-323). México: Trillas.
Shye, S. (1998). Modern Facet Theory: Content Design and Measurement in Behavioral
Research. Europ. Journ. of Psychological Assessment, 14,2, 160-171.
Summers, G. F. (Comp.) (1976). Medición de actitudes. México: Trillas.
Thorndike, R. L. (1989). Psicometría Aplicada. México: Limusa.
Thurstone, L. L. (1976). Las Actitudes pueden medirse. En Summers, G. F. (Ed.), Medición
de actitudes (pp. 311-323). México: Trillas.
Van Den Wittenboer, G. (2001). On the Structure of Measures in Facet Theory. Quality &
Quantity, 35, 77-89.
Wainerman, C. H. (Comp.) (1976). Escalas de medición en ciencias sociales.
Bs. As.: Visión.
• ANEXOS
• Teoría de Facetas
Breve Introducción al enfoque Estructural de Guttman
• Teoría de Facetas
• Teoría de Facetas
• Teoría de Facetas
• Al igual que la teoría de conjuntos, la Teoría de las Facetas es una teoría estructural.
• Teoría de Facetas
• Proceso de facetización
• Proceso de facetización
• Motivación Prosocial
• Bienestar Subjetivo
• Redacción de ítems
• Partiendo del supuesto de que las opiniones son actitudes verbalizadas, los ítems de
las escalas de actitudes suelen tomar la forma de frases cortas, de afirmación que
expresan opiniones que se pueden tener con respecto al objeto de la actitud medida.
– Relevancia
– Claridad
– Discriminación
– Bipolaridad
• Algunas observaciones
• Una cuestión debatida es si es preferible una formulación obvia, que permita advertir
qué se está midiendo o una formulación sutil que en la medida de lo posible
enmascararse el constructo subyacente. La relevancia y la claridad de la formulación
son más importantes que el esconder lo que se quiere medir; por otra parte, y con
criterios de validez (relación con criterios externos) suelen ser mejores lo ítems que
podemos denominar cándidos.
• Algunas observaciones
• No se trata de una cuestión cerrada y se puede experimentar con unos y otros tipos de
ítems durante el proceso de construcción. Ampliaremos este punto al tratar de la
validez de contenido; se ha investigado mucho pero en relación a los tests de
personalidad; tiene menos interés en las escalas de actitud.
• Algunas observaciones
• En la primera redacción de los ítems puede ser conveniente expresar la misma idea de
modos diferentes. Aunque la idea sea la misma, no siempre es previsible qué
formulación va a ser más clara o más discriminante. Después del análisis de ítems se
puede escoger la formulación más eficaz.
• Algunas observaciones
• Como por ejemplo reproducimos seis ítems de una escala de actitud hacia el estudio;
todos expresan la misma idea básica: nivel de aspiraciones. La selección final de los
reactivos se basó en el índice de correlación ítem-total (Morales, 2006).
• Redacciones alternativas
• Substantivos
• Las opiniones pueden sustituirse por substantivos o por expresiones muy breve; el
ejemplo clásico y más conocido es la escala de conservadurismo de Wilson y
Patterson.
• En esta escala se ofrece una lista de substantivos o expresiones breves a los que las
personas deben indicar cuál es su reacción inmediata.
• Pena de muerte
• Matrimonio gay
• Evolucionismo
• Aborto
• Desfiles militares
• Impuestos
• Adjetivos
• Son bastantes los instrumentos constituidos por listas de adjetivos: el que responde
indica qué adjetivos son aplicables en cada caso.
• Los instrumentos formados por listas de adjetivos podemos clasificarlos según estos
tres criterios (que pueden combinarse en un mismo instrumento):
• Adjetivos
• El número de respuestas: pueden ser dos (aplicable o no aplicable; 1 o 0) o más; si son
más, las repuestas pueden expresarse con números o con expresiones verbales o de las
dos maneras a la vez.
• Adjetivos
• Adjetivos
• Los adjetivos pueden ser simples (listas de adjetivos) o bipolares, tal como se utiliza
en el diferencial semántico, aunque aquí los análisis y el uso, con frecuencia, son
distintos.
• Ítems bipolares
• Ítems bipolares
– Puesto a jugar a las cartas, prefiero un juego fácil y divertido a otros que
requiera pensar mucho.
– Prefiero trabajar a comisión, con más riesgo pero con posibilidades de ganar
mucho, que con un salario fijo.
• Otros tipos
• La mayoría de las escalas utilizan opiniones en los ítems y es, en principio, el método
que parece más idóneo.
• Otros tipos
cada ítem está constituido por una frase relativamente corta con cuyo significado se
puede estar o no estar de acuerdo. También se han utilizado otras modalidades en la
manera de concebir los ítems; exponemos las más importantes.
• Ejemplos de ítems
• Ejemplo de ítems
• Las cosas más importantes que hay que enseñar a los niños son la obediencia y el respeto
a la autoridad.
• Ninguna debilidad, ninguna dificultad puede pararnos si tenemos suficiente fuerza de
carácter.
• La ciencia tiene su lugar, pero hay muchas cosas importantes que el espíritu humano
jamás logrará comprender.
• La naturaleza humana es como es, de manera que siempre habrá guerras y conflictos.
• Cuando una persona tiene un problema o está aburrido es mejor para ella no pensar en
eso y ocuparse en cosas que le interesen más.
• Habilidades Sociales
• Ítems de bienestar
• Generalmente hablando, ¿estás feliz este día?
(muy feliz... muy infeliz)
• Cuál es tu humor, en estos días?
(muy bien todo el tiempo... no muy bien la mayor parte del tiempo)
• En general, cómo evalúas tu vida familiar?
(muy bien... muy mal)
• En general estás satisfecho con la manera en cómo utilizas tu tiempo libre?
(muy satisfecho... no totalmente satisfecho)
• En general, cómo evalúas tu salud en estos días?
(muy bien... no del todo bien)
• Ítems de madurez
• Porque (frecuentemente/ rara vez) reflexiono acerca de por qué creo actuar como lo
hago, encuentro estas preguntas (fácil / difícil) para contestar.
• Tengo problemas para controlar los impulsos para hacer las cosas sin pensar
• A menudo digo lo que viene a la mente muy sin pensar mucho en ello.
• Ítems de madurez
• A veces me molestan las personas y sin embargo ni siquiera soy consciente de ello.
• Creencias
• Es importante para mí que los demás me aprueban.
• Las personas que hacen mal merecen lo que reciben.
• Normalmente acepto lo que me sucede con filosofía.
• Si una persona quiere, ella / él puede ser feliz bajo casi cualquier circunstancia.
• Tengo miedo de algunas cosas que a menudo me molestan.
• Todo el mundo necesita a alguien de quien puede depender para pedir ayuda y
consejo.
• "Una cebra no puede cambiar su / sus rayas."
• Me gustaría tener el respeto de los demás.
• Evito las cosas que no puedo hacer bien.
• Demasiadas personas malvadas escapan del castigo que se merecen.
• Juicio de Expertos
• Aproximación general
• Implementación
• Juicio de expertos
• Cada experto recibe suficiente información escrita acerca de: (a) el propósito de la
prueba; (b) conceptualización del universo de contenido; (c) plan de
operacionalización o tabla de especificaciones (en el caso de las pruebas de
rendimiento académico).
• Juicio de expertos
• Cada juez recibe un instrumento de validación en el cual se recoge la información
de cada experto. Dicho instrumento normalmente contiene las siguientes categorías
de información por cada ítem: congruencia ítem-dominio claridad, tendenciosidad
y observaciones.
• Juicio de expertos
• Entregue una nota explicativa de los objetivos de la evaluación y clara definición del
constructo y los componentes principales.
• Juicio de expertos
• Plan de muestreo
• Concepto de representatividad
• No existe una definición formal que permita establecer si una muestra concreta es o
no representativa, ni estimar siquiera su grado de representatividad. Es más bien una
noción intuitiva.
• Plan de muestreo
• Tipo de muestreo.
• Marco de la muestra.
• Tamaño de la muestra.
• Parámetro a estimar:
– Muestreo sistemático.
• Muestreo semiprobabilístico.
• Estimación de parámetros
Siendo:
𝜀 = error estadístico (que no debería superar el 10% del
valor estimado).
�𝑍�1−𝛼/2�2� = Valor de la distribución normal acumulada
correspondiente a determinado nivel de confianza (error tipo
I o alfa).
S2 = Varianza de la variable [cuando el valor estimado
fuese una proporción, la varianza es S2 = p . q = p.(1 – p)]
N = Tamaño de la población
• Consideraciones adicionales
• Considere que la fórmula para el cálculo del tamaño de muestras, presentadas en las
diapositivas anteriores, solo se utilizan para el muestreo aleatorio simple (MSA).
• Baremación
• Nociones elementales
• Estandarización
– Aplicación
– Calificación
– Corrección
– Interpretación
• El desarrollo de pruebas estandarizadas surge como respuesta a la necesidad de
realizar comparaciones entre los resultados de diferentes investigaciones que
indagaban sobre los mismos temas, por lo que propugnó la estandarización de
procedimientos de laboratorio lo que rápidamente fue transferido a los procesos de
evaluación.
• Notas estandarizadas
• Nota z
• Es una transformación lineal de las puntuaciones y constituye la nota tipificada por
excelencia (en estadística se la conoce como nota tipificada estándar o nota estándar).
• Su fórmula es la siguiente:
• Nota T
• Su fórmula es la siguiente:
• Esta nota se caracteriza por presentar una media de 50 y una desviación estándar de
10.
• Estas notas se presentan mediante una media y una desviación estándar, ambas
estandarizadas y fijas.
• Por lo tanto, mediante esta fórmula, se puede obtener una nota tipificada “derivada”
(D), de la siguiente manera:
• Percentil
• Percentil
• Su cálculo es sencillo, puesto que se ordenan todos los resultados de menor a mayor,
el sujeto con la puntuación más baja representa el percentil 1 y el mayor el percentil
99. Como varias personas pudieron obtener iguales puntuaciones un mismo percentil
puede estar representado por el mismo valor en puntuaciones brutas.
• Percentil
• Fórmula:
• Normalización
• Normalización
• Por otro lado, se utiliza el término normalización al procedimiento por el cual se
modifica la distribución de las puntuaciones obtenidas para que éstas se ajusten a la
distribución normal. Estas puntuaciones se denominan “puntuaciones
normalizadas”.
Cuando se trata de esta acepción, el procedimiento consiste en transformar los
valores brutos obtenidos de una muestra a sus respectivos valores percentiles y, a
través de la tabla de distribución normal, se convierten estos percentiles a valores
Z, en este caso se denomina Z normalizada (en ocasiones se representa con la Z
mayúscula para diferenciarla de la zona no normalizada). A partir de esta
transformación se pueden obtener otras puntuaciones normalizadas.
• El estudio de tipificación
• Pasos básicos
• Especificar los estadísticos que se deberán calcular a partir de los datos muestrales.
• Pasos básicos