Evaluación de Destrezas de PC

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 18

Evaluación de destrezas

de pensamiento crítico:
validación de instrumentos
libres de cultura
■ Assessment of Critical Thinking Skills:
Validation of Free-Culture Tools
■ Avaliação de habilidades de pensamento
crítico: validação de instrumentos livres
de cultura María-Antonia Manassero-Mas*
Ángel Vázquez-Alonso**
Resumen
Es un lugar común que el pensamiento crítico es una capacidad importante
en la educación stem (ciencia, tecnología, ingeniería y matemáticas). Sin *
Doctora en Psicología, Catedrática de Psicología
embargo, la investigación ha dedicado más atención a los programas Social, Departamento de Psicología, Universidad
de las Islas Baleares, Palma, España.
de enseñanza del pensamiento crítico que a evaluar los efectos de esos
ma.manassero@uib.es
programas, de modo que los estudios empíricos constituyen la excepción orcid: http://orcid.org/0000-0002-7804-7779
en este tema. Este estudio presenta la validación piloto de dos pruebas de
** Doctor en Ciencias de la educación, profesor e
evaluación de destrezas de pensamiento crítico con dos grupos naturales investigador, Centro de Estudios de Posgrado,
de estudiantes de primaria y secundaria, que participan en un programa de Universidad de las Islas Baleares, Palma, España.
aprendizaje basado en pensamiento. Las pruebas se diseñaron adaptadas a angel.vazquez@uib.es
las destrezas enseñadas y a la edad de los estudiantes, combinando cuestio- orcid: http://orcid.org/0000-0001-5830-7062

nes de instrumentos ya publicados y cuestiones figurativas de nuevo diseño,


independientes de la cultura y de los conocimientos escolares. Los resultados
muestran una relación positiva entre las puntuaciones de las pruebas y los
criterios de validación independientes y externos (calificaciones escolares
y notas del programa de pensamiento de los estudiantes). Se informan una
correlación excepcionalmente alta en una de las pruebas y valores aceptables
de la fiabilidad de las escalas; además, las nuevas cuestiones figurativas
presentan mejor fiabilidad y validez que las verbales. Finalmente, se discuten
las aportaciones de este estudio piloto, la toma de decisiones futuras para
mejorar los instrumentos presentados y el desarrollo del diseño de instrumentos
Fecha de aprobación: 24/08/2019

libres de cultura a medida, iniciados en este estudio.


Fecha de recepción: 09/04/2019

Palabras clave
pensamiento; evaluación; enseñanza; método de evaluación

Primer semestre de 2020 / ISSN 2665-3184


pp. 15-32
Abstract
It is a commonplace that critical thinking is an important ability for stem (science, technology, engineer-
ing and mathematics) education. Nevertheless, research has devoted more attention to critical thinking
programs than to evaluating the effects of these programs, so that the empirical studies are the exception
in this area. This study presents the pilot validation of two assessment tools on critical thinking skills using
two natural groups of elementary and secondary students, who participate in a thinking-based learning
program. The tools are designed to fit the skills developed in the program and the students’ age, and
combine some items drawn from already published critical thinking tests and some newly designed
figurative items, which are independent of school’s culture and knowledge. The results show a positive
relationship between the assessment test scores and the external and independent validation criteria
(students’ school grades and thinking program marks). There is an extremely relevant correlation for
one of the tools, acceptable reliability indices for the scales and better reliability and validity indices
of the newly designed figurative items than the classical verbal items are the main contributions of the
study. Finally, the future decision making to improve the tools, the development of research on free-cul-
ture customized tests, as initiated with this study, and the contributions of this pilot study are discussed.
Keywords
thinking; evaluation; teaching; assessment methods

Resumo
É um lugar comum que o pensamento crítico é uma capacidade importante da educação stem
(ciência, tecnologia, engenharia e matemática). No entanto, a pesquisa tem dedicado mais
atenção aos programas de ensino do pensamento crítico que à tarefa de avaliar os efeitos desses
programas, de modo que os estudos de avaliação empírica são a exceção neste tópico. Este
estudo apresenta a validação piloto de dois testes de avaliação de habilidades de pensamento
crítico com dois grupos naturais de alunos do ensino fundamental e médio, que participam de
um programa de aprendizagem baseado em pensamento. Os testes são projetados de acordo
com as habilidades ensinadas e a idade dos alunos, combinando questões de instrumentos já
publicados e questões figurativas recém-projetadas, independente da cultura e do conhecimento
da escola. Os resultados mostram uma relação positiva entre os resultados dos testes e os critérios
de validação independentes e externos (notas escolares e anotações do programa de pensamento
do aluno). Uma correlação excepcionalmente alta é fornecida em um dos testes e valores aceitá-
veis da confiabilidade das escalas; além disso, as novas questões figurativas apresentam melhor
confiabilidade e validade que as verbais. No final, são discutidas as contribuições deste estudo
ISSN 2665-3184 impreso• ISSN 2323-0126 Web

piloto, futuras tomadas de decisão para melhorar os instrumentos apresentados e o desenvolvimento


No 47 • Primer semestre de 2020 • pp. 15-32

do desenho de instrumentos livres de cultura para medir, iniciados neste estudo.


Palavras-chave
pensamento; avaliação; ensino; métodos de avaliação
TED

16
Introducción comunes son los que identifican pensamiento
con razonamiento. Algo análogo sucede en los
El pensamiento es una capacidad y un planteamientos del pensamiento crítico como
rasgo distintivo de la naturaleza humana. Sin un conjunto articulado de destrezas, con plan-
embargo, la mayor parte del pensamiento teamientos globales y extensos, que incluyen
espontáneo suele ser de baja calidad y defec- habilidades cognitivas y disposiciones (por
tuoso (desinformado, parcial, tendencioso, ejemplo, http://www.criticalthinking.org/
injusto, cargado de prejuicios o intereses, y http://criticalthinking.net), y otros plantea-
erróneo, inválido, etc.). Por ello, una caracte- mientos más concretos centrados en algunas
rística consensual y básica del pensamiento es destrezas (Fisher, 2009).
su normatividad, es decir, debería ser sinónimo
de pensamiento de calidad (correcto, bueno) y La mejora del pensamiento tiene tres
esta normatividad se considera incluida ya en puntos clave: la mejora de las destrezas de
la denominación pensamiento crítico (Bailin, pensamiento, la permanencia a lo largo del
Case, Coombs y Daniels, 1999). tiempo de las mejoras alcanzadas y la exten-
sión o generalización de las mejoras a con-
Pensar correctamente es central en las textos y situaciones diferentes de donde se
comunidades científico-técnicas y en el apren- aprendieron. La apreciación de los niveles,
dizaje de materias stem (ciencia, tecnología, cambios y mejoras del pensamiento requieren
ingeniería y matemáticas), pues pensamiento instrumentos apropiados de evaluación que
científico y pensamiento crítico son entidades permitan una medida fiable de esas magnitu-
equivalentes (Vázquez-Alonso y Manasse- des. La eficacia de los programas educativos
ro-Mas, 2018). Pero pensar también debería de pensamiento, para cambiar y mejorar, para
ser un valor sistemática y socialmente cultivado hacer permanente la mejora y para extenderla
y promovido; por ello, desde los años 1980 se a otras situaciones, requiere la creación de
han generado programas para la enseñanza

Evaluación de destrezas de pensamiento crítico: validación de instrumentos libres de cultura


instrumentos para la evaluación del pensa-
del pensamiento crítico con diversas orientacio- miento crítico que produzcan medidas fiables
nes y prácticas. En todos los casos, parten de y válidas de esos tres criterios básicos para
la hipótesis básica que el pensamiento puede el cambio y mejora del pensamiento. Sin
ser mejorado mediante programas educativos embargo, en la investigación sobre educación
adecuados. Sin embargo, la variedad en los del pensamiento crítico, las actividades de
programas e incluso la propia conceptualiza- diseño de programas de intervención para la
ción de pensamiento crítico es tan amplia entre

María-Antonia Manassero-Mas, Ángel Vázquez-Alonso


enseñanza de este han sido dominantes sobre
los especialistas, que resulta difícil advertir posi- las evaluaciones de los efectos de esos progra-
bilidades de conseguir una síntesis virtuosa en mas, hasta el punto que los estudios empíricos
la gran variedad de los programas de ense- de evaluación que acrediten los efectos de los
ñanza (Follmann, Mattos, Güllich, 2018; Saiz, programas son la excepción más que la regla.
2017; Swartz et ál., 2013). Según Saiz (2017), el programa de filosofía
para niños desarrollado por Lipman es uno de
Antecedentes los programas más evaluados empíricamente
(Colom, García, Magro y Morilla, 2014),
En general, las definiciones y la literatura sobre pero otros como el programa canadiense razo-
pensamiento crítico son muy extensas y com- namiento, argumentación y retórica (Walton y
plejas, pues abarcan desde los planteamien- Macagno, 2015) carece de evaluaciones de
tos generales, que consideran la dimensión de sus efectos, y otros muy extendidos, como el
pensamiento, la crítica y los procesos, hasta los programa de aprendizaje basado en pensa-
TED

reduccionistas, que se centran en alguna parte miento (tbl) (Swartz et ál., 2013) solo han sido
de esa complejidad, donde quizá los más evaluados ocasionalmente.

17
Marco teórico
El diseño y construcción de instrumentos de evaluación es una actividad de
investigación que requiere tomar numerosas decisiones y está plagada de difi-
cultades. El primer grupo de estas se asocia a cuestiones psicométricas básicas,
acerca de la validez y fiabilidad del instrumento de medida; en el caso del
pensamiento crítico, las controversias en su definición sugieren ya las previsibles
grandes dificultades a la hora de superar las cuestiones de validez de los ins-
trumentos. El segundo grupo de dificultades surge de la naturaleza estadística
de la medida de la eficacia del tratamiento educativo y está relacionada con
cuestiones de atribución de los efectos estadísticos observados a las variables
propias del tratamiento; la significación y la potencia de las medidas obtenidas
(tamaño del efecto) deben ser suficientes para valorar la eficacia de los trata-
mientos, desde los tres criterios de cambio, mantenimiento y generalización.
El tercer grupo surge de las necesidades de clarificación conceptual y teórica
en la investigación del pensamiento crítico, como evaluar la eficacia de los
programas dependientes frente a los independientes (del contexto o dominio,
especifico frente a general), de las metodologías directas o indirectas de ense-
ñanza del pensamiento crítico, de las distintas destrezas cognitivas enseñadas
y, en general, la comparación de distintos programas de enseñanza.
Además, por las exigencias de viabilidad y utilidad de su propia finalidad,
los instrumentos de evaluación del pensamiento crítico adoptan restricciones que
se traducen en una selección estricta de las destrezas que evalúan, de modo que
elaboran modelos más concretos, sintéticos y prácticos, los cuales proyectan una
imagen más convergente que las divergencias expuestas en las contribuciones
mencionadas.
Entre las propuestas de evaluación más amplias, Ennis (2019) sugiere las
siguientes dimensiones (compuestas a su vez de varias destrezas): clarificación
básica de ideas, bases de decisión, inferencias, clarificación avanzada y meta-
cognición. En el plan nacional para la evaluación del pensamiento crítico, Paul
y Nosich (2019) proponen una extensa lista de destrezas de pensamiento crítico
(88), agrupadas en las dimensiones siguientes: propósitos, metas o fines, pre-
ISSN 2665-3184 impreso• ISSN 2323-0126 Web

gunta en cuestión o problema a resolver, punto de vista o marco de referencia,


No 47 • Primer semestre de 2020 • pp. 15-32

la dimensión empírica del razonamiento (información), la dimensión conceptual


del razonamiento, presuposiciones y supuestos, implicaciones y consecuencias,
interpretación e inferencias, dimensiones transversales y dimensiones afectivas.
La evaluación propuesta por James Madison (2004) incluye las destrezas
siguientes: reconocer y clarificar problemas, reclamaciones, argumentos y expli-
caciones, distinguir condiciones necesarias y suficientes, identificar y evitar erro-
res y falacias, evaluar si un argumento es fuerte o débil, distinguir conclusiones,
premisas (razones), argumentos, explicaciones, supuestos, problemas, conclusio-
nes, conclusiones tácitas, premisas no declarados e implicaciones, reivindicacio-
nes, argumentos, explicaciones, descripciones, representaciones, etc., describir
la estructura de argumentos y explicaciones, evaluar argumentos analógicos y
TED

generalización inductiva, evaluar un argumento deductivo, interpretar y aplicar


textos instrucciones, ilustraciones, etc., reconocer la ambigüedad, evaluar la rele-

18
vancia de las declaraciones para otras, evaluar • Creatividad (generar ideas, conclusiones):
argumentos en términos de criterios y discernir
si pares de afirmaciones son consistentes, con- – Plantear buenas preguntas.
trarias, contradictorias o paradójicas. – Observación (comparar, clasificar,
secuenciar).
Entre las propuestas de evaluación más
sencillas, el cuestionario de situaciones cotidia- – Análisis y síntesis (partes-todo,
nas de Halpern (2010) evalúa las destrezas analogías, modelos).
resolución de problemas, razonamiento verbal,
utilizar probabilidad e incertidumbre, pensa-
• Razonamiento y argumentación (justificar
miento como prueba de hipótesis, análisis de predicciones, implicaciones, conclusiones):
argumentos y toma de decisiones. El cuestio- – Lógico (deductivo).
nario de pensamiento crítico de Rivas y Saiz
– Empírico (explicar con datos,
(2012) de la universidad de Salamanca (Pen-
crisal) evalúa resolución de problemas, razo- informaciones, pruebas):
namiento inductivo, razonamiento deductivo, • Inductivo (generalizaciones).
razonamiento práctico o informal, y toma de • Argumentación (abductivo).
decisiones. El instrumento de Watson y Glaser • Estadístico (probabilístico).
(2002) propone evaluar deducción, reconoci- – Falacias y errores.
miento de supuestos, interpretación, inferencia
y evaluación de argumentos. • Procesos complejos:
En este marco teórico de gran diversidad, – Toma de decisiones.
el enfoque del pensamiento crítico desde los – Resolución de problemas.
procesos y destrezas de pensamiento consti-
tuyentes ofrece un planteamiento concreto de • Evaluación y juicio (valoración de la cali-

Evaluación de destrezas de pensamiento crítico: validación de instrumentos libres de cultura


formas de razonar o argumentar, de tomar dad del pensamiento):
decisiones eficaces, de resolver problemas
sólidamente y, en general, de evaluar y – Estándares intelectuales (claridad,
juzgar ideas, conclusiones y procesos de precisión, relevancia, ...).
razonamiento y argumentación. Elaborando – Razonamiento y argumentación.
una síntesis empírica de todos esos modelos, – Acciones (soluciones, decisiones,
estudios e instrumentos de evaluación, hemos

María-Antonia Manassero-Mas, Ángel Vázquez-Alonso


consecuencias, ...).
propuesto una definición y una taxonomía
del pensamiento crítico (Manassero-Mas y – Credibilidad de fuentes.
Vázquez-Alonso, 2019). Nuestra aportación – Identificar supuestos.
a la definición de pensamiento crítico es la – Comunicación (clarificación de
siguiente: “Pensamiento crítico es el pensa- significados).
miento claro y preciso en sus justificaciones – Metacognición:
y conclusiones, que además evalúa y juzga
• Autorregulación y autorreflexión.
meticulosamente todos sus elementos”.
• Actitudes y afectos (disposiciones).
La taxonomía elaborada pretende ofrecer
un modelo simple para un constructo complejo En esta taxonomía, el concepto de pen-
como el pensamiento crítico, de modo que sea samiento crítico es fundante, como constructo
comprensible y útil a las personas no especia- general que engloba a todas las demás des-
listas, especialmente los docentes encargados trezas de pensamiento, y que se desarrolla
TED

de enseñarlo, y está formado por las siguientes en cuatro grandes áreas: creatividad; razona-
cuatro áreas y múltiples destrezas: miento y argumentación; procesos complejos;

19
y evaluación y juicio. Cada una de estas incluye destrezas y subdestrezas, que
pueden desarrollarse todavía en constituyentes más simples.
En resumen, la psicología encuadra el pensamiento crítico dentro del cons-
tructo habilidades de pensamiento de alto nivel, formado por un conjunto complejo
de destrezas de pensamiento, como una forma de pensamiento autodirigido,
autodisciplinado, autosupervisado y autocorrectivo que presupone ajuste y con-
formidad con rigurosos estándares de calidad y dominio consciente de su uso.
Además, implica comunicación efectiva, capacidades de razonamiento, toma
de decisiones, resolución de problemas y compromiso y actitudes para superar
las tendencias naturales a la falacia y al sesgo (egocentrismo y sociocentrismo).
Por otro lado, es un lugar común de la psicología cognitiva el supuesto sobre
la relación positiva entre el pensamiento y el aprendizaje, ya que ambos implican
múltiples componentes y niveles, cognitivos y no cognitivos, interdependientes e
inextricablemente relacionados entre sí. Además, la evidencia empírica actual
indica que la dinámica interactiva entre pensamiento crítico y otras variables
educativas puede contribuir a desarrollar mejor el aprendizaje (Phan, 2010).
Este estudio plantea el desarrollo de dos pruebas de evaluación específicas
para un conjunto de destrezas de pensamiento crítico, educadas en el proyecto
de enseñanza del pensamiento crítico desarrollado con los estudiantes participan-
tes en este estudio piloto. Las hipótesis iniciales planteadas establecen la validez
y fiabilidad de las pruebas de pensamiento crítico diseñadas y aplicadas a los
estudiantes, tomando las calificaciones escolares de los estudiantes participantes
como indicador de la validez de criterio de las pruebas y la investigación de la
relación empírica positiva con el aprendizaje escolar.

Metodología
En este apartado se presenta la metodología general diseñada para este estudio
piloto, donde se describe la muestra de los estudiantes participantes, los instru-
mentos de evaluación de pensamiento crítico y los procedimientos seguidos en
la aplicación piloto.
ISSN 2665-3184 impreso• ISSN 2323-0126 Web
No 47 • Primer semestre de 2020 • pp. 15-32

Participantes
Los participantes en la aplicación piloto presentada en este estudio son dos grupos
naturales de estudiantes en un colegio ubicado en una ciudad de tamaño medio,
que aplica el programa de enseñanza del pensamiento crítico teaching-based
learning (tbl) (Swartz et ál., 2013). Se trata, pues, de una muestra opinática,
condicionada por la participación de los estudiantes en el programa tbl, que está
formada por un grupo clase de 22 niña del grado 6 (curso final de la educación
primaria) y 16 en el grupo del grado 8 (segundo curso de educación secundaria).
El pequeño tamaño de la muestra de conveniencia aquí empleada limita
las posibilidades de algunos análisis sobre las pruebas, que serían importantes
para los objetivos del estudio como los análisis factoriales exploratorios para la
TED

confirmación empírica de la validez factorial.

20
Tabla 1. Especificaciones generales de las pruebas piloto ensayadas en este estudio para evaluar
ocho destrezas de pensamiento según los niveles educativos donde se han aplicado (grado 6, sexto
curso de educación primaria, ep6, y grado 8, segundo curso de educación secundaria, eso2)
Destrezas de pensamiento Fuente Tipo Número de reactivos

Prueba ep6 Prueba eso2

Predicción Cornell (Nicoma) Verbal 13 -


Comparación y contraste Cornell (Nicoma) Verbal 13 -
Clasificación Elaboración propia Figurativo 8 -
Elaboración propia Figurativo 10 -
Resolución de problemas
Halpern Situaciones 1
Explicación causal Cornell (Nicoma) Verbal - 13
Cornell (Nicoma) + Verbal - 7
Toma de decisiones
Adaptación propias Situaciones 4
Secuenciación Elaboración propia Figurativo - 10
Relación partes-todo Elaboración propia Figurativo - 4

Verbal: preguntas verbales de opción múltiple con un pie y diversas alternativas para elegir una.
Situaciones: plantean una situación real con información verbal y varias preguntas sobre ella.
Figurativo: plantean conjuntos de figuras sobre las que se plantean diversas preguntas.
Fuente: elaboración propia.

Instrumentos resantes para la edad de la muestra a la que

Evaluación de destrezas de pensamiento crítico: validación de instrumentos libres de cultura


van dirigidas y deben plantear un reto cuyo
Los instrumentos pilotados fueron diseñados a
logro motive y desafíe a los estudiantes. A partir
medida de las ocho destrezas de pensamiento
estas premisas, las cuestiones que integran dos
crítico que los estudiantes estaban aprendiendo
destrezas en cada curso fueron tomadas de un
en cada uno de los cursos, de acuerdo con el
instrumento estandarizado de evaluación del
programa tbl desarrollado en el colegio (tabla
pensamiento crítico (Ennis y Millman, 2005),
1). Las destrezas evaluadas en el grado 6 de
denominado aquí test de Cornell (Nicoma),

María-Antonia Manassero-Mas, Ángel Vázquez-Alonso


primaria (en adelante, ep6) son predicción,
y las otras dos destrezas están formadas por
comparación y contraste, clasificación y reso-
cuestiones principalmente figurativas de ela-
lución de problemas. Las destrezas evaluadas
boración propia, donde se ha incluido una
en el grado 8 de educación secundaria obli-
cuestión del cuestionario de Halpern (resolu-
gatoria (en adelante, eso2) son secuenciación,
ción de problemas).
relación de las partes con el todo, explicación
causal y toma de decisiones. El test de pensamiento crítico de Cornell
presenta verbalmente una historia ficticia y
Las cuestiones creadas para la evaluación
sencilla sobre unos exploradores en el planeta
de esas ocho destrezas forman los dos instru-
Nicoma; los estudiantes deben responder pre-
mentos de este estudio piloto de evaluación.
guntas relacionadas con la información des-
El contenido de las cuestiones de las pruebas
plegada en la historia y que van dirigidas a
se diseñó con arreglo a los siguientes criterios
evaluar cuatro destrezas de pensamiento crí-
generales: la demanda cognitiva de cada
tico. La información de la historia y cuestiones
TED

cuestión debe ir dirigida a la destreza para


referidas a las destrezas de comparación y
la que está diseñada, sus contenidos deben
predicción se han incluido en la prueba del
ser legibles, comprensibles, adecuados e inte-
grado 6 (ep6), y la información y cuestiones
21
referidas a las destrezas de explicación causal y toma de decisiones se han
incluido en la prueba para el grado 8 (eso2). Algunas preguntas de cada una
de esas dimensiones se excluyeron porque se consideraron repetitivas o porque
presentaban algún problema de comprensión (ver muestra en anexo).
Las otras cuatro dimensiones de las pruebas fueron desarrolladas a partir de
materiales principalmente figurativos para facilitar la motivación, la comprensión
de los estudiantes y la agilidad de sus respuestas; además, el diseño figurativo
pretende que estas cuestiones sean aún más independientes de la cultura y los
conocimientos escolares (ver muestra en anexo).
La prueba del grado 6 está formada por 45 reactivos (destrezas clasifica-
ción y resolución de problemas), mientras la prueba correspondiente al grado
8 (eso2) está formada por 38 reactivos para las destrezas de secuenciación y
relación partes y todo (tabla 1). En conjunto, todas las cuestiones incluidas en
las pruebas están libres de cultura, puesto que los contenidos de las preguntas
no están relacionados ni anclados en conocimientos curriculares de las mate-
rias escolares. Ningún conocimiento previo es un requisito para responder a la
demanda cognitiva que exige lograr la respuesta correcta, de manera que las
cuestiones plantean retos de pensamiento auténticos e independientes de cono-
cimientos curriculares previos de ningún tipo para los estudiantes.
Los formatos de respuesta elegidos para las preguntas planteadas en las prue-
bas son formatos cerrados, porque facilitan la asignación de puntuaciones y hacen
más rápida y fiable la obtención y análisis de los resultados. Este formato tiene el
inconveniente de no evaluar el desarrollo de los procesos de pensamiento, pero
tiene la ventaja de ofrecer una evaluación estandarizada y rápida de destrezas
de pensamiento. Las ventajas metodológicas de un instrumento estandarizado
son: facilitar el establecimiento de líneas base para comparar investigaciones,
programas y metodologías de enseñanza y lograr que sus medidas ajusten la
demanda cognitiva de las preguntas a la destreza que representan para consti-
tuir una evaluación válida y fiable de cada destreza.

Procedimiento
ISSN 2665-3184 impreso• ISSN 2323-0126 Web
No 47 • Primer semestre de 2020 • pp. 15-32

Las pruebas no se han aplicado como pruebas de velocidad, con un tiempo


improrrogable para responder; los estudiantes podían disponer del tiempo nece-
sario para concluir sus respuestas.
Fueron aplicadas por la profesora tutora de los estudiantes en su grupo natu-
ral, en el mes de mayo al final de curso, utilizando dispositivos digitales; se plan-
tearon como una prueba más de evaluación dentro del curso, para incentivar el
esfuerzo y motivación de los estudiantes.
Las respuestas correctas reciben un punto, y las respuestas incorrectas cero
puntos y no se han aplicado correcciones por respuestas al azar. La base de
datos resultante con las puntuaciones de los estudiantes se ha procesado con el
paquete estadístico spss 25.
TED

Las variables consideradas para los análisis son las puntuaciones alcanzadas
en las diferentes destrezas evaluadas por las dos pruebas, como suma de los
reactivos que forman cada destreza (tabla 1). La suma de las puntuaciones de
cada una de las cuatro destrezas evaluadas en cada prueba ha generado una
22
variable de puntuación global (pensamiento) pensamiento crítico se han recogido para cada
que sería la estimación del nivel de pensa- estudiante otras dos variables que actúan como
miento crítico de los estudiantes con base en criterios externos de validez de las pruebas. En
las cuatro destrezas evaluadas. primer lugar, el promedio de las calificaciones
escolares finales (escala de 1 a 10) obtenidas
Aunque existen diversos tipos de validez
por cada estudiante en las asignaturas del
psicométrica, estos no constituyen conceptos
curso (criterio nota media); en segundo lugar,
independientes entre sí, ya que mantienen una
la calificación específica (escala de 1 a 7) otor-
relación de influencia recíproca y conforman
gada por el profesor del programa tbl sobre
las diversas partes de un todo; en este pilotaje
la ejecución de las actividades realizadas por
se han atendido especialmente las formas de
los estudiantes en este programa (variable tbl).
validez compatibles con el contexto del estu-
Esta última calificación fue otorgada por el
dio (el tamaño de la muestra impide el análi-
profesor de manera ciega respecto a la ejecu-
sis correlacional de validez factorial). Por ello,
ción de las pruebas, ya que el profesor emitió
la validez de contenido se ha basado en el
su calificación sin saber que se aplicaban las
análisis y evaluación de decenas de cuestio-
pruebas, y, por supuesto, sin conocer sus resul-
nes e instrumentos de evaluación de pensa-
tados, de manera que se puede considerar una
miento crítico por dos expertos, cuyo acuerdo
valoración totalmente ciega e independiente
ha seleccionado las cuestiones que se ajusta-
de la prueba.
ban mejor a la demanda cognitiva de cada
destreza evaluada y las ha asignado a una
de las dos pruebas pilotadas. La fiabilidad se Resultados
ha calculado mediante el estadístico alfa de
Cronbach. Los descriptores estadísticos de las puntuacio-
nes de las variables consideradas en este estu-
Para evaluar empíricamente la validez dio, obtenidas de la aplicación de las pruebas,

Evaluación de destrezas de pensamiento crítico: validación de instrumentos libres de cultura


convergente de las medidas de destrezas de están resumidos en la tabla 2.

Tabla 2. Estadística descriptiva básica de las variables empleadas en este estudio


Criterios externos Destrezas de pensamiento
Prueba ep6
Notas Medias tbl (1-7) Predicción Comparación Clasificación Problema Pensamiento*

María-Antonia Manassero-Mas, Ángel Vázquez-Alonso


(n = 22)
Media 8,46 4,41 8,95 7,95 3,95 7,64 28,50
Desviación
0,85 2,28 1,94 1,73 2,24 2,08 5,12
estándar
Máximo 9,6 7 13 11 8 11 40
Mínimo 6,6 1 4 5 0 3 21
Mediana 8,75 4,5 9 8 3,5 7 27,5
Prueba eso2 Explicación Toma de Relaciones
Notas Medias tbl (1-7) Secuenciación Pensamiento*
(n = 16) causal decisiones parte-todo
N 16 16 16 16 16 16 16
Media 800 4,38 7,88 4,94 7,56 1,00 21,38
Desviación
1,14 1,86 2,33 1,39 1,71 1,63 4,76
estándar
Máximo 9,4 6 11 7 10 4 29
TED

Mínimo 5,3 1 4 2 4 0 12
Mediana 8,15 5 8 4.5 8 0 22

* La puntuación de la variable pensamiento es la suma de las puntuaciones en las cuatro destrezas evaluadas.
Fuente: elaboración propia. 23
La variable nota media es el promedio de las calificaciones finales obteni-
das en las asignaturas del curso correspondiente; en ambos grupos se observa
una calificación media situada en el intervalo del notable alto. La variable tbl es
la calificación final otorgada por el profesor del aprendizaje realizado sobre las
actividades de destrezas de pensamiento, en el marco del programa de ense-
ñanza basada en el pensamiento (tbl); la calificación media y la mediana de
esta variable también se sitúa por encima del punto medio del rango de estas
calificaciones (4).
Las puntuaciones medias de las cuatro destrezas evaluadas mediante las
pruebas aplicadas de retos de pensamiento se sitúan aproximadamente por
encima de la media del rango de cada una de estas variables. Las puntuaciones
de la variable pensamiento se obtienen, en cada caso, como suma de las cuatro
puntuaciones obtenidas por cada estudiante en las cuatro destrezas de pensa-
miento evaluadas; las puntuaciones medias y las medianas de esta variable en
cada curso se sitúan también aproximadamente por encima del punto medio del
rango de esta variable. En conjunto, estos resultados sugieren que las pruebas
están muy centradas en las capacidades de respuesta y asequibles a los niveles
cognitivos de los estudiantes.
El análisis de correlaciones entre la variable pensamiento y las puntuacio-
nes en las cuatro destrezas de pensamiento con la variable tbl (valoración por el
profesor del nivel de aprendizaje de destrezas en clase) permite una estimación
empírica de la validez convergente de las pruebas de retos de pensamiento. En
el caso de la prueba de sexto curso de educación primaria ep6 la correlación
obtenida entre la variable pensamiento y la variable tbl es positiva y moderada-
mente elevada (0,345), aunque su nivel de significación estadística (p=0,116)
está próximo, pero ligeramente por encima del umbral de significación estadística
(p < 0,05). En el caso de la prueba de segundo curso de educación secunda-
ria obligatoria eso2 la correlación obtenida entre la variable pensamiento y la
variable tbl es positiva y muy alta (0,775), y su nivel de significación estadística
es muy elevado, muy por debajo nivel de significación mínimo (p < 0,000). Sin
duda, es el resultado de más impacto en este estudio piloto, ya que demuestra
una profunda concomitancia entre ambas formas independientes de evaluar el
ISSN 2665-3184 impreso• ISSN 2323-0126 Web
No 47 • Primer semestre de 2020 • pp. 15-32

pensamiento crítico, el profesor y la prueba retos de pensamiento.

Tabla 3a. Coeficientes de correlación de Pearson entre las variables de este


estudio y su grado de significación estadística –en cursiva– para la prueba
aplicada en sexto curso de educación primaria (los coeficientes de correlación
de las destrezas con la variable pensamiento aparecen tachados porque
ambas variables son linealmente dependientes entre sí, por definición)
Prueba ep6 Notas Medias tbl (1-7) Predicción Comparación Clasificación Problema

Pensamiento 0,337 0,345 0,795** 0,578** 0,635** 0,554**


(significación) 0,125 0,116 0,000 0,005 0,001 0,007
Notas 1 0,572** 0,304 0,054 0,314 0,163
medias
TED

(significación) 0,005 0,169 0,813 0,155 0,469

tbl (1-7) 1 0,241 0,174 0,284 0,173


(significación) 0,280 0,440 0,200 0,441

24
Prueba ep6 Notas Medias tbl (1-7) Predicción Comparación Clasificación Problema

Predicción 1 0,453* 0,230 0,397


(significación) 0,034 0,303 0,068
Comparación 1 0,245 -0,097
(significación) 0,271 0,667
Clasificación 1 0,068
(significación) 0,764

* La correlación es significativa en el nivel 0.05 (bilateral).


** La correlación es significativa en el nivel 0.01 (bilateral).
Fuente: elaboración propia.

Las correlaciones entre las puntuaciones El análisis de las correlaciones entre la


de las cuatro destrezas de pensamiento eva- variable de pensamiento, medida por las prue-
luadas por las pruebas y la calificación tbl son bas como suma de las cuatro puntuaciones de
también positivas en las cuatro destrezas de destrezas, y la variable de rendimiento escolar,
las dos pruebas. En el caso de la prueba de medida por la nota media obtenida por los
sexto curso de educación primaria las correla- estudiantes entre las calificaciones finales de las
ciones obtenidas entre las cuatro destrezas de asignaturas del curso, produce resultados empí-
pensamiento y la calificación tbl son positivas ricos similares, aunque no iguales en los dos
para las cuatro destrezas (0,173 a 0,284), cursos (tablas 3a, 3b). En el caso de la prueba
aunque su nivel de significación no alcanza el de sexto curso de educación primaria la corre-
umbral de significación estadística (p < 0,05). lación entre pensamiento y nota media es posi-

Evaluación de destrezas de pensamiento crítico: validación de instrumentos libres de cultura


En el caso de la prueba de segundo curso de tiva y moderadamente alta (0,337), y su nivel
educación secundaria obligatoria las corre- de significación estadística (p=0,12) también
laciones obtenidas entre las cuatro variables está próximo, pero ligeramente por encima del
de destrezas de pensamiento y la variable tbl umbral de significación estadística (p < 0,05).
son positivas y más altas (0,663 a 0,320), y En el caso de la prueba de segundo curso de
su nivel es estadísticamente significativo, por educación secundaria obligatoria la correla-
debajo del umbral de significación, en la des- ción obtenida entre la variable pensamiento y

María-Antonia Manassero-Mas, Ángel Vázquez-Alonso


treza explicación causal (p = 0,.015) y muy la nota media del curso es positiva y más alta
significativo (p = 0,.005) en el caso de la des- (0,522), y su nivel de significación estadística
treza secuenciación (tablas 3a, 3b). (p=0,03) es bueno, por debajo del umbral de
significación mínimo (p < 0,05).

Tabla 3b. Coeficientes de correlación de Pearson entre las variables de


este estudio y su grado de significación –en cursiva– para la prueba
aplicada en segundo curso de educación secundaria (los coeficientes de
correlación las destrezas con la variable pensamiento aparecen tachados
porque son linealmente dependientes entre sí, por definición)
Explicación Toma de Relaciones
Prueba eso2 Notas medias tbl (1-7) Secuenciación
causal decisiones parte-todo
TED

Pensamiento 0,522* 0,775** 0,821** 0,468 0,644** 0,669**


(significación) 0,038 0,000 0,000 0,068 0,007 0,005
Notas medias 1 0,683** 0,468 0,021 0,535* 0,273
(significación) 0,004 0,068 0,938 0,033 0,306
25
Explicación Toma de Relaciones
Prueba eso2 Notas medias tbl (1-7) Secuenciación
causal decisiones parte-todo

tbl (1-7) 1 0,596* 0,320 0,663** 0,440


(significación) 0,015 0,227 0,005 0,088
Explicación 1 0,141 0,369 0,455
causal
(significación) 0,602 0,159 0,077
Toma de 1 0,156 0,147
decisiones
(significación) 0,564 0,587

Secuenciación 1 0,167
(significación) 0,537

* La correlación es significativa en el nivel 0.05 (bilateral).


** La correlación es significativa en el nivel 0.01 (bilateral).
Fuente: elaboración propia.

Estos resultados avalan empíricamente la validez de criterio de las prue-


bas de pensamiento, ya que las puntuaciones obtenidas con las pruebas (la
puntuación de pensamiento global y las puntuaciones de las cuatro destrezas)
correlacionan positivamente con una medida de destrezas de pensamiento tbl
otorgada por el profesor e independiente de las anteriores. Ambas medidas
de pensamiento se pueden considerar independientes porque los profesores de
ambos niveles fueron ciegos a esta experiencia, ya que emitieron sus califica-
ciones tbl sin información de las pruebas, y, por otro lado, las pruebas han sido
diseñadas por personas ciegas a las experiencias y actividades de enseñanza
concretas realizadas por los alumnos en la clase, en el marco del programa tbl.
El resultado se puede calificar de extraordinario en el caso de la prueba de
retos de pensamiento para segundo curso de educación secundaria obligato-
ria debido a la correlación tan alta y estadísticamente significativa entre ambas
medidas independientes. Los resultados también son positivos y muestran la misma
tendencia para la relación entre destrezas de pensamiento y rendimiento esco-
lar medido por la nota media de las calificaciones en las asignaturas de cada
curso. No obstante, el pequeño tamaño de la muestra requiere confirmar estos
ISSN 2665-3184 impreso• ISSN 2323-0126 Web

prometedores resultados con nuevas medidas empíricas.


No 47 • Primer semestre de 2020 • pp. 15-32

Fiabilidad de la prueba y las escalas


Otra propiedad importante de los instrumentos de medida es la fiabilidad del
instrumento, como la consistencia interna de las puntuaciones emanadas del ins-
trumento para cada una de las escalas que lo componen. En este caso, se ha
calculado el estadístico alfa de Cronbach para la puntuación de pensamiento
global y para las puntuaciones parciales en las cuatro destrezas evaluadas en
cada prueba, obtenidas sumando las puntuaciones dicotómicas (0-1) de cada
pregunta de las pruebas retos de pensamiento aplicadas (tabla 4). Para compu-
tar el estadístico alfa, cada variable de pensamiento se considera integrada por
todas las cuestiones que la conforman; en el caso de la variable de pensamiento
TED

global serían todas las cuestiones de la prueba, y en el caso de las destrezas,


serían las cuestiones pertenecientes a cada destreza.

26
Estos cálculos de fiabilidad tienen dos particularidades estadísticas que proyectan condicio-
nantes sobre el resultado de estos parámetros: las cuestiones están medidas dicotómicamente
(0-1) y el tamaño de la muestra de este estudio piloto es pequeño. Una amplia literatura está de
acuerdo en que las estimaciones del parámetro alfa resultan minoradas cuando se usan variables
dicotómicas y muestras de tamaño pequeño, el cual, además, puede condicionar la posibilidad
de implementar algunos cálculos. En este último caso se encuentra el parámetro alfa para la
variable pensamiento global de la prueba retos de pensamiento eso2, que no pudo computarse
por no satisfacer la muestra las condiciones de contorno requeridas para el cómputo.

Tabla 4. Resultados del coeficiente de consistencia interna (alfa de Cronbach)


para las dos pruebas de retos de pensamiento (ep6 y eso2)
Prueba ep6 Alfa Cronbach Prueba eso2 Alfa de Cronbach
Predicción 0,455 Explicación causal 0,617
Comparación 0,185 Toma de decisiones 0,226
Clasificación 0,809 Secuenciación 0,479
0,545
Problema Relaciones parte-todo 0,938
(0,843*)
Pensamiento 0,700 Pensamiento No computable

* Índice de fiabilidad si se elimina la cuestión verbal proveniente del test de Halpern


de la escala de resolución de problemas (solo reactivos figurativos).
Fuente: elaboración propia.

El coeficiente alfa global para la prueba muy bueno (0,843) para las cuestiones figu-

Evaluación de destrezas de pensamiento crítico: validación de instrumentos libres de cultura


retos de pensamiento ep6 obtuvo un valor rativas (a pesar de su reducido número) y un
aceptable (0,70), pero las cuatro escalas que valor menor de toda la escala, si se incluye la
miden las destrezas de pensamiento obtuvieron cuestión verbal del test de Halpern (0,545).
valores más diversificados. La destreza clasifi- Por tanto, las cuestiones figurativas aumentan
cación (figurativa) obtuvo un valor bueno de su la fiabilidad de las pruebas de pensamiento
fiabilidad (0,809) y la destreza comparación respecto a las cuestiones verbales.
(verbal) obtuvo el valor más bajo (0,185); las
El coeficiente de fiabilidad para la prueba

María-Antonia Manassero-Mas, Ángel Vázquez-Alonso


otras dos destrezas, comparación y resolu-
global retos de pensamiento eso2 no pudo
ción de problemas, obtuvieron valores inter-
calcularse por no satisfacer los requerimientos
medios, que podrían ser aceptables teniendo
estadísticos; las diversas escalas que miden
en cuenta, además, el pequeño número de
las cuatro destrezas de pensamiento obtuvie-
cuestiones que las forman (el estadístico alfa
ron también valores diversificados. Las cuestio-
depende críticamente del número de ítems que
nes figurativas de la destreza relaciones entre
conforman la variable).
las partes y el todo registraron un excelente
En el caso de la destreza resolución de pro- resultado de fiabilidad (0,938), mientras la
blemas, formada por una cuestión procedente destreza de toma de decisiones alcanza un
del test de Halpern (verbal) y otras cuestiones valor muy bajo; las otras destrezas, explica-
figurativas, se observó una gran diferencia de ción causal y secuenciación logran valores
comportamiento de ambos grupos de cuestio- intermedios.
nes. Realizando un cómputo del parámetro
TED

En conjunto, estos resultados acerca de


alfa para los dos grupos de cuestiones por
la fiabilidad de las pruebas y las escalas de
separado se obtuvo un valor de la fiabilidad
destrezas muestran que las cuestiones y esca-

27
las figurativas tienden a tener resultados de fiabilidad mejores que las escalas
verbales, representadas principalmente por las escalas del test de Cornell y la
cuestión verbal sobre una situación cotidiana de resolución de problemas, tomada
del test de Halpern, las cuales no superan el valor umbral usual (alfa > 0,70).

Análisis de ítems
Se han calculado los índices de facilidad (porcentaje de respuestas correctas) y
las correlaciones interítem, aunque en ambos casos no se exponen los resultados
empíricos totales por su excesiva extensión.
El análisis de la prueba ep6 detecta seis cuestiones muy fáciles (> 90 %) y
dos cuestiones muy difíciles (< 10 %); el análisis de la prueba eso2 detecta cinco
muy fáciles (> 90 %) y una muy difícil (< 10 %). Estas cuestiones muy fáciles y
muy difíciles serán sometidas a una revisión cuidadosa para considerar su exclu-
sión o reformulación en una futura prueba.
El análisis de las correlaciones interítems muestra la existencia de siete cues-
tiones en la prueba ep6 y siete en la eso2 que presentan un número relevante
de correlaciones negativas que indican una potencial disfunción estadística de
estas cuestiones. Aquellas con correlaciones negativas también serán revisadas
simultáneamente con su impacto en la fiabilidad de la prueba, para considerar
su exclusión o reformulación en una futura prueba más sólida, para cuya mejora
se ha realizado este estudio piloto.

Conclusiones
El objetivo de este estudio es validar empíricamente dos pruebas de evaluación
de destrezas de pensamiento crítico para estudiantes de sexto curso de educación
primaria (grado 6) y segundo curso educación secundaria obligatoria (grado 8),
que siguen un curso de aprendizaje basado en pensamiento en su colegio. Como
variables adicionales, que sirven como criterios de validación convergente, se
han considerado las calificaciones escolares finales medias de las asignaturas
del curso y la calificación específica de las actividades del programa de apren-
ISSN 2665-3184 impreso• ISSN 2323-0126 Web

dizaje basado en pensamiento otorgadas por el profesor. El pequeño tamaño


No 47 • Primer semestre de 2020 • pp. 15-32

de la muestra empleada en este pilotaje limita las técnicas de validación, pues


no pueden emplearse en este caso análisis factoriales y otros (por ejemplo, la
percentilación de puntuaciones de las escalas o el análisis de la validez factorial
de las destrezas de pensamiento).
Los resultados globales de este estudio piloto sobre las dos pruebas pensa-
miento crítico se pueden considerar positivos. En primer lugar, porque las corre-
laciones de las variables destrezas de pensamiento crítico con los criterios de
validación (notas medias y nota tbl) son positivas en todos los casos. Para la
prueba ep6 las correlaciones son positivas y próximas a la significación estadís-
tica, pero en la eso2 esas correlaciones no solamente son positivas, sino que son
muy altas y con una significación estadística alta. Cabe destacar el valor extraor-
TED

dinariamente alto de la correlación entre la variable global de pensamiento y la


nota tbl (0,775) logrado en la prueba eso2, que constituye un respaldo empí-

28
rico extraordinario como validación de criterio valor excepcional del resultado anterior. Desde
para la prueba (y también para el programa esta perspectiva, estos resultados constituyen
de aprendizaje tbl aplicado). un acicate no solo para mejorar psicométrica-
mente las pruebas, sino también para promo-
En segundo lugar, los resultados también
ver decididamente la evaluación de los efectos
son positivos porque la mayoría de los coefi-
de la enseñanza del pensamiento crítico. Para
cientes de fiabilidad obtenidos son positivos y
ello, se necesita disponer de instrumentos de
aceptables. La mitad de las cuestiones aplica-
evaluación del pensamiento, válidos y fiables,
das provenían de un instrumento estandarizado
cuya aplicación logre evaluaciones cuantitati-
construido hace años (test de Cornell, Nicoma,
vas, empíricas y estandarizadas que aporten
una cuestión del test de Halpern y otras); el
datos de los efectos positivos y beneficiosos,
resto son cuestiones de elaboración propia
un aspecto vivamente abandonado de la inves-
de tipo figurativo, para hacer las pruebas aún
tigación del pensamiento crítico (Saiz, 2017).
más libres de cultura. Pues bien, la tendencia
observada en los índices de fiabilidad de las La estandarización de estos instrumentos
distintas destrezas es que las cuestiones figu- de evaluación del pensamiento permite tam-
rativas tienden a presentar índices de fiabili- bién convertirlos en herramientas de evaluación
dad buenos (0,479 a 0,938) y mejores que funcionales, a disposición del profesorado que
las cuestiones verbales, resultado que apoya enseña pensamiento crítico, para facilitar la
una mejora de las pruebas, con énfasis en la evaluación educativa de las destrezas del pen-
inclusión de cuestiones figurativas. samiento adquiridas por los estudiantes como
también desarrollan otros autores (Gómez,
Estos resultados también constituyen un
Jiménez, De las Heras y Vázquez, 2018).
respaldo empírico importante para el propio
curso de enseñanza por el proyecto de apren- En resumen, este estudio presenta la vali-
dizaje basado en pensamiento (tbl) aplicado dación piloto (tentativa) de instrumentos de

Evaluación de destrezas de pensamiento crítico: validación de instrumentos libres de cultura


en el colegio (Swartz et ál., 2013): la correla- medida de destrezas de pensamiento crítico
ción entre la nota tbl otorgada por el profesor con estudiantes adolescentes (12-14 años),
del curso eso2 y las puntuaciones alcanzadas compuestos por reactivos tomados de pruebas
en la prueba de pensamiento por los estu- consolidadas (Cornell y Halpern) y otros reacti-
diantes es casi perfecta para una muestra tan vos figurativos, de nuevo diseño, como primera
pequeña, y en ep6, la correlación es positiva y etapa para continuar su mejora en desarrollos
próxima a la significación estadística. El resul- futuros, y que demuestra la significativa rela-

María-Antonia Manassero-Mas, Ángel Vázquez-Alonso


tado excepcional de la prueba eso2 implica ción entre pensamiento crítico y aprendizaje
que las varianzas de ambas medidas son escolar. El estudio innova hacia un enfoque
prácticamente idénticas y, en consecuencia, de instrumentos independientes de la cultura
ambas medidas se realimentan en su validez: y de los currículos escolares, y además, flexi-
los resultados del curso apoyan la validez de bles, es decir, susceptibles de diseñarse a la
la prueba y la prueba apoya la eficacia del medida, para satisfacer necesidades prácticas
curso. Este resultado es valioso porque identi- concretas, como adaptarse a las destrezas del
fica empíricamente efectos concretos y apoya programa de enseñanza, el curso o la edad
la enseñanza del pensamiento, conforme pro- de los estudiantes.
pone Saiz (2017).
Como se ha expuesto, la mayoría de pro- Agradecimientos
gramas de enseñanza del pensamiento, que
se aplican desde hace décadas en distintas Proyecto edu2015-64642-R (aei/feder, ue) finan-
TED

instituciones educativas, tienen pocos datos ciado por la Agencia Estatal de Investigación
que valoren sus efectos concretos y específi- (aei) de España y el Fondo Europeo de Desa-
cos, circunstancia que realza todavía más el rrollo Regional (feder).
29
Referencias
Bailin, S., Case, R., Coombs, J.R. y Daniels, L.B. (1999). Conceptualizing critical
thinking. Journal of Curriculum Studies, 31, 285-302.
Colom, R., García Moriyón, F., Magro, C. y Morilla, E. (2014). The Long-term Impact
of Philosophy for Children: A Longitudinal Study (Preliminary Results). Analytic Tea-
ching and Philosophical Praxis, 35, 50-55.
Ennis, R.H. y Millman, J. (2005). Cornell Critical Thinking Test Level X. Seaside, CA:
The Critical Thinking Company.
Ennis, R.H. (2019). Long definition of critical thinking. CriticalThinking.net. Recupe-
rado de http://criticalthinking.net/definition/long-definition-of-critical-thinking/
Fisher, A. (2009). Critical Thinking. An Introduction. Cambridge: Cambridge Uni-
versity Press.
Follmann, D., Mattos, K.R.C. y Güllich, R.I. da C. (2018). Estratégias de Ensino de
Ciências e a Promoção de Pensamento Crítico em Portugal. Tecné, Episteme y
Didaxis, ted, (número extraordinario). https://revistas.pedagogica.edu.co/index.
php/TED/article/view/8789
Gómez Pérez, J.E., Jiménez Pérez, R., De las Heras Pérez, Ángeles, M. y Vázquez
Bernal, B. (2018). Avance de investigación: Validación de un cuestionario para
medir el nivel de autorregulación en el tratamiento de cuestiones sociocientíficas
en un aula de clase de séptimo grado. Tecné, Episteme y Didaxis: ted, (número
extraordinario). https://revistas.pedagogica.edu.co/index.php/TED/article/
view/8862
Halpern, D.F. (2010). Halpern Critical Thinking Assessment. Vienna: Schuhfried.
http://www.schuhfried.com/vienna-test-system-vts/all-tests-from-a-z/test/
hcta-halpern-critical-thinking-assessment-1/
Madison, J. (2004). James Madison Critical Thinking Course. Seaside, CA: The Cri-
tical Thinking Co. https://www.criticalthinking.com/james-madison-critical-thin-
king-course.html
ISSN 2665-3184 impreso• ISSN 2323-0126 Web

Manassero-Mas, M.A. y Vázquez-Alonso, A (2019, en prensa). Taxonomía de las


No 47 • Primer semestre de 2020 • pp. 15-32

destrezas de pensamiento: una herramienta clave para la alfabetización cien-


tífica. En M.D. Maciel y E. Albrecht (org.), Ciência, Tecnologia & Sociedade:
Ensino, Pesquisa e Formação (pp. 17-37). São Paulo: Terracota.
Paul, R. y Nosich, G.M. (2019). A Model for the National Assessment of Higher
Order Thinking. CrtitcalThinking.org. http://www.criticalthinking.org/
pages/a-model-for-the-national-assessment-of-higher-order-thinking/591
Phan, H.P. (2010). Critical thinking as a self-regulatory process component in teaching
and learning. Psicothema, 22, 284-292.
TED

30
Rivas, S.F. y Saiz, C. (2012). Validación y pro- Walton, D. y Macagno F. (2015). A Classifi-
piedades psicométricas de la prueba de pen- cation System for Argumentation Schemes.
samiento crítico Pencrisal. Revista Electrónica Argument and Computation, 6(3), 214-249.
de Metodología Aplicada, 17, 18-34.
Watson, G. y Glaser, E.M. (2002). Watson-Gla-
Saiz, C. (2017). Pensamiento crítico y cambio. ser Critical Thinking Appraisal-II Form E. Lon-
Madrid: Pirámide. dres: Pearson.
Swartz, R.J., Costa, A.L., Beyer, B.K., Reagan R.
y Kallick, B. (2013). El aprendizaje basado Para citar este artículo
en el pensamiento. Madrid: sm.
Manassero-Mas, M.A. y Vázquez-Alonso, A.
Vázquez-Alonso, A. y Manassero-Mas, M.A. (2020). Evaluación de destrezas de pen-
(2018). Pensamiento científico y pensa- samiento crítico: Validación de instrumentos
miento crítico: dos caras de la misma libres de cultura. Revista Tecné, Episteme
moneda para la educación científica. Comu- y Didaxis: ted, (47), 15-32. https://doi.
nicación presentada en el IV Simposio Inter- org/10.17227/ted.num47-9801
nacional de Enseñanza de las Ciencias,
Vigo, España. http://congresos.educacio-
neditora.net/index.php/SIEC/SIEC2018/
paper/view/219

Evaluación de destrezas de pensamiento crítico: validación de instrumentos libres de cultura


María-Antonia Manassero-Mas, Ángel Vázquez-Alonso
TED

31
Anexo
Textos de dos reactivos de muestra de las pruebas; el primero, tomado del test
de Cornell (Nicoma) es verbal, y el segundo, tomado de la destreza secuencia-
ción, es figurativo.
66. “Los exploradores no pueden escapar debido a que no pueden derribar las
paredes de la cabaña de piedra.”
¿Cuál de las siguientes afirmaciones probablemente se da por supuesta?
a. Los exploradores pueden saltar por la ventana.
b. Los centinelas están alerta.
c. Todos los medios de escape son imposibles, excepto a través de las paredes.
Las figuras siguientes están construidas con unidades cuadradas y forman una
secuencia regular de la cual se muestran las tres primeras etapas.
La etapa 3 de la secuencia está formada por nueve unidades cuadradas, de las
cuales cinco están sombreadas y cuatro son blancas (sin sombra).

Etapa 1 Etapa 2 Etapa 3

Completa los números correspondientes a la etapa cuatro:


• Número de unidades cuadradas sombreadas
ISSN 2665-3184 impreso• ISSN 2323-0126 Web

correspondientes a la etapa cuatro: _____


No 47 • Primer semestre de 2020 • pp. 15-32

• Número de unidades cuadradas blancas


correspondientes a la etapa cuatro: _____
• ¿Cuántas unidades cuadradas sombreadas tendrá
la figura de la etapa número once? _____
• ¿Cuántas unidades cuadradas blancas tendrá
la figura de la etapa número once?
• ¿Cuántas unidades cuadradas sombreadas tendrá
la figura de la etapa número catorce?
TED

32

También podría gustarte