Proyecto Final

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 11

Portafolio de

trabajo rumbo
al examen final.

Nombre: Naidelyn Guadalupe Alarcón


Salazar
Matrícula: 460301914
Materia: Diseño y validación de
instrumentos de medición.
Profesor: Oscar Ramón López Carrillo
Campus: Zapopan
Fecha de entrega: 05/12/2022
Marco histórico.
La historia de la medición en psicología se ha caracterizado por la relación entre el
desarrollo interno de la psicometría y la psicología y el deseo de responder a las
necesidades de las personas de cada período histórico, lo que muestra un gran énfasis en
herramientas más prácticas para el desarrollo de la teoría.

Los estudios de diferencias individuales han llevado al desarrollo de diferentes pruebas y


teorías que han permitido aportar más datos para analizar estudios y medir estudios
experimentales.

Se consideran tres factores decisivos en el desarrollo de los test


-La apertura del laboratorio antropométrico de Galton en Londres
-El desarrollo de la correlación de Pearson y
-La interpretación que Spearman hace de ella, considerando que las correlaciones
entre dos variables indica que ambas tienen un factor común.

Francis Galton se interesó en las bases hereditarias de las inteligencias y en la medición


de habilidades humanas, con esto elaboró una serie de pruebas sensorio-motrices y diseñó
técnicas para investigar las diferencias individuales en cuanto aptitudes y temperamento.
Entre sus contribuciones metodológicas destaca la técnica de correlaciones, que sigue
siendo un método actual para analizar calificaciones de pruebas.

James McKeen Cattell (1860-1944) sería el primero en utilizar el término "análisis


psicológico", pero sus experimentos, como los de Dalton, eran instintivos y el análisis de
los datos mostraba que no había relación entre ellos. este tipo de prueba y el estado mental
de los sujetos. Es Binet quien ofrece un gran cambio en la filosofía de los experimentos,
para llevar a su nivel los trabajos de otros saberes, que pretenden examinar cosas como el
juicio, etc.

En 1904 Alfred Binet y Théodore Simon construyeron una prueba, para ser administrada
individual mente, que consistía en 30 problemas que aumentaban su dificultad conforme
avanzaban, los problemas de esta primera prueba de inteligencia práctica pusieron énfasis
en la habilidad para juzgar, comprender y razonar. Se publicó Por Primera Vez en 1905. En
1908 se publicó esta prueba revisada y su contenido entonces contenía una gran cantidad
de subpruebas Clasificadas por niveles de edad, de los 3 a los 13 años. En este periodo se
introdujo el concepto de edad mental como una forma de cuantificar el desempeño general
de una persona en la prueba. La prueba se amplió en 1911 hasta la edad adulta.

Catell trabajó con Wundt, con quien compartió el interés por los fenómenos perceptivos y
sensomotores, y el rigor en el control de las condiciones en que se realizaban las
observaciones, pero de quién se distanció ante el despreció del experimentalista alemán
por las diferencias individuales. Más tarde trabajo con Galton e inició en Estados Unidos el
estudio de las diferencias individuales. Acuñó el término "test mental" en un artículo
publicado en 1890 en la revista Mind bajo el título “Mental test and measurements”. Asumió
la idea de Galton sobre la posibilidad de medir las funciones intelectuales por medio de test
de discriminación sensorial y tiempo de reacción. Sin embargo, los primeros estudios que
se realizaron para evaluar este tipo de test ofrecieron resultados desalentadores: el
"rendimiento intelectual" mostraba poca correspondencia de unos test a otros y
prácticamente ninguna relación con estimaciones independientes del nivel intelectual
realizadas por los profesores. Por el contrario, Ebbinghaus, que ya mostraba un cambio de
comportamiento, encontró una clara correspondencia entre el rendimiento académico de
los niños y la prueba de completar oraciones.

Binet recibió en 1904 el encargo del ministerio francés de instrucción pública de elaborar
un instrumento de medida capaz de diferenciar entre los niños "educables" y los que no
podrían beneficiarse de la educación normal. Junto con su colaborador Simon presentó en
1905 la primera versión del test Binet-Simon. El test estaba formado por 30 problemas o
tareas dispuestos en orden de dificultad creciente, que medían la capacidad de juicio,
razonamiento y comprensión. Para determinar el nivel de dificultad, los problemas habían
sido administrados a 50 niños de entre 3 y 11 años más a algún niño retrasado. La segunda
versión del test editada en 1908 incluía un número mayor de ítems junto con la eliminación
de algunos que se habían considerado podían reflejar diferencias en función de la
extracción social de los niños, además aparecían ya agrupados por niveles de edad. Binet
eligió la palabra "estado mental" frente a la palabra "edad mental" preferida por las
sucesivas versiones de la medida, ya que la primera palabra se liberaba de los cambios de
significado de la segunda. Poco después de la publicación, el análisis de Binet y Simon fue
traducido a diferentes idiomas y utilizado en diferentes países, mostrando aceptación
pública.
En 1916 Lewis Terman publica la Escala de Inteligencia de Stanford-Binet.
En 1917 Los exámenes Alfa y Beta del ejército, los primeros test de inteligencia colectivos
son elaborados y administrados a los reclutas estadunidenses.
En 1926 se aplica por primera vez la Prueba de Amplitud Académica para evaluar a los
aspirantes a ingresar a la universidad.
En 1927 se publica la primera edición del Formulario de Intereses Vocacionales para
Varones, de Strong, así como las Pruebas de Inteligencia de Khlmann-Anderson.
En 1936 Los Exámenes de Registro de Graduados se usa por primera vez para seleccionar
a los aspirantes a ingresar a la escuela de posgrado.
En 1937 Se publica la revisión de la Escala de Inteligencia de Stanford-Binet
En 1938 Henry Murray publica Explorations in Personality. Buros publica el primer Mental
Measurements Yearbook.
En 1939 se publica la Escala de inteligencia Wachsler-Bellevue.
En 1942 Se publica el inventario Multifásico de Personalidad de Minnesota.
En 1949 Se realiza la publicación de la Escala de Inteligencia de Wechsler para Niños.
En 1960 se publica la Forma L-M de la escala de inteligencia de Standford-Binet
De 1970 al 2002 Se incrementa el uso de las computadoras para diseñar, administrar,
calificar, analizar e interpretar pruebas.
Tipos de calificación

Pruebas de ensayo: La calificación puede hacerse en base a la calidad de respuesta


de este, el procedimiento deberá ser estructurado y objetivo, de tal forma que las
calificaciones dependan menos de factores ajenos al contenido y más del nivel de
conocimiento.
Ejemplo: En una prueba por ensayo se asignará un tema, con ciertos criterios de
calificación, por cada criterio realizado correctamente se asignará un punto, con un
máximo de 10 puntos por todos los criterios cumplidos.

Pruebas objetivas: La calificación de pruebas objetivas es rápida y precisa mediante


una plantilla o máquina, de modo en el que es posible regresar las pruebas a los que
aplican la prueba cuando aún tienen en mente el material visto en ellas.
Ejemplo: Se realizó un examen de opción múltiple, al finalizar el examen se da
retroalimentación haciendo que entre los alumnos califiquen los exámenes con las
respuestas correctas.

Pruebas orales: Es más probable cometer errores en las calificaciones de pruebas


orales en comparación de las calificaciones escritas, hay formas especiales de
evaluar el desempeño que mejoran la objetividad de la calificación, como prestar
atención al diseño y estructura de las preguntas, es recomendable elaborar modelos
de respuestas a las preguntas que se administrarán.
Ejemplo: En el examen de historia se realizó una evaluación oral, donde se harán
preguntas abiertas sobre los temas vistos en clase, donde el criterio de evaluación
se basa en si el candidato no alcanza los requisitos de las descripciones, y la
comunicación oral es demasiado corta o no se puede entender, o es irrelevante, la
puntuación de la pregunta debe ser 0.
Calificaciones modificadas: usualmente no vale la pena alterar las calificaciones,
pero a menudo que esto se presenta se modifican de manera que resulten más
significativas.
Ejemplo: En el examen oral, un alumno contestó la pregunta de manera muy
concreta, el maestro le pidió que profundizará su respuesta y modificó su calificación.

Rango

El rango de un procedimiento analítico es el intervalo entre la concentración superior


e inferior (cantidades) de analito en la muestra (incluyendo estas concentraciones)
para el cual se ha demostrado que el procedimiento analítico posee un nivel
adecuado de precisión, exactitud y linealidad.
Caso: Se realizó una encuesta a los estudiantes de UVM, más concretamente 230
alumnos, de diferentes carreras. En la encuesta se les preguntó cual era su primera
opción de universidad, teniendo en cuenta que ahora estudian en UVM. Tras
recopilar datos en la encuesta, se obtuvo que 120 dijeron UdeG, mientras que 110
mencionaron que querían ir a la UNAM.
Para sacar el rango de este caso, es necesario sacar la diferencia de las respuestas
dadas, por lo que a 120 debemos restarle 110. Lo que nos da un rango de: 10

Tipos de normas

-Normas por edad: Se extraen eligiendo una muestra normativa a partir de la que
extraemos del promedio de actuación típico en las diferentes edades.
Ejemplo: en una prueba psicométrica que mide la inteligencia de un niño de 10 años,
el resultado de la prueba puede o no asemejarse a un niño de 6 años, en dicho caso
que se asemeje, mostraría problemas de aprendizaje.

-Por grupo: normas diseñadas de manera específica para servir como referencia en
el contexto del grupo al que pertenece el sujeto a prueba quien alcanzó una
puntuación particular.
Ejemplo: Estudiantes de psicología van de casa en casa realizando el inventario de
Beck para medir los niveles de ansiedad y depresión en las colonias más
vulnerables.

-Por género: son normas sociales que definen acciones aceptables y apropiadas
para mujeres y hombres en un contexto social determinado. Estas normas dan forma
al acceso (a menudo desigual) de mujeres y hombres a los recursos y libertades,
afectando así su voz, poder y sentido de sí mismos.
Ejemplo: Se espera que los hombres sean estoicos, duros y sin emociones. Se
espera que las mujeres estén conectadas, sean sumisas y respetuosas.

Tipos de confiabilidad

-Mitades: Incluye la aplicación de la prueba a una muestra apropiada; luego,


subdividiendo los ítems en dos mitades (una es par y la otra es impar; o,
asignándolos aleatoriamente a un grupo y al otro) para finalmente calcular el
coeficiente de correlación entre dos conjuntos de valores. El contenido de los
elementos debe controlarse cuando se utiliza el proceso semipar e impar, ya que
esta forma de numeración puede haber sido elegida para medir elementos de diversa
dificultad clasificados en orden ascendente.
Ejemplo: Una prueba que tiene preguntas tanto pares como impares, estas dos
mitades son administradas a una misma persona, se tiene que encontrar la
correlación entre ambas mitades, mientras más relación se encuentre, más fiable
será la prueba.

-Temporal: implica que un instrumento aplicado en 2 momentos distintos al mismo


sujeto debe arrojar el mismo resultado, la correlación entre mediciones debe ser alta.
Ejemplo: Se le aplica una prueba de memoria a un niño de 12 años, donde se le
muestra una serie de figuras que tiene que dibujar en ese momento, después de 15
minutos se le pide que vuelva a dibujar las figuras a lo que recuerde, los resultados
deberían ser iguales o por lo menos no variar mucho.
-Alternas: Plantea que la confiabilidad de la escala es el producto de la correlación
entre dos medidas paralelas de las escalas en los mismos sujetos.
Ejemplo: Un cuestionario tiene dos versiones con diferentes números de reactivos,
para mayor confiabilidad se puede aplicar primero una versión y después la otra,
para así ver si los resultados de ambas aplicaciones son parecidos entre sí.

-Interna: Se refiere específicamente a la consistencia de que todos los elementos de


la prueba miden el mismo atributo. Las personas con el mismo nivel de estructura
medido recibirán igual número de puntos. Si la prueba es altamente confiable, se
dice que es una prueba de homogeneidad. En general, la homogeneidad disminuye
cuando un mismo ítem recibe diferentes respuestas de los sujetos a los que se les
aplica el test, o cuando los ítems no hacen referencia a la misma característica o
atributo que queremos medir, o más, cuando un incontrolable o controlable se
produce un error. Si estos factores funcionan, es difícil interpretar los resultados
obtenidos.
Ejemplo: En una prueba tiene diferentes aspectos a ser evaluados, cada aspecto
se divide en un numero de subpruebas que miden lo mismo de forma diferente para
poder sacar varios resultados que no deberían variar tanto ya que operan sobre un
mismo constructo.

Tipos de validez.
• Aparente: es la apariencia de validez que puede dar un instrumento a quien
lo mire, sin ningún tipo de análisis. Hace referencia al grado en que un test
aparenta valorar un terminado atributo.

• De contenido: Se refiere a la medida en que la herramienta de medición


representa el contenido que pretende medir. Es equivalente a cuán
representativa es una muestra en comparación con el universo del que
proviene. Entonces, por ejemplo, si una prueba está diseñada para evaluar
los resultados de aprendizaje en un tema determinado, los ítems de la prueba
deben ser representativos, en términos de tipo y proporción, de cada tema
tratado mencionado en clase.

• De criterio: Establece la validez de un instrumento de edición al comparar sus


resultados con los de algún criterio externo que pretende medir lo mismo.
Supongamos que Alejandra trata de “medir” el grado en que es aceptada por
Gael; entonces decide que va a tomarlo de la mano y observará su reacción.
Supuestamente si el no retira la mano esto indicaría cierta aceptación. Este
criterio es un estándar con el que se juzga la validez del instrumento. Cuanto
más se relacionen los resultados del instrumento de medición con el criterio,
la valides del criterio será mayor.
Bibliografía
-Briones, G. & TRILLAS, EDITORIAL. (2008). Métodos Y Técnicas De Investigación Para
Ciencias Sociales (4.a ed.). Trillas.
-Cohen, R. J., Schneider, J. W. & Tobin, R. (2021). Looseleaf para pruebas y evaluación
psicológicas (10.a ed.). McGraw-Hill Education.
-Hernández, R., Fernández, C. & Baptista, P. (2022). Metodología De La Investigación (5.a
ed.). MCGRAW HILL EDUCATION.
-Graf, A. J. (1999). Métodos de investigación en psicología. Síntesis.
-Coolican, H. (2005). Métodos de investigación y estadística en psicología (2.a ed.). Editorial
El Manual Moderno.
-Arnau, J. & Balluerka, N. (2002). Diseños de investigación experimental en psicología (1.a
ed.). Pearson Educación.
-Clark, C. D. (2003). Investigación Cuantitativa En Psicología. Oxford University Press.
-O′Donohue, W. T. & Ferguson, K. E. (2003). Handbook of Professional Ethics for
Psychologists: Issues, Questions, and Controversies (Primero.). Sage Publications, Inc.
-FERNÁNDEZ-BALLESTEROS, R. (1998). INTRODUCCIÓN A LA EVALUACIÓN
PSICOLÓGICA I (1a. ed., 1a. reimp.). MADRID: PIRÁMIDE.
-Sáiz, M. (2009). Historia de la psicología (1.a ed.). Barcelona: Editorial UOC.
-Kaplan, R. M. (2007). PRUEBAS PSICOLÓGICAS: PRINCIPIOS, APLICACIONES Y
TEMAS (6.a ed.). EDICIONES PARANINFO.

También podría gustarte