Validez y Confiabilidad - DR Yache
Validez y Confiabilidad - DR Yache
Validez y Confiabilidad - DR Yache
INVESTIGACIÓN
VALIDÉZ Y CONFIABILIDAD
Docente:
Dr. Eduardo Yache
RECOLECCIÓN DE DATOS
EL PLAN IMPLICA:
a)La identificación de las fuentes de donde se obtendrán los datos: Estos
van a ser proporcionados por personas, se producirán de observaciones
o se encuentran en documentos, archivos, bases de datos, etc.
b)La localización de las fuentes: Es la muestra seleccionada,
indispensable para definir con precisión donde están localizados.
c)Los medios o métodos de recolección de datos: Implica elegir uno o
varios medios y definir los procedimientos que se utilizarán en la
recolección de los datos. El método o métodos deben ser confiables,
válidos y objetivos.
d) La preparación y presentación de los datos recolectados: Para su
análisis y utilización en responder el problema planteado.
LA MEDICIÓN
Medir significa "asignar números, símbolos o valores a las
propiedades de objetos o eventos de acuerdo con reglas”.
INSTRUMENTO DE MEDICIÓN
LA VALIDEZ
La validez, en términos generales, se refiere al grado
en que un instrumento realmente mide la variable
que pretende medir.
Por ejemplo, un instrumento válido para medir la
inteligencia y no la memoria.
INSTRUMENTO DE MEDICIÓN
La Confiabilidad
Se refiere al grado en que su aplicación
repetida al mismo sujeto u objeto produce
iguales resultados.
Grado en el que un instrumento produce
resultados consistentes y coherentes.
INSTRUMENTO DE MEDICIÓN
1. VALIDÉZ DE CONTENIDO:
La validez de contenido se refiere al grado en que
un instrumento refleja un dominio específico de
contenido de lo que se mide.
Es el grado en que la medición representa al
concepto o variable medida (Bohrnstedt, 1976).
Es el grado en que los ítems que constituyen el
instrumento tienen el dominio del contenido que
se mide (Nunnally, 1973).
Dominio de contenido de la variable
LL RR ÑÑ
EE AA
AA
NN M M M M
AA ZZ ZZ
UU GG GG
LL RR ÑÑ
EE AA AA
NN MM MM LL EE
AA ZZ ZZ
UU GG GG
9
VALIDÉZ DE CONTENIDO
1. VALIDÉZ DE CONTENIDO:
Criterios de validación:
a) Redacción. Interpretación unívoca del enunciado de la pregunta
para lograr con claridad y precisión el uso del vocabulario técnico.
b) Pertinencia. Es útil y adecuado al avance de la ciencia y la
tecnología.
c) Coherencia o congruencia. Existe una organización lógica en base a
la relación estrecha entre: la variable y la dimensión; la dimensión y
el indicador; el indicador y el ítems; el ítems y la opción de
respuesta con los objetivos a lograr.
d) Adecuación. Correspondencia entre el contenido de cada pregunta
y el nivel de preparación o desempeño del entrevistado.
e) Comprensión. Se alcanza un entendimiento global de las preguntas.
VALIDÉZ DE CONTENIDO
1. VALIDÉZ DE CONTENIDO:
A. Prueba de V de Aiken (1985). Es un coeficiente que se
computa como la razón de un dato obtenido sobre la suma
máxima de la diferencia de los valores posibles. Puede ser
calculado sobre las valoraciones de un conjunto de jueces
con relación a un ítem o como valoraciones de un juez
respecto a un grupo de ítems.
Asimismo las valoraciones asignadas pueden ser
DICOTOMICAS o POLITOMICAS.
VALIDÉZ DE CONTENIDO
1. VALIDÉZ DE CONTENIDO:
Prueba de V de Aiken (1985). Es el más adecuado para
determinar este tipo de validez, ya que permite obtener
valores factibles de ser contrastados estadísticamente, se
recomienda por lo menos 5 jueces.
S
V
n c 1
Donde:
n = Número de jueces
c = Número de valores en la escala de medición
S = Sumatoria de si.
si = Valor asignado por el juez i.
VALIDÉZ DE CONTENIDO
1. VALIDÉZ DE CONTENIDO:
Prueba de V de Aiken (1985): Ítem bueno (se acepta) = 1
Ítem deficiente (se rechaza) = 0
JUECES V
ÍTEMS Criterios Acuerdos Decisión
1 2 3 4 5 6 7 8 9 10 Aiken
Redacción 1 0 1 1 1 1 1 1 1 1 9 0.90 Si
Pertinencia 1 1 1 1 1 1 1 1 1 1 10 1.00 Si
Ítem
Coherencia 1 1 1 1 1 1 0 1 1 1 9 0.90 Si
1
Adecuación 0 1 1 1 1 1 1 1 0 1 8 0.80 Si
Comprensión 1 1 1 1 1 1 1 1 1 1 10 1.00 Si
Redacción 1 1 1 1 0 1 1 1 1 1 9 0.90 Si
Pertinencia 1 1 1 1 1 1 0 1 1 1 9 0.90 Si
Ítem
Coherencia 1 1 1 1 1 1 0 1 1 1 9 0.90 Si
2
Adecuación 1 1 1 0 0 1 1 1 0 1 7 0.70 No
Comprensión 1 1 1 1 1 0 1 1 1 1 9 0.90 Si
Redacción 1 0 1 0 0 1 1 0 1 0 5 0.50 No
Pertinencia 1 1 1 1 1 1 0 1 1 1 9 0.90 Si
Ítem
Coherencia 1 0 1 1 0 1 0 1 0 1 6 0.60 No
3
Adecuación 0 1 0 1 0 1 1 0 1 1 6 0.60 No
Comprensión 1 1 1 1 1 0 1 1 1 1 9 0.90 Si
VALIDÉZ DE CONTENIDO
1. VALIDÉZ DE CONTENIDO: Prueba de V de Aiken (1985):
VALIDÉZ DE CONTENIDO
1. VALIDÉZ DE CONTENIDO:
B. Prueba de Lawshe (1975).
Es el juicio concerniente al grado de acuerdo entre un
grupo de expertos que determina la validez de contenido
del instrumento construido por los autores.
Para cada ítem, se anota el número de expertos que afirman
que el ÍTEM SI ES ESENCIAL; si más de la mitad de los
expertos indican que un ítem es esencial, entonces ese
ítem tiene al menos alguna validez de contenido.
VALIDÉZ DE CONTENIDO
1. VALIDÉZ DE CONTENIDO:
B. Prueba de Lawshe (1975).
Fórmula de razón de validéz de contenido:
N
n
CVR 2
N
2
Donde:
n: Número de expertos que afirman que el ítem si es esencial.
N: Número total de expertos.
VALIDÉZ DE CONTENIDO
1 2 3 4 5 TOTAL
ítem CVR
SI NO SI NO SI NO SI NO SI NO SI NO
1. VALIDÉZ DE I1.1 x x x x x 5 0 1
CONTENIDO I1.2 x x x x x 5 0 1
: I1.3 x x x x x 5 0 1
B. Prueba de Lawshe I2.1
I2.2
x
x
x
x
x
x
x
x
x
x
5
5
0
0
1
1
(1975). I2.3 x x x x x 5 0 1
I2.4 x x x x x 5 0 1
• Según Herrera (1998) I2.5 x x x x x 5 0 1
• 0,53 a menos Validez nula I2.6 x x x x x 5 0 1
I3.1 x x x x x 5 0 1
• 0,54 a 0,59 Validez baja
I3.2 x x x x x 5 0 1
• 0,60 a 0,65 Válida I3.3 x x x x x 5 0 1
• 0,66 a 0,71 Muy válida I3.4 x x x x x 5 0 1
• 0,72 a 0,99 Excelente validez I4.1 x x x x x 5 0 1
I4.2 x x x x x 5 0 1
• 1.0 Validez perfecta
I4.3 x x x x x 5 0 1
I4.4 x x x x x 5 0 1
I5.1 x x x x x 5 0 1
I5.2 x x x x x 5 0 1
I5.3 x x x x x 5 0 1
VALIDÉZ DE CRITERIO
2. Evidencia relacionada con el criterio
La validez de criterio establece la validez de un
instrumento de medición al compararla con algún
criterio externo que pretende medir lo mismo.
Este criterio es un estándar con el que se juzga la validez
del instrumento (Wiersma & Jurs, 2005). Cuanto más se
relacionen los resultados del instrumento de medición
con el criterio, la validez de criterio será mayor.
El principio de la validez de criterio es sencillo: si
diferentes instrumentos o criterios miden el mismo
concepto o variable, deben arrojar resultados similares.
VALIDÉZ DE CRITERIO
2. Evidencia relacionada con el criterio
La pregunta que se responde con la validez de criterio es: ¿en
qué grado el instrumento comparado con otros criterios
externos mide lo mismo?, o ¿qué tan cercanamente las
puntuaciones del instrumento se relacionan con otro (s)
resultado (s) sobre el mismo concepto?.
Se determina comparando los resultados obtenidos con los
instrumentos diseñados por el investigador con los
resultados estandarizados de otras pruebas consideradas
óptimas (a un patrón de medida o criterio externo).
Ejemplo: En un estudio de la variable «Desempeño docente»,
se ha estandarizado un instrumento, donde se ha obtenido
resultados fidedignos al 100%.
VALIDÉZ DE CONSTRUCTO
3. Evidencia relacionada con el constructo
La validación de un constructo está vinculado con la
teoría. No es conveniente llevar a cabo tal validación, a
menos que exista un marco teórico que soporte la
variable en relación con otras variables.
Es necesario investigaciones que hayan demostrado que
los conceptos se relacionan. Cuanto más elaborada y
comprobada se encuentre la teoría que apoya la
hipótesis, la validación del constructo arrojará mayor luz
sobre la validez general del instrumento de medición.
VALIDÉZ DE CONSTRUCTO
Presentación gráfica de un instrumento con
validez de constructo. (Hernández, 2006)
Teoría
(Investigaciones hechas ) encontraron que A se relaciona
positivamente con B, C y D. Y negativamente con W.
Si el instrumento mide A, sus resultados deben relacionarse
positivamente con los obtenidos en las mediciones de B, C y D; y
relacionarse negativamente con los resultados de W.
VALIDÉZ DE CONSTRUCTO
TÉCNICA ANALISIS FACTORIAL
El Análisis Factorial es una técnica estadística
multivariante cuya finalidad es analizar las relaciones de
interdependencia existentes entre un conjunto de
variables, calculando un conjunto de variables latentes,
denominadas factores, que explican con un número
menor de dimensiones, dichas relaciones. Por este
motivo, el Análisis Factorial es una técnica de reducción
de datos con un número menor de variables sin
distorsionar dicha información, lo que aumenta el grado
de manejo e interpretación de la misma.
VALIDÉZ DE CONSTRUCTO
Utilizando el SPSS…
VALIDÉZ DE CONSTRUCTO
Utilizando el SPSS…
VALIDÉZ DE CONSTRUCTO
Utilizando el SPSS…
VALIDÉZ DE CONSTRUCTO
Utilizando el SPSS…
VALIDÉZ DE CONSTRUCTO
Utilizando el SPSS…
VALIDÉZ DE CONSTRUCTO
Utilizando el SPSS…
VALIDÉZ DE CONSTRUCTO
Utilizando el SPSS…
VALIDÉZ DE CONSTRUCTO
Utilizando el SPSS…
VALIDÉZ DE CONSTRUCTO
Utilizando el SPSS…
VALIDÉZ DE CONSTRUCTO
Utilizando el SPSS…
VALIDÉZ DE CONSTRUCTO
Utilizando el SPSS…
VALIDÉZ DE CONSTRUCTO
Utilizando el SPSS…
VALIDÉZ DE CONSTRUCTO
Utilizando el SPSS…
https://www.youtube.com/watch?v=RpU1k5LDigk
INSTRUMENTO DE MEDICIÓN
LA VALIDEZ TOTAL
LA CONFIABILIDAD
La confiabilidad de un instrumento de medición se
refiere al grado en que su aplicación repetida al
mismo sujeto u objeto produce iguales resultados.
Cuando los resultados no son coherentes, no se
puede "confiar" en un instrumento.
Grado en el que un instrumento produce resultados
consistentes y coherentes.
INSTRUMENTO DE MEDICIÓN
LA CONFIABILIDAD
a) Confiabilidad test-retest.
El método más obvio para hallar la confiabilidad de un
test consiste en repetirlo en una segunda ocasión. En
este procedimiento un mismo instrumento de medición
(o ítems o indicadores) es aplicado dos o más veces a un
mismo grupo de personas, después de un período de
tiempo. Si la correlación entre los resultados de las
diferentes aplicaciones es altamente positiva, el
instrumento se considera confiable.
INSTRUMENTO DE MEDICIÓN
LA CONFIABILIDAD
a) Confiabilidad test-retest.
Ejemplo: Se examina a un grupo de 23 estudiantes mediante
una prueba objetiva de selección múltiple y luego de
transcurrido cinco días se toma el mismo examen al mismo
grupo.
Los resultados obtenidos antes y después (test – retest) son los
siguientes:
Antes: 65, 65, 68, 72, 60, 64, 68, 51, 73, 63, 50, 62, 54, 69, 58, 60,
70, 64, 62, 70, 66, 67, 79
Después: 64, 66, 64, 70, 61, 65, 70, 50, 72, 64, 51, 61, 54, 70, 60,
58, 69, 65, 60, 70, 68, 69, 80.
INSTRUMENTO DE MEDICIÓN
CONFIABILIDAD TEST RETEST
Diferencias al
N° Antes Puntuación Después Puntuación Diferencia
cuadrado
1 65 12.5 64 10 2.5 6.25
2 65 12.5 66 14 -1.5 2.25
3 68 16.5 64 10 6.5 42.25
4 72 21 70 19.5 1.5 2.25
5 60 5.5 61 7.5 -2 4
6 64 10.5 65 12.5 -2 4
7 68 16.5 70 19.5 -3 9
8 51 2 50 1 1 1
9 73 22 72 22 0 0
10 63 9 64 10 -1 1
11 50 1 51 2 -1 1
12 62 7.5 61 7.5 0 0
13 54 3 54 3 0 0
14 69 18 70 19.5 -1.5 2.25
15 58 4 60 5.5 -1.5 2.25
16 60 5.5 58 4 1.5 2.25
17 70 19.5 69 16.5 3 9
18 64 10.5 65 12.5 -2 4
19 62 7.5 60 5.5 2 4
20 70 19.5 70 19.5 0 0
21 66 14 68 15 -1 1
22 67 15 69 16.5 -1.5 2.25
23 79 23 80 23 0 0
Total 100
INSTRUMENTO DE MEDICIÓN
LA CONFIABILIDAD
b) Método de la división en mitades (pares e impares).
El método de mitades partidas requiere sólo una aplicación de la
medición. Partiendo de una sola aplicación de una forma de test
es posible llegar a la medida de su fiabilidad siguiendo varios
procedimientos de división en mitades. Se puede usar la fórmula
de Pearson, el cual pasaremos a explicar.
Fórmula:
nxy (x)(y )
rip
[nx (x) ][ny (y ) ]
2 2 2 2
INSTRUMENTO DE MEDICIÓN
LA CONFIABILIDAD
b) Método de la división en mitades (pares e impares).
Coeficiente de confiabilidad del test
2rip
R xx
1 rip
1024 1024
rip 0.4372
5484288 2341.85
k t pq
2
s
r
k 1 st
2
Donde:
K = Número de ítems
p = Proporción de éxito de cada pregunta
q = Proporción de incidente de cada pregunta
p q = Variación de cada pregunta
S2t = Varianza total de filas
KR-20 Kuder y Richardson
ITEMS
NÚMERO DE
XT
ALUMNOS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 1 0 0 1 1 1 0 0 1 1 1 1 0 0 1 1 1 0 1 1 13
2 1 0 1 1 1 0 1 0 1 1 1 0 1 0 1 0 0 0 1 0 11
3 1 0 0 0 0 1 1 0 1 1 1 0 0 0 0 1 0 1 0 0 8
4 0 1 1 1 0 1 0 0 1 1 1 0 1 0 0 0 0 0 1 0 9
5 1 1 1 1 1 1 0 1 0 1 1 1 0 1 0 0 1 0 1 1 14
6 1 1 1 1 1 0 1 1 1 0 1 1 0 1 1 1 1 1 1 1 17
7 1 0 1 0 1 1 0 1 0 1 0 1 1 1 1 1 1 0 1 1 14
8 1 1 1 0 1 0 0 0 0 0 1 0 0 0 1 0 0 0 1 0 7
9 1 0 0 1 1 1 1 1 1 1 1 1 1 0 0 1 0 0 1 0 13
10 0 1 1 0 1 0 0 0 1 0 1 1 0 0 0 1 0 1 0 1 9
RC 8 5 7 6 8 6 4 4 7 7 9 6 4 3 5 6 4 3 8 5 115
RINCI 2 5 3 4 2 4 6 6 3 3 1 4 6 7 5 4 6 7 2 5 85
p 0.8 0.5 0.7 0.6 0.8 0.6 0.4 0.4 0.7 0.7 0.9 0.6 0.4 0.3 0.5 0.6 0.4 0.3 0.8 0.5 0.575
q 0.2 0.5 0.3 0.4 0.2 0.4 0.6 0.6 0.3 0.3 0.1 0.4 0.6 0.7 0.5 0.4 0.6 0.7 0.2 0.5 0.425
pq 0.16 0.25 0.21 0.24 0.16 0.24 0.24 0.24 0.21 0.21 0.09 0.24 0.24 0.21 0.25 0.24 0.24 0.21 0.16 0.25 4.29
VARIANZA 0.1778 0.2778 0.2333 0.2667 0.1778 0.2667 0.2667 0.2667 0.2333 0.2333 0.1 0.2667 0.2667 0.2333 0.2778 0.2667 0.2667 0.2333 0.1778 0.2778 10.28
KR-20 Kuder y Richardson
https://www.youtube.com/watch?v=0r9o7t6AnLk
CONFIABILIDAD DEL INSTRUMENTO