Validez y Confiabilidad - DR Yache

DISEÑO Y DESARROLLO DEL TRABAJO DE
INVESTIGACIÓN
VALIDÉZ Y CONFIABILIDAD
Docente:
Dr. Eduardo Yache
RECOLECCIÓN DE DATOS
Una vez formulado:

-El problema. - La justificación.
-Los objetivos. - El marco teórico.
-Los antecedentes. - El tipo de estudio.
-Diseño de investigación. - La hipótesis.
-Población y muestra (probabilístico y no probabilístico)
La siguiente etapa consiste en recolectar los datos pertinentes sobre los:
-Atributos.
-Conceptos.
-Casos.
-Sucesos involucrados en la investigación.
-Cualidades de los participantes.
Esta etapa de recolección de la información se conoce también como
trabajo de campo.
RECOLECCIÓN DE DATOS
EL PLAN IMPLICA:
a)La identificación de las fuentes de donde se obtendrán los datos: Estos
van a ser proporcionados por personas, se producirán de observaciones
o se encuentran en documentos, archivos, bases de datos, etc.
b)La localización de las fuentes: Es la muestra seleccionada,
indispensable para definir con precisión donde están localizados.
c)Los medios o métodos de recolección de datos: Implica elegir uno o
varios medios y definir los procedimientos que se utilizarán en la
recolección de los datos. El método o métodos deben ser confiables,
válidos y objetivos.
d) La preparación y presentación de los datos recolectados: Para su
análisis y utilización en responder el problema planteado.
LA MEDICIÓN
Medir significa "asignar números, símbolos o valores a las
propiedades de objetos o eventos de acuerdo con reglas”.
INSTRUMENTO DE MEDICIÓN
Requisitos de un instrumento de medición

Toda medición o instrumento de recolección de datos
debe reunir tres requisitos esenciales: VALIDEZ Y
CONFIABILIDAD.
LA VALIDEZ
La validez, en términos generales, se refiere al grado
en que un instrumento realmente mide la variable
que pretende medir.
Por ejemplo, un instrumento válido para medir la
inteligencia y no la memoria.
La Confiabilidad
Se refiere al grado en que su aplicación
repetida al mismo sujeto u objeto produce
iguales resultados.
Grado en el que un instrumento produce
resultados consistentes y coherentes.
La validez es un concepto del cual pueden

tenerse diferentes tipos de evidencia:
1) Validéz de contenido.
2) Validéz de criterio.
3) Validéz de constructo.
VALIDÉZ DE CONTENIDO
1. VALIDÉZ DE CONTENIDO:
La validez de contenido se refiere al grado en que
un instrumento refleja un dominio específico de
contenido de lo que se mide.
Es el grado en que la medición representa al
concepto o variable medida (Bohrnstedt, 1976).
Es el grado en que los ítems que constituyen el
instrumento tienen el dominio del contenido que
se mide (Nunnally, 1973).
Dominio de contenido de la variable
LL RR ÑÑ
EE AA
AA
NN M M M M
AA ZZ ZZ
UU GG GG
Instrumento con Instrumento sin

validez de contenido validez de contenido
LL RR ÑÑ
EE AA AA
NN MM MM LL EE
AA ZZ ZZ
UU GG GG
9
Criterios de validación:
a) Redacción. Interpretación unívoca del enunciado de la pregunta
para lograr con claridad y precisión el uso del vocabulario técnico.
b) Pertinencia. Es útil y adecuado al avance de la ciencia y la
tecnología.
c) Coherencia o congruencia. Existe una organización lógica en base a
la relación estrecha entre: la variable y la dimensión; la dimensión y
el indicador; el indicador y el ítems; el ítems y la opción de
respuesta con los objetivos a lograr.
d) Adecuación. Correspondencia entre el contenido de cada pregunta
y el nivel de preparación o desempeño del entrevistado.
e) Comprensión. Se alcanza un entendimiento global de las preguntas.
A. Prueba de V de Aiken (1985). Es un coeficiente que se
computa como la razón de un dato obtenido sobre la suma
máxima de la diferencia de los valores posibles. Puede ser
calculado sobre las valoraciones de un conjunto de jueces
con relación a un ítem o como valoraciones de un juez
respecto a un grupo de ítems.
Asimismo las valoraciones asignadas pueden ser
DICOTOMICAS o POLITOMICAS.
Prueba de V de Aiken (1985). Es el más adecuado para
determinar este tipo de validez, ya que permite obtener
valores factibles de ser contrastados estadísticamente, se
recomienda por lo menos 5 jueces.
S
V
n   c  1
Donde:
n = Número de jueces
c = Número de valores en la escala de medición
S = Sumatoria de si.
si = Valor asignado por el juez i.
Prueba de V de Aiken (1985): Ítem bueno (se acepta) = 1
Ítem deficiente (se rechaza) = 0
JUECES V
ÍTEMS Criterios Acuerdos Decisión
1 2 3 4 5 6 7 8 9 10 Aiken
Redacción 1 0 1 1 1 1 1 1 1 1 9 0.90 Si
Pertinencia 1 1 1 1 1 1 1 1 1 1 10 1.00 Si
Ítem
Coherencia 1 1 1 1 1 1 0 1 1 1 9 0.90 Si
1
Adecuación 0 1 1 1 1 1 1 1 0 1 8 0.80 Si
Comprensión 1 1 1 1 1 1 1 1 1 1 10 1.00 Si
Redacción 1 1 1 1 0 1 1 1 1 1 9 0.90 Si
Pertinencia 1 1 1 1 1 1 0 1 1 1 9 0.90 Si
Ítem
Coherencia 1 1 1 1 1 1 0 1 1 1 9 0.90 Si
2
Adecuación 1 1 1 0 0 1 1 1 0 1 7 0.70 No
Comprensión 1 1 1 1 1 0 1 1 1 1 9 0.90 Si
Redacción 1 0 1 0 0 1 1 0 1 0 5 0.50 No
Pertinencia 1 1 1 1 1 1 0 1 1 1 9 0.90 Si
Ítem
Coherencia 1 0 1 1 0 1 0 1 0 1 6 0.60 No
3
Adecuación 0 1 0 1 0 1 1 0 1 1 6 0.60 No
Comprensión 1 1 1 1 1 0 1 1 1 1 9 0.90 Si
1. VALIDÉZ DE CONTENIDO: Prueba de V de Aiken (1985):
B. Prueba de Lawshe (1975).
Es el juicio concerniente al grado de acuerdo entre un
grupo de expertos que determina la validez de contenido
del instrumento construido por los autores.
Para cada ítem, se anota el número de expertos que afirman
que el ÍTEM SI ES ESENCIAL; si más de la mitad de los
expertos indican que un ítem es esencial, entonces ese
ítem tiene al menos alguna validez de contenido.
B. Prueba de Lawshe (1975).
Fórmula de razón de validéz de contenido:
N
n
CVR  2
N
2
Donde:
n: Número de expertos que afirman que el ítem si es esencial.
N: Número total de expertos.
1 2 3 4 5 TOTAL
ítem CVR
SI NO SI NO SI NO SI NO SI NO SI NO
1. VALIDÉZ DE I1.1 x x x x x 5 0 1
CONTENIDO I1.2 x x x x x 5 0 1
: I1.3 x x x x x 5 0 1
B. Prueba de Lawshe I2.1
I2.2
x
x
x
x
x
x
x
x
x
x
5
5
0
0
1
1
(1975). I2.3 x x x x x 5 0 1
I2.4 x x x x x 5 0 1
• Según Herrera (1998) I2.5 x x x x x 5 0 1
• 0,53 a menos Validez nula I2.6 x x x x x 5 0 1
I3.1 x x x x x 5 0 1
• 0,54 a 0,59 Validez baja
I3.2 x x x x x 5 0 1
• 0,60 a 0,65 Válida I3.3 x x x x x 5 0 1
• 0,66 a 0,71 Muy válida I3.4 x x x x x 5 0 1
• 0,72 a 0,99 Excelente validez I4.1 x x x x x 5 0 1
I4.2 x x x x x 5 0 1
• 1.0 Validez perfecta
I4.3 x x x x x 5 0 1
I4.4 x x x x x 5 0 1
I5.1 x x x x x 5 0 1
I5.2 x x x x x 5 0 1
I5.3 x x x x x 5 0 1
VALIDÉZ DE CRITERIO
2. Evidencia relacionada con el criterio
La validez de criterio establece la validez de un
instrumento de medición al compararla con algún
criterio externo que pretende medir lo mismo.
Este criterio es un estándar con el que se juzga la validez
del instrumento (Wiersma & Jurs, 2005). Cuanto más se
relacionen los resultados del instrumento de medición
con el criterio, la validez de criterio será mayor.
El principio de la validez de criterio es sencillo: si
diferentes instrumentos o criterios miden el mismo
concepto o variable, deben arrojar resultados similares.
VALIDÉZ DE CRITERIO
2. Evidencia relacionada con el criterio
La pregunta que se responde con la validez de criterio es: ¿en
qué grado el instrumento comparado con otros criterios
externos mide lo mismo?, o ¿qué tan cercanamente las
puntuaciones del instrumento se relacionan con otro (s)
resultado (s) sobre el mismo concepto?.
Se determina comparando los resultados obtenidos con los
instrumentos diseñados por el investigador con los
resultados estandarizados de otras pruebas consideradas
óptimas (a un patrón de medida o criterio externo).
Ejemplo: En un estudio de la variable «Desempeño docente»,
se ha estandarizado un instrumento, donde se ha obtenido
resultados fidedignos al 100%.
VALIDÉZ DE CONSTRUCTO
3. Evidencia relacionada con el constructo
La validación de un constructo está vinculado con la
teoría. No es conveniente llevar a cabo tal validación, a
menos que exista un marco teórico que soporte la
variable en relación con otras variables.
Es necesario investigaciones que hayan demostrado que
los conceptos se relacionan. Cuanto más elaborada y
comprobada se encuentre la teoría que apoya la
hipótesis, la validación del constructo arrojará mayor luz
sobre la validez general del instrumento de medición.
Presentación gráfica de un instrumento con
validez de constructo. (Hernández, 2006)
Teoría
(Investigaciones hechas ) encontraron que A se relaciona
positivamente con B, C y D. Y negativamente con W.
Si el instrumento mide A, sus resultados deben relacionarse
positivamente con los obtenidos en las mediciones de B, C y D; y
relacionarse negativamente con los resultados de W.
TÉCNICA ANALISIS FACTORIAL
El Análisis Factorial es una técnica estadística
multivariante cuya finalidad es analizar las relaciones de
interdependencia existentes entre un conjunto de
variables, calculando un conjunto de variables latentes,
denominadas factores, que explican con un número
menor de dimensiones, dichas relaciones. Por este
motivo, el Análisis Factorial es una técnica de reducción
de datos con un número menor de variables sin
distorsionar dicha información, lo que aumenta el grado
de manejo e interpretación de la misma.
Utilizando el SPSS…
Se concluye que la validez de constructo es

consistente.
https://www.youtube.com/watch?v=RpU1k5LDigk
LA VALIDEZ TOTAL
validez de validez de validez de

contenido criterio constructo
LA CONFIABILIDAD
La confiabilidad de un instrumento de medición se
refiere al grado en que su aplicación repetida al
mismo sujeto u objeto produce iguales resultados.
Cuando los resultados no son coherentes, no se
puede "confiar" en un instrumento.
Grado en el que un instrumento produce resultados
consistentes y coherentes.
LA CONFIABILIDAD
a) Confiabilidad test-retest.
El método más obvio para hallar la confiabilidad de un
test consiste en repetirlo en una segunda ocasión. En
este procedimiento un mismo instrumento de medición
(o ítems o indicadores) es aplicado dos o más veces a un
mismo grupo de personas, después de un período de
tiempo. Si la correlación entre los resultados de las
diferentes aplicaciones es altamente positiva, el
instrumento se considera confiable.
LA CONFIABILIDAD
a) Confiabilidad test-retest.
Ejemplo: Se examina a un grupo de 23 estudiantes mediante
una prueba objetiva de selección múltiple y luego de
transcurrido cinco días se toma el mismo examen al mismo
grupo.
Los resultados obtenidos antes y después (test – retest) son los
siguientes:
Antes: 65, 65, 68, 72, 60, 64, 68, 51, 73, 63, 50, 62, 54, 69, 58, 60,
70, 64, 62, 70, 66, 67, 79
Después: 64, 66, 64, 70, 61, 65, 70, 50, 72, 64, 51, 61, 54, 70, 60,
58, 69, 65, 60, 70, 68, 69, 80.
CONFIABILIDAD TEST RETEST
Diferencias al
N° Antes Puntuación Después Puntuación Diferencia
cuadrado
1 65 12.5 64 10 2.5 6.25
2 65 12.5 66 14 -1.5 2.25
3 68 16.5 64 10 6.5 42.25
4 72 21 70 19.5 1.5 2.25
5 60 5.5 61 7.5 -2 4
6 64 10.5 65 12.5 -2 4
7 68 16.5 70 19.5 -3 9
8 51 2 50 1 1 1
9 73 22 72 22 0 0
10 63 9 64 10 -1 1
11 50 1 51 2 -1 1
12 62 7.5 61 7.5 0 0
13 54 3 54 3 0 0
14 69 18 70 19.5 -1.5 2.25
15 58 4 60 5.5 -1.5 2.25
16 60 5.5 58 4 1.5 2.25
17 70 19.5 69 16.5 3 9
18 64 10.5 65 12.5 -2 4
19 62 7.5 60 5.5 2 4
20 70 19.5 70 19.5 0 0
21 66 14 68 15 -1 1
22 67 15 69 16.5 -1.5 2.25
23 79 23 80 23 0 0
Total 100
CONFIABILIDAD TEST RETEST

LA CONFIABILIDAD
b) Método de la división en mitades (pares e impares).
El método de mitades partidas requiere sólo una aplicación de la
medición. Partiendo de una sola aplicación de una forma de test
es posible llegar a la medida de su fiabilidad siguiendo varios
procedimientos de división en mitades. Se puede usar la fórmula
de Pearson, el cual pasaremos a explicar.
Fórmula:
nxy  (x)(y )
rip 
[nx  (x) ][ny  (y ) ]
2 2 2 2
LA CONFIABILIDAD
Coeficiente de confiabilidad del test
2rip
R xx 
1  rip
El coeficiente puede oscilar entre 0 y 1. Donde un coeficiente de 0

significa nula confiabilidad y 1 representa el máximo de
confiabilidad. (confiabilidad total). Entre más se acerca al cero
(0), hay mayor error en la medición. Pero se considera confiable el
instrumento mayor a 0.6
16( 2465)  (196)(196)

rip 
[16( 2594)  (196) 2 ][16( 2512)  (196) 2
1024 1024
rip    0.4372
5484288 2341.85
2rip 2(0.44 ) 0.88

Rxx     0.61
1  rip 1  0.44 1.44
El resultado de 0.61 se considera

confiable
LA CONFIABILIDAD
c) Coeficiente KR-20 Kuder y Richardson (Para ítems
dicotómicos).
Se basa en la consistencia de las respuestas de los sujetos a
todos los elementos del test (para preguntas dicotómicas).
 k  t   pq 
 2
s
r   
 k  1  st
2

Donde:
K = Número de ítems
p = Proporción de éxito de cada pregunta
q = Proporción de incidente de cada pregunta
p q = Variación de cada pregunta
S2t = Varianza total de filas
KR-20 Kuder y Richardson
ITEMS
NÚMERO DE
XT
ALUMNOS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 1 0 0 1 1 1 0 0 1 1 1 1 0 0 1 1 1 0 1 1 13
2 1 0 1 1 1 0 1 0 1 1 1 0 1 0 1 0 0 0 1 0 11
3 1 0 0 0 0 1 1 0 1 1 1 0 0 0 0 1 0 1 0 0 8
4 0 1 1 1 0 1 0 0 1 1 1 0 1 0 0 0 0 0 1 0 9
5 1 1 1 1 1 1 0 1 0 1 1 1 0 1 0 0 1 0 1 1 14
6 1 1 1 1 1 0 1 1 1 0 1 1 0 1 1 1 1 1 1 1 17
7 1 0 1 0 1 1 0 1 0 1 0 1 1 1 1 1 1 0 1 1 14
8 1 1 1 0 1 0 0 0 0 0 1 0 0 0 1 0 0 0 1 0 7
9 1 0 0 1 1 1 1 1 1 1 1 1 1 0 0 1 0 0 1 0 13
10 0 1 1 0 1 0 0 0 1 0 1 1 0 0 0 1 0 1 0 1 9
RC 8 5 7 6 8 6 4 4 7 7 9 6 4 3 5 6 4 3 8 5 115
RINCI 2 5 3 4 2 4 6 6 3 3 1 4 6 7 5 4 6 7 2 5 85
p 0.8 0.5 0.7 0.6 0.8 0.6 0.4 0.4 0.7 0.7 0.9 0.6 0.4 0.3 0.5 0.6 0.4 0.3 0.8 0.5 0.575
q 0.2 0.5 0.3 0.4 0.2 0.4 0.6 0.6 0.3 0.3 0.1 0.4 0.6 0.7 0.5 0.4 0.6 0.7 0.2 0.5 0.425
pq 0.16 0.25 0.21 0.24 0.16 0.24 0.24 0.24 0.21 0.21 0.09 0.24 0.24 0.21 0.25 0.24 0.24 0.21 0.16 0.25 4.29
VARIANZA 0.1778 0.2778 0.2333 0.2667 0.1778 0.2667 0.2667 0.2667 0.2333 0.2333 0.1 0.2667 0.2667 0.2333 0.2778 0.2667 0.2667 0.2333 0.1778 0.2778 10.28
KR-20 Kuder y Richardson
RC = total de las respuestas correctas para cada pregunta.

RINC = total de las respuestas incorrectas para cada pregunta.
p = proporción de éxito para cada pregunta.
q = proporción de incidente para cada pregunta.
pq = variación de cada pregunta
CONFIABILIDAD DEL INSTRUMENTO
d) Coeficiente Alfa de Cronbach.

Este coeficiente desarrollado por Cronbach requiere una sola
administración del instrumento de medición y produce valores
que oscilan entre 0 y 1.
Su ventaja reside en que no es necesario dividir en dos mitades a
los ítems del instrumento de medición, simplemente se aplica la
medición y se calcula el coeficiente. Para el cálculo de este
coeficiente se utiliza el SPSS Versión 26.
Fórmula:

CRITERIOS:
•Coeficiente alfa de Cronbach mayor a 0,9 es Excelente
•Coeficiente alfa de Cronbach mayor a 0,8 y menor a 0,9 es Bueno
•Coeficiente alfa de Cronbach mayor a 0,7 y menor a 0,8 Aceptable
•Coeficiente alfa de Cronbach mayor a 0,6 y menor a 0,7 Cuestionable
•Coeficiente alfa de Cronbach mayor a 0,5 y menor a 0,6 Pobre
•Coeficiente alfa de Cronbach menor a 0,5 es Inaceptable

Indicaciones para calcular la confiabilidad por ítems y
dimensiones.
Ejemplo:
Variable. GESTIÓN PEDAGÓGICA.
Dimensión. DESARROLLO ORGANIZACIONAL E INVESTIGACIÓN
Con 11 ítems y muestra piloto de 20 de participantes.
(Recuerde que el procedimiento es el mismo para las otras
dimensiones de la variable).

1ro. Ingresar los valores de los ítems por participante en la VISTA DE DATOS.

2do. Llenar por columna lo que observa en la VISTA DE VARIABLES

3ro. Hacer click en el comando ANALIZAR, luego ir a ESCALA, y hacer click
en ANALISIS DE FIABILIDAD

4to. Se presenta la siguiente ventana

5to. Pasarlos los ítems a la ventana de ELEMENTOS

6to. Ir a ESTADISTICOS y marcar ESCALA y ESCALA SI SE ELIMINA EL
ALEMENTO y hacer click en continuar

7mo. Hacer clic en ACEPTAR y obtenemos lo que queremos.
https://www.youtube.com/watch?v=0r9o7t6AnLk

RESULTADO:
RELACIÓN VALIDÉZ Y CONFIABILIDAD
Un instrumento de medición puede ser confiable, pero no

necesariamente válido.
Por ello es requisito que el instrumento de medición
demuestre ser válido y confiable. De no ser así, los resultados
de la investigación no deben tomarse en serio.
FACTORES QUE AFECTAN LA
VALIDÉZ Y LA CONFIABILIDAD
Primer factor:
La Improvisación.
Algunas personas creen que elegir un instrumento de
medición o desarrollar uno es algo que puede tomarse a
la ligera. Incluso, algunos profesores piden a los alumnos
que construyan instrumentos de medición de un día para
otro, o lo que es casi lo mismo, de una semana a otra. Lo
cual habla del poco o nulo conocimiento del proceso de
elaboración de instrumentos de medición. Esta
improvisación genera casi siempre instrumentos poco
válidos o confiables, lo cual no debe existir en la
investigación.
Segundo factor:
Instrumentos no validados en el contexto de aplicación.
A veces se utilizan instrumentos desarrollados en el
extranjero que no han sido validados en el contexto de
aplicación: cultura y tiempo.
Hay instrumentos en los que hasta el lenguaje suena a
“antiguo”. Las culturas, los grupos y las personas
cambian; y esto debe ser tomado en cuenta al elegir o
desarrollar un instrumento de medición.
Tercer factor:
Instrumento no adecuado a las personas a las que se les
aplica.
En ocasiones el instrumento resulta inadecuado para las
personas a quienes se les aplica: no es empático, utiliza un
lenguaje muy elevado para el sujeto participante, no toma
en cuenta diferencias en cuanto a género, edad,
conocimientos, memoria, nivel ocupacional y educativo,
motivación para contestar, capacidades de
conceptualización y otras diferencias en los participantes.
Quien realiza una investigación debe siempre adaptarse a
los sujetos participantes y no éstos a él o ella, ya que es
necesario brindarles todo tipo de facilidades.
Cuarto factor:
Cuestiones vinculadas con los estilos personales de los
sujetos participantes.
(Bostwick y Kyte, 2005) Tales como: deseabilidad social
(tratar de dar una impresión muy favorable a través de
las respuestas), tendencia a asentir con respecto a todo
lo que se pregunta, dar respuestas inusuales o contestar
siempre negativamente.
Quinto factor:
Condiciones en las que se aplica el instrumento de medición.
El ruido, la iluminación, el frío, un instrumento demasiado
largo o tedioso, una encuesta telefónica, tiempo
inapropiado; son cuestiones que llegan a afectar
negativamente la validez y la confiabilidad.
Por lo común en los experimentos se cuenta con
instrumentos de medición más largos y complejos que en los
diseños no experimentales. Por ejemplo, en una encuesta
pública sería muy difícil aplicar una prueba larga o compleja.
Sexto factor:
Falta de estandarización.
Por ejemplo, que las instrucciones no sean las mismas
para todos los participantes, que el orden de las
preguntas sea distinto para algunos individuos, que los
instrumentos de observación no sean equivalentes, etc.
Este elemento también se vincula con la objetividad.
GRACIAS POR SU
ATENCIÓN
Dr. Eduardo Yache

Validez y Confiabilidad - DR Yache

Cargado por

Copyright:

Formatos disponibles

Validez y Confiabilidad - DR Yache

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Validez y Confiabilidad - DR Yache

Cargado por

Copyright:

Formatos disponibles

DISEÑO Y DESARROLLO DEL TRABAJO DE

Una vez formulado:

Requisitos de un instrumento de medición

La validez es un concepto del cual pueden

Instrumento con Instrumento sin

Se concluye que la validez de constructo es

validez de validez de validez de

CONFIABILIDAD TEST RETEST

El coeficiente puede oscilar entre 0 y 1. Donde un coeficiente de 0

16( 2465)  (196)(196)

2rip 2(0.44 ) 0.88

El resultado de 0.61 se considera

RC = total de las respuestas correctas para cada pregunta.

d) Coeficiente Alfa de Cronbach.

d) Coeficiente Alfa de Cronbach.

d) Coeficiente Alfa de Cronbach.

d) Coeficiente Alfa de Cronbach.

d) Coeficiente Alfa de Cronbach.

d) Coeficiente Alfa de Cronbach.

d) Coeficiente Alfa de Cronbach.

d) Coeficiente Alfa de Cronbach.

d) Coeficiente Alfa de Cronbach.

d) Coeficiente Alfa de Cronbach.

d) Coeficiente Alfa de Cronbach.

Un instrumento de medición puede ser confiable, pero no

Dr. Eduardo Yache

También podría gustarte