Guia para La Interpretacion Del - Enrique Navarro Asencio
Guia para La Interpretacion Del - Enrique Navarro Asencio
Guia para La Interpretacion Del - Enrique Navarro Asencio
RESULTADOS EN EL CONTRASTE DE
HIPÓTESIS ESTADÍSTICAS
(Estadística Paramétrica y No Paramétrica)
ÍNDICE
1
Enrique Navarro Asencio (@eduktive)
Esta guía pretende llevar a cabo una introducción a los conceptos básicos del contraste de hipótesis
estadístico. Con su lectura se puede dar respuesta a dos preguntas fundamentales: ¿Qué tipo de
análisis estadístico es adecuado para analizar los datos? y ¿cómo se interpreta esa información
estadística?
Univariada
Descriptiva
Bivariada
(Correlaciones)
Estadística
Pruebas
Paramétricas
Inferencial
(Contraste de
Hipótesis)
Pruebas No
Paramétricas
2
Enrique Navarro Asencio (@eduktive)
investigación no tiene ese objetivo y solo pretende describir un grupo de sujetos, las correlaciones
son estadísticos descriptivos.
Esa inferencia, por tanto, permite la generalización de los resultados de una muestra a la población
en términos de probabilidad. Esta generalización de los resultados dependerá principalmente del
proceso de selección muestral que debe garantizar la representatividad de la muestra.
Antes de comenzar con la descripción de las diferentes pruebas que se utilizan para el contraste de
hipótesis en estudios con datos empíricos, conviene introducir algunos conceptos básicos.
3
Enrique Navarro Asencio (@eduktive)
4
Enrique Navarro Asencio (@eduktive)
quien decide qué niveles o modalidades tiene esa variable y permite distribuir a los sujetos de
forma aleatoria en esos niveles, como diferentes dosis de medicamento o diferentes modalidades de
un programa de intervención (control, experimental). En cambio, son variables asignadas si no
pueden ser manipuladas por el investigador, es decir, son características propias de los sujetos
como el género, nivel educativo, edad, etc.
0,75
50% 50%
0,5
0,25
5000 LANZAMIENTOS
FIGURA 3. DISTRIBUCIÓN BINOMIAL CON IGUAL PROBABILIDAD
6
Enrique Navarro Asencio (@eduktive)
Cuando se trabaja con variables cuantitativas y se cuenta con un tamaño suficiente, su distribución
muestral adquiere forma de campana de Gauss que se denomina distribución normal o también
conocida como distribución Z.
68,28%
95%
99%
7
Enrique Navarro Asencio (@eduktive)
Utilizar variables cuantitativas que cumplen con los requisitos de normalidad, como ya se
mencionó en el tema anterior, es uno de los supuestos que se deben cumplir para utilizar pruebas
estadísticas paramétricas. En cambio, si la distribución de puntuaciones no cumple con la
normalidad se deberán emplear pruebas no paramétricas.
Pruebas Paramétricas: se utilizan con variables cuantitativas y con una muestra
suficiente de sujetos (al menos 30 casos por grupo). Estos requisitos son necesarios para
obtener una distribución normal de las puntuaciones en la variable analizada.
Pruebas NO Paramétricas: se utilizan con variables dependientes cualitativas, ya
sean ordinales o nominales. También cuando se cuenta con variables cuantitativas pero
no se alcanza el tamaño mínimo recomendado.
La decisión de emplear un tipo de pruebas u otras depende de las características de las variables
que forman parte de la investigación. Para utilizar pruebas paramétricas las variables deben
cumplir una serie de supuestos:
Variables dependientes cuantitativas: medidas en escalas de intervalo o razón. En
algunas ocasiones variables ordinales pueden considerarse cuantitativas si cumplen con
el supuesto de normalidad
Normalidad de las puntuaciones: las variables objeto de estudio deben tener
distribución normal, es decir, con forma de campana de Gauss. Este supuesto puede
comprobarse con la prueba de Kolmogorov-Smirnov, pero si se cuenta con variables
cuantitativas y un tamaño muestral suficiente (30 casos).
2. Correlación: Pearson
B. No Paramétricos
1. Diferencias entre grupos: U de Mann-Whitney, H de Kruskal-Wallys y W de
Wilcoxon
2. Correlación: Spearman, Tau b, Tau c, Gamma y Chi-cuadrado, biserial-puntual
El estadístico siempre va acompañado de un valor de probabilidad asociado. Normalmente se
nombra como sig. (bilateral) o P-valor. Este valor es el que determina si el estadístico calculado ha
resultado significativo.
NIVEL DE SIGNIFICACIÓN
Cada estadístico estimado en un contraste de hipótesis, ya sea paramétrico o no paramétrico, de
correlación o comparación, siempre se acompaña de su probabilidad de ocurrencia de la hipótesis
nula (p-valor).
Esta probabilidad asociada al estadístico indica el número de ocasiones (cuántas veces de cada 100,
es una proporción) que se cumplirá la hipótesis nula. Ese valor se debe comparar con un valor de
probabilidad, elegido por el investigador, que establece el límite para considerar que una hipótesis
se cumple. Ese valor de comparación es el nivel de significación o nivel de error que se espera
cometer (α) y en investigación social no debe superar el 5%, es decir, una probabilidad de 0,05.
Para aceptar la hipótesis nula deberá cumplirse más del 5% de las ocasiones, por tanto, debe tener
una probabilidad asociada que supere el 0,05.
Unos valores bajos de probabilidad asociada al estadístico inferior o igual al nivel de error (5% o
inferior o igual a 0,05) señalarán que la hipótesis nula no se cumple el número suficiente de
ocasiones y, en consecuencia, deberá rechazarse y, por tanto, aceptar la hipótesis alternativa. En
cambio, si la probabilidad supera ese valor deberá aceptarse.
Ese 5% (α=,05) es el límite establecido por consenso en investigación. No obstante, si el resultado
de la probabilidad es igual o inferior al 1% (p = ,01) indica que la hipótesis nula solo ocurre una de
cada 100 veces. Si esa probabilidad es del 0,1% (p= ,001) nos indica que ocurre una de cada 1000
ocasiones. Cuanto más bajo sea el nivel de significación más seguridad habrá al rechazar la
hipótesis nula.
Siempre que se realiza un contraste de hipótesis estadístico hay cierta probabilidad de error. Ese
5% indica también el error que se asume en el contraste de hipótesis. Utilizar este punto de corte
del valor de la probabilidad conlleva asumir un 95% de nivel de confianza, pero es posible aunque
poco probable que rechacemos una hipótesis nula cuando es cierta, o que la aceptemos cuando es
falta. Los distintos tipos de error que pueden cometerse se resumen en la siguiente tabla:
Realidad
H0 cierta H0 Falsa
Por tanto, cuando se rechaza la hipótesis nula es porque tiene poca probabilidad de ocurrencia. En
un análisis de correlación la hipótesis nula se formula en términos de negación de la relación entre
las variables de rendimiento. Y, por tanto, la obtención de un valor de probabilidad inferior a 0,05
quiere decir que esa falta de relación, la hipótesis nula, ocurre menos del 5% de las veces y debe ser
rechazada. En el otro 95% de los casos la relación es significativa. De forma opuesta, cuando el
valor de probabilidad supera ese 0,05 la hipótesis nula tiene una probabilidad de ocurrencia
suficiente para no ser rechazada.
1.5 CLASIFICACIÓN DE ANÁLISIS ESTADÍSTICOS PARA EL CONTRASTE
DE HIPÓTESIS.
En este apartado se presentan los estadísticos más habituales para contrastar hipótesis de
correlación o de comparación de grupos, diferenciando entre paramétricos y no paramétricos.
Los distintos análisis de correlación que se incluyen en esta guía están representados en la Figura
6. El coeficiente Pearson se emplea con variables cuantitativas y tamaños muestrales grandes (por
encima de 30 casos). El coeficiente Spearman (también tau-b, tau-c y gamma) se emplean cuando
no se alcanza ese tamaño muestral o cuando las variables analizadas tienen naturaleza ordinal.
Cuando se correlaciona una variable cualitativa dicotómica y otra cuantitativa se utiliza la
correlación biserial-puntual. Finalmente, el coeficiente chi-cuadrado analiza la relación entre
variables cualitativas nominales o entre una variable nominal y otra ordinal.
El estadístico chi-cuadrado tiene variantes en función del número de niveles de la variable
nominal. Si las variables tienen el mismo número de categorías, especialmente si las variables a
correlacionar tienen dos únicas categorías, se utiliza el coeficiente de contingencia. En cambio, si el
número de niveles es distinto se emplearía chi-cuadrado.
Variables Cuantitativas
Paramétrica
(Pearson)
Cualitativas Ordinales
Descriptiva Bivariada
(Spearman, taub,
(Correlación)
tauc, gamma)
Nominal dicotómica y
No Paramétrica cuantitativa (biserial-
puntual)
chi-cuadrado, phi y v
de Cramer (distinto
número de categorías)
Cualitativas Nominales
Coeficiente de
contingencia, phi y v
de Cramer (mismo
número de categorías
10
Enrique Navarro Asencio (@eduktive)
T de Student para
1 grupo
una muestra
Independientes
(T de Student)
Paramétrica 2 grupos
Relacionados
(T de Student)
Independientes
(ANOVA)
VD. Ordinal o
Nominal (Chi-
1 grupo
Cuadrado como
bondad de ajuste)
VD. Ordinal
(U de Mann-
Whitney)
Independientes
VD. Nominal VD y VI
dicotómicas
(Chi-cuadrado para (Coeficiente de
la independencia) Contingencia)
2 grupos
VD. Ordinal (W de
Wilcoxon)
No Paramétrica
Relacionados
Variables
dicotómicas
(Mc Nemar)
VD. Ordinal (H de
Kruskal Wallis)
Independientes
VD Nominal
(Chi-cuadrado para
la independencia)
Relacionados
VD y VI nominal
(Friedman)
11
Enrique Navarro Asencio (@eduktive)
Todas las pruebas paramétricas y no paramétricas se describen en esta guía excepto aquellas que se
utilizan para comparar más de dos grupos relacionados (ANOVA de medidas repetidas, Friedman y
Q de Cochran). Se excluyen debido a su alta complejidad de interpretación y porque son poco
utilizadas en este campo de estudio. Las pruebas para grupos relacionados, tanto paramétricas
como no paramétricas, normalmente comparan únicamente dos grupos: un pretest con un postest.
12
Enrique Navarro Asencio (@eduktive)
13
Enrique Navarro Asencio (@eduktive)
14
Enrique Navarro Asencio (@eduktive)
15
Enrique Navarro Asencio (@eduktive)
16
Enrique Navarro Asencio (@eduktive)
Esta misma tabla se muestra también los resultados del ANOVA. Para comprobar si existen
diferencias entre los grupos se observa el valor de la probabilidad asociada al estadístico F de
Snedecor (P). Esta probabilidad tiene un valor de 0,001, valor inferior a 0,05. Como la
probabilidad de ocurrencia de la hipótesis nula es muy baja debe ser rechazada y, por tanto,
aceptar la alternativa y afirmar diferencias entre los grupos.
EZAnalyze ANOVA Report - ANOVA of AXENOFO by CONTACT
ANOVA Table
Source of Variance SS DF MS F
Between Groups 1514,141 2,000 757,071 7,738
Within Groups 9490,609 97,000 97,841
Total 11004,750
P ,001
Eta Squared ,138
The ANOVA results indicate that at least two of the groups differed significantly
Tabla 3. Prueba F de Snedecor (ANOVA)
Como en este caso se cuenta con más de dos grupos, la prueba F de Snedecor no informa entre qué
grupos se producen las diferencias. Para averiguarlo debe observarse la tabla de contrastes
posteriores (Tabla 4). En esta tabla se comparan las diferencias entre cada grupo por separado, es
decir, el grupo 1 con el grupo 2, el grupo 1 con el grupo 3 y el grupo 2 con el grupo 3.
La forma de interpretar los contrastes posteriores es igual que la de cualquier otro contraste de
hipótesis. En realidad, no son más que pruebas T de Student para cada par de grupos observados.
Debe observarse por tanto, la probabilidad asociada a ese estadístico T (P-Unadjusted). Si ese valor
es inferior a 0,05, las diferencias entre las puntuaciones de los dos grupos son significativas.
En este ejemplo se han encontrado diferencias significativas entre los grupos 1 y 2 y entre los
grupos 2 y 3. En cambio, las diferencias no son estadísticamente significativas entre los grupos 1 y
3. Esta tabla también ofrece información sobre el valor exacto de esa diferencia de medias en la
columna “mean difference”
Post Hoc tests Comparison Mean Difference T-Value P - Unadjusted P - Bonferroni Eta Squared
Group_1
1 and 2 5,459 2,349 ,022 ,065 ,076
1 and 3 4,315 1,747 ,085 ,256 ,044
Group_2
2 and 3 9,774 3,917 ,000 ,001 ,201
Tabla 4. Contrastes posteriores (post hoc)
Finalmente los resultados se acompañan de un gráfico de barras que muestra las medias en
xenofobia de los tres grupos comparados (Figura 12).
17
Enrique Navarro Asencio (@eduktive)
postest son significativas, siendo más altas en el postest. Esto quiere decir que el programa de
educación intercultural ha mejorado el nivel de conocimientos sobre otras culturas y religiones.
EZAnalyze Results Report - Paired T-Test of INFORMA2 with INFORMA3
N Pairs: 100
Mean Difference: -2,840
SE of Diff.: ,208
Eta Squared: ,650
T-Score: 13,636
P: ,000
The difference between INFORMA2 and INFORMA3 is significant
Tabla 5. Resultados prueba T para dos grupos relacionados
Los resultados se acompañan de un gráfico de barras que plasma las medias de las puntuaciones
pretest y postest.
19
Enrique Navarro Asencio (@eduktive)
20
Enrique Navarro Asencio (@eduktive)
Este estadístico puede tomar valores entre -1 y +1. El cero quiere decir ausencia de correlación. A
medida que el valor se acerca a los extremos (-1 o +1) la correlación es más potente. El signo señala
la direccionalidad de la correlación. Un valor negativo quiere decir que a medida que aumentan los
valores de una variable disminuyen los de la otra (correlación inversa). En cambio, si el valor es
positivo, a medida que aumentan unos también lo hacen los otros y viceversa (correlación directa).
Por ejemplo, si se seleccionan 30 individuos y se mide su peso y altura. Utilizando estas dos
variables como referencia es posible elaborar un gráfico de dispersión como el siguiente (Figura
15):
21
Enrique Navarro Asencio (@eduktive)
A simple vista puede observarse una relación directa entre las variables peso y altura, es decir, a
media que la altura es mayor también lo es el peso. Aunque los gráficos de dispersión permiten
observar el sentido de la relación (ver Figura 17), para conocer el grado exacto de la relación es
necesario calcular un índice de correlación.
22
Enrique Navarro Asencio (@eduktive)
23
Enrique Navarro Asencio (@eduktive)
Esto índica que la hipótesis nula planteada tiene pocas probabilidades de ocurrencia y, por tanto,
debe ser rechazada.
Comprensión lectora (0-30)
Mann-Whitney U 63,000
Wilcoxon W 234,000
Z -2,799
Asymp. Sig. (2-tailed) ,005
a. Not corrected for ties.
Tabla 9. Prueba U de Mann-Whitney
En este caso se pueden afirmar diferencias en la variable dependiente (comprensión lectora) entre
los grupos. El valor de la probabilidad asociada es igual a 0,005, inferior al 0,05 que se utiliza como
margen de error.
Para conocer qué grupo ha obtenido mayores puntuaciones en la variable dependiente debe
observarse la tabla de rangos. Un mayor rango índica que ese grupo obtiene mayores puntuaciones
en la variable dependiente.
25
Enrique Navarro Asencio (@eduktive)
Test Statisticsa
Comprensión lectora (0-30)
Chi-Square 4,738
df 2
Asymp. Sig. ,094
a. Kruskal Wallis Test
Tabla 11. Prueba H de Kruskal Wallis
Aunque en la tabla aparezca el estadístico Chi-square (chi-cuadrado), el estadístico utilizado es H
de Kruskal Wallis. Chi-cuadrado es solo una transformación porque H no tiene distribución de
probabilidad conocida y, por ese motivo, se transforma en chi para poder asignar esos valores de
probabilidad.
En este caso la probabilidad asociada al estadístico H es de 0,094. Valor que supera el 0,05
establecido como límite. Por tanto, no se pueden asumir diferencias estadísticamente significativas
entre los grupos comparados. Debe aceptarse la hipótesis nula.
26
Enrique Navarro Asencio (@eduktive)
Media de Suma de
N Rangos Rangos
Nivel de Vocabulario (postest) - Nivel de Rangos Negativosa 0a ,00 ,00
Vocabulario (pretest) Rangos Positivosb 3b 2,00 6,00
Empatesc 33c
Total 36
a. Nivel de Vocabulario (postest) < Nivel de Vocabulario (pretest)
b. Nivel de Vocabulario (postest) > Nivel de Vocabulario (pretest)
c. Nivel de Vocabulario (postest) = Nivel de Vocabulario (pretest)
Tabla 12. Rangos. Prueba W de Wilcoxon
Es necesario analizar la Tabla 13 para comprobar la existencia de diferencias estadísticamente
significativas entre pretest y postest.
Test Statisticsb
Nivel de Vocabulario
(postest) - Nivel de
Vocabulario (pretest)
Z -1,732a
Asymp. Sig. (2-tailed) ,083
a. Basado en rangos negativos.
b. Wilcoxon Signed Ranks Test
Tabla 13. Prueba W de Wilcoxon
El valor de probabilidad asociada al estadístico calculado es de 0,083, valor que se encuentra por
encima de 0,05. Por tanto, debe aceptarse la hipótesis nula y no se pueden afirmar diferencias
entre las puntuaciones de pretest y postest.
27
Enrique Navarro Asencio (@eduktive)
VOCA_Post
No Supera Supera Total
VOCA_Pr No Recuento 10 7 17
e Supera % dentro de COM2 58,8% 41,2% 100,0%
Supera Recuento 5 8 13
% dentro de COM2 38,5% 61,5% 100,0%
Total Recuento 15 15 30
% dentro de COM2 50,0% 50,0% 100,0%
Tabla 14. Tabla de contingencia
Para comprobar si los cambios entre pretest y postest son estadísticamente significativos debe
observarse la siguiente tabla:
Pruebas de chi-cuadrado
Sig. exacta
Valor (bilateral)
Prueba de McNemar ,774a
N de casos válidos 30
a. Utilizada la distribución binomial
Tabla 15. Prueba de mcnemar
El resultado de la prueba indica que la probabilidad asociada al estadístico (o,774) supera al nivel
de error asumido (0,05) y, por tanto, debe aceptarse la hipótesis nula y afirmar que no hay un
mayor número de casos que supere la prueba de vocabulario en el postest que en el pretest.
28
Enrique Navarro Asencio (@eduktive)
29
Enrique Navarro Asencio (@eduktive)
30
Enrique Navarro Asencio (@eduktive)
En la tabla de resultados (Tabla 18) aparecen dos coeficientes de correlación porque es una tabla
simétrica. Incluye los valores de correlación entre madurez lectora y nivel de vocabulario y también
entre nivel de vocabulario y madurez lectora.
El resto de coeficientes de correlación para variables ordinales (Tabla 19) muestran valores muy
similares:
Asymp. Std.
Value Error Approx. T Approx. Sig.
Ordinal by Ordinal Kendall's tau-b ,902 ,051 8,947 ,000
Kendall's tau-c ,813 ,091 8,947 ,000
Gamma 1,000 ,000 8,947 ,000
N of Valid Cases 36
Tabla 19. Correlación tau-b, tau-c y gamma entre Madurez lectora y nivel de vocabulario categorizadas.
Todos los coeficientes resultan significativos. Los valores de probabilidad asociada (Approx. Sig.)
son inferiores a 0,05. Un análisis en profundidad de cada uno de ellos indican que tau-b es el que
obtiene un valor más parecido a Spearman (Tau-b= 0,902 y Spearman= 0,916). El coeficiente
Gamma indica una correlación perfecta entre las variables, con un valor de 1. En cambio, tau-c es el
más conservador de los tres, con un valor de 0,813. No obstante, las diferencias entre coeficientes
son mínimas. En todos los casos la intensidad de la correlación es alta.
31
Enrique Navarro Asencio (@eduktive)
Analizando la tabla de contingencia se observa cierta tendencia. Hay un mayor número de casos
con nivel de vocabulario alto y que han asistido a preescolar. En cambio, los que no han asistido a
preescolar tienen un mayor número de casos con nivel de vocabulario bajo.
Categorización Nivel de Vocabulario
Baja Media Alta Total
Asistencia a Preescolar Sí 1 9 6 16
No 6 11 1 18
Total 7 20 7 34
Tabla 20. Tabla de contingencia de Asistencia a preescolar y nivel de vocabulario
Los resultados también incluyen un gráfico de barras (Figura 20) con la misma información que la
tabla de contingencia:
33