Clase Practica 9 - Tests No Parametricos - Robert Jiménez

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1de 8

Clase práctica Pruebas de contraste no paramétrica en el RKward

Tema I. Pruebas de contraste de hipótesis no paramétricas


 Muestras independientes
 Muestras relacionadas
 Muestras con más de 2 grupos (ANOVA 1)
Objetivo: Aplicar comparaciones estadísticas no paramétricas.
Mendenhall, W. Beaver, R.J., y Beaver B.M. (2012) Introducción a la probabilidad y estadística, 11 ed. D.F. México,
México. Cengage Learning.
Pruebas no paramétricas

Ejercicios

1. Los siguientes datos nos dan el peso de comida (en Kg.) consumidos por adulto y día en diferentes
momentos en un año. Usar un contraste no paramétrico para comprobar si el consumo de comida
es el mismo en los 4 meses considerados.

Estadísticos descriptivos de KILOGRAMOS


 Variables: KILOGRAMOS (Kilogramos consumidos)
 Eliminar valores desconocidos: Si

Media Mediana Moda Perdidos Válidos

KILOGRAMOS 4.77 4.7 4.7 0 20

Test de normalidad de Shapiro-Wilk


 Variable: KILOGRAMOS (Kilogramos consumidos)

Estadístico W p-valor
0.9682101 0.7167183
Test de normalidad de Shapiro-Wilk
 Variable: KILOGRAMOS (Kilogramos consumidos)
 Según: MESES (Meses analizados)

Grupo Estadístico W p-valor


Febrero 0.9020198 0.4211497
Mayo 0.951388 0.7471008
Agosto 0.9140781 0.492481
Noviembre 0.9899775 0.9796155

Test de Levene para la comparación de varianzas de KILOGRAMOS


según MESES
 Comparación de: KILOGRAMOS (Kilogramos consumidos)
 Según: MESES (Meses analizados)
 Variabilidad con respecto a la: Mediana

Variable Niveles del factor Grados de libertad Estadístico F p-valor


Febrero
Mayo 3
KILOGRAMOS 0.6568627 0.5903598
Agosto 16
Noviembre

Hasta ahora podemos tranquilamente usar los Tests Paramétricos, pues tanto
Normalidad como Homocedasticidad han sido mayores a p=0,05; pero igualmente
realizaremos el Test de Kruskal-Wallis.

Test de Kruskal-Wallis para la comparación de muestras


independientes
 Comparación de: KILOGRAMOS (Kilogramos consumidos)
 Según: MESES (Meses analizados)

Estadístico Chi p-valor


14.96979 0.001842652

Comparación por pares

Pares Diferencia observada Diferencia crítica Diferencias significativas


Febrero-Mayo 8.2 9.871455 NO
Febrero-Agosto 4.1 9.871455 NO
Febrero-Noviembre 5.5 9.871455 NO
Mayo-Agosto 4.1 9.871455 NO
Mayo-Noviembre 13.7 9.871455 SI
Agosto-Noviembre 9.6 9.871455 NO
Diagrama de caja de KILOGRAMOS
 Variable(s): KILOGRAMOS (Kilogramos consumidos)
 Variable(s) de agrupación: MESES (Meses analizados)

Sólo entre Mayo y Noviembre existe una diferencia significativa; pero no hay diferencia
significativa entre: Febrero-Mayo, Febrero-Agosto, Febrero-Noviembre, Mayo-Agosto
y Agosto-Noviembre
2. Se ha realizado un estudio para investigar el efecto del ejercicio físico en el nivel de colesterol en la sangre.
En el estudio participaron once personas, a las que se les midió el nivel de colesterol antes y después de
desarrollar un programa de ejercicios. Los resultados obtenidos fueron los siguientes:

Utilizando el contraste más adecuado, ¿se puede concluir que el ejercicio físico disminuye el nivel de colesterol?

Test de normalidad de Shapiro-Wilk


 Variable: NIVEL.PREVIO (Nivel previo)

Estadístico W p-valor
0.929637 0.4443308

Test de normalidad de Shapiro-Wilk


 Variable: NIVEL.POSTERIOR (Nivel posterior)

Estadístico W p-valor
0.6797544 0.0005011644
Test de Wilcoxon para la comparación de dos muestras pareadas
 Comparación de: NIVEL.PREVIO (Nivel previo)
 Con: NIVEL.POSTERIOR (Nivel posterior)
 Hipótesis alternativa: Bilateral
 Tipo de prueba: Aproximación normal con correción por continuidad
 Nivel de confianza del intervalo: 0.95

Nivel de confianza Intervalo de confianza para la


Variables Estadístico W p-valor
% diferencia de medias
NIVEL.PREVIO (Nivel previo)
-8.999985
NIVEL.POSTERIOR (Nivel 16.5 0.8879537 95
27.99999
posterior)

H0 : No existen diferencias entre el antes y el después de las mediciones


Hi : Existen diferencias entre el antes y el después de las mediciones
Según esta experimentación el ejercicio físico no influye en la disminución de colesterol,
debido a que la p es mayor a 0, 05, entonces se cumple H0 al no existir diferencias.
3. Para comparar las dificultades presentados por un grupo de problemas de lógica, se han seleccionado
aleatoriamente a ocho individuos a los que se les ha planteado tres pruebas iguales, a cada uno y se han
anotado los tiempos, en minutos, que han tardado en resolverlos. Los resultados obtenidos son

Prueba Prueba Prueba


1 2 3
38 6 35
22 4 9
14 8 8
8 2 4
6 4 8
10 14 10
14 2 5
8 6 3

Utilizando el contraste más adecuado, ¿se puede concluir que existen diferencias significativas en los tiempos de
resolución de las tres pruebas?

Test de normalidad de Shapiro-Wilk


 Variable: TIEMPO (Minutos)

Estadístico W p-valor
0.7342932 2.962455e-05

Test de normalidad de Shapiro-Wilk


 Variable: TIEMPO (Minutos)
 Según: PRUEBAS (Prueba 1, 2 y 3)

Grupo Estadístico W p-valor


Prueba 1 0.8014587 0.02967278
Prueba 2 0.8611888 0.1233922
Prueba 3 0.6486221 0.0005834208

Test de Levene para la comparación de varianzas de TIEMPO según PRUEBAS


 Comparación de: TIEMPO (Minutos)
 Según: PRUEBAS (Prueba 1, 2 y 3)
 Variabilidad con respecto a la: Mediana

Variable Niveles del factor Grados de libertad Estadístico F p-valor


Prueba 1
2
TIEMPO Prueba 2 0.71038 0.5028913
21
Prueba 3

Hasta ahora podemos tranquilamente usar los Tests Paramétricos, pues tanto
Normalidad como Homocedasticidad han sido mayores a p=0,05; pero igualmente
realizaremos el Test de Kruskal-Wallis.

Test de Kruskal-Wallis para la comparación de muestras independientes


 Comparación de: TIEMPO (Minutos)
 Según: PRUEBAS (Prueba 1, 2 y 3)

Estadístico Chi p-valor


7.065699 0.02922152

Comparación por pares


Pares Diferencia observada Diferencia crítica Diferencias significativas
Prueba 1-Prueba 2 9.3125 8.463997 SI
Prueba 1-Prueba 3 5.125 8.463997 NO
Prueba 2-Prueba 3 4.1875 8.463997 NO

Diagrama de caja de TIEMPO


 Variable(s): TIEMPO (Minutos)
 Variable(s) de agrupación: PRUEBAS (Prueba 1, 2 y 3)

Sólo entre Prueba 1-Prueba 2 existe una diferencia significativa; pero no hay diferencia
significativa entre: Prueba 1-Prueba 3 Prueba 2-Prueba 3.
4. Las notas obtenidas en un examen en dos grupos de alumnos que han seguido metodologías de estudio distintas han
sido:

Metodología A: 5,8 3,2 8,0 7,3 7,1 2,1 5,0 4,4 4,2 6,7
Metodología B: 8,1 5,4 7,2 7,5 6,3 8,2 6,0 7,8
Utilizando el contraste más adecuado, ¿se puede concluir que existen diferencias en la nota
media según cada metodología?

Test de normalidad de Shapiro-Wilk


 Variable: NOTAS

Estadístico W p-valor
0.9233089 0.1479448

Test de normalidad de Shapiro-Wilk


 Variable: NOTAS
 Según: METODOLOG.A (Metodología A y B)

Grupo Estadístico W p-valor


Metodología A 0.9614362 0.802118
Metodología B 0.9158255 0.396915

Test de Levene para la comparación de varianzas de NOTAS según


METODOLOG.A
 Comparación de: NOTAS
 Según: METODOLOG.A (Metodología A y B)
 Variabilidad con respecto a la: Mediana

Variable Niveles del factor Grados de libertad Estadístico F p-valor


Metodología A 1
NOTAS 3.941789 0.06451517
Metodología B 16

Hasta ahora podemos tranquilamente usar los Tests Paramétricos, pues tanto Normalidad
como Homocedasticidad han sido mayores a p=0,05; pero igualmente realizaremos el Test de
Mann-Whitney.

Test U de Mann Whitney para la comparación de dos muestras


independientes
 Comparación de: NOTAS
 Según: METODOLOG.A (Metodología A y B)
 Hipótesis alternativa: Bilateral
 Tipo de prueba: Aproximación normal con correción por continuidad
 Nivel de confianza del intervalo: 0.95

Nivel de confianza Intervalo de confianza para la diferencia


Variable Niveles del factor Estadístico U p-valor
% de medias
Metodología A -3.4
NOTAS 17 0.04342063 95
Metodología B -0.1

Diagrama de caja de NOTAS


 Variable(s): NOTAS
 Variable(s) de agrupación: METODOLOG.A (Metodología A y B)

H0 : Las dos muestras pertenecen a la misma población


Hi : Las dos muestras no pertenecen a la misma población
El valor de p es menor a 0, 05, por lo tanto, hay diferencia en las notas según cada
metodología. Siendo mayor la nota media de la Metodología B, como lo indican los
siguientes datos:

Grupo METODOLOG.A = Metodología A


Media Perdidos Válidos

NOTAS 5.38 0 10

Grupo METODOLOG.A = Metodología B


Media Perdidos Válidos

NOTAS 7.0625 0 8

5. En un experimento diseñado para estimar los efectos de la inhalación prolongada de óxido de


cadmio, 15 animales de laboratorio sirvieron de sujetos para el experimento, mientras que 10
similares sirvieron de grupo control. La variable de interés fue el nivel de hemoglobina después del
experimento. Se desea saber si puede concluirse que la inhalación prolongada de óxido de cadmio
disminuye el nivel de hemoglobina según los siguientes datos que presentamos:
Test de normalidad de Shapiro-Wilk

 Variable: HEMOGLOBINA (Nivel de Hemoglobina)

Estadístico W p-valor
0.9410938 0.1568933

Test de normalidad de Shapiro-Wilk


 Variable: HEMOGLOBINA (Nivel de Hemoglobina)
 Según: EXPOSICION (Expuestos y No expuestos)

Grupo Estadístico W p-valor


Expuestos 0.8947275 0.0790961
No expuestos 0.9096581 0.2786506

Test de Levene para la comparación de varianzas de HEMOGLOBINA según


EXPOSICION
 Comparación de: HEMOGLOBINA (Nivel de Hemoglobina)
 Según: EXPOSICION (Expuestos y No expuestos)
 Variabilidad con respecto a la: Mediana

Variable Niveles del factor Grados de libertad Estadístico F p-valor


Expuestos 1
HEMOGLOBINA 1.004189 0.3267259
No expuestos 23

Hasta ahora podemos tranquilamente usar los Tests Paramétricos, pues tanto Normalidad
como Homocedasticidad han sido mayores a p=0,05; pero igualmente realizaremos el Test de
Mann-Whitney.

Test U de Mann Whitney para la comparación de dos muestras


independientes
 Comparación de: HEMOGLOBINA (Nivel de Hemoglobina)
 Según: EXPOSICION (Expuestos y No expuestos)
 Hipótesis alternativa: Bilateral
 Tipo de prueba: Aproximación normal con correción por continuidad
 Nivel de confianza del intervalo: 0.95

Niveles del Nivel de Intervalo de confianza para la


Variable Estadístico U p-valor
factor confianza % diferencia de medias
HEMOGLOBINA (Nivel de Expuestos -2.30007
25 0.006007872 95
Hemoglobina) No expuestos -0.5999723

H0 : Las dos muestras pertenecen a la misma población


Hi : Las dos muestras no pertenecen a la misma población
El valor de p es menor a 0, 05, por lo tanto, hay diferencia en los niveles de
hemoglobina cuando inhalamos óxido de cadmio de manera prolongada.

También podría gustarte