Test T Student de Comparacion de Muestras

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 35

TÉCNICAS ESTADÍSTICAS

APLICADAS EN NUTRICIÓN
Y SALUD

Contrastes de hipótesis paramétricos para una y varias muestras: contrastes


sobre la media, varianza y una proporción. Contrastes sobre la diferencia de
medias, razón de varianzas y diferencia de proporciones

Dra. Fátima Olea Serrano


Departamento de Nutrición y Bromatología. UGR
Test t-Student

Permite decidir si dos variables aleatorias normales (gausianas) y con la misma


varianza tienen medias diferentes.

Puede aplicarse en numerosos contextos, para comprobar si la modificación en


las condiciones de un proceso (humano o natural) esencialmente aleatorio
producen una elevación o disminución de la media poblacional.

Opera decidiendo si una diferencia en la media muestral entre dos muestras es


estadísticamente significativa,

y poder

afirmar que las dos muestras corresponden a distribuciones de


probabilidad de media poblacional distinta,

afirmar que la diferencia de medias puede deberse a oscilaciones


estadísticas al azar
2
Condiciones de aplicación del test t para dos medias

Las condiciones de aplicación del test t para comparar dos medias son:
A) Normalidad o n > 30 en cada grupo.
B) Homogeneidad de varianzas.

A) Normalidad
La variable dependiente ha de ser cuantitativa y seguir una distribución normal.
Para comprobarlo realizamos los siguientes pasos:
- Cuando tanto n1 como n2 son mayores o iguales que 30 se puede presumir
que la aproximación a la normal será buena.
- Pero se debe comprobar la normalidad de la variable dependiente si la
muestra no es muy grande (menores de 30).

3
…….Condiciones de aplicación del test t para dos medias

l) Comprobar que el máximo y el mínimo queden dentro del intervalo definido por
tres desviaciones estándar por encima y por debajo de la media.
Media ± 3 Desv. Estándar

2) Que la asimetría (en valor absoluto) sea menor que dos veces error estándar.
Asimetría < 2 errores estándar de asimetría

3) Que la curtosis (en valor absoluto) sea menor a dos veces su error estándar.
Curtosis < 2 errores estándar de curtosis

Si se cumplen estos tres requisitos en cada grupo, podrá asumirse que su


distribución es aproximadamente normal.

Hacerlo en SPSS con explorar o bien con un test de normalidad con SPSS (tests de
Kolmogorov-Smirnov con la corrección de Lilliefors o de Shapiro-Wilks). Este test
debe realizarse separadamente para cada uno de los dos grupos (llamados
"factores", en el menú "explorar" dentro de "estadísticos descriptivos" de SPSS). 4
B) Homogeneidad de varianzas ("homoscedasticidad")

Comprobar que las varianzas de ambos grupos son iguales.


La prueba F para la homogeneidad de varianzas mostrara la existencia o no de
diferencias significativas entre las varianzas.
Se calcula el cociente entre las varianzas de ambos grupos.

F= Varianza mayor / Varianza menor


Buscar en las tablas de la F de Snedecor el valor crítico (para p = 0,05).

Si p > 0,10, entonces podrá asumirse que las varianzas son homogéneas

Se puede usar el test convencional de la t de Student


Hay otros tests para comprobar que las varianzas son homogéneas: test de
Barttlet, test de Levene etc.

Como hipótesis nula (H0) las varianzas son iguales.

Si el valor p correspondiente al test de Levene es inferior a 0,05, se asume que


las varianzas son distintas. 5
Prueba de Levene

Prueba estadística inferencial utilizada para evaluar la igualdad de las varianzas para
una variable calculada para dos o más grupos.

Algunos procedimientos estadísticos comunes asumen que las varianzas de las


poblaciones de las que se extraen diferentes muestras son iguales.

H0 varianzas poblacionales son iguales


Si el P-valor resultante de la prueba de Levene es inferior a un cierto nivel de
significación (0.05), las varianza no son iguales

La prueba de Levene se utiliza a menudo antes de que una comparación de medias.

Si la prueba de Levene muestra significación, se debe cambiar a pruebas no


paramétricas.

6
Si no se pudiese asumir la normalidad, se intentará una transformación de los
datos en sus logaritmos y repetir con la variable transformada todo el proceso.

Si hay asimetría positiva suele mejorar la aproximación a la normal al hacer la


transformación logarítmica.

Pero si tampoco se aproxima a la normalidad, se deberá aplicar una prueba no


paramétrica, en este caso la U de Mann-Whitney.

Ademas si alguno de los grupos tenga menos de 10 observaciones, es mejor


usar directamente la U de Mann-Whitney

7
TEST DE LA T DE STUDENT

La distribución t de Student es parecida a la normal y la sustituye cuando no se conoce la


desviación estándar poblacional (σ )

Como casi nunca se suele disponer de σ, el uso de la t de Student es muy frecuente.

Si la muestra es elevada («>100), es casi equivalente usar la t de Student o la normal. Esta


diferencia tiene poca relevancia práctica.

La t de Student tiene en cuenta el tamaño de muestra. Hay una t distinta para cada tamaño
de la muestra

Los grados de libertad son n-1 cuando hay una sola muestra, siendo n el tamaño de la mues-
tra o N-2 cuando se comparan dos muestras (siendo N la suma de los individuos de los dos
grupos), es decir

(n 1- 1) + (n 2- 1) = ( n¡ +n 2-2)=N-2

El problema más simple que se puede resolver con la t de Student es con una sola muestra,
ésta tendría n-1 grados de libertad
8
Prueba t para muestra única

En esta prueba se evalúa la hipótesis nula de que la media de la población


estudiada es igual a un valor especificado μ0, se hace uso del estadístico t

donde es la media muestral, es la desviación estándar muestral y n es el


tamaño de la muestra.

Los grados de libertad utilizados en esta prueba se corresponden al valor n − 1.

9
Analizar  comparar medias  prueba t para una muestra

10
La t de Student tiene en cuenta el tamaño de la muestra.
Hay una t distinta para cada tamaño de muestra
Los grados de libertad son n-1
El problema mas sencillo a aplicar la t de Student es referido a una sola muestra que
tendría n-1 grados de libertad.
Hacer un ejemplo .
mg de Fe estimados en 24 horas para un grupo de población

Estadísticos para una muestra

Desviación Error típ. de


N Media típ. la media
Fe 241 11.0261 4.26505 .27474

Prueba para una m uestra

Valor de prueba = 0
95% Intervalo de
conf ianza para la
Dif erencia dif erencia
t gl Sig. (bilateral) de medias Inf erior Superior
Fe 40.134 240 .000 11.02614 10.4849 11.5673

11
COMPARAR UNA MEDIA CON UN VALOR DE REFERENCIA
La prueba t para una muestra efectúa un contraste de hipótesis para
comprobar si la media de una variable difiere de forma significativa de un valor
que nosotros mismos seleccionamos.
En este caso hay que seleccionar la variable elegida y el valor que queremos
contrastar. Al pulsar Aceptar se efectuará el contraste de hipótesis.

Estadísticos para una muestra


N Media Desviación típ. Error típ. de la
media
IMC 240 27,1010 5,44395 ,35141

Prueba para una muestra


Valor de prueba = 25
t gl Sig. Diferencia 95% Intervalo de
(bilateral) de medias confianza para la
diferencia
Inferior Superior
IMC 5,979 239 ,000 2,10100 1,4088 2,7933

12
13
TEST DE LA T DE STUDENT PARA DOS MUESTRAS INDEPENDIENTES

Prueba t para dos muestras independientes Iguales tamaños muestrales, iguales varianzas

Esta prueba se utiliza solamente cuando:


• los dos tamaños muestrales (esto es, el número, n, de participantes en cada grupo) son
iguales;
• se puede asumir que las dos distribuciones poseen la misma varianza.
El estadístico t a probar si las medias son diferentes se puede calcular como sigue:

es la desviación estándar combinada, 1 = grupo uno, 2 = grupo 2.

El denominador de t es el error estándar de la diferencia entre las dos medias.


Por prueba de significancia, los grados de libertad de esta prueba se obtienen
como 2n − 2 donde n es el número de participantes en cada grupo.

14
Diferentes tamaños muestrales, iguales varianzas

Esta prueba se puede utilizar únicamente si se puede asumir que las dos distribuciones
poseen la misma varianza.

El estadístico t si las medias son diferentes puede ser calculado como sigue:

las fórmulas, son generalizaciones del caso que se da cuando ambas muestras poseen
igual tamaño (sustituyendo n por n1 y n2).

En esta fórmula, n = número de participantes, 1 = grupo uno, 2 = grupo dos. n − 1 es el


número de grados de libertad para cada grupo, y el tamaño muestral total menos dos
(esto es, n1 + n2 − 2) es el número de grados de libertad utilizados para la prueba de
significancia.

15
Si no se puede asumir la normalidad, se realizar la transformación logarítmica de
los y se repite con la variable transformada todo el análisis.

Si hay asimetría positiva suele mejorar la aproximación a la normal al hacer la


transformación logarítmica.

EJEMPLOS……………………

Pero si tampoco entonces se aproxima a la normalidad, se deberá aplicar una


prueba no paramétrica, en este caso la U de Mann-Whitney.

De otra parte si alguno de los grupos tiene menos de 10 observaciones, es mejor


usar directamente la U de Mann-Whitney

16
Diferentes tamaños muestrales, diferentes varianzas
Esta prueba es también conocida como prueba t de Welch y es utilizada
únicamente cuando se puede asumir que las dos varianzas poblacionales son
diferentes
Los tamaños muestrales pueden o no ser iguales, y por lo tanto deben ser
estimadas por separado. El estadístico t a probar cuando las medias
poblacionales son distintas puede ser calculado como sigue:

Aquí s2 es el estimador sin sesgo de la varianza de las dos muestras,


n = número de participantes,
1 = grupo uno, 2 = grupo dos.
En este caso no es la varianza combinada.

17
Test t para dos medias independientes con varianzas heterogéneas (test
de Welch)

Este test es más robusto que el de varianzas homogéneas y es preferible por


muchas propiedades, requiere hacer dos modificaciones a lo anteriormente
visto.

1.- En el denominador de la t de Student, en vez de usar una única varianza


ponderada, se deben usar las varianzas de cada grupo separadamente para
calcular el error estándar.

2.- Los grados de libertad (g.l.*) ya no son N-2, sino que deben calcularse
usando una fórmula más compleja

18
Prueba t dependiente para muestras apareadas

Esta prueba se utiliza cuando las muestras son dependientes


- cuando se trata de una única muestra que ha sido evaluada dos veces
(muestras repetidas)

- cuando las dos muestras han sido emparejadas o apareadas

La diferencia D entre todos los pares tiene que ser calculada.


Los pares se forman ya sea con resultados de una persona antes y después de
la evaluación o entre pares de personas emparejadas en grupos de significancia

(por ejemplo, tomados de la misma familia o grupo de edad: véase la tabla).

Media (XD) y la desviación estándar (sD)

Constante μ0 es diferente de cero


Los grados de libertad utilizados son n − 1.
19
Pasos a dar en un test t para dos medias (varianzas homogéneas)

A. Estimación de la varianza conjunta.


la muestra total está dividida en dos grupos. La estimación de la varianza
conjunta de los dos grupos es la varianza ponderada s2, dada por la siguiente
fórmula:

B. Cálculo de la diferencia entre las dos medias. El cálculo de la diferencia de


medias se realiza mediante una simple sustracción o resta:

x1- x2
C. Cálculo del error estándar de la diferencia de medias (EEDM).

EEDM=

20
D. Test de la t de Student En vez de utilizar la distribución normal, se usa una t de
Student

A medida que el tamaño de muestra se hace mayor, la t de Student se parece más


a la Normal
t=

E. Comparar con las tablas de la t de Student.

Conocido el valor de t, compararlo con el que aparece en las tablas para N-2
grados de libertad.

Si el valor de t obtenido es mayor que el que aparece en las tablas Se rechaza la


hipótesis nula y sí hay diferencias significativas entre ambas medias.

Si el valor de t inferior al que aparece en las tablas no se rechazará la hipótesis nula


y no hay diferencias significativas
21
Intervalo de confianza para la diferencia de medias

Solo hemos calculado: "existen diferencias significativas" o "no existen


diferencias significativas".

Para estimar la magnitud de la diferencia entre ambos grupos, se soluciona


calculando unos límites de confianza a la diferencia de medias

Vamos a asumir que las varianzas sean homogéneas.

La expresión es parecida al intervalo de confianza para una media, pero en vez


de utilizar una media se utiliza una diferencia de medias y en vez del error
estándar de la media, se usa el error estándar de la diferencia de medias (EEDM)

22
Test t para comparar las medias de dos grupos independientes con SPSS
1.- Comprobar la normalidad si alguno de los dos grupos tiene menos de 30
observaciones.

En el menú "Explorar" se debe estratificar por la variable que define los grupos, es
decir, se pedirán "Gráficos con pruebas de normalidad" separadamente para cada
grupo.

Examinar si la curtosis y la asimetría son inferiores (en valor absoluto) al doble de sus
respectivos errores estándar, y si el máximo y el mínimo valor quedan dentro del
rango comprendido por la media ± 3 desviaciones estándar.

Test t para dos medias (datos no emparejados), se seleccionará dentro del menú

"Analizar", la opción "Comparar Medias" y —dentro de ella— la "Prueba T para


muestras independientes".

23
24
Seleccionamos la variable tratamiento y definimos los grupos:
25
26
27
Nuestros resultados
Comparación de medias entre grupos

28
Estadísticos de grupo
Sexo N Media Desviación Error típ. de
típ. la media
Masculino 87 26,7364 4,26134 ,45686
IMC
Femenino 153 27,3083 6,01716 ,48646

La hipótesis nula del test de Levene es la homoscedasticidad (igualdad de varianzas).


la significación estadística (p = 0,003) informa de que las varianzas no son iguales
(homogéneas).
Si éste valor p fuese superior a 0,05 se consideraría que las varianzas son iguales.
Prueba de
Levene para la
igualdad de
varianzas Prueba T para la igualdad de medias
95% Intervalo de
Error típ. confianza para la
Sig. Diferenci de la diferencia
(bilateral a de diferenci Superio
F Sig. t gl ) medias a Inferior r
IMC Se han asumido 9,328 ,003 -,782 238 ,435 -,57191 ,73159 -2,01313 ,86931
varianzas iguales
No se han -,857 226,68 ,392 -,57191 ,66736 -1,88693 ,74310
asumido 8
varianzas iguales
29
Sexo Estadístico Error típ.
IMC Masculino Media 26,7364 ,45686
Intervalo de confianza para la Límite 25,8282
media al 95% inferior
Límite 27,6446
superior
Media recortada al 5% 26,7794
Mediana 26,9598
Varianza 18,159 explorar
Desv. típ. 4,26134
Mínimo 15,94
Asimetría < 2 erroresMáximo
estándar de asimetría 35,64
Rango 19,70
Amplitud intercuartil 6,14
Asimetría -,133 ,258
Curtosis -,534 ,511
Femenino Media 27,3083 ,48646
Intervalo de confianza para la Límite 26,3472
media al 95% inferior
Límite 28,2694
superior
Media recortada al 5% 26,9854
Mediana 26,6272
Varianza 36,206
Desv. típ. 6,01716
Mínimo 16,23
Máximo 45,16
Rango 28,93
Amplitud intercuartil 8,56
Asimetría ,737 ,196 30
Curtosis ,389 ,390
Si p es menor de 0,05 no se sigue una distribución normal
Si p es mayor de 0,05 se sigue una distribución normal

Kolmogorov-Smirnova Shapiro-Wilk
Estadísti
Sexo Estadístico gl Sig. co gl Sig.
*
IMC Masculino ,053 87 ,200 ,990 87 ,783
Femenino ,071 153 ,060 ,959 153 ,000

La prueba de Kolmogórov-Smirnov, es una prueba no paramétrica que se utiliza


para determinar la bondad de ajuste de dos distribuciones de probabilidad entre
sí.

En el caso de que queramos verificar la normalidad de una distribución, la


prueba de Lilliefors conlleva algunas mejoras con respecto a la de Kolmogórov-
Smirnov; y, en general, el test de Shapiro–Wilk o la prueba de Anderson-Darling
son alternativas más potentes.

La prueba Kolmogórov-Smirnov es más sensible a los valores cercanos a la


mediana que a los extremos de la distribución.
31
32
33
hombres

mujeres

34
Test de la t de Student para dos muestras independientes

Hay diferencias significativas entre el IMC según sexo?

Prueba t para dos muestras independientes

Desviación Error típ. de


Sexo N Media típ. la media
IMC Hombre
160 20.6564 4.10296 .32437

Mujer 118 20.1914 3.84860 .35429

Prueba de Levene
para la igualdad de Prueba T para la igualdad de medias
varianzas
95% Intervalo de
confianza para la
diferencia
Diferenci Error típ.
Sig. a de de la Superio
F Sig. t gl (bilateral) medias diferencia Inferior r
IMC Se han asumido
1.419
varianzas .434 .511 .959 276 .339 .465 .485 -.489
iguales
No se han
asumido 260.60
.968 .334 .465 .480 -.480 1.41135
varianzas 9
iguales

También podría gustarte