Exposición
Exposición
Exposición
10/09/2024
GRUPO 4
Agregar para la expo mencionar tipos de pruebas parametricas y no parametricas, para la expo no usar ejemplos
de un proceso, mejor las opciones en cada paso
PARTE DE YAZMÍN
INTRODUCCIÓN:
El procedimiento general de prueba es un conjunto de pasos que seguimos cuando queremos
investigar algo o comprobar si una idea es correcta o no. Se utiliza mucho en ciencia para asegurar
que lo que descubrimos está basado en hechos y no solo en suposiciones,entonces, lo que se busca
es investigar un fenómeno,plantear y probar hipótesis y obtener conclusiones basadas en evidencia.
Este proceso es crucial porque garantiza que las investigaciones sean rigurosas, repetibles y
basadas en evidencia empírica. Permite validar o refutar teorías y es el fundamento del avance en
todas las ciencias . Normalmente este procedimiento se utiliza mucho en el método científico. El
procedimiento general de prueba tiene los siguientes pasos:
1. Observación
2. formular una hipótesis
3. Diseñar un experimento
4. Recolecta de datos
5. Analizar los datos
6. Contrastar la hipótesis
7. conclusiones
8. compartir los resultados
Ejemplo aplicado a la farmacia:
Imagina que estás desarrollando un nuevo tratamiento para una enfermedad. El procedimiento
general de prueba seguiría estos pasos:
Sin embargo esta exposición se va a basar en el contraste de hipótesis para un parámetro que se
basan en los pasos anteriormente dichos que son la análisis de resultados (paso 5) y el contraste de
hipótesis (paso 6). Cuando llegas al paso de analizar los datos en el procedimiento general de
prueba, necesitas una forma de decidir si tu hipótesis es correcta o no. Aquí es donde entra el
contraste de hipótesis que consiste en establecer un supuesto estadístico para el valor de un
parámetro y seguir una secuencia de pasos para probar la validez del mismo.
Los pasos son los siguientes:
(adjuntar pasos)*
Sin embargo mis compañeros van a profundizar más en cada paso
Pero antes primero vamos hablar de las paramétricas y no paramétricas.
.
Cuando llegamos al paso del contraste de hipótesis necesitamos decidir qué tipo de prueba
estadística vamos a utilizar para analizar los datos. Aquí es donde entra la diferencia entre pruebas
paramétricas y no paramétricas.
Las pruebas paramétricas son aquellas que asumen que los datos siguen una distribución
específica, como la distribución normal, las pruebas paramétricas son más robustas y tienen
mayor potencia estadística (capacidad de detectar efectos reales) cuando se cumplen sus supuestos.
Sin embargo, para aplicar pruebas paramétricas, hay ciertos aspectos clave que deben tenerse en
cuenta. También suelen requerir que los datos cumplan ciertas condiciones o supuestos, como:
● Normalidad: Los datos deben seguir una distribución normal (campana de Gauss). Esto
significa que la mayoría de los datos están concentrados cerca del valor promedio y la
cantidad de datos disminuye progresivamente hacia los extremos.
● Escala de medición: Los datos utilizados en pruebas paramétricas deben estar en una
escala de intervalo o razón. Esto significa que las variables deben ser numéricas y medir
cantidades continuas, como peso, altura, temperatura, etc.
● Varianza homogénea: Si estás comparando más de un grupo, las varianzas deben ser
similares entre ellos.
Las pruebas paramétricas generalmente requieren un tamaño de muestra más grande para
garantizar que los supuestos, como la normalidad, se cumplan de manera razonable.Un tamaño de
muestra mayor también mejora la potencia estadística, lo que hace más probable detectar diferencias
reales entre grupos
Las pruebas paramétricas pueden ser sensibles a los valores atípicos (outliers). Estos valores
extremos pueden afectar de manera importante el resultado del análisis, especialmente si los datos
son pocos.
Si los datos cumplen con estas condiciones, entonces utilizamos pruebas paramétricas. Ejemplos de
las pruebas paramétricas son : Prueba t de Student: Se usa para comparar las medias de dos
grupos (como en un experimento en el que comparas dos tratamientos diferentes). ANOVA (Análisis
de Varianza): Se utiliza para comparar las medias de tres o más grupos. Correlación de Pearson:
Para medir la relación entre dos variables continuas.
● Si quieres comprobar si el nuevo medicamento reduce el dolor más que un placebo, y los
datos de reducción del dolor siguen una distribución normal, puedes usar una prueba t para
comparar las medias de ambos grupos
Por otro lado tenemos las no paramétricas,las pruebas no paramétricas son más flexibles porque no
asumen que los datos sigan una distribución específica. Estas pruebas se utilizan cuando los
datos no cumplen los supuestos de las pruebas paramétricas, como:
Prueba de Mann-Whitney: Se utiliza para comparar dos grupos cuando los datos no siguen una
distribución normal.
Prueba de Kruskal-Wallis: Para comparar tres o más grupos cuando no se puede usar ANOVA.
Correlación de Spearman: Para medir la relación entre dos variables cuando los datos no son
normales o son ordinales.
El contraste de hipótesis usa cualquiera de estos dos tipos de pruebas según las características de
los datos del experimento, y nos ayuda a tomar decisiones objetivas sobre si aceptamos o
rechazamos la hipótesis nula, pero en términos de esta exposición vamos a hablar más de las
paramétricas
Ahora después de esta introducción un poquito extensa pero necesaria vamos a hablar de la
secuencia para realizar el contraste.
Les voy a hablar del primer paso que es Identificar y anotar los datos con que se cuenta y la
pregunta que origina el proceso. Es muy importante que antes de empezar a hacer el análisis se
tenga bien claro, que tipo de datos están disponibles, porque dependiendo de ellos, se elegirá el tipo
de planteamiento, el parámetro, el estadístico de contraste, etc.
Primero, necesitas saber qué parámetro estás evaluando y qué tipo de datos tienes. Aquí están
algunos de los parámetros comunes y los estadísticos de contraste asociados:
● Media: Si estás comparando medias entre grupos o evaluando la media de un solo grupo.
● Proporción: Si estás evaluando proporciones o porcentajes en lugar de medias.
● Varianza: Si estás comparando la variabilidad o dispersión de los datos.
● Zα/2: Valor crítico para el nivel de confianza deseado.
● σ: Desviación estándar poblacional (si no se conoce, se usa una estimación).
● E: Margen de error permitido
● Zα/2: Valor crítico para el nivel de confianza deseado.
● p: Proporción esperada de éxito.
● E: Margen de error permitido.
●
Los supuestos suelen incluir normalidad, igualdad de varianzas, y tipo de escala de medición. Aquí te
muestro cómo seleccionar el estadístico en función de estos supuestos:
a. Comparación de Medias
● Prueba t de Student para una muestra: Utiliza esta prueba si estás evaluando si la
media de una sola muestra es diferente de un valor conocido o teórico, y tus datos son
aproximadamente normales (para muestras pequeñas) o grandes (para muestras grandes).
○ Supuestos:
■ Datos aproximadamente normales.
■ Datos independientes.
■ Varianzas similares si se comparan con una media conocida.
● Prueba t de Student para dos muestras independientes: Utiliza esta prueba para
comparar las medias de dos grupos independientes.
○ Supuestos:
■ Datos aproximadamente normales.
■ Varianzas iguales entre los dos grupos (puedes usar una versión de la
prueba t sin esta suposición si las varianzas no son iguales).
● Prueba t de Student para dos muestras dependientes: Utiliza esta prueba para comparar
las medias de dos grupos relacionados (por ejemplo, antes y después de un tratamiento en el
mismo grupo de personas).
○ Supuestos:
■ Datos aproximadamente normales.
■ Datos emparejados (por ejemplo, medidas antes y después en la misma
persona).
● ANOVA (Análisis de Varianza): Utiliza esta prueba para comparar las medias de tres o más
grupos independientes.
○ Supuestos:
■ Datos aproximadamente normales.
■ Varianzas iguales entre los grupos.
■ Independencia de las observaciones.
b. Comparación de Proporciones
● Prueba de proporciones para una muestra: Utiliza esta prueba para comparar una
proporción observada con una proporción conocida o esperada.
○ Supuestos:
■ Tamaño de muestra suficientemente grande.
■ Los eventos son independientes.
● Prueba de chi-cuadrado para dos muestras independientes: Utiliza esta prueba para
comparar las proporciones entre dos grupos independientes.
○ Supuestos:
■ Tamaños de muestra grandes (idealmente, esperados > 5 en cada celda).
■ Datos categóricos independientes.
● Prueba de chi-cuadrado para una muestra: Utiliza esta prueba para comparar las
proporciones observadas con las esperadas en una sola muestra.
c. Comparación de Varianzas
● Prueba de F: Utiliza esta prueba para comparar las varianzas entre dos o más grupos.
○ Supuestos:
■ Datos aproximadamente normales.
■ Varianzas comparadas (para dos grupos).
● Tamaño de Muestra: Las pruebas pueden variar en su aplicación dependiendo del tamaño
de la muestra. Por ejemplo, la prueba t es adecuada para muestras pequeñas, mientras que
para muestras grandes, la aproximación normal puede ser suficiente.
● Tipo de Datos: Los datos deben cumplir con los requisitos de escala (intervalo/razón para
medias, nominal/categórica para proporciones).
Ejemplos Prácticos
Prueba t de Student
La prueba t de Student se utiliza para comparar medias y es especialmente útil cuando el tamaño de
la muestra es pequeño y/o la varianza poblacional es desconocida. Dependiendo del diseño del
estudio y los datos disponibles, hay varias versiones de la prueba t de Student.
Objetivo: Comparar la media de una sola muestra con una media poblacional conocida o teórica.
Supuestos:
Uso:
Supuestos:
Uso:
Objetivo: Comparar las medias de dos grupos relacionados (por ejemplo, antes y después del
tratamiento en el mismo grupo).
Fórmula: t=DˉsD/nt = \frac{\bar{D}}{s_D / \sqrt{n}}t=sD/nDˉ
Supuestos:
Uso:
● Evaluar si hay una diferencia significativa en las medias de dos condiciones relacionadas.
Prueba Z
La prueba z se utiliza principalmente para comparar medias cuando se conoce la desviación estándar
poblacional o cuando el tamaño de la muestra es suficientemente grande. Es más precisa cuando las
condiciones de normalidad están garantizadas o cuando se usa para proporciones.
Objetivo: Comparar la media de una muestra con una media poblacional conocida cuando se
conoce la desviación estándar poblacional.
Supuestos:
Uso:
Uso:
● Tamaño de Muestra: La prueba t es preferida para muestras pequeñas (n < 30) y cuando la
desviación estándar poblacional no es conocida. La prueba z se utiliza cuando el tamaño de
la muestra es grande (n > 30) o la desviación estándar poblacional es conocida.
● Desviación Estándar: La prueba t utiliza la desviación estándar de la muestra (s), mientras
que la prueba z utiliza la desviación estándar poblacional (σ\sigmaσ).
● Distribución: La prueba t sigue una distribución t de Student, que se ajusta según los grados
de libertad, mientras que la prueba z sigue una distribución normal estándar.
En resumen:
● Utiliza la prueba t cuando trabajas con muestras pequeñas o cuando la desviación estándar
poblacional no es conocida.
● Utiliza la prueba z para muestras grandes o cuando la desviación estándar poblacional es
conocida y los datos siguen una distribución normal.
TOMA DE DECISIÓN
VALOR P
Se trata de obtener los resultados observados (o más extremos) si la hipótesis nula fuera cierta.
Cuanto más pequeño sea el valor p, menos probable es que los resultados se deban al azar.
Donde se plantea un nivel de significancia que es el umbral que establecemos antes de realizar la
prueba para decidir si rechazamos o no la hipótesis nula.
Si p ≤ α:
• Rechazamos la hipótesis nula, en otras palabras significa que los resultados obtenidos son
estadísticamente significativos. Es decir, es muy poco probable que estos resultados se hayan
producido por azar, y por lo tanto, tenemos evidencia para rechazar la hipótesis nula y aceptar la
hipótesis alternativa.
Si p > α:
ESTADÍSTICO DE CONTRASTE
Mide cuán lejos están los datos observados de lo que se espera si la hipótesis nula fuera verdadera.
El valor crítico es el umbral que define si esta distancia es suficientemente grande como para
considerarla significativa, dado el nivel de confianza.
Rechazamos la hipótesis nula, Significa que los datos se encuentran en la región de rechazo. Es
decir, los resultados observados son demasiado extremos para ser compatibles con la hipótesis nula.
En este caso, rechazamos la hipótesis nula porque los resultados indican que es altamente
improbable que los datos se ajusten a esta hipótesis. Esto implica que hay suficiente evidencia
estadística para apoyar la hipótesis alternativa.
No rechazamos la hipótesis nula, En este caso, no hay suficiente evidencia para concluir que existe
una diferencia significativa. Los datos no son lo suficientemente extremos como para descartar la
hipótesis de que no hay diferencia entre los grupos o variables.
CONCLUSIÓN
1. Reiterar el objetivo del estudio: Recuerda brevemente cuál era la pregunta de investigación
que se quiere responder.
• Explica qué significan estos resultados en términos del problema que estás estudiando.
• Relaciona los resultados estadísticos con el fenómeno real que estás investigando.
4. Limitaciones del estudio:
• Se menciona cualquier limitación que pueda afectar la generalización de los resultados (por
ejemplo, tamaño de la muestra, supuestos no cumplidos).
Ejercicio:
Lee las siguientes afirmaciones sobre la prueba t de Student y decide si son verdaderas o falsas.
Respuestas:
Ejercicio:
Lee las siguientes afirmaciones sobre pruebas paramétricas y no paramétricas y decide si son
verdaderas o falsas.
1. Las pruebas paramétricas requieren que los datos sigan una distribución normal.
2. La prueba de Wilcoxon es una prueba paramétrica que se usa para comparar dos
grupos independientes.
3. La prueba t de Student para dos muestras independientes es una prueba paramétrica.
4. Las pruebas no paramétricas son más flexibles en cuanto a los supuestos sobre la
distribución de los datos.
5. La prueba de Mann-Whitney U es equivalente a la prueba t de Student para muestras
independientes, pero no requiere que los datos sean normales.
6. La prueba de Kruskal-Wallis es una prueba paramétrica utilizada para comparar más
de dos grupos independientes.
7. Las pruebas no paramétricas son generalmente menos poderosas que las pruebas
paramétricas cuando se cumplen los supuestos de normalidad.
8. La prueba de Friedman es una prueba no paramétrica que se utiliza para comparar
más de dos grupos relacionados.
9. La prueba de chi-cuadrado se utiliza para analizar la relación entre dos variables
categóricas y se considera una prueba paramétrica.
10. La prueba t de Student para una muestra se usa para comparar la media de una
muestra con una media poblacional conocida y es una prueba no paramétrica.
Respuestas:
1. Verdadero: Las pruebas paramétricas a menudo requieren que los datos sigan una
distribución normal. Estas pruebas incluyen, por ejemplo, la prueba t de Student y ANOVA.
2. Falso: La prueba de Wilcoxon es una prueba no paramétrica que se usa para comparar dos
grupos relacionados, no independientes. La versión para grupos independientes es la prueba
de Mann-Whitney U.
3. Verdadero: La prueba t de Student para dos muestras independientes es una prueba
paramétrica que asume normalidad en los datos y varianzas iguales entre los grupos.
4. Verdadero: Las pruebas no paramétricas no requieren que los datos sigan una distribución
específica, lo que las hace más flexibles con respecto a los supuestos sobre la distribución
de los datos.
5. Verdadero: La prueba de Mann-Whitney U es una prueba no paramétrica que se usa para
comparar dos grupos independientes y no requiere que los datos sean normales, a diferencia
de la prueba t de Student.
6. Falso: La prueba de Kruskal-Wallis es una prueba no paramétrica utilizada para comparar
más de dos grupos independientes. La prueba paramétrica equivalente sería ANOVA.
7. Verdadero: Las pruebas no paramétricas suelen ser menos poderosas que las pruebas
paramétricas cuando los datos cumplen con los supuestos necesarios para las pruebas
paramétricas.
8. Verdadero: La prueba de Friedman es una prueba no paramétrica utilizada para comparar
más de dos grupos relacionados o medidas repetidas.
9. Falso: La prueba de chi-cuadrado se utiliza para analizar la relación entre variables
categóricas y se considera una prueba no paramétrica.
10. Falso: La prueba t de Student para una muestra es una prueba paramétrica que compara la
media de una muestra con una media poblacional conocida. La versión no paramétrica
equivalente sería la prueba de signos de Wilcoxon.
Ejercicio:
Lee las siguientes afirmaciones sobre las hipótesis nula y alternativa en el contexto de las
pruebas de hipótesis y decide si son verdaderas o falsas.
4. Si no se puede rechazar la hipótesis nula, se acepta la hipótesis alternativa como
verdadera.
Respuestas:
Ejercicio:
Lee las siguientes afirmaciones sobre los niveles de significación y decide si son verdaderas
o falsas.
1. El riesgo bajo (α = 0.01) se utiliza en estudios donde el error tipo I tiene consecuencias
graves, como en investigaciones médicas donde se prueban nuevos tratamientos.
2. Para estudios en los que las decisiones tienen consecuencias mínimas o en fases
preliminares de investigación, un nivel de significación bajo (α = 0.01) sería adecuado
para minimizar el riesgo de error tipo I.
3. En un estudio donde se está evaluando un nuevo fármaco que podría tener efectos
secundarios graves, se debería usar un nivel de significación alto (α = 0.10) para
reducir el riesgo de error tipo II.
Respuestas:
Ejercicio:
Lee la siguiente afirmación sobre la región de rechazo, regla de selección y cálculo del
estadístico de contraste:
1. Se tiene un estudio con una población normal donde H0: 𝛍 ≥ 10 y Ha: 𝛍 <10. Si para un
nivel de significancia de 0.05 se obtuvo un valor crítico de 9.73 y un estadístico de
contraste de 10.8, debe rechazarse la hipótesis.
Respuesta:
1. Falso. La forma de H0 y Ha revela que se trata de un análisis unilateral inferior (región
de rechazo a la izquierda), por lo que la hipótesis se acepta si el estadístico de
contraste es mayor al valor crítico.