Prueba de Hipótesis - VR

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 16

Universidad Nacional Experimental de Guayana

Vice Rectorado Académico


Coordinación General de Pregrado
Proyecto de Carrera Ciencias Fiscales
Asignatura: Estadística Aplicada

XXXXXXXXXXXXXXXXX

Prof. XXXXXXXXXXXXX Elaborado por:


Vidalia Ramírez C.I.: 25.
Sec. 01

Ciudad Bolívar, octubre del 2020


4. PRUEBA DE HIPÓTESIS.

4.1. Qué es una hipótesis estadística. ¿En qué consiste la prueba de


hipótesis? Procedimiento.
El término “hipótesis estadística” hace referencia hacia el área de
investigación trabajando conjuntamente con la de estadística, pues yendo
a la primera parte de este, una hipótesis es una suposición o proposición
sobre un tema de estudio que, hasta cierto punto, es la que aporta
motivos al origen del trabajo de investigación, siendo este el que puede
verificar su veracidad o no, y en base a ello permitirle al investigador
aseverar una conclusión sobre el tema.
Ahora bien, al ser en gran manera el proceso de investigación algo
científico (pues muchas investigaciones son de esta índole), dicha idea
amerita partir de un punto de referencia y arrojar resultados en base a
este, es decir, dicha hipótesis puede ser que “El consumo semanal de
una sapoara, aumenta la sensación de calor corporal en 1°C”, esta sería
la hipótesis estadística, que es necesario acotar debe ser algo
cuantificable. De esta idea se desprenden entonces dos valores
importantes:
 Hipótesis nula: es la característica de la población (lo normal es
que se hagan hipótesis sobre esta y no a la muestra), sobre la
cual se cree es cierta y que se desea corroborar o refutar, se
representa como “Ho”, que en este caso serían: 1sapoara/°C*
Semana.
 Hipótesis alternativa: representa los valores fuera del valor de
referencia, por lo cual sería cualquier valor que no comparta la
hipótesis nula, en ocasiones a este se le llama bilateral, se
anota como “H1”, para este ejemplo serían valores distintos (≠)
a Ho, ya sean mayores o menores, y pasaran a ser parte
fundamental de la conclusión del investigador.
Dicha hipótesis es necesario que sea puesta a prueba, sin
embargo, aun cuando se ha hablado de “rechazar o aprobar” la misma, en
realidad los estudios estadísticos lo que arrojan es confiabilidad a dicha
idea, se pudiera hacer una metáfora a un partido de futbol por ejemplo,
donde cada equipo es una de esas hipótesis, la duración del partido
corresponde al periodo de tiempo en que está vigente la proposición
hasta que pase a ser una teoría (pueden pasar años y décadas en ello);
cada anotación, va aumentando la credibilidad de una u otra, hasta que
llega un punto donde por ese puntaje la conclusión es prácticamente
inminente.
Las pruebas de hipótesis consisten en eso, en ir recolectando
muestras, sintetizándolas y analizándolas, para que con esos resultados
se anoten puntos a favor de la hipótesis nula o alternativa. Es de tener
cuidado este tipo de estudios pues la idea es que el mismo sea si se
pudiera decir imparcial, pues en ocasiones ocurre que el investigador más
allá de probar cuál será la correcta, busca es probar que aquella con cual
posee afinidad tenga resultados concluyentes a favor.
El procedimiento para realizar dichas pruebas es el siguiente:
1. Expresar la hipótesis nula.
2. Expresar la hipótesis alternativa.
3. Especificar el nivel de significancia: este tiene que ver con el
porcentaje de riesgo en aceptar o no (en base a los resultados
obtenidos), una u otra hipótesis, en la práctica el valor esta
entre 1-5%.
4. Determinar el tamaño de la muestra: esto es a criterio del
investigador y puede variar según su disponibilidad, sabiendo
que a mayor muestra puede disminuir el porcentaje de error
(no de manera lineal).
5. Establecer los valores críticos que establecen las regiones de
rechazo de las de no rechazo: esto es en base a la
significancia.
6. Determinar el tipo de prueba estadística.
7. Coleccionar los datos y calcular el valor de la muestra de la
prueba estadística apropiada.

3
8. Determinar si la prueba estadística ha sido en la zona de
rechazo a una de no rechazo.
9. Determinar la decisión estadística.
10. Expresar la decisión estadística en términos del problema.
Entre los pasos mencionados, algunos no se explicaron, pues o ya
se comentaron anteriormente o por su título ya se puede deducir a que
están relacionados y en su mayoría es con criterio del investigador.

4.2. Prueba de hipótesis para la media y para la diferencia de medias.


Prueba de hipótesis para la proporción y para la diferencia de
proporciones. Prueba de hipótesis para la varianza y para el cociente
de varianzas.

Prueba de hipótesis para la media y para la diferencia de medias


En el paso seis (6) del punto anterior para realizar las pruebas de
hipótesis, se observa que corresponde a elegir el tipo de prueba a llevar a
cabo, y eso dependerá del parámetro y del estadístico que se posea o el
cual se desee conseguir para llevar a cabo la prueba. En este parte de la
investigación se estarán explicando los más comunes, siendo el primero
de ellos la media y el de la diferencia de medias.
Como es de conocimiento en estadística, la media o también
conocida como “media aritmética”, es el valor promedio central de una
lista de datos obtenidos de la muestra, es decir que aun lado y al otro de
este se encuentran el resto de los valores, este se obtiene sumando todos
los valores recopilados y dividiéndolos entre la cantidad de estos, por
ejemplo si en un salón de clases con diez (10) alumnos sus edades son:
5, 6, 7, 6, 6, 7, 5, 6, 6, 7, la suma de estos es 61, entre la cantidad de
estudiantes sería “6,1”, esta sería la medía, y aplicándolo al tema
supóngase que dicho salón es de 2do grado de primaria, con esta media
se puede realizar una hipótesis estadística que exponga que los salones
de este grado (población), poseen una edad promedio de 6 años, la cual
con los estudios se rechazará o no.

4
Antes de continuar es bueno hacer mención a las zonas críticas y
de rechazo, pues son términos inherentes a las pruebas de hipótesis
estadísticas, estos representan el rango en el cual la hipótesis sería no
valida, normalmente en comparación al área aceptable esta es pequeña.
Normalmente se presentan tres posibilidades de esta zona, y se
representa en una curva acampanada como la usada para la distribución;
estas son:
 Prueba bilateral: en la cual el área de aceptación que sería la
hipótesis nula, correspondería a todo “x”, mientras que el de la
alternativa seria todo los distinto de “x” como se explicó en un caso
anterior.

 Prueba unilateral con cola a la derecha: en esta el rango aceptable


seria todo lo igual o menor a “x”, mientras que la de rechazo lo
mayor a “x”.

 Prueba unilateral con cola a la izquierda: caso contrario al anterior,


la parte aceptable será todo lo igual o mayor a “x” y lo menor a “x”
será el área de rechazo.

5
Es también necesario saber que, para este tipo de pruebas, no se
utiliza la formula directa del parámetro elegido para el estudio, sino que se
emplean ecuaciones derivadas de esta que son un poco más prácticas
pero que ameritan conocer otras variables referentes a la población y
muestra analizada. A continuación, se muestra un cuadro resumen con
dichas fórmulas tanto para el caso de la media como para el de varianza:

Ahora para afianzar un poco el tema un ejemplo: Un médico fisiatra


afirma que la flexibilidad en las mujeres que padecen osteoporosis
después de aplicársele cierto tratamiento es mayor al valor promedio
observado en mujeres con igual condición, el cual se sabe es igual a 270

6
mm/m (milímetro de estiramiento sobre metro de altura de la persona),
con una desviación de 120 mm/m. Para probar su premisa el investigador
determinó la flexibilidad de 36 individuos que fueron sometidos al
tratamiento y pudo determinar que dicha muestra arroja un valor promedio
de 310 mm/m. La flexibilidad es una variable que se distribuye
normalmente. Las hipótesis de investigación son las siguientes:
 Ho: El tratamiento para la osteoporosis no tiene ningún efecto
 H1: El tratamiento para la osteoporosis aumenta los niveles de

flexibilidad.
Prueba de las hipótesis estadísticas:
a. Formulación de hipótesis
Ho: μ = 270
H1: μ > 270

b. Especificación de un valor de probabilidad crítico o nivel de


significación.
Ante la ausencia de una especificación particular, se puede
escoger como nivel de significación un valor de α = 0.05.

c. Elección de un estadístico de la muestra y de su distribución para


someter a prueba las hipótesis.
Puesto que el parámetro involucrado en la docimasia es la media
poblacional μ, y la variable se distribuye normalmente con
varianza conocida lo más conveniente es usar como estadístico
de prueba la media muestral en su forma derivada Z.
( x́−μ)
Z=
σ /√n
d. Establecer una zona de aceptación para Ho.
Como H1: μ > μo se trata de una prueba de una cola hacia la

derecha, siendo la zona de aceptación la siguiente:


ZA = {Z / Z < z (1−α)}

e. Cómputos necesarios.
e.1) Estadístico de prueba:

7
( x́−μ) (310−270) 40
Z= = = =2
σ /√n 120 / √ 36 20
e.2) Zona de aceptación: Z = {Z / Z < z(0,95)} = {Z / Z < 1.65}

f. Decisión.
Como z = 2 > z(0.95) = 1.65 el valor del estadístico de prueba se

encuentra dentro de la zona de rechazo. Por lo tanto, se concluye


que los datos obtenidos proporcionan suficiente evidencia para
rechazar a la hipótesis nula (H o). La información que se recolecto
de la muestra, permite afirmar que se tiene un 95% de confianza
de que el tratamiento aplicado a los pacientes enfermos de
osteoporosis aumenta la flexibilidad de estos para sus actividades
cotidianas.
En el caso de trabajar con la prueba con la diferencia de las
muestras, el procedimiento es similar solo que para ello será necesario
poseer (según el caso) igual que en la de la media normal, la desvisción
aparte claro de la distribución, además de claro conocer los datos o tener
las media de los datos de cada población a estudiar. Este tipo de prueba
es más utilizado para corroborar aprobación o rechazo entre dos
planteamientos.

Prueba de hipótesis para la proporción y para la diferencia de


proporciones
Igual que en el caso de las medias, al utilizar proporciones se
busca es aportar credibilidad a una u otra hipótesis, en este caso la
hipótesis tiene afinidad a presentarse en manera porcentual, como por
ejemplo decir que 3 de cada 10 cajas del CLAP, viene con un producto
menos, lo que equivaldría a un 33% de del total de la hipótesis. Hasta
cierta forma, el procedimiento es igual para la diferencia de proporciones
que sería el equivalente de la diferencia de medias, pero de forma
proporcional.

8
Un punto clave es que en este tipo de prueba influye más
notoriamente el tamaño de la muestra pues esta debe cumplir con cierto
porcentaje para que los resultados puedan ser válidos y tener peso a la
hora de hacer conclusiones.
Su fórmula general sería la siguiente:

Dónde: “x” es el número de ocurrencias del evento en él estudio;


“n” es el número total de eventos durante el estudio; “p0” es la proporción
propuesta (en el caso anterior seria 3/10 = 0,333).
Tomando en cuenta la relevancia del tamaño de la muestra es
necesario calcular si sería válida o no con la formula “(n/N*100%) > 5%”,
dónde “n” sería la muestra y “N” la población. En el caso de que la
población sea finita es necesario aplicar un factor de corrección que se
verá más adelante.
Para asentar bien los conocimientos se ampliará el caso anterior
para sus cálculos, con lo cual el estudio realizado es sobre las primeras
600 cajas entregadas de las cuales 200 vinieron sin un producto,
sabiendo que el cargamento completo era de 10000 cajas; se estila una
significancia del 0,025, por lo cual la Z tabla sería de 1,96. Es por ello que la
prueba se hará con unilateral izquierda, teniendo como zona de rechazo
una mayor pérdida de productos lo que ameritaría una fiscalización sobre
todo el sistema.
Como ya se dijo un paso importante luego de asentados los datos
bases, es corroborar que la muestra cumple para el estudio, tomando en
cuenta que: n/N*100% = 600/10000*100% = 6%; lo cual es mayor al 5%
que se solicita comúnmente, con eso listo se continúa a aplicar la fórmula:

9
Lo que está encerrado en rojo representa el factor correctivo por
ser una muestra finita. Se observa que el resultado obtenido es 1,84 el
cual es menor que el 1,96 extraído de la tabla, por lo cual eso indica que,
se encuentra dentro de la zona de aceptación, con lo cual se podría
concluir que efectivamente a 3 de cada 10 cajas les falta un producto.
En el caso de usar la diferencia de proporciones, al igual que con
las medias es necesario reacondicionar la fórmula a la siguiente forma:

Dónde el numerador representa a la estimación combinada de “p”,


con lo cual los sub índices uno (1) son las ocurrencias y el total de
eventos en la muestra uno, mientras que los sub índices dos (2) son las
ocurrencias y total de eventos en la segunda muestra.

Prueba de hipótesis para la varianza y para el cociente de varianzas


También es posible que se requiera hacer el estudio según la/las
varianzas que se obtengan entre las cuales se desee estar según el caso,
sabiendo que, este valor tiene dos maneras base de obtenerse, por un
lado, es sabido que esta es el cuadrado de la desviación típica (valor que
representa el rango aproximado de dispersión de la totalidad de los datos
con respecto a la media); otra manera es por medio de la media aritmética
y aplicando la siguiente formula:

Desglosada de la siguiente forma:

Dónde: “xn” representa uno de los datos recolectados; X́ es la


media y “n” el número de datos recolectados. Su cálculo es importante
pues brinda otra manera de calcular la desviación típica que es un valor si

10
se quiere, más comprensible y practico; además de ello hay otras
fórmulas estadísticas que también requieren de conocer este parámetro y
que son bastante significativas y determinantes su resultado, como es la
covarianza.
En aras de facilitar el proceso de comparación y decisión por parte
del investigador, se suele usar tablas como la mostrada a continuación,
que indican valores calculados la distribución de “chi cuadrado” ( χ 2 ¿, con
la cual se contrasta el valor obtenido:

Al ser una prueba sobre las hipótesis más, el procedimiento es


bastante parecido al de la media y al de proporción; que involucra
determinar la hipótesis y la significancia, luego si es necesario obtener el
valor crítico de la varianza, para el cual puede usarse una tabla como la
anterior (basándose en los grados de libertad “n-1” y en la significancia),
se procede al cálculo y luego a la conclusión.

11
Hay situaciones donde es necesario para rechazar o no una
hipótesis, comparar datos de dos poblaciones independientes, su fórmula
es algo más compleja que la anterior:
n A ( nB −1)S 2 A σ 2B
T= 2 2
nB (n A −1)S B σ A
Dónde “A” y “B” corresponden a una u otra muestra de las
poblaciones elegidas, “n” sería entonces el número de esta muestra, “S2”
sería la varianza de la muestra y “σ2”es la varianza de la población que en
la mayoría de los casos en ambas es igual y por ente su cociente sería
uno (1) y se desprecia al momento de aplicar la formula.

4.3. Uso de herramientas tecnológicas para realizar prueba de hipótesis


Los estudios estadísticos según el ramo, pueden manejar una
cantidad bastante amplia de datos, y sobre todo con el avance de las
ciencias cada vez el manejo de estos se ha vuelto más complejo, pues
amerita de cálculos y graficas que hacerlas de manera manual tomaría
mucho tiempo y podría acrecentar el margen de errores, por esa razón
nacen los programas o paquetes estadísticos.
Estos son programas informáticos que le facilitan al investigador,
estadista, gerente o cualquier otro, el manejo de datos y su análisis, pues
en ellos en una breve cantidad de pasos es posible hacer un sinfín de
cálculos a una velocidad bastante grande, lo cual disminuye el tiempo en
que se puede dar respuesta a las incógnitas de una investigación, en las
cuales quizás ameritaba semanas de cálculo y comprobación, con estas
aplicaciones es posible en un par de minutos u horas obtener todos los
resultados necesarios, claro está que mientras no se desarrolle una
inteligencia artificial significativa, dichos resultados seguirán teniendo su
análisis y conclusión a merced del investigador.
Uno de los programas más utilizados, a pesar de no estar enfocado
directamente al área estadística es el Office Excel, de la mano de
Microsoft, el cual permite la aplicación de fórmulas y graficas en una
interfaz bastante amigable. De igual manera hay otros programas que si

12
están direccionados al trabajo estadístico y de análisis de datos que
permiten, realizar procesos más detallados y hacer cálculos más
completos sobre cantidades de datos inmensas, con la misma rapidez de
la primera herramienta, pues ya que solo se enfocan a ello, poseen su
optimización a este tipo de usos. Algunos de los más usados son:
 SPSS Statistical Package for the Social Sciences (paquete
estadístico para las ciencias sociales).
 S-Plus: muy utilizado en las ciencias de la salud; trae la posibilidad
de hacer pruebas sobre hipótesis sobre distintos parámetros.
 MiniTab: es el preferidos de empresas para el manejo de control de
calidad y otros procesos productivos.
 StatGraphics: bastante común en el proceso de enseñanza de
carácter estadístico, tanto a nivel de secundaria como universitario.
 Statisticas.
 PH-Stats.
 WinIDAMS: creado por la UNESCO en colaboración con
profesionales de diversos países.

4.4. Análisis de Varianza: Cuándo se emplea un análisis de varianza.


Aspectos Generales. La Distribución F. Propiedades, usos, precauciones
de su uso. Diseño de Experimentos.

Análisis de Varianza: Cuándo se emplea un análisis de varianza.


Aspectos Generales
Es un tipo de análisis estadístico utilizado cuando es necesario
comparar características cuantitativas (es decir que se pueden medir de
alguna manera, tales como altura, ingresos, peso, calificaciones, entre
otros), las cuales son importantes entre distintos grupos de muestras
dentro de una población. Un ejemplo pudiera ser revisar el rendimiento
académico de los niños de 5to grado de una escuela privada, una escuela
estadal y por último una subvencionada, ahí se tiene que, la población se
compondría de todos los estudiantes de 5to grado, y las muestras sobre

13
algunas secciones de diferentes instituciones, y la variable sería en base
a sus notas promedios, en una o varias materias.
También es conocido por su nombre en inglés como ANOVA
“ANalsys of VAriance” (análisis de varianza), y puede involucrar también
el proceso comparativo de las medias de esas muestras involucradas. El
resultado y conclusión de este estudio indicara si la característica
procesada es igual para los grupos revisados, siguiendo el ejemplo
anterior, se determinará si el rendimiento es el mismo o si existe alguna
diferencia.

La Distribución F. Propiedades, usos, precauciones de su uso. Diseño de


Experimentos.
Es un tipo de distribución muy utilizada en la estadística inferencial,
sobre todo en la contrastación, de la igualdad de varianzas proveniente de
dos poblaciones independientes, así como también en el análisis de la
varianza, aspecto que ya se analizó previamente. Esta permite detectar la
presencia o inexistencia de diferencias significativas entre las diversas
muestras recolectadas, siendo entonces clave en todos aquellos casos en
los que se quiere investigar la importancia de un factor determinado en el
desarrollo y desempeño de una característica.
Las propiedades de la también llamada distribución F de Snedecor
(por George Snedecor) o como distribución F de Fisher-Snedecor (por
Ronald Fisher), en base a su estudio serían las siguientes:
 La distribución F es parte de una familia de distribuciones, lo
cual significa que hay un número infinito de diferentes
distribuciones de este tipo. Esta, en particular depende del
número de grados de libertad que posea la muestra. Esta
característica es similar tanto a la  de la distribución T y la
distribución chi-cuadrado (σ 2).
 La distribución F es cero o es positivo, por lo tanto, no hay
valores negativos para F. Esta característica es similar a la
distribución chi-cuadrado (σ 2).

14
 Está sesgada hacia la derecha. Así es, esta distribución de
probabilidad, no es simétrica, por lo cual su curva tiene más
hacia un lado, siendo similar a la distribución chi-cuadrado ( σ 2

).
A pesar de todo, esta distribución involucra una serie de posibles
inconvenientes a los cuales hay que estar al pendiente para evitar errores
en las conclusiones del análisis. Estos son:
1. Comparar dos o más materiales con el fin de elegir al que mejor
cumple los requisitos.
2. Comparar varios instrumentos de medición para verificar si trabajan
con la misma veracidad y precisión.
3. Determinar los factores de un proceso que tienen impacto
significativo sobre una o más características del producto final.
4. Encontrar las condiciones de operación (temperatura, velocidad,
humedad, por ejemplo) que reduzcan los defectos o que logren un
mejor desempeño del proceso.
5. Reducir el tiempo de ciclo del proceso.
6. Hacer el proceso insensible o robusto a oscilaciones de variables
ambientales.
7. Apoyar el diseño o rediseño de nuevos productos o procesos.
8. Ayudar a conocer y caracterizar nuevos materiales.
Como se ha visto hasta ahora, todo es parte de estudios de
investigación y de comprobación de hipótesis, sin embargo, también es
necesario mencionar la importancia del diseño del experimento o de los
experimentos a llevar a cabo, pues de la calidad de estos dependerán los
resultados y conclusiones. A la hora de diseñar un experimento es
importante seguir o al menos tomar en cuenta los siguientes pasos:
o Enunciado o planteamiento del problema. El tema a tratar
debe ser claro y bien delimitado, para que el enfoque del
resto del estudio sea acorde.

15
o Formulación de hipótesis. Como ya se ha explicado
anteriormente tiene que ver con le exposición de la
proposición a la que se espera favorecer o rechazar.
o Proposición de la técnica experimental y el diseño. También
se ha comentado, y es que la elección del método y del
parámetro a utilizar, que debe ser acorde al tipo de estudio.
o Examen de sucesos posibles y referencias en que se basan
las razones para la indagación que asegure que el
experimento proporcionará la información requerida y en la
extensión adecuada, que disminuya en la medida de lo
posible los errores.
o Consideración de los posibles resultados desde el punto de
vista de los procedimientos estadísticos que se aplicarán y
para asegurar que se satisfagan las condiciones necesarias
para que sean válidos estos procedimientos.
o Ejecución del experimento.
o Aplicación de las técnicas estadísticas a los resultados
experimentales.
o Extracción de conclusiones con medidas de la confiabilidad
de las estimaciones generadas.
o Deberá darse cuidadosa consideración a la validez de las
conclusiones para la población de objetos o eventos a la
cual se van a aplicar.
o Valoración de la investigación completa y contrastación con
otras investigaciones del mismo problema o similares.
Se puede decir que los primeros pasos corresponden a una etapa
previa al a experimento y es en base a la cual se establecen las
condiciones y “reglas” de juego, sin embargo, hay otros pasos que es
también necesario tomar en cuenta y que son post-ejecución (aspecto
subrayado), que sirven para realizar correcciones y procesos de control
antes de dar una conclusión definitiva sobre los resultados y sobre la
investigación en sí.

16

También podría gustarte