Trabajo Final de Estadistica
Trabajo Final de Estadistica
Trabajo Final de Estadistica
CREAD MAGANGUE
V SEMESTRE
ESTADISTICA INFERENCIAL
TUTOR:
PRESENTADO POR:
MAGANGUE—BOLIVAR
2020
Tabla de contenido
1 INTRODUCCIÓN................................................................................................................3
2 OBJETIVOS.........................................................................................................................5
4 MARCO CONCEPTUAL....................................................................................................7
PROPORCIONES.....................................................................................................................18
4.22 MUESTRA..............................................................................................................20
4.23 POBLACIÓN..........................................................................................................20
4.24 HIPOTESIS.............................................................................................................20
4.25 SUMATORIA..........................................................................................................22
5 METODOLOGIA...............................................................................................................25
6 PRESENTACIÓN DE RESULTADOS.............................................................................26
7 CONCLUSIONES..............................................................................................................27
1 INTRODUCCIÓN.
La Estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos
de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar
forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es el vehículo
que permite llevar a cabo el proceso relacionado con la investigación científica. Es transversal a
una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias
de la salud hasta el control de calidad. Se usa para la toma de decisiones en áreas de negocios o
aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias
acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a
La Estadística Inferencial puede dar respuesta a muchas de las necesidades que la sociedad
actual puede requerir. Su tarea fundamental es el análisis de los datos que se obtienen a partir de
datos importantes para el estudio de situaciones que se presentan a diario y permite dar
respuesta a los problemas de una forma útil y significativa. La Estadística Inferencial se centra
en tomar una pequeña muestra representativa de la población y a partir de ésta, infiere que el
El hecho es que la ciencia se basa en todo aquello que se pueda constatar empíricamente, es
verificables, se puede inferir a partir de la información estadística. En las ciencias sociales ocurre
algo semejante en tanto es con los datos que dan las encuestas que se puede armar o articular la
información estadística e inferir resultados a partir de una muestra que deberá ser
estadísticamente representativa para que resulte una verdadera inferencia. Son muchos los
fenómenos o sucesos que no tienen respuesta, es por esto que se debe realizar estudios
pertinentes que aclaren la situación que se desea analizar. Dicho estudio se logra por medio de la
experimentación constante, que muestra cada uno de los resultados que se van obteniendo con
ayuda de la estadística. Esta puede dar respuesta a muchas de las necesidades que la sociedad
actual puede requerir. Su tarea fundamental es el análisis de los datos que se obtienen a partir de
Hallar mediante una encuesta realizada a 100 hogares de Magangué- Bolívar la media y
desviación estándar, para así formular una hipótesis nula y alternativa comprobando una de ellas
Formular hipótesis.
Para la realización del trabajo se debe Investigar sobre los gastos promedios mensuales de 100
personas seria la población objeto de estudio. A estos datos se le debe determinar la media y la
desviación estándar, de la población objeto de estudio, escoger una muestra de 30. Con base en
lo anterior establecer una hipótesis nula y su respectiva hipótesis alternativa. Aplicar los
conceptos de inferencia estadística para comprobar dicha hipótesis. Explicar las conclusiones e
El trabajo se realiza con los siguientes datos, que representan los ingresos mensuales de los
100 hogares.
780000, 660000, 690000, 940000, 770000, 630000, 660000, 750000, 680000, 760000,
900000, 780000, 710000, 1010000, 780000, 430000, 590000, 670000, 610000, 710000,
960000, 750000, 640000, 760000, 720000, 770000, 740000, 650000, 820000, 860000,
660000, 860000, 960000, 890000, 810000, 710000, 850000, 990000, 590000, 920000,
680000, 720000, 770000, 600000, 870000, 840000, 750000, 770000, 510000, 450000,
850000, 670000, 870000, 800000, 840000, 930000, 690000, 760000, 890000, 750000,
830000, 680000, 720000, 670000, 920000, 890000, 820000, 960000, 770000, 1020000,
740000, 910000, 760000, 830000, 660000, 680000, 610000, 730000, 72000, 760000,
730000, 770000, 790000, 94000, 630000, 590000, 620000, 710000, 810000, 650000,
730000, 630000, 630000, 890000, 820000, 640000, 850000, 920000, 640000, 730000.
4 MARCO CONCEPTUAL.
las características que posee una población. Si es posible estudiar a todos sus miembros, se dice
que se realiza un censo; sin embargo, las más de las veces no se dispone de recursos personal,
La parte de la estadística que analiza y describe a una muestra se conoce como estadística
población las características obtenidas al analizar una muestra se le llama estadística inferencial.
El muestreo es, precisamente, uno de los principales aspectos a considerar en el estudio de las
pruebas de hipótesis.
interpretar, hacer proyecciones y comparaciones. De tal forma que crea un buen argumento para
mecanismos que le permiten llevar a cabo dichas deducciones, tales como pruebas de estimación
estadística, se puede decir que el objetivo de la estadística que es inferir o estimar características
de una población que no es completamente observable y por ello el análisis de una parte de ella
la cual se llama muestra. Ahora bien, para considerar válidas en la población las conclusiones
muestra es de suma importancia, y para ello hay diversos métodos (métodos de muestreo). La
generales de la misma.
posibles y luego efectuarle una prueba o test estadístico, se conoce también como la docimasia
estadística. Cuando una conclusión se valida con un test estadístico de nombre tipo cuantitativo.
En caso contrario la decisión adoptada es de tipo cualitativo, o sea una decisión tomada de en
forma subjetiva, el método consiste en definir una probabilidad de aceptación del orden del 95%
para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación
hecho de constituir ésta uno de los pilares teóricos fundamentales sobre los que se asienta el
desarrollo y aplicación de la Estadística Inferencial. Así, mientras que si de una o más variables
Teoría de la Probabilidad nos permite establecer predicciones de las características que esas
variables adoptarán en una muestra de sujetos extraída al azar de esa población, la estadística
camino de la población a la muestra- ha establecido las bases para trazar el camino opuesto, esto
es, inferir a partir de los datos de una muestra en una o más variables, cómo serán las
Cabe resaltar que la recolección de datos se refiere al uso de una gran diversidad de técnicas y
herramientas que pueden ser utilizadas por el analista para desarrollar los sistemas de
Estas son determinadas usando un número finito de parámetros. Esto es, por ejemplo, si
conocemos que la altura de las personas sigue una distribución normal, pero desconocemos cuál
normal son los dos parámetros que queremos estimar. Cuando desconocemos totalmente qué
distribución siguen nuestros datos entonces deberemos aplicar primero un test no paramétrico,
que nos ayude a conocer primero la distribución. La estadística paramétrica clásica plantea tres
tipos de problemas:
por intervalos (buscamos un intervalo de confianza). Por otra parte para entender la Regresión
Lineal Simple, se hace necesario tener en cuenta que es un análisis de regresión, puesto que este
es el que genera una ecuación para describir la relación estadística entre uno o más predictores y
utiliza el método de estimación de mínimos cuadrados ordinarios, del cual se obtiene la ecuación
Ahora bien la Regresión Lineal simple, examina la relación lineal entre dos variables
continuas: una respuesta (Y) y un predictor (X). Cuando las dos variables están relacionadas, es
posible predecir un valor de respuesta a partir de un valor predictor con una exactitud mayor que
Examinar cómo cambia la variable de respuesta a medida que cambia la variable predictor. Y
Predecir el valor de una variable de respuesta (Y) para cualquier variable predictor (X).En cuanto
probabilidad que asociamos con una estimación de intervalo se conoce como el nivel de
confianza. Esta probabilidad nos indica que tanta confianza tenemos en que la estimación del
intervalo incluya al parámetro de la población. Una probabilidad más alta significa más
ajustar un modelo de regresión con todos los predictores, se deberían utilizar las técnicas de
selección de modelo paso a paso o de los mejores subconjuntos para excluir los predictores que
no estén asociados con las respuestas. En efecto, los Intervalos de confianza y predicción en
regresión múltiple, razonando como en el modelo de regresión lineal simple, se deben distinguir
del que se conoce que = h. Esto es, se quiere predecir un valor de la variable condicionada
Y/ = h.
Frente al concepto de variable estadística, el concepto de variable aleatoria supone contar con
implica contar con datos para la población pues, en otro caso, lo que tendríamos serían
frecuencias relativas, esto es, estimaciones de las probabilidades, no las probabilidades en sí.
De una variable no suele ser conocida dado que, normalmente, no es factible contar con los
datos de todas las entidades de la población de interés para una determinada variable- Una
datos recogidos para una muestra de esa población y la aplicación de la aproximación frecuencia
práctica acumulada, que dicha variable se distribuye de acuerdo a algún modelo teórico de
características conocidas, tal como algunos de los que se presentarán en la siguiente sección.
probabilidad de una variable, al valor resultante se le denomina parámetro (mientras que si fuera
Las pruebas de hipótesis se realizan en todas las situaciones en las cuales se puede contractar
afirmar que la mayoría de las personas que votan están de su lado, se somete a esta hipótesis a
una verificación estadística comparándola con los datos muéstrales observados, es decir que para
probar una hipótesis tomar una decisión al realizar una comparación entre la muestra observada
con respecto a la teoría. Para llevar a cabo una prueba de hipótesis es necesario tomar en cuenta
• Hipótesis nula Ho. Es aquella que plantea lo contrario de lo que se quiere probar
mediante valores muéstrales es decir, es el valor calculado mediante valores muéstrales, este
valor sirve para tomar en una decisión estadística, dicha decisión consiste en optar si se rechaza o
no la hipótesis nula
hipótesis nula.5.
representa.
4.5 HIPOTESOS NULA Y HIPOTESIS ALTERNATIVA
usualmente es más simple que su antagonista, se designa a la hipótesis nula con el símbolo H0.
El error tipo I y error tipo II son tipos de errores que podemos cometer cuando en una
la hipótesis alternativa o H1. Es decir, cuando estamos realizando pruebas de hipótesis. Pero para
entender estos conceptos, primero debemos contextualizar su uso en la estimación por intervalos.
Como hemos visto, la estimación por intervalos se basa en una región crítica a partir del
parámetro de la hipótesis nula (H0) que planteamos, así como en el intervalo de confianza a
Estas pruebas son adecuadas cuando los datos que se están utilizando constan de cuentas o
frecuencias, el objetivo de estas pruebas es evaluar las afirmaciones con respecto a una
La determinación del tamaño muestra en una investigación es de vital importancia, tanto para
caracterizar la distribución de la variable, como para fijar el grado de precisión del estudio. El
propósito de este artículo es ofrecer ayuda en el cálculo del tamaño muestra cuando se efectúa un
fijo), en el cual se utilizan métodos estadísticos inferenciales como medios para el análisis, como
ser la estimación estadística, las pruebas de hipótesis y el análisis de experimentos, que requieren
de información precisa sobre las variables consideradas, y que es obtenida a partir de la muestra
A diferencia de otras pruebas de medias que se basan en la diferencia existente entre dos
intermediaste entre la estimación interna. Esta razón F fue creada por Ronald Fisher (1890-
1962), matemático británico, cuyas teorías estadísticas hicieron mucho más precisos los
Fisher también contribuyó a clarificar las funciones que desempeñan la mutación y la selección
El valor estadístico de prueba resultante se debe comparar con un valor tabular de F, que
indicará el valor máximo del valor estadístico de prueba que ocurría si H0 fuera verdadera, a un
nivel de significación seleccionado. Antes de proceder a efectuar este cálculo, se debe considerar
medidas de bondad en general resumen la discrepancia entre los valores observados y los valores
Es lo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una
población, su estudio permite calcular la posibilidad de que tiene, dada una sola muestra, de
La distribución es considerara como una variable aleatoria, cuando se deriva de una muestra
aleatoria de tamaño se puede considerar como la distribución de la estadística para todas las
de una muestra que sea representativa de la población. El muestreo cuenta con ventajas las
cuales son:
Costo reducido
Mayor rapidez
Mayor posibilidad
El muestreo puede ser preciso que el censo, esto es debido a que cuando el volumen de
entrenamiento intensivo.
Cuando la medición del elemento trae consigo la destrucción o deterioro del mismo
Cuando la población sea infinita o tan grande que le quede al investigador físicamente
Es lo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una
población, su estudio permite calcular la posibilidad de que tiene, dada una sola muestra, de
La distribución es considerara como una variable aleatoria, cuando se deriva de una muestra
aleatoria de tamaño se puede considerar como la distribución de la estadística para todas las
Una estimación puntual de un parámetro poblacional es cuando se utiliza un único valor para
estimar ese parámetro, es decir, se usa un punto en concreto de la muestra para estimar el valor
deseado, cuando estimamos un parámetro de forma puntual podemos saber con certeza, cuál es
ese valor.
Ejemplo: imaginemos una población de 30 personas de las que seleccionamos una muestra de
20 para las que conocemos sus edades. Estimar de forma puntual la media de edad, sería tan
sencillo como sumar esos 20 datos y dividirlos entre el total de la muestra estadística.
muestra.
se le llama intervalo de confianza a un par de números entre los cuales se estima que estará
cierto valor desconocido con un determinado nivel de confianza formalmente, estos números
determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido
probable que dos muestras de una población es particular produzcan intervalos de confianza
idénticos, sin embargo su usted repitiera muchas veces su muestra, un determinado porcentaje de
El intervalo puede utilizarse de manera alternativa al contraste de hipótesis para decir si hay
igualdad de los grupos. Se decidirá por la igualdad de los grupos si el valor 0 queda en cualquier
estadística.
4.20 DISEÑO FACTORIAL.
Un diseño factorial es utilizado generalmente por los científicos que desean comprender el
efecto de dos o más variables independientes respecto de una única variable dependiente,
estadísticamente es más fácil de manipular, sin embargo, en muchos casos dos factores pueden
Los investigadores sociales suelen utilizar diseño factoriales para evaluar los efectos de los
experiencia, es común que en la ciencia agrarias se utilicen diseños factoriales por la necesidad
de las pruebas de campo para probar el efecto de las variables en los cultivos, en esos estudios a
gran escala, es difícil poco práctico aislar y probar cada variable individualmente.
Diseño factorial completo generalmente que contienen factores con más de dos niveles
El diseño factorial de dos niveles cada factor experimental tiene solo dos niveles las corridas
experimentales incluyen todas las combinaciones de estos niveles factoriales, aunque los diseños
factoriales de 2 niveles no pueden explorar completamente una amplia región del espacio de los
factores.
El diseño factorial completo se ordena con base en los signos asignados a los generadores de
Cuando el efecto de un factor depende del nivel del otro, se puede utilizar una gráfica de
interacción para visualizar las posibles interacciones, las líneas paralelas en una gráfica indican
que no hay interacción, mientras mayor sea la diferencia en la pendiente entre las líneas, mayor
estadísticamente significativa.
4.22 MUESTRA
que una muestra sea, representativa y para ello debe escogerse una técnica de muestra adecuada,
que produzca una muestra aleatoria adecuada. La selección de la muestra Condición para que a
población.
4.23 POBLACIÓN
4.24 HIPOTESIS
nula es la afirmación de que dos parámetros o fenómenos no tienen relación entre sí.
tal tratamiento es mejor que el control o tal procedimiento tiene menos morbilidad) es
contrastada con una hipótesis estadística que supone que no existe tal efecto o tal diferencia. La
razón para hacer esto es que se puede calcular de antemano la distribución de probabilidades
asociadas con tal situación. Esta hipótesis se conoce con el nombre de hipótesis nula que se
abrevia como H0 (Nullus: Nula, falto de valor y fuerza para obligar o tener efecto). La expresión
cero, y que en algunos casos se puede especificar el signo de esa diferencia. Normalmente
µ 2 o bien µ 1> µ 2.
y el número de grupos que se comparan. La cifra que resulta de usar la prueba (aplicar la o las
fórmulas) en los datos recolectados se conoce como el estadístico del test en cuestión: z;
estadístico puede ser calculada de antemano cuando la H0 es verdadera y por lo tanto conocer los
valores que delimitarán distintas porciones del área bajo la curva de esa distribución; éstas se
conocen como distribuciones de muestreo. Vale la pena decir aquí, y lo reiteraremos luego, que
trabajo, limitándose a decir que no hay suficiente evidencia para rechazar la hipótesis nula
equivocarse cuando se rechaza H0, de decir que hay una diferencia cuando en realidad no la hay.
otros más extremos si la H0 es verdadera, cifra que es determinada por el área de la distribución
región crítica (Figura 1). Este punto puede re frasearse así: se rechaza la H0 si el estadístico cae
en la región crítica. En los apéndices de los textos de estadística aparecen tablas con la
4.25 SUMATORIA
Las distribuciones de frecuencias: son tablas en que se dispone las modalidades de la variable
por filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc.
Muestreo aleatorio simple: Para obtener una muestra, se numeran los elementos de la
Intervalo de confianza: Se llama así a un intervalo en el que sabemos que está un parámetro,
aleatoria y significativa, extraer conclusiones que permitan aceptar o rechazar una hipótesis
Bilateral H0=k H1 ≠ k
H0 ≤k H1> k
Contraste bilateral.
Se presenta cuando la hipótesis nula es del tipo H0: μ = k (o bien H0: p = k) y la hipótesis
Contraste unilateral
Caso 1
La hipótesis alternativa, por tanto, es del tipo H1: μ < k (o bien H1: p < k).
caso será:
La hipótesis nula es del tipo H0: μ ≤ k (o bien H0: p ≤ k). La hipótesis alternativa, por tanto,
Para resolver el problema expuesto es necesario conocer los gastos promedios de 100 hogares
de Magangué bolívar. Ya sabiendo cuales son estos, debemos hallar cada uno de los
existe mucho interés en solucionar problemas públicos desde las instituciones mediante la
estadística inferencial. Uno de los problemas es el de CONOCER bien los problemas mediante
estudios confiables. De los Interrogantes surgen probables hipótesis para precisar mejor cómo
solucionar los problemas sociales como el que se plantea. La mejor información ayudará, sin
duda, a los tomadores de decisión, con esto se evita formular hipótesis falsas y conocer la
Por tal razón pretendemos hallar y concluir el problema para desenvolvernos en nuestra área
necesarios en el futuro. La estadística inferencia al igual que las demás nos brinda esa
posibilidad de poder aproximarnos a lo que puede ser y haber, de igual modo consideramos que
es un recurso y medio por el cual como profesionales nos sirve no sólo para diagnosticar y poder
tomar una decisión frente a las posibles variables que se presentan, sino también de forma
personal y demás.
6 PRESENTACIÓN DE RESULTADOS
R
1. R K= regla de sturges. A=
K
59
2. K intervalos k = 1 + 3.322 log(n) A=
8
3. A k= 7.644 A= 8
R=102 – 43
R= 59
X́ =
∑ F∗X = 7602 =76.02
n 100
s=
√ ∑ F ( x− X́ ) = √23,525.1744 = √237.628=15.41
n−1 99
S = 15.41
7 CONCLUSIONES