Estadistica1 PDF
Estadistica1 PDF
Estadistica1 PDF
Cogido 1082877115
Docente
Santa Marta
04 De Agosto De 2019
Población:
Muestra:
Estadístico
Los datos o medidas que se obtienen sobre una muestra y por lo tanto
una estimación de los parámetros.
Error muestral:
Nivel de confianza
Varianza poblacional
Inferencia estadística
Para que los resultados obtenidos de los datos muéstrales se puedan extender a
la población, la muestra debe ser representativa de la población en lo que se
refiere a la característica en estudio, o sea, la distribución de la característica en la
muestra debe ser aproximadamente igual a la distribución de la característica en la
población.
Una muestra simple aleatoria es aquella en que sus elementos son seleccionados
mediante el muestreo aleatorio simple.
De modo que una muestra simple aleatoria se puede interpretar como un conjunto
de valores de n variables aleatorias independientes, cada una de las cuales tiene
la misma distribución que es llamada distribución poblacional.
Existen dos formas de extraer una muestra de una población: con reposición y sin
reposición.
1. El método de selección.
2. El tamaño de la muestra
Estimación:
La estimación se divide en tres grandes bloques, cada uno de los cuales tiene
distintos métodos que se usan en función de las características y propósitos del
estudio:
Estimación puntual:
Consiste en la estimación del valor del parámetro mediante un solo valor, obtenido
de una fórmula determinada. Por ejemplo, si se pretende estimar la talla media de
un determinado grupo de individuos, puede extraerse una muestra y ofrecer como
estimación puntual la talla media de los individuos. Lo más importante de un
estimador, es que sea un estimador eficiente. Es decir, que sea insesgado
(ausencia de sesgos) y estable en el muestreo o eficiente (varianza mínima)
Estimación puntual. Sea X una variable poblacional con distribución Fθ , siendo θ
desconocido. El problema de estimación puntual consiste en, seleccionada una
muestra X1,..., Xn, encontrar el estadístico T(X1,..., Xn) que mejor estime el
parámetro θ. Una vez observada o realizada la muestra, con valores x1,..., xn, se
obtiene la estimación puntual de θ, T(x1,..., xn) = ˆ θ.
Vemos a continuación dos métodos para obtener la estimación puntual de un
parámetro: método de los momentos y método de máxima verosimilitud. Método
de los momentos: consiste en igualar momentos poblacionales a momentos
muéstrales. Deberemos tener tantas igualdades como parámetros a estimar.
Momento poblacional de orden r αr = E (Xr) Momento muestral de orden r ar = Xn
i=1 Xr i n
Método de máxima verosimilitud: consiste en tomar como valor del parámetro
aquel que maximice la probabilidad de que ocurra la muestra observada. Si X1, ...,
Xn es una muestra seleccionada de una población con distribución Fθ o densidad
fθ(x), la probabilidad de que ocurra una realización x1, ..., xn viene dada por:
Lθ(x1, ..., xn) = Yn i=1 fθ(xi)
A Lθ(x1, ..., xn) se le llama función de verosimilitud.(credibilidad de la muestra
observada). Buscamos entonces el valor de θ que maximice la función de
verosimilud, y al valor obtenido se le llama estimación por máxima verosimilitud de
θ. Nota: si la variable X es discreta, en lugar de fθ(xi ) consideramos la función
masa de probabilidad pθ(xi).
Ejemplo 7.1: Sea X → N(µ, σ), con µ desconocido. Seleccionada una más. X1,...,
Xn, con realización x1,..., xn, estimamos el parámetro µ por ambos métodos.
Según el método de los momentos: E(X) = Xn i=1 Xi n = − X, y al ser µ = E(X) se
obtiene que ˆ µ = − x. Por el método de máxima verosimilitud: Lµ(x1, ..., xn) = Yn
i=1 fµ(xi ) = = Yn i=1 1 √ 2πσ e −(xi−µ) 2 2σ
Estimación por Intervalos de confianza 109 y maximizamos en µ tal función; en
este caso resulta más fácil maximizar su logaritmo: lnLµ(x1, ..., xn) = − 1 2σ 2 Xn
i=1 (xi − µ) 2 − n ln( √ 2πσ) ∂ ∂µ lnLµ(x1, ..., xn) = 1 σ 2 Xn i=1 (xi − µ) = n − x − nµ
σ 2 = 0 ⇐⇒ ˆ µ = −
Intervalo de confianza:
El intervalo de confianza es una expresión del tipo [θ1, θ2] ó θ1 ≤ θ ≤ θ2, donde θ es
el parámetro a estimar. Este intervalo contiene al parámetro estimado con un
determinado nivel de confianza. Pero a veces puede cambiar este intervalo
cuando la muestra no garantiza un axioma o un equivalente circunstancial.
Variabilidad del Parámetro:
Si no se conoce, puede obtenerse una aproximación en los datos aportados por la
literatura científica o en un estudio piloto. También hay métodos para calcular el
tamaño de la muestra que prescinde de este aspecto. Habitualmente se usa como
medida de esta variabilidad la desviación típica poblacional y se denota σ.
Error de la estimación:
Es una medida de su precisión que se corresponde con la amplitud del intervalo
de confianza. Cuanta más precisión se desee en la estimación de un parámetro,
más estrecho deberá ser el intervalo de confianza y, si se quiere mantener o
disminuir el error, más observaciones deberán incluirse en la muestra estudiada.
En caso de no incluir nuevas observaciones para la muestra, más error se comete
al aumentar la precisión. Se suele llamar E, según la fórmula E = (θ2 - θ1)/2.
Límite de Confianza:
Es la probabilidad de que el verdadero valor del parámetro estimado en la
población se sitúe en el intervalo de confianza obtenido. El nivel de confianza se
denota por (1-α), aunque habitualmente suele expresarse con un porcentaje ((1-
α)·100%). Es habitual tomar como nivel de confianza un 95% o un 99%, que se
corresponden con valores α de 0,05 y 0,01 respectivamente.
Valor α:
También llamado nivel de significación. Es la probabilidad (en tanto por uno) de
fallar en nuestra estimación, esto es, la diferencia entre la certeza (1) y el nivel de
confianza (1-α). Por ejemplo, en una estimación con un nivel de confianza del
95%, el valor α es (100-95)/100 = 0,05
Valor crítico:
Se representa por Zα/2. Es el valor de la abscisa en una determinada distribución
que deja a su derecha un área igual a α/2, siendo 1-α el nivel de confianza.
Normalmente los valores críticos están tabulados o pueden calcularse en función
de la distribución de la población. Por ejemplo, para una distribución normal, de
media 0 y desviación típica 1, el valor crítico para α = 0,1 se calcularía del
siguiente modo: se busca en la tabla de la distribución ese valor (o el más
aproximado), bajo la columna "Área"; se observa que se corresponde con -1,28.
Entonces Zα/2 = 1,64. Si la media o desviación típica de la distribución normal no
coinciden con las de la tabla, se puede realizar el cambio de variable t =(X-μ)/σ
para su cálculo.
Con estas definiciones, si tras la extracción de una muestra se dice que "3 es una
estimación de la media con un margen de error de 0,6 y un nivel de confianza del
99%", podemos interpretar que el verdadero valor de la media se encuentra entre
2,7 y 3,3, con una probabilidad del 99%. Los valores 2,7 y 3,3 se obtienen
restando y sumando, respectivamente, la mitad del error, para obtener el intervalo
de confianza según las definiciones dadas.
Para un tamaño fijo de la muestra, los conceptos de error y nivel de confianza van
relacionados. Si admitimos un error mayor, esto es, aumentamos el tamaño del
intervalo de confianza, tenemos también una mayor probabilidad de éxito en
nuestra estimación, es decir, un mayor nivel de confianza.
Inferencia:
En todo contraste intervienen dos hipótesis. La hipótesis nula (Ho) es aquella que
recoge el supuesto de que el parámetro toma un valor determinado y es la que
soporta la carga de la prueba. La decisión de rechazar la hipótesis nula, que en
principio se considera cierta, está en función de que sea o no compatible con la
evidencia empírica contenida en la muestra. El contraste clásico permite controlar
a priori la probabilidad de cometer el error de rechazar la hipótesis nula siendo
ésta cierta; dicha probabilidad se llama nivel de significación del contraste ( ) y
suele fijarse en el 1%, 5% o 10%.
Media:
Mediana:
La mediana es un conjunto es un valor que se encuentra a la mitad de los otros
valores, es decir, que al ordenar los número de menor a mayor, éste se encuentra
justamente en medio entre los que están por arriba.
Ejemplo de Mediana
Moda:
Por último, se conoce como moda adyacente cuando dos valores continuos tienen
la misma cantidad de repeticiones. En este caso se saca el promedio de ambos.
Nombres Edad
William Robert González 57
Nubia Esther Palacios 54
Yuleima Carreño 37
Katrim Lucia González 27
Gildar Andrés González 22
Zaira Saday González 6
José Irlandés Rojano 22
Amparo de Jesús 40
Juan Javier Palacios 43
Eduardo Luis Palacios 29
Calcular la media:
X= 57+54+37+27+22+6+22+40+43+29÷10
X= 33,7
Calcular la mediana:
Mediana= 66÷2= 33
Calcular la moda:
Moda: 22, 22