0% encontró este documento útil (0 votos)
25 vistas20 páginas

Tarea 2

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1/ 20

Paso 2

Distribuciones muestrales y estimación

Estudiante

Katherine Ortiz Amezquita Código - 1123512411

Julexy Katalina Ríos Gutiérrez – 1004966752

Darly Patricia Estevez – 1006449998

Yeisson Daniel Toro Valencia - 1120377026

Tutor

Victor Manuel Mendoza Rodriguez

Grupo

551112

Universidad Nacional Abierta y a Distancia – UNAD

Escuela de Ciencias de la Educación

Licenciatura en Matemáticas

Inferencia Estadística
2023
Introducción

En este documento exploramos cómo la distribución muestral y la estimación son

herramientas esenciales en la toma de decisiones basadas en datos, permitiéndonos sacar

conclusiones precisas sobre poblaciones a partir de muestras finitas y ayudándonos a

comprender la incertidumbre asociada con nuestras estimaciones. También veremos cómo

estas herramientas se aplican en una variedad de contextos, desde la investigación científica

hasta el análisis de datos empresariales, para tomar decisiones informadas y respaldadas por

evidencia estadística.

A continuación encontramos el desarrollo de los ejercicios propuestos en la guía de

actividades y rúbrica de evaluación Paso 2 – Distribuciones muestrales y estimación en

donde se encuentran unas definiciones importantes sobre conceptos de suma importancia en

el área de la estadística, continuo a esto el desarrollo a unos ejercicios en los cuales se

requirió de saberes sobre distribuciones muestrales y estimación.


Parte A.

Consultar la definición de cada uno de los siguientes conceptos, cuándo y para qué se usan.

Distribuciones de probabilidad: nos permite un despliegue de todos los

posibles resultados de un experimento junto con las probabilidades de cada resultado.

Existen múltiples distribuciones de probabilidad.

Algunas son la distribución binomial, para variables nominales dicotómicas, distribución

normal, para variables continuas, distribución de Poisson, distribución de Chi-cuadrado,

distribución exponencial, etc.

Distribución binomial: solo hay dos resultados complementarios

posibles para un experimento, usualmente denominado éxito y fracaso.

La variable aleatoria es resultado de conteos, donde se toma una muestra y se cuenta el

número de éxitos.

La probabilidad de éxito es constante entre una prueba y otra, y el experimento puede

repetirse muchas veces.

n! x n−x
P ( x )= π (1−π )
x ! ( n−x ) !

π= probabilidad de exito

n=tamaño de muestra

x=numero de exito

Presenta las siguientes propiedades:

● Consiste en un número fijo, n, de pruebas idénticas.

● Cada prueba resulta en uno de dos resultados: éxito, s, o fracaso, F.


● La probabilidad de éxito en una sola prueba es igual a algún valor p y es el mismo

de una prueba a la otra. La probabilidad de fracaso es igual a q=( 1− p ) .

● Las pruebas son independientes.

● La variable aleatoria de interés es Y, el número de éxitos observados durante la n

pruebas.

Distribución normal: La distribución normal es un caso de probabilidad de variable

aleatoria continua, la distribución de una variable está determinada por dos parámetros, su

media y su desviación estándar.

1
P ( X )=
σ √❑

● Tiene forma de campana

● Es simétrica

● Es asintótica

Una de las aplicaciones de la desviación estándar consiste en la regla empírica.

A medida que mayor número de datos se agrega a la muestra de ciertas variables

aleatorias, la distribución de probabilidad va tomando una forma de campana, una

distribución normal o gaussiana.

Según el autor Prieto, A. F. (2015). Las son propiedades de la distribución normal:

● El área total que encierra la curva y el X es igual a 1.


∫ f ( x ) dx=1
−∞

● Es simétrica con respecto al eje vertical x=μ, ya que f (x) solo depende de x

mediante la expresión ( x−μ )2.

f [ ( x + μ ) ] =f [ −( x−μ ) ]

● La densidad es simétrica alrededor de μ, el valor máximo de f ocurre en x=μ.

1
f ( μ )=
σ √❑

● f (x)≥ 0 para todo x .

● Tiene al eje x como una asíntota horizontal, ya que → ∞ f ( x )=0

● Tiene puntos de inflexión x=μ−σ y x =μ +σ , por tanto, es cóncava hacia abajo en

intervalo μ−σ < x < μ+σ , y cóncava hacia arriba en cualquier otra parte.

Tipos de métodos de muestreo

Partiendo que la muestra se obtiene con la recolección de datos de un experimento para así

lograr una evidencia representativa

Muestreo no probalístico dentro de este se conocen varios tipos:

●Muestreo por convivencia: Este método, también conocido como método basado en

sujetos disponibles, no permite al investigador controlar la representatividad de la muestra.


Sin embargo, esto es útil cuando, por ejemplo, el investigador quiere estudiar las

características de las personas que pasan por una esquina en un momento determinado, o

cuando el tiempo y los recursos son tan limitados que de otro modo la investigación no

sería posible.

● Muestreo por juicio

Este método se basa en la experiencia y capacidad que tiene la persona para escoger

los individuos que se suponen que son los más representativos de la población.

● Muestreo por causa/efecto

Ésta es realizada cuando no existe una población definida y es necesario buscar

elementos para el estudio en cuestión.

● Muestreo por cuotas

Dependiendo de unas características que cumplan la población de estudio se escogen

las unidades o elementos de modo que la muestra total tengan la misma distribución de

características.

● Muestreo de poblaciones móviles

Es un método propio de aquellas poblaciones móviles que migran a lugares

determinados.
Muestra probalística en este se puede observar o evidenciar que los elementos de

una población tiene una probabilidad matemática conocida.

Una muestra se considera probabilística si cumple con las siguientes condiciones:

a) Se pueda definir un conjunto de muestras M1, M2, M3... Mi posibles derivados del

proceso de selección propuesta. Así se puede identificar que unidades de muestreo

pertenecen a la muestra M1, M2, M3... Mi

b) A cada muestra posible le debe corresponder una probabilidad de selección

conocida P(S).

c) El proceso de selección garantiza que todos los elementos de la población tienen

una probabilidad P(yi)>0 de ser elegido en alguna muestra.

d) La selección es un proceso aleatorio que garantiza que cada muestra S tenga una

probabilidad P(S) de ser elegida. Muestreo aleatorio simple

Dentro del muestreo probabilístico o aleatorio existen cuatro métodos:

● Muestreo aleatorio simple

El método de muestreo fundamental utilizado en los métodos y cálculos estadísticos

es el muestreo aleatorio simple para una muestra aleatoria simple, a cada unidad de la

población objetivo se le asignan los números correspondientes. Se genera un conjunto de

números aleatorios y las unidades que contienen esos números se incorporan a la muestra.

● Muestreo estratificado
Cuando se utiliza el muestreo estratificado, el investigador divide la población

objetivo en subgrupos o estratos y luego elige aleatoriamente entre los diversos subgrupos.

● Muestreo sistemático

El proceso de muestreo sistemático implica reunir una lista de elementos de la

población y seleccionar cada elemento de la lista para incluirlo en su muestra.

● Muestreo por conglomerados

Este es un método de muestreo aleatorio en el que los elementos de la población se

dividen en forma natural en subgrupos, de tal forma que dentro de ellos sean lo más

heterogéneo posible y entre ellos sean homogéneos, caso contrario al muestreo

estratificado.

Distribuciones muestrales:

● Valor esperado

● Desviación estándar en la media muestral: se necesita la fórmula siguiente para

hallar la desviación estándar den la media




2
s= ¿¿ ¿ ¿ ¿

Teorema del límite central. Este teorema hace referencia a que, en muestras mayores a 30

elementos, la distribución de esta muestra o sus promedios muéstrales, siempre será de

distribución normal, la media de la muestra será la misma media de la variable de interés y

la desviación estándar de los datos serán iguales al error estándar (Díaz, 2018).

● Estimación, estimación puntual, estimación real y estimador del parámetro

objetivo.

Estimación. Estimación se refiere a la tendencia o preferencia de análisis hacia un dato

determinado (Díaz, 2018). Es decir, es cuando se decide o se establece un parámetro en el

que debe estar una variable.

Estimación puntual. Este término puede ser definido como “un valor que puede ser

considerado representativa de la variable estudiada y se indica que es una característica de

ella” (Bianco y Martínez, 2018). Sobre esto, existen dos métodos para encontrar estos tipos

de valores que son el método de momentos y el método de máxima verosimilitud.

Estimación real. La estimación real hace referencia a la estimación de tomar un estimador

o una regla que permite calcular la estimación de algo (Guillen, 2015).

Estimación del parámetro objetivo. Es el parámetro de interés al que se llega por medio

de una estimación puntual dentro de la información proporcionada por una muestra y que

busca un número puntual u objetivo (Guillen, 2015).

Estimación de intervalo y sesgo. La estimación de intervalo es un conjunto de valores en

el que se busca encontrar un parámetro determinado de la población y dentro del cual se

utiliza un dato no sesgo o una intencionalidad de búsqueda de datos para llegar a una

estimación objetivo. La definición de no sesgado, hace referencia a un valor en donde no se


generen datos e intenciones para determinar un valor dentro de la muestra de interés o

establecido por el investigador, sino que este, se dé, de forma estadística (Guillen, 2015).

Error de estimación. Cuando en una distribución muestra normal se encuentran

desviaciones de los valores absolutos, a esto se le llama error de estimación (Guillen,

2015).

● Colas de la densidad de probabilidad. La densidad de la probabilidad suele

denominarse frecuencia, por lo tanto, la cola de la densidad de probabilidad son datos o

direcciones de esa densidad o frecuencia poblacional (Fernández, 2018).

● Límite probabilístico en el error de estimación. Se trata de uno o dos valores que se

establecen y sobre los que se determina que estará un error buscando un valor puntual

(Fernández, 2018).

Intervalos de confianza. Se trata de uno o dos valores que se establecen y sobre los que se

determina que estará un valor buscado (Fernández, 2018).

Parte B.

1. Los siguientes 30 datos corresponden al consumo en Kilovatios - hora de los hogares de

algunos estudiantes de cierta universidad:


a. Construya las distribuciones de frecuencia relativa, de frecuencia absoluta y

distribución acumulada.

Distribución de frecuencia relativa = 1 que equivale al 100%.

Frecuencia absoluta = 30 que equivale al número total de datos.

Distribución acumulada: es la suma de las frecuencias acumuladas de esa clase y las clases

correspondientes a valores menores.


b. Calcular la media, mediana, moda y desviación estándar.

Media:

3801


x. f =
30
=126 ,7
x=

x=126 , 7

Mediana:

N +1
mediana=
2

30+1 31
mediana= = =15 , 5
2 2

La mediana se encuentra en lugar 15 y 16

Moda: como la moda es el dato que más se repite buscamos en la tabla de frecuencia el

dato que más se repite.

Mo=117

Desviación estándar:

Para hallar la desviación estándar, primero hallamos la varianza.

s= √ ❑

330,718
s= =11,404
30−1

● Para la desviación estándar debemos sacar raíz cuadrada a la varianza.

Desviación estándar=√ ❑

S=3,376

2. Los siguientes datos corresponden a una serie de pesos (en gramos) de frutas tomadas de

un montón de ellas en una frutería:


Organizar los datos

188,6 198 202 210,7 220,3 221 221 221,4 223 225,4

226 228 229 230 230,2 232 233,7 235 235 235,4

235,5 236 237 238,7 239 240 241 243 243,4 243,5

244 244,2 245 245,6 255,3 256 262 268,4 270 275,4

a. Calcular la media

Se deben sumar todos los valores en gramos y dividirlos por la cantidad de productos.

x=9,408.7 ÷ 40=235.21
b. Calcular la mediana

Como existe un número par en la cantidad de datos se deben sumar los dos números

que están en la mitad y luego dividir ese valor en 2

Me=235.4 +235.5=470.9 ÷ 2=235.45


c. Hallar la moda

Es el valor que más se repite

Mo=235
d. Calcular la desviación estándar

√∑

2
s= ¿¿ ¿ ¿ ¿

s=

2 149,556.84
39

s= √ 3,834.79
2

s=61.925
e. ¿Cuál medida de tendencia central sería la más adecuada? Justifique su respuesta

Rta/: El promedio del peso representado en gramos de las frutas es de 235.21gr

El 50% del peso representado en gramos de las frutas es mayor o igual que 235.35gr

Las frutas con más frecuencia de peso son de 235gr

4. Cierto metal se produce, por lo común, mediante un proceso estándar. Se desarrolla un

nuevo proceso en el que se añade una aleación a la producción del metal. Los fabricantes se

encuentran interesados en estimar la verdadera diferencia entre las tensiones de ruptura de

los metales producidos por los dos procesos. Para cada metal se seleccionan 12 ejemplares

y cada uno de éstos se somete a una tensión hasta que se rompe. La siguiente tabla muestra

las tensiones de ruptura de los ejemplares, en kilogramos por centímetro cuadrado:

Proc 446 401 476 421 459 438 481 411 456 427 459 445
eso
está
ndar

proc 462 448 435 465 429 472 453 459 427 468 452 447
eso
nuev
o
Si se supone que el muestreo se llevó a cabo sobre dos distribuciones normales e

independientes, obtener:

a. Intervalo de confianza estimado del 95% para la diferencia entre los dos procesos.

b. Intervalo de confianza estimado del 99% para la diferencia entre los dos procesos.

c. Interprete los resultados.

Solución:

Primero, calculamos las estadísticas para ambos conjuntos de datos:

Para el proceso estándar

Media:

(446+ 401+476+ 421+ 459+ 438+ 481+411+ 456+ 427+ 459+445)


(x̄ 1)= =446 ,75
12

Desviación estándar:

(s1 )=27 , 01

Para el proceso nuevo

Media:

(462+ 448+435+ 465+ 429+472+ 453+459+ 427+ 468+ 452+ 447)


(x̄ 2)= =453 , 83
12

Desviación estándar:

(s 2)=16 , 28

Ahora, podemos calcular los intervalos de confianza.

a. Intervalo de confianza del 95% para la diferencia entre los dos procesos: Usaremos la

fórmula para el intervalo de confianza para la diferencia de medios:

intervalo de confianza ¿(x̄ 1−x̄ 2)± t . SE


Donde SE es el error estándar de la diferencia yt es el valor crítico de la distribución t de

Student para un nivel de confianza del 95% con 22 grados de libertad (12 observaciones en

cada grupo - 1):

SE= √❑

SE= √❑

SE= √❑

t=2,080

Intervalo de confianza

(446 ,75−453 , 83)±2,080 ( 14 ,23 )

¿(−12, 08 , 5 , 42)

b. Intervalo de confianza del 99% para la diferencia entre los dos procesos: Realizamos el

mismo cálculo, pero con un valor crítico de t correspondiente al nivel de confianza del 99%

y 22 grados de libertad:

t=2,831

Intervalo de confianza

(446 ,75−453 , 83)±2,831 ( 14 , 23 )

¿(−14 , 97 , 7 , 31)

C. Interpretación de los resultados:

a. El intervalo de confianza del 95% para la diferencia entre los dos procesos es (-12.08,

5.42). Esto significa que podemos estar razonablemente seguros al 95% de confianza de

que la verdadera diferencia entre las tensiones de ruptura de los dos procesos se encuentra

dentro de este intervalo. En otras palabras, el proceso estándar puede tener una tensión de

ruptura hasta 12,08 kg/cm² menor o 5,42 kg/cm² mayor que el proceso nuevo.
b. El intervalo de confianza del 99% para la diferencia entre los dos procesos es (-14.97,

7.31). Este intervalo es más amplio que el intervalo del 95%, lo que significa que estamos

más seguros al 99% de confianza de que la verdadera diferencia se encuentra dentro de este

rango. El proceso estándar puede tener una tensión de ruptura hasta 14,97 kg/cm² menor o

7,31 kg/cm² mayor que el proceso nuevo.

En ambos casos, no podemos afirmar con certeza que uno de los procesos sea mejor que el

otro, ya que los intervalos de confianza incluyen valores positivos y negativos. Sin

embargo, proporcione una estimación de la diferencia probable entre los dos procesos con

cierto nivel de confianza.

5. Realice el ejercicio propuesto del libro: Anderson, D., Sweeney, D., Williams, T.,

Camm, J., and Cochran, J. (2014). Statistics for Business and Economics. Twelfth Edition.

Cengage 4 Learning.

https://opac.atmaluhur.ac.id/uploaded_files/temporary/DigitalCollection/

ZTI3ZWZhMTZhNWU1MDc5MzBmYmQ1NzZmMmZiMWE2ZGI1Nm

E0ZDY0YQ==.pdf

Página 356 (320 del libro): Exercises. Methods. Punto 18, literales a) y b).

Una población tiene una media de 200 y una desviación estándar de 50. Una muestra de

tamaño 100 y la media de la muestra se utilizará para estimar la media de la población.

a. ¿Cuál es el valor esperado de x ?

Rta: la media de la población es 200, usando el muestreo aleatorio simple, el valor

esperado o media de la distribución muestral es igual a la media de la población.

b. ¿Cuál es la desviación estándar de x ?

Rta: fórmula de población finita


luego seguimos con la desviación estándar

σ
σ x=
√❑
50
σ x=
√❑
50
σ x=
10
σ x=5

Conclusiones

La estadística es una ciencia muy importante para el ser humano y para las

diferentes profesiones, porque permite determinar características y propiedades de grandes

poblaciones. Existen diferentes propósitos en los que se reúne gran cantidad de datos por
medio de encuestas estadísticas y estás estimaciones o límites ayudan a delimitar o

preestablecer valores que son importantes en los estudios a muestras de gran tamaño.

Contar con intervalos de confianza o errores estándar en las distribuciones normales

de las muestras reduce el error que pueda generarse durante el procesamiento de los datos y

el cual permite una mayor confiabilidad en la información generada estadísticamente para

el proceso de la toma de decisiones

Los intervalos de confianza proporcionan una forma efectiva de estimar parámetros

desconocidos de una población utilizando muestras de datos. Son esenciales en la toma de

decisiones basadas en datos y ayudan a los investigadores y profesionales a comprender la

incertidumbre en sus estimaciones.

A medida que se aumenta el nivel de confianza, el intervalo de confianza se vuelve

más amplio, lo que significa que se tiene más confianza en que el valor poblacional se

encuentra dentro del intervalo, pero al costo de una estimación menos precisa. Por otro

lado, reducir el nivel de confianza resultará en un intervalo más estrecho, lo que

proporcionará una estimación más precisa pero con menos confianza en su cobertura de la

población real. La elección del nivel de confianza debe ser coherente con los objetivos y las

necesidades del análisis.

Bibliografía
Bianco, A., & Martínez, E. (2018). Inferencia estadística - Estimación puntual. Obtenido de

http://www.dm.uba.ar/materias/probabilidades_estadistica_C/2011/1/

PyEC132011.pdf

Díaz, N. C. (2018). Ditribución de probabilidad. El teoréma central del límite. Obtenido de

https://www.revistaseden.org/files/8-CAP%208.pdf

Fernández, D. S. (2018). Distribución normal e introducción a pruebas de hipótesis.

Obtenido de https://rpubs.com/dsfernandez/418180

Guillen, B. (2015). Estimaciones estadísticas. Un acercamiento analítico. Daena:

International Journal of Good Conscience, 237-255. Obtenido de

http://www.spentamexico.org/v5-n1/5(1)237-255.pdf

Ochoa Sangrador, C., Molina Arias, M., & Ortega Páez, E. (2019). Inferencia estadística:

Probabilidad, variables aleatorias y distribuciones de probabilidad. Evid Pediatr, 15,

27.

Prieto, A. F. (2015). Distribuciones de probabilidad. Universidad de Cundinamarca.

Recuperado de: http://www. academia.

edu/19517058/Distribuciones_discretas_y_continuas.

Sierra, J. J. (2013). Inferencia Estadística. Módulo de la Universidad Abierta y a Distancia.

[PDF]. Repositorio Institucional UNAD.

https://repository.unad.edu.co/handle/10596/11301

También podría gustarte