Guía 1-Estadística Descriptiva

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

Universidad Técnica Federico Santa Marı́a Profesor: Ronny Vallejos

Departamento de Matemática

Guı́a 1: Estadı́stica Descriptiva

Ejercicio 1. En una empresa el coeficiente de variación de los empleados del departamento de


producción es 0.35. La gerencia de producción decide subir un 5 % el sueldo. Por su parte la
gerencia de la empresa decide dar un bono mensual de 3 UF. El coeficiente de variación después
de la transformación es 0.15. Determine el promedio y la desviación estándar antes y después de
la transformación.
S
Nota: El coeficiente de variación para una muestra X1 , X2 , . . . , Xn se define como CV = X
.
Ejercicio 2. La temperatura en el interior de un transformador puede ser medida por dos métodos
distintos, el método clásico y el método nuevo. A continuación se presentan 10 datos obtenidos
por cada método:

Método Clásico Método Nuevo


28 19
19 27
23 31
34 42
27 37
38 24
23 28
26 31
25 36
31 21

Si un transformador funciona en forma correcta con una temperatura de 30◦ C

a. Determine cuál método es más preciso y más exacto.


b. ¿Cuál es el promedio y la varianza para el método clásico medido en grados Farenheit?

Ejercicio 3. Sea X1 , . . . , Xn una muestra aleatoria de tamaño n. Definimos la media geométrica


X G como sigue
X G = (X1 · . . . · Xn )1/n .
Demuestre que X G ≤ X.
Ejercicio 4. La siguiente muestra representa el tiempo (en horas) que 25 cajeros electrónicos
funcionan correctamente. La muestra es la siguiente:

2130, 2158, 2191, 2110, 2145, 2208, 2201, 2195, 2125, 2148, 2166, 2172, 2192, 2138, 2210, 2215,
2108, 2105, 2120, 2130, 2144, 2172, 2248, 2115, 2150.

a. Determine la media, la varianza, la mediana, el rango intercuartı́lico (IQR) y la moda.


b. Que porcentaje de dispositivos funcionó más de 2150 horas correctamente % ?
c. Determine si existen puntos aberrantes (outliers) en la muestra.
d. Construya un Boxplot y determine si el histograma es simétrico, si existen posibles outliers
y el rango donde se distribuye el 50 % de la muestra.
MAT-042 1 Octubre 02, 2019
Universidad Técnica Federico Santa Marı́a Profesor: Ronny Vallejos
Departamento de Matemática

e. ¿Cuál es la probabilidad que un dispositivo funcione correctamente más de 2150 horas?


f. Construya un histograma considerando 6 intervalos de igual longitud. Describa los patrones
que observa.

1
Ejercicio 5. Considere la transformación de los datos de una muestra como sigue: Yi = 2Xi +3
. Si
X = −25.8 y SX = 7.8, determine aproximadamente Y y SY .

Nota: SX = n1 ni=1 (Xi − X)2 .


P

2
Ejercicio 6. Sea X una variable estadı́stica tal que SX = 2 y X = 1. Sea Yi = 0.9Xi + 1.1.

a. Encuentre la media de Y.
b. Calcule SY2 .
a. ¿Existe el coeficiente de variación (CV)?

Ejercicio 7. Un encuestador de una fábrica de ciertos componentes electrónicos registra con


“0çuando una empresa no responde a la pregunta sobre cierta caracterı́stica X que tiene que ver
con el buen funcionamiento de dichos componentes. Del total de n empresas una proporción p de
ellas están registradas con “0”. Un analista (Usted) procesa la información considerando los valores
“0.obteniendo X = 21.6 y Sn2 = 87.1 Basado en esta información y conociendo que se consultaron
n = 200 empresas y que la proporción p fue del 10 %. Calcule la verdadera media y varianza usando
la información de las empresas que respondieron la encuesta.

Ejercicio 8. Se realizó un estudio para determinar la cantidad de dinero que gasta una familia de
clase media en alimentación por semana. Se tomó una muestra aleatoria obteniendo los siguientes
resultados en miles de pesos:

Clases ni
[0 − 10] 18
[10 − 20] 22
[20 − 30] 36
[30 − 40] 30
[40 − 100] 08

a. Calcule la cantidad de dinero promedio que gastan las familias por semana.
b. ¿Qué porcenntaje de familias gasta más de 35.000 peros en alimentación a la semana?
c. Calcule la mediana, la moda y el percentil noventa.

Ejercicio 9. En una fábrica de automóviles, el departamento de control de calidad decide hacer


pruebas para determinar si los autos cumplen con ciertas especificaciones dadas por el diseño
(2014). 45 automóviles recién fabricados (3 modelos distintos) son puestos en funcionamiento
durante 3 horas a una velocidad de 100 km/h para determinar el rendimiento de combustible en
litros. La tabla que se entrega a continuación resume la información obtenida en el experimento.

MAT-042 2 Octubre 02, 2019


Universidad Técnica Federico Santa Marı́a Profesor: Ronny Vallejos
Departamento de Matemática

Litros Modelo 1 Modelo 2 Modelo 3


[15 − 20] 8 7 8
[20 − 25] 5 3 4
[25 − 30] 2 5 3

a. Determine qué modelo tiene mejor rendimiento.


c. El diseño del modelo 1 para el año 2015 especifica que la cantidad de litros de combustible
por cada 300 Km será 5 % menor a la del año anterior. ¿Cuántos litros de combustible gastará
en promedio el modelo 1 en recorrer 300 Km?

Ejercicio 10. El número de fallas mensuales del sistema de almacenamiento de correos electróni-
cos de una compañı́a es una variable estadı́stica de interés. Se tomó una muestra de 20 meses
consecutivos para estudiar esta variable y la información que se obtuvo es la siguiente:

Q1 = 7.75; M e = 10.00; Q3 = 11.00; γ1 = −0.5087312; γ2 = 2.29001; X = 9.5; S = 2.605662.

X
12
11
10
9
8

0 50 100 150 200

Usando la información disponible:

a. Haga un análisis descriptivo de la variable X: número de fallas mensuales en el sistema de


almacenamiento de correos electrónicos (Su respuesta debe ser escrita en no más de 5 lı́neas).
MAT-042 3 Octubre 02, 2019
Universidad Técnica Federico Santa Marı́a Profesor: Ronny Vallejos
Departamento de Matemática

b. En otra compañı́a el número de fallas mensuales Y en el sistema de almacenamiento de


correos electrónicos es descrita por la función

Y = 2X − 1.

Construya un boxplot para la variable Y .


c. Calcule el coeficiente de variación (CV) para las variables X e Y.

Ejercicio 11. Dada una señal en el tiempo {Xt , t ∈ Z}. El retorno de una señal se define como

Xt − Xt−1
Rt = .
Xt−1
Se analizan dos señales independientes Xt e Yt las cuales han sido observadas para t =
1, 2, . . . , 200. Se conoce la siguiente información de ambas señales:
a. Haga un análisis descriptivo de los retornos asociados a las señales Xt e Yt .
b. ¿ Porqué los retornos son más apropiados para comparar datos medidos en el tiempo que las
series originales?
c. Supongamos que una variable de interés es
Zt = Xt + aYt , t = 1, 2, . . . , 200.

Encuentre una expresión para el promedio (Z) y la varianza SZ2 de la variable Z.


d. Si a=0.1, 200
P 2
P200 2 P200
t=1 (Xt − X) = 230, Y = 0.7, t=1 Yt = 14.3, y t=1 (Xi − X)(Yt − Y ) = 0.01,
2
¿Es posible obtener SZ ?

Ejercicio 11. La cantidad de agua caida en dos cuidades durante 20 años consecutivos está
resumida en la siguiente tabla [en mm]:

Cuidad 1 Cuidad 2
0-100 1 0
100-200 1 2
200-300 2 5
300-400 8 6
400-500 3 4
500-600 3 3
600-700 2 0

a. Compare la cantidad de agua caı́da en ambas cuidades.


b. Para cada cuidad ¿Qué porcentaje de años la cantidad de agua caı́da fue menor a 160 [mm]?
c. Determine si los histogramas asociados a cada variable son simétricos.

MAT-042 4 Octubre 02, 2019


Universidad Técnica Federico Santa Marı́a Profesor: Ronny Vallejos
Departamento de Matemática

X Y

18
12

16
11

14
10

12
9

10
8

8
0 50 100 150 200 0 50 100 150 200

X Y

Retorno de X Retorno de Y

0.6
0.4

0.4
0.2

0.2
0.0
0.0

-0.2
-0.2

-0.4

0 50 100 150 200 0 50 100 150 200

Retorno de X Retorno de Y

Retorno de X Retorno de Y
0.6
0.4

0.4
0.2

0.2
0.0
0.0

-0.2
-0.2

-0.4

Retorno de X Retorno de Y

Ejercicio 12. La variable X representa la demanda de un producto (en toneladas) que cierta
empresa ofrece en el mercado. La variable Y representa las ventas del mismo producto, ambas
medidas en millones de pesos. Se dispone de la siguiente información para las variables X e Y :
{(Xi ; Yi )}, i = 1, . . . , n. Considere el modelo de regresión
Yi = β0 + β1 Xi + i
donde i es un error aleatorio.
a. Calcule los estimadores de mı́nimos cuadrados de β0 y β1 .
b. Escriba el modelo de regresión ajustado para la variable Y como función de X.
c. Determine las estimaciones de β0 y β1 si:
n
X
2
n = 10; X = 5.33; Y = 13; Xi Yi = 92.42; SX = 0.86.
i=1

MAT-042 5 Octubre 02, 2019


Universidad Técnica Federico Santa Marı́a Profesor: Ronny Vallejos
Departamento de Matemática

d. ¿Cuál podrı́a ser un valor para las ventas cuando las demanda es igual a 5 toneladas? Justi-
fique.

Ejercicio 13. Se han hecho las siguientes observaciones de los pesos de 10 muestras de metal al
ser tratados quı́micamente durante perı́odos de tiempo cambiantes

Y Peso [lb] 19 16 15 5 15 9 11 13 8 10
X Tiempo [seg] 5 10 15 20 25 30 35 40 45 50

a. Ajustar una curva exponencial de la forma Y = β0 β1X .


b. Ajustar una curva exponencial de la forma Y = 1/(β0 + β1 X).
c. Seleccione el mejor modelo entre los anteriores. Justifique!

MAT-042 6 Octubre 02, 2019

También podría gustarte