Solucion Estadistica I 18mayo2012

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 5

Examen Final de Estadı́stica I, 18 de Mayo de 2012.

Grados en ADE, DER-ADE, ADE-INF, FICO, ECO, ECO-DER.

NORMAS: 1) Entregar cada problema en un cuadernillo distinto, aunque esté en blanco.


2) Realizar los cálculos con al menos dos cifras decimales significativas.
3) No se podrá abandonar el examen hasta transcurridos 30 minutos depués de haber empezado.
4) No está permitido salir del aula sin entregar el examen, aunque esté en blanco.

1. La tabla siguiente contiene los resultados de una encuesta realizada en 1000 hogares españoles, donde se
registraron los valores de (X, Y ), siendo X =“número de coches en propiedad en 2011”, con posibles valores
0, 1, 2, e Y =“renta neta del hogar en 2011 (en miles de euros)”.
(a) (0.25 puntos) ¿De qué tipo son las variables X e Y ?
Y
(b) (0.5 puntos) Obtener la frecuencia marginal absoluta de
[0, 50) [50, 100) [100, ∞)
X. Calcular la media y cuasi-desviación tı́pica de X.
0 324 105 37
X1 112 234 6 (c) (0.5 puntos) Para los hogares con renta neta inferior a
2 1 4 177 50 mil euros, determinar el promedio y el número más
frecuente de coches en propiedad.
Se dispone de la siguiente información de la variable Y , respecto de los tres grupos que define X:
Resumen Estadı́stico para Y
X=0 X=1 X=2
Recuento 466 352 182
Promedio 39.70 58.93 248.12
Mediana 28.35 59.52 265.24
Varianza 1376.33 372.85 2672.49
Desv. Estándar 37.10 19.31 51.70
Coef. de Variación 93.44% 32.77% 20.84%
Mı́nimo 0.03 0.94 32.56
Máximo 288.44 126.09 299.81
Rango 288.41 125.15 267.26
Primer Cuartil 12.39 46.16 235.33
Tercer Cuartil 57.07 71.96 285.62
Rango Intercuartı́lico 44.67 25.80 50.29

(d) (0.5 puntos) Identificar cada diagrama de caja con cada uno de los grupos X = 0, X = 1, X = 2.
Justificar la respuesta.
(e) (0.25 puntos) Relacionar los histogramas I), II), III) con los diagramas de caja a), b), c) del apartado
anterior. Justificar la respuesta.
(f) (0.5 puntos) Escogemos un hogar de cada uno de los tres grupos y observamos su renta (en miles de
euros). Los valores son: 51 para X = 0; 62 para X = 1 y 75 para X = 2. Decidir y justificar cuál de
estos tres hogares es más pobre en relación con los tres grupos que define la variable X. (Indicación:
estandarizar).
Solution:

(a) X is numerical discrete and Y is numerical continuous.


(b) The marginal frequency of X is
xi 0 1 2
ni• 466 352 182
The mean of X is
(0)466 + 1(352) + 2(182)
x̄ = = 0.716
1000
and its quasi-variance is

(0)2 · 466 + 12 · 352 + 22 · 182 − 1000(0.716)2 567.344


s2x = = = 0.5679
1000 − 1 999
p
and thus sx = s2x = 0.7536
(c) First we need to find the conditional distribution of X|Y < 50. It is given by
x 0 1 2
f (x|Y < 50) 324/437=0.7414 112/437=0.2563 1/437=0.0023
The corresponding mean is
324 112 1 114
x|Y < 50 = 0 +1 +2 = = 0.2609
437 437 437 437
The mean number is 0.2609. The mode is 0.
(d) Boxplot a) corresponds to those households for which X = 2, b) to those where X = 0 and c) to those
where X = 1. Possible justifications: shape of the distributions (compare mean with the median),
five-number summaries, positions of the quartiles...
(e) Histogram I corresponds to c) (X = 1), II to a) (X = 2), III to b) (X = 0). Possible justification:
shape of the distributions, ...
(f) We use the standardized incomes to make the comparison. The standardized incomes are calculated
in this table
X=0 X=1 X=2
mean 39.7021 58.9252 248.115
quasi-SD 37.0989 19.3092 51.6961
given incomes 51 62 75
their z-scores 0.3045 0.1592 -3.3487
The household with the income of 75,000 (X = 2) is the poorest in relative terms.
Alternatively, the last income is the only one below the group-average (negative z-score) whilst the
other two are above (positive z-scores), so the last one is the poorest (no calculations needed).
2. En una fábrica hay dos lı́neas de montaje L1 y L2. En la lı́nea L1 un 5% de los productos son defectuosos,
mientras que en la lı́nea L2, un 10% lo son. Un inspector de calidad escoge los productos que va a analizar
de la siguiente manera: Primero escoge una de las lı́neas (con probabilidad 0.4 elige la lı́nea L1 y con
probabilidad 0.6 la L2) y luego dentro de esa lı́nea escoge un producto al azar.
(a) (0.5 puntos) Calcular la probabilidad de que el inspector analice un producto que sea defectuoso.
En una inspección regular el inspector debe analizar 3 productos. Para ello, decide repetir el proceso
anterior de forma independiente para cada uno de los productos que va a analizar.

(b) (0.5 puntos) Considerar la variable aleatoria X =“número de productos defectuosos en una ins-
pección regular”. Describir el soporte de X (conjunto donde X toma valores) y determinar si X es
discreta o continua.
(c) (0.5 puntos) Obtener la función de probabilidad de X.
(d) (0.5 puntos) Calcular la esperanza de X.
(e) (0.5 puntos) Por cada producto defectuoso encontrado en una inspección regular, el inspector impone
a la fábrica una multa de 30 euros. Considerar la v.a. Y =“importe total de la multa en una inspección
regular”. Describir el soporte de Y (conjunto donde Y toma valores) y calcular el importe medio con
que puede ser multada la fábrica después de una inspección regular.

Solución:
(a) El primer apartado se hace por el teorema de la probabilidad total. Sea D el suceso: “producto
defectuoso”. Consideramos los sucesos L1 y (respectivamente L2): “el producto se elige de la lı́nea L1
(respectivamente L2)”.

P (D) = P (D|L1)P (L1) + P (D|L2)P (L2) = 0.4 · 0.05 + 0.6 · 0.10 = 0.08

(b)-(d) Los apartados del (b) al (d) se pueden hacer de dos formas:
forma corta: La variable aleatoria X =“número de productos defectuosos en una inspección regular”
sigue una distribución Binomial de parámetros n = 3 y p = 0.08. El soporte de X es {0, 1, 2, 3} y, por
tanto, es una variable aleatoria discreta. Su función de probabilidad es:
 
3
P (X = k) = 0.08k 0.923−k , para k = 0, 1, 2, 3.
k

Su esperanza es E(X) = n p = 3 · 0.08 = 0.24.


forma larga:
(b) El soporte de X es {0, 1, 2, 3} y, por tanto, es una variable aleatoria discreta.
(c) Considerar los sucesos Di =“el producto i es defectuoso”, Ni =”el producto i no es defectuoso”. La
función de probabilidad es:

P (X = 0) = P (N1 )P (N2 )P (N3 ) = 0.923 = 0, 778688

P (X = 1) = P (N1 )P (N2 )P (D3 )+P (D1 )P (N2 )P (N3 )+P (N1 )P (D2 )P (N3 ) = 3·0.08·0.92·0.92 = 0, 203136
P (X = 2) = P (N1 )P (D2 )P (D3 )+P (D1 )P (N2 )P (D3 )+P (D1 )P (D2 )P (N3 ) = 3·0.08·0.08·0.92 = 0, 017664
P (X = 3) = P (D1 )P (D2 )P (D3 ) = 0.083 = 0, 000512
(d) La esperanza es:

E(X) = 0 · 0.778688 + 1 · 0.203136 + 2 · 0.017664 + 3 · 0.000512 = 0.24

(e) El soporte de la v.a. Y =“importe total de la multa en una inspección regular” es {0, 30, 60, 90} y,
puesto que Y = 30X, su esperanza es E(Y ) = 30E(X) = 30 · 0.24 = 7.2 euros, que es el importe medio
con que puede ser multada la fábrica.
3. Una empresa de fabricación de componentes electrónicos recibe una media de 3 pedidos al dı́a. Suponiendo
que el número de pedidos recibidos por dı́a sigue una distribución de Poisson, responde a las siguientes
preguntas:

(a) (0.75 puntos) ¿Cuál es la probabilidad de que en un dı́a determinado se reciban más de 5 pedidos?
(b) (0.75 puntos) ¿Cuál es la probabilidad de que lleguen dos pedidos en una hora? Suponer que un dı́a
laborable tiene 8 horas.
(c) (1 punto) La empresa tiene la polı́tica de atender los pedidos el mismo dı́a que se reciben, aunque esto
implique que los empleados tengan que hacer horas extra. De manera general, esto ocurre cuando se
reciben más de cinco pedidos en un mismo dı́a. ¿Cuál es la probabilidad de que los empleados tengan
que hacer horas extra al menos un dı́a en una semana cualquiera? Suponer que una semana tiene 5
dı́as laborables.

Solución:
(a) Sea X = “número de pedidos que se reciben al dı́a”. X ∼ P ois(3). La probabilidad de que en un dı́a
determinado se reciban más de 5 pedidos es:
5 5 x
30 31 32 33 34 35
 
−3 3
X X
−3
P (X > 5) = 1−P (X ≤ 5) = 1− P (X = x) = 1− e = 1−e + + + + + = 0.0839.
x=0 x=0
x! 0! 1! 2! 3! 4! 5!

1

(b) Sea U = “número de pedidos que se reciben en una hora”. Si X ∼ P ois(3), sabemos que Y ∼ P ois 83 .
La probabilidad de que lleguen dos pedidos en una hora es:

(3/8)2
P (U = 2) = e−3/8 = 0.0483.
2!

(c) Sea V = “número de dı́as por semana en que los empleados tienen que hacer horas extra” = “número
de dı́as sobre 5 en que llegan más de 5 pedidos”. Puesto que los pedidos llegados un dı́a se atienden y
despachan ese mismo dı́a y no se acumulan al siguiente, y los pedidos llegan de forma independiente
en los sucesivos dı́as, tenemos que V ∼ Bin(5, p), donde p = P (X > 5) = 0.0839 es la probabilidad
calculada en el apartado a). Entonces, la probabilidad de que los empleados tengan que hacer horas
extra al menos un dı́a en una semana determinada es:
   
5 5
P (V ≥ 1) = 1 − P (V = 0) = 1 − 0p0 (1 − p)5−0 = 1 − 00.91615 = 1 − 0.91615 = 0.3548.
0 0
4. Una agencia inmobiliaria está interesada en estudiar el precio del alquiler de los pisos de cierta localidad.
Para ello, toma una muestra aleatoria simple (m.a.s.) de 80 familias, que considera representativas de la
localidad, preguntándoles el alquiler mensual que pagan. Con la información obtenida la agencia realiza
los siguientes gráficos:
Gráfica Normal Cuantil−Cuantil Histograma
800
(a) (0.75 puntos) Justificar si es cierto que
● ● los valores de los alquileres mensuales

0.004

●● de las familias de esta localidad pueden


700


●●
Cuantiles muestrales

describirse mediante una distribución de

0.003
●●
●●● probabilidad Normal.
600


●●











● (b) (1 punto) La agencia inmobiliaria afirma

0.002


●●●
500





●● que el alquiler mensual de las familias de
●●●●


●●●

● esta localidad es en media de 500 euros con

0.001

●●

●●




400

●●






●●●


una desviación tı́pica de 100 euros. Deter-
●●
● ●●●

minar la probabilidad (aproximada) de que

0.000
300


la suma de los alquileres mensuales de 80
−2 −1 0 1 2 200 400 600 800
familias se encuentre entre 40000 y 42000
euros.
Cuantiles teóricos alquiler mensual

(c) (0.75 puntos) Si en lugar de tomar una m.a.s. de 80 familias sólo se hubiera encuestado a 25 familias,
¿se podrı́a calcular la probabilidad (aproximada) de que la media de los alquileres mensuales de 25
familias se encontrara entre 500 y 600 euros? Justificar la respuesta.

Solución:
(a) No. En el QQ-plot los datos se alejan considerablemente de la lı́nea recta. Además la forma del
histograma no es simétrica.
P80
(b) P (40000 < i=1 Xi < 42000) ≈ P (500 < X n < 525) = P (0 < Z < 2.24) = 0.4875
(c) En este caso no se podrı́a justificar la utilización del Teorema Central del Lı́mite.

También podría gustarte