Soluciones Ejercicios UD 3

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 13

Estadística I. Informática/I.

en Tecnologías de la
Información

Soluciones de los ejercicios de la Unidad 3


31 de marzo de 2019

Dr. Víctor Hernández


Dr. Jorge Martín

Departamento de Estadística e Investigación operativa


Universidad Nacional de Educación a distancia
0.1. Soluciones de los ejercicios de la tercera unidad 1

0.1. Soluciones de los ejercicios de la tercera unidad

Ejercicio 3.1 (examen junio 2017)


Una urna contiene bolas numeradas del 1 al 3; los números están re-
presentados en la urna en las proporciones p, p y 1 − 2p respectivamente,
0 < p < 1/2. Para estimar el valor del parámetro p se extraen de la urna dos
bolas con reemplazamiento, obteniéndose una muestra aleatoria de tama-
ño dos.

1. ¿Cuántas muestras distintas hay? Escribir todas las muestras distintas


y calcular su probabilidad.

2 Consideremos el estadístico S igual a la suma de los números de las


bolas en la muestra. Calcular el valor de S para cada muestra y hallar
E{S}.

Solución.
Una muestra está formada por una pareja ordenada de bolas. Una ma-
nera fácil de representarlo es mediante un par de números (i , j ), donde i es
el número que lleva la primera que extraemos y j el número de la segun-
da, 1 ≤ i , j ≤ 3. Puesto que las extracciones se hacen con reemplazamiento,
los números pueden estar repetidos; así, las muestras posibles son 3 × 3 = 9.
Esas muestras y sus probabilidades se muestran en la tabla siguiente.

(1,1) p2 (1,2) p2 (1,3) p(1 − 2p)


(2,1) p2 (2,2) p2 (2,3) p(1 − 2p)
(3,1) p(1 − 2p) (3,2) p(1 − 2p) (3,3) (1 − 2p)2

Con la notación actual, el valor que toma el estadístico S cuando obtenemos


la muestra (i , j ) es igual a S = i + j . Formamos una nueva tabla añadiendo
tres columnas donde aparece el valor del estadístico en cada muestra.

Muestra Prob S Muestra Prob S Muestra Prob S

(1,1) p2 2 (1,2) p2 3 (1,3) p(1 − 2p) 4


(2,1) p2 3 (2,2) p2 4 (2,3) p(1 − 2p) 5
(3,1) p(1 − 2p) 4 (3,2) p(1 − 2p) 5 (3,3) (1 − 2p)2 6

A partir de esta tabla, observamos que los valores posibles de S son 2, 3, 4, 5


y 6; ahora, es inmediato calcular la función de probabilidad de S sin más que
sumar las probabilidades de las muestras sobre las que el estadístico toma
el mismo valor. Por ejemplo, tenemos

P (S = 4) = p 2 + 2p(1 − 2p) = 2p − 3p 2 , P (S = 5) = 2p(1 − 2p) = 2p − 4p 2

y
P (S = 6) = (1 − 2p)2 = 1 − 4p + 4p 2
2 Estadística I. Informática/I. en Tecnologías de la Información. UNED

Todas esas probabilidades se resumen en la tabla siguiente que define la


función de probabilidad de S.

S 2 3 4 5 6
p(s) p2 2p 2 2p − 3p 2 2p − 4p 2 1 − 4p + 4p 2

5
Sin dificultad, se comprueba que s=2 p(s) = 1.

Por otra parte, el valor esperado del estadístico S es igual a


5
E{S} = s p(s)
s=2
= 2p + 6p 2 + 8p − 12p 2 + 10p − 20p 3 + 6 − 24p + 24p 2
2

= 6(1 − p)

Ejercicio 3.2 (examen septiembre 2017)


Consideremos una muestra aleatoria simple (X 1 , X 2 , X 3 , X 4 , X 5 ) de una
población que tiene distribución N (μ, σ) y los estadísticos

1 5 1 5 X −μ
X= Xi , s2 = (X i − X )2 , T=
5 i=1 5 i=1 s

1. Hallar el valor a tal que P (T < a) = 0.05.

2. Si se sabe que σ2 = 5 hallar el valor b tal que P (|X − μ| > b) = 0.01.

Solución.
Los resultados necesarios para resolver las dos cuestiones se describen
 estadístico X tiene distribución normal de media μ
en el apartado 3.2.3. El
y desviación típica σ/ 5, mientras que el estadístico

 X −μ 
5−1 = 4 T = 2T
s
tiene distribución t4 de STUDENT con 4 grados de libertad.
Gracias al resultado anterior, tenemos

0.05 = P (T < a) = P (2T < 2a) = P (t4 < 2a)

En la tabla de la distribución de STUDENT, encontramos

P (t4 > 2.132) = 0.05

y, por la simetría de la distribución, resulta P (t4 < −2.132) = 0.05; luego debe
ser 2a = −2.132, es decir a = −1.066.
0.1. Soluciones de los ejercicios de la tercera unidad 3


Por otra parte, si σ = 5, resulta que X tiene una distribución normal de
media μ y desviación típica

σ 5
 =  =1
5 5
luego
X −μ
Z= = X −μ
1
tiene una distribución N (0, 1). Así, por la simetría de la distribución normal,
tenemos
0.01 = P (|X − μ| > b)
= P (|Z | > b)
= P (Z > b) + P (Z < −b)
= 2P (Z > b)
Luego b debe cumplir P (Z > b) = 0.005. En la tabla de la distribución normal
N (0, 1) encontramos el valor aproximado b = 2.575.

Ejercicio 3.3 (examen junio 2017)


Sea (X 1 , X 2 , X 3 ) una muestra aleatoria simple de una variable que tiene
distribución normal de media μ = 0 y desviación típica σ = 2. Consideremos
el estadístico 
U = X 12 + X 22 + X 32
1. Hallar el valor u1 que cumple P (U < u1 ) = 0.99.
2. Hallar el valor u2 que cumple P (U > u2 ) = 0.99.

Solución.
El resultado clave para resolver estas dos cuestiones está dicho en la pá-
gina 159 (primera edición), página 166 (segunda edición): en las condicio-
nes del enunciado, la distribución del estadístico
1 3 1 U2
2
X i2 = (X 12 + X 22 + X 32 ) =
2 i=1 2 2

es una χ23 con tres grados de libertad.


Ahora, por una parte, tenemos
0.99 = P (U < u1 )
= P (U 2 < u12 )
U 2 u12
= P( < )
22 4
u2
= P (χ23 < 1 )
4
4 Estadística I. Informática/I. en Tecnologías de la Información. UNED

En la tabla de la distribución χ2 encontramos

P (χ23 > 11.34) = 0.01

luego u12 /4 = 11.34, es decir u1 = 6.73.


Por otra parte, resulta

0.99 = P (U > u2 )
= P (U 2 > u22 )
U 2 u22
= P( > )
22 4
u2
= P (χ23 > 2 )
4

En la tabla de la distribución χ2 encontramos

P (χ23 > 0.115) = 0.99

luego u22 /4 = 0.115, es decir u2 = 0.68.

Ejercicio 3.4 (examen junio 2016)


Consideremos una muestra aleatoria simple (X 1 , X 2 ) de una población
que tiene distribución N (θ, σ) y los estadísticos

X1 + X2 (X 1 − X )2 + (X 2 − X )2 X −θ
X= , U= , V= 
2 2 U

1. Calcular la probabilidad P (V < 3.078).

2. Hallar el valor v ∗ tal que P (|V | < v ∗ ) = 0.9.

Solución.
Primero debemos conocer la distribución del estadístico V . Claramente,
es una distribución derivada de la normal. El estadístico X nos resulta fami-
liar: es la media de la muestra. De manera semejante, el estadístico U nos
debe ser familiar: es la varianza muestral (ver página 159). Así, comenzare-
mos por escribirlo como es más frecuente:

1 2
U = s2 = (X i − X )2
2 i=1

Ahora, reconocemos que el estadístico V

X −θ  X −θ
V=  = 2−1
U s
0.1. Soluciones de los ejercicios de la tercera unidad 5

es el estadístico de STUDENT con un (2-1) grados de libertad (ver el resultado


3.9 de la página 162). Para calcular las probabilidades que se piden no nece-
sitamos más que la tabla de la distribución t de STUDENT que se encuentra
en la página 164.

1. En la primera línea de la tabla, correspondiente a un grado de liber-


tad, y en la columna encabezada por 0.10, encontramos el valor 3.078, que
cumple P (V > 3.078) = 0.10. Así, se tiene

P (V < 3.078) = 1 − P (V ≥ 3.078) = 1 − P (V > 3.078) = 1 − 0.10 = 0.90

2. De manera semejante, tenemos

P (|V | < v ∗ ) = P (−v ∗ < V < v ∗ ) = 0.90

lo que equivale a

P (v < −v ∗ ) + P (V > v ∗ ) = 1 − 0.90 = 0.10

Pero, por la simetría de la distribución, P (v < −v ∗ ) = P (V > v ∗ ), luego

P (V > v ∗ ) = 0.05

En la primera tabla de la t encontramos el valor v ∗ = 6.314 que satisface la


ecuación anterior.

Ejercicio 3.5 (examen junio 2013)


 
Del conjunto de cuatro tarjetas 1 2 3 4 se realizan dos extrac-
ciones con reemplazamiento para obtener una muestra.

1. Consideremos el estadístico M igual al máximo de los números que


aparecen en la muestra. Hallar el valor del estadístico en cada muestra
posible y encontrar su distribución.

Solución.
Hay 4 × 4 = 16 muestras posibles, cada una de ellas tiene probabilidad
1/16 de ocurrir. En la tabla siguiente aparecen las 16 muestras y el valor del
estadístico M en cada una de ellas.

Muestra M Muestra M Muestra M Muestra M


(1, 1) 1 (1, 2) 2 (1, 3) 3 (1, 4) 4
(2, 1) 2 (2, 2) 2 (2, 3) 3 (2, 4) 4
(3, 1) 3 (3, 2) 3 (3, 3) 3 (3, 4) 4
(4, 1) 4 (4, 2) 4 (4, 3) 4 (4, 4) 4
6 Estadística I. Informática/I. en Tecnologías de la Información. UNED

Ahora, hallar la distribución de M es un simple recuento. Observamos que


M = 1 en una muestra, M = 2 en tres muestras, M = 3 en cinco muestras y
M = 4 en siete muestras. Así, se tiene

1 3 5 7
P (M = 1) = , P (M = 2) = , P (M = 3) = , P (M = 4) =
16 16 16 16

Estas relaciones que definen la función de probabilidad de M.


Desde luego, el método anterior está basado en la simple “fuerza bruta”
de hacer recuentos, y tiene poco alcance. Si en lugar de 4 tarjetas fueran 100
y en lugar de tomar una muestra de tamaño 2 tomáramos una de tamaño
10, el número de muestras sería:

× · · · × 100
= 1020
100 × 100
diez veces

que es un número de muestras capaz de desanimar a cualquiera que quiera


emplear el simple recuento.
Un método más general para calcular la distribución de M es el siguien-
te: los casos favorables al suceso {M ≤ k} son fáciles de calcular, tanto si hay
cuatro tarjetas como si hay cien, ya que M ≤ k significa que ambos números
de la muestra son menores o iguales que k y, por consiguiente, hay k · k = k 2
muestras que cumplen tal condición. Lo anterior significa que

k2
P (M ≤ k) =
42

y, la probabilidad P (M = k) se calcula por diferencia

k 2 − (k − 1)2
P (M = k) = P (M ≤ k) − P (M ≤ k − 1) =
42

En el caso de N = 100 tarjetas y muestras de tamaño n = 10, el razonamiento


sigue siendo útil. Para que M ≤ k, todos los números de la muestra deben
ser menores o iguales que k, luego

k 10
P (M ≤ k) =
10010

y obtenemos

k 10 − (k − 1)10
P (M = k) = P (M ≤ k) − P (M ≤ k − 1) =
10010

Ejercicio 3.6 (examen septiembre 2013)


Tenemos cinco tarjetas numeradas del 1 al 5.

1 2 3 4 5
0.1. Soluciones de los ejercicios de la tercera unidad 7

Las permutamos al azar y las ordenamos en fila boca arriba. Designamos


por X la variable aleatoria que cuenta el número de tarjetas intercaladas
entre las tarjetas 1 y 2 . Por ejemplo, si la permutación es

3 2 5 4 1

entonces X = 2.

1. Si (X 1 , X 2 ) es una muestra aleatoria simple de tamaño 2 de la variable


anterior, encontrar la función de probabilidad de la muestra.

Solución.
Primero hallaremos la función de probabilidad de X . Puesto que hay 5
tarjetas, el número de permutaciones es 5! = 120. La variable X tiene cuatro
valores posibles: 0, cuando las tarjetas 1 y 2 están contiguas, 1, 2 ó 3.
Podemos hallar la función de probabilidad mediante “fuerza bruta”, es-
cribiendo las 120 permutaciones, hallando el valor de X en cada una de ellas
y contando casos. Nosotros lo haremos mediante razonamiento.
Para que sea X = 0 las tarjetas 1 y 2 tienen que ser contiguas, bien
en este orden orden, bien en el orden 2 1 . Para contar cuántas permuta-
ciones tienen esta cualidad imaginamos que hemos pegado las dos tarjetas
formando una sola y, ahora, permutamos las cuatro tarjetas que quedan de
todas las maneras posibles. Así, tenemos 4! permutaciones en en las que
aparece la tarjeta 2 inmediatamente a la derecha de la 1, y otras 4! permuta-
ciones en las que la 1 está inmediatamente a la derecha de 2. En total, hay
48 permutaciones con 1 y 2 contiguas y, en consecuencia, se tiene

48 4
P (X = 0) = =
120 10
Para contar las permutaciones en que X = 1, tenemos que elegir el número
que va entre la tarjeta 1 y la 2, o entre la 2 y la 1. Eso puede hacerse de 3
maneras distintas. Luego, “pegaremos” las tres tarjetas, en el orden debido,
y permutaremos las tres que quedan (dos tarjetas sencillas y una triple). En
total hay 2 maneras de elegir el orden de 1 y 2, 3 maneras de elegir el número
intermedio y 3! = 6 permutaciones por cada una de las elecciones anteriores.
Es decir, hay 2 × 3 × 6 = 36 permutaciones con X = 1 y se tiene
36 3
P (X = 1) = =
120 10
Ahora, contaremos el número de permutaciones en que X = 3. Los tres nú-
meros 3, 4 y 5 deben estar entre 1 y 2, de tal modo que podemos elegir el
orden de 1 y 2 (2 maneras) y el orden de los tres números intermedios (3! = 6
maneras). En total hay 2 × 6 = 12 permutaciones con X = 3 y se tiene
12 1
P (X = 3) = =
120 10
8 Estadística I. Informática/I. en Tecnologías de la Información. UNED

Por último, la probabilidad P (X = 2) la calculamos por diferencia pasando


al complementario

4 3 1 2
P (X = 2) = 1 − − − =
10 10 10 10
En resumen, la función de probabilidad de X es


⎪4/10 si k = 0


⎨3/10 si k = 1
p(k) =

⎪2/10 si k = 2



1/10 si k = 3

o, de manera más resumida

4−k
p(k) = , para k = 0, 1, 2, 3
10
Una vez que conocemos la función de probabilidad de X , resulta inmediato
hallar la función de probabilidad de la muestra. Si (k 1 , k 2 , donde k 1 = 0, . . . ,
3, k 2 = 0, . . . , 3 es una muestra cualquiera, se tiene

(4 − k 1 )(4 − k 2 )
p(k 1 , k 2 ) =
102

Ejercicio 3.7 (examen junio 2015)


Observamos dos repeticiones independientes del valor de una variable
aleatoria X cuya función de densidad viene dada por

e 1−x si x ≥ 1
f (x) =
0 si x < 1

1. Supongamos que (X 1 , X 2 ) es el vector muestral. Describir todas las


muestras posibles y encontrar la función de densidad de la muestra.

2. Se considera el estadístico T = min(X 1 , X 2 ), igual al mínimo de los va-


lores muestrales. Calcular P (T > t ) para t ≥ 1; a partir del resultado
obtenido, deducir la función de densidad de T .

Solución.
1. Para que f (x1 , x2 ) sea mayor que cero, deben ser x1 ≥ 1 y x2 ≥ 1; la
muestra que obtengamos, con probabilidad uno, pertenecerá al conjunto
[ 1, ∞) × [ 1, ∞). Además, se tiene

e 1−x1 e 1−x2 = e 2−x1 −x2 si x1 ≥ 1, x2 ≥ 1
f (x1 , x2 ) =
0 en otro caso
0.1. Soluciones de los ejercicios de la tercera unidad 9

2. Para calcular la distribución del estadístico T = min(X 1 , X 2 ) razona-


remos de manera semejante al ejercicio 3.2. Primero, observamos que, con
probabilidad uno, T ≥ 1.
Ahora, para que el mínimo de X 1 y X 2 sea mayor que un número t , am-
bas variables deben ser mayores que t , pues si alguna fuera menor o igual,
el mínimo sería todavía menor o igual que esa variable; es decir, se tiene
P (T > t ) = P (X 1 > t , X 2 > t ) = P (X 1 > t )P (X 2 > t )
Ahora, si t < 1, resulta
∞
P (X 1 > t ) = f (x) d x
t
1 ∞
= f (x) d x + f (x) d x
t 1
1 ∞
= 0d x + e 1−x d x
t 1
 ∞

= − e 1−x  = 1
1
mientras que si t ≥ 1, resulta
∞
P (X 1 > t ) = f (x) d x
t ∞
= e 1−x d x
t
 ∞

= − e 1−x  = e 1−t
t
De tal manera, se tiene

1 si t < 1
P (T > t ) = 1−t 1−t 2(1−t )
e e =e si t ≥ 1
Ahora, la función de distribución de T es

0 si t < 1
F T (t ) = P (T ≤ t ) = 1 − P (T > t ) =
1 − e 2(1−t ) si t ≥ 1
y la función de densidad del estadístico T es

 0 si t < 1
f T (t ) = F T (t ) =
2e 2(1−t ) si t ≥ 1

Ejercicio 3.8 (examen septiembre 2015


Consideremos una muestra aleatoria simple (X 1 , X 2 , X 3 , X 4 ) de una po-
blación con distribución N (0, 2) y los estadísticos
X4
Y = X 12 + X 22 + X 32 , T=
Y /3
1. Hallar el valor de t tal que P (| T |> t ) = 0.2.
10 Estadística I. Informática/I. en Tecnologías de la Información. UNED

Solución.
En primer lugar, se tiene
 2  2  2
Y X1 X2 X3
= + +
4 2 2 2

luego Y /4 es suma de 3 cuadrados de normales independientes y, en con-


secuencia, tiene distribución χ23 (ver el resultado 3.6, página 157). Ahora,
podemos poner
 X4  X 4 /2
T = 3 = 3
Y Y /4

donde X 4 /2 tiene distribución normal de media cero y varianza 1, Y /4 es χ2


con 3 grados de libertad y ambas variables son independientes; se sigue que
T tiene distribución de STUDENT con 3 grados de libertad. Así, buscamos en
la tercera fila de la tabla de la t y obtenemos

P (T > 1.638) = 0.1

luego P (T < −1.638) = 0.1 y P (| T |> 1.638) = 0.2, luego t = 1.638.

Ejercicio 3.9 (examen septiembre 2015)


Se observan tres realizaciones independientes de una variable aleato-
ria X con distribución uniforme en el intervalo (0, θ), θ > 0; pongamos que
(X 1 , X 2 , X 3 ) es el vector muestral. Para estimar θ se utiliza el estadístico T =
max(X 1 , X 2 , X 3 ).

1. Calcular P (T < t ) para 0 < t < θ. Del resultado anterior deducir la fun-
ción de densidad de T .

Solución.
Es semejante a los ejercicios 3.2 y 3.4. Para que el mayor valor de X 1 , X 2
y X 3 sea menor que t , las tres variables tienen que ser menores que t . Así, se
tiene

P (T < t ) = P (X 1 < t , X 2 < t , X 3 < t )


= P (X 1 < t )P (X 2 < t )P (X 3 < t )
= (P (X < t ))3

ya que las tres variables son independientes y tienen la misma distribución,


por lo que se tiene

P (X 1 < t ) = P (X 2 < t ) = P (X 3 < t ) = P (X < t )


0.1. Soluciones de los ejercicios de la tercera unidad 11

Puesto que X tiene distribución uniforme en el intervalo (0, θ), resulta


⎧t
t ⎨−∞ 0d x = 
⎪ 0 si t ≤ 0
0 t
P (X > t ) = f (x) d x = −∞ 0d x + 0 θ1 d x = t /θ si 0 < t < θ
−∞ ⎪
⎩0 θ 1 t
−∞ 0d x + 0 θ d x + θ 0d x = 1 si t ≥ θ

Claramente, para calcular P (T < t ) debemos distinguir tres casos: que t ≤ 0,


que 0 < t < θ y t ≥ θ.
El caso primer caso es bastante simple: si t ≤ 0, entonces P (X < t ) = 0 y
P (T < t ) = 0.
El caso 0 < t < θ es el más interesante. Por ser X uniforme, se tiene P (X <
t ) = t /θ y
 3
t
P (T < t ) =
θ
Por último, si t ≥ θ, entonces P (X < t ) = 1 y

P (T < t ) = 1

El resumen, la función de distribución de T , cumple F T (t ) = P (T < t ) (por


ser continua) y es igual a


⎨0 si t ≥ 0
F T (t ) = (t /θ)3 si 0 < t < θ


1 si t ≥ θ

y la función de densidad de T es igual a



3t 2 /θ3 si 0 < t < θ
f T (t ) =
0 otro caso

Ejercicio 3.10 (examen junio 2013)


Se considera una muestra aleatoria simple (X 1 , X 2 , X 3 , X 4 ) de una pobla-
ción con distribución N (1, 2) y el estadístico

Y = (X 1 − 1)2 + (X 2 − 1)2 + (X 3 − 1)2 + (X 4 − 1)2

1. Hallar el valor de y que cumple P (Y > y) = 0.05.

Solución.
Sabemos que las variables (X i − 1)/2 tienen distribución normal de me-
dia cero y varianza uno, luego
       
Y X1 − 1 2 X2 − 1 2 X3 − 1 2 X4 − 1 2
= + + +
4 2 2 2 2
12 Estadística I. Informática/I. en Tecnologías de la Información. UNED

Observamos que Y /4 es suma de los cuadrados de 4 variables normales de


media cero y varianza uno independientes, así Y /4 tiene distribución χ2 con
4 grados de libertad. Se tiene
 
Y y
P (Y > y) = P > = P (V > y/4) = 0.05
4 4

donde V es χ24 . En la cuarta fila de la tabla de la distribución χ2 encontramos


P (V > 9.488), luego
y
= 9.488
4
y se tiene y = 37.952.

También podría gustarte