Dist Chi Cuadrado Dist F y Anova 2 Reparado
Dist Chi Cuadrado Dist F y Anova 2 Reparado
Dist Chi Cuadrado Dist F y Anova 2 Reparado
Si s es la varianza de una muestra aleatoria de tamaño “n”, obtenida de una población normal con varianza σ 2,
2
Si consideramos muestras de tamaño tomadas de una población normal con desviación típica , y si para
cada muestra calculamos 2 se obtiene para Ji-cuadrado una distribución de muestreo llamado distribución Ji-
cuadrado que viene expresada por:
1
y y 0( 2 )
1 / 2*( 2 )
.e 2
2
; donde n 1 gl
Las pruebas Ji cuadrado son útiles al analizar más de dos poblaciones; permitiendo determinar si un grupo de
datos que a nuestro juicio, podrían ser descritos por una distribución determinada (Binomial, Poisson, Normal) se ajusta
en realidad a ese patrón.
La distribución Ji cuadrado tiene dos funciones relevantes:
1) En tablas de contingencia:
a) cumple como decisor en la dependencia o independencia de variables que se desean relacionar.
b) es utilizada como prueba de homogeneidad cuando el experimentador controla una de las variables.
2) Como bondad de ajuste de una distribución de probabilidad teórica, es decir, puede utilizarse para decidir si una
distribución de probabilidad en particular sigue una distribución de probabilidad teórica (binomial, Poisson o normal).
Si deseamos ir más allá de las meras intuiciones respecto a las frecuencias observadas y esperadas (son
aquellas que según las leyes de probabilidad, se espera que sucedan) emplearemos el estadístico Ji cuadrado; definido
como una medida de discrepancia existente entre las frecuencias observadas y esperadas.
( fo fe) 2
2 ; donde fe frecuencia esperada
fe
fo frecuencia observada
Para calcular el número de grados de libertad en una tabla de contingencia (tabla de doble entrada con “f” filas
y “c” columnas), se establece el producto del número de filas menos una por el número de columnas menos una.
gl = (f -1)*(c -1)
NOTA: Para evitar incurrir en inferencias incorrectas de las pruebas de hipótesis Ji cuadrado se establece que
una frecuencia esperada menor de cinco en una celda de una tabla de contingencia es demasiado pequeña para
utilizarse.
ESTADÍSTICA II 1
LCDO. JUAN FRANCISCO GÓMEZ
INFERENCIA SOBRE UNA VARIANZA DE LA POBLACIÓN.
Para el cálculo de intervalo de confianza así como para el contraste de hipótesis de la varianza poblacional se
(n 1) * s 2
emplea el estadístico 2 . Si la varianza de la población es 2 , entonces el estadístico 2 tiene
2
una distribución Ji cuadrado con (n-1) grados de libertad.
Dada una muestra aleatoria de tamaño “n” de una población normal se puede obtener un intervalo de confianza
(n 1) * s 2
con coeficiente de confianza de 1- para 2
que es una variable aleatoria con distribución Ji
2
cuadrado de n-1 grados de libertad.
2 (n 1) * s 2
1 2
2 2
2
1 2 1
2
(n 1) * s
2 2
1
2 2
( n 1) * s 2 (n 1) * s 2
2
2 2
1
2 2
Similar a los procesos estudiados para la media poblacional se establece para la varianza poblacional
ESTADÍSTICA II 2
LCDO. JUAN FRANCISCO GÓMEZ
BONDAD DE AJUSTE PARA LA DISTRIBUCIÓN BINOMIAL
ESTADÍSTICA II 3
LCDO. JUAN FRANCISCO GÓMEZ
1) H0: La distribución del número de aceptaciones sigue una distribución binomial con p=0,4 y n = 3
2) H1: La distribución del número de aceptaciones no sigue una distribución binomial con p=0,4 y n =3
Para calcular el estadístico de prueba es necesario determinar las frecuencias esperadas por medio de la probabilidad
binomial
fe
P(r=0)= nCr*pr*qn-r 3C0*0,40*0,63 0,216 0,216*100=21,6
P(r=1)= nCr*pr*qn-r 1
3C1*0,4 *0,6
2
0,432 0,432*100=43,2
P(r=2)= nCr*pr*qn-r 2
3C2*0,4 *0,6
1
0,288 0,288*100=28,8
P(r=3)= nCr*pr*qn-r 3
3C3*0,4 *0,6
0
0,064 0,064*100=6,4
Número de renglones
gl = n – k - 1 = 4 – 0 - 1 = 3
Número de parámetros
estimados
t2 7,815
Se acepta la hipótesis nula por lo tanto la distribución del número de aceptaciones sigue una distribución binomial con
p = 0,4 y n = 3
ESTADÍSTICA II 4
LCDO. JUAN FRANCISCO GÓMEZ
BONDAD DE AJUSTE PARA LA DISTRIBUCIÓN DE POISSON
Observe que existe un valor esperado menor que 5; lo que amerita hacer un ajuste agrupando renglones:
Se acepta H0 por lo que la distribución del número de defectos de las tarjetas sigue una distribución de Poisson con
0,75
ESTADÍSTICA II 5
LCDO. JUAN FRANCISCO GÓMEZ
BONDAD DE AJUSTE PARA LA DISTRIBUCIÓN NORMAL
Pruebe la hipótesis de que la distribución de frecuencia de las duraciones de baterías dadas en la siguiente tabla, se
puede aproximar mediante una distribución normal con media µ= 3,5 y desviación estándar σ=0,7. Utilice un α = 0.05.
Frecuencias
Límites de clase
observadas
1.45 – 1.95 2
1.95 – 2.45 1
2.45 – 2.95 4
2.95 – 3.45 15
3.45 – 3.95 10
3.95 – 4.45 5
4.45 – 4.95 3
Solución
H0; La distribución de la duración de las baterías sigue una distribución normal con µ = 3,5 y σ = 0,7
H1; La distribución de la duración de las baterías no sigue una distribución normal con µ = 3,5 y σ = 0,7
En este ejercicio en particular se cuenta con la media y desviación estándar de la población, por lo que no se tiene que
estimar. En caso de que no se tuviera, se estimarían a partir de los datos agrupados con las fórmulas que se vieron en el
curso de Estadística I, tomando en cuenta que para los grados de libertad el valor de “k” sería 2, ya que se estimaría la
media y la desviación estándar.
x
Recordando que z , se sustituye el valor de x por los límites de clase comenzando con el límite de 1.95
ESTADÍSTICA II 6
LCDO. JUAN FRANCISCO GÓMEZ
Límite real
1,95 -2,21
2,45 -1,50
2,95 -0,79
3,45 -0,07
3,95 0,64
4,45 1,36
La razón por la cual se comienza con el límite de 1,95 y se termina con el límite de 4,45, es porque la suma de
todas las probabilidades debe ser 1, bajo la curva normal.
P( z 2,21 ) = 0,01355
ESTADÍSTICA II 7
LCDO. JUAN FRANCISCO GÓMEZ
Con estas probabilidades se calcularán los valores esperados, multiplicando cada
probabilidad por 40.
Frecuencias Frecuencia
Límites de clase Probabilidad*fo
observadas esperada
0,01355*40
1.95 2 0,542
Como existen frecuencias esperadas menores que cinco hay que agrupar renglones
(intervalos) hasta lograr que sean mayores o iguales a cinco.
Frecuencias Frecuencia
Límites de clase Probabilidad
observadas esperada
2.95 7 8,5904
3.95 8 10,4436
ESTADÍSTICA II 8
LCDO. JUAN FRANCISCO GÓMEZ
ESTADÍSTICA II 9
LCDO. JUAN FRANCISCO GÓMEZ
( fo fe) 2 (7 8,5904) 2 (15 10,2936) 2 (10 10,6724) 2 (8 10,4436) 2
c2 3,0604
fe 8,5904 10,2936 10,6724 10,4436
Grados de libertad: n – K - 1 = 4 – 0 - 1 = 3
Como el 3,139 no es mayor de 7,815, se acepta H 0 y se concluye con un α= 0.05 que el ajuste de los datos a una
distribución normal con µ = 3,5 y σ= 0,7 es bueno.
ESTADÍSTICA II 10
LCDO. JUAN FRANCISCO GÓMEZ
BONDAD DE AJUSTE PARA UNA DISTRIBUCIÓN DEFINIDA
Una organización no gubernamental (ONG’s) solicita donativos por teléfono, resultando que un 60% de las llamadas ha
negado el donativo, un 30% ha contestado que necesita más información a través del correo para tomar una decisión
sobre la donación y un 10% ha contestado afirmativamente, realizando la donación en el momento. Durante esta
semana, se han realizado un total de 100 llamadas, 65 negaron el donativo, 31 pidieron más información y cuatro
donaron inmediatamente alguna cantidad. Contrastar, a un nivel de significancia de 10%, que esta semana los
resultados han sido similares a los que se venían obteniendo.
H0: Los resultados obtenidos de las cien llamadas realizadas esta semana han sido similares a los que se venían
obteniendo anteriormente
H1: Los resultados obtenidos de las cien llamadas realizadas esta semana no han sido similares a los que se venían
obteniendo
Para encontrar las frecuencias esperadas se multiplica el total de las frecuentas observadas por la probabilidad
suministrada por el problema.
gl = n – 1 = 3 – 1 = 2
0,1
t2 4,605
ESTADÍSTICA II 11
LCDO. JUAN FRANCISCO GÓMEZ
CONTRASTE PARA DEPENDENCIA E INDEPENDENCIA
TABLAS DE CONTINGENCIA
Se encuestó a varios directores generales de empresas y se les pidió que valoraran entre bajo, medio y alto el
rendimiento financiero de su empresa y también se les pidió que valoraran de la misma manera, la estrategia de su
empresa. Contrastar a nivel de significancia del 1% la hipótesis de no asociación entre los dos tipos de valoraciones
Rendimiento Financiero
Estrategia TOTAL
Bajo Medio Alto
Bajo
15 25 20
60
15 24 21
Medio 35 50 25
110
27,5 44 38,5
Alto 25 45 60
130
32,5 52 45,5
Ho: La valoración del rendimiento financiero de la empresa es independiente de la valoración de la estrategia seguida por
la empresa
H1: La valoración del rendimiento financiero de la empresa es dependiente de la valoración de la estrategia seguida por
la empresa
Por ejemplo para el primer valor de la tabla se obtiene de la siguiente manera 60*75/300 = 15; y así para todas y cada
una de los valores de las celdas
ESTADÍSTICA II 12
LCDO. JUAN FRANCISCO GÓMEZ
gl = (f – 1)*(c – 1) = (3 – 1)*(3 – 1) = 4
0,01
13,277
El consejo de administración de Telefónica desea conocer si la opinión de sus accionistas respecto a una posible fusión
es independiente del número de acciones que poseen. Una muestra de 500 accionistas proporciona la siguiente tabla:
Opinión
A favor En contra Indecisos Total
Nº de acciones
Menos de 200 25 18 21 64
200-1000 93 62 67 222
Ho: El número de acciones que posee un accionista es independientes de su opinión respecto a una posible fusión
ESTADÍSTICA II 13
LCDO. JUAN FRANCISCO GÓMEZ
H1: El número de acciones que posee un accionista es dependiente de su opinión respecto a una posible fusión
Calculamos los valores esperados e ij bajo la hipótesis nula (independencia de X e Y) aplicando la fórmula:
gl = (f – 1)*(c – 1) = (3 – 1)*(3 – 1) = 4
0,995
0,005
t2 14,86
ESTADÍSTICA II 14
LCDO. JUAN FRANCISCO GÓMEZ
Se acepta la hipótesis nula por lo cual el número de acciones que posee un accionista es independiente de su
opinión respecto a una posible fusión
ESTADÍSTICA II 15
LCDO. JUAN FRANCISCO GÓMEZ
CONTRASTE PARA HOMOGENEIDAD
TABLAS DE CONTINGENCIA
Se han aplicado tres métodos de empaquetado de dispositivos electrónicos durante un periodo de 4 meses; al final de
cada mes se realiza un recuento del número de paquetes estropeados, obteniéndose los siguientes datos:
Meses
1 2 3 4 Total
Método
6 8 8 8 30
A
6,098 7,561 7,317 9,024
10 12 9 14 45
B
9,146 11,341 10,978 13,537
9 11 13 15 48
C
9,756 12,098 11,707 14,439
25 31 30 37 123
Total
Comprobar con un nivel de confianza del 95% si los tres métodos de envasado son igualmente buenos (homogéneos) o
existen diferencias significativas entre ellos.
H0: 1 2 3 (P1=P2=P3)
H1: Al menos dos de las medias son diferentes (Al menos dos de las proporciones son diferentes)
gl = (f – 1 )*(c – 1) = (3 – 1)*(4 – 1) = 6
0,95
α = 0,05
t2 12,592
ESTADÍSTICA II 16
LCDO. JUAN FRANCISCO GÓMEZ
INTERVALO DE CONFIANZA Y CONTRASTE DE HIPOTESIS PARA UNA VARIANZA POBLACIONAL
2) H1: 2 0,25
(n 1) * s 2 (18 1) * 0,4
3) c 27,2
2
2 0,25
4) Zona de aceptación y de rechazo
gl = n – 1 = 18-1 = 17
α = 0,05
27,587
Como c 27,2 t 27,587 Se acepta la hipótesis nula, por lo tanto no debe ajustarse la máquina
2 2
ESTADÍSTICA II 17
LCDO. JUAN FRANCISCO GÓMEZ
b) Para calcular intervalo de confianza,
( n 1).s 2 (n 1).s 2
2
2 2
1
2 2
17 * 0,4 17 * 0,4
2
27,587 8,672
0,2465 2 0,7841
La varianza real del llenado cantidades de llenado de la máquina oscila entre 0,2465 y 0,7841 con un 90% de
confianza.
ESTADÍSTICA II 18
LCDO. JUAN FRANCISCO GÓMEZ
DISTRIBUCIÓN F DE FISHER
Se le dio este nombre en honor a Sir Ronald Fisher, uno de los fundadores de la estadística moderna. Esta
distribución de probabilidad se emplea para probar si dos muestras provienen de poblaciones que poseen varianzas
iguales. Esta prueba es útil para determinar si una población normal tiene una mayor variación que la otra y también se
aplica cuando se trata de comparar simultáneamente varias medias poblacionales. Las poblaciones deben ser normales
y los datos tener al menos la escala de intervalos.
S 12
La distribución F está asociada al cociente de dos variables Ji cuadrados independientes; F= donde S 12 y
S 22
S 22 son las varianzas de las muestras de tamaño n 1 y n 2 , con distribución 2 con grados de libertad(n - 1).
12
(n1 1)
Entonces podemos decir que: F
22
(n2 1)
s 12 * (n1 1)
12 s 12
2
1
s 2 * (n 1) (n1 1) (n1 1) 1 2
como 2 entonces F
2 22 s 22 * (n2 1) s 22
(n2 1)
22 22
(n2 1)
Características de la distribución F
1. Existe una "familia" de distribuciones F. Un miembro específico de la familia se determina por dos parámetros: los
grados de libertad en el numerador y en el denominador.
ESTADÍSTICA II 19
LCDO. JUAN FRANCISCO GÓMEZ
F(gln;gld;α)
4. La distribución F es asimétrica; está sesgada a la derecha, es decir, tiene un sesgo positivo
5. A medida que aumentan los valores, la curva se aproxima al eje x, pero nunc a lo toca
6. Las tablas de valores críticos de F sólo presentan los del lado derecho. En caso de necesitar el valor crítico en
la cola de la izquierda, éste se obtiene calculando el recíproco del valor crítico relacionado que resulta de la tabla
1
F( gl n ; gl d ;1 )
F( gl d ; gl n ; )
ESTADÍSTICA II 20
LCDO. JUAN FRANCISCO GÓMEZ
INTERVALO DE CONFIANZA PARA EL COCIENTE DE DOS VARIANZAS
s12
2 s2 * 2
F 12 12 22
s2 s2 * 1
22
s2 * 2 1 s2 * 2 1
F 12 22 F 22 12
1
s2 * 1 F s1 * 2 F
2 2 1
2 2
1 1
F F 1 s12 12 1 s2
1 2 1 * 2 2 * 12
2
12 2 2 F s2 2 F s2
s 2
2 2 s2 2
1
2
2
s 1 s12
.
Un fabricante de automóviles pone a prueba dos nuevos métodos de ensamblaje de motores respecto al tiempo en
minutos. Los resultados se muestran el la tabla:
Método 1 Método 2
n1= 31 n2 = 25 Construya un intervalo de confianza del 90%
= 50 = 24
Marca A Marca B
Tamaño de la muestra 10 8
Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de poblaciones normales con varianzas
desconocidas, construya un intervalo de confianza del 98% para la relación de las dos varianzas de los contenidos de
nicotina de las dos marcas de cigarrillos.
El intervalo de confianza del 98% para la relación de la varianza de la marca B (la mayor) a la varianza de la marca A
está dado por
Si se hubiera construido la relación de la varianza de la marca A a la marca B el intervalo de confianza estaría dado por:
ESTADÍSTICA II 21
LCDO. JUAN FRANCISCO GÓMEZ
CONTRASTE DE HIPÓTESIS PARA DOS VARIANZAS POBLACIONALES
11-53. La compañía POLAR está preocupada por la variabilidad en el número de bacterias producidas por diferentes
cultivos. Si los cultivos tienen una variabilidad significativamente diferente en el número de bacterias producidas,
entonces los experimentos no son correctos y se obtendrá algún resultado extraño (La administración de la compañía
esta comprensiblemente ansiosa cuando los científicos producen cosas extrañas). Se han recolectados los datos
siguientes:
s A2 423,4
sB2 755,8 1
1) H0: A2 B2
2) H1: A2 B2
3) Se aplica el estadístico F
s B2 755,8 1
Fc = 2 1,785
sA 423,4
4)
ESTADÍSTICA II 22
LCDO. JUAN FRANCISCO GÓMEZ
F(10;10;0,99)= F(10;10;0,01)= 4,85
1 1
Como Fc = 1,785 se encuentra entre Ft(10;10;0,99) = = 0,206 y Ft(10;10;0,01) = 4,85; se acepta la
F(10;10; 0, 01) 4,85
hipótesis nula, por lo tanto los cultivos no tienen una variabilidad significativamente diferente en el número de bacterias
producidas.
El gerente de producción de una compañía afirma que existe igual variabilidad en el rendimiento del segundo turno de
trabajo que la variabilidad en el rendimiento del primer turno de trabajo. El jefe de producción cree que la del segundo
turno es mayor que la del primero, por lo cual toma una muestra del rendimiento de 21 obreros del segundo turno cuya
varianza es 4.8 y toma una muestra del rendimiento de 16 obreros del primer turno cuya varianza es 2.9. Se pide probar
la hipótesis con un nivel de significación del 5%.
ESTADÍSTICA II 23
LCDO. JUAN FRANCISCO GÓMEZ
ANALISIS DE VARIANZA
A menudo resulta importante comparar diferencias en los resultados entre varios grupos para tal fin se crea
estudio de análisis de varianza, el cual nos permite estudiar la igualdad de medias o desigualdad de por lo menos dos de
ellas; siempre en tres o más poblaciones.
Los experimentos diseñados de un factor, en los cuales los sujetos o unidades experimentales son asignados
aleatoriamente a grupos o niveles de un solo factor se conocen como modelos de diseños de un sentido o
completamente aleatorizados.
Cuando las mediciones resultantes de los “k” grupos son continuas y se cumplen ciertas suposiciones, se
puede emplear una metodología conocida como análisis de varianza o ANOVA (ANalysis Of Variante) para comparar las
medias de los grupos o de varias poblaciones.
Los resultados de un procedimiento de ANOVA por lo general se presentan en una tabla cuyo formato es el
siguiente:
X
2
SCTotal X T 2
n
T
Ti 2 x
2
SCT
ni n
ESTADÍSTICA II 24
LCDO. JUAN FRANCISCO GÓMEZ
Donde: Ti Sumatoria del factor en cada grupo.
SCE X 2
Ti 2
n1
Es de hacer notar que los grados de libertad totales es la suma de los grados de libertad del tratamiento y los
grados de libertad del error:
G1 T G1 E G1 Total
Además el estadístico utilizado para el contrate de la hipótesis es F, el cual viene expresado por:
CMT
F
CME
H1 Por lo menos dos de las medias difieren o no todas las medias son iguales.
ESTADÍSTICA II 25
LCDO. JUAN FRANCISCO GÓMEZ
DIFERENCIA MENOS SIGNIFICATIVA o DIFERENCIA MINIMA SIGNIFICATIVA
Cuando empleamos el análisis de varianza para probar si son iguales las medias de “k” poblaciones, y el
rechazo de la hipótesis nula sólo nos permite concluir que las medias de población no son todas iguales, es necesario
aplicar un procedimiento que nos permita determinar dónde hay diferencia entre las medias. Este procedimiento es
conocido como la diferencia menos significativa de Fisher (LSD: least-significant difference) y se aplica a través de la
fórmula:
1 1
LSD t / 2. CME *
n1 n2
Donde CME = cuadrado medio del error y t / 2. pertenece a una distribución t de student con n – k grados de libertad
1 1
LSD F(1; gld ; ) * CME * .
n1 n2
Dos medias son diferentes, a nivel poblacional, siempre que:
x i x j LSD
PROBLEMA
Un inversionista está interesado en ver si existen diferencias significativas en las tasas de recuperación de acciones,
bonos y fondos mutualistas. Ha tomado muestras aleatorias de cada tipo de inversión y ha registrado los siguientes
datos:
Tasa de reembolso (%)
Acciones 2.0 6.0 2.0 2.1 6.2 2.9
Bonos 4.0 3.1 2.2 5.3 5.9
Fondos Mutuos 3.5 3.1 2.9 6.0
a) Establezca las hipótesis nula y alternativa.
b) Pruebe sus hipótesis al nivel de significancia de 0,05
c) Establezca una conclusión explícita.
1) H0: 1 2 3
2) H1: Al menos dos de las medias de las tasas de reembolso (%) son diferentes
ESTADÍSTICA II 26
LCDO. JUAN FRANCISCO GÓMEZ
Error 35,860833333333 15-3=12 2,988402778
Total 36,757333333333 15-1 =14
2
Xt
2
57,2 2
SCTotal = X t
= 254,88 - 36,757 3
n 15
F(2;12;0,05)=3,89
Como Fc = 0,15 < Ft ( 2;12;0 , 05 ) 3,89 , se acepta la hipótesis nula; por lo tanto, no existen diferencias
significativas en las tasas de recuperación de acciones, bonos y fondos mutualistas
Si consideramos tres grupos de estudiantes, a dos de los cuales se les aplicó dos métodos especiales de enseñanza,
manteniendo al tercer grupo con el régimen normal de estudios. Se quiere comprobar si existen diferencias significativas
entre las calificaciones promedio obtenidas por los grupos y determinar entre qué grupos está la diferencia, con un error
tipo I del 5%. Los datos obtenidos para el análisis son los siguientes:
∑x Media
Método I 13 12 10 8 6 11 60 10
Método II 15 14 11 12 10 13 75 12,5
Régimen Normal 16 20 13 14 18 15 96 16
ESTADÍSTICA II 27
LCDO. JUAN FRANCISCO GÓMEZ
1) H0: 1 2 3
2
Xt
2
231 2
SCTotal = X t
= 3159 - 194,5
n 18
Ti2 X t 2 60 2 75 2 96 2 231 2
SCT =
n = = 109
i n 6 6 6 18
Ti2 60 2 75 2 96 2
SCE = X
2
= 3159 = 85,5
t
ni 6 6 6
F(2;15;0,05)=3,68
Como Fc = 9,561 > Ft ( 2;15; 0 , 05) 3,68 , se rechaza la hipótesis nula; por lo tanto, existe diferencias significativas
en los promedios de los grupos estudiados
ESTADÍSTICA II 28
LCDO. JUAN FRANCISCO GÓMEZ
Ahora a fin de determinar cuáles de los grupos son diferentes se procede a aplicar la formula de la diferencia menos
1 1 1 1
significativa: LSD F(1; gld ; ) * CME * F(1;15; 0, 05) * CME *
n1 n2 n1 n2
1 1
= 4,543077 * 5,7 * 2,938000391
6 6
Como el número de datos es igual para los tres grupos LSD es constante así que podemos comparar con los valores
absolutos de las diferencias de las medias
En caso de que el número de datos sean diferentes deben calcularse LSD para cada par de datos y comparar con sus
respectivas medias
1 1 1 1
LSD t * CME *
n n 2,131* 5,7 * 2,937380789
2
1 2 6 6
xi x j 10 12,5 2,5 LSD. Las medias del grupo 1 y 2 son iguales
xi x j 10 16 6 LSD. Las medias del grupo 1 y 3 son diferentes
xi x j 12,5 16 3,5 LSD. Las medias del grupo 2 y 3 son diferentes
EJERCICIOS PROPUESTOS
1. Una empresa empaca determinado producto de latas de tres tamaños distintos, cada uno en distinta línea de
producción. La mayor parte de las latas se apegan a las especificaciones, pero un ingeniero de control de calidad ha
identificado los siguientes defectos:
Mancha en la lata.
Grieta en la lata.
Ubicación incorrecta del anillo de apertura.
Falta del anillo de apertura.
Otras.
Se selecciona una muestra de unidades defectuosas de cada una de las tres líneas , y cada unidad se clasifica según el
defecto, la siguiente tabla de contingencia incluye esos datos:
DEFECTO
MANCHA GRIETA UBICACION FALTA OTROS
LINEA DE 1 34 65 17 21 13
PRODUCCION 2 23 52 25 19 6
3 32 28 16 14 10
¿Los datos sugieren desigualdad en las proporciones que caen en las distintas categorías de las tres líneas? Nivel de
confianza de 95%
2. Se obtuvo una muestra aleatoria de individuos que viajan solos en automóvil al trabajo, en una gran zona
metropolitana, y cada individuo fue clasificado de acuerdo con el tamaño de su automóvil y la distancia de recorrido
ESTADÍSTICA II 29
LCDO. JUAN FRANCISCO GÓMEZ
citadino. ¿La siguiente información sugiere que dicha distancia y el tamaño del automóvil están relacionados en la
población a la cual se hizo el muestreo? Exprese las hipótesis pertinentes y utilice una prueba Chi-cuadrado con un nivel
0.05.
DISTANCIA DE RECORRIDO
[0,10) [10,20) [20,∞)
SUBCOMPACTO 6 27 19
TAMAÑO DE COMPACTO 8 36 17
AUTOMOVIL MEDIANO 21 45 33
GRANDE 14 18 6
3. De cada una de tres comunidades se sacó una muestra de jóvenes casados. A cada pareja se le pidió que
especificara la cantidad mínima de educación que esperaba que sus hijos recibieran. La siguiente tabla muestra los
resultados que se observaron en la muestra:
COMUNIDAD
NIVEL MINIMO A B C
PRIMARIA 30 28 24
SECUNDARIA 30 19 46
UNIVERSITARIO 90 78 130
¿Qué se puede concluir respecto a la homogeneidad de las aspiraciones en la educación de los hijos? Nivel de
confianza de 95%
4. Un investigador desea saber si es posible concluir que hay relación entre el grado de liberalismo y la posición en la
universidad en una población de estudiantes universitarios. Para estos efectos se seleccionó una muestra de 500
estudiantes. La tabla siguiente muestra la clasificación de los datos según sus respuestas:
GRADO DE LIBERALISMO
CLASE LIGERO MODERADO ALTO
1ER. AÑO 30 83 37
2DO. AÑO 19 56 50
3ER. AÑO 16 46 63
4TO, AÑO 10 38 52
¿Qué se puede concluir respecto al problema del investigador?
5. Una compañía que produce una parte maquinada para un motor, afirma que tiene una varianza de diámetro no mayor
a 0.0002 pulgadas. Una muestra aleatoria de 10 de dichas partes dio una varianza de muestra s2 = 0.0003. Si se supone
que las medidas del diámetro se distribuyen en forma normal, ¿hay evidencia para refutar lo que afirma el proveedor?
Use α = 0.05.
6. En una encuesta preelectoral realizada a 500 personas se obtuvo la siguiente distribución en función de sus edades y
de su intención de voto:
RANGO DE EDAD
Partido [18, 35) [35, 50) [50 o mas
A 10 40 60
B 15 70 90
C 45 60 35
D 30 30 15
A un nivel de confianza del 90% ¿Puede afirmarse que la intención de voto es independiente de la edad?
7. En la encuesta telefónica realizada el pasado curso por los alumnos los resultados fueron muy dispares, mientras
algunos realizaron las cuatro entrevistas programadas otros no consiguieron completar ninguna de ellas. La distribución
del número de entrevistas conseguidas por los 57 alumnos que participaron en el proyecto fue la siguiente:
ESTADÍSTICA II 30
LCDO. JUAN FRANCISCO GÓMEZ
N° de entrevistas N° de alumnos
0 6
1 16
2 24
3 9
4 2
A un nivel de confianza del 90% ¿Puede afirmarse que estas diferencias han sido debidas al azar? O por el contrario
están motivadas por alguna otra causa.
Nota: Para calcular el valor del estadístico necesitamos las probabilidades de los valores, para ello es preciso estimar
previamente el valor de P a partir de los datos de la muestra.
El total de llamadas ha sido 57·4 = 228.
Las llamadas con éxito han sido 1·16 + 2·24 + 3·9 + 4·2 = 99.
La proporción de éxito es 99/228 = 0,4342.
8. Se sabe por experiencia que el tiempo que tarda el servicio de caja de una empresa prestadora del servicio de agua
de una región para atender a los clientes que llegan a efectuar el pago mensual del servicio se distribuye normalmente.
Se pide estimar el intervalo de confianza para la desviación estándar poblacional del tiempo requerido para atender los
pagos que efectúan los clientes, con un nivel de confianza del 95%, si para el efecto se tomó una muestra aleatoria de
25 clientes que arrojó una desviación estándar de 1.8 minutos.
9. Una muestra aleatoria de 41 paquetes de cierta semilla presenta una desviación estándar de en su peso de 1.6 onzas
Construir un intervalo de confianza del 95% para el verdadero valor de la desviación estándar poblacional. Se sabe que
los pesos de los paquetes se distribuyen normalmente.
10. El tiempo que transcurre para los obreros de una gran compañía entre el momento del ingreso a la planta y el
momento en que están listos para recibir las orientaciones de su jefe inmediato, se distribuye normalmente. Una muestra
de 20 obreros arroja una desviación estándar de 3.5 minutos. Se pide calcular el intervalo de confianza del 99% para la
desviación estándar del tiempo transcurrido para todos los obreros de la compañía.
11. Una muestra aleatoria de 8 pedidos que le hacen a una compañía, nos muestra que los mismos demoraron en ser
atendidos así: 10, 12, 19, 14, 15, 18, 11 y 13 días. Construir el intervalo de confianza del 99% para la desviación
estándar del tiempo que tarda la compañía en atender la orden:
12. Las pruebas efectuadas a una muestra aleatoria de 40 motores mostraron que tenían una desviación estándar de la
eficiencia térmica del 1.6%. Calcule el intervalo de confianza para grandes muestras del 95% para la desviación
estándar.
13. La gerencia de una empresa avícola considera que la variabilidad que se presenta en el peso de los pollos de 3
meses es aceptable, puesto que cree que la desviación estándar de los pesos es de 250 gramos. Un grupo de socios de
la empresa pone en duda lo manifestado por la gerencia y considera que la variabilidad es superior; por lo cual 6 meses
después la gerencia ordena tomar una muestra de 30 pollos de 3 meses seleccionados aleatoriamente y encuentra que
la desviación estándar de la misma es de S=225 gramos. Con un nivel de significación del 5%, compruebe quien tiene la
razón.
14. Se quiere comprobar si la variabilidad en la duración de unas lámparas marca A es igualmente variable que la
duración de otra marca B de la competencia. Para tal fin, se toma una muestra aleatoria de 13 lámparas tipo A y se
encuentra que la desviación estándar muestral es S=8, mientras que en otra muestra aleatoria de 13 lámparas tipo B se
encuentra que la desviación estándar muestral es de S=4. Se pide probar la hipótesis nula de que la variabilidad es igual
en ambas poblaciones con un nivel de significación del 5%.
15. Dos muestras aleatorias de tamaños 10 y 16 se han tomado respectivamente de dos poblaciones normalmente
distribuidas y las varianzas correspondientes fueron de 23 y 20. Determinar si la primera muestra tiene una varianza
significativamente mayor que la segunda. Nivel de significación del 1%.
ESTADÍSTICA II 31
LCDO. JUAN FRANCISCO GÓMEZ
16. El gerente de producción de una compañía afirma que existe igual variabilidad en el rendimiento del segundo turno
de trabajo que la variabilidad en el rendimiento del primer turno de trabajo. El jefe de producción cree que la del segundo
turno es mayor que la del primero, por lo cual toma una muestra del rendimiento de 21 obreros del segundo turno cuya
varianza es 4.8 y toma una muestra del rendimiento de 16 obreros del primer turno cuya varianza es 2.9. Se pide probar
la hipótesis con un nivel de significación del 5%.
19. Se quiere comparar el grado de variabilidad en el rendimiento de los obreros de dos compañía A y B y se encuentra
que en una muestra aleatoria de n 1=16 obreros de la compañía A la desviación estándar es S 1=14.07 unidades/hora,
mientras que en otra muestra aleatoria de n 2= 24 obreros de la compañía B el valor de la desviación estándar es
S2=20.86 unidades/hora. ¿Se puede concluir que la variabilidad en el rendimiento es menor en la compañía A que en la
B? Utilice un nivel de significación del 10%. El rendimiento de los obreros se distribuye normalmente en ambas
compañías.
20. Desde hace algún tiempo la desviación estándar del contenido de jugo de unos envase llenados por una máquina es
de 0.22 onzas. Se sospecha que dicha variabilidad en el contenido ha aumentado, por lo cual se toma una muestra
aleatoria de 20 envases los cuales arrojan una desviación estándar de 0.32 onzas. ¿Considera usted que el aumento de
la variabilidad es real? Nivel de significación del 5%
21. Dos máquinas diferentes A y B se utilizan para producir pernos idénticos que deben tener 2 pulgadas de longitud . Se
toma una muestra aleatoria de 25 pernos de la producción de la máquina A y otra muestra aleatoria de 25 pernos de la
máquina B, las cuales arrojan varianzas de 0.03 y 0.04 pulgadas 2 respectivamente. ¿Evidencian los anteriores datos que
la varianza de B es mayor que la de A? Utilice un nivel de significación del 5%. Respuesta: Según tablas F=1.98. Como
el valor calculado de F=1.33 se encuentra en la zona de aceptación, entonces, existe igual variabilidad para ambas
máquinas.
22. Al parecer el número de accidentes automovilísticos por día en una determinada ciudad tiene una distribución de
Poisson. A continuación se presentan los datos de una muestra de 80 días del año anterior. ¿Estos datos apoyan la
creencia de que el número de accidentes por dia tiene una distribución de Poisson?
23. El número de llamadas telefónicas que llegan por minuto al conmutador de una empresa tienen una distribución de
Poisson. Use de α = 0,1 y los datos siguientes para probar este suposición.
24. Siete por ciento de quienes invierten en fondos mutualistas consideran que las acciones corporativas son “muy
seguras”, 58% las considera “relativamente seguras”, 24% las considera “no muy seguras”, 4% las considera “”nada
segura” y 7% “no están seguros”. Business/week/Harris pregunto a 529 inversionistas de fondos mutualistas como
calificarían ellos bonos corporativos respecto de su seguridad. Las respuestas fueron las siguientes
ESTADÍSTICA II 32
LCDO. JUAN FRANCISCO GÓMEZ
Seguridad Frecuencia ¿La actitud de los inversionistas en
Muy seguros 48 fondos mutualistas difiere respecto a
Relativamente seguros 323 los bonos corporativos de su actitud
NO muy seguros 79 frente a las acciones corporativas?
Nada seguros 16 Apoye su conclusión dando una
No están seguros 63 prueba estadística. Use α = 0,01
25. De una muestra de piezas se obtiene la tabla de contingencia siguiente sobre la calidad, de acuerdo con el
turno de producción
turno Numero de piezas Numero de defectuosos Use α = 0,05 para probar la hipótesis
Primero 368 32 de que la calidad es independiente
Segundo 285 15 del turno de producción. ¿Cuál es la
Tercero 176 24 conclusión?
26. The Wall Street Journal hizo un estudio sobre el tipo de empleo de sus suscriptores. Los siguientes datos muestrales
corresponden a las ediciones del este y del oeste.
Región Use α = 0,05 para
Tipo de empleo Edición del este Edición del oeste probar la hipótesis de
Tiempo completo 1105 574 que el tipo de empleo
Medio tiempo 31 15 es independiente de la
Autoempleo/consultor 229 186 región. ¿Cuál es la
No empleado 485 344 conclusión?
27. Un vendedor hace cuatro llamadas por dia. En una muestra de 100 días los
volúmenes de venta son los siguientes.
Numero de ventas Frecuencia (días) Por experiencia se sabe que 30% de las
0 30 llamadas llevan a una venta. Si las
1 32 llamadas de ventas son independientes,
2 25 el número de ventas por días deberá
3 10 seguir una distribución binomial. Use un
4 3 nivel de significancia de 0,05
28. En una auditoria, los auditores tienen que dar opiniones acerca de diversos aspectos con base en sus propias
experiencias directas, indirectas o en una combinación de ambas. En un estudio se pidió a auditores que dieran su
opinión acerca de la frecuencia con que se presentan errores en una auditoria. Suponga que se obtuvieron los resultados
que se presentan a continuación; valores bajos indican opiniones mas acertadas.
Directa Indirecta combinado
17 16,6 25,2
18,5 22,2 24 Use α = 0,05 para determinar si el tipo de
15,8 20,5 21,5 experiencia en que se basa la opinión afecta la
18,2 18,3 26,8 calidad de la misma
20,2 24,2 27,5
16 19,8 25,8
13,3 21,2 24,2
ESTADÍSTICA II 33
LCDO. JUAN FRANCISCO GÓMEZ
5 4 5 entre los tres grupos.
6 5 6
4 4 6
30. Un fabricante de automóviles pone a prueba dos nuevos métodos de ensamblaje de motores respecto al tiempo en
minutos. Los resultados se muestran el la tabla:
Método 1 Método 2 Construya un intervalo de confianza del 90%
n1= 31 n2 = 25
= 50 = 24
31. En su incansable búsqueda de un sistema de llenado adecuado, cierta empresa prueba dos máquinas. Robo-fill se
usa para llenar 16 tarros y da una desviación estándar de 1.9 onzas en el llenado. Con Automat-fill se llenan 21 frascos
que dan una desviación estándar de 2.1 onzas. Si la empresa tiene que elegir uno de estos sistemas en función de la
uniformidad de llenado. ¿Cuál deberá seleccionar? Use un a = 0.10.
32. Se realizó un experimento para comparar el tiempo promedio requerido por el cuerpo humano para absorber dos
medicamentos, A y B. Suponga que el tiempo necesario para que cada medicamento alcance un nivel específico en el
torrente sanguíneo se distribuye normalmente. Se eligieron al azar a doce personas para ensayar cada fármaco
registrándose el tiempo en minutos que tardó en alcanzar un nivel específico en la sangre. Calcule con a = 0.05 si existe
diferencia entre los tiempos promedio y obtenga el valor de P. Suponga varianzas iguales.
Medicamento A Medicamento B
nA = 12 nB = 12
= 26,8 = 32,6
= 15,57 17,54
33. La Asociación Nacional de Comerciantes en Automóviles (ANCA) quiere comparar el comportamiento del gasto de gasolina de distintas
marcas de autos, para ello obtuvo una muestra aleatoria del consumo de gasolina en litros de dichos automóviles en 40 de sus distintos modelos.
Utilice un Alfa de 0.051. ¿El consumo de gasolina tienen un comportamiento similar?2. ¿Qué automóvil gasta menos gasolina?
(miles)
34. Un productor de pinturas para viviendas desea comparar el factor brillo de su pintura utilizando cuatro emulsiones
diferentes. Se pintan cinco tablas con cada tipo de emulsión y la clasificación que se dio a casa una aparece aquí
35. Muchas leyes estatales antiusura, promulgadas para regular los tipos de interés que los prestamistas pueden cargar,
establecen limitaciones a la variación de dichos tipos. Para evitar la discriminación contra los prestatarios, una ley
ESTADÍSTICA II 34
LCDO. JUAN FRANCISCO GÓMEZ
establece que la desviación típica de los tipos no puede ser superior al 0,50% durante un período de seis meses. La
comisión bancaria estatal elige al azar ocho préstamos concedidos por un prestigioso banco y halla los tipos de interés
siguientes: 6,2 8,9 7,3 6,8 7,9 8,1 7,5 y 6,9%. Al nivel del 5%, ¿infringe el banco las leyes estatales antiusura?
36. La cadena de comida rápida, afirman que la desviación típica es en realidad de 24000 dólares, y que su muestra de
20 concesionarios, que dio una desviación típica de 31300 dólares. El intervalo de confianza del 90% para la varianza de
los ingresos confirma la afirmación dada?
37. En un estudio para determinar si la opinión de la población es homogénea respecto al programa de privatización de
empresas públicas, se tomaron muestras aleatorias de tamaño 325, 164, 255 y 56 ciudadanos, de los departamento de
Lima, Cuzco, Arequipa y Piura respectivamente. Los resultados se muestran en el siguiente cuadro:
Opinión
Departamento Favorable Desfavorable No Opina Total
Cuzco 23 56 164
Lima 128
Arequipa 128 26 255
Piura 34 7 15
Total 400 300 800
Realice la prueba respectiva. Use =0.01
40. Una teoría fundamental en análisis financiero es que cuento menor sea la desviación de los rendimientos de un
activo menor es el riesgo asociado a dicho activo. Una desviación más pequeña garantizará que el rendimiento real sea
más cercano al esperado. Un intermediario financiero busca una inversión de poco riesgo para uno de sus clientes. La
selección ha sido ya limitada a dos valores, de cuyos rendimientos se extrae una muestra. El primer valor tiene unos
rendimientos de: 5,2; 7,3; 6,9; 6,5; 7,9; 4,1; 4,5 y 7,7%. El segundo valor rinde el 6,3; 6,9; 5,7; 6,2; 6,4; 6,8; 5,8; 6,5 y
6,1%. ¿Qué valor debe ser el elegido al nivel del 10%.
41. Desde que los intermediarios financieros trabajan a comisión en casi todas las
operaciones, están interesados en la actividad transaccional del mercado bursátil. Se hace
un estudio para determinar si existe diferencia en las comisiones medias pagadas según el
día de la semana y se recopilan los datos que aquí se muestran, en centenares de dólares. Al
nivel del 1%, ¿parece que todos días de la semana son igualmente rentables?
Lunes Martes Miércoles Jueves Viernes
21 28 11 15 25
26 21 14 14 23
24 19 12 12 26
32 15 10 12 28
25 12 10 16 24
26 10 12 13 25
24 13 15 18 29
42. El gerente de una planta industrial pretende determinar si el número de empleados que asisten al consultorio médico
de la planta se encuentran distribuidos en forma equitativa durante los 5 días de trabajo de la semana. Con base en una
muestra aleatoria de 4 semanas completas de trabajo, se observaron doscientas cuatro consultas:
Con α = 0,05, ¿existe alguna razón para creer que el número de empleados que asisten al consultorio médico, no se
encuentra distribuido de forma equitativa durante los días de la semana?
ESTADÍSTICA II 35
LCDO. JUAN FRANCISCO GÓMEZ
43. Para probar si hay alguna diferencia significativa entre la cantidad de horas entre las descomposturas respectivas de
cuatro máquinas se obtuvieron los siguientes datos:
Maquinas
1 2 3 4
6,4 8,7 11,1 11,5
7,8 7,4 10,3 11,3
5,3 10,1 9,7 12,8
7,4 9,2 10,3 9,9
8,4 9,2
7,3
Al nivel de significancia del 5%, ¿hay alguna diferencia entre las medias poblaciones de los tiempos de las cuatro
maquinas?
44. Considere que la demanda semanal de un producto tiene una distribución normal y
pruebe esta aseveración con un error tipo I del 10%
18 20 22 27 22 25 22 27 25 24
26 23 20 24 26 27 25 19 21 25
26 25 31 29 25 25 28 26 28 24
45. A continuación vemos una muestra de estimados de rendimientos por acción, para 2008
46. Los datos de 3 proveedores en relación a partes defectuosas es como sigue: Probar a un 5% de significancia si los
defectos dependen del tipo de proveedor.
47. Una empresa está considerando un cambio organizacional. Para evaluar las actitudes de los empleados hacia este
cambio, se selecciona una muestra de 400 empleados y se les preguntó acerca de sus actitudes hacia la implantación de
una política por la que un empleado podría tomar un día de vacaciones adicional al mes sin paga. Los resultados
clasificados por tipo de empleo son como sigue:
ACTITUD HACIA LAS VACACIONES SIN PAGA
TIPO DE TRABAJO A favor Neutral En contra
Trabajador por horas 135 23 67
Supervisor 39 7 14
Administrador de nivel medio 47 6 22
Administrador de nivel superior 26 6 8
Con un nivel de significancia de 2,5%, ¿hay evidencia de una relación entre la actitud hacia el tiempo de vacaciones sin
paga y el tipo de empleo? (Webster)
48. La directora de la sucursal bancaria del Provincial piensa que en su sucursal los cheques sin fondo siguen una
distribución de Poisson. Sabe que el número medio de estos cheques en su sistema bancario es de 3,6 diarios. Toma
una muestra en un periodo de 95 días y halla los datos que aparecen a continuación:
# de cheques sin fondos diarios 0 1 2 3 4 5 6 o más
días 12 14 13 15 14 15 12
ESTADÍSTICA II 36
LCDO. JUAN FRANCISCO GÓMEZ
Prueba la afirmación un nivel del confianza del 99,5% (Webster)
49. El director de producción de una textilera, tiene que garantizar que la combinación de sus productos cumplen un
determinado sistema de cuotas. También tiene instrucciones para ajustarla a un esquema que produzca el 30% de
productos de seda, el 20% de lana, el 10% de algodón y el 40% de cuero. De las 200 últimas unidades producidas, 65
fueron de seda, 5 de lana, 25 de algodón y 65 de cuero. Al nivel del 5%, ¿debe ajustar el esquema de producción actual?
(Webster)
50. Los tiempos necesarios en minutos para ejecutar un trabajo fueron 4,2; 7,1; 5,5; 4,6; 4,8; 6,8; 6,9; 6,2; 6,4 y 5,9. El
jefe del sindicato afirma que la varianza de la población de tiempos de ejecución es inferior a los 0,9 minutos 2 acordados
en el convenio colectivo. Contrastar la hipótesis al nivel de confianza de 99%, ¿tiene razón el jefe del sindicato?. Calcule
e interprete el intervalo de confianza con un error 5% para la desviación típica poblacional? (Webster)
51. Desde siempre, un objetivo primario de los sindicatos ha sido la nivelación de salarios (reducción de las diferencias
salariales entre los trabajadores en general). Un estudio reciente indicaba que diez sectores muy sindicalizados
presentaban una desviación típica de los índices salariales (redondeada al dólar más próximo) de 17 dólares, mientras
que ocho sectores en que los sindicatos eran débiles o apenas existían deban una desviación típica de 19 dólares.
¿Parecen estar los sindicatos en el camino de lograr su objetivo? Poner α = 0,025 (Webster)
52. El economista jefe del SENIAT Lara no esta de acuerdo con su supervisor, Pago fiscal Contribuyentes
el cual afirma que los pagos fiscales siguen una distribución normal. Los datos 0 a 15 248
de 2000 contribuyentes dieron los resultados que se ven aquí. Al nivel del 1%, 15 a 30 232
¿tiene razón el supervisor? (Webster) 30 a 45 489
45 a 60 512
60 a 75 263
75 a 90 256
53. Los ejecutivos calificaron la calidad del servicio Aerolíneas Ventas al Hotelería Automotriz
que ofrecen varios ramos comerciales. Suponga que
menudeo
se obtuvieron las siguientes calificaciones para los
59 63 70 49
ramos dados; los números mayores indican más
56 49 68 55
elevada calidad del servicio. Con nivel de significancia
47 60 62 48
de 0,05, pruebe si hay alguna diferencia significativa
46 54 69 49
entre las medias poblacionales de las calificaciones
55 56 59 50
de las cuatro industrias. ¿Cuál es su conclusión?
54 55
(Anderson)
48
54. Un estudio económico sobre niveles de renta en Barquisimeto reveló en 1999 que de todos los beneficiarios de
ayudas sociales, el 60% eran desempleados, el 22% trabajaban menos de 20 horas semanales, el 10% trabajaban entre
20 y 30 horas, y el resto más de 30 horas. Se implantó un programa de formación profesional para aumentar la
probabilidad de empleo de los beneficiarios de ayuda social. En 2006, una encuesta mostró que de 1100 personas
inscritas en ayuda social, 679 eran desempleados, 237 trabajaban menos de 20 horas, 121 trabajaban entre 20 y 30
horas, y el resto más de 30 horas. Si el programa de formación profesional se ideo para alterar la estructura observada
en 1999, ¿se puede mantener el programa? Poner un error tipo I de 0,01.
55. He aquí los resultados de un estudio efectuado por Datnálisis para determinar la relación
entre la importancia que los propietarios de tiendas conceden a la publicidad y el tamaño de
la tienda que poseen. ¿Parece dar que todos los tenderos dan la misma importancia a la
publicidad? Usar alfa de 10%
Tamaño
Publicidad Pequeño Mediano Grande
Importante 20 52 32
No importante 53 47 28
No opinan 67 32 25
ESTADÍSTICA II 37
LCDO. JUAN FRANCISCO GÓMEZ
56. Los grandes almacenes Makro de Venezuela hicieron hace poco un estudio para
determinar si había alguna relación entre el estado civil de un cliente y el volumen de
dólares de sus compras. Los resultados se muestran en la tabla. ¿Cuál es su conclusión al
nivel de significancia del 5%?
Volumen en dólares
< 10 10 - 19 20 - 29 30 - 39 40 - 49
Casado 32 23 15 12 14
Divorciado 51 17 10 15 13
Estado civil
Soltero 21 19 29 35 39
Viudo 18 15 19 10 9
57. El encargado de compras de unos grandes almacenes inspecciona cinco camiones de mercancías cada hora. Cada
uno contienen siete lotes de mercancía. Tiene que decidir si se compra la carga de cada camión. Hay una probabilidad
del 20% de que un camión sea aceptado. Con los datos de la tabla, ¿parece ser binomiales los niveles de aceptación? (α
= 0,05)
# de aceptaciones / 5 camiones 0 1 2 3 4 5
# de aceptaciones observadas 96 123 63 15 1 2
58, La tabla de frecuencias siguiente refleja datos de las ventas diarias durante 200 días. Con α = 0,05; ¿parecen seguir
las ventas una distribución normal?
VENTAS FRECUENCIA
40 59,9 7
60 79,9 22
80 99,9 46
100 119,9 42
120 139,9 42
140 159,9 18
160 179,9 11
180 199,9 12
59. El capataz de muelle de Puerto Cabello registró los datos aquí indicados sobre la llegada de camiones. Al nivel del
1%, ¿parece existir una distribución de Poisson?
60. Desde que los intermediarios financieros trabajan a comisión en casi todas las
operaciones, están interesados en la actividad transaccional del mercado bursátil. Se hace
un estudio para determinar si existe diferencia en las comisiones medias pagadas según el
día de la semana y se recopilan los datos que aquí se muestran, en centenares de dólares. Al
nivel del 1%, ¿parece que todos días de la semana son igualmente rentables?
Lunes Martes Miércoles Jueves Viernes
21 28 11 15 25
26 21 14 14 23
24 19 12 12 26
32 15 10 12 28
25 12 10 16 24
26 10 12 13 25
24 13 15 18 29
ESTADÍSTICA II 38
LCDO. JUAN FRANCISCO GÓMEZ
61. Se registraron los siguientes datos, en minutos que tardan algunos hombres y mujeres en realizar cierta actividad en
una empresa, los cuales fueron seleccionados aleatoriamente. Suponga que los tiempos para los dos grupos se
distribuyen normalmente. Determine un intervalo del 90% de confianza para el cociente de las varianzas
HOMBRES MUJERES
n1=14 n2=25
Media=17 Media=19
Varianza=1,5 Varianza=1,8
Grupo de Edad Pruebe si estas dos variables son independientes
Tipo de seguridad social 18-30 31-60 Más de 60 con un nivel de significancia de 0,05
Garantizada por el Estado 92 137 72
Con fondos de pensiones 61 114 56
Sin opinión 19 73 3
ESTADÍSTICA II 39
LCDO. JUAN FRANCISCO GÓMEZ
66. El gerente de un banco desea saber si el monto de las transacciones que se realizan se ajusta a una distribución
normal con un nivel de significación de 0,025. Toma una muestra aleatoria de 5000 transacciones y obtiene los
siguientes resultados:
Monto de la transacción fo
0 a menos de 1500 1500
1500 a menos de 3000 1300
3000 a menos de 4500 470
4500 a menos de 6000 500
6000 a menos de 7500 300
7500 a menos de 9000 200
9000 a menos de 10500 220
10500 a menos de 12000 100
12000 a menos de 13500 80
13500 a menos de 15000 60
15000 en adelante 270
67. El director de una aseguradora desea saber si el tipo de seguros depende de los ingresos
del cliente. Para investigarlo, toma una muestra aleatoria de 250 personas e identifica los
tipos de seguros que prefieren y cuáles son sus ingresos. Pruebe la independencia de estas
2 variables con un nivel de significación de 0,1
Tipos de seguro
Ingresos($) Total
A B C
0-5000 15 10 11 36
5001-15000 20 29 19 68
15001-30000 15 38 10 63
30001-adelante 20 23 40 83
Total 70 100 80 250
68. Un inversionista se interesa en instalar un centro comercial en una ciudad que tiene últimamente un rápido
crecimiento; él localizo 3 regiones en las afueras de la ciudad y desea saber si los ingresos de los habitantes cercanos a
esas áreas son iguales. Para ello hizo un estudio socioeconómico de algunas familias seleccionadas al azar en la
cercanía de cada corrida. La información en miles de pesos mensuales se da a continuación.
Región A Región B Región C Analice si se debe rechazar o no la hipótesis nula
24000 22800 26100
23600 26400 23600
23000 23800 24300
23300 21200 28100
27600 24800 24100
23100 20100 26200
69. Se reconoce que las actitudes negativas son un método efectivo de persuasión en la publicidad. Un estudio
que apareció en El Nacional informó los resultados de un análisis de contenido de anuncios culposos en 24
revistas. La cantidad de anuncios con actitudes de culpa, que aparecieron en ellas, es la siguiente:
ESTADÍSTICA II 40
LCDO. JUAN FRANCISCO GÓMEZ
70. La empresa Savoy, fabricante de los chocolates con leche patrocinó una encuesta nacional en la que más
de 4 millones de personas indicaron su preferencia para un color nuevo. El conteo de esta encuesta dio como
resultado el reemplazo del color chocolate por un nuevo color azul. En el folleto “Colores” que publicó el
departamento de asuntos del consumidor de Savoy, la distribución de colores de los chocolates es como sigue:
Café Amarillo Rojo Naranja Verde Azul
30% 20% 20% 10% 10% 10%
En un estudio que apareció en Opiniones se usaron muestras de bolsas de 250 gramos para determinar si eran
válidos los porcentajes publicados. Se obtuvieron los siguientes resultados con una muestra de 506
chocolates:
Café Amarillo Rojo Naranja Verde Azul
177 135 79 41 36 38
Use un nivel de significancia de 0,05 para determinar si estos datos respaldan los que publicó la empresa
ESTADÍSTICA II 41
LCDO. JUAN FRANCISCO GÓMEZ