Problemario
Problemario
Problemario
11.23. Consulte el ejercicio 11.22 y realice una prueba de la hipótesis nula de que B1 = 0 alfa =
0.05
11.43 Un fabricante de detergente para la ropa está interesado en probar un nuevo producto antes de
su lanzamiento al mercado. Un área de preocupación era la relación entre la altura de la espuma del
detergente en una lavadora en función de la cantidad de detergente añadido en el ciclo de lavado.
Para una carga estándar de lavado la maquina se llenó hasta el nivel completo, el fabricante hizo
asignaciones aleatorias de cantidades de detergente y los probó en la máquina de lavado. Los datos
aparecen a continuación.
11.55 Calcula una ecuación de regresión con el ejercicio de 11,54 como la variable dependiente.
Una parte de la salida se muestra aquí:
Escriba la ecuación de predicción. Interpretar los coeficientes. Es el término constante
(intersección) significativo en este contexto?
¿Qué parte de la variabilidad de los salarios se explica por la variación en los años de experiencia
laboral previa?
11.89.- Un reactor en una zona suburbana intentado predecir precios de las casas únicamente sobre
la base de su tamaño. Desde un servicio de listado múltiple, la inmobiliaria tamaño en miles de
metros cuadrados y el precio que pide obtiene en miles de dólares. La información se almacena en
el archivo DAT EX 1189 en los conjuntos de datos de sitios web, con precios en la columna 1 y
columna 2 Haga que su programa de software estadístico leer este archivo.
a.-Obtener una parcela de precio y tamaño. ¿Parece existe una relación creciente?
b.-Localizar un aparente valor atípico en los datos. ¿Es un punto de apalancamiento alto?
d.-Eliminar el valor atípico y obtener una nueva ecuación de regresión. ¿Cuánto cuesta el cambio de
pendiente sin que el valor atípico? ¿Por qué?
e.-Localizar las desviaciones standar residuales para los modelos atípicos-incluido y atípicos-
excluidos. ¿Difieren mucho? ¿Por qué?
11.90.-Obtener el modelo de regresión de valores atípicos-excluido de los datos del ejercicio 11.89.
a.-Interpretar el intercepto (constante) plazo. ¿Cuánto sentido tiene este número tiene en este
contexto?
b.-¿Qué significaría en este contexto, si la pendiente fuera 0? ¿Puede la hipótesis nula de pendiente
cero se rechazó enfáticamente?
c.-Calcula un intervalo de confianza del 95% para el valor real de la población de la pendiente. La
salida de la computadora debe darle la pendiente estimada y el error estándar, pero probablemente
tendrá que hacer los cálculos a mano.
a. Haga que su programa informático calcular una ecuación de regresión con la durabilidad
predicho por la concentración. Interprete el coeficiente de la pendiente.
12.25 Una empresa metalúrgica lleva a cabo un estudio energético utilizando métodos de regresión
múltiple. La variable dependiente es el costo del consumo y = energía por día (en miles de dólares).
Y las variables independientes son X1 = toneladas de metal tratados en el día, X2 = temperatura
exterior promedio -60 ° F (un contrato sindical requiere de refrigeración de la planta cuando las
temperaturas exteriores llegan a 60 °), X3 = potencia nominal para la maquinaria en uso, y X4 =
X1X2, los datos se analizaron mediante estadísticas.
12.26
El resultado para el ejercicio 12.15 se muestra aquí.
a) Buscar el valor de R2. Lo utilizan para confirmar el cálculo del estadístico de F.
b) ¿Podemos concluir que hay por lo menos algunos valores de predicción aleatoriamente entre las
variables independientes?
12.27
Otro análisis de regresión de los datos del ejercicio 12.26 utilizando sólo las actividades de
promoción como una variable independiente. El resultado son los siguientes:
12.28 Se calcularon 2 modelos basados en los datos del ejemplo 12.13, con los siguientes
resultados:
12.29
Calcula el estadístico F en el ejercicio anterior, con base en las sumas de cuadrados que se muestran
en la salida. Interprete los resultados de la prueba F.
12.31
Se analizaron los datos de calificación crediticia, utilizando sólo la variable de ingreso mensual que
es un predictor. Se muestran los resultados de JMP.
a) Por cuanto tiene la regresión suma de cuadrados reducido por la eliminación hecha ?
b) ¿Estas variables que agregan valor predictivo estadísticamente significativo (en los niveles
normales de alfa). una vez que se le da ingreso?
12.56 Un productor de diversos alimentos aditivos para el ganado lleva a cabo un estudio sobre el
número de días de los tiempos de engorda necesarios para traer ganado de carne a peso de mercado.
Dieciocho novillos de edad y peso esencialmente idénticos son comprados y llevados a un corral de
engorde. Cada novillo se alimenta con una dieta con una conformación específica de la
concentración de antibiótico contenido de proteína y el porcentaje de suplemento alimenticio
Los datos son los siguientes:
Novillo 1 2 3 4 5 6 7 8 9
Proteína 10 10 10 10 10 10 15 15 15
Antibiótico 1 1 1 2 2 2 1 1 1
Suplemento 3 5 7 3 5 7 3 5 7
Tiempo 88 82 81 82 83 75 80 80 75
Novillo 10 11 12 13 14 15 16 17 18
Proteína 15 15 15 20 20 20 20 20 20
Antibiótico 2 2 2 1 1 1 2 2 2
Suplemento 3 5 7 3 5 7 3 5 7
Tiempo 77 76 72 79 74 75 74 70 69
13.41 El efecto abrasivo de un probador de desgaste para telas experimentales se probó en un tejido
particular, mientras que se corre a seis diferentes velocidades de la máquina. Cuarenta y ocho piezas
idénticas de 5 pulgadas cuadradas de tejido fueron cortadas, con ocho plazas asignadas al azar a
cada una de las seis velocidades de la máquina: 100, 120, 140, 160, 180 y 200 revoluciones por
minuto (rev / min). El orden para la asignación de los cuadrados a la máquina fue al azar, con cada
cuadrado probado durante un período de 3 minutos en el ajuste de la máquina correspondiente. La
cantidad de desgaste se midió y registró para cada cuadrado. Los datos aparecen en la tabla adjunta.
a) Grafica los datos medios por revoluciones por nivel en minuto y sugerir un modelo.
c) Sugerir cuál de los gráficos de residuos podría ser útil en el control de las hipótesis en base del
modelo
EJERCICIO 12.58. Los datos del ejercicio 12.56 también son analizados por un modelo de
regresión utilizando sólo el contenido proteico como una variable independiente, con el siguiente
resultado:
b) encontrar el valor de R2
d) c) Prueba de la hipótesis nula de que los coeficientes de antibiótico y suplemento son con
valor de zeta y alfa = 0.05
e) 12.59: Una encuesta de administradores de sistemas de información fue usado para predecir
el salario anual programador de principio/ análisis en un área metropolitana. Los
administradores especificaron sus salarios por personal. Las firmas del margen de beneficio
bruto en centavos por dólar de ventas, y las firmas de información procesando costo como
un porcentaje del costo administrativo total. Los datos son almacenados en el ejercicio
1252.DAT archivo en el sitio web en datos enviados, con salario mínimo en la columna 1,
número de empleados en la columna 2, margen de ganancia en la columna 3, y costo del
procesamiento de la información en la columna 4.
f) a) Obtén una ecuación de regresión múltiple con salarios como la variable dependiente y
las otras tres variables como predictores, interpreta cada uno de los (parcial) coeficientes de
pendientes.
g) b) ¿Hay evidencia concluyente que lo tres predictores juntos tienen la menos algún valor en
la predicción del salario? Ubica un valor de P para la prueba apropiada.
h) c) ¿cada una de las variables independientes, si ninguno, tienen estadísticamente detectable
(α= .05) valor predicho como el ultimo predictor en la ecuación?
i) 12.60: a) localiza el coeficiente de determinación (R 2) para el modelo de regresión del
ejercicio 12.59
j) b) obtén otro modelo de regresión con el número de empleados como la sola variable
independiente. Encuentra el coeficiente de determinación para este modelo.
k) c) a mano, prueba la hipótesis nula que añadida margen de ganancia y costo de
procesamiento de información de números de empleados, Usa α= 0.01 que puedes concluir
de esta prueba?
EJERCICIO 12.64. Utilizar los datos de eliminación de ejercicio 12.62 para predecir los gastos
generales de un contrato cuando el contratista cuenta con 500 empleados, el contrato es de 2.50%
de los ingresos del contratista, y el costo del personal es de 55% del costo directo. Obtener un
intervalo de predicción de 95%. Tendría un costo de gastos generales igual al costo directo 88.9%
razonable en este situación?
13.43 Referirse a los datos del ejercicio 13.41. supongamos que otra variable fue controlada y que
los primeros cuatro cuadrados en cada velocidad se trataron con una concentración 2 de capa
protectora y los segundos cuatro cuadrados fueron tratados con una concentración 4 del mismo
recubrimiento. dado que x1 indica la velocidad de la máquina y X2 indica la concentración de la
capa protectora, colocar estos modelos.
a) representar los datos medios por revoluciones por minuto y nivel de sugerir un modelo.
c) sugieren que las parcelas residual podría ser útil en el control de las hipótesis de base del modelo.
d) utilizar los gráficos de residuos para detectar posibles violaciones de los supuestos
32.3 1 7 72.9 2 10
34.8 1 8 88.2 3 6
38.2 1 9 89.3 3 7
43.5 1 10 94.1 3 8
60.3 2 6 95.7 3 9
63.7 2 7 100.6 3 10
65.4 2 8
13.65 se realizó un estudio para determinar si la infección por un programa de vigilancia control
han reducido las tasas de hospitalización adquirido la infección en los hospitales de Estados Unidos.
Este conjunto de datos considerado muestra aleatoria de 28 hospitales seleccionados de 338
hospitales participantes en un estudio . Cada uno en conjunto de datos proporciona información
sobre variables para un solo hospital. Las variables son como sigue.
ESTANCIA variable = entrada, estancia media de todos PACIENTES en un hospital (en días)
INS variable = entrada, relación del número de cultivos realizados al número de pacient sin canta o
síntomas de hospitalización adquirido la infección (100 veces)
ESCUELA = variable de entrada simulado para la afiliación de espacios escolares médica, 1 = sí, 0
= no
RC1 = variable de entrada simulado para la región del país, 1 = noreste, 0 = otro
RC2 = variable de entrada simulado para la región del país, 1 = el centro norte, 0 = otro
RC3 = variable de entrada simulado para la región del país, 1 = sur, 0 = otro
nota que hay cuatro regiones geográficas del país. Estas cuatro regiones del país requieren sólo tres
variables dummy para codificar para ellos. Los datos fueron analizados usando SAS con los
siguientes Resultados
13.67 Consulte el ejercicio 13.65. Supongamos que decidimos eliminar del modelo completo
algunas variables que creemos contribuyen poco para explicar la variable de salida. ¿qué le elección
de un modelo de ser? ¿Por qué elegir este modelo?