Tarea 5 Estadistica

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 25

UNIVERSIDAD DON BOSCO

MATERIA:
ESTADÍSTICA APLICADA ESA901

DOCENTE:
ING. GERARDO ANTONIO LÓPEZ RAMOS

TEMA:
GUÍA DE EJERCICIOS # 5 – ANÁLISIS DE VARIANZA Y REGRESIÓN

EQUIPO DE TRABAJO CARNÉ


Eva Melissa Blas Ruiz BR223092
Rodrigo Xavier Morán Rodríguez MR233337
Eveling Janeth Santos de Carranza SP130097
Nancy Alexandra Serrano Jiménez SJ121122

FECHA DE ENTREGA: 3 DE DICIEMBRE DE 2023

DESARROLLO DE EJERCICIOS
25. A continuación se presenta el tamaño del pecho (en pulgadas) y el peso (en libras)
de osos elegidos al azar, que fueron anestesiados y medidos (según datos de Gary
Alt y Minitab, Inc.). Como es mucho más difícil pesar un oso que medir el tamaño de
su pecho, la presencia de una relación podría conducir a un método para estimar el
peso a partir del tamaño del pecho.

a) ¿Existe una relación lineal entre el tamaño del pecho y el peso? Argumente su
respuesta.

Tamaño de Pecho
Correlativo Peso (Y) XY X² Y²
(X)
1 26 80 2080 676 6400
2 45 344 15480 2025 118336
3 54 416 22464 2916 173056
4 49 348 17052 2401 121104
5 35 166 5810 1225 27556
6 41 220 9020 1681 48400
7 41 262 10742 1681 68644
8 49 360 17640 2401 129600
9 38 204 7752 1444 41616
10 31 144 4464 961 20736
Totales 409 2544 112504 17411 755448

𝟏𝟎(𝟏𝟏𝟐𝟓𝟎𝟒) − (𝟒𝟎𝟗)(𝟐𝟓𝟒𝟒)
𝒓=
(√𝟏𝟎(𝟏𝟕𝟒𝟏𝟏) − 𝟒𝟎𝟗𝟐 )(√𝟏𝟎(𝟕𝟓𝟓𝟒𝟒𝟖) − 𝟐𝟓𝟒𝟒𝟐 )

𝒓 = 𝟎. 𝟗𝟖𝟑𝟐𝟖𝟗𝟔𝟐

Existe una correlación lineal positiva fuerte, lo cual nos indica que si se puede usar
este método para estimar el peso con el tamaño del pecho
Peso (Y)
450
400
350
300
250
200
150
100
50
0
0 10 20 30 40 50 60

b) ¿Qué porcentaje de la variación en el peso de un oso puede explicarse


mediante la variación del tamaño de su pecho?

𝒓𝟐 = 𝟎. 𝟗𝟖𝟑𝟐𝟖𝟗𝟔𝟐𝟐

𝒓𝟐 = 𝟎. 𝟗𝟔𝟔𝟖𝟓𝟖𝟒𝟗

El porcentaje de variación en el peso es de un 96.67%.

26. Un ingeniero químico está estudiando el efecto de la temperatura y la tasa de


agitación en la producción de cierto producto. El proceso se realiza 16 veces; en la
tabla siguiente se muestran los resultados. Las unidades para la producción son
porcentajes de un máximo teórico.
a) ¿Existe una relación lineal entre la temperatura y producción? Argumente su
respuesta.

Elaboramos el diagrama de dispersión de los datos. Colocamos la variable independiente


“Temperatura °C” en el eje x y la variable dependiente “Porcentaje de producción” en el eje
Y.
Para determinar si hay una relación lineal entre la temperatura y el porcentaje de
producción, determinamos la ecuación de la recta basado en: 𝑌 = 𝑎𝑋 + 𝑏. Elaboramos una
tabla determinando los valores de: ∑ 𝑥 , ∑ 𝑦 , ∑ 𝑥𝑦, y ∑ 𝑥 2 .

Obteniendo las siguientes ecuaciones:

∑ 𝑦 = 𝑎 ∑ 𝑥 + 𝑛𝑏 → 1209.45 = 1918𝑎 + 16𝑏

∑ 𝑥𝑦 = 𝑎 ∑ 𝑥 2 + 𝑏 ∑ 𝑥 → 145464.45 = 231766𝑎 + 1918𝑏

Despejando a y b empleando método de determinantes resulta:


1209.45 16
| | (1209.45)(1918) − (145464.45)(16) −7706.1
𝑎= 145464.45 1918 = = = 0.2609
1918 16 (1918)(1918) − (231766)(16) −29532
| |
231766 1918
1918 1209.45
| | (1918)(145464.45) − (231766)(1209.45) −1308573.6
𝑏 = 231766 145464.45 = =
1918 16 (1918)(1918) − (231766)(16) −29532
| |
231766 1918
= 44.3104

Comprobando los resultados mediante ecuaciones normales simultaneadas:


𝑛(∑ 𝑥𝑦) − (∑ 𝑥)(∑ 𝑦) (16)(145464.45) − (1918)(1209.45) 7706.1
𝑎= = = = 0.2609
𝑛(∑ 𝑥 2 ) − (∑ 𝑥)2 (16)(231766) − 19182 29532
(Σ𝑥 2 )(Σ𝑦) − (Σ𝑥)(Σ𝑥𝑦) (231766)(1209.45) − (1918)(145464.45) 1308573.6
𝑏= = =
𝑛(∑ 𝑥 2 ) − (∑ 𝑥)2 (16)(231766) − 19182 29532
= 44.3104

Por tanto, la ecuación de recta de mínimos cuadrados es:


𝑦 = 0.2609𝑥 + 443104

Graficando la recta versus el diagrama de dispersión:

Respuesta: Comprobando mediante la relación entre el diagrama de dispersión y la recta,


sí existe una relación lineal entre la temperatura y el porcentaje de producción, ya que a
mayor temperatura, mayor producción, como podemos ver en las gráficas, que el porcentaje
de producción aumenta al aumentar la temperatura.

b) ¿Qué porcentaje de la variación en la tasa de agitación puede explicarse mediante


la variación de la temperatura?

Podemos explicar la variación en la tasa de agitación mediante el coeficiente de correlación


lineal (r) y del coeficiente de determinación (r 2). Utilizando la fórmula de Pearson para
encontrar el valor de r, tenemos:
Datos: ∑ 𝑥 = 1918 ; ∑ 𝑦 = 720 ; ∑ 𝑥𝑦 = 87746 ; ∑ 𝑥 2 = 231766; ∑ 𝑦 2 = 33760

Sustituyendo los datos en la fórmula:

𝑛(∑ 𝑥𝑦) − (∑ 𝑥)(∑ 𝑦)


𝑟=
√𝑛(∑ 𝑥 2 ) − (∑ 𝑥)2 √𝑛(∑ 𝑦 2 ) − (∑ 𝑦)2
(16)(87746) − (1918)(720)
𝑟=
√(16)(231766) − (1918)2 √(16)(33760) − (720)2
1403936 − 1380960 22976
𝑟= = = 0.9064
√29532 √21760 25349.88

Elevando r2 para encontrar el coeficiente de determinación:

𝑟 2 = (0.9064)2 = 0.8216

Multiplicando 0.8216 𝑥 100% = 82.16%

Respuesta: Podemos interpretar que el 82.16% de la variación de la tasa de agitación


puede explicarse o deberse mediante la variación de la temperatura.
27. Una compañía local de energía seleccionó una residencia típica para desarrollar
un modelo empírico para el consumo de energía (en kilowatts por día) como una
función de la temperatura promedio diaria durante los meses de invierno. Se obtuvo
la siguiente información durante un periodo de 15 días.

a) ¿Existe una relación lineal entre la temperatura y el consumo de energía?


Argumente su respuesta.

Primero elaboramos el diagrama de dispersión de los datos. Colocamos la variable


independiente ‘Temperatura en °C’ en el eje X y la variable dependiente ‘consumo de
energía en KW/día’ en el eje Y

Luego para determinar si hay una relación lineal entre la temperatura y el consumo de
energía determinamos la ecuación de la recta basado en: 𝑌 = 𝑎𝑋 + 𝑏. Elaboramos una
tabla determinando los valores de: ∑ 𝑥 , ∑ 𝑦 , ∑ 𝑥𝑦, y ∑ 𝑥 2 .
Obteniendo las siguientes ecuaciones:

∑ 𝑦 = 𝑎 ∑ 𝑥 + 𝑛𝑏 → 1133 = 23𝑎 + 15𝑏

∑ 𝑥𝑦 = 𝑎 ∑ 𝑥 2 + 𝑏 ∑ 𝑥 → 202 = 899𝑎 + 23𝑏

Despejando a y b empleando método de determinantes resulta:


1133 15
| |
𝑎 = 202 23 = (1133)(23) − (15)(202) = 23029 = −1.7774
23 15 (23)(23) − (15)(899) −12956
| |
899 23
23 1133
| |
𝑏= 899 202 = (23)(202) − (133)(899) = −1013921 = 78.2587
23 15 (23)(23) − (15)(899) −12956
| |
899 23

Comprobando los resultados mediante ecuaciones normales simultaneadas:


𝑛(∑ 𝑥𝑦) − (∑ 𝑥)(∑ 𝑦) (15)(202) − (23)(1133) −23029
𝑎= = = = −1.7774
𝑛(∑ 𝑥 2 ) − (∑ 𝑥)2 (15)(899) − 232 12956
𝑛(∑ 𝑥𝑦) − (∑ 𝑥)(∑ 𝑦) (899)(1133) − (23)(202) 1013921
𝑏= = = = 78.2587
𝑛(∑ 𝑥 2 ) − (∑ 𝑥)2 (15)(899) − 232 12956

Por tanto, la ecuación de recta de mínimos cuadrados es:


𝑦 = −1.7774𝑥 + 78.2587
Graficando la recta versus el diagrama de dispersión:

Respuesta: Comprobando mediante la relación entre el diagrama de dispersión y la recta,


sí existe una relación lineal entre la temperatura y el consumo de energía, ya que a mayor
temperatura, menor consumo, como podemos ver en las gráficas, que el consumo
disminuye al aumentar la temperatura.
b) ¿Qué porcentaje de la variación en el consumo de energía puede explicarse
mediante la variación de la temperatura?
Podemos explicar la variación en el consumo de energía mediante el coeficiente de
correlación lineal (r) y del coeficiente de determinación (r 2). Utilizando la fórmula de Pearson
para encontrar el valor de r, tenemos:
Datos: ∑ 𝑥 = 23 ; ∑ 𝑦 = 1133 ; ∑ 𝑥𝑦 = 202 ; ∑ 𝑥 2 = 899; ∑ 𝑦 2 = 89091

Sustituyendo los datos en la fórmula:

𝑛(∑ 𝑥𝑦) − (∑ 𝑥)(∑ 𝑦)


𝑟=
√𝑛(∑ 𝑥 2 ) − (∑ 𝑥)2 √𝑛(∑ 𝑦 2 ) − (∑ 𝑦)2
(15)(202) − (23)(1133)
𝑟=
√(15)(899) − (23)2 √(15)(89091) − (1133)2
3030 − 26059 −23029
𝑟= = = −0.8815
√12956 √52676 26124.1317

Elevando r2 para encontrar el coeficiente de determinación:

𝑟 2 = (−0.8815)2 = 0.7770

Multiplicando 0.7770 𝑥 100% = 77.70%

Respuesta: Podemos interpretar que el 77.70% de la variación del consumo de energía


puede explicarse o deberse mediante la variación de la temperatura.

28. Los siguientes datos corresponden a la cantidad de sustancia que permanece en


un sistema químico en reacción después de X minutos.

a) Trazar el diagrama de dispersión del tiempo versus la cantidad de sustancia.


b) Encontrar la ecuación de una parábola de mínimos cuadrados que ajuste esta
serie de datos. Dejar evidencia de todos los procedimientos realizados en el
cálculo de las sumatorias, planteamiento de las ecuaciones normales y
resolución del sistema de ecuaciones usando Excel. Debe trazar la curva
sobre el diagrama de dispersión elaborado en a).

En nuestro caso la variable independiente ‘x’ serán los minutos, mientras que la variable
dependiente ‘y’ será la cantidad de sustancia que permanece en el sistema químico
después de pasados los minutos.

Debido a que el diagrama de dispersión muestra que se tiene forma de una parábola,

utilizaremos la ecuación , cuyas ecuaciones normales son:


Al sustituir los valores de las sumatorias en las ecuaciones normales, resulta:

1- 311 = 15a + 50.8b + 208.26c


2- 1038.1 = 50.8a + 208.26b + 955.16c
3- 4457.07 = 208.26a + 955.16b + 4685.55c

Al resolver este sistema de ecuaciones lineales por el método de determinantes en Excel


tenemos:

Primero efectuamos una matriz 3x3 para los valores de a, b y c, y una matriz 3x1 para los
valores de los términos independientes.
Luego generamos una matriz inversa a partir de la matriz ‘coeficientes’ y la colocamos en
los cuadros de la tabla ‘inversa’ usando la función MINVERSA
Luego multiplicamos los valores de la matriz inversa con la matriz TI (términos
independientes) para que nos arroje los valores de a, b y c; realizándolo mediante el uso
de la fórmula en Excel MMULT de multiplicación de matrices.

Después de obtener los valores de a, b y c, elaboramos la ecuación de la parábola de


mínimos cuadrados:

𝑦 = 𝑎 + 𝑏𝑥 + 𝑐𝑥 2 → 𝑦 = 54.96 − 24.29𝑥 + 3.46𝑥 2

Luego trazamos la curva sobre el diagrama de dispersión elaborado previamente:

𝑦 = 𝑎 + 𝑏𝑥 + 𝑐𝑥 2 → 𝑦 = 54.96 − 24.29𝑥 + 3.46𝑥 2


c) Estimar la cantidad de sustancia que permanece en el sistema químico después
de 3.8 minutos
Sustituimos x= 3.8 y = 54.96 - 24.29(3.8) + 3.46 (3.8)^2

Y = 54.96 - 92.302 + 49.96

Y = 12.618 ≈ 12.62

Respuesta : después de 3.8 minutos permanece una cantidad de 12.62 gramos de


sustancia en el sistema.

29. En un experimento agropecuario, se tomó una muestra de 15 unidades de una


variedad de árbol frutal y se observó el rendimiento en frutos de acuerdo con la
cantidad de fertilizante utilizado

a) Trazar el diagrama de dispersión e indicar la tendencia


Cantidad de Frutos(Y)
60

50

40

30

20

10

0
0 2 4 6 8 10 12

La tendencia es una parábola invertida, indicando que a medida se le agrega fertilizante el


rendimiento de los frutos aumenta, hasta llegar al máximo valor, una vez alcanzado a pesar
de que se aumente la cantidad de fertilizante, tendrá un rendimiento decreciente.

b) Encontrar la ecuación de una parábola de mínimos cuadrados que ajuste esta serie
de datos. Dejar evidencia de todos los procedimientos realizados en el cálculo de las
sumatorias, planteamiento de las ecuaciones normales y resolución del sistema de
ecuaciones usando Excel. Debe trazar la recta sobre el diagrama de dispersión
elaborado en a).
Gramos de Cantidad de
Correlativo X² X³ X⁴ XY X²Y
Fertilizante(X) Frutos(Y)
1 1 10 1 1 1 10 10
2 1 15 1 1 1 15 15
3 2 30 4 8 16 60 120
4 2 25 4 8 16 50 100
5 3 40 9 27 81 120 360
6 3 43 9 27 81 129 387
7 4 50 16 64 256 200 800
8 5 55 25 125 625 275 1375
9 5 54 25 125 625 270 1350
10 6 53 36 216 1296 318 1908
11 7 51 49 343 2401 357 2499
12 8 47 64 512 4096 376 3008
13 9 41 81 729 6561 369 3321
14 9 35 81 729 6561 315 2835
15 10 30 100 1000 10000 300 3000
Totales 75 579 505 3915 32617 3164 21088

(1) 579 = 10𝑎 + 75𝑏 + 505𝑐


(2) 3164 = 75𝑎 + 505𝑏 + 3915𝑐
(3) 21088 = 505𝑎 + 3915𝑏 + 32617𝑐

Resolviendo por simultaneo de ecuaciones:


Tomando 1 Y 2:
579 = 10𝑎 + 75𝑏 + 505𝑐 (−7.5)
3164 = 75𝑎 + 505𝑏 + 3915𝑐
−4342.5 = −75𝑎 − 562.5𝑏 − 3787.5𝑐
3164 = 75𝑎 + 505𝑏 + 3915𝑐
(4) −1178.5 = −57.5 𝑏 + 127.5𝑐

Tomando 1 Y 3:

579 = 10𝑎 + 75𝑏 + 505𝑐 (−50.5)


21088 = 505𝑎 + 3915𝑏 + 32617𝑐
−29232.5 = −505𝑎 − 3787.5𝑏 − 25502.5𝑐
21088 = 505𝑎 + 3915𝑏 + 32617𝑐
(5) −8151.5 = 127.5 𝑏 + 7114.5𝑐
Igualando 4 y 5:
−1178.5 = −57.5 𝑏 + 127.5𝑐 (127.5)
−8151.5 = 127.5 𝑏 + 7114.5𝑐 (57.5)
−150258.75 = −7331.25𝑏 + 16256.25𝑐
−468711.75 = −7331.25𝑏 + 409083.75𝑐
−618970 = +425340 𝑐

−618970
𝑐= = −1.4552
425340

Sustituyendo en 5 y despejando b:
−8151.5 = 127.5𝑏 + 7114.5(−1.4552)
−8151.5 + 10353.0204
𝑏=
127.5

2.201.5204
𝑏= = 17.2668
127.5
Sustituyendo en 1 y despejando a:

579 = 10𝑎 + 75(17.2668) + 505(−1.4552)


579 − 1295.01 + 734.876
𝑎=
10
18.866
𝑎= = 1.8866
10

Ecuación parábola de mínimos cuadrados:


𝑌 = 1.8866 + 17.2668𝑥 − 1.4552𝑥 2

Cantidad de Frutos(Y)
60

50

40

30
y = -1.45x2 + 17.27x +1.89
20

10

0
0 2 4 6 8 10 12

b) Estimar el rendimiento en frutos de un árbol si se le aplicó 12 gramos de


fertilizante.
X=12
𝑌 = 1.8866 + 17.2668(12) − 1.4552(12)2
Y = 1.8866 + 207.2016 − 209.54
𝑌 = −0.4518

Esto nos indica, que ya no habrá rendimiento de frutos.

30. En la investigación de accidentes automovilísticos, el tiempo total requerido para


el frenado total de un automóvil después de que el conductor ha percibido un peligro
está compuesto de su tiempo de reacción (el tiempo que transcurre en su detección
del peligro y la aplicación de los frenos) más el tiempo de frenado (el tiempo que
tarda el automóvil en detenerse después de la aplicación de los frenos). La siguiente
tabla proporciona la distancia de frenado D en metros de un automóvil que viaja a
diversas velocidades V en metros por segundo al momento en el cual el conductor
detecta un peligro.

a) Trazar el diagrama de dispersión


b) Encontrar la ecuación de una parábola de mínimos cuadrados que ajuste esta serie
de datos. Dejar evidencia de todos los cálculos realizados en el cálculo de las
sumatorias, planteamiento de las ecuaciones normales y resolución del sistema de
ecuación usando Excel. Debe trazar la curva sobre el diagrama de dispersión
elaborado en a).

Debido a que el diagrama presenta forma de parábola, utilizaremos la siguiente ecuación


para calcular los valores de a y b de la ecuación a formar.

𝑌 = 𝑎 + 𝑏𝑥 + 𝑐𝑥 2

Obteniendo los datos en la tabla para elaborar las ecuaciones normales:

Las ecuaciones normales son:


1. ∑ 𝑦 = 𝑛𝑎 + 𝑏 ∑ 𝑥 + 𝑐 ∑ 𝑥 2

2. ∑ 𝑥𝑦 = 𝑎 ∑ 𝑥 + 𝑏 ∑ 𝑥 2 + 𝑐 ∑ 𝑥 3

3. ∑ 𝑥 2 𝑦 = 𝑎 ∑ 𝑥 2 + 𝑏 ∑ 𝑥 3 + 𝑐 ∑ 𝑥 4

Sustituyendo los datos en las ecuaciones normales tenemos:

1. 1176 = 6𝑎 + 270𝑏 + 13900𝑐

2. 64840 = 270𝑎 + 13900𝑏 + 783000𝑐

3. 3830000 = 13900𝑎 + 783000𝑏 + 46750000𝑐

Resolución del sistema de ecuaciones usando Excel:

1. ingresamos los valores de los coeficientes de la matriz 3x3 en base a los valores de a, b
y c en las ecuaciones normales y una matriz 3x1 con los valores de los términos
independientes de las ecuaciones.

2. generamos una matriz inversa 3x3 a partir de los datos de la tabla ‘coeficientes’, y la
colocamos en los cuadros de la tabla ‘inversa’ usando la función MINVERSA
3. Luego multiplicamos los valores de la matriz inversa con la matriz TI (términos
independientes) para que nos arroje los valores de a, b y c; realizándolo mediante el uso
de la fórmula en Excel MMULT de multiplicación de matrices.
A partir de los valores encontrados de a, b y c, elaboramos la ecuación de la parábola de
mínimos cuadrados:

𝑌 = 41.771 − 1.0957𝑥 + (0.0878)𝑥 2

Luego trazamos la curva sobre el diagrama de dispersión elaborado previamente:


c) Estimar la distancia D de frenado cuando el automóvil se está desplazando a 55
m/s y a 75 m/s.

• Calculando la distancia D de frenado utilizando x=55 m/s utilizando la ecuación de


la parábola de mínimos cuadrados encontrada en el paso anterior, tenemos:
𝑌 = 41.771 − 1.0957𝑥 + (0.0878)𝑥 2
𝑌 = 41.771 − 1.0957(55) + (0.0878)(55)2 = 247.10 𝑚𝑒𝑡𝑟𝑜𝑠

• Calculando la distancia D de frenado cuando x=75 m/s utilizando la ecuación de la


parábola de mínimos cuadrados hallada en el paso anterior, tenemos:
𝑌 = 41.771 − 1.0957𝑥 + (0.0878)𝑥 2
𝑌 = 41.771 − 1.0957(75) + (0.0878)(75)2 = 453.47 𝑚𝑒𝑡𝑟𝑜𝑠

También podría gustarte