Unidad 2 Paso 4 Descripción de La Información - Grupo70
Unidad 2 Paso 4 Descripción de La Información - Grupo70
Unidad 2 Paso 4 Descripción de La Información - Grupo70
CÓDIGO: 100105A
Presentado a la tutora:
GLORIA PAULINA CASTELLANOS
Grupo: 100105_70
1
INTRODUCCIÓN
La regresión lineal es una técnica que permite cuantificar la relación que puede ser observada
cuando se grafica un diagrama de puntos dispersos correspondientes a dos variables, cuya
tendencia general es rectilínea; relación que cabe compendiar mediante una ecuación “del mejor
ajuste” de la forma:
y = a + bx
En esta ecuación, “y” representa los valores de la coordenada a lo largo del eje vertical en el
gráfico (ordenada); en tanto que “x” indica la magnitud de la coordenada sobre el eje horizontal
(abscisa). El valor de “a” (que puede ser negativo, positivo o igual a cero) es llamado el
intercepto; en tanto que el valor de “b” (el cual puede ser negativo o positivo) se denomina la
pendiente o coeficiente de regresión.
El análisis de correlación se encuentra estrechamente vinculado con el análisis de regresión y
ambos pueden ser considerados de hecho como dos aspectos de un mismo problema.
La correlación entre dos variables el grado de asociación entre las mismas. Este es expresado por
un único valor llamado coeficiente de correlación (r), el cual puede tener valores que oscilan
entre -1 y +1. Cuando “r” es negativo, ello significa que una variable (ya sea “x” o “y”) tiende a
decrecer cuando la otra aumenta (se trata entonces de una “correlación negativa”,
correspondiente a un valor negativo de “b” en el análisis de regresión). Cuando “r” es positivo,
en cambio, esto significa que una variable se incrementa al hacerse mayor la otra (lo cual
corresponde a un valor positivo de “b” en el análisis de regresión).
En el presente trabajo se pretende interpretar la problemática que nos presentan del servicio de
urgencias del hospital Federico Lleras de Ibagué mediante la identificación de las variables
cuantitativas de la situación estudiada que puedan estar relacionadas, para a partir de esto realizar
la descripción de la información suministrada de la base de datos “calidad en el servicio de
Urgencias 2018-16-4”.
2
JUSTIFICACIÓN
Por medio del presente trabajo se pretende realizar un análisis y descripción de la información
suministrada en la base de datos “calidad en el servicio de Urgencias 2018-16-4”, mediante la
utilización de la regresión y correlación lineal simple de las variables cuantitativas. Se pretende
mediante la realización de los gráficos de dispersión determinar el tipo de asociación de las
variables cuantitativas, así como encontrar el modelo matemático que nos permite predecir el
efecto de una variable sobre la otra, saber si es confiable el modelo, determinando el porcentaje
de explicación del modelo y el grado de relación de las variables.
3
OBJETIVOS
4
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE
Diagrama de dispersión:
El diagrama de dispersión permite estudiar las relaciones entre dos conjuntos asociados de datos
que aparecen en pares (por ejemplo, (x,y), uno de cada conjunto). El diagrama muestra estos
pares como una nube de puntos y nos permite estudiar a relación entre:
5
ESTUDIANTE 1: Luis Fredy Timana
Diagrama de dispersión:
Debido a que el coeficiente de correlación está por debajo de 0.80 su correlación no es buena. Con
respecto al servicio de urgencias podemos afirmar que la relación edad - estatura de los
encuestados no es proporcional y existe una relación baja por la baja confiabilidad de sus
relaciones.
6
ESTUDIANTE 2: Rolando Hermida Manjarrés
Diagrama de dispersión:
y = 0.0136x + 0.7524
Gráfico de Dispersión R² = 0.8645
2
1.8
Estatura (M)
1.6
1.4
1.2
1
0.8
0.6
0.4
0.2
0
0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00 80.00 90.00 100.00
Peso (Kg)
Debido a que el coeficiente de correlación está por encima de 0.80 su correlación es buena. Con
respecto al servicio de urgencias podemos afirmar que la relación peso- estatura de los encuestados
es proporcional y existe una relación alta por la alta confiabilidad de sus relaciones.
7
ESTUDIANTE 3: Sandra Patricia Cañas
Diagrama de dispersión:
2
ESTATURA
1.5
0.5
0
0 10 20 30 40 50 60 70 80 90 100
PESO
Se determina que como el coeficiente de correlación está por debajo de 0.80, su correlación no es
buena. En cuanto al servicio de urgencias, evidenciamos que la relación entre el peso y la estatura
no es proporcional por lo tanto no es confiable.
8
CONCLUSIONES
Por medio de esta actividad pudimos identificar que, para manejar los diferentes tipos de
variables, es necesario realizar un diagrama de dispersión, el cual nos permitió aplicar los
conceptos vistos como fórmulas de relación y correlación. La herramienta Excel nos suministró
las ecuaciones y datos para obtener un resultado.
Estos ejercicios nos mostraron los tipos de asociación ente variables y el grado de correlación
entre las mismas.
9
REFERENCIAS BIBLIOGRÁFICAS
http://www.fao.org/docrep/003/X6845S/X6845S02.htm
http://estadisticadescriptivaunad100105.blogspot.com.co/
10
ANEXO: LABORATORIO REGRESIÓN Y CORRELACIÓN LINEAL.
X (sal) Y (Tensión)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120
11
b. Encuentre el modelo matemático que permite predecir el efecto de una variable
sobre la otra. ¿Es confiable?
se determina que es confiable porque están unidos tanto x como y, y además
con base a su resultado, 𝑅 2 es uno(1)
por lo cual se tiene un grado de alta confiabilidad, tiene un grado de correlacion
excelente
y=6,1062x+88,128 &
2
𝑅 = 0,9877
12
2014 registros de temperatura y consumos de vapor.
Consumo de vapor
Mes Temperatura (F)
(Lb)
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98
13
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las
variables.
14
c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.
El porcentaje de explicación del modelo esta dado por la representación porcentual del
coeficiente de determinación.
R² * 100 %
= 0.1508 * 100%
= 15.08%. El grado de relación de las dos variables esta dado por la raíz cuadrada del
coeficiente de determinación así
√(R²) = √(0.1508)
0,38 * 100 % = 38%, lo cual nos indica están relacionadas entre sí en un 38%. Debido
a que el coeficiente de correlación está por debajo de de 0.80 su correlación no es buena.
15
Año PIB Nación Ventas de la compañía
2001 1,70 339,43
2002 2,50 363,02
2003 3,90 359,75
2004 5,30 336,90
2005 4,70 339,38
2006 6,70 348,40
2007 6,90 372,00
2008 3,50 358,79
2009 1,70 337,94
2010 4,00 357,32
2011 6,60 342,14
2012 4,00 327,84
2013 4,90 362,06
2014 4,40 348,80
2015 3,10 353,52
2016 2,00 355,40
2017 1,80 342,00
16
Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.
a. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la
otra. ¿Es confiable?
Altura
N° Peso (kg)
(cm)
1 150 61
2 143 63
3 146 60
4 160 74
5 143 58
6 145 63
7 149 64
8 158 74
9 150 74
10 150 66
11 153 63
12 151 61
13 151 64
14 147 69
15 142 64
16 164 77
17 162 76
18 163 80
19 152 79
20 144 68
18
a) Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.
b) Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable? El modelo matemático que nos permite predecir una variable sobre la
otra es y = 0.746x - 44.863 R² = 0.5583, como R² está alejado de 1 no es confiable ya que
los datos de y son dispersos con respecto a x.
19
d) ¿Cuál es el peso esperado de un estudiante que mide 172 cm? y = 0.746(172)- 44.863 =
49.408 - 22.751 = 83.449 Kg.
Estatura
Peso (Kg)
(cm)
120 24
124 23
107 19
118 24
112 21
110 19
115 22
104 16
110 20
116 23
30
Peso (Kg)
25
20
15
10
90 95 100 105 110 115 120 125 130
Estatura (cm)
La variable independiente (x) es la estatura (cm) y la dependiente (y) es el peso (Kg),
el tipo de asociación es lineal.
20
b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable? El modelo matemático que permite predecir el efecto de una variable
sobre la otra es Y=a + bX; y = 0.386x - 22.751, R² = 0.8329.
d. ¿Cuál es el peso que debería tener un estudiante que mida 128 cm? y = 0.386(128)- 22.751
= 49.408 - 22.751 = 26.657 Kg.
y (umbral de reflejo
% Sobrepeso de flexión
nociceptiva)
89 2.00
90 3.00
75 4.00
30 4.50
51 5.50
75 7.00
62 9.00
45 13.00
90 15.00
20 14.00
21
y = -0.0629x + 11.642
Gráfico de Dispersión R² = 0.1115
16.00
umbral de reflejo de flexión
14.00
12.00
nociceptiva
10.00
8.00
6.00
4.00
2.00
0.00
0 20 40 60 80 100
% Sobrepeso
a) Realice el diagrama de dispersión y determine el tipo de asociación entre las variables. el
tipo de asociación es lineal.
b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable? El modelo matemático que permite predecir el efecto de una variable
sobre la otra es Y=a + bX; y = -0.0629x + 11.642, R² = 0.1115. como R² está muy alejado
de 1 no es confiable ya que los datos de y son dispersos con respecto a x.
El grado de relación de las dos variables esta dado por la raíz cuadrada del coeficiente de
determinación así √(R²) = √(0.1115) = 0.33 cuya representación porcentual sería de 0.33 *
100 % = 33%, lo cual nos indica están relacionadas entre sí en un 33%. Debido a que el
coeficiente de correlación está por debajo de 0.40 su correlación no es buena.
22
d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de
sobrepeso, de 40? y = -0.0629(40) + 11.642 = -2.516 + 11.642 = 9.126 %
X
Hidrocarbur Y
os Pureza
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
23
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.
100
98
96
PUREZA
94
92
90
88
86
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8
HIDROCARBUROS
24
d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es
igual a 91,3?
y = 14,947x + 74,283
x = (y - 74,283) / 14,947
x = (91,3 - 74,283) / 14,947
x = 1,14 (Porcentaje de hidrocarburo)
1.5. Tem-Vapor. El número de libras de vapor (y) consumidas mensualmente por una
planta química, se relaciona con la temperatura ambiental promedio (en o F). Para el
año 2014, se registraron los siguientes valores de temperatura y consumo anual.
Consumo
Temperatu
Mes de vapor
ra (F)
(Lb)
Ene 21 185,79
Feb 24 214,47
Mar 32 288,03
Abr 47 424,84
May 50 455
Jun 59 539
Jul 68 621,55
Ago 74 675,06
Sep 62 562,03
Oct 50 452,93
Nov 41 369,95
Dic 30 273,98
25
y = 9.2087x - 6.3184
DIAGRAMA DE DISPERSIÓN
R² = 0.9999
800
700
CONSUMO DE VAPOR
600
500
400
300
200
100
0
0 10 20 30 40 50 60 70 80
TEMPERATURA
26
1.8. %-Umbral. Los investigadores están estudiando la correlación entre la obesidad y
la respuesta individual al dolor. La obesidad se mide como porcentaje sobre el peso
ideal (x). La respuesta al dolor se mide utilizando el umbral de reflejo de reflexión
nociceptiva (y) que es una medida de sensación de punzada. Obsérvese que ambas, X
e Y, son variables aleatorias
umbral de
%
reflejo de
Sobrepes
flexión
o
nociceptiva
89 2,00
90 3,00
75 4,00
30 4,50
51 5,50
75 7,00
62 9,00
45 13,00
90 15,00
20 14,00
27
y = -0.0629x + 11.642
DIAGRAMA DE DISPERSIÓN R² = 0.1115
16.00
UMBRAL DE REFLEJO DE FLEXIÓN
14.00
12.00
10.00
NOCICEPTIVA
8.00
6.00
4.00
2.00
0.00
0 20 40 60 80 100
% SOBREPESO
28