2016 tp5 R y C
2016 tp5 R y C
2016 tp5 R y C
Cátedra ESTADISTICA
TRABAJOS PRÁCTICOS
2016
Facultad de Ingeniería
Universidad Nacional de La Patagonia S. J. B.
Comodoro Rivadavia
CONSIGNA PARTICULAR:
Se recomienda atender especialmente a cuáles conceptos aprehendidos con
adecuada.
2 REGRESIÓN Y CORRELACIÓN -
U.N.P.S.J.B. – FACULTAD DE INGENIERÍA – Cátedra de ESTADÍSTICA – 2016-
EJERCICIOS:
1.- . Qué tipo de análisis realizaría con los siguientes pares de variables? Justifique su
respuesta, aclarando su objetivo.
a) Se hace un estudio sobre la antigüedad en años de los automotores de una
marca determinada y se piensa que la cantidad de nafta que consumen cada 100 km
depende de la antigüedad de los vehículos de esa marca.
b) Se toma una muestra de 15 personas y en cada una de ellas se mide el
tamaño del perímetro encefálico y se observa el éxito en la vida.
c) Se tiene una distribución estadística bidimensional que representa el precio
del kg de pan en $ y el consumo mensual en kg.
d) Se tienen datos sobre la velocidad de un río y la profundidad en distintos
puntos del mismo. Se desea analizar:
*)si la velocidad está relacionada en forma directa con la profundidad.
**)si existe relación entre las variables y cuál es la fuerza de esta relación.
3. -. Una compañía de productos químicos desea estudiar los efectos que el tiempo de
extracción tiene en la eficiencia de una operación de extracción, obteniéndose los datos
que aparecen en la siguiente tabla:
Tiempo de Extracción Eficiencia de Extracción
(minutos) %
57 27
64 45
80 41
46 19
62 35
72 39
52 19
77 49
57 15
68 31
a) Dibuje un diagrama de dispersión para verificar que una línea recta se ajustará
relativamente bien a los datos, bosqueje una línea recta a ojo, y con ella prediga en forma
aproximada la eficiencia en la extracción que puede esperarse cuando el tiempo de
extracción es de 55 minutos.
b) Ajuste una línea recta a los datos dados con el método de los mínimos cuadrados y
utilícela para predecir ahora concretamente la eficiencia de extracción que puede
esperarse cuando el tiempo de extracción es de 55 minutos.
REGRESIÓN Y CORRELACIÓN - 3
U.N.P.S.J.B. – FACULTAD DE INGENIERÍA – Cátedra de ESTADÍSTICA – 2016-
4. - Este ejercicio tiene algunos ítem resueltos, a fin de que en este momento aplique los
conceptos aprehendidos, completando lo que sea necesario y analizando y discutiendo
las cuestiones que se le presentan.
Para determinar la relación que existe entre el esfuerzo normal y la resistencia al corte del
suelo, se llevó a cabo un experimento con una caja de esfuerzo cortante, obteniéndose
los siguientes resultados:
Esfuerzo Normal 11 13 15 17 19 21
Resistencia 15.2 17.7 19.3 21.5 13.9 25.4
al corte 14.8 18.3 18.7 19.9 22.9 24.3
( kN/m2 ) 17.3 21.8 24.1 26.9
Datos: x = 260 x² = 4424 y = 322 y² = 6710.92 xy = 5398.4
c) Pruebe la hipótesis que crea más importante para decidir si continúa con el análisis del
problema de regresión. Concluya e interprete.
1) Ho : =0
H1 : 0
2) 0.05
b
3) v. p. : tn 2;
Sb
4)
Se2 Se2
S2b =
( x x 2 ) 2 x 2 ( x) 2 / n
S2e = 6,59 Se = 2,567 S b = 0.1820
4 REGRESIÓN Y CORRELACIÓN -
U.N.P.S.J.B. – FACULTAD DE INGENIERÍA – Cátedra de ESTADÍSTICA – 2016-
tcal = 4,58
1 x2
Sa = Se
n ( x x ) 2
Sa = 3.0248
Con una confianza de 95 %, podría decir que el intervalo (0,09 ; 13) encerraría al
verdadero valor de la ordenada al origen de la recta de regresión entre las variables
resistencia al corte y el esfuerzo normal . Esto es, con una confianza de 95 %, podría
decir que el intervalo (0,09 ; 13) encerraría al verdadero promedio de la resistencia al
corte, para un valor “cero” del esfuerzo normal, si esto tiene sentido.
h) ¿En qué condiciones es válido calcular e interpretar “r” ? Asuma las condiciones
necesarias y hágalo.
COMPLETE
5. - .La siguiente tabla indica cuántas semanas trabajó una muestra de seis personas en
una estación de inspección de automóviles y el número de unidades que cada uno
inspeccionó entre el medio día y las 2 P.M. en un día cualquiera:
REGRESIÓN Y CORRELACIÓN - 5
U.N.P.S.J.B. – FACULTAD DE INGENIERÍA – Cátedra de ESTADÍSTICA – 2016-
6. - Dados los siguientes gráficos de dispersión, indicar si entre las dos variables hay o no
correlación y asignar los valores de "r" dados a cada uno de ellos, según su criterio
6 REGRESIÓN Y CORRELACIÓN -
U.N.P.S.J.B. – FACULTAD DE INGENIERÍA – Cátedra de ESTADÍSTICA – 2016-
7
7
6
6 n=30
n=30
5 5
4 4
y
y
3 3
2 2
1
Figura b
Figura a 1
0
0
0 1 2 3 4 5
x 0 1 2 x 3 4 5
9
9
8 Figura d
8 n=30 7
7
6
6
5
y
5
y
4
4
3
3
2 2
figura c
n=30
1 1
0 0
0 1 2 3
x 4 5 6 0 1 2 3 x 4 5 6
8 6
7
5
6 Figura e
n=30
5
4
4
y
3
y
2
n=30 2
1
Figura f
0 1
0 1 2 x 3 4 5 6
0
0 1 2 x3 4 5 6
7. - Observe las figuras mostradas a continuación que corresponden a los mismos pares
de datos: ¿qué diferencias nota en cuanto al grado de asociación de las variables? ¿Por
qué sucede esto? Describa posible causas (pero no invente, sólo observe y razone)
Se tienen datos correspondientes a empresas A y B mezclados indiscriminadamente o
bien separados en dos estratos, según algún factor de estratificación .
REGRESIÓN Y CORRELACIÓN - 7
U.N.P.S.J.B. – FACULTAD DE INGENIERÍA – Cátedra de ESTADÍSTICA – 2016-
12
12
n=40
10
10 na=nb=20
8
Viscocidad
viscocidad
8
6
6
4
4
2 2
A B
0 0
0 2 4 6 8 10 0 2 4 6 8 10
Cantidad de impurezas Cantidad de impurezas
8
7 n=50
6
Viscocidad
5
4
3
2
1
0
0 1 2 3 4 5
Cantidad de im purezas
8 7
7 6
6 n=30 5 n=17
5 4
4 3
3
2
2
1
1
0
1 1,5 2 2,5 3 3,5 4
0
0 1 2 3 4 5
Figura 3
8 REGRESIÓN Y CORRELACIÓN -
U.N.P.S.J.B. – FACULTAD DE INGENIERÍA – Cátedra de ESTADÍSTICA – 2016-
5
n=30
4
y
2
0
0 1 2 x3 4 5 6
4,5
4 n=12
3,5
6
3 n=18
5
2,5
4
2
1,5 3
1 2
0,5
1
0
0 0,5 1 1,5 2 2,5 0
0 1 2 3 4 5 6
REGRESIÓN Y CORRELACIÓN - 9
U.N.P.S.J.B. – FACULTAD DE INGENIERÍA – Cátedra de ESTADÍSTICA – 2016-
11. - Retome el ítem c del Ejercicio Nº 4 y / o el ítem a del ejercicio Nº 9 y realice las
siguientes actividades:
a) Diga si cree coherente encontrar un I.C. para la pendiente poblacional que tenga
límite superior negativo. ¿Por qué?
b) Diga si cree coherente encontrar un I.C. para la pendiente poblacional que tenga
límite inferior negativo y límite superior positivo. ¿Por qué?
PRUEBA DE CONCEPTOS:
1) Dado y = 6 + 5x. Señale sin calcular cuáles intervalos podrían tener sentido:
5.5 < < 6.5 -5 < <-4 4.8 < <5.2 -5 < < 5
2) Asigne los valores 0.43; 0.72; 0.97 y 1 a los coeficientes de correlación de las
siguientes distribuciones bidimensionales:
5
6
5
4
4 3
3 2
2 1
1
0
0 2 4
0
0 0, 5 1 1, 5 2 2, 5 3 3, 5 4 4, 5 5
3, 5 n=12
4
3
2, 5 3
2
2
1, 5
1
1
0, 5
0
0 1 2 3
0
0 0, 5 1 1, 5 2 2, 5
AUTOEXÁMEN
10 REGRESIÓN Y CORRELACIÓN -
U.N.P.S.J.B. – FACULTAD DE INGENIERÍA – Cátedra de ESTADÍSTICA – 2016-
2) Está de acuerdo o no con la siguiente afirmación: “si no existe una relación lineal, el
coeficiente de correlación será cero, pero un coeficiente de correlación cero no
significa que no existe ninguna relación”.
3) ¿Qué diferencias y semejanzas encuentra entre regresión y correlación?
4) ¿Qué significa coeficiente de determinación y que significa coeficiente de correlación?
5) ¿Por qué se interesan los estadísticos frecuentemente en la pregunta ¿es = 0?
¿Indica la magnitud de qué tan bien pueden hacerse las predicciones? Discuta.
6) ¿Es en la ecuación de regresión un parámetro significativo en todos los casos?
(recuerde la interpretación del ítem “e” del ejercicio: 4 ¿Cuál sería el significado de =
0? ¿Podría ser su estimador “a” menor que cero si la variable y es, por ejemplo, una
“longitud”?
7) ¿Cómo mide el coeficiente de correlación la fuerza de la relación lineal entre dos
variables?
8) ¿Qué valor toma r si todos los puntos muestrales caen sobre la misma recta y si
a) la recta tiene pendiente positiva?
b) La recta tiene pendiente negativa?
OTRAS PREGUNTAS INTERESANTES:
REGRESIÓN Y CORRELACIÓN - 11