E09 Andeva P01
E09 Andeva P01
E09 Andeva P01
3
Que tiene que decidir qué y cuánto de cada producto
debe fabricar en los próximos seis meses considerando:
el costo de la materia prima, el consumo de
combustibles, el tiempo de proceso, las presentaciones,
el gasto en mano de obra .
Considerando el ingreso neto de cada producto y las
restricciones operativas de la fábrica y el mercado.
Para formar criterio analiza el conjunto de ecuaciones
lineales que representan la operación de la empresa.
4
Que debe entregar un estudio de mercado para una
nueva presentación de un producto con mucha
competencia.
En su estudio de factibilidad incluye un análisis de
Fortalezas y Oportunidades, Debilidades y Amenazas
conocido por sus siglas FODA modificado, en el que
incluye calificaciones y valores métricos.
Para auxiliarse en sus recomendaciones utiliza
modelos lineales para determinar los “puntos
calientes” del estudio.
5
Que debe programar las compras de equipo, materiales y
medicinas para las clínicas de la Seguridad Social de país
considerando: precios, calidades, presentaciones y otras
variables relacionadas con los equipos, materiales y
medicinas.
Debe además, considerar los presupuestos de compras de
cada una de las clínicas, los presupuestos de gastos y
prioridades de uso.
Para las prospectivas utiliza un modelo de simulación que
incluye ecuaciones lineales.
6
Que debe estudiar el impacto que tendría abrir una zona
franca en una región ecológicamente rica para no
convertirla en una “zona caliente”.
Por una parte debe estudiar el hábitat de las especies
endémicas. Y por otra, los análisis de factibilidad que los
especialistas en desarrollo urbano, económico e industrial
han considerado para promover la apertura de una zona
franca.
Para el análisis utilizará ecuaciones lineales.
7
En los ejemplos anteriores se presenta una constante:
Un conjunto de variables que pueden interactuar o no en su
relación sobre una o varias variables que reflejan el resultado
sobre el objetivo de estudio. En donde es posible:
Al establecer un ordenamiento específico:
Del lado izquierdo de una igualdad las variables
consecuentes;
Del lado derecho las variables influyentes separadas por
un signo de suma que indica que los efectos son aditivos.
Lo esencial para una o un sistema de Ecuaciones Lineales.
8
El modelo lineal toma la forma genérica:
y y b X X1 b X X 2 ... b
2 2 2 2 2 2
i 1 1i 2 2i p pi
i 1 i 1 i 1 i 1 i 1
i 1
T o ta l n -1 SCT
12
El Objetivo de esta charla es introducir al estudiante en el
uso de los Modelos Lineales en:
Técnicas de Regresión:
Técnicas de Experimentación Planificada;
Y Técnicas de Muestreo.
Todas relacionadas con la incertidumbre aleatoria.
Otra sección muy importante de la estadística se refiere al
uso de los Modelos Lineales en la Optimización de Recursos,
área de estudio más relacionada con la Investigación de
Operaciones que se ve en otra unidad de estudio.
13
La Mecánica de la charla incorpora, en este momento, el uso de un
Libro Electrónico E09_ANDEVA_X01.xls, herramienta que
permitirá mostrar a los estudiantes que la teoría no está en la cabeza
del profesor o plasmada en los libros.
Se mostrará, que el avance de la ciencia, en este caso la Estadística
con todas las complicaciones que se le achacan, puede tener un uso
práctico sí, se es capaz, de aplicar razonamientos simples
transformados en instrucciones para el Programa Gestor de la Hoja
Electrónica, instrumento que responderá con resultados de
operaciones, en ocasiones muy complejas que se resuelven mediante
algoritmos internos.
Se verá que la aplicación teórica a los resultados no se desvirtúa por
lo que implica hacer cálculos paso a paso, trabajo que se le deja a la
HE quién los resuelve sin que el estudiante se entere.
14
Marte 2004
15
El Modelo Lineal más simple definido por:
yi b0 b1 xi i
O por:
yi y b1 xi x i
y i y xi x
SCXY
b1 i 1
n
SCX
x
i 1
i x
2
16
Para iniciar la discusión del ANDEVA es conveniente utilizar
La Técnica de Regresión Simple cuyo modelo tiene una única
variable inductora X para:
Deducir el comportamiento de Y la variable reflectora
(dominio de la función) cuando se utiliza para explorar
poblaciones;
O para inducir acciones cuando el comportamiento de
la variable Y refleja (rango de la función) a acción de
Factores en Técnica de experimentación planificada.
En todos casos, usualmente se utilizará la inferencia que
resulte de una muestra. 17
La hipótesis estadística que debe valorarse en la Regresión
Simple es:
Determinar sí El Modelo Lineal aproxima convenientemente
el comportamiento de la variable Y, sujeto del análisis.
Considerando la forma alternativa del modelo lineal
yi y b1 xi x i
y y b x x yi b0 b1 xi
2 2 2 2
i 1 i
i 1 i 1 i 1
O en su forma Explícita:
SCY SCR SCE
O en su forma Proporcional:
1 r 2 (1 r 2 )
Es evidente que entre mayor sea r2 más será la aproximación
del Modelo Lineal al conjunto de datos
19
Es evidente que entre mayor sea r2, la proporción de
variación explicada es mayor el argumento para rechazar la
hipótesis nula Ho; b1 = 0.
La Teoría Estadística ha desarrollado, para estos casos, la
prueba de F (de Fisher). Que consiste en ubicar en la
Distribución de Probabilidad de F, la cantidad de
probabilidad desde el punto que determina la variable
resultante de dividir dos varianzas, hasta infinito. La
cantidad de probabilidad así medida se llama nivel de
significación o nivel y a la probabilidad complementaria 1
- nivel de seguridad o nivel de confianza, que viene desde 0
hasta el punto usado como criterio, ambas con respecto a la
hipótesis nula. 20
En el modelo de regresión hay dos parámetros, b0 y b1, por tanto, la
varianza de regresión tiene 1 grado de libertad, esto es:
SCR
CMR r 2 SCY
1
En la varianza del error intervienen n observaciones de las que se restan
los dos coeficientes de regresión o restricciones paramétricas, por tanto
tendrá n – 2 grados de libertad.
SCE (1 r 2 ) SCY
CME
n2 n2
El cociente de F calculado es por tanto:
CMR (n 2)r 2
Fc
CME 1 r 2 21
Todo estudio estadístico lleva implícito que, los responsables han
analizado las consecuencias de Aceptar o Rechazar una Hipótesis Nula y
con esta base definido el nivel de confiabilidad que se usará en las pruebas
de significación.
Distribución de probabilidad de F
El Gráfico esquematiza una
prueba de F con un nivel de 1,20 Zona de Aceptación de la
hipótesis nula. O Zona de
significación 5%. La regla de 1,00
Confianza 95%
Probabilidad
función de la HE indica un delim ita las zonas de
0,60 decisión: 4,351
nivel inferior o igual a 0,05 se
rechaza la hipótesis. O bien, 0,40
F(Fc; 1; 20)
Zona de Rechazo de la
hipótesis nula. O zona de
si el valor calculado de F es 0,20
significación 5%
2,4
3,0
4,2
4,8
5,4
6,6
7,2
9,0
9,6
0,0
1,8
3,6
6,0
7,8
8,4
Valores de F Calculada
grados de libertad en el
cociente de las varianzas. 22
En la escuela de Zootecnia de la Universidad de Costa Rica se
efectuó un experimento planificado en una granja avícola en
pollos de raza para carne. Uno de los objetivos era:
Obtener un promedio de libra de carne por libra de
alimento consumido.
Los resultados son promedios de 22 jaulas que tenían 10
pollos cada una.
La hipótesis nula dice que el peso de los pollos no está
relacionado con el consumo de alimento, esto es:
Ho; b1 = 0
Con un nivel de significación de 0,05 o 5%, para las pruebas.
23
Para construir un ANDEVA de Regresión Simple paso a paso
debe obtener los siguientes estadísticos:
Promedio de Y.
n
y i
1,425 2,603 ... 1,945
y i 1
2,391
n 22
Promedio de X.
n
x i
37,233 43,136 ... 47,077
x i 1
43,666
n 22
Suma de Cuadrados de Y:
n
SCY yi y 1,425 - 2,391 2,603 - 2,391 ... 1,945 - 2,391 5,670
2 2 2 2
i 1
24
El ANDEVA SCX; SCXY y Coeficiente b1
Suma de Cuadrados de X.
n
SCX xi x 37,233 - 43,666 43,136 - 43,666 ... 47,077 - 43,666 264,866
2 2 2 2
i 1
27,709
x i x yi y
SCXY 27,709
b1 i 1
n
0,1046
SCE 264,866
x
i 1
i x
2
25
En ANDEVA Coeficiente bo CME y Desviación Estándar.
y b
i 1
i 0 b1 xi 1,425 - - 2,177 0,1046 37,233 ... 1,945 - 2,177 0,1046 47,077
2 2
2,7716
b0 0 b0 2,177
t b 0; n 2 ; 2 - 2,1730
S B0 1 x 2
1 43,666 2
SE n
0,3723
n 22 264,866
ix x 2
i 1
i 1
Total 21 5,670
Promedio de Y 2,3909
Desviación Estándar 0,3723
Coeficiente de variación 15,57%
Coeficiente de Correlación 71,50%
Coeficiente de Determinación 51,12%
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,7150
Coeficiente de determinación R^2 0,5112
R^2 ajustado 0,4868
Error típico 0,3723
Observaciones 22
ANÁLISIS DE VARIANZA
Fuente de Grados de Suma de Cuadrados Cocinete de Probabilidad Límites Significantes
Variación Libertad Cuadrados Medios F. Calculada Significante P( 0,05) P(0,01)
Regresión 1 2,8988 2,8988 20,9180 0,00018 4,3513 8,0960
Residuos 20 2,7716 0,1386
Total 21 5,6703
32
33
Marte 2004
El Modelo Lineal más simple que se utiliza en experimentos
planificados es el denominado Diseño Completo al Azar. En
donde el Objeto de la experiencia es un Factor con más de un
Nivel de Aplicación o Tratamientos.
Es también, el tránsito entre el Modelo de Regresión Simple y
el Modelo Experimental, pues como de verá, el ANDEVA se
puede realizar con la rutina de Regresión de la HE.
Aun cuando Los Modelo utilizados en la Experimentación
planificada son un refinamiento del Modelo de Regresión
tienen, al menos, una forma tradicional de ser presentados
que requiere un poco de discusión.
34
El Modelo Lineal en Experimentos Planificados.
35
Una empresa que fabrica estructuras de lámina galvanizada, quiere
incursionar en estructuras preformadas para tejados.
El departamento de control de la calidad está efectuando pruebas de
resistencia tratando de ubicar el punto óptimo de carbono agregado a
la colada del hierro.
Uno de los ensayos proporcionó los resultados mostrados en el cuadro
como unidades de resistencia a la tensión.
Porcentaje de carbono
Repetición 0,1 0,2 0,3
1 25 40 34
2 28 31 37
3 25 27 37
4 22 40 39
5 23 43 32
6 31 35 38
Sumas T 154 216 217
36
El ANDEVA Suma de cuados Total y de Tratamientos.
SCT
t 1 ST2 3 11.302,3333
434,1111_
r 6 37
El ANDEVA Cuadrado Medio de Tratamientos, del Error; F calculada.
El Cociente de F.
CMT 217,0556
Fc 11,7046
CME 18,5444
38
Finalmente de valora la F calculada mediante la rutina de la HE:
11,7046
F ( Fc; 2; 15) f (11,7046; 2; 15)dx = DISTR.F(11,7046;2 ;15) 0,0009
0
39
La HE proporciona una rutina para el cálculo del
ANDEVA para un Factor con la siguiente salida.
Análisis de varianza de un factor
RESUMEN
Grupos Cuenta Suma Promedio Varianza
0,1 6 154 25,6666667 11,06666667
0,2 6 216 36 37,6
0,3 6 217 36,1666667 6,966666667
ANÁLISIS DE VARIANZA
Fuente de Suma de Grados de Cuadrados Cocinete de Probabilidad Límites Significantes
Variación Cuadrados Libertad Medios F. Calculada Significante P( 0,05) P(0,01)
Entre grupos 434,1111 2 217,0556 11,7046 0,0009 3,6823 6,3588
Dentro de los grupos 278,1667 15 18,5444
Total 712,2778 17
i 1 j 1
y ij
2
y
SCT b1
2
r
i 1
X 12
i b2
2
r
i 1
X 2 i SCE
X 1i t i t
Tal que la suma de X1i = 0 y la suma de (X1i)2 sea mínima. Para esto, se
tiene que encontrar el escalar que haga mínimo al polinomio:
Promedios Sinificativos
Niveles de Carbón
Es evidente que la dureza aumenta
0,2
a medida que se aumenta el
contenido de carbón en la colada, 0,1
43
Para obtener los coeficientes de regresión de los contrastes se arreglan los
datos según lo requiere el modelo de diapositiva 41 y solicitamos en la HE
la Regresión para obtener el ANDEVA:
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,7807
Coeficiente de determinación R^2 0,6095
R^2 ajustado 0,5574
Error típico 4,3063
Observaciones 18
ANÁLISIS DE VARIANZA
Fuente de Grados de Suma de Cuadrados Cocinete de Probabilidad Límites Significantes
Variación Libertad Cuadrados Medios F. Calculada Significante P( 0,05) P(0,01)
Regresión 2 434,1111 217,0556 11,7046 0,0009 3,6823 6,3588
Residuos 15 278,1667 18,5444
Total 17 712,2778
44
El modelo significativo de los valores sin transforma es:
yij 5,1667 255,8333 0,25 508,3333 0,25 2 37,4_
45
Grafico Significativo
40,0
Para presentar los resultados es 38,0
Resistencia
Máxim a 37,4
% de Carbono
34,0
determinantes. 22,0
20,0
0,10 0,12 0,14 0,16 0,18 0,20 0,22 0,24 0,26 0,28 0,30
Resistencia a la tensión
50
Factor Operativo:
La presentación, con todo y que se empaque por las mismas
máquinas puede considerase como factor de variación sin el cual no
podría llevarse a cabo la experiencia.
Factor Objetivo:
El porcentaje de cada producto en los envases con 5 niveles con un
valor de 20% para cada producto.
El Método de Análisis:
Se usará diseño de dos Factores en Bloques Aleatorios.
Nivel de Confianza:
El 95% o un coeficiente de significación de 5%.
Hipótesis Nula:
Todos los tratamientos son iguales: Ho; Ti = 0. 51
De acuerdo al objetivo de la experiencia, habrá una
composición homogénea del producto si cada envase contiene
un 20% de cada una de las hojuelas. En otras palabras, se
espera aceptar la hipótesis nula. El Modelo Lineal que se va a
usar para valorar la experiencia es:
yij y.. Ti B j Eij
SCT
t 1 ST2 5 1 24,4280
24,4280
b 4
Total 253,4080 19
Media 58,94 60,88 67,65 58,70 64,47 65,26 62,30 59,79 60,24
Error típico 4,2608 4,2874 3,9664 5,6780 4,4940 5,4305 4,7907 3,6977 5,2791
Mediana 57,95 62,05 70,37 59,49 64,62 69,675 61,47 58,37 54,52
Moda ---- ---- ---- ---- ---- ---- ---- ---- ----
Desviación estándar 18,0770 19,6475 15,3617 21,9906 16,8150 18,8119 16,5953 18,4887 21,1164
Varianza de la muestra 326,7779 386,0252 235,9827 483,5880 282,7451 353,8894 275,4049 341,8320 445,9041
Curtosis -1,3671 -1,0158 0,4070 -1,3971 -0,5807 -0,3971 -0,6329 -0,6034 -1,6459
Coeficiente de asimetría 0,1607 0,3256 -0,8193 -0,0369 -0,3342 -0,6995 -0,2985 0,3366 0,2614
Rango 52,51 63,39 55,59 63,31 54,88 60,69 54,22 69,27 61,45
Mínimo 33,98 31,29 33,32 28,11 35,3 28,74 31,62 28,2 30,47
Máximo 86,49 94,68 88,91 91,42 90,18 89,43 85,84 97,47 91,92
Suma 1060,86 1278,51 1014,75 880,47 902,64 783,15 747,57 1494,87 963,84
Cuenta 18 21 15 15 14 12 12 25 16
64
Es lógico pensar que un “buen” estimador de la varianza entre grupos los
sea el promedio ponderado de las varianzas. En términos de Sumas de
Cuadrados para usar la igualdad: SCY = SCG + SCE.
9
SCE ni 1 S i2
i 1
Finalmente:
SCG SCY SCE 20.046,9289 48.840,1723 1.206,7566
Cálculos resumidos en el cuadro del ANDEVA
65
ANÁLISIS DE VARIANZA
Fuente de Grados de Suma de Cuadrados Cocinete de Probabilidad Límites Significantes
Variación Libertad Cuadrados Medios F. Calculada Significante P( 0,05) P(0,01)
Total 147 50.046,9289
El ANDEVA indica que no hay motivos para dudar que todos los toros
presentan porcentajes de fertilidad similares sobre el 61,67%. Algo más
bajo que lo esperado. Esto es 1,6 ampollas de semen por fecundación exitosa
a la palpación aproximadamente entre 2 y 3 meses después de la
inseminación.
En la HE puede comprobar el resultado que obtuvo paso a paso.
66
En la toma de datos se tienen dos niveles o etapas de muestreo: primero
se llega a la finca y dentro de la finca se llega al toro. Este esquema se
estudia detalladamente en diseños de muestreo, en este caso, los cálculos
se muestran el la HE.
Cada anidamiento provoca un error que debe considerarse en la prueba
de F en donde el cuadrado medio del error de una clase es el cuadrado
medio de la clase siguiente.
ANDEVA ANIDADO EN TOROS DENTRO DE FINCAS.
Fuente de Grados de Suma de Cuadrados Cocinete de Probabilidad Límites Significantes
Variación Libertad Cuadrados Medios F. Calculada Significante P( 0,05) P(0,01)
Entre Fincas 5 3.015,9737 603,1947 1,7357 0,1487 2,4495 3,5138
Entre toros dentro
de fincas 40 13.900,5884 347,5147 1,0699 0,3841 1,5128 1,7931
Del ANDEVA se concluye que no hay efecto Entre Fincas dentro de toros
P(0,1487); ni efecto entre toros dentro de repeticiones P(0,3841). Por tanto, la
población puede tratarse como un todo. 67
Se han tratado aspectos relevantes del Análisis de Poblaciones mediante el
uso de Modelos Lineales y Las Sumas de Cuadrados que implican en un
método denominado Análisis de la Varianza, conocida universalmente por
sus siglas en los diferentes idiomas como ANDEVA.
Desde el más simple de la Regresión Lineal, pasando por modelos de uso en
la Investigación Planificada, para un Factor y para dos Factores, uno
Operativo y él otro Objetivo.
Se introdujo el concepto del Polinomio Mínimo y el contraste de
Tratamientos mediante Polinomios Ortogonales imbuidos en los niveles de
los factores. Y de cómo complementan al ANDEVA.
Finalmente, se mostró el uso del ANDEVA en las técnicas del muestreo.
Cada una de las áreas abordadas, integran apartados que la Teoría
Estadística trata por separado. Por tanto, la herramienta del ANDEVA se
puede estudiar específicamente en cada subárea.
68
La manera más consistente de aprender es practicando.
Es recomendable que el estudiante refuerce su conocimiento
reproduciendo los ejemplos que se han presentado con cambios
suficientes para variar resultados dejando fijos los procedimientos.
Si aun tuviera más interés solicite al profesor la Guía Autodidáctica
correspondiente a este capítulo.