0% encontró este documento útil (0 votos)
4 vistas69 páginas

E09 Andeva P01

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1/ 69

1

Especialista en café se ha orientado a valorar nuevas


variedades de cafetos para recomendar a los cafeteros de
Costa Rica.
Para cumplir los objetivos del estudio debe valorar entre
otras cosas: rendimiento, exigencias nutricionales,
resistencias a plagas y enfermedades, capacidades de
reproducción. Todo esto en las diferentes zonas cafeteras
del país y en al menos dos ciclos de cuatro años y una
poda.
Para ofrecer sus recomendaciones planifica sus
experiencias usando modelos lineales para el análisis de
resultados.
2
Del departamento de comercio exterior que explora
el aporte de productos básicos como: leche, huevos,
arroz, maíz, azúcar; para obtener estimaciones del
Producto Interno Bruto de los países desarrollados y
del propio País.
En el análisis de los datos utiliza modelos lineales
para conseguir prospectivas útiles que le faciliten
estimar el indicador nacional del PIB.

3
Que tiene que decidir qué y cuánto de cada producto
debe fabricar en los próximos seis meses considerando:
el costo de la materia prima, el consumo de
combustibles, el tiempo de proceso, las presentaciones,
el gasto en mano de obra .
Considerando el ingreso neto de cada producto y las
restricciones operativas de la fábrica y el mercado.
Para formar criterio analiza el conjunto de ecuaciones
lineales que representan la operación de la empresa.

4
Que debe entregar un estudio de mercado para una
nueva presentación de un producto con mucha
competencia.
En su estudio de factibilidad incluye un análisis de
Fortalezas y Oportunidades, Debilidades y Amenazas
conocido por sus siglas FODA modificado, en el que
incluye calificaciones y valores métricos.
Para auxiliarse en sus recomendaciones utiliza
modelos lineales para determinar los “puntos
calientes” del estudio.
5
Que debe programar las compras de equipo, materiales y
medicinas para las clínicas de la Seguridad Social de país
considerando: precios, calidades, presentaciones y otras
variables relacionadas con los equipos, materiales y
medicinas.
Debe además, considerar los presupuestos de compras de
cada una de las clínicas, los presupuestos de gastos y
prioridades de uso.
Para las prospectivas utiliza un modelo de simulación que
incluye ecuaciones lineales.
6
Que debe estudiar el impacto que tendría abrir una zona
franca en una región ecológicamente rica para no
convertirla en una “zona caliente”.
Por una parte debe estudiar el hábitat de las especies
endémicas. Y por otra, los análisis de factibilidad que los
especialistas en desarrollo urbano, económico e industrial
han considerado para promover la apertura de una zona
franca.
Para el análisis utilizará ecuaciones lineales.

7
En los ejemplos anteriores se presenta una constante:
Un conjunto de variables que pueden interactuar o no en su
relación sobre una o varias variables que reflejan el resultado
sobre el objetivo de estudio. En donde es posible:
Al establecer un ordenamiento específico:
Del lado izquierdo de una igualdad las variables
consecuentes;
Del lado derecho las variables influyentes separadas por
un signo de suma que indica que los efectos son aditivos.
Lo esencial para una o un sistema de Ecuaciones Lineales.
8
El modelo lineal toma la forma genérica:

yi  a0  a1 x1i  a2 x2i  ...  a p x p i   i


Es evidente que el comportamiento de la variable Y se verá
influido en tasas de incremento o decremento ai para cada
variable X.
Para el curso interesa que la variable Y sea de naturaleza
aleatoria, por esto se incluye el error i, mientras que las
variables X:
Pueden ser de naturaleza Aleatoria;
Pueden ser de naturaleza Factorial:
9
O pueden estar Determinadas por la Investigación.
EL problema de los modelo lineales se centra en determinar
cuál o cuáles tasas ai son determinantes en el resultado de la
variable Y utilizada para valorar el comportamiento del Sujeto
Experimentado bajo la influencia de la correspondiente
variable X.
La Teoría Estadística ha desarrollado una técnica de
valoración probabilística de Hipótesis Nulas establecidas
sobre los coeficientes ai en un modelo modificado como:
 X  X p     i2
n n n n n

 y  y  b  X  X1   b  X  X 2   ...  b
2 2 2 2 2 2
i 1 1i 2 2i p pi
i 1 i 1 i 1 i 1 i 1

Conocido como Igualdad de la Suma de Cuadrados, en la que


la parte aleatoria 2 o Suma de Cuadrados del Error
proporciona el criterio para las decisiones. 10
Son las siglas para el Análisis de la Varianza, es además el
concepto de una técnica para separar cada uno de los
componentes de la varianza total en términos de sumas de
cuadrados o sea: n

 iy  y  2

i 1

y valorar la Hipótesis Nula del coeficiente aj asociado a cada una


de las variables Xj.
Es evidente que las decisiones serán más sencillas y acertadas si
únicamente aquellas Variables Objetivo X que realmente hagan
evidente un cambio en la variable Y, usada para medir el
comportamiento del conjunto de sujetos experimentados o
explorados.
11
También, bajo el título de ANDEVA se conoce al cuadro resumen que
compendia la información de las fuentes de variación en un formato
simple y universal mostrada en un cuadro cuya forma puede cambiar de
una a otra Técnica de Análisis de los Modelos Lineales pero con el mismo
contenido: Las Fuentes de variación y el Criterio para valorar la
hipótesis nula:
Ho; EL MODELO NO EXPLICA EL COMPORTAMIENTO DE Y.

F u e n te d e la G rados de Sum as de C uadrados C rtite rio d e P ro b a b ilid a


V a ria c ió n L ib e rta d C uadrados M e d io s F C a lc u la d a Fc
S CR CM R
CM R  Fc  PF  Fc ; a  1; n  a 
D e l M o d e lo a -1 SCR a 1 CM E
SC E
CM E 
N o E x p lic a d a n -a SCE na

T o ta l n -1 SCT
12
El Objetivo de esta charla es introducir al estudiante en el
uso de los Modelos Lineales en:
Técnicas de Regresión:
Técnicas de Experimentación Planificada;
Y Técnicas de Muestreo.
Todas relacionadas con la incertidumbre aleatoria.
Otra sección muy importante de la estadística se refiere al
uso de los Modelos Lineales en la Optimización de Recursos,
área de estudio más relacionada con la Investigación de
Operaciones que se ve en otra unidad de estudio.
13
La Mecánica de la charla incorpora, en este momento, el uso de un
Libro Electrónico E09_ANDEVA_X01.xls, herramienta que
permitirá mostrar a los estudiantes que la teoría no está en la cabeza
del profesor o plasmada en los libros.
Se mostrará, que el avance de la ciencia, en este caso la Estadística
con todas las complicaciones que se le achacan, puede tener un uso
práctico sí, se es capaz, de aplicar razonamientos simples
transformados en instrucciones para el Programa Gestor de la Hoja
Electrónica, instrumento que responderá con resultados de
operaciones, en ocasiones muy complejas que se resuelven mediante
algoritmos internos.
Se verá que la aplicación teórica a los resultados no se desvirtúa por
lo que implica hacer cálculos paso a paso, trabajo que se le deja a la
HE quién los resuelve sin que el estudiante se entere.
14
Marte 2004
15
El Modelo Lineal más simple definido por:
yi  b0  b1 xi   i
O por:
yi  y  b1  xi  x    i

Que se obtiene resolviendo las Ecuaciones Normales:


b0  y  b1 x
Y n

 y i  y  xi  x 
SCXY
b1  i 1
n

SCX
 x
i 1
i  x
2

16
Para iniciar la discusión del ANDEVA es conveniente utilizar
La Técnica de Regresión Simple cuyo modelo tiene una única
variable inductora X para:
Deducir el comportamiento de Y la variable reflectora
(dominio de la función) cuando se utiliza para explorar
poblaciones;
O para inducir acciones cuando el comportamiento de
la variable Y refleja (rango de la función) a acción de
Factores en Técnica de experimentación planificada.
En todos casos, usualmente se utilizará la inferencia que
resulte de una muestra. 17
La hipótesis estadística que debe valorarse en la Regresión
Simple es:
Determinar sí El Modelo Lineal aproxima convenientemente
el comportamiento de la variable Y, sujeto del análisis.
Considerando la forma alternativa del modelo lineal
yi  y  b1  xi  x    i

La hipótesis se plantea desde el punto de vista del coeficiente


b1. Esto es:
Ho; B1  0
18
Adecuando la Ecuación de Sumas de Cuadrados de la
Diapositiva 10 al caso:
n n n

 y  y  b  x  x     yi   b0  b1 xi  
2 2 2 2
i 1 i
i 1 i 1 i 1

O en su forma Explícita:
SCY  SCR  SCE
O en su forma Proporcional:
1  r 2  (1  r 2 )
Es evidente que entre mayor sea r2 más será la aproximación
del Modelo Lineal al conjunto de datos
19
Es evidente que entre mayor sea r2, la proporción de
variación explicada es mayor el argumento para rechazar la
hipótesis nula Ho; b1 = 0.
La Teoría Estadística ha desarrollado, para estos casos, la
prueba de F (de Fisher). Que consiste en ubicar en la
Distribución de Probabilidad de F, la cantidad de
probabilidad desde el punto que determina la variable
resultante de dividir dos varianzas, hasta infinito. La
cantidad de probabilidad así medida se llama nivel de
significación o nivel  y a la probabilidad complementaria 1
-  nivel de seguridad o nivel de confianza, que viene desde 0
hasta el punto usado como criterio, ambas con respecto a la
hipótesis nula. 20
En el modelo de regresión hay dos parámetros, b0 y b1, por tanto, la
varianza de regresión tiene 1 grado de libertad, esto es:
SCR
CMR   r 2  SCY
1
En la varianza del error intervienen n observaciones de las que se restan
los dos coeficientes de regresión o restricciones paramétricas, por tanto
tendrá n – 2 grados de libertad.

SCE (1  r 2 )  SCY
CME  
n2 n2
El cociente de F calculado es por tanto:

CMR (n  2)r 2
Fc  
CME 1 r 2 21
Todo estudio estadístico lleva implícito que, los responsables han
analizado las consecuencias de Aceptar o Rechazar una Hipótesis Nula y
con esta base definido el nivel de confiabilidad que se usará en las pruebas
de significación.
Distribución de probabilidad de F
El Gráfico esquematiza una
prueba de F con un nivel de 1,20 Zona de Aceptación de la
hipótesis nula. O Zona de
significación 5%. La regla de 1,00
Confianza 95%

decisión es simple: Si la 0,80 Valor de la Fc que

Probabilidad
función de la HE indica un delim ita las zonas de
0,60 decisión: 4,351
nivel inferior o igual a 0,05 se
rechaza la hipótesis. O bien, 0,40
F(Fc; 1; 20)
Zona de Rechazo de la
hipótesis nula. O zona de
si el valor calculado de F es 0,20
significación 5%

menor a 4,351 rechace Ho. 0,00


Para una prueba con 1 y 20
0,6
1,2

2,4

3,0

4,2

4,8

5,4

6,6

7,2

9,0
9,6
0,0

1,8

3,6

6,0

7,8

8,4
Valores de F Calculada
grados de libertad en el
cociente de las varianzas. 22
En la escuela de Zootecnia de la Universidad de Costa Rica se
efectuó un experimento planificado en una granja avícola en
pollos de raza para carne. Uno de los objetivos era:
Obtener un promedio de libra de carne por libra de
alimento consumido.
Los resultados son promedios de 22 jaulas que tenían 10
pollos cada una.
La hipótesis nula dice que el peso de los pollos no está
relacionado con el consumo de alimento, esto es:
Ho; b1 = 0
Con un nivel de significación de 0,05 o 5%, para las pruebas.
23
Para construir un ANDEVA de Regresión Simple paso a paso
debe obtener los siguientes estadísticos:
Promedio de Y.
n

y i
1,425  2,603  ...  1,945
y i 1
  2,391
n 22
Promedio de X.
n

x i
37,233  43,136  ...  47,077
x i 1
  43,666
n 22

Suma de Cuadrados de Y:
n
SCY    yi  y   1,425 - 2,391   2,603 - 2,391  ...  1,945 - 2,391  5,670
2 2 2 2

i 1

24
El ANDEVA SCX; SCXY y Coeficiente b1

Suma de Cuadrados de X.
n
SCX    xi  x    37,233 - 43,666   43,136 - 43,666  ...   47,077 - 43,666  264,866
2 2 2 2

i 1

Suma de Productos Cruzados XY.


n
SCXY    xi  x  yi  y    37,233- 43,6661,425 - 2,391  ...   47,077 - 43,6661,945 - 2,391
i 1

 27,709

Coeficiente de la Pendiente b1:


n

 x i  x  yi  y 
SCXY 27,709
b1  i 1
n
   0,1046
SCE 264,866
 x
i 1
i  x
2

25
En ANDEVA Coeficiente bo CME y Desviación Estándar.

Coeficiente de la Intersectada b0:


b0  y  b1 x  2,391 - 0,1046  43,666  -2,177
Una vez que se obtiene el modelo se puede calcula la Suma de
Cuadrados del Error:
n

 y   b
i 1
i 0  b1 xi    1,425 -  - 2,177  0,1046 37,233   ...  1,945 -  2,177  0,1046 47,077 
2 2

 2,7716

En el ANDEVA de regresión se acostumbra ofrecer pruebas


sobre los coeficientes de regresión . Para esto debe
considerarse La Desviación Estándar del Modelo:
SCE 2,7716
SE   CME   0,3723
n2 22  2
26
El ANDEVA SCR, F calculada y Probabilidad de F.

El criterio para valorar la hipótesis se obtiene con la variable de F


calculada, para esto se debe obtener la Suma de Cuadrados de la Regresión:
n

 x  x   0,10462  264,866  2,899


2
SCR  b1
2
i
i 1

Estadístico con el que ya se puede obtener el cociente de F


Calculada:
CMR 2,899
Fc    20,918
CME 0,139

Y valorar la probabilidad que determina en la distribución


de F mediante la rutina de la HE:
20,918
P( Fc; 1; 20)   f (20,918; 1; 20)dx  0,00018
0
27
En ANDEVA Prueba de t para la Intersectada.

Los estimadores de los coeficientes del modelo de regresión


tienen una distribución normal alrededor de los parámetros.
Esto significa que se pueden valorar las hipótesis al comparar
variables estandarizadas con la Distribución Normal Estándar
o usando la Distribución de “t”. Para la intersectada:

b0  0 b0  2,177
t  b 0; n  2 ; 2     - 2,1730
S B0 1 x 2
1 43,666 2
SE  n
0,3723 
n 22 264,866

 ix  x  2

i 1

Valorado con la rutina de la HE:


201
2 ,173  t 2 2
F (  2,173 ; 20; 2)  Y0  f 1   dt  0,04197
0
 20 

Implica rechazar la hipótesis con una probabilidad de 4,20%. 28


El ANDEVA Prueba de t para la Pendiente.

La variable t para la pendiente b1:


b1  0 b1 0,1046
t ( b1;n2; 2)     4,5736
S b1 SE 0,3723
n
264,866

 ix  x  2

i 1

Valorada con la rutina de la HE:


201
4 , 5736  t 
2 2
F ( 4,5736 ; 20; 2)  Y0  f 1   dt  0,00018
0
 20 
En el caso de la Regresión Simple, las probabilidades de F
y de t son exactamente iguales. Nada extraño si se recuerda
que la distribución de F es una Distribución de
Probabilidad de variables t2
29
Todos los cálculos se acomodan en el cuadro del ANDEVA
para regresión tomado como base el de la diapositiva 12.
ANDEVA para regresión simple
Fuente de Grados de Suma de Cuadrados Cocinete de Probabilidad Límites Significantes
Variación Libertad Cuadrados Medios F. Calculada Significante P( 0,05) P(0,01)
Regresión 1 2,899 2,8988 20,9180 0,00018 4,3513 8,0960
Error 20 2,772 0,1386

Total 21 5,670
Promedio de Y 2,3909
Desviación Estándar 0,3723
Coeficiente de variación 15,57%
Coeficiente de Correlación 71,50%
Coeficiente de Determinación 51,12%

Información sobre los coeficientes de regresión


Coeficiente Error Estadístico Probabilidad Límites 95%
Variable Regresión Típico t Coeficiente Inferior Superior
Intersectada -2,1773 1,0019 -2,1730 0,04197 -4,2673 -0,0872
X 0,1046 0,022873581 4,5736 0,00018 0,0569 0,1523
30
La primera conclusión que indica el ANDEVA es que debe rechazarse la
Hipótesis Nula con un nivel de significación de 0,00018 o 0,018%. Dicho
de otra forma, el Modelo Lineal:
yˆ i  -2,1773  0,1046 x i 
Aproxima los datos con un nivel de confianza de 99,98%.
La intersectada se estima entre: Prb0  t 20; 0,05 S b0   0  b0  t 20; 0,05 S b 0   95%
Pr  4,2673   0  -0,0872  95%

Evidentemente, no pasa por el origen, como se dedujo con anterioridad.


La pendiente puede fluctuar entre: Prb1  t 20; 0,05 S b1  1  b1  t 20; 0,05 S b1   95%
Pr 0,0569  1  0,1523  95%
La conclusión de la regresión sería: Los pollos pesan más entre más
alimento consumen. Un kilo de alimento implica un aumento de peso que
puede ir de 60 a 150 gramos con una confianza del 95%.
31
Ya que se ha dado un repaso a la eoría para reafirmar conceptos, se está
en posición de interpretar el resumen del ANDEVA que ofrece la rutina
de la HE. Con los mismos valores que el elaborado paso a paso.
Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,7150
Coeficiente de determinación R^2 0,5112
R^2 ajustado 0,4868
Error típico 0,3723
Observaciones 22

ANÁLISIS DE VARIANZA
Fuente de Grados de Suma de Cuadrados Cocinete de Probabilidad Límites Significantes
Variación Libertad Cuadrados Medios F. Calculada Significante P( 0,05) P(0,01)
Regresión 1 2,8988 2,8988 20,9180 0,00018 4,3513 8,0960
Residuos 20 2,7716 0,1386
Total 21 5,6703

Coeficiente Error Estadístico Probabilidad Límites 95%


Variable Regresión Típico t Coeficiente Inferior Superior
Intercepción -2,1773 1,0019 -2,1730 0,0420 -4,2673 -0,0872
X 0,1046 0,0229 4,5736 0,0002 0,0569 0,1523

32
33
Marte 2004
El Modelo Lineal más simple que se utiliza en experimentos
planificados es el denominado Diseño Completo al Azar. En
donde el Objeto de la experiencia es un Factor con más de un
Nivel de Aplicación o Tratamientos.
Es también, el tránsito entre el Modelo de Regresión Simple y
el Modelo Experimental, pues como de verá, el ANDEVA se
puede realizar con la rutina de Regresión de la HE.
Aun cuando Los Modelo utilizados en la Experimentación
planificada son un refinamiento del Modelo de Regresión
tienen, al menos, una forma tradicional de ser presentados
que requiere un poco de discusión.
34
El Modelo Lineal en Experimentos Planificados.

El Modelo Lineal básico para los experimentos se define como:

yij  y..  Ti  Eij


Se usa indicar la observación con la notación yij para hacer ver que debe
considerarse como una repetición j dentro del tratamiento i.
La expresión Ti indica el efecto de un Factor dentro del modelo. Pero en
este, se incluye una Regresión Polinomial de grado t – 1, donde t es número
de niveles del factor o Tratamientos.
Y la expresión Eij indica que la aproximación que se hace mediante el
Modelo Experimental a una variable aleatoria, no podrá ser exacta, pues
hay fuentes de variación inherentes a la unidad experimentada ij que no
podrán ser explicadas por el Modelo usado en la aproximación.

35
Una empresa que fabrica estructuras de lámina galvanizada, quiere
incursionar en estructuras preformadas para tejados.
El departamento de control de la calidad está efectuando pruebas de
resistencia tratando de ubicar el punto óptimo de carbono agregado a
la colada del hierro.
Uno de los ensayos proporcionó los resultados mostrados en el cuadro
como unidades de resistencia a la tensión.
Porcentaje de carbono
Repetición 0,1 0,2 0,3
1 25 40 34
2 28 31 37
3 25 27 37
4 22 40 39
5 23 43 32
6 31 35 38
Sumas T 154 216 217
36
El ANDEVA Suma de cuados Total y de Tratamientos.

Son pocos los cálculos para llevar a cabo un Análisis de la


Varianza paso a paso de la manera tradicional adaptada a las
facilidades de la HE. Lo primero a considerar son:
La cantidad de tratamientos o niveles del factor: t = 3
Las veces que se repite cada tratamiento: r = 6
La Suma de Cuadrados del Total:

SCY   t  r  1 SY2   3  6  1 41,8987  712,2778

La Suma de Cuadrados del Tratamientos o del Factor:

SCT 
 t  1 ST2  3  11.302,3333
  434,1111_
r 6 37
El ANDEVA Cuadrado Medio de Tratamientos, del Error; F calculada.

El Cuadrado Medio de Tratamientos:


SCT ST2 1.320,3333
CMT     217,0556
t 1 r 6

La Suma de Cuadrados del Error se obtiene por diferencia:


SCE  SCY  SCT  712,2778 - 434,1111  278,1667

El Cuadrado Medio del Error :


SCE 278,1667
CME    18,5444
nt 18  3

El Cociente de F.
CMT 217,0556
Fc    11,7046
CME 18,5444

38
Finalmente de valora la F calculada mediante la rutina de la HE:
11,7046
F ( Fc; 2; 15)   f (11,7046; 2; 15)dx = DISTR.F(11,7046;2 ;15)  0,0009
0

Con lo que se concluye el ANDEVA.


El resultado indica que la probabilidad de que las diferencias de la
resistencia a la tensión de las estructuras de metal se deban al azar es de
0,0009 0 0,09%, o nivel de significación.
Se puede interpretar considerando el nivel de confianza diciendo:
Se concluye que el porcentaje de carbón agregado al metal produce
estructuras de de diferente dureza con una confiabilidad de 99,91%

39
La HE proporciona una rutina para el cálculo del
ANDEVA para un Factor con la siguiente salida.
Análisis de varianza de un factor

RESUMEN
Grupos Cuenta Suma Promedio Varianza
0,1 6 154 25,6666667 11,06666667
0,2 6 216 36 37,6
0,3 6 217 36,1666667 6,966666667

ANÁLISIS DE VARIANZA
Fuente de Suma de Grados de Cuadrados Cocinete de Probabilidad Límites Significantes
Variación Cuadrados Libertad Medios F. Calculada Significante P( 0,05) P(0,01)
Entre grupos 434,1111 2 217,0556 11,7046 0,0009 3,6823 6,3588
Dentro de los grupos 278,1667 15 18,5444

Total 712,2778 17

Queda el problema de decidir ¿cuál nivel de carbón es el


adecuado?
40
El Modelo de la diapositiva 35 puede escribirse:
yˆ i  y..  b1 X 1i  b2 X 2 i  Eij
En donde: Ti  b1 X 1i  b2 X 2 i  Eij

Y las Sumas de Cuadrados como:


 2
 
t r t t


i 1 j 1
y ij
2
 y  

SCT  b1 
2
r
i 1
X 12
i b2 
2
r
i 1
X 2 i   SCE

En donde X1 = [-1; 0; 1] y X2 = [1; -2; 1], polinomios


mínimos transformados de los niveles de los tratamientos
para efectuar un análisis que se conoce Por Contrastes
Ortogonales.
41
Los Tratamientos aplicado son: 0,10, 0,20 y 0,30 por ciento de carbono.
Para obtener un polinomio mínimo debe buscarse la cantidad:

X 1i    t i  t 
Tal que la suma de X1i = 0 y la suma de (X1i)2 sea mínima. Para esto, se
tiene que encontrar el escalar  que haga mínimo al polinomio:

Estas cantidades son:


1
   0,10;  0; 10     1; _ 0; _ 1 _ y _ 31  2 ;  0  2 ; 1  2   1;2;1 
0,10  3   3  3 

Para X1i y X2i respectivamente.


42
Cuando se aplican los polinomios a los promedios de los tratamientos se
efectúan los siguientes contrastes o comparaciones:
Promedios de Tratamientos Suma de S.Cuadrados S.Cuadrdos Cociente Probabilidad Coeficentes
Contraste 25,6667 36,0000 36,1667 Yi * Xij X Contraste F F Regresión
T1 vs T2 -1 0 1 10,50 2 330,7500 17,8355 0,0007 5,2500
2(T2) vs T1+T2 1 -2 1 -10,17 6 103,3611 5,5737 0,0322 -1,6944

Promedios Sinificativos

En el gráfico se observa el modelo


de regresión significativo. 0,3

Niveles de Carbón
Es evidente que la dureza aumenta
0,2
a medida que se aumenta el
contenido de carbón en la colada, 0,1

pero hasta cierto nivel u óptimo.


0,0 5,0 10,0 15,0 20,0 25,0 30,0 35,0 40,0
Éste será deducido más adelante. Dureza

43
Para obtener los coeficientes de regresión de los contrastes se arreglan los
datos según lo requiere el modelo de diapositiva 41 y solicitamos en la HE
la Regresión para obtener el ANDEVA:
Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,7807
Coeficiente de determinación R^2 0,6095
R^2 ajustado 0,5574
Error típico 4,3063
Observaciones 18

ANÁLISIS DE VARIANZA
Fuente de Grados de Suma de Cuadrados Cocinete de Probabilidad Límites Significantes
Variación Libertad Cuadrados Medios F. Calculada Significante P( 0,05) P(0,01)
Regresión 2 434,1111 217,0556 11,7046 0,0009 3,6823 6,3588
Residuos 15 278,1667 18,5444
Total 17 712,2778

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción 32,6111 1,0150 32,1288 0,0000 30,4477 34,7746
X1 5,2500 1,2431 4,2232 0,0007 2,6003 7,8997
X2 -1,6944 0,7177 -2,3609 0,0322 -3,2242 -0,1647

44
El modelo significativo de los valores sin transforma es:

yij  5,1667  255,8333 Ti   508,3333 Ti2  


Usando el criterio de la segunda derivada es posible encontrar un óptimo
mediante:
 b1  255,8333
To    0,25
2b2 2 - 508,333

Por ciento de carbono con lo que se estima un resistencia de:

 
yij  5,1667  255,8333 0,25  508,3333 0,25 2  37,4_

45
Grafico Significativo

40,0
Para presentar los resultados es 38,0
Resistencia
Máxim a 37,4

suficiente un gráfico, en este 36,0

% de Carbono
34,0

caso que muestre que Y es una 32,0


30,0
5,17+2,558X-508,3X²
variable continua. Indicando 28,0
26,0
además los resultados 24,0

determinantes. 22,0
20,0
0,10 0,12 0,14 0,16 0,18 0,20 0,22 0,24 0,26 0,28 0,30

Resistencia a la tensión

Es importante usar el gráfico apropiado al tipo de variable y análisis. En


este caso, se busca que la resistencia a la tensión sea máxima. El gráfico
hace evidente que la tensión aumenta a medida que se le agrega carbono
a la colada hasta llegar a 0,25% de donde empieza a disminuir. Un
posible siguiente ensayo partirá de este punto central explorando hacia
arriba y abajo cantidades más próximas hasta que el resultado se
consolide. 46
47
Marte 2004
Posiblemente, el Modelo Lineal más utilizado en la
Experimentación Planificada es el esquema en el que uno de los
Factores es Operativo y el otro, obviamente Objeto de la
Experimentación. Este esquema se conoce como Diseño en
Bloques Completamente al Azar, reminiscencias del pasado
agrícola del modelo, en el que el bloque correspondía a una
parcela de tierra con características diferenciadas. Ahora
podría asociarse el nombre de Bloque con la función que
desempeña: una fuente de variación homogénea a su interior y
heterogénea con otras de la misma naturaleza, que
regularmente no interesa analizar pero que sin esta no podría
realizarse el ensayo, además, podría afectar el resultado.
48
El Modelo Lineal para experimentos con dos Factores se
define como:
yij  y..  Ti  B j  Eij

Una ecuación ampliada del modelo completo al azar en el


factor Bj representante de los bloques. Usualmente, la
inclusión de un factor reduce la cantidad de los efectos no
explicados del error. Esto de traduce en diseños más
eficientes.
La diferencia con el proceso del diseño completo al azar es
que los tratamientos o niveles del Factor Objetivo deben
asignarse al azar a las repeticiones de cada bloque. Y es
más conveniente, tener la misma cantidad de repeticiones
por bloque. 49
Un fabricante que se inicia en el mercado de las botanas mediante un
producto innovador que incorpora tubérculos tropicales de camote,
ñáme, dos variedades de tiquisque y yuca. El producto se ofrece en 4 tipo
de empaques, 30, 60, 120 y 240 gramos.
Las cantidades que se agregan de cada producto es similar, esto es 1/5
para cada producto.
Los dueños, solicitaron a la Escuela de Ingeniería Agropecuaria
Administrativa del Instituto Tecnológico de Costa Rica, se les hiciera una
valoración de la calidad del producto.
La primera pregunta que les hizo el estudiante fue:
Si se puede saber ¿qué porcentaje se agrega de cada producto?.
La respuesta fue, el mismo para cada producto, esto es: el 20%.

50
Factor Operativo:
La presentación, con todo y que se empaque por las mismas
máquinas puede considerase como factor de variación sin el cual no
podría llevarse a cabo la experiencia.
Factor Objetivo:
El porcentaje de cada producto en los envases con 5 niveles con un
valor de 20% para cada producto.
El Método de Análisis:
Se usará diseño de dos Factores en Bloques Aleatorios.
Nivel de Confianza:
El 95% o un coeficiente de significación de 5%.
Hipótesis Nula:
Todos los tratamientos son iguales: Ho; Ti = 0. 51
De acuerdo al objetivo de la experiencia, habrá una
composición homogénea del producto si cada envase contiene
un 20% de cada una de las hojuelas. En otras palabras, se
espera aceptar la hipótesis nula. El Modelo Lineal que se va a
usar para valorar la experiencia es:
yij  y..  Ti  B j  Eij

En donde i = 1,2,...,5= t productos; j = 1,2,...,6=b repeticiones


por cada producto en los 4 tipo de envases.
El proceso de selección de los productos se realizó adquiriendo
10 bolsas para cada uno de los 4 tipos de envases en seis de los
grandes supermercados elegidos al azar en la zona
metropolitana de la capita, para obtener el promedio de cada
producto. 52
Tradicionalmente se usa un cuadro de dos entradas totalizado
por factores llamado Datos de Campo como resumen
informativo y para efectuar el ANDEVA.
PRODUCTOS
Presentación Camote Ñame Tiquisque 1 Tiquisque 2 Yuca Suma
30 20,5 16,8 23,6 19,1 17,9 97,9
60 22,1 18,1 14,9 13 27,7 95,8
120 18,1 15 18,5 23,7 17,7 93,0
240 22,4 24,6 18,9 16,8 19,8 102,5
Suma 83,1 74,5 75,9 72,6 83,1 389,2

Número de tratamientos: 5=t


Número de Presentaciones: 4=b
Suma de Cuadrados Total:
SCY   t  r  1 SY2   5  4  113,3373  253,4080
53
Suma de Cuadrados de Presentaciones Bloques:
SCB 
 b  1 S B2  4  116,0467
  9,6280
t 5

Suma de Cuadrados de Productos Tratamientos:

SCT 
 t  1 ST2  5  1 24,4280
  24,4280
b 4

Suma de Cuadrados del Error:


SCE  SCY  SCB  SCT  253.4080 - 9,6280 - 24,4280  219,3520

Resultados que se resumen en el cuadro del ANDEVA en la


siguiente diapositiva.
54
ANDEVA de Bloques Aleatorios.
Fuente de Grados de Suma de Cuadrados Cocinete de Probabilidad Límites Significantes
Variación Libertad Cuadrados Medios F. Calculada Significante P( 0,05) P(0,01)
Total 19 253,4080

Presentaciones 3 9,6280 3,2093 0,1756 0,9109 3,4903 5,9525


Productos 4 24,4280 6,1070 0,3341 0,8498
Error 12 219,3520 18,2793

De acuerdo a los resultados del ANDEVA se concluye que no hay


evidencias para declarar diferencias entre presentaciones o entre
tratamientos.
No obstante, hay que estar completamente seguros que en presentaciones o
en tratamientos hay algún efecto escondido. Para esto se considera el
Modelo Lineal completo:
yˆ ij  y..  b1 B1j  b2 B 2j  b3 j  b4Ti1  b5Ti 2  b6Ti 3  b7T j4  Eij
3

En el que B y T son los polinomios ortogonales para presentaciones y


tratamientos.
55
Para el Contraste lineal de Envases:
r
30  60 _ vs _ 120  240  b
1
2
B
i 1
i  0,1100 2 100  1,2100

Para el Contraste Cuadrático de Envases:


r
30  240 _ vs _ 60  120  b 2
2 B i 1
i  0,5800 2  20  6,7280

Para el Contraste Cúbico de Envases:


r
30  120 _ vs _ 60  240  b 2
3 B
i 1
i  0,1300 2  100  1,6900

La suma de cuadrados de los contrastes es igual a la suma de cuadrados


de los Envases, Presentaciones o Bloques:
1,2100  6,7280  1,6900  9,6280
Procediendo de la misma forma para Tratamientos se llega al
ANDEVA de la siguiente diapositiva: 56
ANÁLISIS DE VARIANZA
Fuente de Grados de Suma de Cuadrados Cocinete de Probabilidad Límites Significantes
Variación Libertad Cuadrados Medios F. Calculada Significante P( 0,05) P(0,01)
Regresión 7 34,056 4,8651 0,2662 0,9559 2,9134 4,6395
Empaques 3 9,6280 3,2093 0,1756 0,9109 3,4903 5,9525
1 1,2100 4,8651 0,2662 1,9559 4,7472 9,3303
1 6,7280 6,7280 0,3681 0,5554 4,7472 9,3303
1 1,6900 4,8651 0,2662 2,9559 4,7472 9,3303
Prodictos 4 24,4280 6,1070 0,3341 0,8498 3,2592 5,4119
1 0,09025 4,8651 0,2662 3,9559 4,7472 9,3303
1 20,0402 20,0402 1,0963 0,3157 4,7472 9,3303
1 0,3610 4,8651 0,2662 4,9559 4,7472 9,3303
1 3,9366 3,9366 0,2154 0,6509 4,7472 9,3303

Residuos 12 219,3520 18,2793


Total 19 253,4080

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción 19,4600 0,9560 20,3553 0,0000 17,3770 21,5430
B1 0,1100 0,4275 0,2573 0,8013 -0,8215 1,0415
B2 0,5800 0,9560 0,6067 0,5554 -1,5030 2,6630
B3 0,1300 0,4275 0,3041 0,7663 -0,8015 1,0615
T1 -0,0475 0,6760 -0,0703 0,9451 -1,5204 1,4254
T2 0,5982 0,5713 1,0471 0,3157 -0,6466 1,8430
T3 0,0950 0,6760 0,1405 0,8906 -1,3779 1,5679
T4 0,1186 0,2555 0,4641 0,6509 -0,4381 0,6753
57
EN el ANDEVA para el Modelo Completo no indicó diferencias
importantes para los factores. Por tanto, debe concluirse que el
porcentaje de hojuelas de cada materia prima en el producto terminado
es la misma, de 20% o 1/5.
Dos técnicas adicionales se pueden utilizar:
El ANDEVA solicitado directamente a la HE como: Herramientas /
Análisis de datos / Análisis de la varianza para dos factores con una
repetición por grupo. Cuyo resultado es:
ANÁLISIS DE VARIANZA
Fuente de Suma de Grados de Cuadrados Cocinete de Probabilidad Límites Significantes
Variación Cuadrados Libertad Medios F. Calculada Significante P( 0,05) P(0,01)
Filas 9,6280 3 3,2093 0,1756 0,9109 3,4903 5,9525
Columnas 24,4280 4 6,1070 0,3341 0,8498 3,2592 5,9525
Error 219,3520 12 18,2793

Total 253,4080 19

En todo caso, se acepta la hipótesis nula.


58
La segunda técnica consiste en elaborar un ANDEVA con el
modelo completo sin promediar por muestra. Con más
observaciones se aumenta la confiabilidad de las
conclusiones. Como se puede corroborar en la HE.
Es conveniente mencionar que una alternativa apropiada
para valorar la hipótesis es analizar las diferencia de los
porcentajes con la distribución binomial mediante la
comparación de las frecuencias observadas con las
frecuencias esperadas.
También es conveniente indicar al estudiante, que
situaciones de control de calidad pueden analizarse
mediante las cartas de control. Ver Control de la calidad.
59
60
El Modelo Lineal para Técnicas de Muestreo puede
esquematizarse mediante:
yij  y..  Gi  Eij

En donde Gi rebresenta un efecto del agrupamiento, sea:


En muestreos Estratificados;
En muestreos por Conglomerados;
O en muestreos de Razón y Regresión.
61
Una empresa que vende semen de toros mantiene un proyecto
permanente de valoración de la fertilidad del producto. Al
menos dos veces al año ofrece a una universidad un trabajo
para pasantes de veterinaria con el objeto de que realicen el
estudio. Este consiste en tomar n número de toros en r fincas y
de los registros de vida, localizar las vacas que se hayan
inseminado en los últimos seis meses calificando la preñez con
la palpación exitosa del producto.
El Análisis se hace con un nivel de confianza de 95%. Se
espera, que no haya diferencias por toro y una fertilidad
superior a 62%.
62
Los datos se pueden clasificar por Finca y por Toro, interesa el
ordenamiento por toro tal como se muestra en el siguiente
cuadro:
T O R O S
Nº 1 2 3 4 5 6 7 8 9
1 42,34 39,41 74,48 28,11 74,65 28,74 31,62 63,16 83,62
2 86,49 70,80 67,68 83,61 60,84 69,43 50,76 67,73 48,92
3 70,07 74,77 62,03 30,10 66,46 54,90 60,23 86,74 30,47
4 34,72 38,35 77,48 82,88 86,55 76,57 80,38 34,50 40,23
5 53,43 62,20 76,68 50,72 90,18 69,05 62,71 28,20 87,49
6 48,07 76,05 86,21 58,64 62,78 75,74 80,84 54,21 43,76
7 83,23 38,40 33,32 32,88 36,60 87,31 41,96 47,84 58,28
8 37,47 58,88 59,18 60,73 77,09 69,92 52,99 84,41 42,34
9 80,23 31,29 75,07 62,19 75,43 89,43 69,88 40,87 44,40
10 61,15 43,19 70,37 30,86 55,71 43,47 73,88 55,84 82,86
11 33,98 46,10 53,94 45,67 49,47 42,80 56,48 88,58 81,60
12 54,75 79,03 88,91 91,42 56,01 75,79 85,84 54,28 82,48
13 63,94 48,14 81,17 59,49 35,30 78,93 50,76
14 84,71 62,05 64,14 80,82 75,57 48,31 36,18
15 76,09 46,98 44,09 82,35 65,45 58,53
16 40,01 92,55 62,25 91,92
17 46,70 44,84 62,03
18 63,48 71,04 50,59
19 94,68 45,39
20 93,99 58,37
21 65,77 97,47
22 34,88
23 61,59
24 82,45
25 40,80
63
En estudios de poblaciones por muestreo siempre es
importante mostrar las estadísticas descriptivas de la
población o los grupos, se esperen o no diferencias entre
ellos. Se muestran la varianza y el total en negrillas por el
interés que tienen en el cálculo del ANDEVA paso a paso.
Estadístico Toro 1 Toro 2 Toro 3 Toro 4 Toro 5 Toro 6 Toro 7 Toro 8 Toro 9

Media 58,94 60,88 67,65 58,70 64,47 65,26 62,30 59,79 60,24
Error típico 4,2608 4,2874 3,9664 5,6780 4,4940 5,4305 4,7907 3,6977 5,2791
Mediana 57,95 62,05 70,37 59,49 64,62 69,675 61,47 58,37 54,52
Moda ---- ---- ---- ---- ---- ---- ---- ---- ----
Desviación estándar 18,0770 19,6475 15,3617 21,9906 16,8150 18,8119 16,5953 18,4887 21,1164
Varianza de la muestra 326,7779 386,0252 235,9827 483,5880 282,7451 353,8894 275,4049 341,8320 445,9041
Curtosis -1,3671 -1,0158 0,4070 -1,3971 -0,5807 -0,3971 -0,6329 -0,6034 -1,6459
Coeficiente de asimetría 0,1607 0,3256 -0,8193 -0,0369 -0,3342 -0,6995 -0,2985 0,3366 0,2614
Rango 52,51 63,39 55,59 63,31 54,88 60,69 54,22 69,27 61,45
Mínimo 33,98 31,29 33,32 28,11 35,3 28,74 31,62 28,2 30,47
Máximo 86,49 94,68 88,91 91,42 90,18 89,43 85,84 97,47 91,92
Suma 1060,86 1278,51 1014,75 880,47 902,64 783,15 747,57 1494,87 963,84
Cuenta 18 21 15 15 14 12 12 25 16

64
Es lógico pensar que un “buen” estimador de la varianza entre grupos los
sea el promedio ponderado de las varianzas. En términos de Sumas de
Cuadrados para usar la igualdad: SCY = SCG + SCE.

 
9
SCE    ni  1 S i2 
i 1

 18  1 326,7779   21 - 1 386,0252  ...  16 - 1 445,9041  48.840,1723

Con la Suma de Cuadrados Total se puede obtener por diferencia la Suma


de Cuadrados Entre Grupos:
 9  
SCY    ni   1 S Y2   18  21  ...  16   1340,4553  50.046,9289
 i 1  

Finalmente:
SCG  SCY  SCE  20.046,9289  48.840,1723  1.206,7566
Cálculos resumidos en el cuadro del ANDEVA
65
ANÁLISIS DE VARIANZA
Fuente de Grados de Suma de Cuadrados Cocinete de Probabilidad Límites Significantes
Variación Libertad Cuadrados Medios F. Calculada Significante P( 0,05) P(0,01)
Total 147 50.046,9289

Entre Toros 8 1.206,7566 150,8446 0,4293 0,9019 2,0056 2,6417


Dentro de Toros 139 48.840,1723 351,3681
Promedio 61,67
Desviación Estándar 18,7448
Coeficiente de Variación 30,40%

El ANDEVA indica que no hay motivos para dudar que todos los toros
presentan porcentajes de fertilidad similares sobre el 61,67%. Algo más
bajo que lo esperado. Esto es 1,6 ampollas de semen por fecundación exitosa
a la palpación aproximadamente entre 2 y 3 meses después de la
inseminación.
En la HE puede comprobar el resultado que obtuvo paso a paso.
66
En la toma de datos se tienen dos niveles o etapas de muestreo: primero
se llega a la finca y dentro de la finca se llega al toro. Este esquema se
estudia detalladamente en diseños de muestreo, en este caso, los cálculos
se muestran el la HE.
Cada anidamiento provoca un error que debe considerarse en la prueba
de F en donde el cuadrado medio del error de una clase es el cuadrado
medio de la clase siguiente.
ANDEVA ANIDADO EN TOROS DENTRO DE FINCAS.
Fuente de Grados de Suma de Cuadrados Cocinete de Probabilidad Límites Significantes
Variación Libertad Cuadrados Medios F. Calculada Significante P( 0,05) P(0,01)
Entre Fincas 5 3.015,9737 603,1947 1,7357 0,1487 2,4495 3,5138
Entre toros dentro
de fincas 40 13.900,5884 347,5147 1,0699 0,3841 1,5128 1,7931

Dentro de toros 102 33.130,3668 324,8075


Total 147 50.046,9289

Del ANDEVA se concluye que no hay efecto Entre Fincas dentro de toros
P(0,1487); ni efecto entre toros dentro de repeticiones P(0,3841). Por tanto, la
población puede tratarse como un todo. 67
Se han tratado aspectos relevantes del Análisis de Poblaciones mediante el
uso de Modelos Lineales y Las Sumas de Cuadrados que implican en un
método denominado Análisis de la Varianza, conocida universalmente por
sus siglas en los diferentes idiomas como ANDEVA.
Desde el más simple de la Regresión Lineal, pasando por modelos de uso en
la Investigación Planificada, para un Factor y para dos Factores, uno
Operativo y él otro Objetivo.
Se introdujo el concepto del Polinomio Mínimo y el contraste de
Tratamientos mediante Polinomios Ortogonales imbuidos en los niveles de
los factores. Y de cómo complementan al ANDEVA.
Finalmente, se mostró el uso del ANDEVA en las técnicas del muestreo.
Cada una de las áreas abordadas, integran apartados que la Teoría
Estadística trata por separado. Por tanto, la herramienta del ANDEVA se
puede estudiar específicamente en cada subárea.
68
La manera más consistente de aprender es practicando.
Es recomendable que el estudiante refuerce su conocimiento
reproduciendo los ejemplos que se han presentado con cambios
suficientes para variar resultados dejando fijos los procedimientos.
Si aun tuviera más interés solicite al profesor la Guía Autodidáctica
correspondiente a este capítulo.

Manuel Pontigo: Marzo, 2004

También podría gustarte