Metodos Estadisticos
Metodos Estadisticos
Metodos Estadisticos
ESTADÍSTICOS
PARA EL ESTUDIO DE LA ESTABILIDAD
VARIETAL EN ENSAYOS AGRÍCOLAS
MÉTODOS ESTADÍSTICOS PARA EL ESTUDIO DE LA
ESTABILIDAD VARIETAL EN ENSAYOS AGRÍCOLAS. II Edición
ÍNDICE
ÍNDICES ..................................................................................................................................................... 5
PREÁMBULO.............................................................................................................................................. 11
I PARTE: INTRODUCCIÓN
1. INTRODUCCIÓN ................................................................................................................................. 21
1.1. Estabilidad y adaptabilidad .............................................................................................................. 21
1.2. Métodos biométricos para estimar la estabilidad: paramétricos univariantes ................................. 24
1.2.1. Partición de la Suma de Cuadrados de la Interacción GxE .................................................. 24
1.2.2. Análisis de regresión .............................................................................................................. 25
1.3. Métodos para medir estabilidad: univariantes no-paramétricos ...................................................... 29
1.4. Métodos para medir estabilidad: Multivariantes................................................................................ 29
1.4.1. Componentes Principales ........................................................................................................ 30
1.4.2. Variables ambientales. Regresión Múltiple.............................................................................. 30
1.4.3. Análisis Factorial ...................................................................................................................... 31
1.4.4. Análisis A.M.M.I........................................................................................................................ 31
1.4.5. Análisis de Grupos................................................................................................................... 32
1.4.6. Coordenadas Principales ........................................................................................................ 33
1.4.7. Análisis de Correspondencias ................................................................................................ 33
1.4.8. Análisis Canónico..................................................................................................................... 34
1.4.9. Otros métodos.......................................................................................................................... 34
1.5. Resumen general sobre los métodos expuestos .............................................................................. 36
2.2.2. El Análisis de la Varianza ........................................................................................................ 45
2.2.3. La Interacción GxE .................................................................................................................. 46
2.2.4. Resolución práctica ................................................................................................................. 47
3. PARAMETROS UNIVARIANTES DE ESTABILIDAD MAS UTILIZADOS ............................... 55
3.1. Varianza de Estabilidad ..................................................................................................................... 55
3.2. Coeficiente de Variación .................................................................................................................... 55
3.3. Ecovalencia y Cuadrados Medios de la Ecovalencia ....................................................................... 56
3.4. Varianza Ambiental ............................................................................................................................ 57
3.5. Medida única de Lin y Binns ............................................................................................................. 57
3.6. Resultados con los datos experimentales ......................................................................................... 58
4. METODO DE TAI (1971) .................................................................................................................... 63
4.1. Caso práctico ..................................................................................................................................... 64
5. METODOS NO-PARAMETRICOS .................................................................................................... 69
5.1. Estadísticos no-paramétricos de Hühn ............................................................................................. 69
5.2. Método de Consistencia de Comportamiento ................................................................................... 70
5.3. Método de Kang ................................................................................................................................ 70
5.4. Método de Ordenamientos Estratificados ......................................................................................... 70
5.5. Aplicación práctica ............................................................................................................................ 71
5.5.1. Método no-paramétrico de Hühn............................................................................................. 71
7
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
5.5.2. Método de “Consistencia de comportamiento”....................................................................... 72
5.5.3. Método de Kang ...................................................................................................................... 73
5.5.4. Método de Ordenaciones Estratificadas ................................................................................. 74
6. METODO DE ESKRIDGE .................................................................................................................. 79
6.1. Caso práctico ..................................................................................................................................... 80
7. METODO ESTRELLA........................................................................................................................... 85
8. ANALISIS DE COMPONENTES PRINCIPALES............................................................................ 89
8.1. Caso práctico ..................................................................................................................................... 90
8.1.1. ACP de Genotipos. Datos originales de rendimiento.............................................................. 90
8.1.2. Datos transformados................................................................................................................ 90
8.1.3. ACP de Ambientes. Datos originales de rendimiento ............................................................. 91
8.1.4. Datos transformados................................................................................................................ 92
9. “ADDITIVE MAIN EFFECTS AND MULTIPLICATIVE. INTERACTION”: A.M.M.I. ............. 95
9.1. La validez predictiva .......................................................................................................................... 96
9.2. Aplicación práctica ............................................................................................................................ 96
9.2.1. Procedimientos......................................................................................................................... 96
9.2.2. Resultados ............................................................................................................................... 97
9.2.3. Estimación de las repeticiones necesarias ............................................................................. 98
9.2.4. El “biplot”.................................................................................................................................. 99
9.2.5. Agrupaciones en el biplot........................................................................................................ 100
9.2.6. Comentarios finales.................................................................................................................. 101
9.3. El “ruido” en el Análisis AMMI ........................................................................................................... 101
10. ANALISIS DE GRUPOS ................................................................................................................... 107
10.1. Análisis de grupos según Lin .......................................................................................................... 110
10.2. Análisis de grupos según Fox y Rosielle......................................................................................... 114
11. ANALISIS DE COORDENADAS PRINCIPALES ........................................................................ 119
11.1. Caso práctico ................................................................................................................................... 122
12. ANALISIS FACTORIAL DE CORRESPONDENCIAS ................................................................ 131
12.1. Caso práctico ....................................................................................................................................... 131
13. ANALISIS CANONICO .................................................................................................................... 137
13.1. Caso práctico ................................................................................................................................... 138
14. MODELO SREG. GGE BIPLOT ...................................................................................................... 143
14.1. Caso práctico .................................................................................................................................. 144
15. COMENTARIOS Y CONSEJOS FINALES .................................................................................. 149
15.1. Métodos Univariantes Paramétricos ................................................................................................ 149
15.2. Métodos Univariantes No-Paramétricos .......................................................................................... 150
15.3. Otros métodos Univariantes............................................................................................................. 150
15.4. Métodos Multivariantes .................................................................................................................... 150
15.5. Comparación de métodos univariantes y multivariantes................................................................. 151
15.6. Plan de Trabajo ............................................................................................................................... 152
16. APENDICE .......................................................................................................................................... 157
16.1. Matrices de entrada para los distintos paquetes estadísticos utilizados ...................................... 157
16.2. ANOVA y Regresión Conjunta ........................................................................................................ 165
16.3. Estadísticos Paramétricos Univariantes........................................................................................... 168
16.4. Método de Tai .................................................................................................................................. 170
8
Índices Índices Índices Índices Índices Índices Índices Índices Índices Índices Índices Índices Índices
16.5. Estadísticos No-paramétricos ......................................................................................................... 171
16.6. Análisis AMMI .................................................................................................................................. 175
16.7. Análisis de grupos según Fox y Rosielle ........................................................................................ 183
16.8. Análisis de Coordenadas Principales ............................................................................................. 186
16.9. Análisis Canónico ............................................................................................................................ 187
16.10. Modelo GGE biplot ....................................................................................................................... 191
INDICE DE FIGURAS
1. Tipos de interacción para dos genotipos hipotéticos ............................................................................ 23
2. Líneas de regresión para los 11 genotipos ............................................................................................ 26
3. Categorías de estabilidad ....................................................................................................................... 28
4. Coeficiente de Variación ......................................................................................................................... 56
5. Comparación con respuesta máxima ..................................................................................................... 59
6. Gráfica de Tai .......................................................................................................................................... 65
7. Método de Ketata y col. 1989 ................................................................................................................. 70
8. Consistencia del comportamiento (ordenes) .......................................................................................... 72
9. Consistencia del comportamiento (rendimiento) .................................................................................... 73
10. Genotipos 2-6-7 (ordenes bajos) .......................................................................................................... 75
11. Genotipos 10-11-1-5 (ordenes medios) ................................................................................................ 75
12. Genotipos 8-9-3-4 (ordenes altos) ........................................................................................................ 76
13. Método “Estrella” ................................................................................................................................... 85
14. ACP datos sin transformar (ambientes) ................................................................................................ 90
15. ACP datos transformados (ambientes) ................................................................................................. 91
16. ACP datos sin transformar (genotipos) ................................................................................................. 91
17. ACP datos transformados (genotipos) .................................................................................................. 92
18. Análisis AMMI ........................................................................................................................................ 100
19. Análisis de grupos Genotipos (UPGMA-DIST. EUCL.) ......................................................................... 108
20. Análisis de grupos Ambientes (UPGMA-DIST. EUCL.) ........................................................................ 108
21. Análisis de grupos Genotipos (WPGMA-DIST. EUCL.) ........................................................................ 109
22. Análisis de grupos Ambientes (WPGMA-DIST. EUCL.) ........................................................................ 109
23. Análisis de grupos Genotipos (SINGL-DIST. EUCL.) ........................................................................... 110
24. Análisis de grupos Ambientes (SINGL-DIST. EUCL.) ........................................................................... 110
25. Análisis de grupos Genotipos (COMPL-DIST. EUCL.) ......................................................................... 111
26. Análisis de grupos Ambientes (COMPL-DIST. EUCL.) ......................................................................... 111
27. Análisis de grupos Genotipos (METODO LIN 1982) ............................................................................ 112
28. Análisis de grupos Ambientes (METODO LIN 1982) ........................................................................... 113
29. Análisis de grupos Genotipos (METODO FOX-ROSIELLE) .................................................................. 113
30. Análisis de grupos Ambientes (METODO FOX-ROSIELLE) ................................................................. 114
31. Coordenadas Principales (CICLO L1) (dos dimensiones) ................................................................... 119
32. Coordenadas Principales (CICLO H1) (dos dimensiones) ................................................................... 120
33. Coordenadas Principales (CICLO L1) .................................................................................................. 120
34. Coordenadas Principales (CICLO L2) .................................................................................................. 121
35. Coordenadas Principales (CICLO L3) .................................................................................................. 122
36. Coordenadas Principales (CICLO L4) .................................................................................................. 123
37. Coordenadas Principales (CICLO H1) .................................................................................................. 124
38. Coordenadas Principales (CICLO H2) .................................................................................................. 124
39. Coordenadas Principales (CICLO H3) .................................................................................................. 125
40. Coordenadas Principales (CICLO H4) .................................................................................................. 125
41. Coordenadas Principales (CICLO H5) .................................................................................................. 126
9
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
42. Coordenadas Principales (CICLO H6) .................................................................................................. 126
43. Análisis de Correspondencias .............................................................................................................. 132
44. A.F. de Correspondencias (Genotipos) ................................................................................................ 132
45. A.F. de Correspondencias (Ambientes) ............................................................................................... 132
46. Análisis Canónico .................................................................................................................................. 137
47. Análisis GGE biplot ............................................................................................................................... 145
48. Componentes Principales de todos los métodos utilizados ................................................................. 151
INDICE DE TABLAS
1. ANOVA de la interacción GxE ................................................................................................................ 46
2. ANOVA y Regresión Conjunta de la interacción GxE ............................................................................ 47
3. ANOVA y Análisis de la Regresión (caso práctico) ................................................................................ 49
4. Rendimiento medio, coeficiente de regresión y S_di para cada genotipo ............................................ 50
5. Parámetros de estabilidad Û_i, s_i, CVi, Wi, Wi-CM y S_xi .................................................................... 58
6. Parámetros de estabilidad para los cuatro grupos definidos en la Fig. 4 ............................................. 58
7. Indice de Lin y Binns: Pi ......................................................................................................................... 59
8. Resultados del Método de Tai ................................................................................................................ 64
9. Cálculo de los estadísticos S(m)i (m=1,2,3,6). Datos transformados .................................................... 71
12. Método de Kang ................................................................................................................................... 74
13. Estratificación de rangos ...................................................................................................................... 75
14. Valores para los cuatro índices de “primera-seguridad” y las ordenaciones respectivas .................. 80
15. Efectos aditivos e interacción del ANOVA incluyendo los 3 primeros ejes del ACP de
la interacción ......................................................................................................................................... 97
16. Coordenadas genotípicas y ambientales del primer componente del AMMI ...................................... 98
17. RMS PD (kg ha-1) para siete modelos basados en datos de rendimiento .......................................... 98
18. Estimación de parámetros del AMMI para su evaluación predictiva
para rendimiento medio de 11 genotipos en 10 ambientes ................................................................ 99
19. Análisis de grupos de los genotipos según el método de Lin ............................................................. 112
20. Análisis de grupos de los ambientes según el método de Lin ............................................................ 112
21. Análisis de grupos de Fox y Rosielle para genotipos .......................................................................... 114
22. Análisis de grupos de Fox y Rosielle para ambientes ......................................................................... 115
23. Ciclos H y L para el análisis de Coordenadas Principales .................................................................. 121
24. Arbol de mínima dispersión para los primeros genotipos de cada ciclo ............................................ 123
25. Longitudes medias del AMD para los genotipos más disimilares ....................................................... 124
26. Las tres primeras coordenadas del Análisis Factorial de Correspondencias ..................................... 132
27. Coordenadas canónicas para cada genotipo ...................................................................................... 139
28. Coordenadas canónicas para el individuo medio de cada grupo ...................................................... 139
10
P
R E Á M B U L O
Preámbulo Preámbulo Preámbulo Preámbulo Preámbulo Preámbulo Preámbulo Preámbulo Preámbulo
PREÁMBULO da elaboración matemática, su dificultad de cál-
culo y lo problemático de la interpretación de los
Se tiene tendencia a pensar que la labor del resultados en términos agronómicos. El acerca-
mejorador termina con la obtención de las pri- miento entre la Estadística y la Agronomía ha pro-
meras semillas de una nueva variedad (de un piciado la aparición de numerosos y complejos
nuevo cultivar, para ser más precisos en la ter- métodos de estudio de la interacción genotipo-
minología), y que el resto –multiplicación, comer- ambiente, perfectamente resolubles gracias a los
cialización, conservación, etc.– corresponde a “paquetes” estadísticos comerciales actualmente
las empresas privadas o públicas. Eso no lo pen- existentes y cuya interpretación en términos bio-
sará nunca un mejorador profesional, ni ningún lógicos no ofrece más dudas que la que resulta
alumno de Mejora de Plantas, ni nadie que tenga de las características del propio material vivo.
contacto con este mundo. En realidad, un culti-
var no termina nunca de salir de las manos del No pocos de dichos métodos son de base
mejorador: aún cuando éste no se encargue teórica muy simple. Otros, por el contrario, la tie-
directamente de los ensayos a nivel comercial, nen muy compleja, muy “sofisticada” según la ter-
siempre estará atento a los datos de estos ensa- minología al uso. Este Manual no entra en las
yos, a la respuesta de su material en diferentes bases teóricas, sea cual sea la complicación de
localidades, a los factores ambientales que las mismas, a menos que sea estrictamente nece-
hacen aumentar o disminuir el rendimiento, a la sario. Para saciar la sed de rigor matemático se
estabilidad de sus variedades en relación a otras dan abundantes referencias en el texto. Este es
obtenciones... en suma, estará interesado en lo un Manual que trata de enseñarle al lector a ele-
que se viene llamando interacción genoti- gir el método de estudio más apropiado (no siem-
po-ambiente, y esa será una información pre lo más complicado es lo mejor), a operar y a
esencial para proseguir el trabajo de mejora. interpretar los datos de un caso real. Sólo precisa
de un conocimiento elemental de lo que es el
Huelga decir que ese estudio no sólo interesa diseño de experimentos; podríamos simplificarlo
al mejorador. A éste se le hace necesario para diciendo “un conocimiento de lo que es el análi-
proseguir su trabajo, pero al extensionista, al sis de la varianza y de las pruebas estadísticas
agrónomo en general, le resulta esencial por más comunes”. Eso en cuanto al bagaje teórico.
cuanto debe conocer por fuerza el comporta- En cuanto al de cálculo, se precisa tener acceso
miento de las diferentes variedades existentes en a los paquetes estadísticos usuales, pues los
el mercado en los ambientes en que trabaja con métodos multivariantes no pueden resolverse por
objeto de suministrar una información de la medio de operaciones sencillas y estos paquetes
mayor importancia: ¿qué cultivares van bien en resuelven los cálculos más complicados.
qué lugares? ¿cuáles podrán recomendarse para
todos los ambientes?. Si ninguno, ¿cuáles serán Dado que los datos con los que se opera en
más productivos en los buenos suelos, cuáles este manual proceden de un caso real, las inter-
“aguantarán el golpe” en los malos?. En general, pretaciones de los resultados son relativas a
¿existe alguna relación entre los diferentes tipos este caso. Eso quitaría generalidad al presente
de variedades y los diferentes ambientes en que texto como Manual. Para obviar tal limitación, se
se pueden sembrar, una relación que permita analizan distintas alternativas (p. ej. “de haberse
predecir un cierto comportamiento? obtenido un valor ....., la conclusión hubiera sido
.....”) con objeto de que el lector pueda encontrar
Puede verse que, aunque a primera vista la en estas páginas su propio caso. Hemos de
expresión interacción genotipo-ambiente decir, sin embargo, que es imposible incluir
parece excesivamente técnica, su alcance es de todos los casos posibles: el material biológico
enorme importancia práctica. Su estudio es, siempre superará en riqueza a todos los cálculos
pues, absolutamente necesario. Hasta hace unos que el hombre pueda realizar. Tarde o temprano,
años, los métodos utilizados para dicho estudio el que practica estos métodos termina encon-
eran escasos e insatisfactorios. Ocurría que los trando una situación aún no descrita en la litera-
que empleaban mejoradores y agrónomos no tura científica. Tarde o temprano, pues, el lector
eran del agrado de los profesionales de la Esta- terninará analizando sus propios datos y luchan-
dística por simples e imprecisos, por su más que do por obtener sus propias conclusiones.
discutible base teórica. A su vez, los análisis esta-
dísticos complejos no eran accesibles a los que A ayudarle en ese menester es a lo que va
trabajaban con material vegetal por su complica- dirigido el presente Manual.
13
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
NOTA PREVIA irreprochable, pero absolutamente pedante en el
lenguaje coloquial, de “cultivar”.
Los datos y corrientes de control necesarios
para los distintos paquetes estadísticos utiliza- En la literatura se habla siempre de “interac-
dos se dan en los apartados del Apéndice. Esos ción genotipo-ambiente”. Lo que se estudia, en
son los datos de partida. Con ellos, siguiendo las realidad, son “variedades” (o cultivares, como ya
instrucciones que se dan para poner en práctica se ha dicho), y la identificación de “variedad”
cada método, se obtienen los resultados que con “genotipo” puede hacer temblar a los puris-
figuran en el texto. La práctica usual del análisis tas, y con razón, pues hablar de un genotipo
de la varianza y de las pruebas estadísticas ele- implica un conocimiento profundo del material y
mentales (pruebas t, F, χ, etc.) se suponen cono- una homogeneidad inalcanzable en la práctica,
cidas. A pesar de ello, en el texto se facilitan, sobre todo en la agrícola. Por bien obtenida que
cuando se considera oportuno, incluso las ope- esté una variedad-línea pura de una especie
raciones más rutinarias, con objeto de que el lec- absolutamente autógama, o una variedad-clon
tor compruebe que sus cálculos van por buen de una especie leñosa, es más que dudoso que
camino. se tenga la seguridad de que en una y otra sólo
existe un genotipo. Sin embargo, dada la prácti-
El material y las condiciones reales en que se ca unanimidad de la literatura en este caso, se
obtuvieron los datos no hacen al caso, por lo que hablará de interacción genotipo-ambiente aun-
se habla en el Manual de 11 variedades y de 10 que el material de estudio sean variedades de
ambientes. No obstante, y aunque no se vuelva todo tipo: se hace la abstracción de que las
a mencionar más en el texto, los datos proceden variedades en ensayo son tan diferentes entre sí
de un ensayo de 15 variedades de habas (Vicia que se pueden suponer constituidas por conjun-
faba L.) en 8 localidades andaluzas durante tres tos de genotipos tales que muestran diferencias
años consecutivos, dentro de la Red Andaluza mínimas dentro de una variedad y máximas
de Experimentación Agrária. Los autores dan las entre variedades.
gracias a la Consejería de Agricultura, Pesca y
Alimentación de la Junta de Andalucía por Por último, un comentario sobre las referen-
haberles permitido disponer de estos datos. Se cias bibliográficas contenidas en el texto. La
prefirieron las habas por ser un material sensible finalidad del presente libro es entrenar al lector
a los cambios de ambiente y, por ello, en el que en diversas técnicas estadísticas de aplicación
era esperable una alta interacción genotipo- en agricultura. No es un trabajo de investigación.
ambiente. El caracter analizado es el del rendi- Por lo tanto, las referencias que se incluyen en el
miento, que será en general el carácter proble- texto son las mínimas necesarias, y se dan cuan-
ma para el lector. do hay que otorgar el crédito debido a algún
autor concreto (por ejemplo, si es el creador de
Una observación sobre terminología. Se utili- una nueva técnica, etc). Una proliferación de
zan, siempre que es posible, términos castella- citas no tendría más efecto que hacer penosa la
nos (p. ej. “prueba” en lugar de “test”, etc). lectura. Sin embargo, las referencias necesarias
Como en este campo, al igual que en tantos se dan al final de cada capítulo: las básicas en
otros, los términos ingleses son de uso común, las que se encuentran descritos los métodos y
con frecuencia se alternan en el texto los de una algunos trabajos de investigación que los apli-
y otra lengua; esta doble terminología que el lec- can. Sólo encontrará el lector más nombres de
tor encontrará en el texto no obedece, pues, a los deseados en el primer capítulo, y ello es
falta de cuidado sino a todo lo contrario: a fami- debido a que en él se hace una descripción
liarizar al lector con la terminología inglesa, de somera de los métodos de análisis cuya práctica
uso universal, mostrándole de cuando en cuan- se detallará en capítulos sucesivos.
do que también existen términos en castellano.
Finalmente, se habrá observado que hasta aquí
se han manejado indistintamente las palabras MODO DE OPERAR
“cultivar” y “variedad”. Así se seguirá haciendo
en el texto, con clara predilección, al no haber En cada capítulo (excepto en el 1, que con-
posibilidad de confusión con la terminología que tiene una somera descripción de los diferentes
se utiliza en Botánica, por el de uso común en la métodos) se comienza por una breve exposición
práctica cotidiana agrícola (esto es, “variedad”) teórica, incluyendo las formulaciones necesarias
en relación con el más preciso y técnicamente para el cálculo. A continuación se aplica todo
14
Preámbulo Preámbulo Preámbulo Preámbulo Preámbulo Preámbulo Preámbulo Preámbulo Preámbulo
ello a los datos reales, que se dan en el Apendi- miendan los paquetes estadísticos SAS y
ce. Deben ser grabados en disco duro o en dis- NTSYS.
quete y comprobar su correcta grabación antes
de proceder a cualquier tipo de análisis. Las corrientes de control necesarias se inclu-
yen en el Apéndice, donde también figuran algu-
En cada caso se mencionan los programas y nos programas en BASIC elaborados para este
subprogramas que hay que utilizar. Se reco- Manual.
15
I .P A
I. P
R T E A R T E
I
N T R O D U C C I Ó N
1
I
NTRODUCCIÓN
Íntroducción Introducción Introducción Introducción Introducción Introducción Introducción Introducción
1. INTRODUCCIÓN do se estudian estas variaciones en rendimiento
se utiliza el término estabilidad fenotípica
Para una efectiva utilización de los recursos para referirse a las fluctuaciones de la expresión
vegetales en programas de Mejora existe la fenotípica del rendimiento mientras el genotipo
necesidad de evaluar y describir sus variacio- permanece constante
nes. El problema se complica porque numerosos
caracteres se heredan cuantitativamente y son Hay que decir que los términos de estabili-
grandemente influenciables por el ambiente, por dad fenotípica, rendimiento estable, y adapta-
lo que resulta necesario conseguir la máxima ción se interpretan de muy distintas formas, lo
información sobre las diferencias genéticas que motivó la humorística frase de Dorst: “la
entre variedades o poblaciones y sus respuestas palabra adaptación tiene gran adaptabi-
en diversos ambientes, esto es, lo que se llama lidad ...” (Dorst, 1957). Es un sentir común, en
Interacción Genotipo-Ambiente (GxE). efecto, que cada científico tiene su propio punto
de vista sobre estos conceptos.
La interacción GxE surge cuando una
variación ambiental tiene distinto efecto sobre Hay mejoradores que prefieren el término
genotipos diferentes o, a la inversa, cuando un ADAPTACIÓN dentro del contexto de una
mismo genotipo responde de distinta manera en variación en el espacio y utilizan el término
diversos ambientes. En otras palabras, cuando no ESTABILIDAD cuando se refieren al estudio de
se puede asociar una desviación producida por el un sitio durante varios años. Otros muchos utili-
ambiente con un ambiente específico (lugar, año, zan estabilidad y adaptación para referirse tanto
combinación localidad-año, tipo de suelo, etc.) a la dimensión espacial como a la temporal.
sin tener en cuenta el genotipo sobre el cual
aquella actúa. Ello se traduce en una interacción La capacidad de algunos genotipos para
en sentido estadístico entre genotipo y ambiente. comportarse óptimamente en un amplio rango
de ambientes es lo que Finlay y Wilkinson (1963)
Desde el punto de vista de la Mejora de plan- definieron como adaptabilidad general, y la
tas, la interacción GxE representa, sobre todo, un capacidad de comportarse óptimamente en
continuo reto: puede ser una eficaz ayuda, pero algunos ambientes específicos, como estabili-
también puede reducir los progresos de la selec- dad específica.
ción y los rendimientos esperados por el destinata-
rio de todos los programas de Mejora: el agricultor. Pueden distinguirse dos conceptos básicos
de estabilidad fenotípica tal y como esta-
bleció Becker (1981):
1.1. Estabilidad y adaptabilidad
1) concepto biológico: tendrán estabili-
Los investigadores coinciden en general en dad fenotípica aquellos genotipos que muestran
la importancia de obtener variedades esta- variación mínima, medible por la varianza esta-
bles (se sobrentiende: estables en ambientes dística, frente los diferentes ambientes;
muy diversos) de alto rendimiento, pero no se
ponen de acuerdo en la definición del concepto 2) concepto agronómico: un genotipo
de estabilidad ni en los métodos estadísticos estable será el que muestre una mínima interac-
para su estimación. ción medida por la ecovalencia (véase más
abajo su definición).
La interacción GxE puede ser interpretada
en parte como resultado de una respuesta dife- Tradicionalmente, los mejoradores han utiliza-
rencial a diversos estreses ambientales (sequía, do el término de estabilidad para caracterizar
salinidad, enfermedades, ...); consecuentemen- aquellas variedades (recuérdese: idealmente
te, la mejora para resistencia se traduciría en un genotipos.) que muestran un rendimiento constan-
aumento de la estabilidad. Pero generalmente, te en diferentes ambientes, es decir, los que mues-
sólo una pequeña parte de la interacción GxE tran una varianza mínima frente a éstos. Esta idea
puede ser atribuida a determinantes ambienta- de estabilidad está en la misma línea que el con-
les conocidos; la mayor parte es justamente una cepto de homeostasis genético usado en
cantidad inexplicable en los análisis estadísticos Genética Cuantitativa, e introducido por Lerner
de los ensayos de rendimiento, a la que se cono- (1954) quien lo definió como una propiedad de los
ce con el término de “error experimental”. Cuan- organismos a adaptarse a condiciones variables
21
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
permitiendo una estabilización frente a las fluctua- Tipo 1 es análoga al concepto de homeostasis y
ciones ambientales; constituye el llamado con- corresponde a la definición de estabilidad bajo
cepto biológico de estabilidad. un concepto biológico, diferenciándola de la
definida bajo un concepto agronómico, la cual
Pero en la agricultura moderna, la idea home- es equivalente al Tipo 2 (ver más arriba).
ostática de estabilidad no resulta interesante
debido a que unas nuevas variedades no res- La estabilidad de Tipo 3 está basada en el
ponderían con incrementos de rendimiento a concepto de estabilidad de Eberhart y Russell
unas mejores condiciones de crecimiento. Este (1966), y se fundamenta en que la variabilidad
hecho nos conduce al concepto de estabili- de un genotipo con respecto al ambiente (loca-
dad agronómica. Así, un genotipo se consi- lidades, años, localidades x años) puede ser
dera estable cuando su rendimiento está en el dividida en dos partes: una parte predecible
nivel de productividad determinado por un correspondiente a una posible regresión entre
ambiente concreto. Una medida de esta estabili- genotipos y ambientes, y otra impredecible
dad es la ecovalencia (Wi) propuesta por correspondiente a los cuadrados medios de la
desviación estadística respecto a la regresión
Wricke (1962,1964) definida como la contribu- lineal. Un genotipo se consideraría estable si la
ción de un genotipo concreto a la suma de cua- suma residual de cuadrados es pequeña.
drados total de la interacción GxE en un análisis Todos estos parámetros los obtenemos por
de la varianza. medio de un análisis de la varianza (ANOVA)
convencional.
La interacción GxE se considera de tipo La estabilidad de Tipo 4 puede medir la
cuantitativo si las ordenaciones de los geno- capacidad de un genotipo, en sentido homeos-
tipos no cambian al pasar de un ambiente a otro, tático, para resistir variaciones ambientales
esto es, si la respuesta diferencial de un genoti- impredecibles o súbitas. En contraste con los
po comparado con otro es la misma indepen- otros tres tipos de estabilidad, el Tipo 4 tiene la
dientemente del ambiente en cuestión (Fig. 1, b). ventaja de proporcionar información acerca de
Para los mejoradores este tipo de interacción la capacidad de un genotipo para superar la
cuantitativa es menos importante que la denomi- variación debida al componente impredecible,
nada de tipo cualitativo, en la cual los genoti- propiedad que no poseen los anteriores tipos
pos cambian sus ordenaciones relativas en los de estabilidad. Sin embargo, una desventaja
distintos ambientes (Fig. 1, c). Este tipo de inte- del Tipo 4 es que se requiere incluir en el ensa-
racción complica el proceso de selección y yo un factor “tiempo” añadido al término varie-
recomendación de buenos genotipos. dad x localidad. La razón es que sólo entonces
podremos separar la variación predecible, pro-
Lin y col. (1986) y Lin y Binns, (1988, 1989), por veniente del factor “suelo”, de la variación
su parte definen cuatro conceptos estadísticos de impredecible derivada del factor “tiempo”. El
estabilidad. Un genotipo se considera estable: factor ideal de tiempo es el “año”, pues parece
Tipo 1: si su varianza entre ambientes es el más natural, pero no tiene por qué serlo; pue-
pequeña. den serlo, en efecto, las estaciones, las épocas
Tipo 2: si su respuesta a los ambientes es de siembra, etc.
paralela a la respuesta media de
todos los genotipos del ensayo. Todos estos conceptos están en clara con-
Tipo 3: si la suma de cuadrados residual de tradicción entre sí, habiéndose usado de forma
la regresión sobre el índice ambiental alternativa en muchos trabajos, puesto que un
es pequeña. genotipo estable en un sentido puede ser ines-
Tipo 4: si su cuadrado medio dentro de table en otros sentidos. Por ejemplo, un genoti-
ambientes, esto es, si su variabilidad po puede ser estable de Tipo 1 pero ser inesta-
para cualquier ambiente en diferentes ble de Tipo 2, o puede ser considerado como
años, es pequeña. inestable desde el sentido de estabilidad de
Tipo 3 pero simultáneamente estable de Tipo 2,
a) No existe interacción, b) Interacción de tipo etc. Es difícil reconciliar todos estos conceptos
cuantitativo, c) Interacción de tipo cualitativo. dentro de un criterio unificado. La razón básica
de ésta dificultad es que la respuesta de un
Se observará claramente el aumento de com- genotipo a distintos ambientes es mul-
plejidad en las definiciones. La estabilidad de tivariante. Y, sin embargo, las definiciones
22
Íntroducción Introducción Introducción Introducción Introducción Introducción Introducción Introducción
Figura 1..Tipos de interacción para dos genotipos hipotéticos.
a)
GENOTIPO 1
VARIABLE
GENOTIPO 2
1 AMBIENTES 2
b)
GENOTIPO 1
VARIABLE
GENOTIPO 2
1 AMBIENTES 2
c)
GENOTIPO 2
VARIABLE
GENOTIPO 1
1 AMBIENTES 2
23
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
anteriores la transforman en un problema univa- Pero un mejorador trata, casi siempre, de bus-
riante, ya que todo se basa en la obtención de car genotipos estables y, al mismo tiempo, de alto
un sólo índice de estabilidad. rendimiento. Ahora bien, la estabilidad medida en
base a este concepto estático va normalmente
Se han propuesto numerosos métodos para asociada a rendimientos relativamente bajos. Por
estimar la estabilidad fenotípica o analizar la ello, se recomienda el concepto dinámico para
interacción GxE; la mayoría están fuertemente estudios de estabilidad de rendimiento.
relacionados con el concepto agronómico de
estabilidad, como por ejemplo los métodos Frecuentemente, en relación con el rendi-
paramétricos univariantes. Posteriormente, se miento y otros caracteres cuantitativos, muchos
propusieron métodos no paramétricos, los que, genotipos reaccionan de forma similar a condi-
por estar basados en las ordenaciones de los ciones ambientales favorables o desfavorables.
genotipos, no necesitan cumplir ninguna condi- Esta respuesta diferencial al ambiente produce
ción sobre la distribución de los datos observa- variaciones de la media para el carácter consi-
dos (en términos estadísticos, sobre la homo- derado. De acuerdo con el concepto dinámico,
geneidad de varianzas). También se han intro- sólo las desviaciones de un genotipo, respecto a
ducido técnicas de análisis multivariante para todos los ambientes, se consideran como contri-
el análisis de la estabilidad. Estos métodos buyentes de inestabilidad en relación con esta
suministran una información amplia y nueva reacción general, porque la respuesta general
sobre la verdadera respuesta de los genotipos (es decir, la media de todos los genotipos en un
a los ambientes. determinado ambiente) puede ser interpretada
como un efecto (=índice) ambiental.
1.2. Métodos biométricos para estimar
la estabilidad: paramétricos 1.2.1. Partición de la Suma de Cuadrados de la
univa-riantes Interacción GxE
ción como paso previo a efectuar cualquier infe- tulos posteriores. Aquí sólo se dará una breve
rencia sobre los factores principales, es decir, idea de los mismos.
genotipos y ambientes.
Salmon (1951) y Plaisted y Peterson (1959)
Léon (1985), definió dos conceptos básicos realizaron un análisis de varianza para todos
de estabilidad, dependiendo del fin propuesto y los genotipos tomados de dos en dos, con
del carácter en consideración: concepto objeto de estimar la varianza de la interacción
estático y concepto dinámico. Ambos para todas las combinaciones posibles de
coinciden respectivamente con los ya mencio- genotipos. La media de las varianzas obtenidas
nados conceptos biológico y agronómico de para cada genotipo se utilizaba como un índice
Becker (1981). de la contribución de un genotipo a la interac-
ción GxE total.
La estabilidad fenotípica de acuerdo con el
concepto estático fue medida ya por Roemer en Plaisted (1960) propuso estimar la contribu-
1917, y más tarde por numerosos autores, utili- ción de cada genotipo a la suma de cuadrados
zando la varianza de cada genotipo respecto de de la interacción GxE de la siguiente forma: 1º)
todos los ambientes del ensayo, que denominó se realiza el análisis de la varianza con todos los
varianza ambiental (Sxi) la cual detecta genotipos del ensayo omitiendo en el análisis el
todas las desviaciones respecto de la media genotipo del cual queremos calcular su contri-
genotípica (ver fórmula [14]). Este concepto de bución a la GxE; 2º) una medida de la estabili-
estabilidad es útil para caracteres como calidad, dad del genotipo omitido vendría dada, según
resistencia a enfermedades y a estreses abióti- Plaisted, por la varianza de la interacción GxE
cos (frío, sequía, ... etc.). obtenida en el análisis anterior.
24
Íntroducción Introducción Introducción Introducción Introducción Introducción Introducción Introducción
Wricke (1962) define el término ecovalen- mayor que el error estándar de la media de la
cia (Wi) como la contribución de cada genotipo, respuesta máxima, el cultivar más productivo
en todos los ambientes, a la suma de cuadrados puede ser recomendado en toda la región.
de la interacción (ver fórmula [12]). Si la ecova-
lencia es pequeña, la estabilidad agronómica (o La principal desventaja encontrada por algu-
de Tipo 2) es alta. nos investigadores es que dicho estadístico
muestra una alta correlación con el rendimiento,
Shukla (1972) propuso una estima insesgada que puede llegar a ser total. De este modo,
de la varianza de la interacción para cada geno- seleccionar por este estadístico es seleccionar
tipo. A este estadístico lo denominó varianza fundamentalmente por rendimiento y no por el
de la estabilidad (ver fórmula [8]). binomio rendimiento+estabilidad.
comprobarse también que todos estos estadísti- estabilidad fenotípica a través de los ambientes
cos producen la misma ordenación para un con- es mediante el coeficiente de regresión de cada
junto de genotipos determinado; sin embargo, genotipo sobre la media ambiental. Por su popu-
mientras los tres primeros son meramente índi- laridad entre los mejoradores, se lo considerará
ces numéricos, el de Shukla (1972) permite com- aquí con cierto detalle.
probar la homogeneidad de las estimas.
El primero en introducir ésta técnica fue Moo-
Dado que el establecimiento de testigos en un ers (1921); posteriormente fue descrita y elabo-
ensayo de cultivares no resulta siempre fácil, debi- rada por Yates y Cochran (1938), quienes utili-
do a que el mejor testigo en una localidad no tiene zaron la media total de todos los genotipos en un
por que serlo en otra, Lin y Binns (1988) propusie- ambiente determinado como índice ambiental,
ron una medida única de la superioridad del com- esto es, como medida del ambiente. El compor-
portamiento de un genotipo, definiéndola como el tamiento de un cierto genotipo o grupo de geno-
cuadrado medio de la distancia entre la respuesta tipos se estudiaba por medio de la regresión
de un genotipo y el genotipo de máxima respues- lineal de las medias del genotipo en cada
ta, en un ambiente dado. Con este método, la ambiente en función de los dichos índices o
máxima respuesta en un ambiente se convierte en valores ambientales (Fig. 2).
el testigo a considerar. Según dichos autores las
ventajas de este método son las siguientes: El uso de ésta técnica como base para el
análisis de varianza y asociado a pruebas de
- No son necesarios los “genotipos control”, es hipótesis fue discutido por Mandel (1961),
decir, testigos comunes para todos los ambientes quien demostró ser una extensión de la prueba
del ensayo: basta con incluir los genotipos mejor de Tukey (1949) con un grado de libertad para
adaptados localmente para cada ambiente. no-aditividad. En efecto, si t es el número de
genotipos, Mandel definió un componente con
- Sólo se necesita un parámetro para carac- t-1 grados de libertad de la suma de cuadra-
terizar la estabilidad de la producción potencial dos de la interacción; dicho componente es
de cada genotipo. independiente de los efectos ambientales y
representa la suma de cuadrados de la hetero-
- La adaptabilidad específica de un genotipo geneidad de las t pendientes de regresión.
se puede identificar dibujando tanto la respues- Mandel demostró que si las pendientes son
ta real del genotipo de máxima respuesta como idénticas éstas se distribuyen como una Chi-
la del genotipo en cuestión en función de la cuadrado; basta pues, realizar una prueba F
media de cada ambiente. para comprobar la existencia de pendientes
diferentes, siendo la hipótesis nula el que todas
- La diferencia entre la media de la respues- las pendientes sean iguales.
ta máxima en todos los ambientes y la media del
cultivar más productivo suministra una importan- Finlay y Wilkinson (1963) consideraron que
te información a la hora de recomendar cultiva- una simple comparación de pendientes no es
res; así, cuando esta diferencia no es mucho suficiente para determinar estabilidad; la media
25
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Figura 2.. Líneas de regresión para los 11 genotipos.
4,000
3,500
3,000
2,500
2,000
1,500
2,500 2,800 3,100 3,400 3,700 4,000 4,300 4,600
GEN 1
GEN 7
GEN 2
GEN 8
GEN 3
GEN 9
GEN 4
GEN 10
GEN 5
GEN 11
GEN 5
total de cada genotipo también debería entrar en modelo lineal es bueno, S2di y ecovalencia están
el estudio. Así, los genotipos con pendiente cer- altamente correlacionadas, según Becker (1981).
cana a 1 y alto rendimiento se considerarían
como bien adaptados a todos los ambientes. Estos dos estadísticos del método de regre-
sión, bi y S2di, han sido utilizados de diferentes
Como se puede observar, todo ello no es formas. Mientras S2di está fuertemente relaciona-
nada más que un redescubrimiento de las ideas do con la parte impredecible de la variabilidad
de Yates y Cochran ya expuestas en 1938. de un genotipo (es decir, puede ser observado
como un parámetro de estabilidad), el coeficien-
En el método del análisis de regresión los te de regresión bi caracteriza la respuesta espe-
efectos de la interacción GxE pueden ser expre- cífica de los genotipos al efecto ambiental,
sados de la siguiente forma: pudiéndose considerar como un parámetro de
respuesta. Los genotipos que no reaccionan
(ge)ij = ßiej + dij frente a los factores ambientales mostrarán una
pendiente cero y podrían ser estables de acuer-
donde ßi es el coeficiente de regresión lineal do con el concepto estático. Por otro lado, los
para el genotipo i y dij un residuo. genotipos que muestran una respuesta media a
los cambios ambientales (es decir, responden
Se han propuesto dos técnicas de regresión pobremente en los ambientes de bajo rendi-
aparentemente distintas para explicar la interac- miento y responden muy bien en los ambientes
ción GxE. Una calcula la regresión de los efec- de alto rendimiento) tendrán pendientes igual a
tos de la interacción sobre los efectos ambienta- 1. Para la ordenación de los genotipos será más
les (ßi; Perkins y Jinks, 1968a,b) y la otra realiza estable aquél que muestre el valor de S2di más
la regresión de valores medios sobre medias de próximo a cero.
ambientes (bi; Finlay y Wilkinson, 1963) (Fig. 2):
Ahora bien, ambos estadísticos son equivalentes Pinthus (1973) propuso utilizar el coeficiente
ya que ßi=bi-1. de determinación (r2i), asimismo obtenido en el
análisis de regresión, como estimador de la esta-
Como complemento al coeficiente de regre- bilidad de un genotipo en lugar de S2di. La apli-
sión, el cuadrado medio residual de las desvia- cación de r2i tiene la ventaja de que es indepen-
ciones de la regresión (S2di), tal como se lo obtie- diente de las unidades de medida.
ne en un análisis rutinario de regresión, describe
la contribución del genotipo i a la interacción GxE Freeman (1973) denomina análisis de
(Eberhart y Russell, 1966). Cuando el ajuste al varianza y regresión conjunta al hecho de
26
Íntroducción Introducción Introducción Introducción Introducción Introducción Introducción Introducción
descomponer los grados de libertad (t-1)*(s-1), tigo al ensayo. Sin embargo, si el número de
siendo t el número de genotipos y s el de genotipos es grande los resultados difieren muy
ambientes, y la suma de cuadrados de la inte- poco cuando empleamos estas medidas inde-
racción GxE, en dos componentes, uno con t-1 pendientes de las que se obtienen utilizando la
grados de libertad, para comprobar la heteroge- media ambiental.
neidad de las regresiones, y otro que recoge las
desviaciones de la regresión con (t-1)*(s-2) g.l. 2) La segunda limitación estadística es que el
Cada uno de estos componentes se compara error asociado con las pendientes de los genoti-
con el cuadrado medio del error experimental; si pos no es estadísticamente independiente de
la heterogeneidad de las regresiones es signifi- éstos, porque la suma de cuadrados para la
cativa, podemos rechazar la hipótesis nula de desviación, con (t-1)*(s-2) g.l., no puede ser sub-
que todos los genotipos tienen los mismos coefi- dividida ortogonalmente en t componentes
cientes de regresión y, por consiguiente, la correspondientes a genotipos.
misma estabilidad. Además, el componente de
heterogeneidad puede compararse con el cua- 3) Implícito en el método está el admitir que
drado medio de las desviaciones para compro- existe una relación lineal entre la interacción y las
bar si las regresiones explican una parte impor- medias ambientales. Cuando este requisito no se
tante de la interacción observada. da, la efectividad del análisis se reduce y los resul-
tados pueden ser engañosos ya que el análisis
Eagles y col., (1977) sugieren que de la frac- requiere que una alta proporción de la interacción
ción denominada “heterogeneidad de las regre- pueda ser explicada mediante regresión lineal.
siones”, en el análisis de varianza y regresión Otros autores han propuesto análisis de regresión
conjunta, se puede extraer un componente con no lineales; por ejemplo, Hill y Baylor (1983) utiliza-
un grado de libertad que nos indicaría la ten- ron un contraste ortogonal del análisis de la varian-
dencia de las líneas de regresión a converger en za subdividiendo la variación frente a ambientes
un punto. Cuando las líneas de regresión tienden (años y localidades) para cada genotipo en efectos
significativamente a converger en un punto nos lineales y cuadráticos de los ambientes.
indica la existencia de una alta correlación entre
los coeficientes de regresión y las medias geno- 4) Los coeficientes de regresión son estima-
típicas en todos los ambientes. Esta conclusión ciones sesgadas debido al hecho de suponer
la podemos deducir sin más que ver la ecuación que en el análisis de regresión, la variable inde-
[9], ecuación que nos permite calcular la suma pendiente, en este caso la media ambiental, ha
de cuadrados del factor convergencia. sido medida sin error. Este sesgo depende del
número de genotipos del ensayo y del cociente
A pesar de la gran utilización que ha tenido la varianza ambiental/varianza del error. En un buen
técnica de regresión, los problemas inherentes a diseño experimental (por ejemplo, un gran núme-
la misma son numerosos e importantes, habien- ro de repeticiones y/o contrastando condiciones
do sido objeto de discusión en muchos trabajos. ambientales) este cociente sería grande y el
Aunque es un método práctico y funcional, es de sesgo pequeño, pero en otras muchas condicio-
débil base teórica ya que: nes (por ejemplo, un número pequeño de repeti-
ciones, etc), el sesgo puede ser importante.
1) La media genotípica no es independiente
de las medias marginales de los ambientes. 5) Existe una interdependencia biológica y
Realizar la regresión de una variable sobre la algebraica entre las pendientes y las sumas de
otra no siendo independientes viola uno de los cuadrados de las desviaciones de la regresión.
requisitos fundamentales del análisis de regre- Esto puede ser consecuencia del propio proce-
sión. Esta interdependencia es un problema dimiento de ajustar los datos a una línea recta.
grave cuando el número de genotipos es
pequeño, pero cuando éste es superior a 15 el 6) Otro problema es que cuando en nuestro
problema es menor. Como solución, Freeman y ensayo existen pocos ambientes que sean o de
Perkins (1971) sugirieron que la regresión alto o de bajo rendimiento, el ajuste de un
podría estar basada sobre medidas indepen- genotipo concreto puede estar grandemente
dientes de los ambientes; así, por ejemplo, se influenciado por su comportamiento en éstos
podrían realizar los cálculos omitiendo sucesi- pocos ambientes, con posibilidad de obtener
vamente el genotipo en cuestion en el análisis resultados muy dudosos. Es decir, el coeficien-
de la regresión, o bien añadiendo genotipos tes- te y las desviaciones de la regresión pueden
27
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
variar sustancialmente al no disponer de dispone de un número suficientemente grande
ambientes extremos. de genotipos, ambientes y repeticiones, y con
homogeneidad de varianzas (necesaria para el
7) La relativa estabilidad de dos genotipos análisis de varianza), el método de regresión
cualquiera depende no sólo del grupo de locali- puede ser recomendable.
dades analizadas en el ensayo sino también del
resto de genotipos ensayados. Se ha demostra- Regresiones segmentadas. El análisis
do que la estabilidad de un genotipo depende de regresión convencional presupone una rela-
del comportamiento medio del grupo en el cual ción lineal entre la interacción GxE y los valores
está siendo comparado. aditivos ambientales (ej). Cuando, sin embargo,
esta relación es significativamente no lineal, el
8) Cuando el conjunto de genotipos es gran- análisis de regresión simple no puede ser utiliza-
de, parece existir una correlación positiva entre do plenamente como herramienta predictiva.
producciones medias y los coeficientes de Verma y col. (1978) proponen una modificación
regresión. a la regresión lineal convencional; sugieren divi-
dir los ambientes en dos grupos según el signo
9) Estas técnicas son más descriptivas que del índice ambiental: los ambientes de bajo ren-
predictivas, y por ello, no mejoran el conoci- dimiento (o signo negativo) y los de alto rendi-
miento sobre la interacción GxE. miento (signo positivo). Se efectuaría la regre-
sión lineal para cada grupo de ambientes (con el
10) Con bastante frecuencia, no hay suficien- índice ambiental, como siempre, en abcisas),
te variabilidad genética dentro del conjunto de con un punto de truncadura en el valor cero (Fig.
genotipos estudiados. 3). Esta modificación es muy simple y es un
método más conveniente para detectar diferen-
11) Para determinar en un ensayo cual de los cias entre genotipos que complicadas regresio-
genotipos se comporta como superior a los nes cuadráticas.
demás, los mejoradores tienen la dificultad de
definirse entre el rendimiento medio, pendiente y Según Virk y col. (1988) al utilizarse como índi-
desviación de la regresión, porque la respuesta ce ambiental, en los modelos de regresión lineal,
genotípica a los ambientes es intrínsicamente la media de todos los genotipos, la consecuencia
multivariante y el análisis de regresión lo trans- de medir el valor ambiental de esta forma es que
forma en un problema univariante. la respuesta media de todos los genotipos frente
a todo el conjunto de ambientes podría tener pen-
Revisando estas consideraciones estadísti- diente uno. Por ello, dichos autores modifican el
cas, Skrøppa (1984) concluyó que en aquellos modelo anterior de la Fig. 3, que tiene un punto fijo
casos en que las desviaciones de la regresión, de truncamiento (pues sólo considera dos grupos
así como la convergencia de las líneas de regre- de ambientes), por un modelo en el cual existen
sión, no son significativas, y cuando la heteroge- varios puntos de truncamiento específicos para
neidad de las pendientes es significativa, si se cada genotipo y determinados por los cambios
Rendimiento medio
200
b>1
150
b=1
100 b=0
50
0
-60 -50 -40 -30 -20 -10 0 10 20 30 40 50 60
Indice Ambiental
Gen. con estab. media Gen. con estab. pobre
Gen. con estab. alta Gen. teóricam. ideal
28
Íntroducción Introducción Introducción Introducción Introducción Introducción Introducción Introducción
de respuesta frente a la serie de ambientes esta- fueron propuestos por Hühn (1979) y Nassar y
blecidos en el ensayo. El análisis se aproxima así Hühn (1987).
a un estudio de regresión no lineal, aunque de
más fácil ejecución. Ketata y col., (1989) propusieron el uso
simultáneo de la posición media y su desviación
En resumen, siendo el análisis de regresión el estándar para cada genotipo. Representando
método más utilizado por los mejoradores en el gráficamente estas dos variables para todos los
estudio de la interacción GxE, no hay que olvi- genotipos podremos seleccionar aquellos que
dar que los resultados dependen, en gran medi- ocupen una situación de posición media alta y
da, del grado de linealidad así como de la inde- de una desviación estándar pequeña. Dichos
pendencia existente entre el índice ambiental y autores afirman que para un alto número de
el valor de los genotipos ensayados. genotipos ambas variables no están correlacio-
nadas y entonces es posible seleccionar inde-
pendientemente para alto rendimiento y baja
1.3. Métodos para medir estabilidad: variabilidad ambiental, esto es, para consis-
univariantes no-paramétricos tencia de comportamiento.
Cuando utilizamos las pruebas de significa- Kang (1988) ideó un nuevo método no-
ción para estadísticos paramétricos que nos paramétrico para seleccionar genotipos estables
miden la estabilidad, realizamos implícitamente de alto rendimiento: se establecen las ordena-
suposiciones sobre sus distribuciones y sobre la ciones de los rendimientos medios de los geno-
homogeneidad de sus varianzas. En muchos tipos, dándole el valor 1 al genotipo de más alto
casos, dichas hipótesis previas ni siquiera se rendimiento. De igual forma se establecen las
prueban. Sin embargo, con medidas no-paramé- ordenaciones de las varianzas de estabilidad
tricas de estabilidad no tenemos que tener en definida por Shukla (1972) (vease 1.2.1), con el
cuenta suposiciones de este tipo. Las pruebas valor más bajo igual a 1. Los dos números de
no-paramétricas se basan en el orden de los orden se suman: la suma de menor valor podría
genotipos en los distintos ambientes; por tanto, corresponder al genotipo más deseable.
un genotipo será estable si su posición en el
ordenamiento general de todos los genotipos es El método estratificado de ordena-
similar en los distintos ambientes. Otra ventaja ciones, propuesto por Fox y col. (1990) para
de los estadísticos no-paramétricos frente a los analizar la adaptación general, consiste en con-
paramétricos es que son menos sensibles a tar el número de ambientes para los cuales un
errores de medida y que la adición u omisión de genotipo ocupa los primeros órdenes, los
una o varias observaciones no causa grandes medios o los bajos del ensayo. Un genotipo con
variaciones en las estimaciones. Según Becker y la mayoría de los números de orden en el primer
Léon (1988), el primero que utilizó esta técnica tercio superior se considera como ampliamente
fue Haldane (1946). adaptado. Es por tanto, un método no-paramétri-
co muy simple e independiente de toda escala.
Normalmente los números de orden de los
genotipos en cada ambiente se determinan por
sus valores observados Xij (=valor medio res- 1.4. Métodos para medir estabilidad:
pecto de las repeticiones); sin embargo, la esta- Multivariantes
bilidad fenotípica puede ser medida indepen-
dientemente de los efectos genotípicos sin más El análisis multivariante es apropiado para
que utilizar para la ordenación los valores Xij analizar matrices de dos dimensiones,como son
corregidos [X*ij=Xij-(Xi.-X..)], donde Xi. es la las que contienen datos de G genotipos y E
media marginal del genotipo i y X.. la media total ambientes. La respuesta de cualquier genotipo
del ensayo. De esta forma, el número de orden en los E ambientes puede representarse en un
de cada genotipo sólo dependerá de la interac- espacio E-dimensional, siendo las coordena-
ción y del error experimental. das para un eje los rendimientos (o cualquier
otro carácter) genotípicos en un ambiente.
Los estadísticos no-paramétricos calculados
en base a las ordenaciones de los datos corre- Se han utilizado dos grupos de técnicas mul-
gidos, que permiten una mejor interpretación de tivariantes para estudiar la estructura interna de
los resultados que el de los datos sin corregir, la interacción GxE:
29
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
1) Técnicas de ordenación, tales como da extrayendo nuevos componentes principales
Análisis de Componentes Principales, Análisis o, más fácilmente, examinando la matriz de
de Coordenadas Principales y Análisis Factorial. correlación residual, después de extraer el pri-
Estas técnicas representan la relación genotipo- mer componente. Por ejemplo, Perkins y Jinks
ambiente tan fielmente como es posible hacerlo (1968a,b), estudiando la altura de planta en líne-
en un espacio de pocas dimensiones. En las as de Nicotiana rustica, encontraron que los
gráficas resultantes de estos análisis observa- genotipos del ensayo podían ser divididos en
mos cómo los genotipos o los ambientes simila- dos grupos siguiendo el sistema anterior: los
res están mas cercanos entre sí que aquellos genotipos que mostraban una correlación resi-
cuyo comportamiento es distinto al de los ante- dual positiva formaban un grupo y los que mos-
riores. Estas técnicas son efectivas para mostrar traban una correlación negativa otro.
relaciones y reducir el “ruido” de nuestros datos.
Ahora bien, como ya se ha comentado, el
2) Técnicas de clasificación, como el método de la regresión lineal utiliza un sólo esta-
Análisis de Grupos y el Análisis Discriminante. dístico, el coeficiente de regresión, para descri-
Estos métodos agrupan entradas similares en bir el patrón de respuesta de los genotipos fren-
forma de nubes de puntos (“clusters”). te a los ambientes, y mucha de la información
perdida se recoge en la desviación. Por otra
parte, el Análisis de Componentes Principales es
1.4.1. Componentes Principales una generalización de la regresión lineal que
supera esta dificultad generando varios estadís-
El Análisis de Componentes Principales ticos, las coordenadas en los ejes de los com-
(ACP) es uno de los métodos multivariantes más ponentes principales, para describir el patrón de
utilizados y desde luego el más antiguo, cuyo respuesta de un genotipo. No es de extrañar
fundamento se le deba a Pearson, nada menos que, pues, que el Análisis de Componentes Prin-
que en 1901. Evidentemente el uso de ordena- cipales sea más eficaz que el método de regre-
dores ha facilitado la ejecución de las operacio- sión lineal en la descripción del comportamiento
nes matemáticas necesarias, de enorme com- genotípico.
plejidad en la mayor parte de los casos, y de
realización poco menos que imposible por pro- La principal dificultad del estudio de
cedimientos tradicionales. Su atractivo radica en la interacción GxE mediante el ACP,
transformar los datos de un grupo de coordena- estriba en la interpretación de los com-
das en otro de más fácil interpretación, el cual ponentes principales extraídos, ya que
preserva, tanto como sea posible, la configura- puede ocurrir que éstos no muestren ninguna
ción original del grupo de puntos y concentra un relación obvia con las condiciones ambientales.
gran porcentaje de la variación o estructura de
los datos inicial en las primeras nuevas varia-
bles, llamadas componentes principales, obteni- 1.4.2. Variables ambientales. Regresión Múltiple
das en la transformación. En este proceso de
reducción de los datos se pierde inevitablemen- Otra posibilidad es caracterizar un ambien-
te alguna información original, pérdida que se te por las medidas de los parámetros que pue-
compensa por la posibilidad de obtener una den describirlo, tales como temperatura,
mejor interpretación de los datos reales. Este humedad, precipitación, radiación, etc., ya que
análisis puede reducir efectivamente la estructu- ellos pueden explicarnos, al menos parcial-
ra de una matriz de interacción GxE de G pun- mente, la interacción GxE. Varios autores han
tos (genotipos) en E dimensiones (ambientes) a intentado relacionar el comportamiento de
un subespacio de pocas dimensiones. caracteres genotípicos, como rendimiento, en
los diversos ambientes con variables ambien-
Hay autores que, bajo ciertas condiciones, lo tales particulares mediante simple regresión
consideran un modelo equivalente al de la regre- lineal. Cuando la variable independiente domi-
sión lineal. Williams (1952) demuestra que, efec- na el carácter estudiado, entonces, por
tivamente, la estimación de los coeficientes de supuesto, la regresión lineal lo pondrá de
regresión por mínimos cuadrados es equivalente manifiesto. Sin embargo, cuando actúan simul-
a la extracción del primer componente principal táneamente varias variables independientes
en el estudio del comportamiento genotípico. La (incluso cuando actúan aditivamente), o cuan-
validez del modelo puede ser entonces evalua- do varias de ellas están correlacionadas entre
30
Íntroducción Introducción Introducción Introducción Introducción Introducción Introducción Introducción
sí, el análisis de regresión simple no es apro- los cultivos. Pocos investigadores lo han utilizado,
piado. Así pues, cuando están implicados sin embargo, para el estudio del comportamiento
muchos factores, la utilización de la regresión de los genotipos en un ensayo multilocal.
múltiple parece una necesidad.
Esto que parece tan evidente desde un punto 1.4.4. Análisis A.M.M.I.
de vista teórico no resulta tan sencillo de llevar a
la práctica, pues ha de investigarse qué varia- Mandel (1971) introdujo un nuevo tipo de
bles y de qué tipo (edáficas, climáticas, estados análisis para el estudio de una matriz bidimen-
fisiológicos, etc.) han de ser incluidas en el sional GxE utilizando para ello un método multi-
modelo y, además, en la mayor parte de los plicativo que denominó AMMI “Additive Main
casos no se dispone de los datos necesarios. effect and Multiplicative Interaction”. El primer
Otra dificultad es que si se consideran simultá- paso es realizar el análisis de la varianza y pos-
neamente muchas variables ambientales, tienen teriormente particionar la suma de cuadrados de
que obtenerse regresiones polinómicas de la interacción en una serie de componentes mul-
orden elevado para obtener un buen ajuste. tiplicativos (coordenadas genotípicas x coorde-
nadas ambientales). Prácticamente en este últi-
Varios autores han utilizado el análisis de mo decenio la utilización del Análisis de Compo-
regresión múltiple incluyendo variables climáti- nentes Principales se ha realizado como compo-
cas. Para predecir los rendimientos de diver- nente del Análisis AMMI.
sos genotipos, utilizaron la técnica de regre-
sión “paso-a-paso”, esta consiste en realizar el El AMMI estudia primeramente los efectos
análisis de regresión de manera exploratoria, aditivos principales de genotipos y ambientes
es decir, tomando diversas combinaciones de por medio de un análisis de la varianza y descri-
las variables independientes, a fin de obtener be la parte no-aditiva de la variación, esto es, la
un mínimo de varianza residual no explicada interacción GxE, por medio de un Análisis de
en términos del mismo número de variables Componentes Principales.
independientes, apartando cualesquiera varia-
bles independientes potenciales que no elimi- El método AMMI tiene tres objetivos principales:
nen una porción significativa de la variación.
Se necesita aún un estudio muy profundo de 1) Es un método de diagnosis. Resulta
investigación para determinar la utilidad real apropiado para el comienzo de los análisis esta-
de este método. dísticos del ensayo ya que nos diagnostica la
posibilidad de poder estudiar submodelos
representativos de los datos totales del ensayo.
1.4.3. Análisis Factorial
2) Clarificar la interacción GxE. El
El Análisis Factorial es un procedimiento de AMMI nos da el patrón y comportamiento de los
ordenación relacionado con el Análisis de Com- genotipos y ambientes conjuntamente.
ponentes Principales. Los factores son similares
a los componentes principales. De la misma 3) Mejora la precisión de estimas del
forma que en éste, un gran número de variables rendimiento. Se ha demostrado que se obtie-
correlacionadas se reducen a un pequeño ne la misma precisión en la estima de rendi-
número de factores. La variabilidad se explica, miento con el análisis AMMI que con otros tipos
por el contrario, en términos de factores de análisis con un número de repeticiones de 2
generales comunes a todas las variables y de a 5 veces mayor. Esta mejora en la estima
factores únicos a cada variable. Los ejes de puede utilizarse para rebajar costes, ya que
los factores generales pueden ser rotados a podemos reducir el número de repeticiones, o
posiciones oblicuas conforme a las hipótesis bien, incluir más tratamientos en el experimento.
previas que se establezcan con objeto de maxi-
mizar los factores principales y minimizar los Gauch (1985, 1988) indicó la posibilidad de
secundarios. utilizar el modelo AMMI con un enfoque predic-
tivo, además del postdictivo. Desde el punto
El Análisis Factorial se ha utilizado mucho para de vista postdictivo los datos se utilizan para
estudiar la relación existente entre componentes construir un modelo que explique los datos y
de rendimiento y características morfológicas de comparar los valores esperados con los datos
31
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
de partida. Bajo un enfoque predictivo los tegias diferentes de clasificación. La elección
datos se dividen en dos partes: los que van a que se haga de ellas resultará en grupos distin-
servir para elaborar el modelo (es decir, los tos. No existe un criterio objetivo para aceptar o
datos a los cuales les aplicamos el Análisis rechazar una elección determinada. La compa-
AMMI) y los que se reservan para la prueba de ración de los métodos de análisis de grupos dis-
validez. A partir de los datos del modelo obtene- ponibles se basa en dos aspectos: uno es la
mos los valores esperados que compararemos definición de la medida de similaridad (o disimi-
con los datos de validación. laridad) y el otro es el algoritmo usado para efec-
tuar la agrupación.
Es importante determinar qué modelo AMMI
es el más ajustado a nuestros datos. Para ello, Básicamente hay dos grandes clases de
existe un estadístico denominado RMS PD (como medidas de similaridad, según el criterio sea
veremos en el capítulo 9) cuyo valor nos indica único o múltiple. Para el primero se distinguen
cual es el modelo más preciso. Así, podemos cuatro grupos, obteniéndose las medidas de
construir varios modelos: el AMMI0, que sólo similaridad a partir de uno sólo de ellos:
estima los efectos aditivos de genotipos y
ambientes sin incluir en el modelo ningún com- - Distancia euclídea,
ponente principal, esto es, es un análisis de la - Distancia tipificada,
varianza simple; el AMMI1 que combina los efec- - Indice de disimilaridad, y
to aditivos del AMMI0 con el efecto interacción - Coeficiente de correlación.
GxE estimado por el primer componente princi-
pal (ACP 1); y así sucesivamente hasta incluir A su vez, dentro de cada grupo existen dos
todos los componentes principales en el modelo. tipos de índices: el que nos define la similaridad
usando conjuntamente efectos genéticos y la
Cuando el modelo más preciso es el AMMI1 interacción GxE, y aquellos en que la similaridad
se pueden representar las coordenadas ACP 1 de está basada solamente en la interacción GxE.
genotipos y ambientes (en ordenadas) frente a las
medias marginales de los mismos (en abscisas): En contraste con el criterio único anterior,
es el denominado biplot de Gabriel (1971). el criterio múltiple desarrollado por Lefkovitch
(1985) utiliza un algoritmo que permite efec-
tuar más de una medida de las relaciones
1.4.5. Análisis de Grupos existentes entre cada par de genotipos. Defi-
nió la disimilaridad de genotipos por medio de
El Análisis de Grupos es un método de clasi- tres medidas:
ficación que ha sido ampliamente utilizado para
aumentar la eficacia de los ensayos o bien - Media marginal,
como un método alternativo cuando no pueden - Varianza entre ambientes y,
usarse los métodos univariantes tales como la - Distancia entre ambientes.
regresión lineal.
Esta alternativa se basa en que, para construir
El Análisis de Grupos puede realizarse bien grupos homogéneos, los genotipos pueden ser
sobre caracteres medidos, o bien sobre cual- agrupados usando todas esas medidas secuen-
quier otra variable independiente. El objetivo es cial o simultáneamente en un procedimiento de
identificar grupos de ambientes con un nivel agrupación condicional (Lefkovitch, 1980, 1982).
similar de interacción GxE a fin de identificar los Al contrario que el criterio único, esta descompo-
mejores genotipos para determinadas condicio- sición proporciona un medio de análisis para
nes. Lo que hacemos es agrupar los genotipos investigar cada medida por separado.
de acuerdo con su respuesta, es decir, agrupar
genotipos en subgrupos cualitativamente homo- Frecuentemente, la decisión sobre el valor
géneos en cuanto a su estabilidad, de tal forma de un cultivar por parte del mejorador se basa
que dentro de dichas agrupaciones no haya en la comparación de dicho cultivar con uno o
interacción GxE, pero que sí exista entre ellas. más testigos. Lin y Binns (1985) sugieren el
estudio de las interacciones entre los testigos y
Para dilucidar la interacción GxE mediante el los cultivares ensayados para determinar qué
Análisis de Grupos se han propuesto, al menos, genotipos, si no muestran interacción GxE,
10 medidas diferentes de disimilaridad y 8 estra- pueden ser directamente comparados con los
32
Íntroducción Introducción Introducción Introducción Introducción Introducción Introducción Introducción
testigos, ignorando la variabilidad entre basado en una adecuada medida de similari-
ambientes. Una vez comprobado que los culti- dad entre genotipos. La base del método es
vares no muestran interacción GxE significati- utilizar el Análisis de Coordenadas Principales
va con ninguno de los testigos conocidos, sobre ciclos (L y H) de series ambientales.
mediante la utilización de una prueba t se pue- Para ello, los ambientes se dividen en dos gru-
den agrupar aquellos cultivares que o son pos: i) aquellos cuya media marginal no supe-
superiores, o inferiores o estadísticamente ra a la media total del ensayo y ii) aquellos que
iguales al testigo. la sobrepasan. Los primeros forman progresi-
vamente lo que se denomina ciclos L (por
Esta metodología no está exenta de críti- ejemplo, ambientes de bajo rendimiento, si es
cas. Así: éste el carácter medido) y los segundos cons-
tituyen lo que se denomina ciclos H (ambien-
1) Existen gran número de algoritmos de cla- tes de alto rendimiento). Para cada ciclo, tanto
sificación, y cada uno de ellos puede producir L como H, se realiza una representación gráfi-
diferentes agrupaciones (dendrogramas). ca de las primeras dos coordenadas principa-
les. Con las sucesivas representaciones se
2) El nivel de corte en el dendrograma para pone de manifiesto directa e inmediatamente
obtener grupos de cultivares, puede ser deci- los buenos genotipos, mientras que se dese-
dido arbitrariamente. cha el resto.
4) puede conducir al establecimiento de - No depende del conjunto de genotipos
grupos difíciles de justificar y, por consiguien- incluidos en el análisis,
te, traducirse en resultados erróneos.
- Es muy fácil identificar los genotipos más
Como Cormack (1971) dijo: “en algunas estables en la secuencia de gráficas
situaciones es mejor no efectuar el aná- resultantes.
lisis de grupos y dejar al criterio del
investigador el establecimiento o no de 1.4.7. Análisis de Correspondencia
tales grupos”.
De una manera general puede considerarse
que los objetivos que se persiguen cuando se
1.4.6. Coordenadas Principales aplica el Análisis de Correspondencias son simi-
lares a aquellos perseguidos con la aplicación
El Análisis de Coordenadas Principales fue del Análisis de Componentes Principales, y pue-
desarrollado por Schoenberg (1935), Young y den resumirse en los dos puntos siguientes:
Householder (1938) y Torgerson (1952). Fue
popularizado por Gower (1966), el cual lo rela- - Estudio de las relaciones existentes entre los
cionó con otros métodos estadísticos. Es una genotipos entre sí y entre los ambientes entre sí.
generalización del Análisis de Componentes
Principales en el cual se utiliza una medida de - Estudio de la relaciones entre los genotipos
similaridad entre los individuos. Sus objetivos por un lado y los ambientes por otro.
y limitaciones son similares. Parte de una
matriz de similaridad para obtener una repre- La elección entre el Análisis de Componentes
sentación geométrica de los individuos basa- Principales y el de Correspondencias dependerá
da en una distancia (distancia de Gower), del tipo matriz de datos (filas=genotipos, colum-
razonablemente compatible con la similaridad nas=ambientes) que se desee analizar. Así como
(Cuadras, 1981). el Análisis de Componentes Principales es útil para
datos cuantitativos, el Análisis de Corresponden-
Westcott (1987) propuso un método gráfico cias es apropiado para representar tablas de fre-
para apreciar estabilidad genotípica. En él, el cuencias, aunque en la actualidad se ha empeza-
Análisis de Coordenadas Principales está do a utilizar en el estudio de la Interacción GxE.
33
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
El Análisis de Correspondecias puede consi- basado en ambos (rendimiento genotípico y
derarse como un caso particular del Análisis de estabilidad) que pueda ayudar al mejorador en
Componentes Principales aunque con propieda- la selección. Consecuentemente, los mejorado-
des que permiten una mejor representación de res le han dado más importancia, en el desarro-
la estructura de ciertas tablas de datos. Como llo de estos índices, bien al rendimiento, o bien a
peculiaridad hay que señalar que en el Análisis la estabilidad según sus propios criterios. Si la
de Correspondencias la distancia que se define estabilidad la podemos expresar como una
entre puntos no es una distancia euclídea clási- medida de variablidad o de incertidumbre,
ca, como en el ACP, etc., sino una distancia Chi- entonces las técnicas adecuadas para tomar
Cuadrado. decisiones bajo condiciones de riesgo pueden
utilizarse para desarrollar estos índices de esta-
bilidad que ponderen la importancia tanto del
1.4.8. Análisis Canónico rendimiento como de la estabilidad.
basado en distancias como la euclídea, la dis- que puedan ser preferidas, por su bajo riesgo,
tancia de Gower, la distancia chi-cuadrado, etc. por los agricultores. Es una técnica que puede
En el Análisis Canónico se utiliza la distancia de ayudar a otros métodos analíticos para la inter-
Mahalanobis D. pretación de los datos en la mejora de plantas u
otros ensayos.
El Análisis Canónico es un método de repre-
sentación de grupos a lo largo de ejes con máximo El Método “primera-seguridad” de
poder de discrimación, en relación a la distancia D. Eskridge, propuesto inicialmente por Kataoka
El Análisis Canónico resume la variación entre gru- (1963) como un medio de estimar cómo se
pos de forma parecida a como el Análisis de Com- toman decisiones en inversiones financieras
ponentes Principales resume la variación total. cuando existe el riesgo de que deriven a, por
ejemplo, bancarrota y aplicado a problemas de
El Análisis Canónico se utiliza generalmente mejora por Eskridge (1990), está basado sobre
después de un Análisis de Grupos para cercio- una probabilidad aceptable para el mejorador
rarse de la fiabilidad existente en la formación de de que no ocurra un suceso indeseable, como,
dichos grupos. En tanto que el Análisis de Gru- por ejemplo, la elección de cultivares que ten-
pos clasificaba los genotipos de acuerdo con su gan una alta probabilidad de producir bajos ren-
semejanza fenética, el Análisis Canónico empe- dimientos. Esta probabilidad se utiliza para cal-
zando con unos grupos ya definidos, procede a cular un intervalo de confianza que representa
investigar las interrelaciones entre estos grupos. los niveles de rendimiento para los cuales los
rendimientos muy bajos sólo se tendrían con un
α% de probabilidad.
1.4.9. Otros métodos
La importancia de éste método es que los
Dominancia estocástica. La Dominan- modelos de decisión resultantes pueden ser uti-
cia estocástica es una técnica poco usada en el lizados para desarrollar índices que cuantifiquen
análisis de la interacción y en la estabilidad en cuánto ha valorado un mejorador el rendi-
genotípica. Los agricultores pueden considerar miento y la estabilidad cuando está desarrollan-
nuevas tecnologías en general y a las nuevas do cultivares para un amplio intervalo de
variedades en particular como de mayor riesgo ambientes. El mejorador tendrá primero que
que las tradicionales. El riesgo puede entonces especificar una probabilidad razonable (α) de
actuar como un impedimento para su adopción. que ocurra un rendimiento bajo (así, 1 de cada
Se han propuesto gran cantidad de parámetros 20, es decir, α=0.05). Utilizando éste α se calcu-
univariantes de estabilidad para identificar geno- la un intervalo de confianza para cada genotipo.
tipos de gran adaptabilidad. Muchos de estos Este intervalo representa el nivel de rendimiento
parámetros han sido desarrollados con el interés que se espera si ocurre el desastre de obtener,
implícito de que los mejoradores puedan utilizar por alguna causa, rendimientos bajos para un
el rendimiento genotípico y la estabilidad al efec- nivel de probabilidad del α%. Los genotipos con
tuar su selección. Pero en muy pocos se ha indi- mayor valor del extremo superior de este inter-
cado explícitamente como desarrollar un índice valo serán los seleccionados.
34
Íntroducción Introducción Introducción Introducción Introducción Introducción Introducción Introducción
Un importante resultado de los ensayos mul- “genotipos” como fijo. Los parámetros de este
tilocales es la construcción de una tabla de dos tipo de modelos pueden estimarse por máxima
vías donde se sitúan los rendimientos estimados verosimilitud restringida (REML) (Denis et al.
de cada genotipo en varios ambientes. Esta 1997; Piepho, 1998). Una de las mayores venta-
tabla es la base para el estudio de la interacción jas de aplicar la metodología REML es su utilidad
genotipo ambiente. El estimador más natural y para el manejo de datos no equilibrados. Piepho
más utilizado para la construcción de estas (1999) propone utilizar el procedimiento MIXED
tablas GxE es la media entre repeticiones para del SAS (SAS, 1997) para la resolución de los
cada genotipo en cada ambiente. principales modelos lineales utilizados en el
estudio de la interacción GxE, y ofrece las
Se ha demostrado, sin embargo, que existen corrientes de control en SAS correspondientes al
otros estimadores que pueden ser predictiva- modelo de la varianza de estabilidad de Shukla
mente más precisos que la media; por ejemplo, (1972), a los modelos de regresión de Finlay-Wil-
los estimadores basados en modelos multiplica- kinson (1963) y de Eberhart-Russel (1966), al de
tivos como el AMMI (Gauch, 1992) y los factores la varianza ambiental (Becker y Leon, 1988) y
de reducción (Cornelius et al 1994, 1996), y el finalmente, a un modelo multiplicativo como el
mejor predictor lineal insesgado (BLUP) basado AMMI (Gauch, 1988).
en un análisis de varianza de dos vías (Cornelius
et al 1994, 1996; Piepho, 1994). Cuando se poseen datos adicionales de
variables ambientales o genotípicas como datos
En el AMMI tanto “genotipos” como “ambien- meteorológicos, análisis de suelo, reacciones a
tes” son considerados como factores fijos (Piep- enfermedades, días a floración, marcadores
ho, 1994). Sin embargo, según Stroup y Multize moleculares, etc, la regresión factorial (Denis,
(1991) cuando el número de genotipos es lo sufi- 1988; van Eeuwijk et al 1996) puede utilizarse
cientemente grande debería considerarse como para determinar la influencia de estas covaria-
factor aleatorio, pero si el factor “genotipo” es bles sobre la interacción GxE. Los modelos de
aleatorio, la interacción GxE también lo será. regresión factorial (RF) son modelos lineales que
Stroup y Multize (1991) consideran que si, en un explican la interacción GxE en función de las
ensayo de variedades, estas están entre 20 y respuestas diferenciales de los genotipos a las
100, el BLUP es más eficaz que el BLUE. Piepho distintas covariables ambientales o genotípicas
(1994) aclara que considerar el factor “genotipo” incluidas en el modelo; según Vargas et al
como aleatorio no necesariamente elimina nues- (1999), tiene la ventaja de poder probar estadís-
tro interés de estimar el rendimiento de genoti- ticamente la influencia de estas covariables
pos concretos. sobre la interacción GxE del rendimiento. Los
modelos RF son también modelos multiplicativos
Piepho (1994) concluyó que las estimaciones como el AMMI; la principal diferencia es que los
obtenidas con el BLUP son predictivamente más primeros se construyen directamente como una
precisas que los obtenidas por el modelo AMMI, función de covariables ambientales o genotípi-
y en Piepho (1998) completó el análisis señalan- cas. Cuando ambos tipos de covariables se inte-
do que el BLUP era ligeramente superior a los gran simultáneamente en el modelo de RF se
factores de reducción de Cornelius et al (1996), realiza una regresión múltiple paso a paso para
aunque Cornelius y Crossa (1999) concluyeron cada covariable, siendo, según Vargas et al
justamente lo contrario. (1999), una herramienta útil para seleccionar las
más importantes covariables que explican la
Más usual es considerar los efectos ambien- interacción GxE.
tales como aleatorios y los efectos genotípicos
como fijos, y por esta razón Henderson (1975) Cuando realizamos un análisis de QTLs con
recomendó los modelos mixtos que proporcio- datos en diferentes localidades, puede existir
nan el mejor estimador lineal insesgado (BLUE) interacción GxE cuando los alelos favorables sólo
para genotipo (efecto fijo) y el mejor predictor se muestran en algunos ambientes. Romagosa et
lineal insesgado (BLUP) para los efectos aleato- al (1996) estudiaron la utilidad del modelo AMMI
rios (Kang, 1998). Según Piepho (1999) la mayo- para identificar QTLs con un valor suficiente para
ría de los modelos estadísticos para el estudio poderse introducir en un esquema de selección
de la interacción GxE pueden expresarse por ayudada por marcadores, bajo la hipótesis de
medio de modelos lineales mixtos, donde que si la adaptación tiene base genética se
“ambientes” se considera como factor aleatorio y podrían identificar aquellas regiones del genoma
35
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
responsables de la expresión genotípica diferen- mente muy simples y fácilmente interpretables
cial en diferentes ambientes por medio del desde un punto de vista biológico. Sin embargo,
mapeo de QTLs basado en las coordenadas éste método tiene graves inconvenientes men-
genotípicas del AMMI. Concluyeron que cuando cionados en un apartado anterior de este capítu-
pueda mapearse QTLs en una población, las lo. De ahí que se deba sustituir, en la mayor
coordenadas genotípicas resultantes del análisis parte de los casos, por otros métodos, ya sean
AMMI constituyen un método adecuado para el univariantes paramétricos, univariantes no-para-
estudio de la naturaleza y de la magnitud de las métricos o multivariantes.
interacciones QTL x ambiente.
Se ha utilizado un amplio número de méto-
Yan et al (2000) desarrollaron un método dos multivariantes para analizar los ensayos
denominado “GGE biplot” para el análisis gráfico multilocales y estimar la estabilidad del rendi-
de los datos procedentes de un ensayo multi- miento. En algunos de ellos se superan las limi-
ambiental (tómese ambiente como año, locali- taciones de la regresión lineal, pero los resulta-
dad, combinación año-localidad, etc.). Las letras dos son, a menudo, difíciles de interpretar en
“GGE” se refieren a que en el modelo se unen el relación a la interacción GxE (como es el caso
efecto principal de genotipos (G) más el efecto del Análisis de Componentes Principales y el
multiplicativo de la interacción GxE (GE), siendo Análisis de Grupos).
estos dos efectos las dos fuentes de variación
más relevantes en la evaluación del comporta- Ciertas técnicas multivariantes, o combina-
miento de distintos genotipos en diferentes ciones de las mismas, ofrecen una información
ambientes. El “GGE biplot” se construye dibu- biológica relevante y son estadísticamente muy
jando los dos primeros componentes derivados simples (por ejemplo, el AMMI).
de una descomposición singular (SVD) de la
matriz de datos ambientalmente centrada. Este La combinación del Análisis de Varianza y
método desde su difusión por Yan et al (2000) ha Componentes Principales en el modelo AMMI,
recibido numerosos comentarios positivos de junto con las estimas predictivas, hacen que
reconocidos biométricos como Crossa, Gauch, éste sea un método muy válido para explicar la
Hunt, etc. De ahí que le dediquemos un nuevo estructura de la interacción y estimar con más
capítulo en esta segunda edición de este precisión los rendimientos, pero se necesita una
Manual. investigación más intensa para cuantificar la pro-
babilidad de acertar en la selección de un geno-
tipo utilizando el valor predictivo del AMMI,
1.5. Resumen general sobre los méto- comparado con los valores predictivos de
dos expuestos otros modelos.
Para genetistas, mejoradores y agronomis- a las áreas geográficas, y así poder explicar
tas, los estadísticos paramétricos de estabilidad, mejor ciertos aspectos de la interacción.
obtenidos por regresión lineal, son matemática-
36
Íntroducción Introducción Introducción Introducción Introducción Introducción Introducción Introducción
REFERENCIAS CITADAS
• BECKER, H.C. 1981:Correlations among • FINLAY, K.W. and G.N. WILKINSON, 1963:
some statistical measures of phenotypic stability. The analysis of adaptation in a plant breeding
Euphytica 30, 835-840. programme. Aust. J. Agric. Res. 14, 742-754.
• BECKER, H.C. and J. LEON. 1988: Stability • FOX, P.N., B. SKOVMAND, B.K. THOMP-
Analisys in Plant Breeding. Plant Breeding 101, 1-23. SON, H.J. BRAUN and R. CORMIER. 1990: Yield
and adaptation of hexaploid spring triticale.
• CORMACK, R.M. 1971: A Review of classi- Euphytica 47, 57-64.
fication. Journal of the royal stat. society. A134,
321-367. • FREEMAN, G.H. 1973: Statistical methods
for the analysis of genotype-environment interac-
• CORNELIUS P. L. and J. CROSSA. 1999. tions. Heredity 31 (3), 339-354.
Prediction Assessment of Shrinkage Estimators
of Multiplicative Models for Multi-Environment • FREEMAN, G.H. and J.M. PERKINS. 1971:
Cultivar Trials. Crop Science, 39:998-1009. Environmental and genotype-environmental
components of variability. VIII. Heredity 27, 15-
• CORNELIUS, P.L., CROSSA, J. and M.S. 23.
SEYEDSADR. 1994. Test and estimators of multi-
plicative models for variety trials. Proc 1993 Kan- • GABRIEL, K.R. 1971: The biplot graphic
sas State Univ. Conf. On Applied Statistics in display of matrices with application to princi-
Agriculture. Manhatten, Kansas, pp. 156-169. pal component analysis. Biometrika 58, 453-
467.
• CORNELIUS, P.L., CROSSA, J. and M.S.
SEYEDSADR. 1996. Statistical tests and estima- • GAUCH, H.G. 1985: Mimeo 85-7. Cornell
tors of multiplicative models for genotype by Univ. Ithaca, New York.
environment data. In: Kang M.S., Gauch, H.G. Jr.
(eds) Genotype by environment interaction. CRC • GAUCH, H.G. 1988: Model selection and
Press, Boca Raton, pp. 199-234. validation for yield trials with interactions. Biome-
trics 44, 705-715.
• CUADRAS, C.M. 1981: Métodos de análi-
sis multivariante. Ed. por Eunibar. Barcelona. • GAUCH, H.G. Jr. 1992. Statistical analysis
of regional yield trials. Elsevier, Amsterdam.
• DENIS, J.B. 1988. Two-way analysis using
covariates. Statistics 19: 123-132. • GOWER, J.C. 1966: Some distance pro-
perties of latent root and vector methods
• DENIS, J.B., PIEPHO, H.P. and F.A. VAN used in multivariate analysis. Biometrika 3,
EEUWIJK. 1997. Modelling expectation and 325-338.
variance for genotype by environment data.
Heredity 79:162-171. • HALDANE, J.B.S. 1946: The interaction of
nature and nurture. Ann. Eugenics. 13, 197-
• DORTS, J.C. 1957: Adaptation. Euphytica 6, 205.
247-254.
• HENDERSON, C.R. 1975. Best linear unbia-
• EAGLES, H.A., P.N. HINZ, and K.J. FREY. sed estimation and prediction under a selection
1977: Selection of superior cultivars of oats by using model. Biometrics 31: 423-447.
regression coefficients. Crop Sci. 17, 101-105.
• HILL, R.R. Jr., and J.E. BAYLOR. 1983:
• EBERHART, S.A. and W.A. RUSSELL. Genotype x environment interaction analysis for
1966: Stability Parameters for Comparing Varie- yield in alfalfa. Crop Sci. 23, 811-815.
ties. Crop Sci. 6, 36-40.
• HILL. M. O. 1974: Correspondence Analy-
• ESKRIDGE, K.M. 1990: Selection of stable sis: A Neglected Multivariate Method. Applied
cultivars using a safety-first rule. Crop Sci. 30, statistics 23, 340-354.
369-374.
37
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
• HÜHN, VON M. 1979: Beiträge zur erfas- • LIN, C.S., and M.R. BINNS, 1989: Compa-
sung der phänotypischen stabilität. EDV in Medi- rison of unpredictable environmental variation
zin und Biologie 10 (4), S. 112-117. generated by year and by seeding-time factors
for measuring type 4 stability. Theor. Appl.
• KANG, M.S. 1988: A Rank-sum method for Genet. 78, 61-64.
selectig high -yielding, stable corn genotypes.
Cereal Res. Comm.16, 113-115. • MANDEL, J. 1961: Non-additivity in two-
way analysis of variance. J. Amer. Statist. Assoc.
• KANG M.S. 1998. Using genotype by envi- 56, 878-888.
ronment interaction for crop cultivar develop-
ment, Adv. Agron. 62:199-252. • MANDEL, J. 1971: A new analysis of
variance model for non-additive data. 13, 1-18.
• KATAOKA, S. 1963: A stochastic program-
ming model. Econometrica 31, 181-196. • MOOERS, C.A. 1921: The agronomic place-
ment of varieties. J. Amer. Soc. Agronomy 13,
• KETATA, H., S.K. YAN and M. NACHIT. 337-352.
1989: Relative consistency performance across
environments. Int. Sym. on Physiology and Bree- • NASSAR, R., and M. HÜHN, 1987: Studies
ding of Winter Cereals for stressed Mediterrane- on estimation of phenotypic stability: Test of sig-
an Environments. Montpellier. July 3-6, 1989. nificance for nonparametric measures of phe-
notypic stability. Biomet. 43, 45-53.
• LEFKOVITCH, L.P. 1985: Multi-criteria clus-
tering in genotype-environment interaction pro- • PEARSON, K. 1901. Philos. Mag. 2, 559-572.
blems. Theor. Appl. Genet. 70, 585-589.
• PERKINS, J.M. and J.L. JINKS. 1968a:
• LEFKOVITH, L.P. 1982: Conditional cluster, Environmental and genotype-environmental
muster, and probability. Math. Biosci. 60, 207-234. components of variability. III. Heredity 23, 339-
356.
• LEFKOVITH, L.P. 1980: Conditional cluste-
ring. Biometrics 36, 43-58. • PERKINS, J.M. and J.L. JINKS. 1968b:
Environmental and genotype-environmental
• LEON, J. 1985: Beiträge zur erfassung der components of variability. IV. Heredity 23 (4),
phänotypischen stabilität unter besonderer 525-535.
berüecksichtigung unterschiedlincher heteroge-
nitäts- und heterozygotiegrade sowie einer • PIEPHO, H.P. 1994. Best linear unbiased
zusammenfassenden beurteilung von ertragshö- prediction (BLUP) for regional yield trials: a com-
he und ertragssicherheit. Dissertation, Christian- parison to additive main effects multiplicative
Albrechts-Universität Kiel. interaction (AMMI) analysis. Theor. Appl. Genet.
89: 647-654.
• LERNER, I.M. 1954: Genetic homeostasis.
Edinbourg, London: Oliver and Boyd. • PIEPHO, H.P. 1998. Empirical best linear
unbiased prediction in cultivar trials using factor-
• LIN, C.S. and M.R. BINNS. 1985: Procedu- analytic variance-covariance structures. Theor.
ral approach for assessing cultivar-location data: Appl. Genet. 97:195-201.
pairwise genotype-environment interactions of
test cultivars with checks. Can. J. Plant Sci. • PIEPHO, H.P. 1999. Stability analysis using
65:1065-1071. the SAS system. Agronomy Journal, 91:154-160.
• LIN, C.S., M.R. BINNS, and L.P. LEFKO- • PINTHUS, M.J. 1973: Estimate of genotypic
VITCH, 1986: Stability analysis: Where do we value: A proposed method. Euphytica 22, 121-123.
stand?.Crop Sci. 26, 894-900.
• PLAISTED, R.L. and L.C. PETERSON.
• LIN, C.S. and M.R. BINNS. 1988: A superio- 1959: A technique for evaluating the ability of
rity measure of cultivar performance for cultivar x selections to yield consistently in different
location data. Can. J. Plant Sci. 68, 193-198. locations or seasons. Amer. Potato J. 36, 381-
385.
38
Íntroducción Introducción Introducción Introducción Introducción Introducción Introducción Introducción
• PLAISTED, R.L. 1960: A shorter method for two-way genotype by environment tables. p.
for evaluating the ability of selection to yield 15-49. In M.S. Kang and H.G. Gauch (ed.)
consistently over locations. Amer. Potato J. 37, Genotype-by-environment interaction, CRC
166-172. Press, Boca Raton, FL.
• ROEMER, T. 1917: Sind die ertragsreichen • VARGAS, M., CROSSA, J., VAN EEWIJK,
sorten ertragssicherer? Mitt. DLG 32, 87-89. F.A., RAMIREZ, M.E. and K. SAYRE. 1999. Using
partial least squares regression, factorial regres-
• ROMAGOSA, I., ULLRICH, S.E., PATRICK, sion, and AMMI models for interpreting genotype
F. HAN and P. M. HAYES. 1996. Use of the addi- x environment interaction. Crop Sci. 39:955-967.
tive main effects and multiplicative interaction
model in QTL mapping for adaptation in barley. • VERMA M.M., G.S. CHAHAL and B.R.
Theor. Appl. Genet. 93:30-37. MURTY. 1978: Limitations of Conventional
Regression Analysis A Proposed Modification.
• SALMON, S.C. 1951: Analysis of variance Theor. Appl. Genet. 53, 89-91.
and longtime variety tests of wheat. Agron. J. 43,
562-570. • VIRK, D.S., P.S. VIRK, B.K. MANGAT and
G. HARINARAYANA. 1988: Linear and non-linear
• SAS Institute. 1997. SAS/STAT software: regression analysis of genotype x environment
changes and enhancements through release interactions in pearl millet. Theor Appl. Genet.
6.12. SAS Inst., Cary, NC. 75, 736-740.
llement applicable sur l’espace d’Hilbert. Annals
of Mathemetics (2nd Series) 36, 724-732. • WILLIAMS, E.J. 1952: The interpretation of
interactions in factorial experiments. Biometrika
• SHUKLA, G.K., 1972: Some Statistical 39, 65-81.
aspects of partitioning genotype-environmental
components of variability. Heredity 29, 237-245. • WRICKE, G. 1962: Uber eine methode zur
erfassung der ökologischen streubreite in feld-
• SKROPPA, T. 1984: A critical evaluation of versuchen. Z. Pflanzenzünchtg 47, 92-96.
methods available to estimate the genotypexen-
vironment interaction. Studia Forestalia Suecuca • WRICKE, G. 1964: Zur berechnung der oko-
166, 3-14. valenz be sommerweizen und hafer. Z. Planzen-
zünchtg 52, 127-138.
• STROUP, W.W. and D.K. MULITZE. 1991.
Nearest neighbor adjusted best linear unbiased • YAN, W., HUNT, L.A., SHENG, Q. and Z.
prediction. Am. Stat. 45:194-200. SZLAVNICS. 2000. Cultivar evaluation and
mega-environment investigation based on the
• TORGERSON, W.S. 1952: Multidimensional GGE biplot. Crop Sci. 40:597-605.
scaling. I. Theory and method. Psychometrika 2,
267-276. • YATES, F. and W.G. COCHRAN. 1938: The
analysis of groups of experiments. J. Agr. Sci.,
• TUKEY, J.W. 1949: One degree of freedom 28, 556-580.
for non-additivity. Biometrics 5, 232-242.
• YOUNG, G. and A.S. HOUSEHOLDER.
• VAN EEUWIJK, F.A., DENIS, J.B. and M.S. 1938: Discursion of a set points in terms of
KANG. 1996. Incorporating additional informa- mutual distances. Psychometrika 3, 19-22.
tion on genotypes and environments in models
39
I I
. PARTE
II. P A R T E
A
ESTADÍSTICOS
N Á L I S I S
2A
R
NÁLISIS
Y
DE
EGRESIÓN
LA VARIANZA
CONJUNTA
Análisis de la Varianza y Regresión Conjunta Análisis de la Varianza y Regresión Conjunta Análisis de la Varianza y Regresión Conjunta
2. ANÁLISIS DE LA VARIANZA Y Por tanto, el valor del estadístico χ2 ajustado
REGRESIÓN CONJUNTA será:
χ2 ajustado = χ2 / C (3)
2.1. Datos
el cual se distribuye mediante una χ2[a-1] cuan-
Se parte de un ensayo de 11 genotipos (G1 a do la hipótesis nula H0 es verdadera, es decir,
G11) en 10 ambientes (A1 a A10) con un diseño de cuando todas las varianzas son homogéneas.
bloques al azar con tres repeticiones (ver los datos
reales en el Apéndice). De esta forma si el valor χ2 ajustado es mayor
que χ2[a-1] concluiremos con que las a varianzas
estudiadas son significativamente heterogéneas.
2.2. Análisis de la varianza y regresión
conjunta Desgraciadamente, el test Barlett es excesivamen-
te sensible a las desviaciones de la normalidad en los
El primer paso en el análisis del comporta- datos y un χ2 significativo puede, por tanto, indicar no-
miento de una serie de genotipos en diferentes normalidad en vez de heteroscedasticidad.
ambientes es la identificación estadística de una
interacción GxE significativa. Esto requiere llevar Existe también un método rápido que, aunque
a cabo un análisis de la varianza de los ensayos no tan eficiente, presenta la ventaja de su sencillez.
en estudio. Este análisis sólo será posible si las Este es la prueba de la Fmax que se basa en la
varianzas del error (εijk) (es decir, las varianzas de distribución de probabilidad acumulativa del
las celdas que contienen el nivel inferior de datos) cociente entre las varianzas mayor y menor. Se
no son estadísticamente heterogéneas: recorde- hallan las varianzas mayor, s2max, y la menor, s2min.
mos que se trata de uno de los supuestos en que Se calcula entonces el cociente de varianzas máxi-
se fundamenta el análisis de la varianza. mo s2max/s2min. Existe una Tabla de la distribución
acumulativa de Fmax,α[a,n-1] (ver Tablas en Steel y
Torrie, 1985); esta Tabla supone que los grados de
2.2.1. Un paso previo: la homogeneidad de las libertad de todas las varianzas son iguales, pero
varianzas podemos hacer una prueba aproximada utilizando
el menor de los grados de libertad de las dos
Cuando existen más de dos grupos, la prue- varianzas utilizadas en el cálculo.
ba de Barlett para homogeneidad de
varianzas es el más indicado. El estadístico Si el cociente de varianzas es mayor que el
final de significación es (χ2); el valor experimen- estadístico Fmax hallado en la Tabla entonces las
tal se compara, como es usual, con un valor crí- varianzas se considerarían heterogéneas con pro-
tico tabulado de la distribución chi-cuadrado babilidad P < α.
(χ2). El estadístico a calcular viene dado por la
expresión:
a a 2
2.2.2. El Análisis de la Varianza
χ2 = 2.3026 [∑ (ni-1)] logs2-∑ (ni-1) logs (1)
1 1 i
El modelo matemático del análisis de varianza
de los datos observados es, en nuestro caso, el
donde: siguiente: sean g genotipos en e ambientes, y r el
a= número de varianzas cuya homoge- número de observaciones de cada genotipo en
neidad se prueba. cada ambiente,
ni -1 = grados de libertad de la varianza
i-ésima. Yijk = µ + gi + ej + (ge)ij +rjk + εijk (4)
s2i = varianza i-ésima, y
donde:
a
∑ (ni-1)s2i
1
s2 = —————— (2) Yijk = el valor fenotípico del genotipo i-ésimo en
a
∑ (ni-1) la k-ésima repetición del j-ésimo ambiente,
1
El estadísticoχ2 así obtenido se divide por un µ = media total de todas las observaciones,
factor de corrección C, cuyo valor es: genotipos y ambientes,
45
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
gi = efecto aditivo del genotipo i-ésimo cativa. A partir de aquí describiremos todos aque-
(i=1, ..,g), llos métodos más utilizados para el estudio de la
interacción GxE.
ej = efecto aditivo del ambiente j-ésimo
(j=1, ..,e), El primero de ellos, y por ende el más utilizado,
es el método de la Regresión, conocido como
(ge)ij = interacción GxE del genotipo i-ésimo y análisis de la varianza y regresión conjun-
del ambiente j-ésimo, ta. Este análisis utiliza el análisis de la varianza tal
y como hemos visto anteriormente, pero nos des-
rjk = efecto de la observación k-ésima en el compone la varianza total de la interacción GxE en
ambiente j-ésimo, (k=1, ..,r), dos partes, una debida a la heterogeneidad de los
coeficientes de regresión y otra a las desviaciones
εijk = variación residual de la observación de estas regresiones. Tal análisis se expone en la
k-ésima del genotipo i-ésimo y del Tabla 2 y los resultados obtenidos para los datos
ambiente j-ésimo. del ejemplo en la Tabla 3.
Se trata, de nuevo en nuestro caso, de un En el método de la regresión se asume que la
modelo mixto de dos factores con genotipo como interacción está linealmente relacionada con el
factor fijo (pues se está interesado en esas varie- efecto ambiental, es decir:
dades concretas) y ambiente y repetición como
aleatorios. El análisis de la varianza para el mode- (ge)ij = biej + dij (5)
lo mixto [4] es como se muestra en Tabla 1. Otras
situaciones tendrán lógicamente un modelo mate- donde bi es el coeficiente de regresión lineal
mático [4] y un análisis (Tabla 1) distintos. El análi- para el genotipo i y dij un residuo.
sis numérico se da en la Tabla 3. Para realizarlo se
puede utilizar el paquete estadístico SX, o si el De esta forma el modelo lineal [4] queda como
diseño es muy desequilibrado (es decir, distinto sigue:
número de observaciones por factor, o dicho de
otra forma, existencia de valores perdidos o no Yijk = µ + gi + biej + rjk + ε’ijk (6)
tomados) el procedimiento GLM del paquete esta-
dístico SAS. El análisis de la varianza para nuestro modelo
mixto se muestra en la Tabla 2.
2.2.3. La interacción GxE Como complemento al coeficiente de regresión
(bi), el cuadrado medio residual de las desviacio-
El análisis anterior es el más simple que pode- nes de la regresión (S2di) describe la contribución
mos realizar y con el determinamos algo tremenda- del genotipo i a la interacción GxE, propuesta por
mente importante: la existencia o no existencia de Eberhart y Russell (1966). Ambos parámetros se
una interacción Genotipo-Ambiente (GxE) signifi- calculan como sigue:
Tabla 1. ANOVA de la interacción GxE.
F. de V. G.L. S.C. F
Genot x Amb(GxE) (g-1)(e-1) CM(GxE)/CM(Er)
ij
Error(Er) e(g-1)(r-1) ∑∑∑Y2ijk-∑∑Y2ij/r-SC(RE)
ijk
Total egr-1 ∑∑∑Y2ijk-FC
ijk
FC=Y2.../egr
Los CM se obtienen dividiendo las SC por los g.l. correspondientes.
46
Análisis de la Varianza y Regresión Conjunta Análisis de la Varianza y Regresión Conjunta Análisis de la Varianza y Regresión Conjunta
Tabla 2. ANOVA Y REGRESIÓN CONJUNTA de la interacción GxE.
F. de V. G.L. S.C. F
Genot x Amb(GxE) (g-1)(e-1) ∑∑Y2ij./r-SC(G)-SC(E)-FC CM(GxE)/CM(Er)
ij
Heterog. (H) g-1 ∑ (βi -1)2 ∑Ζ2j CM(H)/CM(D)
j j
Desv.Regres(D) (g-1)(e-2) Por sustracción de
la suma SC(GxE) CM(D)/CM(Er)
Error(Er) e(g-1)(r-1) ∑∑∑Y2ijk - ∑∑Y2ij/r-SC(RE)
ijk
Total egr-1 ∑∑∑Y2ijk -FC
ijk
FC= Y2.../egr
cuadrados medios de la desviación de la regresión.
—— — — —
∑ (Yij- Yi.- Y.j+ Y..) ( Y.j+ Y..)
j
bi = 1+ ——————————— (7) Se puede extraer un componente más, con un
—
∑ (Y.j- Y..) sólo grado de libertad, para probar la tendencia de
j
las líneas de regresión a converger en un punto. En
- cuadrado medio residual: efecto, la suma de cuadrados de la heterogeneidad
entre las regresiones lineales se puede dividir en
dos componentes, uno debido a la convergencia de
1 —— — ——
s2di = —— [∑ (Yij- Yi.- Y.j+ Y..)2 - (bi-1)2 ∑ ( Y.j- Y..)2] (8) las líneas de regresión en un punto, con un grado de
E-2 j j
libertad, y otro debido a la no-convergencia.
El cuadrado medio residual para cada línea se La fórmula utilizada para calcular la suma de
compara por medio de una prueba F utilizando el cuadrados para convergencia es:
valor aproximado F* = σ2i/σ2o, con (e-2) y e*g*(r-1)
grados de libertad, siendo σ2o la varianza del error SSconv = R2 H2 (9)
dentro de ambientes. Es decir, en la Tabla 1, σ2o
sería [SC(RE)+SC(Er)]/ [g.l.(RE) + g.l.(Er)] y σ2i =
donde R es la correlación entre los coeficientes
S2di. Si F* resulta no significativo nos indica que de regresión y las respectivas medias marginales
S2di se puede considerar no significativamente dis- de los genotipos (es decir, las medias genotípicas
tinta de cero. en cada ambiente), y H2 es la suma de cuadrados
debida a heterogeneidad de las regresiones.
Cuando la prueba de Bartlett nos ha dado signi-
ficativa y, por tanto, las varianzas del error de los
ambientes son heterogéneas, el cuadrado medio 2.2.4. Resolución práctica
de la desviación de la regresión se puede utilizar
como error en aquellos contrastes en que los datos Para la resolución del ejemplo que a continua-
de partida sean las medias genotípicas en cada ción se expone se ha utilizado una “corriente de
ambiente. Dado que los parámetros presentados control” o secuencia de órdenes reconocibles por
hasta ahora han sido calculados a partir de los el paquete estadístico que se está utilizando (ver
datos individuales (repeticiones) y no de medias Apéndice) elaborada por Romagosa para el
genotípicas se ha optado aquí por utilizar σ2ε paquete estadístico SAS.
47
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
La prueba de Bartlett (χ2= 65.5) y Fmax = 6.838 2.1) A partir de la matriz de datos A 10x11 (ver
para homogeneidad de varianzas para los 10 Apéndice) se obtiene la matriz de interac-
ambientes indicó que los errores experimentales ción INT (ver Apéndice) sin más que res-
eran heterogéneos. En estos casos lo aconsejable tar a cada dato de la matriz A las respecti-
es encontrar una transformación de los datos que vas medias marginales y sumarle la media
baje el valor de χ2 en la prueba de Bartlett. Para general, así, por ejemplo, para cualquier
ello se pueden ensayar varios tipos de transfor- dato de A (Yij) obtenemos el correspon-
maciones; las más comunes son la raíz cuadrada diente dato de la matriz INT (Y* ij) de la
de Yijk, esto es, de cada valor experimental (ade- siguiente forma: Y*ij = Yij - Y.j - Yi. + Y..
cuada cuando los datos consisten en números
enteros pequeños), el log Yijk (cuando la media 2.2) Se forma la matriz compuesta por las
esté positivamente correlacionada con la varian- columnas de la matriz de interacción INT
za, es decir, a mayores medias corresponden a la cual se le añade una nueva columna:
mayores varianzas) y la angular o arco-seno de la la de las medias ambientales; por tanto,
raíz cuadrada de Yijk (especialmente apropiada sería una matriz 10x12: matriz INTAMB
para porcentajes y proporciones). Los resultados (ver Apéndice).
obtenidos con las dos primeras transformaciones
han sido los siguientes: 1) raíz cuadrada: 2.3) A partir de esta matriz, en el SX se pueden
χ2=74.49, Fmax=6.629, y 2) logarítmica: χ2=76.34, realizar las sucesivas regresiones entre las
Fmax=6.652. Puede verse que las transformacio- 11 primeras columnas (correspondientes a
nes resultan en poca o ninguna mejora de la los 11 genotipos) y la última (correspon-
homogeneidad. diente a la media total de todos los genoti-
pos en cada ambiente), obteniéndose así,
La principal consecuencia de que las varianzas para cada genotipo, la suma de cuadrados
del error sean heterogéneas es que el estadístico F debida a la regresión. Se suman todas las
no se distribuye según una F de Snedecor, lo que sumas de cuadrados debidas a la regre-
afecta a la determinación de las significaciones sión para los 11 genotipos. Dicha suma se
estadísticas en el Análisis de la Varianza, lo que multiplica por el número de repeticiones
puede ser un serio problema si la significación de del ensayo y obtenemos como resultado la
la interacción GxE fuese marginal (es decir, ron- suma de cuadrados del término que en la
dase los valores del 5% o del 1%). En nuestro caso, Tabla 3 aparece como Heterog (H).
la gran significación de la interacción GxE ha per-
mitido el análisis de la varianza para todos los La suma de cuadrados debida a la convergen-
ambientes utilizando los datos originales, aunque cia se calcula como hemos comentado anterior-
siempre es conveniente resaltar, a efectos de pos- mente por medio de la fórmula [9].
teriores estudios de otros autores, el hecho de que
las varianzas del error son heterogéneas. Los resultados obtenidos para nuestro ejemplo
(Tabla 3) y la explicación de los mismos se realiza
De este modo, para completar la Tabla 3 se ha a continuación.
procedido de la siguiente forma:
Del estudio del ANOVA (Tabla 3), se desprende
1º) Si se posee el paquete estadístico SAS exis- que el factor de variación Genotipo (G) es muy sig-
te una “corriente de control” diseñada por nificativo (F=12.68;P<0.0001), al igual que el factor
Romagosa (ver Apéndice). Ambiente (E). La interacción GxE resulta ser muy
significativa (F=3.21;P<0.0001) por lo que se
2º) Si no se posee el paquete estadístico SAS puede deducir que los factores G y E no son inde-
se pueden utilizar otros paquetes estadísticos pendientes, existiendo por consiguiente interac-
menos complicados, por ejemplo, el SX, en el cual ción entre ellos.
todas las aplicaciones vienen dadas por medio de
ventanas de menús. Así, con el SX, el cálculo de la Por otra parte, la descomposición de la SC total
suma de cuadrados de la heterogeneidad entre pone de manifiesto que el efecto ambiental (E) es
regresiones lineales se realiza obteniendo las res- mucho mayor (41.37%) que el efecto genotípico
pectivas regresiones entre los valores de interac- (G) (24.48%) y el de su interacción GxE (17.37%).
ción de cada genotipo y los índices ambientales.
De esta forma, con este paquete estadístico, los Una vez comprobada la existencia de la inte-
pasos a seguir serían: racción GxE, cabe preguntarse por la naturaleza
48
Análisis de la Varianza y Regresión Conjunta Análisis de la Varianza y Regresión Conjunta Análisis de la Varianza y Regresión Conjunta
Tabla 3. ANOVA y análisis de regresión.
Heterog. 10 708.5 17.92a 1.74 0.0856
Conv. 1 316.4 44.65b 7.26 0.0246
Desv. Conv. 9 392.2 55.35b 3.18 0.0013
Desv. Reg. 80 3244.9 82.08a 2.96 0.0001
Error 200 2740.5 12.04#
mada heterogeneidad de las regresiones (este coeficiente de correlación lo obtenemos en el
(Heterog. en la Tabla 3) y en un componente no listado de salida de la corriente de control realiza-
lineal o residual (Desv. Reg. en la Tabla 3). da para el SAS, para éste método). Así, para el
ejemplo que estamos analizando, un genotipo
Tras comparar ambos componentes con el error especialmente adaptado a ambientes de bajo ren-
experimental [FHeterog=CM(Heterog)/ CM(Er)=5.17***; dimiento caracterizado por un rendimiento medio
FDesv.Reg =CM(Desv.Reg.)/CM(Er)=2.96***] y, además, alto y con bajo coeficiente de regresión, sería raro
la componente lineal (Heterog.) con la desviación de la encontrarlo en el material de trabajo.
regresión (Desv. Reg.) [FHeterog=CM(Heterog.)/
CM(Desv.Reg.)=1.74 N.S.], resulta que la heterogenei- Así pues, el modelo de regresión no sería el
dad de regresiones es altamente significativa cuando adecuado para describir la estabilidad de nuestros
se le compara con los cuadrados medios del error y no genotipos. Esta relativa falta de linealidad para
significativa respecto de los cuadrados medios de la estos datos confirman las observaciones de
desviación de la regresión, hecho que no sorprende muchos autores en los que la interacción GxE no
dado que sólo el 17.92% de la interacción GxE (colum- resultó ser función lineal del efecto ambiental (ej),
na R2, fila “Heterog.” en Tabla 3) puede atribuirse a las principio fundamental en el que está basado el
regresiones lineales. El componente residual (82.08%), método de la regresión como se manifestó en [5].
por contra, resulta ser muy significativo (P<0.0001). En estos casos, para la selección de genotipos
estables puede utilizarse el parámetro S2di (el cua-
Como la heterogeneidad de regresiones resulta drado medio residual) dado en [8], el cual describe
no significativa respecto de la desviación de la una medida de irregularidades impredecibles en
regresión, la utilidad del método de análisis de las respuestas a los ambientes, es decir, suministra
regresión para la interpretación de los datos resul- la verdadera medida de estabilidad (Langer y col.,
ta, en este caso, poco útil. 1979). Los resultados obtenidos para nuestro ejem-
plo son los que se muestran en la Tabla 4. Dado
Como se ha dicho antes, se puede extraer aún que, en nuestro caso, el método de Regresión no ha
otro componente con un grado de libertad para resultado muy fiable, la selección la efectuaríamos
probar la tendencia de las líneas de regresión a por medio del parámetro S2di. Según éste paráme-
converger en un punto. Este componente (“Conv.” tro los genotipos seleccionados serían aquellos que
en Tabla 3), calculado como se indica en [9], es tuvieran S2di no significativamente distinta de cero,
significativo al 5%, denotando que gran parte de la es decir, los genotipos 1, 6, 7, 9, 10 y 11.
49
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Tabla 4. Rendimiento Medio, Coeficiente de Regresión (bi) y S2di, para cada genotipo.
6 3907.15 1.2733 # 78695.36
7 4241.11 1.1412 87471.60
8 3193.40 1.2132 122333.20 *
9 3320.56 .7652 # 32766.83
10 3517.98 .8777 # 28145.89
11 3617.71 .9222 73808.71
REFERENCIAS CITADAS
OTRAS REFERENCIAS
ACONSEJADAS
• KROONENBERG, P.M. and K.E. BASFORD.
• EAGLES, H.A., P.N. HINZ, and K.J. FREY. 1989: An investigation of multi-atribute genotype
1977: Selection of superior cultivars of oats by response across environments using three-mode
using regression coefficients. Crop Sci. 17, 101- principal component analysis. Euphytica 44,
105. 109-123.
• EBERHART, S.A. and W.A. RUSSELL. 1966: • MANDEL, J. 1961: Non-additivity in two-way
Stability Parameters for Comparing Varieties. Crop analysis of variance. J. Amer. Statist. Assoc. 56,
Sci. 6, 36-40. 878-888.
• FINLAY, K.W. and G.N. WILKINSON, 1963: • McINTOSH, M.S. 1983: Analysis of combined
The analysis of adaptation in a plant breeding pro- experiments. Agron. Jour. 75, 153-155.
gramme. Aust. J. Agric. Res. 14, 742-754.
• MUNGOMERY, V.E. 1978: Genetic analyses
• FREEMAN, G.H. and J.M. PERKINS. 1971: of environmental interactions and effects of compe-
Environmental and genotype-environmental com- tition in soybeans. Unpublisher Ph. D. Thesis,
ponents of variability. VIII. Heredity 27, 15-23. Department of Agriculture, University of
Queensland.
• FREEMAN, G.H. 1973: Statistical methods for
the analysis of genotype-environment interactions. • PERKINS, J.M. and J.L. JINKS. 1968b:
Heredity 31 (3), 339-354.
Environmental and genotype-environmental com-
ponents of variability. IV. Heredity 23 (4), 525-535.
• HINZ, P.N. and H.A. EAGLES. 1976:
Estimation of a transformation for the analysis of • POONI, H.S. and J.L. JINKS. 1980: Non-linear
some agronomic and genetic experiments. Crop genotype- environment interactions. II. Statistical
Sci. 16, 280-283. models and genetical control. Heredity 45, 389-400.
50
Análisis de la Varianza y Regresión Conjunta Análisis de la Varianza y Regresión Conjunta Análisis de la Varianza y Regresión Conjunta
• SHORTER, R. 1972: Influence of genotype Analysis A Proposed Modification. Theor. Appl.
and environment on chemical composition of soy- Genet. 53, 89-91.
bean seeds ( Glycine max L. Merrill) Unpublished
M. Agr. Sc. Thesis, University of Queensland. • VIRK, D.S., N.B. SINGH, M. SRIVASTAVA and
G. HARINARAYANA. 1984. Regression analysis for
• SOKAL, R.R. and F.J. ROHLF. 1979: general adaptation in pearl millet using different
Biometría. Principios y métodos estadísticos en la environmental indices. Theor. Appl. Genet. 68,
investigación biológica. H. Blume Ediciones. 509-513.
• VERMA M.M., G.S.CHAHAL and B.R.MURTY. analysis of groups of experiments. J. Agr. Sci., 28,
1978:. Limitations of Conventional Regression 556-580.
51
E
3 PARÁMETROS
U NIVARIANTES DE
ESTABILIDAD MÁS UTILIZADOS
Parámetros Univariantes de Estabilidad más Utilizados Parámetros Univariantes de Estabilidad más Utilizados
3. PARÁMETROS UNIVARIANTES significativo, entonces la σ2i no es, estadística-
DE ESTABILIDAD mente hablando, distinta de cero.
MÁS UTILIZADOS
Información adicional sobre la estabilidad de
Como ya se indicó en la Introducción los cada genotipo se puede obtener por medio de la
parámetros univariantes de estabilidad más utili- introducción de un covariante que puede repre-
zados en el estudio de la interacción GxE son los sentar fertilizaciones y/o prácticas de campo dis-
siguientes: tintas. El covariante más utilizado es el denomi-
nado por Shukla como Zj, que para el ambiente
1) Varianza de estabilidad (σ2i) y (s2i) j-ésimo se define como la diferencia entre el
de Shukla. efecto aditivo del ambiente j (esto es, Y.j) y la
media total del ensayo (Y..), esto es, Zj=Y.j-Y...Por
2) Coeficiente de Variación de Francis tanto, este covariante es en realidad un índice
y Kannembert (CVi). ambiental. Las ecuaciones 15 y 16 de Shukla
3) Ecovalencia de Wricke (Wi) y Cuadra- (1972) son las que se utilizan para extraer el
dos Medios de la ecovalencia. efecto del covariante en componentes asigna-
bles a cada genotipo (s2i).
4) Varianza ambiental de genotipos
(S2xi). La ecuación 15 de Shukla es la del coeficien-
te de regresión lineal para el genotipo i-ésimo:
5) Medida única de Lin y Binns.
— — —
Σj (Yij - Yi. - Y.j + Y..) *Zj
bi = —————————— (11)
3.1. Varianza de estabilidad ΣjZ2j
Shukla (1972) definió dos varianzas (paráme- La ecuación 16 de Shukla nos da su paráme-
tros) de estabilidad σ2i y s2i. La primera se cal- tro de estabilidad s2i:
cula por medio de la fórmula:
g ΣiSi
s2i = ————— [Si - ———] (12)
(g-2) (e-2) g(g-1)
—— — — — —
(g(g-1))Σj(Yij-Yi.-Y.j+Y..)2-ΣiΣj(Yij-Yi.-Y.j+Y..)2
σ2i = ——————————————————— (10)
(g-1) (g-2) (e-1) donde:
— — —
donde: S´i = Σj (Yij - Yi. - Y.j + Y..-bi*Zj)2 (13)
Yij = valor medio del carácter medido (por Cuando g es grande, se procede con s2i de
ejemplo, rendimiento) para el genotipo i en el igual forma que para σ2i. Así, para probar si s2i=0,
ambiente j. F*=s2i / σ2o se aproxima a un distribución F de
g = número de genotipos, Snedecor con (e-2) y e*g*(r-1) grados de libertad
e = número de ambientes. para cada s2i, procediéndose como antes.
Cuando el número de genotipos g es grande,
para probar si σ2i=0, el estadístico calculado de 3.2. Coeficiente de Variación
la forma F* = σ2 / σ2 , donde σ2 es la varianza
i o o
del error dentro de ambientes, se aproxima a un Dado que la respuesta genotípica puede
distribución F de Snedecor con (e-1) y e*g*(r-1) tener una gran varianza, Francis y Kannenberg
grados de libertad para cada σ2i. De esta forma, (1978) sugirieron una medida de mayor consis-
para saber si un determinado valor de σ2i es tencia para rendimiento. Esta medida es el coe-
estadísticamente no distinto de cero, efectua- ficiente de variación (CVi), que es el cocien-
mos en primer lugar el cociente σ2i / σ2o, tal y te, expresado generalmente bajo la forma de
cómo se ha comentado en el capítulo anterior. porcentaje, entre la desviación estándar (σ) y la
En segundo lugar, el valor de F* así calculado lo media. La Figura 4 representa la gráfica para el
contrastamos con el de las tablas de la F de Sne- rendimiento medio en función del CVi.
decor con (e-1) grados de libertad para el nume-
rador y eg(r-1) grados de libertad para el deno- El rendimiento total del ensayo y el CV medio
minador. Si el valor de F* contrastado resulta no dividen la gráfica en 4 grupos:
55
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
GRUPO I: Alto rendimiento, pequeña variación. Siempre nos encontraremos con resultados
GRUPO II: Alto rendimiento, gran variación. como los comentados en el párrafo anterior. Es
GRUPO III: Bajo rendimiento, pequeña variación. decir, tendremos genotipos que de acuerdo con la
GRUPO IV: Bajo rendimiento, gran variación. mayoría de los métodos utilizados se deben consi-
derar como estables, y que para otros sin embargo,
Considerando como genotipo estable aquel estarán caracterizados por ser los mas inestables.
que posee un rendimiento alto y consistente, Por último tendremos aquellos genotipos que tras el
sólo los genotipos del Grupo I pueden conside- estudio de la interacción GxE con varios métodos
rarse como estables. no quedan definidos claramente. Así pues, además
de los cálculos estadísticos se precisa un buen
El Grupo III también es consistente, pero pue- conocimiento de nuestro material vegetal para dis-
den considerarse a los genotipos incluidos en el cutir adecuadamente los resultados.
como inestables debido a que los rendimientos
están por debajo del rendimiento medio del ensa- El método del CV-medio se diseñó en princi-
yo para la mayoría del intervalo ambiental. pio como ayuda en estudios sobre la base fisio-
lógica de la estabilidad del rendimiento (Francis,
Se puede realizar algunas comparaciones 1977). Se trata de un método que agrupa más
utilizando los parámetros ya comentados. Así, que caracteriza genotipos individualmente.
obteniendo los coeficientes de regresión por
grupos, los grupos III y IV (en los que bi≈0; ver
Tabla 7) podrían ser considerados por encima 3.3. Ecovalencia y Cuadrados Medios
de los de media estabilidad (bi≈1; método de de la Ecovalencia
Finlay y Wilkinson, 1963). Sin embargo, cuando
consideramos las S2di de Eberhart y Russell - La ecovalencia de Wricke (1962) viene
(1966) y la σ2i de Shukla (1972), son los grupos expresada por:
III y I los que hay que considerar como estables.
— — —
Wi = Σj (Yij - Yi. - Y.j + Y..)2 (14)
Veamos las diferencias concretas entre éstos
métodos: el genotipo 5 , en el Grupo I, es consi-
derado como estable según el método del coefi- Puesto que la ecovalencia mide la contribu-
ciente de variación, pero viendo la alta significa- ción de un genotipo i a la interacción GxE, el
ción para los parámetros σ2i y S2di (ver las genotipo con Wi=0 será el más estable.
Tablas 5 y 4, respectivamente) debería conside-
rarse como inestable. Por el contrario, los geno- Como puede deducirse de la expresión [10]
tipos 9 y 10, que no aparecen en el Grupo I, y la varianza de estabilidad es una función lineal
por tanto, según el método del coeficiente de de la ecovalencia:
variación se considerarían como inestables,
según los valores de las significaciones para σ2i G*Wi C.M. interacción GxE
σ2 = —————— - —————————— (15)
y S2di deben considerarse como estables. (g-2) * (e-1) (g-2)
4,200
4,000
Rend. Medio
7 GRUPO I
5
GRUPO II
6
3,800 2
1
3,600 11
Y.. = 3547
10 GRUPO III GRUPO IV
3,400
9
3,200 8
3,000 4
C.V. = 18.74 3
2,800
13.5 14.5 15.5 16.5 17.5 18.5 19.5 20.5 21.5 22.5 23.5 24.5
COEF. DE VARIACIÓN
56
Parámetros Univariantes de Estabilidad más Utilizados Parámetros Univariantes de Estabilidad más Utilizados
Muchos autores han utilizado la suma de cua- más tarde por numerosos autores usando la
drados Wi (ecovalencia) para una comparación varianza obtenida de los resultados de un geno-
relativa entre cultivares, pero pocos trabajos utili- tipo en todos los ambientes del ensayo. Se
zan los cuadrados medios de la ecovalencia (Wi- denominó varianza ambiental:
CM) propuesto por Kang y Miller (1984). El cua-
drado medio de la ecovalencia se compararía de —
Σj (Yij - Yi.)2
la misma forma que la σ2i de Shukla (véase el S2xi = ————— (16)
apartado 3.1). Esto supondría dividir la suma de (e-1)
cuadrados de la interacción GxE de cada culti-
var por (e-1)(g-1)/g y comparar los cuadrados Desde el punto de vista del concepto
medios con σ2o, suponiendo que Wi-CM se distri- dinámico, los estadísticos más utilizados en la
buye como una F de Snedecor (hipótesis que partición de la interacción GxE son la ecova-
necesita ser verificada). Así, para el genotipo 1, lencia y la varianza de estabilidad. La
de la Tabla 5 vemos que Wi= 402491.8, y el valor varianza ambiental, como se ha comentado
de (e-1)(g-1)/g=8.1818. Con estos valores, el cál- en la Introducción, es útil para caracteres de
culo de los cuadrados medios de la ecovalencia calidad, para resistencia a enfermedades o
caracteres estresantes, pero para rendimiento,
sería tal como sigue: Wi-CM= 402491.8/8.1818 =
49193.4; este valor dividido por la σ2o=45675 nos un mejorador intenta encontrar simultáneamente
da el estadístico que debe ser contrastado según genotipos estables y de alto rendimiento. Por
una F de Snedecor con 9 (=e-1) g.l. en el nume- contra, este parámetro nos evalúa la estabilidad
rador y 220 g.l. en el denominador. Pero Kang y de los genotipos desde el punto de vista del
Miller (1984) sugieren que ésta sería una hipóte- concepto estático, asociado generalmente con
sis válida si σ2i y Wi-CM estuvieran fuertemente rendimientos bajos.
correlacionadas y si σ2i / σ2o se distribuyera apro-
ximadamente como una F de Snedecor. La posi-
bilidad de probar la significación de Wi-CM 3.5. Medida única de Lin y Binns
podría incrementar la utilidad y efectividad de
este estadístico como índice de estabilidad. Lin y Binns (1988) propusieron una medida
única de la superioridad del comportamiento
Kang (1985) y Kang y col., (1987) realizaron de un genotipo i (Pi). Pi se define como el cua-
un estudio exhaustivo de estos dos métodos que drado medio de la distancia entre la respuesta
reveló que la ecovalencia (Wi) era un paso inter- de un genotipo y el genotipo de máxima res-
medio para el cálculo de σ2i y que el uso de Wi puesta, en un ambiente dado, expresándose de
como una medida separada de estabilidad no es la forma:
necesario dado que σ2i es un parámetro inses-
gado (es decir, depende para su cálculo de Σj (Yij - Mj.)2
Pi = ————— (17)
menos parámetros que la ecovalencia) que 2n
puede ser probado por significación estadística.
donde Yij es el rendimiento del genotipo i-ésimo
Es significativo que tanto Wi-CM como σ2i en el ambiente j-ésimo, Mj es la máxima res-
muestren prácticamente los mismos genotipos puesta de entre todos los genotipos en el
como estables (ver Tabla 5). Los valores de σ2i y
ambiente j-ésimo, y n es el número de ambien-
Wi-CM para cada genotipo son muy similares; el tes. Un valor pequeño de éste índice de superio-
orden relativo de los genotipos para ambos ridad implica adaptación general de un genoti-
parámetros, sería exactamente el mismo, pero po. Este índice integra rendimiento medio y esta-
los cálculos para la obtención de Wi-CM son bilidad relativa en un sólo parámetro.
menores y mas simples que los utilizados para
calcular σ2i. El método de Shukla sería el preferi- Como la distribución de éste parámetro no es
do, sin embargo, si se utilizase un covariante y, conocida, Lin y Binns utilizaron como prueba de
por tanto, escogiéramos el parámetro (s2i). comparación el cuadrado medio del error (CME)
de la ANOVA por el estadístico F de Snedecor
para una determinada probabilidad. Así,
3.4. Varianza ambiental CME=137,025 con 200 g.l., y el valor de F(Sne-
decor) con un nivel del 5% y 10 g.l. (número de
La estabilidad fenotípica, según el concep- ambientes) es de 1.83; por tanto, el punto de
to estático, fue medida por Roemer (1917) y corte para Pi sería 137,025 x 1.83=250,755.75.
57
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
3.6. Resultados con los datos considerados como estables son los mismos
experimentales (Tabla 5). Estos genotipos son: 1, 6, 7, 9, 10 y 11.
Los resultados de la aplicación de éstos esta- 3.6.2. Según el método del Coeficiente de
dísticos a los datos ejemplo se muestran en las Variación los genotipos mas estables serían
Tablas 5, 6 y 7. Su cálculo puede hacerse par- aquellos incluidos en el Grupo I de la Figura 4
tiendo de la matriz de datos del Apéndice y (Tablas 5 y 6). Estos son los genotipos 1, 11, 5
siguiendo un programa en lenguaje BASIC que y 7.
nos calcula todos los parámetros univariantes
comentados, excepto el Pi, para el cual existe 3.6.3. En cuanto a la Varianza Ambiental los
una corriente de control realizada para el paque- genotipos más estables serían el 9, 10, 11, 1,
te estadístico SAS. Comentaremos brevemente 4 y 3, de los cuales tan sólo el 1 y el 11 supe-
los resultados para cada estadístico. ran ligeramente el rendimiento medio total del
ensayo (Tabla 5). Se comprueba así, como
3.6.1. Respecto de las Varianzas de Shukla hemos comentado anteriormente, que este
σ2i [10] y s2i [12], así como de los estadísticos parámetro nos evalúa la estabilidad de los
relacionados con la ecovalencia Wi y Wi-CM genotipos desde el punto de vista del concepto
(véase 3.3), se puede decir que los resultados estático, asociado generalmente con rendimien-
son muy similares y prácticamente los genotipos tos bajos.
Tabla 5. Parámetros de estabilidad σ2i, s2i, CVi, Wi, Wi-CM y S2xi.
6 98155.3 81160.4 19.55 842582.7 102982.3 583765.1
7 86491.0 91886.9 16.51 756691.3 92484.5 490541.2
8 134251.7* 134495.6* 23.75 1108384.0 135469.1* 575251.3
9 40682.2 25025.6 13.95 419372.0 51256.6 214700.8
10 20100.2 19377.8 14.74 267812.9 32732.7 269178.1
11 66262.7 75187.9 16.00 607737.6 74279.1 335133.4
Tabla 6. Parámetros de estabilidad para los cuatro grupos definidos en la Fig. 4.
MEDIO MEDIA MEDIA MEDIA
58
Parámetros Univariantes de Estabilidad más Utilizados Parámetros Univariantes de Estabilidad más Utilizados
Tabla 7. Índice de Lin y Binns: Pi.
7 4241.11 18079.87
6 3907.16 240540.41
5 3896.25 277814.63
2 3825.07 357083.54
1 3699.38 510353.34
11 3617.71 672759.88
10 3517.99 799177.34
9 3320.56 1242578.43
8 3193.40 1512318.61
4 2920.35 2413706.44
3 2877.50 3109467.61
za como punto de corte para Pi (véase 3.5) sólo el de mayor rendimiento medio en la mayoría de
los genotipos 7 y 6 se seleccionarían como no los ambientes del ensayo, sobresaliendo en la
diferentes de la respuesta máxima. gráfica del resto de genotipos, siendo casi impo-
sible distinguir un segundo genotipo que desta-
Como podemos ver en la Tabla 7 el estadísti- que de entre los restantes.
co Pi, para nuestros datos, ordena los genotipos
según sus rendimientos medios y no por su esta- Como comentario final cabe repetir aquí lo
bilidad. Por tanto, seleccionar por este estadísti- dicho en la Introducción: distintos métodos dan
co resultaría en seleccionar por rendimiento, con frecuencia distintos resultados. Esto no es
como ya se comentó en la Introducción. una paradoja: es consecuencia de la enorme
complejidad del material biológico en su interac-
Puede complementarse la selección de los ción con el ambiente.
genotipos más estables por medio de la cons-
trucción de la gráfica de la Figura 5, donde se Por ello, conviene siempre aplicar más de un
representan los rendimientos medios de cada método, y decidir en base a los resultados obte-
genotipo en cada ambiente en función del rendi- nidos y al conocimiento del material biológico.
miento ambiental para ser comparados con la
respuesta máxima.
5,100
4,600
4,100
3,600
3,100
2,600
2,100
2,600 2,800 3,000 3,200 3,400 3,600 3,800 4,000 4,200 4,400 4,600
Rend. medio ambiental
RESPUESTA MÁXIMA GEN 1 GEN 7 GEN 6 GEN 5 GEN 2
59
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
REFERENCIAS CITADAS and sugar yield and their implications in sugar-
cane breeding. Crop Sci. 24, 435-440.
• EBERHART, S.A. and W.A. RUSSELL. 1966:
Stability Parameters for Comparing Varieties. • KANG, M.S., J.D.MILLER AND L. L. DARRAH.
Crop Sci. 6, 36-40. 1987: A note on relationship between stability
variance and ecovalence. J.Hered. 78, 107-107.
• FINLAY, K.W. and G.N. WILKINSON, 1963:
The analysis of adaptation in a plant breeding • KANG, M.S. 1985: Sas program for calculating
programme. Aust. J. Agric. Res. 14, 742-754. stability-variance parameters. J.Hered. 76, 142-143.
• FRANCIS, T.R. 1977: Yield stability studies • LIN, C.S. and M.R. BINNS. 1988: A superio-
in short-season maize (Zea mays L.) Ph. D. The- rity measure of cultivar performance for cultivar x
sis University of Guelph, Guelph, Ont. location data. Can. J. Plant Sci. 68, 193-198.
• FRANCIS, T.R. and L.W. KANNENBERG. • SHUKLA, G.K., 1972: Some Statistical
1978:Yield stability studies in short-season aspects of partitioning genotype-environmental
maize.I. A descriptive method for grouping components of variability. Heredity 29, 237-245.
genotypes. Can. J. Plant Sci. 58, 1029-1034.
• WRICKE, G. 1962: Uber eine methode zur
• KANG, M.S. and J.D. MILLER. 1984: erfassung der ökologischen streubreite in feld-
Genotype x Environment interactions for cane versuchen. Z. Pflanzenzünchtg 47, 92-96.
• ROEMER, T. 1917: Sind die ertragsreichen
• GRAY, E. 1982: Genotype x environment sorten ertragssicherer? Mitt. DLG 32, 87-89.
interactions and stability analysis for forage yield
of orchardgrass clones. Crop Sci. 22, 19-23. • WRICKE, G. and W.E. WEBER. 1986: Quan-
titative Genetics and Selection in Plant Breeding.
• JOWETT, D. 1972: Yield stability parame- De Gruiter.
ters for sorghum in East Africa. Crop Sci. 12,
314-317.
60
4
M T
ÉTODOA I ( 1
DE 971)
Método de TAI (1971) Método de TAI (1971) Método de TAI (1971) Método de TAI (1971) Método de TAI (1971)
4. MÉTODO DE TAI (1971) tivamente, obtenidos en el análisis de la varianza
(ver Capítulo 2), se demuestra que:
Tai (1971) describe otro método para estimar
parámetros de estabilidad. Es similar al método s2e=MSL/gr, σ2λ=MSB/gr y σ2ε=[(g-1/g)(MSE/r)] (21)
de Eberhart y Russell (ver Capítulo 2) en el sen-
tido de que ambos métodos estiman la respues- donde g es el número de genotipos y r el núme-
ta lineal de una variedad respecto de los efectos ro de repeticiones del ensayo. Haciendo λi =
ambientales. Sin embargo, el método descrito (σ2δi + σ2ε)/σ2ε e introduciendo las relaciones
por Tai difiere del propuesto por Eberhart y Rus- anteriores en [19], resulta:
sell en la estimación de los parámetros que
determinan estabilidad: Tai relaciona el modelo σ2e+σ2λ=MSL/gr (22)
matemático para el análisis de la varianza con la
estimación del potencial genotípico de una α2iσ2e+λiσ2ε=s2 (ge)i (23)
variedad para estabilizar su comportamiento
frente a las variaciones ambientales. α2iσ2e=se (ge)i (24)
σ2λ=MSB/gr
El modelo matemático en el cual se funda- (25)
menta el método de Tai está basado en el méto-
do de análisis de relación estructural. σ2ε=(g-1)MSE/gr (26)
Dado que la demostración del modelo matemá-
tico del método de Tai queda fuera de los objeti- Resolviendo este sistema de ecuaciones
vos de este manual, para más detalle se reco- obtenemos las estimaciones de los parámetros
mienda examinar el libro de Kendall y Stuart αi y λi para el genotipo i-ésimo:
(1961) en lo concerniente al análisis de relación
estructural. Aún así, a continuación se describirá se (ge)i
αi = ——————— y
brevemente aquellos aspectos más importantes (MSL-MSB) /gr
para la compresión de este método. (27)
s2(ge)i-αise(ge)i
A partir del método de análisis de relación λi = ———————
(g-1) MSE/gr
estructural, se pueden derivar los siguientes esti-
madores de máxima verosimilitud bajo el supues- αi mide la respuesta lineal del genotipo i a los
to de que las variables ej (efecto de j-ésimo efectos ambientales, y λi la desviación de la res-
ambiente) y (ge)ij (efecto de la interacción GxE) puesta lineal en unidades relativas de la varian-
están distribuidas normalmente: za del error (MSE).
de probabilidad de a=1-P con (e-2) grados de
donde σ2e es la varianza de los efectos ambienta- libertad, los dos límites de predicción para αi
les, σ2δi es la varianza de las desviaciones de la correspondientes a αi=0 se demuestra que son:
respuesta lineal, σ2λ es la varianza del error aso-
ciado con los efectos ambientales, σ2e es la varian-
λ (g-1) MSE MSL
za del error asociado con los efectos de la interac- ± ta [——————————————————]1/2 (28)
ción, s2e es la varianza muestral de los efectos (MSL-MSB) [(e-w) MSL-(t2a+n-2)MSB]
ambientales, s2(ge)i es la varianza muestral de los
efectos de la interacción del genotipo i-ésimo en expresión que es función de λ.
los e ambientes y se (ge)i es la covarianza mues-
tral entre los efectos ambientales y la interacción. De esta forma, a partir de [28] podemos cons-
truir unas regiones de confianza (parábolas que
Siendo MSL, MSB y MSE los cuadrados pasan por el origen) a un determinado nivel de
medios de los efectos ambientales, de las repe- probabilidad, dentro de las cuales, el valor de αi
ticiones dentro de ambientes y del error, respec- no es significativamente distinto de cero (Fig. 6).
63
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Se puede construir también un intervalo de La distribución de los valores de αi y λi de los
confianza teórico para un hipotético valor de λo 11 genotipos se muestran en la Fig. 6 y sus valo-
por medio de una distribución F con n1=e-2 y res en la Tabla 8. Para ello se han utilizado las fór-
n2=e(g-1)(r-1) grados de libertad, de esta manera: mulas del apartado [27] y para las curvas de con-
fianza la fórmula [28]; se han representado las cur-
Para λo = 1 el intervalo a un nivel de probabi- vas correspondientes a los niveles del 20, 10 y 5%.
lidad P es
Tan sólo dos genotipos, el 2 y el 9, han mos-
Fa(n2,n1) ≤ λo ≤ Fa(n1,n2) trado un valor significativamente distinto de α=0,
al nivel del 20% (Tabla 8).
donde Fa(n2,n1)=1/Fa(n1,n2) y 2a=1-P.
El genotipo 3 ha mostrado un valor significa-
El intervalo para λo>1 se puede construir por tivo al 5% de λ>1; por tanto, se sitúa fuera de la
medio de una distribución F no centrada (ver zona de comportamiento genotípico estable. Por
Kendall y Stuart, 1961; o Scheffe, 1959). Siendo otro lado los genotipos 1, 9 y 10 han mostrado un
F’a(n1,n2) el límite superior para un hipotético valor de λ significativamente menor de uno, de
valor de λo mayor que la unidad, tenemos que, ahí que también se consideren como genotipos
aproximadamente: inestables.
F’a(n1,n2) = λoFa [n1 λ2o / (2λo-1), n2] (29) Los genotipos situados en la región de esta-
bilidad media y, por tanto también considerados
Dado que un genotipo perfectamente estable como deseables son: 2, 4, 5, 6, 7, 8, y 11.
no cambiaría su comportamiento de un ambiente Según este método entre los genotipos situados
a otro, esto es equivalente a decir, para el méto- en la zona de estabilidad media seleccionaría-
do de Tai, que α=-1 y λ=1. Eberhart y Russell mos los de mayor rendimiento; éstos serían el 7
definieron como genotipos estables los que tení- y el 6 que no difieren estadísticamente en sus
an b=1 y s2di=0, lo que es equivalente a tener los rendimientos medios a un nivel del 5%.
valores α=0 y λ=1 en el modelo de Tai. El valor
de α=0 y λ=1 lo define Tai como genotipos de Como podemos ver en la Figura 6, existe más
mediana estabilidad y los valores de α=-1 y λ=1 variación en el estadístico λ sugiriendo que el
como genotipos de perfecta estabilidad. componente relativamente impredecible (así λ
en el modelo de Tai y S2di en el modelo de la
regresión, indicándonos ambos la desviación de
4.1. Caso práctico la respuesta lineal) de la interacción GxE puede
ser mucho más importante que el componente
Pasemos ahora al cálculo y discusión de los predecible (α y bi, coeficientes de la respuesta
parámetros de estabilidad según el método lineal). Estos resultados corroboran los resulta-
diseñado por Tai: dos del Capítulo 2.
GENOTIPO
1
2
3
α
-0.018084
0.222528+
-0.306657
λ
0.362717#
1.435433
3.854765*
4 -0.062764 0.917683
5 0.068642 0.948011
6 0.136454 0.666558
7 0.070535 0.659362
8 0.106482 0.944867
9 -0.117234+ 0.308609#
10 -0.061054 0.223194#
11 -0.038851 0.542428
(1) * = Valor λ mayor que Fa derivado de F Snedecor con: n1= g-2; n2= g(c-1)(r-1); a= 0.05
# = Valor λ menor que Fa derivado de F Snedecor con: n1= g-2; n2= g(c-1)(r-1); a= 0.05
+ = Valor α distinto de 0 para el 20%.
64
Método de TAI (1971) Método de TAI (1971) Método de TAI (1971) Método de TAI (1971) Método de TAI (1971)
Gráfico 6. Gráfica de Tai
()
<1 =1 =2 P= 0´95
P= 0´90
0,5 P= 0´80
2
6 8
10 1 11 7 5
0
4
9
3
-0,5
Crop Sci. 6, 36-40. Analysis and Application to Potato Regional
Trials. Crop Sci. 11, 184-190.
• KENDALL, M.G. and A. STUART. 1961: The
advanced of statistics. Vol. 2, 3 rd ed. Griffin and
Co. Ltd. London.
cane breeding. Crop Sci. 24, 435-440. Sci. 19, 434-438.
• LIN, C.S., M.R. BINNS, and L.P. LEFKO- • YUE, G, S. K. PERNG, T. L. WALTER, C. E.
VITCH, 1986: Stability analysis: Where do we WASSOM and G. H. LIANG. 1990: Stability
stand?.Crop Sci. 26, 894-900. Analysis of Yield in Maize, Wheat and sorghum
and its Implications in Breeding Programs. Plant
• TAI, G.C.C. 1975: Analysis of genotype- Breeding. 104, 72-80.
environment interactions based on the method of
65
5
N
MÉTODOS
O P ARAMÉTRICOS
Métodos no Paramétricos Métodos no Paramétricos Métodos no Paramétricos Métodos no Paramétricos
5. MÉTODOS NO-PARAMÉTRICOS
—
2Σ |rij-r’i|
Los métodos no-paramétricos más utilizados si(6) = ————
— (33)
ri.
en esta última década son los siguientes:
portamiento”. pecto de la estabilidad máxima, expresada en
3) Método de Kang. unidades de ordenaciones medias marginales.
4) Método de “ordenamientos estrati-
ficados”. Ambos combinan rendimiento y estabilidad,
pero según Kang y Pham (1991), S(3)i parece dar
más peso a estabilidad que S(6)i.
5.1. Estadísticos no paramétricos
de Hühn Como los genotipos se ordenan separadamen-
te en cada ambiente, los efectos ambientales no
Los estadísticos no-paramétricos se basan influyen sobre la estabilidad definida por estos
en las ordenaciones (rij) de los valores Yij (valo- estadísticos. Sin embargo, las diferencias entre
res medios genotípicos en cada ambiente). genotipos podrían afectar a estas medidas de
Siguiendo la misma nomenclatura que propuso estabilidad y conducir a aceptar diferencias de
Hühn (1979), los estadísticos propuestos por él estabilidad aun cuando no exista interacción GxE.
son los siguientes:
Para superar esta ambigüedad se “corrigen”
2Σj<j’|rij-r’ij|
si(1) = —————— (30) los datos originales Yij con el efecto genotípico esti-
e (e-1) mado como la diferencia entre la media marginal
del genotipo i y la media total del ensayo , es decir:
donde rij es el órden del genotipo i en el ambien-
te j ,y — —
Y*ij=Yij-(Y1.-Y..) (34)
igual estabilidad) se puede atribuir ahora sóla-
de las diferencias absolutas de los órdenes del
mente a interacciones GxE.
genotipo i en todos los ambientes. La varianza
de los órdenes es:
Se han desarrollado para los estadísticos S(1)i
y S(2)i pruebas aproximadas de significación
—
Σj (rij-ri.)2 basadas en una distribución normal. Así, se cal-
si(2) = ————— (31)
(e-1) culan los dos estadísticos siguientes:
—
donde ri. (ordenación media marginal=Σj rij/e)
puede ser interpretado como el esperado para
que podría aproximarse a una distribución chi-
cada rij bajo la hipótesis de máxima estabilidad
cuadrado con un grado de libertad y,
(órdenes iguales). Es decir, la expresión de
máxima estabilidad sería cuando todas las orde-
S(m) = Σi Z(m)i, para m= 1,2 (36)
naciones de un genotipo en los distintos ambien-
tes fuera la misma y por tanto, igual a la ordena-
que podría aproximarse a una distribución chi-
ción media marginal.
cuadrado con G (número de genotipos) grados
de libertad y donde E(S(m)i) es la media de S(m)i
Otros dos estadísticos de Hühn son:
y V(S(m)i) es la varianza de S(m)i.
—
Σj (rij-ri.)2 Nassar y Hühn (1987) nos permiten calcular
si(3) = ————— (32) estos estadísticos por medio de unas sencillas
—
ri
fórmulas:
69
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
E(S(1)i)=(G2-1)/(3G) (37) cada genotipo, del orden medio y de su desvia-
ción estandar (std) para construir una gráfica, la
E(S(2)i)=(G2-1)/12 (38)
cual puede dividirse en cuatro zonas (Fig. 7).
V(S(1)i)=(G2-1)[(G2-4)(E+3)+30]/[45G2E(E-1)] (39) Como se puede ver en la Fig. 7 se seleccionarán
V(S(2)i)=(G2-1)[2(G2-4)(E-1)+5(G2-1)]/[360E(E-1)] (40) como más estables y de alto rendimiento aque-
llos genotipos que esten en la zona de “consis-
Con la prueba de S(m) con G grados de liber- tencia superior”.
tad deducimos si existen diferencias significati-
vas en estabilidad entre los genotipos. Para pro- También se puede construir la gráfica de
bar la estabilidad de un sólo genotipo i, se apli- medias genotípicas frente a su desviación están-
ca el estadístico Z(m)i como una chi-cuadrado dar, aunque hay que tener en cuenta que los
con un grado de libertad. genotipos seleccionados podrían serlo desde un
punto de vista del concepto estático o biológico
Se pueden seguir algunas recomendaciones de estabilidad.
para una mejor aplicación de estos estadísticos no-
paramétricos. Las podemos sintetizar en tres puntos:
5.3. Método de Kang
a) Para un análisis de estabilidad fenotípica
se deben de utilizar los datos corregidos Y*ij si la Kang (1988) ideó otro método no-paramétri-
queremos estimar independientemente de los co para seleccionar genotipos de alto rendi-
efectos del nivel de rendimiento. miento y estables. Para ello, se ordenan los ren-
dimientos medios genotípicos en orden decre-
b) Para una estimación cuantitativa de esta- ciente de tal forma que el genotipo de mayor
bilidad fenotípica es preferible S(1)i, por su sen- rendimiento medio tenga el valor de orden=1.
cillez de cálculo y de interpretación, existiendo Paralelamente, y de forma similar, se establecen
para éste parámetro la prueba eficiente de signi- los órdenes de los genotipos atendiendo a la
ficación descrita más arriba. varianza de estabilidad de Shukla (σ2i), dando el
valor de orden 1 al genotipo que tenga la menor.
c) Si se está interesado en considerar simul- Posteriormente se suman ambos órdenes; de
táneamente estabilidad y rendimiento, los esta- esta forma el genotipo que tenga menor orden-
dísticos no-paramétricos a aplicar son S(3)i y suma será el más deseable.
S(6)i, los cuales miden la estabilidad en unidades
de rendimiento. Pero deben utilizarse los datos
originales Yij porque la transformación Yij - Y*ij eli- 5.4. Método de ordenamientos
mina el efecto genotípico de los datos. estratificados
mente otro método basado en la utilización, para tercio se considerará como más adaptado.
STD
STD
BAJA
CONSISTENCIA
SUPERIOR
CONSISTENCIA
INFERIOR
70
Métodos no Paramétricos Métodos no Paramétricos Métodos no Paramétricos Métodos no Paramétricos
5.5. Aplicación práctica De todo esto, podemos concluir que el geno-
tipo 3 ha podido resultar significativo debido al
Los resultados obtenidos de la aplicación de azar y que el test o prueba global es más fide-
cada uno de estos métodos a nuestros datos son digno que el individual indicándonos la no exis-
los siguientes: tencia de diferencias significativas de estabili-
dad entre genotipos.
5.5.1. Método no paramétrico de Hühn Como para los estadísticos S(m)i (m = 3,6) no se
dispone de ninguna prueba de significación, los
Las Tablas 9 y 10 presentan los valores para genotipos más estables serían aquellos que mostra-
los estadísticos de Hühn. Para cada genotipo se sen los valores de S(m)i más pequeños. Así, los
ha calculado Z(1)i y Z(2)i basados sobre los orde- genotipos más estables son: 9, 10, 6, 1 y 7 (Tabla 9).
nes de los datos corregidos y no corregidos.
Los resultados de estos estadísticos tomando
Como puede verse en la Tabla 9, ΣZi(1)
= como base de la ordenación los datos originales,
10.88 y Zi(2) = 14.33. Ambos estadísticos son distan mucho de lo ya expuesto (Tabla 10).
menores que el valor de la chi-cuadrado para el
5% y 11 grados de libertad (X20.05,11 = 19.70). Así, ΣZ(1)i = 82.56 y ΣZ(2)i = 47.76 son alta-
Se puede concluir que no existen diferencias en mente significativos, dado que ΣZ(1)i y ΣZ(2)i son
estabilidad entre las 11 genotipos. De esta forma mayores que el valor de χ0.05,11= 19.7, por lo
se acepta la hipótesis nula (es decir: no existen que se puede decir que existen diferencias en
diferencias de estabilidad entre los genotipos estabilidad entre los 11 genotipos. Por tanto,
del ensayo), por lo que no es necesario conti- procedemos a inspeccionar los valores indivi-
nuar con una comparación múltiple entre los duales de Z(m)i, los cuales son significativos para
valores S(m)i (m=1,2). los genotipos 1, 4, 5, 6, 7, 8, 9 y 10 para S(1)i, y
4, 5, 6, 7, 8, 9 y 10 para S(2)i, siendo altamente
A pesar de que no es necesario continuar significativos para S(1)i los genotipos 7 y 4, ya
con una comparación múltiple, podemos ver que el valor de χ0.001,1 = 10.82 es menor que
como en la Tabla 9, inspeccionando los valores Z(1)4=12.142 y Z(1)7=24.811.
individuales de Z(m)i, se encuentra que el genoti-
po 3 es significativo (Z(m)i > χ20.05,1 = 3.84, m = En cuanto a los estadísticos S(m)i (m = 3,6), el
1,2). El error probabilístico esperado según la genotipo 7 resulta ser el más estable, siguiéndo-
teoría de Probabilidades es: le 5 y 6.
Tabla 9. Cálculo de los estadísticos S(m)i (m = 1,2,3,6) Datos Y*ij (transformados).
6 3.511 8.488 0.041 0.227 7.958 2.500
7 4.022 11.433 0.392 0.205 10.394 2.747
8 4.022 12.055 0.392 0.421 12.764 3.294
9 3.022 6.844 0.993 0.993 6.695 2.174
10 2.911 6.322 1.385 1.349 6.393 2.179
11 3.644 9.733 0.002 0.007 9.954 2.954
71
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Tabla 10. Cálculo de los estadísticos S(m)i (m = 1,2,3,6). Datos Yij (originales).
6 1.844 2.722 8.454** 5.285* 2.130 1.043
7 0.566 0.336 24.811*** 9.318** 0.221 0.358
8 2.111 3.211 6.125* 4.598* 4.737 2.492
9 1.977 3.211 7.243** 4.598* 4.070 1.887
10 1.922 2.581 7.736** 5.493* 2.716 1.578
11 2.577 4.733 2.951 2.767 4.392 1.855
parámetros clásicos de estabilidad (varianza De esta forma, la reducción en significación
ambiental, ecovalencia, coeficiente de regresión para los datos corregidos puede ser considera-
y S2di) los resultados obtenidos eran idénticos da como un aumento de fiabilidad si se está inte-
tanto para los datos originales Yij como para los resado en una caracterización de la estabilidad
transformados Y*ij. De esta forma, esta transfor- de los genotipos independientemente del nivel
mación sólo afecta a los estadísticos no-paramé- de rendimiento.
tricos, cambiando sus ordenaciones y haciendo
que éstas sean muy diferentes según se opere
con Yij o con Y*ij. 5.5.2. Método de “consistencia
de comportamiento”
El gran efecto de la transformación queda
demostrado observando los resultados de las Un genotipo se considera estable si sus
pruebas de significación en las Tablas 10 y 11. ordenaciones son relativamente consistentes en
Esta transformación reduce drásticamente los todos los ambientes. En la Figura 8 se represen-
niveles de significación individuales (significa- tan las ordenaciones medias de cada genotipo
ciones basadas sobre Z(1)i y Z(2)i) y globales en todos los ambientes en función de las desvia-
(significación para diferencias en estabilidad ciones típicas de dichas ordenaciones y en la
entre todos los genotipos). Por tanto, el utilizar Figura 9 los rendimientos genotípicos medios
los datos originales supone un mayor nivel de frente a sus desviaciones típicas. Los resultados
discriminación (es decir, se tienen mas posibili- obtenidos para nuestros datos pueden verse en
dades de encontrar mas diferencias significati- la Tabla 11, base para las representaciones grá-
vas entre genotipos), que si se opera con los ficas de las Figuras 8 y 9.
datos transformados.
Figura 8. Consistencia del comportamiento (órdenes)
2,9
2
2.4
STD. ORDENAMIENTO
3
11
1.9 5 1 9 8
6 10
1.4 4
0.9
7
0.4
1 2 3 4 5 6 7 8 9 10 11
ORDENAMIENTO MEDIO
72
Métodos no Paramétricos Métodos no Paramétricos Métodos no Paramétricos Métodos no Paramétricos
Figura 9. Consistencia del comportamiento (rendimiento)
950
2
850
STD.RENDIMIENTO 6
750 8
5
3 7
650
4 1
550 11
10
9
450
2.800 3.000 3.200 3.400 3.600 3.800 4.000 4.200
RENDIMIENTO MEDIO
En la Fig. 8 los genotipos que muestran una son más estables y de mayor rendimiento. Nos
adaptación general se encontrarán en el cua- combina, pues, en una gráfica, estabilidad y ren-
drante denominado “Consistencia Superior” dimiento.
(ordenamiento bajo y desviación típica baja),
mientras que genotipos que muestran una adap-
tación específica se encuentran en el cuadrante 5.5.3. Método de Kang
de “Inconsistencia Superior”. Así, los genotipos
seleccionados para amplia adaptación son el 7 En éste método se asigna un número de
y el 6, mientras que los genotipos 1, 2, 5 y 11 orden a cada valor de rendimiento medio, dando
pueden ser seleccionados para ambientes el valor de 1 al rendimiento más alto. También se
específicos. asignan las ordenaciones a los valores de σ2i
(varianza de Shukla; ver Capítulo 3), dando el
En la Fig. 9 los genotipos seleccionados por valor de 1 a la varianza σ2i más pequeña. Las
poseer un mayor rendimiento y estabilidad son dos ordenaciones se suman para cada genoti-
1, 7 y 11 que se sitúan en el cuadrante inferior po. El valor más pequeño, resultante de esta
derecha al poseer una desviación típica peque- suma, daría el genotipo más deseable. La misma
ña y un rendimiento superior a la media del operación se puede efectuar con s2i , de tal
ensayo. forma que podemos sumar ambos valores resul-
tantes de σ2i +rendimiento y de s2i +rendimiento,
Como se puede observar este método tiene obteniendo el órden final para cada genotipo.
la ventaja de su sencillez en los cálculos y su Los resultados obtenidos de la aplicación del
poder resolutivo en las gráficas. En éstas ya método de Kang para nuestros datos se presen-
podemos estimar rápidamente qué genotipos tan en la Tabla 12.
GENOTIPOS
1
REND. MEDIO
3699.38
STD. REND.
581.971
RANGO MEDIO
4.60
STD. RANGO
2.011
2 3825.07 898.333 4.95 2.872
3 2877.50 678.528 9.20 2.347
4 2920.35 593.609 9.90 1.524
5 3896.25 723.460 3.95 1.921
6 3907.16 764.045 3.50 1.649
7 4241.11 700.386 1.35 0.579
8 3193.40 758.453 8.90 1.791
9 3320.56 463.358 7.90 1.792
10 3517.99 518.824 6.45 1.606
11 3617.71 578.907 5.30 2.175
73
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Tabla 12. Método de Kang
GENOTIPO σ2i s2i Rend. σ2i + Rend. s2i + Rend. Suma Orden
1 2 3 5 7 8 15 3
2 10 10 4 14 14 28 9
3 11 11 11 22 22 44 11
4 7 8 10 17 18 25 8
5 8 9 3 11 12 23 7
6 6 5 2 8 7 15 2
7 5 6 1 6 7 13 1
8 9 7 9 18 16 34 10
9 3 2 8 11 10 21 6
10 1 1 7 8 8 16 4
11 4 4 6 10 10 20 5
(Tabla 12) se pueden seleccionar los genotipos
1, 7, y 10 (en los cuales σ2i no es significativa- Es un método muy simple que consiste en
mente distinta de cero, ver Tabla 5) y en la dibujar un histograma en el que quede reflejado el
columna “s2i+rendimiento” los genotipos 1, 6, y número de ambientes para los cuales un genotipo
10. Y en conjunto (columna “Orden”), los genoti- ha mostrado posiciones altas, medias o bajas.
pos seleccionados serían el 7, 6, 1 y 10 (por Los valores obtenidos según este método para
este orden de preferencia). Como vemos los cada genotipo pueden verse en la Tabla 13, y su
genotipos seleccionados difieren según utilice- representación gráfica en las Figuras 10, 11, y 12.
mos una columna u otra en un sólo genotipo,
debido a las diferencias de significación de σ2i y Un genotipo con mayor porcentaje de núme-
s2i. Los genotipos que se consideraban estables ros de orden en la clase 1-3 será considerado
(s2i no significativa) después de la utilización del como relativamente bien adaptado a todos los
covariante (índice ambiental) incluyen el genoti- ambientes del ensayo de nuestro ejemplo. Sin
po 6 y excluyen el 7 (ver Capítulo, 3, Tabla 5). embargo, con éste método no se identifican los
genotipos adaptados específicamente a un cier-
Resulta ser, por tanto, un método útil para to ambiente.
seleccionar simultáneamente para rendimiento
y estabilidad de rendimiento. Además, se trata De la visualización de las Figuras 10, 11 y 12
de un método realmente polivalente. Así, si esta- podemos concluir que los genotipos selecciona-
mos interesados en dar más peso al rendimien- dos por su amplia adaptación serían los repre-
to o a la estabilidad, se podría hacer sin más sentados en la Fig. 10, es decir, los genotipos 7,
que multiplicar por un coeficiente los órdenes 6 y 2, los cuales se caracterizan por contener la
de rendimiento o de estabilidad. Por ejemplo, si mayor parte de sus números de órden en la
estamos interesados en dar el doble de peso al clase 1-3.
efecto rendimiento que a la estabilidad lo que
hacemos es multiplicar por 2 el orden obtenido Este método resulta, como hemos visto, sim-
para los rendimientos medios y le sumamos el ple y sencillo y, como todos los métodos no-
orden correspondiente a la varianza de Shukla paramétricos, independiente de la escala, ade-
(= 2*orden rendimiento+orden σ2i). más de dar igual peso a cada ambiente.
74
Métodos no Paramétricos Métodos no Paramétricos Métodos no Paramétricos Métodos no Paramétricos
Figura 10. Genotipos 2-6-7 (órdenes bajos)
12
10
10
8
6
6 5
4
4 3
2 1 1
0 0
0
1-3 4-6 7-10
GEN2 GEN6 GEN7
GENOTIPOS
1
2
3
5
CLASES DE ÓRDENES (Posiciones)
1 - 3(*) 4 - 6 7 - 10
5
1
2
4
ORDEN FINAL
5
3
3 0 2 8 8.5
4 0 1 9 10.5
5 3 7 0 4
6 6 3 1 2
7 10 0 0 1
8 0 1 9 10.5
9 0 2 8 8.5
10 0 5 5 7
11 3 3 4 6
(*) Número de ambientes en los cuales cada genotipo tiene un número de orden comprendido
entre 1 y 3.
Figura 11. Genotipos 10-11-1-5 (órdenes medios)
8 7
7
6 5
5 5
5
4
4 3 3 3 3
3
2
2
1 0 0
0
1-3 4-6 7-10
GEN10 GEN11 GEN1 GEN5
75
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Figura 12. Genotipos 8-9-3-4 (órdenes altos)
10 9 9
8 8
8
4
2 1
2 1 2
0 0 0 0
0
1-3 4-6 7-10
GEN8 GEN9 GEN3 GEN4
and adaptation of hexaploid spring triticale. • KANG, M. S, and H. N. PHAM. 1991:.Simul-
Euphytica 47, 57-64. taneous Selection for High Yielding and Stable
Crop Genotypes. Agronomy journal. 83, 161-165.
• HUEHN, M. 1990b: Nonparametric measu-
res of phenotypic stability. Part 2: Applications. • KETATA, H., S.K. YAN and M. NACHIT.
Euphytica 47, 195-201. 1989: Relative consistency performance across
environments. Int. Sym. on Physiology and Bree-
• HUEHN, M. 1990a: Nonparametric measu- ding of Winter Cereals for stressed Mediterrane-
res of phenotypic stability. Part 1: Theory. Euphy- an Environments. Montpellier. July 3-6, 1989.
tica 47, 189-194.
• NASSAR, R., and M. HÜHN, 1987: Studies
• HÜHN, VON M. 1979: Beiträge zur erfas- on estimation of phenotypic stability: Test of sig-
sung der phänotypischen stabilität. EDV in Medi- nificance for nonparametric measures of phe-
zin und Biologie 10 (4), S. 112-117. notypic stability. Biomet. 43, 45-53.
international maize yield trials. Theor. Appl.
Genet. 81, 162-165.
76
6
MÉTODO
DEE SKRIDGE
Método de Eskridge Método de Eskridge Método de Eskridge Método de Eskridge Método de Eskridge
6. MÉTODO DE ESKRIDGE que cuanto se desvía de 1 la pendiente de un
genotipo. Se demuestra (Eskridge, 1990) que la
La estabilidad de un genotipo la fundamentó media y la varianza poblacionales se estiman
Eskridge (1990) en cuatro diferentes modelos, por los valores de Yi. y de (bi-1)2S2y(1-1/e), res-
según los parámetros de estabilidad incluidos pectivamente. Estos valores se sustituyen en
en el análisis. Así, los parámetros incluidos en [41] dando el índice FW (FW=Yi.-Z(1-α) [(bi-
cada modelo son: 1)2S2y(1-1/e)]1/2). Cuando todos los genotipos
tienen pendiente 1, el índice FW tiende al rendi-
1) La varianza ambiental (S2xi) (3.4). miento medio.
Wilkinson y el cuadrado medio residual (S2di) de
Eberthart y Russell (2.2.3). por medio del Cuadrado Medio del error en un
ANOVA. σ2e+σ2i sustituye a Vi en [41], resultan-
Denominaremos respectivamente EV, FW, SH do el índice SH (SH=Yi.-Z(1-α)[σ2e+σ2i]1/2).
y ER los valores de Eskridge resultantes. Estos
cuatro diferentes estadísticos de estabilidad se 4) Siguiendo un razonamiento similar al uti-
incorporan a la ecuación de Kataoka (1963): lizado para la obtención del índice FW, se
demuestra (Eskridge, 1990) que la media y la
varianza poblacionales según el método de
—
Yi.-Z(1-α) (Vi)1/2 (41) Eberhart y Russell pueden estimarse por los
valores de Yi. y (bi-1)2S2y(1-1/e)+S2di, respec-
donde: tivamente. Esta varianza representa la propor-
_ ción de la varianza total del genotipo i-ésimo,
Yi. es la media genotípica del genotipo i. que es debida por un lado a la desviación de
Z(1-α) es el percentíl (1-α) de una distribución la pendiente de 1 y por otro a la desviación de
Normal. la regresión lineal. Estos valores sustituidos
Vi es una medida de estabilidad del genotipo i. en [41] resultan en el índice ER (ER=Yi.-Z(1-α)
[(bi-1)2S2y(1-1/e)+S2di]1/2).
Veamos con más detalle como estas cuatro
medidas de estabilidad se incorporan a la ecua- La forma de calcular algunos parámetros
ción [41]: antes comentados es la siguiente:
calcula teniendo en cuenta nuestro modelo
Yi. (media genotípica en todos los ambientes) y mixto, donde el efecto ambiental es aleatorio,
S2xi. Estas estimaciones sustituyen respectiva- así, la varianza se despeja de la siguiente forma
mente a Yi. y Vi en [41], dando el índice denota- (ver Tabla 1):
do por EV (EV= Yi.-Z(1-α) (S2xi)1/2). Utilizando este
índice se podrán seleccionar genotipos con σ2e = [CM(E) - CM(RE)]/gr (43)
medias genotípicas mayores y varianzas
ambientales menores. CM(E) = (Σ Y2.j./gr - FC)/(e-1) (44)
2) Según éste modelo se selecciona un culti- CM(RE) =[Σ Σ Y2.jk/g - SC(E) - FC]/[e(r-1)] (45)
var con media grande y pendiente (bi) próxima a
uno. La ecuación [41] podría utilizarse para Un valor concreto de α (o de Z(1-α)) indica el
sopesar la importancia del rendimiento medio grado subjetivo del mejorador para aceptar
según el coeficiente de Finlay y Wilkinson si se bajos rendimientos expresado en términos de
define una medida de varianza que nos cuantifi- probabilidad. Se utilizan valores pequeños de α
79
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
cuando la obtención de rendimientos bajos pre- Estos cambios en las ordenaciones genotí-
supone una serie de costes sociales altos (ban- picas de los índices pueden ser debidos a que
carrota, hambre, ..etc), como sería el caso de una el ordenamiento de los genotipos ha resultado
agricultura de subsistencia. Por ello hemos elegi- ser muy sensible al nivel α especificado y a la
do un α = 0.05 [Z (0.95) = 1.645], que significaría elección del parámetro de estabilidad introdu-
que de 20 rendimientos medios existe la proba- cido en la fórmula [41]. Un α = 0.05 indica que
bilidad del 5%(o sea, una sola vez) de obtener un existirían problemas graves si se diera una
rendimiento bajo en un ambiente determinado. bajada de rendimiento. Pueden utilizarse otros
valores de α. Idealmente, el mejorador podría
determinar el valor medio de α para la situación
6.1. Caso práctico agrícola que es objeto del programa de mejora.
Si no se pudiera determinar directamente,
Los valores obtenidos para los índices del podría deducirse a partir de investigaciones
método de “primera seguridad”, de Eskridge previas. Por ejemplo, para agricultores de sub-
se dan en la Tabla 14. Como vemos existen dife- sistencia las preferencias de riesgo han mos-
rencias en las ordenaciones de los genotipos de trado tener valores de Z(1-α) de 0.5 y 1.5,
correspondiendo a valores de α comprendidos
un índice a otro, aunque el mejor genotipo (el 7)
es el mismo para los 4 índices. entre 0.3 y 0.05.
1 2742.03(2) 3667.55(3) 2775.56(4) 3330.74(3) 3699.37(5)
2 2347.31(8) 3433.53(6) 2645.19(6) 3054.59(7) 3825.07(4)
3 1761.32(11) 2337.94(11) 1306.66(11) 1632.88(11) 2877.50(11)
4 1943.86(10) 2809.92(10) 1878.11(10) 2330.93(10) 2920.35(10)
5 2706.15(3) 3775.47(2) 2847.34(3) 3296.54(4) 3896.24(3)
6 2650.30(6) 3667.06(4) 2899.60(2) 3386.96(2) 3907.15(2)
7 3088.97(1) 4117.00(1) 3249.35(1) 3739.01(1) 4241.11(1)
8 1945.74(9) 3006.04(9) 2138.49(9) 2588.31(9) 3193.40(9)
9 2558.33(7) 3114.28(8) 2393.39(8) 2958.32(8) 3320.56(8)
10 2664.52(5) 3410.56(7) 2621.36(7) 3221.83(5) 3517.98(7)
11 2665.40(4) 3549.35(5) 2653.94(5) 3165.60(6) 3617.71(6)
Como se observa en la Tabla 14, la elección bilidad puede ser útil cuando el ensayo se realiza
de una determinada definición de estabilidad en un grupo de ambientes diversos. Consecuen-
tiene un gran impacto sobre el ordenamiento de temente los índices FW y SH pueden ser útiles
los genotipos. Así: para evaluar un grupo de genotipos entre sí en un
amplio margen de ambientes, pero se debe
a) La estabilidad de tipo 1 (S2xi) depen- extremar la precaución a la hora de realizar extra-
de de la diversidad de ambientes del experi- polaciones a genotipos no incluidos en el ensayo.
mento. Si los ambientes son muy distintos enton-
ces la estabilidad de tipo 1, y en consecuencia c) La estabilidad de tipo 3 (S2di) mide
el índice EV, no resulta muy útil. Sin embargo, si irregularidades impredecibles de la respuesta de
los ambientes del ensayo son muy parecidos, un genotipo a los diversos ambientes (en con-
entonces la estabilidad de tipo 1 y, por tanto, el traste con la de tipo 2, que mide la parte predeci-
índice EV, podrían ser útiles. ble de la respuesta). El índice ER incluye ambos
tipos de estabilidad, tipos 2 y 3, siendo por ello un
b) La estabilidad de tipo 2 (bi y α2i) con- índice más completo que FW y que SH.
sidera un cultivar como estable si su respuesta
ambiental es paralela a la respuesta media de Como resumen, se puede decir que la utiliza-
todos los cultivares del ensayo. Este tipo de esta- ción de los índices del método de “primera
80
Método de Eskridge Método de Eskridge Método de Eskridge Método de Eskridge Método de Eskridge
seguridad” tiene ciertas ventajas. Están basados Sin embargo, la aplicación de éstos índices
sobre la razonable suposición de que el mejora- puede estar limitada por una serie de desventa-
dor tiene como principal preocupación eliminar jas. Así, puede resultar difícil encontrar un valor
todo tipo de riesgos para una posible elección realista de α, sobre todo si hay que tener en
de un cultivar con elevada probabilidad en dar cuenta una situación agrícola concreta. Por otro
rendimientos bajos. Asimismo, poseen un interés lado, los índices están basados sobre varianzas
intrínseco por ser, estos índices, límites inferiores estimadas, las cuales pueden mostrar, por sí mis-
de confianza. En suma, pondera la importancia mas, un gran error en su estimación. Unas esti-
relativa del dúo estabilidad-rendimiento. Final- maciones imprecisas de varianzas pueden pro-
mente, este método es útil para ser aplicado a ducir ordenaciones de genotipos de valor dudo-
los tres tipos de estadísticos univariantes de so o nulo. Finalmente, según Eskridge, se pueden
estabilidad definidos por Lin y col. 1986 (véase desarrollar otros índices alternativos a los expues-
Capítulo 1). tos por él, siguiendo a Roy (1952) y Telser (1955).
of assets. Econometrica 20,431-449.
• ESKRIDGE, K.M. 1990: Selection of stable
cultivars using a safety-first rule. Crop Sci. 30, • SHUKLA, G.K., 1972: Some Statistical
369-374. aspects of partitioning genotype-environmental
components of variability. Heredity 29, 237-245.
• FINLAY, K.W. and G.N. WILKINSON, 1963:
The analysis of adaptation in a plant breeding • TELSER, L.G. 1955: Safety-first and holding.
programme. Aust. J. Agric. Res. 14, 742-754. Rev. Econ. Stud. 23,1-16.
• ESKRIDGE, K.M., and B.E. JOHNSON.
1991: Expected utility maximation and selection
of stable plant cultivars. Theor. Appl. Genet.
81,825-832.
81
7
M
E
ÉTODO
STRELLA
Método Estrella Método Estrella Método Estrella Método Estrella Método Estrella Método Estrella
7. MÉTODO ESTRELLA correspondiente. Así pues, la estabilidad
puede estimarse de una forma visual en éste
El método Estrella (Flores, 1993) consiste en método.
dibujar una estrella con tantos radios como
ambientes, correspondiendo cada radio a un Los dibujos de las estrellas se presentan en
ambiente. En cada radio situamos, a una escala la Fig. 13. En ella podemos observar como los
conveniente, el rendimiento medio en ese genotipos 7, 6, 5, 2 y 1 son los de mayor área,
ambiente para un genotipo dado. Uniendo cada siendo, entre ellos, el genotipo 7 el que más tien-
uno de éstos puntos, se obtiene una estrella de a la forma circular, siendo, por tanto, según
representativa del comportamiento de cada éste método, el más estable.
variedad (o genotipo, en general).
La principal ventaja es la sencillez y rapidez
El rendimiento medio será proporcional al de resultados, y aún más cuando algunos geno-
área de la estrella y cuanto más tienda la tipos sobresalen de entre los demás. Como des-
forma de ésta a la de una circunferencia, más ventaja, no existe una prueba de significación
estable será el comportamiento de la variedad satisfactoria.
5 6 7 8
1 2 3 4
REFERENCIAS CITADAS
• FLORES, F. 1993: Interacción Genotipo-
Ambiente en Vicia faba L. Tesis Doctoral.
E.T.S.I.A.M. Córdoba.
85
8
C
ANÁLISIS DE
OMPONENTES PRINCIPALES
Análisis de Componentes Principales Análisis de Componentes Principales Análisis de Componentes Principales
8. ANÁLISIS DE COMPONENTES Con pocos vectores, pues, podemos explicar,
PRINCIPALES en ciertos casos, gran cantidad de la variación
total. Estudiando los componentes de los nuevos
El análisis de componentes principales (ACP) ejes puede establecerse cuáles han sido los carac-
parte de una tabla de datos compuesta por e teres que más han contribuido a conseguir la sepa-
caracteres (ambientes en nuestro caso) obser- ración mostrada por el eje en cuestión; estos
vados en g individuos (genotipos). Estos indivi- caracteres serán aquellos para los cuales el coefi-
duos se consideran como puntos en un espacio de ciente correspondiente (aij√–λi) es mayor en valor
e dimensiones, determinado por unos ejes que absoluto. El caso ideal es aquel en que el coseno
representan a los caracteres. que forma la variable antigua con la nueva (aij√–λi)
es próximo a la unidad, lo que indica que la nueva
El análisis consiste en transformar el conjunto variable coincide en dirección con la antigua,
de variables Y1, Y2, ...Ye en un nuevo conjunto X1, diciéndose entonces que aquella tiene el “sentido
X2, ...Xe en el que cada Xi es una combinación line- físico” dado por ésta.
al de las Yi, o sea:
Las componentes principales se pueden obte-
Xi = ai1Y1 + ai2Y2 + ..... + aieYe (46) ner también partiendo de la matriz de correlaciones
R. Las componentes principales extraídas de la
siendo la suma de los cuadrados de los coefi- matriz C son distintas de las obtenidas de la matriz
cientes aij igual a la unidad, por ser las aij los cose- R, es decir, que el método no es invariante res-
nos directores de la recta representada por la pecto a la matriz de partida.
ecuación (46):
La elección entre C ó R es un tema controverti-
e do. Si las unidades de medida de las variables son
∑ a2ij = 1 (47)
j=1 distintas (años, kilos, metros,..etc.), es preferible el
uso de R, porque equivale a utilizar variables redu-
Las componentes principales se obtienen dia-
cidas y, por tanto, sin dimensión física. Pero si las
gonalizando la matriz de covarianzas C:
unidades de medida son las mismas (como es
nuestro caso) o razonablemente comensurables,
C = A DλA’ (AA’= A’A = I) (48)
es preferible realizar el análisis sobre C, que es
menos artificial
siendo Dλ la matriz diagonal Dλ= diag(λ1, ..,λe)
que contiene los valores propios de C. Estos valores
Como resumen, la finalidad de las componen-
se obtienen resolviendo la ecuación C - λiI = 0.
tes principales es la de simplificar la estructura de
los datos, sin obedecer a un modelo fijado “a prio-
Se demuestra que λ nunca puede ser negativo
ri”, para poder explicar, en pocas componentes, la
y que ∑i λi = e. Como cada λ lleva asociado un vec-
mayor parte de la información que contienen las
tor propio, y estos son ortogonales entre sí, hemos
variables. El análisis de componentes principales
obtenido unas nuevas variables en función de las
(ACP) es uno de los métodos más antiguos de
antiguas:
ordenación indirecta. Representamos la matriz de
datos inicial como una matriz GxE, G unidades u
Xi = ∑j aijYj (49)
observaciones (genotipos) y E variables (ambien-
tes). El propósito de éste análisis es producir una
que están descorrelacionadas entre sí.
ordenación de las observaciones en un pequeño
número de dimensiones, las cuales explican la
Se demuestra asimismo que la varianza de Xi es
mayor cantidad de variación original.
λi, lo que implica que cada valor propio explica un
porcentaje λi*(100/e) de la variación total registrada
Se pueden realizar cuatro análisis de componen-
y además la primera componente principal X1 es la
tes principales en el estudio de la Interacción GxE:
que tiene mayor varianza, siendo X2 la que tiene
mayor varianza de todas las nuevas variables no
1) ACP en el que los genotipos son las variables
correlacionadas con X1, y X3 la que tiene mayor
y los ambientes las observaciones, partiendo de
varianza de todas las nuevas variables no correla-
los datos originales de rendimiento.
cionadas con X1 y X2 ,.. etc. hasta definir el conjun-
to de nuevas variables. Para el tratamiento matemá-
2) Lo mismo que en 1 pero partiendo de datos
tico que conduce a la breve descripción anterior,
transformados (Y*ij):
véase Kendall and Stuart (1961) y Cuadras (1981).
89
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
— — — —
Y*ij = Yij - Yi. - Y.j + Y.. (50) 8.1. Caso práctico
es decir, eliminando del dato original los valores Los resultados de los cuatro análisis de Com-
medios genotípicos y ambientales. ponentes Principales para nuestros datos se pre-
sentan a continuación. Dado que en este último
3) ACP en el que los ambientes son las varia- decenio la utilización del análisis de Componentes
bles y los genotipos las observaciones, partiendo Principales se ha realizado como componente del
de los datos originales. análisis AMMI, no se tratará con mucha profundi-
dad en este capítulo.
4) Lo mismo que en 3 pero con datos transfor-
mados de forma similar a 2.
8.1.1. ACP de Genotipos. Datos originales de
Estos análisis, para nuestro ejemplo, se han rendimiento
realizado con el programa NTSYS de la siguiente
forma: Los primeros componentes explican, respecti-
vamente el 76.91 y 14.08 % de la varianza. La pro-
a) Partimos de la matriz de datos 10 (ambien- yección de las coordenadas ambientales para los
tes) x 11 (genotipos) para los casos 1) y 3) anterio- dos primeros componentes principales se repre-
res y de la matriz 10 x 11 transformada según [50] sentan en la Figura 14.
para la obtención de los componentes, que repre-
sentan ciertamente a la interacción GxE, para los Se comprueba que para el primer componente,
casos 2) y 4) (ver Apéndice). el ordenamiento de las coordenadas ambientales
se corresponde exactamente con el obtenido con
b) Calculamos la matriz de covarianzas C con los rendimientos medios ambientales (Fig. 14: en la
la instrucción “Simil Interval”, dándole en el parte derecha están los ambientes de alto rendi-
Coeff=VARCOV. miento, y en la parte izquierda los de bajo rendi-
miento). Así pues, este componente representa el
c) A partir de C se calculan sus valores propios efecto ambiental. En cuanto al segundo compo-
y vectores propios asociados, con la instrucción nente no se aprecia un patrón obvio de respuesta.
EIGEN.
8.1.2. Datos transformados
d) Por último, se realiza la proyección de los
vectores propios (con la instrucción PROJ) obte- Los dos primeros componentes explican el
niéndose la gráfica de ambientes (Figs. 14 y 15) si 68.24 % y el 10.73 % de la varianza, respectiva-
hemos partido de genotipos como variables (casos mente. Las coordenadas ambientales para los dos
1 y 2) y la de genotipos (Figs. 16 y 17) si se ha par- primeros componentes principales se han repre-
tido de ambientes (casos 3 y 4). sentado en la Figura 15.
Figura 14. ACP datos sin transformar (ambientes)
-200
A9
-400
A5 A3
ACP2
-600
A10 A8
-800
A6 A7
-1.000
A4 A2
A1
-1.200
2.549 2.749 2.949 3.149 3.349 3.549 3.749 3.949 4.149 4.349
ACP1
90
Análisis de Componentes Principales Análisis de Componentes Principales Análisis de Componentes Principales
Figura 15. ACP datos transformados (ambientes)
300
A6 A4
200
A9 A5
100
ACP2
A1
A8 A7
0 A3
-100
A10
A2
-200
-900 -800 -700 -600 -500 -400 -300 -200 -100 0
ACP1
Partir de los datos transformados tiene una jus- ambiente ejerce sobre la Interacción GxE viene
tificación: que de alguna forma el análisis de com- dado por el valor y signo de su coordenada IACP,
ponentes principales nos ayude a definir qué por contra, en el análisis de Componentes Princi-
ambientes y qué genotipos muestran un grado pales no resulta tan obvio determinar la cuantía del
menor de interacción. Es decir: identificar, sobre aporte de cada ambiente a la Interacción GxE.
todo, aquellos genotipos que engrosan en menor
cuantía la interacción GxE total. Por tanto, en la De esta forma nos limitaremos en este Capítulo a
Figura 15 podemos esperar que la distribución de exponer brevemente los resultados de los ACP’s y diri-
los ambientes obedezca a una gradación en el gir la atención del lector al estudio del análisis AMMI.
aporte a la interacción GxE. Cuando veamos el
análisis A.M.M.I. en el capítulo siguiente recordare-
mos la coincidencia de resultados con los obteni- 8.1.3. ACP de Ambientes. Datos originales de
dos en este apartado. Se puede observar como en rendimiento
la Fig. 15 el ordenamiento de los ambientes según
el primer componente principal ACP1 (de izquierda Los dos primeros componentes explican el
a derecha: A9, A8, A3, ...., A4) coincide completa- 77.41 % y 11.68 % respectivamente. Las coorde-
mente con el ordenamiento que se puede realizar nadas genotípicas para estos dos primeros com-
en la Fig. 18 respecto del eje de las coordenadas ponentes han sido representadas en la Fig. 16.
IACP1 ambientales (de la parte superior de la grá-
fica a la inferior: A9, A8, A3, ...., A4). Se puede observar en la Fig. 16 como se sigue el
mismo patrón que en el caso del ACP de genotipos
Como vemos existe una relación entre interac- (caso 8.1). El primer componente ordena los genoti-
ción GxE y la distribución de los ambientes dada pos según su rendimiento medio, mientras que del
por el ACP (Fig. 15), pero, así como en el análisis segundo componente no podemos extraer ninguna
AMMI (ver Capítulo siguiente) el aporte que cada información clara relacionada con estabilidad.
Figura 16. ACP datos sin transformar (genotipos)
1.700
G3
G11 G1
1.500 G7
G10
G9 G5 G6
1.300
ACP2
G4 G2
1.100
900 G8
700
500
2.234 2.434 2.634 2.834 3.034 3.234 3.434 3.634 3.834
ACP1
91
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Figura 17. ACP datos transformados (genotipos)
300
200 G5
100
G8 G3
G9
ACP2
0
G10
G2 G6
-100 G11
G4
G7
-200
G1
-300
-600 -500 -400 -300 -200 -100 0 100 200 300 400
ACP1
8.1.4. Datos transformados apartado 8.2 de este Capítulo, se tratará con más
profundidad la relación existente entre estos gru-
En la Figura 17 se representan las coordenadas pos formados y la Interacción GxE en el análisis
genotípicas de los dos primeros componentes prin- AMMI (Capítulo 9), dada la imposibilidad de poder
cipales, el primero extrae un 68.24 %, y el segundo realizarla, con cierta sencillez, con el ACP. Con el
un 10.73 % de la variación total. ACP sólo hemos sido capaces de determinar la
existencia de tres grupos bien diferenciados, pero
En esta gráfica podemos distinguir claramente no podemos enlazar cada grupo con un determi-
tres grupos compuestos por los siguientes genotipos: nado grado de estabilidad.
deben estar relacionados de alguna manera con la componente y los sucesivos representan la inte-
Interacción GxE. Este aspecto será dilucidado en racción GxE. Pero este no ha sido nuestro resul-
el Capítulo siguiente donde obtenemos mas infor- tado, lo que demuestra, una vez más, que no
mación, respecto a estabilidad, sobre los grupos caben generalizaciones en la interpretación de
formados. Recordamos al lector lo comentado en el los análisis de este tipo.
REFERENCIAS CITADAS
multivariante. Ed. por Eunibar. Barcelona. • KEMPTON, R.A. 1984: The use of biplots in
interpreting variety by environment interactions. J.
• FREEMAN, G.H. and B.D. DOWKER. Agric. Sci., Camb. 103, 123-135.
1973:The analysis of variation between and within
genotypes and environments. Heredity 30, 97-109. • MUNGOMERY, V.E., R. SHORTER and D.E.
BYTH, 1974: Genotype x environment interactions
• KENDALL, M.G. and A. STUART. 1961: The and environmental adaptation. I Pattern analysis -
advanced of statistics. Vol. 2, 3 rd ed. Griffin and Application to soya bean populations. Aust. J.
Co. Ltd. London. Agric. Res. 25, 59-72.
92
9“ A MAIN EFFECTS
DDITIVE
AND MULTIPLICATIVE
INTERACTION”: A.M.M.I.
“Additive Main Effects and Multiplicative Interaction”: A.M.M.I. “Additive Main Effects and Multiplicative Interaction”
9. “ADDITIVE MAIN EFFECTS AND coordenadas ambientales (√ λnδen) por las geno-
MULTIPLICATIVE INTERACTION”: típicas (√ λnδgn) obtenemos directamente la esti-
A.M.M.I. mación de la interacción ( λn τgn δen), de un
determinado genotipo en cualquier ambiente. El
Recuérdese que los ensayos de compara- conjunto de estos valores constituyen así, la
ción de variedades se realizan con un gran matriz de datos de la interacción estimada por el
número de variedades sembradas en distintos método AMMI.
ambientes, y dispuestas en varias repeticiones.
Recuérdese, asimismo, que la suma total de Los grados de libertad para cada componen-
cuadrados para los datos de rendimiento puede te del ACP retenido se calcula por el método de
separarse generalmente en tres partes: Gollob (1968):
Por definición, los efectos principales son 1º) Los autovalores de una matriz Y des-
aditivos, siendo la interacción no-aditiva. Si la compuesta por SVD (Singular Value Decompo-
interacción se expresa en términos individuales sition) pueden obtenerse a partir de la siguiente
de genotipo y ambiente, la partición aditiva es expresión (Gabriel, 1971):
imposible. La alternativa más simple para el aná-
2
lisis es una suma de términos multiplicativos. Y = λ21 + ... + λ2e (53)
El AMMI empieza con un análisis de la varian- haciendo la matriz Y igual a la matriz de datos
za (ANOVA) para calcular los efectos aditivos de de la interacción, la expresión anterior nos dice
genotipo y ambiente, y aplica a continuación un que la suma de cuadrados de la interacción la
Análisis de Componentes Principales (ACP) para podemos descomponer en e sumas de cuadra-
analizar los efectos no aditivos de la interacción. dos, representando cada una de ellas la suma
Como matriz de entrada para el ACP no se toman de cuadrados de cada uno de los ejes del ACP.
los datos originales de rendimiento, sino los datos
transformados (Y*ij = Yij - Yi. - Y.j + Y..) (Yi., Y.j, Y.. 2º) Por tanto, si obtenemos el porcentaje de
son, como siempre, medias marginales) que variación que retiene el primer eje del ACP (ver
representan indudablemente a la interacción, rea- Capítulo 8) podremos calcular la suma de cua-
lizándose un ACP (extrayéndose los componen- drados del primer eje, sin más que multiplicarlo
tes principales de la matriz de covarianzas y no por la suma de cuadrados de la interacción GxE
de la de correlaciones) para genotipos y otro para que obtenemos del ANOVA y dividir el resultado
ambientes, obteniéndose así las coordenadas entre el número de repeticiones del ensayo.
ambientales y genotípicas respectivamente.
3º) Según [53] la suma de cuadrados del pri-
El modelo es: mer eje es igual a λ21; podemos pues calcular la
raíz del primer autovalor del AMMI, que será
Yge = µ + αg + βe + ∑ λn τgn δen + θge (51) igual a la suma de cuadrados del primer eje del
ACP elevado a 1/4. Veamos cómo:
donde: Yge es el rendimiento del genotipo g
en el ambiente e, µ es la media general, α es la Siendo:
desviación media genotípica, β es la desviación
media ambiental, λn es el autovalor del eje n del SSge = suma de cuadrados interacción GxE
análisis de Componentes Principales, τgn y δen
son los vectores propios unitarios genotípicos y ki % el porcentaje de variabilidad retenido
ambientales, respectivamente, asociados a λn. por el eje i, y r el número de repeticiones
95
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
9.1. La validez Predictiva ño valor del RMS PD indica un buen ajuste del
modelo. Así, sea X1,1 el valor estimado para el
genotipo 1 en el ambiente 1 e Y1,1 el dato reser-
9.1.1. La validez predictiva se calcula por vado de confirmación para la misma combina-
medio del procedimiento de Confirmación Cru- ción de genotipo-ambiente. Como se ha explica-
zada (C.C.) descrito por Gauch y Zobel (1988). do, la forma de proceder para el cálculo del
La matriz de datos sin transformar se divide en estadístico RMS PD es la siguiente:
dos submatrices; una de ellas representa los
datos para el modelo y la otra los datos para la
confirmación. Para cada tratamiento de nues- 9.1.3.1.)
tro ejemplo (por ejemplo, para cada combina-
ción genotipo y ambiente) se han seleccionado (X1,1 - Y1,1)2 + (X1,2 - Y1,2)2 + .... + (Xg,e -
dos repeticiones al azar para el modelo y al que -Yg,e)2 =SS PD
aplicaremos el análisis AMMI, habiéndose reser-
vado la tercera como conjunto de observaciones 9.1.3.2.)
de confirmación (así, tenemos 11 x 10 x 1 = 110
observaciones para confirmación). SS PD/nº datos confirmación = MS PD
se utiliza para la estimación del error predictivo
(RMS PE)2 (siempre siguiendo la nomenclatura
9.1.2. Posteriormente se ajustan varios modelos: usual de este método).
AMMI0, el cual sólo estima los efectos aditivos
de genotipo y ambiente sin retener o incluir nin- Se estima que, en general, unos 10 modelos
gún eje del ACP en el modelo; AMMI1, que diferentes elegidos al azar de la matriz de datos son
combina los efectos aditivos del anterior con el suficientes para la realización de la confirmación
efecto interacción estimado por el primer eje del cruzada y comprobar si el análisis AMMI es más
ACP; y así sucesivamente hasta completar el preciso que un modelo de simples efectos aditivos.
total del número de ejes que será el menor de g
y e. El modelo completo (AMMI10) se denomi-
na CELL MEANS según la nomenclatura más 9.1.4. El análisis AMMI se completa con la
utilizada. construcción de un “biplot”. En abcisas se
representan los efectos principales (medias
genotípicas y ambientales) y en ordenadas la
9.1.3. Los valores estimados para cada modelo coordenadas en el primer eje del ACP.
se comparan con los datos de confirmación
(véase parágrafo 9.1.1). Por ejemplo, el valor
estimado por cualquier de estos modelos para el 9.2. Aplicación práctica
genotipo 1 en el ambiente 1 se compara con el
dato correspondiente de confirmación. La dife-
rencia entre el valor estimado y este último se 9.2.1. Procedimientos
eleva al cuadrado, se le suman todas las dife-
rencias restantes de todos los genotipos en Los resultados obtenidos para nuestros
todos los ambientes (véase 9.1.3.1). Esta suma datos del ejemplo se exponen a continuación. Se
de cuadrados se divide por el número de obser- han utilizado dos procedimientos:
vaciones de confirmación (véase 9.1.3.2) y se
calcula su raíz cuadrada (véase 9.1.3.3) dando a) Para la obtención de las coordenadas
lo que se denomina RMS PD (“Root Mean genotípicas y ambientales se ha ejecutado una
Square Predictive Difference”) según la corriente de control para el paquete estadístico
nomenclatura usual de este método. Un peque- SAS (ver Apéndice).
96
“Additive Main Effects and Multiplicative Interaction”: A.M.M.I. “Additive Main Effects and Multiplicative Interaction”
b) En el caso de que no se disponga de la El valor más pequeño del RMSPD nos indicará el
corriente de control anterior otra forma válida es modelo AMMI más preciso.
la siguiente (véanse en el Apéndice los progra-
mas necesarios):
9.2.2. Resultados
1) Se ha diseñado un programa en lenguaje
BASIC que a partir de la matriz de datos nos A continuación comentaremos los resultados
genera diez modelos totalmente al azar. obtenidos.
los autovalores y las coordenadas genotípicas y nificativos (P<0.0001) representando el 71.37,
ambientales. Previamente habrá habido que 9.45 y el 8.67 % de la S.C. de la combinación
introducir, como ficheros texto, los vectores pro- total de tratamientos, respectivamente.
pios obtenidos por el NTSYS.
Como hemos comentado anteriormente
Hasta aquí hemos completado los resultados según el criterio postdictivo del AMMI medido
obtenidos en el apartado a), pero el análisis por el ANOVA se incluirían en el modelo los dos
AMMI va más allá: debemos calcular cual es el primeros ejes de la interacción (recuérdase que
modelo más adecuado, es decir, debemos cal- el tercero resulta significativo al 8%, Tabla 15).
cular el RMSPD de los modelos al azar genera- Sin embargo, desde un punto de vista predicti-
dos en el apartado 1. vo, medido por el RMS PD, se selecciona el
AMMI1 ya que tiene el valor más bajo para este
4) Con otro programa en BASIC calculamos estadístico (453.08 kg/ha) (Tabla 17), sus coor-
los RMSPD para el AMMI0, AMMI1, AMMI2, ...., denadas genotípicas y ambientales se muestran
AMMI10 de cada modelo anterior. en la Tabla 16. Recordemos que este modelo es
el que incluye sólo el primer eje de la interacción.
5) Calculamos la media de los valores del
RMSPD para cada AMMI (AMMI0, AMMI1, ...., Con este modelo bastan 37 g.l.: 9 para
AMMI10) de los diez modelos generados al azar. ambientes más 10 para genotipos y 18 para el
Tabla 15. Efectos aditivos e interacción del ANOVA incluyendo los 3 primeros ejes del ACP
de la interacción
F. de V. GL SC R2 F Pr>F
Resd.(1-2) 42 505.8 21.03 0.86 .6980
Error 200 2740.0 12.04
97
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Tabla 16. Coordenadas genotípicas y ambientales del primer componente del AMMI.
1 3699.38 -2.557
2 3825.07 23.068
3 2877.50 -38.996
4 2920.35 -13.547
5 3896.25 11.667
6 3907.16 13.422
7 4241.11 12.456
8 3193.40 12.945
9 3320.56 -6.482
10 3517.99 -4.749
11 3617.71 -7.228
1 3607.44 -13.513
2 3686.88 -12.896
3 3304.04 8.480
4 3433.34 -22.456
5 2776.58 1.194
6 3561.86 -9.681
7 3784.10 -4.811
8 4422.35 20.237
9 4259.10 38.932
10 2633.84 -5.486
primer eje ACP de la interacción. Es 1.4 (=53/37; AMMI1. Para ello, empleando la nomenclatura
ver Tabla 17) veces más “parsimonioso” (esto es, de Crossa y col. (1990), la cantidad de mayor
necesita de pocos g.l.) que el AMMI2, que es el interés es el MSE(modelo) (error medio cuadráti-
que hubiera habido que seleccionar desde el co del modelo) que puede estimarse como la
punto de vista del criterio postdictivo al reco- diferencia entre el MSE(modelo - confirmación) y
mendar la prueba F incluir los dos primeros ejes en la varianza de los datos de confirmación.
el modelo, como ya se ha comentado (Tabla 15).
El MSE (modelo - confirmación) es el cuadra-
En la Tabla 15 vemos como el modelo AMMI1 do del RMS PD para el AMMI1 (453.08 kg/ha,
captura el 77.71 % de la S.C. del total del ensayo Tabla 17). La varianza de los datos de confirma-
[(9412.6+5571.2+2697.8)/22751.6] como valor ción es simplemente el cuadrado medio del error
predictivo. Por tanto, el procedimiento Confirma- del ANOVA del AMMI (173,350 ignorando repe-
ción Cruzada (C.C.) (Tabla 17) indica que el 22.29 ticiones dentro de ambientes, es decir, sin tener
% restante de la S.C. total (100-77.71) se corres- en cuenta, al realizar el ANOVA, la suma de
ponde con un residuo de valor no predictivo. cuadrados del término Rep./Amb. que quedaría
incluida en la suma de cuadrados del error), el
9.2.3. Estimación de las repeticiones necesarias cual, expresado en términos de su raíz cuadra-
da, es 416.35 kg/ha (RMS FE, Tabla 18).
Un cálculo interesante es determinar el
número de repeticiones necesarias, dentro de Así, para el AMMI1, el MSE(modelo) es esti-
ambientes, para igualar la precisión del modelo mado como [(453.08)2-(416.35)2], el cual expre-
Tabla 17. RMS PD (Kg ha-1) para siete modelos basados en datos de rendimiento.
AMMI0
AMMI1
AMMI2
AMMI3
AMMI4
MODELO COMPLETO
19
37
53
67
79
329
499.14
453.08
476.68
494.04
500.56
509.14
98
“Additive Main Effects and Multiplicative Interaction”: A.M.M.I. “Additive Main Effects and Multiplicative Interaction”
Tabla 18. Estimación de parámetros del AMMI para su evaluación predictiva para rendi-
miento medio de 11 genotipos en 10 ambientes.
PARÁMETROS ESTIMADO
MODELO Y ERROR
Modelo 77.71 %
Variación debida al azar 22.29 %
EVALUACIÓN DEL MODELO
Modelo postdictivo 2 IACP
G. L. postdictivo 53
Modelo predictivo AMMI1
G. L. predictivo 37
Parsimonia 1.4
PREDICCIÓN
Observaciones modelo ajustado 220
Datos de confirmación 110
RMS PD 453.08 kg/ha
RMS FE 416.35 kg/ha
RMS PE 178.70 kg/ha
RMS PE relativo a la media total 5.04 %
ción, mientras el MSE(modelo) está basado
sobre Rm repeticiones (donde Rm=número de
repeticiones utilizados para el modelo). 9.2.4. El “biplot”
De acuerdo con Gauch y Zobel (1988), el cál- Una forma de plasmar visualmente los resul-
culo del número de repeticiones (RL) que hacen tados del AMMI es realizando la gráfica o
que la predicción basada sobre el modelo com- “biplot” de rendimiento medio en función de
pleto tenga igual precisión que el mejor modelo las coordenadas del primer eje del ACP (IACP1)
predictivo basado en Rm repeticiones, se realiza de genotipos y de ambientes (Fig. 18). Los geno-
de una forma aproximada como tipos (o ambientes) con coordenadas elevadas
para IACP1 (tanto positivas como negativas) tie-
RL =[Var(datos confirmación)/MSE(modelo)]= nen una aportación mayor a la interacción GxE,
=[RMS FE/RMS PE]2 . mientras que los genotipos (o ambientes) con
IACP1 próximo a cero aportan mínimamente a la
El número aproximado de repeticiones nece- interacción, resultando éstos más estables.
sarios para que el modelo completo iguale al
AMMI1, por tanto, es RL=RAMMI= (416.35/178.70)2 Como puntualizaron Zobel y col. (1988), el ren-
=5.43. dimiento esperado, según el modelo AMMI1, para
cualquier combinación genotipo-ambiente puede
Como el mejor modelo predictivo está basa- calcularse a partir de la Fig.18. Veamos un ejemplo
do sobre Rm=2 repeticiones, el factor de ganan- de como realizar esta estimación y cómo el mode-
cia aproximado se puede definir como FG=RL / lo AMMI1 resulta más ajustado que el AMMI0. Para
Rm= 5.43/2 = 2.72 (Tabla 18). ello necesitamos los datos siguientes:
99
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Figura 18. Análisis AMMI
COORDENADA IACP1
60
A9
40
G2 A8
20 G6
G8 A3
G7
A5 G5
G1
0 G10
A10 G4 G9 G11 A7
A6 A2
-20 A1
A4
G3
-40
2.600 2.800 3.000 3.200 3.400 3.600 3.800 4.000 4.200 4.400
REND. MEDIO
kg/ha. racción se estima multiplicando las coordenadas
genotípicas por las ambientales del ACP1. Estos
De la matriz de datos que podemos ver en el dos resultados se suman para producir el valor
Apéndice recogemos el siguiente extracto: esperado del modelo AMMI1.
ajusta más la estimación del modelo AMMI1
El rendimiento estimado por el método (5,437.93 kg/ha) que la del modelo AMMI0
AMMI0 sería: (4,953.26 kg/ha). Existe una diferencia de 484.67
kg/ha entre ambos métodos, un 13.6 % respecto
Efectos aditivos= de la media del ensayo, dada por los efectos
= 4,241.11 + 4,259.1 - 3,546.95 = 4,953.26 multiplicativos (efectos de la Interacción GxE)
kg/ha. extraídos del primer eje del ACP.
El rendimiento estimado por el método
AMMI1 sería: 9.2.5. Agrupaciones en el biplot
podemos realizarlos de una forma aproximada
con los datos que nos ofrece el biplot de la Figu- Fig. 18:
ra 18, pues disponemos de los valores medios
tanto de genotipos como de ambientes para el 1) Grupo 1: incluye los genotipos 2, 5, 6, 7 y
cálculo de los efectos aditivos y de las coorde- 8. Los cinco se caracterizan por tener valores
nadas del IACP 1 para el cálculo de los efectos intermedios de signo positivo en sus coordena-
multiplicativos. das IACP1. Para estos genotipos, el modelo
100
“Additive Main Effects and Multiplicative Interaction”: A.M.M.I. “Additive Main Effects and Multiplicative Interaction”
AMMI1 predice rendimientos genotípicos iguales genotípicos con la máxima exactitud. Un obstá-
a los dados por el modelo AMMI0 en ambientes culo en ésta estimación son el “ruido” o “noise” y
con coordenadas IACP1 próximas a cero, meno- el error en los datos de campo.
res que los dados por el AMMI0 en ambientes
con coordenadas IACP1 negativas y mayores en De forma práctica, el ruido en el análisis
ambientes con coordenadas IACP1 positivas. AMMI se cuantifica por la S.C. residual después
de ajustar el mejor modelo predictivo, y el error
2) Grupo 2: constituido por los genotipos 1, se estima por las diferencias entre unidades
4, 9, 10 y 11 que tienen unos valores intermedios individuales experimentales (repeticiones) den-
de signo negativo en sus coordenadas IACP1. tro del mismo tratamiento (combinaciones GxE).
clara la posibilidad de establecer una serie de extraído del diseño de bloques al azar. Esto no
grupos como hicimos con los genotipos. Aún así implica, sin embargo, que éstas u otras fuentes
podemos decir que muestran una mayor variabi- de variación estén libres de error y ruido.
lidad en el efecto principal (media) que en el
efecto de la interacción (IACP1). Desde un punto de vista práctico, es difícil
una distinción precisa entre “ruido” y “error”. La
desigualdad en el riego, la aplicación de pro-
9.2.6. Comentarios finales ductos agroquímicos, los daños por insectos y
animales y las enfermedades contribuyen a la
Como podemos observar, hemos obtenido existencia de unas variaciones indeseables de
unos resultados muy similares a los obtenidos tipo “ruido”, tanto como las diferencias en suelo
por el análisis de Componentes Principales en y las imprecisiones en las operaciones de
cuanto a la ordenación de los genotipos y campo. Estadísticamente, el grado en que éstos
ambientes. Sin embargo, el análisis AMMI va pueden ser cuantificados por medio de repeti-
más allá estimándonos el aporte de cada geno- ciones, bloques incompletos, error, residual, u
tipo y ambiente al efecto de la interacción. otros términos en un análisis de varianza depen-
de del diseño experimental, y del análisis esta-
En la Tabla 18 resumimos los resultados dados dístico realizado.
por el AMMI para nuestro ensayo. En ella podemos
ver como el modelo AMMI1 extrae el 77.71 % de la Existen tres tipos básicos de estrategias para
S.C. del total del ensayo, con 37 g.l. (10 de genotipos, controlar el error e incrementar la precisión de
9 de ambientes y 18 del IACP1), y 22.29 % como los rendimientos genotípicos estimados:
variación no predictiva debida al azar, con 72 g.l.
1) Partición del error.
En dicha Tabla también podemos ver como 2) Partición de la variación genotípica, y
el número aproximado de repeticiones (RAMMI) 3) partición de la variación GxE.
necesarios para que el modelo completo iguale
la precisión del AMMI1 es de 5.43. Es decir, el El primero utiliza un diseño de bloques
modelo AMMI1 basado en dos repeticiones es incompletos en forma de “lattices” o “lattices”
tan preciso como el modelo completo con 5.43 generalizados, el cual sustrae la variación entre
repeticiones, de esta forma existe un factor de bloques del error experimental. El segundo
ganancia teórico en precisión de 2.72. El benefi- incluye un método espacial (análisis “neighbor”,
cio en repeticiones es de 3.43 o lo que es lo análisis en cuadros latinos, análisis de parcelas
mismo un beneficio de 377 observaciones. vecinas) para ajustar los patrones de variación
de la fertilidad del suelo.
101
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Dado que estos tres tipos de estrategias de por el efecto conjunto de los restantes ambientes.
control del error se aplican a fuentes de varia- Según Crossa y col. (1991) la mayoría de las cau-
ción diferentes y ortogonales (error, genotipos, e sas biológicas asociadas a la interacción GxE
interacción) se pueden utilizar independiente o podrían ser relegadas al término residual del aná-
simultáneamente. lisis AMMI.
Una ventaja significativa del análisis AMMI es En resumen, como ya se comentó en la Intro-
que las estimas en un ambiente dado se realizan ducción y como podemos deducir de lo expues-
utilizando también la información de los otros to en este capítulo, el análisis AMMI tiene las
ambientes del ensayo, mientras que en las otras siguientes ventajas sobre los demás métodos de
estrategias de estudio de interacción GxE, un estudio de la interacción GxE:
ambiente no tiene influencia en las estimas reali-
zadas en cualquier otro ambiente del ensayo. 1) Se trata de un método potente de diagno-
Gauch (1990) sugiere que ésta es una de las sis, ya que nos permite la posibilidad de poder
razones por la cual las estimas realizadas con el estudiar submodelos representativos de los
AMMI son más precisas predictivamente que las datos totales del ensayo.
realizadas por medio del modelo de tratamientos
medios, es decir, cuando la estima del rendi- 2) Nos aporta una gran cantidad de informa-
miento se realiza como la media de las R repeti- ción sobre la naturaleza de la interacción GxE,
ciones de cada genotipo en cada ambiente. El es decir, nos permite clasificar tanto los genoti-
modelo AMMI considera todas las observacio- pos como los ambientes según sus patrones de
nes GxExR, mientras que el modelo de trata- comportamiento.
mientos medios se enfoca exclusivamente sobre
las R repeticiones y descarta las R(GxE-1) 3) Un aspecto que ha quedado muy claro en
observaciones restantes. este capítulo es la mejora de la precisión en las
estimas del rendimiento. Se ha demostrado que
Desde el punto de vista biológico, un ambien- se obtiene la misma precisión en la estima de
te perjudicado por algún tipo de estrés (por ejem- rendimiento con el análisis AMMI que con otros
plo, niveles altos de sodio en el suelo) entre otros tipos de análisis con un número de repeticiones
ambientes sin éste problema podría ser anulado de 2 a 5 veces mayor.
REFERENCIAS CITADAS
• BESAG, J. and R. KEMPTON. 1986: Statis- • GABRIEL, K.R. 1971: The biplot graphic
tical analysis of field experiments using neigh display of matrices with application to principal
boring plots. Biometrics 42, 231-251. component analysis. Biometrika 58, 453-467.
• CROSSA, J., H.G. GAUCH, Jr., and • GAUCH, H.G.Jr. 1990: Full and reduced
R.W. ZOBEL. 1990: Additive main effects models for yield trials. Theor Appl. Genet. 80,
and multiplicative interaction analysis of two 153-160.
international maize cultivar trials. Crop Sci.
30, 493-500. • GAUCH, H.G.Jr., and R.W. ZOBEL. 1988:
Predictive and postdictive succes of statistical
• CROSSA, J., P.N. FOX, W.H. PFEIFFER, S. analyses of yield trials. Theor Appl. Genet. 76, 1-10.
RAJARAM and H.G. GAUCH, Jr. 1991: AMMI
adjustment for statistical analysis of an interna- • GOLLOB, H.F. 1968: A statistical model
tional wheat yield trial. Theor. Appl. Genet. 81, which combines features of factor analytic and
27-37. analysis of variance techniques. Psychometrika
33, 73-115.
102
“Additive Main Effects and Multiplicative Interaction”: A.M.M.I. “Additive Main Effects and Multiplicative Interaction”
• PATTERSON, H. D,. E. R. WILLIAMS, and E. • YATES, F. 1936: A new method of arranging
A. HUNTER. 1978: Block Designs for Variety variety trials involving a large number of varieties.
Trials.J. Agric. Sci. 90, 395-400. J. Agric. Sci. 26, 424-455.
OTRAS REFERENCIAS
ACONSEJADAS
• BRADU, D. and K.R. GABRIEL. 1978: The • GAUCH, H.G.Jr., and R.W. ZOBEL. 1989:
biplot as a diagnostic tool for models of two-way Accuracy and selection succes in yield trial
tables. Technometrics 20, 47-68. analyses. Theor. Appl. Genet. 77, 473-481.
• CROSSA, J., 1990: Statistical analyses of • GAUCH. H. G, Jr. and R. W. ZOBEL. 1990:
multilocation trials. Adv. Agr. 44, 55-85. Imputing Missing Yield Trial Data. Theor. Appl.
Genet. 79, 753-761.
• DIGBY, P.G.N. and R.A. KEMPTON. 1987:
Multivariate analysis of ecological communities. • KEMPTON, R.A. 1984: The use of biplots in
Chapman and Hall (Ed.) interpreting variety by environment interactions.
J. Agric. Sci., Camb. 103, 123-135.
• GAUCH, H.G. 1982: Multivariate analysis in
community ecology. 1st Ed. Cambridge Univ. • KRZANOWSKI, W.J. 1983: Cross-valida-
Press. London and New York. tory choise in principal components analysis-
some sampling results. J. Statatist. Computation
• GAUCH, H.G. 1985: Mimeo 85-7. Cornell and simulation 18, 299-314.
Univ. Ithaca, New York.
• WOLD, S. 1978: Cross-validatory estimation
• GAUCH, H.G. 1988: Model selection and of the number of components in factor and prin-
validation for yield trials with interactions. Biome- cipal components models. Technometrics 20,
trics 44, 705-715. 397-405.
103
10
A G
NÁLISIS DE RUPOS
Análisis de Grupos Análisis de Grupos Análisis de Grupos Análisis de Grupos Análisis de Grupos Análisis de Grupos
10. ANÁLISIS DE GRUPOS caciones jerárquicas. Este aspecto constituye el
punto débil más importante de la clasificación
El problema de la clasificación consiste bási- jerárquica.
camente en hallar una partición tal que satisfaga
a algún criterio discriminante o de discriminación El esquema de una clasificación jerárquica
óptima. Dicho criterio se puede dar en forma de es el siguiente:
relación funcional que refleje los niveles desea-
| |
bles a elegir entre varias particiones o agrupa- ENTRADA SALIDA
mientos. A esta relación funcional se la llama Matriz de Algoritmo de Clasificación
función objeto. similaridades clasificación jerárquica
entre los ==============» (dendrograma)
El problema intrínseco de la clasificación es individuos
la elección del criterio de discriminación óptima
o de la función objeto. Esta nos dice cuándo Este tipo de análisis se ha utilizado como una
se ha obtenido una partición deseable. técnica alternativa para descomponer un gran
número de genotipos, cuya interacción con el
Los procedimientos de clasificación jerárqui- ambiente es significativa, en subgrupos de
cos se basan en que los dos individuos más pró- genotipos que presentan respuestas similares,
ximos quedan automáticamente agrupados y sin ninguna restricción en cuanto al tipo de
tratados en adelante como un solo grupo. Así, el modelo de respuesta.
número de individuos se habrá reducido a n-1:
un grupo de 2 individuos y n-2 grupos de un indi- La dificultad principal que se encuentra para
viduo cada uno. El proceso se continúa hasta aplicar éste método es la de elegir una medida
que todos los individuos son agrupados en un de similaridad y un algoritmo de agrupamiento
grupo que los contiene a todos. entre la amplia gama citada por los distintos
autores que han tratado el tema, sin que exista
Se necesita por un lado una medida de homo- un criterio objetivo que ayude a tal elección.
geneidad interna del grupo (medida de simi- Dada la naturaleza multivariante del Análisis de
laridad) y por otro, un criterio que dé la dispari- Grupos, el establecimiento de los diferentes gru-
dad entre dos grupos distintos (algoritmo de pos vendrá determinado tanto por el peso espe-
clasificación). Y por último, una relación jerár- cífico de la observación (genotipo), es decir, por
quica como resultado de una clasificación, repre- el efecto genético (rendimiento medio genotípi-
sentada gráficamente por un dendrograma co), como por el perfil que presenta el genotipo
que es la representación gráfica de una distancia en relación a las variables observadas (ambien-
ultramétrica sobre un conjunto finito. tes). Por tanto, resulta difícil determinar el grado
en que cada uno de los factores citados contri-
Cuando se trabaja en espacios métricos (eso buye al establecimiento de los diferentes grupos.
sucede cuando las observaciones están carac-
terizadas por caracteres cuantitativos y en algu- Ante tal situación y dado que desconocemos
nos casos cuando lo están por cualitativos) para a priori la naturaleza de la interacción GxE, se
medir la proximidad existente entre pares de ele- ha utilizado aquí, en primer lugar, una medida de
mentos suele utilizarse una distancia, que es similaridad convencional: el cuadrado de la
una medida particular de disimilaridad. distancia euclídea entre genotipos. Esta
medida tiene en cuenta, simultáneamente, el
Hay que señalar, sin embargo, que el proble- efecto genético y el efecto de la interacción GxE.
ma de determinar la distancia ultramétrica más
próxima a una distancia definida (o a una disimi- Si Yij es el valor observado del genotipo i-
laridad) no está resuelto, existiendo un gran ésimo en el ambiente j-ésimo, la distancia euclí-
número de algoritmos que conducen, a partir de dea entre dos genotipos (i,i’) se define como:
un cuadro de distancias o de disimilaridades, a
un cuadro de distancias ultramétricas y en con- e
secuencia a una jerarquización. d2 (i,i’) = Σ (Yij-Yi’j)2 (56)
j=1
107
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Figura 19 Análisis de grupos Genotipos (UPGMA-DIST. EUCL.)
G8
G2
G5
G6
G7
G3
G4
entre grupos o método UPGMA. Este algorit- debe efectuarse el corte. Existe, por tanto, una
mo define la distancia entre dos grupos como la clara interacción entre el procedimiento estadís-
media de las distancias entre todos los pares de tico y el conocimiento que se posee sobre los
casos posibles, donde cada uno de los miembros datos, por lo que incluso pueden estar justifica-
de cada par pertenece a cada uno de los grupos. dos truncamientos a distinto nivel.
En base a esta distancia y a este algoritmo se Para la realización de los análisis de grupos
ha procedido a efectuar la clasificación de geno- que vamos a comentar a continuación se ha uti-
tipos y ambientes, obteniéndose como resultado lizado el paquete estadístico de métodos multi-
los dendrogramas de las Figuras 19 y 20. Las variantes NTSYS:
representaciones gráficas obtenidas a partir de
los procedimientos de clasificación terminan 1º) A partir de la matriz rectangular de
necesariamente con la realización de un corte en medias 10 x 11 o 11 x 10 dependiendo de si
el dendrograma. En ellos, el nivel al que se ha queremos obtener el dendrograma de genotipos
efectuado el corte viene dado por el momento o de ambientes, respectivamente. En primer
del ciclo en el cual se produce un salto cuantita- lugar se elige el tipo de distancia en el subpro-
tivo. A pesar de que dicho corte puede parecer grama “Similarity Interval”. En este caso se ha
objetivo, en la mayor parte de los casos se hace escogido “DISTSQ” (distancia euclídea al cuadra-
por el investigador de forma subjetiva. No pode- do), dando como resultado la matriz de distancias
mos olvidar de ningún modo que al realizar el (la matriz de partida se da en el Apéndice).
corte en el árbol de relaciones (esto es, en el
dendrograma), entra en juego el criterio del 2º) Una vez obtenida la matriz de distancias,
investigador para determinar la altura a la cual el análisis de grupos sigue con la elección del
A1
A6
A4
A2
A7
A3
A5
A10
A8
A9
108
Análisis de Grupos Análisis de Grupos Análisis de Grupos Análisis de Grupos Análisis de Grupos Análisis de Grupos
Figura 21 Análisis de grupos Genotipos (WPGMA-DIST. EUCL.)
G1
G11
G9
G10
G8
G3
G4
G2
G5
G6
G7
algoritmo de fusión. Para ello, seleccionamos el Grupo 3: 5 y 10 donde se han obtenido los
subprograma “SAHN Clustering” que nos da a rendimientos más bajos,
elegir entre varios algoritmos de fusión (UPGMA,
WPGMA, SINGL, COMPL, ....) dando como Por tanto, el efecto GxE queda totalmente
resultados los árboles de relaciones o dendro- absorbido por el efecto genético, de modo que
gramas de las Figuras 19 a la 26. los grupos que se obtienen se diferencian única
y exclusivamente en base a sus rendimientos
Como se puede observar, en las Figuras 19 y medios.
20 los grupos formados son:
De la Figura 21 a la 26 se muestran los den-
GENOTIPOS: drogramas de los análisis de grupos realizados
Grupo 1: 2, 5, 6 y 7 genotipos de mayor ren- con la misma medida de similaridad pero con
dimiento; distintos algoritmos de fusión WPGMA, SINGL y
Grupo 2: 1, 8, 9, 10 y 11 genotipos de rendi- COMPL. En ellas observamos cómo los resulta-
mientos intermedios y dos son muy similares a los comentados ante-
Grupo 3: 3 y 4 genotipos de bajo rendimiento riormente.
AMBIENTES: Puesto que estos resultados no aportan nada
Grupo 1: 8 y 9 son en los que se han obteni- nuevo a lo ya conocido para los datos del ejem-
do mayores rendimientos medios; plo, resulta interesante incidir más sobre la natu-
Grupo 2: 1, 2, 3, 4, 6 y 7 donde se obtienen raleza de la interacción GxE. Ello exige buscar
rendimientos intermedios y una medida de similaridad que, además de
A1
A6
A4
A2
A7
A3
A5
A10
A8
A9
109
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Figura 23 Análisis de grupos Genotipos (SINGL-DIST. EUCL.)
G1
G11
G9
G10
G2
G5
G6
G7
G8
G3
G4
hacer más hincapié en el perfil de los genotipos, 10.1. Análisis de grupos según Lin
esto es, en el comportamiento de los genotipos
a través de los ambientes, corrija el enorme Lin (1982) define la disimilaridad entre dos
peso que tiene el propio efecto del rendimiento genotipos en base a las diferencias entre los efec-
medio. tos medios de los genotipos en los diferentes
ambientes y hace uso del método aglomerativo de
Por las razones expuestas anteriormente, sin pares de grupos sin ponderar. Una vez definida la
olvidar el hecho de que medidas y algoritmos disimilaridad entre dos genotipos, consiste bási-
distintos conducen a grupos diferentes, pode- camente en ir construyendo grupos de tal forma
mos utilizar otras alternativas propuestas por dis- que el cuadrado medio dentro del hipotético
tintos autores. Así: 1) La medida de similaridad nuevo grupo sea mínimo en cada ciclo de fusión.
entre dos genotipos y el algoritmo de clasifica-
ción propuestos por Lin (1982). Dicha medida La medida de disimilaridad propuesta por
de similaridad está basada únicamente en el Lin es:
efecto de la interacción GxE; por ello, cabe e
esperar una mayor intervención del perfil que Σ (Iij-Ii’j)2
j=1
muestra el comportamiento de cada genotipo en d (i,i’) = —————— (57)
los diferentes ambientes más que su rendimien- 2 (e-1)
to medio. 2) Otra alternativa es el Análisis de
Grupos siguiendo el modelo propuesto por Fox donde:
y Rosielle (1982); éste último está siendo muy
— — —
utilizado en los últimos años. Iij = Yij - Yi. - Y.j + Y.. (58)
Figura 24 Análisis de grupos Ambientes (SINGL-DIST. EUCL.)
A1
A6
A4
A2
A7
A3
A5
A10
A8
A9
110
Análisis de Grupos Análisis de Grupos Análisis de Grupos Análisis de Grupos Análisis de Grupos Análisis de Grupos
Figura 25 Análisis de grupos Genotipos (COMPL-DIST. EUCL.)
G1
G11
G9
G10
G8
G3
G4
G2
G5
G6
G7
y e es el número de ambientes.
disimilaridad para un subgrupo de r genotipos es:
r
Los resultados obtenidos tras aplicar el méto-
2 Σ d (i,i’) do de Lin a los genotipos y ambientes del ejem-
1≤i<i’
d (1, 2, ..., r) = ———— (59) plo se muestran en las Figuras 27 y 28 y en las
r (r-1) Tablas 19 y 20, donde, por ejemplo, d(9,10,4) se
calcula de la siguiente forma:
Así, se van formando aquellos nuevos grupos
que presenten el mínimo valor para el nuevo d(9,10,4) = 1/3 [d(9,10) + d(9,4) + d(10,4)] =
índice lo que, al coincidir con el CM de la inte- = 1/3 (30109.68 + 43837.32 + 47904.38) = 40617.12
racción GxE de los r genotipos, tal y como
demostró Lin, implica ir construyendo grupos las distancias para todos los pares de geno-
dentro de los cuales el efecto de la interacción tipos d(9,10), d(9,4), d(10,4), ..etc. se calculan
GxE es homogéneo. basándose en la ecuación [57].
A1
A6
A4
A2
A7
A3
A5
A10
A8
A9
111
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Figura 27 Análisis de grupos Genotipos (MÉTODO LIN 1982)
G9
G10
G4
G1
G11
G2
G6
G7
G5
G8
G3
CICLO DE FUSIÓN
1
2
3
4
G.L.(#)
9
18
27
36
GENOTIPOS AGRUPADOS
(9,10)
(1,11)
(6,7)
(9,10),4
C.M. DE LA GxE(&)
30109.68
30906.41
37882.38
40617.12
5 45 (6,7),2 45900.30
6 54 (9,10,4),(1,11) 49254.10
7 63 (5,8) 67447.26
8 72 (5,8),(6,7,2) 74344.10
9 81 (5,8,6,7,2),(9,10,4,1,11) 97580.30 **
10 90 (5,8,6,7,2,9,10,4,1,11),3 146425.48 ***
Como se puede advertir, en el caso de los que resultan ser los mismos grupos formados
genotipos (Tabla 19) el C.M. de la interacción GxE tanto por el ACP (Capítulo 8) como por el análi-
es significativo en el ciclo de fusión 9, constituyén- sis A.M.M.I. (Capítulo 9).
dose según el criterio de Lin tres grupos homogé-
neos en cuanto a la interacción GxE (Fig. 27): Respecto a los ambientes se puede decir algo
similar. Según el método de Lin se obtienen cua-
GRUPO GENOTIPOS tro grupos, ya que el C.M. de la interacción GxE
G1 2,5,6,7,8 es significativo en el ciclo 7 (Tabla 20 y Fig. 28).
G2 1,4,9,10,1
G3 3
CICLO DE FUSIÓN
1
G.L.(#)
10
GENOTIPOS AGRUPADOS
(1,6)
C.M. DE LA GxE(&)
43307.00
2 20 (3,8) 43402.00
3 30 (2,7) 49635.00
4 40 (2,7),10 51687.80
5 50 (1,6),4 52836.20
6 60 (2,7,10),5 65442.00 *
7 70 (2,7,10,5),(1,6,4) 93440.60 **
8 80 (3,8),9 104200.00 ***
9 90 (2,7,10,5,1,6,4),(3,8,9) 146425.48 ***
112
Análisis de Grupos Análisis de Grupos Análisis de Grupos Análisis de Grupos Análisis de Grupos Análisis de Grupos
Figura 28 Análisis de grupos Ambientes (MÉTODO LIN 1982)
A1
A6
A4
A2
A7
A10
A5
A3
A8
A9
Los grupos formados son los siguientes ambientes 3 y 8 resultan ser los de intermedia
(Fig. 28): contribución de signo positivo y el grupo A4,
formado tan sólo por el ambiente 9, es precisa-
GRUPO AMBIENTES mente el que más contribuye a la interacción
A1 1,6,4 GxE.
A2 2,7,10,5
A3 3,8 Como hemos podido comprobar, el método
A4 9 de análisis de grupos de Lin resulta útil para
identificar fácilmente la estructura de la inte-
En los métodos anteriores no pudimos agru- racción tanto en genotipos como en ambientes.
par los ambientes según un patrón relacionado El criterio para identificar el patrón de respuesta
con la interacción GxE. Ahora bien, si obser- en éste método (y en el contexto de un ensayo
vamos el biplot de la Fig. 18, conjuntamente GxE) es el tamaño de los cuadrados medios de
con el agrupamiento obtenido por el método de la interacción GxE. Se considera que los geno-
Lin vemos que realmente existe una gran simi- tipos dan la misma respuesta frente a todos los
litud y que las agrupaciones han sido realiza- ambientes si los C.M. de la interacción GxE no
das según su contribución a la interacción son significativamente diferentes del error esti-
GxE. Así, el grupo A1 formado por los ambien- mado. De esta forma Lin pensó que “dado que
tes 1, 6 y 4 son los que en el biplot de la Fig todos los índices, definidos o construidos, son
18 muestran una mayor contribución de signo los C.M. de la interacción GxE para un corres-
negativo a la interacción GxE. El grupo A2 for- pondiente genotipo, las agrupaciones basadas
mado por los ambientes 2, 7, 10 y 5 muestra en el valor crítico de F podrían satisfacer este cri-
una escasa contribución de signo negativo a la terio y resultar en grupos aproximadamente
interacción GxE. El grupo A3 formado por los homogéneos” (Lin, 1982).
Figura 29 Análisis de grupos Genotipos (MÉTODO FOX-ROSIELLE)
G11
G1
G9
G10
G8
G3
G4
G5
G6
G2
G7
113
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
10.2. Análisis de grupos según Fox las obtenidas por el método aglomerativo
y Rosielle UPGMA, es decir, los genotipos han sido agru-
pados fundamentalmente atendiendo al efecto
El método de Fox y Rosielle (1982) parte de principal (rendimiento medio) quedando enmas-
datos estandarizados para ambientes cuando carado el efecto interacción.
queremos agrupar ambientes, y datos sin estan-
darizar para genotipos. La medida de similaridad En cuanto a las agrupaciones obtenidas
es la distancia euclídea al cuadrado, y la para los ambientes (Fig. 30) vemos como
estrategia de fusión es el método Ward de resulta ser muy parecida a la obtenida por el
mínimas varianzas o “Incremental Sum of método de Lin, la diferencia estriba en que
Squares”, el cual minimiza la suma de cuadra- con el método de Fox y Rosielle se ha obteni-
dos dentro de grupos para todas las particiones. do un desglose mayor del grupo que se carac-
teriza por tener una contribución intermedia de
Los resultados del análisis de grupos según signo negativo a la interacción GxE, constitu-
Fox y Rosielle se presentan en las Tablas 21 y 22 yéndose así el grupo 3 (ambientes 5 y 7) que
y en las Figuras 29 y 30. Para su realización se resultan ser los ambientes de menor contribu-
dispone de una corriente de control para el ción a la interacción. Por otro lado se forma el
paquete estadístico SAS (ver Apéndice). grupo 4 constituido por todos los ambientes
que contribuyen con signo positivo que en el
En la Figura 29 vemos como las agrupacio- método de Lin quedaban agrupados en los
nes obtenidas para los genotipos coinciden con grupos 3 y 4.
Figura 30 Análisis de grupos Ambientes (MÉTODO FOX-ROSIELLE)
A8
A3
A9
A5
A7
A10
A2
A6
A1
A4
10 G11 G1 2 0.0098
9 G5 G6 2 0.0140
8 G9 G10 2 0.0146
7 G2 CL9 3 0.0224
6 CL8 CL10 4 0.0375
5 CL7 G7 4 0.0452
4 G3 G4 2 0.0500
3 G8 CL6 5 0.0720
2 CL3 CL4 7 0.2363
1 CL2 CL5 11 0.4978
114
Análisis de Grupos Análisis de Grupos Análisis de Grupos Análisis de Grupos Análisis de Grupos Análisis de Grupos
Tabla 22 Análisis de grupos de Fox y Rosielle para ambientes.
9 A8 A3 2 0.0133
8 CL9 A9 3 0.0235
7 A5 A7 2 0.0259
6 A10 A2 2 0.0875
5 A6 A1 2 0.0900
4 CL5 A4 3 0.1145
3 CL7 CL8 5 0.1162
2 CL3 CL6 7 0.1916
1 CL2 CL4 10 0.3372
Como resumen podemos decir que las agru- Diversos autores han obtenido resultados
paciones obtenidas para ambientes por ambos positivos con este método para sus datos,
métodos es muy similar de forma que el efecto pudiendo agrupar los genotipos en base a su
de la interacción ha podido aflorar a pesar de la respuesta frente a los ambientes, y por tanto,
importancia del efecto principal. establecer qué grupos de genotipos son más
estables. En nuestro ejemplo, por el contrario,
Método de Lin Método de Fox y Rosielle este método no supera al de Lin a la hora de
Grupo 1: 1, 6, 4 Grupo 1: 1, 6, 4 explicar los datos experimentales.
Grupo 2: 2, 7, 10, 5 Grupo 2: 2, 10
Grupo 3: 3, 8 Grupo 3: 5, 7
Grupo 4: 9 Grupo 4: 3, 8, 9
REFERENCIAS CITADAS
• FOX, P.N. and A.A. ROSIELLE. 1982: Redu- • SOKAL, R.R. and C.D. MICHENER. 1958: A
cing the influence of environmental main-effects statistical method for evaluating systematic rela-
on pattern analysis of plant breeding environ- tionships. Univ. Kansas Sci. Bull. 38, 1409-1438.
ments. Euphytica 3, 645-656.
ments to control genotype by environment inte- Compt. J. 2, 98-103.
ractions with an application to cotton. Crop Sci.
9, 135-140. • BYTH D.E., R.L. EISEMANN and I.H.DE
LACY. 1976: Two-way pattern analysis of a large
• BROWN, J.S. 1991: Principal component data set to evaluate genotypic adaptation. Here-
and cluster analyses of cotton cultivar variability dity 37, 215-230.
across the U.S. cotton belt. Crop Sci. 31, 915-922.
115
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
• CUADRAS, C.M. 1981: Métodos de análisis • HAYWARD, M.D., I.H. DeLACEY, B.F.
multivariante. Ed. por Eunibar. Barcelona. TYLER and D.W. DRAKE. 1982: The application
of pattern analysis for the recognition of adapta-
• CHARMET, G., F. BALFOURIER, A. BION. tion in a collection of Lolium multiflorum popula-
1990: Agronomic Evaluation of a Collection of tions. Euphytica 31, 383-396.
French Perennial Ryegrass Populations: Multiva-
riate Classification Using Genotype x Environ- • JOHNSON, G.R. 1977: Analysis of genoty-
ment Interactions. Agronomie 10, 807-823. pic similarity in terms of mean yield and stability
of environmental response in a set maize
• FOX, P.N., B. SKOVMAND, B.K. THOMP- hybrids. Crop Sci. 17, 837-842.
SON, H.J. BRAUN and R. CORMIER. 1990: Yield
and adaptation of hexaploid spring triticale. • JUDEZ, L. 1989: Técnicas de análisis de
Euphytica 47, 57-64. datos multidimensionales. Publ. Mº de Agricultu-
ra, Pesca y Alimentación.
• GHADERI, A., M.W. ADAMS and A.W.
SAETTLER. 1982: Environmental response pat- • LIN, C.S., M.R. BINNS, and L.P. LEFKO-
terns in commercial classes of common bean VITCH, 1986: Stability analysis: Where do we
(Phaseolus vulgaris L.). Theor. Appl. Genet. 63, stand? Crop Sci. 26, 894-900.
17-22.
• RAMEY, T.B., and A.A. ROSIELLE. 1983:
• GHADERI, A., E.H. EVERSON and C.E. HASS cluster analysis: a new method of grou-
CRESS. 1980: Classification of environments and ping genotypes or environments in plant bree-
genotypes in wheat. Crop Sci. 20, 707-719. ding. Theor. Appl. Genet. 64, 131-133.
• HAIR, J.F.,Jr., R.E. ANDERSON, and R.L. • SHORTER, R. and R.J. NORMAN. 1983:
TATHAM. 1987: Multivariate data analysis with Cultivar x environment interactions for kernel
readings. Mcmillan Publ. Co., New York. yield in virginia type peanuts in queensland.
Aust. J. Agric. Res. 34, 415-426.
• HANSON.W.D. 1970:. Genotypic stability.
Theor. Appl. Genet. 40, 226-231.
116
11
C
ANÁLISIS DE
OORDENADAS PRINCIPALES
Análisis de Coordenadas Principales Análisis de Coordenadas Principales Análisis de Coordenadas Principales
11. ANÁLISIS DE COORDENADAS genotipos i e i’ se determina de la siguiente
PRINCIPALES forma, siendo Yij e Yi’j los rendimientos medios
de los genotipos i e i’ en el ambiente j :
Westcott (1986) criticó duramente todos las
metodologías univariantes disponibles en 1986 (Yij+Yi’j)
Lj - ————
para el estudio de la interacción GxE. Como alter- 2
S(i,i’) = —————— (60)
nativa, propuso técnicas de análisis multivariante, Lj-Sj
aunque no consideró apropiados todos los méto-
dos disponibles (entre otros, tanto el Análisis de donde si i=i’, entonces S(i,i’)=1.
Grupos como el Análisis de Componentes Princi-
pales) en base a las razones comentadas en la Cuando hay más de un ambiente, la similari-
Introducción. Sin embargo, sugirió la utilización de dad que ha de emplearse es la similaridad
otros métodos multivariantes hasta ese momento media. Esto se realiza por ciclos sucesivos de
prácticamente inéditos en este campo, tales como cálculo de índices de similaridad introduciendo
el Análisis de Coordenadas Principales y el Análi- en cada ciclo un nuevo ambiente (Tabla 23).
sis de Correspondencias (que veremos en el capí-
tulo siguiente). Para ello:
diversas, no existiendo un criterio absoluto para 2º) Se calcula la matriz de similaridad, según
elegir una de ellas. Westcott (1987) propuso la [60], para cada ambiente.
utilización de un coeficiente de similaridad que
permite que todos los valores propios de la 3º) Comenzando por H1 o por L1, se van aña-
matriz transformada a partir de la matriz de simi- diendo ambientes sucesivamente. Así, el ciclo
laridad sean positivos, y en caso de que existan H2 estaría constituido por los dos ambientes de
algunos negativos, que éstos sean de escasa valores máximos y el ciclo L2 por los dos
relevancia. Esto es una condición necesaria ambientes de valores mínimos, y así sucesiva-
para poder representar las distancias en un mente.
espacio euclídeo.
4º) Se calcula la matriz de similaridad base o
En un ambiente j, si Lj y Sj denotan el mayor matriz de similaridades medias según los
y el menor rendimiento del grupo de genotipos, ambientes que constituyan el ciclo, ya que como
la similaridad definida por Westcott entre dos hemos comentado antes, cuando hay más de un
0.2
-0.2
G4
G9
G11
G8
G6
CCPP 2
G5
-0.4
-0.6
G7
-0.8
-1 -0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 0 0.1 0.2 0.3 0.4
CCPP 1
GENOTIPOS
119
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Figura 32 Coordenadas Principales (CICLO H1) (dos dimensiones)
0.8
G6
0.6
0.4
0.2 G7
CCPP 2
0
-0.2
G5
-0.4
-0.6 G2
-0.8
-1 -0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 0 0.1 0.2 0.3 0.4
CCPP 1
GENOTIPOS
ambiente, la similaridad que ha de emplearse es S(5,4)=0.50. Concluyendo, pequeños valores
la similaridad media. Así por ejemplo, para el en la matriz de similaridad nos indican que el
ciclo H2, se obtendría de la media de las matri- genotipo en cuestión es muy productivo y se
ces de similaridad de los dos ambientes de representará, por tanto, en la gráfica de coor-
mayor rendimiento medio. denadas principales como un genotipo alejado;
valores grandes nos indican que dicho genoti-
Esta medida de similaridad determina que, po es muy poco productivo en el ambiente o
en la representación bidimensional (Figuras 31- grupo de ambientes del ciclo en cuestión y, por
32) o tridimensional (Figuras 33-42), aquellos tanto, se representará como un punto central en
genotipos que estén muy por encima de la la gráfica. De este modo, los “buenos” genoti-
media sean muy disimilares y por tanto queda- pos son aquellos que están muy alejados del
rán representados por puntos muy alejados centro, siendo inmediata su identificación. Los
entre sí. Por ejemplo, para el ciclo L1 (Fig. 33) genotipos estables son aquellos que, consis-
los genotipos más alejados son el 5, 7, 6 y 9, tentemente, son “buenos” en los ciclos sucesi-
siendo por tanto estos genotipos los más pro- vos conforme se van incorporando nuevos
ductivos en este ambiente; en la matriz de simi- ambientes.
laridad (DISTL1.TXT, ver Apéndice) sus distan-
cias recíprocas deben ser pequeñas en rela- En la Tabla 23 se muestra la composición de
ción a la que tienen respecto de otros genoti- ambientes para cada ciclo del análisis de coor-
pos menos productivos en este ambiente. Así, denadas.
la distancia entre los genotipos 5 y 7 es
S(5,7)=0.068, mientras que la distancia entre el Una vez obtenida la similaridad, las coorde-
genotipo 5 y el menos productivo (el 4) es nadas principales se obtienen como sigue:
G9
0.8
0.3 G5
CCPP 3
G7
-0.2
G6
0.7
-0.7 0.2
-1 -0.3
-0.5 -0.8 CCPP 2
0 0.5
CCPP 1
120
Análisis de Coordenadas Principales Análisis de Coordenadas Principales Análisis de Coordenadas Principales
Figura 34 Coordenadas Principales (CICLO L2)
0.3
CCPP 3 G7
G5
-0.2
-0.7
-0.9
-0.4
CCPP 1
0.1
G6
0.6
-0.8
-0.3
0.2
0.7
CCPP 2
1) La matriz de similaridad S(i,j) se transfor- Para comprobar la variabilidad total, repre-
ma en una nueva matriz T(i,j), de la siguiente sentada por la dimensión d, se suman los valo-
forma: res propios hasta el valor propio de la dimensión
d, y se divide por la suma de todos los valores
— — — propios, tal y como se realiza en el Análisis de
tij = sij - si. - s.j + s.. (61)
Componentes Principales.
2) Se diagonaliza la matriz T:
En definitiva, el Análisis de Coordenadas
T = B Dµ B’= B D1/2 D1/2 B’= W W’ (62) Principales permite representar objetos respecto
µ µ
a una distancia deducida del coeficiente de simi-
donde: laridad.
en las Figuras 31-32).
W=B D1/2µ es la matriz de coordenadas princi-
pales, por lo que para una representación en dimen- Dados g puntos en un espacio de e dimen-
sión d, se toman las d primeras columnas de W. siones, siempre es posible trazar tal árbol
CICLO AMBIENTE REND. MEDIO AMBIENTES QUE
AÑADIDO MEDIO FORMAN EL CICLO
L1
L2
L3
L4
10
5
3
4
2633
2776
3304
3433
10 _
10,5
10,5,3
10,5,3,4 ]
(1)
]
H1 8 4422 8
H2 9 4259 8,9
H3 7 3784 8,9,7 (2)
H4 2 3686 8,9,7,2
H5 1 3607 8,9,7,2,1
H6 6 3561 8,9,7,2,1,6
121
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Figura 35 Coordenadas Principales (CICLO L3)
1,1 G6
0.6
CCPP 3
G7
0.1
G5
0.7
G2 0.2
-0.4
-0.9 -0.3
-0.4 -0.8 CCPP 2
0.1 0.6
CCPP 1
mediante líneas rectas que unen pares de pun- 3º) Con el paquete estadístico NTSYS realiza-
tos, si se verifican las siguientes condiciones: mos un doble centrado, es decir, calculamos la
matriz T según [61]. Para ello se ha utilizado el
a) En ningún caso se forman polígonos cerra- subprograma “Double Center”.
dos.
b) Por cada punto pasa al menos una línea. 4º) Calculamos los vectores propios de la
c) El árbol no presenta discontinuidades. matriz T, con el subprograma “Eigenvectors”, y
los representamos en dos y tres dimensiones,
Existen muchos algoritmos para llevar a cabo con el subprograma “Matrix Plot - graphics” y “3-
la construcción de un árbol de mínima disper- D Model - graphics” respectivamente, dándonos
sión. Se ha utilizado el primer algoritmo de como resultado las Figuras 31-42.
Gower y Ross (1969). Este consiste en un proce-
so iterativo que comienza uniendo los puntos 5º) Como ya se ha dicho, para las longitudes
más próximos entre sí y continúa de modo que del árbol de mínima dispersión se ha utilizado el
siempre se verifiquen las condiciones anteriores. subprograma “MST” del paquete estadístico
Para nuestro ejemplo, para el cálculo de las lon- NTSYS.
gitudes, del árbol de mínima dispersión, entre
genotipos hemos utilizado el subprograma MST Los tres primeros ejes del análisis de coorde-
(Minimum Spanning Tree) del paquete estadísti- nadas, para todos los ciclos, contribuyen aproxi-
co NTSYS. madamente, en nuestro caso, con el 44 % de la
variación total, lo que representa un porcentaje
similar al obtenido por otros autores en diferen-
11.1. Caso práctico tes materiales.
Los resultados de aplicar el análisis de coor- Las representaciones gráficas de los análisis
denadas principales a los datos del ejemplo que de coordenadas principales se muestran de la
estamos siguiendo se han obtenido de la Figura 31 a la 42. Las dos primeras (Fig. 31-32)
siguiente forma: representan las coordenadas principales en los
dos primeros ejes mostrándose también el
1º) Mediante un programa en BASIC (ver árbol de mínima dispersión cuyas longitu-
Apéndice) hemos calculado la matriz de distan- des obtenidas para todos los ciclos son las que
cias para cada ambiente, utilizando la fórmula refleja la Tabla 24. De ésta forma resulta más
[60]. fácil identificar aquellos genotipos más disimila-
res (o de mayor rendimiento) en cada ciclo.
2º) Por medio de otro sencillo programa en
BASIC (ver Apéndice) se calculan las matrices Como puede observarse en la Tabla 24, se
de distancias para cada ciclo. Consiste en cal- han representado los valores para los seis pri-
cular las medias para cada ciclo según los meros genotipos en cada ciclo. Tanto en la Tabla
ambientes que lo forman. 24 como en las Figuras 31-42 se observa que
122
Análisis de Coordenadas Principales Análisis de Coordenadas Principales Análisis de Coordenadas Principales
Figura 36 Coordenadas Principales (CICLO L4)
G6
1.1
0.6
CCPP 3
G7
G5
0.1
G1 0.23
-0.4 -0.27
-0.2 0.3 -0.77 CCPP 2
0.8 1.3
CCPP 1
Tabla 24 Árbol de mínima dispersión para los primeros genotipos de cada ciclo.
G4-G6 33.8 G3-G6 45.4
G4-G9 33.0 G3-G5 43.8
G4-G11 23.0 G3-G1 31.7
G4-G10 23.0 G3-G8 29.1
G4-G5 44.4 G4-G2 50.5
G4-G6 39.8 G4-G5 50.4
G4-G2 36.0 G4-G6 46.7
G4-G1 31.2 G4-G11 41.4
G4-G10 30.5 G4-G1 38.2
H1 G3-G7 50.0 H6 G3-G7 58.9
G3-G6 47.1 G3-G6 52.6
G3-G2 45.6 G3-G5 49.4
G3-G5 44.9 G3-G2 47.8
G3-G1 27.2 G3-G1 45.7
G3-G10 25.0 G3-G11 45.2
123
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Figura 37 Coordenadas Principales (CICLO H1)
CCPP 3
-0.3
1
-0.8 G.5 0.5
-0.9 -0.4 0
0.1 -0.5 CCPP 2
0.6
CCPP 1
Tabla 25 Longitudes medias del AMD para los genotipos más disimilares.
11 27.67(7) 36.61(6) = 13 (5.5)
De la Tabla 25 podemos extraer las siguien- Por tanto, para los genotipos y ambientes
tes conclusiones: analizados en este ejemplo, el análisis de
CC.PP. origina unos resultados satisfactorios
1) Tres genotipos resultan ser los más esta- para la detección de genotipos de alto rendi-
bles, con diferencia de los demás, en el ciclo L miento que permanecen estables bajo diferentes
(de bajo rendimiento): el 7, 5 y el 6. condiciones ambientales, además de coinciden-
tes con los obtenidos por métodos anteriores,
2) El genotipo 7 resulta ser el más estable en puesto que resultan ser los genotipos agrupa-
los ambientes de alto rendimiento (Ciclo H), dos en el Grupo 1 del A.M.M.I.
seguido de los genotipos 5, 6 y 2.
G5
0.8
0.3
CCPP 3
G7
G2 G6
-0.2
0.7
-0.7 0.2
-0.4 -0.3
0.1 -0.8 CCPP 2
0.6 1.1
CCPP 1
124
Análisis de Coordenadas Principales Análisis de Coordenadas Principales Análisis de Coordenadas Principales
Figura 39 Coordenadas Principales (CICLO H3)
G6
0.9
0.4
CCPP 3
G2 G7
-0.1
G5 0.7
-0.6 0.2
-0.5 -0.3
0 -0.8 CCPP 2
0.5 1
CCPP 1
Como conclusión podemos enumerar las distribución de las variables) y puede ser apli-
principales ventajas de éste método: cado sin problemas a un pequeño grupo de
ambientes.
1) Es altamente fiable cuando se utiliza para
analizar un grupo de datos que incluyen resulta- De los resultados expuestos y del conoci-
dos de ambientes extremos de bajo y alto rendi- miento que se posee acerca del comportamien-
miento. to de los genotipos en base a análisis anteriores
y que, como veremos mas adelante, quedan
2) Identifica fácilmente los genotipos esta- confirmados por los análisis de corresponden-
bles en una secuencia gráfica generada por los cias y canónico, se deduce que cuando existen
distintos ciclos del análisis. genotipos que cumplan las características dese-
adas se ponen en evidencia por éste método los
3) Se trata de un modelo “libre” (es decir, no más estables, de ahí que alentemos a una
se requiere ninguna condición respecto a la mayor utilización de éste método.
1
G6
0.5
CCPP 3
G7
0 G2
0.8
-0.5 0.3
G5
-0.9 -0.4 -0.2
-0.1 -0.7 CCPP 2
-0.6
CCPP 1
125
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Figura 41 Coordenadas Principales (CICLO H5)
G6
0.8
G5
0.3 G7
CCPP 3
-0.2
G2
-0.7 0.8
0.3
-0.3 0.2 -0.2
0.7 1.2 -0.7 CCPP 2
CCPP 1
1
G.5
0.5 G.6
CCPP 3
G.7
0
1.1
-0.5 G.2 0.6
0.1
-0.3 0.2 -0.4
0.7 CCPP 2
1.2
CCPP 1
126
Análisis de Coordenadas Principales Análisis de Coordenadas Principales Análisis de Coordenadas Principales
REFERENCIAS CITADAS
Heredity 56, 243-253.
OTRAS REFERENCIAS ACONSEJADAS
• CROSSA, J., 1988: A comparison of results • CROSSA, J., 1990: Statistical analyses of
obtained with two methods for assessing yield multilocation trials. Adv. Agr. 44, 55-85.
stability. Theor Appl. Genet. 75, 460-467.
• CROSSA, J., P.N. FOX, W.H. PFEIFFER, S.
• CROSSA, J., B. WESTCOTT and C. GON- RAJARAM and H.G. GAUCH, Jr. 1991: AMMI
ZALEZ. 1988: The Yield Stability of Maize Genoty- adjustment for statistical analysis of an interna-
pes Across International Environments:Full Sea- tional wheat yield trial. Theor. Appl. Genet. 81,
son Tropical Maize. Expl.Agric. 24, 253-263. 27-37.
• CROSSA, J., B. WESTCOTT and C. GON- • GOWER, J.C. 1966: Some distance proper-
ZALEZ. 1988: Analysin yield stability of maize ties of latent root and vector methods used in
genotypes using a spatial model. Theor Appl. multivariate analysis. Biometrika 3, 325-338.
Genet. 75, 863-868.
ZALEZ. 1989: The yield stability of CIMMYT’S
maize germplasm. Euphytica 40, 245-251.
127
12
ANÁLISIS FACTORIAL
DE CORRESPONDENCIA
Análisis Factorial de Correspondencias Análisis Factorial de Correspondencias Análisis Factorial de Correspondencias
12. ANÁLISIS FACTORIAL 1) Se obtienen tres nuevas matrices a partir
DE CORRESPONDENCIAS de Y:
cuando los datos representan frecuencias) Z(I,J)=Yij/(Yi. Y.j1/2) (65)
basado en una distancia especial llamada chi-
cuadrado, cuya principal propiedad viene dada
por la posibilidad de efectuar una representa- 2) Se obtiene la matriz M’ traspuesta de M y
ción simultánea de las variables y de las pobla- calculamos P=M’M
ciones.
3) Diagonalizamos la matriz P: P=T Dµ T’
El análisis de correspondencias ha sido un
método olvidado en el contexto de la interac- donde:
ción GxE. En principio parece lógico que así
fuera, ya que es un método especialmente T=matriz de los vectores propios de P nor-
diseñado para el estudio de tablas de contin- malizados,
gencia, en las cuales cada casilla contiene el
número de individuos que cumplen simultánea- D=matriz diagonal de los valores propios
mente las características deseadas. Sin embar- de M.
go, también es aplicable a los casos en que se
dispone de una matriz de observaciones y Las coordenadas de los genotipos en un
variables y se considera que los valores que se espacio de dimensión d, son las d primeras
encuentran en cada casilla son el resultado de columnas de: A=X T, y las coordenadas de los
expresar una cantidad total (en este caso, el ambientes, en dimensión d, las columnas de:
rendimiento) en función del genotipo (observa- B=Z M T Dµ-1/2.
ción) y del ambiente (variable) considerado. Hill
(1974) y Westcott (1986) propusieron investigar Hay que añadir que en ambos casos se
sus posibilidades en el estudio de la interac- prescinde de la primera columna ya que en el
ción GxE. proceso de diagonalización el primer elemen-
to de la diagonal es 1. Por tanto, las coorde-
El análisis de correspondencias asigna a nadas vendrán dadas por la 2ª, 3ª, ... colum-
cada genotipo un peso específico igual a uno y nas de las matrices A y B. Para comprobar la
se basa en el comportamiento de los genotipos variabilidad total, representada por la dimen-
en cada uno de los ambientes, es decir, proyec- sión d, se suman los valores propios (excepto
ta los genotipos de acuerdo con su perfil y no en el primero) hasta el valor propio de la dimen-
función del nivel de rendimiento (como nos ocu- sión d, y se divide por la suma de todos los
rría en el análisis de componentes principales y valores propios, exceptuando nuevamente el
en el análisis de coordenadas principales). El primero.
AFC utiliza el nivel de rendimiento sólo como
identificativo del genotipo.
12.1. Caso práctico
Teóricamente, es suficiente que las sumas de
filas y columnas sean positivas. En nuestra Para la realización del Análisis Factorial de
matriz, todos los valores son positivos, y supo- Correspondencias se ha utilizado el subprogra-
nemos que el rendimiento total observado se ma “Correspondence Analysis” del paquete
reparte en función del genotipo y del ambiente estadístico NTSYS.
considerados.
Las coordenadas tanto de los genotipos
Sea Y(I,J) la matriz de datos originales, como de los ambientes se pueden observar en
donde cada casilla contiene el valor observado la Tabla 26 y en la Fig. 43 podemos ver los resul-
Yij del genotipo i-ésimo en el ambiente j-ésimo. tados del análisis de correspondencias plasma-
Se procede de la siguiente forma: dos en forma de gráfica.
131
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Figura 43 Análisis de Correspondencias
-0.02
G8 G9
G3
-0.04
-0.06 A10 A2
G5
-0.08
-0.1 -0.05 0 0.05 0.1 0.15 0.2
1 EJE FACT. DE CORRESP. (59.18%)
AMBIENTES GENOTIPOS
GENOTIPOS AMBIENTES
GEN. 1ª 2ª 3ª AMB. 1ª 2ª 3ª
1 0.014 0.049 - 0.011 1 0.067 0.013 0.017
2 - 0.092 0.008 - 0.030 2 0.066 - 0.059 - 0.026
3 0.209 - 0.034 - 0.024 3 - 0.052 - 0.010 0.029
4 0.068 0.043 0.069 4 0.111 0.031 - 0.010
5 - 0.046 - 0.066 - 0.002 5 - 0.024 0.026 - 0.086
6 - 0.050 0.004 0.012 6 0.043 0.044 0.035
7 - 0.040 0.025 - 0.029 7 0.026 - 0.003 - 0.002
8 - 0.073 - 0.022 0.045 8 - 0.060 - 0.003 0.011
9 0.023 - 0.020 0.030 9 - 0.146 0.013 - 0.004
10 0.020 - 0.004 0.005 10 0.001 - 0.060 0.022
11 0.036 0.012 - 0.040
%Varianza explicada por los tres primeros ejes factoriales 59.18 10.58 9.85
%Varianza acumulada 59.18 69.75 79.60
Figura 44 A. F. de Correspondencias (Genotipos)
0.09
A3
A9 A1
0.03
E.F.C. 3
A8 A7 A4
A10
-0.03
A2
A5 0.09
-0.05 0.04
-0.15 -0.06
-0.07 -0.01 -0.06 E.F.C. 2
-0.09 -0.17
E.F.C. 1
132
Análisis Factorial de Correspondencias Análisis Factorial de Correspondencias Análisis Factorial de Correspondencias
Figura 45 A. F. de Correspondencias (Ambientes)
0.09
A6
A3
0.03 A9
A8 A7 A1 A4
E.F.C. 3
A10
-0.03
A2
A5 0.09
-0.09 0.04
-0.15 -0.01
-0.07 0.01 -0.06 E.F.C. 2
0.09 0.17
E.F.C. 1
En la Figura 43 podemos ver la proyección de IACP1 del biplot, obteniéndose así las mismas
los genotipos y de los ambientes en el primer agrupaciones entre genotipos y ambientes que
plano factorial. Su estudio pone de manifiesto la las ya explicadas para el AMMI1.
existencia de asociación entre genotipos y
ambientes, lo que se traduce en que aquellos no Por otro lado, el AFC permite efectuar el estu-
son independientes de estos, es decir: existe dio particular de cada uno de los genotipos,
interacción GxE. Este hecho puede compro- pudiendo extraer más información que con el
barse fácilmente, ya que ni los ambientes ni los análisis de grupos o en los casos en que el aná-
genotipos se han distribuido aleatoriamente en el lisis de CCPP no ofrece conclusiones claras, ya
plano de proyección, sino que se han formado que con el AFC podemos concluir qué genotipos
unas determinadas agrupaciones, que pueden son los más estables sin más que observar su
observarse mejor en la representación tridimen- situación en la gráfica respecto del origen: los
sional de las Figuras 44 y 45. En el caso de inde- genotipos más próximos al origen resultan ser
pendencia, tanto los genotipos como los ambien- los más estables, pudiéndose construir regiones
tes se habrían distribuido aleatoriamente en concéntricas de estabilidad a partir del origen,
forma de nube de puntos alrededor del origen. resultando, por tanto, que los genotipos más
estables por este método son el 9, 11, 10, 7 y 6.
Los tres primeros ejes factoriales explican el
59.18 %, 10.58 % y el 9.85 % de la variabilidad Como conclusión, cabe decir, que este méto-
total, respectivamente, lo que supone en total un do se muestra potencialmente muy adecuado
79.60 %, por lo que puede decirse que sólo con para el estudio de la interacción GxE pues per-
éstas tres dimensiones se explica un buen por- mite visualizar de forma gráfica la presencia o
centaje de la variabilidad total. ausencia de dicha interacción, a la vez que faci-
lita la posibilidad de efectuar agrupaciones de
Si comparamos la Fig. 43 con la Fig. 18 del genotipos en función de su comportamiento, es
“biplot” del análisis AMMI, vemos como el primer decir, de su aportación a la interacción GxE,
eje factorial de correspondencias dispone tanto como es nuestro caso: los que aporten menos,
genotipos como ambientes en el mismo orden aquellos situados en regiones concéntricas más
relativo que lo hacía el eje de coordenadas del próximas al origen, serán los más estables.
133
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
REFERENCIAS CITADAS
• BENZECRI, J.P. 1970: L’analyse des don- • GREENACRE, M.J. 1987: Theory and apli-
nées. II. L’analyse des correspondances. cations of correspondance analysis. Academic
Dunod. París. Press. London.
• CUADRAS, C.M. 1981: Métodos de análisis • LEFEBVRE, J. 1983: Introduction aux analy-
multivariante. Ed. por Eunibar. Barcelona. ses statistiques multidimensionales. Masson.
París.
134
13
A
C
NÁLISIS ANÓNICO
Análisis Canónico Análisis Canónico Análisis Canónico Análisis Canónico Análisis Canónico Análisis Canónico
13. ANÁLISIS CANÓNICO unos ejes en los que sus individuos han sido pro-
yectados según una proyección canónica (esto
Las técnicas de representación de datos es, la transformación de la matriz Y de datos en
desarrolladas anteriormente se han basado en otra matriz X (ver [67]), la cual contiene las coor-
distancias como la euclídea, la distancia de denadas de una configuración euclídea en
Gower, la distancia chi-cuadrado, etc. El análisis dimensión m=min(g,k-1), siendo g el número de
canónico (AC) utiliza la distancia D de genotipos y k el número de grupos predefini-
Mahalanobis. El AC es un método de repre- dos), pudiéndose investigar la posición y orien-
sentación de grupos, a lo largo de ejes con tación de unos grupos respecto de otros.
máximo poder de discriminación en relación a la
distancia D. El AC, pues, nos permite pasar de la matriz
de datos medios Y a la matriz de datos X, refe-
La distancia de Mahalanobis entre los grupos ridas a las variables canónicas Vi:
πi y πj es la distancia estadística entre sus indivi-
duos medios respectivos: X=YV (67)
— — — —
D2 (πi , πj) = (Yi. - Yj.) ‘S-1 (Yi. - Yj.) (66) Procedimiento para la obtención
de la matriz X.
siendo S la matriz de covarianzas.
Partimos de una matriz de medias Y (gxe),
Un aspecto interesante del análisis canónico de g individuos (genotipos) y e variables
es la posibilidad de construir y representar regio- (ambientes), en la que los individuos se agrupan
nes de confianza para los individuos medios de en k grupos; por tanto, la matriz Y se considera
los diferentes grupos (ver Figura 46). subdividida en k submatrices (Y1, Y2, ..., Yk).
drados y productos Wi= H’iHi, y sumando todas
El Análisis Canónico comienza con un con- estas matrices obtenemos la matriz de suma de
junto predefinido de grupos (lo que obliga a cuadrados y productos total dentro de grupos
haber aplicado antes otro tipo de análisis) y pro- W = ΣWi. De esta forma, la matriz de suma de
cede a investigar las interrelaciones entre estos cuadrados y productos entre grupos se calcula-
grupos. Además, los grupos se representan en ría por diferencia: B=T-W.
10
2 COORD. CANÓNICA
9
1
4
10 11
5
3935 3732
3 5
-5 6 2
14567 7 8
GENOTIPOS
137
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
El AC busca una combinación lineal de las e 2) Las distancias geométricas euclídeas de las
variables de tal forma que se obtenga la mayor representaciones canónicas de los grupos coinci-
variación entre grupos en relación con la varia- den con las distancias de Mahalanobis, salvo la
bilidad dentro de grupos. La primera combina- pérdida debida a la reducción de la dimensión.
ción lineal v1 se elige de forma que el cociente
[variación entre grupos]/[variación dentro de 3) En el caso de normalidad multivariante y
grupos] sea máximo: homogeneidad de covarianzas, las proyeccio-
nes de los vectores de medias teóricas están
[v’1Bv1]/[v’1Wv1] contenidas en regiones confidenciales esféricas,
que son círculos en el caso de dos dimensiones,
–
La segunda combinación lineal maximiza de de radios Rε/√ Nt (t = 1, ...,k = grupos).
nuevo el cociente anterior referido a v2, es decir:
La utilización de estas esferas de confian-
[v’2Bv2]/[v’2Wv2] za permite dar una visión precisa del grado de
separación o confusión entre los diferentes grupos.
cumpliendo la condición v’1Wv2 = 0, y así suce-
sivamente.
13.1. Caso práctico
El proceso de extracción de variables canónicas
se repetirá hasta que estas igualen a m = min.(k- Para nuestro ejemplo se han predefinido 3
1,e) (k=número de grupos), dado que a partir de m grupos. Estos grupos son los resultantes de los
las demás coordenadas son constantes. análisis de ACP, AMMI, ANALISIS DE GRUPOS y
AFC que, como vimos, eran coincidentes:
De esta forma se obtendría la matriz V del cam-
bio de coordenadas; introduciéndola en [67] obte- Grupo 1: genotipos 2, 5, 6, 7 y 8,
nemos la matriz de coordenadas canónicas X. Grupo 2: genotipos 1, 4, 9, 10 y 11,
Grupo 3: genotipo 3.
Como resumen, en el AC se siguen los
siguientes pasos: Se ha utilizado para la realización del Análisis
Canónico el subprograma CANDISC del paque-
1) Transformar las variables hasta que la te estadístico SAS (Sarle, 1985), creando para
matriz de covarianzas dentro de grupos sea una ello una sencilla corriente de control (ver Apén-
matriz identidad. dice). Los principales datos obtenidos se mues-
tran en las Tablas 27 y 28
2) Calcular las medias de grupos sobre las
variables transformadas. En la Fig. 42 se muestra la gráfica de las dos
primeras coordenadas canónicas, las cuales
3) Realizar un Análisis de Componentes Prin- representan el 98.28 % y el 1.72 %, respectiva-
cipales sobre las medias, ponderando cada mente, es decir, que el 100 % de las interrela-
media con el número de observaciones de cada ciones de estos grupos predefinidos queda
grupo. Los valores propios serán igual al cocien- explicado por estos dos ejes.
te obtenido al dividir la variación entre grupos
por la variación dentro de grupos en la dirección En esta misma figura también se han coloca-
de cada componente principal. do las distancias entre grupos, comprobándose
que el grupo 2 es un grupo intermedio entre los
4) Transformar los componentes principales otros dos, como ya se ha comentado en los
al espacio de las variables originales, obtenién- métodos anteriores, resultando estar compues-
dose así las variables canónicas. tos precisamente por los genotipos considera-
dos como más estables.
Las principales características de la repre-
sentación canónica son: Como conclusión podemos decir que el aná-
lisis canónico nos ha distinguido claramente
1) Las variables canónicas son de varianza estos grupos predefinidos, sugiriendo que esta
unidad e independientes entre sí. Por lo tanto, clasificación y ordenación no tiene nada de
trazaremos los ejes canónicos como ejes ortogo- arbitraria en nuestro caso.
nales.
138
Análisis Canónico Análisis Canónico Análisis Canónico Análisis Canónico Análisis Canónico Análisis Canónico
Tabla 27 Coordenadas canónicas para cada genotipo.
1 1.578 10.794
2 60.327 -4.674
3 -62.013 -2.375
4 0.450 9.367
5 60.542 -4.045
6 59.874 -5.152
7 59.550 -4.804
8 60.008 -4.703
9 0.433 9.275
10 0.229 8.259
11 0.161 8.407
%Varianza explicada por las dos primeras Coord. canónicas 98.28 1.72
%Varianza acumulada 98.28 100.00
REFERENCIAS CITADAS
• SARLE, W.S. 1985: PROC CANDISC. In:
SAS User’s Guide: Statistics. Version 6. 4th Edi-
tion. SAS Institute, Inc. (Eds.), Cary, NC.
multivariante. Ed. por Eunibar. Barcelona. bean (Phaseolus vulgaris L.). Theor. Appl.
Genet. 63, 17-22.
• DE PACE, C, A. FILIPPETTI and L. RIC-
CIARDI. 1988: A Combined Univariate and Multi- • RAO, C.R. 1970: Multivariate analysis: An
variate Approach for Selecting High Performing indispensable statistical aid in applied research.
Genotypes of Vivia faba L. Plant. Breeding. 100, Sankhya 22, 317-338.
199-208.
• WHITEHOUSE, R.N. 1970: Canonical
• DIGBY, P.G.N. and R.A. KEMPTON. 1987: analysis as an aid in plant breeding. pp. 269-
Multivariate analysis of ecological communities. 282. In: R.A. Nilan (Ed.), Barley Genetics II. Was-
Chapman and Hall (Ed.) hington State Univ. Press, Pullman, WA.
139
14
MODELO SREG.
GGE BIPLOT
Modelo Sreg. GGE Biplot Modelo Sreg. GGE Biplot Modelo Sreg. GGE Biplot Modelo Sreg. GGE Biplot
14. MODELO SREG. GGE BIPLOT Expliquemos brevemente el modelo SREG
(“sites regresión”) y cómo generamos el “GGE
Analizando el comportamiento de una serie de biplot” correspondiente. El rendimiento medio de
variedades de trigo de invierno procedentes de un genotipo i en el ambiente j se describe usual-
un ensayo realizado en varias localidades de mente por el modelo lineal siguiente [68]:
Ontario, Yan et al. (2000) propusieron para dicho
análisis, lo que ellos denominaron, el “GGE
biplot”, biplot construido a partir de los dos pri- Yij = µ + gi + ej + gxeij (68)
meros componentes principales (ACP1 y ACP2)
extraídos de un análisis de componentes princi- donde µ es la media general del ensayo, gi es el
pales con los datos previamente centrados res- efecto principal del genotipo i, ej es el efecto prin-
pecto las medias ambientales. El término “GGE cipal del ambiente j, y gxeij es la interacción entre
biplot” procede de que se dibuja en el biplot tanto el genotipo i y el ambiente j. Suprimiendo del
el efecto principal genotípico (G) como el de la modelo gi y/o ej o todos los valores µ + gi + ej , se
interacción GxE, los cuales son, verdaderamente, consigue que la variación explicable por los térmi-
las dos fuentes de variación más importantes, y nos suprimidos sea absorbida por el término gxeij.
por tanto, debemos considerarlas cojuntamente, Es a esta matriz de valores gxeij la que sometemos
en las evaluaciones del comportamiento de diver- a una descomposición singular (SVD). Precisamen-
sos genotipos en diferentes ambientes (Gauch y te, cuando aplicamos SVD a los valores gxeij en el
Zobel, 1996). modelo [68] tenemos el modelo AMMI (Zobel et al.
1988).
per et al. 1997), pero no tal y como lo desarrolla- término gi de la ecuación [68] y aplicar SVD a los
ron Yan et al. (2000) y Yan y Kang (2002), por valores gxeij (los cuales están ahora ambiental-
medio del cual podemos obtener la siguiente mente centrados) tenemos el siguiente modelo:
información:
donde Yij es el rendimiento medio del genotipo i
c) Comparar cualquier pareja de genotipos en
en el ambiente j, ej es el rendimiento medio del
función de su comportamiento en los diferentes
ambiente j frente a todos los genotipos, λ1 y λ2 son
ambientes del ensayo.
los valores singulares para ACP1 y ACP2, respec-
d) Determinar los mejores genotipos en cada
tivamente, ξi1 y ξi2 son las coordenadas ACP1 y
ambiente.
ACP2, respectivamente, para el genotipo i, ηj1 y
e) Determinar la existencia de mega-ambientes,
en función del agrupamiento de ambientes produ-
ηj2 son las coordenadas ACP1 y ACP2, respecti-
vamente, para el ambiente j, y εij es el residual del
cido en el biplot.
modelo asociado con el genotipo i y el ambiente j.
f) Visualizar conjuntamente los efectos principa-
les genotípicos y su estabilidad.
Un biplot basado en la ecuación [69] contiene
los efectos del genotipo G más los efectos de la
Aunque el método del “GGE biplot” fue
interacción GxE, de ahí que se le haya denomina-
desarrollado para el análisis de datos pro-
do como “GGE biplot”; por el contrario, un biplot
cedentes de ensayos multi-ambientales
generado a partir de una descomposición singular
(EMA), puede aplicarse para todos los
de los valores gxeij procedentes del modelo [68]
tipos de tablas de datos de dos vías, en
contiene sólo los efectos de la interacción GxE, de
los cuales se asume una estructura del
ahí que se le denomine “GE biplot”.
tipo entrada x probador (siguiendo la
nomenclatura de Yan et al. (2000): en los
Para dibujar el GGE biplot de forma que las
datos de un EMA, los genotipos serían las
coordenadas ACP1 y ACP2 de genotipos y ambi-
entradas y los ambientes serían los pro-
entes estén referidas a una escala simétrica,
badores).
143
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
podemos reescribir la ecuación anterior [69] en la variación total. De esta forma, un genotipo ideal
forma siguiente: sería aquel que tuviera grandes valores de la coor-
denada ACP1 (alto rendimiento medio, o sea, un
Yij - µ - ej = ξ*i1 η*j1 + ξ*i2 η*j2 + εij (70) alto efecto principal) y casi nulos de la coordenada
ACP2 (más estabilidad). De la misma forma, un
donde ξ*i1 = λ0.51ξi1; ξ*i2 = λ0.52ξi2; η*j1 = ambiente ideal sería aquel con una gran coordena-
= λ0.51 ηj1 y η*j2 = λ0.52 ηj2. La escala del modelo da ACP1, o sea, capaz de discriminar entre los
[70] tiene la ventaja de que ACP1 y ACP2 tienen la genotipos ensayados, es decir, facilitaría la identifi-
misma unidad (raíz cuadrada de la unidad original, cación de los genotipos con mejor adaptación gen-
p. ej. t ha-1 en términos de rendimiento). eral, y coordenada ACP2 casi nula, o sea, más rep-
resentativo del ambiente medio. Si un ambiente
El modelo SREG tiene una versión ambiental tiene una gran coordenada ACP2 podría favorecer
estandarizada: el comportamiento de algunos genotipos y al
mismo tiempo, desfavorecer el de otros; así, un
(Yij - µ - ej)/zj = ξ*i1 η*j1 + ξ*i2 η*j2 + εij (71) genotipo seleccionado bajo un ambiente con una
alta coordenada ACP2 puede resultar altamente
donde zj es: específico para ese ambiente.
sólo puede estimarse si nuestro diseño con- para nuestros datos, que encontramos en el
sta de varias repeticiones, por lo que este Apéndice de este Manual (Yan2000.sas), y nece-
modelo sólo es posible cuando tenemos sitaremos, como software estadístico, el SAS. Una
repeticiones en el ensayo, de forma que vez ejecutado el programa en SAS, nos generará el
podamos ajustar cualquier heterogeneidad biplot de la Figura 47 y, la salida texto que
entre probadores. podemos encontrar en el Apéndice.
observar en un GGE biplot (Fig. 47). Se representan tificar los genotipos vértice como aquellos conec-
todos los genotipos por sus “marcas” (p. ej. G1) cor- tados por los lados del polígono. Estos genotipos
respondientes; de ellos, los más alejados del origen son: G7, G2, G8, G4 y G3. Se han trazado las
se unen por una línea a trazos formando un polígono, perpendiculares a cada lado del polígono dividien-
por lo que el resto de genotipos se encontrarán en su do así el biplot en una serie de sectores, uno por
interior. Se dibujan líneas que partiendo del origen cada genotipo vértice. Se demuestra que todos los
sean perpendiculares a cada lado del polígono, de ambientes incluidos en un sector dan el mismo
forma que el biplot estará dividido en varios sectores. genotipo como superior en cada ambiente, coinci-
La marca de cada ambiente se une con el origen diendo éste con el genotipo vértice.
mediante una línea, éstos quedaran repartidos entre
los distintos sectores formados anteriormente. Los En la Figura 47 vemos que todos los ambientes
genotipos situados en los vértices del polígono serán están incluidos en un único sector, cuyo genotipo
los de mayor respuesta o mejor comportamiento en vértice es G7, por lo cual podemos decir que el
los ambientes incluidos en su sector (determinado genotipo G7 ha sido el mejor en todos los ambi-
por las líneas perpendiculares a cada lado que con- entes del ensayo. El resto de genotipos vértice no
fluyen en dicho vértice). Una condición necesaria han tenido ningún ambiente en sus sectores
para poder identificar los mejores genotipos en fun- respectivos; lógicamente, no han sido los de mayor
ción de sus efectos principales por medio del biplot, rendimiento en ninguno de los ambientes ensaya-
es que las coordenadas ACP1 genotípicas dos, ya que, como hemos visto anteriormente, el
tengan un coeficiente de correlación mayor genotipo G7 ha sido el genotipo de mayor
de 0.95 con los efectos principales rendimiento en todos los ambientes. Los genotipos
genotípicos; generalmente, esto ocurre, cuando el interiores al polígono, particularmente aquellos
primer eje del ACP extrae un gran porcentaje de la localizados cerca del origen (G10,G9), son los
144
Modelo Sreg. GGE Biplot Modelo Sreg. GGE Biplot Modelo Sreg. GGE Biplot Modelo Sreg. GGE Biplot
Figura 47
GGE biplot
3.5
3.0
A4
2.5
2.0 G3
A1
1.5
G11 G1
Factor 2
1.0 A2 G7
A6 A5
0.5 G10
0.0 G4 G9 A10A7
G6
-0.5
G5
-1.0
A8
A3
-1.5 G2
A9
-2.0
-2.5
G8
-3.0
-3.5
- - - - - - - 0 0 1 1 2 2 3 3
3 3 2 2 1 1 0 . . . . . . . .
. . . . . . . 0 5 0 5 0 5 0 5
5 0 5 0 5 0 5
Factor 1
genotipos de menor respuesta en los ambientes rendimientos muy pobres en todos los ambientes;
ensayados, siendo, por contra, los genotipos de los puede destacarse el genotipo G4 como el peor
vértices los de mayor respuesta. Los genotipos vér- adaptado, dado que es el de menor rendimiento
tice situados en los cuadrantes opuestos a aquellos medio (la menor coordenada ACP1) y muy estable
en que se sitúan los ambientes, es decir, aquellos (baja coordenada ACP2). Finalmente, los rendimien-
con coordenadas ACP1 de signo generalmente neg- tos medios de los genotipos G10 y G9 estuvieron
ativo, son realmente los genotipos de menor por debajo de la media general del ensayo
rendimiento medio. Dicho de otra forma, los que más (ACP1<0) y ligeramente estables (pequeña coorde-
pobremente han rendido en todos los ambientes; nada ACP2).
en nuestro caso, los genotipos G3, G4 y G8.
El biplot también muestra el rendimiento de
Estudiando simultáneamente rendimiento y esta- cualquier genotipo en cualquiera de los ambientes;
bilidad podemos comentar lo siguiente a la vista de por ejemplo, el genotipo G2 mostró un rendimiento
la Figura 47. Vemos como el genotipo G7 propor- medio por encima de la media general del ensayo
ciona los mayores rendimientos medios (el (ACP1>0), pero en dos ambientes, A4 y A1, mostró
mayor valor de la coordenada ACP1) y fue relativa- un rendimiento inferior a la media de cada uno de
mente estable frente a todos los ambientes ensaya- estos ambientes. Según Yan et al. (2000) la forma
dos (pequeño valor absoluto de la coordenada de visualizar si un genotipo está por encima o por
ACP2); le siguen los genotipos G6, G5 y G2 como debajo de la media de un ambiente viene indicado
un segundo grupo de genotipos con alto por el ángulo virtual formado por las líneas que
rendimiento medio, siendo G6 y G5 de similar o unen el origen con los respectivos genotipo y ambi-
mayor estabilidad que G7 y el genotipo G2 ligera- ente; así, si éste ángulo es obtuso dicho genotipo
mente más inestable que los anteriores, probable- rinde por debajo de la media ambiental y si el
mente, como veremos más adelante, porque en los ángulo es agudo el rendimiento está por encima.
ambientes A1 y A4 promedió por debajo de la media
de cada ambiente. Los genotipos G11 y G1 mues- Con respecto a los ambientes, el biplot muestra
tran similar rendimiento medio (ligeramente supe- como A8, A3 y A9 fueron los ambientes más
rior a la media general del ensayo, que vendría discriminantes, tal y como indican sus mayores
dada aproximadamente por el eje ACP2) y similar coordenadas ACP1. Sin embargo, debido a su gran
estabilidad a la mostrada por el genotipo G2. Por el coordenada ACP2, las diferencias observadas
contrario, vemos como el biplot nos muestra en el entre genotipos en estos ambientes puede no refle-
extremo opuesto tres genotipos no adaptados a los jar exactamente las diferencias en rendimiento
ambientes del ensayo (G8, G4 y G3), mostrando medio de estos genotipos en todos los ambientes.
145
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Por el contrario, los ambientes A7 y A10 no fueron ACP1 genotípicas y sus efectos principales fue alta,
muy discriminantes pero las diferencias entre r>0.95) y, por tanto, las diferencias entre genotipos
genotipos fueron altamente consistentes con los vendrán dadas en proporción a sus efectos princi-
promedios obtenidos frente a todos los ambientes pales en cada ambiente. Por el contrario, ambientes
ensayados, ya que tomaron las menores coorde- como el A4 no son ni discriminantes (pequeña
nadas ACP2. En los ambientes con coordenadas coordenada ACP1) ni representativos (gran
ACP2 próximas a cero, los genotipos se ordenan coordenada ACP2) y, por consiguiente, los genoti-
básicamente de acuerdo con sus coordenadas pos que tuvieran altos rendimientos en A4 no nece-
ACP1 o a sus efectos principales (ya que, en nue- sariamente dan altos rendimientos medios en el
stro caso, la correlación entre las coordenadas conjunto de los ambientes ensayados.
REFERENCIAS CITADAS
YAN, W., HUNT, L.A., SHENG, Q. y Z.
BRADU, D. y K.R. GABRIEL. 1978. The biplot as SZLAVNICS. 2000. Cultivar evaluation and mega-
a diagnostic tool for models of two-way tables.
environment investigation based on the GGE biplot.
Technometrics 20:47-68. Crop Sci. 40:597-605.
COOPER, M., R.E. STUCKER, I.H. DELACY y YAN, W., y M.S. KANG. 2002. GGE biplot analy-
B.D. HARCH. 1997. Wheat breeding nurseries, tar- sis. A graphical tool for breeders, geneticists, and
get environments, and indirect selection for grain agronomists. CRC PRESS.
yield. Crop Sci. 37:1168-1176.
ZOBEL, R.W., M.J. WRIGHT y H.G. GAUCH.
GAUCH, H.G. y R.W. ZOBEL. 1997. Identifying 1988. Statistical analysis of a yield trial. Agron. J.
mega-environments and targeting genotypes. Crop 80:388-393.
Sci. 37:311-326.
146
15
COMENTARIO Y
CONSEJOS FINALES
Comentario y Consejos Finales Comentario y Consejos Finales Comentario y Consejos Finales Comentario
15. COMENTARIOS Para genetistas, mejoradores y agrónomos,
Y CONSEJOS FINALES los estadísticos paramétricos de estabilidad
obtenidos por regresión lineal son matemáti-
Como se ha comentado a lo largo de este camente muy simples y fácilmente interpretables
Manual, el obtener datos por medio de ensayos desde un punto de vista biológico. Sin embargo,
en muchas localidades permite estimar rendi- como se ha expuesto en este Manual, este méto-
mientos con más precisión y permite seleccionar do tiene graves inconvenientes, que podemos
los mejores genotipos. La mayoría de los mejo- resumir fundamentalmente en tres:
radores y de los extensionistas poseen un buen
conocimiento de los diferentes ambientes en - No suministra información cuando falta la
que realizan sus ensayos, así como, en general, linealidad,
de la adaptación del material vegetal que mane-
jan. Generalmente este conocimiento es empíri- - Es muy dependiente del grupo de genoti-
co, habiéndose adquirido a partir de las obser- pos y ambientes incluidos en el ensayo, y
vaciones de campo, incluso de simples compa-
raciones visuales entre líneas en selección y los - Tiende a simplificar sobremanera los dife-
testigos adecuados. Sin embargo, parece nece- rentes patrones de respuesta para explicar la
saria la utilización de métodos estadísticos para interacción GxE en una sola dimensión (coefi-
el cálculo de la estabilidad genotípica, comple- ciente de regresión), cuando en realidad ésta
mentando y haciendo objetivas las impresiones puede ser muy compleja. Evidentemente
realizadas en campo por el mejorador. Dado el resulta peligroso tratar de sacrificar
gran número de métodos existentes ha resultado información relevante con objeto de
necesaria una revisión de los más utilizados. Así, facilitar la interpretación biológica y la
discutamos brevemente lo que en este Manual estadística.
se ha comentado sobre los mismos.
Dado que para nuestro caso práctico la hete-
rogeneidad de las regresiones ha resultado no
15.1. Métodos Univariantes significativa, la utilidad del método de análisis de
paramétricos regresión para la interpretación de los datos
resulta, por lo menos, dudosa. En línea con
Los métodos univariantes para calcular esta- nuestro resultado, Westcott llegó a afirmar que
bilidad tienen la ventaja de su simplicidad en los no deben recomendarse ni el método de regre-
cálculos. sión ni los parámetros de estabilidad deducidos
de él, ni se pueden superar sus defectos con la
En la Introducción ya se comentó que los utilización conjunta del análisis de grupos o el
parámetros S2xi y CVi pertenecen al tipo 1 de ACP (Westcott, 1986).
estabilidad análogo al concepto de homeosta-
sis. Una razón por la cual los mejoradores no A pesar de todo lo expuesto anteriormente,
han utilizado mucho estos parámetros es por la conviene decir que cuando la heterogenei-
necesidad de encontrar genotipos no sólo con dad de las regresiones resulte altamen-
buena estabilidad de tipo 1 sino también con alto te significativa el método de regresión puede
rendimiento. La estabilidad de tipo 1 está aso- ser utilizado. Se aconseja su utilización también
ciada generalmente con respuestas pobres y cuando en el ensayo experimental intervienen un
bajos rendimientos en ambientes en los que gran número de genotipos y se desea realizar un
otros cultivares han tenido altos rendimientos. En barrido previo de los mismos.
nuestro caso práctico, los genotipos que han
mostrado mayor estabilidad medida por medio Los parámetros Wi, Wi-CM y σ2i han produ-
del parámetro S2xi han resultado ser también los cido resultados similares entre sí; de esta forma
de menor rendimiento medio. En cambio para el podemos usar indistintamente uno u otro, siendo
CVi los genotipos de mayor estabilidad también preferible utilizar σ2i, ya que como se indica en el
eran los de mayor rendimiento; sin embargo, el Capítulo 3, una exhaustiva investigación de los
estadístico CVi no resulta “a priori” muy apro- mismos reveló que la ecovalencia (Wi) era un
piado como medida de estabilidad porque tiene paso intermedio para el cálculo de σ2i y que no
una limitación intrínseca: bajos rendimientos es necesario el uso de Wi como una medida indi-
implican altos CVi, y altos rendimientos, bajos vidual de estabilidad dado que σ2i es un pará-
CVi. metro insesgado cuya significación estadística
149
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
puede calcularse. El estadístico Wi-CM también El método Estrella posee la ventaja de su
puede ser probado estadísticamente, pero supo- sencillez y rapidez de resultados que nos deter-
niendo que se distribuyera como una F de Sne- mina con una simple visualización aquellos
decor, hipótesis que necesita ser probada. genotipos más estables y de mayor rendimiento,
pero no suministra ningún índice cualitativamen-
El ordenamiento que produce Pi es el mismo te diferente a los ya comentados.
que el originado por el rendimiento medio. Por
tanto, la selección basada sobre este índice
podría favorecer el seleccionar fundamental- 15.4. Métodos Multivariantes
mente por rendimiento, por lo que Pi no ofrece
ninguna ventaja respecto de los métodos ante- Se ha utilizado en el presente Manual un
riores. amplio número de métodos multivariantes para
analizar los ensayos multilocales y estimar la
estabilidad del rendimiento. En algunos de
15.2. Métodos univariantes ellos se superan las limitaciones de la regre-
no-parámetricos sión lineal, pero los resultados son, a menudo,
difíciles de interpretar en relación a la interac-
Si se está interesado en considerar simultá- ción GxE (como es el caso del Análisis de
neamente estabilidad y rendimiento, los estadís- Componentes Principales y el Análisis
ticos no paramétricos a aplicar son S(3)i y S(6)i de Grupos).
de Hühn, los cuales miden la estabilidad en uni-
dades de rendimiento. Pero deben utilizarse los Para nuestro ejemplo práctico, el Análisis
datos originales porque la transformación Yij - Y*ij de Componentes Principales, por sí sólo,
elimina el efecto genotípico de los datos. no nos ha suministrado unos resultados que
hayamos podido relacionar con el comporta-
El método de Ketata tiene la ventaja de su miento de los genotipos en los distintos ambien-
sencillez en los cálculos y su poder resolutivo en tes: en otros casos reales puede ocurrir lo con-
las gráficas. En éstas ya podemos estimar rápi- trario, pero ha de considerarse siempre que no
damente qué genotipos son más estables y de es un método diseñado para el estudio de la
mayor rendimiento. Nos combina, pues, en una interacción GxE.
gráfica, estabilidad y rendimiento.
El Análisis de Grupos de Lin, para nues-
El método de Kang ha resultado ser también tro caso práctico, ha mostrado ser más eficaz
un método útil para seleccionar simultáneamen- que el de Fox y Rosielle para el estudio de la
te para rendimiento y estabilidad. Además, si interacción GxE. Pero recordemos que en los
estuviéramos interesados en dar más peso a últimos años el más utilizado viene siendo el
rendimiento o a estabilidad también se podría segundo y que ha dado, en general, excelentes
utilizar. resultados.
dos no paramétricos, es independiente de la esca- biológica relevante y son estadísticamente muy
la, además de dar igual peso a cada ambiente. simples como, por ejemplo, el AMMI. La combi-
nación del Análisis de Varianza y Componentes
Principales en el modelo AMMI, junto con las
15.3. Otros métodos univariantes estimas predictivas, hacen que éste sea un
método muy válido para explicar la estructura de
El método de Eskridge tiene como principal la interacción y estimar con más precisión los
preocupación eliminar todo tipo de riesgos para rendimientos, pero se necesita una investigación
la elección de aquel cultivar que tenga poca pro- más profunda para cuantificar la probabilidad de
babilidad en dar rendimientos bajos. Ahora bien, acertar en la selección de un genotipo utilizando
al estar los índices basados en varianzas esti- el valor predictivo del AMMI, comparado con
madas, las cuales pueden mostrar por sí mismas los valores predictivos de otros modelos. Es,
una gran error estándar, las estimas imprecisas ciertamente, el método más completo en cuanto
de varianzas pueden producir ordenaciones de a información suministrada, aunque también el
genotipos de dudoso valor. de análisis más complejo.
150
Comentario y Consejos Finales Comentario y Consejos Finales Comentario y Consejos Finales Comentario
El Análisis de Coordenadas Principa- cual combinamos un análisis de regresión y un
les (CCPP), con la medida de similaridad de análisis de componentes principales. Resulta,
Westcott, se ha mostrado como una potente ciertamente, más complejo interpretar sus resul-
herramienta para la determinación de aquellos tados que los obtenidos por el AMMI, pero
genotipos más ampliamente adaptados y de alto renombrados biométricos han demostrado que
rendimiento. con este método de estudio de la GxE conse-
guimos un nivel mayor de información y más
El Análisis Factorial de Correspon- minucioso que el aportado por el modelo AMMI.
dencias (AFC) se muestra potencialmente muy Con ello no queremos indicar que sean métodos
adecuado para el estudio de la interacción GxE excluyentes, sino todo lo contrario, pensemos
pues permite visualizar de forma gráfica la pre- que cuando encontremos una correlación baja
sencia o ausencia de interacción GxE. Por otro entre los efectos aditivos genotípicos y las coor-
lado, el AFC permite efectuar el estudio particu- denadas ACP1 los efectos primarios o principa-
lar de cada uno de los genotipos, pudiendo les no quedan correctamente reflejados en el
extraer más información que con el Análisis biplot, por lo que seria más razonable combinar
de Grupos o en los casos en que el Análisis ambos modelos.
de CCPP no ofrece conclusiones claras.
15.5. Comparación de métodos
El Análisis Canónico es un método muy univariantes y multivariantes
adecuado para confirmar que la clasificación
obtenida por otros métodos tiene un mínimo de Lo que en este apartado vamos a comentar
arbitrariedad. es un extracto de lo expuesto en el artículo Flo-
res et al. (1998), ampliado con los resultados
El modelo SREG del GGE biplot es otra téc- obtenidos al aplicar el método de Yan et al.
nica multivariante, híbrida como el AMMI, en la (2000) al mismo conjunto de datos.
Figura 48 S2XI: Varianza ambiental, EBRAS: regresión según Eberhart y Russell, TAI: métod de Tai, SHUKLA:
varianza de estabilidad de Shukla, CV: Coeficiente de variación de Francis y Kannenberg, PI: parámetro de Lin y Binns, S1O,
S2O, S3O y S6O: medidas de estabilidad no-paramétrica de Hühn, KANG: método de sumas-rangos de Kang, KETRANG:
método de Ketata con rangos, KETREND: método de Ketata con rendimiento, FOXRANG: método estratificado de rangos
de Fox, ESTRELLA: método estrella de Flores, UPGMA: análisis de grupos usando el algoritmo UPGMA, LIN: análisis de gru-
pos según Lin, FOXROS: análisis de grupos según Fox y Rosielle, AMMI: análisis AMMI según Zobel, CCPP: coordenadas
principales según Westcott, AFC: análisis factorial de correspondencias según Hill, RENDTO: orden genotípico según su
rendimiento, YAN: análisis según GGE biplot de Yan.
ACP MÉTODOS
ACP 2
ACP 1
151
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Se compararon veintitrés métodos diferentes sola dimensión la variación debida a la interac-
(paramétricos, no-paramétricos y multivariantes) ción, cuando, en realidad, la respuesta normal-
utilizados en este Manual para el estudio de la mente es multidimensional. Existe, pues, el peli-
interacción GxE utilizando dos grupos de datos gro de sacrificar información relevante con el
experimentales: un ensayo de 15 variedades de objeto de simplificar la interpretación estadística.
habas en 12 ambientes y un ensayo de 11 varie- Estos métodos tan simples podrían ser útiles
dades de guisante en 16 ambientes. Se forma- cuando el mejorador tiene un gran número de
ron las matrices de rangos de cada variedad en genotipos para evaluar, pero cuando sea nece-
cada ambiente; se aplicó a cada matriz de ran- sario un estudio más preciso (por ejemplo, en los
gos un análisis de componentes principales y se análisis de los datos procedentes de ensayos
compararon los resultados mediante un análisis llevados a cabo por Centros Internacionales de
de correlación canónica. Los resultados se Investigación) los métodos multivariantes son los
muestran en la Figura 48. La inclusión del méto- idóneos.
do de Yan et al. (2000) no modificó las conclu-
siones de Flores et al. (1998). 15.6. Plan de Trabajo
Se identificaron cinco grupos de métodos
muy diferentes en base a distintos conceptos de Así a la vista de este resumen, un plan de
estabilidad. El primer eje del análisis de compo- trabajo que recomendamos para un buen estu-
nentes principales separó los métodos que defi- dio de la interacción GxE es la aplicación suce-
nen la estabilidad homeostática de un siva de los siguientes métodos estadísticos; tal
genotipo (S2XI, S1O y S2O) del resto de méto- plan es similar al de la primera edición con la
dos que se basan en un concepto agronó- inclusión del método del “GGE biplot”:
mico de estabilidad. 1º. El método del GGE biplot.
2º. El análisis AMMI.
El segundo componente principal nos ordena 3º. El análisis canónico.
los métodos en tres grupos fundamentales, de 4º. Un método univariante (Kang).
tal forma que si un mejorador está interesado
principalmente en aquellos métodos que le dan
1°. El Método del “GGE biplot” que es
más importancia al rendimiento genotípico ten-
actualmente el método más potente para
dría que elegir uno de los métodos del grupo G1
el estudio de la interacción GxE.
(CV, KETREND, PI, UPGMA, FOXROS, FOXEST y
2º- El Análisis AMMI, que nos suministraría
KETORD); si la selección de genotipos la basa-
información adicional, sobre todo en
mos dándole más importancia a su estabilidad
aquellos casos de baja correlación entre
que al rendimiento, entonces los métodos a ele-
efecto principales y las coordenadas
gir son los agrupados en G3 (TAI, AFC, SHU-
ACP1 del modelo anterior.
KLA, LIN y EBRAS) y, finalmente, si estamos inte-
resados en seleccionar bajo un criterio que le de 3º. El Análisis Canónico, para rechazar
igual importancia a la estabilidad de los genoti- toda arbitrariedad en la formación de los
pos que a su nivel de rendimiento, entonces grupos por los métodos anteriores.
escogeríamos los métodos incluidos en el grupo 4º- Un Método Univariante, por ejemplo
G2 (YAN, CCPP, S6O, AMMI, ESTRELLA, KANG el método de Kang (1988), que nos ayu-
y S3O). daría a perfilar la ordenación dentro de
grupos.
Por otro lado, para genéticos, mejoradores y 5º. Recordemos que cuando en el ensayo
agrónomos, los métodos univariantes son mate- intervienen un gran número de genotipos
máticamente más simples y de más fácil inter- es muy conveniente hacer barridos pre-
pretación. Estos métodos, sin embargo, tienen vios con métodos univariantes antes de
una gran desventaja: tienden a sobresimplificar aplicar los multivariantes.
el modelo de respuesta para explicar en una
152
Comentario y Consejos Finales Comentario y Consejos Finales Comentario y Consejos Finales Comentario
REFERENCIAS CITADAS
selectig high-yielding, stable corn genotypes. mega-environment investigation based on the
Cereal Res. Comm. 16, 113-115. GGE biplot. Crop Sci. 40:597-605.
153
16
A
PÉNDICE
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
16. APÉNDICE 16.1. Matrices de entrada
para los distintos paquetes
estadísticos utilizados
Nota Previa
16.1.1. Matriz de datos denominada “DAT-
Se advierte que los programas en lenguaje COMP1.TXT” utilizada para las corrientes de
BASIC han sido realizados específicamente para control diseñadas para el paquete estadístico
el caso práctico que se ha resuelto en este SAS.
Manual, aunque si se poseen ciertos conoci-
mientos del lenguaje BASIC pueden ser adapta-
dos fácilmente para la resolución de otros casos.
1.0 1.0 1.0 4208.3
1.0 1.0 2.0 3933.3
1.0 1.0 3.0 3408.3
1.0 2.0 1.0 3458.3
1.0 2.0 2.0 3679.2
1.0 2.0 3.0 3520.8
1.0 3.0 1.0 3475.0
1.0 3.0 2.0 3308.3
1.0 3.0 3.0 3275.0
1.0 4.0 1.0 3475.0
1.0 4.0 2.0 3216.7
1.0 4.0 3.0 3312.5
1.0 5.0 1.0 3820.8
1.0 5.0 2.0 3395.8
1.0 5.0 3.0 4070.8
1.0 6.0 1.0 4000.0
1.0 6.0 2.0 4195.8
1.0 6.0 3.0 4245.8
1.0 7.0 1.0 4166.7
1.0 7.0 2.0 3720.8
1.0 7.0 3.0 4225.0
1.0 8.0 1.0 3016.7
1.0 8.0 2.0 2716.7
1.0 8.0 3.0 2437.5
1.0 9.0 1.0 3504.2
1.0 9.0 2.0 3775.0
1.0 9.0 3.0 3637.5
1.0 10.0 1.0 3800.0
1.0 10.0 2.0 3804.2
1.0 10.0 3.0 3395.8
1.0 11.0 1.0 3504.2
1.0 11.0 2.0 3870.8
1.0 11.0 3.0 3470.8
2.0 1.0 1.0 4166.7
2.0 1.0 2.0 3125.0
2.0 1.0 3.0 3333.3
2.0 2.0 1.0 3958.3
2.0 2.0 2.0 3541.7
2.0 2.0 3.0 3750.0
2.0 3.0 1.0 3958.3
2.0 3.0 2.0 3958.3
2.0 3.0 3.0 3541.7
2.0 4.0 1.0 2500.0
2.0 4.0 2.0 2916.7
2.0 4.0 3.0 3125.0
2.0 5.0 1.0 4375.0
2.0 5.0 2.0 4375.0
2.0 5.0 3.0 4375.0
2.0 6.0 1.0 3750.0
2.0 6.0 2.0 3541.7
2.0 6.0 3.0 4166.7
2.0 7.0 1.0 3541.7
2.0 7.0 2.0 4375.0
2.0 7.0 3.0 4166.7
2.0 8.0 1.0 3541.7
2.0 8.0 2.0 3125.0
2.0 8.0 3.0 3125.0
2.0 9.0 1.0 2916.7
(Continúa)
157
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
AMBIENTE GENOTIPO REPET. RENDIMIENTO
3.0 1.0 1.0 3454.2
3.0 1.0 2.0 3087.5
3.0 1.0 3.0 3383.3
3.0 2.0 1.0 4000.0
3.0 2.0 2.0 3695.8
3.0 2.0 3.0 3679.2
3.0 3.0 1.0 2637.5
3.0 3.0 2.0 2575.0
3.0 3.0 3.0 1770.8
3.0 4.0 1.0 2920.8
3.0 4.0 2.0 2437.5
3.0 4.0 3.0 2804.2
3.0 5.0 1.0 3800.0
3.0 5.0 2.0 3766.7
3.0 5.0 3.0 3808.3
3.0 6.0 1.0 3950.0
3.0 6.0 2.0 3758.3
3.0 6.0 3.0 3529.2
3.0 7.0 1.0 3975.0
3.0 7.0 2.0 4054.2
3.0 7.0 3.0 4083.3
3.0 8.0 1.0 3437.5
3.0 8.0 2.0 3375.0
3.0 8.0 3.0 2720.8
3.0 9.0 1.0 3083.3
3.0 9.0 2.0 3304.2
3.0 9.0 3.0 2695.8
3.0 10.0 1.0 3645.8
3.0 10.0 2.0 3662.5
3.0 10.0 3.0 3341.7
3.0 11.0 1.0 3358.3
3.0 11.0 2.0 2162.5
3.0 11.0 3.0 3075.0
4.0 1.0 1.0 3825.0
4.0 1.0 2.0 3550.0
4.0 1.0 3.0 4229.2
4.0 2.0 1.0 3425.0
4.0 2.0 2.0 2945.8
4.0 2.0 3.0 3391.7
4.0 3.0 1.0 3475.0
4.0 3.0 2.0 2925.0
4.0 3.0 3.0 4241.7
4.0 4.0 1.0 3229.2
4.0 4.0 2.0 3062.5
4.0 4.0 3.0 3237.5
4.0 5.0 1.0 3141.7
4.0 5.0 2.0 3287.5
4.0 5.0 3.0 3500.0
4.0 6.0 1.0 3116.7
4.0 6.0 2.0 3450.0
4.0 6.0 3.0 3225.0
4.0 7.0 1.0 3654.2
4.0 7.0 2.0 4225.0
4.0 7.0 3.0 4512.5
4.0 8.0 1.0 2329.2
4.0 8.0 2.0 3004.2
4.0 8.0 3.0 2650.0
4.0 9.0 1.0 3054.2
4.0 9.0 2.0 3350.0
4.0 9.0 3.0 3058.3
4.0 10.0 1.0 3433.3
4.0 10.0 2.0 3904.2
4.0 10.0 3.0 3737.5
4.0 11.0 1.0 3458.3
4.0 11.0 2.0 3662.5
4.0 11.0 3.0 4008.3
5.0 1.0 1.0 2856.3
5.0 1.0 2.0 2562.5
5.0 1.0 3.0 3875.0
5.0 2.0 1.0 3162.5
5.0 2.0 2.0 3245.8
(Continúa)
158
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
AMBIENTE GENOTIPO REPET. RENDIMIENTO
5.0 5.0 2.0 3100.0
5.0 5.0 3.0 2375.0
5.0 6.0 1.0 3462.5
5.0 6.0 2.0 3293.8
5.0 6.0 3.0 2629.2
5.0 7.0 1.0 3735.4
5.0 7.0 2.0 3675.0
5.0 7.0 3.0 4014.6
5.0 8.0 1.0 1310.4
5.0 8.0 2.0 3237.5
5.0 8.0 3.0 1608.3
5.0 9.0 1.0 2212.5
5.0 9.0 2.0 2683.3
5.0 9.0 3.0 2358.3
5.0 10.0 1.0 2672.9
5.0 10.0 2.0 2625.0
5.0 10.0 3.0 2775.0
5.0 11.0 1.0 2731.3
5.0 11.0 2.0 2904.2
5.0 11.0 3.0 3579.2
6.0 1.0 1.0 3958.3
6.0 1.0 2.0 3875.0
6.0 1.0 3.0 4083.3
6.0 2.0 1.0 3250.0
6.0 2.0 2.0 3916.7
6.0 2.0 3.0 2958.3
6.0 3.0 1.0 2666.7
6.0 3.0 2.0 3125.0
6.0 3.0 3.0 3208.3
6.0 4.0 1.0 3958.3
6.0 4.0 2.0 3125.0
6.0 4.0 3.0 3208.3
6.0 5.0 1.0 3541.7
6.0 5.0 2.0 3583.3
6.0 5.0 3.0 3166.7
6.0 6.0 1.0 3958.3
6.0 6.0 2.0 4000.0
6.0 6.0 3.0 3750.0
6.0 7.0 1.0 4375.0
6.0 7.0 2.0 4083.3
6.0 7.0 3.0 4000.0
6.0 8.0 1.0 3208.3
6.0 8.0 2.0 3708.3
6.0 8.0 3.0 3041.7
6.0 9.0 1.0 4166.7
6.0 9.0 2.0 3041.7
6.0 9.0 3.0 3041.7
6.0 10.0 1.0 3333.3
6.0 10.0 2.0 3458.3
6.0 10.0 3.0 3333.3
6.0 11.0 1.0 4166.7
6.0 11.0 2.0 3958.3
6.0 11.0 3.0 3291.7
7.0 1.0 1.0 3791.7
7.0 1.0 2.0 3854.2
7.0 1.0 3.0 4208.3
7.0 2.0 1.0 3958.3
7.0 2.0 2.0 4229.2
7.0 2.0 3.0 4416.7
7.0 3.0 1.0 3541.7
7.0 3.0 2.0 3041.7
7.0 3.0 3.0 3708.3
7.0 4.0 1.0 3125.0
7.0 4.0 2.0 3291.7
7.0 4.0 3.0 2875.0
7.0 5.0 1.0 4687.5
7.0 5.0 2.0 3541.7
7.0 5.0 3.0 3437.5
7.0 6.0 1.0 3958.3
7.0 6.0 2.0 3875.0
7.0 6.0 3.0 3854.2
(Continúa)
159
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
AMBIENTE GENOTIPO REPET. RENDIMIENTO
7.0 9.0 3.0 2958.3
7.0 10.0 1.0 3479.2
7.0 10.0 2.0 3291.7
7.0 10.0 3.0 4166.7
7.0 11.0 1.0 4062.5
7.0 11.0 2.0 3895.8
7.0 11.0 3.0 4125.0
8.0 1.0 1.0 5104.2
8.0 1.0 2.0 3958.3
8.0 1.0 3.0 3958.3
8.0 2.0 1.0 5729.2
8.0 2.0 2.0 4895.8
8.0 2.0 3.0 5000.0
8.0 3.0 1.0 3333.3
8.0 3.0 2.0 2916.7
8.0 3.0 3.0 2916.7
8.0 4.0 1.0 4375.0
8.0 4.0 2.0 3541.7
8.0 4.0 3.0 3229.2
8.0 5.0 1.0 5520.8
8.0 5.0 2.0 5104.2
8.0 5.0 3.0 4895.8
8.0 6.0 1.0 5625.0
8.0 6.0 2.0 5000.0
8.0 6.0 3.0 5208.3
8.0 7.0 1.0 6145.8
8.0 7.0 2.0 5416.7
8.0 7.0 3.0 4687.5
8.0 8.0 1.0 3750.0
8.0 8.0 2.0 4687.5
8.0 8.0 3.0 3854.2
8.0 9.0 1.0 4270.8
8.0 9.0 2.0 4479.2
8.0 9.0 3.0 3125.0
8.0 10.0 1.0 4895.8
8.0 10.0 2.0 3854.2
8.0 10.0 3.0 3958.3
8.0 11.0 1.0 4375.0
8.0 11.0 2.0 4062.5
8.0 11.0 3.0 4062.5
9.0 1.0 1.0 4704.2
9.0 1.0 2.0 4287.5
9.0 1.0 3.0 4491.7
9.0 2.0 1.0 6016.7
9.0 2.0 2.0 4925.0
9.0 2.0 3.0 5216.7
9.0 3.0 1.0 1816.7
9.0 3.0 2.0 2470.8
9.0 3.0 3.0 1600.0
9.0 4.0 1.0 2975.0
9.0 4.0 2.0 2341.7
9.0 4.0 3.0 3720.8
9.0 5.0 1.0 5645.8
9.0 5.0 2.0 4287.5
9.0 5.0 3.0 4883.3
9.0 6.0 1.0 5366.7
9.0 6.0 2.0 4841.7
9.0 6.0 3.0 4816.7
9.0 7.0 1.0 6016.7
9.0 7.0 2.0 5250.0
9.0 7.0 3.0 5070.8
9.0 8.0 1.0 4404.2
9.0 8.0 2.0 4508.3
9.0 8.0 3.0 4545.8
9.0 9.0 1.0 4000.0
9.0 9.0 2.0 4525.0
9.0 9.0 3.0 2854.2
9.0 10.0 1.0 4650.0
9.0 10.0 2.0 3325.0
9.0 10.0 3.0 4141.7
9.0 11.0 1.0 4675.0
(Continúa)
160
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
AMBIENTE GENOTIPO REPET. RENDIMIENTO
10.0 3.0 1.0 2395.8
10.0 3.0 2.0 1979.2
10.0 3.0 3.0 1979.2
10.0 4.0 1.0 2708.3
10.0 4.0 2.0 1666.7
10.0 4.0 3.0 1666.7
10.0 5.0 1.0 3750.0
10.0 5.0 2.0 3125.0
10.0 5.0 3.0 3020.8
10.0 6.0 1.0 2812.5
10.0 6.0 2.0 3020.8
10.0 6.0 3.0 2812.5
10.0 7.0 1.0 3645.8
10.0 7.0 2.0 3125.0
10.0 7.0 3.0 2604.2
10.0 8.0 1.0 2916.7
10.0 8.0 2.0 2291.7
10.0 8.0 3.0 2083.3
10.0 9.0 1.0 3645.8
10.0 9.0 2.0 2812.5
10.0 9.0 3.0 2125.0
10.0 10.0 1.0 2500.0
10.0 10.0 2.0 2500.0
10.0 10.0 3.0 2812.5
10.0 11.0 1.0 2708.3
10.0 11.0 2.0 2812.5
10.0 11.0 3.0 2291.7
(Conclusión)
16.1.2. Matriz de entrada para el paquete esta- los nombres de G1, G2, ...., G11 (representando
dístico NTSYS. Se trata de una matriz de tipo los 11 genotipos). Los datos son las medias de
rectangular (1, para el Ntsys), con 10 filas y 11 las tres repeticiones.
columnas etiquetadas (11L, para el Ntsys) con
1 10 11L 0
G1 G2 G3 G4 G5 G6 G7 G8 G9 G10 G11
3849.97 3552.77 3352.77 3334.73 3762.47 4147.20 4037.50 2723.63 3638.90 3666.67 3615.27
3541.67 3750.00 3819.43 2847.23 4375.00 3819.47 4027.80 3263.90 3402.80 3680.57 4027.80
3308.33 3791.67 2327.77 2720.83 3791.67 3745.83 4037.50 3177.77 3027.77 3550.00 2865.27
3868.07 3254.17 3547.23 3176.40 3309.73 3263.90 4130.57 2661.13 3154.17 3691.67 3709.70
3097.93 3265.97 2161.13 1854.87 2993.07 3128.50 3808.33 2052.07 2418.03 2690.97 3071.57
3972.20 3375.00 3000.00 3430.53 3430.57 3902.77 4152.77 3319.43 3416.70 3374.97 3805.57
3951.40 4201.40 3430.57 3097.23 3888.90 3895.83 4229.17 3722.20 3534.73 3645.87 4027.77
4340.27 5208.33 3055.57 3715.30 5173.60 5277.77 5416.67 4097.23 3958.33 4236.10 4166.67
4494.47 5386.13 1962.50 3012.50 4938.87 5008.37 5445.83 4486.10 3793.07 4038.90 4283.33
2569.47 2465.27 2118.07 2013.90 3298.60 2881.93 3125.00 2430.57 2861.10 2604.17 2604.17
161
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
16.1.3. Matriz de entrada para el NTSYS. Se filas por 10 columnas etiquetadas por A1, A2,
trata de una matriz de tipo rectangular (1) de 11 ......, A10 (representando los 10 ambientes).
1 11 10L 0
A1 A2 A3 A4 A5 A6 A7 A8 A9 A10
3849.97 3541.67 3308.33 3868.07 3097.93 3972.20 3951.40 4340.27 4494.47 2569.47
3552.77 3750.00 3791.67 3254.17 3265.97 3375.00 4201.40 5208.33 5386.13 2465.27
3352.77 3819.43 2327.77 3547.23 2161.13 3000.00 3430.57 3055.57 1962.50 2118.07
3334.73 2847.23 2720.83 3176.40 1854.87 3430.53 3097.23 3715.30 3012.50 2013.90
3762.47 4375.00 3791.67 3309.73 2993.07 3430.57 3888.90 5173.60 4938.87 3298.60
4147.20 3819.47 3745.83 3263.90 3128.50 3902.77 3895.83 5277.77 5008.37 2881.93
4037.50 4027.80 4037.50 4130.57 3808.33 4152.77 4229.17 5416.67 5445.83 3125.00
2723.63 3263.90 3177.77 2661.13 2052.07 3319.43 3722.20 4097.23 4486.10 2430.57
3638.90 3402.80 3027.77 3154.17 2418.03 3416.70 3534.73 3958.33 3793.07 2861.10
3666.67 3680.57 3550.00 3691.67 2690.97 3374.97 3645.87 4236.10 4038.90 2604.17
3615.27 4027.80 2865.27 3709.70 3071.57 3805.57 4027.77 4166.67 4283.33 2604.17
1 10 11L 0
G1 G2 G3 G4 G5 G6 G7 G8 G9 G10 G11
90.100 -332.79 414.77 353.89 -194.27 179.55 -264.10 -530.26 257.85 88.190 -62.933
-297.64 -215.00 802.00 -213.05 338.83 -227.62 -353.24 -69.430 -57.686 22.654 270.16
-148.13 209.51 -306.82 43.397 138.34 81.594 39.304 227.28 -49.876 274.93 -509.53
282.30 -457.29 783.34 369.66 -472.90 -529.64 3.0674 -418.66 -52.779 287.29 205.60
168.92 211.27 53.999 -295.12 -132.81 -8.2881 337.59 -370.97 -132.16 -56.652 224.23
257.91 -464.98 107.59 495.27 -480.59 -19.301 -103.26 111.12 81.230 -157.93 172.95
14.878 139.19 315.92 -60.264 -244.49 -248.47 -249.09 291.65 -22.970 -109.26 172.91
-234.51 507.87 -697.33 -80.449 401.96 495.21 300.16 28.434 -237.62 -157.28 -326.44
82.945 848.92 -1627.1 -620.00 330.48 389.07 492.58 580.55 -239.64 -191.23 -46.521
-216.80 -446.69 153.68 6.6602 315.47 -112.11 -203.00 150.28 453.65 -0.7063 -100.43
3607.4 90.100 -332.79 414.77 353.89 -194.27 179.55 -264.10 -530.26 257.85 88.190 -62.933
3686.9 -297.64 -215.00 802.00 -213.05 338.83 -227.62 -353.24 -69.430 -57.686 22.654 270.16
3304.0 -148.13 209.51 -306.82 43.397 138.34 81.594 39.304 227.28 -49.876 274.93 -509.53
3433.3 282.30 -457.29 783.34 369.66 -472.90 -529.64 3.0674 -418.66 -52.779 287.29 205.60
2776.6 168.92 211.27 53.999 -295.12 -132.81 -8.2881 337.59 -370.97 -132.16 -56.652 224.23
3561.9 257.91 -464.98 107.59 495.27 -480.59 -19.301 -103.26 111.12 81.230 -157.93 172.95
3784.1 14.878 139.19 315.92 -60.264 -244.49 -248.47 -249.09 291.65 -22.970 -109.26 172.91
4422.3 -234.51 507.87 -697.33 -80.449 401.96 495.21 300.16 28.434 -237.62 -157.28 -326.44
4259.1 82.945 848.92 -1627.1 -620.00 330.48 389.07 492.58 580.55 -239.64 -191.23 -46.521
2633.8 -216.80 -446.69 153.68 6.6602 315.47 -112.11 -203.00 150.28 453.65 -0.7063 -100.43
162
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
16.1.6. Matriz de datos Medias.txt para la
corriente de control yan2000.sas.
1 1 3850
1 2 3552.8
1 3 3352.8
1 4 3334.7
1 5 3762.5
1 6 4147.2
1 7 4037.5
1 8 2723.6
1 9 3638.9
1 10 3666.7
1 11 3615.3
2 1 3541.7
2 2 3750
2 3 3819.4
2 4 2847.2
2 5 4375
2 6 3819.5
2 7 4027.8
2 8 3263.9
2 9 3402.8
2 10 3680.6
2 11 4027.8
3 1 3308.3
3 2 3791.7
3 3 2327.8
3 4 2720.8
3 5 3791.7
3 6 3745.8
3 7 4037.5
3 8 3177.8
3 9 3027.8
3 10 3550
3 11 2865.3
4 1 3868.1
4 2 3254.2
4 3 3547.2
4 4 3176.4
4 5 3309.7
4 6 3263.9
4 7 4130.6
4 8 2661.1
4 9 3154.2
4 10 3691.7
4 11 3709.7
5 1 3097.9
5 2 3266
5 3 2161.1
5 4 1854.9
5 5 2993.1
5 6 3128.5
5 7 3808.3
5 8 2052.1
5 9 2418
5 10 2691
5 11 3071.6
6 1 3972.2
6 2 3375
6 3 3000
6 4 3430.5
6 5 3430.6
6 6 3902.8
6 7 4152.8
6 8 3319.4
6 9 3416.7
6 10 3375
6 11 3805.6
7 1 3951.4
7 2 4201.4
7 3 3430.6
7 4 3097.2
7 5 3888.9
7 6 3895.8
163
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
AMBIENTE GENOTIPO RENDIMIENTO
7 7 4229.2
7 8 3722.2
7 9 3534.7
7 10 3645.9
7 11 4027.8
8 1 4340.3
8 2 5208.3
8 3 3055.6
8 4 3715.3
8 5 5173.6
8 6 5277.8
8 7 5416.7
8 8 4097.2
8 9 3958.3
8 10 4236.1
8 11 4166.7
9 1 4494.5
9 2 5386.1
9 3 1962.5
9 4 3012.5
9 5 4938.9
9 6 5008.4
9 7 5445.8
9 8 4486.1
9 9 3793.1
9 10 4038.9
9 11 4283.3
10 1 2569.5
10 2 2465.3
10 3 2118.1
10 4 2013.9
10 5 3298.6
10 6 2881.9
10 7 3125
10 8 2430.6
10 9 2861.1
10 10 2604.2
10 11 2604.2
164
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
16.2. Anova y Regresión Conjunta if genotype=’local’ then delete;
RUN;
16.2.1. Corriente de control realizada por el Dr. PROC anova ;
Ignacio Romagosa para la realización del CLASS BLQ SITE GENOTYPE;
Análisis de la Varianza mixto para dos factores: MODEL YLD = SITE SITE*BLQ GENOTYPE
Genotipo como factor fijo y Ambiente como fac- SITE*GENOTYPE;
tor aleatorio. TEST H=SITE E=SITE*BLQ;
TEST H=GENOTYPE E=SITE*GENOTYPE;
* PROGRAMA ANOVA.SAS; MEANS GENOTYPE /LSD E=SITE*GENOTYPE;
options ps=80; QUIT;
DATA RAW;
INFILE ‘datcomp1.txt’;
INPUT site $ genotype $ blq yld; 16.2.2. Salida del programa ANOVA.SAS.
Analysis of Variance Procedure / Class Level Information
Class Levels Values
BLQ 3 1 2 3
Number of observations in data set = 330
Error 200 27405078.2 137025.4
Corrected Total 329 227516782.8
Tests of Hypotheses using the Anova MS for BLQ*SITE as an error term
Analysis of Variance Procedure
NOTE: This test controls the type I comparisonwise error rate not the experimentwise error rate.
Alpha= 0.05 df= 90 MSE= 439276.4 / Critical Value of T= 1.99 / Least Significant Difference= 339.98
165
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
T Grouping Mean N GENOTYPE
A 4241.1 30 7.000
A
B A 3907.2 30 6.000
B
B 3896.2 30 5.000
B
B C 3825.1 30 2.000
B C
B C 3699.4 30 1.000
B C
B C D 3617.7 30 11.000
C D
E C D 3518.0 30 10.000
E D
E D 3320.6 30 9.000
E
E F 3193.4 30 8.000
F
F 2920.4 30 4.000
F
F 2877.5 30 3.000
RUN;
* PROGRAMA JRA.SAS; PROC REG NOPRINT OUTEST=JRA;
Options ps=66 noNUMBER; BY GENOTYPE;
DATA RAW0; MODEL YLD = MSYLD;
INFILE ‘A:DATCOMP1.txt’; RUN ;
INPUT SITE $ GENOTYPE $ BLQ YLD; PROC SORT DATA=RAW;
RUN; BY GENOTYPE;
PROC SORT ; RUN;
BY SITE ; PROC MEANS NOPRINT ;
RUN; BY GENOTYPE ;
PROC MEANS NOPRINT; VAR YLD;
BY SITE; OUTPUT OUT=GENOMEAN MEAN=GENOYLD;
VAR YLD; RUN;
OUTPUT OUT=SITEMEAN MEAN=MSYLD; DATA CONVERGE;
RUN; MERGE JRA (DROP=_TYPE_ _MODEL_)
DATA RAW; GENOMEAN;
SET RAW0; BY GENOTYPE ;
IF GENOTYPE =’local’ THEN DELETE; KEEP GENOTYPE GENOYLD INTERCEP
RUN; MSYLD _RMSE_;
DATA JOINTREG; RUN;
MERGE RAW SITEMEAN; PROC PRINT;
BY SITE; VAR GENOTYPE GENOYLD INTERCEP
KEEP SITE GENOTYPE BLQ YLD MSYLD; MSYLD _RMSE_;
RUN; RUN;
PROC GLM; PROC CORR;
CLASS GENOTYPE BLQ; var GENOYLD MSYLD;
MODEL YLD = MSYLD MSYLD*BLQ QUIT;
166
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
16.2.4. Salida del programa JRA.SAS.
GENOTYPE 11 1.000 2.000 3.000 4.000 5.000 6.000 7.000 8.000 9.000
10.000 11.000
BLQ 3 1 2 3
Model 23 161227644.9 7009897.6 32.36 0.0001
Error 306 66289137.9 216631.2
Corrected Total 329 227516782.8
GENOTYPE 10 55712403.38 5571240.34 25.72 0.0001
MSYLD*GENOTYPE 10 7085682.23 708568.22 3.27 0.0005
8 6.000 3907.16 -609.12 1.27328 334.135
9 7.000 4241.11 193.11 1.14126 444.859
10 8.000 3193.40 -1109.96 1.21326 513.545
11 9.000 3320.56 606.39 0.76521 493.691
CORRELATION ANALYSIS
2 ‘VAR’ Variables: GENOYLD MSYLD
Simple Statistics
Variable N Mean Std Dev Sum
GENOYLD 11 3547 430.93852 39016
MSYLD 11 1.00000 0.28776 11.00000
Simple Statistics
Variable Minimum Maximum
Pearson Correlation Coefficients / Prob > IRI under Ho: Rho=0 / N=11
GENOYLD MSYLD
167
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
16.3. Estadísticos Paramétricos 250 NEXT I
Univariantes 260 FOR I=1 TO HA:FOR I1=1 TO K:FOR I2=1
TO R
15.3.1. PROGRAMA REALIZADO EN BASIC 270 SUM3=SUM3+ENV(I,I1,I2)
PARA EL CALCULO DE LOS SIGUIENTES 280 NEXT I2
PARAMETROS: Cuadrados Medios de la 290 CONJ(I,I1)=SUM3/R:SUM3=0
Ecovalencia (CM-W), Ecovalencia (Wi), 300 NEXT I1:NEXT I
Coeficiente de Regresión (Bi), Cuadrado Medio 310 FOR I=1 TO K:FOR I1=1 TO HA
Residual de la Regresión (SD2), Varianza 320 NIV(I1)=CONJ(I1,I)-GEN(I)-AMB(I1)+MEDIA
ambiental (SX2), Varianza de Shukla (1972) 330 SUM4=SUM4+(NIV(I1)*NIV(I1))
(SIGMA(2)), Coeficiente de determinación (R2), 340 NEXT I1
Parámetros de Eskridge (1991) (EV, FW, SH, ER) 350 ECOV (I) = SUM4: SUM4 = 0: SUME =
y el Coeficiente de Variación. SUME + ECOV (I)
355 CMWI(I)=ECOV(I)/17.3
LA MATRIZ DE ENTRADA ES UNA MATRIZ 360 NEXT I
COLUMNA, ES DECIR, LA COLUMNA DE LOS 365 LPRINT “***** CUADRADOS MEDIOS DE
RENDIMIENTOS MEDIOS DE LA MATRIZ DAT- LAS ECOVALENCIAS DE WRICKE *****”
COMP1.TXT. 366 LPRINT:LPRINT:FOR I=1 TO K
367 LPRINT “CM-W(“;I;”) = “;CMWI(I):NEXT
I:GOSUB 1160
10 HA=10:K=11:R=3:REM ***HA=Núm. de 370 REM ***** COEF. REGRESION ****
ambientes; K=Núm. genotipos 380 FOR I1=1 TO K:SUM7=0:FOR I=1 TO HA
R=Núm. de repeticiones 390 Z(I)=AMB(I)-MEDIA
20 DIM ENV (30,20,10), AMB (HA), GEN (K), 400 SUM6=SUM6+((CONJ(I,I1)-GEN(I1)-
SIGMA (K), YIM (K), R2 (K), S2X (K), SD2 (K), AMB(I)+MEDIA)*Z(I))
SEG (K), CONJ (HA,K), NIV (HA), ECOV (K), EV 410 SUM7=SUM7+(Z(I)*Z(I))
(K), FW (K), SH (K), V1I (K), VI (K), ER (K) 420 NEXT I
30 DIM Z (HA), B1 (K), B (K), SAF (K), CV (K), 430 B1(I1)=SUM6/SUM7:B(I1)=1+B1(I1)
CV1 (K), CMWI (K) 440 SUM6=0:NEXT I1
40 OPEN “A:MATCOLUM.10” AS#1 LEN=12 450 REM ***DESVIACION MEDIA CUADRATICA
50 FIELD#1,10 AS V1$ *****
60 FOR H=1 TO HA:FOR H1=1 TO K:FOR H2=1 460 FOR I=1 TO K
TO R:I=I+1 470 SEG(I)=B1(I)*B1(I):SEG(I)=SEG(I)*SUM7
70 Y=EOF(1):IF Y=-1 THEN CLOSE#1:GOTO 480 SD2(I)=ECOV(I)-SEG(I):SD2(I)=SD2(I)/(HA-
130 2)
80 GET#1,I 490 NEXT I
90 V1=VAL(V1$) 500 REM *****VARIANZA AMBIENTAL *****
100 ENV(H,H1,H2)=V1:S1=S1+V1:NEXT H2: 510 FOR I=1 TO K:FOR I1=1 TO HA
NEXT H1:NEXT H 520 SUM8 = (CONJ(I1,I)- GEN (I)): SUM9 =
110 REM ** a(amb,gen,rep)=yld*** SUM9 + (SUM8*SUM8)
120 MEDIA=S1/(HA*K*R) 530 NEXT I1
130 CLS 540 S2X(I)=((SUM9)/(HA-1)):SUM9=0
140 LOCATE 20,15:PRINT “******* ESTOY PRO- 550 NEXT I
CESANDO ********” 560 REM ***VARIANZA MEDIA ***
150 REM ****** ECOVALENCIAS ****** 570 FOR I=1 TO HA
160 FOR I=1 TO HA:FOR I1=1 TO K:FOR I2=1 580 SUM18=(AMB(I)-MEDIA): SUM19 = SUM19
TO R + (SUM18*SUM18)
170 SUM1=SUM1+ENV(I,I1,I2) 590 NEXT I:S2YMED = SUM19/(HA-1): MSE =
180 NEXT I2:NEXT I1 K*S2YMED
190 AMB(I)=SUM1/(K*R):SUM1=0 600 MSGE=3*SUME/((K-1)*(HA-1)): SIG2E =
200 NEXT I (MSE-MSGE)/K
210 FOR I=1 TO K:FOR I1=1 TO HA:FOR I2=1 610 REM **** COEF. DETERMINACION PINT-
TO R HUS *****
220 SUM2=SUM2+ENV(I1,I,I2) 620 FOR I=1 TO K
230 NEXT I2:NEXT I1 630 R2(I)=SD2(I)/S2X(I)
240 GEN(I)=SUM2/(HA*R):SUM2=0 640 R2(I)=1-R2(I)
168
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
650 NEXT I 1060 LPRINT:LPRINT
660 REM *** VARIANZA DE ESTABILIDAD **** 1070 FOR I=1 TO K
670 PA=(HA-1)*(K-2):PA=K/PA:PE=(K-2)*(HA- 1080 LPRINT I;EV(I);FW(I);SH(I);ER(I);GEN(I)
1)*(K-1) 1090 NEXT I
680 FOR I=1 TO K 1100 GOSUB 1160
690 SIGMA(I)=PA*ECOV(I)-(SUME/PE):NEXT I 1110 REM ***********PRINTEO DEL CV.
700 REM *********** COEFICIENTE DE VARIA- ******************
CION ****************** 1120 LPRINT:LPRINT:FOR I=1 TO K
710 FOR I=1 TO K 1130 LPRINT “COEF. DE VARIAC. GENOTIPO
720 CV1(I)=S2X(I)^.5 (“;I;”) =”;CV(I)
730 CV(I)=(CV1(I)/GEN(I))*100 1140 NEXT I
740 NEXT I 1150 END
750 REM ***** DETERMINACION ESTADISTI- 1160 PRINT “PULSE TECLA”:WHILE
COS “SAFETY-FIRTS” INKEY$=””:WEND:RETURN
760 REM *****VARIANZA AMBIENTAL**** 1170 REM ****RUTINA SAFETY ****
770 FOR I=1 TO K 1180 FOR I=1 TO K
780 YIM(I)=GEN(I):VI(I)=S2X(I) 1190 ZA=1.645
790 NEXT I 1200 SAF(I)=YIM(I)-(ZA*VI(I)^.5)
800 GOSUB 1170:FOR I=1 TO K: EV(I) = SAF (I): 1210 NEXT I:RETURN
NEXT I
810 REM *****COEF. REGRESION *****
820 FOR I=1 TO K 16.3.2. Corriente de control, para el paquete
830 CSTE = (1-(1/HA)): V1I(I) = CSTE*S2YMED estadístico SAS, realizada por el Dr. Ignacio
*B1(I)^2:VI(I)=V1I(I):NEXT I Romagosa para el cálculo del índice de
840 GOSUB 1170:FOR I=1 TO K: FW(I) = SAF(I): Superioridad de Lin y Binns.
NEXT I
850 REM *****VAR. SHUKLA ******** * PROGRAMA SUPINDEX.SAS;
860 FOR I=1 TO K:VI(I)=SIG2E+SIGMA(I):NEXT I options ps=80;
870 GOSUB 1170:FOR I=1 TO K: SH(I) = SAF(I): DATA RAW;
NEXT I INFILE ‘DATCOMP1.TXT’;
880 REM *** DESV. CUADRATICA ******** INPUT SITE $ GENOTYPE $ BLQ YLD;
890 FOR I=1 TO K RUN;
900 VI(I)=V1I(I)+SD2(I):NEXT I PROC SORT;
910 GOSUB 1170:FOR I=1 TO BY SITE GENOTYPE;
K:ER(I)=SAF(I):NEXT I RUN;
920 REM ***** SALIDAS POR PANTALLA O PROC MEANS NOPRINT;
IMPRESORA ****** BY SITE GENOTYPE;
930 CLS VAR YLD;
940 PRINT “SS(GE) = “;3*SUME:PRINT “SY =”; OUTPUT OUT=SITEGENO MEAN = YLD;
S2YMED RUN;
950 PRINT “SIGMA}e = “;SIG2E PROC MEANS NOPRINT DATA=SITEGENO;
960 GOSUB 1160 BY SITE ;
970 LPRINT “GEN. Wi Bi SD2 SX2 SIGMA(2) VAR YLD;
MED R2” OUTPUT OUT=MAXYIELD MAX = MAXYLD;
980 LPRINT “======================= RUN;
=========== ===============” DATA RAW2;
990 LPRINT:LPRINT MERGE SITEGENO MAXYIELD;
1000 FOR I=1 TO K BY SITE;
1010 LPRINT I; ECOV(I); B(I);SD2(I); S2X(I); P1= MAXYLD - YLD;
SIGMA(I); GEN(I); R2(I) RUN;
1020 NEXT I PROC SORT;
1030 GOSUB 1160 BY GENOTYPE;
1040 LPRINT:LPRINT:LPRINT “GEN. EV FW RUN;
SH ER MED “ PROC MEANS NOPRINT DATA=RAW2 MEAN
1050 LPRINT “======================= STD uss;
=========== =======” BY GENOTYPE;
169
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
VAR YLD P1; by p1;
OUTPUT OUT=SUPINDEX MEAN = YLD X STD run;
= STDYLD Y USS = Z P1; PROC PRINT DATA=SUPINDEX;
RUN; VAR GENOTYPE YLD STDYLD P1;
proc corr; QUIT;
var yld stdyld p1;
run;
proc sort; 16.3.2.1. Salida del programa SUPINDEX.SAS.
Simple Statistics
Variable N Mean Std Dev Sum
YLD 11 3547 430.93852 39016
STDYLD 11 659.98864 126.09271 7260
P1 11 9125902 832201 100384922
Simple Statistics
Variable Minimum Maximum
Pearson Correlation Coefficients / Prob > IRI under Ho: Rho=0 / N=11
YLD STDYLD P1
OBS GENOTYPE YLD STDYLD P1
11 3.000 2877.50 678.528 27985208.55
120
10 HA=10:K=11:R=3 70 GET#1,I
20 DIM ENV(30,20,10), AMB(HA), GEN(K), 80 V1=VAL(V1$)
S2GL(K), SLGL(K), GL(K,HA), EXIL(HA), 90 ENV(H,H1,H2)=V1:S1=S1+V1:NEXT H2:
ALFA(K), LAMBDA(K), Y(K,HA) NEXT H1:NEXT H
25 REM ***** LA MATRIZ DE ENTRADA ES UNA 100 REM ** a(amb,gen,rep)=yld***
170
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
110 MEDIA=S1/(HA*K*R) LAMBDA ******
120 CLS 20 DIM AL FA(200),LAMBDA(200)
130 FOR I=1 TO K 25 REM ***** MSL, MSB, MSE SON RECOGIDOS
140 FOR I2=1 TO HA:FOR I3=1 TO R DEL ANOVA *****
150 SUM1=SUM1+ENV(I2,I,I3) 30 MSL=10458521.9#
160 NEXT I3:NEXT I2 40 MSB=536886.2
170 GEN(I) = SUM1: GEN(I) = (GEN(I)/(HA*R)): 50 MSE=137025.4#
SUM1=0 60 T80=1.397:T90=1.86:T95=2.306: REM ***
180 NEXT I VALOR DE t SEGUN EL NIVEL
190 FOR H=1 TO HA DE PROBABILIDAD **********
200 FOR H2=1 TO K:FOR H3=1 TO R 70 M1=10:N2=8
210 SUM2 =SUM2+ENV(H,H2,H3) 80 NUM1=M1*MSE*MSL:K=1!:H=2
220 NEXT H3:NEXT H2 90 DEN1=MSL-MSB: DEN2 = N2*MSL: DEN31 =
230 AMB(H)=(SUM2/(K*R)):EXIL(H)=AMB(H)- ((T80*T80)+N2)*MSB:
MEDIA:SUM2=0 DEN32=((T90*T90)+N2)*MSB
240 NEXT H 100 DEN33=((T95*T95)+N2)*MSB
250 FOR I=1 TO K 105 OPEN “A:CURVA95.TXT” FOR OUTPUT
260 FOR I1=1 TO HA AS#1
270 FOR I3=1 TO R 110 FOR I=0! TO 7 STEP .2
280 SUM3=SUM3+ENV(I1,I,I3) 120 NUM2=I*NUM1:DENOT=(DEN1*(DEN2-
290 NEXT I3 DEN33)):ALF=(NUM2/DENOT)^.5
300 Y(I,I1)=SUM3/(R):SUM3=0 130 ALFA(I)=K*T95*ALF
310 NEXT I1:NEXT I 132 PRINT#1, USING “####.#####”;I,ALFA(I)
320 FOR I=1 TO HA:FOR H=1 TO K 140 NEXT I
330 GL(H,I)=Y(H,I)-GEN(H)-AMB(I) + MEDIA: 145 IF H=2 THEN K=(-1):H=3:GOTO 110
NEXT H:NEXT I 147 CLOSE#1
340 MSL=10458521.9# 200 END
350 MSB=536886.2
360 MSE=137025.4 El fichero CURVA95.TXT generado puede ser
370 FOR I=1 TO K:FOR H=1 TO HA introducido en un programa de diseño de gráfi-
380 SLGL(I)=SLGL(I)+EXIL(H)*GL(I,H): cos como el Harvard Graphics para la represen-
S2GL(I)=S2GL(I)+GL(I,H)*GL(I,H):NEXT H tación de las curvas de confianza del parámetro
390 SLGL(I) = SLGL(I) / 19: DENO = MSL-MSB: α.
DENO = DENO/(K*R)
400 ALFA(I)=SLGL(I)/DENO
410 NUM1 = ALFA(I) * SLGL(I): NUM1 = (S2GL 16.5. Estadísticos univariantes
(I)/19)- NUM1 No-paramétricos
420 DENO2 = 14*MSE/(K*R): LAMBDA(I) =
NUM1/DENO2:NEXT I 16.5.1. Programa en lenguaje SAS para la obten-
430 LPRINT “RESULTADOS DEL PROGRAMA ción del fichero texto que contiene las ordena-
DE TAI (1971) “ ciones de los genotipos en los distintos ambien-
440 LPRINT “ “ tes.
450 LPRINT “ GENOTIPO MEDIA
ALFA LAMBDA “ * PROGRAMA RANG.SAS;
460 FOR I=1 TO K OPTIONS PS=80 NONUMBER;
470 LPRINT USING “#######.######”; I, DATA RAW;
GEN(I), ALFA(I), LAMBDA(I): NEXT I INFILE ‘DATMED.TXT’;
480 END * DATMED.TXT ES UN FICHERO DE MEDIAS,
490 PRINT “PULSE TECLA”:WHILE INKEY$ = SIN REPETICIONES;
””:WEND:RETURN INPUT SITE $ GENOTYPE $ YLD;
RUN;
PROC SORT;
16.4.2. Programa en BASIC para generar las cur- BY SITE GENOTYPE;
vas de confianza para el parámetro α. RUN;
PROC RANK DESCENDING OUT = RGE TIES =
10 REM ***** PROGRAMA PARA CURVA ALFA- MEAN;
171
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
BY SITE; PROC PRINT DATA=RANG.TXT;
RANKS RYLD; VAR SITE GENOTYPE RYLD;
VAR YLD; RUN;
RUN;
PROC SORT;
BY GENOTYPE; 16.5.2. Salida del programa RANG.SAS.
RUN;
AMB.
1.0000
1.0000
GEN.
1.0000
2.0000
RANGO
3.0000
8.0000
1.0000 3.0000 9.0000
1.0000 4.0000 10.000
1.0000 5.0000 4.0000
1.0000 6.0000 1.0000
1.0000 7.0000 2.0000
1.0000 8.0000 11.000
1.0000 9.0000 6.0000
1.0000 10.000 5.0000
1.0000 11.000 7.0000
2.0000 1.0000 8.0000
2.0000 2.0000 6.0000
2.0000 3.0000 5.0000
2.0000 4.0000 11.000
2.0000 5.0000 1.0000
2.0000 6.0000 4.0000
2.0000 7.0000 2.5000
2.0000 8.0000 10.000
2.0000 9.0000 9.0000
2.0000 10.000 7.0000
2.0000 11.000 2.5000
3.0000 1.0000 6.0000
3.0000 2.0000 2.5000
3.0000 3.0000 11.000
3.0000 4.0000 10.000
3.0000 5.0000 2.5000
3.0000 6.0000 4.0000
3.0000 7.0000 1.0000
3.0000 8.0000 7.0000
3.0000 9.0000 8.0000
3.0000 10.000 5.0000
3.0000 11.000 9.0000
4.0000 1.0000 2.0000
4.0000 2.0000 8.0000
4.0000 3.0000 5.0000
4.0000 4.0000 9.0000
4.0000 5.0000 6.0000
4.0000 6.0000 7.0000
4.0000 7.0000 1.0000
4.0000 8.0000 11.000
4.0000 9.0000 10.000
4.0000 10.000 4.0000
4.0000 11.000 3.0000
5.0000 1.0000 4.0000
5.0000 2.0000 2.0000
5.0000 3.0000 9.0000
5.0000 4.0000 11.000
5.0000 5.0000 6.0000
5.0000 6.0000 3.0000
5.0000 7.0000 1.0000
5.0000 8.0000 10.000
5.0000 9.0000 8.0000
5.0000 10.000 7.0000
5.0000 11.000 5.0000
6.0000 1.0000 2.0000
6.0000 2.0000 8.0000
6.0000 3.0000 11.000
6.0000 4.0000 6.0000
6.0000 5.0000 5.0000
6.0000 6.0000 3.0000
6.0000 7.0000 1.0000
6.0000 8.0000 10.000
6.0000 9.0000 7.0000
6.0000 10.000 9.0000
(Continúa)
172
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
AMB. GEN. RANGO
7.0000 9.0000 9.0000
7.0000 10.000 8.0000
7.0000 11.000 3.0000
8.0000 1.0000 5.0000
8.0000 2.0000 3.0000
8.0000 3.0000 11.000
8.0000 4.0000 10.000
8.0000 5.0000 4.0000
8.0000 6.0000 2.0000
8.0000 7.0000 1.0000
8.0000 8.0000 8.0000
8.0000 9.0000 9.0000
8.0000 10.000 6.0000
8.0000 11.000 7.0000
9.0000 1.0000 5.0000
9.0000 2.0000 2.0000
9.0000 3.0000 11.000
9.0000 4.0000 10.000
9.0000 5.0000 4.0000
9.0000 6.0000 3.0000
9.0000 7.0000 1.0000
9.0000 8.0000 6.0000
9.0000 9.0000 9.0000
9.0000 10.000 8.0000
9.0000 11.000 7.0000
10.000 1.0000 7.0000
10.000 2.0000 8.0000
10.000 3.0000 10.000
10.000 4.0000 11.000
10.000 5.0000 1.0000
10.000 6.0000 3.0000
10.000 7.0000 2.0000
10.000 8.0000 9.0000
10.000 9.0000 4.0000
10.000 10.000 5.5000
10.000 11.000 5.5000
(Conclusión)
20 K=11:HA=10 COS *****
30 REM ***** K=NUM. DE GENOTIPOS; HA= 150 REM ****** S(1) ******
NUM. DE AMBIENTES **** 160 AMB1=HA*(HA-1):AMB=2/AMB1
35 DIM R(K,HA), S1(K), S2(K), S3(K), INRME(K), 170 FOR I=1 TO K
RME(K), Z1(K), Z2(K), S6(K) 180 FOR H=1 TO HA-1
37 OPEN “A:RANG.TXT” AS#1 LEN=12: REM *** 190 FOR J=H+1 TO HA
RANG.TXT= FICHERO TEXTO 200 RG=R(I,H)-R(I,J)
QUE CONTIENE LAS ORDENACIONES DE 210 RG1=ABS(RG)
CADA GENOTIPO EN CADA AMBIENTE 220 SUM=SUM+RG1
40 FIELD#1,10 AS V1$ 230 NEXT J
50 FOR I=1 TO HA 240 SUM1=SUM1+SUM:SUM=0
60 FOR H=1 TO K 250 NEXT H
70 Z=Z+1 260 S1(I)=SUM1*AMB:SUM=0:SUM1=0
80 Y=EOF(1):IF Y=-1 THEN CLOSE#1:GOTO 140 270 NEXT I
173
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
280 REM ********* S(2) Y S(3) ****** 790 LPRINT “S1 = “;SUM7,”S2 = “;SUM8
290 FOR I=1 TO K:FOR H=1 TO HA 800 END
300 SUM2=SUM2+R(I,H)
310 NEXT H
320 RME(I)=SUM2/(HA): INRME(I)=15-RME(I): 16.5.4. Corriente de control realizada por el Dr.
SUM2=0 Ignacio Romagosa para la obtención de las grá-
330 NEXT I ficas de Ketata.
340 FOR I=1 TO K
350 FOR H=1 TO HA * PROGRAMA KETATA.SAS;
360 CUA=R(I,H)-RME(I) options ps=80 NONUMBER;
370 CUA2=CUA*CUA DATA RAW;
380 SUM3=SUM3+CUA2 INFILE ‘DATCOMP1.TXT’;
390 NEXT H INPUT SITE $ GENOTYPE $ BLQ YLD;
400 S2(I)=SUM3/(HA-1) RUN;
405 S3(I)=SUM3/INRME(I):SUM3=0 PROC SORT ;
410 NEXT I BY SITE GENOTYPE;
420 REM ****** S(6) ******** RUN;
430 FOR I=1 TO K PROC MEANS NOPRINT;
440 FOR J=1 TO HA BY SITE;
450 DQ=R(I,J)-RME(I) VAR YLD;
460 DQ1=ABS(DQ) OUTPUT OUT=SITEMEAN MEAN =MYLDG;
480 SUM4=SUM4+DQ1 RUN;
490 NEXT J DATA RAW2;
500 S6(I)=SUM4/INRME(I):SUM4=0 MERGE RAW SITEMEAN;
510 NEXT I BY SITE;
550 REM ******* ESTADISTICOS ******* RUN;
560 REM ****** ZM(I) ******** PROC MEANS NOPRINT;
570 K2=K*K:ES1=(K2-1)/(3*K) BY SITE GENOTYPE;
580 ES2=(K2-1)/12 VAR YLD;
590 VS1=K2-1:VSS1=((K2-4)*(HA+3))+30 OUTPUT OUT=MGE MEAN =MYLD;
600 VSS2=K2*45*HA*(HA-1) RUN;
610 VS1=VS1*VSS1/VSS2 proc rank descending out=rge ties=mean;
620 V21S=K2-1: V22S=(K2-4)*(HA-1)*2: V23S= by site ;
(K2-1)*5 ranks ryld;
630 V24S=360*HA*(HA-1) var myld;
640 VS2=V21S*(V22S+V23S)/V24S run;
650 FOR I=1 TO K proc sort;
660 Z11=S1(I)-ES1 by genotype;
670 Z12=Z11*Z11 run;
680 Z1(I)=Z12/VS1 proc means noprint;
690 Z22=S2(I)-ES2 by genotype ;
700 Z23=Z22*Z22 var myld ryld;
710 Z2(I)=Z23/VS2 output out=pge mean=myld mryld std=syld
720 SUM7=SUM7+Z1(I) sryld;
730 SUM8=SUM8+Z2(I) run;
740 NEXT I proc print data=pge ;
750 LPRINT “ GEN. S1(I) S2(I) Z1(I) Z2(I) var genotype myld syld mryld sryld;
S3(I) S6(I) “ run;
760 FOR I=1 TO K proc plot;
770 LPRINT USING plot syld*myld = genotype;
“####.#####”;I;S1(I);S2(I);Z1(I);Z2(I);S3(I);S6(I) plot sryld*mryld = genotype;
780 NEXT I quit;
174
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
16.5.4.1. Salida del programa KETATA.SAS.
4 11.000 3617.71 578.907 5.30 2.17562
5 1.000 3699.38 581.971 4.60 2.01108
6 2.000 3825.07 898.333 4.95 2.87180
7 3.000 2877.50 678.528 9.20 2.34758
8 4.000 2920.35 593.609 9.90 1.52388
9 5.000 3896.25 723.460 3.95 1.92137
10 6.000 3907.16 764.045 3.50 1.64992
11 7.000 4241.11 700.386 1.35 0.57975
denadas genotípicas y ambientales para los tres BY GENOTYPE;
primeros ejes del análisis AMMI. VAR YLD;
OUTPUT OUT=GENOMEAN MEAN=MYLDG;
* PROGRAMA AMMI.SAS; RUN;
options ps=80; data varname;
DATA RAW; I=1;
INFILE ‘A:DATCOMP1.TXT’; DO WHILE(LAST=0);
INPUT SITE $ GENOTYPE $ BLQ YLD; set genomean END=LAST;
RUN; numvar=I;
PROC SORT ; if i<10 then varn=’var’||’0’||I;
BY SITE; if i> 9 then varn=’var’||I;
RUN; VARNUM =COMPRESS(VARN);
PROC MEANS NOPRINT; keep numvar varnum genotype myldg;
BY SITE; output;
VAR YLD; I=I+1;
OUTPUT OUT=SITEMEAN MEAN=MYLDS; END;
RUN; run;
data sitename; data rawrecod;
I=1; merge recoding varname;
DO WHILE(LAST=0); by genotype;
set sitemean END=LAST; keep numsite numvar varnum yld ;
numsite = I; run;
keep numsite site mylds; PROC anova OUTSTAT=OUTSS;
output; CLASS NUMSITE NUMVAR ;
I=I+1; MODEL YLD = NUMSITE NUMVAR NUMSI-
END; TE*NUMVAR;
run; RUN;
data recoding; * PARA OBTENER LA SUMA DE CUADRADOS
merge raw sitename; DE GxE;
by site; DATA SSGxE;
keep numsite genotype yld; SET OUTSS;
175
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
IF _SOURCE_ = ‘NUMSITE*NUMVAR’; * CALCULO DE LA SUMA DE CUADRADOS DE
SSGE = SS; AMMI1 ;
KEEP SSGE; DATA AMMISS;
RUN; b = 3; * num reps;
PROC SORT data=rawrecod; n =11; * NUM VAR;
BY NUMSITE VARNUM; m =10; * NUM LOC;
RUN; MERGE EIGEN SSGxE;
PROC MEANS NOPRINT; DO I=1 TO n+m;
BY NUMSITE VARNUM; SSAMMI1 = EIGEN1*SSGE/b;
VAR YLD; SSAMMI2 = EIGEN2*SSGE/b;
OUTPUT OUT=SITEGENO MEAN=YLD; SSAMMI3 = EIGEN3*SSGE/b;
RUN; KEEP SSAMMI1-SSAMMI3;
PROC GLM DATA=SITEGENO NOPRINT; OUTPUT;
CLASS NUMSITE VARNUM ; END;
MODEL YLD = NUMSITE VARNUM; RUN;
OUTPUT OUT=OUTRES R=RESID; DATA PCAGS;
RUN; SET PCAGENO PCASITE;
DATA AMMI01; RUN;
SET OUTRES; DATA PCA13;
KEEP NUMSITE VARNUM RESID; MERGE PCAGS AMMISS;
RUN; IF ID= ‘GENOTYPE’ THEN DO;
PROC TRANSPOSE; num = numvar;
BY NUMSITE; PCA1 = -PCA1*(SSAMMI1**.25);
ID VARNUM; PCA2 = -PCA2*(SSAMMI2**.25);
RUN; PCA3 = -PCA3*(SSAMMI3**.25);
PROC PRINCOMP COV PREFIX=PCA OUTPUT;
OUT=OUT1 OUTSTAT=OUT2 NOPRINT; END;
VAR VAR01-VAR11; * num variedades IF ID= ‘SITE’ THEN DO;
RUN; num = numsite;
PROC TRANSPOSE DATA=OUT2 OUT=OUT3; PCA1 = -PCA1/(SSAMMI1**.25);
RUN; PCA2 = -PCA2/(SSAMMI2**.25);
*PARA OBTENER LOS EIGENVELUES; PCA3 = -PCA3/(SSAMMI3**.25);
DATA EIGEN; OUTPUT;
SET OUT2; END;
IF _TYPE_ = ‘EIGENVAL’; KEEP ID num numvar numsite YLD PCA1-
TOTAL = SUM(OF VAR01-VAR11); * 11 ES EL PCA3;
NUMERO DE VARIEDADES; RUN;
EIGEN1 = VAR01/TOTAL; proc sort;
EIGEN2 = VAR02/TOTAL; by numvar;
EIGEN3 = VAR03/TOTAL; run;
KEEP EIGEN1-EIGEN3; data PCAGNAME;
RUN; merge pca13 varname;
PROC PRINT; by numvar;
RUN; run;
DATA PCAGENO; proc sort;
MERGE VARNAME OUT3; by numsite;
YLD = MYLDG; run;
ID = ‘GENOTYPE’; data PCASNAME;
KEEP _NAME_ ID numvar YLD PCA1-PCA3; merge PCAGNAME sitename;
RUN; by numsite;
DATA PCASITE; keep site genotype yld pca1-pca3;
MERGE SITENAME OUT1 ; run;
YLD = MYLDS; proc print;
ID = ‘SITE’; var site genotype yld pca1-pca3;
KEEP _NAME_ ID numsite YLD PCA1-PCA3; run;
RUN;
176
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
16.6.1.1. Salida del programa AMMI.SAS.
NUMSITE 10 1 2 3 4 5 6 7 8 9 10
NUMVAR 11 1 2 3 4 5 6 7 8 9 10 11
Error 220 38142802.3 173376.4
Corrected Total 329 227516782.8
NUMSITE 9 94126697.43 10458521.94 60.32 0.0001
NUMVAR 10 55712403.38 5571240.34 32.13 0.0001
NUMSITE*NUMVAR 90 39534879.71 439276.44 2.53 0.0001
OBS SITE GENOTYPE YLD PCA1 PCA2 PCA3
11 • 11 3617.71 -7.2285 5.4793 15.5994
12 1 • 3607.44 -13.5129 3.3579 -11.3628
13 2 • 3686.88 -12.8966 -19.9734 13.6269
14 3 • 3304.04 8.4802 -5.1697 -10.2307
15 4 • 3433.34 -22.4565 12.7635 5.0229
16 5 • 2776.58 1.1942 9.5041 15.4644
17 6 • 3561.86 -9.6812 14.1253 -10.9673
18 7 • 3784.10 -4.8110 -0.8982 9.0582
19 8 • 4422.35 20.2378 -3.3857 -5.0709
20 9 • 4259.10 38.9322 5.6555 4.7934
21 10 • 2633.84 -5.4862 -15.9793 -10.3340
177
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
16.6.2. Programa en BASIC para la obtención de 340 NEXT M
los modelos con dos (A) o tres (B) repeticiones 350 VALI(I,H)=ENV(I,H,M)
totalmente al azar para el cálculo del estadístico 360 G=0:NEXT H:NEXT I
RMS PD. 370 OPEN “A:MODEL1.TXT” FOR OUTPUT AS#2
380 FOR I=1 TO HA:FOR H=1 TO K:FOR R=1 TO
2
PROGRAMA A: 390 PRINT#2, USING “######.####”;I,H,R,ENV-
10 REM ****PROGRAMA PARA LA OBTENCION REP(I,H,R)
DE LOS ********* 400 NEXT R:NEXT H:NEXT I
20 REM ****** MODELOS DE DOS REPETICIO- 410 CLOSE#2
NES ************ 420 OPEN “A:VAL1.TXT” FOR OUTPUT AS#3
30 REM ******** TOTALMENTE AL AZAR PARA 430 FOR I=1 TO HA:FOR H=1 TO K:PRINT#3,
EL *********** VALI(I,H):NEXT H:NEXT I
40 REM ****** CALCULO DEL ESTADISTICO 440 END
RMS PD ********* 450 PRINT “PULSA UNA TECLA *********”:WHILE
45 REM ** LA MATRIZ DE ENTRADA ES UNA INKEY$=””:WEND:RETURN
MATRIZ COLUMNA *
50 CLS
60 RANDOMIZE TIMER PROGRAMA B:
70 FOR W=1 TO 5
80 FG=INT((3000*RND(1))+1000):SOUND 10 REM ***********PROGRAMA PARA LA
FG,.5:NEXT W OBTENCION DE ************
90 LOCATE 15,15:PRINT “******** BIENVENIDO 20 REM ******** LOS 10 MODELOS DE TRES
AL PROGRAMA RMS PD **********” REPETICIONES ********
100 PRINT 25 REM *************** TOTALMENTE AL AZAR
110 LOCATE 17,22:PRINT “Autor, 1991: FER- ******************
NANDO FLORES GIL “ 30 REM ********** NECESARIOS PARA EL CAL-
120 FOR O=1 TO 7:PRINT:NEXT CULO DEL ***********
O:PRINT:GOSUB 450 40 REM **************** ESTADISTICO RMS PD
130 CLS *****************
140 HA=10:K=11:R=3 50 REM ***** LA MATRIZ DE ENTRADA ES UNA
145 DIM MATRIZ COLUMNA ****
ENV(HA,K,R),ENVREP(HA,K,R),VALI(HA,K) 60 CLS
150 OPEN “A:MATCOLUM.10” AS#1 LEN=12 70 RANDOMIZE TIMER
160 FIELD#1,10 AS V1$ 80 FOR W=1 TO 5
170 FOR H=1 TO HA:FOR H1=1 TO K:FOR H2=1 90 FG=INT ((3000*RND(1)) + 1000): SOUND
TO R:I=I+1 FG,.5: NEXT W
180 Y=EOF(1):IF Y=-1 THEN CLOSE#1:GOTO 100 LOCATE 15,15:PRINT “******** BIENVENIDO
220 AL PROGRAMA RMS PD **********”
190 GET#1,I 110 PRINT
200 V1=VAL(V1$) 120 LOCATE 17,22:PRINT “Autor, 1991: FER-
210 ENV(H,H1,H2)=V1:S1=S1+V1:NEXT NANDO FLORES GIL “
H2:NEXT H1:NEXT H 130 FOR O=1 TO 7:PRINT:NEXT
220 REM *****A(AMB,GEN,REP)=YLD ***** O:PRINT:GOSUB 470
230 MEDIA=S1/(HA*K*R):DIM REP(HA*K*R) 140 CLS
240 REP(0)=0 150 HA=17:K=11:R=4
250 FOR I=1 TO HA:FOR H=1 TO K 160 DIM ENV (HA,K,R), ENVREP (HA,K,R), VALI
260 V=V+1 (HA,K)
270 J=J+1:G=G+1 170 OPEN “a:columna.10” AS#1 LEN=12
280 IF G=3 THEN 320 180 FIELD#1,10 AS V1$
290 REP(J)=INT(3*RND(1))+1 190 FOR H=1 TO HA:FOR H1=1 TO K:FOR H2=1
300 IF REP(J)=REP(J-1) THEN 290 TO R:I=I+1
310 ENVREP(I,H,G)=ENV(I,H,REP(J)):GOTO 270 200 Y=EOF(1):IF Y=-1 THEN CLOSE#1:GOTO
320 FOR M=1 TO 3 240
330 IF M=REP(J-1) OR M=REP(J-2) THEN 340 210 GET#1,I
ELSE 350 220 V1=VAL(V1$)
178
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
230 ENV (H,H1,H2) = V1: S1 = S1+V1: NEXT H2: 50 CLS
NEXT H1:NEXT H 60 RANDOMIZE TIMER
240 REM *****A(AMB,GEN,REP)=YLD ***** 70 FOR W=1 TO 5
250 MEDIA=S1/(HA*K*R):DIM REP((20)*K*R) 80 FG = INT ((3000*RND(1)) + 1000): SOUND
260 FOR I=1 TO HA:FOR H=1 TO K FG,.5: NEXT W
270 GOSUB 480 90 FOR I=1 TO 10:PRINT:NEXT I:I=0:PRINT “
280 ENVREP(I,H,J)=ENV(I,H,REP(J)) ******** BIENVENIDO AL PROGRAMA A M M I
290 GOSUB 480:IF J=5 THEN 340 **********”
300 FOR M=1 TO J-1 100 PRINT
310 IF REP(M)=REP(J) THEN J=J-1:GOTO 290 110 PRINT “ Autor, 1991: FER-
320 NEXT M NANDO FLORES GIL “
330 ENVREP(I,H,J)=ENV(I,H,REP(J)):GOTO 290 120 FOR O=1 TO 7:PRINT:NEXT
340 NEXT H:NEXT I O:PRINT:GOSUB 1630
350 LOCATE 17,22:PRINT “ ESTOY GRA- 130 CLS
BANDO “ 140 INPUT “NUMERO DEL MODELO “;NUM
360 OPEN “A:MODEL1.TXT” FOR OUTPUT AS#2 150 LPRINT:LPRINT:LPRINT:LPRINT “***********
370 FOR I=1 TO HA:FOR H=1 TO K:FOR R=1 TO MODELO A M M I Num. “;NUM
2 160 HA=17:K=11:R=2:N=HA*K*R
380 PRINT#2, USING “######.####”;I,H,R,ENV- 170 DIM SU(K): DIM SU2 (HA), LAMBDA (12),
REP(I,H,R) VG (K,12)
390 NEXT R:NEXT H:NEXT I 180 DIM INT1 (HA,K), ENV (HA,K,R), VA (HA,12),
400 CLOSE#2 COOGEN (K,12)
410 FOR I=1 TO HA:FOR H=1 TO K 190 DIM L (HA), L2 (HA), COOAM (HA,12),
420 VALI (I,H) = (ENVREP (I,H,3) + ENVREP RENDG (K), RENDAM (HA)
(I,H,4))/2 200 INPUT “NOMBRE DEL FICHERO DE DATOS
430 NEXT H:NEXT I “;FIC$
440 OPEN “A:VAL1.TXT” FOR OUTPUT AS#3 210 OPEN FIC$ AS#1 LEN=46
450 FOR I=1 TO HA:FOR H=1 TO K:PRINT#3, 220 FIELD#1,11 AS V4$,11 AS V3$,11 AS V2$,11
VALI(I,H):NEXT H:NEXT I AS V1$
460 CLS:END 230 FOR H1=1 TO HA:FOR H2=1 TO K
470 PRINT “PULSA UNA TECLA *********”:WHILE 240 FOR H3=1 TO R
INKEY$=””:WEND:RETURN 250 I=I+1
480 IF J=5 THEN FOR J=1 TO 4:REP(J)=0:NEXT 260 GET#1,I
J:J=1:REP(J)=INT(4*RND(1))+1 :RETURN 270 Y=EOF(1):IF Y=-1 THEN CLOSE#1:GOTO
490 J=J+1:REP(J)=INT(4*RND(1))+1:RETURN 310
280 V1=VAL(V1$)
290 ENV (H1,H2,H3) = V1: S1 = S1 + V1: S2 = S2
16.6.3.- Programa en BASIC con el cual obtene- + (V1*V1)
mos el análisis de la varianza y partición de la 300 NEXT H3:NEXT H2:NEXT H1
suma de cuadrados de la interacción GxE en las 310 FC=S1*S1:FC=FC/N:MEDIA=S1/N
correspondientes a los diez ejes del ACP. 320 REM ***GENOTIPOS ***
También se obtienen las coordenadas genotípi- 330 FOR I=1 TO K
cas y ambientales del análisis AMMI previa intro- 340 SUM=0
ducción de los ficheros texto que contienen los 350 FOR I2=1 TO HA:FOR I3=1 TO R
vectores propios unitarios genotípicos y ambien- 360 SUM=SUM+ENV(I2,I,I3)
tales resultantes del ACP realizado con el 370 NEXT I3:NEXT I2
NTSYS. 380 RENDG(I)=SUM/(HA*R)
390 SU(I)=SUM*SUM
10 REM ****PROGRAMA DEL ANALISIS DE LA 400 ZU=ZU+SU(I)
VARIANZA ***** 410 NEXT I
20 REM *********** TRIPLE FACTORIAL 420 GEN1=HA*R:GEN=ZU/GEN1:GENO=GEN-
***************** FC:REM ***S.C. DE GENOTIPOS
30 REM ******** Y CALCULO DE LAS COORDE- 430 REM **** MACROAMBIENTES ****
NADAS ******** 440 FOR I=1 TO HA
40 REM ****** PARA EL MODELO AMMI 450 SUM2=0
******************** 460 FOR I2=1 TO K:FOR I3=1 TO R
179
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
470 SUM2=SUM2+ENV(I,I2,I3) = VAL(VG6$)
480 NEXT I3:NEXT I2 800 VG7 = VAL(VG7$): VG8 = VAL(VG8$): VG9
490 RENDAM(I)=SUM2/(K*R) = VAL(VG9$)
500 SU2(I)=SUM2*SUM2 810 VG10=VAL(VG10$)
510 ZU2=ZU2+SU2(I) 820 VG(I,1)=VG1:VG(I,2)=VG2:VG(I,3)=VG3
520 NEXT I 830 VG(I,4)=VG4:VG(I,5)=VG5:VG(I,6)=VG6
530 LOC1 = K*R: LOC2 = ZU2/LOC1: LOCAL = 840 VG(I,7)=VG7:VG(I,8)=VG8:VG(I,9)=VG9
LOC2-FC: REM **SC LOCAL 850 VG(I,10)=VG10
540 REM *** INTERACCION MACRO*GEN **** 860 NEXT I
550 FOR I=1 TO HA:FOR I1=1 TO K 870 OPEN AM$ AS#3 LEN=132
560 SUM4=0 880 FIELD#3,13 AS VA1$,13 AS VA2$,13 AS
570 FOR I3=1 TO R VA3$,13 AS VA4$,13 AS VA5$,13 AS VA6$,13
580 SUM4=SUM4+ENV(I,I1,I3) AS VA7$,13 AS VA8$,13 AS VA9$,13 AS VA10$
590 NEXT I3 890 FOR I=1 TO HA
600 INT1(I,I1)=SUM4*SUM4 900 GET#3,I
610 ZU4=ZU4+INT1(I,I1) 910 Y3=EOF(3):IF Y3=-1 THEN CLOSE#3:GOTO
620 NEXT I1:NEXT I 1010
630 LV1 = R: LV = ZU4/LV1: INLG = LV-GENO- 920 VA1 = VAL(VA1$): VA2 = VAL(VA2$): VA3 =
LOCAL-FC: REM ** S.C. LO*GEN ** VAL(VA3$)
640 ERROR1 = S2-LV: ER = K*HA*(R-1): 930 VA4 = VAL(VA4$): VA5 = VAL(VA5$): VA6 =
ERROR2 = ERROR1/ER VAL(VA6$)
650 REM *** PARTICION DE LA INTER. GxE *** 940 VA7 = VAL(VA7$): VA8 = VAL(VA8$): VA9 =
660 PRINT “NOMBRE DEL FICHERO VECT. VAL(VA9$)
PROPIOS GENOTIPICOS “;:INPUT G$ 950 VA10=VAL(VA10$)
670 PRINT “NOMBRE DEL FICHERO VECT. 960 VA(I,1)=VA1:VA(I,2)=VA2:VA(I,3)=VA3
PROPIOS AMBIENTALES “;:INPUT AM$ 970 VA(I,4)=VA4:VA(I,5)=VA5:VA(I,6)=VA6
680 PRINT “PORCENTAJES DE VARIANZA DE 980 VA(I,7)=VA7:VA(I,8)=VA8:VA(I,9)=VA9
LOS AUTOVALORES 1-10”;:INPUT 990 VA(I,10)=VA10
AUT1,AUT2,AUT3,AUT4,AUT5,AUT6,AUT7,AUT 1000 NEXT I
8,AUT9,AUT10 1010 REM *******SALIDAS POR IMPRESORA
690 SSPCA1 = INLG*AUT1: SSPCA2 = ******
INLG*AUT2: SSPCA3 = INLG*AUT3: SSPCA4 = 1020 GLGL=(K-1)*(HA-1):QW=K-1
INLG*AUT4: SSPC5 = INLG*AUT5: SSPCA6 = 1030 GLDGL=(K-1)*(HA-2)
INLG*AUT6 1040 GENO1=GENO/(K-1)
700 SSPCA7 = INLG*AUT7: SSPCA8 = 1050 LOCAL1=LOCAL/(HA-1)
INLG*AUT8: SSPCA9 = INLG*AUT9: SSPCA10 1060 INLG1 = INLG/GLGL:GLPC1 = K+HA-3:
= INLG*AUT10 GLPC2 = GLPC1-2: GLPC3 = GLPC2-2:
710 LAMBDA(1)=(SSPCA1/R)^.25:LAMBDA(2) MSPCA1 = SSPCA1/GLPC1: MSPCA2 =
= (SSPCA2/R)^.25:LAMBDA(3) = SSPCA2/GLPC2: MSPCA3 = SSPCA3/GLPC3
(SSPCA3/R)^.25:LAMBDA(4) = 1070 GLPC4 = GLPC3-2: GLPC5 = GLPC4-2:
(SSPCA4/R)^.25:LAMBDA(5) = GLPC6 = GLPC5-2: MSPCA4 = SSPCA4/ GLPC4:
(SSPCA5/R)^.25:LAMBDA(6) = (SSPCA6/R)^.25 MSPCA5 = SSPCA5/GLPC5: MSPCA6 =
720 LAMBDA(7)=(SSPCA7/R)^.25: LAMBDA(8) SSPCA6/GLPC6
= (SSPCA8/R)^.25:LAMBDA(9) = (SSPCA9/R) 1080 GLRES = GLGL-GLPC1-GLPC2-GLPC3-
^.25: LAMBDA(10) = (SSPCA10/R)^.25 GLPC4-GLPC5-GLPC6:SSRES = INLG-
730 OPEN G$ AS#2 LEN=132 SSPCA1- SSPCA2-SSPC3-SSPCA4-SSPCA5-
740 FIELD#2,13 AS VG1$,13 AS VG2$,13 AS SSPCA6:MSRES = SSRES/GLRES
VG3$,13 AS VG4$,13 AS VG5$,13 AS VG6$,13 1090 REM ******* CALCULO DE LAS COORDE-
AS VG7$,13 AS VG8$,13 AS VG9$,13 AS VG10$ NADAS ********
750 FOR I=1 TO K 1100 FOR I=1 TO K
760 GET#2,I 1110 FOR H=1 TO 10
770 Y2=EOF(2):IF Y2=-1 THEN CLOSE#2:GOTO 1120 COOGEN(I,H)=VG(I,H)*LAMBDA(H)
870 1130 NEXT H:NEXT I
780 VG1 = VAL(VG1$): VG2 = VAL(VG2$): VG3 1140 FOR J=1 TO HA:FOR E=1 TO 10
= VAL(VG3$) 1150 COOAM(J,E)=VA(J,E)*(LAMBDA(E))*(-1)
790 VG4 = VAL(VG4$): VG5 = VAL(VG5$): VG6 1160 NEXT E:NEXT J
180
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
1170 REM ****** DISPLAY DE LAS COORDENA- MBDA(3);LAMBDA(4);LAMBDA(5); LAMB-
DAS*********** DA(6):LPRINT:LPRINT
1180 LPRINT “********* SALIDA DEL PROGRAMA 1420 LPRINT “***** VALORES PROPIOS :
AMMI **********” “:LPRINT USING “#####.###”;
1190 LPRINT:LPRINT “ A N O V A DEL ANALI- LAMBDA(7);LAMBDA(8);LAMBDA(9);LAMB-
SIS A M M I “ DA(10):LPRINT:LPRINT
1200 LPRINT 1430 LPRINT “COORDENADAS PARA LOS
“#####################################” DOCE EJES DEL AMMI”
1210 LPRINT 1440 LPRINT
1220 LPRINT “F. DE V. G.L. S.C. “######################################
M.C. F “ ##########”
1230 LPRINT “========== ====== 1450 LPRINT:LPRINT “GENOTIPOS PCA1
====== ====== === “ PCA2 PCA3 PCA4 PCA5 PCA6
1240 LPRINT PCA7 PCA8 PCA9 PCA10 “
1250 LPRINT “GENOTIPOS”;:LPRINT USING 1460 FOR I=1 TO K
“###########.#”; K- 1470 LPRINT USING
1,GENO,GENO1,GENO1/INLG1 “#####.####”;I;COOGEN(I,1);COOGEN(I,2);CO
1260 LPRINT OGEN(I,3); COOGEN(I,4);COOGEN(I,5);COO-
1270 LPRINT “MACROAMB.”;:LPRINT USING GEN(I,6);
“###########.#”; HA- 1480 LPRINT USING
1,LOCAL,LOCAL1,LOCAL1/ERROR2 “#####.####”;COOGEN(I,7);COOGEN(I,8);COO
1280 LPRINT GEN(I,9); COOGEN(I,10)
1290 LPRINT “GEN x LOC”;:LPRINT USING 1490 NEXT I
“ # # # # # # # # # # # . # ” ; 1500 LPRINT:LPRINT:LPRINT “AMBIENTES
GLGL,INLG,INLG1,INLG1/ERROR2 PCA1 PCA2 PCA3 PCA4 PCA5
1300 LPRINT “ PCA1 “;:LPRINT USING PCA6 PCA7 PCA8 PCA9 PCA10 “
“ # # # # # # # # # # # . # ” ; 1510 FOR H=1 TO HA
GLPC1,SSPCA1,MSPCA1,MSPCA1/ERROR2 1520 LPRINT USING
1310 LPRINT “ PCA2 “;:LPRINT USING “#####.####”;H;COOAM(H,1);COOAM(H,2);CO
“ # # # # # # # # # # # . # ” ; O A M ( H , 3 ) ;
GLPC2,SSPCA2,MSPCA2,MSPCA2/ERROR2 COOAM(H,4);COOAM(H,5);COOAM(H,6);
1320 LPRINT “ PCA3 “;:LPRINT USING 1530 LPRINT USING
“ # # # # # # # # # # # . # ” ; “#####.####”;COOAM(H,7);COOAM(H,8);COO
GLPC3,SSPCA3,MSPCA3,MSPCA3/ERROR2 AM(H,9); COOAM(H,10)
1330 LPRINT “ PCA4 “;:LPRINT USING 1540 NEXT H
“ # # # # # # # # # # # . # ” ; 1550 INPUT “NOMBRE ARCHIVO COO-GEN
GLPC4,SSPCA4,MSPCA4,MSPCA4/ERROR2 “;COG$
1340 LPRINT “ PCA5 “;:LPRINT USING 1560 INPUT “NOMBRE ARCHIVO COO-AMB
“ # # # # # # # # # # # . # ” ; “;COA$
GLPC5,SSPCA5,MSPCA5,MSPCA5/ERROR2 1570 OPEN COG$ FOR OUTPUT AS#4
1350 LPRINT “ PCA6 “;:LPRINT USING 1580 FOR I=1 TO K:PRINT#4, USING
“ # # # # # # # # # # # . # ” ; “#######.###”;COOGEN(I,1);COOGEN(I,2);
GLPC6,SSPCA6,MSPCA6,MSPCA6/ERROR2 COOGEN(I,3);COOGEN(I,4);COOGEN(I,5);COO
1360 LPRINT “RESIDUAL “;:LPRINT USING GEN(I,6);COOGEN(I,7);COOGEN(I,8);COO-
“ # # # # # # # # # # # . # ” ; GEN(I,9);COOGEN(I,10);RENDG(I):NEXT I
GLRES,SSRES,MSRES,MSRES/ERROR2 1590 CLOSE#4
1370 LPRINT 1600 OPEN COA$ FOR OUTPUT AS#5
1380 LPRINT “ERROR “;:LPRINT USING 1610 FOR I=1 TO HA:PRINT#5, USING
“###########.#”;ER,ERROR1,ERROR2 “#######.###”;COOAM(I,1);COOAM(I,2);
1390 LPRINT “ S.S. DE LOS PCA7 AL PCA10 =” COOAM(I,3);COOAM(I,4);COOAM(I,5);COOAM(
1400 LPRINT USING I,6);COOAM(I,7);COOAM(I,8);
“########.##”;SSPCA7;SSPCA8;SSPCA9;SSPC COOAM(I,9);COOAM(I,10);RENDAM(I):NEXT
A10 I:CLOSE#5
1410 LPRINT:LPRINT:LPRINT:LPRINT “***** 1620 END
VALORES PROPIOS : “:LPRINT 1630 FOR W=1 TO
USING”#####.###”;LAMBDA(1);LAMBDA(2);LA 7:FINH=INT((3000*RND(1))+1000):SOUND
181
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
FINH,1:NEXT W:PRINT “PULSA UNA TECLA B(I,11) = B11
....”:WHILE INKEY$=””:WEND:RETURN 260 NEXT I
270 FOR I=1 TO K
280 SUM=SUM+A(I,11)
16.6.4. Programa realizado en BASIC para el cál- 290 NEXT I
culo del estadístico RMS PD. Se obtienen los 300 MEDIA=SUM/K
valores del RMS PD para los seis primeros ejes, 310 REM ** CALCULO DE LOS VALORES ADITI-
para el modelo con sólo efectos aditivos y para VOS
el modelo completo. 320 DIM ADIT(12,15)
330 FOR I=1 TO K:FOR H=1 TO HA
10 CLS 340 ADIT(H,I)=A(I,11)+B(H,11)-MEDIA
15 REM PROGRAMA RMSPD PARA MODELO 350 NEXT H:NEXT I
COMPLETO 360 REM ***** CALCULO DE LAS COORDENA-
20 DIM A(15,13),B(12,13):K=11:HA=10 DAS
30 GOSUB 1200:INPUT “MODELO Num. “;NUM 370 DIM COOT(12,12,15),ESTDO(12,180)
40 INPUT “ NOMBRE DEL FICHERO DE COOR- 380 FOR T=1 TO HA:FOR I=1 TO K:FOR H=1 TO
DENADAS GENETICAS “;A$ HA
50 INPUT “ NOMBRE DEL FICHERO DE COOR- 390 COOT(T,H,I)=A(I,T)*B(H,T)
DENADAS AMBIENTALES “;B$ 400 NEXT H:NEXT I:NEXT T
60 OPEN A$ AS#1 LEN=123 410 REM ***ESTIMADOS MODELO AMMI
70 FIELD#1,11 AS V1$,11 AS V2$,11 AS V3$,11 420 FOR S=1 TO HA:CONT1=0:FOR H=1 TO
AS V4$,11 AS V5$,11 AS V6$,11 AS V7$,11 AS HA:FOR I=1 TO K
V8$,11 AS V9$,11 AS V10$,11 AS V11$ 430 CONT1=CONT1+1
80 FOR I=1 TO K 440 ESTDO(S,CONT1)=COOT(S,H,I)
90 GET#1,I 450 NEXT I:NEXT H:NEXT S
100 Y=EOF(1):IF Y=-1 THEN CLOSE#1: GOTO 460 GOSUB 1200:INPUT “NOMBRE DEL MODE-
160 LO DE VALIDACION “;VL$
110 V1 = VAL(V1$): V2 = VAL(V2$): V3 = 470 DIM VALI(180),AMMI(12,180)
VAL(V3$): V4 = VAL(V4$) 480 OPEN VL$ FOR INPUT AS#3
120 V5 = VAL(V5$): V6 = VAL(V6$): V7 = 490 IF EOF(3) THEN CLOSE#3:GOTO 530
VAL(V7$) 500 VL=VL+1:INPUT#3,VL1$
121 V8 = VAL(V8$): V9 = VAL(V9$): V10 = 510 VALI(VL)=VAL(VL1$)
VAL(V10$): V11 = VAL(V11$) 520 GOTO 490
130 A(I,1)=V1:A(I,2)=V2:A(I,3)=V3:A(I,4)=V4 530 REM ***** RMSPD DE LA PARTE ADITIVA
140 A(I,5)=V5:A(I,6)=V6:A(I,7)=V7 540 DIM AMMI0(180):FOR I=1 TO HA:FOR T=1
141 A(I,8) = V8: A(I,9) = V9: A(I,10) = V10: A(I,11) TO K:CD=CD+1
= V11 550 AMMI0(CD)=ADIT(I,T)
150 NEXT I 560 DIF7=AMMI0(CD)-VALI(CD)
160 REM 570 DIF72=DIF7*DIF7:SDIF7=SDIF7+DIF72
170 OPEN B$ AS#2 LEN=123 580 NEXT T:NEXT I
180 FIELD#2,11 AS B1$,11 AS B2$,11 AS 590 RMS7=SDIF7/(110):RMSPD(7)=SQR(RMS7)
B3$,11 AS B4$,11 AS B5$,11 AS B6$,11 AS 600 REM **** CALCULO DE LOS RMSPD DEL
B7$,11 AS B8$,11 AS B9$,11 AS B10$,11 AS MODELO
B11$ 610 REM RMSPD 1
190 FOR I=1 TO HA 620 FOR I=1 TO 110
200 GET#2,I 630 AMMI(1,I)=ESTDO(1,I)
210 Y1=EOF(2):IF Y1=-1 THEN CLOSE#2: 640 AMMI(2,I)=ESTDO(1,I)+ESTDO(2,I)
GOTO 270 650 AMMI(3,I) = ESTDO(1,I) + ESTDO(2,I) +
220 B1 = VAL(B1$): B2 = VAL(B2$): B3 = ESTDO(3,I)
VAL(B3$): B4 = VAL(B4$) 660 AMMI(4,I) = ESTDO(1,I) + ESTDO(2,I) +
230 B5=VAL(B5$):B6=VAL(B6$):B7=VAL(B7$) ESTDO(3,I) + ESTDO(4,I)
231 B8 = VAL(B8$): B9 = VAL(B9$): B10 = 670 AMMI(5,I) = ESTDO(1,I) + ESTDO(2,I) +
VAL(B10$): B11 = VAL(B11$) ESTDO(3,I) + ESTDO(4,I) + ESTDO(5,I)
240 B(I,1)=B1:B(I,2)=B2:B(I,3)=B3:B(I,4)=B4 680 AMMI(6,I) = ESTDO(1,I) + ESTDO(2,I) +
250 B(I,5)=B5:B(I,6)=B6:B(I,7)=B7 ESTDO(3,I) + ESTDO(4,I) + ESTDO(5,I) +
251 B(I,8) = B8: B(I,9) = B9: B(I,10) = B10: ESTDO(6,I)
182
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
6 8 1 INKEY$=””:WEND:RETURN
AMMI(7,I)=ESTDO(7,I)+ESTDO(8,I)+ESTDO(9,I)
+ESTDO(10,I)
682 AMMI(8,I)=AMMI(6,I)+AMMI(7,I) 16.7. Análisis de grupos según Fox y
690 DIF1=(AMMI0(I)+AMMI(1,I))-VALI(I) Rosielle
700 DIF2=(AMMI0(I)+AMMI(2,I))-VALI(I)
710 DIF3=(AMMI0(I)+AMMI(3,I))-VALI(I) 16.7.1. Corriente de control, para el paquete
720 DIF4=(AMMI0(I)+AMMI(4,I))-VALI(I) estadístico SAS, realizada por el Dr. Ignacio
730 DIF5=(AMMI0(I)+AMMI(5,I))-VALI(I) Romagosa para la obtención del Análisis de gru-
740 DIF6=(AMMI0(I)+AMMI(6,I))-VALI(I) pos de genotipos y ambientes según el método
741 DIF9=(AMMI0(I)+AMMI(8,I))-VALI(I) de Fox y Rosielle.
750 DIF12=DIF1*DIF1:SDIF1=SDIF1+DIF12
751 DIF92=DIF9*DIF9:SDIF9=SDIF9+DIF92 * PROGRAMA F&R.SAS;
760 DIF22=DIF2*DIF2:SDIF2=SDIF2+DIF22 options ps=66 noNUMBER;
770 DIF32=DIF3*DIF3:SDIF3=SDIF3+DIF32 DATA yldmeans;
780 DIF42=DIF4*DIF4:SDIF4=SDIF4+DIF42 INFILE ‘DATCOMP1.TXT’;
790 DIF52=DIF5*DIF5:SDIF5=SDIF5+DIF52 INPUT SITE $ GENOTYPE $ BLQ YLD;
800 DIF62=DIF6*DIF6:SDIF6=SDIF6+DIF62 STDYLD=YLD;
810 NEXT IF GENOTYPE =’local’ THEN DELETE;
I:RMS1=SDIF1/110:RMSPD(1)=SQR(RMS1):RE RUN;
M *** 110=NUM. DATOS VALIDACION ***** PROC SORT;
820 RMS2=SDIF2/(110):RMSPD(2)=SQR(RMS2) BY SITE GENOTYPE;
830 RMS3=SDIF3/(110):RMSPD(3)=SQR(RMS3) RUN;
840 RMS4=SDIF4/(110):RMSPD(4)=SQR(RMS4) PROC MEANS NOPRINT;
850 RMS5=SDIF5/(110):RMSPD(5)=SQR(RMS5) BY SITE GENOTYPE;
860 RMS6=SDIF6/(110):RMSPD(6)=SQR(RMS6) VAR YLD stdyld;
870 RMS9=SDIF8/(110):RMSPD(8)=SQR(RMS8) OUTPUT OUT=SITEGENO MEAN = YLD
1040 LPRINT “ RMS PD PARA EL MODELO Num. STDYLD;
“;NUM RUN;
1050 LPRINT “ DEL 1-6 SEGUN EJES ADICIO- PROC STANDARD NOPRINT DATA=SITEGENO
NADOS AL MODELO” MEAN=0 STD=1 OUT=STAND;
1060 LPRINT “ 7 = SOLO FACTORES ADITI- BY SITE;
VOS.” VAR STDYLD;
1070 LPRINT “ 8 = MODELO COMPLETADO RUN;
CON TODOS LOS EJES.” DATA STDMEANS;
1080 LPRINT:LPRINT:LPRINT SET STAND;
1090 FOR I=1 TO 9 KEEP SITE GENOTYPE STDYLD;
1100 LPRINT “RMS PD (“;I;”) = “;RMSPD(I) RUN;
1110 NEXT I PROC SORT DATA=STDMEANS;
1120 LPRINT:LPRINT:LPRINT BY SITE;
1121 PRINT “ RMS PD PARA EL MODELO Num. RUN;
“;NUM PROC TRANSPOSE OUT=TRANSTD;
1122 PRINT “ DEL 1-6 SEGUN EJES ADICIONA- BY SITE;
DOS AL MODELO” ID GENOTYPE;
1123 PRINT “ 7 = SOLO FACTORES ADITIVOS.” RUN;
1124 PRINT “ 8= MODELO COMPLETADO CON PROC CLUSTER METHOD=WARD
TODOS LOS EJES.” DATA=TRANSTD;
1125 PRINT:PRINT:PRINT ID SITE;
1126 FOR I=1 TO 8 PROC TREE HORIZONTAL SPACES=2;
1127 PRINT “RMS PD (“;I;”) = “;RMSPD(I) ID SITE;
1128 NEXT I RUN;
1130 END data rawmeans;
1200 FOR W=1 TO set sitegeno;
2:FINH=INT((3000*RND(1))+1000):SOUND keep site genotype yld;
FINH,1:NEXT W:RETURN run;
3000 PRINT “PULSA TECLA “:WHILE PROC SORT;
183
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
BY GENOTYPE; ID GENOTYPE;
RUN; PROC TREE HORIZONTAL SPACES=2;
PROC TRANSPOSE OUT=TRANSRAW; ID GENOTYPE;
BY GENOTYPE; RUN;
ID SITE;
RUN;
PROC CLUSTER METHOD = WARD DATA = 16.7.2. Salida del programa F&R.SAS.
TRANSRAW;
Eigenvalue
Eigenvalues of the Covariance Matrix
Difference Proportion Cumulative
3 0.63242 0.319706 0.160712 0.83289
4 0.31272 0.103467 0.079468 0.91236
5 0.20925 0.124859 0.053175 0.96554
6 0.08439 0.051290 0.021446 0.98698
7 0.03310 0.019322 0.008412 0.99539
8 0.01378 0.009438 0.003502 0.99890
9 0.00434 0.004343 0.001104 1.00000
10 -0.00000 0.000000 -.000000 1.00000
11 -0.00000 • -.000000 1.00000
Root-Mean-Square Distance Between Observations = 2.805403
Number Frequency
of of New Semipartial
Clusters Clusters Joined Cluster R-Squared R-Squared Tie
7 5.000 7.000 2 0.025943 0.937244
6 10.000 2.000 2 0.087513 0.849731
5 6.000 1.000 2 0.090093 0.759638
4 CL5 4.000 3 0.114509 0.645129
3 CL7 CL8 5 0.116282 0.528846
2 CL3 CL6 7 0.191630 0.337216
1 CL2 CL4 10 0.337216 0.000000
184
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
SITE 0.35
Ward’s Minimum Variance Cluster Analysis
0.3
Semi-Partial R-Squared
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
8.000 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX...
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
3.000 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX...
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
9.000 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX.......
XXXXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXX
10.000 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX.................................
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
2.000 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX.................................
X
X
6.000 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX.................................
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
1.000 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX.................................
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
4.000 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX............................................
2 370713 232983 0.116763 0.89085
3 137730 37219 0.043381 0.93423
4 100511 47291 0.031658 0.96588
5 53220 19675 0.016763 0.98265
6 33544 20276 0.010565 0.99321
7 13268 8346 0.004179 0.99739
8 4921 1655 0.001550 0.99894
9 3266 3169 0.001029 0.99997
10 97 • 0.000031 1.00000
Root-Mean-Square Distance Between Observations = 2519.885
Number Frequency
of of New Semipartial
Clusters Clusters Joined Cluster R-Squared R-Squared Tie
8 9.000 10.000 2 0.014674 0.961475
7 2.000 CL9 3 0.022417 0.939058
6 CL8 CL10 4 0.037583 0.901475
5 CL7 7.000 4 0.045206 0.856269
4 3.000 4.000 2 0.050023 0.806245
3 8.000 CL6 5 0.072044 0.734201
2 CL3 CL4 7 0.236354 0.497847
1 CL2 CL5 11 0.497847 0.000000
185
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
GENOTYPE 0.5
Ward’s Minimum Variance Cluster Analysis
0.45
Semi-Partial R-Squared
8.000 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX.....................
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
9.000 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX...
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
10.000 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX...
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
11.000 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX.
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
1.000 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX.
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
3.000 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX............
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
4.000 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX............
X
X
2.000 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX............
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
5.000 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX..........
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
6.000 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX..........
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
7.000 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX................
las distancias genotípicas según el método de 180 IF Y(I,R)<MIN THEN MIN=Y(I,R):LI=R
Westcott. 190 IF Y(I,R)>MAX THEN MAX=Y(I,R):HI=R
200 NEXT R
10 CLS 210 L(I) = MIN: H(I) = MAX: MAX = 10: MIN =
20 DIM Y(20,20), SIM(20,20,20), H(20), L(20): 10000: LPRINT “AMBIENTE “;:LPRINT USING
HA=10:K=11 “#######.##”;I,H(I);HI;L(I);LI
30 OPEN “A:GEN10.TXT” AS#1 LEN=112 220 NEXT I:GOSUB 350
40 FIELD#1, 10 AS V1$,10 AS V2$,10 AS V3$,10 230 REM SIMILARIDADES
AS V4$,10 AS V5$,10 AS V6$,10 AS V7$,10 AS 240 FOR I=1 TO HA:FOR R=1 TO K:FOR T=1 TO
V8$,10 AS V9$,10 AS V10$,10 AS V11$ K
50 I=I+1 250 LOCATE 15,25:PRINT “!!! ESTOY PROCE-
60 GET#1,I SANDO —-”"
70 Y=EOF(1):IF Y=-1 THEN CLOSE#1:GOTO 260 IF R=T THEN SIM(T,R,I)=1!:GOTO 280
150 270 SIM(T,R,I)=(H(I)-((Y(I,R)+Y(I,T))/2))/(H(I)-
80 Y(I,1) = VAL(V1$): Y(I,2) = VAL(V2$) :Y(I,3) = L(I))
VAL(V3$) 280 NEXT T:NEXT R:NEXT I
90 Y(I,4) = VAL(V4$): Y(I,5) = VAL(V5$): Y(I,6) = 290 OPEN “A:SIMGEN.TXT” FOR OUTPUT AS#2
VAL(V6$) 300 FOR I=1 TO HA:FOR R=1 TO K:FOR T=1 TO
100 Y(I,7) = VAL(V7$): Y(I,8) = VAL(V8$): Y(I,9) = K
VAL(V9$) 310 LOCATE 15,25:PRINT “!!! ESTOY GRABAN-
110 Y(I,10) = VAL(V10$): Y(I,11) = VAL(V11$) DO !!! “
130 PRINT Y(I,1); Y(I,2); Y(I,3); Y(I,4); Y(I,5); 320 PRINT#2, USING
Y(I,6); Y(I,7); Y(I,8); Y(I,9); Y(I,10); Y(I,11) “#########.###”;SIM(T,R,I)
186
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
330 NEXT T:NEXT R:NEXT I PROGRAMA ES REALIZAR LA MEDIA DE LAS
340 CLOSE#2:END DISTANCIAS DE WESTCOTT PARA LOS
350 PRINT “PULSA TECLA .....”:WHILE AMBIENTES 1 Y 10 ***********
INKEY$=””:WEND:CLS:RETURN 130 NEXT I
140 DIST(T,R)=SUM1/1:SUM1=0
150 NEXT T:NEXT R
16.8.2. Programa en BASIC para el cálculo de la 160 FOR I=1 TO K
matriz de similaridades medias de Westcott para 170 PRINT USING
los ambientes que se especifiquen en la línea “#####.####”;DIST(I,1);DIST(I,2);DIST(I,3);
120. DIST(I,4);DIST(I,5);DIST(I,6);DIST(I,7);DIST(I,8);
DIST(I,9);
10 WIDTH “LPT1:”,152 DIST(I,10);DIST(I,11):NEXT I
20 DIM SIM(20,20,20),DIST(20,20) 180 REM POSIBLE PAUSA
30 CLS:HA=10:K=11 190 OPEN “A:DISTL1.TXT” FOR OUTPUT AS#2
40 OPEN “A:SIMGEN.TXT” FOR INPUT AS#1 200 FOR I=1 TO K
50 FOR I=1 TO HA:FOR R=1 TO K:FOR T=1 TO 210 PRINT#2, USING
K “######.######”;DIST(I,1);DIST(I,2);DIST(I,3);
60 INPUT#1,Y$ DIST(I,4);DIST(I,5);DIST(I,6);DIST(I,7);DIST(I,8);
70 SIM(T,R,I)=VAL(Y$) DIST(I,9);
80 NEXT T:NEXT R:NEXT I DIST(I,10);DIST(I,11):NEXT I
90 CLOSE#1 220 CLOSE#2:END
100 REM CALCULO DE SIMILARIDADES 230 PRINT “PULSA TECLA .....”:WHILE
MEDIAS INKEY$=””:WEND:RETURN
110 FOR R=1 TO K:FOR T=1 TO K:FOR I=1 TO HA
120 IF I=10 OR I= 1 THEN
SUM1=SUM1+SIM(T,R,I):REM ****EN ESTE 16.8.3. Matriz DISTL1.TXT que contiene las distan-
CASO AL SER I=1 O I=10 LO QUE HACE EL cias de Westcott entre genotipos para el ciclo L1.
3 11L 11 0
G1 G2 G3 G4 G5 G6 G7 G8 G9 G10 G11
1.000000
0.608000 1.000000
0.743000 0.784000 1.000000
0.784000 0.824000 0.959000 1.000000
0.284000 0.324000 0.459000 0.500000 1.000000
0.446000 0.486000 0.622000 0.662000 0.162000 1.000000
0.351000 0.392000 0.527000 0.568000 0.068000 0.230000 1.000000
0.622000 0.662000 0.797000 0.838000 0.338000 0.500000 0.405000 1.000000
0.454000 0.495000 0.630000 0.670000 0.170000 0.332000 0.238000 0.508000 1.000000
0.554000 0.595000 0.730000 0.770000 0.270000 0.432000 0.338000 0.608000 0.441000 1.000000
0.554000 0.595000 0.730000 0.770000 0.270000 0.432000 0.338000 0.608000 0.441000 0.541000 1.000000
16.9. Análisis Canónico
2.0000 3850.0 3541.7 3308.3 3868.1 3097.9 3972.2 3951.4 4340.3 4494.5 2569.5
1.0000 3552.8 3750.0 3791.7 3254.2 3266.0 3375.0 4201.4 5208.3 5386.1 2465.3
3.0000 3352.8 3819.4 2327.8 3547.2 2161.1 3000.0 3430.6 3055.6 1962.5 2118.1
2.0000 3334.7 2847.2 2720.8 3176.4 1854.9 3430.5 3097.2 3715.3 3012.5 2013.9
1.0000 3762.5 4375.0 3791.7 3309.7 2993.1 3430.6 3888.9 5173.6 4938.9 3298.6
1.0000 4147.2 3819.5 3745.8 3263.9 3128.5 3902.8 3895.8 5277.8 5008.4 2881.9
1.0000 4037.5 4027.8 4037.5 4130.6 3808.3 4152.8 4229.2 5416.7 5445.8 3125.0
1.0000 2723.6 3263.9 3177.8 2661.1 2052.1 3319.4 3722.2 4097.2 4486.1 2430.6
2.0000 3638.9 3402.8 3027.8 3154.2 2418.0 3416.7 3534.7 3958.3 3793.1 2861.1
2.0000 3666.7 3680.6 3550.0 3691.7 2691.0 3375.0 3645.9 4236.1 4038.9 2604.2
2.0000 3615.3 4027.8 2865.3 3709.7 3071.6 3805.6 4027.8 4166.7 4283.3 2604.2
187
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
16.9.2. Corriente de control diseñada para la 10 Variables 12 DF Within Classes
realización del análisis canónico con el paquete 3 Classes 2 DF Between Classes
estadístico SAS.
* PROGRAMA CANON.SAS;
Class Level Information
OPTIONS PS=80 NONUMBER;
DATA FER;
GRUP Frequency Weight Proportion
TITLE ‘ANALISIS CANONICO DE LOS 11 GENO-
TIPOS’;
INFILE ‘A:AMB10.DAT’; 1 5 5.0000 0.454545
INPUT GRUP A1 A2 A3 A4 A5 A6 A7 A8 A9 A10; 2 5 5.0000 0.454545
3 1 1.0000 0.090909
RUN;
PROC CANDISC DATA=FER OUT=OUTCAN
DISTANCE ANOVA;
CLASS GRUP; CANONICAL DISCRIMINANT ANALYSIS
VAR A1 A2 A3 A4 A5 A6 A7 A8 A9 A10; PAIRWISE SQUARED DISTANCES
BETWEEN GROUPS
RUN;
PROC PLOT;
PLOT CAN2*CAN1=GRUP; 2 _ _ -1 _ _
format grup specchar.; D (i|j) = (X - X )’ COV (X - X )
TITLE ‘PLOT DE LAS VARIABLES CANONICAS’; i j i j
RUN;
PROC PRINT DATA=OUTCAN;
RUN; Squared Distance to GRUP
From GRUP 1 2 3
16.9.3. Salida del programa CANON.SAS.
1 0 3732 14567
ANÁLISIS CANÓNICO DE LOS 11 GENOTIPOS 2 3732 0 3935
CANONICAL DISCRIMINANT ANALYSIS 3 14567 3935 0
11 Observations 14 DF Total
CANONICAL DISCRIMINANT ANALYSIS
A1
A2
A3
A4
346.5833
57.1106
633.0104
348.0440
343.3330
342.8615
267.0736
358.0039
163.4471
193.5830
689.4846
125.6517
0.158859
0.209894
0.847421
0.093098
0.1889
0.2657
5.5540
0.1027
A5 577.0900 473.5956 443.9535 0.422727 0.7323
A6 372.4527 265.8305 330.7724 0.563363 1.2902
A7 325.8896 249.7967 271.6755 0.496400 0.9857
A8 893.9598 339.6482 990 0.876270 7.0821
A9 1383 399.8689 1576 0.928304 12.9477
A10 395.6833 287.8715 346.0454 0.546314 1.2042
188
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
Univariate Test Statistics
Variable F Pr > F
A1 1.1332 0.3542
A2 1.5939 0.2433
A3 33.3240 0.0001
A4 0.6159 0.5564
A5 4.3937 0.0370
A6 7.7414 0.0069
A7 5.9142 0.0163
A8 42.4926 0.0001
A9 77.6864 0.0001
A10 7.2250 0.0087
S=2
Statistic
M=3.5 N=0.5
Multivariate Statistics and F Approximations
Hotelling-Lawley Trace 3088.0329837 308.8033 20 4 0.0001
Roy’s Greatest Root 3034.8921297 1213.957 10 4 0.0001
Adjusted Approx Squared
Canonical Canonical Standard Canonical
Correlation Correlation Error Correlation
Eigenvalues of INV(E)*H
= CanRsq/(1-CanRsq)
Eigenvalue Difference Proportion Cumulative
Likelihood
Ratio Approx F Num DF Den DF Pr > F
189
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
Total Canonical Structure CANONICAL DISCRIMINANT ANALYSIS
A7 0.696601 -0.107333 A4 -16.19827011 10.11874777
A8 0.936152 0.013490 A5 20.00525124 -11.33907624
A9 0.952928 0.144628 A6 16.97664096 -8.68925309
A10 0.738274 0.038377 A7 -13.84216015 -7.11100919
A8 37.98546656 -12.35761614
A9 -11.75550768 47.57845068
A10 1.49746051 -0.06180503
Between Canonical Structure
A2 0.057126 -0.998367
A3 0.998565 0.053551
A4 -0.928698 0.370836
A5 0.999820 0.018958 A1 -.0663226920 0.0255736242
A6 0.895703 0.444653 A2 0.0078029158 -.0035070222
A7 0.988545 -0.150927 A3 0.0247140880 -.0272303922
A8 0.999898 0.014277 A4 -.0465408681 0.0290731852
A9 0.988880 0.148716 A5 0.0346657374 -.0196487130
A10 0.998676 0.051441 A6 0.0455806622 -.0233298160
A7 -.0424749994 -.0218203017
A8 0.0424912486 -.0138234590
A9 -.0085024725 0.0344123351
Pooled Within Canonical Structure
A10 0.0037844923 -.0001561982
CAN1 CAN2
2 0.57034263 9.22061118
A9 0.064591 0.073407 3 -60.63106254 -4.54494603
A10 0.019893 0.007743
GEN GRUP A1 A2 A3 A4 A5 A6 A7 A8 A9
4 2 3334.7 2847.2 2720.8 3176.4 1854.9 3430.5 3097.2 3715.3 3012.5
5 1 3762.5 4375.0 3791.7 3309.7 2993.1 3430.6 3888.9 5173.6 4938.9
6 1 4147.2 3819.5 3745.8 3263.9 3128.5 3902.8 3895.8 5277.8 5008.4
7 1 4037.5 4027.8 4037.5 4130.6 3808.3 4152.8 4229.2 5416.7 5445.8
8 1 2723.6 3263.9 3177.8 2661.1 2052.1 3319.4 3722.2 4097.2 4486.1
9 2 3638.9 3402.8 3027.8 3154.2 2418.0 3416.7 3534.7 3958.3 3793.1
10 2 3666.7 3680.6 3550.0 3691.7 2691.0 3375.0 3645.9 4236.1 4038.9
11 2 3615.3 4027.8 2865.3 3709.7 3071.6 3805.6 4027.8 4166.7 4283.3
GEN A10 CAN1 CAN2 CAN3 CAN4 CAN5 CAN6 CAN7 CAN8 CAN9 CAN10
2 2465.3 60.3277 -4.6741 . . . . . . . .
3 2118.1 -62.0127 -2.3757 . . . . . . . .
4 2013.9 0.4503 9.3668 . . . . . . . .
5 3298.6 60.5425 -4.0455 . . . . . . . .
6 2881.9 59.8744 -5.1519 . . . . . . . .
7 3125.0 59.5503 -4.8038 . . . . . . . .
8 2430.6 60.0087 -4.7030 . . . . . . . .
9 2861.1 0.4336 9.2749 . . . . . . . .
10 2604.2 0.2292 8.2596 . . . . . . . .
11 2604.2 0.1606 8.4078 . . . . . . . .
190
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
16.10. Modelo GGE biplot OPTIONS PS = 5000 LS=78 NODATE;
if env=4 THEN YLD=(YLD-3433.3)/82.98;
if env=5 THEN YLD=(YLD-2776.6)/125.7;
if env=6 THEN YLD=(YLD-3561.9)/77.89;
if env=7 THEN YLD=(YLD-3784.1)/80.07;
if env=8 THEN YLD=(YLD-4422.3)/147.53;
if env=9 THEN YLD=(YLD-4259.1)/192.23;
if env=10 THEN YLD=(YLD-2633.8)/97.98;
PROC GLM DATA=RAW OUTSTAT=STATS ;
CLASS ENV GEN;
MODEL YLD = ENV GEN ENV*GEN/SS4;
DATA STATS2;
SET STATS ;
DROP _NAME_ _TYPE_;
IF _SOURCE_ = ‘ERROR’ THEN DELETE;
MSE=137025 ; /* Cuadrados medios del error del ANOVA*/
DFE=200 ; /* Grados de libertad del MSE*/
NREP=3 ; /* Número de repeticiones del ensayo*/
SS=SS*NREP;
MS=SS/DF;
F=MS/MSE;
PROB=1-PROBF(F,DF,DFE);
PROC PRINT DATA=STATS2 NOOBS;
VAR _SOURCE_ DF SS MS F PROB;
PROC GLM DATA=RAW NOPRINT;
CLASS ENV;
MODEL YLD = ENV/ SS4 ;
OUTPUT OUT=OUTRES R=RESID;
PROC SORT DATA=OUTRES;
BY GEN ENV;
PROC TRANSPOSE DATA=OUTRES OUT=OUTRES2;
BY GEN;
ID ENV;
VAR RESID;
PROC IML;
USE OUTRES2;
READ ALL INTO RESID;
NGEN=NROW(RESID);
NENV=NCOL(RESID);
USE STATS2;
191
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
READ VAR {MSE} INTO MSEM;
READ VAR {DFE} INTO DFEM;
READ VAR {NREP} INTO NREP;
CALL SVD (U,L,V,RESID);
MINIMO=MIN(NGEN,NENV);
L=L[1:MINIMO,];
SS=(L##2)*NREP;
SUMA=SUM(SS);
PORCENT=((1/SUMA)#SS)*100;
MINIMO=MIN(NGEN,NENV);
PORCENTA=0;
DO I = 1 TO MINIMO;
DF=(NGEN-1)+(NENV-1)-(2*I-1);
DFA=DFA//DF;
PORCEACU=PORCENT[I,];
PORCENTA=PORCENTA+PORCEACU;
PORCENAC=PORCENAC//PORCENTA;
END;
DFE=J(MINIMO,1,DFEM);
MSE=J(MINIMO,1,MSEM);
SSDF=SS||PORCENT||PORCENAC||DFA||DFE||MSE;
L12=L##0.5;
SCOREG1=U[,1]#L12[1,];
SCOREG2=U[,2]#L12[2,];
SCOREG3=U[,3]#L12[3,];
SCOREE1=V[,1]#L12[1,];
SCOREE2=V[,2]#L12[2,];
SCOREE3=V[,3]#L12[3,];
SCOREG=SCOREG1||SCOREG2||SCOREG3;
SCOREE=SCOREE1||SCOREE2||SCOREE3;
SCORES=SCOREG//SCOREE;
CREATE SUMAS FROM SSDF;
APPEND FROM SSDF;
CLOSE SUMAS;
CREATE SCORES FROM SCORES;
APPEND FROM SCORES ;
CLOSE SCORES;
xxx=J(nrow(d)-1,1,0);
yyy=J(nrow(d)-1,1,0);
ppp={0 1,1 0};
do i=1 to nrow(d)-1 ;
dd=d[i:i+1,];
if dd[1,1]>dd[2,1] then ddd=ppp*dd;
else ddd=dd;
p=(ddd[2,2]-ddd[1,2])/(ddd[2,1]-ddd[1,1]) ;
if p<0 then ss=1 ;
else ss=-1 ;
r=tan((180-90-abs(atan(p)*180/3.14156))*3.14156/180)*ss ;
aa=(ddd[1,2]+ddd[2,2])/2-p*(ddd[1,1]+ddd[2,1])/2;
xx=aa/(r-p) ;
/*xx=(p*d[i,1]-d[i,2])/(p-r) ;*/
if abs(r)<1 then xxx[i,]=3.5; /* máximo para ejes ACP*/
192
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
else xxx[i,]=3.5/abs(r); /* máximo para ejes ACP*/
if xx<0 then xxx[i,]=-xxx[i,] ;
else xxx[i,]=xxx[i,];
yyy[i,]=xxx[i,]*r;
end;
kk=xxx||yyy;
xx1={V1 V2};
create pol from d[colNAME=xx1];
append from d ;
close pol;
xx2={V3 V4};
create perp from kk[colNAME=xx2];
append from kk ;
close perp;
data pol; set pol; TYPE=”pol”;
data perp; set perp; TYPE=”per”;
DATA SSAMMI;
SET SUMAS;
SSAMMI =COL1;
PORCENT =COL2;
PORCENAC=COL3;
DFAMMI =COL4;
DFE =COL5;
MSE =COL6;
DROP COL1 - COL6;
MSAMMI=SSAMMI/DFAMMI;
F_AMMI=MSAMMI/MSE;
PROBF=1-PROBF(F_AMMI,DFAMMI,DFE);
PROC PRINT DATA=SSAMMI NOOBS;
VAR SSAMMI PORCENT PORCENAC DFAMMI MSAMMI F_AMMI PROBF;
PROC SORT DATA=RAW;
BY GEN;
PROC MEANS DATA = RAW NOPRINT;
BY GEN ;
VAR YLD;
OUTPUT OUT = MEDIAG MEAN=YLD;
DATA NAMEG;
SET MEDIAG;
TYPE = ‘GEN’;
NAME = ‘G’||GEN;
KEEP TYPE NAME YLD;
PROC SORT DATA=RAW;
BY ENV;
PROC MEANS DATA = RAW NOPRINT;
BY ENV ;
VAR YLD;
OUTPUT OUT = MEDIAE MEAN=YLD;
DATA NAMEE;
SET MEDIAE;
TYPE = ‘ENV’;
NAME = ‘A’||ENV;
KEEP TYPE NAME YLD;
DATA NAMETYPE;
SET NAMEG NAMEE;
DATA BIPLOT0 ;
MERGE NAMETYPE SCORES;
193
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
DIM1=COL1;
DIM2=COL2;
DIM3=COL3;
DROP COL1-COL3;
data biplot ;
set biplot0 pol perp;
PROC PRINT DATA=BIPLOT NOOBS;
VAR TYPE NAME YLD DIM1 DIM2 DIM3;
Data labels;
set biplot ;
retain xsys ‘2’ ysys ‘2’ ;
length function text $8 ;
text = name ;
if type = ‘GEN’ then do;
color=’blue ‘;
size = 0.6;
style = ‘hwcgm001’;
x = dim1;
y = dim2;
if dim1 >=0
then position=’5’;
else position=’5’;
function = ‘LABEL’;
output;
end;
if type = ‘ENV’ then DO;
color=’black ‘;
size = 0.6;
style = ‘hwcgm001’;
x = 0.0;
y = 0.0;
function=’MOVE’;
output;
x = dim1;
y = dim2;
function=’DRAW’ ;
output;
if dim1 >=0
then position=’5’;
else position=’5’;
function=’LABEL’;
output;
end;
if type = “per” then do;
color=’green’;
line=2;
size = 0.6;
style = ‘hwcgm001’;
x=0.0;
y=0.0;
function=’MOVE’;
output;
x=v3;
y=v4;
function=’DRAW’;
output;
194
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
end;
Proc gplot data=biplot;
Plot dim2*dim1 v2*v1 /overlay Annotate=labels frame
Vref=0.0 Href = 0.0
cvref=black chref=black
lvref=3 lhref=3
vaxis=axis2 haxis=axis1
vminor=1 hminor=1 nolegend;
symbol1 v=none c=black h=0.7 ;
symbol2 v=none c=blue i=j line=3 ;
axis2
length = 6.0 in
order = (-3.5 to 3.5 by 0.5) /* máximo y mínimo eje ACP2*/
label=(f=hwcgm001 h=1.2 a=90 r=0 ‘ACP 2’)
value=(h=0.8)
minor=none;
axis1
length = 6.0 in
order = (-3.5 to 3.5 by 0.5) /* máximo y mínimo eje ACP1*/
label=(f=hwcgm001 h=1.2 ‘ACP 1’)
value=(h=0.8)
minor=none;
Title1 f=hwcgm001 h=1.0 ‘GGE biplot’; /* Título para el GGE biplot*/
run;
16.10.2. Salida generada por el SAS.
La salida gráfica de la corriente de control Yan2000.sas es la Figura 47. Y la salida de
texto es lo siguiente:
GGE biplot 6
Class
ENV
Levels
10
Values
1 10 2 3 4 5 6 7 8 9
GEN 11 1 10 11 2 3 4 5 6 7 8 9
195
Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos Métodos Estadísticos
GGE biplot 7
Model 109 2351.633548 21.574620 • •
Error 0 • •
Corrected Total 109 2351.633548
R-Square C.V. Root MSE YLD Mean
1.000000 0 0 0.000203
ENV 9 0.000014 0.000002 • •
GEN 10 1505.985284 150.598528 • •
ENV*GEN 90 845.648250 9.396092 • •
GGE biplot 8
_SOURCE_ DF SS MS F PROB
ENV 9 0.00 0.000 .0000000 1
GEN 10 4517.96 451.796 .0032972 1
ENV*GEN 90 2536.94 28.188 .0002057 1
GGE biplot 9
4666.68 66.1481 66.148 18 259.260 .0018921 1.00000
1105.76 15.6736 81.822 16 69.110 .0005044 1.00000
564.83 8.0062 89.828 14 40.345 .0002944 1.00000
363.29 5.1494 94.977 12 30.274 .0002209 1.00000
176.55 2.5026 97.480 10 17.655 .0001288 1.00000
117.51 1.6656 99.146 8 14.688 .0001072 1.00000
41.01 0.5813 99.727 6 6.835 .0000499 1.00000
11.31 0.1603 99.887 4 2.828 .0000206 1.00000
7.69 0.1091 99.996 2 3.847 .0000281 0.99997
0.27 0.0038 100.000 0 • • •
196
Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice Apéndice
GGE biplot 10
GEN 2 1.88549 1.19598 -1.56955 0.33652
GEN 3 -5.32244 -2.94713 1.99535 1.69161
GEN 4 -5.76417 -2.89544 -0.05814 -1.88008
GEN 5 3.02883 1.58363 -0.74798 2.03543
GEN 6 3.20410 1.74135 -0.37674 -0.67397
GEN 7 6.48103 3.21257 0.87694 -0.64489
GEN 8 -4.02880 -1.83521 -2.84837 0.06129
GEN 9 -2.00884 -1.02212 -0.15062 -0.16270
ENV 1 0.00074 2.00365 1.76220 -0.63938
ENV 10 0.00056 1.62048 -0.24989 0.83812
ENV 2 -0.00021 1.66503 0.88299 2.81963
ENV 3 0.00045 2.36492 -1.34084 -0.22634
ENV 4 0.00055 1.23219 2.82905 -0.35704
ENV 5 -0.00007 2.29473 0.61807 0.05376
ENV 6 -0.00035 1.65775 0.72331 -1.97774
ENV 7 0.00000 1.86987 -0.26001 0.53438
ENV 8 0.00037 2.37776 -1.21291 -0.19106
ENV 9 -0.00000 2.39843 -1.73373 -0.49462
197