Reconstruccion Filogenética
Reconstruccion Filogenética
Reconstruccion Filogenética
Resumen
En este informe se van a revisar cuatro diferentes ejercicios para poder ver y entender los conceptos y
fundamentos de la sistemática; esta dio origen en el año 1950 y fue propuesta por el señor Willi
Hennig, en este campo de estudio se empieza a hablar frente a términos como parafilético, polifilético,
monofilético, plesiomorfía, autapomorfía, apomorfia, homoplasia, cladograma y cladograma (Castillo,
J & Goyenechea, I. 2007). Se conoce como filogenia a la relación que se puede establecer entre un
grupo de organismos y a partir de esta se puede dilucidar su historia evolutiva, para esto se hace uso
de evidencia morfológica, bioquímica y genética.
Introducción
En cuanto a la historia de la sistemática filogenética se encuentra que fue propuesta por Willi Hennig
en 1950, quien era un entomólogo alemán y lo hace con la finalidad de poder realizar filogenias
comprobables y replicables, pues hasta ese entonces no se había propuesto un método con tales
características en este campo . Además es importante recalcar los términos básicos empleados con
frecuencia en este campo y son: parafilético, polifilético, monofilético, plesiomorfía, autapomorfía,
apomorfia, homoplasia, cladograma y cladograma (Castillo, J & Goyenechea, I. 2007). En cuanto a
los grupos que podemos encontrar al realizar una filogenia encontramos grupos naturales y grupos no
naturales. En esta primera categoría tenemos un grupo de miembros que se agrupan con su ancestro en
común y para los grupos no naturales se tienen grupos parafiléticos que son aquellos que contienen al
ancestro pero no a todos los descendientes y finalmente un grupo polifilético se da cuando se toman
taxones que provienen de ancestros distintos y se incluyen dentro del mismo grupo (Castillo, J &
Goyenechea, I. 2007).
Se conoce como filogenia a la relación que se puede establecer entre un grupo de organismos y a
partir de esta se puede dilucidar su historia evolutiva, para esto se hace uso de evidencia morfológica,
bioquímica y genética. Con la cual se ha llegado a establecer que todos los seres vivos se encuentran
relacionados y se puede llegar a establecer la la historia de linajes de organismos que han existido a
través del tiempo (Sosa, V. 2009). La sistemática actual basa las clasificaciones en las filogenias y al
compararla con el sistema tradicional linneano se encuentra que la clasificación filogenética se basa
en grupos monofiléticos y no en rangos que ya se encuentren establecidos (Sosa, V. 2009). La
construcción de filogenias también permite intuir el tiempo que ha llevado la divergencia de un linaje,
y existen diversos mecanismos para hacerlo, por ejemplo al estimar la tasa de evolución molecular.
La construcción filogenética nos da a conocer la organización de los seres vivos donde explica los
métodos existentes para dicha clasificación filogenética como el método de parsimonia; este busca e
identifica el árbol filogenético. Cuando se habla de reconstrucción filogenética a nivel molecular
permite trazar las relaciones entre secuencias; las secuencias se pueden distinguir con una unidad
taxonómica la cual puede representar una especie, a un individuo, a una población y a un gen en
algunos casos (Dorcas, 2011); Dependiendo cuales sean las unidades taxonómicas que se están
comparando el árbol filogenético indicará distintos aspectos de la evolución, por ejemplo, se podría
representar como se ha producido la diferenciación de especies o como se han originado las
secuencias presentes en una población (Ferriz,2012). El método UPGMA es un método de
clasificación que se basa en la identificación de las parejas que son más similares entre sí, en el
cálculo de la media de las distancias entre ellas y el resto de secuencias para reconstruir un árbol; es el
método más simple puesto que supone que las tasas de evolución son más o menos constantes entre
las diferentes secuencias o linajes, por esta razón existiría una relación lineal aproximada entre
distancia de evolución y tiempo de divergencia (Olivares, 2008).
MATERIALES Y MÉTODOS
● Ejercicio 1
Para el desarrollo del primer ejercicio titulado “ reconocimiento de caracteres, estados y construcción
manual de un cladograma” en donde se ilustraban en total ocho especies de turbelarios comensales
(Platyhelminthes) que constituyen un grupo monofilético, se realizó una lista con todos los caracteres
posibles para así establecer la matriz, se realizó un cladograma según la regla de inclusión/exclusión,
posterior a esto se desarrolló un cladograma en donde se reconocieron los diferentes grupos
monofiléticos y se detallaron las homoplasias autapomorfías y sinapomorfías del árbol.
● Ejercicio 2
Para este ejercicio titulado “ Alineación manual de secuencias de ADN y construcción de
cladograma” se elaboró en base a unas secuencias de nucleótidos en donde se postularon tres
diferentes alineamientos de estas secuencias, con esto se aplicaron los conceptos asignación de
costos a las sustituciones y gaps y mediante esto se realizaron diferentes cladogramas para los
diferentes taxones
● Ejercicio 3
Para el desarrollo de esta actividad, se ingresó a GenBank y se descargaron las secuencias del
marcador genético de la subunidad I de la citocromo c oxidasa para las especies: Taenia arctos
(JF261319.1), Taenia crassiceps (AB033411.1), Taenia hydatigena (AB033410.1), Taenia serialis
(AM503319.1), Taenia solium (DQ202385.1), Taenia taeniaeformis (AB221484.1) y Taenia saginata
(AB033409.1), esta secuencia se obtuvo colocando los códigos, los cuales están siguientes a los
nombres científicos de las especies, por ejemplo, AB033410.1. Luego, se ingresó el código en el
NCBI, se cuantificó el número de bases que tiene cada secuencia para cada individuo, también se
visualizaron las secuencias mediante la opción FASTA, esta opción está en la parte superior derecha,
dando click primero a “Send to”; luego se seleccionó “Coding sequences”; se colocó en formato
“FASTA” y se dio click en “Create file”. Posteriormente, se colocaron las siete secuencias en un bloc
de notas y se guardó el archivo en el ordenador. Después, se realizó un alineamiento múltiple de las
secuencias con el programa ClustalW, este programa se encuentra en EMBL-EBI. Una vez se obtuvo
el alineamiento, se ingresó en EMBL-EBI phylogeny y se configuró de la siguiente manera:
Tree format: Default
Distance correction: off
Exclude gaps: off
Clustering method: Neighbor joining o UPGMA
PIM: off.
Ya configurado el programa, se dio click en “Submit”, se realizaron dos árboles filogenéticos, uno
mediante Neighbor Joining y otro mediante UPGMA.
● Ejercicio 4
Se realizó la misma actividad que en el ejercicio anterior, sin embargo, en este ejercicio, se cambió el
organismo de estudio y el marcador genético, para los animales se podrían usar el gen mitocondrial
COI grupos como aves, peces, mamíferos, insectos, para hongos la región ITS, para plantas los genes
rbcL y matK. Posteriormente, se descargó en formato “FASTA”, se organizó la matriz de las
secuencias en un bloc de notas, se implementó un alineamiento múltiple ClustalW y se guardó el
archivo. Por último, se obtuvo el árbol filogenético por Neighbor Joining.
Resultados
● Ejercicio 1
Para establecer los carácteres y su relación entre sí, se plantea la siguiente tabla que permite
relacionar a los individuos. En esta tabla el número (1) indica presencia del carácter y el
número (0) ausencia del mismo. Aunque cabe aclarar que para el carácter (ov) que lo
presentan todos los individuos el número cero indica la presencia de un solo ovario y el
número 1 la presencia de más de un ovario.
a f g i n o ov p t te ve vi vs
A 0 1 1 1 1 1 0 0 1 1 1 0 1
B 1 1 1 1 1 1 1 1 1 1 0 1 1
C 0 1 0 1 1 0 0 1 1 1 1 0 1
D 1 1 1 1 0 1 1 1 1 1 1 1 1
E 1 1 1 1 1 1 1 1 1 1 1 1 1
F 0 1 0 1 1 1 0 1 1 1 0 0 1
G 1 1 1 1 0 1 1 1 1 1 1 1 1
H 0 1 0 1 1 0 0 1 1 1 1 0 0
[Tabla 1] Lista de caracteres para las ocho especies hipotéticas de turbelarios comensales
● Ejercicio 2
Taxon 1. T G G T T G A C A A C C A T G A A
Taxón 2. T G G A T T G A C A A C C A T G
Taxón 3. T G G A T T G A C A A C C G T A
Taxòn 4 . T T G A C A A C C G T
Taxon 5. T C G A C T C A A T T G T G
Para los alineamientos alternativos de las secuencias, se escogieron distintos criterios para la
asignación de costos a los sustituciones y gaps (X) negrita para la sustitución de nucleótidos
y (-) para la deleción de nucleótidos o gaps.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Taxòn T G G T - T G A C A A C C A T G A A
1
Taxón T G G A T T G A C A A C C A T G - -
2
Taxón T G G A T T G A C A A C C G T A - -
3
Taxòn T - - - - T G A C A A C C G T - - -
4
Taxòn T C G A C T - - C A A T T G T G - -
5
[Tabla 2] Matriz de secuencia para alineamiento alternativo 1
● Para este primer alineamiento (tabla 2) se usó como criterio que la alineación se diera tanto en
el inicio, a la mitad de la secuencia como al finalizarla; como se puede observar se
presentaron 16 deleciones de nucleótidos y 9 sustituciones de nucleótidos, no obstante, se
obtuvo que de las 18 pares de bases 6 se alinearon completamente (T, T, C,A,A,T). Sin
embargo la secuencia del taxón 1 se prolongó debido a la deleción de un nucleótido lo que
ocasionó que las secuencias de los otros taxones se prolongarán también.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Taxon T G G - T T G A C A A C C C T G A A
1
Taxón T G G A T T G A C A A C C A T G - -
2
Taxón T G G A T T G A C A A C C G T - A -
3
Taxon - - - - T T G A C A A C C G T - - -
4
Taxon T C G A C T C A - - A T T G T G - -
5
[Tabla 3] Matriz de secuencia para alineamiento alternativo 2
Para el segundo alineamiento alternativo se tuvo como criterio que la alineación se diera desde la
mitad de la secuencia y al finalizar; como se puede observar se presentaron 16 deleciones de
nucleótidos o gaps y 8 sustituciones de nucleótidos donde de las 18 pares de bases 4 se alinearon
completamente (T, A, A, T)
Alineamiento alternativo 3:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Taxòn T - G G T T G A C A A C C A T G A A
1
Taxón T G G A T T G A C A A C C A T G - -
2
Taxón T G G A T T G A C A A C C G T - A -
3
Taxòn - - - - T T G A C A A C C G T - - -
4
Taxòn - - - - T C G A C T C A A T T G T G
5
[Tabla 4] Matriz de secuencia para alineamiento alternativo 2
Esta figura muestra la filogenia obtenida a partir del alineamiento realizado por ClustalW. La
configuración que se realizó, para la filogenia fue: Tree format: Default / Distance correction: off /
Exclude gaps: off / Clustering method: Neighbor joining / PIM: off. La primera especie que aparece es
Taenia arctos.
Esta figura muestra la filogenia obtenida a partir del alineamiento realizado por ClustalW. La
configuración que se realizó, para la filogenia fue, el mismo que el de la figura 1 a diferencia que la
configuración en Clustering method es UPGMA. La primera especie que aparece es Taenia arctos.
● Ejercicio 4
● Neighbor joining: Esta configuración se realizó con los siguientes parámetros FORMATO
DE ÁRBOL (Defecto), CORRECCIÓN DE DISTANCIA (apagado) EXCLUIR BRECHAS
(apagado) MÉTODO DE AGRUPACIÓN (Unión de vecinos) PIM (apagado)
La regla de inclusión / exclusión empleada para organizar y clasificar los carácteres va a permitir
formar grupos a partir de un grupo de caracteres incluyendo o excluyendo subgrupos dentro de una
misma hipótesis, lo cual lleva a formar una sola explicación histórica (Amarilla, L. et al. 2017).
Además este tipo de organización permite establecer los estados apomórficos compartidos o las
sinapomorfías por los grupos establecidos.En el caso del árbol filogenético formado se puede decir
que este cumple con el principio de parsimonia, pues no fue necesario emplear más de una vez algún
carácter para poder definir los taxones y como la regla de inclusión / exclusión permite formar una
sola explicación histórica entonces podemos decir que pueden llegar a presentarse caracteres similares
a partir de distintos mecanismos evolutivos determinados por las presiones en el medio. estos
carácteres similares son denominados homoplasias y hacen referencia a los cambios paralelos
adquiridos independientemente (Casanova, P. & Boix, J. 2020) y son: la ventosa y los ojos.
Finalmente en cuanto a las autapomorfías y sinapomorfias que son los caracteres que definen
específicamente cada taxón y los carácteres que agrupan los taxones, se encuentran especificados en
el árbol filogenético construido para este ejercicio [Figura 1].
Para el segundo ejercicio se hicieron lineamientos alternativos de secuencias entre diferentes taxones.
Para comprender un lineamiento es una hipótesis acerca de las homologías posicionales que hay entre
bases (caracteres) de individuos distintos. El alineamiento de secuencias se basa en la comparación de
dos secuencias homólogas para encontrar las inserciones, deleciones o cambios puntuales en los
nucleótidos que se hayan podido crear en el desarrollo de divergencia de las dos a partir del ancestro
en común; de esta forma una vez que ambas secuencias quedan alineadas se van a crear 3 tipos de
pares de alineamiento: emparejamientos, no emparejamientos y huecos. Este es un paso crucial para la
reconstrucción del árbol filogenético puesto que la sustitución podría ser realizada ya sea por
transición o transversión lo que hace que no sea factible diferenciar entre deleción o inserción debido
a que no se puede saber cual de los dos ocurrió lo que genera que se realice distintas interpretaciones
(Lopez, 2012). No obstante, la sustitución es un tipo de mutación donde se sustituyen un par de bases
diferentes, además, tiene correlación con la sustitución de un aminoácido en una aminoácido en una
proteína por un aminoácido distinto. Por otra parte, las bases nitrogenadas son : Adenina(A), Timina
(T), Guanina (G) y Citosina (C) estas se encuentran en el ADN el cual está formado por los pares
Citosina- Guanina y Adenina- timina entre las dos hélices (Gàlvez, 2009); por esta razón de los tres
lineamientos alternativos la que más se adecua es la primera en razón de que se tuvo como criterio la
alineación desde el principio, a mitad de la secuencia y al finalizar obteniendo una máxima
verosimilitud, parsimonia e inferencia bayesiana (Mesa et al.,2011), por el uso de gaps que retribuyen
a deleciones o inserciones se logra la alineación de 6/18 pares de bases (T, T, C, A, A, T) siendo en el
que hubo mayor número de coincidencias a diferencia de los otros lineamientos alternativos que
fueron menores, el segundo alineamiento tuvo 4/18 pares de bases (T, A, A, T) y por último el tercer
lineamiento alternativo consiguió 5/18 pares de bases ( T,G,A,C,T) por lo que los taxones analizados
en base a la secuencia original al taxón 1, nos conlleva a pensar que las secuencias aun siendo de
taxones distintos lograron mecanismos en la evolución molecular consiguiendo diferentes caracteres
y nuevas especies.
Para la filogenia de UPGMA y la de Neighbor joining (NJ), relacionan la especie Taenia arctos con la
especie Taenia solium, para la primera ramificación. Para la segunda ramificación, se relacionan las
especies, Taenia serialis, con la especie, Taenia saginata, esta misma relación de las cuatro especies,
para ambas filogenias se debe a que las distancias evolutivas se calcularon mediante Máxima
Verosimilitud Compuesta, las unidades del número de sustituciones de bases por sitio y las posiciones
de codón incluidas fueron 1ª+2ª+3ª+ sin codificación, es decir, ambos programas comparten ciertos
criterios o formas para el desarrollo de filogenias, de ahí las similitudes, entres los programas.
(MEGA)
Para la filogenia de Neighbor-Joining, se relacionan las especies, Taenia crassiceps y Taenia
taeniaeformis, dejando separado a la especie, Taenia hydatigena, separándose estas tres, de las
especies del párrafo anterior. Mientras que la filogenia por UPGMA, las tres especies anteriormente
mencionadas, se encuentran separadas, sin embargo, Taenia hydatigena y Taenia crassiceps, se
encuentran relacionadas con las cuatro especies del párrafo anterior.
Estas diferencias pueden deberse a que para NJ, no considera ancestros intermedios entre los nodos
existentes, es decir, no toma en cuenta la relación ancestro–descendientes, tampoco considera el
principio de descendencia con modificación, por lo tanto, el árbol que se obtiene usando NJ no refleja
relaciones evolutivas, es más como, una representación del grado de similaridad de los terminales.
(Peña, 2011) Este método se usa para identificar individuos cuando es desconocida su especie,
también se puede descubrir especies crípticas. Esto puede ser viable cuando la variabilidad
intra-específica de dicha secuencia es menor que la variación existente entre especies diferentes. El
algoritmo NJ, consiste en generar un único árbol filogenético, que no necesariamente será el
verdadero. En el paso inicial, se unen los dos neighbors (secuencias) que tengan la menor distancia
genética, este par inicial se considera como una sola entidad y se busca el siguiente terminal que tenga
la menor distancia genética con este. El procedimiento continúa hasta unir todos los terminales al
“árbol filogenético”, la distancia genética entre dos terminales, se calcula en base al número total de
sustituciones de bases nitrogenadas diferentes, seleccionando los terminales que tengan menor
distancia genética. Construyendo el “árbol filogenético” agregando terminales tomando como
información los valores de la matriz de distancias. (Guerrero J., et al. 2005)
Mientras que UPGMA, asume que las especies son grupos por sí mismas, luego relaciona los dos
grupos más cercanos basado en la matriz de distancias, recalcula la matriz de distancia y repite el
proceso hasta que todas las especies estén conectadas a un único grupo. El método UPGMA realiza
todos sus cálculos con la matriz calculada hallando la distancia genética entre las OTUs. (Acero S.,
2007) Este método es conveniente usarlo cuando se cumple la hipótesis de reloj molecular, es decir,
cuando todas las secuencias han evolucionado a la misma velocidad, ya que, genera árboles
ultramétricos. (COMAV., 2017)
REFERENCIAS