Cladistica 2-1
Cladistica 2-1
Cladistica 2-1
Métodos - Distancia
- Máxima parsimonia
- Máxima verosimilitud (maximum likehood)
- Inferencia bayesiana.
* Todos los metodos se pueden en los programas disponibles, eg. PAUP, PHYLIP, McClade, Mr. Bayes etc.
Comparación
de métodos
Distancia Máxima parsimonia Máxima verosimilitud (likelihood)
Utiliza sólo las distancias Utiliza solo caracteres derivados Utiliza todos los datos
pareadas compartidos
Minimiza la distancia entre Minimiza la distancia total Maximiza la probabilidad de un árbol dados
vecinos más cercanos los valores de parámetros específicos
Atrapado fácilmente en Supuestos fallan cuando la Depende mucho del modelo de evolución
óptimos locales evolución es rápida asumido
Bueno para generar árboles Buena opción cuando <30 taxa y Bueno para conjuntos de datos pequeños y
tentativos, o elegir entre varios la homoplasia es rara para probar árboles construidos con otros
árboles métodos
Distancia Los únicos en los cuales se construye un árbol → los demás se busca el mejor entre varios árboles.
- Los métodos de distancia son los únicos donde se reconstruye un árbol
Máxima - En los demás métodos se busca el árbol (de un número determinado de árboles existentes) que más se
parsimonia ajuste a nuestros datos (máxima parsimonia y máxima verosimilitud)
y máxima - Hay un montón de árboles y se escoge el árbol que mejor se ajuste a los datos que tenemos.
verosimilitu
d Parsimonia
- Primeros indicadores: cantidad de caracteres filogenéticos informativos para parsimonia.
- Los caracteres deben tener al menos 1 cambio y estar incluidos en al menos 2 taxas. si no cumple con estas
condiciones el programa no lo empleará para realizar la reconstrucción filogenética → Exceso de datos
- Se busca el que tenga menor número de pasos – Optimiza los números de datos.
Máxima verosimilitud
- El método de máxima verosimilitud busca el árbol máximo verosímil, es decir, el árbol que es más
probable que haya generado los datos que hemos observado.
En este método partimos un modelo de evolución
Inferencia Encuentra una región de árboles que representan bien mis datos (un pull de árboles)
bayesiana - La inferencia bayesiana encuentra rasgos o árboles con base la mayor probabilidad con base en la
probabilidad anterior.
- La inferencia bayesiana en filogenia genera la probabilidad posterior de un parámetro, un árbol filogenético
y/o un modelo evolutivo, basada en la probabilidad anterior de ese parámetro y la función de verosimilitud
de los datos
Distancia
Deriva genética
- La frecuencia de los rasgos puede cambiar en una población debido a eventos fortuitos
● Cambio aleatorio
● Incluye efectos fundadores y de cuello de botella
Distancia La distancia genética es una medida de la divergencia entre especies o entre poblaciones dentro de una especie.
genética
distancia
- Por cada dos secuencias, la distancia es un valor único basado en la fracción de posiciones en las que las
dos secuencias difieren, definida como la distancia p
- Modelo evolutivo específico: Aplicación de un modelo evolutivo específico que hace suposiciones
particulares sobre la naturaleza de los cambios evolutivos
Especies - En especies lejanas: Puede ocurrir que el cambio sea tanto que eventualmente vuelve a lo mismo, esto
lejanas debido a que solo se tienen 4 bases nucleotídicas, por ello pueden haber pasado por todas o casi todas las
combinaciones y terminar regresando a lo mismo.
Modelo - Transiciones: Sucede cuando no hay un cambio químico en la composición de las bases A ↔ G y C ↔T
evolutivo - Transversiones Sucede cuando hay un cambio químico en la composición de las bases A ↔ C, A ↔ T, G
↔ C o G ↔T.
- Las seis posibles patrones de sustituciones para los datos nucleotídicos
Dos métodos - Los principales métodos de construcción de árboles basados en la distancia son:
● Clúster
● Mínima evolución.
Pasos:
- Escoge primero las especies más cercanas.
- La distancia genética se divide a la mitad.
- Ahora ya están juntas, pongo la distancia genética de la especie 3 y lo resto con el valor del nodo de 1 y 2
(corresponde a la mitad de la distancia)
- El valor de la diferencia corresponde al valor de la línea que sale del nodo
- El valor de la distancia de 3 se pone en la línea que da hasta el presente
- Toma las especies más cercanas en la matriz donde 1 es idéntico y 0 distintas
Problema de Los métodos de agrupamiento son extremadamente sensibles a tasas desiguales en diferentes linajes.
cluster
Mínima Debido a las serias limitaciones de los métodos ordinarios de agrupamiento, se han desarrollado algoritmos para
evolución reconstruir los llamados árboles de distancia aditivos.
● Las distancia genéticas entre un par de OTUs es igual a la suma de las longitudes de las ramas que los
conectan, en lugar de un promedio.
● En ME, el árbol que minimiza las longitudes del árbol, que a su vez es la suma de las longitudes de las
ramas, es considerado como la mejor estimación filogenética.
Problemas ● Un inconveniente del método ME es que, en principio, todas las diferentes topologías de árboles tienen que
Mínima ser investigados para encontrar el árbol mínimo.
evolución
Solución heurística: Vecino más cercano
Los métodos de agrupamiento agruparían erróneamente las secuencias A y C, ya que asumen un comportamiento
similar al de un reloj. Aunque las secuencias A y C parecen más similares, las secuencias A y B están más
estrechamente relacionadas → pues se tienen en cuenta los nodos y no las taxas
Maxima parsimonia
Presunción Presunción implícita : el cambio evolutivo es poco común → por que asume la menor cantidad de pasos
implicita
Que intenta Intenta maximizar la homología (Encuentra las presuntas homologias) y minimizar la homoplasia.
- ¿De que depende el arbol? El árbol depende solamente de los caracteres filogenéticamente informativos
Los sitios - Son aquellos que tengan → Al menos dos estados de carácter diferentes y con al menos dos taxa en cada
filogenéticam uno
ente - Estos son los caracteres usados para inferir la filogenia el árbol evolutivo.
informativos
Problema de - Con 9 taxa , es mas probable ser golpeado por un rayo (odds 3:100 000) que de encontrar y
parsimonia seleccionar el mejor árbol de manera aleatoria (odds 1:135, 135). Con un
- poco mas de 50 taxa , el numero de
- topologías supera la cantidad de átomos en
- el universo y aun así esto sigue siendo un
- problema filogenético pequeño.
-
Aplicacion queremos saber la P (árbol/datos), esto requiere considerar todos los árboles posibles, lo cual es prácticamente
de los arboles imposible. En lugar podemos calcular P (datos/árbol) y seleccionar el árbol en el cual la probabilidad sea la mayor.
- Esto requiere que se consideren todos los posibles sets de datos (del mismo tamaño).
-
- la probabilidad
- probabilidad