Alineación de Secuencia Múltiple Con Clustal X
Alineación de Secuencia Múltiple Con Clustal X
Alineación de Secuencia Múltiple Con Clustal X
Una historia de los programas Clustal los programas de Clustal han sido desarrollo continuo por
ms de diez aos, por lo que las versiones disponibles no dar los mismos resultados. Esto puede
ser confuso a los nuevos usuarios; por lo tanto, sentimos que una corta historia de desarrollo
Clustal ayudara a aclarar los asuntos.
El primer programa Clustal2,3, escrito por Des Higgins en 1988, fue diseado para realizar una
alineacin eficiente en las PCs, que tena entonces una potencia informtica dbil por los
estndares actuales. Aprovech un alineacin recursiva eficiente en memoria algoritmo4 con la
alineacin progresiva estrategia introducida por Feng y Doolittle5 y Willie Taylor6. La esencia
alineacin progresiva es alinear la secuencias ms estrechamente relacionadas los difciles
divergentes duran. La precomparacin utiliz un mtodo rpido de FASTA bsqueda de palabras y
el dendrograma construido utilizando el mtodo UPGMA7,8. Los mens de texto simple hicieron
Clustal fcil de utilizar. Aunque concebido como un "pobre programa de alineacin del hombre,
cualquier persona que podra permitirse un microordenador, Clustal era en realidad uno de los
programas ms actualizados de su tipo.
Alan Bleasby y Rainer Fuchs ayudaron Higgins9 renovar ampliamente Clustal para un nuevo
lanzamiento, Clustal V, en 1992. Incorporaron alineaciones de perfil (alineaciones de viejas
alineaciones) y la facilidad para generar rboles de la alineacin mediante el uso rpido de Vecino-
Unin mtodo10. El usuario podra tambin probar el rbol para la robustez usando una prueba
simple de bootstrap de topologa de rbol. Julie Thompson y Toby Gibson colaboraron en la
tercera generacin, Clustal W (W para Ponderacin, que fue aplicado a secuencias y penalidades
gap) 12, que fue lanzado en 1994. Clustal W se parece mucho a Clustal V, pero hay muchas
diferencias internas. Incorporamos la brecha especfica de posicin penalidades para que se
puedan aplicar disminuido en los residuos hidroflicos y dondequiera que se introduzcan las
lagunas en la alineacin13. La secuencia de precomparacin en Clustal W usa ms sensibles la
programacin dinmica, que produce un dendrograma mucho mejor. Los dendrograma en s se
calcula ahora Vecino-Unir, que mejora el rbol topologa y proporciona un mtodo para ponderar
secuencias sobre la base de sus divergencias. En versiones posteriores de Clustal W, las mscaras
de brecha-pena pueden guiar la alineacin (por ejemplo, en los casos en que la informacin de la
estructura secundaria es disponible; ver Fig. 1). El programa puede tambin combinar alineaciones
juntas o agregar una lista de nuevas secuencias a una vieja alineacin, convirtindose as en una
herramienta de alineacin. Aunque hemos desarrollado Clustal W para funcionar en una
computadora local, numerosos Se han establecido servidores web - por ejemplo, en el EBI (http:
//www2.ebi.ac.uk/clustalw/).
Aunque las alineaciones producidas son los mismos que los producidos por la corriente de Clustal
W, el usuario puede mejor evaluar alineaciones en Clustal X (Ref. 1). Dentro de las alineaciones, se
conservan se destacan las columnas (con un color esquema que el usuario puede personalizar).
Figura 1. Captura de pantalla de una sesin con Clustal X en modo de ventana dividida para la
alineacin del perfil. Archaeal Las secuencias TFIIB (ventana inferior) estn alineadas con TFIIB
eucariotas prealignadas (ventana superior). Se ha aplicado una mscara estructural de la
estructura resuelta de TF2B_Human. Se muestran informacin estructural y las curvas de calidad
para cada alineacin. Horizontal los desplazamientos estn bloqueados. a / A, a-hlice.
Figura 2. Imagen de pantalla de NJplot que muestra un rbol calculado por Clustal X de la
alineacin TFIIB generada en la Fig. 1. La raz se coloca en la rama que une los eucariotas y
archaea. Las longitudes de ramificacin son proporcionales a la secuencia divergencia y se puede
medir con relacin a la barra mostrada (arriba a la derecha). Las etiquetas de rama registran la
estabilidad de las ramas ms de 1000 repeticiones bootstrap.
Introduccin a Clustal X
Los programas Clustal W y Clustal X tienen diseos autoexplicativos y en lnea ayuda est
disponible, de modo que programas no debera ser difcil. Por inexperto usuarios, el principal
obstculo parece estar consiguiendo que el programa lea sus secuencias. Se deben recoger las
secuencias en un solo archivo en un formato que Clustal puede leer. El formato ms simple es
FASTA, pero el EMBL y SWISSPROT los formatos de base de datos se pueden leer directamente.
Por lo general, el conjunto de secuencias ser exportado de algn otro anlisis de secuencias
paquete (la mayora de los cuales Formato FASTA). Los usuarios de la Web pueden extraer
conjuntos de secuencias de bases de datos a travs de SRS servidores (por ejemplo, desde
http://srs.ebi.ac.uk/).
En alineacin difcil casos, generalmente pagar a prueba diferentes parmetros. Los herramientas
de alineacin Clustal X puede ayudar mucho en evaluando los resultados de la alineacin.
Cundo y cmo usar Clustal X - y cuando no!
El amplio uso de Clustal W y X parecen implicar que siempre alinean las secuencias bien. De hecho,
esto es no siempre es as. La alineacin algoritmo ha sido optimizado alinear conjuntos de
secuencias que estn enteramente colineal - es decir, las secuencias tienen la misma protena
dominios y estos dominios estn en el mismo orden. Si no se cumple esta condicin (y muchas
veces no lo es), Clustal X pueden producir desalineaciones graves.
El programa Clustal X puede usarse para alinear cualquier grupo de protenas o secuencias de
cido que estn relacionadas con otros en toda su longitud.
Secuencias divergentes.
Clustal trata de alinear las secuencias ms estrechamente relacionadas primero, para construir un
representante perfil de la familia. Divergente secuencias se retrasan por defecto hasta este perfil
est disponible. Si solo tienes miembros divergentes de una familia, resultan en la mayora (si no
todas) de las secuencias ser retrasado, y la progresividad de la alineacin se pierde. En esto caso,
puede cambiar el parmetro de retardo o utilice el modo de alineacin de perfiles para impulsar el
orden de alineacin usted mismo. En casos extremos, las secuencias pueden simplemente ser
demasiado divergente para ser correctamente alineado.
Sesgo de composicin.
Clustal emplea posiciones especficas penalidades para ayudar a introducir brechas en las regiones
hidroflicas del alineacin. Por defecto, los residuos G, P, S, N, D, Q, E, K y R se consideran para ser
hidrfilo. Si sus secuencias muestran un sesgo en uno (o ms) de estos residuos, debe eliminar
residuo de la lista de Protein Gap Men Parmetros.
Pocas secuencias.
Una alineacin de un pequeo nmero (, 10) de muy lejano protenas podran ser poco fiables. T
debe comprobar tal alineamiento cuidadosamente
Los terminales no conservados deben ser removidos, o la opcin 'Usar Matriz Negativa' debe ser
invocado - de lo contrario un se puede producir una falsa alineacin.
Multidominio protenas que tienen complejo historias evolutivas a menudo comparten algunos,
pero no todos, del conjunto de dominio. Los alicientes producidos en estos casos ser impredecible.
A veces las personas intentar alinear un conjunto de fragmentos cortos a una sola secuencia de
referencia. Esto no funcionar en Clustal X. Si las secuencias no se superponen, por supuesto, no
tienen nada que ver, y el rbol gua y la ponderacin de secuencia generados son un disparate!
Encontrar otro manera de hacerlo.
Sin embargo, Clustal X no muestra rboles. Un simple programa de visualizacin de rboles, NJplot
(Ref. 14), se incluye en el ClustalX paquete de distribucin. Al igual que Clustal X, NJplot est
disponible para todas las plataformas informticas. NJplot lee el formato phylip rbol de salida de
Clustal X y muestra rboles como dendrogramas. Manipulaciones bsicas de las etiquetas de texto,
las el rerooting del rbol se puede realizar, pero la topologa de rbol subyacente no puede ser
cambiado. Tenga en cuenta que NeighbourJoining los rboles no estn enraizados, por lo que el
usuario debe decidir si existe una raz vlida o no. La figura 2 muestra un rbol generada por
Clustal X y mostrada por NJplot. Otros paquetes de visualizacin de rbol tiles incluyen TreeTool,
disponible para Sun UNIX only15 y TreeView, que se ejecuta en Macs / PCs16. Estos programas
pueden mostrar rboles tanto radialmente como en dendrogramas. Los alineamientos clustales
tambin pueden ser utilizados como insumos para rbol, tales como PHYLIP17, PhyloWin18 o
PAUP (que fue desarrollado por D. L. Swofford en el Smithsonian Institute).
Conclusin
En este artculo, ofrecemos algunas orientaciones que esperamos sea til a los usuarios de Clustal.
En el no demasiado lejano alineacin progresiva, la alineacin progresiva estrategia para los
ltimos diez aos probablemente quedar obsoleto. Iterativo estrategias de alineacin, como
PRRP19 y SAGA20, se inform que se desempean como bien, o mejor que, Clustal X para
pequeo nmero de secuencias, pero actualmente demasiado lento para manejar grandes
conjuntos de datos Las estrategias iterativas ms eficientes, cada vez ms potente computadoras
de escritorio, podra pronto alineaciones de alta calidad para todos los que los necesitan.