Homoloxía de secuencias

semellanza entre proteínas ou ácidos nucleicos pola mesma orixe evolutiva

En xenética e bioloxía molecular, o termo homoloxía de secuencias refírese á semellanza que presentan as secuencias de dúas ou máis proteínas ou ácidos nucleicos debido a que teñen unha mesma orixe evolutiva. Xeralmente pode concluírse que dúas secuencias son homólogas entre si se hai unha gran similitude entre elas. Non obstante, a similitude de secuencias é un resultado que procede directamente da observación, mentres que a homoloxía é unha interpretación de que esa alta similitude entre as dúas secuencias se debe a que as mesmas posúen unha orixe común. De feito, unha alta similitude de secuencias pode deberse simplemente á casualidade (nas secuencias curtas, por exemplo).

Un aliñamento de secuencias feito por medio de ClustalO, de proteínas histonas de mamíferos.
As secuencias son dos residuos de aminoácidos 120 a 180 das proteínas. Os residuos que están conservados en todas as secuencias están salientados en gris. Debaixo das secuencias de proteínas hai unha clave que indica a secuencia conservada (*), mutacións conservadoras (:), mutacións semiconservadoras (.) e mutacións non conservadoras ( ).[1]
Un aliñamento de secuencias de dúas proteínas, obtido por medio de ClustalW.

Existen varios algoritmos que se poden usar para agrupar secuencias en familias, as cales son xogos de secuencias mutuamente homólogas (véxase, aliñamento de secuencias). Algunhas das bases de datos biolóxicas que almacenan secuencias homólogas de xenomas animais son, por exemplo, HOVERGEN,[2] HOMOLENS,[3] HOGENOM.[4]

Na rama xenómica da bioinformática, úsase o concepto de homoloxía de secuencias para predicir a función dun xene: se a secuencia do xene A, de función coñecida, é homóloga á secuencia do xene B, de función descoñecida, pode inferirse que B podería ter a mesma función que A.[5] Na rama estrutural da bioinformática, a homoloxía úsase para determinar que partes dunha proteína son importantes na formación da estrutura e na interacción con outras proteínas. Na técnica denominada modelaxe por homoloxía, esta información utilízase para predicir a estrutura dunha proteína unha vez coñecida a estrutura dunha proteína homóloga.[6]

Tipos de secuencias homólogas

editar

As secuencias homólogas poden ser ortólogas ou parálogas.[7]

Xenes ou secuencias ortólogas

editar

As secuencias ou xenes ortólogos son aquelas secuencias homólogas que se separaron por un evento de especiación. É dicir, cando unha especie diverxe en dúas especies separadas, dise que as copias diverxentes dun mesmo xene nas especies resultantes son ortólogas. Noutras palabras, as secuencias ortólogas son as secuencias que se encontran en diferentes especies e que son moi similares debido a que se orixinaron por descendencia vertical a partir dunha soa secuencia presente nun antepasado común. O termo "ortólogo" referido aos xenes acuñouno en 1970 Walter Fitch[8]

A ortoloxía defínese estritamente en termos de antepasados filoxenéticos, e como a ascendencia exacta dos xenes de diferentes organismos é ás veces difícil de determinar debido a posibles duplicacións xénicas e rearranxos xenómicos, a evidencia máis concluínte de que dous xenes similares son ortólogos é que o indique o resultado da análise filoxenética da liñaxe dese xene. Os xenes que se encontran dentro do mesmo clado son ortólogos, xa que descenden do mesmo antepasado. Os xenes ortólogos xeralmente, pero non sempre, teñen a mesma función. As secuencias ortólogas proporcionan información útil en taxonomía e en estudos filoxenéticos. O patrón de diverxencia xenética pode utilizarse para inferir as relacións existentes entre especies. Dúas especies que están estreitamente relacionadas terán secuencias de ortólogos moi similares. Ao contrario, dúas especies filoxeneticamente afastadas presentarán unha grande diverxencia na secuencia dos xenes ou secuencias ortólogas baixo estudo.

Un exemplo de xene ortólogo é o xene de plantas FLU que codifica a proteína reguladora Flu, que está presente en Arabidopsis (planta superior pluricelular) e tamén en Chlamydomonas (alga verde unicelular). A versión que ten Chlamydomonas é máis complexa: cruza a membrana dúas veces en vez de só unha, contén dominios adicionais e sofre splicing alternativo. Porén, pode substituír plenamente á proteína moito máis simple de Arabidopsis se a transferimos do xenoma da alga ao da planta por enxeñaría xenética. A súa semellanza de secuencia significativa xunto co feito que compartan os mesmos dominios funcionais indican que estes dous xenes son ortólogos,[9] e foron herdados do antepasado común de algas e plantas.

Algunhas bases de datos biolóxicas proporcionan ferramentas para identificar e almacenar secuencias ortólogas. Por exemplo, en eucariotas OrthoMCL,[10] en mamíferos OrthoMaM,[11] en plantas OrthologID[12] e GreenPhylDB[13]

As estratexias de estudo baseadas en árbores filoxenéticas pretenden distinguir a especiación dos fenómenos de duplicación xénica comparando as árbores de xenes con árbores de especies, como se pon en funcionamento en recursos como TreeFam[14] e LOFT.[15] Unha terceira clase de enfoques híbridos son o uso de métodos heurísticos e filoxenéticos para construír grupos e determinar árbores, por exemplo Ortholuge,[16] EnsemblCompara GeneTrees[17] e HomoloGene.[18]

Xenes ou secuencias parálogas

editar

As secuencias homólogas denomínanse parálogas se a súa orixe foi un evento de duplicación no xenoma. Noutras palabras, se un xene dun organismo se duplica para ocupar dúas posicións diferentes no mesmo xenoma, entón as dúas copias son parálogas. Este tipo de semellanza entre xenes denomínase paraloxía.

As secuencias ou xenes parálogos tipicamente teñen a mesma ou similar función, pero moitas veces este non é o caso debido a que non existe a mesma forza selectiva orixinal que actúe sobre a copia duplicada do xene, e esta pode adquirir novas funcións por mutación e selección natural.

Os xenes parálogos a miúdo pertencen á mesma especie, pero non ter por que ser necesariamente así: por exemplo, o xene da hemoglobina humana e o xene da mioglobina de chimpancés son parálogos. Os parálogos poden dividirse en "parálogos en" (in-paralogs), que son pares de parálogos que se orixinaron despois dun episodio de especiación, e "parálogos fóra" (out-paralogs), que se orixinaron antes dun episodio de especiación. Os chamados "parálogos fóra entre especies" (between-species out-paralogs) son pares de parálogos que existen entre dous organismos debido a duplicacións antes da especiación, mentres que os "parálogos fóra dentro da especie" (within-species out-paralogs) son pares de parálogos que existen no mesmo organismo orixinados por un episodio de duplicación antes da especiación.

As secuencias parálogas dannos unha útil perspectiva para entender como evolucionan os xenomas. Os xenes mencionados da mioglobina e hemoglobina considéranse parálogos antigos. De xeito similar, as catro clases coñecidas de hemoglobinas (hemoglobina A, hemoglobina A2, hemoglobina B, e hemoglobina F) son parálogos entre si. Aínda que todas estas proteínas exercen unha función similar no transporte de oxíxeno, a súa función xa diverxiu lixeiramente: a hemoglobina fetal (hemoglobina F) ten unha maior afinidade polo oxíxeno que a do adulto. Porén, a función non sempre se conserva nos parálogos, como ocorre, por exemplo, na anxioxenina humana, que diverxiu da ribonuclease, conservando unha estrutura terciaria similar pero adquirindo funcións moi diferentes.

Xeralmente se considera que os ortólogos son máis similares funcionalmente que os parálogos con diverxencia similar, pero varias publicacións puxeron en cuestión esta idea.[19][20][21]

Casos especiais

editar

Xenes ou secuencias ohnólogas

editar

Os xenes ohnólogos son xenes parálogos que se orixinaron por un proceso de duplicación de xenoma completo. O nome procede do apelido de Susumu Ohno e foille dado por Ken Wolfe.[22] Os xenes ohnólogos son interesantes nas análises evolutivas porque todos diverxiron durante un período de tempo de igual duración desde a súa orixe común.

Xenes ou secuencias xenólogas

editar

Os xenes homólogos que se orixinan por unha transferencia horizontal de xenes entre dous organismos denomínanse xenólogos. Os xenólogos poden ter diferentes funcións se o novo ambiente no que ten que funcionar o xene que se transferiu horizontalmente é moi diferente do orixinal. Pero, en xeral, os xenes xenólogos teñen unha función similar nos dous organismos. O termo acuñouno Walter Fitch.[23]

Xenes ou secuencias gametólogas

editar

Os xenes gametólogos prodúcense pola relación entre xenes homólogos en cromosomas de sexos opostos que non se recombinan. Os xenes gametólogos son o resultado do establecemento da determinación xenética do sexo e das barreiras que se crean para a recombinación entre os cromosomas sexuais. Exemplos de xenes gametólogos son o CHDW e o CHDZ en aves.

Xenes ou secuencias homeólogas

editar

Os cromosomas homeólogos (ou partes de cromosomas homeólogos) son aqueles que quedaron xuntos despois dunha hibridación interespecífica e alopoliploidización para formar un xenoma híbrido, e cuxa relación era completamente homóloga nunha especie ancestral.[24] En alopoliploides, os cromosomas homólogos dentro de cada subxenoma parental deberían emparellarse fielmente durante a meiose, orixinando unha herdanza disómica; porén nalgúns alopoliploides, os cromosomas homeólogos dos cromosomas parentais poden ser case tan similares entre si como os cromosomas homólogos, causando unha herdanza tetrasómica (cromosomas emparellados de catro en catro na meiose), recombinación interxenómica e redución da fertilidade.

  1. "Clustal FAQ #Symbols". Clustal. Arquivado dende o orixinal o 24 de outubro de 2016. Consultado o 8 December 2014. 
  2. HOVERGEN: Homologous Vertebrate Genes Database Arquivado 15 de xuño de 2012 en Wayback Machine.
    Duret L, Mouchiroud D, Gouy M (1994). "HOVERGEN: a database of homologous vertebrate genes". Nucleic Acids Res. 22 (12): 2360–5. PMC 523695. PMID 8036164. doi:10.1093/nar/22.12.2360. 
  3. HOMOLENS: Homologous Sequences in Ensembl Animal Genomes Arquivado 02 de maio de 2014 en Wayback Machine.
    Penel S, Arigon AM, Dufayard JF; et al. (2009). "Databases of homologous gene families for comparative genomics". BMC Bioinformatics 10 (Suppl 6): S3. PMC 2697650. PMID 19534752. doi:10.1186/1471-2105-10-S6-S3. 
  4. HOGENOM : Database of Complete Genome Homologous Genes Families
  5. Pellegrini, M.; et al. (1999). "Assigning protein functions by comparative genome analysis: Protein phylogenetic profiles" (PDF). Proceedings of the National Academy of Sciences (EE.UU.) 96 (8). 4285-4288. 
  6. Martí-Renom, M. A.; et al. (2000). "Comparative Protein Structure Modeling of Genes and Genomes" (PDF). Annual Review of Biophysics and Biomolecular Structure 29. Páxs. 291-325. 
  7. Koonin EV (2005). "Orthologs, paralogs, and evolutionary genomics". Annu. Rev. Genet. 39: 309–38. PMID 16285863. doi:10.1146/annurev.genet.39.073003.114725. Arquivado dende o orixinal o 30 de maio de 2020. Consultado o 02 de maio de 2014. 
  8. Fitch, W.M. 1970. Distinguishing Homologous from Analogous Proteins. Systematic Zoology Syst Biol 19: 99-113.
  9. A Falciatore, L Merendino, F Barneche, M Ceol, R Meskauskiene, K Apel, JD Rochaix (2005). The FLP proteins act as regulators of chlorophyll synthesis in response to light and plastid signals in Chlamydomonas. Genes & Dev, 19:176-187 [1]
  10. OrthoMCL: Identification of Ortholog Groups for Eukaryotic Genomes
    Chen F, Mackey AJ, Stoeckert CJ, Roos DS (2006). "OrthoMCL-DB: querying a comprehensive multi-species collection of ortholog groups". Nucleic Acids Res. 34 (Database issue): D363–8. PMC 1347485. PMID 16381887. doi:10.1093/nar/gkj123. 
  11. OrthoMaM Arquivado 12 de abril de 2021 en Wayback Machine.
    Ranwez V, Delsuc F, Ranwez S, Belkhir K, Tilak MK, Douzery EJ (2007). "OrthoMaM: a database of orthologous genomic markers for placental mammal phylogenetics". BMC Evol. Biol. 7: 241. PMC 2249597. PMID 18053139. doi:10.1186/1471-2148-7-241. 
  12. OrthologID Arquivado 24 de febreiro de 2014 en Wayback Machine.
    Chiu JC, Lee EK, Egan MG, Sarkar IN, Coruzzi GM, DeSalle R (2006). "OrthologID: automation of genome-scale ortholog identification within a parsimony framework". Bioinformatics 22 (6): 699–707. PMID 16410324. doi:10.1093/bioinformatics/btk040. 
  13. GreenPhylDB Arquivado 29 de marzo de 2010 en Wayback Machine.
    Conte MG, Gaillard S, Lanau N, Rouard M, Périn C (2008). "GreenPhylDB: a database for plant comparative genomics". Nucleic Acids Res. 36 (Database issue): D991–8. PMC 2238940. PMID 17986457. doi:10.1093/nar/gkm934. 
  14. TreeFam: Tree families database
    Ruan J, Li H, Chen Z, Coghlan A, Coin LJ, Guo Y, Hériché JK, Hu Y, Kristiansen K, Li R, Liu T, Moses A, Qin J, Vang S, Vilella AJ, Ureta-Vidal A, Bolund L, Wang J, Durbin R (January 2008). "TreeFam: 2008 Update". Nucleic Acids Res. 36 (Database issue): D283–8. PMC 2238856. PMID 18056084. doi:10.1093/nar/gkm1005. 
  15. TreeFam: Tree families database
    van der Heijden RT, Snel B, van Noort V, Huynen MA (March 2007). "Orthology prediction at scalable resolution by phylogenetic tree analysis". BMC Bioinformatics 8: 83. PMC 1838432. PMID 17346331. doi:10.1186/1471-2105-8-83. 
  16. Fulton, DL; Li, YY, Laird, MR, Horsman, BG, Roche, FM, Brinkman, FS (2006-05-28). "Improving the specificity of high-throughput ortholog prediction". BMC Bioinformatics 7: 270. PMC 1524997. PMID 16729895. doi:10.1186/1471-2105-7-270. 
  17. Vilella, AJ; Severin, J, Ureta-Vidal, A, Heng, L, Durbin, R, Birney, E (February 2009). "EnsemblCompara GeneTrees: Complete, duplication-aware phylogenetic trees in vertebrates". Genome Research 19 (2): 327–35. PMC 2652215. PMID 19029536. doi:10.1101/gr.073585.107. 
  18. Sayers, EW; Barrett, T, Benson, DA, Bolton, E, Bryant, SH, Canese, K, Chetvernin, V, Church, DM, DiCuccio, M, Federhen, S, Feolo, M, Fingerman, IM, Geer, LY, Helmberg, W, Kapustin, Y, Landsman, D, Lipman, DJ, Lu, Z, Madden, TL, Madej, T, Maglott, DR, Marchler-Bauer, A, Miller, V, Mizrachi, I, Ostell, J, Panchenko, A, Phan, L, Pruitt, KD, Schuler, GD, Sequeira, E, Sherry, ST, Shumway, M, Sirotkin, K, Slotta, D, Souvorov, A, Starchenko, G, Tatusova, TA, Wagner, L, Wang, Y, Wilbur, WJ, Yaschenko, E, Ye, J (January 2011). "Database resources of the National Center for Biotechnology Information". Nucleic Acids Research 39 (Database issue): D38–51. PMC 3013733. PMID 21097890. doi:10.1093/nar/gkq1172. 
  19. Studer, Romain A.; Robinson-Rechavi (3/4/2009). "How confident can we be that orthologs are similar, but paralogs differ?". Trends in Genetics 25 (5): 210–216. PMID 19368988. doi:10.1016/j.tig.2009.03.004. 
  20. Nehrt, Nathan; Clark, Radivojac, Hahn (2011). Rzhetsky, Andrey, ed. "Testing the Ortholog Conjecture with Comparative Functional Genomic Data from Mammals". PLOS Computational Biology 7 (6): e1002073. PMC 3111532. PMID 21695233. doi:10.1371/journal.pcbi.1002073. 
  21. Eisen, Jonathan. "Special Guest Post & Discussion Invitation from Matthew Hahn on Ortholog Conjecture Paper". 
  22. Wolfe K (May 2000). "Robustness—it's not where you think it is". Nat. Genet. 25 (1): 3–4. PMID 10802639. doi:10.1038/75560. 
  23. Fitch WM (June 1970). "Distinguishing Homologous from Analogous Proteins". Syst. Zool. 19 (2): 99–113. PMID 5449325. doi:10.2307/2412448. 
  24. Glover, Natasha M.; Redestig, Henning; Dessimoz, Christophe (2016). "Homoeologs: What Are They and How Do We Infer Them?". Trends in Plant Science (Cell Press) 21 (7): 609–621. ISSN 1360-1385. PMC 4920642. PMID 27021699. doi:10.1016/j.tplants.2016.02.005. 

Véxase tamén

editar

Outros artigos

editar