Predicion Genes
Predicion Genes
Predicion Genes
Herramientas personales
Contraer
WLE Austria Logo (no text).svgWiki Loves Earth:
¡sube tus fotos del patrimonio natural en Perú, ayuda a Wikipedia y gana!
Contenidos ocultar
Inicio
Antecedentes
Aproximaciones extrínsecas
Aproximaciones Ab Initio
Alternar subsección Aproximaciones Ab Initio
Otras señales
Aproximaciones por Genómica Comparativa
Referencias
Enlaces externos
Predicción de genes
Artículo
Discusión
Leer
Editar
Ver historial
Herramientas
Apariencia ocultar
Texto
Pequeño
Estándar
Grande
Anchura
Estándar
Ancho
Artículo bueno
Aproximaciones extrínsecas
En sistemas de predicción de genes basados en evidencias, en el genoma objetivo se
buscan secuencias que sean similares a la evidencia externa, que toma la forma de
una secuencia conocida de un ARN mensajero (ARNm) o producto proteico. Dada una
secuencia de ARNm, es trivial derivar una única secuencia genómica de ADN desde la
cual haya tenido que ser transcrita. Dada una secuencia de proteína, se puede
derivar por traducción reversa del código genético una familia de posibles
secuencias de ADN codificante. Una vez que las secuencias de ADN candidatas han
sido determinadas, es un problema algorítmico relativamente sencillo el buscar
eficientemente un genoma objetivo para las coincidencias, totales o parciales,
exactas o inexactas. BLAST es un sistema ampliamente utilizado para este propósito.
Aproximaciones Ab Initio
Dado el gasto y la dificultad inherentes a la obtención de evidencias extrínsecas
para muchos genes, es también necesario recurrir a la predicción de genes ab
initio, en la cual se busca, sistemáticamente y de forma exclusiva en la secuencia
genómica de ADN, ciertos signos reveladores de genes codificantes de proteínas.
Estos signos pueden ser categorizados, en líneas generales, bien como señales
(secuencias específicas que indican la presencia cercana de un gen), bien como
contenido (propiedades estadísticas de la propia secuencia codificante). El término
predicción de la expresión “predicción de genes ab initio” queda precisamente
caracterizado como tal puesto que la evidencia externa es generalmente necesaria
para establecer de forma concluyente que un supuesto gen es funcional.
Esquema de un marco abierto de lectura, que incluye los codones de inicio (o start)
y de parada (o stop).
En los genomas de los organismos procariotas, los genes tienen secuencias
promotoras (señales) específicas y relativamente bien conocidas, como la caja
Pribnow (Pribnow box) y los sitios de unión de los factores de transcripción, que
son fácilmente identificables de forma sistemática. Además, la secuencia
codificante para una proteína se presenta como un marco abierto de lectura (open
reading frame, ORF) contiguo, que típicamente mide varios centenares o miles de
pares de bases. Las estadísticas de los codones de parada son tales que encontrar
un marco abierto de lectura de esa longitud es prácticamente un signo informativo:
puesto que 3 de los 64 posibles codones en el código genético son codones de
parada, podría esperarse un codón de parada, aproximadamente, por cada 20-25
codones, o 60-75 pares de bases, en una secuencia aleatoria. Además, el ADN
codificante tiene ciertas periodicidades y otras propiedades estadísticas que son
fáciles de detectar en una secuencia de esta longitud. Estas características
convierten la predicción de genes en procariotas en algo relativamente sencillo, y
los sistemas bien diseñados son capaces de alcanzar altos niveles de precisión.
La predicción de genes en organismos eucariotas, especialmente en organismos tan
complejos como el ser humano, es considerablemente más desafiante por varias
razones. Primero, el promotor y otras señales regulatorias en estos genomas son más
complicadas y menos comprendidas que en los procariotas, haciéndolas más
complicadas de reconocer fidedignamente. Dos ejemplos clásicos de señales
identificadas por los descubridores de genes eucariotas son las islas CpG y los
sitios de unión para una cola poli-A.
Los predictores avanzados de genes para genomas tanto procariotas como eucariotas,
usan típicamente complejos modelos probabilísticos, como los modelos ocultos de
Márkov, para combinar información conseguida de una variedad de diferentes medidas
de señal y contenido. El sistema GLIMMER es un identificador de genes ampliamente
usado y muy preciso para organismos procariotas. GeneMark es otra aproximación
popular. Los predictores de genes ‘’ab initio’’, en comparación, han conseguido
sólo éxitos limitados. Ejemplos notables de estos son los programas GENSCAN y
geneid. Unos pocos programas, como CONTRAST usan aproximaciones de aprendizaje
automático, como máquinas de soporte vectorial, para una eficaz predicción de
genes.
Otras señales
Entre las señales utilizadas para la predicción de genes están las estadísticas
resultantes del análisis estadístico de sub-secuencias como k-meros (n-gramas de
secuencias de ácidos nucléicos o aminoácidos), la transformada de Fourier de un ADN
pseudo-numéricamente codificado, los parámetros de una Z-curva (curva
tridimensional relacionada biunívocamente con una determinada secuencia de ADN), y
ciertas características de su recorrido.3
Referencias
U.S. Dpt. of Energy Genome Research Programs (agosto de 2006). «Genomics and its
Impact on Science and Society» (pdf). Consultado el 2008.
U.S. Dpt. of Energy Genome Research Programs (2007). «Human Genome Project
Information: Bioinformatics» (html). Consultado el 2008.
Saeys Y, Rouzé P, Van de Peer Y (2007). «In search of the small ones: improved
prediction of short exons in vertebrates, plants, fungi and protists».
Bioinformatics 23 (4): 414-420. doi 10.1093/bioinformatics/btl639.
Hiller M, Pudimat R, Busch A, Backofen R (2006). «Using RNA secondary structures
to guide sequence motif finding towards single-stranded regions». Nucleic Acids Res
34 (17): e117. Entrez PubMed 16987907.
Patterson DJ, Yasuhara K, Ruzzo WL (2002). «Pre-mRNA secondary structure
prediction aids splice site prediction». Pac Symp Biocomput: 223-234. Entrez PubMed
11928478.
Marashi SA, Goodarzi H, Sadeghi M, Eslahchi C, Pezeshk H (2006). «Importance of
RNA secondary structure information for yeast donor and acceptor splice site
predictions by neural networks». Comput Biol Chem 30 (1): 50-57. Entrez PubMed
16386465.
Marashi SA, Eslahchi C, Pezeshk H, Sadeghi M (2006). «Impact of RNA structure on
the prediction of donor and acceptor splice sites». BMC Bioinformatics 7: 297.
Entrez PubMed 16772025.
Rogic, S (2006). "The role of pre-mRNA secondary structure in gene splicing in
Saccharomyces cerevisiae Archivado el 30 de mayo de 2009 en Wayback Machine.". PhD
Dissertation, University of British Columbia.
Enlaces externos
genefinding, repositorio de software y recursos para predicción de genes Archivado
el 30 de diciembre de 2019 en Wayback Machine.
Bibliografía sobre reconocimiento computacional de genes, por Wentian Li
geneid, software eficiente basado en el reconocimiento de señales funcionales
SGP2, que combina geneid con tblastx
Glimmer está orientado al descubrimiento de genes en bacterias y virus Archivado el
26 de agosto de 2011 en Wayback Machine.
GlimmerHMM utiliza Glimmer bajo modelos ocultos de Márkov generalizados Archivado
el 18 de agosto de 2011 en Wayback Machine.
GeneMapper, software que transfiere anotaciones de genomas bien referenciados a
otros en desarrollo
GenomeThreader es una herramienta para predecir la estructura génica
GENSCAN: servidor en línea del MIT para análisis de genes sobre ADN
Twinscan/N-SCAN, software y servidor de la Washington University
CHEMGENOME analiza genomas mediante propiedades físico-químicas
Software GeneMark con diferentes versiones para predicción de genes en procariotas
y eucariotas
Control de autoridades
Proyectos WikimediaWd Datos: Q1248292
Categorías: BioinformáticaBiología computacional
Esta página se editó por última vez el 20 sep 2023 a las 02:07.
El texto está disponible bajo la Licencia Creative Commons Atribución-
CompartirIgual 4.0; pueden aplicarse cláusulas adicionales. Al usar este sitio
aceptas nuestros términos de uso y nuestra política de privacidad.
Wikipedia® es una marca registrada de la Fundación Wikimedia, una organización sin
ánimo de lucro.
Política de privacidadAcerca de WikipediaLimitación de responsabilidadCódigo de
conductaDesarrolladoresEstadísticasDeclaración de cookiesVersión para
móvilesWikimedia FoundationPowered by MediaWiki