Biomol - Informe S12
Biomol - Informe S12
Biomol - Informe S12
BIOLOGÍA MOLECULAR
INFORME: Análisis bioinformático de secuencias proteicas
MESA: 3
GRUPO DE PRÁCTICA: 2
DOCENTE:
● Julio Solis Sarmiento
INTEGRANTES:
- Justino Chavez, Alem Grimaldi (22100048)
- Polanco Diaz, Carlos Polanco (22100040)
- Ramos Huerta, Cristhofer Brayan (21100110)
- Ushñahua Santos, Dariel Abner (22100044)
- Valverde Vilcherrez, Ana Karla (22100138)
LIMA - PERÚ
2024
INTRODUCCIÓN
El análisis bioinformático de secuencias proteicas es una disciplina que integra biología,
informática y matemáticas para estudiar las proteínas a nivel molecular. Las proteínas son
fundamentales para los procesos biológicos, y su análisis permite identificar, comparar y
predecir su estructura y función a partir de sus secuencias de aminoácidos. Los principales
objetivos incluyen la identificación de proteínas desconocidas, la predicción de estructuras
tridimensionales, el análisis evolutivo y la determinación de funcionalidades y dominios
proteicos (Can, T; 2014).
Las herramientas y métodos utilizados en este campo son variados e incluyen alineación de
secuencias mediante herramientas como BLAST y Clustal Omega, bases de datos como
UniProt, NCBI y PDB, además de programas de predicción de estructuras como Phyre2 y
AlphaFold. Por otro lado, el modelado molecular y la dinámica molecular son técnicas
cruciales para simular el comportamiento de las proteínas en diversas condiciones, ayudando
a entender su estabilidad y funcionalidad (Altschul, S; et al. 1990).
Las aplicaciones del análisis bioinformático de secuencias proteicas son amplias, abarcando
la medicina, la biotecnología y la investigación básica. En medicina, este análisis facilita el
diseño de nuevos fármacos y terapias proteicas; en biotecnología, permite la ingeniería de
enzimas y proteínas específicas; y en la investigación básica, proporciona una comprensión
profunda de los mecanismos biológicos a nivel celular y molecular. En conjunto, esta
disciplina es esencial para el avance de la biología moderna y sus aplicaciones tecnológicas
(Can, T; 2014).
me caen mal, onvrez, no resuelven, esperan que todo se los den fácil, la csmr, odio, odio, odio, odio
tengo hambre, por eso tengo odio, se me pasará cuando cene, pero mientras tanto, odio, odio, odio,
sepan resolver, la csmr
Estructura 3d de la proteína:
● Cistein proteasa - Caspasa
Estructura 3d de la proteína:
b) Defensinas de humanos
c) Defensinas de ratón
3. Realizar una búsqueda con siguiente símbolo: pdf2.1 Identificar cuáles son los otros
nombres o símbolos con que se conoce a esta proteína pdf2.1 en Arabidopsis thaliana.
Codigo PDF2.1
Sinonimos:
4. Realizar búsqueda de: afp4 raphanus. Percatarse del número de entrada (entry) en Uniprot
correspondiente a esta proteína. Identificar como se identifica a este péptido en la sgte
publicación: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC160805
Identificación en la publicación:
>secuencia X0
MSWFFTLLFLISSLSLTTPSEASHEKKPPSAVVVGTVYCDTCFQAEFSHASHFISGASVGVECK
DGSSKPSFQTEVKTDSHGVFRVHLPFSVSKRVKKIEGCSVKLISSSEPYCAVSSTATSSSLHLKS
SEQGTYIFSAGFFTFKPLKQPSLCNQKPSIPNSKEFSSQKSSFPGIPVTSPFPGKTTKAGQLTDKK
VGLPGLPGTGLPGLPGLPGIPQLTPFTGKNTKGGQLTDKKLLGLPGLPGLPGLPGLPGLPGLPG
LPGLPGLPGLPGLPGLGKAGQLNDKKVARPDTSFTTPQIPKTSLPPNPSPPTSRIPGIPRASSKQT
TSP
a. Código FASTA
a. Código FASTA
TAREA 1
Revise el concepto de homología y paralogia. ¿Qué aplicaciones tienen dichos conceptos en análisis
biológico y bioinformático? Además, explore los tipos de mutaciones en ácidos nucleicos y cómo
pueden utilizarse estos conceptos en los objetivos de comparación o alineamiento de secuencias.
Con respecto a las mutaciones en ácidos nucleicos estos son cambios en la secuencia de ADN o ARN
que pueden afectar la estructura y función de genes y proteínas. Comprender los tipos de mutaciones,
como puntuales, inserciones y deleciones (indels), duplicaciones, inversiones, translocaciones y
frameshift, es crucial en biología molecular y bioinformática. Las mutaciones puntuales incluyen
transiciones (cambio de una purina por otra purina o de una pirimidina por otra pirimidina) y
transversiones (cambio de una purina por una pirimidina o viceversa). Las inserciones y deleciones
añaden o eliminan nucleótidos, las duplicaciones copian segmentos de ADN, las inversiones revierten
segmentos, y las translocaciones mueven segmentos de una ubicación a otra. Las mutaciones
frameshift alteran el marco de lectura de un gen. En la comparación de secuencias, estos conceptos
son clave para detectar homología y construir árboles filogenéticos. Las mutaciones puntuales y los
indels ayudan a identificar genes homólogos y a inferir relaciones evolutivas. Los algoritmos de
alineamiento, como Needleman-Wunsch y Smith-Waterman, utilizan matrices de sustitución y
penalizaciones por gaps para realizar alineamientos precisos. La detección de variación genética se
beneficia del análisis de mutaciones, como los SNPs y los indels, que se usan en estudios de variación
genética y asociación de rasgos. El análisis funcional de mutaciones permite predecir los efectos de
frameshift, duplicaciones y translocaciones en proteínas. Herramientas bioinformáticas modelan estas
mutaciones para estudiar sus consecuencias y el análisis de conservación funcional ayuda a identificar
dominios críticos en proteínas (Alberts, B; et al. 2014).
TAREA 2
a. Identificar una proteína de interés en eucariotas (enzima, transportador, etc). Utilice sus
conocimientos de Bioquímica para elegir dicha proteína. Reporte el identificador (número de
accession o de entrada en UNIPROT o NCBI). Buscar secuencias homólogas por BLAST en
especies diferentes. Resuma todo lo que se puede aprender de BLAST y Alineamiento por
pares. Elija 2 secuencias homólogas, una distante y otra cercana para comparar con la
secuencia elegida. Interprete y dé ejemplos de cambios conservados, no conservados y huecos
en la comparación de dichas secuencias.
Secuencia FASTA:
MRLKNLTFIIILIISGELYAEEKPCGFPHVENGRIAQYYYTFKSFYFPMSIDKKLSFFCLAGYTTESGRQ
EEQTTCTTEGWSPEPRCFKKCTKPDLSNGYISDVKLLYKIQENMRYGCASGYKTTGGKDEEVVQCLSDGW
SSQPTCRKEHETCLAPELYNGNYSTTQKTFKVKDKVQYECATGYYTAGGKKTEEVECLTYGWSLTPKCTK
LKCSSLRLIENGYFHPVKQTYEEGDVVQFFCHENYYLSGSDLIQCYNFGWYPESPVCEGRRNRCPPPPLP
INSKIQTHSTTYRHGEIVHIECELNFEIHGSAEIRCEDGKWTEPPKCIEGQEKVACEEPPFIENGAANLH
SKIYYNGDKVTYACKSGYLLHGSNEITCNRGKWTLPPECVENNENCKHPPVVMNGAVADGILASYATGSS
VEYRCNEYYLLRGSKISRCEQGKWSSPPVCLEPCTVNVDYMNRNNIEMKWKYEGKVLHGDLIDFVCKQGY
DLSPLTPLSELSVQCNRGEVKYPLCTRKESKGMCTSPPLIKHGVIISSTVDTYENGSSVEYRCFDHHFLE
GSREAYCLDGMWTTPPLCLEPCTLSFTEMEKNNLLLKWDFDNRPHILHGEYIEFICRGDTYPAELYITGS
ILRMQCDRGQLKYPRCIPRQSTLSYQEPLRT
MRLKNLTFIIILIISGELYAEEKPCGFPHVENGRIAQYYYTFKSFYFPMSIDKKLSFFCLAGYTTESGRQ
EEQTTCTTEGWSPEPRCFKKCTKPDLSNGYISDVKLLYKIQENMRYGCASGYKTTGGKDEEVVQCLSDGW
SSQPTCRKEHETCLAPELYNGNYSTTQKTFKVKDKVQYECATGYYTAGGKKTEEVECLTYGWSLTPKCTK
LKCSSLRLIENGYFHPVKQTYEEGDVVQFFCHENYYLSGSDLIQCYNFGWYPESPVCEGRRNRCPPPPLP
INSKIQTHSTTYRHGEIVHIECELNFEIHGSAEIRCEDGKWTEPPKCIEGQEKVACEEPPFIENGAANLH
SKIYYNGDKVTYACKSGYLLHGSNEITCNRGKWTLPPECVENNENCKHPPVVMNGAVADGILASYATGSS
VEYRCNEYYLLRGSKISRCEQGKWSSPPVCLEPCTVNVDYMNRNNIEMKWKYEGKVLHGDLIDFVCKQGY
DLSPLTPLSELSVQCNRGEVKYPLCTRKESKGMCTSPPLIKHGVIISSTVDTYENGSSVEYRCFDHHFLE
GSREAYCLDGMWTTPPLCLEPCTLSFTEMEKNNLLLKWDFDNRPHILHGEYIEFICRGDTYPAELYITGS
ILRMQCDRGQLKYPRCIPRQSTLSYQEPLRT
Accession: XP_032955220.1
Secuencia FASTA:
>XP_032955220.1 coagulation factor XIII B chain [Rhinolophus
ferrumequinum]
MRSKVLAFIIILIISGELYAEEKPCGLPTVENGRLAPYYYTFESFYFPMSIDQKLSFSCLAGYATETGKK
EDKTTCTTEGWNPRPRCFKKCTKPDLMNGFISDAKLLYKFQENMRYSCASGYKTTGGQDEEVVQCLADGW
SSQPACRKEHETCLAPELHHGNYSTTQRTFRVKGKVRYECAPGYYTAGGKKTEEVECHTYGWSVTPKCTK
LKCSSLRLIENGYFHPIKQTYEEGDVVQFFCHENYYLSGADLIQCYNFGWYPESPVCEGRRNRCPPPPLP
LNSKLQTYSTTYRHGETVRIECELNFEIQGSEEIRCDNGKWTDPPKCTEEKEKTACEEPPHIEHSAANLY
AKVYYNGDKVAFACQSGYHLRGSKEITCLRGKWTVPPECVENNENCKPPPDVTNGAVVGGLLASYTTGSS
VEYRCNEYYILKGAKRSRCQQGQWSSPPVCLEPCTVNMDYMNRNNIEMKWKLEGKVLHGDLIDFACKQGF
DLAPSTPVSALSVQCDRGEVKYPVCLRKESKGMCASPPLIKNGVITSSVRGSYENGSSVEYRCFDHHFLQ
GPRVSHCSQGVWTTPPLCLEPCTLSSVEMENNNLLLKWDFDNRPYIFHGEYIEFLCRRDTYVAQLSTIGS
ELRVRCDRGQLKYPRCIQRQRMLFYQEPVRT
Resultados: emboss_needle-I20240614-192938-0805-23132248-p1m
# Length: 661
# Score: 3070.0
Cambios Conservativos: Son aquellos en los que un aminoácido es reemplazado por otro con
propiedades químicas similares. En tu resultado, estos se representan con dos puntos ( : ). Estos
cambios suelen tener un impacto mínimo en la estructura y función de la proteína.
Donde encontramos la mayor cantidad de cambios conservativos son en las siguientes líneas de
comparación (segunda, séptima y novena):
Cambios no conservativos: Son aquellos en los que un aminoácido es reemplazado por otro con
propiedades químicas diferentes. En tu resultado, estos se representan con un punto ( . ). Estos
cambios pueden tener un impacto significativo en la estructura y función de la proteína.
Donde encontramos la mayor cantidad de cambios no conservativos son en las siguientes líneas de
comparación (séptima, duodécima y décimo tercera):
Huecos: Son espacios en la alineación que indican la inserción o eliminación de uno o más
aminoácidos. Los huecos pueden tener un impacto significativo en la estructura y función de la
proteína, especialmente si ocurren en una región funcionalmente importante de la proteína. Estos
huecos son representados por un espacio en blanco, sin embargo, observamos que en los
resultados obtenidos, no existen huecos.
En conclusión, podemos observar que entre ambas secuencias existe gran similitud, debido a que no se
encuentran los llamados “huecos” en su comparación de secuencias, pero sí existen muchos cambios tanto
conservativos como no conservativos, lo que indican similitudes fuertes y débiles respectivamente, esto
podría verse reflejado en los resultados obtenidos luego del BLASTP al buscar similitudes en organismos
diferentes dando un 81% de similitud.
TAREA 3
Análisis de la proteína elegida en la tarea anterior.
https://www.ncbi.nlm.nih.gov/Structure/cdd/cddsrv.cgi?hslf=1&uid=410341&#seqhrch
Puntos importantes:
Coágulos de Fibrina: Aportan y estabilizan el factor A para poder formar los coágulos de
fibrina y permitir la cicatrización de las heridas del cuerpo (Thomas, 2016)
Composición de la proteína:
Carga de la proteína: -10
Estructura tridimensional:
Referencias Bibliográficas
Alberts, B., Johnson, A., Lewis, J., Raff, M., Roberts, K., & Walter, P. (2014). Molecular Biology of
the Cell (6th ed.). Garland Science.
Altschul, S. F., Gish, W., Miller, W., Myers, E. W., & Lipman, D. J. (1990). Basic local alignment
search tool. Journal of Molecular Biology, 215(3), 403-410.
https://doi.org/10.1016/S0022-2836(05)80360-2
Can, T. (2014). Introduction to Bioinformatics. In: Yousef, M., Allmer, J. (eds) miRNomics:
MicroRNA Biology and Computational Analysis. Methods in Molecular Biology, vol 1107.
Humana Press, Totowa, NJ. https://doi.org/10.1007/978-1-62703-748-8_4
Koonin, E. V. (2005). Orthologs, paralogs, and evolutionary genomics. Annual Review of Genetics,
39, 309-338. https://doi.org/10.1146/annurev.genet.39.073003.114725
Muszbek, L., Yee, V. C., & Hevessy, Z. (1999). Blood coagulation factor XIII: structure and function.
Thrombosis research, 94(5), 271-305.
Thomas, A., Biswas, A., Dodt, J., Philippou, H., Hethershaw, E., Ensikat, H. J., Ivaskevicius, V., &
Oldenburg, J. (2016). Coagulation Factor XIIIA subunit missense mutations affect structure
and function at the various steps of Factor XIII action. Human Mutation, 37(10), 1030–1041.
https://doi.org/10.1002/humu.23041