Tp Base Connaissance 2
Tp Base Connaissance 2
Tp Base Connaissance 2
Copiez-collez ci-dessous ou récupérez sur le site du cours la séquence suivante unknown.fasta (au
format FASTA) afin d'essayer d'identifier cette séquence dans les bases de connaissance disponible
en ligne.
ATGGCGAACCTTGGCTGCTGGATGCTGGTTCTCTTTGTGGCCACATGGAGTGACCTGGGCCTCTGCAAGAAGCG
CCCGAAGCCTGGAGGATGGAACACTGGGGGCAGCCGATACCCGGGGCAGGGCAGCCCTGGAGGCAACCGCTACC
CACCTCAGGGCGGTGGTGGCTGGGGGCAGCCTCATGGTGGTGGCTGGGGGCAGCCTCATGGTGGTGGCTGGGGG
CAGCCCCATGGTGGTGGCTGGGGGCAGCCTCATGGTGGTGGCTGGGGGCAGCCTCATGGTGGTGGCTGGGGGCA
GCCTCATGGTGGTGGCTGGGGGCAGCCCCATGGTGGTGGCTGGGGACAGCCTCATGGTGGTGGCTGGGGTCAAG
GAGGTGGCACCCACAGTCAGTGGAACAAGCCGAGTAAGCCAAAAACCAACATGAAGCACATGGCTGGTGCTGCA
GCAGCTGGGGCAGTGGTGGGGGGCCTTGGCGGCTACATGCTGGGAAGTGCCATGAGCAGGCCCATCATACATTT
CGGCAGTGACTATGAGGACCGTTACTATCGTGAAAACATGCACCGTTACCCCAACCAAGTGTACTACAGGCCCA
TGGATGAGTACAGCAACCAGAACAACTTTGTGCACGACTGCGTCAATATCACAATCAAGCAGCACACGGTCACC
ACAACCACCAAGGGGGAGAACTTCACCGAGACCGACGTTAAGATGATGGAGCGCGTGGTTGAGCAGATGTGTAT
CACCCAGTACGAGAGGGAATCTCAGGCCTATTACCAGAGAGGATCGAGCATGGTCCTCTTCTCCTCTCCACCTG
TGATCCTCCTGATCTCTTTCCTCATCTTCCTGATAGTGGGATGA
• Récupérez le fichier mutation.fasta proposé sur le site du TP. Que contient-il a priori ?
• Procédez à un alignement des deux séquences ADN normale et mutée en visualisant les
mutations avec l'outil EMBOSS proposé par EBI-EMBL : par exemple
https://www.ebi.ac.uk/Tools/psa/emboss_water/nucleotide.html
• On peut aussi utiliser d'autres outils comme https://www.ebi.ac.uk/Tools/psa.
• Faites de même avec l'outil blast proposé par le NCBI (voir exercice précédent) en cochant
« Align two or more sequences »
Interprétation/Commentaire de résultats :
• Trouvez la séquence de la protéine du prion humain (Homo Sapiens) PrP : code P04156
dans cette base. Sauvegardez la séquence au format fasta.
• Consultez l'ensemble des documents fournis pour comprendre la fonction de la protéine et
les maladies auxquelles elle est associée.
• Étudiez le réseau d'interaction de la protéine avec l'outil BioGrid http://thebiogrid.org/
(cherchez pour le gène PRNP et sélectionnez l'onglet Network)
• Comparez avec le réseau d'interaction du gène PRNP trouvé avec l'outil STRING
Interprétation/Commentaire de résultats :
Interprétation/Commentaire de résultats :
TP2 Part B : Alignement de famille de séquences
Exercice 5 : Alignement de famille de séquences et Arbres phylogénétiques
1. Dans les résultats du BLAST du prion contre SWISSPROT, sélectionnez 10 protéines
prions, allant des plus proches aux plus éloignées
o Obtenez chaque séquence au format FASTA
o Ajoutez au fur et à mesure chaque séquence dans un fichier texte
o Sauvez votre liste de séquence au format FASTA
2. Sur le serveur du EBI, trouvez l'outil CLUSTAL OMEGA. Copiez-collez les 10 séquences
au format FASTA du fichier texte
o Alignez les 10 séquences
o Repérez les régions conservées/divergentes
o Sauvegardez cet alignement sur votre disque.
o Observez l'arbre de l'évolution de type PHYLIP. Qu'est-ce que l'outil PHYLIP ?
3. Refaite l'exercice avec l'outil T-Coffee (http://www.tcoffee.org/) accessible aussi d'ici
https://www.ebi.ac.uk/Tools/msa/tcoffee/
4. Utilisez l'utilitaire multiple-linux toujours sur le site
http://www.ks.uiuc.edu/Training/Tutorials/science/bioinformatics-tutorial/bioinformatics/
Séquence de la protéine PRNP traduite d'un cDNA expérimental issu d'un patient atteint
de CJD
E-value : Dans les alignements de séquence, une E-value de 4 signifie que si l’on avait
soumis une séquence aléatoire, on s’attendrait à trouver 4 alignements avec un score
aussi élevé, par le simple jeu du hasard. Un tel alignement ne peut donc en aucun cas
être considéré comme significatif. En revanche des valeurs très faibles sont une bonne
indication d'un alignement significatif.