1 - Introduction À La Génomique

Télécharger au format pptx, pdf ou txt
Télécharger au format pptx, pdf ou txt
Vous êtes sur la page 1sur 39

Introduction à la génomique

Introduction à la génomique

Définitions
La génomique est la science qui étudie les génomes complets.
Elle vise à faire l'inventaire des gènes, les localiser, caractériser leur séquence et étudier leur
fonction. Elle permet également l’analyse de la structure physique du génome.

La bioinformatique est une discipline fondée sur les acquis biologiques,


mathématiques et informatiques.
Elle propose des méthodes et des logiciels qui permettent de gérer, d'organiser, de comparer,
d'analyser et d'exploiter des informations d'origine génétique ou autres.

On ne peut séparer les deux disciplines, car la quantité d'information qui doit
être traitée par la génomique requiert l'utilisation de machines et donc d’outils
bioinformatiques.
Introduction à la génomique

Historique
L'essor de cette discipline a été facilité par le développement des techniques de séquençage des
génomes et la bio-informatique.
•En 1972, le premier véritable séquençage d'un génome est publié, avec la lecture de la séquence
ARN du gène du virus bactériophage MS2.
•En 1995, pour la première fois, la séquence complète du génome d’une cellule vivante a été
déterminée. Il s’agissait d’Haemophilus influenzae.
•A la fin du 20ème siècle, cette discipline a été très médiatisée grâce notamment à la compétition
entre plusieurs équipes pour finaliser le séquençage du génome humain et publier les résultats.
•En 2001, la séquence « brute » du génome humain a été publiée.
•Depuis, un nombre croissant de génomes complets sont séquencés chez des espèces vivantes
très différentes : le ver Caenorhabditis elegans en 1998, la mouche drosophile et la plante
Arabidopsis thaliana en 2000 ou encore, le chien en 2005. En septembre 2007, une équipe menée
par le biologiste et entrepreneur Craig Venter a publié le premier génome complet d'un individu
qui se trouve être Craig Venter lui-même. Le génome du codécouvreur de la structure de l'ADN
et ancien directeur du Projet génome humain, James Watson, a aussi été séquencé dans son
intégralité à la même période.
Introduction à la génomique: Suite Historique

La biologie moléculaire est donc entrée depuis 1995 dans l’ère de la génomique : on dispose
maintenant de l’information génétique exhaustive sur un nombre croissant d’organismes vivants
et il est aujourd’hui possible d’aborder de manière globale un certain nombre de problèmes
complexes dont on n’avait jusqu’à présent qu’une connaissance fragmentaire : voies
métaboliques, interaction de la cellule avec l’extérieur, mécanismes globaux de régulation et de
contrôle.
Introduction à la génomique

Dates clés des débuts de l’ère de la génomique

1953 : Watson et Crick découvrent la structure de l’ADN


1956 : Sanger établit la séquence en aa de l’insuline
1977 : Sanger met au point le séquençage de l’ADN
1987 : Premier séquenceur automatisé
1995 : Séquençage du 1er génome bactérien
Haemophilus influenzae (1,83 Mb)
1996 : Séquençage du 1er génome eucaryote
Saccharomyces cerevisiae (12 Mb)
1999: Chromosome 22 humain
2001 : annonce du décryptage du génome humain
2003: Séquençage du génome humain achevé
2007: Première séquence complète du génome d'un individu
Introduction à la génomique

Génomique
Analyse globale du génome d’un organisme (gènes et
régions intergéniques)

1. Génomique structurelle 2. Génomique fonctionnelle


- Organisation et position des gènes, - Fonction des gènes
taille du génome - Analyse globale de l’expression
- Comparaison des génomes de génétique
différents organismes - Distribution systématique des
- Séquençage de l’ADN et analyse des gènes (Knock-outs, RNAi)
séquences
Introduction à la génomique

Les outils de la génomique


•Le séquençage (séquençage d’une molécule d’ADN/
Sanger au séquençage de plusieurs fragments d’ADN/NGS).
•Le séquençage de génomes entiers ( Haemophilus
influenzae, séquençage d’un chromosome, séquençage du
génome humain).
Introduction à la génomique

Séquençage

Déterminer l'ordre linéaire des composants d'une macromolécule (aa d'une


protéine, nt de l'ADN, …)
• Le séquençage des protéines Nécessite un matériel dédié qui est cher.
• Technique délicate à mettre en œuvre.
La séquence des protéines peut-être déduite de l’ADN
Le séquençage de l’ADN
• Plus simple à mettre en oeuvre
• Technique très répandue, beaucoup de laboratoires possèdent un petit
séquenceur automatique
Introduction à la génomique
Séquençage de Sanger: principe
Introduction à la génomique
Séquençage de Sanger: évolution
Introduction à la génomique

Limites de la technique de séquençage de Sanger

•Une manipulation de séquençage ne peut pas déterminer plus de 500 à 1.000 nucléotides
à la suite. C’est très peu par rapport à un chromosome entier !
•Besoin de couper les chromosomes en fragments puis de les reconstituer
• Il peut y avoir des erreurs de lecture
•Oubli d’un nucléotide
• Inversion de l’ordre des nucléotides, …

Il est donc nécessaire de séquencer plusieurs fois un fragment pour obtenir une
séquence fiable
Introduction à la génomique

Le séquençage de nouvelle génération (NGS)


Introduction à la génomique: suite Le séquençage de nouvelle
génération
Introduction à la génomique: suite Le séquençage de nouvelle
génération
Introduction à la génomique: suite Le séquençage de nouvelle
génération
Introduction à la génomique: suite Le séquençage de nouvelle
génération
Introduction à la génomique: suite Le séquençage de nouvelle
génération
Introduction à la génomique: suite Le séquençage de nouvelle
génération Principe Technologie Illumina
1- Préparation de l’ADN:

Après extraction et purification de l’ADN, celui-ci est fragmenté par sonication: Librairie de
fragments
 
Les extrémités adhésives sont transformées en coupures franches à l’aide d’exonucléases, des
groupements phosphates y sont ajouté et enfin, des nucléotides A sont ajoutés.

Ligation à deux différents adapteurs suite à une amplification : le brin sens avec un type
d'adaptateur A, le brin anti-sens avec un adaptateur B.
 
Introduction à la génomique: suite Le séquençage de nouvelle
génération Principe Technologie Illumina

•Les adaptateurs contiennent dans les deux sens: un site de liaison des primers, un indexe et
une région complémentaires aux sondes de la cellule en verre
Introduction à la génomique: suite Le séquençage de nouvelle
génération Principe Technologie Illumina
2- Génération des clusters par bridge PCR:
•L’étape permettant la génération des clusters est l’étape ou chaque fragment est amplifié de
manière isothermale.
•Le système permettant la génération de ces clusters est muni de plaques de verres constitués
de microsillons.
•The flow cell: est la plaque en verre partagée en lignes (sillons). Chacun des sillons contient
deux types d’oligonucléotides A’ et B’.
•L’hybridation est possible grâce à ces deux types d’oligonucléotides qui sont complémentaires
aux adaptateurs A et B.
Introduction à la génomique: suite Le séquençage de nouvelle
génération Principe Technologie Illumina

•Après hybridation, l’amplification est


réalisée et à la fin de celle-ci, la
molécule d’ADN double brin est
dénaturée et le brin original est
éliminé par lavage.

•La molécule nouvellement synthétisée


contenant une extrémité libre s’hybride à
l’oligonucléotide complémentaire voisin
et forme un pont puis le brin
complémentaire est synthétisé formant
une molécule d’ADN double brin. On
redénature pour séparer les brins
néosythétisés
Introduction à la génomique: suite Le séquençage de nouvelle
génération Principe Technologie Illumina

•Les cycles d’amplifications des ponts


sont répétés jusqu’à ce qu’il y ait une
multitude de ponts formés.

•Les double-brins sont dénaturés. Les


brins anti-sens liés à un type d’amorces B
sont coupés et on rince pour les éliminer,
ne laissant que des brins sens.

•On ajoute des amorces libres en solution


qui vont s’hybrider avec les fragments de
DNA pour la partie séquençage proprement
dite.
Introduction à la génomique: suite Le séquençage de nouvelle
génération Principe Technologie Illumina
•L'une des grandes différences entre le séquençage par synthèse ou Sanger et NextGen est que
le séquençage et la détection du signal se font simultanément pour le séquençage à haut débit.
•À chaque cycle d'amplification, la détection est faite immédiatement. Il n'y a pas d'étape de
migration, ce qui contribue à réduire le temps nécessaire à l'exécution du séquençage.
• Ceci implique aussi que la quantité de matériel séquençable à la fois, n'est plus tributaire de
l'espace disponible sur capillaires. Pour le séquençage NextGen, il s'exécute des centaines de
millions de réactions en même temps.
Introduction à la génomique: suite Le séquençage de nouvelle
génération Principe Technologie Illumina

•Une amplification produit 1 read

•L’amplification du même fragments plusieurs


fois produit plusieurs reads

RMQ: Le séquençage est réalisé dans un sens pour tous les fragments puis grâce à l’indexe 2
dans l’autre sens de la même manière.
(voir vidéo illumina https://www.youtube.com/watch?v=womKfikWlxM)
Introduction à la génomique: suite Le séquençage de nouvelle
génération Principe Technologie Illumina
Analyse des données de séquençage
•Les données brutes générées par séquençage sont traitées pour la vérification de la qualité
du séquençage.
•Par la suite, il est important de trouver le bon alignement des séquences.
•L’étape de post-alignement consiste en la suppression des erreurs dues aux étapes
d’amplification et au réalignement afin d’arriver à un alignement le plus fin possible.
•L’étape de variants calling consiste à identifier les variations de l’échantillon par rapport à
la séquence de référence.
•L’annotation fonctionnelle est une étape cruciale permettant la distinction entre une
variation génétique pathologique ou non pour la priorisation des variations (sélection de
variations candidates).
•Dans cette dernière étape (priorisation), il est important d’utiliser les informations sur les
variants et la pathologie pour classer les variations.
Introduction à la génomique: suite Le séquençage de nouvelle
génération
Comparaison des trois méthodes de séquençage à haut débit les plus
employées
Introduction à la génomique

Approches de séquençage de génomes entiers


•Principe du séquençage du génome d’Haemophilus Influenzae.
•Principe du séquençage de chromosomes.
•Principe du séquençage du génome humain.
Introduction à la génomique: suite Approche de séquençage de
génomes entiers
•Principe du séquençage du génome d’Haemophilus Influenzae

Grace au "whole-genome random sequencing” Craig Venter et ces collaborateurs ont publié, en
1995, le premier génome séquencé dans sa totatilé qui est celui de la bactérie Haemophilus
influenzae Rd.

Ce séquençage a démontré pour la première fois que le shotgun randomisé pouvait être appliqué
pour le séquençage de génomes entiers de manière rapide et efficace.

Dans la méthode de séquençage conventionelle, les génomes étaient fragmentés de manière


ordonnée, les cartes physique étaient réalisées avant que les efforts de séquençage ne
commencent. Contrairement à cette stratégie, le séquençage par shotgun consistait en l’utilisation
de logiciels d’assemblage puissant afin d’assembler de courtes séquences d’ADN chevauchant,
sans réalisation préalable de carte physique d’un génome
Introduction à la génomique: suite Approche de séquençage de
génomes entiers
Principe du séquençage d’un chromosome
• Amplification du chromosome.
• Besoin de séquencer 8 à 10 fois le chromosome.
• Les copies du chr sont cassées aléatoirement en fragments de quelques milliers de nucléotides.
• Séquençage des extrémités de certains des fragments obtenus.
• Certaines séquences se chevauchent en partie.
Introduction à la génomique: suite Approche de séquençage de
génomes entiers
Principe du séquençage d’un chromosome
Reconstitution des contigs
• Comparaison des séquences obtenues pour aligner les parties séquencées plusieurs fois.
• Reconstitution d’enchaînements plus grands, appelés contigs.
• Traitement informatique indispensable.
Introduction à la génomique: suite Approche de séquençage de
génomes entiers
Principe du séquençage d’un chromosome

Assemblage final
Il reste à ordonner et orienter les contigs.
Difficulté :
- Présence de répétitions dans les génomes qui peuvent conduire à assembler des contigs
provenant de régions distantes du chr.
- Présence de « trous » qui sont comblés par un séquençage ciblé.
- Correction des erreurs.

IL est normalement indispensable de renouveler le séquençage pour améliorer la qualité de la


Séquence. Cependant, cette étape n’est pas toujours réalisée. En effet, le premier objectif
consiste à avoir rapidement l’ébauche d’un génome pour, par exemple, le comparer à une
espèce proche.
Introduction à la génomique: suite Approche de séquençage de
génomes entiers
Séquençage du génome humain

Le projet a commencé dans les années 1990


Etape préalable : cartographie des chromosomes (localisation de marqueurs) pour faciliter
l’assemblage
1998 : début du séquençage
Le travail a été réparti entre 20 institutions internationales réunies dans un consortium public.

Ebauche préliminaire célébrée en juin 2000


Génome séquencé seulement 5 fois
Entre 400.000 et 600.000 fragments de 5.000 à 6.000 nt pas toujours orientés et ordonnés
90% du génome couvert, avec une erreur tous les 1.000 nt
Introduction à la génomique: suite Approche de séquençage de
génomes entiers
Avril 2003 : achèvement du génome humain

• 2 ans d’avance sur le calendrier initial grâce aux progrès des techniques de séquençage.
• Séquençage de 5 autres « équivalents génomiques ».
• Taux d’erreurs d’un nucléotide tous les 10.000.
• Travail focalisé sur les trous résiduels
• Il en reste moins de 400
• 2,9 milliards de nucléotides, soit 90% des 3,2 milliards de nucléotides de l'ensemble du
génome humain.
• Le reste du génome est constitué de séquences répétées (notamment au niveau des
centromères et télomères)
Introduction à la génomique: suite Approche de séquençage de
génomes entiers
Principe du séquençage du génome humain: méthode du consortium
Introduction à la génomique: suite Approche de séquençage de
génomes entiers
Principe du séquençage du génome humain: méthode du consortium
Introduction à la génomique: suite Approche de séquençage de
génomes entiers
Principe du séquençage du génome humain: méthode du consortium
Introduction à la génomique: suite Approche de séquençage de
génomes entiers
Pourquoi séquencer des génomes
•Intérêt économique
Médecine
Biotechnologies
Environnement
• Intérêt scientifique
Evolution des espèces
Fonctionnement des
cellules
Etude des êtres vivants
• Utilité publique
Nutrition
Propagation des maladies
Environnement
Introduction à la génomique: suite Approche de séquençage de
génomes entiers
Bilan des projets génome en 2016
Genome online database: https://gold.jgi.doe.gov/

- 949 génomes complets


- 42 682 génomes brouillons
- 43 419 projets incomplets
Introduction à la génomique: suite Approche de séquençage de
génomes entiers
Bilan des projets génome en 2016

Vous aimerez peut-être aussi