Séquençage Sanger : étapes et méthode
Qu'est-ce que la méthode de Sanger ?
La méthode de Sanger, également appelée séquençage Sanger ou séquençage par terminaison de chaîne, est une technique qui permet de déterminer la séquence de nucléotides d'un ADN. Elle a été mise au point en 1977 par le double prix Nobel Frederick Sanger et son équipe, d'où le nom de "séquence Sanger".
La structure générale de l'ADN est illustrée sur la Figure 2.
Comment fonctionne le séquençage Sanger ?
Le séquençage Sanger peut être réalisé manuellement, ou plus couramment, de manière automatisée à l'aide d'un séquenceur (Figure 1). Chaque procédure se déroule en trois grandes étapes décrites ci-dessous.
Figure 1.Trois grandes étapes du séquençage automatisé selon la méthode de Sanger.
Étapes du séquençage Sanger
Le séquençage Sanger se déroule en trois grandes étapes.
1. Séquence d'ADN pour PCR à terminaison de chaîne
La séquence d'ADN d'intérêt sert de matrice pour un type spécial de PCR appelé PCR à terminaison de chaîne. La PCR à terminaison de chaîne fonctionne comme une PCR standard à une différence près : l'ajout de nucléotides modifiés (dNTP) appelés didésoxyribonucléotides (ddNTP). À l'étape d'élongation de la PCR standard, l'ADN polymérase ajoute des dNTP sur un brin d'ADN en croissance en catalysant la formation d'une liaison phosphodiester entre le groupement 3'-OH libre du dernier nucléotide et le groupement 5'-phosphate du nucléotide suivant (Figure 2).
Dans la PCR à terminaison de chaîne, l'utilisateur mélange une faible proportion de ddNTP de terminaison de chaîne avec les dNTP classiques. Les ddNTP ne possèdent pas le groupement 3'-OH nécessaire à la formation d'une liaison phosphodiester ; ainsi, lorsque l'ADN polymérase incorpore aléatoirement un ddNTP, l'élongation s'arrête. Une PCR à terminaison de chaîne produit des millions voire des milliards de copies d'oligonucléotides de la séquence d'ADN d'intérêt terminées, après une longueur aléatoire (n), par des 5'-ddNTP.
Dans le séquençage manuel de Sanger, quatre réactions de PCR sont mises en place, chacune ne recevant qu'un seul type de ddNTP (ddATP, ddTTP, ddGTP ou ddCTP).
Dans le séquençage automatisé de Sanger, tous les ddNTP sont mélangés dans une seule et même réaction, et chacun des quatre dNTP comporte un marqueur fluorescent unique.
2. Séparation par taille par électrophorèse sur gel
À la deuxième étape, les oligonucléotides à terminaison de chaîne sont séparés selon leur taille par électrophorèse sur gel. Dans l'électrophorèse sur gel, les échantillons d'ADN sont déposés à une extrémité d'une matrice de gel et un courant électrique est appliqué ; l'ADN étant chargé négativement, les oligonucléotides sont attirés vers l'électrode positive située à l'autre extrémité du gel. Sachant que tous les fragments d'ADN ont la même charge par unité de masse, la vitesse à laquelle les oligonucléotides se déplacent est uniquement déterminée par leur taille. Plus un fragment est petit, moins il subit de frottements en se déplaçant dans le gel et plus sa vitesse de migration est rapide. Ainsi, les oligonucléotides sont disposés du plus petit au plus grand lorsqu'on lit le gel de bas en haut.
Dans le séquençage manuel de Sanger, les oligonucléotides de chacune des quatre réactions de PCR sont déposés sur quatre pistes différentes d'un gel. Cela permet d'identifier les oligonucléotides correspondant à chaque ddNTP.
Dans le séquençage automatisé de Sanger, tous les oligonucléotides sont analysés en une seule et même électrophorèse capillaire sur gel dans le séquenceur.
3. Analyse du gel et détermination de la séquence d'ADN
La dernière étape consiste simplement à lire le gel pour identifier la séquence d'ADN de départ. Étant donné que l'ADN polymérase ne synthétise l'ADN que dans le sens 5'→3' à partir d'une amorce fournie, chaque ddNTP terminal correspond à un nucléotide spécifique de la séquence de départ (par exemple, le fragment le plus court doit se terminer au niveau du premier nucléotide à partir de l'extrémité 5', le deuxième fragment le plus court au niveau du deuxième nucléotide à partir de l'extrémité 5', et ainsi de suite). En lisant le gel de la plus petite à la plus grosse bande, il est donc possible de déterminer la séquence 5'→3' du brin d'ADN d'origine.
En mode manuel, l'utilisateur lit simultanément les quatre pistes du gel de bas en haut, en se servant de la piste pour identifier le ddNTP terminal de chaque bande. Par exemple, si la bande inférieure se trouve dans la colonne correspondant au ddGTP, cela signifie que le plus petit fragment de PCR se termine par un ddGTP, et donc, que le premier nucléotide à partir de l'extrémité 5' de la séquence de départ contient une base guanine (G).
En mode automatisé, un ordinateur lit chaque bande du capillaire dans l'ordre, en se servant de la fluorescence pour déterminer l'identité de chaque ddNTP terminal. En quelques mots, un laser excite les marqueurs fluorescents de chaque bande et un ordinateur détecte la lumière émise. Étant donné que chacun des quatre ddNTP comporte un marqueur fluorescent différent, la lumière émise peut être directement associée à l'identité du ddNTP terminal. Le résultat obtenu est un chromatogramme faisant apparaître le pic de fluorescence de chaque nucléotide le long de l'ADN matrice.
Figure 2.Schéma de la structure de l'ADN. L'ADN est une molécule composée de deux brins qui s'enroulent sur eux-mêmes pour former une double hélice. Chaque brin est constitué d'une suite de molécules appelées désoxyribonucléotides (dNTP).
Chaque dNTP contient un groupement phosphate, un sucre et l'une des quatre bases azotées que sont l'adénine (A), la thymine (T), la guanine (G) et la cytosine (C). Les dNTP s'enchaînent linéairement via des liaisons covalentes de type phosphodiester entre le sucre d'un dNTP et le groupement phosphate du dNTP suivant ; la répétition de ce motif sucre-phosphate forme le squelette sucre-phosphate.
Les bases azotées de chaque brin sont reliées par des liaisons hydrogène entre bases complémentaires, formant la double hélice de l'ADN.
Comment lire les résultats d'un séquençage Sanger ?
La bonne lecture des résultats d'un séquençage Sanger dépend du brin d'ADN complémentaire qui est le brin d'intérêt ainsi que de l'amorce disponible. Pour deux brins d'ADN A et B, si le brin d'intérêt est le brin A et que l'amorce s'hybride mieux sur le brin B, les fragments produits seront identiques au brin A. À l'inverse, si le brin d'intérêt est le brin A et que l'amorce s'hybride mieux sur ce brin, les fragments produits seront identiques au brin B ; il faudra donc les reconvertir en brin A.
Ainsi, si la séquence d'intérêt se lit "TACG" et que l'amorce s'hybride mieux sur ce brin, les fragments produits se liront "ATGC" ; ils devront donc être reconvertis en "TACG". Toutefois, si l'amorce s'hybride mieux sur le brin complémentaire ("ATGC"), les fragments produits se liront "TACG", ce qui correspond à la bonne séquence.
Pour résumer, avant de commencer, vous devez savoir ce que vous souhaitez obtenir et comment vous allez y parvenir. Ceci étant posé, voici une illustration de l'exemple ci-dessus (TACG→ATGC→TACG). Si les marqueurs des didésoxynucléotides sont T = jaune, A = rose, C = bleu foncé et G = bleu clair, vous obtiendrez les séquences courtes suivantes : amorce-A, amorce-AT, amorce-ATG et amorce-ATGC. Une fois les fragments séparés par électrophorèse, le laser lira les fragments par ordre de longueur (rose, jaune, bleu clair et bleu foncé) et produira un chromatogramme. L'ordinateur convertira les lettres, donnant la bonne séquence finale : TACG.
Séquençage Sanger et PCR : quelles différences ?
Le séquençage Sanger et la PCR utilisent le même matériel de départ et peuvent être combinés, mais l'un ne remplace pas l'autre.
La PCR sert à amplifier l'intégralité de l'ADN. Bien que des fragments de longueur variable puissent être produits involontairement (par exemple, l'ADN polymérase peut être défectueuse), l'objectif est de dupliquer l'intégralité de la séquence d'ADN. Pour cela, les ingrédients d'une PCR sont l'ADN cible, des nucléotides, l'amorce de l'ADN et une ADN polymérase (plus précisément une Taq polymérase, capable de résister aux hautes températures nécessaires pour la PCR).
Le séquençage Sanger vise quant à lui à produire toutes les longueurs possibles de l'ADN cible jusqu'à sa longueur complète. C'est la raison pour laquelle il faut les didésoxynucléotides, en plus du matériel de départ de la PCR.
La méthode de Sanger et la PCR peuvent être combinées lors de la préparation du matériel de départ d'un protocole de séquençage Sanger. La PCR peut être utilisée pour créer de nombreuses copies de l'ADN à séquencer.
En étant capable de travailler à partir de plusieurs matrices, le protocole Sanger se montre plus performant. Si la séquence cible mesure 1 000 nucléotides de long et qu'il n'y a qu'une seule copie de la matrice, il faudra plus de temps pour produire les 1 000 fragments marqués. Cependant, s'il existe plusieurs copies de la matrice, il faudra théoriquement moins de temps pour produire les 1 000 fragments marqués.
Pour continuer à lire, veuillez vous connecter à votre compte ou en créer un.
Vous n'avez pas de compte ?