Résultats et discussion
Nous avons commencé par tester les ADN polymérases Taq (de Thermus aquaticus), Vent haute fidélité (exo, de Thermococcus litoralis), Pfu (exo+, de Pyrococcus furiosus), Deep Vent (exo+, de Pyrococcus sp. GB-D), et Q5 (exo+) dans des réactions en chaîne par polymérase (PCR) traditionnelles avec un désoxyribonucléoside monophosphate (dGMP), des dNDP et des dNTP comme substrats (Fig. 1 A et B). La substitution de n’importe lequel des dNTP par des dNDPs a permis une synthèse robuste de l’ADN, et d’autres expériences avec deux, trois ou les quatre dNDPs au lieu des dNTPs ont permis la PCR. Pour s’assurer que les produits ne provenaient pas de dNTP contaminants et que les réactions n’étaient pas renforcées par des stabilisateurs présents dans les tampons commerciaux ou les stocks d’enzymes, nous avons testé la synthèse d’ADN à partir de dNDP purifiés en utilisant des tampons et des enzymes faits maison. Nous avons également inclus des enzymes réplicatives bactériennes, telles que les ADN polymérases réplicatives bactériennes du Bacillus stearothermophilus (Bst) thermophile et du Bacillus subtilis (Bsu, grand fragment) mésophile. Ces polymérases, ainsi que les polymérases archéales de Thermococcus kodakensis (KOD), Thermococcus sp. 9°N (9°N), et Thermococcus gorganarius (Tgo), ont montré des extensions d’amorce robustes en utilisant seulement 100 µM de dNDP purifiés à 60 °C (sauf Bsu, qui a été testé à 37 °C dans tous les cas) (Fig. 1C). Les réactions d’extension d’amorce ont été efficaces pour toutes ces enzymes, en particulier pour Deep Vent, KOD, et 9°N. Une pause a été observée avant l’incorporation du dA et du dC dans l’oligonucléotide naissant (Fig. 1 C et D), ce qui suggère que les KM pour le dADP et le dCDP sont suffisamment élevés pour ralentir l’extension de l’amorce à une concentration de substrat de 100 µM.
Pour avoir un aperçu mécanistique de la réaction, nous avons d’abord étudié son efficacité en utilisant l’enzyme Taq. La variation de la température d’extension de 50 °C à 72 °C n’a entraîné aucune différence observable dans la quantité de produit pleine longueur. Pour simplifier les analyses cinétiques, toutes les réactions de PCR ont été réalisées en utilisant un protocole de cycle de température en deux étapes, dans lequel l’amorce a été annelée et étendue dans la première étape à 72 °C et le duplex a été fondu à 95 °C dans la deuxième étape (Fig. S1A). Pour comparer les taux d’utilisation des dNDP par rapport aux dNTP canoniques, le temps d’extension a été modifié de 15 à 120 s. Pour un temps d’extension de 15 s, la réaction avec les dNTP a produit environ quatre fois plus de produit que la réaction avec un temps d’extension de 2 min contenant les dNDP (Fig. S1B). Ces données suggèrent que le taux d’incorporation des diphosphates est plus lent que celui des triphosphates traditionnels, comme on peut s’y attendre compte tenu de l’énergie inférieure de l’état fondamental des dNDP. Nous nous sommes ensuite demandé si un seul ou les quatre dNDP étaient responsables de ce ralentissement du taux d’incorporation. La PCR quantitative (qPCR) a été utilisée pour une mesure précise de la formation du produit. Chaque diphosphate a été interrogé indépendamment en le combinant avec 0,2 mM des trois autres dNTP pour amplifier une longue matrice d’ADN. Ces réactions ont été normalisées par rapport à une réaction témoin, qui contenait 0,2 mM des quatre dNTP (Fig. S1C). Une valeur de 1 indique qu’un diphosphate est incorporé aussi efficacement que son analogue triphosphate. Ces résultats suggèrent que le dADP est incorporé le moins efficacement (1 mM de dADP a donné ∼60% de 0,2 mM de dATP), suivi du diphosphate de désoxythymidine (dTDP) et du diphosphate de désoxycytidine (dCDP). D’autre part, seule une augmentation de deux fois la concentration de dGDP est nécessaire pour atteindre la même efficacité PCR que la réaction de contrôle dGTP.
Pour analyser directement la polymérisation de l’ADN, nous avons réalisé une réaction d’extension d’amorce marquée au 32P et d’une matrice longue (706 nt). La concentration en diphosphate a varié de 0,1 à 1,0 mM et a été combinée avec 0,2 mM des trois autres dNTPs, comme pour les réactions de qPCR décrites ci-dessus. Comme prévu, l’augmentation des concentrations de dADP a diminué le temps nécessaire à la production du produit complet (Fig. 1E). Une pause sur la longueur de l’ADN matrice a été observée uniquement dans le cas du dADP, ce qui suggère que la polymérase s’arrête pendant l’incorporation des substrats dADP (Fig. 1E). D’autre part, l’absence de pause dans la réaction du dTDP suggère que le dTDP est utilisé plus efficacement que le dADP (Fig. S2A), comme le suggère l’analyse qPCR (Fig. S1A). L’analyse de la formation du produit a suggéré que la concentration de dADP nécessaire pour atteindre la vitesse demi-maximale est de ∼420 µM (Fig. S2B), plus d’un ordre de grandeur au-dessus de la KM pour les dNTP mesurés précédemment (16 et 24 µM) (5, 6). Près de la concentration saturante de dADP, l’ADN complet est synthétisé en environ 30 s et, étant donné que la séquence de 706 nt contient 182 adénosines, la vitesse moyenne d’utilisation du dADP est d’au moins ∼6 s-1. Ceci est environ un ordre de grandeur plus lent que la vitesse moyenne d’utilisation des dNTP par la Taq polymérase (kcat = 47 s-1) et se situe à moins de 1,5 fois la kcat de Pfu (7).
Pour comparer davantage la cinétique de la synthèse d’ADN sur de longues matrices à partir de dNDP et de dNTP, nous avons utilisé une matrice plasmidique d’ADN simple brin (ADNs) M13mp18 de 7 249 nt (8). Les polymérases Bsu (à 37 °C), Bst et Taq (à 60 °C) ont montré une synthèse d’ADN robuste à partir de dNDPs (Fig. S2C). Nous avons mesuré la vitesse de synthèse de l’ADN en utilisant la fluorescence de l’intercalateur SYTO9, observée par un thermocycleur en temps réel à des concentrations variables de dNDP et de dNTP (Fig. S2D) (9). Un tracé de ces taux en fonction de la concentration en nucléotides a révélé un KM apparent de ∼0,4 mM pour les dNDP et un taux maximal de synthèse environ 17 fois plus faible pour les dNDP que pour les dNTP (Fig. S2E). Ces résultats montrent, en comparaison directe dans des conditions identiques, que la vitesse de synthèse de l’ADN à partir des dNDPs est un peu plus d’un ordre de grandeur plus faible qu’à partir des dNTPs et que le Vmax/KM est donc environ 400 fois plus faible pour les dNDPs que pour les dNTPs.
Une réaction de polymérisation avec des substrats triphosphates canoniques augmente la longueur du brin d’ADN naissant d’un nucléotide, libérant un PPi (3). Au cours de la réaction inverse, la pyrophosphorolyse, l’amorce est raccourcie d’un nucléotide et un dNTP est libéré. De manière analogue, lorsque les dNTP sont utilisés comme substrats, les polymérases libèrent des phosphates, et la réaction inverse est la phosphorolyse de l’ADN (Fig. 2A). Pour confirmer que les polymérases utilisent directement les dNDPs et n’utilisent pas une activité enzymatique inconnue jusqu’à présent (ou nucléotide diphosphate kinase copurifiée) qui convertit deux dNDPs en un dNTP et un dNMP, nous avons utilisé des dNDPs purifiés et analysé les produits d’une réaction d’extension d’amorce. Nous avons mesuré la production de phosphate à l’aide d’un capteur fluorescent, qui est dérivé de la protéine bactérienne de liaison au phosphate et qui présente une grande spécificité pour le phosphate (10). Nous avons constaté qu’en présence de dNTPs purifiés et d’ADN polymérase Taq, le phosphate s’accumule (Fig. 2B), mais pas dans les expériences sans polymérase. Dans les expériences de contrôle avec des dNTP, la production de phosphate a été observée, mais son taux était plus lent et indépendant de l’enzyme, ce qui suggère que le phosphate détecté résulte de la dégradation des dNTP en dNDP et phosphate et n’est pas lié à la synthèse d’ADN. Ces résultats ont confirmé que la Taq utilise directement les dNTP comme substrats, libérant le phosphate comme sous-produit de la synthèse de l’ADN. Lorsque nous avons mesuré la quantité de phosphate produite dans les extensions d’amorce sur l’ADN ss M13 de 7 249 nt décrit ci-dessus, nous avons constaté que ∼1-11 µM de phosphate étaient produits en utilisant une matrice de 1,6 nM par rapport à la production de phosphate de fond provenant de la dégradation des dNDP (Fig. S3A). Cette concentration de phosphate correspond à ∼2-6 000 molécules par ADN, soit environ 0,1-0,9 du modèle copié à l’aide de dNDP. Cette large fourchette résulte d’un fond de phosphate relativement important dans le matériel de départ et de la réaction de fond soustraite du signal dans la réaction d’extension d’amorce.
Phosphorolyse de l’ADN par l’ADN polymérase Taq. (A) Schéma des réactions avant et arrière avec les dNTPs/dNDPs et le pyrophosphate/phosphate comme substrats, respectivement. (B) Le capteur fluorescent spécifique du phosphate a révélé la présence de phosphate dans une réaction d’extension d’amorce catalysée par Taq avec des dNDPs purifiés (ligne pleine). Aucune fluorescence n’a été observée lorsque l’enzyme a été omise (ligne pointillée). (C) Les réactions inverses dépendantes du phosphate inorganique (Pi) et du pyrophosphate (PPi) sur 20 min montrent la digestion de l’amorce marquée en 5′. (D) Analyse par CCM à échange d’anions des produits libérés pendant la réaction inverse. L’incubation de la Taq polymérase en présence de phosphate (Pi) et d’une amorce marquée au 32P produit du 32P-dADP, et l’ajout de pyrophosphate 5 mM à la réaction produit également du 32P-dATP, ce qui prouve que l’ADN polymérase Taq peut utiliser des substrats di- et triphosphates pour la polymérisation. (E) Dégradation de l’ADN avec le phosphate (○) et le pyrophosphate (●), montrant de grandes différences dans le KM (∼10 et 0,054 ± 0,005 mM) et le Vmax (0,0010 ± 0,0005 et 0,205 ± 0,005 s-1, respectivement). Les données relatives au pyrophosphate ont été ajustées directement (encart à échelle linéaire), tandis que les paramètres relatifs au phosphate ont été extraits d’un tracé double-réciproque des données.
Pour vérifier que les réactions ne produisent pas de dNTP à partir de dNDP, nous avons incubé la Taq polymérase avec 250 µM de dCDP et de dTDP et résolu les réactions par chromatographie d’échange d’ions (figure S3B). Cette analyse n’a révélé aucune nouvelle espèce moléculaire correspondant à des nucléotides mono- ou triphosphorylés dans la réaction contenant l’enzyme, par rapport à la réaction sans enzyme, ce qui indique une absence d’activité phosphoryl transférase dans la préparation enzymatique et soutient davantage l’utilisation directe des dNDP dans la synthèse de l’ADN.
Comme décrit ci-dessus, les réactions avec les substrats dNDP libèrent un phosphate inorganique (Pi), et la réaction inverse est donc la phosphorolyse de l’ADN (Fig. 2A). Pour tester l’efficacité de cette réaction inverse, nous avons étudié la phosphorolyse d’une amorce marquée au 5′ 32P annelée à un brin matrice en l’incubant avec l’enzyme et 10 mM Pi. La figure 2C montre l’élimination du nucléotide 3′ terminal du brin d’amorce par l’ADN polymérase Taq en présence de Pi et de PPi, ce qui démontre que l’ADN polymérase Taq peut subir la réaction inverse de polymérisation de l’ADN à partir de dNTPs et de dNDPs. L’analyse des polymérases thermophiles Bst, Deep Vent, KOD (Fig. S4A), 9°N, Tgo, et les polymérases mésophiles Bsu a également montré la phosphorolyse de l’ADN (Fig. S4B), bien que dans une moindre mesure. Une réaction témoin avec le fragment Klenow de l’ADN polymérase I d’Escherichia coli, qui n’accepte pas les dNDP comme substrats, a également été examinée (Fig. S4C) et a montré que la présence de PPi, mais pas de Pi, entraîne le raccourcissement de l’amorce.
Pour analyser davantage la réaction inverse, nous avons préparé de l’ADNdb marqué intérieurement avec du 32P-phosphate en effectuant une réaction d’extension d’amorce avec de l’α-32P-dATP, suivie d’une purification par PAGE. Nous avons analysé les produits de la réaction inverse en utilisant une CCM à échange d’anions (polyéthylèneimine). Comme prévu, l’incubation de l’ADN à marquage interne avec la Taq polymérase et le pyrophosphate a donné des produits qui ont migré avec le dATP. Les réactions en présence de phosphate ont produit des espèces migrant plus rapidement, correspondant au dADP, et les réactions sans phosphate ou pyrophosphate n’ont produit aucune espèce migrant, indiquant qu’en présence de Taq polymérase seule, l’ADN est resté intact (figure 2D) et confirmant que la réaction inverse est la phosphorolyse de l’ADN.
Enfin, l’analyse de la cinétique de la réaction inverse en fonction du substrat a révélé un KM de ∼10 ± 5 mM (n = 9) et 57 ± 5 µM (n = 5) pour le phosphate et le pyrophosphate, respectivement, bien que la faible solubilité du phosphate de magnésium au-dessus de 10 mM nous ait empêchés d’obtenir des mesures précises (Fig. 2E). Les structures cristallines des ADN polymérases avec du pyrophosphate ou de l’acide phosphonoformique dans les sites actifs montrent une interaction coulombienne avec la protéine (11⇓-13). Le rapport de 200 entre les KM des deux substrats correspond à ∼15 kJ/mol (3,6 kcal/mol) à 72 °C, une énergie de liaison approximativement égale à une interaction ionique entre le phosphate supplémentaire et un cation compensateur sur la protéine et soutenant un modèle dans lequel le phosphate/pyrophosphate est reconnu principalement par une interaction charge-charge. Les estimations des vitesses maximales de la réaction inverse ont suivi une tendance similaire : dans ces conditions, la Vmax était de 0,0010 ± 0,0005 s-1 et 0,205 ± 0,005 s-1 pour le phosphate et le pyrophosphate, respectivement, révélant à nouveau un rapport d’environ 200 fois entre les deux activités. Pris ensemble, sous des concentrations saturantes des deux substrats, la réaction de phosphate est environ 4 × 104 fois moins efficace, ce qui suggère que la phosphorolyse de l’ADN ne constitue pas une menace significative pour la stabilité du génome.
Pour mieux comprendre la synthèse de l’ADN à partir des substrats à faible énergie (dNDPs et Pi), nous avons mesuré les énergies d’activation en utilisant l’analyse d’Arrhenius des réactions avant et arrière. Comme les mesures unimoléculaires des changements de conformation associés à la reconnaissance et à l’incorporation des bons dNTP ont révélé un mouvement de la protéine plus rapide que la cinétique de réaction observée (14), l’étape limitant la vitesse de la réaction en avant dans la Taq polymérase est probablement liée à l’étape de chimie ou à un réarrangement pré-catalytique du site actif qui dépend de l’interaction avec les phosphates du substrat. Nous avons observé que la Vmax des réactions avant et arrière est plus faible pour le dNDP et le phosphate que pour le dNTP et le pyrophosphate, ce qui suggère que l’étape limitant la vitesse est sensible à l’état de phosphorylation des substrats. Cependant, le réarrangement pré-catalytique (tel que l’alignement des résidus du site actif et la liaison d’un ion Mg2+ catalytique) et l’étape de chimie peuvent être affectés par la phosphorylation du substrat ; par conséquent, l’une ou l’autre étape peut limiter le taux en présence de dNDPs, en supposant qu’ils n’introduisent pas une nouvelle étape conformationnelle lente dans le mécanisme. Dans la Pol β, il a été proposé précédemment que ces deux étapes aient des constantes de vitesse similaires (15), et les énergies d’activation calculées pour les réactions avant et arrière utilisant les substrats à haute énergie (dNTPs et pyrophosphate) ne diffèrent que de 15 kJ/mol (4). Dans le cas des enzymes thermophiles Taq et Klentaq1, l’énergie d’activation de la réaction en avant varie largement, allant de 90 à 125 kJ/mol, selon les conditions expérimentales et probablement l’identité des nucléotides qui réagissent (8, 16), alors que l’énergie d’activation de la pyrophosphorolyse n’a pas été, à notre connaissance, déterminée expérimentalement.
Nous avons analysé les taux d’incorporation d’un seul nucléotide de 50 µM de dCDP, dADP et dTDP, empilés respectivement sur dA, dC et dA, pendant la réaction d’extension d’amorce. L’analyse d’Arrhenius a montré une dépendance linéaire de ln(kobs) sur 1/T pour les expériences en dessous de 60 °C, révélant des énergies d’activation de 85 ± 14, 108 ± 11, et 112 ± 15 kJ/mol pour les trois nucléotides (Fig. 3 A et B ; n = 6 pour chaque nucléotide). L’analyse d’Arrhenius de la réaction inverse avec 0,4 mM de phosphate, donnant une molécule de dADP, a révélé une grande énergie d’activation de 138 ± 10 kJ/mol (n = 5), en accord avec la vitesse lente observée de la phosphorolyse de l’ADN par Taq (Fig. 3 A et B), et représentant une augmentation significative par rapport à l’énergie d’activation calculée de la pyrophosphorolyse (92 kJ/mol dans Pol β) (4). L’énergie d’activation des réactions avant et arrière pour le dADP diffère donc de ∼30 kJ/mol, fournissant un fort biais pour la synthèse d’ADN. Ce biais pour la réaction en avant se traduit par une moindre exigence de séquestration du produit phosphate par une voie métabolique en aval, contrairement à la synthèse d’ADN basée sur les dNTP et l’hydrolyse du pyrophosphate par les pyrophosphatases inorganiques. De plus, si les changements conformationnels précatalytiques de la Taq polymérase ne sont pas affectés par les substrats à faible énergie et que l’étape de chimie est limitante, l’utilisation des dNTP et des phosphates peut donner un nouvel aperçu expérimental de la catalyse enzymatique de la synthèse de l’ADN.
Paramètres cinétiques des réactions avant et arrière avec l’ADN polymérase Taq. (A) Analyse d’Arrhenius de la phosphorolyse (pour produire du dADP ; ▲) et de la réaction en sens direct avec les dNDP, donnant des Ea de 138 ± 10 et 90 ± 10 kJ/mol, respectivement (108 ± 11, 85 ± 14, et 112 ± 15 kJ/mol pour dADP, △ ; dCDP, ○ ; et dTDP, +, respectivement). (B) Coordonnées de réaction pour les réactions avant et arrière, indiquées par rapport à l’énergie d’une amorce non étendue, dAMP (supposée être la même que la valeur AMP), et phosphate (Pi). L’ajout des énergies d’activation mesurées à l’énergie d’hydrolyse de l’ADP et d’un phosphodiester révèle que l’état de transition (TS) est à peu près au même niveau pour les réactions avant et arrière (dans les limites de l’erreur expérimentale, indiquée par la boîte grise). La grande différence entre les énergies d’activation et les KM pour les dNDP et le phosphate, ainsi que la nature exergonique de la réaction globale, expliquent l’efficacité de la synthèse de l’ADN à partir des dNDP, en particulier par les ADN polymérases thermophiles, et la stabilité apparente de l’ADN par rapport à la phosphorolyse sous la charge à basse ou haute énergie de la cellule.
Notre étude démontre que Taq, et plusieurs autres enzymes des familles A et B d’ADN polymérases, y compris les enzymes réplicatives des bactéries thermophiles et mésophiles, peuvent remplacer les substrats triphosphates canoniques par les analogues diphosphates. Les premières preuves de l’inutilité du γ-phosphate dans le substrat nucléotidique proviennent d’études de la transcriptase inverse du VIH-1 et de l’ADN polymérase gp43 du bactériophage RB69. Les variantes de la RT du VIH-1 qui abolissent l’interaction électrostatique entre le γ-phosphate du dNTP entrant et la polymérase ont permis de conserver l’activité, bien qu’à un rythme beaucoup plus lent (17⇓-19), et l’ADN polymérase gp43 du bactériophage RB69 a présenté une activité similaire (20). Ces deux enzymes virales acceptent les dNTP comme substrats, mais avec des KM (ou KD) qui sont 500 et 17 fois plus élevés, et des constantes de vitesse qui sont 100 et 400 fois plus faibles que pour les dNTP par la RT du VIH-1 et la gp43 du RB69, respectivement (20, 21). Notre étude démontre que les polymérases réplicatives cellulaires possèdent cette activité, décrit les affinités de substrat et les énergies d’activation pour les réactions avant et arrière, et implique que la synthèse d’ADN à partir des dNDP est raisonnablement efficace, en particulier pour les enzymes thermostables.
Nos résultats suggèrent que la réplication de l’ADN peut être accomplie en utilisant les dNDP comme substrats. Chez les thermophiles, la réplication du génome peut être moins sensible à la charge énergétique de la cellule que chez les mésophiles car les polymérases thermostables peuvent accepter les substrats diphosphorylés ainsi que les substrats triphosphorylés. La réplication de l’ADN est donc moins affectée par le rapport ATP/ADP intracellulaire, et l’efficacité relativement élevée avec laquelle l’ADN est synthétisé à des températures élevées suggère que les thermophiles peuvent être capables de se passer entièrement des substrats triphosphorylés. De plus, les preuves paléobiologiques suggèrent que le dernier ancêtre commun de notre biosphère était un thermophile (22⇓-24), et notre étude implique que les substrats disphosphorylés pourraient avoir été suffisants pour la réplication du génome des premiers organismes, allégeant le besoin de métaboliser des intermédiaires métaboliques triphosphorylés à haute énergie. Dans ce cas, les diphosphates pourraient être considérés comme des intermédiaires dans l’évolution des métabolites à haute énergie et pourraient inclure des blocs de construction ancestraux des premiers génomes, tels que des ribonucléotides ou des acides nucléiques plus simples.
L’ADN polymérase joue des rôles prépondérants dans de nombreuses biotechnologies. L’utilisation de substrats diphosphates rapportés ici a le potentiel de rendre pratique l’incorporation d’analogues coûteux, tels que des nucléotides marqués isotopiquement ou chimiquement modifiés, éliminant le besoin de synthèses triphosphates difficiles. Cette caractéristique des ADN polymérases peut également fournir une méthode de détection des nucléotides utilisés dans le séquençage de l’ADN à haut débit. Deux méthodes courantes permettent de détecter le groupe partant PPi associé à l’extension de l’amorce, soit par un test chimioluminescent secondaire, soit en surveillant un changement du pH local (25, 26). L’utilisation d’un substrat dNDP produit du Pi, offrant ainsi une opportunité supplémentaire de distinguer les nucléotides incorporés. Cette appréciation élargie des capacités de l’ADN polymérase suggère également que l’examen d’autres enzymes triphosphate-dépendantes pourrait révéler une tolérance pour des substrats diphosphate à plus faible énergie, plus faciles d’accès, comme intermédiaires évolutifs.