236 liens privés
Bienvenue à tous ! Dans ce billet, nous allons examiner caractère par caractère le code source du vaccin ARNm SARS-CoV-2 de BioNTech/Pfizer.
Mise à jour : après que plus de 1,7 million de personnes ont visité cette page, j'ai décidé d'écrire un livre sur un thème similaire. Pour devenir un lecteur bêta, rendez-vous sur cette page consacrée à la technologie de la vie. Je vous remercie.
Je tiens à remercier les nombreuses personnes qui ont passé du temps à vérifier la lisibilité et l'exactitude de cet article. Toutes les erreurs restent les miennes, mais j'aimerais qu'on me les signale rapidement à l'adresse bert@hubertnet.nl ou @bert_hu_bert.
Le vaccin est un liquide que l'on s'injecte dans le bras. Comment parler de code source ?
C'est une bonne question, alors commençons par une petite partie du code source du vaccin BioNTech/Pfizer, également connu sous le nom de BNT162b2, également connu sous le nom de Tozinameran, également connu sous le nom de Comirnaty.
Les 500 premiers caractères de l'ARNm BNT162b2.
Source : Organisation mondiale de la santé : Organisation mondiale de la santé
Les 500 premiers caractères de l'ARNm BNT162b2.
Source : Organisation mondiale de la santé : Organisation mondiale de la santé
Le vaccin à ARNm BNT162b2 est constitué d'un code numérique. Il comporte 4 284 caractères, ce qui correspond à une série de tweets. Au tout début du processus de production du vaccin, quelqu'un a téléchargé ce code sur une imprimante à ADN (oui), qui a ensuite converti les octets sur le disque en véritables molécules d'ADN.
Une machine à ADN Kilobaser Express
De cette machine sortent de minuscules quantités d'ADN qui, après de nombreuses transformations biologiques et chimiques, se retrouvent sous forme d'ARN (nous y reviendrons) dans le flacon de vaccin. Une dose de 30 microgrammes contient en fait 30 microgrammes d'ARN. En outre, un astucieux système d'emballage lipidique (gras) permet d'introduire l'ARNm dans nos cellules.
Mise à jour : Derek Lowe, du célèbre blog In the pipeline de Science, a rédigé un article complet intitulé "RNA Vaccines And Their Lipids" (Les vaccins ARN et leurs lipides) qui explique clairement les éléments lipidiques et d'administration des vaccins que je ne suis pas en mesure de décrire. Heureusement, Derek l'est !
Mise à jour 2 : Jonas Neubert et Cornelia Scheitz ont écrit cette page impressionnante qui contient de nombreux détails sur la manière dont les vaccins sont produits et distribués. A recommander !
L'ARN est la version volatile de la "mémoire de travail" de l'ADN. L'ADN est en quelque sorte la mémoire flash de la biologie. L'ADN est très durable, redondant en interne et très fiable. Mais tout comme les ordinateurs n'exécutent pas le code directement à partir d'une clé USB, avant qu'un événement ne se produise, le code est copié dans un système plus rapide, plus polyvalent mais beaucoup plus fragile.
Pour les ordinateurs, il s'agit de la mémoire vive, pour la biologie, c'est l'ARN. La ressemblance est frappante. Contrairement à la mémoire flash, la RAM se dégrade très rapidement, à moins d'être entretenue avec amour. La raison pour laquelle le vaccin ARNm de Pfizer/BioNTech doit être stocké dans le plus profond des congélateurs est la même : l'ARN est une fleur fragile.
Chaque caractère d'ARN pèse de l'ordre de 0,53-10-²¹ gramme, ce qui signifie qu'il y a environ 6-10¹⁶ caractères dans une seule dose de vaccin de 30 microgrammes. Exprimé en octets, cela représente environ 14 pétaoctets, bien qu'il faille préciser qu'il s'agit d'environ 13 000 milliards de répétitions des mêmes 4 284 caractères. Le contenu informatif réel du vaccin dépasse à peine un kilo-octet. Le SARS-CoV-2 lui-même pèse environ 7,5 kilo-octets.
Mise à jour : dans le message original, ces chiffres étaient erronés. Voici une feuille de calcul avec les calculs corrects.
Le contexte le plus bref
L'ADN est un code numérique. Contrairement aux ordinateurs, qui utilisent 0 et 1, la vie utilise A, C, G et U/T (les "nucléotides", "nucléosides" ou "bases").
Dans les ordinateurs, nous stockons les 0 et les 1 sous la forme de la présence ou de l'absence d'une charge, d'un courant, d'une transition magnétique, d'une tension, d'une modulation d'un signal ou d'un changement de réflectivité. En bref, le 0 et le 1 ne sont pas une sorte de concept abstrait - ils vivent sous la forme d'électrons et dans de nombreuses autres incarnations physiques.
Dans la nature, A, C, G et U/T sont des molécules, stockées sous forme de chaînes dans l'ADN (ou l'ARN).
Dans les ordinateurs, nous regroupons 8 bits en un octet, et l'octet est l'unité typique des données traitées.
La nature regroupe 3 nucléotides en un codon, et ce codon est l'unité typique de traitement. Un codon contient 6 bits d'information (2 bits par caractère d'ADN, 3 caractères = 6 bits. Cela signifie que 2⁶ = 64 valeurs de codon différentes).
Pour l'instant, c'est plutôt numérique. En cas de doute, consultez le document de l'OMS contenant le code numérique pour vous en convaincre.
Des lectures complémentaires sont disponibles ici - ce lien ("Qu'est-ce que la vie") peut aider à comprendre le reste de cette page. Ou, si vous aimez les vidéos, j'ai deux heures pour vous.
Que fait ce code ?
L'idée d'un vaccin est d'apprendre à notre système immunitaire à combattre un agent pathogène, sans que nous tombions malades. Historiquement, cela s'est fait par l'injection d'un virus affaibli ou incapacité (atténué), plus un "adjuvant" pour effrayer notre système immunitaire et le pousser à agir. Il s'agissait d'une technique résolument analogique impliquant des milliards d'œufs (ou d'insectes). Elle nécessitait également beaucoup de chance et de temps. Parfois, un virus différent (non apparenté) était également utilisé.
Un vaccin à ARNm permet d'atteindre le même objectif ("éduquer notre système immunitaire"), mais à la manière d'un laser. Et je l'entends dans les deux sens du terme : très étroit mais aussi très puissant.
Voici donc comment cela fonctionne. L'injection contient du matériel génétique volatil qui décrit la fameuse protéine "Spike" du SRAS-CoV-2. Par des moyens chimiques astucieux, le vaccin parvient à introduire ce matériel génétique dans certaines de nos cellules.
Celles-ci se mettent alors consciencieusement à produire des protéines Spike du SRAS-CoV-2 en quantités suffisamment importantes pour que notre système immunitaire entre en action. Confronté aux protéines Spike et aux signes révélateurs de la prise de contrôle des cellules, notre système immunitaire développe une réponse puissante contre de multiples aspects de la protéine Spike ET du processus de production.
C'est ce qui nous permet d'obtenir un vaccin efficace à 95 %.
Le code source !
Commençons par le tout début, un très bon point de départ. Le document de l'OMS contient cette image utile :
Il s'agit d'une sorte de table des matières. Nous commencerons par la "casquette", qui est en fait un petit chapeau.
De la même manière qu'on ne peut pas simplement placer des opcodes dans un fichier sur un ordinateur et l'exécuter, le système d'exploitation biologique a besoin d'en-têtes, d'éditeurs de liens et de conventions d'appel.
Le code du vaccin commence par les deux nucléotides suivants :
GA
Cela peut être comparé à tous les exécutables DOS et Windows commençant par MZ, ou aux scripts UNIX commençant par # ! Dans la vie comme dans les systèmes d'exploitation, ces deux caractères ne sont en aucun cas exécutés. Mais ils doivent être présents, car sinon rien ne se passe.
Le "cap" de l'ARNm a un certain nombre de fonctions. Tout d'abord, il indique que le code provient du noyau. Dans notre cas, ce n'est évidemment pas le cas, notre code provient d'une vaccination. Mais nous n'avons pas besoin de le dire à la cellule. Le capuchon donne à notre code une apparence légitime, ce qui le protège de la destruction.
Les deux nucléotides initiaux de l'AG sont également chimiquement légèrement différents du reste de l'ARN. En ce sens, l'AG est doté d'une signalisation hors bande.
La "région non traduite en cinq points" (five-prime untranslated region)
Un peu de jargon ici. Les molécules d'ARN ne peuvent être lues que dans un seul sens. La partie où la lecture commence est appelée 5' ou "cinq-prime", ce qui peut prêter à confusion. La lecture s'arrête à l'extrémité 3' ou trois-prime.
La vie est constituée de protéines (ou de choses fabriquées par des protéines). Ces protéines sont décrites dans l'ARN. La transformation de l'ARN en protéines s'appelle la traduction.
Ici, nous avons la région 5' non traduite ("UTR"), ce qui fait que cette partie ne se retrouve pas dans la protéine :
GAAΨAAACΨAGΨAΨΨCΨCΨGGΨCCACAGACΨCAGAGAGAACCCGCCACC
C'est ici que nous rencontrons notre première surprise. Les caractères normaux de l'ARN sont A, C, G et U. U est également connu sous le nom de "T" dans l'ADN. Mais ici, nous trouvons un Ψ, que se passe-t-il ?
C'est l'un des aspects les plus intelligents du vaccin. Notre corps dispose d'un puissant système antivirus ("l'original"). C'est pourquoi les cellules ne sont pas très enthousiastes à l'égard de l'ARN étranger et s'efforcent de le détruire avant qu'il ne fasse quoi que ce soit.
C'est en quelque sorte un problème pour notre vaccin, qui doit se faufiler dans notre système immunitaire. Après de nombreuses années d'expérimentation, on a découvert que si le U de l'ARN est remplacé par une molécule légèrement modifiée, notre système immunitaire s'en désintéresse. Pour de vrai.
Ainsi, dans le vaccin BioNTech/Pfizer, chaque U a été remplacé par le 1-méthyl-3'-pseudouridylyl, désigné par Ψ. Ce qui est vraiment astucieux, c'est que bien que ce Ψ de remplacement apaise (calme) notre système immunitaire, il est accepté comme un U normal par les parties concernées de la cellule.
Dans le domaine de la sécurité informatique, nous connaissons également cette astuce : il est parfois possible de transmettre une version légèrement corrompue d'un message qui déroute les pare-feu et les solutions de sécurité, mais qui est tout de même acceptée par les serveurs dorsaux - qui peuvent alors être piratés.
Nous récoltons aujourd'hui les fruits de la recherche scientifique fondamentale menée dans le passé. Les découvreurs de cette technique Ψ ont dû se battre pour que leurs travaux soient financés puis acceptés. Nous devrions tous leur être très reconnaissants, et je suis sûr que les prix Nobel arriveront en temps voulu.
De nombreuses personnes ont demandé si les virus pouvaient également utiliser la technique Ψ pour déjouer nos systèmes immunitaires. En bref, c'est extrêmement improbable. La vie ne dispose tout simplement pas de la machinerie nécessaire pour fabriquer des nucléotides 1-méthyl-3'-pseudouridylyl. Les virus dépendent de la machinerie de la vie pour se reproduire, et cette machinerie n'existe tout simplement pas. Les vaccins ARNm se dégradent rapidement dans le corps humain et il est impossible que l'ARN modifié par le Ψ se réplique avec le Ψ encore présent. Le document "No, Really, mRNA Vaccines Are Not Going To Affect Your DNA" (Non, vraiment, les vaccins ARNm ne vont pas affecter votre ADN) est également intéressant à lire.
Ok, revenons à l'UTR 5'. Que font ces 52 caractères ? Comme tout ce qui existe dans la nature, presque rien n'a de fonction précise.
Lorsque nos cellules doivent traduire l'ARN en protéines, elles le font à l'aide d'une machine appelée ribosome. Le ribosome est une sorte d'imprimante 3D pour les protéines. Il ingère un brin d'ARN et, sur la base de celui-ci, il émet une chaîne d'acides aminés, qui se plient ensuite pour former une protéine.
C'est ce que nous voyons se produire ci-dessus. Le ruban noir en bas est l'ARN. Le ruban qui apparaît en vert est la protéine en cours de formation. Les éléments qui entrent et sortent sont les acides aminés et les adaptateurs qui leur permettent de s'insérer dans l'ARN.
Ce ribosome doit s'asseoir physiquement sur le brin d'ARN pour pouvoir travailler. Une fois installé, il peut commencer à former des protéines sur la base de l'ARN qu'il ingère. On peut donc imaginer qu'il ne peut pas encore lire les parties sur lesquelles il se pose en premier. Ce n'est là qu'une des fonctions de l'UTR : la zone d'atterrissage du ribosome. L'UTR fournit un "lead-in".
En outre, l'UTR contient également des métadonnées : quand la traduction doit-elle avoir lieu ? Et dans quelle mesure ? Pour le vaccin, les chercheurs ont utilisé l'UTR le plus "immédiat" qu'ils aient pu trouver, extrait du gène de la globine alpha. Ce gène est connu pour produire de manière robuste un grand nombre de protéines. Au cours des années précédentes, les scientifiques avaient déjà trouvé des moyens d'optimiser encore davantage cet UTR (selon le document de l'OMS), de sorte qu'il ne s'agit pas tout à fait de l'UTR de la globine alpha. C'est mieux.
Le peptide signal de la glycoprotéine S
Comme nous l'avons vu, le but du vaccin est d'amener la cellule à produire de grandes quantités de la protéine Spike du SARS-CoV-2. Jusqu'à présent, nous avons surtout rencontré des métadonnées et des "conventions d'appel" dans le code source du vaccin. Mais nous entrons maintenant dans le territoire des protéines virales proprement dites.
Cependant, il nous reste encore une couche de métadonnées. Une fois que le ribosome (de la splendide animation ci-dessus) a fabriqué une protéine, celle-ci doit encore aller quelque part. Cette destination est codée dans le "peptide signal de la glycoprotéine S (séquence leader étendue)".
Cela signifie qu'au début de la protéine, il y a une sorte d'étiquette d'adresse - codée comme faisant partie de la protéine elle-même. Dans ce cas précis, le peptide signal indique que la protéine doit sortir de la cellule par le "réticulum endoplasmique". Même le jargon de Star Trek n'est pas aussi sophistiqué que cela !
Le "peptide signal" n'est pas très long, mais lorsque nous examinons le code, nous constatons des différences entre l'ARN viral et l'ARN du vaccin :
(À des fins de comparaison, j'ai remplacé le Ψ modifié par un U d'ARN normal.)
3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
Virus : UG UUU GUUU UUU CUU GUU UUA UUG CCA CUA GUC UCU AGU CAG UGU GUU
Vaccin : AUG UUC GUG UUC CUG GUG CUG CUG CCU CUG GUG UCC AGC CAG UGU GUG
! ! ! ! ! ! ! ! ! ! ! ! ! !
Que se passe-t-il donc ? Ce n'est pas par hasard que j'ai classé l'ARN par groupes de 3 lettres. Trois caractères d'ARN constituent un codon. Et chaque codon code pour un acide aminé spécifique. Le peptide signal du vaccin se compose exactement des mêmes acides aminés que le virus lui-même.
Comment se fait-il alors que l'ARN soit différent ?
Il y a 4³=64 codons différents, puisqu'il y a 4 caractères d'ARN et qu'il y en a trois dans un codon. Pourtant, il n'y a que 20 acides aminés différents. Cela signifie que plusieurs codons codent pour le même acide aminé.
La vie utilise le tableau presque universel suivant pour établir la correspondance entre les codons de l'ARN et les acides aminés :
La table des codons de l'ARN (Wikipedia)
https://en.wikipedia.org/wiki/DNA_and_RNA_codon_tables
https://fr.wikipedia.org/wiki/Code_g%C3%A9n%C3%A9tique#Table_des_codons_d'ARN_messager
Dans ce tableau, nous pouvons voir que les modifications dans le vaccin (UUU -> UUC) sont toutes synonymes. Le code de l'ARN du vaccin est différent, mais il produit les mêmes acides aminés et la même protéine.
Si nous regardons de plus près, nous constatons que la majorité des modifications se produisent dans la troisième position du codon, notée par un "3" ci-dessus. Et si l'on consulte le tableau des codons universels, on constate que cette troisième position n'a souvent pas d'importance pour l'acide aminé qui est produit.
Les changements sont donc synonymes, mais alors pourquoi sont-ils là ? En y regardant de plus près, nous constatons que tous les changements, sauf un, conduisent à davantage de C et de G.
Pourquoi donc ? Comme indiqué plus haut, notre système immunitaire voit d'un très mauvais œil l'ARN "exogène", c'est-à-dire le code ARN provenant de l'extérieur de la cellule. Pour échapper à la détection, le "U" de l'ARN a déjà été remplacé par un "Ψ".
Or, il s'avère que l'ARN contenant une plus grande quantité de G et de C est également converti plus efficacement en protéines,
C'est ce qui a été fait dans l'ARN du vaccin en remplaçant de nombreux caractères par des G et des C lorsque cela était possible.
Je suis légèrement fasciné par la seule modification qui n'a pas entraîné l'ajout d'un C ou d'un G, à savoir la modification CCA -> CCU. Si quelqu'un en connaît la raison, qu'il me la communique ! Je suis conscient que certains codons sont plus fréquents que d'autres dans le génome humain, mais j'ai également lu que cela n'influençait pas beaucoup la vitesse de traduction. MISE À JOUR : un certain nombre de lecteurs ont fait remarquer que ce changement pourrait empêcher la formation d'une "épingle à cheveux" dans l'ARN. Vous pouvez faire l'essai vous-même sur le service RNAFold.
Ce merveilleux article de Chelsea Voss traite en profondeur de la forme et du contenu de l'ARN du SARS-CoV-2.
La protéine Spike proprement dite
Les 3 777 caractères suivants de l'ARN du vaccin sont également "optimisés par codon" pour ajouter de nombreux C et G. Pour des raisons d'espace, je ne vais pas énumérer tout le code ici, mais nous allons nous concentrer sur un élément exceptionnellement spécial. Dans un souci d'espace, je n'énumérerai pas ici tout le code, mais nous allons nous concentrer sur une partie exceptionnellement spéciale. Il s'agit de la partie qui fait fonctionner le système, celle qui nous aidera à retrouver une vie normale :
* *
L D K V E A E V Q I D R L I T G
Virus : CUU GAC AAA GUU GAG GCU GAA GUG CAA AUU GAU AGG UUG AUC ACA GGC
Vaccin : CUG GAC CCU CCU GAG GCC GAG GUG CAG AUC GAC AGA CUG AUC ACA GGC
L D P P E A E V Q I D R L I T G
! ! !! ! ! ! ! ! ! ! ! !
Nous voyons ici les changements synonymes habituels de l'ARN. Par exemple, dans le premier codon, nous voyons que CUU est transformé en CUG. Cela ajoute un "G" supplémentaire au vaccin, ce qui, nous le savons, contribue à améliorer la production de protéines. CUU et CUG codent tous deux pour l'acide aminé "L" ou leucine, de sorte que rien n'a changé dans la protéine.
Lorsque nous comparons l'ensemble de la protéine Spike dans le vaccin, tous les changements sont synonymes, à l'exception de deux, et c'est ce que nous voyons ici.
Les troisième et quatrième codons ci-dessus représentent des changements réels. Les acides aminés K et V y sont tous deux remplacés par "P" ou Proline. Pour 'K', cela a nécessité trois changements ('!!!') et pour 'V', cela n'en a nécessité que deux ('!!').
Il s'avère que ces deux modifications améliorent considérablement l'efficacité du vaccin.
Que se passe-t-il donc ici ? Si l'on observe une vraie particule de SRAS-CoV-2, on peut voir la protéine Spike sous la forme d'une série de pointes :
Particules du virus du SRAS (Wikipedia)
Particules du virus du SRAS (Wikipedia)
Les pointes sont montées sur le corps du virus ("la protéine de la nucléocapside"). Mais le fait est que notre vaccin ne génère que les pics lui-même, et que nous ne les montons sur aucune sorte de corps viral.
Il s'avère que, non modifiées, les protéines Spike indépendantes s'effondrent en une structure différente. Si elles étaient injectées sous forme de vaccin, notre corps développerait une immunité... mais uniquement contre la protéine Spike effondrée.
Et le vrai SARS-CoV-2 apparaît avec la protéine Spike. Le vaccin ne fonctionnerait pas très bien dans ce cas.
Que faire alors ? En 2017, il a été décrit comment la substitution d'une double proline au bon endroit permettait aux protéines S du SRAS-CoV-1 et du MERS d'adopter leur configuration "pré-fusion", même si elles ne font pas partie de l'ensemble du virus. Cela fonctionne parce que la proline est un acide aminé très rigide. Elle agit comme une sorte d'attelle, stabilisant la protéine dans l'état que nous devons montrer au système immunitaire.
Les personnes qui ont découvert cela devraient se féliciter sans cesse. Une insoutenable suffisance devrait émaner d'eux. Et ce serait bien mérité.
Mise à jour ! J'ai été contacté par le laboratoire McLellan, l'un des groupes à l'origine de la découverte de la proline. Ils me disent que les applaudissements sont discrets en raison de la pandémie en cours, mais qu'ils sont heureux d'avoir contribué à la mise au point des vaccins. Ils soulignent également l'importance de nombreux autres groupes, travailleurs et bénévoles.
La fin de la protéine, les prochaines étapes
Si nous parcourons le reste du code source, nous rencontrons quelques petites modifications à la fin de la protéine Spike :
V L K G V K L H Y T s
Virus : GUG CUC AAA GGA GUC AAA UUA CAU UAC ACA UAA
Vaccin : GUG CUG AAG GGC GUG AAA CUG CAC UAC ACA UGA UGA
V L K G V K L H Y T s s
! ! ! ! ! ! ! !
À la fin d'une protéine, on trouve un codon "stop", désigné ici par un "s" minuscule. C'est une façon polie de dire que la protéine doit s'arrêter ici. Le virus original utilise le codon stop UAA, le vaccin utilise deux codons stop UGA, peut-être juste pour faire bonne mesure.
La région 3' non traduite
Tout comme le ribosome avait besoin d'une introduction à l'extrémité 5', où nous avons trouvé la "région non traduite", à l'extrémité de la région codante d'une protéine, nous trouvons une construction similaire appelée "3' UTR".
Il y aurait beaucoup à dire sur l'UTR 3', mais je cite ici ce que dit Wikipedia : ''"La région 3'-non traduite joue un rôle crucial dans l'expression des gènes en influençant la localisation, la stabilité, l'exportation et l'efficacité de la traduction d'un ARNm ... malgré notre compréhension actuelle des UTR 3'-, ils restent encore des mystères relatifs".''
Ce que nous savons, c'est que certains 3'-UTR parviennent très bien à promouvoir l'expression des protéines. Selon le document de l'OMS, le 3'-UTR du vaccin BioNTech/Pfizer a été choisi parmi "l'ARNm de l'AES (amino-terminal enhancer of split) et l'ARN ribosomal 12S codé pour la mitochondrie afin de conférer une stabilité à l'ARN et une expression totale élevée de la protéine". Ce à quoi je réponds : "Bravo !
La fin de la AAAAAAAAAAAAAAAAAA
L'extrémité de l'ARNm est polyadénylée. C'est une façon élégante de dire qu'il se termine par un grand nombre de AAAAAAAAAAAAAAAAA. Il semble que même l'ARNm en ait assez de 2020.
L'ARNm peut être réutilisé de nombreuses fois, mais il perd alors une partie des A à la fin. Une fois les A épuisés, l'ARNm n'est plus fonctionnel et est éliminé. De cette manière, la queue "poly-A" est protégée de la dégradation.
Des études ont été menées pour déterminer le nombre optimal de A à l'extrémité des vaccins ARNm. J'ai lu dans la littérature ouverte que ce nombre atteignait environ 120.
Le vaccin BNT162b2 se termine par :
****** ****
UAGCAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAGCAUAU GACUAAAAAA AAAAAAAAAA
AAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAA AAAAAAAA AAAAAAAA
Il s'agit de 30 A, puis d'un "linker" de 10 nucléotides (GCAUGACU), suivi de 70 A supplémentaires.
Il existe plusieurs théories sur la raison de la présence de ce linker. Certains me disent que cela a à voir avec la stabilité des plasmides d'ADN, ce qu'un expert m'a également confirmé :
"Le linker de 10 nucléotides dans la queue du poly(A) facilite l'assemblage des fragments d'ADN synthétique qui deviennent la matrice pour la transcription de l'ARNm. Il réduit également le glissement de l'ARN polymérase T7, de sorte que la longueur de l'ARNm transcrit est plus uniforme".
L'article "Segmented poly(A) tails significantly reduce recombination of plasmid DNA without affecting mRNA translation efficiency or half-life" (Queues poly(A) segmentées réduisent significativement la recombinaison de l'ADN plasmidique sans affecter l'efficacité de la traduction de l'ARNm ou sa demi-vie) contient également une description convaincante de la manière dont un lien peut améliorer l'efficacité.
Résumer
Nous connaissons maintenant le contenu exact de l'ARNm du vaccin BNT162b2 et, pour la plupart des éléments, nous comprenons pourquoi ils sont là :
- Le CAP pour s'assurer que l'ARN ressemble à un ARNm normal
- Une région 5' non traduite (UTR) optimisée et réussie.
- un peptide signal optimisé par codon pour envoyer la protéine Spike au bon endroit (acides aminés copiés à 100 % à partir du virus d'origine)
- Une version optimisée par codon du spike original, avec deux substitutions de "Proline" pour s'assurer que la protéine apparaît sous la bonne forme.
- Une région 3' non traduite connue et optimisée
- Une queue poly-A avec un "linker".
L'optimisation des codons ajoute beaucoup de G et de C à l'ARNm. Parallèlement, l'utilisation de Ψ (1-méthyl-3'-pseudouridylyl) au lieu de U permet d'échapper à notre système immunitaire, de sorte que l'ARNm reste dans les parages suffisamment longtemps pour que nous puissions réellement contribuer à la formation du système immunitaire.