Carattere al codice sorgente del vaccino mRNA BioNTech/Pfizer SARS-CoV-2

 In questo post daremo uno sguardo carattere per carattere al codice sorgente del vaccino mRNA BioNTech/Pfizer SARS-CoV-2.

Voglio ringraziare l’ampio cast di persone che hanno trascorso del tempo a visualizzare in anteprima questo articolo per leggibilità e correttezza. Tuttavia, tutti gli errori rimangono miei, ma mi piacerebbe sentirne parlare rapidamente a bert@hubertnet.nl o @PowerDNS_Bert

Ora, queste parole possono essere un po’ stridenti: il vaccino è un liquido che viene iniettato nel tuo braccio. Come possiamo parlare di codice sorgente?

Questa è una buona domanda, quindi iniziamo con una piccola parte del codice sorgente del vaccino BioNTech/Pfizer, noto anche come BNT162b2, noto anche come Tozinameran noto anche come Comirnaty.

Primi 500 caratteri dell'mRNA BNT162b2. Fonte: Organizzazione mondiale della sanità

Primi 500 caratteri dell’mRNA BNT162b2. Fonte: Organizzazione mondiale della sanità

Il vaccino mRNA BNT162b ha questo codice digitale al centro. È lungo 4284 caratteri, quindi starebbe in un mucchio di tweet. All’inizio del processo di produzione del vaccino, qualcuno ha caricato questo codice su una stampante DNA (sì), che poi ha convertito i byte sul disco in vere molecole di DNA.

Una stampante Codex DNA BioXp 3200 DNA

Una stampante Codex DNA BioXp 3200 DNA

Da una macchina del genere escono piccole quantità di DNA, che dopo molte elaborazioni biologiche e chimiche finiscono come RNA (ne parleremo più avanti) nella fiala del vaccino. Una dose di 30 microgrammi risulta contenere effettivamente 30 microgrammi di RNA.

Inoltre, c’è un intelligente sistema di confezionamento dei lipidi (grassi) che porta l’mRNA nelle nostre cellule.L’RNA è la versione volatile del DNA come “memoria di lavoro”. Il DNA è come la memoria flash drive della biologia. Il DNA è molto resistente, ridondante internamente e molto affidabile. Ma proprio come i computer non eseguono il codice direttamente da un’unità flash, prima che accada qualcosa, il codice viene copiato su un sistema più veloce, più versatile ma molto più fragile.

Per i computer, questa è la RAM, per la biologia è l’RNA. La somiglianza è sorprendente. A differenza della memoria flash, la RAM si degrada molto rapidamente se non rinfrescata continuamente. Il motivo per cui il vaccino mRNA Pfizer/BioNTech deve essere conservato nel più profondo dei congelatori è lo stesso: l’RNA è fragile.

Ogni carattere RNA pesa nell’ordine di 0,53 · 10⁻²¹ grammi, il che significa che ci sono 6 caratteri · 10¹⁶ in una singola dose di vaccino da 30 microgrammi. Espresso in byte, si tratta di circa 25 petabyte, anche se va detto che si tratta di circa 2000 miliardi di ripetizioni degli stessi 4284 caratteri. Il contenuto informativo effettivo del vaccino è di poco più di un kilobyteSARS-CoV-2 stesso pesa circa 7,5 kilobyte.

Il più breve background

Il DNA è un codice digitale. A differenza dei computer, che usano 0 e 1, la vita usa A, C, G e U/T (i “nucleotidi“, i “nucleosidi” o le “basi“).

Nei computer memorizziamo lo 0 e l’1 come (assenza) di carica, o come corrente, come transizione magnetica, o come tensione, o come modulazione di un segnale. O, in breve, lo 0 e l’1 non sono una sorta di concetto astratto: vivono come elettroni e in molte altre incarnazioni fisiche.

In natura, A, C, G e U/T sono molecole, immagazzinate come catene nel DNA (o RNA).

Nei computer, raggruppiamo 8 bit in un byte e il byte è l’unità tipica di dati elaborati.

La natura raggruppa 3 nucleotidi in un codone e questo codone è l’unità tipica di elaborazione. Un codone contiene 6 bit di informazioni (2 bit per carattere DNA, 3 caratteri = 6 bit. Ciò significa 2⁶ = 64 diversi valori di codone).

Finora abbastanza digitale. In caso di dubbio, vai al documento dell’OMS con il codice digitale per vedere di persona.

Ulteriori letture sono disponibili qui  (in inglese) questo collegamento (“Cos’è la vita”) potrebbe aiutare a dare un senso al resto di questa pagina. Oppure, se ti piacciono i video, ho due ore per te (in inglese).

Quindi cosa fa quel codice?

L’idea di un vaccino è insegnare al nostro sistema immunitario come combattere un patogeno, senza che ci ammaliamo davvero. Storicamente questo è stato fatto iniettando un virus indebolito o inabilitato (attenuato), più un “adiuvante”, per spaventare il nostro sistema immunitario in azione. Questa era una tecnica decisamente analoga che coinvolgeva miliardi di uova (o insetti) per la produzione. Inoltre ha richiesto molta fortuna e molto tempo. A volte veniva utilizzato anche un virus diverso (non correlato).

Un vaccino a mRNA ottiene la stessa cosa (“educare il nostro sistema immunitario”) ma in un modo simile al laser. E intendo questo in entrambi i sensi: molto ristretto ma anche molto potente.

Quindi ecco come funziona. L’iniezione contiene materiale genetico volatile che descrive la famosa proteina “Spike” SARS-CoV-2. Attraverso mezzi chimici intelligenti, il vaccino riesce a portare questo materiale genetico in alcune delle nostre cellule.

Questi quindi iniziano doverosamente a produrre proteine ​​SARS-CoV-2 Spike in quantità abbastanza grandi da far entrare in azione il nostro sistema immunitario. Di fronte alle proteine ​​Spike e (soprattutto) ai segni rivelatori che nelle cellule sono state rilevati, il nostro sistema immunitario sviluppa una potente risposta contro molteplici aspetti della proteina Spike e del suo processo di produzione.

E questo è ciò che ci porta al vaccino efficiente al 95%.

Il codice sorgente!

Cominciamo dall’inizio, un ottimo punto di partenza. Il documento dell’OMS ha questa immagine utile:

vaccine toc

Questa è una sorta di sommario. Inizieremo con il “berretto”, rappresentato in realtà come un cappellino.

Proprio come non puoi semplicemente inserire l’opcode in un file su un computer ed eseguirlo, il sistema operativo biologico richiede un’intestazioni, ha un linker e altre cose come convenzioni di chiamata.

Il codice del vaccino inizia con i seguenti 2 nucleotidi:

GA

Questo può essere paragonato molto a ogni eseguibile DOS e Windows che inizia con MZ, o agli script UNIX che iniziano con #!

Sia nella vita che nei sistemi operativi, questi 2 identificativi non vengono eseguiti in alcun modo. Ma devono essere lì perché altrimenti non succede nulla.

Il “berretto” dell’mRNA ha una serie di funzioni. Una contrassegna il codice come proveniente dal nucleo. Nel nostro caso ovviamente no, il nostro codice deriva da una vaccinazione. Ma non abbiamo bisogno di dirlo alla cellula. Il berretto fa sembrare il nostro codice legittimo, il che lo protegge dalla distruzione.

I 2 nucleotidi GA iniziali sono anche chimicamente leggermente diversi dal resto dell’RNA. In questo senso, GAha delle segnalazioni fuori banda.

La “regione dei 5 primi non tradotti”

Un po’ di gergo qui. Le molecole di RNA possono essere lette solo in una direzione. In modo poco chiaro, la parte in cui inizia la lettura è chiamata 5′ o ‘cinque primi ‘. La lettura si ferma all’estremità 3′ o ‘tre primi’.

La vita consiste di proteine ​​(o cose fatte dalle proteine). E queste proteine ​​sono descritte nell’RNA. Quando l’RNA viene convertito in proteine, questo viene chiamato traduzione.

Qui abbiamo la regione non tradotta 5′ (UTR), quindi questo codice non finisce nella proteina:

GAAΨAAACΨAGΨAΨΨCΨΨCΨGGΨCCCCACAGACΨCAGAGAGAACCCGCCACC

Qui incontriamo la nostra prima sorpresa. I caratteri normali dell’RNA sono A, C, G e U. U è sostituita da T nel DNA. Ma qui troviamo un Ψ, cosa sta succedendo?

Questo è uno degli aspetti eccezionalmente intelligenti del vaccino. Il nostro corpo gestisce un potente sistema antivirus (“quello originale”). Per questo motivo, le cellule sono estremamente poco entusiaste dell’RNA estraneo e si sforzano di distruggerlo prima che faccia qualsiasi cosa.

Questo è un po’ un problema per il nostro vaccino: deve superare il nostro sistema immunitario. In molti anni di sperimentazione, si è scoperto che se l’U nell’RNA viene sostituita da una molecola leggermente modificata, il nostro sistema immunitario perde interesse. Davvero!

Quindi, nel vaccino BioNTech/Pfizer, ogni U è stata sostituita da 1-methyl-3′-pseudouridylyl o pseudouridina, indicato con Ψ.

La cosa veramente intelligente è che, sebbene questa sostituzione Ψ plachi il nostro sistema immunitario, è accettata come una normale U da parti rilevanti della cellula.

Nella sicurezza informatica conosciamo anche questo trucco. A volte è possibile trasmettere una versione leggermente corrotta di un messaggio che confonde firewall e soluzioni di sicurezza, ma che è ancora accettata dai server backend che può quindi essere hackerato.

Stiamo ora raccogliendo i frutti della ricerca scientifica fondamentale svolta in passato. Gli scopritori di questa tecnica hanno dovuto lottare per ottenere il finanziamento del loro lavoro. Dovremmo essere tutti molto grati e sono sicuro che i premi Nobel arriveranno a tempo debito .

Molte persone hanno chiesto: i virus potrebbero anche usare la tecnica Ψ per battere il nostro sistema immunitario? In breve, questo è estremamente improbabile. La vita semplicemente non ha la macchina per costruire nucleotidi 1-methyl-3′-pseudouridylyl. I virus si basano sui meccanismi della vita per riprodursi e questa struttura semplicemente non esiste. I vaccini a mRNA si degradano rapidamente nel corpo umano e non vi è alcuna possibilità che l’RNA modificato si replichi con Ψ ancora presente. “No, davvero, i vaccini mRNA non influenzeranno il tuo DNA” è anche una buona lettura.

Ok, torniamo al 5 ‘UTR. Cosa fanno questi 51 caratteri? Come ogni cosa in natura, quasi nulla ha una funzione chiara.

Quando le nostre cellule hanno bisogno di tradurre l’ RNA in proteine, questo viene fatto usando una macchina chiamata ribosoma. Il ribosoma è come una stampante 3D per le proteine. Ingerisce un filamento di RNA e in base a questo emette una serie di aminoacidi, che poi si piegano in una proteina.

Protein translation
Source: Wikipedia user Bensaccount
Questo è ciò che vediamo accadere sopra. Il nastro nero in basso è l’RNA. Il nastro che appare nella parte verde è la proteina che si sta formando. Le cose che volano dentro e fuori sono amminoacidi più adattatori per renderli adatti all’RNA.

Questo ribosoma ha bisogno di inserirsi fisicamente sul filamento di RNA affinché possa funzionare. Una volta inserito, può iniziare a formare proteine ​​basate sull’ulteriore RNA che legge. Questa è solo una delle funzioni dell’UTR: la zona di attracco dei ribosomi.

Oltre a questo, l’UTR contiene anche metadati: quando dovrebbe avvenire la traduzione? E per quanto? Per il vaccino, hanno preso la maggior parte di UTR dal gene della globina alfa. Questo gene è noto per produrre in modo robusto molte proteine. Negli anni precedenti, gli scienziati avevano già trovato modi per ottimizzare ulteriormente questo UTR (secondo il documento dell’OMS), quindi questo non è esattamente l’UTR alfa globina. È megliore.

Il peptide segnale della glicoproteina S.

Come detto, l’obiettivo del vaccino è far sì che la cellula produca quantità abbondanti della proteina Spike di SARS-CoV-2. Fino a questo punto, abbiamo riscontrato per lo più metadati e “convenzioni di chiamata” nel codice sorgente del vaccino. Ma ora entriamo nel vero territorio della proteina ​​virale.

Tuttavia, abbiamo ancora un livello di metadati da utilizzare. Una volta che il ribosoma (dalla splendida animazione sopra) ha prodotto una proteina, quella proteina deve ancora andare da qualche parte. Questo è codificato nel “peptide segnale della glicoproteina S (sequenza leader estesa)”.

Il modo per vedere questo è che all’inizio della proteina c’è una sorta di etichetta dell’indirizzo, codificata come parte della proteina stessa. In questo caso specifico, il peptide segnale dice che questa proteina dovrebbe uscire dalla cellula attraverso il “reticolo endoplasmatico”. Anche il gergo di Star Trek non è così sofisticato!

Il “peptide segnale” non è molto lungo, ma quando guardiamo il codice, ci sono differenze tra l’RNA virale e quello del vaccino:

(Si noti che a scopo di confronto, ho sostituito la modificata Ψ con un normale RNA U)

           3   3   3   3   3   3   3   3   3   3   3   3   3   3   3   3
Virus:   AUG UUU GUU UUU CUU GUU UUA UUG CCA CUA GUC UCU AGU CAG UGU GUU
Vaccine: AUG UUC GUG UUC CUG GUG CUG CUG CCU CUG GUG UCC AGC CAG UGU GUU
               !   !   !   !   ! ! ! !     !   !   !   !   !            

Quindi che sta succedendo? Non ho accidentalmente elencato l’RNA in gruppi di 3 lettere. Tre caratteri RNA formano un codone. E ogni codone codifica un amminoacido specifico. Il peptide segnale nel vaccino è costituito esattamente dagli stessi amminoacidi del virus stesso.

Allora come mai l’RNA è diverso?

Ci sono 4³ = 64 codoni diversi, poiché ci sono 4 caratteri RNA e ce ne sono 3 in un codone. Eppure ci sono solo 20 diversi amminoacidi. Ciò significa che più codoni codificano lo stesso amminoacido.

Life utilizza la seguente tabella quasi universale per mappare i codoni dell’RNA agli amminoacidi:

The RNA codon table (Wikipedia)

The RNA codon table (Wikipedia)

In questa tabella, possiamo vedere che le modifiche nel vaccino (UUU -> UUC) sono tutte sinonimi. Il codice RNA del vaccino è diverso, ma escono gli stessi amminoacidi e la stessa proteina.

Se guardiamo da vicino, vediamo che la maggior parte dei cambiamenti avviene nella posizione del terzo codone, indicata con un “3” sopra. E se controlliamo la tabella dei codoni universali, vediamo che questa terza posizione in effetti spesso non ha importanza per quale amminoacido viene prodotto.

Quindi, i cambiamenti sono sinonimi, ma allora perché ci sono? Guardando da vicino, vediamo che tutte le modifiche tranne una portano a più C e G.

Allora perché dovresti farlo? Come notato sopra, il nostro sistema immunitario ha una visione molto debole dell’RNA “esogeno”, codice RNA proveniente dall’esterno della cellula. Per eludere il rilevamento, la “U” nell’RNA era già stata sostituita da un Ψ.

Tuttavia, risulta che anche l’RNA con una quantità maggiore di G e C viene convertito in modo più efficiente in proteine,

E questo è stato ottenuto nell’RNA del vaccino sostituendo molti caratteri con G e C, ovunque fosse possibile.

Sono un po’ affascinato dal quello cambiamento che non ha portato a un ulteriore C o G, il CCA -> modifica CCU. Se qualcuno conosce il motivo, per favore fatemelo sapere! Nota che sono consapevole che alcuni codoni sono più comuni di altri nel genoma umano, ma ho anche letto che questo non influenza molto la velocità di traduzione .

L’attuale proteina Spike

I successivi 3777 caratteri dell’RNA del vaccino sono “ottimizzati per il codone” aggiungendo molti C e G. Nell’interesse dello spazio non elencherò tutto il codice qui, ma ingrandiremo un pezzo eccezionalmente speciale. Questa è la parte che lo fa funzionare:

                  *   *
          L   D   K   V   E   A   E   V   Q   I   D   R   L   I   T   G
Virus:   CUU GAC AAA GUU GAG GCU GAA GUG CAA AUU GAU AGG UUG AUC ACA GGC
Vaccine: CUG GAC CCU CCU GAG GCC GAG GUG CAG AUC GAC AGA CUG AUC ACA GGC
          L   D   P   P   E   A   E   V   Q   I   D   R   L   I   T   G
           !     !!! !!        !   !       !   !   !   ! !              

Qui vediamo i soliti cambiamenti dell’RNA. Ad esempio, nel primo codone vediamo che CUU è cambiato in CUG. Questo aggiunge un’altra “G” al vaccino, che sappiamo aiuta a migliorare la produzione di proteine. Sia CUU che CUG codificano per l’amminoacido “L” o leucina, quindi non è cambiato nulla nella proteina.

Quando confrontiamo l’intera proteina Spike nel vaccino, tutti i cambiamenti sono simili a questo .. tranne 2, e questo è ciò che vediamo qui.

Il terzo e il quarto codone sopra rappresentano i cambiamenti effettivi. Gli amminoacidi K e V sono entrambi sostituiti da “P” o Prolina. Per ‘K’ questo richiedeva 3 modifiche (‘!!!’) e per ‘V’ ne richiedeva solo 2 (‘!!’).

Si scopre che questi 2 cambiamenti migliorano enormemente l’efficienza del vaccino .

Allora cosa sta succedendo qui? Se guardi una vera particella SARS-CoV-2, puoi vedere la proteina Spike e, beh, un mucchio di punte:

SARS virus particles (Wikipedia)
SARS virus particles (Wikipedia)

Le punte sono montate sul corpo del virus (“la proteina nucleocapside“). Ma il fatto è che il nostro vaccino sta solo generando le punte stesse e non le stiamo montando su nessun tipo di corpo virale.

Si è scoperto che le proteine ​​Spike indipendenti e non modificate collassano in una struttura diversa. Se iniettato come vaccino, questo indurrebbe effettivamente il nostro corpo a sviluppare l’immunità … ma solo contro la proteina spike collassata.

E il vero SARS-CoV-2 si presenta con il corpo spinoso di Spike. Il vaccino non funzionerebbe molto bene in quel caso.

Quindi che si fa? Nel 2017 è stato descritto come mettere una doppia sostituzione di Proline nel posto giusto avrebbe fatto sì che le proteine ​​SARS-CoV-1 e MERS S assumessero la loro configurazione ‘pre-fusione’, anche senza far parte dell’intero virus. Questo funziona perché la Prolina è un amminoacido molto rigido. Agisce come una specie di stecca, stabilizzando la proteina nello stato che dobbiamo mostrare al sistema immunitario.

Le persone che hanno scoperto questo dovrebbero andare in giro a darsi il cinque incessantemente. E sarebbe tutto ben meritato.

Aggiornare! Sono stato contattato dal laboratorio McLellan, uno dei gruppi dietro la scoperta di Proline. Mi dicono che il cinque è attenuato a causa della pandemia in corso, ma sono contenti di aver contribuito ai vaccini. Sottolineano anche l’importanza di molti altri gruppi, lavoratori e volontari.

La fine della proteina, i prossimi passi

Se scorriamo il resto del codice sorgente, riscontriamo alcune piccole modifiche alla fine della proteina Spike:

          V   L   K   G   V   K   L   H   Y   T   s             
Virus:   GUG CUC AAA GGA GUC AAA UUA CAU UAC ACA UAA
Vaccine: GUG CUG AAG GGC GUG AAA CUG CAC UAC ACA UGA UGA 
          V   L   K   G   V   K   L   H   Y   T   s   s          
               !   !   !   !     ! !   !          ! 

Alla fine di una proteina troviamo un codone “stop”, qui indicato con una “s” minuscola. Questo è un modo educato per dire che la proteina dovrebbe finire qui. Il virus originale utilizza il codone di arresto UAA, il vaccino utilizza 2 codoni di arresto UGA, forse solo per buona misura.

La 3° regione non tradotta

Proprio come il ribosoma aveva bisogno di un po’ di introduzione all’estremità 5′, dove abbiamo trovato la “regione cinque primi non tradotta”, alla fine di una proteina troviamo un costrutto simile chiamato 3 ‘UTR.

Si potrebbero scrivere molte parole sull’UTR 3’, ma qui cito ciò che dice Wikipedia : “La regione non tradotta 3′ gioca un ruolo cruciale nell’espressione genica influenzando la localizzazione, la stabilità, l’esportazione e l’efficienza di traduzione di un mRNA … nonostante la nostra attuale comprensione della 3′-UTR, ci sono ancora relativi misteri”.

Quello che sappiamo è che alcune 3′-UTR sono molto efficaci nel promuovere l’espressione delle proteine.

Secondo il documento dell’OMS, il 3′-UTR nel vaccino BioNTech/Pfizer è stato scelto “dal potenziatore ammino-terminale dell’mRNA diviso (AES) e dall’RNA ribosomiale 12S codificato mitocondriale per conferire stabilità dell’RNA e alta espressione proteica totale”.

vaccine

La fine di tutto AAAAAAAAAAAAAAAAAAAAA

La fine dell’mRNA è poliadenilata. Questo è un modo elegante per dire che finisce con un sacco di AAAAAAAAAAAAAAAAAAA.

L’mRNA può essere riutilizzato molte volte, ma quando ciò accade, perde anche alcuni degli A alla fine. Una volta esaurite le A, l’mRNA non è più funzionale e viene scartato. In questo modo, la coda “poli-A” è la protezione dal degrado.

Sono stati condotti studi per scoprire qual è il numero ottimale di A alla fine per i vaccini a mRNA. Ho letto nella letteratura disponibile che questo ha raggiunto il massimo di 120 o giù di lì.

Il vaccino BNT162b2 termina con:

                                     ****** ****
UAGCAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAGCAUAU GACUAAAAAA AAAAAAAAAA 
AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAA

Questo sono 30 A, quindi un “legante a 10 nucleotidi” (GCAUAUGACU), seguito da altre 70 A.

Sospetto che ciò che vediamo qui sia il risultato di un’ulteriore ottimizzazione proprietaria per migliorare ancora di più l’espressione delle proteine.

Riassumendo

Con questo, ora conosciamo l’esatto contenuto di mRNA del vaccino BNT162b2 e, per la maggior parte delle parti, capiamo perché sono presenti:

  • Il CAP per assicurarsi che l’RNA assomigli a un normale mRNA
  • Una regione non tradotta (UTR) di 5′ ben nota e ottimizzata
  • Un peptide di segnale ottimizzato per il codone per inviare la proteina Spike nel posto giusto (copiato al 100% dal virus originale)
  • Una versione ottimizzata per il codone della punta originale del virus, con 2 sostituzioni “Proline” per assicurarsi che la proteina appaia nella forma corretta
  • Una regione non tradotta ben nota e ottimizzata di 3′
  • Una coda poli-A leggermente misteriosa con un “linker” inspiegabile lì dentro

L’ottimizzazione del codone aggiunge molto G e C all’mRNA. Nel frattempo, l’uso di Ψ (pseudouridina) invece di U aiuta a eludere il nostro sistema immunitario, quindi l’mRNA rimane abbastanza a lungo in modo che possiamo effettivamente aiutare ad addestrare il sistema immunitario.

Ulteriore lettura/visione

Nel 2017 ho tenuto una presentazione di due ore sul DNA, che puoi vedere qui. Come questa pagina, è rivolta agli utenti di computer.

Inoltre, dal 2001 gestisco una pagina sul “DNA per i programmatori“.

Potresti anche goderti questa introduzione al nostro fantastico sistema immunitario.

Infine, questo elenco dei miei post sul blog contiene del materiale relativo a DNA, SARS-CoV-2 e COVID.

Fonte: https://berthub.eu/articles/posts/reverse-engineering-source-code-of-the-biontech-pfizer-vaccine/

Commenti

I più letti della settimana

Nessuno può chiedere il Green Pass senza autorizzazione del Ministero

Deagel... E i conti tornano... La stima della popolazione mondiale nel 2025 è agghiacciante

No al silenzio 21 #liberopensiero2019

Covid e libertà

E adesso votate...

Conclusione... Ve lo avevamo detto...