Il sequenziamento di nanopore è una nuova tecnologia che consente un sequenziamento conveniente in posizioni remote e impostazioni di scarsa risorse. Qui, presentiamo un protocollo per il sequenziamento di mRNA da sangue intero che è compatibile con tali condizioni.
La sequenza in posizioni remote e le impostazioni di scarsa risorse presentano sfide uniche. Il sequenziamento di nanopore può essere utilizzato con successo in tali condizioni ed è stato distribuito in Africa occidentale durante la recente epidemia di virus Ebola, evidenziando questa possibilità. Oltre ai vantaggi pratici (basso costo, facilità di trasporto e utilizzo delle attrezzature), questa tecnologia offre anche vantaggi fondamentali rispetto agli approcci di sequenziamento di seconda generazione, in particolare la lunghezza di lettura molto lunga, la capacità di sequenziare direttamente L’RNA e la disponibilità in tempo reale dei dati. La precisione di lettura RAW è inferiore rispetto ad altre piattaforme di sequenziamento, che rappresenta la principale limitazione di questa tecnologia; Tuttavia, questo può essere parzialmente mitigato dall’alta profondità di lettura generata. Qui, presentiamo un protocollo compatibile sul campo per il sequenziamento della codifica mRNAs per Niemann-Pick C1, che è il recettore cellulare per ebolaviruses. Questo protocollo comprende l’estrazione di RNA da campioni di sangue animale, seguita da RT-PCR per l’arricchimento del bersaglio, barcoding, preparazione della libreria, e la sequenza di esecuzione stessa, e può essere facilmente adattato per l’uso con altri bersagli di DNA o RNA.
Il sequenziamento è uno strumento potente e importante nella ricerca biologica e biomedica. Esso consente l’analisi di Genomes, variazioni genetiche, e profili di espressione di RNA, e quindi svolge un ruolo importante nell’indagine delle malattie umane e animali allo stesso modo1,2. Il sequenziamento con metodo Sanger, uno dei metodi più antichi disponibili per il sequenziamento del DNA, è ancora abitualmente utilizzato fino ad oggi ed è stato un angolo-pietra della biologia molecolare. Negli ultimi 50 anni, questa tecnologia è stata migliorata per ottenere una lunghezza di lettura superiore a 1.000 NT e una precisione superiore a 99,999%1. Tuttavia, il sequenziamento di Sanger ha anche dei limiti. Sequenziare un insieme più ampio di campioni o l’analisi di interi geniti con questo metodo richiede molto tempo e costoso1,3. I metodi di sequenziamento del DNA di seconda generazione (di nuova generazione), come il pirosequenziamento 454 e la tecnologia illumina, ci hanno permesso di ridurre significativamente i costi e il carico di lavoro richiesti per il sequenziamento nell’ultimo decennio, e hanno portato ad un enorme aumento del quantità di informazioni sulla sequenza biologica disponibili4. Tuttavia, le singole sequenze di sequenziamento che utilizzano queste tecnologie di seconda generazione sono costose e il sequenziamento in condizioni di campo è impegnativo, in quanto l’equipaggiamento necessario è ingombrante e fragile (simile ai dispositivi di sequenziamento Sanger) e spesso deve essere calibrato e servito da personale appositamente addestrato. Inoltre, per molte delle tecnologie di seconda generazione, le lunghezze di lettura sono piuttosto limitate, il che spesso rende difficile l’analisi bioinformatica a valle di questi dati.
Il sequenziamento di terza generazione che utilizza dispositivi di sequenziamento di nanoparticelle di dimensioni tascabili (Vedi tabella dei materiali) può fungere da alternativa a queste piattaforme di sequenziamento consolidate. In questi dispositivi una molecola di DNA o RNA a filamento singolo passa attraverso un nanoporo simultaneamente con una corrente ionica che viene poi misurata da un sensore (Figura 1). Come il filo attraversa il nanopore, la modulazione della corrente dai nucleotidi presenti nel poro in un dato momento viene rilevata, e computazionalmente indietro-tradotto nella sequenza nucleotide5. A causa di questo principio operativo, il sequenziamento del nanoporo consente sia la generazione di letture molto lunghe (vicino a 1 x 106 nucleotidi6) e l’analisi dei dati di sequenziamento in tempo reale. Il barcoding è possibile collegando sequenze nucleotidiche definite agli acidi nucleici in un campione, che consente l’analisi di più campioni in una singola sequenza di sequenziamento, aumentando così la velocità effettiva del campione e abbassando i costi per campione. Grazie alla loro elevata portabilità e facilità d’uso, i dispositivi di sequenziamento delle nanoparticelle sono stati utilizzati con successo nel campo durante la recente epidemia di malattia da virus Ebola in Africa occidentale, evidenziando la loro idoneità per un rapido dispiegamento in regioni remote7 , 8. il
Qui, descriviamo un protocollo dettagliato compatibile con il campo per il sequenziamento della codifica mRNA per la proteina Niemann-Pick C1 (NPC1), che è il recettore di ingresso obbligato per filovirus come ebolaviruses, e ha dimostrato di limitare la suscettibilità delle specie a questi virus9,10. Il protocollo comprende l’estrazione dell’intero RNA da campioni di sangue, l’amplificazione specifica di NPC1 mRNA da RT-PCR, la barcoding dei campioni, la preparazione della libreria e il sequenziamento con un dispositivo di sequenziamento di nanoporo. L’analisi dei dati non può essere discussa a causa di limitazioni di spazio, anche se alcune direzioni di base sono fornite nei risultati rappresentativi; Tuttavia, il lettore interessato è riferito a una precedente pubblicazione11 per una descrizione più dettagliata del flusso di lavoro che abbiamo utilizzato, nonché alle pubblicazioni di altri12,13,14 per informazioni dettagliate per quanto riguarda gli strumenti di analisi utilizzati in questo flusso di lavoro.
Negli ultimi due decenni, il sequenziamento dei campioni biologici è diventato un aspetto sempre più importante degli studi in una vasta gamma di aree tematiche. Lo sviluppo di sistemi di sequenziamento di seconda generazione basati sul sequenziamento di una fitta gamma di caratteristiche del DNA che utilizzano cicli iterativi di manipolazione enzimatica e acquisizione dati basata su immagini1 ha aumentato drasticamente il throughput rispetto al tecnica di sequenziamento Sanger tradizionale e consente l’analisi di campioni multipli e di varie specie di acido nucleico in un dato campione in parallelo4. Tuttavia, per la maggior parte dei sistemi di seconda generazione comunemente usati, vengono prodotte solo letture brevi e tutte le piattaforme si basano su apparecchiature sensibili, ingombranti e costose3,4.
A differenza delle piattaforme di sequenziamento di seconda generazione, il dispositivo di sequenziamento utilizzato in questo protocollo si basa sulla tecnologia nanoporo. Qui una molecola di acido nucleico a filamento singolo passa attraverso un nanopore, con conseguente modulazione di una corrente ionica che scorre anche attraverso lo stesso nanopore, e che può essere misurata e ritradotta per dedurre la sequenza della molecola di acido nucleico. Questo approccio di sequenziamento di terza generazione conferisce una serie di vantaggi rispetto ad altri approcci. I principali vantaggi che sono direttamente correlati al principio di funzionamento unico di questa tecnologia sono la lunghezza di lettura estremamente lunga prodotta (lunghezze di lettura fino a 8,8 x 105 nucleotidi sono stati segnalati6), la capacità di sequenziare non solo il DNA, ma anche RNA direttamente, che è stato recentemente dimostrato per un genoma completo del virus dell’influenza17, e la capacità di analizzare i dati in tempo reale come vengono generati, che consente la rapida rilevazione metagenomica di agenti patogeni in minuti18. Ulteriori vantaggi pratici sono le dimensioni estremamente ridotte del dispositivo di sequenziamento di nanoporo, che ne consente l’utilizzo in qualsiasi laboratorio o in missioni sul campo in sedi remote19,20e il prezzo basso rispetto ad altri sequenziamento Piattaforme. In termini di costi di gestione, attualmente è necessaria una nuova cella di flusso per ogni esecuzione di sequenziamento, che comporta costi di circa $1.100 per corsa per la cella di flusso e i reagenti di preparazione della libreria. Questi costi possono essere ridotti in alcuni casi mediante il lavaggio e il riuso della cella di flusso, oppure mediante barcoding e sequenziamento di più campioni in una singola corsa. Inoltre, un nuovo tipo di cella di flusso è attualmente in fase di beta-testato da un piccolo numero di laboratori, che richiederà l’uso di un adattatore di cella di flusso (chiamato “flongle”), e dovrebbe ridurre significativamente il prezzo della cella di flusso e quindi i costi di funzionamento.
La maggiore carenza di sequenziamento del nanoporo rimane la sua accuratezza, con singole precisioni di lettura nell’intervallo da 83 a 86% segnalati6,21,22e la maggior parte delle imprecisioni causate da inserimento/eliminazione ( indels)5,21. Tuttavia, un’elevata profondità di lettura può compensare queste imprecisioni e un recente studio suggerito sulla base di considerazioni teoriche che una profondità di lettura di > 10 potrebbe aumentare la precisione complessiva a > 99,8%21. Tuttavia, saranno necessari ulteriori miglioramenti nella precisione, in particolare se l’analisi deve essere eseguita su un livello di singola molecola piuttosto che su un livello di sequenza di consenso. L’uso della tecnologia 1D2 come descritto in questo protocollo, che si basa sull’aggiunta degli adattatori 1D2 e Barcode (cfr. sezione 5,5) che determinano la sequenzione di entrambe le ciocche di una singola molecola di DNA, aumenta la lettura precisione poiché le informazioni provenienti da entrambi i filamenti di DNA possono essere utilizzate per la determinazione della sequenza. Inoltre, una strategia alternativa che può essere perseguito al fine di combinare i vantaggi del sequenziamento di nanoporo (particolarmente lunga lunghezza di lettura) con la maggiore accuratezza di altre tecnologie di sequenziamento è quello di utilizzare le informazioni di sequenziamento di nanoporo come un scaffold, che è poi lucidato utilizzando i dati di sequenziamento da altre piattaforme6.
Il fattore più critico per il successo del protocollo qui presentato è la qualità del campione, e in particolare la quantità e la qualità dell’RNA estratto. La corretta conservazione e l’estrazione tempestiva dell’RNA contribuiscono a ottenere un adeguato rendimento di RNA. L’uso di adeguati tubi di raccolta del sangue consente lo stoccaggio di campioni di sangue per un massimo di un mese, ma la coagulazione del sangue può essere un problema, in particolare quando i campioni vengono conservati a temperature elevate, che può essere il caso in condizioni di campo. Il secondo passo critico è l’amplificazione delle sequenze bersaglio, e in particolare in condizioni di campo le reazioni di PCR spesso eseguono meno bene rispetto alle condizioni di laboratorio standard7. A tal fine, un’attenta progettazione e ottimizzazione del primer è fondamentale per ottenere un’amplificazione robusta. Inoltre, gli approcci di PCR nidificati e la PCR da touchdown, utilizzati in questo protocollo, possono aumentare sia la specificità che la sensibilità dell’amplificazione del gene bersaglio4,7. Infatti, nella nostra esperienza in Liberia e in Guinea con questa tecnologia sono stati richiesti protocolli nidificati in condizioni di campo con campioni di campo anche per set di primer che hanno consentito l’amplificazione di bersagli da campioni di laboratorio e in condizioni di laboratorio con un singolo round di PCR (7 e risultati non pubblicati).
A differenza di questi passaggi più critici, la preparazione della libreria e la sequenza di esecuzione sono procedure piuttosto robuste. Tuttavia, in condizioni di campo, questioni pratiche come la disponibilità di alcuni pezzi di attrezzature possono essere problematici. Ad esempio, è necessario uno spettrofotometro UV per determinare le concentrazioni di DNA prima della preparazione della libreria di campioni con codice a barre. Tuttavia, se un tale dispositivo non fosse disponibile in condizioni di campo, un volume uguale di ciascun campione può essere semplicemente combinato per creare i 45 μL necessari per la preparazione della libreria, con differenze nel materiale di input del campione, che viene di solito mitigato dalla grande numero di letture. Analogamente, la necessità di connettività Internet per l’esecuzione del sequenziamento può essere un problema, anche se la chiamata di base non deve più essere eseguita online, ma può essere eseguita localmente; Tuttavia, questa necessità può essere rimossa in determinate circostanze dal fabbricante, se necessario.
In sintesi, il protocollo presentato consente un sequenziamento relativamente basso costo in posizioni senza accesso alle apparecchiature di sequenziamento tradizionali, anche in luoghi remoti. Può essere facilmente adattato a qualsiasi RNA o DNA target, permettendo così ai ricercatori di rispondere a numerose domande biologiche.
The authors have nothing to disclose.
Gli autori ringraziano Allison Groseth per la lettura critica del manoscritto. Questo lavoro è stato sostenuto finanziariamente dal Ministero federale tedesco dell’alimentazione e dell’agricoltura (BMEL) sulla base di una decisione del Parlamento della Repubblica federale di Germania attraverso l’Ufficio federale dell’agricoltura e dell’alimentazione (BLE).
1D2 adapter, barcode adapter mix, ABB buffer, elution buffer, RBF buffer, LBB beads | Oxford Nanopore Technologies | SQK-LSK308 | 1D² Sequencing Kit |
blood collection tube with DNA/RNA stabilizing reagent | Zymo Research | R1150 | DNA/RNA Shield – Blood Collection Tube |
blunt/TA ligase master mix | New England Biolabs | M0367S | Blunt/TA Ligase Master Mix |
DNA-low binding reaction tube | Eppendorf | 30108051 | DNA LoBind Tube |
DNase buffer and DNase | ThermoFisher Scientific | 11766050 | SuperScript™ IV VILO™ Master Mix with ezDNase™ Enzyme |
flow cell | Oxford Nanopore Technologies | FLO-MIN105.24 | flow cell R9.4 |
hot start high fidelity DNA polymerase | New England Biolabs | M0493L | Q5 Hot Start High-Fidelity DNA Polymerase (500 U) |
magnetic beads | Beckman Coulter | A63881 | Agencourt AMPure XP beads |
magnetic rack | ThermoFisher Scientific | 12321D | DynaMag-2 Magnet |
nanopore sequencing device | Oxford Nanopore Technologies | – | MinION Mk 1B |
PCR barcoding kit | Oxford Nanopore Technologies | EXP-PBC001 | PCR Barcoding Kit I (R9) |
reverse transcriptase master mix | ThermoFisher Scientific | 11766050 | SuperScript™ IV VILO™ Master Mix with ezDNase™ Enzyme |
RNA purification spin column, DNA/RNA prep buffer, DNA/RNA wash buffer, DNase I, DNA digestion buffer | Zymo Research | R1151 | Quick-DNA/RNA Blood Tube Kit |
rotating mixer | ThermoFisher Scientific | 15920D | HulaMixer Sample Mixer |
Taq DNA polymerase | New England Biolabs | M0287S | LongAmp Taq 2X Master Mix |
Ultra II End-prep kit | New England Biolabs | E7546S | NEBNext Ultra II End-Repair/dA-tailing Modul |
UV spectrophotometer | Implen | – | NanoPhotometer |
vacuum manifold | Zymo Research | S7000 | EZ-Vac Vacuum Manifold |