Genetics

Una pipeline completa per l'isolamento e la sequenza dei microRNA e la loro analisi tramite gli strumenti open source

Published: August 21, 2019 doi: 10.3791/59901

Meredith M. Course¹, Kathryn Gudsnuk¹, Paul N. Valdmanis¹

¹Division of Medical Genetics, University of Washington School of Medicine

Summary

In questo articolo viene descritta una strategia dettagliata per l'isolamento di piccoli RNA, l'arricchimento dei microRNA e la preparazione di campioni per il sequenziamento ad alto valore di velocità effettiva. Viene quindi descritto come elaborare le letture di sequenza e allinearle ai microRNA, utilizzando strumenti open source.

Abstract

La metà di tutte le trascrizioni umane sono pensati per essere regolati da microRNA. Pertanto, la quantificazione dell'espressione di microRNA può rivelare i meccanismi sottostanti negli stati della malattia e fornire obiettivi terapeutici e biomarcatori. Qui, dettagliamo come quantificare con precisione i microRNA. In breve, questo metodo descrive i microRNA isolanti, legandoli agli adattatori adatti per il sequenziamento ad alta velocità, amplificando i prodotti finali e preparando una libreria di esempio. Quindi, spieghiamo come allineare le letture di sequenziamento ottenute alle forcine a microRNA e quantificare, normalizzare e calcolare la loro espressione differenziale. Versatile e robusto, questo flusso di lavoro sperimentale combinato e analisi bioinformatica consente agli utenti di iniziare con l'estrazione dei tessuti e finire con la quantificazione dei microRNA.

Introduction

Scoperto per la prima volta nel 1993¹, si stima che quasi 2000 microRNA siano presenti nel genoma umano². I microRNA sono piccoli RNA non codificanti che sono in genere lunghi 21-24 nucleotidi. Sono regolatori post-trascrizione dell'espressione genica, spesso legandosi a siti complementari nella regione 3-non tradotta (3-UTR) di geni bersaglio per reprimere l'espressione proteica e degradare l'mRNA. La quantificazione dei microRNA può fornire informazioni preziose sull'espressione genica e sono stati sviluppati diversi protocolli a questo scopo³.

Abbiamo sviluppato un protocollo definito, riproducibile e di lunga data per il sequenziamento di piccoli RNA, e per l'analisi delle letture normalizzate utilizzando strumenti bioinformatici open source. È importante sottolineare che il nostro protocollo consente l'identificazione simultanea di microRNA endogeni e costrutti esogenamente erogati che producono specie simili a microRNA, riducendo al minimo le letture che mappano ad altre piccole specie di RNA, tra cui RNA ribosomici ( rRNA), trasferire RNA piccoli (tsRNA) derivati dall'RNA), piccoli RNA derivati da rRNA e prodotti per la degradazione dell'mRNA. Fortunatamente, i microRNA sono 5-phosphollated e 2-3 idrossilato⁴, una caratteristica che può essere sfruttata per separarli da questi altri piccoli RNA e prodotti di degradazione mRNA. Esistono diverse opzioni commerciali per la clonazione e il sequenziamento di microRNA che sono spesso più veloci e facili da multinox; tuttavia, la natura proprietaria dei reagenti kit e le loro frequenti modifiche rendono difficile confrontare le corse dei campioni. La nostra strategia ottimizza la raccolta solo delle dimensioni corrette dei microRNA attraverso passaggi di purificazione del gel di acrilammide e agarose. In questo protocollo viene descritta anche una procedura per allineare le letture di sequenza ai microRNA utilizzando strumenti open source. Questa serie di istruzioni sarà particolarmente utile per gli utenti di informatica alle prime armi, indipendentemente dal fatto che venga utilizzato il nostro metodo di preparazione della libreria o un metodo commerciale.

Questo protocollo è stato utilizzato in diversi studi pubblicati. Ad esempio, è stato utilizzato per identificare il meccanismo con cui l'enzima Dicer fende piccoli RNA a una distanza di due nucleotidi dal ciclo interno della struttura stelo-loop - la cosiddetta "regola di conteggio del ciclo"⁵. Abbiamo anche seguito questi metodi per identificare l'abbondanza relativa di RNA piccoli forno (shRNA) consegnati da vettori virali ricombinanti associati ad eno-associati (RAAV), per identificare la soglia di espressione shRNA che può essere tollerata prima del fegato tossicità associata all'espressione shRNA in eccesso⁶. Utilizzando questo protocollo, abbiamo anche identificato microRNA nel fegato che rispondono all'assenza di microRNA-122 - un microRNA epatico altamente espresso - caratterizzando anche il modello di degradazione di questo microRNA⁷. Poiché abbiamo usato il nostro protocollo in modo coerente in numerosi esperimenti, siamo stati in grado di osservare i preparativi campione longitudinalmente, e vedere che non ci sono effetti batch distinguibili.

Condividendo questo protocollo, il nostro obiettivo è quello di consentire agli utenti di generare una quantificazione di alta qualità e riproducibile di microRNA praticamente in qualsiasi linea di tessuti o cellule, utilizzando attrezzature e reagenti a prezzi accessibili e strumenti di bioinformatica gratuiti.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Gli esperimenti sugli animali sono stati autorizzati dal Comitato istituzionale per la cura e l'uso degli animali dell'Università di Washington.

Preparazione della libreria di RNA piccolo

1. Isolamento dell'RNA

Isolare l'RNA da una fonte biologica utilizzando un reagente di isolamento dell'RNA standard, o un kit che arricchisce per i microRNA. Per i tessuti, è meglio iniziare con campioni snap-congelati in azoto liquido e macinato in polvere utilizzando un mortaio pre-freddo e pestello.
Misurare l'integrità dell'RNA di ogni campione su uno strumento in grado di quantificare l'RNA e fornire un numero di integrità dell'RNA (RIN). I RIN devono essere >7.

2. 3' legatura dell'adattatore

Preparare una reazione di legatura nei tubi a strisce PCR, combinando: 11 -L di RNA (1-3 g, utilizzando la stessa quantità per ogni campione), 1,5 L di 10x T4 RNA ligase reaction buffer, ATP-free, 1 L di poli-etilene glicole (PEG), e 0,5 l di 3'M Mi Universal cloning lin ker).
NOTA: L'assenza di ATP aiuta ad arricchire i miRNA e riduce al minimo la clonazione dei prodotti di degradazione dell'mRNA. PEG agisce come un agente di affollamento molecolare, migliorando la legatura di successo. Il linker di clonazione Universal miRNA ha un gruppo di blocco 3' (amine) per prevenire l'auto-legatura, circolarizzazione e legatura all'RNA all'estremità 5'.
Riscaldare i campioni a 95 gradi centigradi su un termociclore per 30-40 s. Raffreddare sul ghiaccio per 1 min.
NOTA: l'incubazione a temperatura ambiente aiuta a prevenire la legatura del linker. Abbiamo anche usato con successo T4 RNA ligase 1.
Preparare 30 mL di un gel di poliacrilamide del 15% con 8 M di urea (per un gel da 20x20 cm): 14,4 g di urea, 3 mL di 10x di etilenediaminetetraacetictraacetic acid (TBE), 11,2 mL del 40% 19:1 acrilammide e H₂O a 30 mL. La soluzione è meglio dissolvirla a 42 gradi centigradi. Immediatamente prima della colata, aggiungere 150 L del 10% di persofato di ammonio (APS) e di 30 -L di tetrametililetilenedia (TEMED) per la polimerizzazione.
Versare tra lastre di vetro separate da 0,8 mm in un pettine di plastica. Una volta che il gel è solidificato (circa 20 min), aggiungere 0,5x TBE al serbatoio e lavare pozzi di urea residua pipeting vigorosamente.
Pre-eseguire il gel ad una costante 375 V per 25 min senza campioni in modo che l'urea possa entrare nel gel, quindi lavare nuovamente i pozzi.
NOTA: potrebbe essere necessario ridurre la quantità di tensione a seconda del tipo di alimentazione e del sistema di elettroforesi utilizzato.
Una volta che i campioni sono fatti ligando, aggiungere 15 l di acillammide di carico ai campioni (per un rapporto 1:1), quindi denaturare per 5 min a 95 gradi centigradi su un termociclo.
Preparare i marcatori di dimensione 25 ng/L di 37 e 44 bp, diluiti con una parte di acillammide di carico. Le sequenze sono elencate nella Tabella 1.
Caricare i campioni sul gel di poliacrilammide, lasciando almeno una corsia tra ogni campione. Caricare 20 - L di almeno due serie di marcatori, in un modello asimmetrico per tenere traccia dell'orientamento del gel.
Eseguire il gel a una costante 375 V per i primi 15 min e quindi aumentare ad una costante 425 V per la corsa rimanente. Eseguire fino a quando il blu bromofenolo è di circa 1-4 cm dal fondo, che richiede circa 2 h.
NOTA: Se necessario, il gel può essere eseguito a una tensione costante inferiore per un periodo di tempo più lungo fino a quando il blu bromofenolo è di circa 1-4 cm dal basso.
Rimuovere il gel dalle lastre di vetro utilizzando un separatore di piastra e posizionare il gel su un protettore di pagina di plastica. Diluire 5 - L di bromuro di etidio in 500 - L di acqua distillata, e pipette su corsie marker appena sopra il marcatore blu chiaro superiore (vedere Figura 1A).
AVVISO: Utilizzare i guanti per il bromuro di etidio e smaltire i rifiuti in conformità con le normative locali. Lasciate in sedito per 5 min.
Sotto la luce ultravioletta (UV), tagliare i gel dal marcatore superiore a quello inferiore in ogni corsia utilizzando la lama di rasoio pulita (vedere Figura 1A). Trasferire in un quadrato di 4 x 4 cm di pellicola di sifetta di laboratorio, quindi tagliare il gel con circa 4 tagli orizzontalmente e 3 verticalmente per produrre 12 quadratini (vedi Figura 1B).
Pipetta 400 - L di 0,3 M NaCl sul quadrato della pellicola di fochettatura e pezzi di gel a imbuto in tubi in siliconizzato da 1,5 ml (vedere Figura 1C). Agitare i campioni su un nutator a 4 gradi durante la notte.
NOTA: Altri tubi a bassa ritenzione da 1,5 mL possono essere sostituiti con tubi in siliconizzato.
Dopo almeno 12 h di agitazione a 4 gradi centigradi, recuperare i campioni e metterli sul ghiaccio, insieme a un tubo conico di etanolo al 100%.
Trasferire 400 l di supernatant in un nuovo tubo, quindi aggiungere 1 mL di 100% etanolo e 1 L di 15 mg/mL di coprecipitante di glicogeno. Assicurarsi di raccogliere il più supernatante possibile, filando verso il basso a 4 gradi centigradi e pipettare più in base alle esigenze. Collocare a -80 gradi centigradi per 1 ora, o -20 gradi centigradi per 2 h o più. Il coprecipitante di glicogeno migliora la visibilità e il recupero del pellet.
Girare a 4 gradi centigradi a 17.000 x g per 20-30 min. Rimuovere tutte le tracce di etanolo e lasciare asciugare l'aria di pellet per 5 min.

3. Legatura del linker da 5'

Sospendere nuovamente il pellet con il pipettaggio in 6,5 gradi di acqua priva di nuclea. Lasciare il pellet in acqua per qualche minuto prima aiuterà con la sospensione.
Dopo aver filato il pellet e ripeso in acqua, aggiungere 0,5 L di 100 M 5'-linker (con codici a barre; vedi tabella 1), 1 L del buffer di ligase T4 RNA, 1 L di 10 mM ATP e 1 L di PEG. Riscaldare a 90 gradi centigradi per 30 s, quindi mettere sul ghiaccio. Aggiungere 1 - LL di T4 RNA ligase 1 e lasciare incubare a temperatura ambiente per 2 h.
Aggiungere 400 -L di 0,3 M NaCl, seguito da 400 : L di fenolo acido/cloroformio. Vortex 30 s - 1 min (soluzione avrà un aspetto nuvoloso), e poi girare a 4 gradi centigradi per 10-15 min alla velocità massima in una microcentrifuga (17.000 x g). Disegnare lo strato superiore e posizionarlo nel nuovo tubo da 1,5 mL.
NOTA: Evitare di pipettare uno qualsiasi degli strati inferiori.
Aggiungere brevemente 350 l di cloroformio, vortice, quindi ruotare a 4 gradi centigradi per 10 min alla velocità massima (17.000 USD x g). Estrarre la parte superiore in un secondo momento e posizionare in nuovo tubo 1.5 mL. Aggiungere 1,5 l di coprecipitante di glicogeno e 1 mL di 100% di etanolo.
NOTA: Ancora una volta, evitare di pipettare uno qualsiasi degli strati inferiori.
Vortice in breve, quindi posizionare a -80 gradi centigradi per almeno 1 h, o -20 gradi durante la notte.

4. Trascrizione inversa (RT)

Accendere il blocco di calore a 42 gradi centigradi. Girare i campioni a 4 e 17.000 x g per 20-30 min. Rimuovere tutti i supernatali e lasciare asciugare l'aria di pellet per 5 min.
Sospendere nuovamente il campione pelleta in 8,25 gradi l di acqua priva di nucleana, quindi aggiungere: 0,5 di 100 M RT primer (tabella 1), e 5 l di 2x RT Reaction Mix da un kit di sintesi cDNA. Incubare a 42 gradi centigradi per 3 min.
Aggiungete 1,5 di 10x enzima RT ad ogni campione e incubate a 42 gradi centigradi per 30 min in un termociclo. Mettere a -20 gradi centigradi o continuare con l'idrolisi e la neutralizzazione.
NOTA: è possibile utilizzare diversi kit RT per i passaggi 4.2 e 4.3.
Eseguire l'idrolisi alcalina e la neutralizzazione: Crea una soluzione di idrossido di potassio (KOH) di 150 mM (150 -L di 1 M KOH, 20 ll di 1 M Tris Base pH 7,5, 830 L di H₂O) e 1 mL di 150 mm di acido cloridrico (HCl) (150 : L di 1 M HCl e 850 LL) di H₂O).
Prima di aggiungere ai campioni, determinare la quantità di HCl necessaria per neutralizzare la soluzione KOH. In genere, circa 20-24 l.l di HCl neutralizzeranno la 25 -L di KOH. Controllare la combinazione su una striscia di pH per assicurarsi che sia nella giusta gamma (pH 7.0 a 9.5).
Idrolizzai i campioni aggiungendo una soluzione KOH di 150 mM e incubando per 10 min a 95 gradi centigradi.
Neutralizzare i campioni aggiungendo la quantità di 150 mM HCl determinata al punto 4.4, per ottenere un pH campione finale compreso tra 7.0 e 9.5.

5. Amplificazione PCR

Dopo la neutralizzazione, preparare una reazione PCR con: 29,5 gradi di acqua, 5 luna di tampone Taq 10x, 1 L di dNTP, 2 L da 25 m in avanti (tabella1), 2 L di 25 M di primer inverso (tabella 1), 0,5 l di Taq e 10 l del cDNA trasvenuto inverso dal passo 4.6 .
Eseguire la seguente reazione PCR: 94 gradi centigradi per 2 min, quindi 20 cicli di 94 gradi centigradi per 45 s, 50 gradi centigradi per 75 s e 72 gradi centigradi per 60 s.
Eseguire una seconda reazione PCR di circa 2-4 cicli in più utilizzando 5 ll l di prodotto dal punto 5.2. Miscela: 34,8 litri d'acqua, 5 luna di 10x tampone Taq, 1 luna di dNTP, 1 luna di 25 M di primer in avanti (tabella 1), 1 L di 25m - primer inverso (tabella 1) e 0,2 L di polimerasi Taq. Seguire gli stessi parametri del termociclore descritti nel passaggio 5.2.
NOTA: Lo scopo di fare due reazioni PCR – con la prima per 20 cicli e la seconda per solo 2-4 in più – è quello di garantire che la quantità di cDNA amplificata sia in una gamma dinamica (cioè, non una quantità satura).

6. Purificazione gel di Agarose

Preparare un gel di agarose del 4% con agarose a bassa fusione. Caricare 40 o più l del prodotto PCR sul gel, insieme al colorante di carico. Caricare gli indicatori di dimensione 100 bp e 25 bp.
NOTA: La scala da 25 bp aiuta a distinguere i prodotti amplificati dai prodotti di ligazione linker-linker. I gel di agarose a bassa fusione devono essere lanciati con maggiore cura rispetto ai tradizionali gel di agarose, quindi seguire attentamente le istruzioni del produttore.
Per l'estrazione del gel, selezionare il numero di ciclo visibile sul gel ma non saturo (di solito 22-24 cicli). Scegliere bande di intensità simili quando si eseguono più campioni.
Tagliare la banda che si trova sopra la banda di 125 bp (la banda più scura sulla scala 25 bp; vedere Figura 1D). Utilizzando un kit di estrazione gel, seguire le istruzioni del produttore per aggiungere buffer basato su un gel 4%, quindi agitare per sciogliere agarose in buffer a temperatura ambiente.
NOTA: la dissoluzione a 55 gradi centigradi aumenta il potenziale di legatura linker-linker.
Seguire le istruzioni di estrazione del gel del produttore ed eluire in 30 litri di tampone di eluizione o acqua. Se il prodotto sembrava debole sul gel, quindi ridurre l'eluizione a 20.L.
Misurare la concentrazione di cDNA utilizzando una tecnica sensibile e preparare la libreria di esempio per il sequenziamento. La preparazione dipenderà dal tipo di sequenziamento utilizzato.
NOTA: I requisiti minimi per una libreria di sequenziamento sono in genere un volume di 10 m di 10 M. Se le concentrazioni sono troppo basse, i campioni di precipitazione in piscina e etanolo per portare la biblioteca alla concentrazione desiderata.
Sequenziare i campioni utilizzando le attrezzature disponibili. Un esempio comune potrebbe essere quello di eseguire campioni utilizzando un kit per 50 bp letture singole, per ottenere circa 15-25 milioni di letture in un formato di output FASTQ.

Allineamento della sequenza DI RNA e bioinformatica

7. Caricamento dei dati

Scaricare i file FASTQ generati da ogni esecuzione della sequenza. Scarica un elenco di sequenze di tornante microRNA da miRbase.org⁸^,⁹^,¹⁰.
Genera un account Galaxy in www.usegalaxy.org e carica un file FASTQ di letture di sequenza su questo account.
Caricare un file di testo di sequenze di codici a barre nell'account Galaxy, ad esempio barcodes.txt, disponibile come file di testo (supplementari tabella 1).
Carica un file FASTA di forcine microRNA nell'account Galaxy da un database come miRBase.org. Esempi di precursori di microRNA di topo (mousehairpins.fa) o umani (humanhairpins.fa) sono riportati nella tabella supplementare 2 e nella tabella supplementare 3.

8. Rimozione dell'adattatore, ordinamento dei codici a barre e

Nella scheda a sinistra, accedere a Manipolazione file genomica > FASTA/FASTQ > Sequenzeadattatore clip .
In File di input in formato FASTA o FASTQimmettere FASTQ dall'elenco a discesa. Impostare Lunghezza minima sequenza su 18. Modificare Origine in Immetti sequenza personalizzata. Immettere CTGTAGGC. Mantenere tutti gli altri parametri predefiniti. Fare clic su Esegui.
NOTA: le letture di sequenze più brevi di 18 nucleotidi sono difficili da mappare in modo univoco ai microRNA e contengono molti prodotti di degradazione.
Nella scheda a sinistra, accedere a Manipolazione file genomica > FASTA/FASTQ > Barra didivisione .
NOTA: le funzioni e le intestazioni Galaxy vengono aggiornate periodicamente, quindi la funzione di ricerca potrebbe essere necessaria per trovare uno strumento equivalente o la sua posizione. I kit commerciali che utilizzano primer indicizzati sono spesso già ordinati per codice a barre. Pertanto, questo passaggio e il passaggio di taglio del codice a barre non sono necessari se si parte da un kit commerciale.
Per i codici a barre da utilizzare, scegliere codici a barre.txt. Per La divisione della libreria, utilizzare Clip sul file di dati prodotto nel passaggio precedente. In Numero di mancate corrispondenze consentiteimmettere 1. Fare clic su Esegui.
Tagliare i primi 4 nucleotidi: passare a Manipolazioni testo > Taglia caratteri iniziali ofinali. Per Set di dati di input, fare clic sull'icona della cartella, ovvero una raccolta di set di dati. Selezionare il file batch di campioni, che include lo splitterdell'etichetta Codice a barre sui dati. In Taglia dall'inizio fino a questa posizioneimmettere 5. In Il set di dati di input è in formato FASTQ? immettere Sì. Fare clic su Esegui. L'esecuzione potrebbe richiedere alcuni minuti.

9. Allineamento delle letture ai microRNA

In Galaxy, accedere a Analisi genomica > RNA-Seq > Quantificazione trascrizione Sailfish¹¹.
Per la domanda Selezionare un trascrittoma di riferimento dalla cronologia o utilizzare un indice incorporato? Immettere il file caricato mousehairpins.fa dall'elenco a discesa. Nel file FASTA/Q fare clic sull'icona della cartella per utilizzare una raccolta di set di dati e selezionare il file che include Taglia sullaraccolta. Fare clic su Esegui. L'esecuzione potrebbe richiedere alcuni minuti.
Nella scheda cronologia a destra, clicca su Sailfish sulla collezione... che è una lista con 19 elementi. Fare clic su ogni singolo file e fare clic sull'icona del disco per salvare nel computer locale. I file scaricati singolarmente devono prima essere decompressi. Potrebbe anche essere necessario salvare nuovamente con estensione .txt allo scopo di importare in un foglio di calcolo.
Aprire ogni file del foglio di calcolo e denominare nuovamente la colonna NumReads in base alla condizione di trattamento. Unire le colonne per generare una matrice di microRNA nella prima colonna e i conteggi letti per condizione nelle colonne successive.
Per calcolare microRNA espressi in modo differenziale per ogni condizione di trattamento, utilizzare il file con i conteggi di lettura in microRNA non elaborati come input per programmi come DESeq2¹². DESeq2 è presente in Galaxy nella scheda Analisi genomica > RNA-seq > DESeq2.
Convertire le letture non elaborate in conteggi di lettura microRNA normalizzati. I conteggi vengono normalizzati alla profondità della sequenza della libreria attraverso il seguente calcolo: [(letture non elaborate/letture totali di microRNA) - (1.000.000 – numero di microRNA contati) - 1].
NOTA: questo calcolo fornisce microRNA mappati normalizzati per milione (RPM) che possono essere confrontati tra set di dati e condizioni biologiche. L'output è un file delimitato da tabulazioni. Sailfish fornisce una colonna di uscita tpm, anche se questo valore è normalizzato dalla lunghezza della forcina microRNA, che non è necessaria in questo contesto.
Se pertinente, ripetere l'allineamento con sequenze di input personalizzate (ad esempio, un vettore) per identificare le letture che eseguono il mapping ai costrutti forniti, ad esempio shRNA.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Schemadei passaggi coinvolti nella preparazione della libreria
Uno schema generale di piccola estrazione dell'RNA, sequenziamento e allineamento è delineato nella figura 2.
Campioni di fegato da un maschio e un topo femmina sono stati raccolti e scattare congelati in azoto liquido. L'RNA totale è stato estratto e valutato per qualità e concentrazione.

Il sequenziamento dell'RNA piccolo produce RNA sufficiente per il sequenziamento
Sono stati utilizzati 3 g di RNA provenienti da due estrazioni di RNA indipendenti per il sequenziamento di piccoli RNA. I campioni sono stati eseguiti su un gel acrilammide e ritagliati tra i marcatori di dimensione corrispondenti a 17-28 nt di RNA (Figura 1A). I campioni sono stati tagliati in frammenti per l'isolamento dell'RNA (Figura 1B) e trasferiti in un tubo centrifuga di 1,5 mL a bassa ritenzione (Figura 1C). I codici a barre bc7 e bc17 (Tabella 1) sono stati giunti alla fine 5' del piccolo RNA. Piccole librerie di RNA sono state amplificate dalla PCR usando 22 cicli di PCR per produrre rispettivamente un prodotto 8,0 e 11,2 ng/L. I campioni sono stati raggruppati e un campione in pool di 10 nM è stato inviato per il sequenziamento ad alta velocità utilizzando una lunghezza di lettura di 50 bp.

MiR-122 è il microRNA più abbondante nel fegato di topo
Dopo l'ordinamento dei codici a barre, 851.931 letture contenevano codici a barre del campione epatico 1 e 650.154 del campione epatico 2. Delle letture, rispettivamente 83,5% e 90,0% mappate a microRNA, con le letture rimanenti che si mappano a rRNA (1,8% e 0,6% rispettivamente), tRNA e frammenti di degradazione dell'mRNA. Dopo l'allineamento ai forcine microRNA umane, abbiamo osservato una forte concordanza tra i conteggi di lettura dei microRNA in ogni replica (R² - 0,998; Figura 3). Sono state rilevate in totale 306 specie di microRNA, con il maggior numero di letture che sono mappate al miR-122 ( tabella supplementare4). L'abbondanza di microRNA era simile tra i campioni di fegato maschile e femminile.

come illustrato nella Figura 1. Estrazione di piccoli RNA da un gel acrilammide. (A) Gel acrilammide e regione che viene tagliato corrispondente alle dimensioni dei microRNA. (B) Pezzi di gel prima e dopo il taglio in frammenti più piccoli. (C) Processo di trasferimento dei frammenti di gel in tubi in siliconizzato. (D) Reazione PCR su gel di agarose a bassa fusione che dimostra un prodotto clonato corretto rispetto al prodotto linker-linker e a campioni insaturi (22 cicli) rispetto a saturi (24 cicli). Fare clic qui per visualizzare una versione più grande di questa figura.

come illustrato nella Figura 2. Schema del protocollo. Sequenza temporale che mostra i passaggi principali coinvolti nella procedura. Fare clic qui per visualizzare una versione più grande di questa figura.

come illustrato nella figura 3. Riproducibilità dei risultati di due estrazioni indipendenti di RNA. La dispersione di microRNA conta da un fegato di topo maschio (asse x) rispetto a un fegato di topo femminile (asse y) utilizzando una scala basata su log10. Ogni punto rappresenta il numero di microRNA mappato per milione (RPM) per ogni singolo microRNA. Fare clic qui per visualizzare una versione più grande di questa figura.

testo elementare	sequenza
3' linker 1	rAppCTGTAGGCACCATCAAT-NH2
marcatore di dimensioni inferiori	rArUrCrGrCrArUrGrCrUrGrUrGrArCrGrUrArCrUrGGTAACCGCATGCGTC
marcatore di dimensioni superiori	rArArUrCrArGrCrGrUrUrUrCrArUrArArCrGrUrUrRUrRArUrGACCGCATGCGTC
codice a barre1	/5AmMC6/ACGCTCTCTCTCTCTCGATCTRArGrCrG
codice a barre2	/5AmMC6/ACGCTCTCTCTCGATCTRGrUrC
codice a barre3	/5AmMC6/ACGCTCTCtCtCCGATCGATCTrUrGrG
codice a barre4	/5AmMC6/ACGCTCTCTCTCTCGATCTRArCrUrU
codice a barre5	/5AmMC6/ACGCTCTCTCTCGATGrGrGrGrU
codice a barre6	/5AmMC6/ACGCTCTCTCTCCGATCGRUrUrA
codice a barre7	/5AmMC6/ACGCTCTCTCTCCGATCGATCTrUrUrUrG
codice a barre8	/5AmMC6/ACGCTCTCTCTCGATCGATCTrUrCrGrC
codice a barre9	/5AmMC6/ACGCTCTCTCTCTCTCGATCGrCrArG
codice a barre10	/5AmMC6/ACGCTCTCTCTCGATCTRArArArC
codice a barre11	/5AmMC6/ACGCTCTCTCTCCGATCGATCTrUrCrU
codice a barre12	/5AmMC6/ACGCTCTCTCTCTCGATCTrArArU
codice a barre13	/5AmMC6/ACGCTCTCTCTCTCTCTTRTrArArGrA
codice a barre14	/5AmMC6/ACGCTCTCTCTCCGATCGATCTrGrArA
codice a barre15	/5AmMC6/ACGCTCTCTCTCCGATCGATCTrGrGrG
codice a barre16	/5AmMC6/ACGCTCTCTCTCCGATCGATCTrUrUrG
codice a barre17	/5AmMC6/ACGCTCTCTCTCCGATCGATUrCrArU
codice a barre18	/5AmMC6/ACGCTCTCTCTCCGATCGrUrArU
Primer RT	ATTGATGGTGCCTACAG
PCR primer F	AATGATACGGCACCACCCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCT
PCR primer R	CAAGCAGAGAGaCGGCATACGACTCTCTCTCTCTCTGGGGAGCCTACAGGGGG

Tabella 1. Elenco dei primer.

Tabella supplementare 1. Elenco di sequenze di codici a barre. Fare clic qui per scaricare questo file.

Tabella supplementare 2. Elenco curato di sequenze precursori di microRNA topo. Fare clic qui per scaricare questo file.

Tabella supplementare 3. Elenco curato di sequenze precursori di microRNA umano. Fare clic qui per scaricare questo file.

Tabella supplementare 4. Conteggi di lettura di microRNA grezzi e normalizzati. Fare clic qui per scaricare questo file.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Nonostante l'identificazione di microRNA oltre 20 anni fa¹³, il processo di sequenziamento dei microRNA rimane laborioso e richiede attrezzature specializzate, impedendo ai laboratori di adottare regolarmente protocolli interni¹⁴. Altre tecniche possono valutare simultaneamente microRNA, come microarray di microRNA e pannelli di espressione multiplexed; tuttavia, questi approcci sono limitati in quanto quantificano solo i microRNA presenti nel loro set di sonde. Per questo motivo, perdono caratteristiche importanti del sequenziamento dell'RNA, come l'identificazione di nuovi microRNA, e di isoformi microRNA - cambiamenti nucleoside che possono avere importante funzione biologica⁶^,⁷^,¹⁵.

Quando si avvia un nuovo esperimento, l'utilizzo di un fornitore commerciale è spesso più semplice perché offre supporto tecnico e facilità d'uso. Sono disponibili diverse opzioni commerciali per il sequenziamento di microRNA, che può essere multiplexato per ridurre il carico di lavoro durante l'elaborazione di grandi numeri (>100) di campioni. Questi kit commerciali vengono continuamente migliorati, il che è sia un vantaggio che uno svantaggio. Da un lato, le aziende che realizzano questi kit hanno sviluppato nuovi metodi di cattura dei microRNA, ad esempio, attraverso la circolarizzazione delle loro 5 e 3 estremità prima del sequenziamento o utilizzando linker degenerati con sequenze casuali ad ogni estremità per ridurre la distorsione della legatura. Hanno anche sviluppato metodi per rimuovere gli adaptor-dimer, ad esempio attraverso la legatura di adattatori a doppio filamento o l'ibridazione di oligonucleotidi complementari. D'altra parte, kit commerciali raccomandano contro la modifica o l'alterazione di qualsiasi passo. Pertanto, se vengono apportati aggiornamenti a un kit, è difficile o impossibile confrontare i dati derivati da versioni vecchie e nuove di kit, nonché i dati derivati da kit di diversi fornitori commerciali. Qui, abbiamo descritto un protocollo che ha il potere di rimanere di fronte alle alternative commerciali. La nostra attenzione alle fasi di purificazione del gel - mentre aggiungono tempo al protocollo - consente una cattura e riproducibilità coerente dei microRNA nel corso dei molti anni che abbiamo usato. Sono state effettuate diverse valutazioni della riproducibilità tra kit commerciali e protocolli interni, e ci riferiamo al lettore ad alcuni di questi studi¹⁶^,¹⁷^,¹⁸^,¹⁹. È importante sottolineare che i passi che delineamo per l'analisi bioinformatica dei microRNA possono essere impiegati indipendentemente dalla scelta del kit o del protocollo interno.

Il sequenziamento del microRNA è spesso turbato dalla scelta dei codici a barre: in alcuni casi, l'efficienza di legatura dei vari codici a barre potrebbe non essere equivalente, portando a distribuzioni di parte delle sequenze nei campioni²⁰. Si raccomanda ora di utilizzare basi degenerate alle estremità 5 e 3 per ridurre al minimo le distorsioni di legatura di microRNA specifici²¹^,²². In questo protocollo, non abbiamo osservato questi problemi di ligazione e abbiamo osservato letture coerenti per repliche tecniche e biologiche valutate con diversi codici a barre⁵^,⁶^,⁷^,²³, ma è importante esserne consapevoli. I metodi per evitare la distorsione della legatura includono l'incorporazione di primer indice nei primer PCR, o per aggiungere uno o più nucleosides di RNA casuali alla fine 3 della sequenza di 5 adattatori (Tabella 1). L'introduzione di uno o più RNA a punta sintetica, come il microRNA C. elegans miR-39²⁴, è anche un'opzione a fini di normalizzazione, che è fondamentale per situazioni a basso rendimento, come la quantificazione dei microRNA dagli esosomi. Allo stesso modo, per la legatura dell'RNA, abbiamo usato con successo T4 RNA ligase 1, ma la legatura con meno distorsione è stata dimostrata per una forma troncata di T4 RNA ligase 2²⁵. Infine, gli apice III e IV sono enzimi alternativi di trascrizione inversa che abbiamo usato senza problemi.

La scelta del database dei microRNA può anche influenzare i risultati normalizzati finali. Una sfida con la cura dei database di microRNA è che diversi nuovi piccoli RNA elencati come microRNA sono in realtà frammenti di elementi ripetuti e non microRNA in buona fede ². Sono stati compiuti sforzi per ritirare microRNA che non sono conformi ai criteri standard, in modo che la prossima versione di un database di microRNA sia più raffinata; tuttavia, l'iterazione successiva contiene anche nuovi candidati che necessitano di conferma. Quando i microRNA derivati dalla ripetizione sono inclusi negli allineamenti, possono inclinare i risultati e sovraccaricare i dati dei microRNA esistenti. Pertanto, l'uso di set di dati ben curati di microRNA di diverse specie è essenziale²⁶^,²⁷. Abbiamo sperimentato la più grande riproducibilità nell'allineare piccole letture di sequenziamento dell'RNA a liste curate di microRNA conservati e abbiamo incluso queste forcine nella Tabella supplementari 2 e nella Tabella supplementari 3. Questi elenchi corrispondono alle stime di circa 500 microRNA ad alta fiducia nel genoma umano²^,²⁶.

Come con qualsiasi tecnica, i risultati dovrebbero essere confermati con un approccio ortogonale. Abbiamo riprodotto con successo piccoli risultati di sequenziamento dell'RNA con piccole macchie nord di RNA che incorporano sonde radioetichettate per confermare le dimensioni e l'abbondanza relativa dei microRNA candidati⁶^,⁷^,²³. La PCR quantitativa dei microRNA che utilizzano il sequenziamento a lettura parziale e la conferma delle modifiche dell'mRNA bersaglio usando qPCR e il gonfiore occidentale sono altre opzioni per la convalida.

In sintesi, abbiamo fornito un metodo per isolare e sequenziare microRNA ed eseguire allineamenti con i database di microRNA esistenti. L'accessibilità dei reagenti e delle attrezzature e l'uso di strumenti open source per l'analisi dovrebbero rendere questo protocollo accessibile a chiunque. Infine, questo protocollo può essere utilizzato in qualsiasi tessuto o linea cellulare per produrre letture altamente riproducibili e di alta qualità.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Gli autori non hanno nulla da rivelare.

Acknowledgments

Ringraziamo i membri dei laboratori di Andrew Fire e Mark Kay per la guida e i suggerimenti.

Materials

Name	Company	Catalog Number	Comments
100 bp DNA ladder	NEB	N3231
19:1 bis-acrylamide	Millipore Sigma	A9926
25 bp DNA step ladder	Promega	G4511
Acid phenol/chloroform	ThermoFisher	AM9720
Acrylamide RNA loading dye	ThermoFisher	R0641
Ammonium persulfate (APS)	Biorad	161-0700
Bioanalyzer instrument	Agilent	G2991AA	For assessing RNA quality and concentration
Chloroform	Fisher Scientific	C298-500
Ethanol (100%)	Sigma	E7023
Gel Loading Buffer II	ThermoFisher	AM8547
GlycoBlue	ThermoFisher	AM9516	Blue color helps in visualizing pellet
HCl	Sigma	320331
KOH	Sigma	P5958
Maxi Vertical Gel Box 20 x 20cm	Genesee	45-109
miRVana microRNA isolation kit	ThermoFisher	AM1560
miSeq system	Illumina	SY-410-1003	For generating small RNA sequencing data
NaCl	Fisher Scientific	S271-500
Nusieve low-melting agarose	Lonza	50081
Parafilm (laboratory sealing film)	Millipore Sigma	P7793
Poly-ethylene glycol 8000	NEB	included with M0204
ProtoScript II First strand cDNA Synthesis Kit	NEB	E6560S
QIAquick Gel Extraction kit	Qiagen	28704
Qubit Fluorometer	ThermoFisher	Q33226	For quantifying DNA concentration
Qubit RNA HS Assay kit	ThermoFisher	Q32855
Razor Blades	Fisher Scientific	12640
Siliconized Low-Retention 1.5 ml tubes	Fisher Scientific	02-681-331
T4 RNA ligase 1	NEB	M0204
T4 RNA Ligase 2, truncated K227Q	NEB	M0351S
TapeStation	Agilent	G2939BA	For assessing RNA quality and concentration
Taq DNA Polymerase	NEB	M0273X
TEMED	Biorad	161-0800
Tris Base pH 7.5	Sigma	10708976001
Tris-buffered EDTA	Sigma	T9285
Trizol	ThermoFisher	15596026
UltraPure Ethidium bromide (10 mg/ml)	Invitrogen	15585-011
Universal miRNA cloning linker	NEB	S1315S
Urea	Sigma	U5378

DOWNLOAD MATERIALS LIST

References

Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
Bartel, D. P. Metazoan MicroRNAs. Cell. 173 (1), 20-51 (2018).
Lau, N. C., Lim, L. P., Weinstein, E. G., Bartel, D. P. An abundant class of tiny RNAs with probable regulatory roles in Caenorhabditis elegans. Science. 294 (5543), 858-862 (2001).
Kim, V. N., Han, J., Siomi, M. C. Biogenesis of small RNAs in animals. Nature Reviews Molecular Cell Biology. 10 (2), 126-139 (2009).
Gu, S., et al. The loop position of shRNAs and pre-miRNAs is critical for the accuracy of dicer processing in vivo. Cell. 151 (4), 900-911 (2012).
Valdmanis, P. N., et al. RNA interference-induced hepatotoxicity results from loss of the first synthesized isoform of microRNA-122 in mice. Nature Medicine. 22 (5), 557-562 (2016).
Valdmanis, P. N., et al. miR-122 removal in the liver activates imprinted microRNAs and enables more effective microRNA-mediated gene repression. Nature Communications. 9 (1), 5321 (2018).
Griffiths-Jones, S. The microRNA Registry. Nucleic Acids Research. 32, D109-D111 (2004).
Griffiths-Jones, S., Grocock, R. J., van Dongen, S., Bateman, A., Enright, A. J. miRBase: microRNA sequences, targets and gene nomenclature. Nucleic Acids Research. 34 (Database issue), D140-D144 (2006).
Griffiths-Jones, S., Saini, H. K., van Dongen, S., Enright, A. J. miRBase: tools for microRNA genomics. Nucleic Acids Research. 36 (Database issue), D154-D158 (2008).
Patro, R., Mount, S. M., Kingsford, C. Sailfish enables alignment-free isoform quantification from RNA-seq reads using lightweight algorithms. Nature Biotechnology. 32 (5), 462-464 (2014).
Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
Fire, A., et al. Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans. Nature. 391 (6669), 806-811 (1998).
Etheridge, A., Wang, K., Baxter, D., Galas, D. Preparation of Small RNA NGS Libraries from Biofluids. Methods in Molecular Biology. 1740, 163-175 (2018).
Yamane, D., et al. Differential hepatitis C virus RNA target site selection and host factor activities of naturally occurring miR-122 3 variants. Nucleic Acids Research. 45 (8), 4743-4755 (2017).
Giraldez, M. D., et al. Comprehensive multi-center assessment of small RNA-seq methods for quantitative miRNA profiling. Nature Biotechnology. 36 (8), 746-757 (2018).
Dard-Dascot, C., et al. Systematic comparison of small RNA library preparation protocols for next-generation sequencing. BMC Genomics. 19 (1), 118 (2018).
Yeri, A., et al. Evaluation of commercially available small RNASeq library preparation kits using low input RNA. BMC Genomics. 19 (1), 331 (2018).
Coenen-Stass, A. M. L., et al. Evaluation of methodologies for microRNA biomarker detection by next generation sequencing. RNA Biology. 15 (8), 1133-1145 (2018).
Baran-Gale, J., et al. Addressing Bias in Small RNA Library Preparation for Sequencing: A New Protocol Recovers MicroRNAs that Evade Capture by Current Methods. Frontiers in Genetics. 6, 352 (2015).
Jayaprakash, A. D., Jabado, O., Brown, B. D., Sachidanandam, R. Identification and remediation of biases in the activity of RNA ligases in small-RNA deep sequencing. Nucleic Acids Research. 39 (21), e141 (2011).
Van Nieuwerburgh, F., et al. Quantitative bias in Illumina TruSeq and a novel post amplification barcoding strategy for multiplexed DNA and small RNA deep sequencing. PLoS One. 6 (10), e26969 (2011).
Valdmanis, P. N., et al. Upregulation of the microRNA cluster at the Dlk1-Dio3 locus in lung adenocarcinoma. Oncogene. 34 (1), 94-103 (2015).
Schwarzenbach, H., da Silva, A. M., Calin, G., Pantel, K. Data Normalization Strategies for MicroRNA Quantification. Clinical Chemistry. 61 (11), 1333-1342 (2015).
Viollet, S., Fuchs, R. T., Munafo, D. B., Zhuang, F., Robb, G. B. T4 RNA ligase 2 truncated active site mutants: improved tools for RNA analysis. BMC Biotechnology. 11, 72 (2011).
Chiang, H. R., et al. Mammalian microRNAs: experimental evaluation of novel and previously annotated genes. Genes & Development. 24 (10), 992-1009 (2010).
Fromm, B., et al. A Uniform System for the Annotation of Vertebrate microRNA Genes and the Evolution of the Human microRNAome. Annual Review of Genetics. 49, 213-242 (2015).

Genetics

Una pipeline completa per l'isolamento e la sequenza dei microRNA e la loro analisi tramite gli strumenti open source

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.