Biology

Computationele analyse Tutorial voor chimeer klein niet-coderend RNA: Target RNA Sequencing Libraries

Published: December 1, 2023 doi: 10.3791/65779

Sreenivas Eadara¹, Xinbei Li¹, Emily A. Eiss¹, Mollie K. Meffert^1,2

¹Department of Biological Chemistry, Johns Hopkins University School of Medicine, ²Solomon H. Snyder Department of Neuroscience, Johns Hopkins University School of Medicine

Summary

Hier presenteren we een protocol dat de installatie en het gebruik van een bio-informaticapijplijn demonstreert om chimere RNA-sequencinggegevens te analyseren die worden gebruikt in de studie van in vivo RNA:RNA-interacties.

Abstract

Een beter begrip van de in vivo genregulerende interacties van kleine niet-coderende RNA's (sncRNA's), zoals microRNA's (miRNA's), met hun doel-RNA's is de afgelopen jaren bevorderd door biochemische benaderingen die gebruik maken van cross-linking gevolgd door ligatie om sncRNA:doel-RNA-interacties vast te leggen door de vorming van chimere RNA's en daaropvolgende sequencingbibliotheken. Hoewel datasets van chimere RNA-sequencing genoombrede en aanzienlijk minder dubbelzinnige input bieden dan miRNA-voorspellingssoftware, vereist het destilleren van deze gegevens tot zinvolle en bruikbare informatie aanvullende analyses en kan het onderzoekers zonder een computationele achtergrond afschrikken. Dit rapport biedt een tutorial om beginnende computationele biologen te ondersteunen bij het installeren en toepassen van een recente open-source softwaretool: Small Chimeric RNA Analysis Pipeline (SCRAP). Platformvereisten, updates en een uitleg van pijplijnstappen en manipulatie van belangrijke variabelen voor gebruikersinvoer worden verstrekt. Het verminderen van een barrière voor biologen om inzichten te verwerven uit chimere RNA-sequencingbenaderingen heeft het potentieel om op ontdekking gebaseerde onderzoeken naar regulerende sncRNA:doel-RNA-interacties in meerdere biologische contexten te starten.

Introduction

Kleine niet-coderende RNA's zijn sterk bestudeerd vanwege hun post-transcriptionele rol bij het coördineren van expressie van genenreeksen in diverse processen zoals differentiatie en ontwikkeling, signaalverwerking en ziekte ^1,2,3. Het vermogen om nauwkeurig de doeltranscripten van genregulerende kleine niet-coderende RNA's (sncRNA's), inclusief microRNA's (miRNA's), te bepalen, is van belang voor studies van RNA-biologie op zowel basis- als translationeel niveau. Bio-informatica-algoritmen die gebruik maken van de verwachte complementariteit tussen de miRNA-zaadsequentie en zijn potentiële doelwitten zijn vaak gebruikt voor de voorspelling van miRNA:doel-RNA-interacties. Hoewel deze bio-informatica-algoritmen succesvol zijn geweest, kunnen ze ook zowel vals-positieve als vals-negatieve resultaten bevatten, zoals elders is besproken ^4,5,6. Onlangs zijn er verschillende biochemische benaderingen ontworpen en geïmplementeerd die een ondubbelzinnige en semikwantitatieve bepaling van in vivo sncRNA:doel-RNA-interacties mogelijk maken door in vivo crosslinking en de daaruit voortvloeiende opname van een ligatiestap om het sncRNA fysiek aan zijn doelwit te hechten om een enkel chimeer RNA te vormen 4,5,7,8,9,10 . Latere voorbereiding van sequencingbibliotheken van de chimere RNA's maakt het mogelijk om de sncRNA:doel-RNA-interacties te beoordelen door computationele verwerking van de sequentiegegevens. Deze video biedt een zelfstudie voor het installeren en gebruiken van een computationele pijplijn genaamd kleine chimere RNA-analysepijplijn (SCRAP), die is ontworpen om robuuste en reproduceerbare analyse van sncRNA:doel-RNA-interacties uit chimere RNA-sequencingbibliotheken^{mogelijk te maken 6}.

Een doel van deze tutorial is om onderzoekers te helpen bij het vermijden van overmatige afhankelijkheid van puur voorspellende bio-informatica-algoritmen door barrières te verlagen voor de analyse van gegevens die zijn gegenereerd door biochemische benaderingen die chimere moleculaire uitlezingen van sncRNA:doel-RNA-interacties bieden. Deze zelfstudie biedt praktische stappen en tips om beginnende computationele wetenschappers te begeleiden bij het gebruik van een pijplijn, SCRAP, ontwikkeld voor het analyseren van chimere RNA-sequencinggegevens, die kunnen worden gegenereerd door verschillende bestaande biochemische protocollen, waaronder crosslinking, ligatie en sequencing van hybriden (CLASH) en covalente ligatie van endogene Argonaute-gebonden RNA's - crosslinking en immunoprecipitatie (CLEAR-CLIP)^7,9.

Het gebruik van SCRAP biedt verschillende voordelen voor de analyse van chimere RNA-sequencinggegevens, in vergelijking met andere computationele pijplijnen⁶. Een opvallend voordeel is de uitgebreide annotatie en de integratie van call-outs naar goed ondersteunde en routinematig bijgewerkte bio-informaticascripts in de pijplijn, in vergelijking met alternatieve pijplijnen die vaak afhankelijk zijn van aangepaste en/of niet-ondersteunde scripts voor stappen in de pijplijn. Deze functie geeft stabiliteit aan SCRAP, waardoor het voor onderzoekers meer de moeite waard is om vertrouwd te raken met de pijplijn en het gebruik ervan in hun workflow op te nemen. Van SCRAP is ook aangetoond dat het beter presteert dan alternatieve pijplijnen bij het aanroepen van pieken van sncRNA:doel-RNA-interacties en dat het platformonafhankelijke functionaliteit heeft, zoals beschreven in een eerdere publicatie⁶.

Aan het einde van deze zelfstudie zijn gebruikers in staat om (i) de platformvereisten voor SCRAP te kennen en SCRAP-pijplijnen te installeren, (ii) referentiegenomen te installeren en opdrachtregelparameters voor SCRAP in te stellen, en (iii) de criteria voor piekaanroepen te begrijpen en piekaanroepen en piekannotatie uit te voeren.

Deze video zal in praktisch detail beschrijven hoe onderzoekers die RNA-biologie bestuderen, de computationele pijplijn, SCRAP, kunnen installeren en optimaal kunnen gebruiken om sncRNA-interacties met doel-RNA's, zoals boodschapper-RNA's, te analyseren in chimere RNA-sequencinggegevens die zijn verkregen via een van de besproken biochemische benaderingen voor de voorbereiding van sequencing-bibliotheken.

SCRAP is een opdrachtregelprogramma. Over het algemeen moet de gebruiker, volgens de onderstaande gids, (i) SCRAP downloaden en installeren (https://github.com/Meffert-Lab/SCRAP), (ii) referentiegenomen installeren en SHROOT uitvoeren, en (iii) piekaanroepen en annotatie uitvoeren.

Meer informatie over de rekenstappen in deze procedure is te vinden op https://github.com/Meffert-Lab/SCRAP. Dit artikel biedt de opzet en achtergrondinformatie om onderzoekers met rekenvaardigheden op instapniveau in staat te stellen SCRAP te installeren, te optimaliseren en te gebruiken op chimere RNA-sequencingbibliotheekdatasets.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

OPMERKING: Het protocol begint met het downloaden en installeren van software die nodig is om chimere RNA-sequencingbibliotheken te analyseren met behulp van SCRAP.

1. Installatie

Voordat u SHROOT installeert, installeert u de afhankelijkheden Git en Miniconda op de machine die voor de analyses moet worden gebruikt. Git is waarschijnlijk al geïnstalleerd. Op het Mac OSX-platform, bijvoorbeeld, controleer dit met behulp van welke git om te zien of het " git " hulpprogramma aanwezig is en geïnstalleerd is in deze map. Controleer of Miniconda is geïnstalleerd met welke conda. Als er niets wordt geretourneerd, installeert u Miniconda. De installatie van Miniconda vereist 400 MB schijfruimte.
1. Er zijn een paar methoden om Miniconda te installeren, en ze verschillen per platform. Raadpleeg het PLATFORM-SETUP markdown-bestand op de Meffert Lab GitHub-repository [https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md] waar verdere instructies staan voor het installeren op Windows, MacOS en Ubuntu. Voor Linux-gebruikers heeft Linux zijn eigen standaard pakketbeheerder (apt). In het specifieke geval van dit onderzoek gebruikt u de opdracht brew install Miniconda om Miniconda te installeren met behulp van een bestaande pakketbeheerder, brew.
  OPMERKING: 'Homebrew', ook wel 'brew' genoemd, is een open-source softwarepakketbeheersysteem dat de installatie van software op het besturingssysteem van Apple, macOS, vereenvoudigt.
2. Als conda voor de eerste keer wordt geïnstalleerd, voer dan conda init uit voor de specifieke shell die in gebruik is. In het voorbeeld hier is die shell die wordt gebruikt zsh. Sluit vervolgens de schaal en open deze opnieuw. Als conda met succes is geïnstalleerd, wordt de basisomgeving gezien die binnen de terminalsessie is geactiveerd.
Download de SCRAP-broncode en installeer de afhankelijkheden.
1. De voorkeursmethode voor het verkrijgen van SCRAP-bronnen is het gebruik van Git. Open dit door git clone https://github.com/Meffert-Lab/SCRAP uit te voeren om de laatste kopie van de broncode te verkrijgen.
2. Installeer mamba, een verbeterde pakketoplosser voor conda, en installeer alle afhankelijkheden voor SCRAP van SCRAP_environment.yml naar zijn eigen conda-omgeving met behulp van de volgende opdrachten:
  conda install -n base conda-forge::mamba
  mamba env create -f SCRAP/SCRAP_environment.yml -n SCRAP
Voer vervolgens de referentie-installatie voor SCRAP uit. De argumenten die in de referentie-installatie worden gebruikt, zullen specifiek zijn voor het organisme waarvan de sncRNA-mRNA-interacties worden geanalyseerd.
bash SCHROOT/bak/Reference_Installation.sh -r vol/pad/naar/SCHROOT/ -m heeft -g hg38 -s mens
1. Geef de map van de SCRAP-bronmap op voor referentie-installatie. Installatiestappen worden vervolgens uitgevoerd met behulp van de bestanden in de fasta - en annotatiemappen . Maak een lijst van het volledige pad zonder steno. Eindig met een schuine streep.
2. Raadpleeg de tabellen in README.md voor de juiste afkortingen van miRbase-soorten. De up-to-date referentiegenomen zijn te vinden op https://genome.ucsc.edu/ of https://www.ncbi.nlm.nih.gov/data-hub/genome/. In dit voorbeeld wordt hg38 gebruikt voor het GRCm38-genoom van de muis.
3. De momenteel opgenomen soorten voor annotatie zijn mens, muis en worm. Bekijk de corresponderende species.annotation.bed-bestanden in de annotatiemap in de SCRAP-bronmap. Als het gebruik van een andere soort voor analyse gewenst is, geef dan een annotation.bed-bestand op dat hetzelfde naamgevingsschema volgt: species.annotation.bed.

2. SCHROOT uitvoeren

Nu de afhankelijkheden en SCRAP zijn geïnstalleerd, voert u het script uit SCRAP.sh
bash SCHROOT/bin/SCRAP.sh -d vol/pad/naar/CLASH_Human/ -a vol/pad/naar/CLASH_Human/CLASH_Human_Adapters.txt -p nee -f ja -r vol/pad/naar/SCHROOT/ -m heeft -g hg38
1. Maak een lijst van het volledige pad naar de voorbeeldmappen zonder steno. Maak de voorbeeldmappen op met de mapnaam die exact overeenkomt met de voorbeeldnaam, zoals weergegeven in afbeelding 1.
2. Houd er rekening mee dat het vermelde pad het pad is naar de map die alle voorbeeldmappen bevat, niet het pad naar een afzonderlijke voorbeeldmap of een voorbeeldbestand (raadpleeg de opdrachtregel in stap 2.1).
3. Maak vervolgens een lijst van het volledige pad naar het adapterbestand. Zorg ervoor dat de voorbeeldnamen in het adapterbestand overeenkomen met de eerder genoemde mapnamen en bestandsnamen (zie de opdrachtregel in stap 2.1).
4. Geef aan of de monsters paired-end zijn en of er al dan niet gefilterd zal worden op pre-miRNA's en/of tRNA's. Voeg desgewenst een filter toe voor rRNA-reiniging (zie de opdrachtregel in stap 2.1).
  OPMERKING: De gebruikers kunnen al dan niet besluiten om deze filters te gebruiken, afhankelijk van de steekproeftypen en experimentele doelen. Afhankelijk van het experimentele ontwerp kunnen pre-miRNA's, tRNA's en rRNA's de beschikbare sequencingdiepte gebruiken voor echte sncRNA:target RNA-chimaera's en gebruikers kunnen filters gebruiken om ze uit te sluiten. Gebruikers kunnen een dergelijke filtering in bepaalde omstandigheden echter vermijden (bijv. het in kaart brengen van sncRNA-doelen op het mitochondriale genoom, dat mitochondriale rRNA's bevat).
5. Maak vervolgens een lijst van het volledige pad naar de referentiemap, de afkorting miRbase en de afkorting van het referentiegenoom (zie de opdrachtregel in stap 2.1).
  OPMERKING: Het kan enkele uren duren voordat het script is voltooid, afhankelijk van de grootte van de gegevensset en de CPU van de computer die wordt gebruikt.

3. Piek bellen en annotatie

Zodra SCRAP klaar is met draaien, controleert u of de uitvoer onder andere een SAMPLE.aligned.unique.bam-bestand bevat. Dit is een binair bestand met uitlijningen van doel-RNA's op het door de gebruiker verstrekte referentiegenoom.
Voer nu piekgesprekken uit door Peak_Calling.sh uit te voeren.
bash SCHROOT/bak/Peak_Calling.sh -d CLASH_Human/ -a CLASH_Human/CLASH_Human_Adapters.txt -c 3 -l 2 -f no -r SCRAP/ -m has -g hg38
OPMERKING: Piekaanroepen is een functie van SCRAP, die is ontworpen om onderzoekers in staat te stellen gemakkelijk de meest robuuste en reproduceerbare kleine niet-coderende RNA:doel-RNA-interacties binnen hun chimere RNA-bibliotheken te evalueren. Deze functie kan onderzoekers bijvoorbeeld helpen bij het identificeren van interacties die ze mogelijk willen selecteren voor verder onderzoek. In stap 3.2.2 hieronder wordt beschreven hoe de gebruiker de criteria instelt die hij wil gebruiken om de stringentie te definiëren waarmee een piek wordt aangeroepen - dit omvat het aantal unieke interacties, of sequencing-lezingen, die moeten hebben plaatsgevonden om de piek op te roepen, evenals het aantal bibliotheken waarin deze specifieke interactie moet hebben plaatsgevonden.
1. Maak opnieuw een lijst van de volledige paden naar de map met de voorbeeldmappen en het adapterbestand (raadpleeg de opdrachtregel in stap 3.2).
2. Stel vervolgens het minimum aantal sequentie-reads in dat nodig is om een piek op te roepen (zie de opdrachtregel in stap 3.2).
3. Stel het minimum aantal afzonderlijke sequencingbibliotheken in dat een piek moet bevatten om te worden aangeroepen (raadpleeg de opdrachtregel in stap 3.2).
  OPMERKING: De keuze van de waarden voor zowel 3.2.2 als 3.2.3 hangt af van de aard van de gesequencede monsters en het aantal monsters of monstertypen. Hier zijn ten minste 3 chimere sequencing-lezingen in een monster vereist om een piek op te roepen, en de piek moet worden ondersteund door ten minste 2 monsters. Een onderzoeker die een gegevensset evalueert waarin veel replica's van sequencingbibliotheken voor een bepaalde aandoening voorkomen, kan bijvoorbeeld besluiten om de aanwezigheid van de reads in een groter aantal sequencingbibliotheken te vereisen.
4. Geef aan of sncRNA's van dezelfde familie moeten bijdragen aan dezelfde piek. Omdat miRNA's van dezelfde familie bijvoorbeeld zaadsequenties delen, kunnen deze miRNA's gedeelde en overlappende sets gendoelen binden; Een gebruiker kan de volledige impact van een familie op deze doelen identificeren door hun collectieve pieken te beoordelen (zie de opdrachtregel in stap 3.2).
5. Geef vervolgens het volledige pad naar de referentiemap, de afkorting miRBase en de afkorting van het referentiegenoom aan (zie de opdrachtregel in stap 3.2).
Zodra de piekaanroep is voltooid, voert u de piekannotatie uit.
bash SCHROOT/bak/Peak_Annotation.sh -p CLASH_Human/peaks.bed -r SCHROOT/ -s mens
1. Maak een lijst van het volledige pad naar het resulterende bestand peaks.bed (of peaks.family.bed ) vanaf het aanroepen van pieken, het volledige pad naar de referentiemap en de gewenste soort voor annotatie.

4. Visualiseren van de data

OPMERKING: Alle stappen voor analyse met behulp van SCRAP zijn nu voltooid. Voor het visualiseren van de gegevens worden verschillende benaderingen aanbevolen:

Voeg alle .bam-bestanden (binair SAM-bestand) samen die u samen wilt visualiseren (samtools merge).
Sorteer het resulterende samengevoegde .bam-bestand (samtools sort). De inhoud van het bestand wordt regel voor regel gesorteerd, zodat samtools kan indexeren.
Indexeer het gesorteerde .bam-bestand (samtools-index). Er wordt een BAI-bestand (binary samtools format index) gegenereerd om visualisatie in de integratieve genomicsviewer (IGV) mogelijk te maken.
Open ten slotte het resulterende gesorteerde .bam- en geïndexeerde .bai-bestand in IGV.
OPMERKING: SncRNA: Doel-RNA-interacties die van belang zijn, kunnen op een aantal onderzoeksspecifieke manieren prioriteit krijgen voor follow-up. Een algemene eerste benadering is het beoordelen van de interacties waarvoor pieken worden ondersteund door de meest chimere sequencing-metingen. Interacties van belang kunnen ook worden gevisualiseerd met behulp van de DuplexFold-webserver uit het RNAstructure-pakket door de sequentie voor zowel het sncRNA als het doel-RNA van de gedetecteerde interactie^{in te voeren 11}. Voor elke piek zijn het chromosoom (eerste kolom) en de genomische coördinaten (begin: 1e kolom einde: 2e kolom) te vinden in het peaks.bed.species.annotation.txt bestand dat is gegenereerd in piekannotatie. Voor miRNA's in het bijzonder, hoewel reproduceerbare en functionele interacties geen uitgebreide zaadgematchte binding kunnen hebben (bijv. interacties kunnen 3' compenserende binding gebruiken), kan de aanwezigheid van zaad-gematchte plaatsen in een verwant bindingsmotief van het doel-RNA niettemin worden beoordeeld als een validerend kenmerk van functioneel belangrijke gedetecteerde interacties ^4,12. Aanvullende gegevensverwerking kan bestaan uit vergelijkingen van differentiële leesdekking tussen pieken in verschillende biologische omstandigheden en mogelijk beoordeling van clustering van gereguleerde genen in routes met behulp van een pathway-analysetool.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Resultaten voor sncRNA:doel-RNA gedetecteerd door een gemodificeerde versie van SCRAP (SCRAP release 2.0, die modificaties voor rRNA-filtering implementeert) op eerder gepubliceerde sequencing-datasets die zijn opgesteld met behulp van CLEAR-CLIP⁹ , worden weergegeven in figuur 2 en tabel 1. Gebruikers kunnen de afname van de relatieve fractie miRNA-interacties met intronregio's waarderen die optreedt na de isolatie van interacties met hoge betrouwbaarheid door piekaanroepen in SCRAP. Aanvullende gegevens uit analyses met behulp van SCRAP zijn ook beschikbaar in de eerste publicatie van deze pijplijn⁶. Afhankelijk van de experimentele aanpak kan het filteren van sequentiegegevens uit geprepareerde chimere RNA-bibliotheken nodig zijn om artefacten in de resultaten te verminderen. Suboptimale biochemische voorbereiding van de sequentiebibliotheek en/of suboptimale filtering van de sequentiegegevens kunnen resulteren in de onjuiste opname van reads die niet zijn voortgekomen uit de ligatie van sncRNA's en doel-RNA's gebonden door Argonaute. Deze artefactische aflezingen kunnen primerdimeren of adapterdimeren, rRNA's en pre-miRNA's bevatten. Tabel 2 beschrijft mogelijke artefacten die in de resultaten kunnen worden gedetecteerd en mogelijke oplossingen.

Figuur 1: Opmaak voor gegevensmappen. Bestanden met onbewerkte lezingen voor elke sequentiebibliotheek moeten worden aangeleverd in de .fastq.gz-indeling. (A) Als de bibliotheken niet aan de gekoppelde kant zijn, wordt een enkel .fastq.gz bestand gebruikt voor de analyse. Dit bestand moet de naam 'SAMPLE.fastq.gz' hebben, waarbij SAMPLE de exacte voorbeeldnaam is die door de gebruiker in het adapterbestand is opgegeven. Het bestand moet zich bevinden in een map die exact overeenkomt met de naam van het voorbeeld. (B) Voor sequencingbibliotheken met een gekoppeld uiteinde worden twee .fastq.gz bestanden gebruikt. Deze bestanden moeten de namen 'SAMPLE-R1.fastq.gz' en 'SAMPLE-R2.fastq.gz' hebben en moeten zich in een map bevinden die exact overeenkomt met de voorbeeldnaam. Al deze mappen met de naam SAMPLE moeten zich in dezelfde bovenliggende map bevinden, die de gebruiker aan SCRAP zal verstrekken als de "voorbeeldmap". Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 2: Aandeel miRNA:doel-RNA-interacties volgens doeltype- en piekoproepmethoden. Chimere sncRNA:target RNA-sequencing gepubliceerde gegevens uit bibliotheken die zijn voorbereid met behulp van CLEAR-CLIP (SRR2413277 - SRR2413295)⁹ werden geanalyseerd met behulp van een aangepaste versie van SCRAP (SCRAP release 2.0) met rRNA-filtering geïmplementeerd. Pre-miRNA's, tRNA's en rRNA's werden gefilterd en er werden verschillende piekaanroepinstellingen gebruikt voor 'high-confidence' (minimaal 3 reads en 2 libraries) en 'alle interacties' (minimaal 1 read en 1 library). Interacties werden gegroepeerd per miRNA-familie of niet-gegroepeerd. Relatieve fracties van chimere RNA-aflezingen voor de categorieën (CDS, 5' UTR, intergeen, intron, 3'UTR) werden berekend en in een grafiek weergegeven. Klik hier om een grotere versie van deze figuur te bekijken.

	Alle interacties		Interacties met veel vertrouwen
	Individuele miRNA's	miRNA-families	Individuele miRNA's	miRNA-families
CDS	8675	8679	925	1046
5' UTR	338	338	38	43
Intergeen	2230	2230	320	339
Intron	9522	9519	382	406
3' UTR	6814	6813	548	644
Totaal aantal interacties:	31033	31034	4219	4597

Tabel 1: Chimere leestellingen van miRNA:doel-RNA-interacties per doeltype en piekoproepmethode. Chimere sncRNA:target RNA-sequencinggegevens gepubliceerd uit bibliotheken die zijn opgesteld met behulp van CLEAR-CLIP (SRR2413277 - SRR2413295)⁹ werden geanalyseerd met behulp van een aangepaste versie van SCRAP (SCRAP release 2.0) met rRNA-filtering geïmplementeerd. Pre-miRNA's, tRNA's en rRNA's werden gefilterd en er werden verschillende piekaanroepinstellingen gebruikt voor interacties met hoge betrouwbaarheid (minimaal 3 leesbewerkingen en 2 bibliotheken) en alle (minimaal 1 lees- en 1 bibliotheek) interacties, gegroepeerd per miRNA-familie of niet-gegroepeerd. Voor elke aandoening worden tellingen van het totale aantal gedetecteerde miRNA:doel-RNA-interacties vermeld waarin de doel-RNA-interactie in kaart is gebracht in de categorie van coderende sequentie (CDS), 5' niet-vertaalde regio (5' UTR), intergene regio, intron of 3' niet-vertaalde regio (3'UTR).

Potentiële verontreiniging	Gedetecteerd als	Oorzaken	Mogelijke oplossingen
Primer Dimers	Interacties gedetecteerd tussen miRNA's waarvan de sequentie overeenkomt met het 5'-uiteinde van een amplificatieprimer en een doel-RNA waarvan de sequentie overeenkomt met de rest van de primer.	Onjuiste scheiding van de grootte (d.w.z. gelextractie) van het PCR-product na amplificatie.	De meeste primerdimeren worden vanwege hun kleine lengte door SCRAP genegeerd na het verwijderen van de adapter. Als ze aanhouden, overweeg dan om primersequenties aan een filter toe te voegen.
rRNA's	Interacties tussen willekeurige miRNA's en bekende rRNA's of lncRNA's Gm26917 en Gm42418	Ineffectieve isolatie (d.w.z. immunoprecipitatie en gelscheiding) van Argonaute-complexen.	rRNA-filtering is vaak nodig wanneer rRNA-besmetting overvloedig aanwezig is.
tRNA's en pre-miRNA's	Interacties tussen tRNA-fragmenten die afbraakproducten zijn van hetzelfde tRNA of 5p- en 3p-miRNA's die uit hetzelfde pre-miRNA worden geproduceerd.	Lage overvloed aan echte sncRNA: doel-RNA-chimaera's of lage weefsel-Argonaute-expressie.	tRNA-filtering en pre-miRNA-filtering.

Tabel 2: Sequentiemetingen en oplossingen voor potentiële contaminanten.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Dit protocol voor het gebruik van de SCRAP-pijplijn voor analyse van sncRNA:doel-RNA-interacties is ontworpen om onderzoekers te helpen bij het uitvoeren van computationele analyse. Van de voltooiing van de zelfstudie wordt verwacht dat onderzoekers met rekenervaring op instapniveau of hoger door de stappen worden geleid die nodig zijn voor de installatie en het gebruik van deze pijplijn en de toepassing ervan om gegevens te analyseren die zijn verkregen uit chimere RNA-sequencingbibliotheken. Stappen die cruciaal zijn voor de voltooiing van dit protocol zijn onder meer de correcte installatie van referenties en het uitvoeren van SCRAP, wat tijdrovend kan zijn en de bron van fouten kan zijn, vooral als er niet zorgvuldig is omgegaan met de installatie van afhankelijkheden met behulp van Anaconda of het typen van opdrachtregelargumenten.

Hier lag de bijzondere focus op tips en stappen voor praktisch gebruik van de SCRAP-pijplijn voor analyse van chimere sncRNA:target RNA-sequencingbibliotheken. SCRAP blijkt beter te presteren dan andere chimere RNA-analyseplatforms bij de detectie van sncRNA:doel-RNA-interacties ^6,13. Dit kan te wijten zijn aan de piekoproepfunctie van SCRAP die speciaal is ontwikkeld om de kenmerken (bijv. 3' schouderen) te detecteren die worden waargenomen als gevolg van biochemische stappen die betrokken zijn bij de vorming van de chimere RNA's. Andere methoden voor het oproepen van pieken voor verschillende biochemische benaderingen, zoals stroomafwaarts van chromatine-immunoprecipitatiesequencing (CHIP-seq)-toepassingen, zijn ontwikkeld om pieken in gegevens te detecteren die symmetrisch zijn verdeeld rond een gemiddelde en doorgaans niet zo goed presteren bij het detecteren van de piekkenmerken van chimere sncRNA:doel-RNA-bibliotheken. Gebruikers kunnen echter het gebruik van andere computerpijplijnen testen die beter voor hun behoeften zouden kunnen werken, vooral als hun gegevens niet aan deze beschrijving voldoen.

Hoewel SCRAP minimale hardwarevereisten heeft, schaalt de SCRAP-runtime slecht mee met de grootte van de gegevensset. Onderzoekers die het beginnersniveau zijn gepasseerd, of die een groot aantal datasets of datasets met een hoge sequencing-dekking hebben, willen SCRAP misschien gebruiken op een manier die de analysestappen kan versnellen. Aangezien grote gegevenssets (meestal > 1 miljard keer worden gelezen) verbeterde bestandsopslagmogelijkheden en lees-/schrijfsnelheden voor gegevens vereisen, kan het uitvoeren van SCRAP op een HPC-cluster (High-Performance Computing) gewenst zijn voor de analyse van grotere gegevenssets. Een SCRAP-optimalisatie, die parallellisatie en verbeterde prestaties moet bieden, zal beschikbaar worden gesteld op GitHub (https://github.com/Meffert-Lab/). Deze bijgewerkte versie van SCRAP (release 2.0) heeft ook verbeterde filters voor rRNA en andere verontreinigingen.

Zoals bij elke interface, kunnen gebruikers onvermijdelijk problemen ondervinden bij het gebruik van de opdrachtregelinterface. De meest voorkomende hiervan zijn spelfouten, onjuiste paden en pakketinstallatie/versiebeheer. Onderzoekers wordt geadviseerd om voorzichtig te zijn en typefouten te vermijden bij het schrijven van opdrachtregelargumenten en om paden naar bestanden of mappen exact te reproduceren (het gebruik van een 'tab'-automatisch aanvullen kan hierbij helpen). Afhankelijkheden voor SCRAP worden beheerd via Anaconda, zodat onderzoekers minder snel problemen ondervinden met de installatie van pakketten of versie-updates.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

De auteurs hebben niets te onthullen.

Acknowledgments

We danken de leden van het Meffert-laboratorium voor nuttige discussies, waaronder BH Powell en WT Mills IV, voor hun kritische feedback over het beschrijven van de installatie en implementatie van de pijpleiding. Dit werk werd ondersteund door een Braude Foundation-prijs, het Maryland Stem Cell Research Fund Launch Program, de Blaustein Endowment for Pain Research and Education-prijs en NINDS RO1NS103974 en NIMH RO1MH129292 aan MKM.

Materials

Name	Company	Catalog Number	Comments
Genomes	UCSC Genome browser	N/A	https://genome.ucsc.edu/ or https://www.ncbi.nlm.nih.gov/data-hub/genome/
Linux	Linux	Ubuntu 20.04 or 22.04 LTS recommended
Mac	Apple	Mac OSX (>11)
Platform setup	GitHub	N/A	https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md]
SCRAP pipeline	GitHub	N/A	https://github.com/Meffert-Lab/SCRAP
Unix shell	Unix operating system	bash >=5.0
Unix shell	Unix operating system	zsh (5.9 recommended)
Windows	Windows	WSL Ubuntu 20.04 or 22.04 LTS

DOWNLOAD MATERIALS LIST

References

Morris, K. V., Mattick, J. S. The rise of regulatory RNA. Nature Reviews Genetics. 15 (6), 423-437 (2014).
Li, X., Jin, D. S., Eadara, S., Caterina, M. J., Meffert, M. K. Regulation by noncoding RNAs of local translation, injury responses, and pain in the peripheral nervous system. Neurobiology of Pain (Cambridge, Mass.). 13, 100119 (2023).
Shi, J., Zhou, T., Chen, Q. Exploring the expanding universe of small RNAs. Nature Cell Biology. 24 (4), 415-423 (2022).
Broughton, J. P., Lovci, M. T., Huang, J. L., Yeo, G. W., Pasquinelli, A. E. Pairing beyond the seed supports microRNA targeting specificity. Molecular Cell. 64 (2), 320-333 (2016).
Grosswendt, S., et al. Unambiguous identification of miRNA:target site interactions by different types of ligation reactions. Molecular Cell. 54 (6), 1042-1054 (2014).
Mills, W. T., Eadara, S., Jaffe, A. E., Meffert, M. K. SCRAP: a bioinformatic pipeline for the analysis of small chimeric RNA-seq data. RNA. 29 (1), 1-17 (2023).
Helwak, A., Kudla, G., Dudnakova, T., Tollervey, D. Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding. Cell. 153 (3), 654-665 (2013).
Hoefert, J. E., Bjerke, G. A., Wang, D., Yi, R. The microRNA-200 family coordinately regulates cell adhesion and proliferation in hair morphogenesis. Journal of Cell Biology. 217 (6), 2185-2204 (2018).
Moore, M. J., Zhang, C., Gantman, E. C., Mele, A., Darnell, J. C., Darnell, R. B. Mapping Argonaute and conventional RNA-binding protein interactions with RNA at single-nucleotide resolution using HITS-CLIP and CIMS analysis. Nature Protocols. 9 (2), 263-293 (2014).
Bjerke, G. A., Yi, R. Integrated analysis of directly captured microRNA targets reveals the impact of microRNAs on mammalian transcriptome. RNA. 26 (3), 306-323 (2020).
Reuter, J. S., Mathews, D. H. RNAstructure: software for RNA secondary structure prediction and analysis. BMC Bioinformatics. 11 (1), 129 (2010).
Moore, M. J., et al. miRNA-target chimeras reveal miRNA 3′-end pairing as a major determinant of Argonaute target specificity. Nature Communications. 6 (1), 8864 (2015).
Travis, A. J., Moody, J., Helwak, A., Tollervey, D., Kudla, G. Hyb: a bioinformatics pipeline for the analysis of CLASH (crosslinking, ligation and sequencing of hybrids) data. Methods (San Diego, Calif.). 65 (3), 263-273 (2014).

Biology

Computationele analyse Tutorial voor chimeer klein niet-coderend RNA: Target RNA Sequencing Libraries

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.