Biology

Opplæring i beregningsanalyse for kimært lite ikke-kodende RNA: Mål-RNA-sekvenseringsbiblioteker

Published: December 1, 2023 doi: 10.3791/65779

Sreenivas Eadara¹, Xinbei Li¹, Emily A. Eiss¹, Mollie K. Meffert^1,2

¹Department of Biological Chemistry, Johns Hopkins University School of Medicine, ²Solomon H. Snyder Department of Neuroscience, Johns Hopkins University School of Medicine

Summary

Her presenterer vi en protokoll som demonstrerer installasjon og bruk av en bioinformatikkrørledning for å analysere kimære RNA-sekvenseringsdata som brukes i studiet av in vivo RNA: RNA-interaksjoner.

Abstract

En forståelse av in vivo-genregulatoriske interaksjoner av små ikke-kodende RNA (sncRNAer), som mikroRNA (miRNA), med deres mål-RNAer, har blitt avansert de siste årene av biokjemiske tilnærminger som bruker kryssbinding etterfulgt av ligering for å fange sncRNA: mål-RNA-interaksjoner gjennom dannelse av kimære RNA og påfølgende sekvenseringsbiblioteker. Mens datasett fra kimær RNA-sekvensering gir genom-bred og vesentlig mindre tvetydig inngang enn miRNA-prediksjonsprogramvare, krever destillasjon av disse dataene til meningsfull og handlingsbar informasjon ytterligere analyser og kan fraråde etterforskere som mangler en beregningsbakgrunn. Denne rapporten gir en veiledning for å støtte beregningsbiologer på inngangsnivå i å installere og bruke et nylig programvareverktøy med åpen kildekode: Small Chimeric RNA Analysis Pipeline (SCRAP). Plattformkrav, oppdateringer og en forklaring av pipeline-trinn og manipulering av viktige brukerinngangsvariabler er gitt. Å redusere en barriere for biologer for å få innsikt fra kimære RNA-sekvenseringstilnærminger har potensial til å springbrett oppdagelsesbaserte undersøkelser av regulatoriske sncRNA: mål-RNA-interaksjoner i flere biologiske sammenhenger.

Introduction

Små ikke-kodende RNA er høyt studert for deres post-transkripsjonelle roller i koordinering av uttrykk fra suiter av gener i ulike prosesser som differensiering og utvikling, signalbehandling og sykdom ^1,2,3. Evnen til nøyaktig å bestemme måltranskripsjonene av genregulerende små ikke-kodende RNA (sncRNAer), inkludert mikroRNA (miRNA), er av betydning for studier av RNA-biologi både på grunnleggende og translasjonsnivå. Bioinformatiske algoritmer som utnytter forventet komplementaritet mellom miRNA-frøsekvensen og dens potensielle mål, har ofte blitt brukt til prediksjon av miRNA: mål-RNA-interaksjoner. Selv om disse bioinformatiske algoritmene har vært vellykkede, kan de også ha både falske positive og falske negative resultater, som det har blitt gjennomgått andre steder ^4,5,6. Nylig har flere biokjemiske tilnærminger blitt designet og implementert som tillater entydig og semikvantitativ bestemmelse av in vivo sncRNA: mål-RNA-interaksjoner ved in vivo tverrbinding og påfølgende inkorporering av et ligeringstrinn for fysisk å feste sncRNA til målet for å danne et enkelt kimært RNA 4,5,7,8,9,10 . Etterfølgende forberedelse av sekvenseringsbiblioteker fra de kimære RNAene tillater vurdering av sncRNA: mål-RNA-interaksjoner ved beregningsbehandling av sekvenseringsdataene. Denne videoen gir en veiledning for installasjon og bruk av en beregningsrørledning kalt liten kimær RNA-analyserørledning (SCRAP), som er designet for å tillate robust og reproduserbar analyse av sncRNA: mål-RNA-interaksjoner fra kimære RNA-sekvenseringsbiblioteker⁶.

Et mål med denne opplæringen er å hjelpe etterforskere med å unngå overdreven avhengighet av rent prediktive bioinformatiske algoritmer ved å senke barrierer for analyse av data generert gjennom biokjemiske tilnærminger som gir kimære molekylære avlesninger av sncRNA: mål-RNA-interaksjoner. Denne opplæringen gir praktiske trinn og tips for å veilede beregningsforskere på inngangsnivå gjennom bruk av en rørledning, SCRAP, utviklet for å analysere kimære RNA-sekvenseringsdata, som kan genereres av flere eksisterende biokjemiske protokoller, inkludert kryssbinding, ligering og sekvensering av hybrider (CLASH) og kovalent ligering av endogene Argonaute-bundne RNAer - tverrbinding og immunutfelling (CLEAR-CLIP) ^7,9.

Bruken av SCRAP gir flere fordeler for analyse av kimære RNA-sekvenseringsdata, sammenlignet med andre beregningsrørledninger⁶. En fremtredende fordel er dens omfattende merknader og inkorporering av utrop til godt støttede og rutinemessig oppdaterte bioinformatiske skript i rørledningen, sammenlignet med alternative rørledninger som ofte er avhengige av tilpassede og / eller ikke-støttede skript for trinn i rørledningen. Denne funksjonen gir stabilitet til SCRAP, noe som gjør det mer verdt for forskere å gjøre seg kjent med rørledningen og å innlemme bruken i arbeidsflyten. SCRAP har også vist seg å overgå alternative rørledninger ved å kalle topper av sncRNA: mål-RNA-interaksjoner og å ha funksjonalitet på tvers av plattformer, som beskrevet i en tidligere publikasjon⁶.

Ved slutten av denne opplæringen vil brukerne kunne (i) kjenne plattformkrav for SCRAP og installere SCRAP-rørledninger, (ii) installere referansegenomer og sette opp kommandolinjeparametere for SCRAP, og (iii) forstå toppanropskriterier og utføre toppanrop og toppmerknad.

Denne videoen vil beskrive i praktisk detalj hvordan forskere som studerer RNA-biologi kan installere og optimalt bruke beregningsrørledningen, SCRAP, for å analysere sncRNA-interaksjoner med mål-RNAer, for eksempel messenger-RNAer, i kimære RNA-sekvenseringsdata oppnådd gjennom en av de diskuterte biokjemiske tilnærmingene til sekvensering av bibliotekforberedelse.

SCRAP er et kommandolinjeverktøy. Generelt, etter veiledningen nedenfor, må brukeren (i) laste ned og installere SCRAP (https://github.com/Meffert-Lab/SCRAP), (ii) installere referansegenomer og kjøre SCRAP, og (iii) utføre toppanrop og merknad.

Du finner mer informasjon om beregningstrinnene i denne prosedyren på https://github.com/Meffert-Lab/SCRAP. Denne artikkelen vil gi oppsett og bakgrunnsinformasjon for å tillate etterforskere med beregningsferdigheter på inngangsnivå å installere, optimalisere og bruke SCRAP på kimære RNA-sekvenseringsbibliotekdatasett.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

MERK: Protokollen begynner med å laste ned og installere programvare som kreves for å analysere kimære RNA-sekvenseringsbiblioteker ved hjelp av SCRAP.

1. Installasjon

Før du installerer SCRAP, må du installere avhengighetene Git og Miniconda på maskinen som skal brukes til analysene. Git er sannsynligvis allerede installert. På Mac OSX-plattformen, for eksempel, bekreft dette ved hjelp av hvilken git for å se at " git " -verktøyet er til stede og installert i denne katalogen. Sjekk om Miniconda er installert med hvilken conda. Hvis ingenting returneres, installerer du Miniconda. Miniconda krever 400 MB diskplass for å installere.
1. Det er noen få metoder for å installere Miniconda, og de varierer etter plattform. Se PLATFORM-SETUP-markdown-filen på Meffert Lab GitHub-repositoriet [https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md] der det er ytterligere instruksjoner for installasjon på Windows, MacOS og Ubuntu. For Linux-brukere har Linux sin egen standard pakkebehandling (apt). I tilfellet som er spesifikt for denne studien, bruk kommandoen brew install Miniconda for å installere Miniconda ved hjelp av en eksisterende pakkebehandling, brew.
  MERK: 'Homebrew', kalt 'brew' er et programvarepakkehåndteringssystem med åpen kildekode som forenkler installasjonen av programvare på Apples operativsystem, macOS.
2. Hvis conda blir installert for første gang, kjør conda init for det aktuelle skallet som er i bruk. I eksemplet her er det skallet som er i bruk zsh. Deretter lukker du og åpner skallet igjen. Hvis conda ble installert, vil basemiljøet aktivert i terminaløkten bli sett.
Last ned SCRAP-kilden og installer avhengighetene.
1. Den foretrukne metoden for å skaffe SCRAP-kilde er å bruke Git. Få tilgang til dette ved å kjøre git clone https://github.com/Meffert-Lab/SCRAP for å få den nyeste kopien av kildekoden.
2. Installer mamba, en forbedret pakkeløser for conda, og installer alle avhengighetene for SCRAP fra SCRAP_environment.yml til sitt eget conda-miljø ved å bruke følgende kommandoer:
  conda installere-n base conda-smie:: mamba
  mamba env opprette -f SKRAP / SCRAP_environment.yml -n SKRAP
Deretter kjører du referanseinstallasjonen for SCRAP. Argumentene som brukes i referanseinstallasjonen vil være spesifikke for organismen hvis sncRNA-mRNA-interaksjoner blir analysert.
bash SKRAP / bin / Reference_Installation.sh-r full / bane / til / SKRAP / -m har-g hg38-s menneskelig
1. Oppgi katalogen til SCRAP-kildemappen for referanseinstallasjon. Installasjonstrinn vil da bli utført ved hjelp av filene i fasta- og merknadsmappene . Oppgi hele banen uten stenografi. Avslutt med en skråstrek.
2. Se tabellene i README.md for riktige miRbase-artsforkortelser. De oppdaterte referansegenomene finnes på https://genome.ucsc.edu/ eller https://www.ncbi.nlm.nih.gov/data-hub/genome/. I dette eksemplet vil hg38 bli brukt til musens GRCm38-genom.
3. De inkluderte artene for merknad er menneske, mus og orm. Vis de tilsvarende species.annotation.bed-filene i merknadsmappen i SCRAP-kildemappen. Hvis du ønsker å bruke en annen art for analyse, kan du oppgi en annotation.bed-fil som følger samme navneskjema species.annotation.bed.

2. Kjører SKRAP

Nå som avhengighetene og SCRAP er installert, - kjør skriptet SCRAP.sh
bash SKRAP / bin / SCRAP.sh -d full / bane / til / CLASH_Human / -en full / bane / til / CLASH_Human / CLASH_Human_Adapters.txt -p nei-f ja-r full / bane / til / SKRAP / -m har-g hg38
1. Liste hele banen til prøven kataloger uten stenografi. Formater eksempelkatalogene med mappenavnet som samsvarer nøyaktig med eksempelnavnet, som vist i figur 1.
2. Legg merke til at banen som vises, er banen til katalogen som inneholder alle eksempelmappene, ikke banen til en individuell eksempelmappe eller en eksempelfil (se kommandolinjen i trinn 2.1).
3. Deretter viser du hele banen til adapterfilen. Kontroller at eksempelnavnene i kortfilen samsvarer med de tidligere nevnte mappenavnene og filnavnene (se kommandolinjen i trinn 2.1).
4. Angi om prøvene er paret og om filtrering for pre-miRNA og / eller tRNA vil bli utført. Legg til et filter for rRNA-rengjøring om ønskelig (se kommandolinjen i trinn 2.1).
  MERK: Brukerne kan eller ikke kan bestemme seg for å bruke disse filtrene, avhengig av utvalgstyper og eksperimentelle mål. Avhengig av eksperimentell design, kan pre-miRNAer, tRNA og rRNA konsumere tilgjengelig sekvenseringsdybde for ekte sncRNA: mål-RNA-kimærer, og brukere kan bruke filtre for å ekskludere dem. Imidlertid kan brukere ønske å unngå slik filtrering under visse omstendigheter (f.eks. Kartlegging av sncRNA-mål til mitokondriegenomet, som inneholder mitokondrielle rRNAer).
5. Deretter lister du opp hele banen til referansekatalogen, miRbase-forkortelsen og referansegenomforkortelsen (se kommandolinjen i trinn 2.1).
  MERK: Skriptet kan ta noen timer å fullføre, avhengig av datasettstørrelsen og CPUen til datamaskinen som brukes.

3. Toppanrop og merknader

Når SCRAP er ferdig med å kjøre, må du kontrollere at utdataene blant annet inneholder en SAMPLE.aligned.unique.bam-fil. Dette er en binær fil som inneholder justeringer av mål-RNA på det brukeroppgitte referansegenomet.
Utfør nå toppanrop ved å kjøre Peak_Calling.sh.
bash SKRAP / bin / Peak_Calling.sh -d CLASH_Human / -a CLASH_Human / CLASH_Human_Adapters.txt -c 3 -l 2 -f nei -r SKRAP / -m har -g hg38
MERK: Peak calling er en funksjon av SCRAP, som er designet for å tillate forskere å enkelt evaluere de mest robuste og reproduserbare små ikke-kodende RNA: mål-RNA-interaksjonene i deres kimære RNA-biblioteker. Denne funksjonen kan for eksempel hjelpe forskere med å identifisere interaksjoner som de kanskje vil velge for videre undersøkelser. Trinn 3.2.2 nedenfor beskriver hvordan brukeren setter kriteriene som de vil bruke til å definere strengheten som en topp kalles - dette inkluderer antall unike interaksjoner, eller sekvenseringsavlesninger, som må ha skjedd for at toppen skal kalles, samt antall biblioteker der denne spesielle interaksjonen må ha skjedd.
1. Igjen, oppgi de fullstendige banene til katalogen som inneholder eksempelmappene, og kortfilen (se kommandolinjen i trinn 3.2).
2. Deretter angir du minimum antall sekvenseringsavlesninger som kreves for at en topp skal kalles (se kommandolinjen i trinn 3.2).
3. Angi minimum antall distinkte sekvenseringsbiblioteker som må inneholde en topp for at den skal kalles (se kommandolinjen i trinn 3.2).
  MERK: Valg av verdier for både 3.2.2 og 3.2.3 vil avhenge av arten av prøvene som er sekvensert og antall prøver eller prøvetyper. Her kreves minst 3 kimære sekvenseringsavlesninger i en prøve for å kalle en topp, og toppen må støttes av minst 2 prøver. En etterforsker som evaluerer et datasett der det er mange sekvenseringsbibliotekreplikater for en gitt tilstand, kan for eksempel bestemme seg for å kreve tilstedeværelse av lesningene i et større antall eksempelsekvenseringsbiblioteker.
4. Angi om sncRNA i samme familie må bidra til samme topp. For eksempel, siden miRNA av samme familie deler frøsekvenser, kan disse miRNAene binde delte og overlappende sett med genmål; En bruker vil kanskje identifisere den fulle effekten av en familie på disse målene ved å vurdere deres kollektive topper (se kommandolinjen i trinn 3.2).
5. Deretter angir du hele banen til referansekatalogen, miRBase-forkortelsen og referansegenomforkortelsen (se kommandolinjen i trinn 3.2).
Når toppanrop er fullført, kjører du toppmerknad.
bash SKRAP / bin / Peak_Annotation.sh -p CLASH_Human / peaks.bed -r SKRAP / -s menneskelig
1. Oppgi hele banen til den resulterende peaks.bed-filen (eller peaks.family.bed ) fra toppanrop, hele banen til referansekatalogen og ønsket art for merknad.

4. Visualisere dataene

MERK: Alle trinn for analyse ved hjelp av SCRAP er nå fullført. For å visualisere dataene anbefales flere tilnærminger:

Slå sammen alle .bam (binær SAM-fil) filer som vil bli ønsket å visualisere sammen (samtools merge).
Sorter den resulterende sammenslåtte BAM-filen (samtools sort). Filinnholdet sorteres linje for linje slik at samtools kan indeksere.
Indekser den sorterte BAM-filen (samtools index). En BAI (binary samtools format index) fil genereres for å tillate visualisering i integrative genomics viewer (IGV).
Til slutt åpner du den resulterende sorterte BAM- og indekserte BAI-filen i IGV.
MERK: SncRNA:Target RNA-interaksjoner av interesse kan prioriteres for oppfølging på en rekke undersøkelsesspesifikke måter. En generisk innledende tilnærming er å vurdere interaksjonene for hvilke topper som støttes av de mest kimære sekvenseringsavlesningene. Interaksjoner av interesse kan også visualiseres ved hjelp av DuplexFold Web Server fra RNAstructure-pakken ved å legge inn sekvensen for både sncRNA og mål-RNA fra den oppdagede interaksjonen¹¹. For hver topp kan kromosomet (første kolonne) og genomiske koordinater (start: 1. kolonne slutt: 2. kolonne) finnes i den peaks.bed.species.annotation.txt filen som genereres i toppmerknad. For miRNA spesielt, mens reproduserbare og funksjonelle interaksjoner kan mangle omfattende frømatchet binding (f.eks. Interaksjoner kan bruke 3' kompenserende binding), kan tilstedeværelsen av frømatchede steder i et kognitivt bindingsmotiv av mål-RNA likevel vurderes som et validerende trekk ved funksjonelt viktige oppdagede interaksjoner ^4,12. Tilleggsdatabehandling kan omfatte sammenligninger av differensiell lesedekning mellom topper i forskjellige biologiske forhold og potensielt vurdering av klynging av regulerte gener i veier ved hjelp av et baneanalyseverktøy.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Resultater for sncRNA:target RNA oppdaget av en modifisert versjon av SCRAP (SCRAP release 2.0, som implementerer modifikasjoner for rRNA-filtrering) på tidligere publiserte sekvenseringsdatasett utarbeidet ved hjelp av CLEAR-CLIP⁹ er vist i figur 2 og tabell 1. Brukere kan sette pris på reduksjonen i den relative fraksjonen miRNA-interaksjoner med intronregioner som oppstår etter isolering av interaksjoner med høy tillit ved toppanrop i SCRAP. Ytterligere data fra analyser med SCRAP er også tilgjengelig i første publisering av denne rørledningen⁶. Avhengig av den eksperimentelle tilnærmingen kan filtrering av sekvenseringsdata fra forberedte kimære RNA-biblioteker være nødvendig for å redusere artefakter i resultatene. Suboptimal biokjemisk fremstilling av sekvenseringsbiblioteket og/eller suboptimal filtrering av sekvenseringsdataene har potensial til å resultere i feil inklusjon av avlesninger som ikke oppsto fra ligering av sncRNA og mål-RNA bundet av argonaute. Disse artefaktavlesningene kan inkludere primerdimerer eller adapterdimerer, rRNA og pre-miRNAer. Tabell 2 beskriver mulige artefakter som kan påvises i resultater, og mulige løsninger.

Figur 1: Formatering for datakataloger. Filer som inneholder rålesing for hvert sekvensbibliotek må leveres i .fastq.gz format. (A) Hvis bibliotekene ikke er sammenkoblet, vil en enkelt .fastq.gz fil bli brukt i analysen. Denne filen skal hete 'SAMPLE.fastq.gz' der SAMPLE er det eksakte prøvenavnet gitt av brukeren i kortfilen. Filen skal ligge i en mappe som samsvarer nøyaktig med eksempelnavnet. (B) For sammenkoblede sekvenseringsbiblioteker vil to .fastq.gz filer bli brukt. Disse filene skal hete 'SAMPLE-R1.fastq.gz' og 'SAMPLE-R2.fastq.gz' og bør være plassert i en mappe som samsvarer nøyaktig med eksempelnavnet. Alle slike kataloger med navnet SAMPLE skal være plassert i samme overordnede katalog, som brukeren vil gi til SCRAP som "eksempelkatalogen". Klikk her for å se en større versjon av denne figuren.

Figur 2: Andel miRNA:mål-RNA-interaksjoner etter måltype og toppanropsmetoder. Kimær sncRNA:mål-RNA-sekvensering publiserte data fra biblioteker utarbeidet ved hjelp av CLEAR-CLIP (SRR2413277 - SRR2413295)⁹ ble analysert ved hjelp av en modifisert versjon av SCRAP (SCRAP release 2.0) med rRNA-filtrering implementert. Pre-miRNAer, tRNA og rRNA ble filtrert, og distinkte toppanropsinnstillinger ble brukt for 'høy tillit' (minimum 3 leser og 2 biblioteker) og 'alle interaksjoner' (minimum 1 lest og 1 bibliotek). Interaksjoner ble gruppert etter miRNA-familie eller ikke-gruppert. Relative fraksjoner av kimære RNA-avlesninger for kategoriene (CDS, 5' UTR, intergenic, intron, 3'UTR) ble beregnet og grafet. Klikk her for å se en større versjon av denne figuren.

	Alle interaksjoner		Interaksjoner med høy tillit
	Individuelle miRNA	miRNA-familier	Individuelle miRNA	miRNA-familier
CDER	8675	8679	925	1046
5' UTR	338	338	38	43
Intergenisk	2230	2230	320	339
Intron	9522	9519	382	406
3' UTR	6814	6813	548	644
Totalt antall interaksjoner:	31033	31034	4219	4597

Tabell 1: Kimær lesing Antall miRNA: mål-RNA-interaksjoner etter måltype og toppanropsmetode. Kimær sncRNA: RNA-sekvenseringsdata publisert fra biblioteker utarbeidet ved hjelp av CLEAR-CLIP (SRR2413277 - SRR2413295)⁹ ble analysert ved hjelp av en modifisert versjon av SCRAP (SCRAP release 2.0) med rRNA-filtrering implementert. Pre-miRNAer, tRNA og rRNA ble filtrert, og distinkte innstillinger for toppanrop ble brukt for høy konfidens (minimum 3 leser og 2 biblioteker) og alle (minimum 1 lest og 1 bibliotek) interaksjoner, gruppert etter miRNA-familie eller ikke-gruppert. For hver tilstand er antall totalt oppdagede miRNA:mål-RNA-interaksjoner der mål-RNA-interaksjonen ble tilordnet til kategorien kodesekvens (CDS), 5' uoversatt region (5' UTR), intergenisk region, intron eller 3' uoversatt region (3'UTR) oppført.

Potensiell forurensning	Oppdaget som	Årsaker	Potensielle løsninger
Primer dimerer	Interaksjoner oppdaget mellom miRNA hvis sekvens samsvarer med 5'-enden av en forsterkningsprimer og et mål-RNA hvis sekvens samsvarer med resten av primeren.	Feil størrelsesseparasjon (dvs. gelekstraksjon) av PCR-produkt etter forsterkning.	De fleste primer dimerer vil bli ignorert av SCRAP etter adapter fjerning på grunn av sin lille lengde. Hvis de vedvarer, bør du vurdere å legge til primersekvenser i et filter.
rRNA	Interaksjoner mellom vilkårlige miRNA og kjente rRNA eller lncRNA Gm26917 og Gm42418	Ineffektiv isolering (dvs. immunutfelling og gelseparasjon) av argonadekomplekser.	rRNA-filtrering er ofte nødvendig når rRNA-forurensning er rikelig.
tRNA og pre-miRNA	Interaksjoner mellom tRNA-fragmenter som er nedbrytningsprodukter av samme tRNA eller 5p og 3p miRNA produsert fra samme pre-miRNA.	Lav overflod av ekte sncRNA: mål RNA kimærer eller lavt vev Argonaute uttrykk.	tRNA-filtrering og pre-miRNA-filtrering.

Tabell 2: Sekvensering av potensiell kontaminant, avlesninger og løsninger.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Denne protokollen om bruk av SCRAP-rørledning for analyse av sncRNA: mål-RNA-interaksjoner er utformet for å hjelpe etterforskere som inngår beregningsanalyse. Fullføring av opplæringen forventes å veilede etterforskere med beregningserfaring på inngangsnivå eller større beregningserfaring gjennom trinnene som kreves for installasjon og bruk av denne rørledningen og dens applikasjon for å analysere data oppnådd fra kimære RNA-sekvenseringsbiblioteker. Trinn som er kritiske for fullføring av denne protokollen inkluderer korrekt referanseinstallasjon og kjøring av SCRAP, som kan være tidkrevende og kan være kilden til feil, spesielt hvis det ikke ble tatt forsiktighet under installasjon av avhengigheter ved hjelp av Anaconda eller skriving av kommandolinjeargumenter.

Her har spesielt fokus vært på tips og trinn for praktisk bruk av SCRAP-rørledningen for analyse av kimært sncRNA:target RNA-sekvenseringsbibliotek. SCRAP har vist seg å overgå andre kimære RNA-analyseplattformer i påvisning av sncRNA: mål RNA-interaksjoner ^6,13. Dette kan skyldes toppanropsfunksjonen til SCRAP, som ble utviklet spesielt for å oppdage funksjonene (f.eks. 3 'skuldre) som observeres som et resultat av biokjemiske trinn involvert i dannelsen av de kimære RNAene. Andre peak calling-metoder for distinkte biokjemiske tilnærminger, for eksempel nedstrøms for kromatinimmunoprecipitation sequencing (CHIP-seq) applikasjoner, er utviklet for å oppdage topper i data som er symmetrisk fordelt rundt et gjennomsnitt og vanligvis ikke fungerer så bra for å oppdage toppfunksjonene til kimære sncRNA: mål RNA-biblioteker. Brukere kan imidlertid ønske å teste bruken av andre beregningsdatasamlebånd som kan fungere bedre for deres behov, spesielt hvis dataene deres ikke passer til denne beskrivelsen.

Mens SCRAP har minimale maskinvarekrav, skalerer SCRAP kjøretid dårlig med datasettstørrelse. Etterforskere som er utenfor nybegynnernivået, eller som har et stort antall datasett eller datasett med høy sekvenseringsdekning, kan ønske å bruke SCRAP på en måte som kan øke hastigheten på analysetrinnene. Siden store datasett (vanligvis > 1 milliard leser) krever forbedrede fillagringsfunksjoner og lese-/skrivehastigheter for data, kan det være ønskelig å kjøre SCRAP på en HPC-klynge (High-Performance Computing) for analyse av større datasett. En SCRAP-optimalisering, som skal gi parallellisering og forbedret ytelse, vil bli gjort tilgjengelig på GitHub (https://github.com/Meffert-Lab/). Denne oppdaterte versjonen av SCRAP (versjon 2.0) har også forbedrede filtre for rRNA og andre forurensninger.

Som med ethvert grensesnitt, kan brukere uunngåelig støte på vanskeligheter når de bruker kommandolinjegrensesnittet. De vanligste av disse inkluderer stavefeil, feil baner og pakkeinstallasjon/versjonskontroll. Etterforskere anbefales å utvise forsiktighet og unngå skrivefeil når de skriver kommandolinjeargumenter og å reprodusere baner til filer eller mapper nøyaktig (bruk av en "tab" autofullføring kan hjelpe med dette). Avhengigheter for SCRAP administreres via Anaconda, slik at etterforskere er mindre sannsynlig å støte på problemer med pakkeinstallasjon eller versjonsoppdateringer.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne har ingenting å avsløre.

Acknowledgments

Vi takker medlemmer av Meffert-laboratoriet for nyttige diskusjoner, inkludert BH Powell og WT Mills IV, for kritiske tilbakemeldinger om å beskrive installasjonen og implementeringen av rørledningen. Dette arbeidet ble støttet av en Braude Foundation-pris, Maryland Stem Cell Research Fund Launch Program, Blaustein Endowment for Pain Research and Education-prisen, og NINDS RO1NS103974 og NIMH RO1MH129292 til MKM.

Materials

Name	Company	Catalog Number	Comments
Genomes	UCSC Genome browser	N/A	https://genome.ucsc.edu/ or https://www.ncbi.nlm.nih.gov/data-hub/genome/
Linux	Linux	Ubuntu 20.04 or 22.04 LTS recommended
Mac	Apple	Mac OSX (>11)
Platform setup	GitHub	N/A	https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md]
SCRAP pipeline	GitHub	N/A	https://github.com/Meffert-Lab/SCRAP
Unix shell	Unix operating system	bash >=5.0
Unix shell	Unix operating system	zsh (5.9 recommended)
Windows	Windows	WSL Ubuntu 20.04 or 22.04 LTS

DOWNLOAD MATERIALS LIST

References

Morris, K. V., Mattick, J. S. The rise of regulatory RNA. Nature Reviews Genetics. 15 (6), 423-437 (2014).
Li, X., Jin, D. S., Eadara, S., Caterina, M. J., Meffert, M. K. Regulation by noncoding RNAs of local translation, injury responses, and pain in the peripheral nervous system. Neurobiology of Pain (Cambridge, Mass.). 13, 100119 (2023).
Shi, J., Zhou, T., Chen, Q. Exploring the expanding universe of small RNAs. Nature Cell Biology. 24 (4), 415-423 (2022).
Broughton, J. P., Lovci, M. T., Huang, J. L., Yeo, G. W., Pasquinelli, A. E. Pairing beyond the seed supports microRNA targeting specificity. Molecular Cell. 64 (2), 320-333 (2016).
Grosswendt, S., et al. Unambiguous identification of miRNA:target site interactions by different types of ligation reactions. Molecular Cell. 54 (6), 1042-1054 (2014).
Mills, W. T., Eadara, S., Jaffe, A. E., Meffert, M. K. SCRAP: a bioinformatic pipeline for the analysis of small chimeric RNA-seq data. RNA. 29 (1), 1-17 (2023).
Helwak, A., Kudla, G., Dudnakova, T., Tollervey, D. Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding. Cell. 153 (3), 654-665 (2013).
Hoefert, J. E., Bjerke, G. A., Wang, D., Yi, R. The microRNA-200 family coordinately regulates cell adhesion and proliferation in hair morphogenesis. Journal of Cell Biology. 217 (6), 2185-2204 (2018).
Moore, M. J., Zhang, C., Gantman, E. C., Mele, A., Darnell, J. C., Darnell, R. B. Mapping Argonaute and conventional RNA-binding protein interactions with RNA at single-nucleotide resolution using HITS-CLIP and CIMS analysis. Nature Protocols. 9 (2), 263-293 (2014).
Bjerke, G. A., Yi, R. Integrated analysis of directly captured microRNA targets reveals the impact of microRNAs on mammalian transcriptome. RNA. 26 (3), 306-323 (2020).
Reuter, J. S., Mathews, D. H. RNAstructure: software for RNA secondary structure prediction and analysis. BMC Bioinformatics. 11 (1), 129 (2010).
Moore, M. J., et al. miRNA-target chimeras reveal miRNA 3′-end pairing as a major determinant of Argonaute target specificity. Nature Communications. 6 (1), 8864 (2015).
Travis, A. J., Moody, J., Helwak, A., Tollervey, D., Kudla, G. Hyb: a bioinformatics pipeline for the analysis of CLASH (crosslinking, ligation and sequencing of hybrids) data. Methods (San Diego, Calif.). 65 (3), 263-273 (2014).

Biology

Opplæring i beregningsanalyse for kimært lite ikke-kodende RNA: Mål-RNA-sekvenseringsbiblioteker

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.