Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Computational Analysis Tutorial for Chimeric Small Noncoding RNA: Target RNA Sequencing Libraries

Published: December 1, 2023 doi: 10.3791/65779

Summary

Her præsenterer vi en protokol, der demonstrerer installation og anvendelse af en bioinformatikrørledning til analyse af kimære RNA-sekventeringsdata, der anvendes i undersøgelsen af in vivo RNA: RNA-interaktioner.

Abstract

En forståelse af in vivo-genregulatoriske interaktioner mellem små ikke-kodende RNA'er (sncRNA'er), såsom mikroRNA'er (miRNA'er), med deres mål-RNA'er er blevet avanceret i de senere år ved biokemiske tilgange, der bruger tværbinding efterfulgt af ligering til at fange sncRNA: mål-RNA-interaktioner gennem dannelsen af kimære RNA'er og efterfølgende sekventeringsbiblioteker. Mens datasæt fra kimær RNA-sekventering giver genomdækkende og væsentligt mindre tvetydigt input end miRNA-forudsigelsessoftware, kræver destillering af disse data til meningsfuld og handlingsbar information yderligere analyser og kan afskrække efterforskere, der mangler en beregningsmæssig baggrund. Denne rapport indeholder en vejledning til at støtte beregningsbiologer på begynderniveau i installation og anvendelse af et nyligt open source-softwareværktøj: Small Chimeric RNA Analysis Pipeline (SCRAP). Der gives platformskrav, opdateringer og en forklaring af pipelinetrin og manipulation af vigtige brugerinputvariabler. At reducere en barriere for biologer til at få indsigt fra kimære RNA-sekventeringsmetoder har potentialet til at springbræt opdagelsesbaserede undersøgelser af regulatoriske sncRNA: mål-RNA-interaktioner i flere biologiske sammenhænge.

Introduction

Små ikke-kodende RNA'er studeres stærkt for deres posttranskriptionelle roller i koordinering af ekspression fra suiter af gener i forskellige processer såsom differentiering og udvikling, signalbehandling og sygdom 1,2,3. Evnen til nøjagtigt at bestemme måltranskripterne af genregulerende små ikke-kodende RNA'er (sncRNA'er), herunder mikroRNA'er (miRNA'er), er af betydning for studier af RNA-biologi på både grundlæggende og translationelt niveau. Bioinformatiske algoritmer, der udnytter forventet komplementaritet mellem miRNA-frøsekvensen og dens potentielle mål, er ofte blevet brugt til forudsigelse af miRNA:target RNA-interaktioner. Mens disse bioinformatiske algoritmer har været vellykkede, kan de også have både falske positive og falske negative resultater, som det er blevet gennemgået andetsteds 4,5,6. For nylig er flere biokemiske tilgange blevet designet og implementeret, der tillader entydig og semikvantitativ bestemmelse af in vivo sncRNA: mål-RNA-interaktioner ved in vivo-tværbinding og efterfølgende inkorporering af et ligeringstrin for fysisk at fastgøre sncRNA'et til dets mål for at danne et enkelt kimært RNA 4,5,7,8,9,10 . Efterfølgende forberedelse af sekventeringsbiblioteker fra de kimære RNA'er muliggør vurdering af sncRNA:target RNA-interaktionerne ved beregningsmæssig behandling af sekventeringsdataene. Denne video indeholder en vejledning til installation og brug af en beregningspipeline kaldet small chimeric RNA analysis pipeline (SCRAP), som er designet til at muliggøre robust og reproducerbar analyse af sncRNA:target RNA-interaktioner fra kimære RNA-sekventeringsbiblioteker6.

Et mål med denne tutorial er at hjælpe efterforskere med at undgå overdreven afhængighed af rent prædiktive bioinformatiske algoritmer ved at sænke barrierer for analyse af data genereret gennem biokemiske tilgange, der giver kimære molekylære aflæsninger af sncRNA: mål-RNA-interaktioner. Denne vejledning giver praktiske trin og tip til at guide beregningsforskere på indgangsniveau gennem brugen af en rørledning, SCRAP, udviklet til analyse af kimære RNA-sekventeringsdata, som kan genereres af flere eksisterende biokemiske protokoller, herunder tværbinding, ligering og sekventering af hybrider (CLASH) og kovalent ligering af endogene argonautbundne RNA'er- tværbinding og immunudfældning (CLEAR-CLIP)7,9.

Anvendelsen af SCRAP giver flere fordele til analyse af kimære RNA-sekventeringsdata sammenlignet med andre beregningsrørledninger6. En fremtrædende fordel er dens omfattende annotering og inkorporeringen af call-outs til velunderstøttede og rutinemæssigt opdaterede bioinformatiske scripts i pipelinen sammenlignet med alternative pipelines, der ofte er afhængige af brugerdefinerede og / eller ikke-understøttede scripts til trin i pipelinen. Denne funktion giver stabilitet til SCRAP, hvilket gør det mere umagen værd for forskere at gøre sig bekendt med rørledningen og indarbejde dens anvendelse i deres arbejdsgang. SCRAP har også vist sig at overgå alternative rørledninger ved at kalde toppe af sncRNA: target RNA-interaktioner og at have funktionalitet på tværs af platforme, som beskrevet i en tidligere publikation6.

Ved afslutningen af dette selvstudium vil brugerne være i stand til at (i) kende platformskrav til SCRAP og installere SCRAP-pipelines, (ii) installere referencegenomer og konfigurere kommandolinjeparametre for SCRAP og (iii) forstå kriterier for spidsbelastningsopkald og udføre spidsbelastningsopkald og spidsbelastning.

Denne video beskriver i praktiske detaljer, hvordan forskere, der studerer RNA-biologi, kan installere og optimalt bruge beregningsrørledningen, SCRAP, til at analysere sncRNA-interaktioner med mål-RNA'er, såsom messenger-RNA'er, i kimære RNA-sekventeringsdata opnået gennem en af de diskuterede biokemiske tilgange til sekventeringsbiblioteksforberedelse.

SCRAP er et kommandolinjeværktøj. Generelt skal brugeren efter vejledningen nedenfor (i) downloade og installere SCRAP (https://github.com/Meffert-Lab/SCRAP), (ii) installere referencegenomer og køre SCRAP og (iii) udføre peak calling og annotation.

Yderligere oplysninger om beregningstrinnene i denne procedure findes på https://github.com/Meffert-Lab/SCRAP. Denne artikel indeholder opsætnings- og baggrundsoplysninger, der giver efterforskere med beregningsfærdigheder på begynderniveau mulighed for at installere, optimere og bruge SCRAP på kimære RNA-sekventeringsbiblioteksdatasæt.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

BEMÆRK: Protokollen begynder med at downloade og installere software, der kræves for at analysere kimære RNA-sekventeringsbiblioteker ved hjælp af SCRAP.

1. Installation

  1. Før du installerer SCRAP, skal du installere afhængighederne Git og Miniconda på den maskine, der skal bruges til analyserne. Git er sandsynligvis allerede installeret. På Mac OSX-platformen skal du for eksempel kontrollere dette ved hjælp af hvilken git for at se, at " git " -værktøjet er til stede og installeret i denne mappe. Kontroller, om Miniconda er installeret ved hjælp af hvilken conda. Hvis der ikke returneres noget, skal du installere Miniconda. Miniconda kræver 400 MB diskplads for at installere.
    1. Der er et par metoder til at installere Miniconda, og de adskiller sig fra platform til platform. Se PLATFORM-SETUP markdown-filen på Meffert Lab GitHub-lageret [https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md], hvor der er yderligere instruktioner til installation på Windows, MacOS og Ubuntu. For Linux-brugere har Linux sin egen standardpakkehåndtering (apt). I det tilfælde, der er specifikt for denne undersøgelse, skal du bruge kommandoen bryg installer Miniconda til at installere Miniconda ved hjælp af en eksisterende pakkehåndtering, bryg.
      BEMÆRK: 'Homebrew', kaldet 'brew' er et open source-softwarepakkehåndteringssystem, der forenkler installationen af software på Apples operativsystem, macOS.
    2. Hvis conda installeres for første gang, skal du køre conda init for den bestemte skal, der er i brug. I eksemplet her er den skal, der er i brug, zsh. Luk derefter og åbn skallen igen. Hvis conda blev installeret korrekt, vil basismiljøet , der er aktiveret i terminalsessionen, blive set.
  2. Download SCRAP-kilden, og installer dens afhængigheder.
    1. Den foretrukne metode til opnåelse af SCRAP-kilde er at bruge Git. Få adgang til dette ved at køre git clone https://github.com/Meffert-Lab/SCRAP for at få den nyeste kopi af kildekoden.
    2. Installer mamba, en forbedret pakkeløser til conda, og installer alle afhængigheder for SCRAP fra SCRAP_environment.yml til sit eget conda-miljø ved hjælp af følgende kommandoer:
      conda installere -n base conda-smede::mamba
      mamba env oprette -f SCRAP/SCRAP_environment.yml -n SKROT
  3. Kør derefter referenceinstallationen for SCRAP. De argumenter, der anvendes i referenceinstallationen, vil være specifikke for organismen, hvis sncRNA-mRNA-interaktioner analyseres.
    bash SCRAP / bin / Reference_Installation.sh -r fuld / sti / til / skrotte / -m har -g hg38 -s menneske
    1. Angiv mappen for SCRAP-kildemappen til referenceinstallation. Installationstrin udføres derefter ved hjælp af filerne i fasta - og annotationsmapperne . Angiv den fulde sti uden stenografi. Afslut med en skråstreg.
    2. Se tabellerne i README.md for de korrekte miRbase-artsforkortelser. De opdaterede referencegenomer kan findes på https://genome.ucsc.edu/ eller https://www.ncbi.nlm.nih.gov/data-hub/genome/. I dette eksempel vil hg38 blive brugt til musens GRCm38-genom.
    3. De aktuelt inkluderede arter til annotering er menneske, mus og orm. Få vist de tilsvarende species.annotation.bed-filer i annotationsmappen i kildemappen SCRAP. Hvis der ønskes brug af en anden art til analyse, skal du angive en annotation.bed-fil, der følger det samme navngivningsskema species.annotation.bed.

2. Kørsel af SCRAP

  1. Nu hvor afhængighederne og SCRAP er installeret, - kør scriptet SCRAP.sh
    bash SCRAP / bin / SCRAP.sh -d fuld / sti / til / CLASH_Human / -a fuld / sti / til / CLASH_Human / CLASH_Human_Adapters.txt -p nej -f ja -r fuld / sti / til / skrot / -m har -g hg38
    1. Angiv hele stien til eksempelmapperne uden stenografi. Formatér eksempelmapperne med mappenavnet, der svarer nøjagtigt til eksempelnavnet, som vist i figur 1.
    2. Bemærk, at stien på listen er stien til den mappe, der indeholder alle eksempelmapperne, ikke stien til en individuel eksempelmappe eller en eksempelfil (se kommandolinjen i trin 2.1).
    3. Angiv derefter hele stien til adapterfilen. Sørg for, at eksempelnavnene i adapterfilen stemmer overens med de tidligere nævnte mappenavne og filnavne (se kommandolinjen i trin 2.1).
    4. Angiv, om prøverne er parret, og om filtrering for pre-miRNA'er og/eller tRNA'er vil blive udført. Tilføj et filter til rRNA-rensning, hvis det ønskes (se kommandolinjen i trin 2.1).
      BEMÆRK: Brugerne kan beslutte at bruge disse filtre afhængigt af eksempeltyperne og eksperimentelle mål. Afhængigt af det eksperimentelle design kan pre-miRNA'er, tRNA'er og rRNA'er forbruge tilgængelig sekventeringsdybde for ægte sncRNA: mål-RNA-kimærer, og brugere kan anvende filtre til at udelukke dem. Brugere vil dog muligvis undgå sådan filtrering under visse omstændigheder (f.eks. Kortlægning af sncRNA-mål til mitokondriegenomet, som indeholder mitokondrie rRNA'er).
    5. Angiv derefter hele stien til referencemappen, miRbase-forkortelsen og referencegenomforkortelsen (se kommandolinjen i trin 2.1).
      BEMÆRK: Det kan tage et par timer at fuldføre scriptet, afhængigt af datasættets størrelse og CPU'en på den computer, der bruges.

3. Peak opkald og annotering

  1. Når SCRAP er færdig med at køre, skal du kontrollere, at outputtet blandt andet indeholder en SAMPLE.aligned.unique.bam-fil. Dette er en binær fil, der indeholder justeringer af mål-RNA'er på det brugerleverede referencegenom.
  2. Udfør nu spidsbelastningsopkald ved at køre Peak_Calling.sh.
    bash SCRAP/bin/Peak_Calling.sh -d CLASH_Human/ -a CLASH_Human/CLASH_Human_Adapters.txt -c 3 -l 2 -f no -r SCRAP/ -m has -g hg38
    BEMÆRK: Peak calling er en funktion i SCRAP, som er designet til at give forskere mulighed for let at evaluere de mest robuste og reproducerbare små ikke-kodende RNA: mål-RNA-interaktioner inden for deres kimære RNA-biblioteker. Denne funktion kan for eksempel hjælpe forskere med at identificere interaktioner, som de måske ønsker at vælge til yderligere undersøgelse. Trin 3.2.2 nedenfor beskriver, hvordan brugeren indstiller de kriterier, som de ønsker at blive brugt til at definere den stringens, hvormed en top kaldes - dette inkluderer antallet af unikke interaktioner eller sekventeringslæsninger, der skal have fundet sted for at toppen kan kaldes, samt antallet af biblioteker, hvor denne særlige interaktion skal have fundet sted.
    1. Angiv igen de fulde stier til den mappe, der indeholder eksempelmapperne og adapterfilen (se kommandolinjen i trin 3.2).
    2. Indstil derefter det mindste antal sekventeringslæsninger, der kræves for at en top kan kaldes (se kommandolinjen i trin 3.2).
    3. Angiv det mindste antal forskellige sekventeringsbiblioteker, der skal indeholde et toppunkt, for at det kan kaldes (se kommandolinjen i trin 3.2).
      BEMÆRK: Valget af værdier for både 3.2.2 og 3.2.3 afhænger af arten af de sekventerede prøver og antallet af prøver eller prøvetyper. Her kræves mindst 3 kimære sekventeringslæsninger i en prøve for at kalde en top, og toppen skal understøttes af mindst 2 prøver. En investigator, der evaluerer et datasæt, hvor der er mange sekventeringsbiblioteksreplikationer for en given tilstand, kan f.eks. beslutte at kræve tilstedeværelsen af læsningerne i et større antal prøvesekventeringsbiblioteker.
    4. Angiv, om sncRNA'er af samme familie skal bidrage til den samme top. For eksempel, da miRNA'er af samme familie deler frøsekvenser, kan disse miRNA'er binde delte og overlappende sæt genmål; En bruger ønsker måske at identificere en families fulde indvirkning på disse mål ved at vurdere deres kollektive toppe (se kommandolinjen i trin 3.2).
    5. Angiv derefter den fulde sti til referencemappen, miRBase-forkortelsen og referencegenomforkortelsen (se kommandolinjen i trin 3.2).
  3. Når spidsbelastningsopkald er fuldført, skal du køre peak-annotering.
    bash SCRAP / skraldespand / Peak_Annotation.sh -p CLASH_Human / toppe.bed -r SCRAP / -s menneske
    1. Angiv den fulde sti til den resulterende peaks.bed-fil (eller peaks.family.bed ) fra peakcalling, den fulde sti til referencemappen og den ønskede art til annotering.

4. Visualisering af dataene

BEMÆRK: Alle trin til analyse ved hjælp af SCRAP er nu afsluttet. Til visualisering af dataene anbefales flere tilgange:

  1. Flet alle de .bam-filer (binær SAM-fil), der ønskes at visualisere sammen (samtools flette).
  2. Sorter den resulterende flettede .bam-fil (samtools sort). Filindholdet sorteres linje for linje, så samtools kan indeksere.
  3. Indekser den sorterede .bam-fil (samtools-indeks). En BAI (binær samtools format index) fil genereres for at tillade visualisering i integrativ genomics viewer (IGV).
  4. Til sidst skal du åbne den resulterende sorterede .bam- og indekserede .bai-fil i IGV.
    BEMÆRK: SncRNA: Target RNA-interaktioner af interesse kan prioriteres til opfølgning på en række undersøgelsesspecifikke måder. En generisk indledende tilgang er at vurdere de interaktioner, for hvilke toppe understøttes af de mest kimære sekventeringslæsninger. Interaktioner af interesse kan også visualiseres ved hjælp af DuplexFold-webserveren fra RNA-strukturpakken ved at indtaste sekvensen for både sncRNA og mål-RNA'et fra den detekterede interaktion11. For hver top kan kromosomet (første kolonne) og genomiske koordinater (start: 1. kolonne slut: 2. kolonne) findes i den peaks.bed.species.annotation.txt fil, der genereres i peak annotation. Især for miRNA'er, mens reproducerbare og funktionelle interaktioner kan mangle omfattende frømatchet binding (f.eks. kan interaktioner bruge 3'-kompenserende binding), kan tilstedeværelsen af frømatchede steder i et kognitivt bindingsmotiv af mål-RNA'et ikke desto mindre vurderes som et validerende træk ved funktionelt vigtige detekterede interaktioner 4,12. Understøttende databehandling kan omfatte sammenligninger af differentiel læsedækning mellem toppe under forskellige biologiske forhold og potentielt vurdering af klyngedannelse af regulerede gener i veje ved hjælp af et vejanalyseværktøj.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Resultater for sncRNA:target RNA detekteret af en modificeret version af SCRAP (SCRAP release 2.0, som implementerer modifikationer til rRNA-filtrering) på tidligere offentliggjorte sekventeringsdatasæt udarbejdet ved hjælp af CLEAR-CLIP9 er vist i figur 2 og tabel 1. Brugere kan sætte pris på faldet i de relative fraktion miRNA-interaktioner med intronregioner, der opstår efter isolering af højtillidsinteraktioner ved peak calling i SCRAP. Yderligere data fra analyser, der anvender SCRAP, er også tilgængelige i den første offentliggørelse af denne pipeline6. Afhængigt af den eksperimentelle tilgang kan filtrering af sekventeringsdata fra forberedte kimære RNA-biblioteker være påkrævet for at reducere artefakter i resultaterne. Suboptimal biokemisk forberedelse af sekventeringsbiblioteket og/eller suboptimal filtrering af sekventeringsdataene har potentialet til at resultere i forkert inkludering af aflæsninger, der ikke opstod ved ligering af sncRNA'er og mål-RNA'er bundet af Argonaute. Disse kunstige aflæsninger kan omfatte primerdimerer eller adapterdimerer, rRNA'er og pre-miRNA'er. Tabel 2 beskriver mulige artefakter, der kan påvises i resultaterne, og mulige løsninger.

Figure 1
Figur 1: Formatering til datamapper. Filer, der indeholder rå læsninger for hvert sekventeringsbibliotek, skal leveres i .fastq.gz format. (A) Hvis bibliotekerne ikke er parret, vil en enkelt .fastq.gz fil blive brugt i analysen. Denne fil skal navngives 'SAMPLE.fastq.gz', hvor SAMPLE er det nøjagtige eksempelnavn, som brugeren har angivet i adapterfilen. Filen skal være indeholdt i en mappe, der matcher eksempelnavnet nøjagtigt. (B) Til parrede sekventeringsbiblioteker bruges to .fastq.gz filer. Disse filer skal navngives 'SAMPLE-R1.fastq.gz' og 'SAMPLE-R2.fastq.gz' og skal placeres i en mappe, der matcher eksempelnavnet nøjagtigt. Alle sådanne mapper med navnet SAMPLE skal være placeret i den samme overordnede mappe, som brugeren vil give til SCRAP som "eksempelmappe". Klik her for at se en større version af denne figur.

Figure 2
Figur 2: Andel af miRNA:target RNA interaktioner efter Target Type og Peak Calling metoder. Chimeric sncRNA: target RNA-sekventering publicerede data fra biblioteker udarbejdet ved hjælp af CLEAR-CLIP (SRR2413277 - SRR2413295)9 blev analyseret ved hjælp af en modificeret version af SCRAP (SCRAP release 2.0) med rRNA-filtrering implementeret. Pre-miRNA'er, tRNA'er og rRNA'er blev filtreret, og forskellige peak-opkaldsindstillinger blev brugt til 'høj tillid' (minimum 3 læsninger og 2 biblioteker) og 'alle interaktioner' (minimum 1 læsning og 1 bibliotek). Interaktioner blev grupperet efter miRNA-familie eller ugrupperet. Relative fraktioner af kimære RNA-læsninger for kategorierne (CDS, 5' UTR, intergen, intron, 3'UTR) blev beregnet og graferet. Klik her for at se en større version af denne figur.

Alle interaktioner Interaktioner med høj tillid
Individuelle miRNA'er miRNA-familier Individuelle miRNA'er miRNA-familier
CD'ER 8675 8679 925 1046
5' UTR 338 338 38 43
Intergen 2230 2230 320 339
Intron 9522 9519 382 406
3' UTR 6814 6813 548 644
Interaktioner i alt: 31033 31034 4219 4597

Tabel 1: Chimeric read Counts of miRNA:target RNA Interactions by Target Type and Peak Calling Method. Chimeric sncRNA: target RNA-sekventeringsdata offentliggjort fra biblioteker udarbejdet ved hjælp af CLEAR-CLIP (SRR2413277 - SRR2413295)9 blev analyseret ved hjælp af en modificeret version af SCRAP (SCRAP release 2.0) med rRNA-filtrering implementeret. Pre-miRNA'er, tRNA'er og rRNA'er blev filtreret, og forskellige peak-opkaldsindstillinger blev brugt til høj tillid (minimum 3 læsninger og 2 biblioteker) og alle (minimum 1 læsning og 1 bibliotek) interaktioner, grupperet efter miRNA-familie eller ugrupperet. For hver tilstand er antallet af samlede detekterede miRNA:target RNA-interaktioner, hvor mål-RNA-interaktionen blev kortlagt til kategorien kodende sekvens (CDS), 5' uoversat region (5' UTR), intergen region, intron eller 3' uoversat region (3'UTR) angivet.

Potentiel forurening Registreret som Årsager Potentielle løsninger
Primer dimerer Interaktioner detekteret mellem miRNA'er, hvis sekvens matcher 5'-enden af en amplifikationsprimer og et mål-RNA, hvis sekvens matcher resten af primeren. Forkert størrelsesadskillelse (dvs. gelekstraktion) af PCR-produkt efter amplifikation. De fleste primerdimerer vil blive ignoreret af SCRAP efter fjernelse af adapteren på grund af deres lille længde. Hvis de vedvarer, kan du overveje at tilføje primersekvenser til et filter.
rRNA'er Interaktioner mellem vilkårlige miRNA'er og kendte rRNA'er eller lncRNA'er Gm26917 og Gm42418 Ineffektiv isolering (dvs. immunudfældning og gelseparation) af Argonaut-komplekser. rRNA-filtrering er ofte nødvendig, når rRNA-forurening er rigelig.
tRNA'er og pre-miRNA'er Interaktioner mellem tRNA-fragmenter, der er nedbrydningsprodukter af det samme tRNA eller 5p og 3p miRNA'er produceret fra det samme pre-miRNA. Lav forekomst af ægte sncRNA:target RNA kimærer eller lavt væv argonaute ekspression. tRNA-filtrering og pre-miRNA-filtrering.

Tabel 2: Potentielle forureningssekventeringslæsninger og opløsninger.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Denne protokol om brugen af SCRAP-pipeline til analyse af sncRNA:target RNA-interaktioner er designet til at hjælpe efterforskere, der indgår i beregningsanalyse. Afslutningen af selvstudiet forventes at guide efterforskere med entry-level eller større beregningserfaring gennem de trin, der kræves til installation og brug af denne pipeline og dens anvendelse til at analysere data opnået fra kimære RNA-sekventeringsbiblioteker. Trin, der er kritiske for færdiggørelsen af denne protokol, omfatter korrekt referenceinstallation og kørsel af SCRAP, hvilket kan være tidskrævende og kan være kilden til fejl, især hvis der ikke blev taget omhu under installationen af afhængigheder ved hjælp af Anaconda eller indtastning af kommandolinjeargumenter.

Her har der især været fokus på tips og trin til praktisk anvendelse af SCRAP-pipelinen til analyse af kimære sncRNA:target RNA-sekventeringsbiblioteker. SCRAP har vist sig at overgå andre kimære RNA-analyseplatforme i påvisning af sncRNA: mål-RNA-interaktioner 6,13. Dette kan skyldes peak call-funktionen i SCRAP, som blev udviklet specielt til at detektere de funktioner (f.eks. 3' skulder), der observeres som et resultat af biokemiske trin involveret i dannelsen af de kimære RNA'er. Andre peak calling metoder til forskellige biokemiske tilgange, såsom nedstrøms for kromatin immunudfældning sekventering (CHIP-seq) applikationer, er blevet udviklet til at detektere toppe i data, der er symmetrisk fordelt omkring et gennemsnit og typisk ikke fungerer så godt til at detektere topfunktionerne i kimære sncRNA: target RNA biblioteker. Brugere kan dog ønske at teste brugen af andre beregningsrørledninger, der kunne fungere bedre til deres behov, især hvis deres data ikke passer til denne beskrivelse.

Mens SCRAP har minimale hardwarekrav, skaleres SCRAP-runtime dårligt med datasætstørrelsen. Efterforskere, der er uden for begynderniveauet, eller som har et omfattende antal datasæt eller datasæt med høj sekventeringsdækning, ønsker måske at bruge SCRAP på en måde, der kan fremskynde analysetrinnene. Da store datasæt (normalt > 1 milliard læsninger) kræver forbedrede fillagringsfunktioner og læse-/skrivehastigheder for data, kan det være ønskeligt at køre SCRAP på en HPC-klynge (High-Performance Computing) til analyse af større datasæt. En SCRAP-optimering, som skal give parallelisering og forbedret ydeevne, vil blive gjort tilgængelig på GitHub (https://github.com/Meffert-Lab/). Denne opdaterede version af SCRAP (release 2.0) har også forbedrede filtre til rRNA og andre forurenende stoffer.

Som med enhver grænseflade kan brugerne uundgåeligt støde på vanskeligheder, når de bruger kommandolinjegrænsefladen. De mest almindelige af disse omfatter stavefejl, forkerte stier og pakkeinstallation/versionering. Efterforskere rådes til at udvise forsigtighed og undgå stavefejl, når de skriver kommandolinjeargumenter og at gengive stier til filer eller mapper nøjagtigt (brug af en 'fane' autofuldførelse kan hjælpe med dette). Afhængigheder for SCRAP administreres via Anaconda, så efterforskere er mindre tilbøjelige til at støde på problemer med pakkeinstallation eller versionsopdateringer.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne har intet at afsløre.

Acknowledgments

Vi takker medlemmer af Meffert-laboratoriet for nyttige diskussioner, herunder BH Powell og WT Mills IV, for kritisk feedback om beskrivelse af installationen og implementeringen af rørledningen. Dette arbejde blev støttet af en Braude Foundation-pris, Maryland Stem Cell Research Fund Launch Program, Blaustein Endowment for Pain Research and Education award og NINDS RO1NS103974 og NIMH RO1MH129292 til M.K.M.

Materials

Name Company Catalog Number Comments
Genomes UCSC Genome browser N/A https://genome.ucsc.edu/ or https://www.ncbi.nlm.nih.gov/data-hub/genome/
Linux Linux Ubuntu 20.04 or 22.04 LTS recommended
Mac Apple Mac OSX (>11)
Platform setup GitHub N/A https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md]
SCRAP pipeline GitHub N/A https://github.com/Meffert-Lab/SCRAP
Unix shell Unix operating system bash >=5.0
Unix shell Unix operating system zsh (5.9 recommended)
Windows Windows WSL Ubuntu 20.04 or 22.04 LTS

DOWNLOAD MATERIALS LIST

References

  1. Morris, K. V., Mattick, J. S. The rise of regulatory RNA. Nature Reviews Genetics. 15 (6), 423-437 (2014).
  2. Li, X., Jin, D. S., Eadara, S., Caterina, M. J., Meffert, M. K. Regulation by noncoding RNAs of local translation, injury responses, and pain in the peripheral nervous system. Neurobiology of Pain (Cambridge, Mass.). 13, 100119 (2023).
  3. Shi, J., Zhou, T., Chen, Q. Exploring the expanding universe of small RNAs. Nature Cell Biology. 24 (4), 415-423 (2022).
  4. Broughton, J. P., Lovci, M. T., Huang, J. L., Yeo, G. W., Pasquinelli, A. E. Pairing beyond the seed supports microRNA targeting specificity. Molecular Cell. 64 (2), 320-333 (2016).
  5. Grosswendt, S., et al. Unambiguous identification of miRNA:target site interactions by different types of ligation reactions. Molecular Cell. 54 (6), 1042-1054 (2014).
  6. Mills, W. T., Eadara, S., Jaffe, A. E., Meffert, M. K. SCRAP: a bioinformatic pipeline for the analysis of small chimeric RNA-seq data. RNA. 29 (1), 1-17 (2023).
  7. Helwak, A., Kudla, G., Dudnakova, T., Tollervey, D. Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding. Cell. 153 (3), 654-665 (2013).
  8. Hoefert, J. E., Bjerke, G. A., Wang, D., Yi, R. The microRNA-200 family coordinately regulates cell adhesion and proliferation in hair morphogenesis. Journal of Cell Biology. 217 (6), 2185-2204 (2018).
  9. Moore, M. J., Zhang, C., Gantman, E. C., Mele, A., Darnell, J. C., Darnell, R. B. Mapping Argonaute and conventional RNA-binding protein interactions with RNA at single-nucleotide resolution using HITS-CLIP and CIMS analysis. Nature Protocols. 9 (2), 263-293 (2014).
  10. Bjerke, G. A., Yi, R. Integrated analysis of directly captured microRNA targets reveals the impact of microRNAs on mammalian transcriptome. RNA. 26 (3), 306-323 (2020).
  11. Reuter, J. S., Mathews, D. H. RNAstructure: software for RNA secondary structure prediction and analysis. BMC Bioinformatics. 11 (1), 129 (2010).
  12. Moore, M. J., et al. miRNA-target chimeras reveal miRNA 3′-end pairing as a major determinant of Argonaute target specificity. Nature Communications. 6 (1), 8864 (2015).
  13. Travis, A. J., Moody, J., Helwak, A., Tollervey, D., Kudla, G. Hyb: a bioinformatics pipeline for the analysis of CLASH (crosslinking, ligation and sequencing of hybrids) data. Methods (San Diego, Calif.). 65 (3), 263-273 (2014).

Tags

Denne måned i JoVE nummer 202
Computational Analysis Tutorial for Chimeric Small Noncoding RNA: Target RNA Sequencing Libraries
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Eadara, S., Li, X., Eiss, E. A.,More

Eadara, S., Li, X., Eiss, E. A., Meffert, M. K. Computational Analysis Tutorial for Chimeric Small Noncoding RNA: Target RNA Sequencing Libraries. J. Vis. Exp. (202), e65779, doi:10.3791/65779 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter