Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

En bioinformatikkrørledning for undersøkelse av molekylær evolusjon og genuttrykk ved hjelp av RNA-seq

Published: May 28, 2021 doi: 10.3791/61633

Summary

Formålet med denne protokollen er å undersøke utviklingen og uttrykket av kandidatgener ved hjelp av RNA-sekvenseringsdata.

Abstract

Destillering og rapportering av store datasett, for eksempel hele genom- eller transkripsjonsdata, er ofte en skremmende oppgave. En måte å bryte ned resultatene på er å fokusere på en eller flere genfamilier som har betydning for organismen og studien. I denne protokollen skisserer vi bioinformatiske trinn for å generere en fylogeni og for å kvantifisere uttrykket av gener av interesse. Fylogenetiske trær kan gi innsikt i hvordan gener utvikler seg i og mellom arter, samt avdekke ortologi. Disse resultatene kan forbedres ved hjelp av RNA-seq data for å sammenligne uttrykket av disse genene i forskjellige individer eller vev. Studier av molekylær evolusjon og uttrykk kan avdekke former for evolusjon og bevaring av genfunksjon mellom arter. Karakteriseringen av en genfamilie kan fungere som et springbrett for fremtidige studier og kan fremheve en viktig genfamilie i et nytt genom eller transkripsjonspapir.

Introduction

Fremskritt innen sekvenseringsteknologier har lagt til rette for sekvensering av genomer og transkripsjoner av ikke-modellorganismer. I tillegg til den økte muligheten for sekvensering av DNA og RNA fra mange organismer, er en overflod av data offentlig tilgjengelig for å studere gener av interesse. Formålet med denne protokollen er å gi bioinformatiske trinn for å undersøke molekylær evolusjon og uttrykk for gener som kan spille en viktig rolle i interesseorganismen.

Å undersøke utviklingen av et gen eller en genfamilie kan gi innsikt i utviklingen av biologiske systemer. Medlemmer av en genfamilie bestemmes vanligvis ved å identifisere bevarte motiver eller homologe gensekvenser. Genfamilieutvikling ble tidligere undersøkt ved hjelp av genomer fra fjernt beslektede modellorganismer1. En begrensning i denne tilnærmingen er at det ikke er klart hvordan disse genfamiliene utvikler seg i nært beslektede arter og rollen til ulike miljøselektive press. I denne protokollen inkluderer vi et søk etter homologer i nært beslektede arter. Ved å generere en fylogeni på et fylumsnivå, kan vi merke oss trender i genfamilieutvikling som for konserverte gener eller avledningsspesifikke dupliseringer. På dette nivået kan vi også undersøke om gener er ortologer eller paraloger. Mens mange homologer sannsynligvis fungerer på samme måte som hverandre, er det ikke nødvendigvis tilfelle2. Å inkorporere fylogenetiske trær i disse studiene er viktig for å løse om disse homologe genene er ortologer eller ikke. I eukaryoter beholder mange ortologer lignende funksjoner i cellen som det fremgår av pattedyrproteiners evne til å gjenopprette funksjonen til gjær ortologer3. Det er imidlertid tilfeller der et ikke-ortopedisk gen utfører en karakterisert funksjon4.

Fylogenetiske trær begynner å avgrense sammenhenger mellom gener og arter, men funksjonen kan ikke tildeles utelukkende basert på genetiske relasjoner. Genuttrykksstudier kombinert med funksjonelle merknader og berikelsesanalyse gir sterk støtte til genfunksjon. Tilfeller der genuttrykk kan kvantifiseres og sammenlignes på tvers av individer eller vevstyper, kan være mer fortellende om potensiell funksjon. Følgende protokoll følger metoder som brukes til å undersøke opsingener i Hydra vulgaris7, men de kan brukes på alle arter og hvilken som helst genfamilie. Resultatene fra slike studier gir grunnlag for videre utredning av genfunksjon og gennettverk i ikke-modellorganismer. Som et eksempel gir undersøkelsen av fylogenien av opsiner, som er proteiner som initierer fototransduksjonskaskaden, kontekst til utviklingen av øyne og lysdeteksjon8,9,10,11. I dette tilfellet kan ikke-modellorganismer spesielt basale dyrearter som cnidarians eller ctenophores belyse bevaring eller endringer i fototransduksjonskaskaden og visjonen over clades12,13,14. På samme måte vil det å bestemme fylogeni, uttrykk og nettverk av andre genfamilier informere oss om de molekylære mekanismene som ligger til grunn for tilpasninger.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Denne protokollen følger UC Irvine dyrepleieretningslinjer.

1. RNA-seq bibliotek forberedelse

  1. Isoler RNA ved hjelp av følgende metoder.
    1. Samle inn prøver. Hvis RNA skal trekkes ut på et senere tidspunkt, må du fryse prøven eller plassere den i RNA-lagringsløsningen15 (Materialliste).
    2. Avlive og dissekere organismen for å skille vev av interesse.
    3. Trekk ut total RNA ved hjelp av et ekstraksjonssett og rens RNA ved hjelp av et RNA-rensesett (Tabell over materialer)
      MERK: Det finnes protokoller og sett som kan fungere bedre for forskjellige arter og vevstyper16,17. Vi har ekstrahert RNA fra forskjellige kroppsvev av en sommerfugl18 og en gelatinøs Hydra19 (se diskusjon).
    4. Mål konsentrasjonen og kvaliteten på RNA for hver prøve (Tabell over materialer). Bruk eksempler med RNA-integritetsnumre (RIN) høyere enn 8, ideelt nærmere 920 for å konstruere cDNA-biblioteker.
  2. Konstruer cDNA-bibliotek og -sekvens på følgende måte.
    1. Bygg cDNA-biblioteker i henhold til instruksjonshåndboken for bibliotekforberedelse (se diskusjon).
    2. Bestem cDNA-konsentrasjon og kvalitet (Materialliste).
    3. Multiplex bibliotekene og sekvenser dem.

2. Få tilgang til en dataklynge

MERK: RNA-seq analyse krever manipulering av store filer og gjøres best på en dataklynge (Tabell over materialer).

  1. Logg på datamaskinklyngekontoen ved hjelp av kommandoen ssh username@clusterlocation i et programvindu for terminal (Mac) eller PuTTY (Windows).

3. Få RNA-seq leser

  1. Få RNA-seq-avlesninger fra sekvenseringsanlegget eller, for data generert i en publikasjon, fra datalageret der det ble deponert (3.2 eller 3.3).
  2. Hvis du vil laste ned data fra repositorier som ArrayExpress, gjør du følgende:
    1. Søk på nettstedet ved hjelp av tiltredelsesnummeret.
    2. Finn koblingen for å laste ned dataene, og venstreklikk og velg Kopier kobling.
    3. I terminalvinduet skriver du inn wget og velger Lim inn kobling for å kopiere dataene til katalogen for analyse.
  3. Følg disse alternative trinnene for å laste ned SRA-data (Short Read Archive) for NCBI:
    1. På terminal nedlasting SRA Toolkit v. 2.8.1 ved hjelp av wget.
      MERK: Nedlasting og installasjon av programmer til datamaskinklyngen kan kreve root-tilgang, kontakt administratoren for datamaskinklyngen hvis installasjonen mislykkes.
    2. Fullfør installasjonen av programmet ved å skrive inn tar -xvf $TARGZFILE.
    3. Søk i NCBI etter SRA-tiltredelsesnummeret for prøvene du vil laste ned, det skal ha formatet SRRXXXXXX.
    4. Hent RNA-seq-dataene ved å skrive inn [sratoolkit location]/bin/prefetch SRRXXXXXX i terminalvinduet.
    5. For parkoblede filer skriver du [sratoolkit location]/bin/fastq-dump --split-files SRRXXXXXX for å få to fastq-filer (SRRXXXXXX_1.FASTQ og SRRXXXXXX_2.FASTQ).
      MERK: For å gjøre en Trinity de novo-montering, bruk kommandoen [sratoolkit location]/bin/fastq-dump --defline-seq '@$sn[_$rn]/$ri' --split-files SRRXXXXXX

4. Trim adaptere og leseoperasjoner av lav kvalitet (valgfritt)

  1. Installer eller last inn Trimmomatic21 v. 0.35 på dataklyngen.
  2. I katalogen der RNA-seq-datafilene er plassert, skriver du inn en kommando som inkluderer plasseringen av den trimmomatiske krukkefilen, inngangs-FASTQ-filene, utdataene FASTQ-filer og valgfrie parametere som leselengde og kvalitet.
    MERK: Kommandoen vil variere avhengig av den rå og ønskede kvaliteten og lengden på lesningene. For Illumina 43 bp leser med Nextera primere, brukte vi: java -jar /data/apps/trimmomatic/0.35/trimmomatic-0.35.jar PE $READ 1. FASTQ $READ 2. FASTQ paired_READ1. FASTQ unpaired_READ1. FASTQ paired_READ2. FASTQ unpaired_READ2. FASTQ ILLUMINACLIP:adapters.fa:2:30:10 LEDENDE:20 ETTERFØLGENDE:20 SKYVEVIND:4:17 MINLEN:30.

5. Hent referansesamling

  1. Søk på google, EnsemblGenomes og NCBI Genomes and Nucleotide TSA (Transcriptome Shotgun Assembly) etter et referansegenom eller montert transkripsjon for interesseartene (Figur 1).
    MERK: Hvis et referansegenom eller transkripsjonsmateriale ikke er tilgjengelig eller av lav kvalitet, går du videre til TRINN 6 for å generere en de novo-montering.
  2. Hvis det finnes et referansegenom eller montert transkripsjon, laster du det ned som en fasta-fil til der analysen skal utføres ved å følge trinnene nedenfor.
    1. Finn koblingen for å laste ned genomet, venstreklikke og kopiere kobling.
    2. Skriv inn wget i terminalvinduet, og lim inn koblingsadressen. Hvis tilgjengelig, kopier også GTF-filen og protein FASTA-filen for referansegenomet.

6. Generer en de novo-montering (alternativ til trinn 5)

  1. Kombiner RNA-seq READ1- og READ2 fastq-filene for alle prøver ved å skrive cat *READ1. FASTQ > $all_READ1. FASTQ og katt *READ2. FASTQ > all_READ2. FASTQ i terminalvinduet.
  2. Installer eller last inn Trinity22 v.2.8.5 på dataklyngen.
  3. Generer og monter ved å skrive på terminalen: Trinity --seqType fq --max_memory 20G --left $all_READ1. FASTQ - høyre $all_READ2. FASTQ.

7. Kartet leser til genomet (7.1) eller de novo transcriptome (7.2)

  1. Kartet leser til referansegenomet ved hjelp av STAR23 v. 2.6.0c og RSEM24 v. 1.3.0.
    1. Installer eller last inn STAR v. 2.6.0c. og RSEM v. 1.3.0 til dataklyngen.
    2. Indekser genomet ved å skrive inn rsem-prepare-reference --gtf $GENOME. GTF --stjerne -p 16 $GENOME. FASTA $OUTPUT.
    3. Kartet leser og beregner uttrykk for hvert eksempel ved å skrive inn rsem-calculate-expression -p 16 --star --paired-end $READ 1. FASTQ $READ 2. FASTQ $INDEX $OUTPUT.
    4. Endre navnet på resultatfilen til noe beskrivende ved hjelp av mv RSEM.genes.results $sample.genes.results.
    5. Generer en matrise med alle tellinger ved å skrive inn rsem-generate-data-matrix *[genes/isoforms.results] > $OUTPUT.
  2. Kart RNA-seq til Trinity de novo-forsamlingen ved hjelp av RSEM og bowtie.
    1. Installer eller last inn Trinity22 v.2.8.5, Bowtie25 v. 1.0.0 og RSEM v. 1.3.0.
    2. Kart leser og beregner uttrykk for hvert utvalg ved å skrive inn [trinity_location]/align_and_estimate_abundance.pl --prep-reference --transcripts $TRINITY. FASTA --seqType fq --left $READ 1. FASTQ - høyre $READ 2. FASTQ --est_method RSEM --aln_method bowtie --trinity_mode --output_dir $OUTPUT.
    3. Endre navnet på resultatfilen til noe beskrivende ved hjelp av mv RSEM.genes.results $sample.genes.results.
    4. Generer en matrise med alle tellinger ved å skrive inn [trinity_location]/abundance_estimates_to_matrix.pl --est_method RSEM *[gener/isoformer].results

8. Identifiser gener av interesse

MERK: Følgende trinn kan gjøres med nukleotid- eller protein FASTA-filer, men fungerer best og er enklere med proteinsekvenser. BLAST-søk ved hjelp av protein til protein er mer sannsynlig å gi resultater når du søker mellom forskjellige arter.

  1. For et referansegenom, bruk proteinET FASTA-filen fra STEP 5.2.2 eller se Supplementsal Materials for å generere en tilpasset genfunksjon GTF.
  2. For en de novo transkripsjon, generere et protein FASTA ved hjelp av TransDecoder.
    1. Installer eller last inn TransDecoder v. 5.5.0 på datamaskinens cluser.
    2. Finn den lengste åpne leserammen og den predikerte peptidsekvensen ved å skrive inn [Transdecoder location]/TransDecoder.LongOrfs -t $TRINITY. FASTA.
  3. Søk i NCBI Genbank etter homologer i nært beslektede arter.
    1. Åpne et nettleservindu og gå til https://www.ncbi.nlm.nih.gov/genbank/.
    2. På søkefeltet skriver du inn navnet på genet av interesse og navnet på nært beslektede arter som har blitt sekvensert eller slekt eller phylum. Velg protein til venstre for søkefeltet, og klikk deretter søk.
    3. Pakk ut sekvenser ved å klikke Send til, og velg deretter Fil. Velg FASTA under Format, og klikk deretter Opprett fil.
    4. Flytt FASTA-filen med homologer til datamaskinklyngen ved å skrive inn scp $FASTA username@clusterlocation:/$DIR i et lokalt terminalvindu, eller bruk FileZilla til å overføre filer til og fra datamaskin og klynge.
  4. Søk etter kandidatgener ved hjelp av BLAST+26.
    1. Installer eller last inn BLAST+ v. 2.8.1 på datamaskinklyngen.
    2. På dataklyngen lager du en BLAST-database fra genomet eller transkripsjonsoversatt protein FASTA ved å skrive inn [BLAST+ location]/makeblastdb -in $PEP. FASTA -dbtype prot -out $OUTPUT
    3. BLAST de homologe gensekvensene fra NCBI til databasen av arten av interesse ved å skrive [BLAST + plassering]/blastp -db $DATABASE -query $FASTA -evalue 1e-10 -outfmt 6 -max_target_seqs 1 -out $OUTPUT.
    4. Vis utdatafilen ved hjelp av kommandoen mer. Kopier unike gen-ID-er fra artene av interesse til en ny tekstfil.
    5. Trekk ut sekvensene av kandidatgener ved å skrive perl -ne 'if(/^>(\S+)/){$c=$i{$1}}$c?print:chomp;$i{$_}=1 hvis @ARGV' $gene_id.txt $PEP. FASTA > $OUTPUT.
  5. Bekreft genmerknad ved hjelp av gjensidig BLAST.
    1. Gå til https://blast.ncbi.nlm.nih.gov/Blast.cgi i nettleseren.
    2. Velg tblastn, lim deretter inn kandidatsekvensene, velg databasen for ikke-overflødig proteinsekvens og klikk BLAST.
  6. Identifiser flere gener ved å kommentere alle gener i genomet eller transkripsjonen med gen ontologi (GO) termer (se diskusjon).
    1. Overfør proteinet FASTA til den lokale datamaskinen.
    2. Last ned og installer Blast2GO27,28,29 v. 5.2 på den lokale datamaskinen.
    3. Åpne Blast2GO, klikk Fil, gå til Last inn, gå til Last inn sekvenser, klikk Last inn Fasta-fil (fasta). Velg FASTA-filen, og klikk Last inn.
    4. Klikk Blast, velg NCBI Blast, og klikk Neste. Rediger parametere eller klikk Neste, rediger parametere og klikk Kjør for å finne den mest lignende genbeskrivelsen.
    5. Klikk på tilordning og klikk deretter Kjør for å søke i Gene Ontology-merknader etter lignende proteiner.
    6. Deretter klikker du interpro, velger EMBL-EBI InterProog klikker Neste. Rediger parametere, eller klikk Neste, og klikk Kjør for å søke etter signaturer for kjente genfamilier og domener.
    7. Eksporter merknadene ved å klikke Fil, velg Eksporter, klikk Eksporter tabell. Klikk Bla gjennom, gi filen et navn, klikk Lagre, klikk Eksporter.
    8. Søk i merknadstabellen etter GO-termer av interesse for å identifisere flere kandidatgener. Trekke ut sekvensene fra FASTA-filen (TRINN 8.4.5)

9. Fylogenetiske trær

  1. Last ned og installer MEGA30 v. 7.0.26 på den lokale datamaskinen.
  2. Åpne MEGA, klikk Juster, klikk Rediger/bygg justering, velg Opprett en ny justering klikk OK, velg Protein.
  3. Når justeringsvinduet åpnes, klikker du på Rediger, klikker på Sett inn sekvenser fra fil og velger FASTA med proteinsekvenser av kandidatgener og sannsynlige homologer.
  4. Velg alle sekvenser. Finn armsymbolet og hold markøren over det. Det skal stå Juster sekvenser ved hjelp av MUSKEL31 algoritme. Klikk armsymbolet, og klikk deretter Juster protein for å justere sekvensene. Rediger parametere, eller klikk OK for å justere ved hjelp av standardparametere.
  5. Kontroller og gjør manuelle endringer visuelt, og lagre og lukk justeringsvinduet.
  6. I hovedvinduet i MEGA klikker du på Modeller, klikker Finn beste DNA/proteinmodeller (ML), velger justeringsfilen og velger tilsvarende parametere som: Analyse: Modellvalg (ML), Tre som skal brukes: Automatisk (nabotre), Statistisk metode: Maksimal sannsynlighet, Substitusjonstype: Aminosyre, Gap/manglende databehandling: Bruk alle nettsteder, Grenområdefilter: Ingen.
  7. Når den beste modellen for dataene er bestemt, går du til hovedvinduet i MEGA. Klikk Fylogeni, og klikk Kontrugert/test maksimalt sannsynlighetstre, og velg deretter justeringen om nødvendig. Velg de riktige parametrene for treet: Statistisk metode: Maksimal sannsynlighet, Test av fylogeni: Bootstrap-metode med 100 replikeringer, substitusjonstype: aminosyre, modell: LG med Freqs. (+F), rater mellom områder: gamma distribuert (G) med 5 diskrete gammakategorier, gap / manglende databehandling: bruk alle nettsteder, ML heuristisk metode: Nearest-Neighbor-Interchange (NNI).

10. Visualiser genuttrykk ved hjelp av TPM

  1. For Trinity, på dataklyngen gå til katalogen der abundance_estimates_to_matrix.pl ble kjørt og en av utgangene skal være matrise. TPM.not_cross_norm. Overfør denne filen til den lokale datamaskinen.
    MERK: Se Tilleggsmaterialer for normalisering på tvers av prøver.
  2. Følg trinnene nedenfor for TPMer fra en genomanalyse.
    1. Gå til installasjonsstedet for RSEM i datamaskinklyngen. Kopier rsem-generate-data-matrix ved å skrive inn scp rsem-generate-data-matrix rsem-generate-TPM-matrix. Bruk nano for å redigere den nye filen og endre "min $offsite = 4" fra 4 til 5 for TPM, den skal nå lese "min $offsite = 5".
  3. Gå til katalogen der RSEM-utdatafilene .genes.results er, og bruk nå rsem-generate-TPM-matrix *[genes/isoforms.results] > $OUTPUT til å generere en TPM-matrise. Overfør resultatene til en lokal datamaskin.
  4. Visualiser resultatene i ggplot2.
    1. Last ned R v. 4.0.0 og RStudio v. 1.2.1335 til en lokal datamaskin.
    2. Åpne RStudio til høyre på skjermen gå til kategorien Pakker og klikk Installer. Skriv inn ggplot2, og klikk installer.
    3. I R-skriptvinduet leste du i TPM-tabellen ved å skrive inn data<-read.table("$tpm.txt",header = T)
    4. For stolpediagrammer som ligner på figur 4, skriver du inn noe som ligner på: p<- ggplot() + geom_bar(aes(y=TPM, x=Symbol, fill=Tissue), data=data, stat="identitet")
      fyll<-c("#d7191c","#fdae61", "#ffffbf", "#abd9e9", "#2c7bb6")
      p<-p+scale_fill_manual(verdier=fyll)
      p + tema(axis.text.x = element_text(vinkel = 90))

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Metodene ovenfor er oppsummert i figur 1 og ble brukt på et datasett av Hydra vulgaris vev. H. vulgaris er en ferskvanns hvirvelløse dyr som tilhører phylum Cnidaria som også inkluderer koraller, maneter og sjømoner. H. vulgaris kan reprodusere aseksuelt ved spirende, og de kan regenerere hodet og foten når de blir bispedert. I denne studien hadde vi som mål å undersøke evolusjonen og uttrykket av opsingener i Hydra7. Mens Hydra mangler øyne, viser de lysavhengig oppførsel32. Opsin gener koder proteiner som er viktige i synet for å oppdage forskjellige bølgelengder av lys og begynne fototransduksjon kaskade. Å undersøke den molekylære utviklingen og uttrykket til denne genfamilien i en basal art kan gi innsikt i utviklingen av øyne og lysdeteksjon hos dyr.

Vi genererte en veiledet montering ved hjelp av Hydra2.0 33 referansegenom og offentlig tilgjengelige RNA-seq data (GEO tiltredelse GSE127279) figur 1. Dette trinnet tok omtrent 3 dager. Selv om vi ikke genererte en de novo transkripsjon i dette tilfellet, kan en Trinity-forsamling ta opptil 1 uke å generere, og hvert bibliotek kan ta noen timer for lesekartlegging avhengig av tilordning. Den sammenslåtte Hydra-forsamlingen (~ 50 000 transkripsjoner) ble kommentert ved hjelp av Blast2GO som tok omtrent 1 uke figur 1. Sekvenser for opsinrelaterte gener ble hentet ut i en fasta-fil. Sekvenser for opsingener fra andre arter ble også hentet ut fra NCBI GenBank. Vi brukte opsiner fra cnidarians Podocoryna carnea, Cladonema radiatum, Tripedelia cystophora, og Nematostella vectensis, og vi inkluderte også outgroups Mnemiopsis leidyi, Trichoplax adhaerens, Drosophila melanogaster og Homo sapiens. Opsingener ble justert i MEGA7 figur 2. Ved å se justeringen kunne vi identifisere Hydra-opsiner som manglet en konservert lysinaminosyre som var nødvendig for å binde et lysfølsomt molekyl. Etter visuell inspeksjon bestemte vi den beste modellen ved å gjøre en modellvalganalyse. Vi genererte et tre med maksimal sannsynlighet ved hjelp av modellen LG + G + F med bootstrap-verdi på 100 figur 3. For 149 opsingener ble treet ferdig på ca. 3 dager. Fylogenien antyder at opsingener utvikler seg ved avgrensningsspesifikke dupliseringer hos cnidarians og potensielt ved tandemduplisering i H. vulgaris7.

Vi utførte en differensialuttrykksanalyse i edgeR og så på absolutt uttrykk for opsingener. Vi antok at en eller flere opsiner ville bli oppregulert i hodet (hypostom) og utført parvise sammenligninger av hypostom kontra kroppssøylen, spirende sone, fot og tentakler. Som et eksempel på en parvis sammenligning ble 1774 transkripsjoner differensialt uttrykt mellom hypostomet og kroppskolonnen. Vi bestemte genene som ble oppregulert på tvers av flere sammenligninger og gjorde en funksjonell berikelse i Blast2GO Tabell 1. Gruppering av G-protein koblet reseptoraktivitet inkluderte opsingener. Til slutt så vi på det absolutte uttrykket av opsingener i forskjellige vev, under spirende og under regenerering ved å plotte sine TPM-verdier ved hjelp av ggplot figur 4. Ved hjelp av metodene som er skissert her, identifiserte vi 2 opsingener som ikke grupperte seg med de andre opsinene i fylogenien, fant en opsin som ble uttrykt nesten 200 ganger mer enn andre, og vi fant noen få opsingener uttrykt sammen med fototransduksjonsgener som kan brukes til lysdeteksjon.

Figure 1
Figur 1: Skjema for arbeidsflyt. Programmer som brukes til å analysere data på dataklyngen er i blått, i magenta er de som vi brukte på en lokal datamaskin og i oransje er et nettbasert program. (1) Trim RNA-seq leser ved hjelp av trimmomatic v. 0.35. Hvis et genom er tilgjengelig, men genmodeller mangler, generer en veiledet montering ved hjelp av STAR v. 2.6.0c og StringTie v. 1.3.4d. (Valgfritt se Tilleggsmaterialer) (2) Uten referansegenom, bruk trimmede avlesninger for å lage en de novo-montering ved hjelp av Trinity v 2.8.5. (3) For å kvantifisere genuttrykk ved hjelp av et referansegenom, leser kartet ved hjelp av STAR og kvantifiserer ved hjelp av RSEM v. 1.3.1. Pakk ut TPMer ved hjelp av RSEM og visualiser dem i RStudio. (4) Bowtie og RSEM kan brukes til å kartlegge og kvantifisere avlesninger kartlagt til en treenighetstranskripsjon. Et Trinity-skript kan brukes til å generere en TPM-matrise for å visualisere antall i RStudio. (5) Bruk nettbasert NCBI BLAST og kommandolinje BLAST+ for å søke etter homologe sekvenser og bekrefte ved hjelp av gjensidig BLAST. Kommenter gener ytterligere ved hjelp av Blast2GO. Bruk MEGA til å justere gener og generere et fylogenetisk tre ved hjelp av den beste passformmodellen. Klikk her for å se en større versjon av denne figuren.

Figure 2
Figur 2: Eksempel på justerte gener. Snapshot viser en del av Hydra opsin gener justert ved hjelp av MUSCLE. Pilen angir plasseringen av en retinal binding konservert lysin. Klikk her for å se en større versjon av denne figuren.

Figure 3
Figur 3: Cnidarian opsin fylogenetisk tre. Maksimalt sannsynlighetstre generert i MEGA7 ved hjelp av opsinsekvenser fra Hydra vulgaris, Podocoryna carnea, Cladonema radiatum, Tripedelia cystophora, Nematostella vectensis, Mnemiopsis leidyi, Trichoplax adhaerens, Drosophila melanogaster og Homo sapiens. Klikk her for å se en større versjon av denne figuren.

Figure 4
Figur 4: Uttrykk for Opsin-gener i Hydra vulgaris(A) Uttrykk i transkripsjoner per million (TPM) av Hydra vulgaris opsin gener i kroppssøylen, spirende sone, fot, hypostom og tentakler. (B) Uttrykk for opsingener i ulike stadier av Hydra spirende. (C) Uttrykk for opsingener av Hydra-hypostomet under ulike regenereringspunkter. Klikk her for å se en større versjon av denne figuren.

GÅ TIL ID GO-navn GO-kategori Fdr
GÅ:0004930 G-protein koblet reseptoraktivitet MOLEKYLÆR FUNKSJON 0.0000000000704
GÅ:0007186 G-protein koblet reseptor signalvei BIOLOGISK PROSESS 0.00000000103
GÅ:0016055 Wnt signalvei BIOLOGISK PROSESS 0.0000358
GÅ:0051260 protein homooligomerisering BIOLOGISK PROSESS 0.000376
GÅ:0004222 metalloendopeptidase aktivitet MOLEKYLÆR FUNKSJON 0.000467
GÅ:0008076 spenningsportert kaliumkanalkompleks MOBILKOMPONENT 0.000642
GÅ:0005249 spenningsportert kaliumkanalaktivitet MOLEKYLÆR FUNKSJON 0.00213495
GO:0007275 utvikling av flercellulær organisme BIOLOGISK PROSESS 0.00565048
GÅ:0006813 kaliumion transport BIOLOGISK PROSESS 0.01228182
GÅ:0018108 peptidyl-tyrosinfosforylering BIOLOGISK PROSESS 0.02679662

Tabell 1: Funksjonell berikelse av gener oppregulert i hypostomet

Tilleggsmaterialer. Klikk her for å laste ned dette materialet.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Formålet med denne protokollen er å gi en oversikt over trinnene for å karakterisere en genfamilie ved hjelp av RNA-seq-data. Disse metodene har vist seg å fungere for en rekke arter og datasett4,34,35. Rørledningen som er etablert her er forenklet og bør være enkel nok til å bli etterfulgt av en nybegynner innen bioinformatikk. Betydningen av protokollen er at den skisserer alle trinnene og nødvendige programmer for å fullføre en publiserbar analyse. Et avgjørende skritt i protokollen er å ha riktig montert transkripsjoner i full lengde, dette kommer fra genomer av høy kvalitet eller transkripsjoner. For å få riktige transkripsjoner trenger man RNA og/eller DNA av høy kvalitet og gode merknader diskutert nedenfor.

For forberedelse av RNA-seq-biblioteket inkluderer vi listesett som fungerte for små kroppsdeler av Hydra19 og sommerfugler18 (Materialbord). Vi merker at for lav inngang RNA brukte vi en modifisert protokoll tilnærming36. Metoder for RNA-ekstraksjon har blitt sammenlignet i flere prøvetyper, inkludert gjærceller17, nevroblastom37, planter38og insektslarver16 for å nevne noen. Vi anbefaler at leseren skaffer seg en protokoll som fungerer for deres arter av interesse, hvis det finnes, eller feilsøker bruk av ofte kommersielt tilgjengelige sett for å starte. For riktig genkvantifisering anbefaler vi å behandle RNA-prøven med DNase. Tilstedeværelsen av DNA vil påvirke riktig gen kvantifisering. Vi anbefaler også at du bruker et klargjøringssett for cDNA-bibliotek som inkluderer et polyA-halevalg for å velge for moden mRNA. Mens rRNA-uttømming resulterer i mer lesedybde, er prosentandelen av exon-dekning mye lavere enn exon-dekningen av RNA ved hjelp av polyA + utvalg39. Til slutt, når det er mulig, er det best å bruke pardelt og strandet40,41. I protokollen over må lesetilordningskommandoene endres når du bruker enkeltstående leseoperasjoner.

Som nevnt ovenfor er det viktig å kunne identifisere gener av interesse og også å skille mellom nylige gendupliseringer, alternativ skjøting og haplotyper i sekvensering. I noen tilfeller kan det å ha et referansegenom hjelpe ved å bestemme hvor gener og eksoner befinner seg i forhold til hverandre. En ting å merke seg er at hvis en transkripsjon er hentet fra en offentlig database og ikke er av høy kvalitet, kan det være best å generere ved hjelp av Trinity42 og kombinere RNA-seq biblioteker fra vev av interesse. På samme måte, hvis et referansegenom ikke har gode genmodeller, kan RNA-seq-biblioteker brukes til å generere nye GTFer ved hjelp av StringTie43 (se Tilleggsmaterialer). I tillegg, i tilfeller der gener er ufullstendige og det er tilgang til et genom, kan gener redigeres manuelt ved hjelp av homologsekvenser som deretter justeres til genomet ved hjelp av tblastn. BLAST-utgangen kan brukes til å bestemme den faktiske sekvensen, som kan være forskjellig fra korreksjonen som gjøres ved hjelp av homologer. Hvis det ikke finnes samsvar, lar du sekvensen være som opprinnelig var. Når du sjekker produksjonen, vær oppmerksom på genomkoordinatene for å sikre at den manglende eksonen faktisk er en del av genet.

Selv om vi fokuserer på programvare og programmer som vi brukte, finnes det endringer i denne protokollen på grunn av mange tilgjengelige programmer som kan fungere bedre for forskjellige datasett. Som et eksempel viser vi kommandoer for kartlegging av leseoperasjoner til transkripsjonen ved hjelp av bowtie og RSEM, men Trinity har nå muligheten til mye raskere justeringer som kallisto44 og laks45. På samme måte beskriver vi merknader ved hjelp av Blast2GO (nå OmicsBox), men det er andre mapperverktøy som kan bli funnet gratis og online. Noen som vi har prøvd inkluderer: GO FEAT46, eggNOG-mapper47,48, og en veldig rask justering PANNZER249. For å bruke disse nettbaserte merknadsverktøyene laster du ganske enkelt opp peptidET FASTA og sender inn. Frittstående versjoner av PANNZER og eggNOG-mapper er også tilgjengelige for nedlasting til dataklyngen. En annen modifikasjon er at vi brukte MEGA og R på en lokal datamaskin og brukte det elektroniske NCBI BLAST-verktøyet til å gjøre gjensidige BLASTer, men alle disse programmene kan brukes på dataklyngen ved å laste ned de nødvendige programmene og databasene. På samme måte kan justerere kallisto og laks brukes på en lokal datamaskin så lenge en bruker har nok RAM og lagring. Imidlertid har FASTQ- og FASTA-filer en tendens til å være veldig store, og vi anbefaler på det sterkeste å bruke en dataklynge for enkelhet og hastighet. I tillegg, mens vi gir instruksjoner og lenker til nedlastingsprogrammer fra utviklerne sine, kan mange av dem installeres fra bioconda: https://anaconda.org/bioconda.

Et vanlig problem når du gjør bioinformatiske analyser er at skallskript svikter. Dette kan skyldes en rekke årsaker. Hvis det opprettes en feilfil, bør disse feilfilen kontrolleres før feilsøking. Noen vanlige årsaker til en feil er skrivefeil, manglende nøkkelparametere og kompatibilitetsproblemer mellom programvareversjoner. I denne protokollen inkluderer vi parametere for dataene, men programvarehåndbøker kan gi mer detaljerte retningslinjer for individuelle parametere. Generelt er det best å bruke de mest oppdaterte versjonene av programvare og å konsultere håndboken som tilsvarer den versjonen.

Forbedringer i denne protokollen inkluderer å gjøre en transkripsjonsomfattende differensialuttrykksanalyse og funksjonell berikelsesanalyse. Vi anbefaler edgeR50 for differensialuttrykksanalyse en pakke tilgjengelig i Bioconductor. For funksjonell berikelsesanalyse har vi brukt Blast2GO29 og nettbasert DAVID51,52. Vi anbefaler også videre redigering av fylogenien ved å trekke den ut som en newick-fil og bruke nettbasert iTOL53. Videre, mens denne protokollen vil undersøke geners molekylære evolusjons- og uttrykksmønstre, kan ytterligere eksperimenter brukes til å validere gen- eller proteinplasseringer og -funksjoner. mRNA-uttrykk kan bekreftes av RT-qPCR eller in situ hybridisering. Proteiner kan lokaliseres ved hjelp av immunhiistokjemi. Avhengig av arten kan knockout-eksperimenter brukes til å bekrefte genfunksjon. Denne protokollen kan brukes til en rekke mål, inkludert, som vist ovenfor, for å utforske en genfamilie som vanligvis er forbundet med fotoreception i en basal art7. En annen anvendelse av disse metodene er å identifisere endringer i en konservert vei under forskjellige selektive trykk. Som et eksempel ble disse metodene brukt til å oppdage variasjon i uttrykket av syn forbigående reseptorpotensialkanaler mellom daglige sommerfugler og nattlige møll34.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne har ingenting å avsløre.

Acknowledgments

Vi takker Adriana Briscoe, Gil Smith, Rabi Murad og Aline G. Rangel for råd og veiledning i å innlemme noen av disse trinnene i arbeidsflyten vår. Vi er også takknemlige til Katherine Williams, Elisabeth Rebboah og Natasha Picciani for kommentarer til manuskriptet. Dette arbeidet ble delvis støttet av en George E. Hewitt Foundation for Medical research fellowship til A.M.M.

Materials

Name Company Catalog Number Comments
Bioanalyzer-DNA kit Agilent 5067-4626 wet lab materials
Bioanalyzer-RNA kit Agilent 5067-1513 wet lab materials
BLAST+ v. 2.8.1 On computer cluster*
https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/
Blast2GO (on your PC) On local computer
https://www.blast2go.com/b2g-register-basic
boost v. 1.57.0 On computer cluster
Bowtie v. 1.0.0 On computer cluster
https://sourceforge.net/projects/bowtie-bio/files/bowtie/1.3.0/
Computing cluster (highly recommended) NOTE: Analyses of genomic data are best done on a high-performance computing cluster because files are very large.
Cufflinks v. 2.2.1 On computer cluster
edgeR v. 3.26.8 (in R) In Rstudio
https://bioconductor.org/packages/release/bioc/html/edgeR.html
gcc v. 6.4.0 On computer cluster
Java v. 11.0.2 On computer cluster
MEGA7 (on your PC) On local computer
https://www.megasoftware.net
MEGAX v. 0.1 On local computer
https://www.megasoftware.net
NucleoSpin RNA II kit Macherey-Nagel 740955.5 wet lab materials
perl 5.30.3 On computer cluster
python On computer cluster
Qubit 2.0 Fluorometer ThermoFisher Q32866 wet lab materials
R v.4.0.0 On computer cluster
https://cran.r-project.org/src/base/R-4/
RNAlater ThermoFisher AM7021 wet lab materials
RNeasy kit Qiagen 74104 wet lab materials
RSEM v. 1.3.0 Computer software
https://deweylab.github.io/RSEM/
RStudio v. 1.2.1335 On local computer
https://rstudio.com/products/rstudio/download/#download
Samtools v. 1.3 Computer software
SRA Toolkit v. 2.8.1 On computer cluster
https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit
STAR v. 2.6.0c On computer cluster
https://github.com/alexdobin/STAR
StringTie v. 1.3.4d On computer cluster
https://ccb.jhu.edu/software/stringtie/
Transdecoder v. 5.5.0 On computer cluster
https://github.com/TransDecoder/TransDecoder/releases
Trimmomatic v. 0.35 On computer cluster
http://www.usadellab.org/cms/?page=trimmomatic
Trinity v.2.8.5 On computer cluster
https://github.com/trinityrnaseq/trinityrnaseq/releases
TRIzol ThermoFisher 15596018 wet lab materials
TruSeq RNA Library Prep Kit v2 Illumina RS-122-2001 wet lab materials
TURBO DNA-free Kit ThermoFisher AM1907 wet lab materials
*Downloads and installation on the computer cluster may require root access. Contact your network administrator.

DOWNLOAD MATERIALS LIST

References

  1. Lespinet, O., Wolf, Y. I., Koonin, E. V., Aravind, L. The role of lineage-specific gene family expansion in the evolution of eukaryotes. Genome Research. 12 (7), 1048-1059 (2002).
  2. Gabaldón, T., Koonin, E. V. Functional and evolutionary implications of gene orthology. Nature Reviews Genetics. 14 (5), 360-366 (2013).
  3. Dolinski, K., Botstein, D. Orthology and Functional Conservation in Eukaryotes. Annual Review of Genetics. 41 (1), (2007).
  4. Macias-Muñoz, A., McCulloch, K. J., Briscoe, A. D. Copy number variation and expression analysis reveals a non-orthologous pinta gene family member involved in butterfly vision. Genome Biology and Evolution. 9 (12), 3398-3412 (2017).
  5. Cannon, S. B., Mitra, A., Baumgarten, A., Young, N. D., May, G. The roles of segmental and tandem gene duplication in the evolution of large gene families in Arabidopsis thaliana. BMC plant biology. 4, 10 (2004).
  6. Eastman, S. D., Chen, T. H. P., Falk, M. M., Mendelson, T. C., Iovine, M. K. Phylogenetic analysis of three complete gap junction gene families reveals lineage-specific duplications and highly supported gene classes. Genomics. 87 (2), 265-274 (2006).
  7. Macias-Munõz, A., Murad, R., Mortazavi, A. Molecular evolution and expression of opsin genes in Hydra vulgaris. BMC Genomics. 20 (1), 1-19 (2019).
  8. Hisatomi, O., Tokunaga, F. Molecular evolution of proteins involved in vertebrate phototransduction. Comparative Biochemistry and Physiology - B Biochemistry and Molecular Biology. 133 (4), 509-522 (2002).
  9. Arendt, D. Evolution of eyes and photoreceptor cell types. International Journal of Developmental Biology. 47, 563-571 (2003).
  10. Shichida, Y., Matsuyama, T. Evolution of opsins and phototransduction. Philosophical Transactions of the Royal Society B: Biological Sciences. 364 (1531), 2881-2895 (2009).
  11. Porter, M. L., et al. Shedding new light on opsin evolution. Proceedings of the Royal Society B: Biological Sciences. 279 (1726), 3-14 (2012).
  12. Plachetzki, D. C., Degnan, B. M., Oakley, T. H. The origins of novel protein interactions during animal opsin evolution. PLoS ONE. 2 (10), 1054 (2007).
  13. Ramirez, M. D., et al. The last common ancestor of most bilaterian animals possessed at least nine opsins. Genome Biology and Evolution. 8 (12), 3640-3652 (2016).
  14. Schnitzler, C. E., et al. Genomic organization, evolution, and expression of photoprotein and opsin genes in Mnemiopsis leidyi: a new view of ctenophore photocytes. BMC Biology. 10, 107 (2012).
  15. Pedersen, K. B., Williams, A., Watt, J., Ronis, M. J. Improved method for isolating high-quality RNA from mouse bone with RNAlater at room temperature. Bone Reports. 11, 100211 (2019).
  16. Ridgeway, J. A., Timm, A. E., Fallon, A. Comparison of RNA isolation methods from insect larvae. Journal of Insect Science. 14 (1), 4-8 (2014).
  17. Scholes, A. N., Lewis, J. A. Comparison of RNA isolation methods on RNA-Seq: Implications for differential expression and meta-Analyses. BMC Genomics. 21 (1), 1-9 (2020).
  18. Briscoe, A. D., et al. Female behaviour drives expression and evolution of gustatory receptors in butterflies. PLoS genetics. 9 (7), 1003620 (2013).
  19. Murad, R., Macias-Muñoz, A., Wong, A., Ma, X., Mortazavi, A. Integrative analysis of Hydra head regeneration reveals activation of distal enhancer-like elements. bioRxiv. , 544049 (2019).
  20. Gallego Romero, I., Pai, A. A., Tung, J., Gilad, Y. Impact of RNA degradation on measurements of gene expression. BMC Biology. 12, 42 (2014).
  21. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  22. Trinity. RNA-Seq De novo Assembly Using Trinity. , 1-7 (2014).
  23. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29, 15-21 (2013).
  24. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC bioinformatics. 12, 323 (2011).
  25. Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome biology. 10, 25 (2009).
  26. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10, 421 (2009).
  27. Conesa, A., Götz, S. Blast2GO: A comprehensive suite for functional analysis in plant genomics. International Journal of Plant Genomics. 619832, (2008).
  28. Conesa, A., et al. Blast2GO: A universal tool for annotation, visualization and analysis in functional genomics research. Bioinformatics. 21 (18), 3674-3676 (2005).
  29. Götz, S., et al. High-throughput functional annotation and data mining with the Blast2GO suite. Nucleic Acids Research. 36 (10), 3420-3435 (2008).
  30. Kumar, S., Stecher, G., Tamura, K. MEGA7: Molecular Evolutionary Genetics Analysis version 7.0 for bigger datasets. Molecular biology and evolution. 33 (7), 1870-1874 (2016).
  31. Edgar, R. C. MUSCLE: Multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  32. Taddei-Ferretti, C., Musio, C., Santillo, S., Cotugno, A. The photobiology of Hydra's periodic activity. Hydrobiologia. 530, 129-134 (2004).
  33. Chapman, J. A., et al. The dynamic genome of Hydra. Nature. 464 (7288), 592-596 (2010).
  34. Macias-Muñoz, A., Rangel Olguin, A. G., Briscoe, A. D. Evolution of phototransduction genes in Lepidoptera. Genome Biology and Evolution. 11 (8), 2107-2124 (2019).
  35. Macias-Munõz, A., Murad, R., Mortazavi, A. Molecular evolution and expression of opsin genes in Hydra vulgaris. BMC Genomics. 20 (1), (2019).
  36. Picelli, S., et al. Full-length RNA-seq from single cells using Smart-seq2. Nature Protocols. 9 (1), 171-181 (2014).
  37. Tavares, L., Alves, P. M., Ferreira, R. B., Santos, C. N. Comparison of different methods for DNA-free RNA isolation from SK-N-MC neuroblastoma. BMC research notes. 4, 3 (2011).
  38. Johnson, M. T. J., et al. Evaluating Methods for Isolating Total RNA and Predicting the Success of Sequencing Phylogenetically Diverse Plant Transcriptomes. PLoS ONE. 7 (11), (2012).
  39. Zhao, S., Zhang, Y., Gamini, R., Zhang, B., Von Schack, D. Evaluation of two main RNA-seq approaches for gene quantification in clinical RNA sequencing: PolyA+ selection versus rRNA depletion. Scientific Reports. 8 (1), 1-12 (2018).
  40. Zhao, S., et al. Comparison of stranded and non-stranded RNA-seq transcriptome profiling and investigation of gene overlap. BMC Genomics. 16 (1), 1-14 (2015).
  41. Corley, S. M., MacKenzie, K. L., Beverdam, A., Roddam, L. F., Wilkins, M. R. Differentially expressed genes from RNA-Seq and functional enrichment results are affected by the choice of single-end versus paired-end reads and stranded versus non-stranded protocols. BMC Genomics. 18 (1), 1-13 (2017).
  42. Haas, B. J., et al. De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis. Nature Protocols. 8 (8), 1494-1512 (2013).
  43. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature biotechnology. 33 (3), 290-295 (2015).
  44. Bray, N. L., Pimentel, H., Melsted, P., Pachter, L. Near-optimal probabilistic RNA-seq quantification. Nature Biotechnology. 34 (5), 525-527 (2016).
  45. Patro, R., Duggal, G., Love, M. I., Irizarry, R. A., Kingsford, C. Salmon provides fast and bias-aware quantification of transcript expression. Nature Methods. 14 (4), 417-419 (2017).
  46. Araujo, F. A., Barh, D., Silva, A., Guimarães, L., Thiago, R. OPEN GO FEAT a rapid web-based functional annotation tool for genomic and transcriptomic data. , 8-11 (2018).
  47. Huerta-Cepas, J., et al. Fast genome-wide functional annotation through orthology assignment by eggNOG-mapper. Molecular Biology and Evolution. 34 (8), 2115-2122 (2017).
  48. Huerta-Cepas, J., et al. EggNOG 5.0: A hierarchical, functionally and phylogenetically annotated orthology resource based on 5090 organisms and 2502 viruses. Nucleic Acids Research. 47, 309-314 (2019).
  49. Törönen, P., Medlar, A., Holm, L. PANNZER2: A rapid functional annotation web server. Nucleic Acids Research. 46, 84-88 (2018).
  50. Robinson, M., Mccarthy, D., Chen, Y., Smyth, G. K. edgeR differential expression analysis of digital gene expression data User's Guide. , (2013).
  51. Huang, D. W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  52. Huang, D. W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: Paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  53. Letunic, I., Bork, P. Interactive tree of life (iTOL) v3: an online tool for the display and annotation of phylogenetic and other trees. Nucleic acids research. 44, 242-245 (2016).

Tags

Biologi Utgave 171 bioinformatikk genutvidelser BLAST transkripsjon genom MEGA
En bioinformatikkrørledning for undersøkelse av molekylær evolusjon og genuttrykk ved hjelp av RNA-seq
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Macias-Muñoz, A., Mortazavi, A. More

Macias-Muñoz, A., Mortazavi, A. A Bioinformatics Pipeline for Investigating Molecular Evolution and Gene Expression using RNA-seq. J. Vis. Exp. (171), e61633, doi:10.3791/61633 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter