Summary

Identifisering av nøkkelfaktorene Reguleringsselvfornyelse og differensiering i EML Hematopoietiske forløperceller av RNA-sekvense Analysis

Published: November 11, 2014
doi:

Summary

RNA-sekvensering og bioinformatikk analyser ble brukt til å identifisere betydelig og forskjellig uttrykt transkripsjonsfaktorer i Lin-CD34 + og Lin-CD34- subpopulasjoner av muse EMLcells. Disse transkripsjonsfaktorer kan spille en viktig rolle i å bestemme veksle mellom selvfornyende Lin-CD34 + og delvis differensiert Lin-CD34- celler.

Abstract

Anvendes hematopoetiske stamceller (HSCs) for klinisk transplantasjon behandling for å gjenoppbygge en pasients hematopoetiske system i mange sykdommer slik som leukemi og lymfom. Belyse mekanismene som kontrollerer HSCs selvfornyelse og differensiering er viktig for anvendelse av HSCs for forskning og kliniske anvendelser. Imidlertid er det ikke mulig å oppnå store mengder av HSCs på grunn av deres manglende evne til å proliferere in vitro. For å overvinne dette hinderet, brukte vi en mus benmarg avledet cellelinje, EML (erytroid, myelogen og lymfatisk) cellelinje, som et modellsystem for denne studien.

RNA-sekvensering (RNA-Seq) har blitt stadig mer brukt til å erstatte microarray for genuttrykk studier. Vi rapporterer her en detaljert metode for å bruke RNA-Seq teknologi for å undersøke potensielle viktige faktorer i regulering av EML celle selvfornyelse og differensiering. Protokollen gitt i denne artikkelen er delt inn i tre deler. Den første part forklarer hvordan kultur EML celler og separat Lin-CD34 + og Lin-CD34- celler. Den andre del av protokollen gir detaljerte prosedyrer for total RNA fremstillingen og den etterfølgende bibliotek konstruksjon for high-throughput-sekvensering. Den siste delen beskriver metoden for RNA-Seq dataanalyse og forklarer hvordan å bruke dataene til å identifisere forskjellig uttrykt transkripsjonsfaktorer mellom Lin-CD34 + og Lin-CD34- celler. De mest markant forskjellig uttrykt transkripsjonsfaktorer ble identifisert til å være de potensielle nøkkel regulatorer kontrollerende EML celle selvfornyelse og differensiering. I diskusjonen delen av dette papiret, vi fremheve de viktigste trinnene for vellykket gjennomføring av dette eksperimentet.

Oppsummert gir dette papiret en metode for å bruke RNA-Seq teknologi for å identifisere potensielle regulatorer av selvfornyelse og differensiering i EML celler. De viktigste faktorene er utsatt for nedstrøms funksjonell analyse in vitro, og jegn vivo.

Introduction

Blodkreft stamceller er sjeldne blodceller som ligger hovedsakelig i voksen benmarg nisje. De er ansvarlig for produksjonen av celler som kreves for å fylle blodet og immunsystemet en. Som en slags stamceller, HSCs er i stand til både selvfornyelse og differensiering. Belyse mekanismene som styrer skjebnen avgjørelse HSCs, mot enten selvfornyelse eller differensiering, vil gi verdifull veiledning om manipulering av HSCs for blodsykdom forskere og klinisk bruk 2. Ett problem som møter forskerne er at HSCs kan opprettholdes og utvides in vitro i svært begrenset grad; det store flertallet av deres avkom er delvis differensiert i kultur 2.

For å identifisere viktige regulatorer som styrer prosessene i selvfornyelse og differensiering på et genom-wide skala, har vi brukt en mus primitive blodkreft stamcellelinje EML som modellsystem. Ther cellelinjen ble avledet fra murin benmarg 3,4. Når fôret med ulike vekstfaktorer, kan EML cellene differensieres til erythroid, myeloid og lymfoide celler in vitro 5. Viktigere, kan denne cellelinjen spres i store mengder i kulturmedium som inneholder stamcellefaktor (SCF), og fremdeles beholde sin multipotentiality. EML celler kan deles inn i subpopulasjoner av selvfornyende Lin-SCA + CD34 + og delvis differensiert Lin-SCA-CD34- celler basert på overflatemarkører CD34 og SCA 6. I likhet med kortsiktig HSCs, SCA + CD34 + celler er i stand til selvfornyelse. Når de ble behandlet med SCF, Lin-SCA + CD34 + celler kan raskt regenerere en blandet befolkning av Lin-SCA + CD34 + og Lin-SCA-CD34- celler og fortsette å spre seg seks. De to populasjoner er like i morfologi og har tilsvarende nivåer av c-kit-mRNA og protein 6. Lin-SCA-CD34–celler er i stand til å spre i medier inneholdende IL-3 i stedet for 3-SCF. Unveiling de sentrale myndigheter i EML celle skjebne beslutning vil gi bedre forståelse av cellulære og molekylære mekanismer tidlig i utviklings overgang under hematopoiesen.

For å undersøke de underliggende molekylære forskjeller mellom selvfornyende Lin-SCA + CD34 + og delvis differensiert Lin-SCA-CD34- celler, brukte vi RNA-Seq å identifisere differensielt uttrykte gener. Spesielt har vi fokus på transkripsjonsfaktorer, som transkripsjonsfaktorer er avgjørende for celle skjebne. RNA-Seq er en nylig utviklet tilnærming som utnytter mulighetene i neste generasjons sekvensering (NGS) teknologi for å profilere og kvantifisere RNA transkribert fra genom 7,8. I korte trekk, er total-RNA poly-A-utvalgt og fragmentert som den innledende template.The RNA-templat blir deretter omdannet til cDNA ved hjelp av revers transkriptase. For å kartlegge full-lengde RNA-transkripter, ved hjelp av intakt, ikke-RNA degradert for å konstruere cDNA bibliotek er viktig. For den purpositur for sekvensering, er spesifikke sekvenser adapter montert på begge endene av cDNA. Deretter, i de fleste tilfeller, blir cDNA-molekyler amplifisert ved PCR og sekvensert i en high-throughput måte.

Etter sekvensering, den resulterende leser kan justeres til et referanse genom og en transkriptom database. Antallet lesninger som kartet til referanse genet blir tellet, og denne informasjonen kan brukes til å estimere genekspresjon nivå. Den leser kan også settes sammen uten de novo en referanse genom, muliggjøre studier av transcriptomes i ikke-modellorganismer 9. RNA-seq teknologi har også blitt anvendt for å detektere spleise isoformene 10-12 nye transkripter, 13 og 14 genfusjoner. I tillegg til påvisning av protein-kodende gener, kan RNA-Seq også brukes til å detektere og analysere nye transkripsjonsnivå av ikke-kodende RNA, slik som lange ikke-kodende RNA 15,16, mikroRNA 17, siRNA etc. 18. På grunn av tHan Nøyaktigheten av denne metode er det blitt benyttet for deteksjon av enkelt nukleotidvariasjoner 19,20.

Før advent av RNA-Seq teknologi, microarray var den viktigste metoden som brukes for å analysere genuttrykk profil. Forhånds utformet prober syntetisert og deretter festet til en fast overflate for å danne en microarray glide 21. mRNA utvinnes og omdannes til cDNA. Under revers transkripsjonsprosessen, blir fluorescerende merkede nukleotider innlemmes i cDNA og cDNA kan bli hybridisert til de microarray lysbilder. Intensiteten av signalet hentet fra et bestemt sted, avhenger av mengden av cDNA-binding til den spesifikke sonde på det punktet 21. Sammenlignet med RNA-Seq teknologi, har microarray flere begrensninger. Først avhengig microarray på pre-eksisterende kunnskap om gen merknader, mens RNA-Seq teknologi er i stand til å oppdage nye transkripsjoner ved relativ høyt nivå bakgrunn, noe som begrenser bruken når gene uttrykk nivået er lavt. Dessuten har den RNA-Seq teknologi mye høyere dynamisk område for påvisning (8000 ganger) 7, mens på grunn av bakgrunn og metning av signaler, er begrenset for både høyt og ydmyk uttrykte gener 7,22 nøyaktigheten av microarray. Til slutt, microarray sonder varierer i sine hybridisering effektivitet, som gjør resultatene mindre pålitelige når man sammenligner relative uttrykk nivåer av ulike transkripsjoner innen én prøve 23. Selv om RNA-Seq har mange fordeler over microarray, er dens dataanalyse kompleks. Dette er en av grunnene til at mange forskere fortsatt microarray benytter i stedet for RNA-Seq. Ulike bioinformatiske verktøy er nødvendig for RNA-Seq databehandling og analyse 24.

Blant flere neste generasjons sekvensering (NGS) plattformer, 454, Illumina, SOLID og Ion Torrent er de mest brukte. 454 var den første kommersielle NGS plattformen. I motsetning til de andre sekvenseringsplattformeneslik som Illumina og SOLID, genererer 454 plattformen lenger lese lengde (gjennomsnittlig 700 basis leser) 25. Lengre leser er bedre for innledende karakterisering av transcriptiome grunn av deres høyere montere effektivitet 25. Den viktigste ulempen av plattformen 454 er den høye kostnaden per megabase av sekvensen. Den Illumina og SOLID plattformer generere lyder med økte tall og korte lengder. Kostnaden per megabase av sekvensen er mye lavere enn 454-plattformen. På grunn av det store antallet av kort leser for Illumina og SOLID plattformer, dataanalyse mye mer beregningskrevende. Prisen på instrument og reagenser for sekvensering for Ion Torrent plattformen er billigere og sekvensering er kortere 25. Imidlertid er feilraten og kostnaden per megabase av sekvens høyere sammenlignet med Illumina og SOLID plattformer. Ulike plattformer har sine egne fordeler og ulemper, og krever ulike metoder for dataanalyse. Den plaTForm bør velges basert på sekvense formål og tilgjengeligheten av finansiering.

I denne artikkelen tar vi Illumina RNA-Seq-plattformen som et eksempel. Vi brukte EML celle som et modellsystem for å undersøke de sentrale myndigheter i EML celle selvfornyelse og differensiering, og ga en detaljert metoder for RNA-Seq bibliotek konstruksjon og dataanalyse for uttrykksnivå beregning og romanen transkripsjon deteksjon. Vi har vist i vårt tidligere publikasjon at RNA-seq studier i modellsystemet EML 2, når kombinert med funksjonstest (f.eks shRNA knockdown) tilveiebringe en kraftig tilnærming i forståelsen av den molekylære mekanismen i de tidlige stadier av hematopoietisk differensiering, og kan tjene som en modell for analyse av celleselvfornyelse og differensiering generelt.

Protocol

1. EML Cell Kultur og Separering av Lin-CD34 + og Lin-CD34- Cells hjelp Magnetic Cell Sorting System og fluorescensaktivert Cell sorteringsmetode Utarbeidelse av babyen hamster nyre (BHK) celledyrkingsmedium for stamcellefaktor samling: Kultur BHK-celler i DMEM-medium inneholdende 10% FBS i 25 cm2 kolbe (tabell 1) ved 37 ° C, 5% CO2 i en cellekulturinkubator. Når cellene vokse til 80-90% konfluens, vaskes cellene en gang med 10 ml PBS. Tilsett 5 ml a…

Representative Results

For å analysere differensielt uttrykte gener i Lin-CD34 + og Lin-CD34- EML celler, brukte vi RNA-Seq teknologi. Figur 1 viser arbeidsflyten av prosedyrene. Etter isolering av avstamning negative celler ved magnetisk cellesortering, separert vi Lin-SCA + CD34 + og Lin-SCA-CD34- celler ved hjelp av FACS Aria. Lin-beriket EML cellene ble farget med anti-CD34, anti-Sca1 og avstamning cocktail antistoffer. Bare karmene celler ble gated for analyse av Sca1 og CD34 uttrykk. To populasjoner (SCA + CD34 + og SC…

Discussion

Pattedyr transkriptomet er svært kompleks 34-38. RNA-Seq teknologi spiller en stadig viktigere rolle i studier av transkriptom analyse, roman transkripsjoner deteksjon og enkelt nukleotidvariasjon funn etc. Det har mange fordeler fremfor andre metoder genekspresjonsanalyser for. Som nevnt i innledningen, overvinner det hybridiseringsreaksjonene gjenstander av microarray og kan brukes til å identifisere nye transkripsjoner de novo. En begrensning av RNA-sekvensering er relativ kort l…

Disclosures

The authors have nothing to disclose.

Acknowledgements

JQW, SZ, SD and KC are supported by grant from the National Institutes of Health and the Staman Ogilvie Fund—Memorial Hermann Foundation.

Materials

Antibiotic-Antimycotic Invitrogen 15240-062 BHK cell culture
Anti-Mouse CD34 FITC eBioscience 11-0341-81 FACS sorting
Anti-Mouse Ly-6A/E (Sca-1) PE eBioscience 12-5981-81 FACS sorting
APC Mouse Lineage Antibody Cocktail BD Biosciences 558074 FACS sorting
BD FACSAria Cell Sorter BD Biosciences Special offer sysmtem FACS sorting
Corning™ Cell Culture Treated Flasks 75cm2 Corning incorporated 430641 Cell culture
Corning™ Cell Culture Treated Flasks 25cm2 Corning incorporated 430639 Cell culture
Deoxyribonuclease I, Amplification Grade Invitrogen 18068-015 Library preparation
DMEM Invitrogen 11965-092 BHK cell culture
DPBS Gibco 14190 Cell culture
HI FBS  Invitrogen 16140071 BHK cell culture
Horse Serum Invitrogen 16050-122 EML cell culture
IMDM HyClone SH30228.02 EML cell culture
L-Glutamine Invitrogen 25030-081 Cell culture
Lineage Cell Depletion Kit, mouse  Miltenyi Biotec 130-090-858 Isolation of lineage negative cells
NanoVue Plus spectrophotometer  GE Healthcare 28-9569-62 Quality control
Thermo Scientific™ Napco™ 8000 Water-Jacketed CO2 Incubators Thermo Scientific 15-497-002  Cell culture
Penicillin-Streptomycin Invitrogen 15140-122 EML cell culture
TRIzol® Reagent Invitrogen 15596-018 RNA exraction
TruSeq™ RNA Sample Prep Kit v2 -Set B (48rxn) Illumina RS-122-2002 Library preparation
2100 Electrophoresis Bioanalyzer Instrument  Agilent G2939AA Quality control
0.25% Trypsin-EDTA Gibco 25200 Cell culture
0.45 µm Syringe Filters Nalgene 190-2545 Cell culture

References

  1. Chambers, S. M., Goodell, M. A. Hematopoietic stem cell aging: wrinkles in stem cell potential. Stem Cell Rev. 3, 201-211 (2007).
  2. Wu, J. Q., et al. Tcf7 is an important regulator of the switch of self-renewal and differentiation in a multipotential hematopoietic cell line. PLoS genetics. 8, (2012).
  3. Ye, Z. J., et al. Complex interactions in EML cell stimulation by stem cell factor and IL-3. Proceedings of the National Academy of Sciences of the United States of America. 108, 4882-4887 (2011).
  4. Tsai, S., Bartelmez, S., Sitnicka, E., Collins, S. Lymphohematopoietic progenitors immortalized by a retroviral vector harboring a dominant-negative retinoic acid receptor can recapitulate lymphoid, myeloid, and erythroid development. Genes Dev. 8, 2831-2841 (1994).
  5. Weiler, S. R., et al. D3: a gene induced during myeloid cell differentiation of Linlo c-Kit+ Sca-1(+) progenitor cells. Blood. 93, 527-536 (1999).
  6. Ye, Z. J., Kluger, Y., Lian, Z., Weissman, S. M. Two types of precursor cells in a multipotential hematopoietic cell line. Proc Natl Acad Sci U S A. 102, 18461-18466 (2005).
  7. Wang, Z., Gerstein, M., Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nature reviews. Genetics. 10, 57-63 (2009).
  8. Chu, Y., Corey, D. R. RNA sequencing: platform selection, experimental design, and data interpretation. Nucleic acid therapeutics. 22, 271-274 (2012).
  9. Hornett, E. A., Wheat, C. W. Quantitative RNA-Seq analysis in non-model species: assessing transcriptome assemblies as a scaffold and the utility of evolutionary divergent genomic reference species. BMC genomics. 13, 361 (2012).
  10. Eswaran, J., et al. RNA sequencing of cancer reveals novel splicing alterations. Scientific reports. 3, 1689 (2013).
  11. Wang, E. T., et al. Alternative isoform regulation in human tissue transcriptomes. Nature. 456, 470-476 (2008).
  12. Wu, J. Q., et al. Dynamic transcriptomes during neural differentiation of human embryonic stem cells revealed by short, long, and paired-end sequencing. Proceedings of the National Academy of Sciences of the United States of America. 107, 5254-5259 (2010).
  13. Loraine, A. E., McCormick, S., Estrada, A., Patel, K., Qin, P. RNA-seq of Arabidopsis pollen uncovers novel transcription and alternative splicing. Plant physiology. 162, 1092-1109 (2013).
  14. Edgren, H., et al. Identification of fusion genes in breast cancer by paired-end RNA-sequencing. Genome biology. 12, 6 (2011).
  15. Ilott, N. E., Ponting, C. P. Predicting long non-coding RNAs using RNA sequencing. Methods. 63, 50-59 (2013).
  16. Sun, L., et al. Prediction of novel long non-coding RNAs based on RNA-Seq data of mouse Klf1 knockout study. BMC bioinformatics. 13, 331 (2012).
  17. Luo, S. MicroRNA expression analysis using the Illumina microRNA-Seq Platform. Methods in molecular biology. 822, 183-188 (2012).
  18. Bolduc, F., Hoareau, C., St-Pierre, P., Perreault, J. P. In-depth sequencing of the siRNAs associated with peach latent mosaic viroid infection. BMC molecular biology. 11, 16 (2010).
  19. Chepelev, I., Wei, G., Tang, Q., Zhao, K. Detection of single nucleotide variations in expressed exons of the human genome using RNA-Seq. Nucleic acids research. 37, 106 (2009).
  20. Djari, A., et al. Gene-based single nucleotide polymorphism discovery in bovine muscle using next-generation transcriptomic sequencing. BMC genomics. 14, 307 (2013).
  21. Murphy, D. Gene expression studies using microarrays: principles, problems, and prospects. Advances in physiology education. 26, 256-270 (2002).
  22. Chen, K., et al. RNA-seq characterization of spinal cord injury transcriptome in acute/subacute phases: a resource for understanding the pathology at the systems level. PLoS one. 8, 72567 (2013).
  23. Marioni, J. C., Mason, C. E., Mane, S. M., Stephens, M., Gilad, Y. RNA-seq: an assessment of technical reproducibility and comparison with gene expression arrays. Genome research. 18, 1509-1517 (2008).
  24. Ramskold, D., Kavak, E., Sandberg, R. How to analyze gene expression using RNA-sequencing data. Methods in molecular biology. 802, 259-274 (2012).
  25. Glenn, T. C. Field guide to next-generation DNA sequencers. Mol Ecol Resour. 11, 759-769 (2011).
  26. Trapnell, C., et al. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Nature protocols. 7, 562-578 (2012).
  27. Trapnell, C., Pachter, L., Salzberg, S. L. TopHat: discovering splice junctions with RNA-Seq. Bioinformatics. 25, 1105-1111 (2009).
  28. Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome biology. 10, 25 (2009).
  29. Trapnell, C., et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nature. 28, 511-515 (2010).
  30. Anders, S., Huber, W. Differential expression analysis for sequence count data. Genome biology. 11, 106 (2010).
  31. Quinlan, A. R., Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26, 841-842 (2010).
  32. Cheranova, D., et al. RNA-seq analysis of transcriptomes in thrombin-treated and control human pulmonary microvascular endothelial cells. J Vis Exp. , (2013).
  33. Zhang, H. M., et al. AnimalTFDB: a comprehensive animal transcription factor database. Nucleic acids research. 40, 144-149 (2012).
  34. Wu, J. Q., et al. Systematic analysis of transcribed loci in ENCODE regions using RACE sequencing reveals extensive transcription in the human genome. Genome Biol. 9, 3 (2008).
  35. Wu, J. Q., et al. Large-scale RT-PCR recovery of full-length cDNA clones. Biotechniques. 36, 690-696 (2004).
  36. Wu, J. Q., Shteynberg, D., Arumugam, M., Gibbs, R. A., Brent, M. R. Identification of rat genes by TWINSCAN gene prediction, RT-PCR, and direct sequencing. Genome Res. 14, 665-671 (2004).
  37. Dewey, C., et al. Accurate identification of novel human genes through simultaneous gene prediction in human, mouse, and rat. Genome Res. 14, 661-664 (2004).
  38. Wu, J. . Characterize Mammalian Transcriptome Complexity. , (2011).

Play Video

Cite This Article
Zong, S., Deng, S., Chen, K., Wu, J. Q. Identification of Key Factors Regulating Self-renewal and Differentiation in EML Hematopoietic Precursor Cells by RNA-sequencing Analysis. J. Vis. Exp. (93), e52104, doi:10.3791/52104 (2014).

View Video