Summary

Identifikation af Nøglefaktorer Regulering Self-fornyelse og differentiering i EML Hæmatopoietisk precursorceller ved RNA-sekventering Analysis

Published: November 11, 2014
doi:

Summary

RNA-sekventering og bioinformatik analyser blev anvendt til at identificere betydeligt, differentielt udtrykte transkriptionsfaktorer i Lin-CD34 + Lin-CD34 subpopulationer af mus EMLcells. Disse transkriptionsfaktorer kan spille en vigtig rolle i fastsættelsen af ​​kontakten mellem selvfornyende Lin-CD34 + og delvist differentierede Lin-CD34-celler.

Abstract

Hæmatopoietiske stamceller (HSC'er) anvendes klinisk til transplantation behandling at genopbygge en patients hæmatopoietiske system i mange sygdomme såsom leukæmi og lymfom. Belyse de mekanismer, der styrer HSC'er selvfornyelse og differentiering er vigtig for anvendelsen af ​​HSC'er for forskning og kliniske anvendelser. Dog er det muligt at opnå store mængder af HSC'er på grund af deres manglende evne til at proliferere in vitro. At overvinde denne forhindring, vi anvendte en muse knoglemarvsafledte cellelinie EML (erythroid, myeloid og lymfatisk) cellelinie, som en model for denne undersøgelse.

RNA-sekventering (RNA-Seq) er i stigende grad blevet anvendt til at erstatte microarray for genekspressionsstudier. Vi rapporterer her en detaljeret metode til at bruge RNA-Seq-teknologi til at undersøge de potentielle nøglefaktorer i reguleringen af ​​EML celle selvfornyelse og differentiering. Oplysningerne i dette papir protokol er opdelt i tre dele. Det første part forklarer, hvordan kultur EML celler og separat Lin-CD34 + og Lin-CD34-celler. Den anden del af protokollen giver detaljerede procedurer for total RNA forberedelse og den efterfølgende bibliotek konstruktion for high-throughput sekventering. Den sidste del beskriver fremgangsmåden for RNA-Seq dataanalyse og forklarer, hvordan man bruger data til at identificere differentielt udtrykte transkriptionsfaktorer mellem Lin-CD34 + og Lin-CD34-celler. De mest markant differentielt udtrykte transkriptionsfaktorer blev identificeret til at være de potentielle vigtige regulatorer styrer EML celle selvfornyelse og differentiering. I diskussionen del af dette dokument, vi fremhæve de vigtigste skridt for en vellykket gennemførelse af dette eksperiment.

Sammenfattende er dette papir tilbyder en metode til at bruge RNA-Seq teknologi til at identificere potentielle regulatorer af selvfornyelse og differentiering i EML celler. De vigtigste faktorer, der er udsat for downstream funktionel analyse in vitro og in vivo.

Introduction

Hæmatopoietiske stamceller er sjældne blodceller, som hovedsagelig bor i den voksne knoglemarv niche. De er ansvarlige for produktionen af nødvendige for at genopbygge blod celler og immunforsvar 1. Som en slags stamceller, HSC'er er i stand til både selvfornyelse og differentiering. Belyse mekanismer, der styrer skæbne afgørelse af HSC'er, mod enten selv-fornyelse eller differentiering, vil tilbyde værdifuld vejledning om manipulation af HSC'er for blodsygdom forsker og klinisk brug 2. Et problem, som forskerne står over for, er, at HSC'er kan fastholdes og udbygges in vitro i meget begrænset omfang; størstedelen af deres afkom er delvist differentieret i kultur 2.

Med henblik på at identificere de vigtigste regulatorer, der styrer de processer af selv-fornyelse og differentiering ved en genom-plan, vi brugte en mus primitive hæmatopoietiske cellelinie EML som modelsystem. Ther cellelinie blev afledt fra murin knoglemarv 3,4. Når de fodres med forskellige vækstfaktorer, kan EML-celler differentierer i erythroid, myeloid og lymfoide celler in vitro 5. Vigtigere, kan denne cellelinie opformeres i store mængder i dyrkningsmedium indeholdende stamcelle faktor (SCF) og stadig bevarer deres multipotentiality. EML-celler kan adskilles i subpopulationer af selvfornyende Lin-SCA + CD34 + og delvist differentierede Lin-SCA-CD34 celler baseret på overflademarkører CD34 og SCA 6. Svarende til kortsigtede HSC'er, SCA + CD34 + celler er i stand til selv-fornyelse. Ved behandling med SCF, Lin-SCA + CD34 + celler kan hurtigt regenerere en blandet population af Lin-SCA + CD34 + Lin-SCA-CD34-celler og fortsætte med at formere 6. De to populationer er ens i morfologi og har tilsvarende niveauer af c-kit-mRNA og protein 6. Lin-SCA-CD34 celler er i stand til at udbrede i medier indeholdende IL-3 i stedet for SCF3. Unveiling de centrale tilsynsmyndigheder i EML celleskæbnen beslutning vil tilbyde en bedre forståelse af cellulære og molekylære mekanismer i begyndelsen udviklingsmæssige overgang under hæmatopoiese.

For at undersøge de underliggende molekylære forskelle mellem selvfornyende Lin-SCA + CD34 + og delvist differentierede Lin-SCA-CD34-celler anvendte vi RNA-Seq at identificere differentielt udtrykte gener. I særdeleshed har vi fokus på transkriptionsfaktorer, som transkriptionsfaktorer er afgørende for celle skæbne. RNA-Seq er en nyudviklet metode, der udnytter mulighederne i næste generation sekventering (NGS) teknologier til at profilere og kvantificere RNA'er transskriberet fra genom 7,8. Kort fortalt, total RNA er poly-A-udvalgt og fragmenteret som den første template.The RNA-template derefter omdannes til cDNA under anvendelse af revers transkriptase. For at kortlægge fuld længde RNA-transkripter ved anvendelse af intakt, ikke-nedbrudt RNA til konstruktion af cDNA-bibliotek er vigtig. For purudgøre af sekventering specifikke adaptorsekvenser tilsat til begge ender af cDNA. Så i de fleste tilfælde, er cDNA-molekyler amplificeret ved PCR og sekventeret i en high-throughput måde.

Efter sekventering, læser den resulterende kan justeres til en reference genom og en transkriptom database. Antallet af læser, at kortet til reference-genet tælles og denne information kan anvendes til at estimere genekspression niveau. Den læser kan også samles de novo uden henvisning genom muliggør studiet af transcriptomes i ikke-modelorganismer 9. RNA-seq teknologi er også blevet anvendt til at detektere splejsningsisoformer 10-12, nye transkripter 13 og genfusioner 14. Ud over påvisning af protein-kodende gener, kan RNA-Seq også anvendes til at påvise hidtil ukendte og analysere transkription niveau af ikke-kodende RNA, såsom lang ikke-kodende RNA 15,16, microRNA 17 siRNA etc. 18. På grund af than nøjagtighed af denne fremgangsmåde, er det blevet anvendt til påvisning af enkelt nucleotidvariationer 19,20.

Før fremkomsten af ​​RNA-Seq teknologi, microarray var den vigtigste metode til analyse af genekspression profil. Pre-designede prober syntetiseres og efterfølgende fastgøres til en fast overflade for at danne en microarray slide 21. mRNA ekstraheres og omdannes til cDNA. Under revers transkription proces, fluorescensmærkede nukleotider inkorporeret i cDNA'et, og cDNA kan hybridiseres onto microarray slides. Intensiteten af signalet opsamlet fra et bestemt sted, afhænger af mængden af cDNA-binding til den specifikke probe på dette sted 21. Sammenlignet med RNA-Seq teknologi, microarray har flere begrænsninger. Først microarray bygger på allerede eksisterende viden om gen-anmærkning, mens RNA-Seq teknologi er i stand til at opdage hidtil ukendte udskrifter ved en relativ høj baggrund niveau, hvilket begrænser dets brug, når GEne udtryk er lavt. Desuden RNA-Seq teknologi har langt højere dynamikområde detektion (8000 gange) 7, mens grund baggrund og mætning af signaler, er begrænset for både højt og ydmyg udtrykte gener 7,22 nøjagtigheden af microarray. Endelig microarray prober er forskellige i deres hybridiseringsegenskaber effektivitetsgevinster, der gør resultaterne mindre pålidelige, når man sammenligner de relative ekspressionsniveauer af forskellige transkripter inden for en prøve 23. Selv om RNA-Seq har mange fordele i forhold microarray, dens analyse af data er kompleks. Dette er en af ​​grundene til, at mange forskere stadig bruger microarray stedet for RNA-Seq. Forskellige bioinformatiske værktøjer er nødvendige for RNA-Seq bearbejdning og analyse 24 data.

Blandt flere næste generation sekventering (NGS) platforme, 454, Illumina, solid og Ion Torrent er de mest anvendte dem. 454 var den første kommercielle NGS platform. I modsætning til de andre sekventering platformesåsom Illumina og SOLID, genererer 454 platform længere læse længde (gennemsnitligt 700 basen læser) 25. Længere læser er bedre for første karakterisering af transcriptiome på grund af deres højere samle effektivitet 25. Den største ulempe ved 454 platform er dens høje pris pr megabase af sekvens. Illumina og solid platforme generere læser med øgede tal og korte længder. Omkostningerne pr megabase af sekvensen er meget lavere end 454 platform. På grund af det store antal af kort læser for Illumina og faste platforme, dataanalyse er meget mere regnekraft. Prisen for instrumentet og reagenser til sekventering for Ion Torrent-platformen er billigere og sekventering er kortere 25. Dog er fejlprocenten og omkostningerne pr megabase af sekvens højere sammenlignet med Illumina og solide platforme. Forskellige platforme har deres egne fordele og ulemper og kræver forskellige metoder til dataanalyse. PLAtform bør vælges baseret på sekventering formål og tilgængeligheden af ​​finansiering.

I dette papir, vi tager Illumina RNA-Seq platform som et eksempel. Vi brugte EML celle som et modelsystem til at undersøge de centrale lovgiverne i EML celle selvfornyelse og differentiering, og fremlagt en detaljeret metoder til RNA-Seq bibliotek konstruktion og dataanalyse for beregningsudtrykket niveau og roman udskrift detektion. Vi har vist i vores tidligere publikation, at RNA-seq studie i EML model system 2 når kombineret med funktionelle test (f.eks shRNA knockdown) give en kraftig tilgang i forståelsen af molekylære mekanisme af de tidlige stadier af hæmatopoietisk differentiering, og kan tjene som en model for analyse af celle selvfornyelse og differentiering i almindelighed.

Protocol

1. EML Cellekultur og Adskillelse af Lin-CD34 + Lin-CD34 celler under anvendelse Magnetic Cell Sorting System og fluorescens-aktiveret cellesortering Metode Fremstilling af babyhamsternyre (BHK) cellekulturmedium for stamcelle faktor samling: Kultur BHK-celler i DMEM medium indeholdende 10% FBS i 25 cm2 kolbe (tabel 1) ved 37 ° C, 5% CO 2 i en cellekultur inkubator. Når cellerne vokse til 80-90% sammenflydning, vaskes cellerne en gang med 10 ml PBS. …

Representative Results

For at analysere differentielt udtrykte gener i Lin-CD34 + og Lin-CD34- EML celler, vi brugte RNA-Seq teknologi. Figur 1 viser arbejdsgangen af procedurerne. Efter isolering af linjeforpligtede negative celler ved magnetisk cellesortering, vi adskilt Lin-SCA + CD34 + og Lin-SCA-CD34-celler under anvendelse af FACS Aria. Lin-beriget EML-celler blev farvet med anti-CD34, anti-Sca1 og afstamning cocktail antistoffer. Kun Lin celler blev gated for analyse af Sca1 og CD34-ekspression. To populationer (SCA + …

Discussion

Mammalian transkriptom er meget kompleks 34-38. RNA-Seq teknologi spiller en stadig vigtigere rolle i undersøgelser af transkriptom analyse roman udskrifter afsløring og enkelt nukleotid variation opdagelse etc. Det har mange fordele frem for andre metoder til genekspression analyse. Som nævnt i indledningen, det overvinder de hybridiseringsbetingelser artefakter microarray og kan anvendes til at identificere hidtil ukendte transkripter de novo. En begrænsning af RNA-sekventering …

Disclosures

The authors have nothing to disclose.

Acknowledgements

JQW, SZ, SD and KC are supported by grant from the National Institutes of Health and the Staman Ogilvie Fund—Memorial Hermann Foundation.

Materials

Antibiotic-Antimycotic Invitrogen 15240-062 BHK cell culture
Anti-Mouse CD34 FITC eBioscience 11-0341-81 FACS sorting
Anti-Mouse Ly-6A/E (Sca-1) PE eBioscience 12-5981-81 FACS sorting
APC Mouse Lineage Antibody Cocktail BD Biosciences 558074 FACS sorting
BD FACSAria Cell Sorter BD Biosciences Special offer sysmtem FACS sorting
Corning™ Cell Culture Treated Flasks 75cm2 Corning incorporated 430641 Cell culture
Corning™ Cell Culture Treated Flasks 25cm2 Corning incorporated 430639 Cell culture
Deoxyribonuclease I, Amplification Grade Invitrogen 18068-015 Library preparation
DMEM Invitrogen 11965-092 BHK cell culture
DPBS Gibco 14190 Cell culture
HI FBS  Invitrogen 16140071 BHK cell culture
Horse Serum Invitrogen 16050-122 EML cell culture
IMDM HyClone SH30228.02 EML cell culture
L-Glutamine Invitrogen 25030-081 Cell culture
Lineage Cell Depletion Kit, mouse  Miltenyi Biotec 130-090-858 Isolation of lineage negative cells
NanoVue Plus spectrophotometer  GE Healthcare 28-9569-62 Quality control
Thermo Scientific™ Napco™ 8000 Water-Jacketed CO2 Incubators Thermo Scientific 15-497-002  Cell culture
Penicillin-Streptomycin Invitrogen 15140-122 EML cell culture
TRIzol® Reagent Invitrogen 15596-018 RNA exraction
TruSeq™ RNA Sample Prep Kit v2 -Set B (48rxn) Illumina RS-122-2002 Library preparation
2100 Electrophoresis Bioanalyzer Instrument  Agilent G2939AA Quality control
0.25% Trypsin-EDTA Gibco 25200 Cell culture
0.45 µm Syringe Filters Nalgene 190-2545 Cell culture

References

  1. Chambers, S. M., Goodell, M. A. Hematopoietic stem cell aging: wrinkles in stem cell potential. Stem Cell Rev. 3, 201-211 (2007).
  2. Wu, J. Q., et al. Tcf7 is an important regulator of the switch of self-renewal and differentiation in a multipotential hematopoietic cell line. PLoS genetics. 8, (2012).
  3. Ye, Z. J., et al. Complex interactions in EML cell stimulation by stem cell factor and IL-3. Proceedings of the National Academy of Sciences of the United States of America. 108, 4882-4887 (2011).
  4. Tsai, S., Bartelmez, S., Sitnicka, E., Collins, S. Lymphohematopoietic progenitors immortalized by a retroviral vector harboring a dominant-negative retinoic acid receptor can recapitulate lymphoid, myeloid, and erythroid development. Genes Dev. 8, 2831-2841 (1994).
  5. Weiler, S. R., et al. D3: a gene induced during myeloid cell differentiation of Linlo c-Kit+ Sca-1(+) progenitor cells. Blood. 93, 527-536 (1999).
  6. Ye, Z. J., Kluger, Y., Lian, Z., Weissman, S. M. Two types of precursor cells in a multipotential hematopoietic cell line. Proc Natl Acad Sci U S A. 102, 18461-18466 (2005).
  7. Wang, Z., Gerstein, M., Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nature reviews. Genetics. 10, 57-63 (2009).
  8. Chu, Y., Corey, D. R. RNA sequencing: platform selection, experimental design, and data interpretation. Nucleic acid therapeutics. 22, 271-274 (2012).
  9. Hornett, E. A., Wheat, C. W. Quantitative RNA-Seq analysis in non-model species: assessing transcriptome assemblies as a scaffold and the utility of evolutionary divergent genomic reference species. BMC genomics. 13, 361 (2012).
  10. Eswaran, J., et al. RNA sequencing of cancer reveals novel splicing alterations. Scientific reports. 3, 1689 (2013).
  11. Wang, E. T., et al. Alternative isoform regulation in human tissue transcriptomes. Nature. 456, 470-476 (2008).
  12. Wu, J. Q., et al. Dynamic transcriptomes during neural differentiation of human embryonic stem cells revealed by short, long, and paired-end sequencing. Proceedings of the National Academy of Sciences of the United States of America. 107, 5254-5259 (2010).
  13. Loraine, A. E., McCormick, S., Estrada, A., Patel, K., Qin, P. RNA-seq of Arabidopsis pollen uncovers novel transcription and alternative splicing. Plant physiology. 162, 1092-1109 (2013).
  14. Edgren, H., et al. Identification of fusion genes in breast cancer by paired-end RNA-sequencing. Genome biology. 12, 6 (2011).
  15. Ilott, N. E., Ponting, C. P. Predicting long non-coding RNAs using RNA sequencing. Methods. 63, 50-59 (2013).
  16. Sun, L., et al. Prediction of novel long non-coding RNAs based on RNA-Seq data of mouse Klf1 knockout study. BMC bioinformatics. 13, 331 (2012).
  17. Luo, S. MicroRNA expression analysis using the Illumina microRNA-Seq Platform. Methods in molecular biology. 822, 183-188 (2012).
  18. Bolduc, F., Hoareau, C., St-Pierre, P., Perreault, J. P. In-depth sequencing of the siRNAs associated with peach latent mosaic viroid infection. BMC molecular biology. 11, 16 (2010).
  19. Chepelev, I., Wei, G., Tang, Q., Zhao, K. Detection of single nucleotide variations in expressed exons of the human genome using RNA-Seq. Nucleic acids research. 37, 106 (2009).
  20. Djari, A., et al. Gene-based single nucleotide polymorphism discovery in bovine muscle using next-generation transcriptomic sequencing. BMC genomics. 14, 307 (2013).
  21. Murphy, D. Gene expression studies using microarrays: principles, problems, and prospects. Advances in physiology education. 26, 256-270 (2002).
  22. Chen, K., et al. RNA-seq characterization of spinal cord injury transcriptome in acute/subacute phases: a resource for understanding the pathology at the systems level. PLoS one. 8, 72567 (2013).
  23. Marioni, J. C., Mason, C. E., Mane, S. M., Stephens, M., Gilad, Y. RNA-seq: an assessment of technical reproducibility and comparison with gene expression arrays. Genome research. 18, 1509-1517 (2008).
  24. Ramskold, D., Kavak, E., Sandberg, R. How to analyze gene expression using RNA-sequencing data. Methods in molecular biology. 802, 259-274 (2012).
  25. Glenn, T. C. Field guide to next-generation DNA sequencers. Mol Ecol Resour. 11, 759-769 (2011).
  26. Trapnell, C., et al. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Nature protocols. 7, 562-578 (2012).
  27. Trapnell, C., Pachter, L., Salzberg, S. L. TopHat: discovering splice junctions with RNA-Seq. Bioinformatics. 25, 1105-1111 (2009).
  28. Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome biology. 10, 25 (2009).
  29. Trapnell, C., et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nature. 28, 511-515 (2010).
  30. Anders, S., Huber, W. Differential expression analysis for sequence count data. Genome biology. 11, 106 (2010).
  31. Quinlan, A. R., Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26, 841-842 (2010).
  32. Cheranova, D., et al. RNA-seq analysis of transcriptomes in thrombin-treated and control human pulmonary microvascular endothelial cells. J Vis Exp. , (2013).
  33. Zhang, H. M., et al. AnimalTFDB: a comprehensive animal transcription factor database. Nucleic acids research. 40, 144-149 (2012).
  34. Wu, J. Q., et al. Systematic analysis of transcribed loci in ENCODE regions using RACE sequencing reveals extensive transcription in the human genome. Genome Biol. 9, 3 (2008).
  35. Wu, J. Q., et al. Large-scale RT-PCR recovery of full-length cDNA clones. Biotechniques. 36, 690-696 (2004).
  36. Wu, J. Q., Shteynberg, D., Arumugam, M., Gibbs, R. A., Brent, M. R. Identification of rat genes by TWINSCAN gene prediction, RT-PCR, and direct sequencing. Genome Res. 14, 665-671 (2004).
  37. Dewey, C., et al. Accurate identification of novel human genes through simultaneous gene prediction in human, mouse, and rat. Genome Res. 14, 661-664 (2004).
  38. Wu, J. . Characterize Mammalian Transcriptome Complexity. , (2011).

Play Video

Cite This Article
Zong, S., Deng, S., Chen, K., Wu, J. Q. Identification of Key Factors Regulating Self-renewal and Differentiation in EML Hematopoietic Precursor Cells by RNA-sequencing Analysis. J. Vis. Exp. (93), e52104, doi:10.3791/52104 (2014).

View Video