Identification of Key Factors Regulating Self-renewal and Differentiation in EML Hematopoietic Precursor Cells by RNA-sequencing Analysis

Shan Zong; Shuyun Deng; Kenian Chen; Jia Qian Wu

doi:10.3791/52104

JoVE Journal > Biology

Please note that all translations are automatically generated. Click here for the English version.

Biology

Identification des facteurs clés de régulation auto-renouvellement et de différenciation dans les cellules hématopoïétiques précurseurs EML par l'analyse de l'ARN-séquençage

Published: November 11, 2014

doi:

10.3791/52104

Shan Zong*¹, Shuyun Deng*¹, Kenian Chen, Jia Qian Wu

¹The Vivian L. Smith Department of Neurosurgery, Center for Stem Cell and Regenerative Medicine, University of Texas Health Science Center,The University of Texas Graduate School of Biomedical Sciences at Houston

Summary

Analyses ARN de séquençage et de bioinformatique ont été utilisés pour identifier les facteurs de transcription de manière significative et exprimés de manière différentielle dans des sous-populations Lin-CD34 + et CD34 Lin-des EMLcells de souris. Ces facteurs de transcription peuvent jouer un rôle important dans la détermination de l'interrupteur entre les cellules Lin-CD34 auto-renouvellement Lin-CD34 + et partiellement différenciés.

Abstract

Les cellules souches hématopoïétiques (CSH) sont utilisés en clinique pour le traitement de la greffe à reconstruire le système hématopoïétique d'un patient dans de nombreuses maladies telles que la leucémie et le lymphome. Élucider les mécanismes contrôlant CSH auto-renouvellement et de différenciation est important pour l'application de CSH pour la recherche et les utilisations cliniques. Cependant, il est impossible d'obtenir des CSH en grande quantité en raison de leur incapacité à proliférer in vitro. Pour surmonter cet obstacle, nous avons utilisé une lignée de cellules dérivées de la moelle osseuse de souris, la lignée cellulaire EML (érythroïde, myéloïde et lymphoïde), en tant que système modèle pour cette étude.

ARN-séquençage (ARN-Seq) a été de plus en plus utilisés pour remplacer les puces à ADN pour les études d'expression génique. Nous rapportons ici une méthode détaillée de l'utilisation de la technologie de l'ARN-Seq pour enquêter sur les facteurs clés potentiels dans la régulation de la cellule EML auto-renouvellement et de différenciation. Le protocole fourni dans le présent document est divisé en trois parties. La première part explique comment la culture de cellules EML et séparé Lin-CD34 + et les cellules Lin-CD34. La deuxième partie du protocole propose des procédures détaillées pour la préparation d'ARN total et la construction de la bibliothèque ultérieure pour le séquençage à haut débit. La dernière partie décrit la méthode d'analyse de données RNA-Seq et explique comment utiliser les données pour identifier les facteurs de transcription exprimés de manière différentielle entre Lin-CD34 + et les cellules Lin-CD34. Les facteurs de transcription plus nettement exprimés de manière différentielle ont été identifiés comme les principaux régulateurs potentiels contrôle cellule EML auto-renouvellement et de différenciation. Dans la section de discussion de cet article, nous mettons en évidence les étapes clés de la performance réussie de cette expérience.

En résumé, ce document propose une méthode d'utilisation de la technologie de l'ARN-Seq pour identifier des régulateurs potentiels de l'auto-renouvellement et de différenciation dans les cellules EML. Les principaux facteurs identifiés sont soumis à l'analyse fonctionnelle en aval in vitro et in vivo.

Introduction

Les cellules souches hématopoïétiques sont des cellules sanguines rares qui se trouvent principalement dans la niche de la moelle osseuse adulte. Ils sont responsables de la production de cellules nécessaires pour reconstituer le sang et le système immunitaire ^1. Comme une sorte de cellules souches, cellules souches hématopoïétiques sont capables à la fois de l'auto-renouvellement et de différenciation. Mécanismes qui contrôlent la décision de sort de CSH élucider, soit vers l'auto-renouvellement ou de la différenciation, offrira de précieux conseils sur la manipulation de cellules souches hématopoïétiques pour les recherches de maladies du sang et de l'utilisation clinique ^2. Un problème rencontré par les chercheurs est que les CSH peuvent être maintenues et développées in vitro dans une mesure très limitée; la grande majorité de leur progéniture sont partiellement différenciées en culture ^2.

Afin d'identifier les principaux régulateurs qui contrôlent les processus d'auto-renouvellement et de différenciation à l'échelle de l'ensemble du génome, nous avons utilisé une primitive hématopoïétique ligne de cellules souches de souris EML en tant que système modèle. Thest la lignée cellulaire a été dérivée à partir de ^3,4 murin de la moelle osseuse. Lorsque nourris avec différents facteurs de croissance, les cellules peuvent se différencier en EML érythroïdes, myéloïdes, lymphoïdes et des cellules in vitro ^5. Surtout, cette lignée cellulaire peut être propagé en grande quantité dans le milieu de culture contenant un facteur de cellules souches (SCF) et en conservant leur multipotentialité. EML cellules peuvent être séparés en sous-groupes d'auto-renouvellement Lin-SCA + CD34 + et les cellules différenciées partiellement Lin-SCA-CD34 sur la base de marqueurs de surface CD34 et SCA ^6. Similaire à court terme CSH, SCA + CD34 + cellules sont capables d'auto-renouvellement. Lorsqu'ils sont traités avec SCF, Lin-SCA + des cellules CD34 + peut régénérer rapidement une population mixte de Lin-SCA + et les cellules CD34 + Lin-SCA-CD34 et continuent à proliférer ^6. Les deux populations sont similaires dans la morphologie et des niveaux similaires de c-kit ARNm et la protéine ^6. Des cellules Lin-SCA-CD34 sont capables de se propager dans un milieu contenant IL-3 à la place de SCF ^3. Unveiling régulateurs clés dans la décision du destin cellulaire EML à offrir une meilleure compréhension des mécanismes cellulaires et moléculaires à transition précoce de développement au cours de l'hématopoïèse.

Afin d'étudier les différences moléculaires sous-jacents entre le Lin-SCA auto-renouvellement + CD34 + et les cellules Lin-SCA-CD34 partiellement différenciées, nous avons utilisé l'ARN-Seq pour identifier les gènes exprimés de manière différentielle. En particulier, nous nous concentrons sur les facteurs de transcription, des facteurs de transcription jouent un rôle crucial dans la détermination du destin cellulaire. ARN-Seq est une approche développée récemment qui utilise les capacités de séquençage de nouvelle génération (NGS) technologies de profil et de quantifier les ARN transcrits à partir de ^7,8 génome. En bref, l'ARN total est le poly-A et fragmenté choisi comme modèle initial template.The ARN est ensuite converti en ADNc en utilisant la transcriptase inverse. Afin de cartographier des transcrits d'ARN de pleine longueur, en utilisant intact, l'ARN non dégradé pour la construction de la banque d'ADNc est importante. Pour le purpose de séquençage, des séquences d'adaptation spécifiques sont ajoutées aux deux extrémités de l'ADNc. Ensuite, dans la plupart des cas, les molécules d'ADNc sont amplifiés par PCR et séquences d'une manière à haut débit.

Après séquençage, résultant lectures peut être aligné sur un génome de référence et une base de données de transcriptome. Le numéro de la carte qui lit le gène de référence est prise en compte et cette information peut être utilisée pour estimer le niveau d'expression du gène. Le lit peut également être assemblé de novo sans un génome de référence, ce qui permet l'étude de transcriptome dans les organismes non-modèles ^9. la technologie de l'ARN-seq a également été utilisé pour détecter les isoformes d'épissage ^{10 à 12,} de nouveaux transcrits ¹³ et ¹⁴ des fusions de gènes. En plus de la détection de gènes codant pour des protéines, de l'ARN-Seq peut également être utilisé pour détecter et analyser nouveau niveau d'ARN non codants, tels que la transcription de l'ARN de long ^{15,16, 17} micro-ARN, etc. siRNA ¹⁸ non codante. En raison de til précision de cette méthode, il a été utilisé pour la détection de variations nucléotidiques simples ^19,20.

Avant l'avènement de la technologie de l'ARN-Seq, puces à ADN est la principale méthode utilisée pour analyser le profil d'expression génique. Sondes pré-synthétisées sont conçus et ensuite fixés à une surface solide pour former une lame de microréseau ^21. L'ARNm est extrait et converti en ADNc. Au cours du processus de transcription inverse, les nucleotides marqués par fluorescence sont incorporés dans l'ADNc et l'ADNc peuvent être hybridés sur les lames de puces à ADN. L'intensité du signal recueilli à partir d'un endroit précis dépend de la quantité d'ADNc de liaison à la sonde spécifique à cet endroit ^21. Par rapport à la technologie de l'ARN-Seq, puces à ADN a plusieurs limites. Tout d'abord, puces à ADN repose sur la connaissance préalable de l'annotation des gènes, tandis que la technologie de l'ARN-Seq est capable de détecter de nouveaux relevés de notes au niveau de fond élevé relative, ce qui limite son utilisation lorsque geniveau d'expression ne est faible. En outre, la technologie de l'ARN-Seq a beaucoup plus dynamique portée de détection (8000 fois) ^7, tandis que, en raison de fond et la saturation des signaux, l'exactitude des puces à ADN est limitée pour les deux gènes fortement exprimés et humble ^7,22. Enfin, des sondes de puces à ADN diffèrent dans leur efficacité d'hybridation, ce qui rend les résultats moins fiables lors de la comparaison des niveaux d'expression relatifs des différents produits de transcription au sein d'un échantillon ^23. Bien que l'ARN-Seq a de nombreux avantages par rapport aux puces à ADN, l'analyse des données est complexe. Ceci est une des raisons pour lesquelles de nombreux chercheurs utilisent encore microarray la place de l'ARN-Seq. Divers outils de bioinformatique sont nécessaires pour le traitement et l'analyse des données ²⁴ ARN-Seq.

Parmi plusieurs séquençage de nouvelle génération (NGS), les plates-formes 454, Illumina, Torrent SOLIDE et Ion sont les plus largement utilisés. 454 a été la première plate-forme commerciale NGS. A la différence des autres plates-formes de séquençagelongueur comme Illumina et solide, la plate-forme 454 génère plus lus (moyenne 700 BASE lit) ^25. Plus de lectures est mieux pour la caractérisation initiale de transcriptiome en raison de leur plus assembler efficacité ^25. Le principal inconvénient de la plate-forme 454 est son coût élevé par mégabase de séquence. Le Illumina et solides plates-formes de générer lit avec une augmentation du nombre et de courtes longueurs. Le coût par mégabase de séquence est beaucoup plus faible que la plate-forme 454. En raison du grand nombre de court interprète pour l'Illumina et solides plates-formes, l'analyse des données est beaucoup plus de calculs. Le prix de l'instrument et des réactifs pour le séquençage de la plate-forme Ion Torrent est moins cher et le temps de séquençage est plus courte ^{de 25.} Cependant, le taux d'erreur et le coût par mégabase de séquence sont plus élevés par rapport à la Illumina et les plates-formes solides. Différentes plates-formes ont leurs propres avantages et inconvénients et nécessitent des méthodes d'analyse des données. Le platform devraient être choisis en fonction du but de séquençage et la disponibilité des fonds.

Dans cet article, nous prenons plate-forme Illumina ARN-Seq comme un exemple. Nous avons utilisé cellule EML en tant que système modèle pour étudier les régulateurs clés dans EML cellule auto-renouvellement et de différenciation, et a fourni une des méthodes détaillées de la construction de la bibliothèque de l'ARN-Seq et l'analyse de données pour le calcul du niveau d'expression et roman détection de transcription. Nous avons montré dans notre précédente publication de cette étude de l'ARN-Seq dans EML système modèle ^2, lorsqu'il est couplé avec un test fonctionnel (par exemple shRNA de knockdown) fournir une approche puissante dans la compréhension du mécanisme moléculaire des premiers stades de la différenciation hématopoïétique, et peut servir de modèle pour l'analyse de cellules auto-renouvellement et de différenciation en général.

Protocol

1. EML culture cellulaire et la séparation des cellules Lin-CD34 + et CD34-Lin en utilisant la cellule magnétique Système et tri cellulaire activé par fluorescence méthode de tri Préparation de rein de bébé hamster (BHK), du milieu de culture de cellules pour la collecte de facteur de cellules souches: Culture des cellules BHK dans un milieu DMEM contenant 10% de FBS en flacon de 25 cm2 (voir le tableau 1) à 37 ° C, 5% de CO2 dans un incubateur de cult…

Representative Results

Afin d'analyser les gènes exprimés de manière différentielle dans Lin-CD34 + et les cellules Lin-CD34 EML, nous avons utilisé la technologie de l'ARN-Seq. La figure 1 montre le flux de travail des procédures. Après isolement de cellules de la lignée négatifs par tri magnétique de cellules, nous nous sommes séparés Lin-SCA + CD34 + et les cellules Lin-SCA-CD34 en utilisant FACS Aria. EML cellules Lin-enrichis ont été colorées avec anti-CD34, anti-Sca1 et anticorps de cocktail de la…

Discussion

Transcriptome des mammifères est très complexe ^34-38. technologie de l'ARN-Seq joue un rôle de plus en plus important dans les études d'analyse du transcriptome, roman détection des transcriptions et seul nucléotide découverte de variation etc. Il présente de nombreux avantages par rapport aux autres méthodes d'analyse de l'expression des gènes. Comme mentionné dans l'introduction, il surmonte les artefacts d'hybridation de micro-réseau et peut être utilis?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

JQW, SZ, SD and KC are supported by grant from the National Institutes of Health and the Staman Ogilvie Fund—Memorial Hermann Foundation.

Materials

Antibiotic-Antimycotic	Invitrogen	15240-062	BHK cell culture
Anti-Mouse CD34 FITC	eBioscience	11-0341-81	FACS sorting
Anti-Mouse Ly-6A/E (Sca-1) PE	eBioscience	12-5981-81	FACS sorting
APC Mouse Lineage Antibody Cocktail	BD Biosciences	558074	FACS sorting
BD FACSAria Cell Sorter	BD Biosciences	Special offer sysmtem	FACS sorting
Corning™ Cell Culture Treated Flasks 75cm²	Corning incorporated	430641	Cell culture
Corning™ Cell Culture Treated Flasks 25cm²	Corning incorporated	430639	Cell culture
Deoxyribonuclease I, Amplification Grade	Invitrogen	18068-015	Library preparation
DMEM	Invitrogen	11965-092	BHK cell culture
DPBS	Gibco	14190	Cell culture
HI FBS	Invitrogen	16140071	BHK cell culture
Horse Serum	Invitrogen	16050-122	EML cell culture
IMDM	HyClone	SH30228.02	EML cell culture
L-Glutamine	Invitrogen	25030-081	Cell culture
Lineage Cell Depletion Kit, mouse	Miltenyi Biotec	130-090-858	Isolation of lineage negative cells
NanoVue Plus spectrophotometer	GE Healthcare	28-9569-62	Quality control
Thermo Scientific™ Napco™ 8000 Water-Jacketed CO2 Incubators	Thermo Scientific	15-497-002	Cell culture
Penicillin-Streptomycin	Invitrogen	15140-122	EML cell culture
TRIzol® Reagent	Invitrogen	15596-018	RNA exraction
TruSeq™ RNA Sample Prep Kit v2 -Set B (48rxn)	Illumina	RS-122-2002	Library preparation
2100 Electrophoresis Bioanalyzer Instrument	Agilent	G2939AA	Quality control
0.25% Trypsin-EDTA	Gibco	25200	Cell culture
0.45 µm Syringe Filters	Nalgene	190-2545	Cell culture

References

Chambers, S. M., Goodell, M. A. Hematopoietic stem cell aging: wrinkles in stem cell potential. Stem Cell Rev. 3, 201-211 (2007).
Wu, J. Q., et al. Tcf7 is an important regulator of the switch of self-renewal and differentiation in a multipotential hematopoietic cell line. PLoS genetics. 8, (2012).
Ye, Z. J., et al. Complex interactions in EML cell stimulation by stem cell factor and IL-3. Proceedings of the National Academy of Sciences of the United States of America. 108, 4882-4887 (2011).
Tsai, S., Bartelmez, S., Sitnicka, E., Collins, S. Lymphohematopoietic progenitors immortalized by a retroviral vector harboring a dominant-negative retinoic acid receptor can recapitulate lymphoid, myeloid, and erythroid development. Genes Dev. 8, 2831-2841 (1994).
Weiler, S. R., et al. D3: a gene induced during myeloid cell differentiation of Linlo c-Kit+ Sca-1(+) progenitor cells. Blood. 93, 527-536 (1999).
Ye, Z. J., Kluger, Y., Lian, Z., Weissman, S. M. Two types of precursor cells in a multipotential hematopoietic cell line. Proc Natl Acad Sci U S A. 102, 18461-18466 (2005).
Wang, Z., Gerstein, M., Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nature reviews. Genetics. 10, 57-63 (2009).
Chu, Y., Corey, D. R. RNA sequencing: platform selection, experimental design, and data interpretation. Nucleic acid therapeutics. 22, 271-274 (2012).
Hornett, E. A., Wheat, C. W. Quantitative RNA-Seq analysis in non-model species: assessing transcriptome assemblies as a scaffold and the utility of evolutionary divergent genomic reference species. BMC genomics. 13, 361 (2012).
Eswaran, J., et al. RNA sequencing of cancer reveals novel splicing alterations. Scientific reports. 3, 1689 (2013).
Wang, E. T., et al. Alternative isoform regulation in human tissue transcriptomes. Nature. 456, 470-476 (2008).
Wu, J. Q., et al. Dynamic transcriptomes during neural differentiation of human embryonic stem cells revealed by short, long, and paired-end sequencing. Proceedings of the National Academy of Sciences of the United States of America. 107, 5254-5259 (2010).
Loraine, A. E., McCormick, S., Estrada, A., Patel, K., Qin, P. RNA-seq of Arabidopsis pollen uncovers novel transcription and alternative splicing. Plant physiology. 162, 1092-1109 (2013).
Edgren, H., et al. Identification of fusion genes in breast cancer by paired-end RNA-sequencing. Genome biology. 12, 6 (2011).
Ilott, N. E., Ponting, C. P. Predicting long non-coding RNAs using RNA sequencing. Methods. 63, 50-59 (2013).
Sun, L., et al. Prediction of novel long non-coding RNAs based on RNA-Seq data of mouse Klf1 knockout study. BMC bioinformatics. 13, 331 (2012).
Luo, S. MicroRNA expression analysis using the Illumina microRNA-Seq Platform. Methods in molecular biology. 822, 183-188 (2012).
Bolduc, F., Hoareau, C., St-Pierre, P., Perreault, J. P. In-depth sequencing of the siRNAs associated with peach latent mosaic viroid infection. BMC molecular biology. 11, 16 (2010).
Chepelev, I., Wei, G., Tang, Q., Zhao, K. Detection of single nucleotide variations in expressed exons of the human genome using RNA-Seq. Nucleic acids research. 37, 106 (2009).
Djari, A., et al. Gene-based single nucleotide polymorphism discovery in bovine muscle using next-generation transcriptomic sequencing. BMC genomics. 14, 307 (2013).
Murphy, D. Gene expression studies using microarrays: principles, problems, and prospects. Advances in physiology education. 26, 256-270 (2002).
Chen, K., et al. RNA-seq characterization of spinal cord injury transcriptome in acute/subacute phases: a resource for understanding the pathology at the systems level. PLoS one. 8, 72567 (2013).
Marioni, J. C., Mason, C. E., Mane, S. M., Stephens, M., Gilad, Y. RNA-seq: an assessment of technical reproducibility and comparison with gene expression arrays. Genome research. 18, 1509-1517 (2008).
Ramskold, D., Kavak, E., Sandberg, R. How to analyze gene expression using RNA-sequencing data. Methods in molecular biology. 802, 259-274 (2012).
Glenn, T. C. Field guide to next-generation DNA sequencers. Mol Ecol Resour. 11, 759-769 (2011).
Trapnell, C., et al. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Nature protocols. 7, 562-578 (2012).
Trapnell, C., Pachter, L., Salzberg, S. L. TopHat: discovering splice junctions with RNA-Seq. Bioinformatics. 25, 1105-1111 (2009).
Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome biology. 10, 25 (2009).
Trapnell, C., et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nature. 28, 511-515 (2010).
Anders, S., Huber, W. Differential expression analysis for sequence count data. Genome biology. 11, 106 (2010).
Quinlan, A. R., Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26, 841-842 (2010).
Cheranova, D., et al. RNA-seq analysis of transcriptomes in thrombin-treated and control human pulmonary microvascular endothelial cells. J Vis Exp. , (2013).
Zhang, H. M., et al. AnimalTFDB: a comprehensive animal transcription factor database. Nucleic acids research. 40, 144-149 (2012).
Wu, J. Q., et al. Systematic analysis of transcribed loci in ENCODE regions using RACE sequencing reveals extensive transcription in the human genome. Genome Biol. 9, 3 (2008).
Wu, J. Q., et al. Large-scale RT-PCR recovery of full-length cDNA clones. Biotechniques. 36, 690-696 (2004).
Wu, J. Q., Shteynberg, D., Arumugam, M., Gibbs, R. A., Brent, M. R. Identification of rat genes by TWINSCAN gene prediction, RT-PCR, and direct sequencing. Genome Res. 14, 665-671 (2004).
Dewey, C., et al. Accurate identification of novel human genes through simultaneous gene prediction in human, mouse, and rat. Genome Res. 14, 661-664 (2004).
Wu, J. . Characterize Mammalian Transcriptome Complexity. , (2011).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Zong, S., Deng, S., Chen, K., Wu, J. Q. Identification of Key Factors Regulating Self-renewal and Differentiation in EML Hematopoietic Precursor Cells by RNA-sequencing Analysis. J. Vis. Exp. (93), e52104, doi:10.3791/52104 (2014).

Identification des facteurs clés de régulation auto-renouvellement et de différenciation dans les cellules hématopoïétiques précurseurs EML par l'analyse de l'ARN-séquençage

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

Identification des facteurs clés de régulation auto-renouvellement et de différenciation dans les cellules hématopoïétiques précurseurs EML par l'analyse de l'ARN-séquençage

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below