Analyses ARN de séquençage et de bioinformatique ont été utilisés pour identifier les facteurs de transcription de manière significative et exprimés de manière différentielle dans des sous-populations Lin-CD34 + et CD34 Lin-des EMLcells de souris. Ces facteurs de transcription peuvent jouer un rôle important dans la détermination de l'interrupteur entre les cellules Lin-CD34 auto-renouvellement Lin-CD34 + et partiellement différenciés.
Les cellules souches hématopoïétiques (CSH) sont utilisés en clinique pour le traitement de la greffe à reconstruire le système hématopoïétique d'un patient dans de nombreuses maladies telles que la leucémie et le lymphome. Élucider les mécanismes contrôlant CSH auto-renouvellement et de différenciation est important pour l'application de CSH pour la recherche et les utilisations cliniques. Cependant, il est impossible d'obtenir des CSH en grande quantité en raison de leur incapacité à proliférer in vitro. Pour surmonter cet obstacle, nous avons utilisé une lignée de cellules dérivées de la moelle osseuse de souris, la lignée cellulaire EML (érythroïde, myéloïde et lymphoïde), en tant que système modèle pour cette étude.
ARN-séquençage (ARN-Seq) a été de plus en plus utilisés pour remplacer les puces à ADN pour les études d'expression génique. Nous rapportons ici une méthode détaillée de l'utilisation de la technologie de l'ARN-Seq pour enquêter sur les facteurs clés potentiels dans la régulation de la cellule EML auto-renouvellement et de différenciation. Le protocole fourni dans le présent document est divisé en trois parties. La première part explique comment la culture de cellules EML et séparé Lin-CD34 + et les cellules Lin-CD34. La deuxième partie du protocole propose des procédures détaillées pour la préparation d'ARN total et la construction de la bibliothèque ultérieure pour le séquençage à haut débit. La dernière partie décrit la méthode d'analyse de données RNA-Seq et explique comment utiliser les données pour identifier les facteurs de transcription exprimés de manière différentielle entre Lin-CD34 + et les cellules Lin-CD34. Les facteurs de transcription plus nettement exprimés de manière différentielle ont été identifiés comme les principaux régulateurs potentiels contrôle cellule EML auto-renouvellement et de différenciation. Dans la section de discussion de cet article, nous mettons en évidence les étapes clés de la performance réussie de cette expérience.
En résumé, ce document propose une méthode d'utilisation de la technologie de l'ARN-Seq pour identifier des régulateurs potentiels de l'auto-renouvellement et de différenciation dans les cellules EML. Les principaux facteurs identifiés sont soumis à l'analyse fonctionnelle en aval in vitro et in vivo.
Les cellules souches hématopoïétiques sont des cellules sanguines rares qui se trouvent principalement dans la niche de la moelle osseuse adulte. Ils sont responsables de la production de cellules nécessaires pour reconstituer le sang et le système immunitaire 1. Comme une sorte de cellules souches, cellules souches hématopoïétiques sont capables à la fois de l'auto-renouvellement et de différenciation. Mécanismes qui contrôlent la décision de sort de CSH élucider, soit vers l'auto-renouvellement ou de la différenciation, offrira de précieux conseils sur la manipulation de cellules souches hématopoïétiques pour les recherches de maladies du sang et de l'utilisation clinique 2. Un problème rencontré par les chercheurs est que les CSH peuvent être maintenues et développées in vitro dans une mesure très limitée; la grande majorité de leur progéniture sont partiellement différenciées en culture 2.
Afin d'identifier les principaux régulateurs qui contrôlent les processus d'auto-renouvellement et de différenciation à l'échelle de l'ensemble du génome, nous avons utilisé une primitive hématopoïétique ligne de cellules souches de souris EML en tant que système modèle. Thest la lignée cellulaire a été dérivée à partir de 3,4 murin de la moelle osseuse. Lorsque nourris avec différents facteurs de croissance, les cellules peuvent se différencier en EML érythroïdes, myéloïdes, lymphoïdes et des cellules in vitro 5. Surtout, cette lignée cellulaire peut être propagé en grande quantité dans le milieu de culture contenant un facteur de cellules souches (SCF) et en conservant leur multipotentialité. EML cellules peuvent être séparés en sous-groupes d'auto-renouvellement Lin-SCA + CD34 + et les cellules différenciées partiellement Lin-SCA-CD34 sur la base de marqueurs de surface CD34 et SCA 6. Similaire à court terme CSH, SCA + CD34 + cellules sont capables d'auto-renouvellement. Lorsqu'ils sont traités avec SCF, Lin-SCA + des cellules CD34 + peut régénérer rapidement une population mixte de Lin-SCA + et les cellules CD34 + Lin-SCA-CD34 et continuent à proliférer 6. Les deux populations sont similaires dans la morphologie et des niveaux similaires de c-kit ARNm et la protéine 6. Des cellules Lin-SCA-CD34 sont capables de se propager dans un milieu contenant IL-3 à la place de SCF 3. Unveiling régulateurs clés dans la décision du destin cellulaire EML à offrir une meilleure compréhension des mécanismes cellulaires et moléculaires à transition précoce de développement au cours de l'hématopoïèse.
Afin d'étudier les différences moléculaires sous-jacents entre le Lin-SCA auto-renouvellement + CD34 + et les cellules Lin-SCA-CD34 partiellement différenciées, nous avons utilisé l'ARN-Seq pour identifier les gènes exprimés de manière différentielle. En particulier, nous nous concentrons sur les facteurs de transcription, des facteurs de transcription jouent un rôle crucial dans la détermination du destin cellulaire. ARN-Seq est une approche développée récemment qui utilise les capacités de séquençage de nouvelle génération (NGS) technologies de profil et de quantifier les ARN transcrits à partir de 7,8 génome. En bref, l'ARN total est le poly-A et fragmenté choisi comme modèle initial template.The ARN est ensuite converti en ADNc en utilisant la transcriptase inverse. Afin de cartographier des transcrits d'ARN de pleine longueur, en utilisant intact, l'ARN non dégradé pour la construction de la banque d'ADNc est importante. Pour le purpose de séquençage, des séquences d'adaptation spécifiques sont ajoutées aux deux extrémités de l'ADNc. Ensuite, dans la plupart des cas, les molécules d'ADNc sont amplifiés par PCR et séquences d'une manière à haut débit.
Après séquençage, résultant lectures peut être aligné sur un génome de référence et une base de données de transcriptome. Le numéro de la carte qui lit le gène de référence est prise en compte et cette information peut être utilisée pour estimer le niveau d'expression du gène. Le lit peut également être assemblé de novo sans un génome de référence, ce qui permet l'étude de transcriptome dans les organismes non-modèles 9. la technologie de l'ARN-seq a également été utilisé pour détecter les isoformes d'épissage 10 à 12, de nouveaux transcrits 13 et 14 des fusions de gènes. En plus de la détection de gènes codant pour des protéines, de l'ARN-Seq peut également être utilisé pour détecter et analyser nouveau niveau d'ARN non codants, tels que la transcription de l'ARN de long 15,16, 17 micro-ARN, etc. siRNA 18 non codante. En raison de til précision de cette méthode, il a été utilisé pour la détection de variations nucléotidiques simples 19,20.
Avant l'avènement de la technologie de l'ARN-Seq, puces à ADN est la principale méthode utilisée pour analyser le profil d'expression génique. Sondes pré-synthétisées sont conçus et ensuite fixés à une surface solide pour former une lame de microréseau 21. L'ARNm est extrait et converti en ADNc. Au cours du processus de transcription inverse, les nucleotides marqués par fluorescence sont incorporés dans l'ADNc et l'ADNc peuvent être hybridés sur les lames de puces à ADN. L'intensité du signal recueilli à partir d'un endroit précis dépend de la quantité d'ADNc de liaison à la sonde spécifique à cet endroit 21. Par rapport à la technologie de l'ARN-Seq, puces à ADN a plusieurs limites. Tout d'abord, puces à ADN repose sur la connaissance préalable de l'annotation des gènes, tandis que la technologie de l'ARN-Seq est capable de détecter de nouveaux relevés de notes au niveau de fond élevé relative, ce qui limite son utilisation lorsque geniveau d'expression ne est faible. En outre, la technologie de l'ARN-Seq a beaucoup plus dynamique portée de détection (8000 fois) 7, tandis que, en raison de fond et la saturation des signaux, l'exactitude des puces à ADN est limitée pour les deux gènes fortement exprimés et humble 7,22. Enfin, des sondes de puces à ADN diffèrent dans leur efficacité d'hybridation, ce qui rend les résultats moins fiables lors de la comparaison des niveaux d'expression relatifs des différents produits de transcription au sein d'un échantillon 23. Bien que l'ARN-Seq a de nombreux avantages par rapport aux puces à ADN, l'analyse des données est complexe. Ceci est une des raisons pour lesquelles de nombreux chercheurs utilisent encore microarray la place de l'ARN-Seq. Divers outils de bioinformatique sont nécessaires pour le traitement et l'analyse des données 24 ARN-Seq.
Parmi plusieurs séquençage de nouvelle génération (NGS), les plates-formes 454, Illumina, Torrent SOLIDE et Ion sont les plus largement utilisés. 454 a été la première plate-forme commerciale NGS. A la différence des autres plates-formes de séquençagelongueur comme Illumina et solide, la plate-forme 454 génère plus lus (moyenne 700 BASE lit) 25. Plus de lectures est mieux pour la caractérisation initiale de transcriptiome en raison de leur plus assembler efficacité 25. Le principal inconvénient de la plate-forme 454 est son coût élevé par mégabase de séquence. Le Illumina et solides plates-formes de générer lit avec une augmentation du nombre et de courtes longueurs. Le coût par mégabase de séquence est beaucoup plus faible que la plate-forme 454. En raison du grand nombre de court interprète pour l'Illumina et solides plates-formes, l'analyse des données est beaucoup plus de calculs. Le prix de l'instrument et des réactifs pour le séquençage de la plate-forme Ion Torrent est moins cher et le temps de séquençage est plus courte de 25. Cependant, le taux d'erreur et le coût par mégabase de séquence sont plus élevés par rapport à la Illumina et les plates-formes solides. Différentes plates-formes ont leurs propres avantages et inconvénients et nécessitent des méthodes d'analyse des données. Le platform devraient être choisis en fonction du but de séquençage et la disponibilité des fonds.
Dans cet article, nous prenons plate-forme Illumina ARN-Seq comme un exemple. Nous avons utilisé cellule EML en tant que système modèle pour étudier les régulateurs clés dans EML cellule auto-renouvellement et de différenciation, et a fourni une des méthodes détaillées de la construction de la bibliothèque de l'ARN-Seq et l'analyse de données pour le calcul du niveau d'expression et roman détection de transcription. Nous avons montré dans notre précédente publication de cette étude de l'ARN-Seq dans EML système modèle 2, lorsqu'il est couplé avec un test fonctionnel (par exemple shRNA de knockdown) fournir une approche puissante dans la compréhension du mécanisme moléculaire des premiers stades de la différenciation hématopoïétique, et peut servir de modèle pour l'analyse de cellules auto-renouvellement et de différenciation en général.
Transcriptome des mammifères est très complexe 34-38. technologie de l'ARN-Seq joue un rôle de plus en plus important dans les études d'analyse du transcriptome, roman détection des transcriptions et seul nucléotide découverte de variation etc. Il présente de nombreux avantages par rapport aux autres méthodes d'analyse de l'expression des gènes. Comme mentionné dans l'introduction, il surmonte les artefacts d'hybridation de micro-réseau et peut être utilis?…
The authors have nothing to disclose.
JQW, SZ, SD and KC are supported by grant from the National Institutes of Health and the Staman Ogilvie Fund—Memorial Hermann Foundation.
Antibiotic-Antimycotic | Invitrogen | 15240-062 | BHK cell culture |
Anti-Mouse CD34 FITC | eBioscience | 11-0341-81 | FACS sorting |
Anti-Mouse Ly-6A/E (Sca-1) PE | eBioscience | 12-5981-81 | FACS sorting |
APC Mouse Lineage Antibody Cocktail | BD Biosciences | 558074 | FACS sorting |
BD FACSAria Cell Sorter | BD Biosciences | Special offer sysmtem | FACS sorting |
Corning™ Cell Culture Treated Flasks 75cm2 | Corning incorporated | 430641 | Cell culture |
Corning™ Cell Culture Treated Flasks 25cm2 | Corning incorporated | 430639 | Cell culture |
Deoxyribonuclease I, Amplification Grade | Invitrogen | 18068-015 | Library preparation |
DMEM | Invitrogen | 11965-092 | BHK cell culture |
DPBS | Gibco | 14190 | Cell culture |
HI FBS | Invitrogen | 16140071 | BHK cell culture |
Horse Serum | Invitrogen | 16050-122 | EML cell culture |
IMDM | HyClone | SH30228.02 | EML cell culture |
L-Glutamine | Invitrogen | 25030-081 | Cell culture |
Lineage Cell Depletion Kit, mouse | Miltenyi Biotec | 130-090-858 | Isolation of lineage negative cells |
NanoVue Plus spectrophotometer | GE Healthcare | 28-9569-62 | Quality control |
Thermo Scientific™ Napco™ 8000 Water-Jacketed CO2 Incubators | Thermo Scientific | 15-497-002 | Cell culture |
Penicillin-Streptomycin | Invitrogen | 15140-122 | EML cell culture |
TRIzol® Reagent | Invitrogen | 15596-018 | RNA exraction |
TruSeq™ RNA Sample Prep Kit v2 -Set B (48rxn) | Illumina | RS-122-2002 | Library preparation |
2100 Electrophoresis Bioanalyzer Instrument | Agilent | G2939AA | Quality control |
0.25% Trypsin-EDTA | Gibco | 25200 | Cell culture |
0.45 µm Syringe Filters | Nalgene | 190-2545 | Cell culture |