Genetics

通过RNA-Seq分析，人类原主角细胞的体外分化特征

Published: May 16, 2020 doi: 10.3791/60905

Jos G.A. Smits*¹, Jieqiong Qu*¹, Hanna Niehues², Huiqing Zhou^1,3

¹Department of Molecular Developmental Biology, Faculty of Science, Radboud Institute for Molecular Life Sciences, Radboud University, Nijmegen, The Netherlands, ²Department of Dermatology, Radboud University Medical Center, Radboud Institute for Molecular Life Sciences, Nijmegen, The Netherlands, ³Department of Human Genetics, Radboud University Medical Center, Nijmegen, The Netherlands

* These authors contributed equally

Summary

这里介绍的是一个逐步的过程，通过接触抑制来分离人类原性角蛋白细胞的体外分化，然后通过RNA-seq分析在分子水平上进行表征。

Abstract

人类原发性角蛋白细胞经常用作体外模型，用于表皮分化和相关疾病的研究。报告了利用各种诱导条件以二维（2D）水下方式培养的角蛋白细胞体外分化的方法。这里描述的是2D体外角细胞分化方法通过接触抑制和随后的分子表征RNA-seq的过程。简言之，角蛋白细胞生长在定义的角蛋白细胞介质中，辅以生长因子，直到它们完全汇合。分化是由角蛋白细胞之间的密切接触引起的，并因排除介质中的生长因子而进一步刺激。利用RNA-seq分析，发现1）分化的角蛋白细胞在分化过程中表现出不同的分子特征，2）动态基因表达模式在表皮分层期间与细胞大体相似。至于与正常角蛋白细胞分化的比较，携带转录因子p63突变的角蛋白细胞表现出改变的形态和分子特征，符合其分化缺陷。最后，本协议详细介绍了2D体外角细胞分化的步骤及其分子特征，重点是RNA-seq数据的生物信息学分析。由于RNA提取和RNA-seq程序有据可查，因此它不是本协议的重点。体外角蛋白细胞分化的实验程序及生物信息分析管道可用于研究健康与患病角蛋白细胞表皮分化期间的分子事件。

Introduction

人类原发性角蛋白细胞来源于人类皮肤，常被用作细胞模型，研究表皮^{1、2、3、4}^的^生物学。表皮的分层可以通过角蛋白细胞分化进行建模，无论是2D水下单层方式，还是3D空气提升器官模型^{2、3、5、6、7。}虽然 3D 模型在评估表皮结构和功能方面变得越来越重要，但由于 2D 分化模型的便利性和生成大量用于分析的细胞的可能性，因此仍然广泛使用。

各种条件已应用于诱导角蛋白细胞分化的2D，包括血清的添加，高浓度的钙，较低的温度和抑制表皮生长因子受体^2，3。这些方法中的每一个方法都经过了许多角蛋白细胞分化标记基因的验证，并证明在评估角蛋白细胞分化（包括在病理条件下）是有效的。然而，当对标记基因的特定面板进行2、3的检查时，这些诱导条件也^{显示了其分化}^效率和^{动力学的差异}。

其中一种方法涉及角蛋白细胞接触抑制和消耗生长因子在培养媒介^8。研究表明，当细胞达到全密度时，角蛋白细胞可以自发分化。将文化媒介中的增长因素排除在外，可以进一步增强差异化。将接触抑制和减损生长因子相结合的方法已被证明在使用多个表皮标记3时，产生^具有与正常分层表皮相似的基因表达模式的分化角蛋白细胞，表明该模型适合研究正常的角蛋白细胞分化。最近，利用该模型对角蛋白细胞分化进行了两次综合基因表达分析，^{结果报告了}^9、10。研究人员在分子水平上验证了该模型，并表明它可用于研究正常和患病的角蛋白细胞分化。

本协议描述了使用RNA-seq进行体外分化方法和分化细胞分子分析的过程。它还说明了分化日（增殖阶段）、第2天、第4天和第7天（分别早期、中间和晚期分化）细胞转录组的特点。表明，分化的角蛋白细胞显示基因表达模式，在表皮分层期间，它们与细胞大体相似。为了研究这种方法是否可用于研究皮肤病理学，我们应用了相同的实验和分析管道，以研究携带转录因子p63突变的角蛋白细胞，这些突变来自结膜、异体发育不良和唇裂（EEC）综合征^11，12的患者。该协议侧重于角蛋白细胞的体外分化以及随后对RNA-seq的生物信息学分析。完整程序的其他步骤，如RNA提取、RNA-seq样品制备和库结构，都记录得很好，很容易遵循，尤其是在使用许多常用商业试剂盒时。因此，这些步骤仅在协议中简要说明。数据表明，该管道适用于研究健康与患病角细胞表皮分化期间的分子事件。

Subscription Required. Please recommend JoVE to your librarian.

Protocol

皮肤活检取自健康志愿者或p63突变患者的躯干，以建立原发性角蛋白细胞培养。关于建立人类原生角蛋白细胞的所有程序都得到拉德布德大学尼梅根医疗中心伦理委员会的批准（"门斯格邦登·翁德佐克·阿纳姆-尼梅根"）。已获得知情同意。

1. 通过接触抑制，人类原发性角蛋白细胞分化

必要时从角蛋白细胞基质（材料表）中准备角蛋白细胞生长介质（KGM）。
使用预先准备的库存制造 500 mL 增殖介质（KGM-pro; 参见表 1）。
制造 500 mL 分化介质（KGM-dif; 参见表 2）。
注：带补充剂的 KGM 可保持在 4 °C 两周。对于更长的存储时间，可以等分和存储在 -20°C。
种子原发性角蛋白细胞密度为5.0~20×10³ 细胞/cm^2，取决于细胞增殖能力。添加足够的 KGM 亲介质来覆盖细胞。
注： 1） KGM培养中常规细胞培养的详细信息，请于Lonza^{13网站找到}。2）应测试每个细胞系的种子密度。例如，正常的原发性角蛋白线可以以5.0 x 10^3细胞 /cm²的密度播种，而一条线携带转录因子p63中具有突变的，其增殖性较小，应以20×10^3细胞 /cm²的密度播种。3）根据实验设置，应播种几个细胞的盘子或孔，以便收集不同分化天在复制品中的样品。
种子播种后使用 KGM pro 介质刷新细胞两天（第 0 天播种，第 3^天第 1 次刷新）。之后，每隔一天使用 KGM pro 媒体进行刷新。定期检查细胞，至少每隔一天检查一次。
当细胞超过90%汇合时，通过将介质换向KGM-dif，诱导细胞分化。将介质更改为 KGM-dif 的天定义为区分日 0。通过先用DPBS洗涤2x，然后加入解解缓冲液（来自RNA提取试剂盒），收集细胞进行进一步的RNA分析。
注：在上述播种密度下，细胞应在7~10天内达到汇合。细胞可以以更高的初始密度播种，以更快地达到汇合。如果细胞不增殖，等待时间越长，则可能不会产生完全汇合的细胞。可能需要更高的播种密度。
每天使用 KGM-dif 介质刷新细胞，并在分化第 2 天、第 4 天收集细胞。7 用于进一步提取RNA。

2. RNA提取

分离总RNA。这可以使用商业RNA分离试剂盒（如Zymo快速RNA微普RNA）或使用酚^14进行。然而，强烈推荐含有DNAse治疗的分离试剂盒用于RNA-seq样品，以防止DNA污染和酚类。在材料表中提供了商业RNA隔离 试剂盒的例子。
使用光谱仪测量RNA浓度。DNA 和 RNA 的吸收峰值均在 260 nm。
注： 1） 260 nm 和 280 nm 的吸收度之比用于评估 RNA 的纯度。大约 2.0 的比率通常被接受为"纯"RNA。如果该比率大大低于 2.0，则样品可能受到 280 nm 吸收的污染物（如蛋白质、酚或其他物质）的污染。2） 260 nm 和 230 nm 的吸收率测量核酸纯度。预期为 2.0 和 2.2 之间的比率。如果该比率大幅降低，样品可能受到 230 nm 吸收的污染物（如 EDTA、乙醇或其他物质）的污染。

3. RNA质量检查

运行RNA或在生物分析器RNA笔克芯片上验证RNA完整性编号（RIN）定量，或在凝胶上进行定性测量。一般来说，至少为 8 的 RIN 是非常可取的。然而，当从组织中提取RNA时，RIN可能较低。
注：可选地，质量控制可以通过 qPCR 对RNA材料进行。

4. RNA-seq 库制备

注：RNA-seq 库制备通常使用商业套件或商业设置进行。所述协议改编自商业套件KAPA RNA HyperPrep套件与RigoErase（Illumina），并简要描述了所有必需的步骤：rRNA耗竭与寡核杂交到人类核糖体RNA，RNA碎片，第一链合成，第二链合成和A-尾，并在^{每一步15后清理}。其他库准备套件也可用于此目的。建议使用市售套件执行此步骤，因为生成的 cDNA 库的质量通常更一致。2）以下步骤用于 1x 库准备。如果准备多个样本，请用 10% 的额外体积进行主混合。

Oligo 杂交和 rRNA 损耗
1. 准备寡分杂交主混合（总 ± 11 μL，混合缓冲液为 4.4 μL，杂交寡分 4.4 μL，无 RNase 水为 2.2 μL）和损耗主混合（总为 ± 5.5 μL，耗竭缓冲液为 3.3 μL，RNase H 为 2.2 μL）。
2. 在热循环器上设置PCR反应程序：95°C，2分钟;在 -0.1 °C/s 下向下渐到 45 °C;45 °C 暂停;45 °C 30分钟;4 °C 永远。
  注：考虑从比扩增所需的RNA量加倍开始。在第一次尝试中，使用金额的一半继续执行以下步骤。这是为了确保仍有材料可以重复这些步骤，这些步骤的周期数不同（参见步骤 4.7.2），如果放大周期结果不够或过度放大。
3. 在 10 μL 无 RNAse 水中使用 25 ng 至 1 μg 的总 RNA，加入 10 μL 的寡杂交主混合。将样品放在预编程的热循环器中，然后启动程序。
4. 当程序达到45°C的暂停步位时，将5μL的耗竭主混合物加入到20μL杂交反应中，而不将其从热循环器中去除。通过上下移液几次彻底混合。
5. 继续热循环器计划，继续消耗步骤（45°C，持续30分钟）。
  注： 1）在协议下一部分的损耗步骤中，将 rRNA 损耗的珠子（例如，KAPA 纯珠）置于室温（RT）中。2）考虑准备DNase消化主混合物（对于第4.2节），因为试剂是在rRNA消耗清理后直接需要的。
6. 执行基于 2.2x 珠的 KAPA 纯珠清理：通过将上下移液数次彻底重新暂停RNA混合物中的珠子，将RNA混合物（25μL）和KAPA纯珠（55μL）结合。
7. 在RT中孵育5分钟，使RNA与珠子结合，将管子放在磁架上捕获珠子，直到液体清澈，小心地去除并丢弃60μL的上清液。
8. 保持磁铁上的管子，用200μL的80%乙醇洗2x，用乙醇孵育珠子≥30s，然后丢弃乙醇。尝试去除所有残留乙醇，而不打扰珠子后第二次洗涤。
9. 在RT中干燥珠子3~5分钟，或直到所有乙醇蒸发。
  注：过干珠子可能导致产量降低。
德纳塞消化
1. 准备DNase消化主混合（总 = 22 μL，2.2 μL的DNase缓冲液，2 μL的DNase，和17.8μL的无纳斯水）。
2. 通过上下移液几次，在DNAse消化主混合物（20μL）中重新吸收珠子。在RT中孵育管3分钟，将RNA从珠子上脱落。
3. 将管子放在磁铁架上以捕获珠子，直到液体清除，并小心地将 20 μL 的上清液转移到干净的管中。
4. 在37°C下用上分液孵育管子30分钟。
  注：考虑制备RNA洗脱、分片和注水主混合物（第4.3节），因为在DNase消化清理之后直接需要试剂。
5. 按照 4.1.6~4.1.9 执行基于 2.2 倍珠子的清理。
RNA洗脱、碎片和吸注
1. 准备碎片，总理和精英缓冲器（1x）主混合与11μL的碎片，总理和精英缓冲液（2x）和11μL的无Rse水。
2. 通过多次上下移液，在22μL的碎片、素质和精英缓冲液（1倍）中彻底用纯化、DNase处理的RNA重新填充珠子。
3. 在室温下孵育3分钟，将RNA从珠子上脱落，然后将管子放在磁铁上，捕捉珠子，直到液体清澈。
4. 小心地将 20 μL 的上一液转移到管中。用珠子丢弃管子。
  注：这是一个安全的停止点，因为样品可以储存在-20°C≤24小时。
5. 将管子放在热循环器中，在 94 °C 下进行破碎和注油 6 分钟。产生大约200~300bp长的碎片。
  注：在94°C下孵育8分钟，用于100~200 bp片段。使用部分降解的RNA时，根据降解的严重程度，在85°C下分片1~6分钟。
6. 将管子放在冰上，然后立即进行第一股合成。
第一股合成
1. 准备第一股合成主混合（总 = 12 μL，第一股合成缓冲液为 11 μL，KAPA 脚本为 1 μL）。
2. 在热循环器上设置PCR反应程序：25°C，10分钟;42 °C 15分钟;70 °C 15分钟;4 °C 永远。
3. 在冰上，将20μL的碎裂底RNA与10μL的第一股合成主混合物相结合。将管子放在冰上，通过轻轻将反应上下移液几次，彻底混合。
4. 将管放在预编程的热循环器中，然后启动程序。
第二股合成和 A 尾
1. 在冰上制备第二股合成和A尾主混合（总为±33μL，二绞线合成缓冲液为31μL，二绞线合成和A-尾酶混合为2μL）。
2. 在热循环器上设置PCR反应程序：16°C，30分钟;62 °C 10分钟;4 °C 永远。
3. 将30μL第一链合成产品与30μL的第二股合成和 A-尾主混合，在冰上上下移液，彻底混合。
4. 将管放在预编程的热循环器中，然后启动程序。
适配器连接和连接后清理
1. 稀释库存适配器（NEXTflex DNA 条形码，25 μM） 3.57 倍于无 RNase 水至 7 μM。
2. 准备适配器结扎主混合（总 = 50 μL，配 40 μL 的结扎缓冲液和 10 μL 的 DNA 连接）。
3. 结合60μL的第二链合成产品，45μL的适配器结扎主混合，和5μL稀释适配器。在冰上上下移液几次，彻底混合。
4. 在20°C下孵育管子15分钟，并立即继续进行第一次结扎后清理。
5. 通过结合适配器连接DNA（110μL）和KAKA纯珠（70μL）进行0.63x珠基清理，然后通过上下移液多次彻底重新暂停DNA混合物中的珠子。
6. 重复步骤 4.1.7=4.1.9。
7. 从磁铁上拆下管子。将珠子完全重新在 50 μL 的 10 mM Tris HCL（pH = 8.0±8.5）中，并在 RT 中孵育珠子 2 分钟。
8. 将板放在磁铁上，等待液体清除。将 50 μL 的透明上清液转移到新管中。
  注：在4°C下安全停止点小于24小时。
9. 通过将 50 μL 的珠子与纯化适配器连接的 DNA 与 35 μL 的 PEG/NaCL 溶液相结合，执行 0.7x 珠子清洁。通过涡旋彻底混合。
10. 执行清理步骤 4.1.7=4.1.9。将珠子完全重新在 20 μL 的 10 mM Tris HCL（pH = 8.0±8.5）中重新暂停，并在 RT 中孵育珠子 2 分钟。
11. 将板放在磁铁上;等到液体清澈。将透明上清液的 20 μL 转移到新管中，然后继续执行第 4.7 节。
  注：安全停止点在4°C下少于1周，或在-20°C下安全停止1周。
库放大和清理
1. 准备库放大主混合（总 = 33 μL，27.5 μL 的 2x KAPA HiFi HotStart ReadyMix 和 5.5 μL 的 10x 图库放大底像混合）。
2. 使用以下参数在热循环器上设置 PCR 反应程序。98 °C 45 s;N 周期（参见下面的注释），为：98 °C，15 s;60°C 30 s;72 °C 30 s;72 °C 1分钟;和4°C永远。
  注：库放大的周期取决于输入材料。大致可以这样估计：从RNA = 25~100 ng开始，N = 11~15周期开始;100~250纳克，N = 9~12 周期;250×500 ng，N = 7×10 周期。
3. 通过结合放大的库 DNA （50 μL）和 KAPA 纯珠（40 μL）进行 0.8x 珠基清理，然后通过上下移液多次彻底重新暂停 DNA 混合物中的珠子。
4. 执行清理步骤 4.1.7=4.1.9。将珠子完全重新在 50 μL 的 10 mM Tris HCL（pH = 8.0±8.5）中，并在RT下孵育珠子 2 分钟。
5. 将 50 μL 的透明上清液转移到新管中，然后进行第二个库放大清理。
6. 通过结合放大的库 DNA （50 μL）和 KAPA 纯珠（50 μL）进行 1x 珠基清理，然后通过上下移液多次彻底重新暂停 DNA 混合物中的珠子。
7. 执行清理步骤 4.1.7=4.1.9。将珠子完全重新在 22 μL 的 10 mM Tris HCL（pH = 8.0±8.5）中，并在 RT 中孵育珠子 2 分钟。
8. 将 20 μL 的透明上清液转移到新管中，进行 Qbit 和生物分析器测量。
浓度和碎片大小
1. 测量样品的DNA浓度。使用基于高灵敏度的荧光染料试剂盒（例如，Denovix Qbit，参见材料表），或者如果浓度似乎低于 0.5 ng/μL，则使用更敏感的 qPCR 方法重新量化（例如，Kappa 定量，参见 材料表）。
2. 使用高灵敏度电泳（例如生物分析器）确定库的片段大小。
  注：可选，在使用稀释准备库而不是cDNA进行测序（附录）之前，可以通过 qPCR 进行质量控制。
测序
1. 发送库进行排序。对于RNA-seq差异基因表达分析，每个样本的读取深度为10-2500万，通常就足够了。

5. 数据预处理

质量检查 Fastq 文件
1. 下载并安装 Trimgalore¹⁶ 以删除 Fastq 文件中的低质量基对和空读取。
  注： 1）此处提及的大多数软件仅在 Linux 中有效。如果仅限于 Windows 计算机，可以使用软件 MobaXterm 或 Putty 在 Linux 服务器上运行分析。请记住，对于基因组索引需要大量的随机访问内存（RAM）（约 64 GB）。2）强烈建议将所有必需的软件安装到 conda 环境中。这将允许简单的软件安装和包管理。有关康达的更多信息，请访问。
2. 为数据创建目录（文件夹），例如文件夹"RNA_seq_KC_diff"。键入"cd/home/用户/"，RNA_seq_KC_diff目录。
  注：有关文件夹结构的概述，请参阅folder_structure.txt文件中的"文档"。
3. 在工作目录中创建多个具有特定名称的文件夹："Fastq"，"CRCh38_fasta"，"CRCh38"，"脚本"和"映射"。
4. 将序列数据的快速文件移动到 fastq 文件夹中。或者，使用以下命令"ln =s 主页/用户/old_location_fastq/FastqFile 主页/用户/RNAseq_KC_diff/Fastq/Fastq 文件"到 Fastq 文件生成软链接，以节省磁盘空间。
5. 在 Fastq 文件上运行修剪大风，请参阅修剪.txt文件，使代码复制粘贴到 bash 中。如有必要，更改命令中的文件夹名称和设置。
映射
1. 下载基因组以将读取映射到，例如，hg38 ensembl 版本 97（未掩蔽版本）： ftp://ftp.ensembl.org/pub/release-97/fasta/homo_sapiens/dna/Homo_sapiens.GRCH38.primary_assembly.fa.gz ;和相应的基因注释文件：hg 38基因注释 ensembl 释放 97， ftp://ftp.ensembl.org/pub/release-97/gtf/homo_sapiens/Homo_sapiens.GRCh38.97.gtf.gz. 将两个文件传输到CRCh38_fasta文件夹。
  注意：或者使用基因组的不同版本，例如，hg38的UCSC版本，如果映射到转录ID而不是基因ID是首选。
2. 安装 STAR 2.7.1¹⁷.
3. 使用 STAR 2.7.1 生成内部参考基因组（参见补充 编码文件）。将线程数更改为处理者具有的线程数（-runThreadN X）。如有必要，更改此脚本中的文件夹名称和设置。通过复制/粘贴到 bash 来运行它。
4. 安装 samtools 1.9¹⁸ 用于索引 bam 文件和 gzip 以压缩摆动文件。
5. 使用 STAR 2.7.1 将 Trim Galore 验证的测序读取与人类基因组组装 hg38 （ensembl 版本 97）对齐，然后使用 samtools 和 gzip 进行索引。这应该使用脚本执行（map_fastq.txt编码文件）。如有必要，更改此脚本中的文件夹名称和设置。通过复制/粘贴到 bash 来运行它。
  注：STAR 映射生成多个输出文件，包括 bam 文件、摆动文件和读取计数表，名为 *_ReadsPerGene.out.tab，可直接由 R 连接使用，用作 Deseq2 的输入。
基因组浏览器可视化
1. 安装wigToBigWig从UCSC基因组浏览器工具生成大威格文件与大2bw脚本^19。
2. 将文件"convertBigWigChroms.py"和"CRCH38_ensembl2UCSC.txt"从补充编码文件传输到工作目录中的文件夹"脚本"。
3. 在 Linux convertBigWigChroms.py上创建可执行文件（使用以下命令："chmod +x 脚本/.py BigWigChroms"）。
4. 使用脚本 wig2bw 从 Wiggle 文件生成 bigWig 文件.txt（请参阅 补充编码文件）。通过复制/粘贴到 bash 来运行它。
5. 在 UCSC 基因组浏览器或综合基因组查看器（IGV）上输入 BigWig 文件以进行可视化。

6. RNA-seq数据分析

将示例数据输入 Deseq2
1. 下载并安装 Rstudio（版本 1.1.456）和 R（版本 3.6）。
2. 安装所有必需的 R 包（请参阅补充编码文件）。
  注：有关显示所有编程代码和输出的详细 R 标记文件，请参阅附加的文件："RNA_seq_kc_differentiation_wt.html"和"RNA_seq_kc_differentiation_patient.html"。下面包括所有步骤的一般说明。
3. 从 ReadsPerGene.out.tab 文件生成计数表。
4. 编写一个示例数据文件，其中包含所有文件名、区分日和其他相关示例数据。有关示例文件，请参阅补充编码sample_data_example.csv中的"代码"。
5. 使用计数表和样本数据生成包含可计数和样本数据的^Deseq220 对象。
基因表达规范化、样本距离和PCA
1. 使用 Deseq2 rld 或 vst 规范化 Deseq2 对象中的计数表。Rld 规范化是首选，但对于许多示例，vst 规范化要快得多。
2. 基于在 R 中的"dist"函数绘制基于规范化读取计数强度的样本距离，然后根据样本距离执行"hclust"聚类。使用图图包绘制热图本身。
3. 使用 Deseq2 的绘图 PCA 函数生成规范化读取计数强度的 PCA 绘图。
  注：PCA 是探索性数据分析的工具，可用于可视化不同样本之间的距离和相关关系。
差分/高可变基因表达分析
1. 使用 Deseq2 结果函数计算差异基因。然而，当评估几个时间点的变化，其中对对比较不适用，使用高度可变的基因。在这种情况下，通过按不同时间点与 rowVar 函数的样本之间的方差排序来提取前 500 个高度可变基因。
  注：在我们的分析中，对于对照样本，使用前500个高度可变基因（在分化日中标准偏差最高的基因）进行进一步分析。然而，对于疾病与控制分析，随着时间的推移，Deseq2使用1 x^10-4 的多重测试校正p值作为截止值计算疾病与健康对照之间的不同表达基因。另一个可能的过滤步骤是排除差异基因变化小于一定的褶皱变化截止。
2. 在差分基因或高可变基因上执行 kmean 聚类，通过不同的表达模式对它们进行聚类。
3. 使用 pheatmap 封装在热图中可视化差分基因或高可变基因。在热图中绘制的强度是 Deseq2 规范化强度，并减去中值。
基因本体（GO）注释丰富分析
1. 通过在单个样本中收集超过 10 个计数的所有基因，生成表达背景基因的列表。
2. 使用在线工具（如 GOrilla^21）执行GO 分析。使用集群中的差分基因/高可变基因列表作为"基因列表"，将背景基因作为比较的背景。
  注：更高级的 R 用户可以使用包群集Profiler²² 自动执行 Go-term 扩充分析。

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

正常角蛋白细胞分化和RNA-seq分析
在这个实验中，从五个个体中提取的角蛋白细胞线用于分化和RNA-seq分析。图1总结了分化的实验过程和RNA-seq分析结果。图1A中显示了正常角蛋白细胞的体外分化过程和分化过程中细胞形态变化的概述。原理成分分析（PCA）显示，接受分化的角蛋白细胞具有连接但独特的整体基因表达特征（图1B）。高度可变的基因由千族聚聚，以可视化分化过程中的基因表达动力学和模式（图1C）。

每个基因组都代表角蛋白细胞分化标志基因（例如，KRT5用于增殖，KRT1和KRT10用于早期和中期分化，IVL/LOR/FLG用于后期分化）。基因本体（GO）对高可变基因簇的注解分析（图1C）显示这些基因簇的基因功能有明显差异（例如，分化中期的角蛋白化;表皮细胞分化、角蛋白分化和肽交叉链接的后期; 图 1D.通过西印（图1E）测量了几种分化标记的蛋白质表达。

P63 突变角蛋白细胞分化和RNA-seq分析：
在第二个实验中，比较了来自健康对症的角蛋白细胞和携带p63突变的患者（突变体R204W、R279H和R304W）的三条线之间的细胞形态和基因表达差异。 图 2A 显示了分化过程和细胞形态变化的概述。突变的角蛋白细胞在菜表面保持平坦，并没有成为第7天控制角蛋白细胞的拥挤或重叠生长。

在PCA分析中，与图1B相比，控制单元系 明显遵循分化模式。然而，突变细胞在分化过程中的基因表达模式与增殖/未分化细胞的形态基本相似。在三条突变线中，区分R279样本在一定程度上沿PC1和PC2移动，表明与R204W和R304W相比，其分化受损较小。

在聚类分析（图2C）中，控制细胞（聚类1）中低调控的基因在R204W和R279W中部分下降，但在R304W中，它们的基因表达没有发生剧烈变化。这些基因可能在细胞增殖中发挥作用，如 GO 注释（图2D）所示。在组2（图2C）中，基因首先被诱导，随后在控制细胞中降低调节。这些基因很可能参与角蛋白细胞分化，因为表皮分化和角蛋白化功能对于这种聚类基因具有高度丰富性（图2D）。这些基因不是在R204W和R304W诱导，而在R279H细胞中，这些基因是诱导的，但不像对照细胞那样被诱导，

集群3中的基因仅在控制细胞分化结束时诱导（图2D）。与这一点一致，这些基因可能在表皮的最外层发挥作用，因为它们已被证明对外部刺激和炎症有反应（图2D）。这些基因的表达模式在所有三个突变细胞系中变化并不大。控制细胞和突变细胞之间基因表达模式的可见差异表明，在这些体外分化模型中，突变细胞不能正确分化。

图1：角蛋白细胞分化与分析。（A） 角蛋白细胞分化协议和细胞形态概述。比例杆 = 100 μm.（B） 区分控制角蛋白细胞的原理分量分析。 （C） 角蛋白细胞分化期间前500个高度可变基因的热图。使用 kmean 聚类将基因聚类为三个聚类。每个基因簇的代表性分化标记基因在侧面指示。 （D） 与所有表达基因的背景（>10计数）相比，GO术语富集分析对高度可变基因簇中基因的代表性高能函数进行扩充分析。戈里拉用于浓缩试验。 （E） 分化过程中角蛋白细胞分化标记的西印。请单击此处查看此图的较大版本。

图2：控制和p63突变角蛋白细胞的比较。（A） 角蛋白细胞分化方案概述和控制细胞形态和p63突变角蛋白细胞。比例 = 100 μm. （B） 区分控制和患者（R204W、R279H 和 R304W）角蛋白细胞的原理分量分析。 （C） 控制基因和突变角蛋白细胞之间差异基因的热图。使用 kmean 聚类将基因聚类为三个聚类。指出了每个基因簇的代表性分化标记基因。 （D） 与所有表达基因的背景（>10计数）相比，GO术语富集分析对高度可变基因簇中基因的代表性高能函数进行扩充分析。戈里拉用于浓缩试验。请单击此处查看此图的较大版本。

KGM 组件	股票	中等	体积
KBM			500 mL
笔/笔	100，000 单位/千升	100 单位/千升	5 mL
Bpe	±13毫克/千升	0.4%	2 mL
乙醇胺	0.1 米	0.1 mM	500 μL
o 磷氨酰胺	0.1 米	0.1 mM	500 μL
氢皮质松	0.5毫克/千升	0.5 μg/mL	500 μL
胰岛素	5毫克/千升	5 μg/mL	500 μL
Egf	10 μg/mL	10纳克/千升	500 μL

表1.KGM 亲中等补充剂。

KGM 组件	股票	中等	体积
KBM			500 mL
笔/笔	100，000 单位/千升	100 单位/千升	5 mL
乙醇胺	0.1 米	0.1 mM	500 μL
o 磷氨酰胺	0.1 米	0.1 mM	500 μL

表2.KGM-diff 介质补充剂。

补充编码文件： Folder_structure.txt;Generate_genome.txt;Map_fastq.txt;RNA_seq_kc_differentiation_patient.html;RNA_seq_kc_differentiation_wt.html;Sample_data_example.csv;特里默.txt;和 Wig2bw.txt。请点击这里下载此文件。

Subscription Required. Please recommend JoVE to your librarian.

Discussion

本工作描述了一种利用RNA-seq分析诱导人类角蛋白细胞分化和后续表征的方法。在目前的文献中，许多关于人类角蛋白细胞分化的研究使用另外两种方法，高钙浓度或以血清作为诱导分化^{的方法2，3，23。}前一份报告仔细比较了这三^{种不同的方法3，}表明这些方法可以代表角蛋白细胞分化的不同生物学。在同一份报告中，作者指出，血清诱导的分化细胞具有高增殖潜力和表达基因，如KRT16和SKALP/PI3，这些基因在银屑病皮肤中表达，但不是在正常表皮中表达，因此血清诱导的分化模型可用于研究牛皮病。相比之下，接触抑制加生长因子排除的方法可以诱导KRT1和KRT10，它们通常用表皮表示，类似于正常的角蛋白细胞分化。高钙诱导产生一种基因表达特征，即血清诱导和接触抑制之间的基因表达，作为最不具体的方法。在分化过程中使用RNA-seq分析进行的分析证实，接触抑制和生长因子排除的方法导致分化性角蛋白细胞与表皮分化预期相似（例如，增殖细胞中的KRT5，早期分化诱导中的KRT1和KRT10，以及后期分化中的LOR和FLG;图1C.

这些发现表明，这种分化技术是一种易于使用和可靠的方法，用于研究角蛋白细胞分化。此外，本研究从p63突变角蛋白细胞中提取的角蛋白细胞的研究还表明，该方法可用于研究患病条件下受影响的角蛋白细胞分化。在这种体外分化方法中，使用从 Lonza 购买的 KGM，因为这种介质会产生一致的结果。原则上，其他具有类似成分的表皮介质，如来自赛莫费舍尔科学公司（KSFM）的角蛋白细胞无血清介质（KSFM），也很可能合适，尽管这需要测试。

应当指出，这种方法有一些局限性。由于它基于接触抑制，因此需要细胞密度的汇合。在我们的p63突变角蛋白细胞实验中，为确保细胞达到汇合，需要更高的初始播种密度。此外，当细胞生长速度不同时，有时必须在不同的日子里诱导分化。在进行实验时，应考虑这些注意事项。在需要同时诱导细胞的实验环境中，应考虑其他分化方法，包括添加血清、高浓度钙和抑制表皮生长因子受体^2、3。然而，所有体外分化方法都有利弊，因为它们可能代表体内皮肤发育过程中存在的局部分化诱导^信号2。

比较这些不同方法的综合分子分析将具有高度的信息性，并可以指导最适合不同生物过程研究的方法的选择。此外，通过西方印迹或蛋白质学分析等，非常建议验证在转录水平测量的变化。此外，应谨慎使用体外数据，这些模型的结论应在体内验证，最好是在人体皮肤发育中。

RNA提取和RNA-seq库制备的原理在^{此前的24、25、26、27、28}^{中已经很好地描述了}。在此协议中，RNA提取和RNA-seq库制备程序基于商用试剂盒的工作流程。原则上，如果RNA质量良好，则RNA提取的不同方法不应对RNA-seq分析产生重大影响。在RNA质量差的情况下（即，当RNA被提取形式固定石蜡嵌入组织时），RNA-seq仍然可以执行;然而，应调整RNA碎片步骤。RNA-seq库制备涵盖从核糖体RNA（rRNA）去除到cDNA库结构进行测序。主要程序可以通过使用各种试剂盒，或使用单独的酶和自制缓冲液29，30，31，32。应当指出，如果RNA-seq分析使用不同的基本原则（例如，核糖体RNA耗竭或聚A mRNA富集通过杂交到聚T寡聚），RNA-seq分析的结果可能会有所不同。此外，该协议利用核糖体RNA去除通过杂交DNA寡糖到人类，小鼠和大鼠rRNA。当与不同的物种合作时，应采用替代的寡头集。

生成的库的排序可以在片段的两端（配对端）或片段的一端（单端）执行。通常，配对端排序大大提高了可映射性，并提供了有关脚本变体的详细信息。然而，对于这里描述的相对简单的差分基因分析，单端测序也可以提供足够的信息。

对于数据分析的重要步骤，描述了一种相对简单的快速q文件质量控制方法，然后是对基因组的映射读取。尽管提供的 bash 代码没有理想的可伸缩性，但它具有透明度的优点。软件的选择，它执行的步骤，以及数据预处理期间使用的基因组版本，都是非重要的步骤，应该有据可查，这对可重复性至关重要。

对于更高级的用户，可以使用自动化管道执行快速Q文件质量检查、适配器修剪和映射的步骤，例如，ARMOR蛇制造工作流程^33或范海林根实验室³⁴的"RNA-seq"蛇制造工作流程。但是，这些完全自动化的管道透明度较低，更难更改。使用这些工具时，了解这些自动化管道中的函数至关重要。最后，该协议包括RNA-seq数据分析，重点是可变基因表达随着时间的推移。在查看具有多个时间点（如差异）的过程时，变量基因表达比对差分测试更可取。最后，该分析管道介绍了RNAseq数据生物信息学分析的相关工具。它包含的工具，可以彻底评估角蛋白细胞分化，在正常和疾病条件下。

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

作者没有什么可透露的。

Acknowledgments

这项研究得到了荷兰科学研究组织的支持（NWO/ALW/MEERVOUD/836.12.010，H.Z.）（NWO/ALW/公开竞争/ALWOP 376，H.Z.，J.G.A.S.）;拉德布德大学奖学金（H.Z.）;和中国奖学金委员会助学金201406330059（J.Q.）。

Materials

Name	Company	Catalog Number	Comments
Bioanalyzer 2100	Agilent	G2929BA
Bovine pituitary extract (BPE)	Lonza		Part of the bulletKit
CFX96 Real-Time system	Bio-Rad		qPCR machine
Dulbecco's Phosphate-Buffered Saline (DPBS)	Sigma-Aldrich	D8537
Epidermal Growth Factor (EGF)	Lonza		Part of the bulletKit
Ethanolamine >= 98%	Sigma-Aldrich	E9508
High Sensitivity DNA chips	Agilent	5067-4626
Hydrocortison	Lonza		Part of the bulletKit
Insulin	Lonza		Part of the bulletKit
iQ SYBR Green Kit	BioRad	170-8886
iScript cDNA synthesis	Bio rad	1708890
KAPA Library Quant Kit	Roche	07960255001	Low concentration measure kit
KAPA RNA HyperPrep Kit with RiboErase	Roche	KK8540	RNAseq kit
KGM Gold Keratinocyte Growth Medium BulletKit	Lonza	192060
Nanodrop	deNovix	DS-11 FX (model)	Nanodrop and Qbit for DNA and RNA measurements
NEXTflex DNA barcodes -24	Illumnia	NOVA-514103	6 bp long primers
Penicillin-Streptomycin	Gibco	15140122
RNA Pico Chip	Agilent	5067-1513