June 27th, 2020
内在无序结构域对致癌融合转录因子功能很重要。为了治疗靶向这些蛋白质,需要更详细地了解这些结构域所采用的调节机制。在这里,我们使用转录组学来绘制尤文氏肉瘤中内在无序的EWS结构域的重要结构特征。
对重复和无序的转录因子进行结构功能分析是困难的。通过将转录组学与正确的细胞环境相结合,这种方法可以更好地揭示重要的结构功能关系。使用 RNA 测序作为功能输出可以在一次实验中有效评估由单个蛋白质调控的所有基因,从而更有可能进行部分功能检测。
部分功能检测对于致癌融合转录因子尤为重要,因为我们不知道这些蛋白质如何发挥作用,它们的测序可以在融合驱动的癌症中带来更好的治疗。尽管我们将关注 EWS/FLI 中的无序 EWS 结构域,但 EWS 参与其他包含功能定义不明确的无序结构域的融合。对于 cDNA 表达构建体转导,首先用 cDNA 构建体在 37 摄氏度的水浴中快速解冻冷冻病毒,然后将 2.5 微升 8 毫克/毫升的聚凝胺轻轻混合到每个低浓度中。
接下来,从每瓶构建体的一个 50% 至 70% 汇合的 10 cm 细胞培养板中取出培养基,并轻轻绕过整个 2 毫升体积的构建体沿板侧面向下移动。摇动板以将病毒均匀地分布在细胞中,并将板置于 37 摄氏度的组织培养箱中 2 小时,每 30 分钟摇动一次板,以防止板的任何区域变干。孵育结束时,加入 5 mL 培养基,添加胎牛血清、抗生素、丙酮酸钠和聚凝胺。
在细胞培养箱中孵育过夜后,用筛选培养基替换上清液,并将细胞放回细胞培养箱中再放置 7 至 10 天,以便进行筛选和 cDNA 构建体表达。在选择期结束时,将细胞收集到 15 毫升锥形管中进行计数,并将 5 到 10 乘以 10 到第五个细胞分配到一个新管中进行 RNA 测序,将 2 乘以 10 分配给六个细胞到另一个新管中进行蛋白质提取。通过离心沉淀细胞,并将沉淀重悬于 1 毫升冷 PBS 中或 5 分钟离心中。
然后快速冷冻沉淀和液氮,并将细胞储存在零下 80 摄氏度。为了验证目标蛋白质的敲低和构建体的表达,根据标准 Western 印迹分析方案,用适当的一抗和二抗印迹蛋白质裂解物样品。为了评估 RNA 的质量和数量,使用基于硅胶离心柱的提取试剂盒中的裂解缓冲液裂解 RNA 测序细胞样品,并以每分钟 13, 000 转以上的速度将裂解物涂在基因组 DNA 去除柱上,持续 30 至 60 秒。
接下来,进行硅胶离心柱纯化,并根据试剂盒说明在柱上洗涤 RNA。然后在 30 μL 洗脱缓冲液中洗脱 RNA,并在分光光度计上以 260 至 280 nm 的比例分析至少 2.5 μg RNA,以评估 RNA 数量和样品质量。对于 fastq 文件分析,请使用 Putty 打开终端到高性能计算环境,并创建一个名为 project 的分析目录。
导航到项目目录的路径,并为压缩的原始 fastq. gz 文件创建一个名为 fastq 的目录和一个名为 trimmed 的第二个目录。我们一个合适的安全文件传输程序来传输压缩的原始 fastq。
gz 文件从本地存储到到 project fastq 目录的路径中,并检查每个样本是否有 R1 和 R2 文件。导航到项目 fastq 的路径,然后按照指示使用 trim galore 中的命令来修剪 fastq 中的低质量读数。gz 文件。
导航到项目目录的路径,并创建一个名为 STAR output 的新目录。导航到项目 trim 目录的路径,并使用指示的命令运行 STAR 以对齐修剪的 fastq。gz 文件。
找到后续步骤所需的输出,其中包含指定位置的每个转录本的计数,并使用命令读入每个基因输出的读数选项卡文件。对于第一列,仅使用 ENSEMBL 基因 ID 列中句点之前的字符,以便于下游处理。然后使用该命令将所有样本的计数编译到名为 totcts 的数据帧中,并将这个新的原始计数数据表保存为制表符分隔的文本文件。
要使用 DESeq2 定义每个构建体的差异表达谱,请输入实验 DESeq2 设计,并使用来自矩阵函数的 DESeq 数据集构建 DESeq 数据集以估计大小因子并运行 DESeq2。要评估分析质量,请使用 DESeq2 提取正则化对数标准化计数。从 DESeq2 结果中提取每个转录谱的结果时,参考敲低条件或基线空载体进行成对比较。
使用 HGNC 基因符号进一步修改这些结果,并从 DESeq2 数据中提取数据作为单个文件,其中包含 ENSEMBL 基因 ID、HGNC 符号、baseMean 表达和所有构建体的差异表达数据,具有对数二倍变化以及原始和调整后的 P 值。评估成功的批量归一化和感兴趣的样本相似性,并使用代码使用正则化对数归一化计数来检查样本聚类与主成分分析和样本到样本距离图。使用正则化对数归一化计数将 1, 000 个最可变的基因提取到一个矩阵中,并使用热图根据这些基因对样本进行无监督分层聚类。
要从树状图中提取感兴趣的聚类,请确定感兴趣的树状图聚类出现哪个级别,并将 K 设置为等于该级别的聚类数。要确定哪些簇是感兴趣的,请重新绘制按簇排序的热图,并将与每个簇相关的基因列表导出到表中,然后使用适当的生物信息学工具来识别已识别和比较的不同基因簇的生物学作用。在这个代表性分析中,可以观察到阳性和阴性构建体的有效敲低和拯救。
请注意,DAF 拯救的细胞未能形成集落,表明致癌转化受损。复制体验证完成后,可以获得所有样品的表型检测和初始 RNA 测序数据处理基因计数,以进行批量归一化和分析。没有批次归一化的 DESeq2 会导致混杂的批次缺陷,这可能是由于培养物中细胞传代引入的生物变异性以及每个批次的处理差异。
批量归一化后,DESeq2 可用于相对于基线为目标构建体生成转录谱。这些数据的主成分分析表明,DAF 的转录谱介于野生型 EWS/FLI 和 Delta 22 之间,证实了部分功能。此外,样品中 1, 000 个最可变基因的分层聚类表明,DAF 无法抑制 EWS/FLI 靶基因,仅部分保留基因激活活性。
Top 基因分析表明,DAF 激活的基因类别在功能上与 DAF 无功能的 EWS/FLI 激活靶标不同。有趣的是,DAF 最能够挽救 GGAA 微卫星激活的基因,但无法挽救高亲和力位点附近的激活基因。将转录组输出与相关表型测定配对即可完成结构功能分析。
研究人员还可以使用其他技术来研究不同转录功能的机制驱动因素。
本研究探讨了本质上无序域在致癌融合转录因子中的作用,重点关注尤文肉瘤中的EWS域。通过利用转录组学,研究旨在阐明这些无序区域的调控机制。