Summary
在这里, 我们描述了分析和可视化整个抗体再灌注物质的结构和组成的协议。这包括使用下一代测序获取大量抗体 RNA 序列。
Abstract
抗体对抗原识别的巨大适应性是获得免疫系统的基础。尽管我们了解被获取的免疫系统产生大量抗体背后的分子机制, 但还没有能够得出完整抗体的全球观点。特别是 b 细胞再储备被认为是一个黑匣子, 因为它们的抗体克隆数量是天文数字。然而, 下一代测序技术正在促成突破, 以提高我们对 B 细胞库的理解。在本报告中, 我们描述了一个简单而有效的方法来可视化和分析整个单独的小鼠和人的抗体再灌注。从小鼠脾脏和人外周血单个核细胞的免疫器官中, 采用 5 '-race 方法制备、逆转转录和扩增总 rna。使用一个通用的正向引物和反义引物抗体类特异性常量域, 抗体 Mrna 被均匀地放大的比例, 反映他们在抗体群中的频率。通过下一代测序 (NGS) 对这些扩增物进行测序, 每个免疫学样本产生10个以上5个抗体序列。我们描述了抗体序列分析的协议, 包括 V (D) j 基因段注释、抗体剧目的鸟图以及我们的计算方法。
Introduction
抗体系统是获得免疫系统的基础之一。由于其种类繁多、抗原识别特异性好、抗原特异性和抗原特异性 B 细胞的克隆扩张, 它对入侵病原体具有很强的抗作用。抗体产生的 B 细胞的曲目估计在一个单独 1超过 10 15. 这种巨大的多样性是在免疫球蛋白遗传位点2中 vdj 基因重组的帮助下产生的。因此, 描述整个 B 细胞反应及其对抗原免疫反应的动态变化是具有挑战性的, 但对于全面了解针对入侵病原体的抗体反应至关重要。
由于其天文多样性, B 细胞再储备已被视为黑匣子;然而, ngs 技术的出现使人们对其复杂性的理解得到了加强。对整个抗体受体进行了成功分析, 首先是斑马鱼5, 然后是小鼠6, 和人类6,7。尽管 NGS 已成为研究适应性免疫反应的有力工具, 但对单个动物之间抗体再灌注的共性和差异缺乏基本分析。
据报道, 在小鼠中, IgM 再平衡物在个体之间几乎是相同的, 而 IgG1 和 IgG2c 在个体之间则有很大的不同。除了 v 基因使用概况外, 在天真的外周 b 细胞中观察到的 vdj 谱频率在个体8之间非常相似。对 vdj 区氨基酸序列的分析也显示, 不同小鼠在相同的结合序列中发生相同的结合序列的频率远远高于先前的想象.这些结果表明, 抗体受体形成的机制可以是确定性的, 而不是随机的 5,8,9。利用 NGS 对小鼠抗体积累的过程进行了成功的分析, 进一步突出了 NGS 发现抗体免疫系统的潜力.
在本报告中, 我们描述了一种简单而有效的方法来可视化和分析全球水平上的抗体曲目。
Protocol
所有动物实验都是根据机构准则并经国家传染病研究所动物护理和使用委员会批准进行的。本报告作为代表结果, 对健康的成年志愿者进行了多溴联苯并溴调查科联用抽样, 得到了日本东京国家传染病研究所道德委员会的批准, 并获得了书面知情同意使用道德操守委员会批准的表格的每个参与者。
1. 底漆设计
- 设计了一种通用的 cdna 正向引物, 用于扩增免疫球蛋白mrna, 而不受 pcr 引物的影响, 如 5 '-race 11、12和 sart-pcr13技术所示。
- 对于免疫球蛋白 vh 基因扩增, 设计恒定区域内的免疫球蛋白类特异性序列作为反向引物8,14 (图 1 a)。
注: 可以在这些引物中添加多重标记序列, 以标记来自不同样品源的库分子。根据使用的试剂盒手册, 还可以添加嵌套 PCR 的序列 15。
通用正向底漆 | 5 '-AGGGGGTAGCATGAGGT-3 ' |
小鼠免疫球蛋白的反向引物 (Ref.8) | |
IgM_CH1: | 5 '-CACATGATTTACAGGGGGCTCTCTCT-3 ' |
IgG1_CH1: | 5 '-CATCCACCAGGGGGGGGTTAGTGG-3 ' |
IgG2c_CH1: | 5 '-GTACCCCACCCACCAGGGCAGGGGGGGGGGGGGGGGGGA-3 ' |
IgG3_CH1: | 5 '-ATGGCACCCCCGCGGGGGGGGGA-3 ' |
IgA_CH1: | 5 '-加塔加加加加加加加加加加-3 ' |
Ig _ CH1: | 5 '-GCCTCTGGGGGGGGGGGGGGGGAGATACAGG-3 ' |
Ig _ CH1: | 5 '-CTBGAGCTCAGGGGGGGGAACA-3 ' |
人类免疫球蛋白的反向引物 (ref. 14) | |
IgM_CH1: | 5 '-GGAATCTCACCAGAGAGGG-3 ' |
IgG_CH1: | 5 '-AAGCCAGGGCCCTGG-3 ' |
IgD_CH1: | 5 '-GGGGGGTGCCCCTGATA-3 ' |
IgA_CH1: | 5 '-GAAGACTGGGGCTGGGGGT-3 ' |
IgE1_CH1: | 5 '-GAGAGGGGGCTGT-3 ' |
IgE2_CH1: | 5 '-TTGCAGGGGGGGGGCAAGGG-3 ' |
Ig _ CH1: | 5 '-TGCATACGATGGGGGGGGATT-3 ' |
Ig _ CH1: | 5 '-AGAGGGGGGGGGGAGGGGGGA-3 ' |
表 1: 免疫球蛋白的 pcr 扩增入门序列
2. 从免疫细胞和组织中分离核酸
注: 下面给出的程序是从小鼠脾脏中提取核酸。然而, 它适用于其他免疫组织和人体细胞, 如淋巴结或外周血单个核细胞 (Pbmc) (图 1 b)。
- 解剖组织,例如, 从8周的 c57bl6 小鼠的脾脏, 并通过不锈钢网 (200 至 400μm) 与2毫升的 pbs 缓冲液, 以获得分散的细胞。将细胞悬浮液转移到 2.0 mL 微离心管中, 并在600xg 和4°C 下离心 5分钟。放弃上清液。
- 加入800Μl 的 ACK 裂解缓冲液 (150 mM NH4 cl,1 MM khco 3, 0.1mm na 2 edta,ph 7.2), 在冰上孵育 2分钟, 以裂解组织中的红血球。
- 用 PBS 3x 的2毫升清洗组织细胞, 然后在 600xg和4°c 离心5分钟。
- 在颗粒中加入800Μl 的苯硫代鸟酸异硫氰酸试剂, 彻底涡流, 在25°c 左右孵育5分钟。
- 加入氯仿 (200μl), 手动晃动 15秒, 然后在25°c 左右孵育2分钟。
- 在 12, 000xg 和25°c 的温度下离心 15分钟分离相, 并将上水相转移到新鲜的管中。
- 加入一体积70% 乙醇, 旋涡短暂, 并将其应用于二氧化硅自旋柱。
- 用30–100μl 的水使 RNA 被洗脱。
- 使用荧光计 (材料表) 定量初始 rna 浓度。
- 将纯化后的 RNA 存放在-80°C。
3. cDNA 合成与 PCR 扩增
注: 下面描述的方法基于 5 '-race11、12和 smat-pcr 技术13。试剂盒15的手册中描述了反应的细节和优化. 小鼠免疫球蛋白的起始材料是第2.10 步的样本。人体免疫球蛋白的起始材料是人体组织的样本, 如步骤2.3 至2.10 所述。
- 根据制造商的说明 15, 使用 5 '-race CDNA 底漆 (含寡核苷酸) 和 s高温-pcr 寡核苷酸 (材料表) 合成2至10μg 的总 rna 模板的第一链 cdna。
- 对于小鼠免疫球蛋白, pcr 使用通用正向引物和免疫球蛋白类特异性反向引物, 用高保真 dna 聚合酶扩增 cDNA (表 1)。将热循环条件设置为: 94°c 2分钟, 然后40个周期 94°c, 59°c 30秒, 72°c 30秒, 最后延长 72°c 5分钟。
注: 典型的实验放大 IgM、IgG1、IgG2c、Igk 和 Igl 免疫球蛋白类, 以观察天真的、Th1 依赖的 b 细胞和 Th2 依赖 b 细胞 (图 3)。 - 对于人体免疫球蛋白, 使用通用正向引物和免疫球蛋白类特异性反向引物 (表 1) 进行第一次pcr, 并带有标记序列。用索引序列引物通过第二次 pcr 包括每个样本的索引序列.使用以下 PCR 条件和 Taq 聚合酶: 94°c 2分秒, 21周 (1 pcr) 或32个周期 (2nd pcr) 在 94°c, 59°c 30秒, 72°c 30秒.
注: 典型的实验放大 IgM、IgD、IgG (IgG1、Igg2、IgG3 和 IgG4)、Iga (IgA1 和 IgA2)、IgE、Igk 和 Igl 免疫球蛋白类, 以观察所有 B 细胞群 (图 4)。
- 对于小鼠免疫球蛋白, pcr 使用通用正向引物和免疫球蛋白类特异性反向引物, 用高保真 dna 聚合酶扩增 cDNA (表 1)。将热循环条件设置为: 94°c 2分钟, 然后40个周期 94°c, 59°c 30秒, 72°c 30秒, 最后延长 72°c 5分钟。
- 在琼脂糖凝胶上电泳 PCR 产物, 并使用硅膜自旋柱纯化600至 800 bp 碎片。
- 在2% 琼脂糖凝胶上对3.2.1 或3.2.2 的样品进行电泳。
- 可视化 uv 透射光器上的 DNA 带, 并对含有600至 800 bp 宽带的胶片进行切除。
- 每10毫克凝胶片加入10毫升膜结合溶液。在50–65°c 下混合和孵育, 直到凝胶片完全溶解。
- 将凝胶溶液转移到硅膜自旋柱上。用洗涤缓冲液清洗一次, 用50毫升的无核水 (材料表) 洗一次。
- 用每个免疫球蛋白类别的荧光计和池振幅对纯化的振幅进行定量, 以进行相同数量的 NGS 测序。
注: 通常情况下, 每个免疫球蛋白类别恢复2-10 毫克放大 dna。将每个样品溶液在 DNA 中均匀混合, 产生含有 10-20 ng dna/ml 的50毫升溶液。 - 使用基于微毛细管的电泳和 DNA 施胶芯片 (材料表) 确定文库的大小和浓度。将库存储在-20°c。
4. 图书馆的 NGS 测序
- 为指定示例名称、索引信息并指示仅获取. fastq 文件的排序运行生成 sampleshet. cvs。
- 解冻试剂盒 (材料表) 和库。
- 使 0.2 N NaOH 和稀释的文库, 以获得所需的摩尔浓度。
- 冲洗并干燥流动细胞。在试剂盒的井中加入600毫升稀释和变性的库溶液。
- 启动排序运行。
5. NGS 数据的质量控制
- 使用 "fastx 工具包"16执行 fastq 数据的质量控制。
注: 所使用的参数设置的一个基本示例如下所示:
fastq _ 质量 _ 微调器-v-t 20l-200-i [infilenamei. fastq]-o [infilenamei. fastq]
fastq _ 质量 _ filcp-v-q 20-p 80-i [infilenamei. fastq]-o [infilenamei. fastq]
fastx _ 反向 _ 补长-v-i [infilenamey. fastx]-o [infilenamey. fastx] - 通过以下命令将输出文件格式化为 "紧固核酸 (. fna)":
fastq _ to _ fastq-v-n-i [infilenamei. fastq]-o [infilename. fna]
6. 从. Fna 数据中提取和分析免疫球蛋白序列
注: 示例程序是在 UNIX 环境中实现的。请将它们用作示例引用, 因为性能可能取决于操作系统和硬件环境。作者对错误或遗漏不承担任何责任。编程语言 perl 17、r18 和所需模块需要按照所引用网站上的说明安装。igblast 程序需要按照相应网站19、20 上的说明进行安装。
- 下载以下内部程序的例子, 以便从 https://github.com/KzPipeLine/KzPipeLine 进行剧目分析:
03_PipeLine_Mouse.zip;一组用于分析小鼠抗体序列的示例程序。
05_PipeLine_Human.zip;一组用于分析人类抗体序列的示例程序。 - 提取序列数据中的抗体读数: 通过搜索每个免疫球蛋白常量区域中的特征序列的 Perl 程序从数据 (. fna) 中提取每个 ig 类的免疫球蛋白 (Ig) 序列 (表 2)。
- 对于小鼠免疫球蛋白重链 (IgH) 基因, 通过以下命令提取读数:
$perl 01_KzMFTIgCmgggaNtdVer3_Kz160607.pl [输入文件名] [输出文件名 (后缀)] - 对于小鼠免疫球蛋白光链 (IgL) 基因提取读取由以下命令:
$perl 01_KzMFTCkltNtdVer1_170810.pl [输入文件名] [输出文件名 (后缀)] - 对于人类免疫球蛋白重链 (IgH) 基因, 通过以下命令提取读数:
$perl 01_KzMfHuIgHCmgadeNtdVer1_Kz180312.pl [输入文件名] [输出文件名 (后缀)] - 对于人类免疫球蛋白光链 (IgL) 基因, 通过以下命令提取读数:
$perl 01_KzMfHuIgCkltNtd_180316.pl [输入文件名] [输出文件名 (后缀)]
- 对于小鼠免疫球蛋白重链 (IgH) 基因, 通过以下命令提取读数:
- 对 V (D) J 基因重组的产能进行注释和检查:
注: 下面描述的方法使用独立的 IgBLAST19来注释序列中的 V (D) j 基因片段。设置 V (D) J 基因的数据库和 IgBLAST 的参数设置, 如所述20。- 通过以下命令对小鼠免疫球蛋白重链 (IgH) 基因进行注释:
$igblastn _ db _ V $IGDATA/ImtgMouseIghV_NtdDb.txt-germline _ db _ j $IGDATA/ImtgMouseIghJ_NtdDb.txt-germline _ db _ d $IGDATA-生物体-域 _ system imgt 查询./$InFile 辅助 _ data $IGDATA/opitalfile/鼠标 _ glt. aux-show _ pect-outfmt 7 > >./$OutName - 通过以下命令对小鼠免疫球蛋白光链 (IgL) 基因进行注释:
$igblastn _ db _ V $IGDATA/ImtgMouseIgkV_NtdDb.txt-germline _ db _ j $IGDATA/ImtgMouseIgkJ_NtdDb.txt-germline _ db _ d $IGDATA-生物体-域 _ system imgt 查询./$InFile 辅助 _ data $IGDATA/opitalfile/鼠标 _ glt. aux-show _ pect-outfmt 7 > >./$OutName - 通过以下命令对人体免疫球蛋白重链 (IgH) 基因进行注释:
$igblastn _ Db _ v $IGDATA/ImtgHumanIghV_NtdDb.txt-germline _ db _ j $IGDATA/ImtgHumanIghJ_NtdDb.txt-germline _ db _ d $IGDATA 生物体人域-域 _ system imgt 查询./$InFile 辅助 _ data $IGDATA/opentalFile/人类 _ glo. aux-show _ p发 ic-outfmt 7 > >./$OutName - 通过以下命令对人体免疫球蛋白光链 (IgL) 基因进行注释:
$igblastn _ Db _ v $IGDATA/ImtgHumanIgkV_NtdDb.txt-germline _ db _ j $IGDATA/ImtgHumanIgkJ_NtdDb.txt-germline _ db _ d $IGDATA 生物体人域-域 _ system imgt 查询./$InFile 辅助 _ data $IGDATA/opentalfile/man _ glo. aux-show _ p发 ic-outfmt 7 > >./$OutName
- 通过以下命令对小鼠免疫球蛋白重链 (IgH) 基因进行注释:
- 可视化抗体曲目的全球特征。
- 通过以下命令可视化鼠标 IgH 曲目:
$ .00a1_3DView_MoIgH_Kz180406.sh
注: 输入文件是文件名. fna (序列数据), 最好是从6.2.1 的输出文件。此文件需要放置在名为 "文件名" 的较低目录 (文件夹) 中。在 shell 脚本的第50行中, 为 Para_4 指定一个 "文件名"。 - 通过以下命令可视化人类 IgH 曲目:
$ .00a1_3DView_HuIgH_Kz180411.sh
注: 输入文件是文件名. fna 序列数据, 最好是6.2.3 的输出文件。此文件需要放置在名称为 "文件名" 的较低目录 (文件夹) 中。在 shell 脚本的第46行中, 为 Para_4 指定一个 "文件名"。 - 通过以下命令可视化鼠标 IgL 曲目:
$ .00_2DViewS_MoIgL_Kz180406.sh
注: 使用此管道, Igk 和 Igl 将同时进行处理。输入文件是文件名. fna (序列数据), 最好是来自6.2.2 的输出文件。此文件需要放置在名为 "文件名" 的较低目录 (文件夹) 中。在 shell 脚本的第53行中, 为 Para_4 指定一个 "文件名"。输出文件的名称, 以 "_IgKlCount.txtDim2Rpm.txt" 结尾, 给出二维条形图的坐标 (图 3, igl)。 - 通过以下命令可视化人类 IgL 曲目:
$ .00_2DView_HuIgL_Kz180319.sh
注: 使用此管道, Igk 和 Igl 将同时进行处理。输入文件是文件名. fna 序列数据, 最好是6.2.4 的输出文件。此文件需要放置在名为 "文件名" 的较低目录 (文件夹) 中。在 shell 脚本的第53行中, 为 Para_4 指定 "文件名"。以 "_IgKlCount.txtDim2Rpm.txt" 结尾的输出文件名给出了二维条形图的坐标 (图 4, igl)。
- 通过以下命令可视化鼠标 IgH 曲目:
Representative Results
小鼠抗体再活性
从脾脏、骨髓、淋巴结或血液等细胞或组织中可以获得整个小鼠抗体剧目的视角。图 3显示了来自天真的小鼠脾脏的 igm、igg1、IgG2c 和免疫球蛋白光链 (igl) 反应的代表性结果。读取数字的摘要如表 3所示。例如, 166175/47144个读取包含 igm 特定的签名序列 (表 2) 和13371/166175 读取是由 IgBLAST19推断的 vdj-生产。
图 3显示了由 3D-vdj-绘图的 vdj 重排的剧目配置文件, 其中每个球的大小表示读取的相对数量;换句话说, 整个 B 细胞中抗体 Mrna 的数量。三维网格由 110 EHV、12 IGHD 和 4个 EHJ 组成, 它们对齐以反映它们在染色体上的顺序。此外, IgBLAST 在每个强加、IGHD 和前线的最后一个位置分别收集了被模糊分配的基因, 从而在长方体中产生了 7, 215个节点。
此外,如图 3所示, 是一个2D-vj 图, 显示了 igl 曲目中 vj 重排的轮廓。此图形上每个条形图的长度表示读取的相对数量。x 轴代表 101个 Iglv 和 3个 Iglv 基因, y 轴代表 4个 Iglj 基因和 3个 Iglj 基因。未注释的 v 基因和 j 基因表示在正确的边界上。
这些生产性读数的互补确定区域 3 (CDR3) 序列, 在 IgBLAST 输出中给出了大部分抗原结合特异性。cdr3 序列可以进行统计分析, 包括生物或技术复制, 如前面所述的 8,10。
人抗体再灌注物质
可以从包括外周血单个核细胞 (Pbmc) 或病理组织在内的各种组织中分析人体抗体的整体视角。图 4显示了来自正常 pmc 的 igm、Igg (igg1、igg2、IgG3 和 IgG4)、总 Iga (Iga1 和 iga2)、igd、Ige 和 igl 再储备物的代表性结果。读取数字的摘要如表 3所示。例如, 90238/152754 读取包含 igm 特定的签名序列, 67896/90238 读取是 vdj-生产。
VDJ 重排的剧目配置显示在一个 3D-vdjh-图形上, 其中每个球的大小表示读取的相对数量;换句话说, 来自整个 Pbmc 的抗体 Mrna 的数量 (图 4)。三维网格由 56 EV、27 IGHD 和6高 j 组成, 它们按染色体上出现的顺序对齐。此外, IgBLAST 模糊分配的基因在每个高级别、IGHD 和长线的最后一个位置分别表示, 从而在长方体中产生 11, 172个节点。
在 IgL 曲目中 vj 重排的轮廓在2D-vj 图中描述, 其中每个条形图的长度表示读取的相对数量 (图 4)。x 轴代表 41个 Iglv 和 32个 Iglv 基因, y 轴代表 5个 Iglj 基因和 5个 Iglj 基因。未注释的 v 基因和 j 基因表示在正确的边界上。
人类 cdr3 序列在 igblast 输出中给出, 可以进行统计分析, 如前面所述的8,10。
免疫球蛋白类 | 感悟 | 反 义 |
小鼠免疫球蛋白重链 (c57bl6) | ||
Igm | AGTCTCCCCACAATGTC | GACATGGAGAGACTIACT |
IgG1 | AAAACCCCCACCATCTCTC | GACAGGGGGGGGGGTTT |
(IgG1 变种) | AAAACACCCCCACCCACCAGTC | GACTIGGGGTGTTTT |
IgG2c | AAAACACACCCACCCACCGGTC | GACCAGGGTGCTTTT |
IgG3 | GGGATGGATATCT | AGCCATOCACCAGGGATCAC |
Iga | TCCTTGCTCCTGCTGCAG | TCCTTGCTCCTGCTGCAG |
小鼠免疫球蛋白光链 (c57bl6) | ||
伊格克 | CTGATTCCCCCCCCACCCACCAGGAGC | GCCTCAGGGGGGGAGAGAGAGAGATACAG |
Ig 1 | TGTTCCCCCCTCTGAGCCGAG | CTGAGCTCTCAGGGGGGAAACA |
Ig 2 | TGTTCCCCCCTCTCTGAGGCCAAG | CTGAGCTCACAGGGGGGAACA |
Ig 3 | TGTTCCCCCCCCTGAGGCCCCAG | CTGGCTCTGGGGGGGGAACA |
Ig 4 | TTTCCCCCCCCTCTCTGAGCCAAG | CTTGAGCTCTCAGGAGGGGGGGGGACA |
人免疫球蛋白重链 | ||
Igm | GGAGGGCACCCCCCCCCAAC | TGTGGGGGGGGGCACTCCC |
Igg | GCTCCACCACAGGCCCATC | GAGGGCCTGGGAGC |
Iga | GCCCCACCCACCCACCAC | GACCAGGGTGCTTTT |
IgD | GCACCCACCCTCGGA | TCCGGGGTGGGGGGC |
Ige | GCCCCCACACAGCCATC | GEGGCCTGGGGGGGC |
人免疫球蛋白轻链 | ||
伊格克 | ACTEGGCCCATCTGC | GCADAGGGCACACCAGT |
Ig 1, 2, 6 | GTCCTTCCCCCCCCC | GGAGGGGGGAGGGGAC |
Ig 3, 7 | GTCCTCTCCCCCCC | GGEGGGGAGAGGAC |
表 2: 免疫球蛋白特征序列摘要
鼠标 IgH | 总读数 | Igm | IgG1 | IgG2c | ||
输入 | 475,144 | |||||
含有 igc | 166 175 | 229 671 | 36, 628 | |||
vdj-生产 | 133 371 | 196 583 | 33 446 | |||
鼠标 IgL | 总读数 | 伊格卡帕 | 伊格拉姆达 | |||
输入 | 527 668 | |||||
含有 igc | 178 948 | 21 446 | ||||
vj-生产 | 160 924 | 16, 988 | ||||
人类 IgH | 总读数 | Igm | Igg | Iga | IgD | Ige |
输入 | 1, 58, 754 | |||||
含有 igc | 90, 238 | 5, 298 | 94 061 | 75, 549 | 2, 932 | |
vdj-生产 | 67, 896 | 2775 | 78 203 | 56, 495 | 3个 | |
人 IgL | 总读数 | 伊格卡帕 | 伊格拉姆达 | |||
输入 | 1, 58, 754 | |||||
含有 igc | 120 316 | 64, 148 | ||||
vj-生产 | 97 169 | 52, 324 |
表 3: 实验中的读取数字摘要
图 1: 分析单个小鼠抗体再灌注的测序策略的示意图.(A) 使用通用正向引物和免疫球蛋白类特异性反向引物对免疫细胞或组织的总 RNA 进行逆转录酶转录和 pcr 扩增。每个免疫球蛋白类的放大器被汇集并呈现为下一代测序。(b)对 c57bl6 小鼠的脾脏等生物复制物进行了如下处理: 用通用引物和抗体类特异性引物从脾脏样本中纯化了总 rna, 并通过 5 '-race 扩增了 cDNAs。然后, 它们被渲染为下一代测序与标记引物的单个小鼠。图的部分从8改编自有允许。请点击这里查看此图的较大版本.
图 2: 用于分析单个小鼠抗体再灌注的数据处理流程图.对下一代测序后得到的放大器读数进行如下处理: (1) 检查读取序列是否存在抗体类特异性签名序列;(2) 使用 Imgt\ Highv-quest 和/或 IgBLAST 检测 v、D 和 J 基因片段的序列;(3) 收集含有生产性 VDJ 结合部的序列;(4) 这些序列用于分析整体剧目功能、CDR3 等. 请点击此处查看此图的较大版本.
图 3: 小鼠抗体再影的全局数据可视化.通过3D-vdj-pd-plant 对每个抗体类的总体剧目配置文件进行了可视化。x 轴代表110个与染色体上一样有序的 HEV 基因。-和 z 轴分别代表 12个 IGHD 和4个高杰基因。每个节点上的球体体积表示读取次数。红色球体: 非注释 V、D 和 J 基因。IgL 读取分布显示在2D-vj 图上, 其中每个条形图的长度表示读取的相对数量。x 轴代表 101个 Iglv 和 3个 Iglv 基因, y 轴代表 4个 Iglj 和 3个 Iglj 基因。未注释的 V 和 J 基因表示在正确的边界上。请点击这里查看此图的较大版本.
图 4: 人类抗体再影的全球数据可视化.通过3D-vdj-pd-plant 对每个抗体类的总体剧目配置文件进行了可视化。x 轴代表56个与染色体上一样有序的高压基因。-和 z 轴分别代表 27个 IGHD 和6个高杰基因。每个节点上的球体体积表示读取次数。红色球体: 非注释 V、D 和 J 基因。IgL 读取排列在2D-vj 图上, 其中每个条形图的长度表示读取的相对数量。x 轴代表 41个 Iglv 和 32个 Iglv 基因, y 轴表示 5个 Iglj 和 5个 Iglj 基因。未注释的 v 基因和 j 基因表示在正确的边界上。请点击这里查看此图的较大版本.
Discussion
这里描述的方法利用 NGS 的抗体 RNA 扩增使用 5 '-race 方法。与使用退化 5 '-v h 基因引物的方法相比, 每个抗体类的 mrna 都使用普遍的正向引物均匀地放大。此外, 使用抗体基因的恒区域 1 (CH1) 特异性反义引物, 可以对特定的免疫球蛋白类进行剧目分析。这对于解剖类特异性抗体反应以及比较天真和免疫的反应 8, 9 非常有益。
这种方法最可能出现的缺陷是免疫球蛋白信息的缺乏。该协议获得的抗体表达的深度在很大程度上取决于步骤3.1 和3.2 中描述的 PCR 扩增。如果没有正确获取曲目深度, 强烈建议在步骤中更改模板 cDNA 和引物的比例3.2.1 或3.2.2。
一般来说, 大约20% 的 ngs 产生的抗体读数是不明确的序列21。即使有了既定的 "修正方法", 5-10 仍然是不明确的 3。因此, 我们分析了序列和过滤后的原始读数, 其中包含与免疫球蛋白常数区域 (CμH1、Cγ1H1、Cγ2cH1 等) 相对应的特征序列。因此, 对体细胞超突变的分析需要仔细的检查。
这种方法的局限性之一是免疫球蛋白重链和轻链对无法推断。因此, 这种方法获得的剧目观点并不全面。但是, 通过对数据10 的统计分析, 可以近似排名靠前的对。此外, 最近还报道了一种新的免疫球蛋白对序列化方法。
在存在免疫球蛋白基因特征序列的基础上, 提取输出. fna 数据中的免疫球蛋白序列。然后对 V、D 和 J 基因片段进行注释, 并对 V (D) J 重排的生产率进行评估。还对互补确定区域 3 (CDR3) 序列进行了注释。imgt\ highv-quest 服务器22、23、24对. fna 数据中的免疫球蛋白序列进行了系统的检查。然而, 构建自动化处理管道具有分析大实验数据的优点。通过使用独立的 IgBLAST 协议19, 可以设置为每个用途自定义的管道。这种方法需要基本的编程知识, 但对于免疫球蛋白系统的详细分析非常有用。描述的管道是自定义协议的示例 (图 2)。
抗体读数的数量与样本中的抗体 rna 量成正比, 反映了抗体系统在给定时间点5、8、25处的抗体成分。这里描述的方法提供了一个鸟眼的眼睛组成的抗体曲目使用 r 程序8,18,26。
与 IgG1 或 IgG2c 8 相比, 个别天真小鼠的 IgM 抗体受体的全球观点显示了高度保守的 vdj 谱.据报道, 未成熟斑马鱼的 VDJ 组合是高度定型的9。相反, 据报道, 人类 VDJ 组合高度偏斜 6。在天真的 B 细胞中高度保守的确定性 vdj-配置可能是由扭曲的 Vdj-rerety 排列或在体内出现的自动抗原的负选择产生的。例如, IGHV11-2 优先表达在胎儿 IgM 曲目27 , 这种优势归因于 IGHV11-2 对衰老红细胞27的自反应活性。有趣的是, 在我们之前发表的关于天真的 Igm8 的分析中, IGHV11-2也是最常见的主要曲目。
这里描述的方法是有用的破译抗原反应抗体再配, 通过包括分析抗体前剧目空间产生的个别身体, 避免无意中遗漏的关键抗体再让 8, 10个。这种方法还允许检查详细的抗体网络活力, 这将有助于加速发现针对新出现的病原体的保护性抗体。
Disclosures
提交人没有利益冲突可供披露。
Acknowledgments
这项工作得到了 AMED 在赠款号码 JP18fk0108011 (KO 和 SI) 和 JP18fm0208002 (TS、KO 和 YO) 下的赠款和教育、文化、体育、科学和技术部 (15K15159) 向 KO 提供的赠款的支持。我们感谢山口一郎和佐佐佐木佐子提供的宝贵技术援助。我们要感谢 Editage (www.editage.jp) 的英文编辑。
Materials
Name | Company | Catalog Number | Comments |
0.2 mL Strip Tubes | Thermo Fisher Scientific | AB0452 | 120 strips |
100 bp DNA Ladder | TOYOBO | DNA-035 | 0.5 mL |
2100 Bioanalyzer Systems | Agilent Technologies | G2939BA /2100 | |
Acetic Acid | Wako | 017-00256 | 500 mL |
Agarose, NuSieve GTG | Lonza | 50084 | |
Ammonium Chloride | Wako | 017-02995 | 500 g |
Chloroform | Wako | 038-02606 | 500 mL |
Dulbecco's PBS (-)“Nissui” | NISSUI | 08192 | |
Ethylenediamine-N,N,N',N'-tetraacetic Acid Disodium Salt Dihydrate (2NA) | Wako | 345-01865 | 500 g |
Falcon 40 µm Cell Strainer | Falcon | 352340 | 50/Case |
ling lock tube 1.7 mL | BM EQUIPMENT | BM-15 | |
ling lock tube 2.0 mL | BM EQUIPMENT | BM-20 | |
MiSeq Reagent Kit v2 | illumina | MS-102-2003 | 500 cycles |
MiSeq System | illumina | SY-410-1003 | |
NanoDrop 2000c Spectrophotometer | Thermo Fisher Scientific | ||
Potassium Hydrogen Carbonate | Wako | 166-03275 | 500 g |
PureLink RNA Mini Kit | life technologies | 12183018A | |
Qubit 3.0 Fluorometer | Thermo Fisher Scientific | Q33216 | |
Qubit dsDNA HS Assay Kit | Thermo Fisher Scientific | Q32854 | 500 assays |
SMARTer RACE 5’/3’ Kit | Clontech | 634858 | |
TaKaRa Ex Taq Hot Start Version | Takara Bio Inc. | RR006A | |
Trizma base | Sigma | T6066 | 1 kg |
TRIzol Reagent | AmbionThermo Fisher Scientific | 15596026 | 100 mL |
Ultra Clear qPCR Caps | Thermo Fisher Scientific | AB0866 | 120 strips |
UltraPure Ethidium Bromide | Thermo Fisher Scientific | 15585011 | |
Wizard SV Gel and PCR Clean-Up System | Promega | A9282 |
References
- Schroeder, H. W. Jr Similarity and divergence in the development and expression of the mouse and human antibody repertoires. Developmental & Comparative Immunology. 30 (1-2), 119-135 (2006).
- Tonegawa, S.
Somatic generation of antibody diversity. Nature. 302 (5909), 575-581 (1983). - Georgiou, G., et al. The promise and challenge of high-throughput sequencing of the antibody repertoire. Nature Biotechnology. 32 (2), 158-168 (2014).
- Lees, W. D., Shepherd, A. J. Studying Antibody Repertoires with Next-Generation Sequencing. Methods in Molecular Biology. 1526, 257-270 (2017).
- Weinstein, J. A., Jiang, N., White, R. A. 3rd, Fisher, D. S., Quake, S. R. High-throughput sequencing of the zebrafish antibody repertoire. Science. 324 (5928), 807-810 (2009).
- Arnaout, R., et al. High-resolution description of antibody heavy-chain repertoires in humans. PLoS One. 6 (8), e22365 (2011).
- Boyd, S. D., et al. Individual variation in the germline Ig gene repertoire inferred from variable region gene rearrangements. Journal of Immunology. 184 (12), 6986-6992 (2010).
- Kono, N., et al. Deciphering antigen-responding antibody repertoires by using next-generation sequencing and confirming them through antibody-gene synthesis. Biochemical and Biophysical Research Communications. 487 (2), 300-306 (2017).
- Jiang, N., et al. Determinism and stochasticity during maturation of the zebrafish antibody repertoire. Proceedings of the National Academy of Sciences of the United States of America. 108 (13), 5348-5353 (2011).
- Sun, L., et al. Distorted antibody repertoire developed in the absence of pre-B cell receptor formation. Biochemical and Biophysical Research Communications. 495 (1), 1411-1417 (2018).
- Olivarius, S., Plessy, C., Carninci, P. High-throughput verification of transcriptional starting sites by Deep-RACE. Biotechniques. 46 (2), 130-132 (2009).
- Yeku, O., Frohman, M. A. Rapid amplification of cDNA ends (RACE). Methods in Molecular Biology. 703, 107-122 (2011).
- Zhu, Y. Y., Machleder, E. M., Chenchik, A., Li, R., Siebert, P. D. Reverse transcriptase template switching: a SMART approach for full-length cDNA library construction. Biotechniques. 30 (4), 892-897 (2001).
- Vollmers, C., Sit, R. V., Weinstein, J. A., Dekker, C. L., Quake, S. R. Genetic measurement of memory B-cell recall using antibody repertoire sequencing. Proceedings of the National Academy of Sciences of the United States of America. 110 (33), 13463-13468 (2013).
- SMARTer RACE 5’/3’ Kit User Manual (634858, 634859). , (2018).
- FASTX-Toolkit. , Available from: http://hannonlab.cshl.edu/fastx_toolkit/ (2018).
- Perl. , Available from: https://perldoc.perl.org/ (2018).
- R: A language and environment for statistical computing. , R Foundation for Statistical Computing. Vienna, Austria. (2016).
- Ye, J., Ma, N., Madden, T. L., Ostell, J. M. IgBLAST: an immunoglobulin variable domain sequence analysis tool. Nucleic Acids Research. 41 (Web Server issue), W34-W40 (2013).
- IgBLAST. , Available from: https://www.ncbi.nlm.nih.gov/igblast/faq.html (2018).
- Prabakaran, P., Streaker, E., Chen, W., Dimitrov, D. S. 454 antibody sequencing - error characterization and correction. BMC Research Notes. 4, 404 (2011).
- Lefranc, M. P., et al. IMGT, the international ImMunoGeneTics information system. Nucleic Acids Research. 37 (Database issue), D1006-D1012 (2009).
- Alamyar, E., Duroux, P., Lefranc, M. P., Giudicelli, V. IMGT((R)) tools for the nucleotide analysis of immunoglobulin (IG) and T cell receptor (TR) V-(D)-J repertoires, polymorphisms, and IG mutations: IMGT/V-QUEST and IMGT/HighV-QUEST for NGS. Methods in Molecular Biology. 882, 569-604 (2012).
- IMGT/HighV-QUEST. , Available from: http://www.imgt.org/HighV-QUEST/login.action (2018).
- Glanville, J., et al. Precise determination of the diversity of a combinatorial antibody library gives insight into the human immunoglobulin repertoire. Proceedings of the National Academy of Sciences of the United States of America. 106 (48), 20216-20221 (2009).
- rgl: 3D Visualization Using OpenGL. , R package version 0.95.1247 (2015).
- Hardy, R. R., Wei, C. J., Hayakawa, K. Selection during development of VH11+ B cells: a model for natural autoantibody-producing CD5+ B cells. Immunological Reviews. , 60-74 (2004).