Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Interactome: Domainome 图书馆建设、噬菌体展示和下一代测序的验证与选择协议

Published: October 3, 2018 doi: 10.3791/56981

Summary

所描述的协议允许构造、特征和选择 (针对选择的目标) 的 "domainome" 图书馆由任何 DNA 来源。这是通过一个结合不同技术的研究管道实现的: 噬菌体展示, 折叠记者和下一代测序, 以及一个用于数据分析的 web 工具。

Abstract

折叠记者是具有易于识别的表型的蛋白质, 如抗生素耐药性, 其折叠和功能被破坏时, 融合到糟糕的折叠蛋白或随机开放阅读框架。我们已经制定了一个战略, 通过使用 TEM-1 β-酶 (酶授予氨苄西林抗性) 的基因组规模, 我们可以选择正确折叠的蛋白质领域的集合, 从 DNA 编码部分的任何 intronless 基因组。这种方法所获得的蛋白质片段, 所谓的 "domainome", 将是良好的表达和可溶性, 使它们适合结构/功能研究。

通过在噬菌体显示系统中直接克隆和显示 "domainome", 我们已经表明有可能选择具有所需绑定特性 (例如,其他蛋白质或抗体) 的特定蛋白质领域, 从而提供必要的基因注释或抗原鉴定的实验信息.

使用新的下一代测序技术可以实现对选定多克隆种群中最富集克隆的识别。基于这些原因, 我们引入了对库本身和选择输出的深度测序分析, 以提供关于每个选定片段的多样性、丰度和精确映射的完整信息。此处介绍的协议显示了库的构建、描述和验证的关键步骤。

Introduction

在这里, 我们描述了一个高通量的方法来构建和选择的折叠和可溶性蛋白质领域从任何基因/基因组的起始源。该方法结合了三种不同的技术: 噬菌体展示, 使用折叠记者和下一代测序 () 与特定的 web 工具进行数据分析。这些方法可用于许多不同的蛋白质基础研究背景下, 用于鉴定和诠释新的蛋白质/蛋白质领域, 表征已知蛋白质的结构和功能特性, 以及定义蛋白质相互作用网络。

在蛋白质的研究中仍然存在许多开放性的问题, 而优化蛋白质生产方法的发展是对几个研究领域的重要需求。例如, 尽管有数以千计的原核和真核基因组1, 但相对蛋白质组的对应地图与编码的蛋白质和肽的直接注释仍然是缺掉的大多数有机体。完整蛋白质组的目录正在成为一个具有挑战性的目标, 需要在时间和资源方面作出巨大的努力。实验注释的黄金标准仍然是克隆所有的开放阅读框架 (码) 的基因组, 建立所谓的 "ORFeome"。通常基因功能被分配基于同源性的相关基因的已知活动, 但这种方法是不准确的, 由于存在许多不正确的注释在参考数据库2,3,4, 5。此外, 即使是已识别和标注的蛋白质, 也需要进行额外的研究, 以在不同的语境中, 从丰度、表达模式等方面进行表征, 包括结构和功能特性, 以及交互网络。

此外, 由于蛋白质是由不同的领域组成的, 每一个都显示出特定的特征, 并且对蛋白质功能有不同的贡献, 研究和这些领域的确切定义可以让一个更全面的图片, 无论是在单一基因和全基因组水平。所有这些必要的信息使得基于蛋白质的研究成为一个广泛而具有挑战性的领域。

从这个角度看, 对蛋白质生产的无偏和高通量的方法可以作出重要贡献。然而, 这些方法的成功, 除了所需的大量投资之外, 还依赖于产生可溶性/稳定蛋白质结构的能力。这是一个主要的限制因素, 因为它已经估计, 只有约30% 的蛋白质可以成功地表达和生产在足够的水平, 是实验性有用的6,7,8。克服这种限制的方法是基于使用随机碎片 DNA 产生不同的多肽, 它们共同提供单个基因的重叠片段表示。在随机生成的 DNA 片段中, 只有很小的一部分是功能性的码而绝大多数是非功能性的 (由于其序列中有停止密码子的存在) 或编码为不自然 (在原始的框架中的 ORF)无生物学意义的多肽。

为了解决所有这些问题, 我们小组开发了一种高通量蛋白质表达和交互分析平台, 可用于基因组9101112。该平台集成了以下技术: 1) 一种从任何有机体的 DNA 编码部分中选择正确折叠的蛋白质域集合的方法;2) 噬菌体展示技术选择合作伙伴的互动;3) 在研究中完全刻画整个 interactome 的特征, 识别出感兴趣的无性系;和 4) 为用户提供数据分析的 web 工具, 无需任何生物信息学或编程技能即可轻松、方便用户地进行 Interactome 分析。

使用这个平台比其他的调查策略具有重要的优势;高于一切的方法是完全无偏见的, 高通量, 和模块化的研究范围从单一基因到整个基因组。管道的第一步是从随机碎片 DNA 的研究中创建一个库, 然后深入地描述其特征。这个库是使用一个工程的载体生成的, 其中的基因/片段被克隆在一个信号序列的蛋白质分泌到周质空间 (Sec 的领导者) 和 TEM1 β酶基因。融合蛋白将赋予氨苄西林抗性和在氨苄西林压力下生存的能力, 只有当克隆的片段是在框架内与这些元素和结果融合蛋白正确折叠10,13 ,14。所有克隆在抗生素选择后获救, 所谓的 "筛选克隆", 是码, 其中大部分 (超过 80%) 来自实际基因9。此外, 这一战略的力量在于发现所有的 ORF 筛选克隆是编码正确折叠/可溶性蛋白/域15。由于许多克隆, 存在于同一区域/域中的库和映射中, 有不同的起点和终点, 这允许对可能导致可溶性产品的最小碎片进行无偏见的单步识别。

这项技术的进一步改进是通过使用的方法来描述图书馆。这个平台和一个特定的数据分析工具的结合, 给出了关于精确核苷酸序列的重要无偏信息, 以及在研究中选择的码的位置, 而不需要进一步广泛的分析或实验性的努力。

Domainome 库可以转换为选择上下文, 并用作执行功能性研究的通用工具。我们整合的高通量蛋白表达和交互分析平台, 我们称之为 Interactome, 利用噬菌体显示技术, 将经过筛选的 ORF 转化为 phagemid 载体, 并创建噬菌体-ORF图书馆。一旦重新克隆成噬菌体显示语境, 蛋白质领域就显示在 M13 粒子的表面上;这样, domainome 库就可以直接选择用于编码具有特定酶活动或绑定属性的域的基因片段, 从而允许 interactome 网络分析。这种方法最初是由 Zacchi来描述的。16和以后使用在另外几个上下文13,17,18

与其他用于研究蛋白质-蛋白质相互作用 (包括酵母两种杂交系统和质谱19,20) 的技术相比, 一个主要的优势是在噬菌体中发生的结合伙伴的放大。显示多轮选择。这样就增加了选择灵敏度, 从而可以识别出库中存在的低丰度结合蛋白域。由于缺少非功能性克隆, 因此使用 ORF 过滤库进行选择的效率进一步提高。最后, 该技术允许对蛋白质和非蛋白诱饵21,22,23,24,25进行选择。

使用 domainome 噬菌体库的噬菌体选择可以使用来自不同病理条件的患者血清中的抗体,自身免疫性疾病13, 癌症或传染病作为诱饵。这种方法被用来获得所谓的 "抗体签名" 的疾病正在研究允许大规模识别和表征的抗原/表位明确承认的患者的抗体, 在同一时间。与其他方法相比, 使用噬菌体显示可以识别线性和构象抗原表位。确定一个特定的签名可能会对了解发病机制、新的疫苗设计、确定新的治疗靶点以及开发新的和特定的诊断和预后工具有重要影响。此外, 当研究集中在传染病, 一个主要的优势是发现免疫蛋白是独立于病原体的培养。

我们的方法证实, 折叠的记者可以使用在基因组规模, 以选择 "domainome": 一个正确折叠, 良好表达, 可溶性蛋白域的集合从 DNA 的编码部分和/或从任何有机体的 cDNA。一旦分离的蛋白质片段是有用的许多目的, 提供必要的实验信息的基因注释, 以及结构研究, 抗体表位映射, 抗原鉴定等。通过该方法提供的高通量数据的完整性, 可以对高度复杂的样本 (如噬菌体显示库) 进行分析, 并具有规避传统的对单个噬菌体获救克隆进行费力采摘和测试的潜力。

同时多亏了过滤库的特点, 以及对分析的极端灵敏度和威力, 在初始屏幕上可以直接识别每个交互的蛋白质域, 而无需创建每个绑定蛋白质的附加库。domainome 可以获得对任何基因/基因组起始源的整体的全面定义, 而数据分析 web 工具可以从定性和定量的角度来获取高度具体的特征。interactome 蛋白质的领域。

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. ORF 图书馆的建设 (图 1)

  1. 插入 DNA 的制备
    1. 合成或基因组 DNA 片段的制备
      1. 用标准方法提取/纯化 DNA26
      2. 片段 DNA 由超声波。如果使用标准 sonicator, 一般建议从三十年代的脉冲开始, 100% 的功率输出。
        注: 试验应采用不同的功率和超声波时间进行实验, 以确定最佳的 DNA 制备条件。每次测试后, 通过琼脂糖凝胶电泳确定 DNA 片段的大小。
      3. 将微气泡 dna 加载到1.5% 琼脂糖凝胶上, 连同100的 bp dna 阶梯。以5伏/厘米为15分钟进行短时间电泳, 并切开含有碎片 DNA 涂片的凝胶部分。
      4. 用柱状凝胶萃取试剂盒纯化插入 DNA, 用紫外分光光度计测量浓度。
        注: 在这一步骤之后, 应至少获得500的纯化刀片, 并将其与1µg 的消化载体结扎, 如步骤1.3 所述。通过评估260nm/280nm260nm/230nm比率来检查碎片准备的质量, 因为样品质量低会影响结扎效率。
      5. 根据制造商的说明, 将5微克的插入物与 1 ul 的快速钝化套件酶组合治疗。用70摄氏度加热10分钟, 可将酶停用, 在-20 摄氏度时保存, 直到使用。
    2. 从 cDNA 中制备片段
      1. 用标准方法提取 RNA (例如,使用 TRizol 或类似试剂)。
      2. 片段 mRNA 通过加热在执行反向转录之前。最后的 DNA 片段长度由 mRNA 沸腾时间和随机引物浓度控制。例如, 热样本为6分钟, 在95摄氏度。
      3. 根据制造商的协议, 使用随机引物制作 cDNA, 并提供任何可用的工具包。
      4. 用生物素化聚达3小时, 在37摄氏度的情况下, 对聚 dT 尾的 cDNA 进行杂交, 并在链亲和素磁珠上分离 Carninci 等。13
      5. 根据制造商的说明, 恢复未绑定材料并使用基于柱的 DNA 纯化试剂盒进行提纯。使用紫外分光光度计测量浓度。请参见步骤1.1.1.4 中的注释。
  2. 过滤载体的制备
    1. 文摘5µg 纯化克隆载体 pFILTER312与 10 U EcoRV 限制酶, 遵循制造商的协议。
    2. 负载2µL (200 ng) 的消化载体, 连同 100 ng 的未消化的载体和 1k bp 分子标记, 在1% 琼脂糖凝胶, 以检查适当的消化。热钝化限制酶。
    3. 添加1/10 体积10x 磷酸酶缓冲液和1µL (5 U) 磷酸酶和孵育37°c 为15分钟, 5 摄氏度的热灭活。
    4. 用琼脂糖凝胶萃取纯化消化质粒, 用紫外分光光度计测定浓度。样品可以存储在-20 °c, 直到使用。
  3. 结扎和转换
    1. 按如下方式进行结扎: 对1µg 的消化质粒添加 400 ng 磷酸化插入物 (质粒: 插入摩尔比 1:5), 10 µL 10x 缓冲 T4 dna 连接酶, 2 µL 高浓度 T4 dna 连接酶最终体积100µL. 孵育反应在16°c overnight.热灭活在65摄氏度为10分钟。
    2. 加入1/10 醋酸钠溶液 (3 米, pH 5.2) 和2.5 容积100% 乙醇, 沉淀结扎产物。混合和冻结在-80 °c 20 分钟。
    3. 离心机在最大速度为20分钟在4°c。放弃上清。
    4. 将500µL 的冷70% 乙醇添加到颗粒和离心机中, 最大速度为20分钟4摄氏度。放弃上清。
    5. 空气干燥颗粒。将沉淀的 DNA 并用重悬到10µL 的水中。
    6. 进行细菌细胞电穿孔。
      注意: 需要使用高效细胞 (高于 5x109转化每µg 的 DNA)。我们建议使用大肠杆菌DH5αF ' (F'/endA1 hsd17 (rK − mK +) supE44 thi-1recA1 gyrA (Nalr) relA1 (lacZYA argF) U169 deoR (F80dlacD (lacZ) M15) 在家里生产或从几个制造商购买。
      1. 在冰上放置适当数量的离心管和0.1 厘米电穿孔小试管。添加1µL 的纯化结扎液 (在 DI 水中) 到25µL 的细胞和轻拍管几次。
      2. 将 DNA 细胞混合物转移到冷试管上, 在台面2x 上敲击, 从试管外部擦拭水, 放在电穿孔模块中, 然后按下脉冲。
      3. 使用25µF、200Ω和1.8 伏的标准 electroporator 机进行电穿孔。时间常数必须为4-5 毫秒。
    7. 立即添加1毫升的液体2xYT 培养基没有任何抗生素, 转移到10毫升管和允许增长37摄氏度, 颤抖在 220 rpm 1 h。
    8. 板块转换 DH5αF 15 厘米2xYT 琼脂板补充34µg/毫升氯霉素 (pFILTER 抵抗) 和25µg/毫升氨苄西林 (选择性标记码) 和孵化隔夜在30摄氏度。
    9. 稀释10厘米2xYT 琼脂板上的库板, 辅以氯霉素 + 氨苄西林和氯霉素, 执行库滴定。孵化过夜在30摄氏度。
  4. pFILTER-ORF 库验证
    1. 测试15-20 个菌落从氯霉素和氯霉素/氨苄西林板, 以估计插入大小分布。在100µL 2xYT 培养基中, 不带抗生素的情况下, 选择一个小贴士, 分别稀释它们。使用此解决方案的0.5 µL 作为 PCR 反应的 DNA 模板, 与任何标准的 TaqDNA 聚合酶遵循制造商的协议。
    2. 使用55°c 的 T 退火和四十年代的延长时间在72°c 执行25周期的放大。底漆序列在材料表中提供。
    3. 在1.5% 琼脂糖凝胶上装载 PCR 产品, 连同 100 bp DNA 梯子和运行。
  5. pFILTER-ORF 图书馆收藏
    1. 通过添加3毫升新鲜的2xYT 培养基, 并用无菌刮刀收割, 彻底混合, 补充20% 不育甘油, 在小整除数中贮存-80 摄氏度, 从150毫米板中收集细菌。
    2. 用柱基质粒提取试剂盒 (在添加甘油之前) 从一个整除中纯化质粒 DNA, 遵循制造商的说明。
    3. 用紫外分光光度计测量浓度。样品可以储存在-20 摄氏度, 直到用于 phagemid 图书馆的准备和/或描述的。

2. 在 Phagemid 向量中筛选码的亚克隆 (图 2)

  1. ORF 过滤 DNA 片段的制备
    1. 从 pFILTER 库向量中建立了5µg 纯化载体的限制酶消化, 添加了 BssHII 的 10 U 和孵化按制造商的协议。用 10 U 的 NheI 来灭活酶和消化。
    2. 将所消化的 DNA 加载到1.5% 琼脂糖凝胶上, 连同 100 bp dna 阶梯。以5伏/厘米为15分钟进行短时间电泳, 或仅足以区分切除片段的涂片, 并切开含有它们的凝胶的部分。
    3. 用柱基凝胶萃取试剂盒纯化插入 DNA, 用紫外分光光度计测量浓度。
  2. phagemid DNA 的制备
    1. 建立了5µg 纯化 pDAN527的限制酶消化。
    2. 通过在0.75% 琼脂糖凝胶上运行经消化的 DNA, 从凝胶中提取出一种基于柱的试剂盒, 纯化消化质粒。
    3. 使用紫外分光光度计测量浓度。样品可以存储在-20 °c, 直到使用。
  3. 图书馆结扎、转换和收集
    1. 按照 pFILTER 向量的描述进行结扎和转换。
    2. 板块变换 DH5αF ' 在150毫米2xYT 琼脂板补充100µg/毫升氨苄西林和孵化过夜30摄氏度。
    3. 稀释100毫米2xYT 琼脂板上的库板, 辅以100µg/毫升氨苄西林, 以确定库的大小。
    4. 按照步骤1.4 中描述的随机选取克隆的 PCR 执行库验证。
    5. 收集 phagemid-ORF 图书馆的收获细菌从150毫米板, 彻底混合, 补充他们与20% 不育甘油和存储在-80 °c 在小整除数。
    6. 用柱基质粒提取试剂盒, 根据制造商的指示, 从图书馆的一个整除中纯化质粒 DNA。
    7. 测量紫外分光光度计的浓度。样品可以储存在-20 摄氏度, 直到被用于表征的产品。

3. 噬菌体库的准备和选择程序

  1. 噬菌体生产
    1. 将 phagemid 库的库存整除稀释成10毫升的2xYT 液汤, 辅以100µg/毫升氨苄西林, 以使外径600nm = 0.05。
    2. 将稀释后的图书馆生长在5-10 倍于原体积的无菌瓶中, 在37摄氏度时以220转每分钟的转速摇晃直到达到 OD600nm = 0.5。
    3. 感染细菌的帮助下噬菌体 (例如M13K07) 在多样性的传染病20:1。留在37°c 45 分钟, 偶尔搅拌 (每10分钟)。
    4. 在室温下, 离心菌在 4000 x g 处为10分钟。丢弃上清, 再悬浮40毫升2xYT 液汤中的细菌颗粒, 辅以100µg/毫升氨苄西林和50µg/毫升卡那霉素, 并在28摄氏度生长, 夜间以 220 rpm 摇晃。
    5. 次日, 离心细菌在 4000 x g 20 分钟在4摄氏度。收集含有噬菌体的上清液。
  2. PEG 沉淀的噬菌体。
    1. 添加1/5 体积的0.22 µm 过滤 peg/NaCl 溶液 (20% 瓦特/v peg 6000, 2.5 米 NaCl) 到清除噬菌体和孵化冰为30-60 分钟。
      注意: 溶液在几分钟后就变得烟雾缭绕, 预示着一个成功的噬菌体沉淀。溶液的混浊会在潜伏期增加。
    2. 离心机在 4000 x g 15 分钟在4摄氏度。一粒白色的噬菌体会形成。
    3. 并用重悬1毫升的无菌 PBS。转移到1.5 毫升管和离心机在4°c 10 分钟的最大速度, 以消除污染细菌。褐色的小球会形成。
    4. 将含有噬菌体的上清液转移到新管中。在冰上保持噬菌体连续滴定和噬菌体选择。
  3. 噬菌体滴定法
    1. 准备噬菌体溶液的稀释系列。将10µL 的噬菌体溶液放入990µL 的 PBS 中, 获得 10-2的稀释。再稀释这个准备使 10-4并且从这获得 10-6稀释。
    2. 生长 DH5αF 的细菌细胞成2xYT 液体培养基在37°c 与震动, 直到 OD600nm = 0.5 达到。将所制备的细菌1毫升转化为1.5 毫升管, 并立即感染 10-4噬菌体稀释液的1µL。孵育不摇晃在37°c 为45分钟. 重复相同的步骤 10-6稀释。
    3. 将被感染的细菌板稀释成100毫米2xYT 版。一夜之间把盘子放在30摄氏度。
    4. 板100µL 未感染的 DH5αF ' 在2xYT 琼脂板补充100µg/毫升氨苄西林, 以检查没有污染的准备。
    5. 在计数了殖民地的数量和计算噬菌体滴度之后的一天。表达的效价作为噬菌体/毫升的数量。预期的效价是 1012-13噬菌体/毫升。
  4. 噬菌体选择
    1. 噬菌体筛选作为诱饵纯化抗体的应用
      1. 饱和噬菌体通过稀释200µL 的噬菌体准备成等量的 PBS-4%skimmed 牛奶和孵化1小时室温下缓慢旋转。这个步骤允许阻止噬菌体的不特异绑定。将30µL 的蛋白-G 涂层磁性珠子转移到1.5 毫升管上。
      2. 洗两次如下: 添加500µL 的 PBS, 在车轮上孵育2分钟在室温下, 用磁铁把珠子拉到管子的一侧, 然后取出上清。
      3. 在室温下用缓慢旋转的30分钟, 用洗涤过的珠子孵化饱和噬菌体。
      4. 用磁场把珠子拉到一边。收集含有噬菌体的上清液用于选择步骤。
      5. 在执行前一步时, 通过共轭纯化的抗体来制备磁性珠子。如上文所述, 洗涤30µL 的蛋白 G 涂层磁性珠子。稀释10µg 的纯化抗体在500µL 的 PBS, 添加到洗涤珠和孵化在室温下缓慢旋转45分钟。
        注: 执行两种不同的磁性微珠的制备: 一种有兴趣的抗体, 一个具有控制抗体, 例如从健康的捐献者身上纯化的抗体。在输出的分析步骤中减去控制抗体选择的抗原序列。另外, 载有控制抗体的磁性珠子可以用来执行噬菌体的预清步骤 (遵循与不共轭珠孵化的协议)。
      6. 噬菌体选择: 用磁铁将珠子画在管子的一侧, 除去最后的洗涤, 在室温下添加噬菌体和孵育, 在室温下缓慢旋转90分钟. 用500µL PBS-0.1%@modeltype@ 和5倍于 PBS 冲洗5次。
      7. 洗脱束缚噬菌体, 代表选择的输出, 通过混合的珠子与1毫升的 DH5αF 细胞生长在 OD600 = 0.5。用珠子孵化细菌45分钟, 37 摄氏度, 偶尔摇晃 (每10分钟)。150毫米2xYT 琼脂板上的输出, 辅以100µg/毫升氨苄西林。
      8. 板材100µL 未稀释和不同的稀释的输出 (10-1到 10-5) 执行滴定。在收集细菌从150毫米板材通过增加3毫升新鲜2xYT 培养基和收获他们用无菌刮刀, 完全地混合, 补充他们与20% 不育甘油并且存放在-80 °c 在小整除数。
      9. 再次种植一个整除, 以执行第二轮选择。重复以上所述的平移过程, 除洗涤条件外。在这种情况下洗涤10次与 PBS-1%@modeltype@ (倾吐解答在管子并且立刻倾吐)。然后添加500µL 的 PBS 和孵育在室温旋转10分钟. 执行其他10洗涤与 PBS。进行第一轮选择的洗脱步骤。
      10. 根据制造商的指示, 从一个整除的输出中提取质粒 DNA。贮存质粒在-20 摄氏度, 直到它将用于深度测序。
    2. 噬菌体筛选作为诱饵重组蛋白的应用
      1. 饱和噬菌体通过稀释200µL 的噬菌体准备成等量的 PBS-4%skimmed 牛奶和孵化1小时室温下缓慢旋转。
      2. 添加100µL 的链亲和素磁性珠子。在室温下孵育1小时以选择链亲和素结合的噬菌体。用磁铁把珠子拉到一边, 去掉链亲和素的噬菌体。从上一步取上清, 加入生物素化蛋白 (浓度为 100-550 nM), 在室温下在转子上孵育30分钟至1小时。
      3. 准备磁性珠: 在执行前一步时, 用 pbs、并用重悬在 pbs 2% 脱脂奶中冲洗100µL 的链亲和素磁性珠子, 在室温下以30分钟至1小时的旋转孵化。
      4. 噬菌体选择: 用磁铁将珠子画在管子的一侧, 去除 PBS-2%milk 和并用重悬的微珠与噬菌体蛋白混合。室温下缓慢旋转孵育90分钟。
      5. 用磁铁将珠子绘制到管的一侧, 丢弃上清, 用500µL 的 PBS 0.1% Tween-20, 仔细清洗五次。按照上一节中的说明执行洗脱。

4. 噬菌体图书馆深度测序平台 (图 3)

  1. DNA 插入从 pFILTER-ORF-pDAN5-ORF-library 或选择噬菌体库中恢复
    1. 解冻图书馆的一个整除, 用分光光度计量化它, 用特定的引物进行放大来恢复 DNA 插入。
      注: 用于营救插入物的引物在其 5 ' 端连接到适配器序列, 从而允许扩增子池的连续索引, 以及使用音序器恢复的 DNA 插入物的直接测序。它们的顺序在材料表中。适配器用粗体表示, 而特定的引物用楷体字表示。
    2. 使用2.5 µL (pFILTER/phagemid/选择噬菌体) 库作为 PCR 反应的 DNA 模板。
    3. 使用以下程序:95 °c 为3分钟;25周期95°c 为三十年代, 55 °c 三十年代, 72 °c 为三十年代;72°c 5 分钟, 保持在4摄氏度。
      注意: 此时建议在 Bioanalyzer 或 TapeStation 上运行1µL PCR 产品, 以验证 amplicons 的大小并检查它们是否在正确的范围内。
  2. PCR 清理
    1. 把磁珠 (AMPure) 带到室温。将整个 pcr 产品从 pcr 管转移到1.5 毫升管。漩涡磁珠三十年代, 以确保珠子均匀分散。添加20µL 的磁性珠子, 每管含有 PCR 产品, 混合通过轻轻吹打。室温孵育, 5 分钟不摇晃。
    2. 将盘子放在磁性支架上2分钟, 或直到上清清除。用 PCR 产品在磁性支架上, 除去并丢弃上清液。
    3. 用新鲜制备的80% 乙醇, 用 PCR 产品在磁性支架上清洗珠子, 如下所示: 添加200µL 的新鲜制备的80% 乙醇到每个样品井;在 3 s 的磁性立场上孵化板块;小心取出并丢弃上清。
    4. 进行第二次乙醇洗涤, 用 PCR 产品在磁性支架上;在第二次清洗结束时, 小心地除去所有的乙醇, 让珠子风干10分钟。
    5. 将 PCR 产品从磁性支架上取出, 加入17.5 µL 10 mM 的 pH 8.5 到每管, 轻轻地将吸管向上和向下10次, 确保珠子完全悬浮。室温孵育2分钟。
    6. 将管放在磁性支架上2分钟或直到上清清除, 小心转移15µL 的上清, 其中含有纯化的 PCR 产品到一个新的1.5 毫升管。将纯化的 PCR 产品贮存在-15 摄氏度至-25 摄氏度, 如果不立即进行 pcr 指标, 则可保存一周。
  3. 指数 PCR
    注: pcr 清理后, 执行指数 pcr。使用 Nextera XT 索引套件;因此, 可以在复用 Illumina 运行中序列化生成的双索引库。
    1. 将所有 15 ul 包含的产品纯化为新的 PCR 管, 并建立以下反应:15 µL 纯化扩增子产品, 5 µL 指数底漆1和5µL 指数底漆 2, 25 µL 2x PCR 组合;最终体积为50µL。
    2. 使用以下程序在热循环仪上执行 PCR:95 °c 为3分钟, 8 周期95°c 为三十年代, 55 °c 三十年代, 72 °c 为三十年代;72°C 5 分钟, 然后保持在4摄氏度。
  4. PCR 清理2
    1. 按照4.2 节中描述的相同协议进行 pcr 清理, 并进行以下更改: 在第一步添加56µL 磁珠到每50µL pcr 产品。
    2. 并用重悬珠在27.5 µL 10 毫米三 pH 8.5 在最后步骤的纯化和转移25µL 到一个新的管 (这是净化最终图书馆准备量化, 然后排序)。
    3. 在-15 摄氏度至-25 摄氏度的情况下, 如果不进行库量化, 则将其存储在一个星期内。
  5. 测序库的定性与定量评价
    1. 净化后, 运行1µL 1:10 稀释的最终图书馆在一个 bioanalyzer, 以验证大小和量化它选择最终图书馆跟踪区域。
    2. 同时, 使用每个制造商的协议中的库量化套件, 通过实时 PCR 进行库量化。
  6. 库排序
    1. 将与其他双索引排序库一起生成的双索引库池。序列这种图书馆通过产生长的读, 至少 250 bp 配对末端通过使用 Hiseq2500 或 MiSeq 仪器在第一个案件获得 250bp pe 读和在第二个案件 300 bp pe 读。

5. 使用 Interactome 网络工具进行生物信息学数据分析

  1. 分析 pFILTER/phagemid/选定-噬菌体库测序与 Interactome 序列数据分析管道的读数。web 工具可在以下地址自由使用: http://interactomeseq.ba.itb.cnr.it/

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

过滤方法在图 1中图解。每种 intronless DNA 都可以使用。在图 1A中, 过滤方法的第一部分表示: 在对琼脂糖凝胶或 bioanalyzer 的加载后, 感兴趣的 DNA 的一个好的碎片出现作为片断的涂片以长度分布在期望大小 150-750 bp。给出了一种具有代表性的碎片 DNA 的虚拟凝胶图像。在琼脂糖凝胶上加载的碎片然后恢复, 最终修复和磷酸化, 然后克隆成一个以前的钝 pFILTER 载体, 以创建一个随机 DNA 片段库。在最佳条件下执行克隆过程的每一步都需要获得高质量的库, 并对所研究的 DNA 进行总覆盖。

图 1B中, 筛选方法表示为: 该库是在氯霉素 (pFILTER 抵抗力) 的情况下生长的, 或者氯霉素和氨苄西林为含 ORF 的菌落选择。只有具有与 ORF 对应的 DNA 片段的菌落产生功能β酶, 并且在存在抗生素选择的情况下生存。图 1C显示了选择性压力的增加如何允许选择好的文件夹码与较差的文件夹。预期的结果是图书馆的规模减少了约20倍。存活的克隆数量增加表明选择性压力不足。

在随后的应用中, 可以很容易地从过滤库中恢复 ORF 碎片;为了进行交互研究, 我们的策略利用了噬菌体展示技术。在图 2中, 提出了噬菌体库建设的主要步骤: 通过从 pFILTER 载体中切割过滤片段, 再克隆成 phagemid 质粒进行融合, 制备出适当的库, 并以序列编码为噬菌体 capside 蛋白 g3p。一旦感染了帮助噬菌体, 存在的载体进入细菌细胞允许生产的噬菌体粒子显示 ORF-g3p 融合产品在其表面, 从而使过滤库可用于噬菌体显示选择, 并进一步分析。

所有的图书馆都被深入分析, 以及噬菌体选择的产出, 如图 3第二部分所示。DNA 片段是从生长的殖民地, 通过 PCR 扩增与特定的寡核苷酸退火的质粒骨干和携带特定的适配器的排序。然后用 Interactome 数据分析 web 工具对其进行分析和读取。

图 4中, 我们报告了一个 ORF 筛选噬菌体显示库的选择过程的示意图。本例中的选择是通过使用受不同病理 (感染性病理、自身免疫病理、癌症) 影响的患者血清中的抗体来执行的。在这种情况下, 噬菌体库直接与患者血清中存在的抗体相互作用, 这种方法可以丰富特定抗原, 因为它们被疾病特异抗体所识别。在这种实验中, 通常也选择使用健康患者的控制血清, 以便有一个背景信号用于连续的比较和规范化的程序。

选择是使用相同类型的患者的血清通常分组到不同的池, 以减少个体间的变异血清抗体滴度。每个池独立用于连续三轮的选择, 以丰富的免疫反应性克隆特定的病理学研究的图书馆。测试集抗体与图书馆噬菌体一起孵化, 免疫复合物通过蛋白质被涂上磁性珠和束缚噬菌体洗脱的标准程序来恢复。选择周期的执行, 提高洗涤和约束严谨。

由 Interactome 生成的读取可以使用专门开发的用于管理此类数据的网络工具进行分析。Interactome 数据分析工作流由四个连续步骤组成, 从原始排序读取开始, 生成具有基因组注释的假定域列表 (图 5A)。在第一步输入 (图 5A -红色框) 中, Interactome 检查输入文件 (原始读取、引用基因组序列、注释列表) 是否格式正确。在第二步预处理 (图 5A -橙色框) 中, 低质量排序数据首先使用 Cutadapt28进行裁剪, 这取决于质量分数和少于100个基数的读数被丢弃。在随后的读取对齐步骤 (图 5A -绿色框), 其余的读数与 blastn29对基因组序列, 允许多达5% 的不匹配。生成 SAM 文件, 并且仅使用 SAMtools30处理质量分数大于 30 (Q > 30) 的读取, 并将其转换为 BAM 文件。在对齐后, Interactome 执行域检测 (图 5A -蓝色框), 调用 Bedtools31 , 以过滤读取至少在记录内的长度80% 的读数重叠;然后为映射读取所覆盖的每个 ORF 部分计算覆盖范围、最大深度和焦点值。覆盖范围表示分配给某一基因的读数的总数量;深度是覆盖特定核部分的最大读数数;焦点是从最大深度和覆盖率之间的比率获得的索引, 它可以介于0和1之间。当焦点大于0.8 且覆盖率高于 BAM 文件中所有映射区域所观察到的平均覆盖率时, CDS 部分被归类为假定的域/表位。Interactome 管线的最后一步是输出 (图 5A -紫色框), 一个假定域的列表以表格分隔的格式生成。Interactome 的管道已包含在一个 web 工具中, 使用户无需任何生物信息学或编程技能即可通过图形界面执行 Interactome 序列分析, 并以简单易用的格式获得其结果。如图 5B所示, 使用 JBrowse32显示分析的输出结果, 以实现可视化和探测。Interactome 在基因组浏览器中生成与检测到的假定域相对应的轨迹, 并提供经典的维恩图来显示在不同选择实验中丰富的共同假定域之间的交集。

Figure 1
图 1: 对 ORF 过滤库建设主要步骤的示意图概述
A) 来自不同来源的 DNA 被微气泡, 碎片化为 150-750 bp 长度的随机片段。碎片从凝胶中恢复, 克隆成钝 pFILTER 载体;B) 使用β酶作为折叠记者的过滤步骤。含有非 ORF 片段的载体在氨苄西林上呈阴性选择, 而 ORF 克隆片段允许菌落生长;C) 应用增加的选择性压力 (氨苄西林浓度在固体生长介质从0到 > 100 微克/毫升) 允许选择更好的折叠碎片。请单击此处查看此图的较大版本.

Figure 2
图 2: 噬菌体库建设主要步骤示意图
A) 用特定的限制酶从过滤的载体上切下了 ORF 过滤的片段。在恢复纯化后, 将片段克隆成 phagemid 载体, 并进行转化;B) phagemid 细菌库感染了帮助噬菌体, 在隔夜生长后, 噬菌体被 PEG 沉淀和收集。请单击此处查看此图的较大版本.

Figure 3
图 3: ORF 库排序
序列在原始的 ORF 选定的图书馆和在噬菌体显示图书馆被执行;1) 在两种情况下, 生长的菌落被回收和 DNA 提取;2) DNA 片段通过与适配器连接的特定引物进行放大来恢复, 以进行测序;3-4) 对碎片进行回收和深度测序使用;5) 利用 Interactome 管线对数据进行分析。请单击此处查看此图的较大版本.

Figure 4
图 4: 使用患者抗体进行库选择的示意图概述
噬菌体文库用于筛选患者血清中的抗体。抗体固定在磁性珠子上, 进行噬菌体库捕获/选择, 进行三次洗涤, 然后选择噬菌体恢复, 并用于再次感染大肠杆菌.再次感染大肠杆菌细胞被镀在选择性压力 (氨苄西林100微克/毫升)。通过放大和扩增子池进行恢复, 然后由。请单击此处查看此图的较大版本.

Figure 5
图 5: 库分析的示意图概述
A) 数据分析工作流的表示, 从原始 FASTQ 文件开始到最终标注的域列表;B) Interactome 网络工具的输入和输出的示意图表示。请单击此处查看此图的较大版本.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

创建高质量的高度多样的码过滤库是整个过程中的第一个关键步骤, 因为它将影响管线的所有后续步骤。

本方法的一个重要优点是, 任何来源 (intronless) dna (cDNA、基因组 dna、PCR 衍生或合成 dna) 都适合于图书馆的建设。应该考虑的第一个参数是, 克隆到 pFILTER 向量中的 DNA 片段的长度应该提供一个基因组或转录的整个集合的表示形式, 所谓的 "domainome"。我们已经证明, 蛋白质领域可以成功克隆, 选择, 并最终确定从 DNA 片段的长度分布跨越从150到 750 bp33,34, 这是符合报告的文献显示, 大多数蛋白质领域是 100 aa 长度 (从50到 200 aa)15

DNA 起始材料必须分割成选择的大小范围, 后来克隆到过滤 (pFILTER)12向量中。在这些步骤中, 可以避免潜在的偏差, 最大限度地提高议定书中所包括的所有克隆步骤反应的效率, 特别是片段的最终修复和磷酸化。载体制备具有挑战性, 应在最佳条件下进行, 以避免未消化载体的质粒降解和/或污染。

一旦创建了库, 就应该进行 "筛选", 以便只保留码折叠的碎片。调整此步骤的一个关键参数是应用的选择性压力, 可以根据所需的过滤的严格性进行修改。选择是使用氨苄西林: 使用浓度越高, 转化菌菌落数量越低, 就能生存。这反映了筛选方法选择 "好" 与 "较差" 文件夹码34的能力。克隆数量的减少通过选定片段的折叠属性的增加来平衡。通常情况下, 氨苄西林浓度应足以减少到大约1/20 的细菌菌落数量, 就那些可以得到种植的氯霉素的图书馆。

图书馆的验证通常是通过 PCR 扩增随机采摘的殖民地和他们的排序。为了对库的质量进行快速估计, 提出了一些菌落的 PCR 扩增方法: 插入长度应在 150-750 bp 的预期范围内, 不同的菌落应呈现不同尺寸的刀片, 表明良好的图书馆准备的可变性术语。这种传统的筛选策略, 当作为唯一的方法, 作为图书馆验证, 是不全面的, 是耗时的, 允许分析只有有限数量的殖民地, 并有很大的机会错过了大部分重要的克隆。我们的方法是基于库的深度排序, 这提供了完整的信息库的多样性和丰度和精确映射每个选定的片段。

采用滤波方法实现了多项技术, 提高了分析的深度。最近, 我们优化了使用 Illumina 平台对 ORF 库进行排序的协议, 并开发了一个用于数据分析的特定 web 工具, 为每个用户分析这些数据, 而无需任何生物信息学编程技能。

图书馆 "本身" 是一种 "万能仪器", 可以在不同的语境中利用蛋白质表达和/或选择。我们的方法学方法是基于将生产的 ORFeome 转化为噬菌体展示环境。蛋白质片段在噬菌体表面被表达并且变得适合以后选择。

这是通过用特定的限制酶消化来拯救 pFILTER 库中的过滤码, 并将它们重新克隆成相容的 phagemid 载体, 使其与噬菌体蛋白 g3p 融合。

在创建 phagemid-ORF 库之后, 它可以用于针对不同目标的选择, 例如假定的结合蛋白10或纯化的抗体35,36如下所述。由于噬菌体粒子将显示在其表面上的过滤码, 这导致了一个更有效的选择程序, 由于没有非显示克隆通常超过它。

在噬菌体显示 ORF 库的选择后, 可以用同一管道对输出克隆进行排序和分析。码可以提供一个完整和统计显著的排名最频繁选择的, 这使得识别的蛋白质大多与诱饵使用。由于每个域的许多不同版本的存在不同于少量的氨基酸, 所以不同顺序的克隆之间的重叠也标识了显示绑定属性的最小片段/域。最后, 由于基因型和表型信息在噬菌体库中的耦合, 一旦确定了选择的领域, DNA 序列可以很容易地从图书馆中解救出来进行进一步的研究,在体外体内验证和描述。

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

作者没有什么可透露的。

Acknowledgments

这项工作得到意大利教育部和大学 (2010P3S8BR_002 到 CP) 的赠款的支持。

Materials

Name Company Catalog Number Comments
Sonopuls ultrasonic homogenizer Bandelin HD2070 or equivalent
GeneRuler 100 bp Plus DNA Ladder Thermo Scientific SM0321 or equivalent
GeneRuler 1 kb DNA Ladder Thermo Fisher Scientific SM0311 or equivalent
Molecular Biology Agarose BioRad 161-3102 or equivalent
Green Gel Plus Fisher Molecular Biology FS-GEL01 or equivalent
6x DNA Loading Dye Thermo Fisher Scientific R0611 or equivalent
QIAquick Gel Extraction Kit Qiagen 28704 or equivalent
Quick Blunting Kit New England Biolabs E1201S
NanoDrop 2000 UV-Vis Spectrophotometer Thermo Fisher Scientific ND-2000
High-Capacity cDNA Reverse Transcription Kit Thermo Fisher Scientific 4368813
Streptavidin Magnetic Beads New England Biolabs S1420S or equivalent
QIAquick PCR purification Kit Qiagen 28104 or equivalent
EcoRV New England Biolabs R0195L
Antarctic Phosphatase New England Biolabs M0289S
T4 DNA Ligase New England Biolabs M0202T
Sodium Acetate 3M pH5.2 general lab supplier
Ethanol for molecular biology Sigma-Aldrich E7023 or equivalent
DH5aF' bacteria cells Thermo Fisher Scientific
0,2 ml tubes general lab supplier
1,5 ml tubes general lab supplier
0,1 cm electroporation cuvettes Biosigma 4905020
Electroporator 2510 Eppendorf
2x YT medium Sigma-Aldrich Y1003
Ampicillin sodium salt Sigma-Aldrich A9518
Chloramphenicol Sigma-Aldrich C0378
DreamTaq DNA Polymerase Thermo Fisher Scientific EP0702
Deoxynucleotide (dNTP) Solution Mix New England Biolabs N0447S
96-well thermal cycler (with heated lid) general lab supplier
150 mm plates general lab supplier
100 mm plates general lab supplier
Glycerol Sigma-Aldrich G5516
BssHII New England Biolabs R0199L
NheI New England Biolabs R0131L
QIAprep Spin Miniprep Kit Qiagen 27104 or equivalent
M13KO7 Helper Phage GE Healthcare Life Sciences 27-1524-01 
Kanamycin sulfate from Streptomyces kanamyceticus Sigma-Aldrich K1377
Polyethylene glycol (PEG) Sigma-Aldrich P5413
Sodium Cloride (NaCl) Sigma-Aldrich S3014
PBS general lab supplier
Dynabeads Protein G for Immunoprecipitation Thermo Fisher Scientific 10003D or equivalent
MagnaRack Magnetic Separation Rack Thermo Fisher Scientific CS15000 or equivalent
Tween 20 Sigma-Aldrich P1379
Nonfat dried milk powder EuroClone EMR180500
KAPA HiFi HotStart ReadyMix  Kapa Biosystems, Fisher Scientific 7958935001
AMPure XP beads Agencourt, Beckman Coulter A63881
Nextera XT dual Index Primers Illumina FC-131-2001 or FC-131-2002 or FC-131-2003 or FC-131-2004
MiSeq or Hiseq2500 Illumina
Spectrophotomer Nanodrop
Agilent Bioanalyzer or TapeStation Agilent
Forward PCR primer general lab supplier 5’ TACCTATTGCCTACGGCA
GCCGCTGGATTGTTATTACTC 3’
Reverse PCR primer general lab supplier 5’ TGGTGATGGTGAGTACTA
TCCAGGCCCAGCAGTGGGTTTG 3’
Forward primer for NGS general lab supplier 5’ TCGTCGGCAGCGTCAGA
TGTGTATAAGAGACAGGCA
GCAAGCGGCGCGCATGC 3’;
Reverse primer for NGS general lab supplier 5’ GTCTCGTGGGCTCGGAGA
TGTGTATAAGAGACAGGGG
ATTGGTTTGCCGCTAGC 3’;

DOWNLOAD MATERIALS LIST

References

  1. Loman, N. J., Pallen, M. J. Twenty years of bacterial genome sequencing. Nat Rev Microbiol. 13 (12), 787-794 (2015).
  2. Jones, C. E., Brown, A. L., Baumann, U. Estimating the annotation error rate of curated GO database sequence annotations. BMC Bioinformatics. 8 (1), 170 (2007).
  3. Andorf, C., Dobbs, D., Honavar, V. Exploring inconsistencies in genome-wide protein function annotations: a machine learning approach. BMC Bioinformatics. 8 (1), 284 (2007).
  4. Wong, W. -C., Maurer-Stroh, S., Eisenhaber, F. More Than 1,001 Problems with Protein Domain Databases: Transmembrane Regions, Signal Peptides and the Issue of Sequence Homology. PLoS Comput Biol. 6 (7), e1000867 (2010).
  5. Bioinformatics, B., et al. Identification and correction of abnormal, incomplete and mispredicted proteins in public databases. BMC Bioinformatics. 9 (9), (2008).
  6. Phizicky, E., Bastiaens, P. I. H., Zhu, H., Snyder, M., Fields, S. Protein analysis on a proteomic scale. Nature. 422 (6928), 208-215 (2003).
  7. DiDonato, M., Deacon, A. M., Klock, H. E., McMullan, D., Lesley, S. A. A scaleable and integrated crystallization pipeline applied to mining the Thermotoga maritima proteome. J Struct Funct Genomics. 5 (1-2), 133-146 (2004).
  8. Nordlund, P., et al. Protein production and purification. Nat Methods. 5 (2), 135-146 (2008).
  9. Zacchi, P., Sblattero, D., Florian, F., Marzari, R., Bradbury, A. R. M. Selecting open reading frames from DNA. Genome Res. 13 (5), 980-990 (2003).
  10. Di Niro, R., et al. Rapid interactome profiling by massive sequencing. Nucleic Acids Res. 38 (9), e110 (2010).
  11. Gourlay, L. J., et al. Selecting soluble/foldable protein domains through single-gene or genomic ORF filtering: Structure of the head domain of Burkholderia pseudomallei antigen BPSL2063. Acta Crystallogr Sect D Biol Crystallogr. 71 (Pt 11), 2227-2235 (2015).
  12. D'Angelo, S., et al. Filtering "genic" open reading frames from genomic DNA samples for advanced annotation. BMC Genomics. 12 (Suppl 1), S5 (2011).
  13. D'Angelo, S., et al. Profiling celiac disease antibody repertoire. Clin Immunol. 148 (1), 99-109 (2013).
  14. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2009).
  15. Heger, A., Holm, L. Exhaustive enumeration of protein domain families. J Mol Biol. 328 (3), 749-767 (2003).
  16. Zacchi, P., Sblattero, D., Florian, F., Marzari, R., Bradbury, A. R. M. Selecting open reading frames from DNA. Genome Res. 13 (5), 980-990 (2003).
  17. Faix, P. H., Burg, M. A., Gonzales, M., Ravey, E. P., Baird, A., Larocca, D. Phage display of cDNA libraries: Enrichment of cDNA expression using open reading frame selection. Biotechniques. 36 (6), 1018-1029 (2004).
  18. Patrucco, L., et al. Identification of novel proteins binding the AU-rich element of α-prothymosin mRNA through the selection of open reading frames (RIDome). RNA Biol. 12 (12), 1289-1300 (2015).
  19. Collins, M. O., Choudhary, J. S. Mapping multiprotein complexes by affinity purification and mass spectrometry. Curr Opin Biotechnol. 19 (4), 324-330 (2008).
  20. Suter, B., Kittanakom, S., Stagljar, I. Two-hybrid technologies in proteomics research. Curr Opin Biotechnol. 19 (4), 316-323 (2008).
  21. Nakai, Y., Nomura, Y., Sato, T., Shiratsuchi, A., Nakanishi, Y. Isolation of a Drosophila gene coding for a protein containing a novel phosphatidylserine-binding motif. J Biochem. 137 (5), 593-599 (2005).
  22. Deng, S. J., et al. Selection of antibody single-chain variable fragments with improved carbohydrate binding by phage display. J Biol Chem. 269 (13), 9533-9538 (1994).
  23. Danner, S., Belasco, J. G. T7 phage display: A novel genetic selection system for cloning RNA-binding proteins from cDNA libraries. Proc Natl Acad Sci. 98 (23), 12954-12959 (2001).
  24. Gargir, A., Ofek, I., Meron-Sudai, S., Tanamy, M. G., Kabouridis, P. S., Nissim, A. Single chain antibodies specific for fatty acids derived from a semi-synthetic phage display library. Biochim Biophys Acta - Gen Subj. 1569 (1-3), 167-173 (2002).
  25. Patrucco, L., et al. Identification of novel proteins binding the AU-rich element of α-prothymosin mRNA through the selection of open reading frames (RIDome). RNA Biol. 12 (12), 1289-1300 (2015).
  26. Ausubel, F. M., et al. Current Protocols in Molecular Biology. Mol Biol. 1 (2), 146 (2003).
  27. Sblattero, D., Bradbury, A. Exploiting recombination in single bacteria to make large phage antibody libraries. Nat Biotechnol. 18, 75-80 (2000).
  28. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10 (2011).
  29. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  30. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  31. Quinlan, A. R. BEDTools: The Swiss-Army tool for genome feature analysis. Curr Protoc Bioinforma. , (2014).
  32. Skinner, M. E., Uzilov, A. V., Stein, L. D., Mungall, C. J., Holmes, I. H. JBrowse: A next-generation genome browser. Genome Res. 19 (9), 1630-1638 (2009).
  33. Gourlay, L. J., et al. Selecting soluble/foldable protein domains through single-gene or genomic ORF filtering: Structure of the head domain of Burkholderia pseudomallei antigen BPSL2063. Acta Crystallogr Sect D Biol Crystallogr. 71, 2227-2235 (2015).
  34. D'Angelo, S., et al. Filtering "genic" open reading frames from genomic DNA samples for advanced annotation. BMC Genomics. 12 (Suppl 1), S5 (2011).
  35. Di Niro, R., et al. Characterizing monoclonal antibody epitopes by filtered gene fragment phage display. Biochem J. 388 (Pt 3), 889-894 (2005).
  36. D'Angelo, S., et al. Profiling celiac disease antibody repertoire. Clin Immunol. 148 (1), 99-109 (2013).

Tags

生物学 140 期 噬菌体展示 下一代测序 Interactome 蛋白质领域 网络工具 折叠记者 蛋白质结构。
Interactome: Domainome 图书馆建设、噬菌体展示和下一代测序的验证与选择协议
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Soluri, M. F., Puccio, S., Caredda,More

Soluri, M. F., Puccio, S., Caredda, G., Grillo, G., Licciulli, V. F., Consiglio, A., Edomi, P., Santoro, C., Sblattero, D., Peano, C. Interactome-Seq: A Protocol for Domainome Library Construction, Validation and Selection by Phage Display and Next Generation Sequencing. J. Vis. Exp. (140), e56981, doi:10.3791/56981 (2018).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter