RESEARCH
Peer reviewed scientific video journal
Video encyclopedia of advanced research methods
Visualizing science through experiment videos
EDUCATION
Video textbooks for undergraduate courses
Visual demonstrations of key scientific experiments
BUSINESS
Video textbooks for business education
OTHERS
Interactive video based quizzes for formative assessments
Products
RESEARCH
JoVE Journal
Peer reviewed scientific video journal
JoVE Encyclopedia of Experiments
Video encyclopedia of advanced research methods
EDUCATION
JoVE Core
Video textbooks for undergraduates
JoVE Science Education
Visual demonstrations of key scientific experiments
JoVE Lab Manual
Videos of experiments for undergraduate lab courses
BUSINESS
JoVE Business
Video textbooks for business education
Solutions
Language
zh_CN
Menu
Menu
Menu
Menu
A subscription to JoVE is required to view this content. Sign in or start your free trial.
Research Article
Please note that some of the translations on this page are AI generated. Click here for the English version.
Erratum Notice
Important: There has been an erratum issued for this article. View Erratum Notice
Retraction Notice
The article Assisted Selection of Biomarkers by Linear Discriminant Analysis Effect Size (LEfSe) in Microbiome Data (10.3791/61715) has been retracted by the journal upon the authors' request due to a conflict regarding the data and methodology. View Retraction Notice
本文介绍了一种使用冷冻电子断层扫描成像的流感病毒数据处理方案,以及随后对血凝素糖蛋白进行亚断层扫描平均。该协议涵盖了从图像预处理到最终模型细化的分步数据处理。
冷冻电子断层扫描是可视化异质样品的有力工具,其中一项主要应用是多形性病毒的结构表征。近年来,病毒糖蛋白的亚断层扫描平均已成为一种在完整病毒粒子表面直接可视化这些关键蛋白质的方法。一个重要的靶点是流感病毒的血凝素(HA)糖蛋白,它密集地覆盖在病毒包膜上,负责流感受体结合和膜融合。虽然已经报道了流感 HA 的亚断层扫描平均值,但由于冷冻 ET 固有的低信噪比以及分析异质性流感病毒粒子所需的手动工作,其分辨率受到限制。这里介绍的是一个冷冻ET分析管道,它集成了多个软件包,可以高效、稳健地分析流感病毒粒子的断层扫描数据。该协议描述了从流感病毒粒子中 HA 的结构测定,从初始运动校正到最终模型构建的步骤。在此管道之后,从从 A/Puerto Rico/8/34 (PR8) 流感毒株收集的两个冷冻 ET 数据集中获得了 6.0 Å 分辨率的 HA 重建。
冷冻电子断层扫描 (cryoET) 在过去几十年中一直被用于捕获蛋白质复合物、病毒、细胞和生物体的快照。冷冻电子显微镜 (cryoEM) 的一种模式,冷冻 ET 是一种结构生物学方法,其中生物样品被快速冷冻,然后通过倾斜 1,2,3 通过各种方向成像。然后,在每个方向拍摄的图像通过计算对齐到它们的公共倾斜轴,并重建为断层扫描以提供三维视图4。
X 射线晶体学和单颗粒冷冻电镜需要纯化的、结构均匀的分子,而冷冻电镜可以直接在其天然环境中对分子进行成像4。因此,冷冻ET的一个主要优点是它能够可视化多形性样本,例如膜病毒,包括流感5,6,7。冷冻ET的另一个承诺是它能够跨尺度成像。虽然断层扫描通常不会在5-10 nm以上分辨8,但亚断层扫描平均的集成,其中识别、对齐和平均同一颗粒的副本,可以在某些生物分子(如核糖体)中产生接近原子的分辨率9,10。然而,只有有限类型的分子可以达到这种分辨率;亚断层扫描平均值通常不会超过 10-15 Å 分辨率。相比之下,单颗粒冷冻电镜在分辨率旋转后通常达到3-4 Å的分辨率11。冷冻ET数据采集和分析软件的更高通量方面的最新进展允许在其天然环境中对其他生物分子进行亚纳米分辨率结构测定12,13,14,15,16,17,18。
冷冻ET的一个常见用途是可视化病毒的形态、组织和结构。尽管与单颗粒冷冻电镜或 X 射线晶体学相比,该技术提供的分辨率较低,但冷冻 ET 与亚断层扫描平均相结合可以提供有关病毒蛋白在其天然环境中如何表现的信息,并提供有关其在病毒粒子背景下的组织的关键细节。病毒冷冻ET的常见靶标是通常用于宿主细胞附着和融合的表面糖蛋白,因为它们通常是治疗或疫苗的主要抗原和靶标。随着冷冻ET处理包的最新进展,实现这些糖蛋白19,20,21,22的亚纳米分辨率平均值变得越来越可行。其中一个例子是血凝素 (HA),它是流感病毒粒子表面的主要蛋白质。这种蛋白质不仅可以进行受体结合和膜融合,而且还以令人难以置信的致密方式覆盖病毒粒子,在单个病毒粒子上有数百到数千个 HA5。此处介绍的协议(图 1)将几个常用的软件包与内部脚本集成在一起,以描述从预处理到模型细化的阶段,以获得流感 HA 的亚断层扫描平均值。
注意:用于此协议的示例数据集可在 EMPIAR-12864 访问,其中包括用于该协议的两组倾斜系列。倾斜系列是从物理像素尺寸为 2.09 Å/像素的纯化甲型流感病毒的手动插入网格中收集的,以确保足够大的视野,以便每个倾斜系列包含多个病毒粒子,并呈现尽可能高分辨率的重建。对于用户自己的数据集,建议使用原始倾斜影片开始工作流程。这些数据集使用高性能工作站进行处理和可视化。 材料表 列出了用于此协议的硬件和软件。该协议中使用的所有软件包都是开源的,可供下载;材料 表中列出了安装链接和说明。推荐的用于处理冷冻ET数据集的工作站应至少配备一个8核处理器、一个具有6 GB VRAM的专用GPU卡、64 GB RAM和2 TB本地存储。
1. Warp 23 和 IMOD 24 中倾斜电影的数据预处理和冷冻电子断层扫描的重建
conda activate warp_environmentWarpTools create_settings --folder_data path/to/.tif --folder_processing warp_frameseries --output warp_frameseries.settings --extension “*.tif” --angpix 1.04 --gain_path gain_file.mrc --exposure 3.07WarpTools fs_motion_and_ctf --settings warp_frameseries.settings --m_grid 1x1x5 --c_grid 2x2x1 --c_range_max 7 --c_defocus_max 10 --c_defocus_min 4 --c_use_sum --out_averagesWarpTools ts_import --mdocs path/to/.mdoc --frameseries /path/to/frameseries --tilt_exposure 3.07 --min_intensity 0.3 --output tomostarWarpTools create_settings --folder_data tomostar --folder_processing warp_tiltseries --output warp_tiltseries.settings --extension “*.tomostar” --angpix 1.04 --gain_path gain_file.mrc --exposure 3.07 --tomo_dimensions NxNxNWarptools ts_stack --settings warp_tiltseries.settings --angpix 8.35WarpTools ts_import_alignments --settings warp_tiltseries.settings --alignments warp_tiltseries/tiltstack/ --alignment_angpix 8.35WarpTools ts_aretomo --settings warp_tiltseries.settings --angpix 8.35 --alignz 1000 --axis_iter 3 --exe AreTomo_executiveWarpTools ts_ctf --settings warp_tiltseries.settings --range_high 7 --defocus_min 2 --defocus_max 10 --auto_hand 4export WARP_FORCE_MRC_FLOAT32=1WarpTools ts_reconstruct --settings warp_tiltseries.settings --input_data input file names --angpix 8.35 --dont_invert2. 断层扫描预处理和颗粒拾取
conda activate isonet_envmkdir tomo_folder
mv tomograms*.mrc tomo_folder/isonet.py prepare_star tomo_folder --output_star tomograms.star --pixel_size 8.35isonet.py deconv tomograms.star --snrfalloff 0.7 --deconv_folder deconvolveconda activate eman_env
e2projectmanager.pycd path/to/tomogramse2spt_boxer_convnet.py --label label_namee2projectmanager.py 打开 EMAN2 GUI。3. 粒子策展
4. 迭代亚断层扫描平均与分类
WarpTools ts_export_particles --settings warp_tiltseries.setting --input_star pts2star.star --coords_angpix 8.35 --output_star bin4_export.star --output_angpix 8.35 --box 48 --diameter 140 --3drelion_convert_star --i bin4_export.star --o bin4_conv.starhead -n 30 bin4_conv.star >> subset.star & tail -n +31 bin4_conv.star | shuf -n 2000 >> subset.star
mpiexec -n 3 relion_refine_mpi --o init_ref/job001/run --auto_refine --split_random_halves --i subset.star --firstiter_cc --ini_high 20 --dont_combine_weights_via_disc --pool 3 --pad 2 --ctf --particle_diameter 300 --flatten_solvent --zero_mask --oversampling 1 --healpix_order 2 --auto_local_healpix_order 4 --offset_range 14 --offset_step 4 --sym C1 --low_resol_join_halves 40 --norm --scale --j 12 --gpu 0:1 --pipeline_control init_ref/job001mpiexec -n 3 relion_refine_mpi --o Refine3D/job001/run --auto_refine --split_random_halves --i bin4_conv.star --ref init_ref/job001/run_class001.mrc --firstiter_cc --ini_high 20 --dont_combine_weights_via_disc --pool 3 --pad 2 --ctf --particle_diameter 400 --flatten_solvent --zero_mask --oversampling 1 --healpix_order 2 --auto_local_healpix_order 4 --offset_range 16 --offset_step 4 --sym C1 --low_resol_join_halves 40 --norm --scale --j 12 --gpu 0:1 --pipeline_control Refine3D/job001relion_refine --o Class2D/job003/run --grad --class_inactivity_threshold 0.1 --grad_write_iter 200 --iter 200 --i Refine3D/job002/run_data.star --dont_combine_weights_via_disc --pool 3 --pad 2 --ctf --tau2_fudge 2 --particle_diameter 300 --K 20 --flatten_solvent --zero_mask -- strict_highres_exp 14 --center_classes --oversampling 1 --norm --scale --j 24 --skip_align --pipeline_control Class2D/job002。relion_star_handler --i input_file2.star --o output_good_class.star --select rlnClassNumber --minval goodclassnumber -maxval goodclassnumberrelion_star_handler --i "output_good_class1.star output_good_class2.star … output_good_classn.star" --o bin4_keep.star --combinerelion_star_handler --i input_file.star --o output_file.star --combinerelion_image_handler --i bin1_ref.mrc --o bin1_c3.mrc --sym c3MTools create_population --directory refine_m --name ha_finalMTools create_source --name source_1 --population refine_m/ha_final.population --processing_settings warp_tiltseries.settings
MTools create_species --population refine_m/ha_final.population --name ha_todaysdate --diameter 160 --sym c3 --temporal_samples 1 --half1 last_relion_refine/run_half1_class001_unfil.mrc --half2 last_relion_refine/run_half2_class001_unfil.mrc --particles_relion last_relion_refine/run_data.star --mask mask.mrcMCore --population refine_m/ha_final.population --refine_particlesMCore --population refine_m/ha_final.population --refine_particles --ctf_cs5. 模型细化
为了证明该处理协议的利用(图1),将前面概述的工作流程应用于从H1N1甲型流感病毒株(A/Puerto Rico/8/1934)获得的25张断层扫描的两个数据集。数据收集参数概述在 表 1 中。 图 2 说明了多形性流感病毒粒子的代表性断层扫描和放大视图。该断层扫描捕捉到了不同的形态,因为病毒粒子的形状从球形到椭圆形/细长不等。虽然大多数流感颗粒含有组织良好的 M1 和 vRNP 组装体,但一些病毒粒子似乎更加杂乱无章并且缺乏关键的结构成分。
从该数据集中,一组初始的 40,995 个子断层图用于粒子拾取和管理后的 bin4 (8.35 Å/pix) 重建。这两个数据集最初在RELION4中独立处理,具有 C1 对称性和包含整个 HA 阵列的宽球形掩模。对这些亚断层扫描进行了三个细化循环,然后进行二维分类。分类后,分辨率差的亚断层扫描和垃圾颗粒被丢弃;在bin2(4.17 Å / pix)处提取剩余的亚断层扫描,并将两个数据集合并在一起。首先在一轮亚断层扫描平均中将 Bin2 亚断层扫描对齐在一起,然后在中央 HA 周围应用圆柱形掩模以进行焦点对齐。在这个阶段,可以清楚地可视化HA重建的三聚体对称性。在bin2和2.8 Å/pix处进行了额外的几轮细化。最后一轮 2D 分类是使用一个小掩模进行的,该掩模仅覆盖中央 HA 三聚体,并带有对齐的亚断层扫描。主要类别由~94%的剩余亚断层照片组成,被提取到未分箱的颗粒中,并在应用C3对称性的情况下进行3D细化。最后,将这些亚断层扫描输出到M,在那里进行粒子位姿和球差细化循环(补充图1)。
最终的亚断层扫描平均值(图3A)由15,970个HA颗粒组成,达到6.0 Å的全局分辨率和5-7 Å的局部分辨率范围(图4)。将PR8 HA模型灵活细化为密度;在FSC=0.5和FSC=0.143时,映射到模型的分辨率分别为8.1 Å和6.6 Å。HA 重建的架构与以前的冷冻电镜和冷冻电镜图非常相似。在此分辨率下,可以区分α螺旋和β折叠(图3B);此外,可以在HA头部和茎上的四个糖基化位点开始鉴定聚糖(图3C)。
我们的结果表明,冷冻ET在从天然流感病毒粒子重建HA中的适用性。通过该方案,观察到垂直于病毒膜的圆柱形糖蛋白的透明密度,并且每个步骤的分辨率都有所提高。对于自己的数据,建议从分箱粒子堆栈开始进行亚断层平均,并在每个细化周期密切监测结果。如果糖蛋白密度从开始阶段就不明显,建议将亚断层扫描位置映射回断层扫描上,以验证定位准确。否则,可以调整对齐参数或实施额外的分类阶段以获得最佳结果。

图 1:流感病毒冷冻 ET 中 HA 的亚断层扫描平均的总体管道。 顶部面板表示用于演示协议的两个数据集的摘要工作流程。第二组对应于协议的第 1 节,第三组对应于第 2-3 节,第四组对应于第 4-5 节。 请点击此处查看此图的大图。

图2:PR8流感病毒的代表性断层扫描。 (A)切片重建的断层扫描。比例尺为 100 nm。(B-D)放大视图 (B) 球形,(C) 圆柱形,(D) 无 M1 PR8 病毒粒子。BD 中的所有比例尺对应于 50 nm。 请点击此处查看此图的大图。

图3:PR8 HA的亚断层扫描平均值。 (A)灵活地安装PR8 HA单颗粒冷冻电镜结构的两个轮廓水平的HA重建的俯视图和侧视图。(B) 房委会重建的剪裁视图。彩色箭头对应于彩色框。(C)在较低轮廓处显示的HA重建,以揭示聚糖密度。还显示了冷冻ET图中棒状表示中的聚糖的特写视图。 请点击此处查看此图的大图。

图 4:HA 亚断层扫描平均值的分辨率估计值。 (A) 映射到重建上的 HA 亚断层扫描平均值的局部分辨率估计值。色条在蓝-白-红调色板上描绘 5-7 Å。(B)半图和图到模型分辨率的FSC曲线。蓝色曲线是未遮罩的重建,红色是遮罩的。 请点击此处查看此图的大图。
| 数据集 1 | 数据集 2 | |
| 像素大小(Pixel Size) | 2.09 | 2.09 |
| 倾斜范围 | 0 至 ±54° | 0 至 ±66° |
| 倾斜步长 | 3° | 3° |
| 收集年份 | 2024 | 2021 |
| 散焦范围 | 4-8 微米 | 4-8 微米 |
| 总剂量 | 120 e-/Å2 | 120 e-/Å2 |
| # 子帧 | 6 | 5 |
| # 使用的倾斜系列 | 15 | 11 |
| # 粒子 | 3278 | 12692 |
表1:PR8流感病毒冷冻ET数据集的数据采集参数。
补充图 1:HA 的亚断层扫描平均工作流程。 通过逐步拆箱对 HA 亚断层图进行迭代比对、平均和分类。 请点击此处下载此文件。
作者没有什么可透露的。
本文介绍了一种使用冷冻电子断层扫描成像的流感病毒数据处理方案,以及随后对血凝素糖蛋白进行亚断层扫描平均。该协议涵盖了从图像预处理到最终模型细化的分步数据处理。
作者要感谢与 Schiffer 实验室的有益讨论。我们还要感谢麻省大学陈氏分校冷冻电镜核心设施在数据采集方面的帮助,并为我们提供支持和建议。这项工作得到了国家普通医学科学研究所的支持,R01GM143773 是 MS 和 R35GM151996 是 CAS。
| AMD Ryzen Threadripper PRO 5965WX | AMD | https://www.amd.com/en/support/downloads/drivers.html/processors/ryzen-threadripper-pro/ryzen-threadripper-pro-5000wx-series/amd-ryzen-threadripper-pro-5965wx.html | |
| AreTomo 1.3.4 | 加州大学旧金山分校 | https://drive.google.com/drive/folders/1Z7pKVEdgMoNaUmd_cOFhlt-QCcfcwF3_ | |
| EMAN2 1999.52 | 贝勒医学院 | https://blake.bcm.edu/emanwiki/EMAN2 | |
| IMOD 4.12.27 | 科罗拉多大学博尔德分校 | https://bio3d.colorado.edu/imod/ | |
| 流感分析脚本 | 马萨诸塞大学陈医学院 | https://github.com/jqyhuang/influenza-analysis | |
| IsoNet 0.3 | 加州大学洛杉矶分校 | https://github.com/IsoNet-cryoET/IsoNet | |
| M 2.0.0 | 基因泰克 | https://warpem.github.io/warp/home/m/ | |
| NVIDIA A4000 | NVIDIA | https://www.nvidia.com/en-us/products/workstations/rtx-a4000/ | |
| Open3D | 英特尔实验室 | https://www.open3d.org/ | |
| PHENIX 1.21-5207 | 劳伦斯伯克利国家实验室 | phenix-online.org | |
| RELION 4.0 | MRC分子生物学实验室 | https://relion.readthedocs.io/en/release-4.0/ | |
| Ubuntu 20.04 | Ubuntu | https://releases.ubuntu.com/focal/ | |
| 加州大学旧金山分校奇美拉X 1.6.1 | 加州大学旧金山分校 | https://www.cgl.ucsf.edu/chimerax/ | |
| 曲速 2.0.0 | 基因泰克 | http://warpem.github.io/warp/ |