RESEARCH
Peer reviewed scientific video journal
Video encyclopedia of advanced research methods
Visualizing science through experiment videos
EDUCATION
Video textbooks for undergraduate courses
Visual demonstrations of key scientific experiments
BUSINESS
Video textbooks for business education
OTHERS
Interactive video based quizzes for formative assessments
Products
RESEARCH
JoVE Journal
Peer reviewed scientific video journal
JoVE Encyclopedia of Experiments
Video encyclopedia of advanced research methods
EDUCATION
JoVE Core
Video textbooks for undergraduates
JoVE Science Education
Visual demonstrations of key scientific experiments
JoVE Lab Manual
Videos of experiments for undergraduate lab courses
BUSINESS
JoVE Business
Video textbooks for business education
Solutions
Language
pt_BR
Menu
Menu
Menu
Menu
A subscription to JoVE is required to view this content. Sign in or start your free trial.
Research Article
Please note that some of the translations on this page are AI generated. Click here for the English version.
Erratum Notice
Important: There has been an erratum issued for this article. View Erratum Notice
Retraction Notice
The article Assisted Selection of Biomarkers by Linear Discriminant Analysis Effect Size (LEfSe) in Microbiome Data (10.3791/61715) has been retracted by the journal upon the authors' request due to a conflict regarding the data and methodology. View Retraction Notice
Este artigo apresenta um protocolo para processamento de dados de vírus influenza imageados por tomografia crioeletrônica e subsequente média do subtomograma da glicoproteína hemaglutinina. Este protocolo abrange o processamento de dados passo a passo, desde o pré-processamento da imagem até o refinamento do modelo final.
A tomografia crioeletrônica é uma ferramenta poderosa para visualizar amostras heterogêneas, com uma das principais aplicações sendo a caracterização estrutural de vírus pleomórficos. Nos últimos anos, a média do subtomograma de glicoproteínas virais surgiu como um método para visualizar diretamente essas proteínas cruciais na superfície de vírions intactos. Um alvo importante é a glicoproteína hemaglutinina (HA) do vírus influenza, que cobre densamente o envelope viral e é responsável pela ligação ao receptor influenza e fusão da membrana. Embora as médias subtomográficas de influenza HA tenham sido relatadas, suas resoluções foram limitadas devido à baixa relação sinal-ruído inerente ao TEcrio, bem como ao esforço manual necessário para analisar vírions heterogêneos de influenza. Apresentamos aqui um pipeline de análise de crioET que integra vários pacotes de software para analisar dados tomográficos de vírions influenza de forma eficiente e robusta. Este protocolo descreve a determinação estrutural do AH a partir de vírions influenza, por meio de etapas desde a correção do movimento inicial até a construção do modelo final. Seguindo esse pipeline, uma reconstrução de HA com resolução de 6,0 Å foi obtida a partir de dois conjuntos de dados crioET coletados da cepa influenza A/Puerto Rico/8/34 (PR8).
A tomografia crioeletrônica (cryoET) tem sido aplicada nas últimas décadas para capturar instantâneos de complexos de proteínas, vírus, células e organismos. Uma modalidade de microscopia crioeletrônica (cryoEM), cryoET é um método de biologia estrutural em que uma amostra biológica é congelada rapidamente e, em seguida, fotografada através de uma variedade de orientações por meio de inclinação 1,2,3. As imagens tiradas em cada orientação são então alinhadas computacionalmente ao seu eixo de inclinação comum e reconstruídas em um tomograma para fornecer uma visão tridimensional4.
Enquanto a cristalografia de raios-X e o cryoEM de partícula única exigem moléculas purificadas e estruturalmente homogêneas, o cryoET pode obter imagens de uma molécula diretamente em seu contexto nativo4. Portanto, uma das principais vantagens do TEcriocrio é sua capacidade de visualizar amostras pleomórficas, como vírus membranosos, incluindo influenza 5,6,7. Outra promessa do cryoET é sua capacidade de obter imagens em escalas. Embora os tomogramas não sejam normalmente resolvidos após 5-10 nm8, a integração da média do subtomograma, onde cópias da mesma partícula são identificadas, alinhadas e calculadas a média, pode resultar em resolução quase atômica em algumas moléculas biológicas, como os ribossomos 9,10. No entanto, apenas tipos limitados de moléculas podem atingir essa resolução; as médias dos subtomogramas normalmente não ultrapassam a resolução de 10-15 Å. Em contraste, o cryoEM de partícula única atinge rotineiramente resoluções de 3-4 Å após a revolução da resolução11. Avanços recentes no maior rendimento do software de aquisição e análise de dados crioET permitiram a determinação da estrutura de resolução subnanométrica de moléculas biológicas adicionais dentro de seu contexto nativo 12,13,14,15,16,17,18.
Um uso comum para cryoET é visualizar a morfologia, organização e estrutura do vírus. Apesar da resolução mais baixa proporcionada por esta técnica em comparação com o cryoEM de partícula única ou cristalografia de raios-X, o cryoET combinado com a média do subtomograma pode fornecer informações sobre como as proteínas virais se comportam em seu ambiente nativo e fornecer detalhes cruciais sobre sua organização no contexto do vírion. Um alvo comum para a crioET de vírus são as glicoproteínas de superfície que são comumente usadas para fixação e fusão de células hospedeiras, pois geralmente são os principais antígenos e alvos para terapias ou vacinas. Com os recentes avanços nos pacotes de processamento de crioET, tornou-se cada vez mais viável atingir médias de resolução subnanométrica dessas glicoproteínas 19,20,21,22. Um exemplo é a hemaglutinina (HA), a principal proteína na superfície dos vírions da gripe. Essa proteína não apenas conduz a ligação ao receptor e a fusão da membrana, mas também cobre o vírion de maneira incrivelmente densa, com centenas a milhares de HAs em um único vírion5. O protocolo apresentado aqui (Figura 1) integra vários pacotes comumente usados com scripts internos para delinear os estágios do pré-processamento ao refinamento do modelo para uma média de subtomograma de influenza HA.
NOTA: Os conjuntos de dados de amostra usados para este protocolo podem ser acessados em EMPIAR-12864, que inclui os dois conjuntos de séries de inclinação usados para este protocolo. As séries de inclinação são coletadas de grades mergulhadas manualmente do vírus influenza A purificado em um tamanho físico de pixel de 2,09 Å / pixel para garantir um campo de visão grande o suficiente para que cada série de inclinação contenha vários vírions e também para renderizar as reconstruções de maior resolução possível. Para os próprios conjuntos de dados dos usuários, é recomendável iniciar o fluxo de trabalho com filmes de inclinação brutos. Esses conjuntos de dados foram processados e visualizados usando estações de trabalho de alto desempenho. A Tabela de Materiais lista o hardware e o software usados para este protocolo. Todos os pacotes de software usados neste protocolo são de código aberto e estão disponíveis para download; os links e instruções de instalação estão listados na Tabela de Materiais. A estação de trabalho recomendada para o processamento de conjuntos de dados crioET deve estar equipada com pelo menos um processador de 8 núcleos, uma placa GPU dedicada com 6 GB de VRAM, 64 GB de RAM e 2 TB de armazenamento local.
1. Pré-processamento de dados de filmes tilt e reconstrução de tomogramas crioeletrônicos em Warp 23 e IMOD 24
conda activate warp_environmentWarpTools create_settings --folder_data path/to/.tif --folder_processing warp_frameseries --output warp_frameseries.settings --extension “*.tif” --angpix 1.04 --gain_path gain_file.mrc --exposure 3.07WarpTools fs_motion_and_ctf --settings warp_frameseries.settings --m_grid 1x1x5 --c_grid 2x2x1 --c_range_max 7 --c_defocus_max 10 --c_defocus_min 4 --c_use_sum --out_averagesWarpTools ts_import --mdocs path/to/.mdoc --frameseries /path/to/frameseries --tilt_exposure 3.07 --min_intensity 0.3 --output tomostarWarpTools create_settings --folder_data tomostar --folder_processing warp_tiltseries --output warp_tiltseries.settings --extension “*.tomostar” --angpix 1.04 --gain_path gain_file.mrc --exposure 3.07 --tomo_dimensions NxNxNWarptools ts_stack --settings warp_tiltseries.settings --angpix 8.35WarpTools ts_import_alignments --settings warp_tiltseries.settings --alignments warp_tiltseries/tiltstack/ --alignment_angpix 8.35WarpTools ts_aretomo --settings warp_tiltseries.settings --angpix 8.35 --alignz 1000 --axis_iter 3 --exe AreTomo_executiveWarpTools ts_ctf --settings warp_tiltseries.settings --range_high 7 --defocus_min 2 --defocus_max 10 --auto_hand 4export WARP_FORCE_MRC_FLOAT32=1WarpTools ts_reconstruct --settings warp_tiltseries.settings --input_data input file names --angpix 8.35 --dont_invert2. Pré-processamento de tomograma e coleta de partículas
conda activate isonet_envmkdir tomo_folder
mv tomograms*.mrc tomo_folder/isonet.py prepare_star tomo_folder --output_star tomograms.star --pixel_size 8.35isonet.py deconv tomograms.star --snrfalloff 0.7 --deconv_folder deconvolveconda activate eman_env
e2projectmanager.pycd path/to/tomogramse2spt_boxer_convnet.py --label label_namee2projectmanager.py comando.3. Curadoria de partículas
4. Média e classificação iterativa do subtomograma
WarpTools ts_export_particles --settings warp_tiltseries.setting --input_star pts2star.star --coords_angpix 8.35 --output_star bin4_export.star --output_angpix 8.35 --box 48 --diameter 140 --3drelion_convert_star --i bin4_export.star --o bin4_conv.starhead -n 30 bin4_conv.star >> subset.star & tail -n +31 bin4_conv.star | shuf -n 2000 >> subset.star
mpiexec -n 3 relion_refine_mpi --o init_ref/job001/run --auto_refine --split_random_halves --i subset.star --firstiter_cc --ini_high 20 --dont_combine_weights_via_disc --pool 3 --pad 2 --ctf --particle_diameter 300 --flatten_solvent --zero_mask --oversampling 1 --healpix_order 2 --auto_local_healpix_order 4 --offset_range 14 --offset_step 4 --sym C1 --low_resol_join_halves 40 --norm --scale --j 12 --gpu 0:1 --pipeline_control init_ref/job001mpiexec -n 3 relion_refine_mpi --o Refine3D/job001/run --auto_refine --split_random_halves --i bin4_conv.star --ref init_ref/job001/run_class001.mrc --firstiter_cc --ini_high 20 --dont_combine_weights_via_disc --pool 3 --pad 2 --ctf --particle_diameter 400 --flatten_solvent --zero_mask --oversampling 1 --healpix_order 2 --auto_local_healpix_order 4 --offset_range 16 --offset_step 4 --sym C1 --low_resol_join_halves 40 --norm --scale --j 12 --gpu 0:1 --pipeline_control Refine3D/job001relion_refine --o Class2D/job003/run --grad --class_inactivity_threshold 0.1 --grad_write_iter 200 --iter 200 --i Refine3D/job002/run_data.star --dont_combine_weights_via_disc --pool 3 --pad 2 --ctf --tau2_fudge 2 --particle_diameter 300 --K 20 --flatten_solvent --zero_mask -- strict_highres_exp 14 --center_classes --oversampling 1 --norm --scale --j 24 --skip_align --pipeline_control Class2D/job002.relion_star_handler --i input_file2.star --o output_good_class.star --select rlnClassNumber --minval goodclassnumber -maxval goodclassnumberrelion_star_handler --i "output_good_class1.star output_good_class2.star … output_good_classn.star" --o bin4_keep.star --combinerelion_star_handler --i input_file.star --o output_file.star --combinerelion_image_handler --i bin1_ref.mrc --o bin1_c3.mrc --sym c3MTools create_population --directory refine_m --name ha_finalMTools create_source --name source_1 --population refine_m/ha_final.population --processing_settings warp_tiltseries.settings
MTools create_species --population refine_m/ha_final.population --name ha_todaysdate --diameter 160 --sym c3 --temporal_samples 1 --half1 last_relion_refine/run_half1_class001_unfil.mrc --half2 last_relion_refine/run_half2_class001_unfil.mrc --particles_relion last_relion_refine/run_data.star --mask mask.mrcMCore --population refine_m/ha_final.population --refine_particlesMCore --population refine_m/ha_final.population --refine_particles --ctf_cs5. Refinamento do modelo
Para demonstrar a utilização deste protocolo de processamento (Figura 1), o fluxo de trabalho descrito anteriormente foi aplicado a dois conjuntos de dados de 25 tomogramas combinados, obtidos de uma cepa do vírus influenza A H1N1 (A/Puerto Rico/8/1934). Os parâmetros de coleta de dados estão descritos na Tabela 1. A Figura 2 ilustra um tomograma representativo e vistas ampliadas de vírions pleomórficos da gripe. Morfologias variadas são capturadas neste tomograma, pois os vírions variam de esférico a oval / alongado. Embora a maioria das partículas de influenza contenha conjuntos M1 e vRNP bem organizados, alguns vírions parecem ser mais desorganizados e carecem de componentes estruturais cruciais.
A partir desse conjunto de dados, um conjunto inicial de 40.995 subtomogramas foi usado para reconstrução de bin4 (8,35 Å/pix) após coleta e curadoria de partículas. Os dois conjuntos de dados foram inicialmente processados independentemente em RELION4 com simetria C1 e uma máscara esférica ampla que abrangia a matriz geral de HA. Foram realizados três ciclos de refinamento para esses subtomogramas, seguidos de classificação 2D. Após a classificação, subtomogramas mal resolvidos e partículas de lixo foram descartados; os subtomogramas restantes foram extraídos em bin2 (4,17 Å/pix) e os dois conjuntos de dados foram combinados. Os subtomogramas Bin2 foram primeiro alinhados em uma rodada de média de subtomograma, depois uma máscara cilíndrica ao redor do AH central foi aplicada para o alinhamento do foco. Nesta fase, a simetria trimérica pode ser claramente visualizada para a reconstrução do AH. Rodadas adicionais de refinamento foram realizadas no bin2 e a 2,8 Å/pix. Uma última rodada de classificação 2D foi realizada com uma pequena máscara cobrindo apenas o trímero central de AH com subtomogramas alinhados. A classe principal, consistindo em ~ 94% dos subtomogramas restantes, foi extraída para partículas não compartimentadas e submetida a refinamento 3D com simetria C3 aplicada. Por fim, esses subtomogramas foram exportados para M, onde foram realizadas poses de partículas e ciclos de refinamento de aberração esférica (Figura Suplementar 1).
A média final do subtomograma (Figura 3A), composta por 15.970 partículas de HA, atingiu uma resolução global de 6,0 Å e uma faixa de resolução local de 5-7 Å (Figura 4). Um modelo de PR8 HA foi refinado de forma flexível na densidade; no FSC=0,5 e FSC=0,143, a resolução do mapa para o modelo foi de 8,1 Å e 6,6 Å, respectivamente. A arquitetura da reconstrução HA se assemelhava muito aos mapas cryoEM e cryoET anteriores. Nesta resolução, as folhas alfa-hélices e beta podem ser distinguidas (Figura 3B); além disso, os glicanos podem começar a ser identificados em quatro locais de glicosilação na cabeça e no caule do AH ( Figura 3C ).
Nossos resultados mostram a adequação do TEcrioC na reconstrução de AH de vírions nativos da influenza. Através do protocolo, a densidade clara para a glicoproteína cilíndrica foi observada perpendicularmente à membrana viral, e a resolução melhorou a cada passo. Para os próprios dados, sugere-se que a média do subtomograma comece a partir de uma pilha de partículas agrupadas e os resultados sejam monitorados de perto em cada ciclo de refinamento. Se a densidade da glicoproteína não for aparente desde os estágios iniciais, recomenda-se mapear os locais do subtomograma de volta no tomograma para verificar o posicionamento preciso. Caso contrário, pode-se ajustar os parâmetros de alinhamento ou implementar estágios de classificação adicionais para obter os melhores resultados.

Figura 1: Pipeline geral para média de subtomograma de HA de crioET do vírus influenza. O painel superior representa um fluxo de trabalho resumido para os dois conjuntos de dados usados para demonstrar o protocolo. O segundo painel corresponde à Seção 1 do protocolo, o terceiro painel corresponde às Seções 2-3 e o quarto painel corresponde às Seções 4-5. Clique aqui para ver uma versão maior desta figura.

Figura 2: Tomografia representativa do vírus influenza PR8. (A) Corte a tomografia reconstruída. A barra de escala é de 100 nm. (BD) Ampliado em vista de (B) esférico, (C) cilíndrico, (D) vírion PR8 sem M1. Todas as barras de escala em B-D correspondem a 50 nm. Clique aqui para ver uma versão maior desta figura.

Figura 3: Média do subtomograma de PR8 HA. (A) Vista superior e lateral da reconstrução de AH em dois níveis de contorno equipados de forma flexível com uma estrutura crioEM de partícula única PR8 HA. (B) Visualizações recortadas através da reconstrução HA. As setas coloridas correspondem às caixas coloridas. (C) Reconstrução de AH mostrada no contorno inferior para revelar a densidade de glicanos. Vistas de perto de glicanos na representação de bastões no mapa cryoET também são mostradas. Clique aqui para ver uma versão maior desta figura.

Figura 4: Estimativa da resolução da média do subtomograma de AH. (A) Estimativa da resolução local da média do subtomograma de AH mapeada na reconstrução. A barra de cores representa 5-7 Å na paleta azul-branco-vermelho. (B) Curvas FSC de meios mapas e de resolução map-to-model. A curva azul é da reconstrução desmascarada e a vermelha é da mascarada. Clique aqui para ver uma versão maior desta figura.
| Conjunto de dados 1 | Conjunto de dados 2 | |
| Tamanho do pixel | 2.09 | 2.09 |
| Faixa de inclinação | 0 até ±54° | 0 até ±66° |
| Passo de inclinação | 3° | 3° |
| Ano de coleta | 2024 | 2021 |
| Faixa de desfocagem | 4-8 μm | 4-8 μm |
| Dose total | 120 e-/Å2 | 120 e-/Å2 |
| # Subquadros | 6 | 5 |
| # Série de inclinação usada | 15 | 11 |
| # Partículas | 3278 | 12692 |
Tabela 1: Parâmetros de coleta de dados para conjuntos de dados crioET do vírus influenza PR8.
Figura suplementar 1: Fluxo de trabalho de média do subtomograma para HA. Alinhamento, média e classificação iterativos são conduzidos para subtomogramas de HA por meio de desbinning gradual. Clique aqui para baixar este arquivo.
Os autores não têm nada a divulgar.
Este artigo apresenta um protocolo para processamento de dados de vírus influenza imageados por tomografia crioeletrônica e subsequente média do subtomograma da glicoproteína hemaglutinina. Este protocolo abrange o processamento de dados passo a passo, desde o pré-processamento da imagem até o refinamento do modelo final.
Os autores gostariam de agradecer as discussões úteis com o Laboratório Schiffer. Também gostaríamos de agradecer à instalação UMass Chan cryoEM Core por sua ajuda na aquisição de dados e por nos fornecer suporte e aconselhamento. Este trabalho foi apoiado pelo Instituto Nacional de Ciências Médicas Gerais R01GM143773 para MS e R35GM151996 para CAS
| AMD Ryzen Threadripper PRO 5965WX | AMD | https://www.amd.com/en/support/downloads/drivers.html/processors/ryzen-threadripper-pro/ryzen-threadripper-pro-5000wx-series/amd-ryzen-threadripper-pro-5965wx.html | |
| AreTomo 1.3.4 | UC San Francisco | https://drive.google.com/drive/folders/1Z7pKVEdgMoNaUmd_cOFhlt-QCcfcwF3_ | |
| EMAN2 2.99.52 | Faculdade de Medicina Baylor | https://blake.bcm.edu/emanwiki/EMAN2 | |
| IMOD 4.12.27 | Universidade do Colorado em Boulder | https://bio3d.colorado.edu/imod/ | |
| Roteiros de análise de influenza | Faculdade de Medicina UMass Chan | https://github.com/jqyhuang/influenza-analysis | |
| IsoNet 0.3 | UCLA | https://github.com/IsoNet-cryoET/IsoNet | |
| M 2.0.0 | Genentech | https://warpem.github.io/warp/home/m/ | |
| NVIDIA A4000 | NVIDIA | https://www.nvidia.com/en-us/products/workstations/rtx-a4000/ | |
| Open3D | Intel Labs | https://www.open3d.org/ | |
| PHENIX 1.21-5207 | Laboratório Nacional Lawrence Berkeley | phenix-online.org | |
| RELION 4.0 | Laboratório de Biologia Molecular do MRC | https://relion.readthedocs.io/en/release-4.0/ | |
| Ubuntu 20.04 | Ubuntu | https://releases.ubuntu.com/focal/ | |
| UCSF ChimeraX 1.6.1 | UC San Francisco | https://www.cgl.ucsf.edu/chimerax/ | |
| Warp 2.0.0 | Genentech | http://warpem.github.io/warp/ |