RESEARCH
Peer reviewed scientific video journal
Video encyclopedia of advanced research methods
Visualizing science through experiment videos
EDUCATION
Video textbooks for undergraduate courses
Visual demonstrations of key scientific experiments
BUSINESS
Video textbooks for business education
OTHERS
Interactive video based quizzes for formative assessments
Products
RESEARCH
JoVE Journal
Peer reviewed scientific video journal
JoVE Encyclopedia of Experiments
Video encyclopedia of advanced research methods
EDUCATION
JoVE Core
Video textbooks for undergraduates
JoVE Science Education
Visual demonstrations of key scientific experiments
JoVE Lab Manual
Videos of experiments for undergraduate lab courses
BUSINESS
JoVE Business
Video textbooks for business education
Solutions
Language
Spanish
Menu
Menu
Menu
Menu
A subscription to JoVE is required to view this content. Sign in or start your free trial.
Research Article
Please note that some of the translations on this page are AI generated. Click here for the English version.
Erratum Notice
Important: There has been an erratum issued for this article. View Erratum Notice
Retraction Notice
The article Assisted Selection of Biomarkers by Linear Discriminant Analysis Effect Size (LEfSe) in Microbiome Data (10.3791/61715) has been retracted by the journal upon the authors' request due to a conflict regarding the data and methodology. View Retraction Notice
Este artículo presenta un protocolo para el procesamiento de datos de virus de influenza obtenidos mediante tomografía crioelectrónica y posterior subtomograma de promedio de la glicoproteína hemaglutinina. Este protocolo cubre el procesamiento de datos paso a paso, desde el preprocesamiento de imágenes hasta el refinamiento del modelo final.
La tomografía crioelectrónica es una herramienta poderosa para visualizar muestras heterogéneas, con una aplicación importante que es la caracterización estructural de virus pleomórficos. En los últimos años, el promedio de subtomogramas de glicoproteínas virales ha surgido como un método para visualizar directamente estas proteínas cruciales en la superficie de viriones intactos. Un objetivo importante es la glicoproteína hemaglutinina (HA) del virus de la influenza, que cubre densamente la envoltura viral y es responsable de la unión al receptor de la influenza y la fusión de la membrana. Si bien se han informado promedios de subtomogramas de HA de influenza, sus resoluciones han sido limitadas debido a la baja relación señal-ruido inherente a la crioET, así como al esfuerzo manual requerido para analizar viriones heterogéneos de influenza. Aquí se presenta una línea de análisis crioET que integra varios paquetes de software para analizar datos tomográficos de viriones de influenza de manera eficiente y robusta. Este protocolo describe la determinación estructural de HA a partir de viriones de influenza, a través de pasos desde la corrección de movimiento inicial hasta la construcción del modelo final. Después de esta tubería, se obtuvo una reconstrucción de HA con una resolución de 6.0 Å a partir de dos conjuntos de datos de crioET recopilados de la cepa de influenza A/Puerto Rico/8/34 (PR8).
La criotomografía electrónica (crioET) se ha aplicado en las últimas décadas para capturar instantáneas de complejos de proteínas, virus, células y organismos. Una modalidad de criomicroscopía electrónica (cryoEM), cryoET es un método de biología estructural en el que una muestra biológica se congela rápidamente y luego se obtienen imágenes a través de una variedad de orientaciones a través de la inclinación 1,2,3. Las imágenes tomadas en cada orientación se alinean computacionalmente con su eje de inclinación común y se reconstruyen en un tomograma para proporcionar una vista tridimensional4.
Mientras que la cristalografía de rayos X y la crioEM de una sola partícula exigen moléculas purificadas y estructuralmente homogéneas, la crioET puede obtener imágenes de una molécula directamente dentro de su contexto nativo4. Por lo tanto, una de las principales ventajas de la crioET es su capacidad para visualizar muestras pleomórficas, como los virus membranosos, incluida la gripe 5,6,7. Otra promesa de la crioET es su capacidad para obtener imágenes a través de escalas. Si bien los tomogramas no se resuelven típicamente más allá de 5-10 nm8, la integración del promedio del subtomograma, donde se identifican, alinean y promedian las copias de la misma partícula, puede dar como resultado una resolución casi atómica en algunas moléculas biológicas como los ribosomas 9,10. Sin embargo, solo tipos limitados de moléculas pueden alcanzar esta resolución; los promedios de subtomograma no suelen superar los 10-15 Å de resolución. Por el contrario, la crioEM de una sola partícula alcanza rutinariamente resoluciones de 3-4 Å después de la revolución de la resolución11. Los avances recientes tanto en el mayor rendimiento del software de adquisición y análisis de datos crioET han permitido la determinación de la estructura de resolución subnanométrica de moléculas biológicas adicionales dentro de su contexto nativo 12,13,14,15,16,17,18.
Un uso común de la crioET es visualizar la morfología, organización y estructura del virus. A pesar de la menor resolución que ofrece esta técnica en comparación con la crioEM de una sola partícula o la cristalografía de rayos X, la crioET combinada con el promedio del subtomograma puede proporcionar información sobre cómo se comportan las proteínas virales en su entorno nativo y proporcionar detalles cruciales sobre su organización en el contexto del virión. Un objetivo común para la crioET de virus son las glicoproteínas de superficie que se usan comúnmente para la unión y fusión de la célula huésped, ya que a menudo son los principales antígenos y objetivos para terapias o vacunas. Con los avances recientes en los paquetes de procesamiento de crioET, se ha vuelto cada vez más factible lograr promedios de resolución subnanométrica de estas glicoproteínas 19,20,21,22. Un ejemplo de ello es la hemaglutinina (HA), la principal proteína en la superficie de los viriones de la influenza. Esta proteína no solo realiza tanto la unión al receptor como la fusión de la membrana, sino que también cubre el virión de una manera increíblemente densa, con cientos o miles de HA en un virión5 singular. El protocolo presentado aquí (Figura 1) integra varios paquetes de uso común con scripts internos para delinear etapas desde el preprocesamiento hasta el refinamiento del modelo para un promedio de subtomograma de HA de influenza.
NOTA: Se puede acceder a los conjuntos de datos de muestra utilizados para este protocolo en EMPIAR-12864, que incluye los dos conjuntos de series de inclinación utilizados para este protocolo. Las series de inclinación se recogen de rejillas sumergidas manualmente del virus de la gripe A purificado con un tamaño de píxel físico de 2,09 Å/píxel para garantizar un campo de visión lo suficientemente grande como para que cada serie de inclinación contenga varios viriones, y también para ofrecer las reconstrucciones de mayor resolución posibles. Para los conjuntos de datos propios de los usuarios, se recomienda iniciar el flujo de trabajo con películas de inclinación sin procesar. Estos conjuntos de datos se procesaron y visualizaron utilizando estaciones de trabajo de alto rendimiento. La tabla de materiales enumera el hardware y el software utilizados para este protocolo. Todos los paquetes de software utilizados en este protocolo son de código abierto y están disponibles para su descarga; los enlaces de instalación y las instrucciones se enumeran en la Tabla de materiales. La estación de trabajo recomendada para procesar conjuntos de datos crioET debe estar equipada con al menos un procesador de 8 núcleos, una tarjeta GPU dedicada con 6 GB de VRAM, 64 GB de RAM y 2 TB de almacenamiento local.
1. Preprocesamiento de datos de películas de inclinación y reconstrucción de tomogramas crioelectrónicos en Warp 23 e IMOD 24
conda activate warp_environmentWarpTools create_settings --folder_data path/to/.tif --folder_processing warp_frameseries --output warp_frameseries.settings --extension “*.tif” --angpix 1.04 --gain_path gain_file.mrc --exposure 3.07WarpTools fs_motion_and_ctf --settings warp_frameseries.settings --m_grid 1x1x5 --c_grid 2x2x1 --c_range_max 7 --c_defocus_max 10 --c_defocus_min 4 --c_use_sum --out_averagesWarpTools ts_import --mdocs path/to/.mdoc --frameseries /path/to/frameseries --tilt_exposure 3.07 --min_intensity 0.3 --output tomostarWarpTools create_settings --folder_data tomostar --folder_processing warp_tiltseries --output warp_tiltseries.settings --extension “*.tomostar” --angpix 1.04 --gain_path gain_file.mrc --exposure 3.07 --tomo_dimensions NxNxNWarptools ts_stack --settings warp_tiltseries.settings --angpix 8.35WarpTools ts_import_alignments --settings warp_tiltseries.settings --alignments warp_tiltseries/tiltstack/ --alignment_angpix 8.35WarpTools ts_aretomo --settings warp_tiltseries.settings --angpix 8.35 --alignz 1000 --axis_iter 3 --exe AreTomo_executiveWarpTools ts_ctf --settings warp_tiltseries.settings --range_high 7 --defocus_min 2 --defocus_max 10 --auto_hand 4export WARP_FORCE_MRC_FLOAT32=1WarpTools ts_reconstruct --settings warp_tiltseries.settings --input_data input file names --angpix 8.35 --dont_invert2. Preprocesamiento de tomogramas y selección de partículas
conda activate isonet_envmkdir tomo_folder
mv tomograms*.mrc tomo_folder/isonet.py prepare_star tomo_folder --output_star tomograms.star --pixel_size 8.35isonet.py deconv tomograms.star --snrfalloff 0.7 --deconv_folder deconvolveconda activate eman_env
e2projectmanager.pycd path/to/tomogramse2spt_boxer_convnet.py --label label_namee2projectmanager.py comando.3. Curación de partículas
4. Promedio y clasificación del subtomograma iterativo
WarpTools ts_export_particles --settings warp_tiltseries.setting --input_star pts2star.star --coords_angpix 8.35 --output_star bin4_export.star --output_angpix 8.35 --box 48 --diameter 140 --3drelion_convert_star --i bin4_export.star --o bin4_conv.starhead -n 30 bin4_conv.star >> subset.star & tail -n +31 bin4_conv.star | shuf -n 2000 >> subset.star
mpiexec -n 3 relion_refine_mpi --o init_ref/job001/run --auto_refine --split_random_halves --i subset.star --firstiter_cc --ini_high 20 --dont_combine_weights_via_disc --pool 3 --pad 2 --ctf --particle_diameter 300 --flatten_solvent --zero_mask --oversampling 1 --healpix_order 2 --auto_local_healpix_order 4 --offset_range 14 --offset_step 4 --sym C1 --low_resol_join_halves 40 --norm --scale --j 12 --gpu 0:1 --pipeline_control init_ref/job001mpiexec -n 3 relion_refine_mpi --o Refine3D/job001/run --auto_refine --split_random_halves --i bin4_conv.star --ref init_ref/job001/run_class001.mrc --firstiter_cc --ini_high 20 --dont_combine_weights_via_disc --pool 3 --pad 2 --ctf --particle_diameter 400 --flatten_solvent --zero_mask --oversampling 1 --healpix_order 2 --auto_local_healpix_order 4 --offset_range 16 --offset_step 4 --sym C1 --low_resol_join_halves 40 --norm --scale --j 12 --gpu 0:1 --pipeline_control Refine3D/job001relion_refine --o Class2D/job003/run --grad --class_inactivity_threshold 0.1 --grad_write_iter 200 --iter 200 --i Refine3D/job002/run_data.star --dont_combine_weights_via_disc --pool 3 --pad 2 --ctf --tau2_fudge 2 --particle_diameter 300 --K 20 --flatten_solvent --zero_mask -- strict_highres_exp 14 --center_classes --oversampling 1 --norm --scale --j 24 --skip_align --pipeline_control Class2D/job002.relion_star_handler --i input_file2.star --o output_good_class.star --select rlnClassNumber --minval goodclassnumber -maxval goodclassnumberrelion_star_handler --i "output_good_class1.star output_good_class2.star … output_good_classn.star" --o bin4_keep.star --combinerelion_star_handler --i input_file.star --o output_file.star --combinerelion_image_handler --i bin1_ref.mrc --o bin1_c3.mrc --sym c3MTools create_population --directory refine_m --name ha_finalMTools create_source --name source_1 --population refine_m/ha_final.population --processing_settings warp_tiltseries.settings
MTools create_species --population refine_m/ha_final.population --name ha_todaysdate --diameter 160 --sym c3 --temporal_samples 1 --half1 last_relion_refine/run_half1_class001_unfil.mrc --half2 last_relion_refine/run_half2_class001_unfil.mrc --particles_relion last_relion_refine/run_data.star --mask mask.mrcMCore --population refine_m/ha_final.population --refine_particlesMCore --population refine_m/ha_final.population --refine_particles --ctf_cs5. Refinamiento del modelo
Para demostrar la utilización de este protocolo de procesamiento (Figura 1), el flujo de trabajo descrito anteriormente se aplicó a dos conjuntos de datos de 25 tomogramas combinados, obtenidos de una cepa del virus de la influenza A H1N1 (A/Puerto Rico/8/1934). Los parámetros de recopilación de datos se describen en la Tabla 1. La Figura 2 ilustra un tomograma representativo y vistas ampliadas de los viriones de la influenza pleomórfica. En este tomograma se capturan morfologías variadas, ya que los viriones varían de forma esférica a ovalada/alargada. Si bien la mayoría de las partículas de influenza contienen ensamblajes M1 y vRNP bien organizados, algunos viriones parecen estar más desorganizados y carecen de componentes estructurales cruciales.
A partir de este conjunto de datos, se utilizó un conjunto inicial de 40.995 subtomogramas para la reconstrucción bin4 (8,35 Å/pix) después de la selección y curación de partículas. Los dos conjuntos de datos se procesaron inicialmente de forma independiente en RELION4 con simetría C1 y una amplia máscara esférica que abarcaba la matriz general de alta disponibilidad. Se realizaron tres ciclos de refinamiento para estos subtomogramas, seguidos de una clasificación 2D. Después de la clasificación, se descartaron subtomogramas mal resueltos y partículas basura; los subtomogramas restantes se extrajeron en bin2 (4,17 Å/pix) y se combinaron los dos conjuntos de datos. Los subtomogramas Bin2 se alinearon primero en una ronda de promedio de subtomograma, luego se aplicó una máscara cilíndrica alrededor del HA central para enfocar la alineación. En esta etapa, la simetría trimérica se puede visualizar claramente para la reconstrucción de HA. Se llevaron a cabo rondas adicionales de refinamiento en bin2 y a 2,8 Å/pix. Se realizó una última ronda de clasificación 2D con una pequeña máscara que cubría solo el trímero central de HA con subtomogramas alineados. La clase principal, que consta de ~ 94% de los subtomogramas restantes, se extrajo a partículas no agrupadas y se sometió a refinamiento 3D con simetría C3 aplicada. Por último, estos subtomogramas se exportaron a M, donde se llevaron a cabo las poses de las partículas y los ciclos de refinamiento de la aberración esférica (Figura complementaria 1).
El promedio final del subtomograma (Figura 3A), que consta de 15.970 partículas de HA, alcanzó una resolución global de 6,0 Å y un rango de resolución local de 5-7 Å (Figura 4). Un modelo de PR8 HA se refinó de manera flexible en la densidad; en FSC=0.5 y FSC=0.143, la resolución del mapa al modelo fue de 8.1 Å y 6.6 Å, respectivamente. La arquitectura de la reconstrucción de HA se parecía mucho a los mapas crioEM y crioET anteriores. A esta resolución, se pueden distinguir las hélices alfa y las láminas beta (Figura 3B); además, los glicanos pueden comenzar a identificarse en cuatro sitios de glicosilación en la cabeza y el tallo del HA (Figura 3C).
Nuestros resultados muestran la idoneidad de la crioET en la reconstrucción de HA a partir de viriones de influenza nativa. A través del protocolo, se observó una densidad clara para la glicoproteína cilíndrica perpendicular a la membrana viral y la resolución mejoró en cada paso. Para los propios datos, se sugiere que el promedio del subtomograma comience desde una pila de partículas agrupadas, y los resultados deben monitorearse de cerca en cada ciclo de refinamiento. Si la densidad de la glicoproteína no es evidente desde las etapas iniciales, se recomienda mapear las ubicaciones del subtomograma en el tomograma para verificar el posicionamiento preciso. De lo contrario, se pueden ajustar los parámetros de alineación o implementar etapas de clasificación adicionales para lograr resultados óptimos.

Figura 1: Pipeline general para el promedio de subtomograma de HA de crioET del virus de la influenza. El panel superior representa un flujo de trabajo de resumen para los dos conjuntos de datos utilizados para demostrar el protocolo. El segundo panel corresponde a la Sección 1 del protocolo, el tercer panel corresponde a las Secciones 2 y 3 y el cuarto panel corresponde a las Secciones 4 y 5. Haga clic aquí para ver una versión más grande de esta figura.

Figura 2: Tomografía representativa del virus de la influenza PR8. (A) Corte a través del tomograma reconstruido. La barra de escala es de 100 nm. (D-C) Vista ampliada del virión PR8 (B) esférico, (C) cilíndrico, (D) sin M1. Todas las barras de escala en B-D corresponden a 50 nm. Haga clic aquí para ver una versión más grande de esta figura.

Figura 3: Promedio del subtomograma de PR8 HA. (A) Vista superior y lateral de la reconstrucción de HA en dos niveles de contorno ajustados de manera flexible con una estructura crioEM de una sola partícula PR8 HA. (B) Vistas recortadas a través de la reconstrucción de HA. Las flechas de colores corresponden a cuadros de colores. (C) Reconstrucción de HA mostrada en el contorno inferior para revelar la densidad de glicanos. También se muestran vistas de cerca de los glicanos en la representación de la barra en el mapa crioET. Haga clic aquí para ver una versión más grande de esta figura.

Figura 4: Estimación de la resolución del promedio del subtomograma de HA. (A) Estimación de la resolución local del promedio del subtomograma de HA mapeado en la reconstrucción. La barra de color representa 5-7 Å en la paleta azul-blanco-rojo. (B) Curvas FSC de semimapas y de resolución de mapa a modelo. La curva azul es de la reconstrucción desenmascarada, y la roja es de la enmascarada. Haga clic aquí para ver una versión más grande de esta figura.
| Conjunto de datos 1 | Conjunto de datos 2 | |
| Tamaño de píxel | 2.09 | 2.09 |
| Rango de inclinación | De 0 a ±54° | De 0 a ±66° |
| Escalón de inclinación | 3° | 3° |
| Año de recolección | 2024 | 2021 |
| Rango de desenfoque | 4-8 μm | 4-8 μm |
| Dosis total | 120 e-/Å2 | 120 e-/Å2 |
| # Submarcos | 6 | 5 |
| # Serie de inclinación utilizada | 15 | 11 |
| # Partículas | 3278 | 12692 |
Tabla 1: Parámetros de recopilación de datos para conjuntos de datos crioET del virus de la influenza PR8.
Figura complementaria 1: Flujo de trabajo de promedio de subtomograma para HA. La alineación, el promedio y la clasificación iterativos se llevan a cabo para los subtomogramas de HA a través de la eliminación gradual de binning. Haga clic aquí para descargar este archivo.
Los autores no tienen nada que revelar.
Este artículo presenta un protocolo para el procesamiento de datos de virus de influenza obtenidos mediante tomografía crioelectrónica y posterior subtomograma de promedio de la glicoproteína hemaglutinina. Este protocolo cubre el procesamiento de datos paso a paso, desde el preprocesamiento de imágenes hasta el refinamiento del modelo final.
Los autores desean agradecer las útiles discusiones con el Laboratorio Schiffer. También nos gustaría agradecer a la instalación UMass Chan cryoEM Core por su ayuda con la adquisición de datos y por brindarnos apoyo y asesoramiento. Este trabajo fue apoyado por el Instituto Nacional de Ciencias Médicas Generales R01GM143773 a MS y R35GM151996 a CAS.
| AMD Ryzen Threadripper PRO 5965WX | AMD | https://www.amd.com/en/support/downloads/drivers.html/processors/ryzen-threadripper-pro/ryzen-threadripper-pro-5000wx-series/amd-ryzen-threadripper-pro-5965wx.html | |
| AreTomo 1.3.4 | UC San Francisco | https://drive.google.com/drive/folders/1Z7pKVEdgMoNaUmd_cOFhlt-QCcfcwF3_ | |
| EMAN2 2.99.52 | Facultad de Medicina Baylor | https://blake.bcm.edu/emanwiki/EMAN2 | |
| IMOD 4.12.27 | Universidad de Colorado en Boulder | https://bio3d.colorado.edu/imod/ | |
| Guiones de análisis de gripe | Escuela de Medicina UMass Chan | https://github.com/jqyhuang/influenza-analysis | |
| IsoNet 0.3 | UCLA | https://github.com/IsoNet-cryoET/IsoNet | |
| M 2.0.0 | Genentech | https://warpem.github.io/warp/home/m/ | |
| NVIDIA A4000 | NVIDIA | https://www.nvidia.com/en-us/products/workstations/rtx-a4000/ | |
| Open3D | Intel Labs | https://www.open3d.org/ | |
| PHENIX 1.21-5207 | Laboratorio Nacional Lawrence Berkeley | phenix-online.org | |
| RELION 4.0 | Laboratorio de Biología Molecular del MRC | https://relion.readthedocs.io/en/release-4.0/ | |
| Ubuntu 20.04 | Ubuntu | https://releases.ubuntu.com/focal/ | |
| UCSF ChimeraX 1.6.1 | UC San Francisco | https://www.cgl.ucsf.edu/chimerax/ | |
| Warp 2.0.0 | Genentech | http://warpem.github.io/warp/ |