Summary
本稿では、ソフトウェアスイートSPHIREを使用して低温EM画像を処理するためのプロトコルを紹介します。現在のプロトコルは、ほぼ原子分解能を目標とするほぼすべての単一粒子EMプロジェクトに適用することができます。
Abstract
SPHIRE(高分解能電子顕微鏡用スパークス)は、単粒子電子冷凍顕微鏡(クライオEM)データの半自動処理のための、オープンソースで使いやすいソフトウェアスイートです。ここに提示されたプロトコルは、単一粒子構造決定パイプラインの全ステップを通してユーザを導くことにより、低温EM顕微鏡写真映画から始まる原子に近い解像度の構造を得る方法を詳細に説明している。これらの手順は、新しいSPHIREグラフィカルユーザーインターフェイスから制御され、ユーザーの操作を最小限に抑える必要があります。このプロトコールを使用して、Photorhabdus luminescensからのTc毒素複合体であるTcdA1の3.5Å構造は、9500個の単一粒子からのみ得られた。この合理化されたアプローチは、自然な状態で精製された巨大分子複合体のノイズのない、偏っていない原子モデルを得るために、広範な処理経験と先験的な構造情報なしで初心者ユーザを助けるでしょう。
Introduction
直接電子検出器技術の開発後、単粒子低温EMの顕著な進歩は現在、構造生物学を改造している1 。 X線結晶学と比較して、この技術は結晶化を必要とせずに少量のタンパク質材料しか必要とせず、同時に試料の純度に関する制約が少なく、しかも原子分解能近くの構造の決定を可能にする。重要なことに、異なる組成物または状態をコンピュータで分離することができ、異なる立体配座の構造決定を前例のない詳細レベルで行うことができる。最近、デノボモデルの構築を可能にする解像度で、挑戦する分子の密度マップを生成することができ、従って、それらの作用様式の深い理解2,3,4,5。
3DEM(3D Electron Microscopy)コミュニティ(https://en.wikibooks.org/wiki/Software_Tools_For_Molecular_Microscopy)で幅広い種類の画像処理ソフトウェアパッケージが利用可能であり、そのほとんどは継続的に開発されています。 EMAN2 6 、IMAGIC 7 、FREALIGN 8 、RELION 9 、SPIDER 10 、およびSPARX 11を含むいくつかの異なるソフトウェアパッケージを用いて、様々な分子量および対称性を示すタンパク質について、ほぼ原子分解能が達成されている。各パッケージは、異なるレベルのユーザー専門知識を必要とし、異なるレベルのユーザーガイダンス、自動化および拡張性を提供します。さらに、いくつかのプログラムは、画像解析のすべてのステップを容易にするための完全な環境を提供する一方、他のプログラムは、既知のrから始まるアラインメントパラメータの改良など、特定のタスクを最適化するように設計されている推論構造。より最近では、APPION 12およびSCIPION 13を含むいくつかのプラットフォームが開発されており、上で列挙した様々なソフトウェアパッケージからのアプローチおよびプロトコルを統合する単一処理パイプラインを提供している。
低温EMの現在の発展に貢献するために、SPARXはSPHIRE(高分解能電子顕微鏡用SPARX)と呼ばれる単粒子分析のための新しいスタンドアロンで完全なプラットフォームに再開発されました。現場の新しい研究者のための技術のアクセシビリティを高め、現代の全自動ハイエンド電子顕微鏡によって生成された大量のデータに対処するために、処理パイプラインは使い易いグラフィカルユーザーインターフェイス(GUI)を使用して、ワークフローの主要なステップを自動化します。さらに、crからの迅速かつ再現可能かつ自動化された構造決定を可能にするための新しいアルゴリズムが追加されましたyo-EM画像。さらに、再現性による検証は、洗練および異質性分析中に生成される共通のアーチファクトを回避するために導入された。
このプログラムは大幅に変更されていますが、簡単なオープンソースコード、最新のオブジェクト指向設計、すべての基本機能のためのPythonインターフェイスなど、その重要な機能が維持されています。したがって、ブラックボックスプログラムに変更されていないため、ユーザーはPythonコードを学習して簡単に修正したり、追加のアプリケーションを作成したり、全体的なワークフローを変更したりすることができます。これは、非標準Cryo-EMプロジェクトに特に便利です。
ここでは、SPHIREのGUIを使用して低温EM画像から原子に近い解像度の密度マップを得るためのプロトコルを示します。生の低温EM直接検出器の映画から密度マップを生成するために必要とされるすべてのステップを詳細に記述しており、特定の巨大分子タイプに限定されるものではない。このプロトコルは、主にnewc現場でワークフローを説明し、処理の重要なステップと可能性のある落とし穴や障害に関する重要な情報を提供します。より高度な機能と、SPHIREの背後にある理論的背景については、他の箇所で説明します。
Protocol
注記:このプロトコルに従うには、SPIREをMPIがインストールされているシステム(現在はLinuxクラスタ)に正しくインストールする必要があります。 http://www.sphire.mpg.deからSPHIREとTcdA1データセットをダウンロードし、インストール手順に従ってください:http://sphire.mpg.de/wiki/doku.php?id=howto:download。この手順では、EMAN2もインストールされます。 SPHIREは、パーティクルの選択にはEMAN2のe2boxerを使用し、画像ファイルの表示にはe2displayを使用しています。生の顕微鏡写真ムービーの線量加重モーション補正のために、SPHIREは非ぼかし14を使用します。プログラムをダウンロードし、インストール手順に従ってください(http://grigoriefflab.janelia.org/unblur、Grigorieff lab)。得られた構造の対話的視覚化のために、プロトコルは分子グラフィックスプログラムであるChimera 15 (https://www.cgl.ucsf.edu/chimera/download.html)を使用する。このプロトコル全体で使用されている機能に精通している素敵なチュートリアルは、こちら:https://www.cgl.ucsf.edu/chimera/data/tutorials/eman07/chimera-eman-2007.html。 SPHIRE GUIからクラスタに並列ジョブを送信する方法については、http://sphire.mpg.de/wiki/doku.php?id=howto:submissionsを参照してください。 SPHIRE GUIの全体的な構成と、このプロトコル全体で実行されるワークフローの主なステップを図1に示します。
1. PROJECT:このプロジェクトの定数パラメータ値を設定する
- ターミナルウィンドウで " sphire&"とENTERキーを押してSPIRE GUIアプリケーションを起動します。
- プロジェクト設定ページの各入力フィールドで、プロジェクト全体のパラメータ(ピクセルサイズ、パーティクル半径、対称性など)を調整し、これらの値をワークフローのすべての後続ステップに登録します。
- 左側のパネルの右下にある "PROJECT"アイコンをクリックして、プロジェクト設定ページを開きます。
- たとえば、パーティクルの長さが200Å、ピクセルサイズが1.2Å/ピクセルの場合、パーティクルの最長軸は200 / 1.2 =〜166ピクセル、半径166/2 = 83ピクセル)。
- 「パーティクルボックスサイズ」をパーティクルサイズの1.5倍以上に設定します。大きな素数を含むウィンドウサイズは使用しないでください。また、3D精緻化アルゴリズムは現在、偶数番号のボックスサイズを必要とすることに注意してください。
注:ウィンドウには、適切なCTF補正のためにピッキング(ウィンドウ内のパーティクルの移動の必要性)とパーティクル境界の外側の十分な背景領域に起因する初期センタリング誤差を考慮するマージンが含まれている必要があります(特に大きなデフォーカス値- 「CTFウィンドウサイズ」を「パーティクルボックスサイズ」に設定します。コントラストの低いデータのプロジェクトの場合は、より大きなウィンドウを使用して、パワースペクトルのスムーズな推定値を取得します。
- 複合体( 例えば、 "C5")の "点群対称性"を設定する。ターゲット構造の対称性がわからない場合は、 "C1"(非対称)のままにします。ただし、後で特定の高次対称性が処理中に特定された場合は、この対称性の設定を適宜変更し、ISACとの2Dアラインメント後の手順を繰り返します。
- kDaで "Protein molecular mass"を設定します(おおよその値で十分です)。 "Register settings"ボタンを押してください。
2.ムービー:各ムービーマイクログラフのフレームを調整してサンプルの全体的な動きを補正する
- すべてのムービー顕微鏡写真について、すべてのフレームのx / yシフトを計算してから、その線量 - 重み付けされていない線量 - 加重平均を作成する(討議参照)。前者は、CTF推定のためにのみ必要であることに留意されたい。なぜなら、推定は用量加重平均では良好に機能しないが、後者は構造決定の他のすべてのステップに使用されるからである。
- 「MOVIE」アイコンをクリックし、「Micrograph Movie Alignment」ボタンをクリックします。実行ファイルを選択して、「実行可能ファイルのパスを解除する」を設定します。アライメントされていない生の顕微鏡写真を選択し、ファイル名の可変部分をワイルドカード "*"( 例えば、 TcdA1 _ *。mrc)で置き換えることによって、 "入力顕微鏡写真パスパターン"を設定します。 「出力ディレクトリ」のパスを指定します。
- 実行可能ファイルを選択して、 "Summovie executable path"を設定します。
- 「ムービーフレーム数」を各ムービー顕微鏡写真のフレーム数に設定します。 「顕微鏡の電圧」と「フレームごとの露出」をデータ収集中の値に設定します。 (例としてすべてのフレームの露光量は60/20 = 3 e - / A 2です。) "Run Command"ボタンを押して、各ムービー顕微鏡写真のフレーム。
注:これにより、 線量 - 重み付けされていない線量加重平均補正された平均顕微鏡写真をそれぞれ含む2つの出力ディレクトリが自動的に作成されます。
3. CTER:CTFのデフォーカスと乱視のパラメータを推定する
- 各線量 - 重み付けされていない平均顕微鏡写真について、CTFパラメータ(デフォーカスおよび非点収差;ユーザによって設定されるもの)を推定する。
- "CTER"アイコンをクリックし、次に "CTF Estimation"ボタンをクリックします。 「入力顕微鏡写真パスパターン」を設定するには、線量 - 重み付けされていない動き補正された顕微鏡写真を選択し、ファイル名の可変部分をワイルドカード"*"。また、「出力ディレクトリ」のパスを指定します。
- 実験室におけるデータの種類(氷の厚さが主要因)と顕微鏡の電圧( 例えば 10%)に日常的に使用される値に「振幅コントラスト」を設定します。典型的な値は7〜14%の範囲です17 。
- データ収集中に使用される「顕微鏡の球面収差(Cs)」および「顕微鏡の電圧」を設定します。
- CTFモデルフィッティングの検索範囲の "最低周波数"と "最高周波数"をそれぞれ0.0285と0.285Å -1 (40 - 4Å)に設定します。 CTFパラメータを推定するには、 "Run command"ボタンを押してください。
注記:CTFパラメータは、指定した出力ディレクトリのpartres.txtファイルに自動的に保存されます。 112枚の顕微鏡写真のCTF推定値を96個のコアで計算し、代表的な結果を得るために使用したLinuxクラスタで約3分後に終了した。
4.ウィンドウ:線量加重平均顕微鏡写真から粒子を抽出する
- e2boxer 6で顕微鏡写真から手動または自動で粒子を選択し、それぞれに関連する顕微鏡写真内の粒子xy座標のリストを含む座標ファイルを作成します。
- "WINDOW"アイコンをクリックし、次に "Particle Picking"ボタンをクリックします。 "Run command"ボタンを押してe2boxer 6を起動し、各顕微鏡写真の粒子を手動または自動で選択します。18 ( 討議を参照)。各顕微鏡写真の最終粒子座標をEMAN1ファイル形式(.box)で保存します。または、座標ファイルをEMAN1形式に変換した後、他のプログラムからインポートすることもできます。
- 線量加重顕微鏡写真から粒子画像を抽出して粒子スタックを作成します(SPHIREでは、粒子スタックはありません)単に「スタック」と呼ばれる)。
- 「Particle Extraction」ボタンを押します。 線量加重の動き補正された顕微鏡写真を選択し、ファイル名の可変部分をワイルドカード "*"( 例えば、 TcdA1 _ *。mrc)で置き換えることによって、 "入力顕微鏡写真パスパターン"を指定してください。同様に、座標ファイル( 例: TcdA1 _ *。ボックス)を選択して、 "座標入力パスパターン"を設定します。 「出力ディレクトリ」のパスを指定します。
- CTFパラメータファイル(手順3.1で作成したpartres.txt)を選択して、 "CTF parameters source"を設定します。 "Run command"ボタンを押してください。
- 抽出された粒子画像スタックを単一の画像スタックに結合する。
- 「パーティクルスタック」ボタンをクリックします。 BDBファイルパス形式( 例 : "bdb:Particles / stack"、ここで "Particles"はthを指す)を使用して、 "Output virtual image stack"へのパスを指定しますeディレクトリにはBDBデータベース・ディレクトリがあり、その名前は常にEMAN2DBであり、「スタック」はこのデータベース内の特定のイメージ・スタックを指します。 "mpi_proc"で始まるディレクトリを選択し、ディレクトリ名の可変部分をワイルドカード "*"( 例えば Particles / mpi_proc_000〜Particles / mpi_proc_ *)に置き換えることによって、 "Input BDB image stack pattern"を指定します。 "Run command"ボタンを押してください。
5. ISAC:2Dにおけるパーティクル画像の分類
- パーティクルを整列させ、2D外観に基づいてパーティクルをクラスタリングすることによって、2Dクラスの平均を計算します。
注:結果として生じる2D平均は、個々の粒子画像と比較して改善された信号対雑音比(SNR)を有し、したがって、データセットの品質および異種性を視覚的に評価し、望ましくない画像をスタックから選別するために使用される( 例えば、氷晶、炭素エッジ、骨材、破片など ) 19 。さらに、それらはその後、最初の3Dモデルを決定するために使用される。- "ISAC"アイコンをクリックし、次に "ISAC - 2D Clustering"ボタンをクリックします。抽出されたパーティクルを含むスタックファイルを選択して、 "Input image stack"を設定します。 「出力ディレクトリ」のパスを指定します。
- 「クラスごとの画像」には200〜1000を使用します。予想される2Dクラス数(1クラスあたりの画像数で割った合計粒子数)を考慮して、適切な数を選択します。このパラメータは、SNRとデータセットのサイズに応じて調整します。データセットが過度にノイズが多い場合は、クラスごとのメンバー数を増やします。少ない数のパーティクルが使用可能な場合は、数を減らしてください。
注記:メモリの制約から、大規模なデータセット(> 100,000個のパーティクル)では、完全なデータセットをサブセットに分割し、各サブセットごとにISACを独立して実行し、結合します最後の結果。この処理シナリオの詳細な手順は、http://www.sphire.mpg.de/wiki/doku.phpに記載されています。 - 「Phase-flip」チェックボックスをオンにします。 「Target particle radius」と「Target particle image size」のデフォルト値は、これらの設定ですべてのパーティクルイメージを自動的に縮小することで処理速度を上げてください。 "Run command"ボタンを押して、2Dクラスの平均を計算します。
注:このステップは計算的に要求され、粒子やクラスの数、ターゲットの半径と画像のサイズとともに、実行時間が大幅に増加します。 96個のプロセスを含むクラスタでは、10,000個の粒子の2D分類が約90分後に終了しました。
- 結果として得られるISAC 2Dの平均値を表示し、視覚的に検査して、品質が満足できるものであることを確認します(ディスカッション参照)。
- 「UTILITIES」の下の「Display Data」ボタンを押します。セット ";入力ファイル "を選択し、ISAC 2D平均値を含むファイル(ステップ5.1で作成したclass_averages.hdf)を選択します。
- 検証されたクラス平均のパーティクルメンバーだけを含む新しいスタックを作成します。
- "Create Stack Subset"ボタンを押します。手順5.1.1と同じスタックファイルを選択して、「画像入力スタック」を設定します。 ISAC 2D平均(ステップ5.1で作成したclass_averages.hdf)を選択して、「ISAC平均」を設定します。 「出力ディレクトリ」のパスを指定します。 "Run command"ボタンを押してください。
6. VIPER:初期3Dモデルの計算
- すべての不良クラスの平均とパーティクルの同一ビューを削除して(ディスカッション参照)、クラス平均(100以上の画像)の小さなセットを選択し、それらを使用して担当者を計算しますVIPERを用いた誘導可能な初期モデル。選択には、それぞれ200〜500人のメンバーで、少なくとも60〜80の高品質平均を含める必要があることを忘れないでください。
- 「VIPER」アイコンをクリックし、次に「データ表示」ボタンをクリックします。 ISAC 2D平均(ステップ5.1で作成したclass_averages.hdf)を選択して、「入力ファイル」を設定します。 "Run command"ボタンを押してください。
- e2displayのグラフィックウィンドウのどこかにあるマウスの中央ボタンを押し、ポップアップウィンドウで "DEL"ボタンを押してください。すべての不良クラスの平均値と、パーティクルの同じビューを削除します( ディスカッション参照)。残りの2Dクラスの平均を新しいファイルに保存するには、[保存]ボタンを押します。
- 選択されたISAC平均値から、後続の3Dリファインメントの初期参照を生成します。
- 「初期3Dモデル - RVIPER」ボタンをクリックします。スクリーニングされたクラスを選択して「入力画像のスタック」を設定する平均値(ステップ6.1で生成)。 「出力ディレクトリ」のパスを指定します。
- ISACのステップ5.1.3と同じ目標粒子半径を使用してください。 "Run command"ボタンを押すと、再現可能なab initio 3Dモデルが生成されます。
注:このステップは計算的に要求され、実行時間は粒子の平均数とサイズの数によって大幅に増加します。 96プロセスのクラスタでは、このジョブ(〜100クラスの平均)は〜15分後に終了しました。
- 結果として得られた3Dモデルが、クラス平均と構造的完全性( すなわち 、切断された部品および/または方向性のアーティファクト)を考慮に入れて合理的であるかどうかをチェックする。マップを表示するには、プログラムChimera 15を使用します。この時点で、相同タンパク質の結晶構造または目的タンパク質のドメインとの最初の比較を行う(例はReprese結果)。
- 後続の3D精細化のためには、周囲のノイズを除去し、元のピクセルサイズに一致するように再スケーリングすることによって、初期3D基準と3Dマスクからab initio 3Dモデルを生成する。
- "Create 3D Reference"ボタンをクリックします。 ab initio 3Dモデル(ステップ6.2で作成したaverage_volume.hdf)を選択して、「Input volume」を設定します。 「出力ディレクトリ」のパスを指定します。
- ISAC縮小率ファイル(手順5.1で作成したREADME_shrink_ratio.txt)を選択して、 "Resample ratio source"を設定します。 "Run command"ボタンを押してください。
メリディアン:最初の3Dボリュームを精密化する
- 最初の3Dモデルから3Dボリュームを再調整します。
- "MERIDIEN"アイコンをクリックし、次に "3D Refinement"ボタンをクリックします。 seleで「画像入力スタック」と「初期3D参照」を設定する粒子スタックおよびab initio 3Dモデル(それぞれステップ5.3および6.4で生成された)を用いて計算する。 「出力ディレクトリ」のパスを指定します。
- ステップ6.4で作成した3Dマスクファイルを選択して、「3Dマスク」を設定します。常に3Dマスクを使用しますが、特に分析の初期段階では、誤ったマスキングの偏りを避けるために、リファレンスに緩くフィットする球面マスクまたはソフトエッジマスクを使用してください。
- [ハード2Dマスクを適用する]チェックボックスをオンにします。 「開始解像度」を20〜25Åのカットオフ周波数値に設定します。このカットオフ周波数を持つローパスフィルタは、最初の3D構造に適用され、初期モデルバイアスを低減することに注意してください。
- このプロセスで使用するクラスタの仕様を確認し、「ノードごとのメモリ」を使用可能なメモリ(ギガバイト)に設定します。 「実行コマンド」ボタンを押すと、最初の3Dモデルから始まる3Dボリュームを完全に自動化された方法で絞り込むことができます。
- 次の鮮明化ステップのために、洗練されたボリュームからソフトエッジの3Dマスクを作成します。
- 「アダプティブ3Dマスク」ボタンをクリックします。フィルタリングされていない半音量(ステップ7.1で作成)の1つを選択して、「入力音量」を設定します。 「出力マスク」のパスを指定します。
- 「二値化しきい値」の値を設定します。キメラを使用して、この特定の閾値で、ノイズがフィルタリングされていないハーフマップの溶媒領域の関心ボリュームの外にあることを確認します。タンパク質のすべての密度はまだcです相互に接続されている。ソフトエッジ3Dマスクを作成するには、「コマンドを実行」ボタンを押します。
注:得られたマスクの本体(値が> 0.5であるボクセルからなる)は、粒子構造にしっかりと適合しなければならないが、依然として関心のあるすべての密度を囲む。ソフトエッジの減衰は、少なくとも8-10ピクセル幅である必要があります。
- 3Dリファインメントで得られた2つのフィルタリングされていない半ボリュームをマージします。次に、検出器の変調伝達関数(MTF)、推定B係数、および分解能のFSC(フーリエ・シェル相関)推定に基づいて、パワースペクトルを調整することによって、併合されたボリュームをシャープにします。
- 「鮮明化」ボタンを選択します。手順7.1で作成した対応するファイル(vol_0_unfil.hdfおよびvol_1_unfil.hdf)を選択して、「最初のフィルタリングされていないハーフボリューム」および「2番目のフィルタリングされていないハーフボリューム」を設定します。常に「B因子強化」を使用してください。通常は、デフォルト値をそのままにしておく最終分解能周波数と10Åの間の範囲を使用して、入力データセットからBファクタ値を推測します。または、 アドホック値( たとえば、 -100)を指定します。
- FSCベースのフィルタを適用するには、「ローパスフィルタ周波数」のデフォルト値を維持します。
- 3Dマスク(手順7.2で作成)を選択して、「ユーザー提供のマスク」を設定します。報告された解像度は、このマスクでFSCを使用して決定されることに注意してください。 "実行コマンド"ボタンを押して、洗練された3Dボリュームをシャープにします。
- 上の3D精密化ステップで推定されたすべてのパーティクルの投影方向から3D角度分布マップを生成します。
- 「角度分布」ボタンをクリックします。手順7.1で作成したファイル(final_params.txt)を選択して "Alignment parameter file"を設定し、 "Run command"ボタンを押します。
- Chiを使用して鮮明な3Dモデルを視覚的に検査するメラ。達成された解決策を考慮して構造が合理的に見えることを確認する( 討議を参照)。
- キメラを用いて角度分布を目視検査する。ディストリビューションが3D角空間全体をほぼ均等にカバーしていることを確認します。対称構造の場合、分布は固有の非対称三角形内に制限されることに留意してください。
8. SORT3D:高度に可変な領域に焦点を当てて3D異種性をソートする
- 3Dリファインメントで使用されるパーティクルスタックから3D可変性マップを計算します。
- 「SORT3D」アイコンをクリックし、次に「3D Variability Estimation」ボタンをクリックします。 3Dリファインメント・ステップ7.1.1に与えられたものと同じスクリーン・パーティクル・スタックを選択して、 "Input image stack"を設定します。 「出力ディレクトリ」のパスを指定します。
- 「投影数」のデフォルト値を維持します。
注:角度の隣からの画像フードは、各3D投影角度での2D分散を推定するために使用される。数値が大きいほど、推定値のノイズは少なくなりますが、解像度と回転アーチファクトはより低くなります。 - [Use CTF]チェックボックスをオンにします。 "Run command"ボタンを押してください。
- 3D変動マップを使用して、以下の3Dクラスタリングステップのフォーカスマスクを作成します。
- 「バイナリ3Dマスク」ボタンを選択します。 3D可変性マップ(ステップ8.1で作成)を選択して、「入力ボリューム」を設定します。 「出力マスク」のファイルパスを指定します。
- キメラの "Volume Viewer"の "Level"フィールドの出力を使用して、 "Binarization threshold"を設定します。 "Run command"ボタンを押してください。
- 構造的に非常に可変な領域に焦点を当て、粒子画像を均質な構造グループに分類します。
- "3D Clustering - RSORT3D"ボタンを押してください。3Dリファインメント(ステップ7.1で作成)の出力ディレクトリを選択して、 "Input 3D refinement directory"を設定します。 「出力ディレクトリ」のパスを指定します。
- ソフトエッジ3Dマスク(手順7.2で作成)を選択して、「3Dマスク」を設定します。二値化された3D可変性マップ(ステップ8.2で生成)を選択して、 "Focus 3D mask"を設定します。
- 大規模なデータセットの場合は、「1グループあたりの画像数」に少なくとも5,000〜10,000を使用します。プログラムは、この設定よりもグループあたりの画像数を常に低く保つことを覚えておいてください。予想される3Dグループの数(粒子の総数を「グループあたりの画像数」で割った値)、データセット、SNR、異質度を考慮して値を調整します。データセット内の別個の構造状態の数がより多くなることが予想されない限り、十分な数の粒子が利用可能である場合には、〜5-10の初期3Dグループから開始する。
- 「最小のグループサイズ」には少なくとも3,000〜5,000個の粒子を使用します。プログラムは、「最小グループサイズ」の設定よりも少ない数の画像を含むグループを無視することに注意してください。 "Run command"ボタンを押して、3Dクラスタリングを実行します。
注:RSORT3Dは2つのステップに細分されています。最初の "sort3d"ステップは、3D異質性をソートします。次に、上の3D精密化ステップによって決定された3Dアラインメントパラメータを使用して、各均質構造グループのボリュームを再構築する。第2の "rsort3d"ステップは、2つの独立したソーティング実行の双方向比較を実行することによって、各グループの再現可能なメンバーを見つける。次に、再現可能に割り当てられた粒子のみを使用して均質構造を再構成する。 96コアのクラスタでは、約3時間後にこのジョブ(約8,000パーティクル、352ボックスサイズ)が終了しました。
- プログラムが終了したら、キメラを使用して同質の3Dグループを選択します。見た目の最も高い解像度の構造を選択します。典型的には最も高い解像度に関連付けられますパルグループ。興味のあるタンパク質の2Dクラスの平均と生物学的側面を考慮に入れて、選択した構造が視覚的に合理的であることを確認します( ディスカッション参照)。同様の解像度でほぼ同一の構造を持つ他のボリュームがある場合、それらを単一の同質の3Dグループから出てくるものと見なしてください。
- 最も均質な3Dグループのパーティクルメンバーに対して(最高の解像度で)局所的な細分化を実行します。
- "Local Subset Refinement"ボタンをクリックしてください。選択したグループのパーティクルIDを含むテキストファイル( たとえば、手順8.3で作成したCluster0.txt)を選択して、[サブセットのテキストファイルパス]を設定します。前の3Dリファインメント(ステップ7.1で作成)の出力ディレクトリを選択して、「3Dリファインメントディレクトリ」を設定します。
- 以前の3Dリファインメントで最も高い解像度が達成されたものに "Restarting iteration"を設定します。プレス「コマンド実行」ボタンをクリックして、選択した粒子の集団を局所的に精緻化します。
- ステップ7.2と同様に、ローカルサブセットリファインメントによって再構成されたフィルタリングされていない最後の半ボリュームからソフトエッジ3Dマスクを作成します。
- ステップ7.3と同様に、ローカルサブセットリファインメントによって導出されたフィルタリングされていない2つの最終半ボリュームをマージし、マージされたボリュームをシャープにします。ただし、今回は鋭利なボリュームをフィルタリングしないでください。
注記:ステップ8.4の異質性分析が、同等の分解能でいくつかの異なる状態を示している場合は、すべての異なる状態を個別に洗練したい場合があります。
9. LOCALRES:最終3Dボリュームのローカル解像度を見積もる
- 均質な粒子群から得られた3Dボリュームの局所分解能を推定する。
- "LOCALRES"アイコンをクリックし、次に "Local Resolution"ボタンをクリックします。 「最初の半音量」と「後半音量ステップ8.6で作成したソフトエッジの3Dマスクを選択して "3Dマスク"を設定し、 "出力ボリューム"のファイルパスを指定して、 。
- "FSC window size"のデフォルト値は7ピクセルです。この設定は、ローカル - 実空間相関が計算されるウィンドウのサイズを定義することを忘れないでください。より大きなウィンドウサイズは、局所分解能を犠牲にしてより滑らかな解像度マップを生成する。
- 分解能基準には、 "Resolution cut-off"のデフォルト値の0.5を維持してください。
注:各ボクセルについて、プログラムはローカルFSCが選択された解像度閾値を下回る頻度としてローカル解像度を報告します。低い相関値は統計的な不確実性が高いため、0.5より低いしきい値は推奨しません。したがって、対応するローカル解像度は、ボクセル間で強く変化する。 - 「オーバー「解像度」を選択すると、ローカルサブセットリファインメント後のシャープニングで推定される絶対解像度が設定されます(ステップ8.7)。「コマンドを実行」ボタンを押してボリュームのローカル解像度を計算します。
- 3Dローカル解像度マップを使用して、ローカルサブセットリファインメント後にシャープにされたボリュームに3Dローカルフィルタを適用します。
- 「3Dローカルフィルタ」ボタンをクリックします。鮮明でフィルタリングされていない3Dボリューム(ステップ8.7で作成)を選択して、「入力ボリューム」を設定します。同様に、「ローカル解像度ファイル」と「3Dマスク」(それぞれステップ9.1と8.6で作成)を設定します。 3Dマスクは、ローカルフィルタリングが適用される領域を定義することに注意してください。 「出力ボリューム」のファイルパスを指定します。 "Run command"ボタンを押して、3Dローカルフィルタを適用します。
- キメラを使用して、最終的な3Dモデルと3Dローカル解像度マップ(ステップ9,2と9.1で生成されたresp積極的に)。 「地色」オプションを選択すると、ローカル解像度に応じて3D音量が調整されます。地方の決議の配布はスムーズでなければならないことに留意してください( 討議を参照)。
Representative Results
上記のプロトコルは、 Photorhabdus luminescens Tc複合体(TcdA1) 20,21,22の A成分の112個の直接検出器映画から開始して実行した。このデータセットは、300kVの加速電圧で動作する高輝度電界放出ガン(XFEG)を備えたCs補正電子凍結顕微鏡で記録した。画像は、標本スケールで1.14Åの画素サイズで60e - /Å -2の総線量で自動的に取得された。ムービーフレームのアライメント後( プロトコルステップ2 )、結果として得られたモーション補正された平均値は、等方性のトーンリングが高解像度に拡張されていました( 図2a )。個々の粒子は容易に目に見え、よく分離していた( 図2b )。次に、e2boxerの群ツールを使用してパーティクルを選んだlass = "xref"> 18( プロトコルステップ4.1 )。この場合、より選択的なオプションを使用して適切な閾値を設定した( 図2c )。 112のデジタル顕微鏡写真は9,652個の粒子を生じた。抽出された画像の大部分( プロトコルステップ4.2 )は、明確に定義された粒子を含み、そのボックスサイズは、推奨されるように、粒子サイズの約1.5倍であった( 図2d )。次に、ISACを用いて、2D異種性分析を実施した( プロトコールステップ5 )。それは98のクラス平均をもたらした( 図3a )。これらの2Dクラス平均を用いて、中間分解能でVIPER( プロトコルステップ6 )を用いてab initioモデルを計算した( 図3b )。このモデルは、以前に3.9Åの分解能22で解決されたTcdA1の結晶構造との優れた一致を示す( 図3c )。このab initioモデルは、初期状態として使用された (MERIDIEN)を用いて、約40,000個の非対称単位のみから3.5Å(0.143基準)再構成( プロトコルステップ7 )を得た( 図4 )。この原子に近い分解能のマップは、複数のコアの恩恵を受けるワークフローのステップで最大96個のCPUを使用して24時間以内に取得されました。
3次元変動分析(プロトコルステップ8)では、ステップ8.3.3でグループあたり2,000個の粒子画像のみが使用された( すなわち 、プロセスは5個の初期3Dグループから開始する)。ステップ8.3.4で最小グループサイズ少数の粒子(〜10,000)。この分析は、主に、精製に使用されるHisタグを含む複合体のN末端領域で局所的な柔軟性を明らかにした( 図5a )。実際、TcdA1の以前に公開された結晶構造では、12個のN末端残基およびHisタグは分解されなかった受容体結合ドメインおよびBC結合ドメインでさらなる変動性が検出された( 図5a )。全体的にみて( 図5a )、この変動は、現在の低温EM密度において未解決のままであった。この構造の不均一性は許容可能であると判断され、したがって焦点を当てた3D分類23は行われなかった。最後に、最終濃度マップの局所分解能が計算された( プロトコルステップ9.1、図この品質のボリュームは、Coot 24やその他のリファインメントツール( 図6 )を使用した新モデル構築に使用することができます。
<図1:SPHIREを使用した画像処理。 ( a )SPHIREソフトウェアパッケージのGUI。ワークフローの特定のステップは、GUIの左側(「ワークフローステップ」)のそれぞれの絵文字を選択することによってアクティブにすることができます。ワークフローのこのステップに関連するコマンドとユーティリティは、GUIの中央領域に表示されます。コマンドの1つを選択すると、それぞれのパラメータがGUIの右側の領域に表示されます。高度なパラメータは通常、プリセットされたデフォルト値の変更を必要としません。 ( b )SPHIRE GUIを用いた単一粒子画像処理のワークフローにおける段階。 この図の拡大版を見るには、ここをクリックしてください。
図2:動きの補正と部分le抽出。 ( a 、 b )1.7μmのデフォーカスで記録された典型的な高品質、低線量、ドリフト補正されたデジタル顕微鏡写真。パワースペクトル(a)において2.7オングストロームの分解能で伸びる等方性のトーンリングと、2D画像( b )における十分に識別可能な粒子に注目されたい。 ( c )e2boxerを用いた粒子の選択。緑色の円は選択された粒子を示します。 ( d )用量加重顕微鏡写真から抽出した典型的な生の粒子。スケールバー= 20nm。 この図の拡大版を見るには、ここをクリックしてください。
図3:2Dクラスタリングと初期モデル生成。 ( a )2階級クラスの平均のギャラリー、多数の側面図を表すo粒子。スケールバー= 20nm。 ( b )参照フリークラスの平均からRVIPERを用いて得られたTcdA1のAb initio 3Dマップ。 ( c )TcdA1結晶構造(リボン)(pdb-id 1VW1)の最初の低温EM密度(透明灰色)への剛体適合。 この図の拡大版を見るには、ここをクリックしてください。
図4:TcdA1のクライオEM 3D構造。 ( a 、 b )約9,500個の粒子画像を用いて計算されたTcdA1の最終3.5Å密度マップ:( a )側面および( b )上面図。 ( c )αヘリックスおよびβシートの低温EM密度の代表的な領域。arge.jpg "target =" _ blank ">この図の拡大版を見るには、ここをクリックしてください。
図5:変動分析とローカル解決。 ( a )鋭利なTcdA1低温EMマップの表面(灰色)および可変性マップ(緑色)。より明確にするために、可変性マップを30Åまでローパスフィルタリングした。 ( b )TcdA1鮮鋭化低温EMマップの表面レンダリングは、局所分解能(Å)に従って着色した。高いばらつきのある領域と低い局所分解能の間のトポロジカルな一致に注意してください。 この図の拡大版を見るには、ここをクリックしてください。
図6:3DモードCootを用いたTcdA1の構築。低温EM密度および原子モデルの代表的な領域がα-ヘリックスについて示されている。原子モデルは、Cootを使用して新しく構築されました。 この図の拡大版を見るには、ここをクリックしてください。
Discussion
単粒子低温EMは、近年急速な発展を示し、主要な生物学的意義25の高分子複合体の多数の原子分解構造を送達した25 。現在フィールドに入っている多数の初心者ユーザをサポートするために、我々は単粒子画像解析プラットフォームSPHIREを開発し 、ムービーアライメント、パーティクルピッキング、CTF推定、初期モデル計算、2Dおよび3D異質性解析、高解像度3D精緻化および局所分解能推定およびフィルタリングを含む。
本明細書に記載されたプロトコールは、目的のタンパク質の低温EM顕微鏡写真を用いた3D構造決定、およびSPHIREの独立型GUIによって提供される計算ツールの助けを借りて、3D構造決定の短いガイドとして意図されている。
ワークフローの主な特徴は、再現性による検証の概念に依拠しており、パラメータ調整を必要としないため、手順のうちの1回だけを実行する必要があります。この自動検証メカニズムは、他のソフトウェアパッケージと比較してSPHIREの主な利点です。結果は客観的で再現性があり、最も重要なのは受け入れ可能な計算コストで得られる傾向があるからです。パイプラインは、経験豊富なユーザーが独自の方法でさらに独立した検証と評価を行うための豊富な診断情報を提供します。それにもかかわらず、構造生物学および電子顕微鏡法において少なくとも基本的な理論的背景を有する初心者ユーザは、それ自身のデータおよび自動化された検証手順を用いて原子に近い分解能構造を得ることができるはずである。
しかしながら、原子に近い分解能構造を得ることは、必ずしも直接的なものではなく、その結果は、サンプルの品質および入力データに大きく依存するa。ここに提示されている手順では、十分な数の高品質のアライメントされていない生のEMムービーが利用可能であり、それらの平均が明確に識別可能な均質で無作為に配向された単一粒子を示すと仮定する。一般に、分子の対称性、サイズまたは全体的な形状に関する制限はないが、特にタンパク質が特徴のない球状を有する場合、低分子量が制限因子であり得る。通常、高い点群対称性を有する、より大きく、規則正しい粒子の分析は、それほど厳しいものではありません。したがって、初心者ユーザは、まず特性の良い低温EMデータセットで本プロトコルを実行することを強くお勧めします。 SPHIREチュートリアルデータ(http:/sphire.mpg.de)またはEMPIARサブミットデータセット(https://www.ebi.ac.uk/pdbe/emdb/empiar/)のいずれかをRawムービーと一緒に使用することをお勧めします。
独自のデータを処理する場合、一部のデータセットまたは一部の画像が特定の品質を満たさない可能性が非常に高い基準。この文脈では、ワークフローの主要なステップのためにプログラムによって実行される自動化された安定性および再現性チェックに加えて、ユーザがプロトコルの特定の「チェックポイント」で結果を視覚的に検査することは依然として推奨されており、満足できるものではない。
最初の目視検査は、映画整列( プロトコルステップ2 )およびCTF推定( プロトコルステップ3 )後の顕微鏡写真レベルで行うことができる。得られたモーション補正された平均値は、はっきりと識別され、よく分離された単一粒子を示すはずであり、そのパワースペクトルははっきりと識別可能な等方性のトーンリングを示すべきである。それらが可視である空間周波数は、ほとんどの場合、構造が原則的に最終的に決定されることができる最高解像度を規定する。十分な品質とそのパワースペクトルの動き補正された平均の例は、セクション#最終的な結果に悪影響を与える可能性のある異常画像は、SPHIREのDriftおよびCTFアセスメントGUIツール(http://sphire.mpg.de/wiki/doku.php)の助けを借りて除去することができます。
パーティクルスクリーニングに関して、SPHIREパイプラインの重要なステップは、ISAC( プロトコルステップ5.2)を使用した2D分類です。ここで、ユーザは、プログラムによって自動的に識別された再現可能な2Dクラス平均が、角度空間を準平準にカバーするのに十分な方向の範囲を採用するように制御すべきである。クラス平均の品質が満足できるものではない場合(ノイズの多い画像やぼやけた画像)、再現可能なクラス平均の数が非常に少ない場合は、自動ピッキング品質の改善、データセットのイメージングまたはサンプルの作成の最適化を検討してください。ほとんどの場合、良好な2Dクラス平均が得られないデータセットから信頼性の高い再構成を計算することはできません。高品質2Dクラスの例怒りは「代表的な結果」のセクションに示されています。
自動化された方法でRVIPERを使用して信頼性の高い初期3Dモデルを得るには、少なくとも100のクラス平均が必要です( プロトコルステップ6.1 )。このステップでは、ユーザは、最高品質の平均を選択し、可能な限り多くの異なる方向の粒子を含むべきである。初期モデルの品質は、その後の高解像度3D精緻化の成功のために重要である。
他のソフトウェアパッケージでは、「悪い」粒子8,9を除去するために3D分類が行われることがあります。しかし、SPHIREでは、ISACを使用して2次元分類を行う際に、これらの粒子のほとんどが自動的に削除されます。したがって、再構成および3D変動分析がデータセットの異質性を示す場合にのみ、3Dソーティングの計算集約的なステップを実行することが推奨されます。
最も重要なことは、ユーザーは常に、得られた3Dボリュームを注意深く注意深く検査し( プロトコルステップ9.3 )、それぞれの密度の特徴が公称解像度とよく一致することを確認する必要があります。 <9Åの分解能では、α-ヘリックスに対応する棒状の密度が見えるようになる。 4.5Å未満の分解能では、βシート中の鎖に対応する密度は、通常、十分に分離され、かさばったアミノ酸が見えるようになる。高分解能マップ(<3Å)では、明確な識別可能な側鎖が示され、正確な原子モデルの構築が可能になります。
今日までに得られた結果は、SPHIREの自動再現性試験および最小限の視覚検査の助けを借りて、現在のプロトコールが一般にあらゆるタイプの単一粒子クライオEMプロジェクトに適用可能であることを実証している。各処理工程の代表的な結果は、TcdA1毒素の再構築のために示されているPhotorhabdus luminescens 21であり 、これはほぼ原子分解能に解決されている。同様の品質の密度マップを使用して、デボリューションバックボーントレースと逆数または実空間のリファインメントによる信頼性の高い原子モデルを構築することができ、複雑な分子メカニズムを理解するための強固な構造フレームワークを提供します。
ACCESION CODES:
EM構造および未処理の映画のための座標は、それぞれ、受託番号EMD-3645およびEMPIAR-10089で、電子顕微鏡データバンクおよび電子顕微鏡画像ファイルアーカイブに寄託されている。
Disclosures
著者らは、競合する金銭的利益がないと宣言している。
Acknowledgments
私たちはTcdA1顕微鏡写真を提供してくれたD. Rodererに感謝します。 EMAN2インフラストラクチャの継続的なサポートに感謝します。この作業は、Max Planck Society(SR)と欧州連合(EU)の第七フレームワークプログラム(FP7 / 2007-2013)(付与番号615984)(SRへ)からの資金と、健康R01 GM60635からPAPへ)。
Materials
Name | Company | Catalog Number | Comments |
SPHIRE | Max Planck Institute of Molecular Physiology- Dortmund and Houston Medical School, Houston, Texas | http://sphire.mpg.de | |
UCSF Chimera | University of California, San Francisco | http://www.cgl.ucsf.edu/chimera/ | |
Unblur | Janelia Farm Research Campus, Ashburn | http://grigoriefflab.janelia.org/unblur | |
Coot | MRC Laboratory of Molecular Biology, Cambridge | http://www2.mrc-lmb.cam.ac.uk/personal/pemsley/coot/ | |
EMAN2 | Baylor College of Medicine, Houston | http://blake.bcm.edu/emanwiki/EMAN2 | |
Computing Cluster with 1824 cores | Max Planck Institute of Molecular Physiology | Linux Cluster with 76 nodes, each with 2 Processors Xeon E5-2670v3 12C 2.30 GHz and 128 Gb RAM | |
TITAN KRIOS electron microscope | FEI | 300 kV, Cs correction, XFEG | |
Falcon II direct electron detector | FEI | ||
EPU (automated data acquisition software) | FEI | https://www.fei.com/software/epu/ |
References
- Nogales, E. The development of cryo-EM into a mainstream structural biology technique. Nature Methods. 13 (1), 24-27 (2016).
- Liao, M., Cao, E., Julius, D., Cheng, Y. Structure of the TRPV1 ion channel determined by electron cryo-microscopy. Nature. 504 (7478), 107-112 (2013).
- Bai, X. -C., Yan, C., et al. An atomic structure of human γ-secretase. Nature. 525 (7568), 212-217 (2015).
- Ecken, J. V. D., Heissler, S. M., Pathan-Chhatbar, S., Manstein, D. J., Raunser, S. Cryo-EM structure of a human cytoplasmic actomyosin complex at near-atomic resolution. Nature. 534 (7609), 724-728 (2016).
- von der Ecken, J., Müller, M., Lehman, W., Manstein, D. J., Penczek, P. A., Raunser, S. Structure of the F-actin-tropomyosin complex. Nature. 519 (7541), 114-117 (2015).
- Tang, G., Peng, L., et al. EMAN2: An extensible image processing suite for electron microscopy. Journal of Structural Biology. 157 (1), 38-46 (2007).
- van Heel, M., Harauz, G., Orlova, E. V., Schmidt, R., Schatz, M. A new generation of the IMAGIC image processing system. Journal of Structural Biology. 116 (1), 17-24 (1996).
- Grigorieff, N. FREALIGN: high-resolution refinement of single particle structures. Journal of Structural Biology. 157 (1), 117-125 (2007).
- Scheres, S. H. W. RELION: implementation of a Bayesian approach to cryo-EM structure determination. Journal of Structural Biology. 180 (3), 519-530 (2012).
- Shaikh, T. R., Gao, H., et al. SPIDER image processing for single-particle reconstruction of biological macromolecules from electron micrographs. Nature Protocols. 3 (12), 1941-1974 (2008).
- Hohn, M., Tang, G., et al. SPARX, a new environment for Cryo-EM image processing. Journal of Structural Biology. 157 (1), 47-55 (2007).
- Lander, G. C., Stagg, S. M., et al. Appion: an integrated, database-driven pipeline to facilitate EM image processing. Journal of Structural Biology. 166 (1), 95-102 (2009).
- de la Rosa-Trevìn, J. M., Quintana, A., et al. Scipion: A software framework toward integration, reproducibility and validation in 3D electron microscopy. Journal of Structural Biology. 195 (1), 93-99 (2016).
- Grant, T., Grigorieff, N. Measuring the optimal exposure for single particle cryo-EM using a 2.6 Å reconstruction of rotavirus VP6. eLife. 4, 06980 (2015).
- Pettersen, E. F., Goddard, T. D., et al. UCSF Chimera?A visualization system for exploratory research and analysis. Journal of Computational Chemistry. 25 (13), 1605-1612 (2004).
- Penczek, P. A., Fang, J., Li, X., Cheng, Y., Loerke, J., Spahn, C. M. T. CTER-rapid estimation of CTF parameters with error assessment. Ultramicroscopy. 140, 9-19 (2014).
- Frank, J. Three-Dimensional Electron Microscopy of Macromolecular Assemblies. , Oxford University Press. (2006).
- Woolford, D., Ericksson, G., et al. SwarmPS: rapid, semi-automated single particle selection software. Journal of Structural Biology. 157 (1), 174-188 (2007).
- Yang, Z., Fang, J., Chittuluru, J., Asturias, F. J., Penczek, P. A. Iterative Stable Alignment and Clustering of 2D Transmission Electron Microscope Images. Structure/Folding and Design. 20 (2), 237-247 (2012).
- Gatsogiannis, C., Merino, F., et al. Membrane insertion of a Tc toxin in near-atomic detail. Nature Publishing Group. , (2016).
- Gatsogiannis, C., Lang, A. E., et al. A syringe-like injection mechanism in Photorhabdus luminescens toxins. Nature. 495 (7442), 520-523 (2013).
- Meusch, D., Gatsogiannis, C., et al. Mechanism of Tc toxin action revealed in molecular detail. Nature. 508 (7494), 61-65 (2014).
- Penczek, P. A., Frank, J., Spahn, C. M. T. A method of focused classification, based on the bootstrap 3D variance analysis, and its application to EF-G-dependent translocation. Journal of Structural Biology. 154 (2), 184-194 (2006).
- Emsley, P., Lohkamp, B., Scott, W. G., Cowtan, K. Features and development of Coot. Acta crystallographica. Section D, Biological crystallography. 66, Pt 4 486-501 (2010).
- Callaway, E. The revolution will not be crystallized: a new method sweeps through structural biology. Nature. 525 (7568), 172-174 (2015).