タンパク質間相互作用(PPI)における多重特異的結合部位のアミノ酸選好性を推定するための、配列の多様化に基づく方法論について説明します。この戦略では、何千もの潜在的なペプチドリガンドが生成され、in silicoでスクリーニングされるため、利用可能な実験方法のいくつかの制限があります。
多くのタンパク質間相互作用には、短いタンパク質セグメントのペプチド結合ドメインへの結合が含まれます。通常、このような相互作用には、可変保存を伴う線形モチーフの認識が必要です。同じリガンド内の高度に保存された領域とより変動しやすい領域の組み合わせは、酵素と細胞シグナル伝達タンパク質の一般的な特性である結合の多特異性に寄与することがよくあります。ペプチド結合ドメインのアミノ酸選好性の特性評価は、タンパク質間相互作用(PPI)のメディエーターの設計にとって重要です。計算法は、高価で面倒な実験手法に代わる効率的な方法であり、後で下流の実験で検証できる可能性のあるメディエーターの設計を可能にします。ここでは、Rosetta分子モデリングパッケージのPepspecアプリケーションを使用して、ペプチド結合ドメインのアミノ酸選好を予測する方法論について説明しました。この方法論は、受容体タンパク質の構造とペプチドリガンドの性質の両方が既知であるか、または推測できる場合に有用です。この方法論は、リガンドからの十分に特徴付けられたアンカーから始まり、アミノ酸残基をランダムに添加することによって拡張されます。このようにして生成されたペプチドの結合親和性は、次にフレキシブルバックボーンペプチドドッキングによって評価され、予測される最高の結合スコアを持つペプチドが選択されます。次に、これらのペプチドを使用してアミノ酸の好みを計算し、オプションでさらなる研究に使用できる位置重みマトリックス(PWM)を計算します。この方法論の適用を説明するために、以前は多重特異性であることが知られていたが、pLxISと呼ばれる短い保存されたモチーフによってグローバルに導かれたヒトインターフェロン調節因子5(IRF5)のサブユニット間の相互作用を使用しました。推定されたアミノ酸選好は、IRF5結合表面に関する以前の知識と一致していました。リン酸化可能なセリン残基が占める位置は、アスパラギン酸とグルタミン酸が高頻度で見られましたが、これはおそらく、それらの負に帯電した側鎖がホスホセリンに類似しているためです。
2つのタンパク質間の相互作用には、多くの場合、アミノ酸の短いセグメントがペプチド結合ドメインに結合することが含まれ、これはタンパク質-ペプチド界面に似ています。このようなタンパク質間相互作用(PPI)に関与する受容体タンパク質は、多くの場合、重なり合っているが異なるリガンド配列の特定のセットを認識する能力を持っています。これは、多特異性1,2として知られています。多重特異性認識は多くの細胞タンパク質の特徴ですが、特に酵素や細胞シグナル伝達タンパク質で顕著です3。多重特異性結合部位と相互作用するタンパク質は、多くの場合、その配列に保存された領域と保存されていない領域の組み合わせを持っています4,5,6。このシナリオでは、より保存された配列モチーフがストリンジェントな分子相互作用に関与しています。逆に、より可変的な配列は、受容体結合部位の何らかの許容性の表面と相互作用します。通常、これらの保存性は低いが機能的に関連性のあるセグメントは、明確な二次構造パターンを欠くループであるか、または天然変性タンパク質に典型的なもののように、さらに動的なコンフォメーションを有する7。
結合部位の潜在的なペプチドリガンドの同定は、通常、対応するPPI8を妨害することができるメディエーターの設計における最初のステップである。しかし、多重特異性結合部位のリガンドのほとんどの配列位置で最も頻度の高い単一のアミノ酸残基を見つけることは、しばしば困難です。それどころか、これらの部位は、その化学的性質に応じて特定のクラスのアミノ酸、例えば、アスパラギン酸またはグルタミン酸などの酸性および負に帯電したアミノ酸、フェニルアラニンのようなかさばる芳香族アミノ酸、または脂肪族アミノ酸アラニン、バリン、ロイシンまたはイソロイシン3のようなより疎水性残基に対して特定の選好を有することがある。いくつかの実験的方法により、指向性進化9、マルチコドンスキャン突然変異誘発10、深部突然変異スキャン11など、タンパク質結合部位のアミノ酸選好に関する洞察を得ることができます。これらの方法はすべて、元のリガンドに突然変異を導入し、受容体タンパク質の機能に対するそれらの影響をさらに分析することに基づく配列多様化のアプローチに従っています(包括的なレビューについては、Bratulic and Badran12 を参照)。しかし、これらの方法では、大規模なシーケンスライブラリの調査が必要になることが多く、煩雑で、コストと時間がかかります。
多重特異性結合部位のアミノ酸選好を推測する計算法は、ウェットラボ法の限界を回避する可能性を秘めています。これらの中で、in silico配列多様化アプローチは、PPI13の構造可塑性を特徴付ける方法として、リガンド配列における幅広いアミノ酸置換のエネルギー的影響を評価する。この方法は、受容体結合部位に結合したペプチドリガンドの構造またはモデルから始まり、その後、リガンド配列に変異を導入します。次に、統計関数とエネルギースコアリング関数を使用して、これらの突然変異が安定性と結合親和性に与える影響を評価します。評価フェーズから得られたベストスコアのリガンド配列のセットは、アミノ酸選好を計算するために使用できます。この戦略は、非常に多くのリガンド配列を効率的に処理できる可能性を秘めています。したがって、ウェットラボアプローチで通常処理できるより限られた数の配列から計算されたものと比較して、アミノ酸選好のより完全で一貫した推論を提供できます。
Rosetta molecular modelingsuite 14 のPepspecアプリケーションは、ペプチド設計モードの主要なステップとして配列の多様化を実行するツールです。このアプリケーションには、結合したペプチドが単一のアミノ酸残基までの長さにまで減少する受容体タンパク質の構造またはモデルが必要であり、これは次のステップのアンカーとして使用されます。次いで、結合したペプチドの配列を(必要に応じて)伸長し、多様化して多数の推定ペプチドリガンドを生成する。次に、これらのペプチドの結合親和性をフレキシブルバックボーンペプチドドッキングによって評価し、予測された結合スコアが最も高いペプチドを選択します。このアプリケーションの主な出力は、設計フェーズの終了時に選択された最良のペプチド候補ですが、このフェーズで受け入れられるはるかに大きなペプチドのセットを使用して、ターゲット結合部位のアミノ酸選好を計算することもできます。アミノ酸選好は、リガンド配列の位置ごとの各アミノ酸残基の頻度として計算され、位置ウェイトマトリックス(PWM)またはより視覚的な配列ロゴとして表されます。
この記事では、PPIに関与する受容体タンパク質の結合表面のアミノ酸選好を推定するプロトコールについて説明します。このプロトコルは、タンパク質-リガンドの線形セグメントが受容体タンパク質に結合することが知られているPPIに焦点を当てているため、シナリオをタンパク質-ペプチドインターフェースとしてモデル化できます。このシナリオでは、リガンドから保存されたモチーフは、通常、受容体結合部位の定義されたポケットと相互作用しますが、PPIに関与するリガンドセグメント全体には、保存領域が少ない場合があります。プロトコルの主な手順をまとめたフローチャートを 図 1 に示します。このプロトコールは、タンパク質-タンパク質複合体の3D構造から始まり、さらにリガンドタンパク質を潜在的に最も相互作用するセグメントに還元し、受容体タンパク質を無傷のままにします。最も相互作用するセグメントは、2つの相互作用タンパク質間のホットスポット残基を同定するために計算アラニン走査突然変異誘発を行うBUDEアラニンスキャンサーバー15を使用することによって推論される。このアプローチでは、配位子からの残基を個々にアラニンで置換し、錯体の自由エネルギーまたは安定性(ΔΔG)の推定変化を使用して、対応する残基のターゲットPPIとの関連性を推測します。最も相互作用の大きいセグメントが推測されると、その受容体タンパク質との複合体を塩基構造としてPepspecに提出し、配列の多様化を行います。
図1:この作業で提案されたプロトコルの主なステップの概要。 番号は、プロトコル セクションのステップ番号と一致します。図は、本文に記載されている例として使用したタンパク質-タンパク質複合体を用いて作成しました。この複合体では、受容体と見なされるタンパク質鎖はピンクで示され、リガンドと見なされる鎖は水色で示され、予測される最もよく相互作用するセグメントは赤で強調表示されます。 この図の拡大版を表示するには、ここをクリックしてください。
提案されたプロトコルの限界の1つは、タンパク質-ペプチド界面の分離された構造が必要であることです。プロトコルは、代わりに、標的タンパク質−ペプチド界面のモデルから開始してもよいが、特定のモデリングステップは本明細書では説明されていない。さらに、このプロトコルは任意のオペレーティングシステムを実行しているパーソナルコンピューターで実行できますが、Rosettaアプリケーションに関連する手順にはLinux環境が必要です。また、Pepspecでは通常、反復回数が多いため、シーケンスの多様化ステップにはコンピュータークラスターを強くお勧めします。
提案されたプロトコルの適用は、ヒトインターフェロン調節因子(IRF)ファミリーのメンバーであるIRF5の入札表面のアミノ酸選好の推定で示されています。このタンパク質を例として選んだのは、その活性化中に2つのサブユニットが結合して、その構造が十分に特徴付けられている二量体を形成するためです16。IRF二量体では、結合は、一方のサブユニットが結合表面を提供し、もう一方のサブユニットがpLxISと呼ばれる短い保存されたモチーフを含む領域を介して相互作用するタンパク質-ペプチド界面としてモデル化できます17,18。さらに、IRFサブユニットへの結合は多重特異です。したがって、それらはホモ二量体、ヘテロ二量体、およびコアクチベーターとして知られる他の細胞タンパク質との複合体を形成することができる18。
本論文は、in silico配列の多様化に基づいて、潜在的に多重特異的な結合部位のアミノ酸選好を推定するためのプロトコルについて述べる。タンパク質-ペプチド界面のアミノ酸選好を推定するための計算ツールはほとんど開発されていない14,25,26。これらのツールには予測的な性質がありますが、?…
The authors have nothing to disclose.
Sistema Nacional de Investigación (SNI) (助成金番号 SNI-043-2023 および SNI-170-2021)、Secretaría Nacional de Ciencia, Tecnología e Innovación (SENACYT)、Instituto para la Formación y Aprovechamiento de Recursos Humanos (IFARHU) による財政支援に感謝の意を表します。著者は、原稿を慎重にレビューしてくれたMiguel Rodríguez博士に感謝します。
BUDE Alanine Scan Server | University of Edinburgh | https://pragmaticproteindesign.bio.ed.ac.uk/balas/ | doi: 10.1021/acschembio.9b00560 |
Rosetta Modeling Software | Rosetta Commons | https://www.rosettacommons.org/software | doi: 10.1002/prot.22851 |
UCSF Chimera | University of California San Francisco | https://www.cgl.ucsf.edu/chimera/ | doi: 10.1002/jcc.20084 |