Summary

Computergestützte Vorhersage der Aminosäurepräferenzen potenziell multispezifischer Peptidbindungsdomänen, die an Protein-Protein-Wechselwirkungen beteiligt sind

Published: January 26, 2024
doi:

Summary

Wir beschreiben eine auf Sequenzdiversifikation basierende Methodik zur Abschätzung der Aminosäurepräferenzen multispezifischer Bindungsstellen in Protein-Protein-Wechselwirkungen (PPIs). Bei dieser Strategie werden Tausende von potentiellen Peptidliganden erzeugt und in silico gescreent, wodurch einige Einschränkungen der verfügbaren experimentellen Methoden überwunden werden.

Abstract

Viele Protein-Protein-Wechselwirkungen beinhalten die Bindung kurzer Proteinsegmente an Peptidbindungsdomänen. In der Regel erfordern solche Wechselwirkungen das Erkennen linearer Motive mit variabler Konservierung. Die Kombination von hochkonservierten und variableren Regionen in denselben Liganden trägt oft zur Multispezifität der Bindung bei, eine gemeinsame Eigenschaft von Enzymen und zellulären Signalproteinen. Die Charakterisierung der Aminosäurepräferenzen von Peptidbindungsdomänen ist wichtig für das Design von Mediatoren von Protein-Protein-Wechselwirkungen (PPIs). Computergestützte Methoden sind eine effiziente Alternative zu den oft kostspieligen und umständlichen experimentellen Techniken und ermöglichen das Design potenzieller Mediatoren, die später in nachgelagerten Experimenten validiert werden können. In dieser Arbeit haben wir eine Methodik beschrieben, die die Pepspec-Anwendung des molekularen Modellierungspakets von Rosetta verwendet, um die Aminosäurepräferenzen von Peptidbindungsdomänen vorherzusagen. Diese Methode ist nützlich, wenn sowohl die Struktur des Rezeptorproteins als auch die Art des Peptidliganden bekannt sind oder abgeleitet werden können. Die Methodik beginnt mit einem gut charakterisierten Anker aus dem Liganden, der durch zufällige Zugabe von Aminosäureresten erweitert wird. Die Bindungsaffinität der auf diese Weise erzeugten Peptide wird dann durch flexibles Rückgrat-Peptid-Docking bewertet, um die Peptide mit den besten vorhergesagten Bindungswerten auszuwählen. Diese Peptide werden dann zur Berechnung von Aminosäurepräferenzen und optional zur Berechnung einer Positionsgewichtsmatrix (PWM) verwendet, die in weiteren Studien verwendet werden kann. Um die Anwendung dieser Methodik zu veranschaulichen, verwendeten wir die Interaktion zwischen Untereinheiten des humanen Interferon-Regulationsfaktors 5 (IRF5), von dem bisher bekannt war, dass er multispezifisch ist, aber global von einem kurzen konservierten Motiv namens pLxIS geleitet wird. Die geschätzten Aminosäurepräferenzen stimmten mit den bisherigen Erkenntnissen über die IRF5-Bindungsoberfläche überein. Positionen, die von phosphorylierbaren Serinresten eingenommen wurden, wiesen eine hohe Häufigkeit von Aspartat und Glutamat auf, wahrscheinlich weil ihre negativ geladenen Seitenketten denen von Phosphoserin ähneln.

Introduction

Die Interaktion zwischen zwei Proteinen beinhaltet oft die Bindung kurzer Segmente von Aminosäuren an Peptid-Bindungsdomänen, die Protein-Peptid-Grenzflächen ähneln. Rezeptorproteine, die an solchen Protein-Protein-Wechselwirkungen (PPI) beteiligt sind, haben oft die Fähigkeit, einen bestimmten Satz überlappender, aber divergierender Ligandensequenzen zu erkennen, eine Eigenschaft, die als Multispezifität bekannt ist 1,2. Die multispezifische Erkennung ist ein Merkmal vieler zellulärer Proteine, aber besonders bemerkenswert ist sie bei Enzymen und zellulären Signalproteinen3. Proteine, die mit multispezifischen Bindungsstellen interagieren, haben oft eine Kombination aus mehr und weniger konservierten Regionen in ihrer Sequenz 4,5,6. In diesem Szenario sind die stärker konservierten Sequenzmotive an stringenten molekularen Wechselwirkungen beteiligt. Umgekehrt interagieren die variableren Sequenzen mit irgendwie permissiven Oberflächen in der Rezeptorbindungsstelle. In der Regel handelt es sich bei diesen weniger konservierten, aber immer noch funktionell relevanten Segmenten um Schleifen ohne definierte Sekundärstrukturmuster oder um noch dynamischere Konformationen, wie sie für intrinsisch ungeordnete Proteine typisch sind7.

Die Identifizierung potenzieller Peptidliganden von Bindungsstellen ist in der Regel der erste Schritt bei der Entwicklung von Mediatoren, die in der Lage sind, die entsprechenden PPIs zu interferieren8. Es ist jedoch oft unwahrscheinlich, einen einzigen der häufigsten Aminosäurereste an den meisten Sequenzpositionen in Liganden multispezifischer Bindungsstellen zu finden. Stattdessen können diese Stellen besondere Präferenzen für eine bestimmte Klasse von Aminosäuren entsprechend ihren chemischen Eigenschaften haben, z. B. saure und negativ geladene Aminosäuren wie Aspartat oder Glutamat, sperrige aromatische Aminosäuren wie Phenylalanin oder mehr hydrophobe Reste wie aliphatische Aminosäuren Alanin, Valin, Leucin oder Isoleucin3. Verschiedene experimentelle Methoden können Einblicke in die Aminosäurepräferenzen von Proteinbindungsstellen liefern, darunter die gerichtete Evolution9, die Multicodon-Scanning-Mutagenese10 und die tiefeMutations-Scanning 11. Alle diese Methoden folgen dem Ansatz der Sequenzdiversifizierung, der darauf basiert, Mutationen in ursprüngliche Liganden einzuführen und deren Wirkung auf die Funktion des Rezeptorproteins weiter zu analysieren (siehe Bratulic und Badran12 für eine umfassende Übersicht). Diese Methoden erfordern jedoch oft die Durchsicht großer Sequenzbibliotheken, was sie umständlicher, kostspieliger und zeitaufwändiger macht.

Computergestützte Methoden zur Ableitung der Aminosäurepräferenzen multispezifischer Bindungsstellen haben das Potenzial, die Einschränkungen von Nasslabormethoden zu umgehen. Unter diesen bewertet der In-silico-Sequenzdiversifikationsansatz den energetischen Einfluss einer Vielzahl von Aminosäureersatzstoffen in der Ligandensequenz, um die strukturelle Plastizität des PPI13 zu charakterisieren. Diese Methode beginnt mit der Struktur oder dem Modell des Peptidliganden, der an die Rezeptorbindungsstelle gebunden ist, und führt anschließend Mutationen in die Ligandensequenz ein. Statistische und Energie-Scoring-Funktionen werden dann verwendet, um den Einfluss dieser Mutationen auf die Stabilität und Bindungsaffinität zu bewerten. Der Satz der Ligandensequenzen mit der besten Punktzahl, der sich aus der Evaluierungsphase ergibt, kann dann zur Berechnung der Aminosäurepräferenzen verwendet werden. Diese Strategie hat das Potenzial, eine sehr große Anzahl von Ligandensequenzen effizient zu verarbeiten. Daher kann es eine vollständigere und konsistentere Rückschluss auf die Aminosäurepräferenzen liefern, verglichen mit denen, die aus der begrenzteren Anzahl von Sequenzen berechnet werden, die normalerweise in Nasslaboransätzen verarbeitet werden können.

Die Pepspec-Anwendung der Rosetta Molecular Modeling Suite14 ist ein Werkzeug, das die Sequenzdiversifizierung als wichtigen Schritt seines Peptiddesignmodus durchführt. Diese Anwendung erfordert eine Struktur oder ein Modell des Rezeptorproteins mit einem gebundenen Peptid bis zu einem einzigen Aminosäurerest in der Länge, das als Anker für die nächsten Schritte verwendet wird. Die Sequenz des gebundenen Peptids wird dann (falls erforderlich) verlängert und diversifiziert, um eine große Anzahl von mutmaßlichen Peptidliganden zu erzeugen. Die Bindungsaffinität dieser Peptide wird dann durch Peptid-Docking mit flexiblem Rückgrat bewertet, um diejenigen mit den besten vorhergesagten Bindungswerten auszuwählen. Obwohl das Hauptergebnis dieser Anwendung die besten Peptidkandidaten sind, die am Ende der Designphase ausgewählt werden, kann die viel größere Menge von Peptiden, die in dieser Phase akzeptiert werden, auch zur Berechnung der Aminosäurepräferenzen der Zielbindungsstelle verwendet werden. Aminosäurepräferenzen werden als Häufigkeit jedes Aminosäurerests pro Position der Ligandensequenz berechnet, die entweder als Positionsgewichtsmatrix (PWM) oder als visuelleres Sequenzlogo dargestellt wird.

In diesem Artikel beschreiben wir ein Protokoll zur Abschätzung der Aminosäurepräferenzen der Bindungsoberfläche eines Rezeptorproteins, das an einem PPI beteiligt ist. Das Protokoll konzentriert sich auf PPIs, bei denen bekannt ist, dass ein lineares Segment des Protein-Liganden an das Rezeptorprotein bindet, so dass das Szenario als Protein-Peptid-Schnittstelle modelliert werden kann. In diesem Szenario interagieren konservierte Motive aus dem Liganden typischerweise mit definierten Taschen in der Rezeptorbindungsstelle, obwohl das gesamte Ligandensegment, das an der PPI beteiligt ist, weniger konservierte Regionen enthalten kann. Ein Flussdiagramm, das die wichtigsten Schritte des Protokolls zusammenfasst, ist in Abbildung 1 dargestellt. Das Protokoll beginnt mit der 3D-Struktur des Protein-Protein-Komplexes und reduziert das Ligandenprotein weiter auf das potenziell am besten interagierende Segment, wobei das Rezeptorprotein intakt bleibt. Das am besten interagierende Segment wird unter Verwendung des BUDE Alanin-Scan-Servers15 abgeleitet, der eine rechnergestützte Alanin-Scanning-Mutagenese durchführt, um Hot-Spot-Reste zwischen den beiden interagierenden Proteinen zu identifizieren. Bei diesem Ansatz werden Reste aus dem Liganden einzeln durch Alanin ersetzt, und die geschätzte Änderung der freien Energie oder Stabilität des Komplexes (ΔΔG) wird dann verwendet, um auf die Relevanz des entsprechenden Rests für den Ziel-PPI zu schließen. Sobald das am besten interagierende Segment abgeleitet ist, wird sein Komplex mit dem Rezeptorprotein als Basisstruktur verwendet, die an Pepspec übermittelt wird, um eine Sequenzdiversifizierung durchzuführen.

Figure 1
Abbildung 1: Überblick über die wichtigsten Schritte des Protokolls, das in dieser Arbeit vorgeschlagen wird. Die Nummern stimmen mit den Schrittnummern im Protokollabschnitt überein. Die Abbildungen wurden mit dem Protein-Protein-Komplex erstellt, der als Beispiel für das im Text beschriebene Beispiel verwendet wird. In diesem Komplex ist die Proteinkette, die als Rezeptor betrachtet wird, rosa dargestellt, während die Kette, die als Ligand betrachtet wird, in hellblau dargestellt ist, wobei ihr vorhergesagtes Segment mit der besten Wechselwirkung rot hervorgehoben ist. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Eine der Einschränkungen des vorgeschlagenen Protokolls ist die Anforderung einer aufgelösten Struktur der Protein-Peptid-Grenzfläche. Das Protokoll kann alternativ mit einem Modell der Zielprotein-Peptid-Grenzfläche beginnen, obwohl die spezifischen Modellierungsschritte hier nicht beschrieben werden. Obwohl das Protokoll auf einem PC mit einem beliebigen Betriebssystem ausgeführt werden kann, ist für die Schritte mit den Rosetta-Anwendungen eine Linux-Umgebung erforderlich. Ein Computercluster wird auch für den Schritt der Sequenzdiversifizierung dringend empfohlen, da Pepspec typischerweise eine große Anzahl von Iterationen durchführt.

Die Anwendung des vorgeschlagenen Protokolls wird durch die Schätzung der Aminosäurepräferenzen der Gebotsfläche von IRF5, einem Mitglied der Familie der humanen Interferon-Regulationsfaktoren (IRF), veranschaulicht. Wir haben dieses Protein als Beispiel gewählt, weil sich während seiner Aktivierung zwei Untereinheiten zu einem Dimer verbinden, dessen Struktur gut charakterisiert ist16. In IRF-Dimeren kann die Bindung als Protein-Peptid-Grenzfläche modelliert werden, bei der eine Untereinheit die Bindungsoberfläche bildet und die andere durch eine Region interagiert, die ein kurzes konserviertes Motiv namens pLxIS17,18 enthält. Darüber hinaus ist die Bindung an IRF-Untereinheiten multispezifisch; Daher können sie Homodimere, Heterodimere und Komplexe mit anderen zellulären Proteinen bilden, die als Koaktivatoren bekannt sind18.

Protocol

1. Erste Vorbereitung der Protein-Peptid-Grenzfläche Herunterladen der Struktur des Protein-Protein-KomplexesNavigieren Sie zur Homepage der Protein Data Bank (PDB) (https://www.rcsb.org/) und geben Sie die PDB-ID für die Struktur des Protein-Protein-Komplexes in das Hauptsuchfeld ein (Abbildung 2A). Die PDB-ID für die Struktur des IRF5-Dimers, die in dieser Arbeit als Beispiel verwendet wird, ist 3DSH1…

Representative Results

In diesem Artikel haben wir ein Protokoll zur Vorhersage der Aminosäurepräferenzen der Bindungsoberfläche von IRF5 beschrieben, einem Mitglied einer Familie von Transkriptionsfaktoren, die als humane Interferon-Regulationsfaktoren bekannt sind. Diese Proteine sind Regulatoren der angeborenen und adaptiven Immunantwort und beteiligen sich an der Differenzierung und Aktivierung mehrerer Immunzellen. IRF-Untereinheiten weisen hochplastische und multispezifische Bindungsoberflächen auf u…

Discussion

Der vorliegende Artikel beschreibt ein Protokoll zur Abschätzung der Aminosäurepräferenzen potentiell multispezifischer Bindungsstellen auf der Grundlage einer in silico Sequenzdiversifikation. Es wurden nur wenige computergestützte Werkzeuge entwickelt, um die Aminosäurepräferenzen von Protein-Peptid-Grenzflächen abzuschätzen 14,25,26. Diese Tools haben einen prädiktiven Charakter, unt…

Offenlegungen

The authors have nothing to disclose.

Acknowledgements

Die finanzielle Unterstützung durch das Sistema Nacional de Investigación (SNI) (Förderkennzeichen SNI-043-2023 und SNI-170-2021), die Secretaría Nacional de Ciencia, die Tecnología e Innovación (SENACYT) von Panama und das Instituto para la Formación y Aprovechamiento de Recursos Humanos (IFARHU) werden dankbar gewürdigt. Die Autoren danken Dr. Miguel Rodríguez für die sorgfältige Durchsicht des Manuskripts.

Materials

BUDE Alanine Scan Server University of Edinburgh https://pragmaticproteindesign.bio.ed.ac.uk/balas/ doi: 10.1021/acschembio.9b00560
Rosetta Modeling Software Rosetta Commons https://www.rosettacommons.org/software doi: 10.1002/prot.22851
UCSF Chimera University of California San Francisco https://www.cgl.ucsf.edu/chimera/ doi: 10.1002/jcc.20084

Referenzen

  1. Kim, P. M., Lu, L. J., Xia, Y., Gerstein, M. B. Relating three-dimensional structures to protein networks provides evolutionary insights. Science. 314 (5807), 1938-1941 (2006).
  2. Schreiber, G., Keating, A. E. Protein binding specificity versus promiscuity. Current Opinion in Structural Biology. 21 (1), 50-61 (2011).
  3. Erijman, A., Aizner, Y., Shifman, J. M. Multispecific recognition: Mechanism, evolution, and design. Biochemie. 50 (5), 602-611 (2011).
  4. Fromer, M., Shifman, J. M. Tradeoff between stability and multispecificity in the design of promiscuous proteins. PLoS Computational Biology. 5 (12), e1000627 (2009).
  5. Xie, T., Zmyslowski, A. M., Zhang, Y., Radhakrishnan, I. Structural basis for multispecificity of MRG domains. Structure. 23 (6), 1049-1057 (2015).
  6. Hendler, A., et al. Human SIRT1 multispecificity is modulated by active-site vicinity substitutions during natural evolution. Molecular Biology and Evolution. 38 (2), 545-556 (2021).
  7. Teilum, K., Olsen, J. G., Kragelund, B. B. On the specificity of protein-protein interactions in the context of disorder. The Biochemical Journal. 478 (11), 2035-2050 (2021).
  8. Pelay-Gimeno, M., Glas, A., Koch, O., Grossmann, T. N. Structure-based design of inhibitors of protein-protein interactions: Mimicking peptide binding epitopes. Angewandte Chemie (International ed. in English). 54 (31), 8896-8927 (2015).
  9. Wang, Y., Xue, P., Cao, M., Yu, T., Lane, S. T., Zhao, H. Directed evolution: Methodologies and applications. Chemical Reviews. 121 (20), 12384-12444 (2021).
  10. Liu, J., Cropp, T. A. Rational protein sequence diversification by multi-codon scanning mutagenesis. Methods in Molecular Biology. 978, 217-228 (2013).
  11. Wei, H., Li, X. Deep mutational scanning: A versatile tool in systematically mapping genotypes to phenotypes. Frontiers in Genetics. 14, 1087267 (2023).
  12. Bratulic, S., Badran, A. H. Modern methods for laboratory diversification of biomolecules. Current Opinion in Chemical Biology. 41, 50-60 (2017).
  13. Humphris, E. L., Kortemme, T. Prediction of protein-protein interface sequence diversity using flexible backbone computational protein design. Structure. 16 (12), 1777-1788 (2008).
  14. King, C. A., Bradley, P. Structure-based prediction of protein-peptide specificity in Rosetta. Proteins. 78 (16), 3437-3449 (2010).
  15. Ibarra, A. A., et al. Predicting and experimentally validating hot-spot residues at protein-protein interfaces. ACS Chemical Biology. 14 (10), 2252-2263 (2019).
  16. Chen, W., Srinath, H., Lam, S. S., Schiffer, C. A., Royer, W. E., Lin, K. Contribution of Ser386 and Ser396 to activation of interferon regulatory factor 3. Journal of Molecular Biology. 379 (2), 251-260 (2008).
  17. Mancino, A., Natoli, G. Specificity and function of IRF family transcription factors: Insights from genomics. Journal of Interferon & Cytokine Research. 36 (7), 462-469 (2016).
  18. Schwanke, H., Stempel, M., Brinkmann, M. M. Of keeping and tipping the balance: Host regulation and viral modulation of IRF3-dependent IFNB1 expression. Viruses. 12 (7), 33 (2020).
  19. Chen, W., et al. Insights into interferon regulatory factor activation from the crystal structure of dimeric IRF5. Nature Structural & Molecular Biology. 15 (11), 1213-1220 (2008).
  20. Pettersen, E. F., et al. UCSF Chimera-A visualization system for exploratory research and analysis. Journal of Computational Chemistry. 25, 1605-1612 (2004).
  21. Crooks, G. E., Hon, G., Chandonia, J. -. M., Brenner, S. E. WebLogo: a sequence logo generator. Genome Research. 14 (6), 1188-1190 (2004).
  22. Panne, D., McWhirter, S. M., Maniatis, T., Harrison, S. C. Interferon regulatory factor 3 is regulated by a dual phosphorylation-dependent switch. The Journal of Biological Chemistry. 282 (31), 22816-22822 (2007).
  23. Weihrauch, D., et al. An IRF5 decoy peptide reduces myocardial inflammation and fibrosis and improves endothelial cell function in tight-skin mice. PloS One. 11 (4), e0151999 (2016).
  24. Mori, M., Yoneyama, M., Ito, T., Takahashi, K., Inagaki, F., Fujita, T. Identification of Ser-386 of interferon regulatory factor 3 as critical target for inducible phosphorylation that determines activation. The Journal of Biological Chemistry. 279 (11), 9698-9702 (2004).
  25. Smith, C. A., Kortemme, T. Predicting the tolerated sequences for proteins and protein interfaces using RosettaBackrub flexible backbone design. PloS One. 6 (7), e20451 (2011).
  26. Rubenstein, A. B., Pethe, M. A., Khare, S. D. MFPred: Rapid and accurate prediction of protein-peptide recognition multispecificity using self-consistent mean field theory. PLoS Computational Biology. 13 (6), e1005614 (2017).

Play Video

Diesen Artikel zitieren
Cruz, H., Llanes, A., Fernández, P. L. Computational Prediction of Amino Acid Preferences of Potentially Multispecific Peptide-Binding Domains Involved in Protein-Protein Interactions. J. Vis. Exp. (203), e66314, doi:10.3791/66314 (2024).

View Video