Proteins interact with each other and these interactions determine in a large part their functions. Protein interaction partners can be identified at high-throughput in vivo using a yeast fitness assay based on the dihydrofolate reductase protein-fragment complementation assay (DHFR-PCA).
Proteins are the building blocks, effectors and signal mediators of cellular processes. A protein’s function, regulation and localization often depend on its interactions with other proteins. Here, we describe a protocol for the yeast protein-fragment complementation assay (PCA), a powerful method to detect direct and proximal associations between proteins in living cells. The interaction between two proteins, each fused to a dihydrofolate reductase (DHFR) protein fragment, translates into growth of yeast strains in presence of the drug methotrexate (MTX). Differential fitness, resulting from different amounts of reconstituted DHFR enzyme, can be quantified on high-density colony arrays, allowing to differentiate interacting from non-interacting bait-prey pairs. The high-throughput protocol presented here is performed using a robotic platform that parallelizes mating of bait and prey strains carrying complementary DHFR-fragment fusion proteins and the survival assay on MTX. This protocol allows to systematically test for thousands of protein-protein interactions (PPIs) involving bait proteins of interest and offers several advantages over other PPI detection assays, including the study of proteins expressed from their endogenous promoters without the need for modifying protein localization and for the assembly of complex reporter constructs.
Reti di interazione proteina (PIN) offrono una risoluzione bassa mappa di come le proteine sono funzionalmente organizzati nella cella 1. Ogni connessione fisica tra due proteine, o interazione proteina-proteina (PPI), possono rappresentare un'associazione che è stabile nel tempo, come quelli trovati all'interno complessi proteici e che contribuiscono alla organizzazione strutturale della cellula. Queste connessioni possono anche rappresentare associazioni transitori che regolano l'attività, la stabilità, la localizzazione e le interazioni dei due partner. Identificare i partner di interazione fisica di una certa proteina fornisce quindi ricca informazioni sulla funzione e la regolazione di quella proteina 2,3. Per queste ragioni, grandi sforzi sono stati messi verso la mappatura dei PIN in organismi modello, tra cui Escherichia coli 4-6, Arabidopsis thaliana 7, Saccharomyces cerevisiae 8-12, Drosophila melanogaster </ Em> 13, Caenorhabditis elegans 14 e Homo sapiens 15. Questi studi hanno fornito importanti informazioni come le proteine sono organizzati in cella e informazioni così chiave sulle proteine con funzioni precedentemente sconosciuti.
Diverse strategie sono state sviluppate nel corso degli anni per studiare PIN. Queste tecnologie possono essere sostanzialmente raggruppati in tre categorie a seconda del tipo di informazioni che forniscono sul PPI (rivisto nel 16-18). Il primo si basa su lieviti doppio ibrido e dei suoi derivati 19. Queste tecnologie forniscono informazioni sulla diretta associazione tra coppie di proteine, che permette di costruire reti binari. La seconda famiglia è basata sulla purificazione di affinità delle proteine esca e l'identificazione dei loro partner associati, come la purificazione di affinità seguita da spettrometria di massa 20. Questi approcci identificano gruppi di proteine che sono direttamenteo indirettamente associato, generalmente in modo stabile, e sono estremamente potenti per identificare complessi proteici. Il terzo approccio si basa su saggi di complementazione proteica-frammento (APC) 11,21. Questo approccio fornisce un livello intermedio di risoluzione tra i due approcci precedenti, in quanto permette di rilevare associazioni dirette e prossimale tra proteine. Ogni tecnica ha i suoi punti di forza e di debolezza, come recentemente rivisto 18.
Il PIN eucariotica meglio descritta è di gran lunga quello del lievito Saccharomyces cerevisiae erba, in parte perché la sua proteoma è relativamente meno complessi di quelli di altri eucarioti modello e per saggi high throughput per rilevare IPP sono stati analizzati prima e sono più efficiente implementato in questo organismo modello 9-12. Un metodo particolarmente potente per il sistema lievito è la diidrofolato reduttasi proteina-frammento complementazione assay (DHFR-PCA), un metodo che è statoutilizzato in contesti diversi per studiare il PIN lievito in condizioni standard e perturbate 11,22-26. Questo metodo si basa su un saggio di sopravvivenza che consente il rilevamento di IPP diretti e quasi diretta per una data proteina esca ad entrambi i livelli di espressione endogeni e localizzazioni subcellulari native dei partner di interazione 11,21 in maniera quantitativa 27. Il segnale ottenuto da questo test (cioè dimensioni delle colonie su array colonia alta densità) riflette quindi la quantità di complessi proteici formati tra l'esca e la preda in un ambiente cellulare quasi equivalente a quella delle cellule wild-type. Il saggio si basa sulla ricostituzione di un enzima coinvolto nel metabolismo giornalista folati, la diidrofolato reduttasi (DHFR), in cui due frammenti complementari della DHFR che sono fusi alle due proteine di interesse vengono portati in prossimità quando le due proteine interagiscono, che a sua volta porta alla ricostituzione reversibili dell'attività enzimatica 11 e la crescita del ceppo su un terreno contenente metotrexato (MTX; Figura 1). Questo composto inibisce l'enzima DHFR endogena, ma non quello mutato utilizzato nel test 28. Due raccolte di ceppi PCA, uno contenente ~ 4.300 Mata ceppi con ORF fusa alla DHFR F [1,2] frammento e una contenente ~ 4.800 MAT α ceppi con un ORF fusa alla DHFR [3] frammento, può essere acquistato a implementare DHFR-PCA a scala piccola o grande in qualsiasi laboratorio. Qui, descriviamo un protocollo generale, ma dettagliato per schermo per PPI tra una proteina esca e ~ 4.800 proteine preda da questo test.
Descriviamo un protocollo basato sul dosaggio DHFR-PCA che consentano l'identificazione sistematica delle interattori fisici per ogni proteina esca a high-throughput. Questo protocollo può essere adattato dallo screening altre esche, e questo a qualsiasi livello desiderato di replica. Dimostriamo l'affidabilità di questo protocollo per l'identificazione di partner di interazione fisica per una proteina esca coinvolta nel complesso nucleare Pore: Nup82. La nostra analisi ha permesso di trovare cinque interattori precedentemente segnalati e uno precedentemente non dichiarata Interactiano (Figure 3F e 3G), mettendo in evidenza la capacità del metodo per studiare il interattoma proteine del lievito.
Il protocollo qui descritto comprende diversi passaggi critici in cui lo sperimentatore deve prestare attenzione. Consigliamo a 1) Assicurarsi che il DHFR esca F [1,2] la fusione sia corretta (Figura 1B); ciò può essere ottenuto mediante sequenziamento costruzione e measuring espressione della proteina corretta usando un anti-DHFR F [1,2] o DHFR anti-F [3] anticorpo; 2) Prima di iniziare lo schermo, si consiglia di verificare se qualcuno esca di interesse presenta interazioni promiscue in schermi PCA. Questo può essere fatto eseguendo schermate di controllo con esche incrociate con il controllo L-DHFR appropriato o accoppiando manualmente l'esca con il controllo L-DHFR appropriata ed eseguendo un test crescita MTX medie. 3) Le piastre devono essere versato il giorno prima di essere utilizzate in modo che l'umidità è ottimale per l'adesione delle cellule sulla superficie agar durante il processo di stampa; 4) piastre di origine non dovrebbero essere usati più di quattro volte a trasferire abbastanza cellule sulla piastra di destinazione. Aumentando il numero di copie della piastra di destinazione può essere fatto da fasi successive di espansione (ad esempio 4 copie -> 16 copie -> 64 copie). In alternativa, le cellule possono essere ritirati in posizioni diverse sui prati o nella colonia tra i diversi cicli di replica; 5) Se più positions mancano dopo la selezione diploide (s), assicurarsi che le piastre di origine non sono stati utilizzati troppe volte nella fase di accoppiamento (passi 4,5-4,7); 6) Verificare che il medium MTX contiene tutti gli ingredienti essenziali alle concentrazioni di destra. Infatti, se nessuna crescita a tutti si osserva sul supporto MTX, può essere sia perché nessuna interazione è rilevabile con PCA per le proteine di interesse o perché il mezzo MTX non era preparato correttamente. Per garantire che il mezzo permette la crescita di ceppi che mostrano DHFR frammenti complementazione, un'interazione costitutiva può essere aggiunto in posizioni vuote della raccolta e usata come controllo positivo come DHFR-frammenti fusi a leucina frazioni cerniera 33 (Figura 1C). Test parallelo utilizzando i frammenti linker-DHFR o frammenti cerniera-linker-DHFR permetterà di discriminare tra le condizioni che consentono tutte le cellule di crescere (bassa concentrazione di MTX o proteine esca che tendono a rendere le interazioni falsi positivi, come described sotto) e le condizioni che impediscono la crescita di tutti i ceppi (Concentrazione MTX troppo alto o essenziale mancante nel mezzo); 7) Dato che PCA viene eseguita attraverso cicli successivi di repliche da un mezzo ad un altro, la contaminazione crociata tra ceppi tra piatti diversi si può verificare se, per esempio, la pin-utensile non è sterilizzato correttamente tra un round di replica e / o l'ultima acqua Bagno (station cioè umido) nella procedura di sterilizzazione è contaminato da colonie di precedenti round di replica. Diverse posizioni gli array sono vuoti e possono quindi essere utilizzati come posizioni di comando in cui deve essere osservato nessuna crescita per rilevare contaminazioni crociate.
L'analisi delle immagini può essere eseguita utilizzando diversi software pubblicati (vedi sezione 5 del protocollo) o qualsiasi script personalizzato. In questo studio, lo script personalizzato esegue i seguenti passi: 1) Lo script sottrae i valori dei pixel di un piatto vuoto a Pixel valori di ogni piatto in modo da corRect per illuminazione pregiudizi. 2) Lo script converte ogni immagine di sfondo con correzione per binario utilizzando una soglia di valore di pixel pari a 10. 3) Per ogni 1.536 posizioni di ogni piatto, determinati sovrapponendo un rettangolo sulle colonie bordo, lo script viene eseguito ImageJ "Analizza particelle … Funzione "in una selezione circolare. La selezione circolare è impostata con un raggio pari all'intervallo tra due posizioni meno 10 pixel. 4) Lo script seleziona la particella più vicina dal centro della selezione e conferma come colonia se la sua posizione non è più di metà dell'intervallo tra due colonie di distanza dal centro della selezione. 5) Lo script misura valori dei pixel della particella selezionata sull'immagine sfondo corretta. 6) Per correggere ulteriormente i restanti pregiudizi retroilluminazione, lo script sottrae il valore medio di tutti i pixel dalla selezione circolare che non erano parte di una particella di valori dei pixel della colonia. La somma di questi valori di pixel correttos, memorizzati nella colonna "IntDenBackSub" della tabella complementare 1, sono usati come misura di dimensioni delle colonie.
Un punto critico all'interno della parte analisi è la scelta della soglia di significatività. Qui, abbiamo scelto una soglia basato sulla distribuzione del negativo L-DHFR F [3] controlli, ma a seconda dell'obiettivo dello schermo, tale soglia può essere troppo severe. Infatti, L-DHFR F [3] controlli vengono sovraespressi (promotore forte TEF) tale che i frammenti complementari possono spontaneamente complementari e questi non sono quindi rappresentativi della maggior parte delle proteine di espressione. Ciò è evidenziato dal fatto che la distribuzione della L-DHFR F [3] controlli è superiore alla media della crescita sfondo (Figura 3D). Così, alcune interazioni che hanno punteggi inferiori a questa soglia rigorosa ma che sono chiaramente al di fuori della distribuzione crescita di fondo può essere considerato come colpi presunti che possono rappresentare, per esempio, tra transitoria o deboleazioni. Questi possono essere ulteriormente studiate e cross-validati se, per esempio, le due proteine non sono espressi a livelli che possono consentire la complementazione spontanea dei frammenti DHFR come controlli L-DHFR. In alternativa, si può impostare una soglia di significatività in base alla percentuale di sovrapposizione con Interactiani fisici riportati in database come BIOGRID 35 al fine di massimizzare la percentuale di veri positivi su falsi positivi. Tuttavia, a differenza l'uso della distribuzione L-DHFR, questa alternativa può non essere sempre fattibile se, per esempio, il numero di noti interattori fisici non è sufficientemente elevato. Inoltre, la scelta della soglia di significatività ha un impatto sulla percentuale di falsi positivi e falsi negativi nel set di dati finale. Infatti, come qualsiasi altro test PPI rilevamento, falsi positivi possono derivare da interazione aspecifica di una proteina con la proteina di fusione DHFR-se, per esempio, la proteina è altamente abbondante come accennato in precedenza. Questoè esemplificato dal fatto che alcuni prede interagiscono sistematicamente con tutte le proteine esca in schermi PCA e, quindi, devono essere rimossi dall'analisi 11 (es Tef2 e Ade17 e Tabella integrativa 2). Per aggirare questo problema, una schermata di controllo PCA delle due collezioni contro il controllo L-DHFR appropriata (F [1,2] o F [3]) per identificare esche e prede espositrici spontanea DHFR frammenta complementazione può essere eseguita in condizioni specifiche di ogni schermata. Inoltre, l'esecuzione di un'analisi arricchimento Gene Ontology può aumentare la fiducia nei dati se la funzione di un determinato esca è noto. D'altra parte, DHFR-PCA può dar luogo a falsi negativi per diverse ragioni: 1) non tutte le proteine possono essere fuse ai frammenti DHFR quanto potrebbero destabilizzare proteine o modificare la loro localizzazione se, per esempio, la fusione della DHFR C-terminale interferisce con un segnale di localizzazione; 2) la ricostituzione DHFR in alcuni compartimenti cellulari may non producono folato se, per esempio, un elemento indispensabile per la sintesi folato non è disponibile; 3) C-termini necessità di essere all'interno di una distanza di 8 nm per DHFR complementazione si verifichi 11. Pertanto, un'interazione noto potrebbe non essere rilevato se la loro C-terminali non sono abbastanza vicino nello spazio. Questo è esemplificato qui dal fatto che una grande frazione di interazioni fisiche Nup82 riportati in banche dati, la maggior parte dei quali sono indiretto, non sono stati rilevati nel nostro test. Analogamente, le interazioni tra le proteine di membrana per cui il C-termini sono in trans rispetto alla membrana non comporteranno DHFR frammenta complementazione e non sarà rilevato 11. Limitazioni 1) e 3) può essere aggirato relativamente semplice fondendo il frammento DHFR alla N-terminali della proteina. Ciò potrebbe evitare di interferire con un segnale di localizzazione vicino al C-termini e può consentire di individuare una interazione tra le proteine di membrana la cui N e C-terminale sono in relativa cisalla membrana.
Diverse sfide rimangono nello studio di PIN (rivisto in 2,3). Le mappe di PIN prodotte finora sono stati ampiamente descritti in un'unica condizione sperimentale per ogni specie e quindi offrire una singola istantanea di come potrebbero essere organizzate reti di proteine. Vi è quindi una necessità per l'esplorazione di altre condizioni sperimentali per vedere come PIN possono essere riorganizzati in risposta ai cambiamenti ambientali, stimoli specifici, attraverso lo sviluppo o seguenti mutazioni. Queste sfide saranno superate dallo sviluppo di nuove tecnologie per interrogare IPP in tempo reale, in cellule viventi e adattando attuali tecniche in modo che possano essere utilizzati da un grande comunità di laboratori. Come una tecnica quantitativa in grado di rilevare i cambiamenti nella quantità di DHFR complementazione complessi 27, DHFR-PCA può essere adattato per superare queste sfide ed è stato utilizzato per studiare come i PPI sono interessate da un DNA agente 22 danni </sup>, agenti chimici 25, delezioni geniche 23,26 o in altre specie di lievito e loro ibridi 33. Exploring queste nuove dimensioni diventerà sempre più importante per rivelare la dinamica del PIN.
The authors have nothing to disclose.
Questo lavoro è stato sostenuto dal Canadian Institute of Health Research (CIHR) concede 191.597, 299.432 e 324.265, a scienze naturali e ingegneria Research Council del Canada Discovery concessione e un finanziamento Human Frontier Science Program al CRL. CRL è un CIHR Nuova Investigator. Guillaume Diss è sostenuto da una borsa di studio PROTEO. Samuel Rochette è supportato da NSERC e FRQNT borse.
Name of Material/Equipement | Company | Catalog Number | Comments/Description |
BioMatrix Robot, Bench-top Configuration | S&P Robotics Inc. | BM5-BC | |
96-format Pin-tool | S&P Robotics Inc. | PH-96-10 | Standard 96-format Pin-tool with 96 high-precision floating pins |
384-format Pin-tool | S&P Robotics Inc. | PH-384-10 | Standard 384-format Pin-tool with 384 high-precision floating pins |
1536-format Pin-tool | S&P Robotics Inc. | PH-1536-05 | Custom 1536-format Pin-tool with 0.5mm high-precision floating pins |
Automated imaging module | S&P Robotics Inc. | IMG-02 | |
Methotrexate | Bioshop Canada Inc. | MTX440 | CAUTION: toxic compound |
Hygromycin B | Bioshop Canada Inc. | HYG003 | |
Nourseothricin dihydrogen sulfate | Werner BioAgents | 5010000 | |
Yeast-Interactome Collection | Thermo Scientific | YSC5849 | |
Omni Tray w/lid sterile | Thermo Scientific | 242811 | |
Anti-DHFR F[1,2] antibody | Sigma-Aldrich | D1067 | |
Anti-DHFR F[3] antibody | Sigma-Aldrich | D0942 |