Ce manuscrit décrit une approche de dépistage à l’échelle du génome basée sur les cellules pour identifier les interactions extracellulaires de récepteur-ligand.
La communication intercellulaire médiée par des interactions directes entre les récepteurs de surface des cellules intégrées par la membrane est cruciale pour le développement normal et le fonctionnement des organismes multicellulaires. La détection de ces interactions reste toutefois techniquement difficile. Ce manuscrit décrit une approche systématique de dépistage génétique CRISPR/Cas9 à l’échelle du génome qui révèle les voies cellulaires requises pour des événements spécifiques de reconnaissance de surface cellulaire. Cet essai utilise des protéines recombinantes produites dans un système d’expression protéique des mammifères comme sondes de liaison avides pour identifier les partenaires d’interaction dans un écran génétique à base de cellules. Cette méthode peut être utilisée pour identifier les gènes nécessaires aux interactions de surface cellulaire détectées par des sondes liants recombinantes correspondant aux ectodomains des récepteurs membranaires. Fait important, étant donné la nature à l’échelle du génome de cette approche, il a également l’avantage non seulement d’identifier le récepteur direct, mais aussi les composants cellulaires qui sont nécessaires pour la présentation du récepteur à la surface cellulaire, fournissant ainsi des informations précieuses sur la biologie du récepteur.
Les interactions extracellulaires par les protéines des récepteurs de surface cellulaire dirigent des processus biologiques importants tels que l’organisation des tissus, la reconnaissance hôte-pathogène et la régulation immunitaire. L’étude de ces interactions est d’intérêt pour l’ensemble de la communauté biomédicale, parce que les récepteurs membranaires sont des cibles exploitables de thérapeutiques systématiquement livrés tels que les anticorps monoclonaux. Malgré leur importance, l’étude de ces interactions reste techniquement difficile. C’est principalement parce que les récepteurs membranés sont amphipathiques, ce qui les rend difficiles à isoler des membranes biologiques pour la manipulation biochimique, et leurs interactions sont caractérisées par les affinités d’interaction faibles (KDs dans la gamme M-mM)1. Par conséquent, de nombreuses méthodes couramment utilisées ne sont pas adaptées pour détecter cette classe d’interactions protéiques1,2.
Une gamme de méthodes a été développée pour étudier spécifiquement les interactions extracellulaires de récepteur-ligand qui prennent leurs propriétés biochimiques uniques en considération3. Un certain nombre de ces approches consistent à exprimer l’ectodomain entier d’un récepteur comme protéine recombinante soluble dans les systèmes à base de mammifères ou d’insectes à base de cellules pour s’assurer que ces protéines contiennent des modifications posttranslationnelles qui sont structurellement importantes, telles que les glycanes et les liens de disulfide. Pour surmonter la liaison de faible affinité, les ectodomains sont souvent oligomés pour augmenter leur avidité liante. Les ectodomains de protéine avide ont été utilisés avec succès comme sondes contraignantes pour identifier les partenaires d’interaction dans les écrans d’interaction protéine-protéine recombinants directs4,5,6,7. Bien que largement réussies, les méthodes recombinantes à base de protéines exigent que l’ectodomain d’un récepteur membranaire soit produit comme protéine soluble. Par conséquent, il ne s’applique généralement qu’aux protéines qui contiennent une région extracellulaire contigue (p. ex., le type I, le type II ou l’IPG) et ne convient généralement pas aux complexes de récepteurs et aux protéines membranaires qui couvrent la membrane plusieurs fois.
Les techniques de clonage d’expression dans lesquelles une bibliothèque de DNA complémentaires (ACS) est transposée en cellules et testées pour un phénotype de gain-of-binding ont également été employées pour identifier les interactions extracellulaires protéine-protéine8. La disponibilité de grandes collections de plasmides d’expression cDNA clonés et séquencés ces dernières années a facilité les méthodes dans lesquelles les lignées cellulaires surexprimant les CDNA codant les récepteurs de surface cellulaire sont examinés pour la liaison des protéines recombinantes pour identifier les interactions9,10. Les approches basées sur la cDNA, contrairement aux méthodes recombinantes à base de protéines, offrent la possibilité d’identifier les interactions dans le contexte de la membrane plasmatique. Cependant, le succès de l’utilisation des constructions d’expression cDNA dépend de la capacité des cellules à surexprimer la protéine sous la forme correctement pliée, mais cela nécessite souvent des facteurs d’accessoires cellulaires tels que les transporteurs, les chaperons, et l’assemblage oligomeric correct. Transfecter une seule CDNA pourrait donc ne pas suffire à obtenir l’expression de la surface cellulaire.
Les techniques de criblage à l’aide de constructions d’ADN ou de sondes de protéines recombinantes exigent de grandes collections de bibliothèques de protéines cDNA ou recombinantes. Des méthodes basées sur la spectrométrie de masse spécialement conçues ont été utilisées récemment pour identifier les interactions extracellulaires qui ne nécessitent pas l’assemblage de grandes bibliothèques. Cependant, ces techniques nécessitent une manipulation chimique de la surface cellulaire, qui peut modifier la nature biochimique des molécules présentes à la surface des cellules et ne sont actuellement applicables que pour les interactions négociées par des protéines glycosylated11,12. La majorité des méthodes actuellement disponibles se concentrent également fortement sur les interactions entre les protéines tout en ignorant largement la contribution du microenvironnement membranaire, y compris des molécules telles que les glycanes, les lipides et le cholestérol.
Le développement récent d’un ciblage bialléléique très efficace à l’aide d’approches basées sur CRISPR a permis aux bibliothèques à l’échelle du génome de cellules dépourvues de gènes définis dans un seul bassin qui peut être examiné de manière systématique et impartiale pour identifier les composants cellulaires impliqués dans différents contextes, y compris la dissection des processus de signalisation cellulaire, l’identification des perturbations qui confèrent une résistance aux médicaments, toxines et agents pathogènes, et la détermination de la spécificité des anticorps13,14,15,16. Ici, nous décrivons un essai de dépistage par KO à l’échelle du génome à base de CRISPR qui offre une alternative aux approches biochimiques actuelles pour identifier les interactions extracellulaires de récepteur-ligand. Cette approche d’identification des interactions négociées par les récepteurs membranaires par des écrans génétiques est particulièrement adaptée aux chercheurs qui ont un intérêt ciblé sur les ligands individuels, car il évite la nécessité de compiler de grandes bibliothèques de cDNA ou de protéines recombinantes.
Cet essai se compose de trois étapes majeures : 1) Des sondes de liaison de protéine recombinantes très avides composées des régions extracellulaires d’un récepteur d’intérêt sont produites et utilisées dans les essais de liaison à base de cytométrie de débit à base de fluorescence ; 2) Les essais de liaison sont employés pour identifier une ligne cellulaire qui exprime le partenaire d’interaction de la sonde de protéine recombinante ; 3) Une version Cas9-exprimant de la lignée cellulaire qui interagit avec la protéine d’intérêt est produite et un écran à élimination directe à l’échelle du génome CRISPR/Cas9 est effectué(figure 1). Dans cet écran génétique, la liaison d’une protéine recombinante aux lignées cellulaires est utilisée comme phénotype mesurable dans lequel les cellules de la bibliothèque knock-out qui ont perdu la capacité de lier la sonde sont triées à l’aide de tri cellulaire activé à base de fluorescence (FACS) et les gènes qui ont causé la perte du phénotype de liaison identifié par le séquençage. En principe, les gènes codant le récepteur responsable de la liaison de la sonde avide et ceux requis pour son affichage de surface cellulaire sont identifiés.
La première étape de ce protocole implique la production de sondes de protéines recombinantes avides représentant l’ectodomain des récepteurs liés à la membrane. Ces récepteurs sont connus pour conserver fréquemment leurs fonctions de liaison extracellulaire lorsque leurs ectodomains sont exprimés comme une protéine soluble recombinante1. Pour une protéine d’intérêt, les protéines recombinantes solubles peuvent être produites dans n’importe quel système approprié d’expression des protéines eucaryotes dans n’importe quel format à condition qu’il puisse être oligoméized pour une avidité contraignante accrue, et il contient des étiquettes qui peuvent être utilisées dans les essais de liaison à base de cytométrie de flux à base de fluorescence (par exemple, FLAG-tag, biotin-tag). Des protocoles détaillés pour la production d’ectodomains solubles de récepteurs membranaires utilisant le système d’expression protéique HEK293, ainsi que différentes techniques de multimerisation et les constructions d’expression protéinées pour la production de protéines pentamériques et de protéines monomériques ont été précédemment décrites1,17. Le protocole ici décrira les étapes pour générer des sondes fluorescentes avides à partir de protéines biotinylated monomériques en les conjuguant à la streptavidin conjuguée à un fluorochrome (par exemple, la phycoerythrine, ou PE), qui peut être utilisé directement dans les essais de liaison à base de cellules et a l’avantage de ne pas avoir besoin d’un anticorps secondaire pour la détection. Les protocoles généraux pour l’exécution des écrans à l’échelle du génome ont déjà été décrits20,21, de ce fait, le protocole se concentre principalement sur les spécificités de l’exécution des écrans de liaison de protéines recombinantes à base de cytométrie d’écoulement à l’aide du système de dépistage à élimination directe CRISPR/Cas9 à l’aide de la bibliothèque human V1 (« Yusa »)18.
Une stratégie de dépistage basée sur CRISPR pour identifier les gènes codant des composants cellulaires impliqués dans la reconnaissance cellulaire est décrite. Une approche similaire utilisant l’activation CRISPR fournit également une alternative génétique pour identifier les récepteurs directement interagissant des protéines recombinantes sans avoir besoin de générer de grandes bibliothèques de protéines26. Cependant, un avantage majeur de cette approche est qu’elle s’applique aux interactions négociées par des molécules de surface affichées localement sur la cellule et ne dépend pas de la surexpression des récepteurs, ce qui peut influencer l’avidité contraignante du récepteur. Contrairement à d’autres méthodes, cette technique ne fait donc aucune hypothèse concernant la nature biochimique ou la biologie cellulaire des récepteurs et offre l’occasion d’étudier les interactions médiatisées par des protéines qui sont normalement difficiles à étudier à l’aide d’approches biochimiques, telles que les très grandes protéines, ou celles qui traversent la membrane plusieurs fois ou forment des complexes avec d’autres protéines, et des molécules autres que des protéines telles que les glycans, les glycolipids et les phosphospholipides. Compte tenu de la nature à l’échelle du génome de la méthode, cette approche a également l’avantage non seulement d’identifier le récepteur, mais aussi d’autres composants cellulaires qui sont nécessaires pour l’événement contraignant, fournissant ainsi un aperçu de la biologie cellulaire du récepteur.
Une des principales limites de cette méthode lors de son utilisation pour identifier le récepteur d’une protéine orpheline est l’exigence initiale d’identifier d’abord une lignée cellulaire qui se lie à la protéine. Ce n’est pas toujours facile et l’identification d’une lignée cellulaire qui affiche un phénotype de liaison qui est également permissif aux écrans génétiques peut être l’étape limite de temps pour le déploiement de cet essai. Certaines lignées cellulaires ont tendance à se lier à plus de protéines que d’autres. Ceci est particulièrement pertinent pour les protéines qui lient HS, parce que ces protéines ont tendance à se lier à n’importe quelle lignée cellulaire qui affiche des chaînes latérales HS, indépendamment du contexte de liaison indigène. En outre, nous avons observé que l’amélioration de la réglementation des syndécans (c’est-à-dire les protéoglycans qui contiennent du HS) dans les lignées cellulaires conduit à une liaison accrue des protéines HS-contraignantes26. Cela pourrait être un facteur à prendre en considération lors de la sélection de la ligne cellulaire pour le dépistage. Cependant, il est également important de noter que la liaison additive de HS n’interfère pas avec la liaison à un récepteur spécifique. Cela signifie que si la liaison est observée, il est possible qu’elle soit négociée uniquement par HS parce que la liaison négociée par HS dans cet essai est additive plutôt que codépendant19. Dans un tel scénario, l’approche de blocage de l’héparine décrite peut identifier de tels comportements sans avoir besoin d’effectuer un écran génétique complet.
Une ressource utile pour le choix des lignées cellulaires est Cell Model Passport, qui contient de la génomique, de la transcriptomique et de l’information sur l’état de la culture pour 1 000 lignées de cellules cancéreuses27. Selon le contexte biologique, les cellules peuvent être choisies en fonction de leurs profils d’expression. Pour faciliter la sélection des lignées cellulaires, nous avons regroupé 1 000 lignées cellulaires dans Cell Model Passport selon l’expression de 1 500 glycoprotéines de surface des cellules humaines préannotées28 (figure supplémentaire 2; des informations de cluster pour chaque lignée cellulaire ainsi que des conditions de croissance sont fournies dans le tableau supplémentaire 2). Lors de l’essai de la liaison d’une protéine avec une fonction inconnue, il est utile de sélectionner un panel de lignées cellulaires représentatives de chaque cluster pour augmenter les chances de couvrir un large éventail de récepteurs. Étant donné le choix, il est recommandé de choisir des lignées cellulaires faciles à culture et faciles à transduire. Comme ces lignées cellulaires seront utilisées dans le criblage à l’échelle du génome, il est préférable qu’elles puissent être cultivées facilement en grandes quantités et sont permissives à la transduction lentivirale, parce qu’il s’agit de la méthode la plus couramment disponible pour la livraison du sgRNA pour le dépistage génétique à base de CRISPR dans les étapes ultérieures.
En général, les sélections de phénotypes sont effectuées en une seule sorte. Cependant, cela est déterminé par la luminosité de la population de cellules tachées par rapport au contrôle. Des rondes itératives de sélections pourraient être adoptées pour des scénarios dans lesquels le rapport signal-bruit du phénotype désiré est faible, ou lorsque le but de l’écran est d’identifier les mutants qui ont des phénotypes forts. Lors de l’utilisation d’une approche de sélection itérative pour les écrans à base de FACS, il est important de considérer que le processus de tri peut causer la mort cellulaire, principalement en raison de la force pure du trieur. Ainsi, toutes les cellules collectées ne seront pas représentées dans la prochaine série de tri.
La complexité de la bibliothèque est un facteur très important dans l’exécution des écrans génétiques réussis, en particulier pour les écrans de sélection négatifs parce que l’ampleur de l’épuisement dans ceux-ci ne peut être déterminée qu’en comparant les résultats à ce qui était présent dans la bibliothèque de départ. Pour les écrans de sélection négatifs, il est courant de maintenir des bibliothèques de 500 à 1 000 x complexité. Les écrans de sélection positifs, cependant, sont plus robustes pour les tailles de bibliothèque, parce que dans ces écrans seulement un petit nombre de mutants sont censés être sélectionnés pour un phénotype particulier. Par conséquent, dans l’écran de sélection positif décrit ici, la taille de la bibliothèque peut être réduite à la complexité 50-100x sans compromettre la qualité de l’écran. En outre, dans ces écrans, il est également possible d’utiliser une bibliothèque de contrôle pour une ligne cellulaire donnée un jour donné comme un « contrôle général » pour tous les échantillons triés le jour pour cette ligne cellulaire donnée. Cela réduira le nombre de bibliothèques de contrôle qui doivent être produites et séquencées.
Une autre considération importante pour l’utilisation de cette approche est les limites des écrans de perte de fonction dans l’identification des gènes qui sont essentiels pour la croissance des cellules in vitro. Le moment des écrans est crucial à cet égard, car plus les cellules mutantes sont maintenues dans la culture, plus la probabilité que les cellules avec des mutations dans les gènes essentiels deviennent non viables et ne sont plus représentés dans la bibliothèque mutante. Les récents tests génétiques effectués dans le cadre de l’initiative Project Score dans plus de 300 lignées cellulaires montrent que plusieurs gènes de la sécrétion de protéines annotée keGG et de la voie de la N-glycosylation sont souvent identifiés comme étant essentiels pour un certain nombre de lignées cellulaires(figure supplémentaire 3)29. Cela peut être pris en considération lors de la conception des écrans si l’effet des gènes nécessaires à la prolifération et la viabilité doit être étudié dans le cadre du processus de reconnaissance cellulaire. Dans ce cas, l’exécution d’écrans à un point d’heure précoce (p. ex., posttransduction du jour 9) serait généralement appropriée. Toutefois, si l’approche est utilisée pour identifier quelques cibles ayant de forts effets de taille plutôt que des voies cellulaires générales, il pourrait être approprié d’effectuer des écrans à un moment ultérieur (p. ex., posttransduction du jour 15-16).
Les résultats du dépistage sont très solides; dans huit écrans recombinés de liaison de protéine exécutés dans le passé, le récepteur de surface de cellules a été le coup supérieur dans chaque cas19. Lorsque vous utilisez cette approche pour identifier le partenaire d’interaction, il faut donc s’attendre à ce que le récepteur et les facteurs contribuant à sa présentation à la surface soient identifiés avec une confiance statistique élevée. Une fois que l’écran est exécuté et qu’un coup est validé à l’aide d’un seul knock-out d’ARN, d’autres suivis peuvent être effectués à l’aide de méthodes biochimiques existantes telles que l’AVEXIS4 et la liaison saturable directe des protéines purifiées à l’aide d’une résonance plasmon de surface. L’approche décrite ici s’applique à toutes les protéines pour lesquelles il est possible de générer une sonde recombinante soluble.
En résumé, il s’agit d’une approche à élimination directe CRISPR à l’échelle du génome pour identifier les interactions négociées par les protéines de surface cellulaire. Cette méthode s’applique généralement pour identifier les voies cellulaires requises pour la reconnaissance de surface cellulaire dans un large éventail de contextes biologiques différents, y compris entre les propres cellules d’un organisme (p. ex., la reconnaissance neuronale et immunologique), ainsi qu’entre les cellules hôtes et les protéines pathogènes. Cette méthode offre une alternative génétique aux approches biochimiques conçues pour l’identification des récepteurs, et parce qu’elle ne nécessite aucune hypothèse préalable concernant la nature biochimique ou la biologie cellulaire des récepteurs, elle a un grand potentiel pour faire des découvertes complètement inattendues.
The authors have nothing to disclose.
Ce travail a été soutenu par le numéro de subvention Wellcome Trust 206194 attribué à GJW. Nous remercions l’installation Cytometry Core : Bee Ling Ng, Jennifer Graham, Sam Thompson et Christopher Hall pour l’aide de FACS.
Anti-mouse alkaline phosphatase | Sigma | A4656 | |
Blasticidin | Chem-Cruz | SC-204655 | |
Blood & Cell Culture DNA Maxi Kit | Qiagen | 13362 | |
BSA | Sigma | A9647-100G | |
Diethanolamine | Sigma | 398179 | |
DMEM | Gibco | 31966-021 | |
Dneasy Blood and Tissue kit | Qiagen | 69504 | |
DynaMag-96 Side Magnet | Invitrogen | 12331D | |
HEK293T packaging cells | ATCC | CRL-3216 | |
Heparin | Sigma | H4784-1G | |
KAPA HiFi HotStart ReadyMix | Kapa | KK2602 | |
Lipofectamine LTX with PLUS reagent | Invitrogen | 15338100 | |
MoFlo XDP cell sorter | BD | ||
Ni2+-NTA agarose beads | Jena Bioscience | AC-501-25 | |
OPTI-MEM | Life Technologies | 31985-070 | |
OX-68 antibody | AbD Serotec | MCA1022R | |
p-nitrophenyl phosphate | Sigma | 1040-506 | |
PD-10 desalting columns | GE healthcare | 17085101 | |
Polybrene | Millipore | TR-1003-G | |
Polypropylene tubes with 5 mL bed volume | Qiagen | 34964 | |
Proteinase K, recombinant, PCR Grade | Roche | 3115879001 | |
Puromycin | Gibco | A11138-03 | |
Q5 Hot Start High-Fidelity 2× Master Mix | NEB | M0494L | |
QIAquick PCR purification kit | Qiagen | 28104 | |
SCFA filter | Nalgene | 190-2545 | |
Sony Cell sorter | Sony | ||
SPRI beads (Agencourt AMPure XP beads) | Beckman | A63881 | |
Streptavidin-coated microtitre plates | Nalgene | 734-1284 | |
Streptavidin-PE | Biolegend | 405204 |