Dette manuskriptet beskriver en genom-skala celle-basert screening tilnærming for å identifisere ekstracellulære reseptor-ligand interaksjoner.
Intercellulær kommunikasjon mediert av direkte interaksjoner mellom membraninbygde celleoverflatereseptorer er avgjørende for normal utvikling og funksjon av flercellede organismer. Det er imidlertid fortsatt teknisk utfordrende å oppdage disse interaksjonene. Dette manuskriptet beskriver en systematisk genom-skala CRISPR / Cas9 knockout genetisk screening tilnærming som avslører cellulære veier som kreves for bestemte celleoverflategjenkjenning hendelser. Denne analysen benytter rekombinante proteiner produsert i et pattedyrproteinuttrykkssystem som ivrige bindingssonder for å identifisere interaksjonspartnere i en cellebasert genetisk skjerm. Denne metoden kan brukes til å identifisere genene som er nødvendige for celleoverflateinteraksjoner oppdaget av rekombinant bindingssonder som tilsvarer ectodomains av membraninerte reseptorer. Viktigere, gitt genom-skala natur denne tilnærmingen, det har også fordelen av ikke bare å identifisere direkte reseptoren, men også de cellulære komponenter som er nødvendige for presentasjon av reseptoren på celleoverflaten, og dermed gi verdifull innsikt i biologien til reseptoren.
Ekstracellulære interaksjoner av celleoverflatereseptorproteiner styrer viktige biologiske prosesser som vevsorganisasjon, vertspatogengjenkjenning og immunregulering. Å undersøke disse interaksjonene er av interesse for det bredere biomedisinske samfunnet, fordi membranreseptorer er handlingsrettede mål for systematisk leverte terapeutiske midler som monoklonale antistoffer. Til tross for deres betydning, studere disse interaksjonene er fortsatt teknisk utfordrende. Dette skyldes hovedsakelig at membraninbygde reseptorer er amfipatiske, noe som gjør dem vanskelige å isolere fra biologiske membraner for biokjemisk manipulasjon, og deres interaksjoner er preget av de svake interaksjonsaffinitetene (KDs i μM-mM-området)1. Følgelig er mange vanlige metoder uegnet til å oppdage denne klassen av proteininteraksjoner1,2.
En rekke metoder er utviklet for å spesifikt undersøke ekstracellulære reseptor-ligand interaksjoner som tar sine unike biokjemiske egenskaper i betraktning3. En rekke av disse tilnærmingene innebærer å uttrykke hele ectodomain av en reseptor som et løselig rekombinant protein i pattedyr eller insektcellebaserte systemer for å sikre at disse proteinene inneholder posttranslational modifikasjoner som er strukturelt viktige, som glyker og disulfidbindinger. For å overvinne lavaffinitetsbindingen, er ekodomene ofte oligomerisert for å øke deres bindende ivrighet. Ivrige proteinectodomainer har blitt brukt som bindende sonder for å identifisere interaksjonspartnere i direkte rekombinant protein-protein interaksjon skjermer4,,5,6,7. Mens bredt vellykket, rekombinant protein-baserte metoder krever at ectodomain av en membranreseptor produseres som et oppløselig protein. Derfor gjelder det bare generelt for proteiner som inneholder en sammenhengende ekstracellulær region (f.eks. enkeltpasstype I, type II eller GPI-forankret) og er vanligvis ikke egnet for reseptorkomplekser og membranproteiner som strekker seg over membranen flere ganger.
Uttrykk kloning teknikker der et bibliotek av komplementære DNAer (cDNAs) er transfected inn i celler og testet for en gain-of-binding fenotype har også blitt brukt til å identifisere ekstracellulære protein-protein interaksjoner8. Tilgjengeligheten av store samlinger av klonet og sekvensert cDNA uttrykk plasmids de siste årene har tilrettelagt metoder der cellelinjer overexpressing cDNAs koding celleoverflate reseptorer er screenet for binding av rekombinant proteiner for å identifisere interaksjoner9,10. CDNA overuttrykksbaserte tilnærminger, i motsetning til rekombinante proteinbaserte metoder, gir mulighet til å identifisere interaksjoner i sammenheng med plasmamembranen. Imidlertid avhenger suksessen med å bruke cDNA-uttrykkskonstruksjoner av cellenes evne til å overuttrykke proteinet i riktig foldet form, men dette krever ofte cellulære tilbehørsfaktorer som transportører, chaperoner og riktig oligomerisk montering. Transfisere en enkelt cDNA kan derfor ikke være nok til å oppnå celleoverflateuttrykk.
Screeningteknikker ved hjelp av cDNA-konstruksjoner eller rekombinante proteinprober er ressurskrevende og krever store samlinger av cDNA eller rekombinante proteinbiblioteker. Spesielt utformede massespektrometribaserte metoder har blitt brukt nylig for å identifisere ekstracellulære interaksjoner som ikke krever montering av store biblioteker. Imidlertid krever disse teknikkene kjemisk manipulering av celleoverflaten, noe som kan endre molekylenes biokjemiske natur som er tilstede på overflaten av cellene og gjelder for tiden bare for interaksjoner mediert av glykosylert proteiner11,12. De fleste av de tilgjengelige metodene fokuserer også tungt på samspillet mellom proteiner, samtidig som de ignorerer bidraget fra membranmikrmiljøet, inkludert molekyler som glyner, lipider og kolesterol.
Den nylige utviklingen av svært effektiv bialleeisk målretting ved hjelp av CRISPR-baserte tilnærminger har gjort det mulig for genom-skala biblioteker av celler som mangler definerte gener i et enkelt basseng som kan screenes på en systematisk og objektiv måte å identifisere cellulære komponenter som er involvert i ulike sammenhenger, inkludert dissekere cellulære signalprosesser, identifisering av perturbations som gir motstand mot narkotika, giftstoffer og patogener, og bestemme spesifisitet av antistoffer13,14,15,16. Her beskriver vi en genom-skala CRISPR-basert knockout celle screening analyse som gir et alternativ til dagens biokjemiske tilnærminger for å identifisere ekstracellulære reseptor-ligand interaksjoner. Denne tilnærmingen til å identifisere interaksjoner mediert av membranreseptorer av genetiske skjermer er spesielt egnet for forskere som har en fokusert interesse på individuelle ligander fordi det unngår behovet for å kompilere store biblioteker av cDNAs eller rekombinant proteiner.
Denne analysen består av tre hovedtrinn: 1) Svært ivrige rekombinant proteinbindingssonder bestående av de ekstracellulære områdene av en reseptor av interesse produseres og brukes i fluorescensbaserte lufttidstoktmetymetribaserte bindingsanalyser; 2) Bindingsanalysene brukes til å identifisere en cellelinje som uttrykker interaksjonspartneren til den rekombinante proteinsonden; 3) En Cas9-uttrykksversjon av cellelinjen som samhandler med proteinet av interesse produseres og en genom-skala CRISPR / Cas9-basert knockout skjermen utføres (Figur 1). I denne genetiske skjermen brukes binding av et rekombinant protein til cellelinjer som en målbar fenotype der celler i knockout-biblioteket som har mistet evnen til å binde sonden, sorteres ved hjelp av fluorescensbasert aktivert cellesortering (FACS) og genene som forårsaket tapet av bindingsfenotypen identifisert ved sekvensering. I prinsippet identifiseres genene som koder reseptoren som er ansvarlig for binding av den ivrige sonden, og de som kreves for celleoverflaten, identifiseres.
Det første trinnet i denne protokollen innebærer produksjon av ivrige rekombinantproteinprober som representerer ektodomenet til de membranbundne reseptorene. Disse reseptorene er kjent for å ofte beholde sine ekstracellulære bindingsfunksjoner når deres ectodomainer uttrykkes som et rekombinant løselig protein1. For et protein av interesse, løselig rekombinant proteiner kan produseres i et egnet eukaryotisk protein uttrykk system i alle formater forutsatt at det kan oligomerized for økt binding aviditet, og den inneholder koder som kan brukes i fluorescens-basert strømning cytometri-baserte bindingsanalyser (f.eks, FLAG-tag, biotin-tag). Detaljerte protokoller for produksjon av løselige ectodomainer av membranreseptorer ved hjelp av HEK293 proteinuttrykkssystemet, samt ulike multimeriseringsteknikker og proteinuttrykket konstruerer for produksjon av både pentameriske proteiner og monomeriske proteiner har tidligere blitt beskrevet1,17. Protokollen her vil beskrive trinnene for å generere fluorescerende ivrige sonder fra monomeriske biotinylert proteiner ved å konjugere dem til streptavidin konjugert til en fluorokrom (f.eks. phycoerythrin, eller PE), som kan brukes direkte i cellebaserte bindingsanalyser og har fordelen av å ikke kreve et sekundært antistoff for deteksjon. Generelle protokoller for å utføre genom-skala skjermer har allerede blitt beskrevet20,21, dermed protokollen hovedsakelig fokusere på detaljene i å utføre flow cytometri-baserte rekombinant protein binding skjermer ved hjelp av CRISPR / Cas9 knockout screening system ved hjelp av Human V1 (“Yusa”) bibliotek18.
En CRISPR-basert screeningstrategi for å identifisere gener som koder cellulære komponenter som er involvert i cellulær gjenkjenning, er beskrevet. En lignende tilnærming ved hjelp av CRISPR-aktivering gir også et genetisk alternativ for å identifisere direkte interagerende reseptorer av rekombinante proteiner uten å måtte generere store proteinbiblioteker26. Imidlertid er en stor fordel med denne tilnærmingen at det gjelder interaksjoner mediert av overflatemolekyler som opprinnelig vises på cellen, og er ikke avhengig av overuttrykk av reseptorer, noe som kan påvirke reseptorens bindingsavsigelse. I motsetning til andre metoder, Derfor gjør denne teknikken ingen antagelser om den biokjemiske naturen eller cellebiologien til reseptorene og gir en mulighet til å studere interaksjoner mediert av proteiner som normalt er vanskelige å studere ved hjelp av biokjemiske tilnærminger, for eksempel svært store proteiner, eller de som krysser membranen flere ganger eller danner komplekser med andre proteiner, og andre molekyler enn proteiner som glynoer, glykotoler og fosfolipider. Gitt metodens genom-skala natur, denne tilnærmingen har også fordelen av ikke bare å identifisere reseptoren, men også flere cellulære komponenter som kreves for binding hendelsen, og dermed gi innsikt i cellebiologien til reseptoren.
En av de store begrensningene i denne metoden når du bruker den til å identifisere reseptoren til et foreldreløst protein, er det første kravet om først å identifisere en cellelinje som binder seg til proteinet. Dette er ikke alltid lett, og å identifisere en cellelinje som viser en bindende fenotype som også er tillatt for genetiske skjermer, kan være det tidsbegrensende trinnet for distribusjon av denne analysen. Noen cellelinjer har en tendens til å binde seg til flere proteiner enn andre. Dette er spesielt relevant for proteiner som binder HS, fordi disse proteinene har en tendens til å binde seg til en hvilken som helst cellelinje som viser HS-sidekjeder, uavhengig av den opprinnelige bindingskonteksten. I tillegg har vi observert at oppregulering av syndekaner (dvs. proteoglykaner som inneholder HS) i cellelinjer fører til økt binding av HS-bindende proteiner26. Dette kan være en faktor å ta hensyn til når du velger cellelinjen for screening. Det er imidlertid også viktig å merke seg at tilsetningsstoffbindingen av HS ikke forstyrrer bindingen til en bestemt reseptor. Dette betyr at hvis bindingen observeres, er det mulig at det medieres utelukkende av HS fordi bindingen mediert av HS i denne analysen er additiv snarere enn codependent19. I et slikt scenario kan heparinblokkeringstilnærmingen som er beskrevet, identifisere slik atferd uten å måtte utføre en full genetisk skjerm.
En nyttig ressurs for å velge cellelinjer er Cell Model Passport, som inneholder genomikk, transkripsjonsmessig og kultur tilstandsinformasjon for ~ 1000 kreftcellelinjer27. Avhengig av den biologiske konteksten kan celler velges basert på uttrykksprofilene deres. For å hjelpe valg av cellelinjer, vi gruppert ~ 1000 cellelinjer i Cell Model Passport i henhold til uttrykket av ~ 1500 forhåndsanordnede humane celleoverflaten glykoproteiner28 (Supplerende figur 2; klyngeinformasjon for hver cellelinje sammen med vekstforhold er gitt i supplerende tabell 2). Når du tester bindingen av et protein med ukjent funksjon, er det nyttig å velge et panel av representative cellelinjer fra hver klynge for å øke sjansen for å dekke et bredt spekter av reseptorer. Gitt et valg, anbefales det å velge cellelinjer som er enkle å kultur og lett å transduce. Siden disse cellelinjene vil bli brukt i genom-skala screening, er det å foretrekke at de kan dyrkes lett i store mengder og er tillatt for lentiviral transduksjon, fordi det er den mest tilgjengelige metoden for levering av sgRNA for CRISPR-basert genetisk screening i de senere trinnene.
Vanligvis utføres fenotypevalgene i en enkelt type. Dette bestemmes imidlertid av lysstyrken til den fargede cellepopulasjonen sammenlignet med kontrollen. Iterative runder med valg kan vedtas for scenarier der signal-til-støy-forholdet til ønsket fenotype er lav, eller når målet med skjermen er å identifisere mutanter som har sterke fenotyper. Når du bruker en iterativ utvalgstilnærming for FACS-baserte skjermer, er det viktig å vurdere at sorteringsprosessen kan forårsake celledød, hovedsakelig på grunn av den rene kraften til sorteringen. Dermed vil ikke alle innsamlede celler bli representert i neste runde av sortering.
Bibliotekkompleksitet er en svært viktig faktor i å utføre vellykkede genetiske skjermer, spesielt for negative utvalgsskjermer fordi omfanget av uttømming i disse bare kan bestemmes ved å sammenligne resultater med det som var tilstede i startbiblioteket. For negative utvalgsskjermer er det vanlig å opprettholde biblioteker med 500-1000 x kompleksitet. Positive utvalgsskjermer er imidlertid mer robuste for bibliotekstørrelser, fordi i slike skjermer forventes det bare at et lite antall mutanter velges for en bestemt fenotype. Derfor, i det positive utvalgsskjermen som er beskrevet her, kan bibliotekstørrelsen reduseres til 50-100x kompleksitet uten at det går på bekostning av kvaliteten på skjermen. I tillegg er det i disse skjermene også mulig å bruke et kontrollbibliotek for en gitt cellelinje på en gitt dag som en “generell kontroll” for alle eksempler sortert på dagen for den gitte cellelinjen. Dette vil redusere antall kontrollbiblioteker som må produseres og sekvenseres.
En annen viktig faktor for å bruke denne tilnærmingen er begrensningene for funksjonstapsskjermer i å identifisere gener som er avgjørende for in vitro cellevekst. Tidspunktet for skjermene er avgjørende i denne forbindelse, da jo lenger mutantcellene holdes i kultur, jo høyere er sannsynligheten for at celler med mutasjoner i essensielle gener blir ikke levedyktige og ikke lenger er representert i det muterte biblioteket. De siste genetiske skjermene utført som en del av Project Score-initiativet i over 300 cellelinjer viser at flere gener i KEGG-annotert proteinsekresjon og N-glykosyleringsvei ofte er identifisert som avgjørende for en rekke cellelinjer (Supplerende figur 3)29. Dette kan tas i betraktning når du utformer skjermer hvis effekten av gener som kreves for spredning og levedyktighet skal undersøkes i sammenheng med cellulær gjenkjenningsprosess. I dette tilfellet, utføre skjermer på et tidlig tidspunkt (f.eks dag 9 ettertransduction) ville være generelt hensiktsmessig. Men hvis tilnærmingen brukes til å identifisere noen mål med sterke størrelseseffekter i stedet for generelle cellulære veier, kan det være hensiktsmessig å utføre skjermer på et senere tidspunkt (f.eks. dag 15-16 ettertransduction).
Resultatene fra screeningen er svært robuste; i åtte rekombinant protein binding skjermer utført i det siste, celleoverflaten reseptoren var toppen hit i alletilfeller 19. Når man bruker denne tilnærmingen til å identifisere interaksjonspartneren, bør man derfor forvente at reseptoren og faktorene som bidrar til presentasjonen på overflaten, skal identifiseres med høy statistisk tillit. Når skjermen er utført og en hit er validert ved hjelp av en enkelt gRNA knockout, kan ytterligere oppfølging utføres ved hjelp av eksisterende biokjemiske metoder som AVEXIS4 og direkte saturable binding av rensede proteiner ved hjelp av overflateplasmon resonans. Tilnærmingen som er beskrevet her gjelder for alle proteiner som det er mulig å generere en oppløselig rekombinant bindingssonde.
Oppsummert er dette en genom-skala CRISPR knockout tilnærming for å identifisere interaksjoner mediert av celleoverflateproteiner. Denne metoden gjelder vanligvis for å identifisere cellulære veier som kreves for celleoverflategjenkjenning i et bredt spekter av forskjellige biologiske sammenhenger, inkludert mellom kroppens egne celler (f.eks. nevrale og immunologiske gjenkjenning), samt mellom vertsceller og patogenproteiner. Denne metoden gir et genetisk alternativ til biokjemiske tilnærminger designet for reseptoridentifikasjon, og fordi det ikke krever noen tidligere antagelser om den biokjemiske naturen eller cellebiologien til reseptorene, har den stort potensial til å gjøre helt uventede funn.
The authors have nothing to disclose.
Dette arbeidet ble støttet av Wellcome Trust-tilskuddsnummeret 206194 tildelt GJW. Vi takker Cytometry Core-anlegget: Bee Ling Ng, Jennifer Graham, Sam Thompson og Christopher Hall for å få hjelp med FACS.
Anti-mouse alkaline phosphatase | Sigma | A4656 | |
Blasticidin | Chem-Cruz | SC-204655 | |
Blood & Cell Culture DNA Maxi Kit | Qiagen | 13362 | |
BSA | Sigma | A9647-100G | |
Diethanolamine | Sigma | 398179 | |
DMEM | Gibco | 31966-021 | |
Dneasy Blood and Tissue kit | Qiagen | 69504 | |
DynaMag-96 Side Magnet | Invitrogen | 12331D | |
HEK293T packaging cells | ATCC | CRL-3216 | |
Heparin | Sigma | H4784-1G | |
KAPA HiFi HotStart ReadyMix | Kapa | KK2602 | |
Lipofectamine LTX with PLUS reagent | Invitrogen | 15338100 | |
MoFlo XDP cell sorter | BD | ||
Ni2+-NTA agarose beads | Jena Bioscience | AC-501-25 | |
OPTI-MEM | Life Technologies | 31985-070 | |
OX-68 antibody | AbD Serotec | MCA1022R | |
p-nitrophenyl phosphate | Sigma | 1040-506 | |
PD-10 desalting columns | GE healthcare | 17085101 | |
Polybrene | Millipore | TR-1003-G | |
Polypropylene tubes with 5 mL bed volume | Qiagen | 34964 | |
Proteinase K, recombinant, PCR Grade | Roche | 3115879001 | |
Puromycin | Gibco | A11138-03 | |
Q5 Hot Start High-Fidelity 2× Master Mix | NEB | M0494L | |
QIAquick PCR purification kit | Qiagen | 28104 | |
SCFA filter | Nalgene | 190-2545 | |
Sony Cell sorter | Sony | ||
SPRI beads (Agencourt AMPure XP beads) | Beckman | A63881 | |
Streptavidin-coated microtitre plates | Nalgene | 734-1284 | |
Streptavidin-PE | Biolegend | 405204 |