Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biochemistry

Undersøkelse av protein-sekvens-struktur-dynamikk Relasjoner med Bio3D-web

Published: July 16, 2017 doi: 10.3791/55640
* These authors contributed equally

Summary

En protokoll for undersøkelsen av proteinsekvens-struktur-dynamikk relasjoner ved bruk av Bio3D-web presenteres.

Abstract

Vi demonstrerer bruken av Bio3D-web for den interaktive analysen av biomolekylære strukturdata. Bio3D-webapplikasjonen gir online-funksjonalitet for: (1) Identifikasjon av relaterte proteinstrukturer sett til brukerdefinerte terskler av likhet; (2) deres multiple justering og struktur superposition; (3) Sequence og struktur bevaringsanalyse; (4) Inter-conformer forhold kartlegging med hovedkomponent analyse, og (5) sammenligning av forventet intern dynamikk via ensemble normal modus analyse. Denne integrerte funksjonaliteten gir en komplett online arbeidsflyt for å undersøke sekvens-struktur-dynamiske forhold i proteinfamilier og superfamilier.

Introduction

Protein databanken (PDB) inneholder nå mer enn 120.000 proteinstrukturer - hvorav mange er av samme proteinfamilie, men løst under forskjellige eksperimentelle forhold. Disse flere strukturer representerer en uvurderlig ressurs for forståelse av intricacies av protein form og funksjon. For eksempel kan den strenge sammenligningen av disse strukturens ensembler avsløre viktige molekylære mekanismer 1 , 2 , 3 og informere om konformasjonsdynamikk involvert i prosesser, inkludert ligandbinding, enzymatisk katalyse og bi-molekylær anerkjennelse 4 , 5 , 6 , 7 . Ny innsikt kan ofte hentes fra den detaljerte storskala analysen av proteinfamiliens sekvens, struktur og dynamikk. Dette krever imidlertid vanligvis betydelig bioinfOrmatikk og dataprogrammeringskompetanse sammen med kjennskap til proteinsystemene som studeres. For eksempel krever programvarepakker som Bio3D, ProDy og Maven programmering i henholdsvis R, Python og Matlab, henholdsvis 8 , 9 , 10 . Omvendt er elektroniske verktøy for analyse av strukturell fleksibilitet generelt begrenset til undersøkelsen av individuelle strukturer 11 , 12 . Et unntak i denne forbindelse er den nylig utviklede WebNM @ serveren, som muliggjør sammenligning av fleksibilitetsmønstre oppnådd fra normalmodusanalyse (NMA) av flere forhåndsjusterte brukerdefinerte strukturer 13 . Denne serveren mangler imidlertid en automatisert prosedyre for identifisering av strukturer for sammenligning, justering eller videre analyse utover NMA. Et annet nylig bidrag er den elektroniske PDBFlex-databasen, som presenterer pre-cOmstridd analyse av PDB-strukturer som deler 95% eller høyere sekvensidentitet 14 . Imidlertid er det ikke aktuelt å analysere mer varierte struktursett.

Vi har tidligere presentert Bio3D-web - et brukervennlig webapplikasjon for analyse av proteinsekvens-struktur-dynamiske forhold 15 . Bio3D-web er unik i å gi enkel å bruke integrert funksjonalitet for identifikasjon, sammenligning og detaljert analyse av store homologe struktursett på nettet. Her presenterer vi en detaljert protokoll for online undersøkelse av protein sekvens-struktur-dynamikk forhold ved hjelp av Bio3D-web. Bio3D-web gir en rekke funksjoner for å støtte de fem hovedtrinnene i dataanalyse vist i figur 1 og diskutert i detalj nedenfor. Disse trinnene utgjør en arbeidsflyt som spenner fra spørringssekvens eller strukturinngang, gjennom flere nivåer av sekvens-struktur-dynamisk analyse, for å oppsummereY-rapportgenerering. Resultatene er tilgjengelige umiddelbart gjennom omfattende visualiserings- og plottingsutstyr i nettleseren, samt ved å laste ned resultatfiler i vanlige format. I tillegg til et praktisk, brukervennlig dynamisk grensesnitt for å undersøke effekten av parameter- og metodevalg, registrerer Bio3D-web også den komplette brukerinngangen og de etterfølgende grafiske resultatene av en brukers økt som en delbar reproducerbar rapport i PDF-, DOC- og HTML-formater. Bruker økter kan bli lagret og lastet opp på fremtidige tider og fullføre resultater nedlastet og tolket videre av Bio3D R-pakken på en brukers lokale maskin.

Bio3D-web drives av Bio3D R-pakken for analyse av biomolekylær struktur, sekvens og molekylære simuleringsdata 8 , 16 . Spesielt Bio3D-algoritmer for stiv kjerneidentifikasjon 8 , overordnet, hovedkomponentanalyse(PCA) 8 , og ensemble normalmodusanalyse (eNMA) 16 danner grunnlaget for søknaden. Vi benytter også Bio3D protokoller som avhenger av pHMMER 17 for identifisering av relaterte proteinkonstruksjoner, og MUSCLE 18 for multiple sekvensjustering. Struktur- og sekvensannoteringer er avledet via Bio3D-verktøy fra RCSB PDB 19 og PFAM databaser 20 . Bio3D-web kan kjøres fra vår online-server eller installeres lokalt på hvilken som helst datamaskin som kjører R. Bio3D-web er åpen for alle brukere og tilbys gratis under en GPL-3 åpen kildekode lisens fra: http: // thegrantlab. org / bio3d / webapps

Protocol

MERK: En typisk Bio3D-websesjon fortsetter gjennom fem påfølgende og avhengige trinn (se figur 1 for en skjematisk fremstilling). Hvert trinn er implementert som en påfølgende navigasjonsfan av webapplikasjonen, nemlig SØK, ALIGN, FIT, PCA og eNMA.

1. Struktursøk og -valg (SØK)

  1. Inngangsstruktur
    1. Hent PDB-ID for adenylatkinase (Adk), for eksempel ved å søke i FBB [http://www.rcsb.org/pdb]. Alternativt, oppnå proteinaminosyresekvensen av interesse, f.eks. Fra UniProt [http://uniprot.org].
    2. Skriv inn den fire tegn lange PDB-IDen for Adk ( f.eks. 1AKE), eller lim inn en proteinsekvens, til tekstboksen i "Inngangsstruktur eller -sekvens" -panelet.
  2. Hit valg
    1. Klikk på den blå "Neste" -knappen i det første panelet eller bare bla ned til panel B) "Hit selection"For videre analyse.
    2. Kontroller at glidebryteren "Limit total antall medfølgende strukturer" er satt til sin maksimale verdi for å inkludere alle strukturer over cutoff.
    3. Senk "Juster inklusjon BitScore cutoff" for å inkludere mer fjernt relaterte hits, eller øk den for å utelukke.
  3. Valgfri hitfiltrering
    1. Klikk på den blå "Neste" -knappen (Hit-valg) i det første panelet eller bare bla ned til panel C) "Valgfri filtrering av relaterte strukturer for videre analyse".
    2. Sørg for at de valgte treffene representerer relevante strukturer ved å inspisere tabellens detaljer, f.eks. FBB-navn, arter og bundet ligander.
    3. Forbedre manuelt den valgte delmengden av strukturer ved behov ved å klikke på tabellens rader.
      MERK: Rader markert med en blå farge viser PDB-IDer valgt for videre analyse i etterfølgende faner.

2. Flere sekvensjusteringsanalyser (ALIGN)

  1. Klikk på ALIGN-fanen for å utføre sekvensjustering av de valgte strukturene fra SEARCH-fanen.
  2. Sammendrag av sammendrag
    1. Gå gjennom sammendragsoppsummeringen i panel A) "Sammendrag av sammendrag". Sørg for at regionene av interesse er justert og ikke maskert av hull i en eller flere strukturer.
    2. Hvis nødvendig, skift "Redigeringsalternativer for visningsjustering" og fjern uønskede PDB-IDer, for eksempel PDBer med manglende rester.
  3. Sequence alignment analyse
    1. Klikk på den blå "Neste" -knappen (Analyse) for å utføre sekvensbasert klustringsanalyse av de samlede strukturer.
    2. Velg plottalternativet Dendrogram. Juster klokken i K-glidebryteren for å skille strukturer inn i k-grupper.
    3. Endre eventuelt klyngemetoden hvis ønskelig, ved å bytte av i boksen Mer klynger og utdata.
    4. Residue conservation analyse
      1. Klikk på den blå "Neste" -knappen (Conservation) for å beregne den kolonnevise restbehandlingen.
      2. Velg Struktur-settene for å generere et plott av gjenstandsbehandlingen i hver justeringsposisjon.
      3. Velg Strukturer justert med PFAM frøjustering for å vise bevaring beregnet med hensyn til den tilknyttede PFAM frøjusteringen som inneholder representative medlemmer av familien.
    5. Sequence alignment display
      1. Klikk på den blå "Neste" -knappen (Justering) for å vise full sekvensjustering med visualiseringsverktøyet i nettleseren.

    3. Struktur montering og analyse (FIT)

    1. Utfør struktur overlegning ved å skrive inn FIT-kategorien.
    2. Struktur superposisjon
      1. Veksle avkrysningsboksen "Vis PDB" for å visualisere den justerte proteienN strukturer i nettleseren.
      2. Sørg for at proteinstrukturen legges over til tilsvarende og relevante regioner ved visuelle kontroller. Klikk og dra musen over strukturer for å rotere, og bla for å zoome.
      3. Juster fargene på konstruksjonene ved å klikke på "Fargevalg". Fargeringsalternativer inkluderer justeringsposisjon, strukturvariabilitet per posisjon, RMSD-klyngegrupper, sekvensklyngegrupper, justerte regioner og sekundærstruktur.
      4. Last ned superposed strukturer som enten konvensjonelle PDB-filer eller som en enkelt PyMOL-øktfil for visualisering i et spesialisert molekylærvisningsprogram.
    3. Strukturanalyse
      1. Klikk på den blå "Neste" -knappen (Analyse) for å utføre strukturbasert klynging av de innsamlede PDB-strukturene.
      2. Veksle RMSD Heatmap i rullegardinmenyen Plot opsjoner.
      3. Juster grupperingsalternativene, inkludert selve klyngemetoden, Ved å bytte av i boksen "Flere klynger og utdata".
        MERK: Parvisvis RMSD-data kan også visualiseres som et dendrogram, et histogram eller et varmekart.
    4. Residuelle svingninger
      1. Klikk på den blå "Neste" -knappen (RMSF) for å vise strukturell variabilitet for hvert rest (vist som et RMSF-plott) med store sekundære strukturelementer som vises i de marginale områdene på x-aksen.
      2. Veksle avkrysningsboksen Vis B-faktorer for å overlappe krystallografiske B-faktorer i referansestrukturen på RMSF-plottet.

    4. Hovedkomponentanalyse (PCA)

    1. Utfør hovedkomponentanalyse ved å skrive inn "PCA" -fanen.
    2. Visualisering av hovedkomponentene
      1. Veksle avkrysningsboksen "Vis PC Trafikk" for å visualisere bevegelser som beskrives av PCene med visualiseringsverktøyet i nettleseren.
      2. Pass på at "SkriveCipal Component 1 "er valgt fra den første rullegardinmenyen.
      3. For å visualisere bevegelsene beskrevet av andre PCer, velg ønsket PC fra rullegardinmenyen "Velg hovedkomponent".
      4. Endre fargingen av banen fra rullegardinmenyen "Fargealternativer".
      5. Velg "Variabilitet per posisjon" fra "Fargevalg" til farge ved forskyvningsstørrelse.
      6. Klikk på "Download PDB trajectory" -knappen i panelet "Principal Component Visualization" for å få en oversikt over bevegelsen beskrevet av PCene.
      7. Klikk på knappen "Last ned PyMOL" -sessionfilen for å generere en PyMOL-øktfil som gir bevegelsene som et vektorfelt.
    3. Conformer analyse
      1. Prosjekt de enkelte strukturer på to valgte PCer ved å klikke på den blå "Neste" (Plot) -knappen.
      2. Pass på at "PC på X-aksen" er satt til 1, og "PC oN Y-akse "til 2. For å prosjektlegge strukturer på andre PCer, juster PC-nummereringen tilsvarende.
      3. Velg "Cluster by PC Subspace" for å fargelegge strukturer i diagrammet ved PC-basert klynging; "RMSD" til farge ved "RMSD-basert" clustering; Og "sekvens" til farge ved sekvensbasert clustering.
      4. Klikk på noen individuelle punkter i plottet for å merke strukturene. Alternativt kan du markere en eller flere strukturer i tabellen "PCA conformer plot annotation" under plottet.
      5. Skyv PCene i glidebryteren for mellomrom for å inkludere flere / mindre PCer for klusjonsalgoritmen.
    4. Restbidrag
      1. Beregn restbidragene til de enkelte PCene ved å klikke på den blå "Neste" (Restbidrag) -knappen.
      2. Plott bidragene for flere PCer ved å inkludere PC-nummeret i tekstboksen "Velg hovedkomponent".
      3. Bytt "Spread liNes "-kryssboks, unngå å plotte restbidragene oppå hverandre.
      4. Slå av avmerkingsboksen "Multiline plot" for å plotte restbidragene i separate tomter.
      5. Bytt "Vis RMSF" for å inkludere RMSF-verdiene (fra FIT-fanen).

    5. Ensemble Normal modus analyse (eNMA)

    1. Klikk på eNMA-fanen for å starte beregning av normalmodus (NM).
    2. Filter struktur
      1. Juster antall strukturer ved å senke eller øke "Cutoff" for struktur inkludering / ekskludering.
      2. Klikk på det grønne "Run Ensemble NMA" for å starte NMA-beregningen.
    3. Normal modus visualisering
      1. Rull ned til det andre panelet i eNMA-fanen (Normal visningsvisualisering) for visualisering av NM-ene.
        MERK: Som standard vises NM med høyeste overlapping (likhet) til PC-1 i det visuelleIzation vindu.
      2. For å visualisere bevegelsene beskrevet av andre NM eller andre PDB strukturer, velg ønsket NM og struktur fra henholdsvis "Velg modus" og "Vis NM for struktur" .
    4. Residuelle svingninger
      1. Klikk på den blå "Neste" (Fluktuasjoner) -knappen for å beregne de resterende svingninger av strukturer valgt for eNMA.
      2. Bytt "Cluster by RMSD" for å farge fluktuasjonsprofiler ved hjelp av RMSD-basert klynging.
      3. Bytt "Cluster by RMSIP" for å farge fluktuasjonsprofilene ved RMSIP-basert klynging.
      4. Veksle avkryssingsboksen "Spread lines" for å plotte de grupperte fluktuasjonsprofiler bortsett fra hverandre.
    5. Sammenligning av NMA og PCA
      1. Klikk på den blå "Next" (PCA-vs-NMA) -knappen for å beregne likheten mellom de enkelte NM-ene og PCene.
      2. Velg en PDB ID fra rullegardinmenyen Sammenlign sammenligninger av strukturer for å beregne likheten mellom NMene i denne strukturen til PCene beregnet i PCA-kategorien.
    6. Overlappingsanalyse
      1. Klikk på den blå "Neste" (Overlapp analyse) -knappen for å beregne overlappingen mellom beregnede NM og strukturforskjellvektoren mellom to valgte strukturer.
      2. Velg en "referanse" PDB ID fra rullegardinmenyen "Sammenlign NMs of Structure" og eller ett eller flere PDB-IDer i strukturtabellen for parvis sammenligning med referanseprotokollen.
    7. Clustering analyse
      1. Klikk på den blå " Neste" -knappen (Clustering) for å utføre strukturklynging basert på parvis NM-likhet (RMSIP).

Representative Results

Adenylatkinase (Adk) er et allestedsnærværende enzym som fungerer for å opprettholde likevekten mellom cytoplasmiske nukleotider som er essensielle for mange cellulære prosesser. Adk virker ved å katalysere reversibel overføring av en fosforylgruppe fra ATP til AMP. Denne reaksjonen ledsages av godt studerte hastighetsbegrensende konformasjonelle overganger 3 , 21 . Her analyserer vi alle tilgjengelige Adk-strukturer med Bio3D-web for å avsløre detaljerte funksjoner og mekanistiske prinsipper for disse viktige overgangene.

Vi kan starte vår Bio3D-webanalyse av Adk ved å skrive inn RCSB PDB-koden til en hvilken som helst kjent Adk-struktur. Hvis du for eksempel legger inn PDB ID 1AKE i panel A i SEARCH-fanen, returneres 167 lignende lignende strukturer hvorfra topp 26 automatisk velges for videre analyse (se panel B). Anmerkningen presenteresEd i panel C indikerer at disse valgte strukturer er alle fra E. coli, ble løst ved røntgendiffraksjon i en rekke romgrupper; Har et oppløsningsområde på 1,63 til 2,8 Å, og ble krystallisert med en rekke forskjellige ligander (inkludert ingen ligander, AMP, ADP, MG og inhibitoren AP5). Vær oppmerksom på at tilleggsannonseringsdetaljer kan vises ved å klikke på "Vis / Skjul kolonner" i panel C.

Flere sekvensjusteringer utføres ved inntasting av ALIGN-fanen. Det første panelet på ALIGN-fanen viser et sammendrag av justeringen som gir detaljer om antall sekvensrader (tilsvarende antall PDB-strukturer), samt antall stillinger ( dvs. justeringskolonner). Dette inkluderer en spesifikasjon av antall mellomrom og mellomrom som inneholder kolonner. Figuren på høyre side av første rad gir en skjematisk fremstilling av sekvensjusteringen. Her thE grå områder representerer ikke-gapsposisjoner, mens hvite områder i justeringen korresponderer med hull. En representasjon av sekvensbevaringen er vist over justeringen med røde områder som indikerer velbevarte stillinger og hvitt som indikerer mindre konservert. Merk at sekvensene i denne figuren er bestilt basert på deres likhet som tilbys av clustering dendrogrammet på venstre side. Det andre panelet i denne kategorien gjør det mulig å forenkle gruppering av de valgte PDBene basert på deres parvisse sekvenslikhet, som kan visualiseres enten som et dendrogram eller et varmekart. Som standard vises et dendrogram (eller trediagram) som representerer arrangementet av klynger. Dendrogrammets y-akse representerer avstanden (i forhold til sekvensidentitet) mellom klyngene.

Struktur-superposisjon utføres automatisk ved å gå inn i FIT-fanen. De overbygde strukturer, som vises interaktivt i panel A, indicaI nærvær av en relativt stiv kjerneområde (som omfatter rester 1-29, 68-117 og 161-214, se panelet "Valgfri kjerne og RMSD detaljer" nederst på FIT-kategorien for detaljer). To ytterligere variable nukleotidbindende regioner (residualene 30-67 og 118-167) er også tydelig synlige ( figur 2 ). RMSD-baserte clustering grupper disse strukturene i to distinkte konformasjoner.

Ved å klikke på PCA- fanen vises det tydeligere forholdet mellom strukturen i form av forskyvningene i disse regionene som effektivt lukker over den bundne nukleotidarten i beslektede strukturer ( figur 2B og 2C ). De fleste strukturer er i "lukket" form (blå i figur 2C ) og er forbundet med en bundet ligand eller inhibitor. I motsetning til dette er flere "åpne" konformasjoner nukleotid og inhibitorfri. Dette stemmer overens medDen omfattende undersøkelsen på Adk struktur og dynamikk som indikerer at en åpen konfigurasjon av disse regionene er nødvendig for nukleotidbinding og en lukket konformasjon for effektiv fosforyloverføring og undertrykkelse av skadelige hydrolysebevakninger. Det er bemerkelsesverdig at en enkelt PC fanger 97% av den totale gjennomsnittlige kvadratforskjellen i dette Adk-struktursettet og gir en klar og overbevisende beskrivelse av åpen til lukket overgang sammen med de individuelle restbidragene til denne funksjonelle forskyvningen (panel C av appen Og figur 2 ).

Å besøke NMA-fanen og øke antall strukturer som vurderes for beregning (ved å redusere cutoff for filtrering av lignende strukturer) indikerer at åpne tilstandsstrukturer viser forbedret lokal og global dynamikk sammenlignet med lukkede formstrukturer ( figur 2D og panel C av app) . Sammenligning av PCA og NMA resultater forIndividuelle strukturer (panel D) indikerer at den første modusen for alle åpne formstrukturer viser en forholdsvis høy overlapping til PC1 (med en middelverdi på 0,37 ± 0,04). I kontrast viser lukkede formstrukturer lavere verdier (med et gjennomsnitt på 0,30 ± 0,01). RMSIP-verdier for åpne formstrukturer (0.62 ± 0.003) er også høyere enn de for lukkede strukturer (0,56 ± 0,008). I tillegg viser overlapningsanalyse at de første modusene i åpen tilstand er i god overensstemmelse med konformasjonsendringen som beskriver forskjellen mellom de åpne og lukkede tilstandene (panel E). Clustering basert på RMSIP-verdier viser igjen en konsistent partisjonering av åpne og lukkede tilstandsstrukturer (panel F).

Samlet viser disse resultatene tilstedeværelsen av to store forskjellige konformasjonelle tilstander for Adk. Disse avviker ved en kollektiv lavfrekvent forskyvning av to nukleotidbindende stedområder som viser tydelig fleksibilitetLiser ved nukleotidbinding.

Figur 1
Figur 1: Bio3D-web oversikt med skjermbilder av PCA og NMA-fanene. Bio3D-web tar en bruker gitt proteinstruktur eller sekvens som input i SEARCH-fanen ( 1 ). Serveren gir en liste over relaterte strukturer, som kan velges for videre analyse. ( 2 ) ALIGN-fanen gir sekvensjustering og analyse av strukturer valgt i SEARCH-fanen. ( 3 ) I FIT-kategorien er alle strukturer overlappet og visualisert i 3D sammen med resultatene av konvensjonell parvis strukturanalyse. ( 4 ) Hovedkomponentanalyse av struktursettet utføres i PCA-kategorien for å karakterisere inter-conformer-relasjoner. ( 5 ) Normal modus analyse på hver struktur kan utføres i eNMA-kategorienÅ utforske dynamiske trender for de tilgjengelige strukturelle tilstandene. Vennligst klikk her for å se en større versjon av denne figuren.

Figur 2
Figur 2: Resultater av Bio3D-webanalyse av adenylatkinase. ( A ) Tilgjengelige PDB strukturer av adenylat kinase lagt på den identifiserte invariant kjerne. Strukturer er farget i henhold til RMSD-basert clustering som er gitt i FIT-kategorien. ( B ) Visualisering av de viktigste komponentene er tilgjengelig fra PCA-fanen for å karakterisere de store konformasjonsvariasjonene i datasettet. Her er banen som korresponderer med den første hovedkomponent, vist i rørrepresentasjon som viser proteinens storskala lukkebevegelse. ( C ) Strukturene er prKastet ut på sine to første hovedkomponenter i en konformert plott som viser en lavdimensjonal representasjon av konformasjonsvariabiliteten. Hver prikk (eller struktur) er farget i henhold til brukerdefinerte kriterier, i dette tilfellet PCA-baserte klyngningsresultater. ( D ) Normalmodusanalyse i eNMA-kategorien antyder forbedret lokal og global dynamikk for strukturer i åpen tilstand (rød) i forhold til lukkede (blå) strukturer. Vennligst klikk her for å se en større versjon av denne figuren.

Discussion

Bio3D-web kan brukes til å interaktivt utforske og kartlegge strukturelle, dynamiske og funksjonelle tilstander av proteiner fra tilgjengelige krystallografiske strukturer. Videre kan NMA- og PCA-baserte klyngingsresultater sammen med annotasjonene og sekvensbasert analyse være spesielt nyttige for å velge representative strukturer for mer tidkrevende analyse, som for eksempel ensemble-småmolekyldocking eller molekylære dynamikk-simuleringer. Bio3D-web muliggjør dermed avansert strukturell bioinformatikkanalyse for et bredere spekter av forskere ved å redusere det nødvendige nivået av teknisk ekspertise. Den nåværende utformingen av Bio3D-web legger vekt på enkelhet over uttømmende inkludering av de mange analysemetoder som er tilgjengelige i den fulle frittstående Bio3D-pakken. I mange tilfeller er det påtatt at forskere vil bruke Bio3D-web for å forstå generelle trender i deres proteinfamilie eller superfamilie av interesse, som deretter kan informere mer spesialiserte analyser. Bio3D-web erRefore utviklet for å raskt utforske biomolekylære struktur datasett og å fungere som et hypotesevirksomhetsverktøy. Vi oppfordrer brukere til å utforske deres data ytterligere ved å gi eksempel Bio3D-kode i den reproducerbare rapporten som også lagrer alle forespørselsdetaljer og analyseresultater.

I det representative eksempelprotokollet ovenfor viser vi Bio3D-nettets evne til å avsløre strukturelle funksjoner ved funksjonelle konformasjonsoverganger av Adk. Andre applikasjoner av Bio3D-web inkluderer strukturell og dynamisk analyse av brukeropplastede PDB-strukturer. For eksempel kan brukeren laste opp nye strukturer eller faktisk proteinsekvenser for analyse. Analysestrinnene nevnt tidligere, spesielt eNMA-trinnet, kan avsløre både lokale og globale trender i proteinbevegelser, med kollektive bevegelser som har funksjonell betydning. Sammenligning med apo-strukturer kan også avsløre egenskaper ved ubundne konformasjonelle overganger. Ytterligere eksempler på søknad tilEn rekke forskjellige proteinfamilier tilbys på nettet.

Selv om alle proteiner er fleksible og dynamiske enheter, har ikke alle proteiner atomoppløsningsstrukturer tilgjengelig i en rekke forskjellige tilstander ( f.eks. Aktive og inaktive tilstander). Vårt syn på proteinstrukturen er derfor en begrenset en, og derfor er innsiktene som er oppnådd fra verktøy som Bio3D-web, nødvendigvis også begrenset for visse proteiner. Men med dagens teknologiske fremskritt og nye initiativer for strukturell genomikk vil protokollen som presenteres her, i stadig større grad bli en viktig rute for å få innblikk i viktige struktur-funksjonsforhold. Et kritisk trinn, som er spesielt viktig når man analyserer mer fjernt relaterte proteiner, er den potensielle fremveksten av justeringsfeil i ALIGN-fanen. Justeringsfeil vil uunngåelig oppstå når sekvenslikheten faller under 30%, og brukeren må i slike tilfeller dobbeltkontrollere og korrigere sekvensjusteringenI ALIGN-fanen. Justeringsfeil vil muligens føre til feil overbygde strukturer i FIT-fanen og maskere de mest relevante konformasjonsvariasjonene for den påfølgende PCA. I tillegg bør brukeren være oppmerksom på manglende rester i de valgte PDB-strukturene, slik at i den nåværende implementerings-PCA kan bare utføres på proteinrester hvor alle strukturer har deres tilsvarende karbon-alfa-atom oppløst. Følgelig, hvis et valgt PDB har uløste rester for en bestemt region av proteinet, vil denne regionen bli utelatt fra PCA.

Bio3D-web er for tiden begrenset til analysen av enkelkjede PDB strukturer. Følgelig kan funksjonelle bevegelser som forekommer på kvaternært nivå ikke utforskes ved bruk av den nåværende protokollen. Selv om vi for tiden utvikler nye algoritmer for å inkludere slike analyser i Bio3D-web, er det eneste nåværende alternativet gjennom konvensjonell Bio3D-bruk.

Bio3D-web er den eneste online applikasjonenIon som gjør det mulig å spørre og identifisere struktursett, tolke mønstrene av sekvens og strukturell variabilitet, og trekke ut mekanistisk informasjon fra både analyse og prediksjon av deres strukturelle plasticitet. Et bredt spekter av molekylære visualiseringsverktøy og online-servere gjør det mulig for forskere å utforske og analysere individuelle biomolekylære strukturer. Imidlertid krever eksisterende verktøy for analyse av sekvens, struktur og dynamikk hos store heterogene proteinfamilier ofte betydelig beregningsmessig kompetanse og forblir vanligvis bare tilgjengelige for brukere med relevant programmeringsevner. For eksempel krever Bio3D-pakken R 8 , ProDy krever python og Maven krever Matlab kunnskap 9 , 10 . Bio3D-web i kontrast krever ingen programmeringskunnskap og øker dermed tilgjengeligheten og reduserer inngangsbarrieren for å utføre avansert komparativ sekvens, struktur og dybdeNamikkanalyse. Videre er forberedelsen, kurering, annotering og opprydding av molekylære strukturer som ofte er nødvendig for effektiv analyse, inkludert i Bio3D-webtjenesten. I tillegg er begrensningen for å utføre en slik analyse på mulige beregningsressurser lindret av server-forekomsten som muliggjør storskala analyse av mange strukturer som kan initieres og styres fra en hvilken som helst moderne nettleser.

Åpen utvikling av Bio3D-web er pågår (se https://bitbucket.org/Grantlab/bio3d). Vi fortsetter å legge til ny analysefunksjonalitet og forbedre eksisterende metoder. Fremtidig utvikling vil fokusere på tilsetning av avstandmatrisebasert PCA og torsjons-PCA, mer omfattende sekvensbevarende tilnærminger som inkluderer en fylogenetisk komponent, identifikasjon av bindingsstedssiden og nye tilnærminger for dynamisk nettverksanalyse på tvers av proteinfamilier. I dette henseende representerer den nåværende webapplikasjonen startpunktetT for mange andre samarbeidende strukturelle bioinformatiske analyse arbeidsflyter ved å muliggjøre reproduserbare og delbare trinn på brukerdefinerte eksperimentelle struktur sett. Vi planlegger også fremtidig støtte til rekonstruerte biologiske enhetskoordinatsett i tillegg til individuelle og flere kjeder fra den asymmetriske enheten for PDB-strukturer. Tilleggsfunksjoner inkluderer forbedret lagring og lasting av samarbeidende arbeidsområder sammen med en mulighet for å angre.

Bio3D-web er en online applikasjon for interaktiv analyse av data for biomolekylær struktur. Bio3D-web kjører på en hvilken som helst moderne nettleser og gir funksjonalitet for: (1) Identifikasjon av relatert proteinstruktur sett til brukerdefinerte terskler av likhet; (2) deres multiple justering og struktur superposition; (3) Sequence og struktur bevaringsanalyse; (4) Inter-conformer-kartlegging med hovedkomponentanalyse, og (5) sammenligning av forventet intern dynamikk via ensemble ellerMal modus analyse. Denne integrerte funksjonaliteten gir en komplett arbeidsflyt for undersøkelse av sekvens-struktur-dynamiske forhold i proteinfamilier og superfamilier. I tillegg til et praktisk, enkelt å bruke dynamisk grensesnitt for å utforske effektene av parameter- og metodevalg, registrerer Bio3D-web også den komplette brukerinngangen og de etterfølgende grafiske resultatene av en brukers økt. Dette gjør det mulig for brukere å enkelt dele og reprodusere sekvensen av analysesteg som skapte resultatene. Bio3D-web er implementert helt i R-språket og er basert på Bio3D- og Shiny R-pakkene. Den kan kjøres fra vår online-server eller installeres lokalt på hvilken som helst datamaskin som kjører R. Dette inkluderer lokal serverinstallasjon for å gi en tilpasset multi-bruker-forekomst med tilgang til prioriterte strukturelle datasett som de som er felles i farmasøytisk industri. Full kildekode og omfattende dokumentasjon er gitt under en GPL-3 åpen kildekode lisens fra: http://thegrantlab.org/ Bio3d / webapps

Disclosures

Forfatterne erklærer at de ikke har konkurrerende økonomiske interesser.

Acknowledgments

Vi takker Dr. Guido Scarabelli og Hongyang Li for omfattende testing gjennom hele utviklingen, samt Bio3D bruker samfunnet og Universitetet i Bergen strukturelle bioinformatikk workshop deltakere for tilbakemelding og kommentarer som har forbedret denne applikasjonen.

Materials

Name Company Catalog Number Comments
Bio3D-web
Web-site http://thegrantlab.org/bio3d-web/
Requirements Web browser

DOWNLOAD MATERIALS LIST

References

  1. Kornev, A. P., Taylor, S. S. Dynamics-Driven Allostery in Protein Kinases. Trends Biochem. Sci. 40 (11), 628-647 (2015).
  2. Yao, X. -Q., Grant, B. J. Domain-opening and dynamic coupling in the α-subunit of heterotrimeric G proteins. Biophys. J. 105 (2), L08-L10 (2013).
  3. Henzler-Wildman, K. A., et al. Intrinsic motions along an enzymatic reaction trajectory. Nature. 450 (7171), 838-844 (2007).
  4. Boehr, D., Nussinov, R., Wright, P. The role of dynamic conformational ensembles in biomolecular recognition. Nat. Chem. Biol. 5 (11), 789-796 (2009).
  5. Teilum, K., Olsen, J. G., Kragelund, B. B. Functional aspects of protein flexibility. Cell Mol Life Sci. 66 (14), 2231-2247 (2009).
  6. Henzler-Wildman, K., Kern, D. Dynamic personalities of proteins. Nature. 450 (7172), 964-972 (2007).
  7. Grant, B. J., Gorfe, A. A., McCammon, J. A. Large conformational changes in proteins: signaling and other functions. Curr. Opin. Struct. Biol. 20 (2), 142-147 (2010).
  8. Grant, B. J., Rodrigues, A. P. C., ElSawy, K. M., McCammon, J. A., Caves, L. S. D. Bio3d: an R package for the comparative analysis of protein structures. Bioinformatics. 22 (21), 2695-2696 (2006).
  9. Bakan, A., Meireles, L. M., Bahar, I. ProDy: protein dynamics inferred from theory and experiments. Bioinformatics. 27 (11), 1575-1577 (2011).
  10. Zimmermann, M. T., Kloczkowski, A., Jernigan, R. L. MAVENs: motion analysis and visualization of elastic networks and structural ensembles. BMC Bioinformatics. 12 (1), 264 (2011).
  11. Yang, L. -W., et al. oGNM: online computation of structural dynamics using the Gaussian Network Model. Nucleic Acids Res. 34, 24-31 (2006).
  12. Suhre, K., Sanejouand, Y. -H. ElNemo: a normal mode web server for protein movement analysis and the generation of templates for molecular replacement. Nucleic Acids Res. 32, W610-W614 (2004).
  13. Tiwari, S. P., et al. WEBnm@ v2.0: Web server and services for comparing protein flexibility. BMC Bioinformatics. 15 (1), 427 (2014).
  14. Hrabe, T., et al. PDBFlex: exploring flexibility in protein structures. Nucleic Acids Res. 44, D423-D428 (2016).
  15. Skjærven, L., Jariwala, S., Yao, X. -Q., Grant, B. J. Online interactive analysis of protein structure ensembles with Bio3D-web. Bioinformatics. , first published online (2016).
  16. Skjærven, L., Yao, X., Scarabelli, G., Grant, B. J. Integrating protein structural dynamics and evolutionary analysis with Bio3D. BMC Bioinformatics. 15 (399), 1-11 (2014).
  17. Eddy, S. R. Accelerated Profile HMM Searches. PLoS Comput. Biol. 7 (10), (2011).
  18. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  19. Berman, H. M. The Protein Data Bank. Nucleic Acids Res. 28 (1), 235-242 (2000).
  20. Finn, R. D., et al. Pfam: the protein families database. Nucleic Acids Res. 42, D222-D230 (2014).
  21. Kerns, S. J., et al. The energy landscape of adenylate kinase during catalysis. Nat. Struct. Mol. Biol. 22 (2), 124-131 (2015).

Tags

Biokjemi utgave 125 Proteinstrukturanalyse Proteindynamikk Hovedkomponentanalyse Normalmodusanalyse
Undersøkelse av protein-sekvens-struktur-dynamikk Relasjoner med Bio3D-web
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Jariwala, S., Skjærven, L.,More

Jariwala, S., Skjærven, L., Yao, X. Q., Grant, B. J. Investigating Protein Sequence-structure-dynamics Relationships with Bio3D-web. J. Vis. Exp. (125), e55640, doi:10.3791/55640 (2017).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter