Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biochemistry

Undersøgelse Proteinsekvens-struktur-dynamik Forhold med Bio3D-web

Published: July 16, 2017 doi: 10.3791/55640
* These authors contributed equally

Summary

En protokol til online undersøgelse af proteinsekvens-struktur-dynamik relationer ved brug af Bio3D-web er præsenteret.

Abstract

Vi demonstrerer brugen af ​​Bio3D-web til den interaktive analyse af biomolekylære strukturdata. Bio3D-webapplikationen giver online-funktionalitet til: (1) Identifikationen af ​​beslægtede proteinstrukturer sætter til brugerdefinerede tærskler af lighed; (2) deres multiple alignment og struktur superposition; (3) Bevaringsanalyse af sekvens og struktur; (4) Inter-conformer-relationskortlægning med hovedkomponentanalyse, og (5) sammenligning af forudsagt intern dynamik via ensemble normal mode analyse. Denne integrerede funktionalitet giver en komplet online-arbejdsgang til undersøgelse af sekvens-struktur-dynamiske relationer inden for proteinfamilier og superfamilier.

Introduction

Proteindatabanken (PDB) indeholder nu mere end 120.000 proteinstrukturer - hvoraf mange er af samme proteinfamilie, men løst under forskellige forsøgsbetingelser. Disse multiple strukturer repræsenterer en uvurderlig ressource til forståelse af intricacies af protein form og funktion. For eksempel kan den stringente sammenligning af disse strukturens ensembler afsløre vigtige molekylære mekanismer 1 , 2 , 3 og informere om konformationsdynamik involveret i processer, herunder ligandbinding, enzymatisk katalyse og bi-molekylær anerkendelse 4 , 5 , 6 , 7 . Nye indsigter kan ofte opnås fra den detaljerede storskala analyse af proteinfamiliens sekvens, struktur og dynamik. Dette kræver imidlertid typisk betydelig bioinfOrmatik og computer programmering ekspertise sammen med kendskab til de proteinsystemer under studiet. For eksempel kræver softwarepakker som Bio3D, ProDy og Maven programmering i henholdsvis R, Python og Matlab, henholdsvis 8 , 9 , 10 . Omvendt er onlineværktøjer til analyse af strukturel fleksibilitet generelt begrænset til undersøgelse af individuelle strukturer 11 , 12 . En undtagelse i denne henseende er den nyudviklede WebNM @ -server, som muliggør sammenligning af fleksibilitetsmønstre opnået ved normal tilstandsanalyse (NMA) af adskillige forudjusterede brugerspecificerede strukturer 13 . Denne server mangler dog en automatiseret procedure til identifikation af strukturer til sammenligning, deres justering eller yderligere analyse ud over NMA. Et andet nyt bidrag er den online PDBFlex database, der præsenterer pre-cOmstridte analyser af FBF-strukturer, der deler 95% eller højere sekvensidentitet 14 . Analysen af ​​flere forskellige struktursæt er dog ikke tilgængelig.

Vi har tidligere præsenteret Bio3D-web - en nem at bruge webapplikation til analyse af proteinsekvens-struktur-dynamiske forhold 15 . Bio3D-web er unik i at give nem at bruge integreret funktionalitet til identifikation, sammenligning og detaljeret analyse af store homologe struktur sæt online. Her præsenterer vi en detaljeret protokol til online undersøgelse af proteinsekvens-struktur-dynamik forhold ved hjælp af Bio3D-web. Bio3D-web giver en række funktioner til understøttelse af de fem store trin i dataanalyse vist i figur 1 og diskuteret i detaljer nedenfor. Disse trin udgør en arbejdsgang, der spænder fra forespørgselssekvens eller strukturindgang, gennem flere niveauer af sekvens-struktur-dynamisk analyse for at opsummereY rapport generation. Resultaterne er tilgængelige straks gennem omfattende in-browser visualisering og plotting enheder, samt ved at downloade resultatfiler i almindeligt anvendte formater. Ud over en praktisk nem at bruge dynamisk grænseflade til at udforske effekterne af parameter og metode valg registrerer Bio3D-web også den komplette brugerindgang og efterfølgende grafiske resultater af en brugers session som en delbar reproducerbar rapport i PDF-, DOC- og HTML-formater. Brugersessioner kan gemmes og genindlæses i fremtiden og afslutte resultater, der er downloadet og fortolket yderligere af Bio3D R-pakken på en brugers lokale maskine.

Bio3D-web drives af Bio3D R-pakken til analyse af biomolekylær struktur, sekvens- og molekylsimulationsdata 8 , 16 . Især Bio3D-algoritmer til identifikation af stiv kerne 8 , overlejring, hovedkomponentanalyse(PCA) 8 og ensemble normal mode analyse (eNMA) 16 danner basis for ansøgningen. Vi benytter også Bio3D-protokoller, der afhænger af pHMMER 17 til identifikation af relaterede proteinstrukturer og MUSCLE 18 til multiple sekvensjustering. Struktur- og sekvensannotationer er afledt via Bio3D-hjælpeprogrammer fra RCSB PDB 19 og PFAM databaser 20 . Bio3D-web kan køres fra vores online-server eller installeres lokalt på enhver computer, der kører R. Bio3D-web er åben for alle brugere og leveres gratis under en GPL-3 open source-licens fra: http: // thegrantlab. org / bio3d / webapps

Protocol

BEMÆRK: En typisk Bio3D-websession fortsætter gennem fem på hinanden følgende og afhængige trin (se figur 1 for en skematisk repræsentation). Hvert trin implementeres som en på hinanden følgende navigationsfane i webapplikationen nemlig SEARCH, ALIGN, FIT, PCA og eNMA.

1. Struktur søgning og udvælgelse (SEARCH)

  1. Input struktur
    1. Hent PDB-id for adenylatkinase (Adk), f.eks. Ved at søge i FBF [http://www.rcsb.org/pdb]. Alternativt få proteintaminosyresekvensen af ​​interesse, fx fra UniProt [http://uniprot.org].
    2. Indtast det fire tegn lange PDB-id til Adk ( f.eks. 1AKE), eller indsæt en proteinsekvens i tekstboksen i panelet "Input struktur eller sekvens".
  2. Hit valg
    1. Klik på den blå "Næste" (Hit valg) knap i det første panel eller bare rul ned til panel B) "Hit selection"Til videre analyse.
    2. Sørg for, at "Limit total number of included structures" skyderen er indstillet til sin maksimale værdi for at inkludere alle strukturer over cutoff.
    3. Sænk "Juster inklusion BitScore cutoff" for at inkludere mere fjernt beslægtede hits eller øg den for at udelukke.
  3. Valgfri hitfiltrering
    1. Klik på den blå "Næste" (Hit valg) knap i det første panel eller bare rul ned til panel C) "Valgfri filtrering af relaterede strukturer til yderligere analyse".
    2. Sørg for, at de valgte hits repræsenterer relevante strukturer ved at inspicere detaljer i tabellen, f.eks. FBF-navn, arter og bundet ligander.
    3. Manuelt forfine den valgte delmængde af strukturer, hvis det er nødvendigt, ved at klikke på rækkerne i tabellen.
      BEMÆRK: Rækker fremhævet med en blå farve viser PDB-id'er, der er valgt til yderligere analyse i efterfølgende faner.

2. Multipel sekvensjusteringsanalyse (ALIGN)

  1. Klik på fanen ALIGN for at udføre sekvensjustering af de valgte strukturer fra fanen SEARCH.
  2. Opsummeringsoversigt
    1. Gennemgå sammenstillingsoversigten i panel A) "Sammenligningsoversigt". Sørg for, at de interesserede områder er justeret og ikke maskeret af huller i en eller flere strukturer.
    2. Om nødvendigt skal du skifte "Redigeringsindstillinger for visningsjustering" og fjerne uønskede PDB-id'er, fx PDB'er med manglende rester.
  3. Sequence alignment analyse
    1. Klik på den blå "Næste" (Analyse) -knap for at udføre sekvensbaseret klyngningsanalyse af de samlede strukturer.
    2. Vælg plot-opsætningen Dendrogram. Indstil klyngen i K-gruppens skyder for at opdele strukturerne i k-grupper.
    3. Du kan eventuelt ændre klyngemetoden, hvis du ønsker det, ved at skifte afkrydsningsfeltet Mere clustering og output.
    4. Resterende bevaringsanalyse
      1. Klik på den blå "Næste" (Bevarelse) -knap for at beregne den kolonnevise restbeskyttelse.
      2. Vælg de indstillede strukturindstillinger for at generere et plot af restbeskyttelsen i hver justeringsposition.
      3. Vælg strukturer i overensstemmelse med PFAM-frøjustering for at vise bevarelse beregnet med hensyn til den tilknyttede PFAM-frøjustering indeholdende repræsentative medlemmer af familien.
    5. Sequence alignment display
      1. Klik på den blå "Næste" (Justering) -knap for at vise den fulde sekvensjustering med visualiseringsværktøjet for browserjustering.

    3. Konstruktion Montering og Analyse (FIT)

    1. Udfør strukturoverlejring ved at indtaste fanen FIT.
    2. Struktur superposition
      1. Skift afkrydsningsfeltet "Vis PDB'er" for at visualisere den justerede proteinN strukturer i browser.
      2. Sørg for, at proteinkonstruktionerne overlejres til tilsvarende og relevante regioner ved visuelle inspektioner. Klik og træk musen over strukturerne for at rotere, og rul til zoom.
      3. Juster strukturernes farve ved at klikke på "Farveindstillinger". Farveindstillinger omfatter justeringsposition, strukturelle variabilitet pr. Position, RMSD-klyngegrupper, sekvensklyngegrupper, justerede regioner og sekundær struktur.
      4. Download de overlejrede strukturer som enten konventionelle PDB-filer eller som en enkelt PyMOL-sessionfil til visualisering i et specialiseret molekylærsynsprogram.
    3. Strukturanalyse
      1. Klik på den blå "Næste" (Analyse) -knap for at udføre strukturbaseret clustering af de indsamlede FBF-strukturer.
      2. Skift RMSD Heatmap i rullemenuen Plot options.
      3. Juster klyngningsindstillingerne, herunder selve klyngemetoden, Ved at skifte afkrydsningsfeltet "Flere klynger og output".
        BEMÆRK: RMSD-data i parvis kan også visualiseres som et dendrogram, et histogram eller et varmekort.
    4. Restkoncentrationer
      1. Klik på den blå "Næste" (RMSF) -knap for at se den strukturelle variabilitet af hver rest (vist som et RMSF-plot) med store sekundære strukturelementer vist i x-aksens marginale områder.
      2. Skift afkrydsningsfeltet Vis B-faktorer til overlejring af krystallografiske B-faktorer i referencestrukturen på RMSF-plottet.

    4. Hovedkomponentanalyse (PCA)

    1. Udfør hovedkomponentanalyse ved at indtaste fanen "PCA".
    2. Visualisering af hovedkomponenterne
      1. Skift afkrydsningsfeltet "Vis pc-trajector" for at visualisere bevægelser, der beskrives af pc'erne med in-browser visualiseringsværktøjet.
      2. Sørg for at "PrinCipal Component 1 "vælges fra den første drop-down menu.
      3. For at visualisere de bevægelser, der beskrives af andre pc'er, skal du vælge den ønskede pc fra rullemenuen "Vælg hovedkomponent".
      4. Skift farvning af bane fra rullemenuen "Farveindstillinger".
      5. Vælg "Variabilitet pr. Position" fra "Farveindstillinger" til farve ved forskydningsstørrelse.
      6. Klik på knappen "Download PDB trajectory" i panelet "Principal Component Visualization" for at få et sporbillede af den bevægelse, der beskrives af pc'erne.
      7. Klik på knappen "Download PyMOL" -session for at generere en PyMOL-sessionfil, der giver bevægelserne som et vektorfelt.
    3. Conformer analyse
      1. Projekt de enkelte strukturer på to udvalgte pc'er ved at klikke på den blå "Næste" (Plot) -knap.
      2. Sørg for, at "PC on X-axis" er indstillet til 1, og "PC oN Y-akse "til 2. For at projektere strukturerne på andre pc'er skal du justere pc nummereringen i overensstemmelse hermed.
      3. Vælg "Cluster by PC Subspace" for at farve strukturerne i plottet ved pc-baseret clustering; "RMSD" til farve ved "RMSD-baseret" clustering; Og "sekvens" til farve ved sekvensbaseret clustering.
      4. Klik på enkelte punkter i plottet for at mærke strukturerne. Alternativt fremhæv en eller flere strukturer i tabellen "PCA conformer plot annotation" under plottet.
      5. Skub pc'erne i skyderen til underrummet for at inkludere flere / mindre pc'er til clusteringsalgoritmen.
    4. Restbidrag
      1. Beregn restbidragene til de enkelte pc'er ved at klikke på den blå "Næste" (Restbidrag) -knap.
      2. Plot bidragene til ekstra pc'er ved at inkludere pc-nummeret i tekstboksen "Vælg hovedkomponent".
      3. Skift "Spread liNes "afkrydsningsfeltet undgå at plotte restbidragene oven på hinanden.
      4. Sæt afkrydsningsfeltet "Multiline plot" af for at plotte restbidragene i separate plot.
      5. Skift "Vis RMSF" for at inkludere RMSF-værdierne (fra fanen FIT).

    5. Ensemble Normal Mode Analyse (eNMA)

    1. Klik på fanen eNMA for at starte beregning af normale tilstande (NMs).
    2. Filter struktur
      1. Juster antallet af strukturer ved at sænke eller forøge "Cutoff" for strukturinddragelse / udelukkelse.
      2. Klik på det grønne "Run Ensemble NMA" for at starte NMA-beregningen.
    3. Normal modes visualisering
      1. Rul ned til det andet panel på eNMA-fanen (Normal visningsvisualisering) til visualisering af NM'erne.
        BEMÆRK: Som standard vises NM med den højeste overlap (lighed) til PC-1 i det visuelleIzation vindue.
      2. For at visualisere de bevægelser, der beskrives af andre NM'er eller andre FBF-strukturer, skal du vælge den ønskede NM og struktur fra henholdsvis "Vælg tilstand" og "Vis NM til struktur" .
    4. Restkoncentrationer
      1. Klik på den blå "Næste" (Fluktueringer) -knap for at beregne de resterende svingninger af strukturer valgt til eNMA.
      2. Skift "Cluster by RMSD" for at farve fluktuationsprofilerne ved RMSD-baseret clustering.
      3. Skift "Cluster by RMSIP" for at farve fluktuationsprofilerne ved RMSIP-baseret clustering.
      4. Skift afkrydsningsfeltet "Spread lines" for at plotte de grupperede udsvingsprofiler adskilt fra hinanden.
    5. Sammenligning af NMA og PCA
      1. Klik på den blå "Næste" (PCA-vs-NMA) -knap for at beregne ligheden mellem de enkelte NM'er og pc'er.
      2. Vælg en PDB ID fra rullemenuen "Sammenlign NMs of Structure" for at beregne ligheden mellem NM'erne i denne struktur til pc'erne beregnet i PCA-fanen.
    6. Overlapningsanalyse
      1. Klik på den blå "Næste" (Overlap analyse) -knap for at beregne overlapningen mellem beregnede NM'er og strukturforskellevektoren mellem to valgte strukturer.
      2. Vælg et "reference" FBF ID fra rullemenuen "Sammenlign NMs of Structure" og eller et eller flere FBB-id'er i strukturtabellen til den parvise sammenligning med referencebeviserne.
    7. Clustering analyse
      1. Klik på den blå " Næste" (Clustering) -knap for at udføre strukturklyngning baseret på parvis NM-lighed (RMSIP).

Representative Results

Adenylatkinase (Adk) er et allestedsnærværende enzym, som virker for at opretholde ligevægten mellem cytoplasmiske nukleotider, der er essentielle for mange cellulære processer. Adk virker ved at katalysere den reversible overførsel af en phosphorylgruppe fra ATP til AMP. Denne reaktion ledsages af veldokumenterede hastighedsbegrænsende konformationelle overgange 3 , 21 . Her analyserer vi alle tilgængelige Adk strukturer med Bio3D-web for at afsløre detaljerede funktioner og mekaniske principper for disse væsentlige overgange.

Vi kan begynde vores Bio3D-webanalyse af Adk ved at indtaste RCSB PDB-koden for enhver kendt Adk-struktur. Hvis du f.eks. Indtaster PDB ID 1AKE i panel A i SEARCH-fanen, returneres 167 lignende lignende strukturer, hvorfra top 26 automatisk vælges til yderligere analyse (se panel B). Annotationen præsentererEd i panel C viser, at disse udvalgte strukturer er alle fra E. coli, blev løst ved røntgendiffraktion i en række rumgrupper; Har et opløsningsområde på 1,63 til 2,8 Å og blev krystalliseret med en række forskellige ligander (inklusiv ingen ligander, AMP, ADP, MG og inhibitoren AP5). Bemærk, at yderligere annotationsoplysninger kan vises ved at klikke på "Vis / Skjul kolonner" i panel C.

Multipel sekvensjustering udføres ved indtastning af ALIGN-fanen. Det første panel på ALIGN-fanen viser et resumé af justeringen, der giver detaljer om antallet af rækkefølge rækker (svarende til antallet af PDB strukturer) samt antallet af positioner ( dvs. justeringskolonner). Dette omfatter en specifikation af antallet af mellemrum og ikke-mellemrum indeholdende kolonner. Figuren på højre side af første række giver en skematisk gengivelse af sekvensjusteringen. Her thE grå områder repræsenterer ikke-mellemliggende positioner, mens hvide områder i justeringen svarer til huller. En repræsentation af sekvensbevarelsen er vist over indretningen med røde områder, der indikerer velbevarede positioner, og hvide indikerer mindre konserverede. Bemærk at sekvenserne i denne figur er bestilt ud fra deres lighed, der leveres af clustering dendrogrammet på venstre side. Det andet panel i denne fane letter yderligere klyngning af de valgte PDB'er baseret på deres parvise sekvenslighed, som kan visualiseres enten som et dendrogram eller et varmekort. Som standard vises et dendrogram (eller trædiagram), der repræsenterer arrangementet af klynger. Dendrogrammets y-akse repræsenterer afstanden (i forhold til sekvensidentitet) mellem klyngerne.

Struktur superposition udføres automatisk ved indtastning af fanen FIT. De overlejrede strukturer, der vises interaktivt i panel A, indicaI nærvær af en forholdsvis stiv kerneområde (omfatter rester 1-29, 68-117 og 161-214; se panelet "Valgfri kerne og RMSD detaljer" nederst på FIT-fanen for detaljer). To yderligere variable nukleotidbindende regioner (rester 30-67 og 118-167) er også tydeligt synlige ( figur 2 ). RMSD-baserede clustering grupper disse strukturer i to forskellige konformationer.

Ved at klikke på fanen PCA vises mere tydeligt forholdet mellem strukturerne i form af forskydningerne af disse regioner, der effektivt lukker de bundne nucleotidarter i beslægtede strukturer ( figur 2B og 2C ). Størstedelen af ​​strukturer er i "lukket" form (blå i figur 2C ) og er forbundet med en bundet ligand eller inhibitor. I modsætning hertil er flere "åbne" konformationer nukleotid og inhibitorfri. Dette er i overensstemmelse medDen omfattende undersøgelse af Adk struktur og dynamik, der indikerer, at en åben konfiguration af disse regioner er påkrævet for nukleotidbinding og en lukket konformation til effektiv phosphoryloverførsel og undertrykkelse af skadelige hydrolysehændelser. Det er bemærkelsesværdigt, at en enkelt pc indfanger 97% af den samlede gennemsnitlige kvadratforskydning i denne Adk-struktur, og giver en klar og overbevisende beskrivelse af den åbne til lukkede overgang sammen med de individuelle restbidrag til denne funktionelle forskydning (panel C i appen Og figur 2 ).

At besøge fanen NMA og øge antallet af strukturer, der anses for beregning (ved at reducere cutoff til filtrering af lignende strukturer) indikerer, at åbne state-strukturer viser forbedret lokal og global dynamik i sammenligning med strukturerne med lukket form ( Figur 2D og panel C i app) . Sammenligning af PCA og NMA resultater forIndividuelle strukturer (panel D) indikerer, at den første tilstand af alle åbne formstrukturer viser en relativ høj overlapning til PC1 (med en middelværdi på 0,37 ± 0,04). Til gengæld viser lukkede formstrukturer lavere værdier (med et gennemsnit på 0,30 ± 0,01). RMSIP-værdier for åbne formstrukturer (0,62 ± 0,003) er også højere end de af lukkede strukturer (0,56 ± 0,008). Derudover viser overlapningsanalyse, at de første tilstande i den åbne tilstand er i god overensstemmelse med konformationsændringen, som beskriver forskellen mellem de åbne og lukkede stater (panel E). Klyngning baseret på RMSIP-værdier viser igen en konsekvent partitionering af åbne og lukkede tilstandsstrukturer (panel F).

Samlet set indikerer disse resultater eksistensen af ​​to store forskellige konformationelle tilstande til Adk. Disse adskiller sig ved en kollektiv lavfrekvent forskydning af to nukleotidbindende stedområder, der udviser særskilte fleksibiliteterLiger ved nukleotidbinding.

figur 1
Figur 1: Bio3D-web oversigt med skærmbilleder af PCA- og NMA-fanerne. Bio3D-web tager en bruger tilvejebragt proteinstruktur eller sekvens som input i SEARCH-fanen ( 1 ). Serveren giver en liste over relaterede strukturer, som kan vælges til yderligere analyse. ( 2 ) Fanen ALIGN giver sekvensjustering og analyse af de strukturer, der er valgt i SEARCH-fanen. ( 3 ) I FIT-fanen er alle strukturer overlejret og visualiseret i 3D sammen med resultaterne af konventionel parvis strukturanalyse. ( 4 ) Hovedkomponentanalyse af struktursættet udføres i PCA-fanen for at karakterisere inter-conformer-relationer. ( 5 ) Normal tilstandsanalyse på hver struktur kan udføres i eNMA-fanenAt udforske dynamiske tendenser for de tilgængelige strukturelle tilstande. Klik her for at se en større version af denne figur.

Figur 2
Figur 2: Resultater af Bio3D-webanalyse af adenylatkinase. ( A ) Tilgængelige PDB strukturer af adenylat kinase overlejret på den identificerede invariant kerne. Strukturer er farvet efter RMSD-baseret clustering, der findes på fanen FIT. ( B ) Visualisering af de vigtigste komponenter er tilgængelig fra PCA-fanen for at karakterisere de store konformationsvariationer i datasættet. Her er banen, der svarer til den første hovedkomponent, vist i rørrepræsentation, der viser proteinens storskala lukkende bevægelse. ( C ) Strukturer er prUdstødt på deres to første hovedkomponenter i et konformeret diagram, der viser en lavdimensionel repræsentation af konformationsvariabiliteten. Hver prik (eller struktur) er farvet efter brugerspecificerede kriterier, i dette tilfælde PCA-baserede klyngningsresultater. ( D ) Normal tilstandsanalyse i fanen eNMA foreslår forbedret lokal og global dynamik for strukturer i åben tilstand (rød) i forhold til de lukkede form (blå) strukturer. Klik her for at se en større version af denne figur.

Discussion

Bio3D-web kan bruges til interaktivt at undersøge og kortlægge de strukturelle, dynamiske og funktionelle tilstande af proteiner fra tilgængelige krystallografiske strukturer. Desuden kan de NMA- og PCA-baserede klyngningsresultater sammen med annotations- og sekvensbaseret analyse være særligt nyttige til udvælgelse af repræsentative strukturer til mere tidskrævende analyser, såsom ensemble-småmolekyl docking eller molekylære dynamik simuleringer. Bio3D-web muliggør således avanceret strukturel bioinformatikanalyse til et bredere udvalg af forskere ved at reducere det krævede niveau af teknisk ekspertise. Det nuværende design af Bio3D-web understreger enkelhed over udtømmende inddragelse af de mange analysemetoder, der findes i den komplette, selvstændige Bio3D-pakke. I mange tilfælde er det meningen, at forskere vil bruge Bio3D-web til at forstå generelle tendenser i deres proteinfamilie eller superfamilie af interesse, som så kan informere mere specialiserede analyser. Bio3D-web erRefore designet til hurtigt at udforske biomolekylære struktur datasæt og at fungere som et hypotese-genererende værktøj. Vi opfordrer brugere til yderligere at udforske deres data ved at give eksempel Bio3D-kode i den reproducerbare rapport, der også lagrer alle forespørgselsdetaljer og analyseresultater.

I det repræsentative eksempelprotokol ovenfor viser vi Bio3D-webens evne til at afsløre strukturelle funktioner i funktionelle konformationelle overgange af Adk. Yderligere applikationer af Bio3D-web omfatter strukturel og dynamisk analyse af brugeroploadede PDB strukturer. For eksempel kan brugeren uploade nye strukturer eller faktisk proteinsekvenser til analyse. De ovennævnte analysestrin, især eNMA-skridtet, kan afsløre både lokale og globale trends i proteinbevægelser, hvor kollektive bevægelser har funktionel betydning. Sammenligning med apo strukturer kan også afsløre egenskaber ved ubundne konformationelle overgange. Yderligere eksempler på ansøgning tilEn række forskellige proteinfamilier leveres online.

Selv om alle proteiner er fleksible og dynamiske enheder, har ikke alle proteiner atomopløsningsstrukturer tilgængelige i en række forskellige tilstande ( f.eks. Aktive og inaktive stater). Vores opfattelse af proteinstrukturrum er således en begrænset, og derfor er indsigten opnået fra værktøjer som Bio3D-web nødvendigvis også begrænset til visse proteiner. Men med de nuværende teknologiske fremskridt og nye initiativer for strukturelle genomik bliver protokollen, der præsenteres her, i stigende grad en vigtig rute for at få indsigt i vigtige struktur-funktionsforhold. Et kritisk trin, som er særligt vigtigt ved analyse af mere fjernt beslægtede proteiner, er den potentielle fremkomst af justeringsfejl i ALIGN-fanen. Justeringsfejl vil uundgåeligt forekomme, når sekvensliknigheden falder under 30%, og brugeren skal i sådanne tilfælde dobbelttjekke og korrigere sekvensjusteringenI fanen ALIGN. Justeringsfejl vil muligvis resultere i ukorrekte overlejrede strukturer i FIT-fanen og maskere de mest relevante konformationsvariationer for den efterfølgende PCA. Derudover skal brugeren være opmærksom på manglende rester i de valgte PDB strukturer, da i den nuværende implementerings-PCA kun kan udføres på proteinrester, hvor alle strukturer har deres tilsvarende carbon-alpha atom opløst. Hvis et udvalgt PDB har uopløste rester for en bestemt region af proteinet, vil denne region derfor blive udeladt fra PCA.

Bio3D-web er i øjeblikket begrænset til analysen af ​​enkeltkæde PDB strukturer. Følgelig kan funktionelle bevægelser, der forekommer på kvaternærniveau, ikke udforskes ved anvendelse af den nuværende protokol. Selv om vi i øjeblikket udvikler nye algoritmer til at inkludere en sådan analyse i Bio3D-web, er den eneste nuværende mulighed via konventionel Bio3D-anvendelse.

Bio3D-web er den eneste online applikationIon, der gør det muligt at forespørge og identificere struktursæt, fortolke deres mønstre af sekvens og strukturelle variabilitet og udvinde mekanistiske informationer fra både analyse og forudsigelse af deres strukturelle plasticitet. En bred vifte af molekylære visualiseringsværktøjer og online-servere gør det muligt for forskere at udforske og analysere individuelle biomolekylære strukturer. Eksisterende værktøjer til analyse af sekvens, struktur og dynamik hos store heterogene proteinfamilier kræver ofte betydelig databehandlingskompetence og forbliver kun tilgængelige for brugere med relevant programmeringsfærdigheder. For eksempel Bio3D pakke kræver R8, Prody kræver python og Maven kræver Matlab viden 9, 10. Bio3D-web i kontrast kræver ingen programmeringskendskab og øger dermed tilgængeligheden og reducerer adgangsbarrieren til at udføre avanceret komparativ sekvens, struktur og dybNamikanalyse. Desuden er forberedelsen, kurering, annotering og oprydning af molekylære strukturer, som ofte er nødvendig til effektiv analyse, inkluderet i Bio3D-webtjenesten. Yderligere begrænses begrænsningen til at udføre en sådan analyse på mulige beregningsmæssige ressourcer af vores server-instans, der muliggør storskala analyse af mange strukturer, der kan initieres og styres fra enhver moderne webbrowser.

Åben udvikling af Bio3D-web er i gang (se https://bitbucket.org/Grantlab/bio3d). Vi fortsætter med at tilføje ny analysefunktionalitet og forbedre eksisterende metoder. Fremtidig udvikling vil fokusere på tilføjelse af fjernmatrixbaseret PCA og torsions-PCA, mere omfattende sekvensbevaringsmetoder, der omfatter en fylogenetisk komponent, identifikation af ensemblebindingssted og nye tilgange til dynamisk netværksanalyse på tværs af proteinfamilier. I denne henseende repræsenterer den aktuelle webapplikation startpunktetT for mange andre samarbejdsvillige strukturelle bioinformatiske analyse-arbejdsgange ved at muliggøre reproducerbare og delbare trin på brugerdefinerede eksperimentelle struktursæt. Vi planlægger også fremtidig support af rekonstruerede biologiske enheds koordinatsæt ud over individuelle og flere kæder fra den asymmetriske enhed af PDB strukturer. Yderligere funktioner omfatter forbedret opbevaring og indlæsning af samarbejdspartnere sammen med en mulighed for at fortryde.

Bio3D-web er en online ansøgning til interaktiv analyse af biomolekylære strukturdata. Bio3D-web kører på en hvilken som helst moderne webbrowser og giver funktionalitet til: (1) Identifikationen af ​​relaterede proteinstruktur sætter til brugerdefinerede tærskler af lighed; (2) deres multiple alignment og struktur superposition; (3) Bevaringsanalyse af sekvens og struktur; (4) Inter-conformer-forholdskortlægning med hovedkomponentanalyse, og (5) sammenligning af forudsagt intern dynamik via ensemble ellerMal mode analyse. Denne integrerede funktionalitet giver en komplet arbejdsgang til undersøgelse af sekvens-struktur-dynamiske relationer inden for proteinfamilier og superfamilier. Ud over en praktisk nem at bruge dynamisk grænseflade til at udforske effekterne af parametervalg og metodevalg registrerer Bio3D-web også den komplette brugerindgang og efterfølgende grafiske resultater af en brugers session. Dette giver brugerne mulighed for nemt at dele og reproducere sekvensen af ​​analysestrin, der skabte deres resultater. Bio3D-web implementeres udelukkende i R-sprog og er baseret på Bio3D- og Shiny R-pakkerne. Den kan køres fra vores online-server eller installeres lokalt på en hvilken som helst computer, der kører R. Dette omfatter lokal serverinstallation til at levere en brugerdefineret multi-bruger-instans med adgang til prioriterede strukturelle datasæt som dem, der er almindelige inden for lægemiddelindustrien. Fuld kildekode og omfattende dokumentation findes under en GPL-3 open source-licens fra: http://thegrantlab.org/ Bio3d / webapps

Disclosures

Forfatterne erklærer, at de ikke har nogen konkurrerende finansielle interesser.

Acknowledgments

Vi takker Dr. Guido Scarabelli og Hongyang Li for omfattende test gennem udvikling samt Bio3D bruger samfund og Universitetet i Bergen strukturelle bioinformatik workshop deltagere til feedback og kommentarer, der har forbedret denne ansøgning.

Materials

Name Company Catalog Number Comments
Bio3D-web
Web-site http://thegrantlab.org/bio3d-web/
Requirements Web browser

DOWNLOAD MATERIALS LIST

References

  1. Kornev, A. P., Taylor, S. S. Dynamics-Driven Allostery in Protein Kinases. Trends Biochem. Sci. 40 (11), 628-647 (2015).
  2. Yao, X. -Q., Grant, B. J. Domain-opening and dynamic coupling in the α-subunit of heterotrimeric G proteins. Biophys. J. 105 (2), L08-L10 (2013).
  3. Henzler-Wildman, K. A., et al. Intrinsic motions along an enzymatic reaction trajectory. Nature. 450 (7171), 838-844 (2007).
  4. Boehr, D., Nussinov, R., Wright, P. The role of dynamic conformational ensembles in biomolecular recognition. Nat. Chem. Biol. 5 (11), 789-796 (2009).
  5. Teilum, K., Olsen, J. G., Kragelund, B. B. Functional aspects of protein flexibility. Cell Mol Life Sci. 66 (14), 2231-2247 (2009).
  6. Henzler-Wildman, K., Kern, D. Dynamic personalities of proteins. Nature. 450 (7172), 964-972 (2007).
  7. Grant, B. J., Gorfe, A. A., McCammon, J. A. Large conformational changes in proteins: signaling and other functions. Curr. Opin. Struct. Biol. 20 (2), 142-147 (2010).
  8. Grant, B. J., Rodrigues, A. P. C., ElSawy, K. M., McCammon, J. A., Caves, L. S. D. Bio3d: an R package for the comparative analysis of protein structures. Bioinformatics. 22 (21), 2695-2696 (2006).
  9. Bakan, A., Meireles, L. M., Bahar, I. ProDy: protein dynamics inferred from theory and experiments. Bioinformatics. 27 (11), 1575-1577 (2011).
  10. Zimmermann, M. T., Kloczkowski, A., Jernigan, R. L. MAVENs: motion analysis and visualization of elastic networks and structural ensembles. BMC Bioinformatics. 12 (1), 264 (2011).
  11. Yang, L. -W., et al. oGNM: online computation of structural dynamics using the Gaussian Network Model. Nucleic Acids Res. 34, 24-31 (2006).
  12. Suhre, K., Sanejouand, Y. -H. ElNemo: a normal mode web server for protein movement analysis and the generation of templates for molecular replacement. Nucleic Acids Res. 32, W610-W614 (2004).
  13. Tiwari, S. P., et al. WEBnm@ v2.0: Web server and services for comparing protein flexibility. BMC Bioinformatics. 15 (1), 427 (2014).
  14. Hrabe, T., et al. PDBFlex: exploring flexibility in protein structures. Nucleic Acids Res. 44, D423-D428 (2016).
  15. Skjærven, L., Jariwala, S., Yao, X. -Q., Grant, B. J. Online interactive analysis of protein structure ensembles with Bio3D-web. Bioinformatics. , first published online (2016).
  16. Skjærven, L., Yao, X., Scarabelli, G., Grant, B. J. Integrating protein structural dynamics and evolutionary analysis with Bio3D. BMC Bioinformatics. 15 (399), 1-11 (2014).
  17. Eddy, S. R. Accelerated Profile HMM Searches. PLoS Comput. Biol. 7 (10), (2011).
  18. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  19. Berman, H. M. The Protein Data Bank. Nucleic Acids Res. 28 (1), 235-242 (2000).
  20. Finn, R. D., et al. Pfam: the protein families database. Nucleic Acids Res. 42, D222-D230 (2014).
  21. Kerns, S. J., et al. The energy landscape of adenylate kinase during catalysis. Nat. Struct. Mol. Biol. 22 (2), 124-131 (2015).

Tags

Biochemistry Protein struktur analyse Protein dynamik Principal komponent analyse Normal mode analyse
Undersøgelse Proteinsekvens-struktur-dynamik Forhold med Bio3D-web
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Jariwala, S., Skjærven, L.,More

Jariwala, S., Skjærven, L., Yao, X. Q., Grant, B. J. Investigating Protein Sequence-structure-dynamics Relationships with Bio3D-web. J. Vis. Exp. (125), e55640, doi:10.3791/55640 (2017).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter