Investigating Protein Sequence-structure-dynamics Relationships with Bio3D-web

Shashank Jariwala; Lars Skj&#230;rven; Xin-Qiu Yao; Barry J. Grant

doi:10.3791/55640

JoVE Journal > Biochemistry

Please note that all translations are automatically generated. Click here for the English version.

Biochemistry

Undersökande Proteinsekvens-struktur-dynamik Förhållanden med Bio3D-webben

Published: July 16, 2017

doi:

10.3791/55640

Shashank Jariwala*¹, Lars Skjærven*², Xin-Qiu Yao, Barry J. Grant

¹Department of Computational Medicine and Bioinformatics,University of Michigan Medical School, ²Department of Biomedicine,University of Bergen

Summary

Ett protokoll för online-undersökning av proteinsekvens-struktur-dynamikrelationer som använder Bio3D-web presenteras.

Abstract

Vi demonstrerar användningen av Bio3D-web för den interaktiva analysen av biomolekylära strukturdata. Bio3D-webbapplikationen ger online-funktionalitet för: (1) Identifieringen av relaterade proteinstrukturuppsättningar till användardefinierade tröskelvärden av likhet; (2) Deras multipla inriktning och struktur superposition; (3) Bevarande analys av sekvens och struktur; (4) Inter-conformer-förhållande kartläggning med huvudkomponentanalys, och (5) jämförelse av förutsedd intern dynamik via ensemble normallägesanalys. Denna integrerade funktionalitet ger ett komplett arbetsflöde online för att undersöka sekvensstrukturen-dynamiska relationer inom proteinfamiljer och superfamiljer.

Introduction

Proteindatabanken (PDB) innehåller nu mer än 120 000 proteinstrukturer – varav många är av samma proteinfamilj men löses under olika experimentella förhållanden. Dessa multipla strukturer representerar en ovärderlig resurs för förståelse av intricacies av proteinform och funktion. Till exempel kan den rigorösa jämförelsen av dessa strukturensembler avslöja viktiga molekylära mekanismer ¹ ^, ² ^, ³ och informera om konformationsdynamik involverad i processer innefattande ligandbindning, enzymatisk katalys och bi-molekylär igenkänning ⁴ ^, ⁵ ^, ⁶ ^, ⁷ . Nya insikter kan ofta erhållas från den detaljerade storskaliga analysen av proteinfamiljernas sekvens, struktur och dynamik. Detta kräver emellertid vanligtvis en stor bioinfOrmatik och datorprogrammeringskompetens tillsammans med bekantskap med de proteinsystem som studeras. Till exempel kräver programvarupaket som Bio3D, ProDy och Maven programmering i R, Python och Matlab, respektive ⁸ ^, ⁹ ^, ¹⁰ . Omvänt är onlineverktyg för analys av strukturell flexibilitet i allmänhet begränsad till undersökningen av enskilda strukturer ¹¹ ^, ¹² . Ett undantag i detta avseende är den nyligen utvecklade WebNM @ -servern, som möjliggör jämförelse av flexibilitetsmönster som erhållits från normallägesanalys (NMA) av flera förinställda användardefinierade strukturer ¹³ . Emellertid saknar den här servern ett automatiserat förfarande för identifiering av strukturer för jämförelse, anpassning eller ytterligare analys utöver NMA. Ett annat nyligen bidrag är den online PDBFlex databasen, som presenterar pre-cOmstridd analys av PDB-strukturer som delar 95% eller högre sekvensidentitet ¹⁴ . Analys av mer varierande strukturuppsättningar är emellertid inte tillgänglig för närvarande.

Vi har tidigare presenterat Bio3D-web – en enkel att använda webbapplikation för analys av proteinsekvens-struktur-dynamiska relationer ¹⁵ . Bio3D-web är unik för att tillhandahålla lättanvänd integrerad funktionalitet för identifiering, jämförelse och detaljerad analys av stora homologa strukturuppsättningar online. Här presenterar vi ett detaljerat protokoll för online-undersökning av proteinsekvens-struktur-dynamik förhållande med Bio3D-web. Bio3D-web ger en mängd olika funktioner för att stödja de fem huvudstegen i dataanalys som visas i Figur 1 och diskuteras i detalj nedan. Dessa steg utgör ett arbetsflöde som sträcker sig från frågesekvens eller strukturinmatning, genom flera nivåer av sekvensstruktur-dynamisk analys, för att sammanfattaY rapportgenerering. Resultatet är tillgängligt omedelbart genom omfattande visualisering och plottningsinställningar i webbläsaren, liksom genom att ladda ner resultatfiler i vanliga format. Förutom ett bekvämt användarvänligt dynamiskt gränssnitt för att utforska effekterna av parameter- och metodval, registrerar Bio3D-web också den fullständiga användarinmatningen och efterföljande grafiska resultat av en användares session som en delbar reproducerbar rapport i PDF-, DOC- och HTML-format. Användarsessioner kan sparas och laddas om i framtida tider och slutföra resultat som hämtas och tolkas ytterligare av Bio3D R-paketet på en användares lokala maskin.

Bio3D-web drivs av Bio3D R-paketet för analys av biomolekylär struktur, sekvens- och molekylsimulationsdata ⁸ ^, ¹⁶ . I synnerhet Bio3D-algoritmer för identifiering av styvkärnor ⁸ , överlagring, huvudkomponentanalys(PCA) ⁸ och ensemble normallägesanalys (eNMA) ¹⁶ utgör grunden för ansökan. Vi utnyttjar också Bio3D-protokoll som beror på pHMMER ¹⁷ för identifiering av relaterade proteinkonstruktioner och MUSCLE ¹⁸ för multipel sekvensinriktning. Struktur- och sekvensanmärkningar härleds via Bio3D-verktyg från RCSB PDB ¹⁹ och PFAM-databaser ²⁰ . Bio3D-web kan köras från vår webbserver eller installeras lokalt på vilken dator som helst som körs. Bio3D-webben är öppen för alla användare och tillhandahålls gratis under en GPL-3 öppen källkod från: http: // thegrantlab. org / bio3d / webapps

Protocol

OBS! En typisk Bio3D-webbsession fortsätter genom fem på varandra följande och beroende stegen (se figur 1 för en schematisk representation). Varje steg implementeras som en efterföljande navigeringsflik i webbapplikationen, nämligen SEARCH, ALIGN, FIT, PCA och eNMA. 1. Struktursökning och urval (SÖK) Input struktur Hämta PDB-ID för adenylatkinas (Adk), t.ex. genom att söka PDB [http://www.rcsb.org/pdb]. Alternativt erhåller du protein aminosyrasekvensen av intresse, t.ex. från UniProt [http://uniprot.org]. Ange det fyra teckens långa PDB-ID för Adk ( t.ex. 1AKE), eller klistra in en proteinsekvens, till textrutan i panelen "Input struktur eller sekvens". Hit-val Klicka på den blå knappen "Nästa" (Hit-val) i den första panelen eller bläddra helt enkelt ner till panel B) "Hit selection"För vidare analys. Se till att glidreglaget "Limit total antal medföljande strukturer" är inställt på sitt maximala värde för att inkludera alla strukturer ovanför cutoff. Sänk "Justera BitScore cutoff" för att inkludera mer distansrelaterade träffar, eller öka den för att utesluta. Valfri träfffiltrering Klicka på den blå knappen "Nästa" (Hit-val) i den första panelen eller bläddra helt enkelt till panel C) "Valfri filtrering av relaterade strukturer för vidare analys". Se till att de valda träffarna representerar relevanta strukturer genom att inspektera detaljer i tabellen, t.ex. PDB-namn, art och bundna ligander. Manuellt förfina den valda delmängden av strukturer vid behov genom att klicka på raderna i tabellen. OBS! Rader markerade med en blå färg visar PDB-ID: er som valts för vidare analys i efterföljande flikar. 2. Multipel sekvensjusteringsanalys (ALIGN) Klicka på fliken ALIGN för att utföra sekvensinriktning av de valda strukturerna från fliken SÖK. Anpassningsöversikt Granska sammanställningsöversikten i panel A) "Sammanställningssammanfattning". Se till att intressanta regioner är inriktade och inte maskerade av luckor i en eller flera strukturer. Om så behövs byt du "Redigeringsalternativ för visningsjustering" och tar bort oönskade PDB-ID, t.ex. PDB-nummer med saknade rester. Sekvensanalysanalys Klicka på den blå knappen "Nästa" (Analys) för att utföra sekvensbaserad klusteranalys av de samlade strukturerna. Välj plottalternativet Dendrogram. Justera klustret till K-gruppens reglage för att partitionera strukturerna i k-grupper. Ändra eventuellt klustringsmetoden om så önskas genom att växla i kryssrutan Mer kluster och utdata. </ol> Resteringsskyddsanalys Klicka på den blå knappen "Nästa" (Conservation) för att beräkna kolumnvis restskydd. Välj Strukturuppsättningssatserna för att generera en plottning av restbehållningen vid varje anpassningsposition. Välj Strukturer i linje med PFAM-fröjustering för att visa bevarande beräknad med hänsyn till den associerade PFAM-fröjusteringen som innehåller representativa familjemedlemmar. Sequence alignment display Klicka på den blå knappen "Nästa" (Alignment) för att visa fullständig sekvensjustering med visualiseringsverktyget i webbläsaren. 3. Strukturmontering och -analys (FIT) Utför strukturöverlagring genom att öppna FIT-fliken. Struktur superposition Växla i rutan Visa Visa PDB för att visualisera den anpassade proteiN strukturer i webbläsaren. Se till att proteinkonstruktionerna överlagras till motsvarande och relevanta regioner genom visuella inspektioner. Klicka och dra musen över strukturerna för att rotera och bläddra för att zooma. Justera strukturerna genom att klicka på "Färgalternativ". Färgalternativen innefattar anpassningsposition, strukturell variabilitet per position, RMSD-gruppgrupper, sekvensgruppsgrupper, inriktade regioner och sekundärstruktur. Hämta de överlagrade strukturerna som antingen konventionella PDB-filer eller som en enda PyMOL-sessionfil för visualisering i ett specialiserat molekylärvisarprogram. Strukturanalys Klicka på den blå knappen "Nästa" (Analys) för att utföra strukturbaserad gruppering av de samlade PDB-strukturerna. Växla RMSD-värmekartan i rullgardinsmenyn Plot-alternativ. Justera klustringsalternativen, inklusive själva klustringsmetoden, Genom att växla i kryssrutan "Mer clustering och utmatningsalternativ". OBS: Parvis RMSD-data kan också visualiseras som en dendrogram, ett histogram eller en värmekarta. Återstoden svängningar Klicka på den blå knappen "Nästa" (RMSF) för att se strukturell variabilitet för varje rest (visas som en RMSF-plot) med större sekundära strukturelement som visas i marginalområdena på x-axeln. Växla rutan Visa B-faktorer för att överlappa kristallografiska B-faktorer i referensstrukturen på RMSF-diagrammet. 4. Huvudkomponentanalys (PCA) Utför huvudkomponentanalys genom att öppna fliken "PCA". Visualisering av huvudkomponenterna Växla kryssrutan "Visa PC-banan" för att visualisera rörelser som beskrivs av datorerna med hjälp av webbläsarens visualiseringsverktyg. Se till att "PrinCipal Component 1 "väljs från den första rullgardinsmenyn. För att visualisera de rörelser som beskrivs av andra datorer väljer du önskad dator från rullgardinsmenyn "Välj huvudkomponent". Ändra färgning av banan från rullgardinsmenyn "Färgalternativ". Välj "Variabilitet per position" från "Färgalternativ" till färg genom förskjutningsstyrka. Klicka på "Ladda ner PDB-banan" -knappen i panelen "Principal Component Visualization" för att få en banvy av den rörelse som beskrivs av datorerna. Klicka på knappen "Hämta PyMOL" för att generera en PyMOL-sessionfil som ger rörelserna som ett vektorfält. Conformeranalys Projekt de enskilda strukturerna på två valda datorer genom att klicka på den blå "Nästa" (Plot) -knappen. Se till att "PC på X-axeln" är inställd på 1 och "PC oN Y-axel "till 2. För att projekta strukturerna på andra datorer, justera PC-numreringen i enlighet med detta. Välj "Cluster by PC Subspace" för att färga strukturerna i diagrammet genom PC-baserad klustring; "RMSD" för att färgas genom "RMSD-baserad" klustring; Och "sekvens" för färg genom sekvensbaserad klustring. Klicka på några enskilda punkter i diagrammet för att märka strukturerna. Alternativt kan du markera en eller flera strukturer i tabellen "PCA conformer plot annotation" nedanför diagrammet. Skjut datorerna i mellanslagreglaget för att inkludera fler / mindre datorer för klustringsalgoritmen. Återstoden bidrag Beräkna restbidragen till de enskilda datorerna genom att klicka på den blå knappen "Nästa" (Återstödsbidrag). Skriv in avgifterna för ytterligare datorer genom att inkludera datorns nummer i textrutan "Välj huvudkomponent". Växla "Sprid liNes "kryssrutan undviker att plotta restbidragen ovanpå varandra. Avmarkera kryssrutan "Multiline plot" för att plotta restbidragen i separata tomter. Byt "Visa RMSF" för att inkludera RMSF-värdena (från fliken FIT). 5. Ensemble Normal Mode Analysis (eNMA) Klicka på eNMA-fliken för att initiera beräkning av normala lägen. Filterstruktur Justera antalet strukturer genom att sänka eller öka "Cutoff" för strukturintegration / uteslutning. Klicka på den gröna "Run Ensemble NMA" för att starta NMA-beräkningen. Normallägen visualisering Bläddra ner till den andra panelen i fliken eNMA (Normal Visual Visualization) för visualisering av NM: erna. OBS! Som standard visas NM med den högsta överlappningen (likhet) till PC-1 i det visuellaFönsterfönster. För att visualisera de rörelser som beskrivs av andra NM eller andra PDB-strukturer, välj önskat NM och struktur i respektive menyn "Välj läge" och "Visa NM för struktur" . Återstoden svängningar Klicka på den blå knappen "Nästa" (fluktuationer) för att beräkna de restvisa fluktuationerna av strukturer som valts för eNMA. Byt "Cluster by RMSD" för att färga fluktuationsprofilerna genom RMSD-baserad klustring. Byt "Cluster by RMSIP" för att färga fluktuationsprofilerna genom RMSIP-baserad klustring. Växla kryssrutan "Spridningslinjer" för att plotta de grupperade fluktuationsprofilerna bortsett från varandra. Jämförelse av NMA och PCA Klicka på den blå knappen "Nästa" (PCA-vs-NMA) för att beräkna likheten mellan de enskilda NM: erna och datorerna. Välj en PDB ID från rullgardinsmenyn "Jämför NMs of Structure" för att beräkna likheten mellan NM: erna i denna struktur till de datorer som beräknas i PCA-fliken. Överlappsanalys Klicka på den blå knappen "Nästa" (Överlappsanalys) för att beräkna överlappningen mellan beräknade NM och strukturskillnadsvektorn mellan två valda strukturer. Välj en "referens" PDB ID från rullgardinsmenyn "Jämför NMs of Structure" och eller ett eller flera PDB-ID i strukturtabellen för parvis jämförelse med referens PDB. Clustering analys Klicka på den blå knappen " Nästa" (Clustering) för att utföra strukturkluster baserat på parvis NM-likhet (RMSIP).

Representative Results

Adenylatkinas (Adk) är ett allestädes närvarande enzym som fungerar för att upprätthålla jämvikten mellan cytoplasmiska nukleotider som är väsentliga för många cellulära processer. Adk verkar genom att katalysera den reversibla överföringen av en fosforylgrupp från ATP till AMP. Denna reaktion åtföljs av väl studerade hastighetsbegränsande konformationsövergångar 3 , 21 . Här analyserar vi alla tillgängliga Adk-strukturer med Bio3D-web för att avslöja detaljerade funktioner och mekaniska principer för dessa väsentliga övergångar. Vi kan börja vår Bio3D-webbanalys av Adk genom att ange RCSB PDB-koden för alla kända Adk-strukturer. Om du exempelvis anger PDB ID 1AKE i panelen A i SEARCH-fliken returneras 167 liknande strukturer från vilka toppen 26 väljs automatiskt för ytterligare analys (se panel B). Anteckningen presenterasEd i panel C indikerar att dessa valda strukturer är alla från E. coli, löstes genom röntgendiffraktion i en rad rymdgrupper; Har ett upplösningsområde av 1,63 till 2,8 Å och samkristalliserades med en rad olika ligander (inkluderande inga ligander, AMP, ADP, MG och inhibitorn AP5). Observera att ytterligare information om annotering kan visas genom att klicka på alternativet "Visa / Dölj kolumner" i panel C. Multipel sekvensinriktning utförs vid inmatning av fliken ALIGN. Den första panelen på fliken ALIGN visar en sammanfattning av inriktningen som ger detaljer om antalet sekvensrader (motsvarar antalet PDB-strukturer), liksom antalet positioner ( dvs. inriktningskolumner). Detta inkluderar en specifikation av antalet klyftor och icke-mellanliggande innehållande kolumner. Figuren på högra sidan av första raden ger en schematisk representation av sekvensinriktningen. Här thE gråa områden representerar icke-gap positioner, medan vita områden i anpassningen motsvarar luckor. En representation av sekvensskyddet visas ovanför inriktningen med röda områden som indikerar välbevarade positioner och vit indikerar mindre konserverad. Observera att sekvenserna i denna figur beställs baserat på deras likhet som tillhandahålls av klustringsdendrogrammet på vänster sida. Den andra panelen i den här fliken underlättar ytterligare kluster av de valda PDB: erna baserat på deras parvisa sekvenslikhet, som kan visualiseras antingen som en dendrogram eller en värmekarta. Som standard visas en dendrogram (eller träddiagram) som representerar arrangemanget av kluster. Dendrogrammets y-axel representerar avståndet (i sekvensidentitet) mellan klyftorna. Strukturöverlagring utförs automatiskt vid inmatning av fliken FIT. De överlagda strukturerna, som visas interaktivt i panel A, indicaTe närvaron av en relativt styv kärnregion (omfattar rester 1-29, 68-117 och 161-214; se panelen "Valfri kärna och RMSD detaljer" längst ner på FIT-fliken för detaljer). Två ytterligare variabla nukleotidbindande regioner (rester 30-67 och 118-167) är också klart synliga ( Figur 2 ). RMSD-baserade klustringsgrupper dessa strukturerar i två distinkta konformationer. Att klicka på PCA- fliken visar tydligare förhållandet mellan strukturerna i termer av förskjutningarna i dessa regioner som effektivt stänger över de bundna nukleotidarten i besläktade strukturer ( Figur 2B och 2C ). Majoriteten av strukturerna är i "sluten" form (blå i figur 2C ) och är associerade med en bunden ligand eller inhibitor. I motsats till detta är mer "öppna" konformationer nukleotid och inhibitorfri. Detta överensstämmer medDen omfattande forskningen om Adk struktur och dynamik som indikerar att en öppen konfiguration av dessa regioner krävs för nukleotidbindning och en sluten konformation för effektiv fosforylöverföring och undertryckande av skadliga hydrolyshändelser. Det är anmärkningsvärt att en enda dator fångar 97% av den totala genomsnittliga kvadratförskjutningen i denna Adk-struktur och ger en tydlig och övertygande beskrivning av den öppna till slutna övergången tillsammans med de individuella restbidragen till denna funktionella förskjutning (panel C i appen Och figur 2 ). Att besöka fliken NMA och öka antalet strukturer som beaktas för beräkning (via minskning av cutoff för att filtrera liknande strukturer) indikerar att öppna tillståndsstrukturer visar förbättrad lokal och global dynamik jämfört med strukturerna med sluten form ( Figur 2D och panel C i app) . Jämförande PCA och NMA resultat förIndividuella strukturer (panel D) indikerar att det första läget för alla öppna formstrukturer uppvisar en relativt hög överlappning till PC1 (med ett medelvärde av 0,37 ± 0,04). Däremot uppvisar slutna formstrukturer lägre värden (med ett medelvärde av 0,30 ± 0,01). RMSIP-värden för öppna formstrukturer (0,62 ± 0,003) är också högre än de för slutna strukturerna (0,56 ± 0,008). Dessutom visar överlappsanalys att de första lägena för det öppna tillståndet är i god överensstämmelse med konformationsändringen som beskriver skillnaden mellan de öppna och stängda tillstånden (panel E). Clustering baserat på RMSIP-värden visar igen en konsekvent partitionering av öppna och stängda tillståndsstrukturer (panel F). Sammantaget indikerar dessa resultat förekomsten av två stora distinkta konformationella tillstånd för Adk. Dessa skiljer sig genom en kollektiv lågfrekvensförskjutning av två nukleotidbindande ställningsområden som uppvisar distinkta flexibiLider vid nukleotidbindning. Figur 1: Bio3D-webböversikt med skärmbilder av PCA- och NMA-flikarna. Bio3D-webben tar en användare som tillhandahåller proteinstruktur eller sekvens som input i SEARCH-fliken ( 1 ). Servern ger en lista över relaterade strukturer, som kan väljas för vidare analys. ( 2 ) Fliken ALIGN ger sekvensinriktning och analys av de strukturer som valts i SEARCH-fliken. ( 3 ) I FIT-fliken läggs alla strukturer över och visualiseras i 3D tillsammans med resultaten från konventionell parvis strukturanalys. ( 4 ) Huvudkomponentanalys av strukturuppsättningen utförs i PCA-fliken för att karakterisera inter-conformer-relationer. ( 5 ) Normallägesanalys på varje struktur kan utföras i eNMA-flikenAtt utforska dynamiska trender för de tillgängliga strukturella tillstånden. Vänligen klicka här för att se en större version av denna figur. Figur 2: Resultat av Bio3D-webanalys av adenylatkinas. ( A ) Tillgängliga PDB-strukturer av adenylatkinas överlagrad på den identifierade invariantkärnan. Strukturer är färgade enligt RMSD-baserad klustring som finns på FIT-fliken. ( B ) Visualisering av huvudkomponenterna är tillgänglig från PCA-fliken för att karakterisera de större konformationsvariationerna i datasatsen. Här visas banan som motsvarar den första huvudkomponenten i rörrepresentation som visar proteinens storskaliga stängningsrörelse. ( C ) Strukturerna är prSprutas på sina två första huvudkomponenter i en konformatorisk plot som visar en lågdimensionell representation av konformationsvariabiliteten. Varje punkt (eller struktur) är färgad enligt användarens specificerade kriterier, i det här fallet PCA-baserade klustringsresultat. ( D ) Normallägesanalys i fliken eNMA föreslår förbättrad lokal och global dynamik för strukturer i det öppna läget (rött) i jämförelse med strukturerna med sluten form (blå). Vänligen klicka här för att se en större version av denna figur.

Discussion

Bio3D-web kan användas för att interaktivt utforska och kartlägga de strukturella, dynamiska och funktionella tillstånden av proteiner från tillgängliga kristallografiska strukturer. Vidare kan de NMA- och PCA-baserade klustringsresultaten tillsammans med annotationerna och sekvensbaserad analys vara särskilt användbara för att välja representativa strukturer för mer tidskrävande analys, såsom ensemble-småmolekyldockning eller molekyldynamik-simuleringar. Bio3D-web underlättar således avancerad strukturell bioinformatikanalys för ett bredare spektrum av forskare genom att minska den nödvändiga tekniska kompetensen. Den nuvarande utformningen av Bio3D-web betonar enkelhet över uttömmande införlivande av de många analysmetoder som finns i det fullständiga fristående Bio3D-paketet. I många fall är det tänkt att forskare kommer att använda Bio3D-web för att förstå allmänna trender i deras proteinfamilj eller superfamilj av intresse, som då kan informera mer specialiserade analyser. Bio3D-web är denRefore utformad för att snabbt undersöka biomolekylära strukturdatablad och att fungera som ett hypotesframbringande verktyg. Vi uppmuntrar användare att vidareutveckla sina data genom att tillhandahålla exempel Bio3D-kod i den reproducerbara rapporten som också lagrar alla sökuppgifter och analysresultat.

I det representativa exemplet protokollet ovan visar vi Bio3D-webens förmåga att avslöja de strukturella egenskaperna hos funktionella konformationella övergångar av Adk. Ytterligare applikationer av Bio3D-web inkluderar strukturell och dynamisk analys av användaruppladdade PDB-strukturer. Till exempel kan användaren ladda upp nya strukturer eller faktiskt proteinsekvenser för analys. Analysstegen som nämnts tidigare, särskilt eNMA-steget, kan avslöja både lokala och globala trender i proteinrörelser, med kollektiva rörelser som har funktionell betydelse. Jämförelse med apo strukturer kan också avslöja egenskaper hos obegränsade konformationella övergångar. Ytterligare exempel på ansökan tillEn rad olika proteinfamiljer tillhandahålls online.

Även om alla proteiner är flexibla och dynamiska enheter, har inte alla proteiner atomupplösningsstrukturer tillgängliga i en rad olika tillstånd ( t.ex. aktiva och inaktiva tillstånd). Vår syn på proteinstruktureringsutrymmet är således en begränsad och därför är insikten erhållen från verktyg såsom Bio3D-banan nödvändigtvis också begränsad för vissa proteiner. Med nuvarande tekniska framsteg och nya initiativ för strukturell genomik kommer protokollet som presenteras här emellertid alltmer att bli en viktig väg för att få insikt i viktiga struktur-funktionsrelationer. Ett kritiskt steg, som är särskilt viktigt när man analyserar mer distansrelaterade proteiner, är den potentiella uppkomsten av inriktningsfel i ALIGN-fliken. Justeringsfel uppstår oundvikligen när sekvenslikheten sjunker under 30% och användaren måste i sådana fall dubbelkontrollera och korrigera sekvensinriktningenPå fliken ALIGN. Justeringsfel kan eventuellt resultera i felaktiga överlagrade strukturer i FIT-fliken och maskera de mest relevanta konformationsvariationerna för den efterföljande PCA. Dessutom bör användaren vara medveten om de saknade resterna i de valda PDB-strukturerna, eftersom det i den nuvarande implementerings-PCA endast kan utföras på proteinrester där alla strukturer har motsvarande kolatom-alfa-atom upplöst. Följaktligen, om ett valt PDB har olösta rester för en viss region av proteinet kommer denna region att utelämnas från PCA.

Bio3D-web är för närvarande begränsad till analysen av enkelkedjiga PDB-strukturer. Följaktligen kan funktionella rörelser som förekommer på kvaternär nivå inte undersökas med användning av det aktuella protokollet. Trots att vi för närvarande utvecklar nya algoritmer för att inkludera sådan analys i Bio3D-webben, är det enda strömalternativet via konventionell Bio3D-användning.

Bio3D-web är den enda onlineapplikationenJon som gör det möjligt att fråga och identifiera strukturuppsättningar, tolka deras mönster av sekvens och strukturell variabilitet och extrahera mekanisk information från både analys och förutsägelse av deras strukturella plasticitet. Ett brett sortiment av molekylära visualiseringsverktyg och online-servrar gör det möjligt för forskare att utforska och analysera enskilda biomolekylära strukturer. Men befintliga verktyg för analys av sekvens, struktur och dynamik hos stora heterogena proteinfamiljer kräver ofta stor beräkningskompetens och är typiskt bara tillgängliga för användare med relevanta programmeringsförmåga. Till exempel, kräver Bio3D paketet R ^8, kräver Prody python och Maven kräver Matlab kunskap ^{^9,} ^10. Bio3D-web i kontrast kräver ingen programmeringskunskap och ökar därigenom tillgängligheten och minskar ingångsbarriären för att utföra avancerad jämförande sekvens, struktur och dykaNamikanalys. Vidare ingår beredningen, kuration, annotering och rengöring av molekylära strukturer som ofta är nödvändiga för effektiv analys med Bio3D-webbtjänsten. Dessutom begränsas begränsningen att utföra en sådan analys på kompetenta beräkningsresurser av vår serverinstans som möjliggör storskalig analys av många strukturer som kan initieras och kontrolleras från en modern webbläsare.

Den öppna utvecklingen av Bio3D-webben pågår (se https://bitbucket.org/Grantlab/bio3d). Vi fortsätter att lägga till ny analysfunktionalitet och förbättra befintliga metoder. Framtida utveckling kommer att fokusera på tillsats av avståndsmatrisbaserad PCA och torsions-PCA, mer omfattande sekvenshanteringsmetoder som innefattar en fylogenetisk komponent, identifiering av ensemble-bindningsställen och nya metoder för dynamisk nätverksanalys över proteinfamiljer. I detta avseende representerar den aktuella webbapplikationen startpunktenT för många andra samverkande strukturella bioinformatiska analysflöden genom att möjliggöra reproducerbara och delbara steg på användardefinierade experimentella strukturuppsättningar. Vi planerar också framtida stöd för rekonstruerade biologiska enhetskoordinatsatser utöver enskilda och flera kedjor från den asymmetriska enheten för PDB-strukturer. Ytterligare funktioner inkluderar förbättrad sparning och laddning av samverkande arbetsytor tillsammans med en möjlighet att ångra.

Bio3D-web är en onlineapplikation för interaktiv analys av data om biomolekylär struktur. Bio3D-web körs på alla moderna webbläsare och ger funktionalitet för: (1) Identifieringen av relaterad proteinstruktur sätter till användardefinierade tröskelvärden av likhet; (2) Deras multipla inriktning och struktur superposition; (3) Bevarande analys av sekvens och struktur; (4) Inter-conformer-förhållande kartläggning med huvudkomponentanalys, och (5) jämförelse av förutsedd intern dynamik via ensemble norMallägesanalys. Denna integrerade funktionalitet ger ett komplett arbetsflöde för undersökning av sekvensstruktur-dynamiska relationer inom proteinfamiljer och superfamiljer. Förutom ett bekvämt användarvänligt dynamiskt gränssnitt för att utforska effekterna av parameter- och metodval, registrerar Bio3D-web också den fullständiga användarinmatningen och efterföljande grafiska resultat av en användares session. Detta gör det möjligt för användare att enkelt dela och reproducera sekvensen av analyssteg som skapade deras resultat. Bio3D-web är implementerat helt i R-språk och bygger på Bio3D- och Shiny R-paketen. Den kan köras från vår webbserver eller installeras lokalt på vilken dator som helst som körs R. Detta inkluderar lokal serverinstallation för att tillhandahålla en anpassad multi-användarinstans med tillgång till prioriterade strukturella dataset, såsom de som är gemensamma inom läkemedelsindustrin. Full källkod och omfattande dokumentation tillhandahålls under en GPL-3 öppen källkod från: http://thegrantlab.org/ Bio3d / webapps

Disclosures

The authors have nothing to disclose.

Acknowledgements

Vi tackar Dr. Guido Scarabelli och Hongyang Li för omfattande testning under utveckling samt Bio3D användargemenskapen och Universitetet i Bergen strukturella bioinformatics workshop deltagare för feedback och kommentarer som har förbättrat denna applikation.

Materials

Bio3D-web
Web-site	http://thegrantlab.org/bio3d-web/
Requirements	Web browser

References

Kornev, A. P., Taylor, S. S. Dynamics-Driven Allostery in Protein Kinases. Trends Biochem. Sci. 40 (11), 628-647 (2015).
Yao, X. -. Q., Grant, B. J. Domain-opening and dynamic coupling in the α-subunit of heterotrimeric G proteins. Biophys. J. 105 (2), L08-L10 (2013).
Henzler-Wildman, K. A., et al. Intrinsic motions along an enzymatic reaction trajectory. Nature. 450 (7171), 838-844 (2007).
Boehr, D., Nussinov, R., Wright, P. The role of dynamic conformational ensembles in biomolecular recognition. Nat. Chem. Biol. 5 (11), 789-796 (2009).
Teilum, K., Olsen, J. G., Kragelund, B. B. Functional aspects of protein flexibility. Cell Mol Life Sci. 66 (14), 2231-2247 (2009).
Henzler-Wildman, K., Kern, D. Dynamic personalities of proteins. Nature. 450 (7172), 964-972 (2007).
Grant, B. J., Gorfe, A. A., McCammon, J. A. Large conformational changes in proteins: signaling and other functions. Curr. Opin. Struct. Biol. 20 (2), 142-147 (2010).
Grant, B. J., Rodrigues, A. P. C., ElSawy, K. M., McCammon, J. A., Caves, L. S. D. Bio3d: an R package for the comparative analysis of protein structures. Bioinformatics. 22 (21), 2695-2696 (2006).
Bakan, A., Meireles, L. M., Bahar, I. ProDy: protein dynamics inferred from theory and experiments. Bioinformatics. 27 (11), 1575-1577 (2011).
Zimmermann, M. T., Kloczkowski, A., Jernigan, R. L. MAVENs: motion analysis and visualization of elastic networks and structural ensembles. BMC Bioinformatics. 12 (1), 264 (2011).
Yang, L. -. W., et al. oGNM: online computation of structural dynamics using the Gaussian Network Model. Nucleic Acids Res. 34, 24-31 (2006).
Suhre, K., Sanejouand, Y. -. H. ElNemo: a normal mode web server for protein movement analysis and the generation of templates for molecular replacement. Nucleic Acids Res. 32, W610-W614 (2004).
Tiwari, S. P., et al. WEBnm@ v2.0: Web server and services for comparing protein flexibility. BMC Bioinformatics. 15 (1), 427 (2014).
Hrabe, T., et al. PDBFlex: exploring flexibility in protein structures. Nucleic Acids Res. 44, D423-D428 (2016).
Skjærven, L., Jariwala, S., Yao, X. -. Q., Grant, B. J. Online interactive analysis of protein structure ensembles with Bio3D-web. Bioinformatics. , (2016).
Skjærven, L., Yao, X., Scarabelli, G., Grant, B. J. Integrating protein structural dynamics and evolutionary analysis with Bio3D. BMC Bioinformatics. 15 (399), 1-11 (2014).
Eddy, S. R. Accelerated Profile HMM Searches. PLoS Comput. Biol. 7 (10), (2011).
Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
Berman, H. M. The Protein Data Bank. Nucleic Acids Res. 28 (1), 235-242 (2000).
Finn, R. D., et al. Pfam: the protein families database. Nucleic Acids Res. 42, D222-D230 (2014).
Kerns, S. J., et al. The energy landscape of adenylate kinase during catalysis. Nat. Struct. Mol. Biol. 22 (2), 124-131 (2015).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Jariwala, S., Skjærven, L., Yao, X., Grant, B. J. Investigating Protein Sequence-structure-dynamics Relationships with Bio3D-web. J. Vis. Exp. (125), e55640, doi:10.3791/55640 (2017).

Undersökande Proteinsekvens-struktur-dynamik Förhållanden med Bio3D-webben

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

Undersökande Proteinsekvens-struktur-dynamik Förhållanden med Bio3D-webben

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below