Summary

Onderzoek naar eiwitsequentie-structuur-dynamiek Relaties met Bio3D-web

Published: July 16, 2017
doi:

Summary

Een protocol voor het online onderzoek van eiwitsequentie-structuur-dynamiek relaties met behulp van Bio3D-web wordt gepresenteerd.

Abstract

We tonen het gebruik van Bio3D-web voor de interactieve analyse van biomoleculaire structuurgegevens. De Bio3D-webtoepassing biedt online functionaliteit voor: (1) De identificatie van gerelateerde eiwitstructuren stelt aan de door gebruikers vastgestelde drempels van gelijkenis; (2) Hun meerdere uitlijning en structuur superpositie; (3) Conserveringsanalyse van sequentie en structuur; (4) Inter-conformer relatie mapping met hoofdcomponent analyse, en (5) vergelijking van voorspelde interne dynamiek via ensemble normal mode analyse. Deze geïntegreerde functionaliteit biedt een complete online workflow voor het onderzoeken van sequentie-structuur-dynamische relaties binnen eiwitfamilies en superfamilies.

Introduction

De eiwitdatabank (PDB) bevat nu meer dan 120.000 eiwitstructuren – veel daarvan zijn van dezelfde eiwitfamilie maar worden opgelost onder verschillende experimentele omstandigheden. Deze meervoudige structuren vormen een waardevolle bron voor het begrijpen van de ingewikkeldheden van eiwitvorm en -functie. Bijvoorbeeld, de nauwkeurige vergelijking van deze structuurensembles kan belangrijke moleculaire mechanismen 1 , 2 , 3 onthullen en informeren over conformational dynamics betrokken bij processen die ligandbinding, enzymatische katalyse en bi-moleculaire herkenning 4 , 5 , 6 , 7 omvatten. Nieuwe inzichten kunnen vaak worden verkregen uit de gedetailleerde grootschalige analyse van de sequentie, structuur en dynamiek van eiwitfamilies. Dit vereist echter meestal aanzienlijke bioinfOrmatiek en computerprogrammeringskunde, samen met bekendheid met de onderzochte proteïnesystemen. Bijvoorbeeld, softwarepakketten zoals Bio3D, ProDy en Maven vereisen programmering in respectievelijk R, Python en Matlab, respectievelijk 8 , 9 , 10 . Omgekeerd zijn online tools voor analyse van structurele flexibiliteit over het algemeen beperkt tot het onderzoek van individuele structuren 11 , 12 . Een uitzondering in dit verband is de recent ontwikkelde WebNM @ -server, die het mogelijk maakt om de flexibiliteitspatronen te vergelijken die zijn verkregen uit de normale modusanalyse (NMA) van een aantal vooraf gedefinieerde gebruikersspecifieke structuren 13 . Deze server ontbreekt echter een geautomatiseerde procedure voor het identificeren van structuren voor vergelijking, hun uitlijning of verdere analyse buiten NMA. Een andere recente bijdrage is de online PDBFlex database, die pre-c presenteertOmgekeerde analyse van PDB-structuren die 95% of meer sequentieidentiteit delen 14 . Echter, analyse van meer uiteenlopende structuur sets is momenteel niet beschikbaar.

We hebben eerder Bio3D-web gepresenteerd – een makkelijk te gebruiken webapplicatie voor de analyse van eiwitsequentie-structuur-dynamische relaties 15 . Bio3D-web is uniek in het leveren van eenvoudig geïntegreerde functionaliteit voor de identificatie, vergelijking en gedetailleerde analyse van grote homologe structuur sets online. Hier presenteren wij een gedetailleerd protocol voor het online onderzoek van eiwitsequentie-structuur-dynamiek relatie met behulp van Bio3D-web. Bio3D-web biedt een verscheidenheid aan functies om de vijf belangrijkste stappen van data-analyse, zoals weergegeven in figuur 1, te ondersteunen en in detail hieronder te bespreken. Deze stappen vormen een workflow die zich uitstreekt van querysequentie of structuurinvoer, door meerdere niveaus van sequentie-structuur-dynamische analyse, om samen te vattenY rapportage generatie. Resultaten zijn direct beschikbaar via uitgebreide in-browser visualisatie en plot-apparaten, evenals door het downloaden van resultaatbestanden in veelgebruikte formaten. Naast een handige, makkelijk te gebruiken dynamische interface voor het verkennen van de effecten van parameter- en methodekeuzes, registreert Bio3D-web ook de volledige gebruikersinvoer en daaropvolgende grafische resultaten van de sessie van een gebruiker als een bruikbaar reproduceerbaar rapport in PDF-, DOC- en HTML-formaten. Gebruikersessies kunnen worden opgeslagen en herladen op toekomstige tijden en afronden resultaten worden gedownload en verder geïnterpreteerd door het Bio3D R-pakket op de lokale machine van een gebruiker.

Bio3D-web wordt aangedreven door het Bio3D R pakket voor analyse van biomoleculaire structuur, sequentie en moleculaire simulatie data 8 , 16 . In het bijzonder, Bio3D-algoritmes voor het identificeren van starre kernen 8 , superpositie, hoofdcomponent analyse(PCA) 8 , en ensemble normal mode analyse (eNMA) 16 vormen de basis van de applicatie. We gebruiken ook Bio3D-protocollen die afhankelijk zijn van pHMMER 17 voor de identificatie van gerelateerde eiwitstructuren, en MUSCLE 18 voor meerdere sequentie-uitlijning. Structuur- en volgorde annotaties worden afgeleid via Bio3D utilities uit de RCSB PDB 19 en PFAM databases 20 . Bio3D-web kan worden uitgevoerd vanuit onze online-server of op een computer geïnstalleerd op een computer die rijdt. Bio3D-web is open voor alle gebruikers en wordt gratis geleverd onder een GPL-3 open source licentie van: http: // thegrantlab. org / bio3d / webapps

Protocol

OPMERKING: een typische Bio3D-websessie gaat door vijf opeenvolgende en afhankelijke stappen (zie Figuur 1 voor een schematische weergave). Elke stap wordt geïmplementeerd als een opeenvolgende navigatie tab van de webapplicatie, namelijk SEARCH, ALIGN, FIT, PCA en eNMA. 1. Structuur zoeken en selectie (SEARCH) Invoerstructuur Verkrijg het PDB-ID van adenylaatkinase (Adk), bijvoorbeeld door het PDB te zoeken [http://www.rcsb.org/pdb]. Alternatief, verkrijgen de eiwit aminozuursequentie van belang, bijvoorbeeld uit UniProt [http://uniprot.org]. Voer het 4-letter lange PDB-ID voor Adk in ( bijvoorbeeld 1AKE) of plak een eiwitvolgorde in het tekstvak in het paneel 'Invoerstructuur of -volgorde'. Hit selectie Klik op de blauwe knop 'Volgende' (Hit selectie) in het eerste paneel of blader gewoon naar paneel B) 'Hit selection'Voor verdere analyse. Zorg ervoor dat de schuifregelaar "Limit total number of included structures" op de maximale waarde is ingesteld om alle structuren boven de cutoff te omvatten. Verlaag de "BitScore cutoff aanpassen" om meer verwante hits in te vullen, of verhoog deze om te uitsluiten. Optioneel hit filteren Klik op de blauwe knop "Volgende" (Hit selectie) in het eerste paneel of blader gewoon naar paneel C) "Optioneel filteren van gerelateerde structuren voor verdere analyse". Zorg ervoor dat de geselecteerde hits relevante structuren vertegenwoordigen door de details van de tabel te inspecteren, bijvoorbeeld PDB naam, soort en gebonden liganden. Handmatig verfijn de geselecteerde subset van de structuren, indien nodig, door op de rijen van de tabel te klikken. OPMERKING: Rijen die zijn gemarkeerd met een blauwe kleur tonen PDB-ID's die zijn geselecteerd voor verdere analyse in de volgende tabbladen. 2. Multiple Sequence Alignment Analysis (ALIGN) Klik op het tabblad ALIGN om sequentie-uitlijning van de geselecteerde structuren uit het SEARCH-tabblad uit te voeren. Uitlijning samenvatting Lees de samenvatting samenvatting in paneel A) "Samenvatting overzicht". Zorg ervoor dat de regio's van belang zijn uitgelijnd en niet gemaskeerd worden door openingen in een of meer structuren. Indien nodig, schakel de "Opties voor weergave aanpassing aanpassen" en verwijder ongewenste PDB-ID's, bijvoorbeeld PDB's met ontbrekende residuen. Sequence alignment analyse Klik op de blauwe knop 'Volgende' (Analyse) om sequentie gebaseerde clustering analyse van de verzamelde structuren uit te voeren. Selecteer de plot optie Dendrogram. Stel de cluster in de K-schuifregelaar om de structuren in k-groepen te verdelen. Optioneel verander de clustermethode, indien gewenst, door het selectievakje Meer clustering en uitvoeropties aan te schakelen. </ol> Residue conservation analyse Klik op de blauwe knop 'Volgende' (Behoud) om het kolomgeheugenreserve te berekenen. Selecteer de ingestelde structuur sets om een ​​plot van het residu behoud te genereren in elke uitlijnpositie. Selecteer Structuren uitgelijnd met PFAM-zaadlijnen om bewaring te laten zien, berekend met betrekking tot de bijbehorende PFAM-zaaduitlijning die representatieve leden van de familie bevat. Sequence alignment display Klik op de blauwe knop "Volgende" (Uitlijning) om de volledige volgorde uit te geven met het visualisatieprogramma in de browser. 3. Structuur montage en analyse (FIT) Voer structuur superimpositie door het tabblad FIT in te voeren. Structuur superpositie Schakel het selectievakje Toon PDB's in om het uitgelijste eiwit te visualiserenN structuren in-browser. Zorg ervoor dat de eiwitstructuren door middel van visuele inspecties worden overgelegd aan overeenkomstige en relevante gebieden. Klik en sleep de muis over de structuren om te draaien en blader naar zoom. Pas de kleur van de structuren aan door op de "Kleuropties" te klikken. Kleuropties omvatten uitlijnpositie, structurele variabiliteit per positie, RMSD-clustergroepen, sequentiegroepgroepen, uitgelijnde regio's en secundaire structuur. Download de superposed structuren als gebruikelijke PDB bestanden of als een single PyMOL sessie bestand voor visualisatie in een gespecialiseerd moleculaire kijker programma. Structuuranalyse Klik op de blauwe knop 'Volgende' (Analyse) om op structuur gebaseerde clustering van de verzamelde PDB-structuren uit te voeren. Wissel de RMSD Heatmap in het vervolgkeuzemenu Plotopties. Pas de clustermogelijkheden aan, inclusief de clustermethode zelf, Door het selectievakje 'Meer clustering en uitvoeropties' in te schakelen. OPMERKING: Pairwise RMSD-gegevens kunnen ook worden weergegeven als een dendrogramma, een histogram of een hittekaart. Residue fluctuaties Klik op de blauwe knop 'Volgende' (RMSF) om de structurele variabiliteit van elk residu (weergegeven als een RMSF-grafiek) te bekijken met belangrijke secundaire structuurelementen die in de marginale gebieden van de x-as worden weergegeven. Schakel het selectievakje Toon B-factoren in om de kristallografische B-factoren van de referentiestructuur op het RMSF-plot over te leggen. 4. Hoofdcomponentanalyse (PCA) Voer hoofdcomponentanalyse uit door op het tabblad "PCA" te gaan. Visualisatie van de hoofdcomponenten Schakel het selectievakje Toon PC-traject in om de bewegingen die door de pc's worden beschreven, te visualiseren met het in-browser visualisatieprogramma. Zorg ervoor dat "PrinCipal Component 1 "wordt gekozen uit het eerste dropdown menu. Om de bewegingen van andere pc's te visualiseren, kies de gewenste pc uit het vervolgkeuzemenu 'Kies hoofdcomponent'. Verander de kleur van het traject in het vervolgkeuzemenu 'Kleuropties'. Kies "Variabiliteit per positie" van de "Kleuropties" om op verplaatsingsgrootte te kleuren. Klik op de knop "Download PDB trajectory" in het panel "Principal Component Visualization" om een ​​traject overzicht te krijgen van de door de pc's beschreven beweging. Klik op het 'PyMOL-sessiebestand' downloaden om een ​​PyMOL-sessiebestand te genereren dat de bewegingen als een vectorveld geeft. Converteer analyse Project de afzonderlijke structuren op twee geselecteerde pc's door op de blauwe "Next" (Plot) knop te klikken. Zorg dat "PC on X-axis" is ingesteld op 1 en "PC oN Y-as "op 2. Om de structuren op andere pc's te projecteren, pas de PC-nummering dienovereenkomstig aan. Kies 'Cluster by PC Subspace' om de structuren in de grafiek te kleuren door middel van PC-gebaseerde clustering; "RMSD" om te kleuren door "RMSD-gebaseerde" clustering; En "Sequence" om op volgorde gebaseerde clustering te kleuren. Klik op een aantal punten in het plot om de structuren te markeren. Alternatief, markeer een of meer structuren in de tabel "PCA conformer plot annotation" onder het plot. Schuif de pc's in de schuifbalk van de subruimte om meer / minder pc's voor het clusteringsalgoritme op te nemen. Residuebijdragen Bereken de restbijdragen aan de individuele pc's door op de blauwe knop "Volgende" (Residuebijdragen) te klikken. Bepaal de bijdragen voor extra pc's door het PC-nummer in te voegen in het tekstvak 'Kies hoofdcomponent'. Schakel de "Spread liNes "checkbox vermijden om de restbijdragen bovenop elkaar te plotten. Schakel het selectievakje 'Multiline plot' uit om de restbijdragen in aparte plots te plotten. Schakel de "Show RMSF" in om de RMSF-waarden in te vullen (op het tabblad FIT). 5. Ensemble Normal Mode Analysis (eNMA) Klik op het tabblad eNMA om de normale modi (NMs) berekening te starten. Filter structuur Pas het aantal structuren aan door de "Cutoff" te verlagen of te verhogen voor opbouw / uitsluiting van structuur. Klik op de groene "Run Ensemble NMA" om de NMA-berekening te starten. Normal modus visualisatie Scrol naar beneden naar het tweede paneel van het tabblad eNMA (Normal Visualization Visualization) voor visualisatie van de NM's. OPMERKING: Standaard wordt de NM met de hoogste overlapping (gelijkenis) naar PC-1 weergegeven in het beeldschermIzation venster. Om de bewegingen van andere NM's of andere PDB-structuren te visualiseren, kies de gewenste NM en structuur uit respectievelijk de "Select Mode" en "Show NMs for Structure" . Residue fluctuaties Klik op de blauwe knop 'Volgende' (Fluctuaties) om de resterende schommelingen van de structuren die voor eNMA geselecteerd zijn, te berekenen. Wissel de 'Cluster by RMSD' om de fluctuatieprofielen te kleuren door middel van RMSD-gebaseerde clustering. Wissel de 'Cluster by RMSIP' om de fluctuatieprofielen te kleuren door middel van RMSIP-gebaseerde clustering. Schakel het selectievakje 'Verspreid lijnen' in om de gegroepeerde fluctuatieprofielen van elkaar te plotten. Vergelijking van NMA en PCA Klik op de blauwe knop 'Volgende' (PCA-vs-NMA) om de gelijkenis tussen de individuele NM's en pc's te berekenen. Selecteer een PDB ID uit de vervolgkeuzelijst Vergelijken NMs of Structure om de gelijkenis tussen de NM's van deze structuur te berekenen naar de PC's die in het tabblad PCA worden berekend. Overlappingsanalyse Klik op de blauwe knop 'Volgende' (Overlappanalyse) om de overlapping tussen berekende NM's en de structuurverschilvector tussen twee geselecteerde structuren te berekenen. Selecteer een 'referentie' VOB-ID in de vervolgkeuzelijst 'Vergelijk NMs of Structure' en of een of meer PDB-ID's in de structuur tabel voor de pairwise vergelijking met het referentie PDB. Clustering analyse Klik op de blauwe knop ' Volgende' (Clustering) om structurele clustering uit te voeren op basis van pair-wise NM-gelijkenis (RMSIP).

Representative Results

Adenylaatkinase (Adk) is een alomtegenwoordig enzym dat functioneert om het evenwicht te behouden tussen cytoplasmatische nucleotiden die essentieel zijn voor veel cellulaire processen. Adk werkt door katalyseren van de omkeerbare overdracht van een fosforylgroep van ATP naar AMP. Deze reactie wordt vergezeld van goed bestudeerde snelheidsbeperkende conformiteitsovergangen 3 , 21 . Hier analyseren we alle beschikbare Adk-structuren met Bio3D-web om gedetailleerde functies en mechanistische principes van deze essentiële overgangen te onthullen. We kunnen onze Bio3D-webanalyse van Adk starten door de RCSB PDB-code van een bekende Adk-structuur in te voeren. Bijvoorbeeld, het invoeren van het PDB ID 1AKE in paneel A van het SEARCH tabblad geeft 167 sequentieve vergelijkbare structuren, waarvan de top 26 automatisch wordt geselecteerd voor verdere analyse (zie paneel B). De annotatie aanwezigEd in paneel C geeft aan dat deze geselecteerde structuren allemaal van E. coli zijn, werden opgelost door röntgendiffractie in een reeks van ruimtegroepen; Hebben een resolutie bereik van 1,63 tot 2,8 Å en werden gecristalliseerd met een reeks verschillende liganden (waaronder geen liganden, AMP, ADP, MG en de inhibitor AP5). Houd er rekening mee dat aanvullende annotatiegegevens kunnen worden weergegeven door op de optie 'Toon / Verberg kolommen' in paneel C te klikken. Meerdere volgorde uitlijning wordt uitgevoerd bij het invoeren van het ALIGN tabblad. Het eerste paneel van het tabblad ALIGN toont een samenvatting van de uitlijning die gegevens geeft over het aantal volgorde rijen (equivalent aan het aantal PDB-structuren), evenals het aantal posities ( dwz uitlijnkolommen). Dit omvat een specificatie van het aantal kloof en niet-kloof bevattende kolommen. De figuur aan de rechterkant van de eerste rij geeft een schematische weergave van de volgorde-uitlijning. Hier thE grijze gebieden vertegenwoordigen niet-kloofposities, terwijl witte gebieden in de uitlijning overeenkomen met gaten. Een weergave van het sequentiewaarzijn wordt getoond boven de uitlijning met rode gebieden die goed geconserveerde posities aanduiden, en wit geeft minder conservering aan. Merk op dat de sequenties in dit cijfer worden besteld op basis van hun gelijkenis die door de clustering dendrogram aan de linkerkant wordt gegeven. Het tweede paneel van dit tabblad vergemakkelijkt de clustering van de geselecteerde PDB's verder, gebaseerd op hun pair-wise sequentie-gelijkenis, die zowel als een dendrogramma of een hittekaart kan worden weergegeven. Standaard wordt een dendrogramma (of boomdiagram) weergegeven dat de opstelling van clusters vertegenwoordigt. De y-as van het dendrogramma vertegenwoordigt de afstand (in termen van sequentieidentiteit) tussen de clusters. Structuur superpositie wordt automatisch uitgevoerd bij het invoeren van het FIT tabblad. De bovenliggende structuren, interactief weergegeven in paneel A, indicaIn aanwezigheid van een relatief starre kerngebied (omvattend residuen 1-29, 68-117 en 161-214; zie het paneel 'optionele kern en RMSD details' onderaan het tabblad FIT voor details). Nog twee variabele nucleotide-bindende gebieden (resten 30-67 en 118-167) zijn ook duidelijk zichtbaar ( Figuur 2 ). RMSD-gebaseerde clustering groepen deze structuren in twee afzonderlijke conformaties. Door op het tabblad PCA te klikken, wordt de relatie tussen de structuren duidelijker weergegeven in termen van de verplaatsingen van deze gebieden die de gebonden nucleotide-species in verwante structuren effectief sluiten ( Figuur 2B en 2C ). De meeste structuren zijn in de 'gesloten' vorm (blauw in figuur 2C ) en zijn geassocieerd met een gebonden ligand of remmer. In contrast zijn meer 'open'-conformaties nucleotide en inhibitorvrij. Dit is in overeenstemming metHet uitgebreide onderzoek naar Adk-structuur en dynamiek, die aangeeft dat een open configuratie van deze gebieden nodig is voor nucleotide binding en een gesloten conformatie voor efficiënte fosforyloverdracht en onderdrukking van nadelige hydrolyse-gebeurtenissen. Het is opmerkelijk dat een enkele pc 97% van de totale gemiddelde vierkante verplaatsing in deze Adk-structuur opgeeft en een duidelijke en dwingende beschrijving geeft van de open tot gesloten overgang, samen met de individuele residuele bijdragen aan deze functionele verplaatsing (Paneel C van de app En figuur 2 ). Het bezoeken van het NMA-tabblad en het verhogen van het aantal structuren die worden beschouwd voor het berekenen (via het afnemen van de cutoff voor het filteren van vergelijkbare structuren) geeft aan dat open state-structuren een verbeterde lokale en globale dynamiek vertonen in vergelijking met de gesloten vormstructuren ( Figuur 2D en Panel C van app) . Vergelijking van PCA en NMA resultaten voorIndividuele structuren (paneel D) geeft aan dat de eerste modus van alle open vormstructuren een relatief hoge overlap voor PC1 vertoont (met een gemiddelde waarde van 0,37 ± 0,04). In tegenstelling hiermee tonen gesloten structuren lagere waarden (met een gemiddelde van 0,30 ± 0,01). RMSIP waarden voor open vormstructuren (0.62 ± 0.003) zijn ook hoger dan die van gesloten structuren (0,56 ± 0,008). Bovendien blijkt dat overlappingsanalyse blijkt dat de eerste modi van de openstaat in goede overeenstemming zijn met de conformiteitsverandering die het verschil tussen de open en gesloten staten (paneel E) beschrijft. Clustering op basis van RMSIP-waarden toont opnieuw een consistente partitionering van open en gesloten state structuren (paneel F). Collectief wijzen deze resultaten op het bestaan ​​van twee belangrijke onderscheidende staten voor Adk. Deze verschillen door een collectieve lage frequentieverplaatsing van twee nucleotide-bindingsplaatsregio's die duidelijke flexibi tonenLities op nucleotide binding. Figuur 1: Bio3D-web overzicht met schermopnamen van de PCA en NMA tabs. Bio3D-web heeft een door de gebruiker verstrekte eiwitstructuur of -volgorde als invoer in het SEARCH-tabblad ( 1 ). De server biedt een lijst van gerelateerde structuren, die kunnen worden geselecteerd voor verdere analyse. ( 2 ) Het tabblad ALIGN biedt sequentiële uitlijning en analyse van de structuren die in het SEARCH tab zijn geselecteerd. ( 3 ) In het tabblad FIT worden alle structuren in 3D samengevat en in 3D weergegeven, samen met de resultaten van conventionele pair-wise structure analyse. ( 4 ) Hoofdcomponent analyse van de structuur set wordt uitgevoerd in het tabblad PCA om inter-conformer relaties te karakteriseren. ( 5 ) Normale modus analyse op elke structuur kan worden uitgevoerd in het eNMA tabbladDynamische trends voor de beschikbare structurele staten verkennen. Klik hier om een ​​grotere versie van deze figuur te bekijken. Figuur 2: Resultaten van Bio3D-webanalyse van adenylaatkinase. ( A ) Beschikbare PDB-structuren van adenylaatkinase op de geïdentificeerde invariant kern. Structuren worden gekleurd volgens RMSD-gebaseerde clustering die op het tabblad FIT wordt verstrekt. ( B ) Visualisatie van de hoofdcomponenten is beschikbaar via het tabblad PCA om de belangrijkste conformatieve variaties in de dataset te karakteriseren. Hier wordt het traject dat overeenkomt met het eerste hoofdcomponent getoond in buisvoorstelling die de grootschalige sluitingsbeweging van het eiwit toont. ( C ) Structuren zijn prOp hun twee eerste hoofdcomponenten in een conformer plot uitgezet die een lage-dimensionale representatie van de conformatieve variabiliteit toont. Elke stip (of structuur) is gekleurd volgens gebruikerscriteria, in dit geval PCA-gebaseerde clusteringsresultaten. ( D ) Normale modus analyse in het tabblad eNMA suggereert verbeterde lokale en globale dynamiek voor structuren in de open staat (rood) in vergelijking met de gesloten vorm (blauwe) structuren. Klik hier om een ​​grotere versie van deze figuur te bekijken.

Discussion

Bio3D-web kan gebruikt worden om de structurele, dynamische en functionele staat van eiwitten interactief te onderzoeken en te plukken uit beschikbare kristallografische structuren. Bovendien kunnen de NMA- en PCA-gebaseerde clusteringsresultaten, samen met de annotaties en sequentie gebaseerde analyse, bijzonder nuttig zijn voor het selecteren van representatieve structuren voor meer tijdrovende analyse, zoals ensemble small molecule docking of moleculaire dynamische simulaties. Bio3D-web vergemakkelijkt dus geavanceerde structurele bioinformatica analyse voor een breder scala van onderzoekers door het vereiste niveau van technische expertise te verminderen. Het huidige ontwerp van Bio3D-web benadrukt de eenvoud over het uitputtende opnemen van de vele analysemethoden die beschikbaar zijn in het volledige stand-alone Bio3D-pakket. In veel gevallen wordt verwacht dat onderzoekers Bio3D-web zullen gebruiken om algemene trends in hun eiwitfamilie of superfamilie van belang te begrijpen, die dan meer gespecialiseerde analyses kunnen informeren. Bio3D-web is deRefore ontworpen om snel de biomoleculaire structuurgegevens te onderzoeken en als een hypothese-genererende tool te fungeren. Wij raden gebruikers aan om hun gegevens verder te onderzoeken door voorbeeld Bio3D code in het reproduceerbare rapport te geven dat ook alle zoekgegevens en analyseresultaten opslaat.

In het bovenstaande representatieve voorbeeldprotocol tonen we de mogelijkheden van Bio3D-web om de structurele kenmerken van functionele conformational transitions van Adk te onthullen. Aanvullende toepassingen van Bio3D-web omvatten structurele en dynamische analyse van gebruikers-geüploade PDB structuren. Bijvoorbeeld kan de gebruiker nieuwe structuren of inderdaad eiwitsequenties uploaden voor analyse. De eerder genoemde analysestappen, met name de eNMA-stap, kunnen zowel lokale als globale trends in eiwitbewegingen onthullen, waarbij collectieve bewegingen functioneel zijn. Vergelijking met apo-structuren kan ook de kenmerken van onbound aan gebonden conformatie-overgangen onthullen. Aanvullende voorbeelden van toepassing opEen reeks verschillende eiwitfamilies worden online aangeboden.

Hoewel alle eiwitten flexibele en dynamische entiteiten zijn, hebben niet alle eiwitten atoomresolutiestructuren beschikbaar in een reeks verschillende staten ( bijv. Actieve en inactieve staten). Onze opvatting van de ruimte voor eiwitstructuur is dus een beperkte en daarom wordt het inzicht verkregen uit hulpmiddelen zoals Bio3D-web noodzakelijkerwijs ook beperkt voor bepaalde eiwitten. Echter, met de huidige technologische vooruitgang en nieuwe initiatieven voor structurele genomica wordt het hier gepresenteerde protocol steeds meer een belangrijke route om inzicht te krijgen in belangrijke structuur-functie relaties. Een kritische stap, die bijzonder belangrijk is bij het analyseren van meer verhoudingsgerelateerde eiwitten, is de mogelijke opkomst van uitlijnfouten in het ALIGN-tabblad. Uitlijning fouten zullen onvermijdelijk optreden wanneer de volgorde gelijkenis dalen tot onder 30% en de gebruiker moet in dergelijke gevallen dubbel controleren en corrigeer de volgorde uitlijningOp het tabblad ALIGN. Uitlijning fouten zullen mogelijk leiden tot onjuiste bovenliggende structuren op het tabblad FIT en maskeren de meest relevante conformatieve variaties voor de daaropvolgende PCA. Daarnaast moet de gebruiker zich bewust zijn van ontbrekende residuen in de geselecteerde PDB-structuren, aangezien in de huidige implementatie PCA alleen kan worden uitgevoerd op eiwitresiduen waarin alle structuren hun bijbehorende koolstofalfaatoom hebben opgelost. Als een geselecteerd VBB onopgeloste residuen heeft voor een bepaald gebied van het eiwit, zal deze regio derhalve van PCA worden weggelaten.

Bio3D-web is momenteel beperkt tot de analyse van single-chain PDB structuren. Bijgevolg kunnen functionele bewegingen die op het quaternaire niveau optreden niet worden onderzocht met behulp van het huidige protocol. Hoewel we momenteel nieuwe algoritmen ontwikkelen om zo'n analyse in Bio3D-web op te nemen, is de enige huidige optie via conventioneel Bio3D-gebruik.

Bio3D-web is de enige online applicatieIonen die het mogelijk maakt om structuur sets te vragen en te identificeren, hun patronen van volgorde en structurele variabiliteit te interpreteren en mechanistische informatie uit beide analyses en voorspelling van hun structurele plasticiteit te extraheren. Een breed scala van moleculaire visualisatie-instrumenten en online servers stelt onderzoekers in staat individuele biomoleculaire structuren te verkennen en te analyseren. Echter, bestaande instrumenten voor analyse van de sequentie, structuur en dynamiek van grote heterogene eiwitfamilies vereisen vaak significante computervaardigheid en zijn meestal alleen toegankelijk voor gebruikers met relevante programmeringsvaardigheden. Bijvoorbeeld, de Bio3D pakketvereisten R8, prody vereist python en Maven vereist Matlab kennis 9, 10. Bio3D-web in contrast vereist geen programmeringskennis en verhoogt daarmee de toegankelijkheid en vermindert de toegangsbarrière voor het uitvoeren van geavanceerde vergelijkende volgorde, structuur en dyNamiekanalyse. Bovendien is de voorbereiding, curatie, annotatie en opruiming van moleculaire structuren die vaak nodig zijn voor efficiënte analyse opgenomen in de Bio3D-webservice. Bovendien wordt de beperking van het uitvoeren van dergelijke analyses op geschikte computergebruiken vergemakkelijkt door onze server-instantie die grootschalige analyse mogelijk maakt van veel structuren die kunnen worden geïnitieerd en gecontroleerd vanuit elke moderne webbrowser.

Open ontwikkeling van Bio3D-web is aan het gangen (zie https://bitbucket.org/Grantlab/bio3d). We blijven doorgaan met nieuwe analysefuncties en bestaande methodes verbeteren. Toekomstige ontwikkeling zal zich richten op de toevoeging van PCA en PCA op afstand matrix, uitgebreidere sequentiebehoud benaderingen die een fylogenetische component bevatten, identificatie van het bindend bindingssysteem en nieuwe benaderingen voor dynamische netwerkanalyse in eiwitfamilies. In dit opzicht vertegenwoordigt de huidige webapplicatie de startpuntT voor veel andere samenwerkende structurele bioinformatic analyse werkstromen door het mogelijk maken van reproduceerbare en deelbare stappen op gebruikers gedefinieerde experimentele structuur sets. We plannen ook toekomstige ondersteuning van gereconstrueerde biologische eenheidscoördinatensets naast individuele en meerdere ketens uit de asymmetrische eenheid PDB-structuren. Extra functies omvatten verbeterde besparing en laden van samenwerkende werkruimten, samen met een mogelijkheid om ongedaan te maken.

Bio3D-web is een online applicatie voor interactieve analyse van biomoleculaire structuurgegevens. Bio3D-web draait op elke moderne webbrowser en biedt functionaliteit voor: (1) De identificatie van gerelateerde eiwitstructuren stelt op door de gebruiker gespecificeerde drempels van gelijkenis; (2) Hun meerdere uitlijning en structuur superpositie; (3) Conserveringsanalyse van sequentie en structuur; (4) Inter-conformer relatie mapping met hoofdcomponent analyse, en (5) vergelijking van voorspelde interne dynamiek via ensemble nochMal modus analyse. Deze geïntegreerde functionaliteit biedt een complete workflow voor het onderzoek naar sequentie-structuur-dynamische relaties binnen eiwitfamilies en superfamilies. Naast een handige, makkelijk te gebruiken dynamische interface voor het verkennen van de effecten van parameter- en methodekeuzes, registreert Bio3D-web ook de volledige gebruikersinvoer en daaropvolgende grafische resultaten van de sessie van een gebruiker. Hiermee kunnen gebruikers de volgorde van analysestages die de resultaten hebben gemaakt gemakkelijk delen en reproduceren. Bio3D-web is volledig geïmplementeerd in de R-taal en is gebaseerd op de Bio3D- en Shiny R-pakketten. Het kan worden uitgevoerd vanuit onze online server of lokaal geïnstalleerd op elke computer die R draait. Dit omvat de lokale serverinstallatie om een ​​aangepaste multi-user-instantie te verschaffen met toegang tot prioritaire structurele datasets, zoals die in de farmaceutische industrie. Volledige broncode en uitgebreide documentatie wordt geleverd onder een GPL-3 open source licentie van: http://thegrantlab.org/ Bio3d / webapps

Disclosures

The authors have nothing to disclose.

Acknowledgements

Wij bedanken dr. Guido Scarabelli en Hongyang Li voor uitgebreide tests tijdens de ontwikkeling, de Bio3D gebruikersgemeenschap en de studenten van de Universiteit van Bergen, structurele bioinformatica workshop voor feedback en opmerkingen die deze applicatie hebben verbeterd.

Materials

Bio3D-web
Web-site http://thegrantlab.org/bio3d-web/
Requirements Web browser

References

  1. Kornev, A. P., Taylor, S. S. Dynamics-Driven Allostery in Protein Kinases. Trends Biochem. Sci. 40 (11), 628-647 (2015).
  2. Yao, X. -. Q., Grant, B. J. Domain-opening and dynamic coupling in the α-subunit of heterotrimeric G proteins. Biophys. J. 105 (2), L08-L10 (2013).
  3. Henzler-Wildman, K. A., et al. Intrinsic motions along an enzymatic reaction trajectory. Nature. 450 (7171), 838-844 (2007).
  4. Boehr, D., Nussinov, R., Wright, P. The role of dynamic conformational ensembles in biomolecular recognition. Nat. Chem. Biol. 5 (11), 789-796 (2009).
  5. Teilum, K., Olsen, J. G., Kragelund, B. B. Functional aspects of protein flexibility. Cell Mol Life Sci. 66 (14), 2231-2247 (2009).
  6. Henzler-Wildman, K., Kern, D. Dynamic personalities of proteins. Nature. 450 (7172), 964-972 (2007).
  7. Grant, B. J., Gorfe, A. A., McCammon, J. A. Large conformational changes in proteins: signaling and other functions. Curr. Opin. Struct. Biol. 20 (2), 142-147 (2010).
  8. Grant, B. J., Rodrigues, A. P. C., ElSawy, K. M., McCammon, J. A., Caves, L. S. D. Bio3d: an R package for the comparative analysis of protein structures. Bioinformatics. 22 (21), 2695-2696 (2006).
  9. Bakan, A., Meireles, L. M., Bahar, I. ProDy: protein dynamics inferred from theory and experiments. Bioinformatics. 27 (11), 1575-1577 (2011).
  10. Zimmermann, M. T., Kloczkowski, A., Jernigan, R. L. MAVENs: motion analysis and visualization of elastic networks and structural ensembles. BMC Bioinformatics. 12 (1), 264 (2011).
  11. Yang, L. -. W., et al. oGNM: online computation of structural dynamics using the Gaussian Network Model. Nucleic Acids Res. 34, 24-31 (2006).
  12. Suhre, K., Sanejouand, Y. -. H. ElNemo: a normal mode web server for protein movement analysis and the generation of templates for molecular replacement. Nucleic Acids Res. 32, W610-W614 (2004).
  13. Tiwari, S. P., et al. WEBnm@ v2.0: Web server and services for comparing protein flexibility. BMC Bioinformatics. 15 (1), 427 (2014).
  14. Hrabe, T., et al. PDBFlex: exploring flexibility in protein structures. Nucleic Acids Res. 44, D423-D428 (2016).
  15. Skjærven, L., Jariwala, S., Yao, X. -. Q., Grant, B. J. Online interactive analysis of protein structure ensembles with Bio3D-web. Bioinformatics. , (2016).
  16. Skjærven, L., Yao, X., Scarabelli, G., Grant, B. J. Integrating protein structural dynamics and evolutionary analysis with Bio3D. BMC Bioinformatics. 15 (399), 1-11 (2014).
  17. Eddy, S. R. Accelerated Profile HMM Searches. PLoS Comput. Biol. 7 (10), (2011).
  18. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  19. Berman, H. M. The Protein Data Bank. Nucleic Acids Res. 28 (1), 235-242 (2000).
  20. Finn, R. D., et al. Pfam: the protein families database. Nucleic Acids Res. 42, D222-D230 (2014).
  21. Kerns, S. J., et al. The energy landscape of adenylate kinase during catalysis. Nat. Struct. Mol. Biol. 22 (2), 124-131 (2015).

Play Video

Cite This Article
Jariwala, S., Skjærven, L., Yao, X., Grant, B. J. Investigating Protein Sequence-structure-dynamics Relationships with Bio3D-web. J. Vis. Exp. (125), e55640, doi:10.3791/55640 (2017).

View Video