En protokol til online undersøgelse af proteinsekvens-struktur-dynamik relationer ved brug af Bio3D-web er præsenteret.
Vi demonstrerer brugen af Bio3D-web til den interaktive analyse af biomolekylære strukturdata. Bio3D-webapplikationen giver online-funktionalitet til: (1) Identifikationen af beslægtede proteinstrukturer sætter til brugerdefinerede tærskler af lighed; (2) deres multiple alignment og struktur superposition; (3) Bevaringsanalyse af sekvens og struktur; (4) Inter-conformer-relationskortlægning med hovedkomponentanalyse, og (5) sammenligning af forudsagt intern dynamik via ensemble normal mode analyse. Denne integrerede funktionalitet giver en komplet online-arbejdsgang til undersøgelse af sekvens-struktur-dynamiske relationer inden for proteinfamilier og superfamilier.
Proteindatabanken (PDB) indeholder nu mere end 120.000 proteinstrukturer – hvoraf mange er af samme proteinfamilie, men løst under forskellige forsøgsbetingelser. Disse multiple strukturer repræsenterer en uvurderlig ressource til forståelse af intricacies af protein form og funktion. For eksempel kan den stringente sammenligning af disse strukturens ensembler afsløre vigtige molekylære mekanismer 1 , 2 , 3 og informere om konformationsdynamik involveret i processer, herunder ligandbinding, enzymatisk katalyse og bi-molekylær anerkendelse 4 , 5 , 6 , 7 . Nye indsigter kan ofte opnås fra den detaljerede storskala analyse af proteinfamiliens sekvens, struktur og dynamik. Dette kræver imidlertid typisk betydelig bioinfOrmatik og computer programmering ekspertise sammen med kendskab til de proteinsystemer under studiet. For eksempel kræver softwarepakker som Bio3D, ProDy og Maven programmering i henholdsvis R, Python og Matlab, henholdsvis 8 , 9 , 10 . Omvendt er onlineværktøjer til analyse af strukturel fleksibilitet generelt begrænset til undersøgelse af individuelle strukturer 11 , 12 . En undtagelse i denne henseende er den nyudviklede WebNM @ -server, som muliggør sammenligning af fleksibilitetsmønstre opnået ved normal tilstandsanalyse (NMA) af adskillige forudjusterede brugerspecificerede strukturer 13 . Denne server mangler dog en automatiseret procedure til identifikation af strukturer til sammenligning, deres justering eller yderligere analyse ud over NMA. Et andet nyt bidrag er den online PDBFlex database, der præsenterer pre-cOmstridte analyser af FBF-strukturer, der deler 95% eller højere sekvensidentitet 14 . Analysen af flere forskellige struktursæt er dog ikke tilgængelig.
Vi har tidligere præsenteret Bio3D-web – en nem at bruge webapplikation til analyse af proteinsekvens-struktur-dynamiske forhold 15 . Bio3D-web er unik i at give nem at bruge integreret funktionalitet til identifikation, sammenligning og detaljeret analyse af store homologe struktur sæt online. Her præsenterer vi en detaljeret protokol til online undersøgelse af proteinsekvens-struktur-dynamik forhold ved hjælp af Bio3D-web. Bio3D-web giver en række funktioner til understøttelse af de fem store trin i dataanalyse vist i figur 1 og diskuteret i detaljer nedenfor. Disse trin udgør en arbejdsgang, der spænder fra forespørgselssekvens eller strukturindgang, gennem flere niveauer af sekvens-struktur-dynamisk analyse for at opsummereY rapport generation. Resultaterne er tilgængelige straks gennem omfattende in-browser visualisering og plotting enheder, samt ved at downloade resultatfiler i almindeligt anvendte formater. Ud over en praktisk nem at bruge dynamisk grænseflade til at udforske effekterne af parameter og metode valg registrerer Bio3D-web også den komplette brugerindgang og efterfølgende grafiske resultater af en brugers session som en delbar reproducerbar rapport i PDF-, DOC- og HTML-formater. Brugersessioner kan gemmes og genindlæses i fremtiden og afslutte resultater, der er downloadet og fortolket yderligere af Bio3D R-pakken på en brugers lokale maskine.
Bio3D-web drives af Bio3D R-pakken til analyse af biomolekylær struktur, sekvens- og molekylsimulationsdata 8 , 16 . Især Bio3D-algoritmer til identifikation af stiv kerne 8 , overlejring, hovedkomponentanalyse(PCA) 8 og ensemble normal mode analyse (eNMA) 16 danner basis for ansøgningen. Vi benytter også Bio3D-protokoller, der afhænger af pHMMER 17 til identifikation af relaterede proteinstrukturer og MUSCLE 18 til multiple sekvensjustering. Struktur- og sekvensannotationer er afledt via Bio3D-hjælpeprogrammer fra RCSB PDB 19 og PFAM databaser 20 . Bio3D-web kan køres fra vores online-server eller installeres lokalt på enhver computer, der kører R. Bio3D-web er åben for alle brugere og leveres gratis under en GPL-3 open source-licens fra: http: // thegrantlab. org / bio3d / webapps
Bio3D-web kan bruges til interaktivt at undersøge og kortlægge de strukturelle, dynamiske og funktionelle tilstande af proteiner fra tilgængelige krystallografiske strukturer. Desuden kan de NMA- og PCA-baserede klyngningsresultater sammen med annotations- og sekvensbaseret analyse være særligt nyttige til udvælgelse af repræsentative strukturer til mere tidskrævende analyser, såsom ensemble-småmolekyl docking eller molekylære dynamik simuleringer. Bio3D-web muliggør således avanceret strukturel bioinformatikanalyse til et bredere udvalg af forskere ved at reducere det krævede niveau af teknisk ekspertise. Det nuværende design af Bio3D-web understreger enkelhed over udtømmende inddragelse af de mange analysemetoder, der findes i den komplette, selvstændige Bio3D-pakke. I mange tilfælde er det meningen, at forskere vil bruge Bio3D-web til at forstå generelle tendenser i deres proteinfamilie eller superfamilie af interesse, som så kan informere mere specialiserede analyser. Bio3D-web erRefore designet til hurtigt at udforske biomolekylære struktur datasæt og at fungere som et hypotese-genererende værktøj. Vi opfordrer brugere til yderligere at udforske deres data ved at give eksempel Bio3D-kode i den reproducerbare rapport, der også lagrer alle forespørgselsdetaljer og analyseresultater.
I det repræsentative eksempelprotokol ovenfor viser vi Bio3D-webens evne til at afsløre strukturelle funktioner i funktionelle konformationelle overgange af Adk. Yderligere applikationer af Bio3D-web omfatter strukturel og dynamisk analyse af brugeroploadede PDB strukturer. For eksempel kan brugeren uploade nye strukturer eller faktisk proteinsekvenser til analyse. De ovennævnte analysestrin, især eNMA-skridtet, kan afsløre både lokale og globale trends i proteinbevægelser, hvor kollektive bevægelser har funktionel betydning. Sammenligning med apo strukturer kan også afsløre egenskaber ved ubundne konformationelle overgange. Yderligere eksempler på ansøgning tilEn række forskellige proteinfamilier leveres online.
Selv om alle proteiner er fleksible og dynamiske enheder, har ikke alle proteiner atomopløsningsstrukturer tilgængelige i en række forskellige tilstande ( f.eks. Aktive og inaktive stater). Vores opfattelse af proteinstrukturrum er således en begrænset, og derfor er indsigten opnået fra værktøjer som Bio3D-web nødvendigvis også begrænset til visse proteiner. Men med de nuværende teknologiske fremskridt og nye initiativer for strukturelle genomik bliver protokollen, der præsenteres her, i stigende grad en vigtig rute for at få indsigt i vigtige struktur-funktionsforhold. Et kritisk trin, som er særligt vigtigt ved analyse af mere fjernt beslægtede proteiner, er den potentielle fremkomst af justeringsfejl i ALIGN-fanen. Justeringsfejl vil uundgåeligt forekomme, når sekvensliknigheden falder under 30%, og brugeren skal i sådanne tilfælde dobbelttjekke og korrigere sekvensjusteringenI fanen ALIGN. Justeringsfejl vil muligvis resultere i ukorrekte overlejrede strukturer i FIT-fanen og maskere de mest relevante konformationsvariationer for den efterfølgende PCA. Derudover skal brugeren være opmærksom på manglende rester i de valgte PDB strukturer, da i den nuværende implementerings-PCA kun kan udføres på proteinrester, hvor alle strukturer har deres tilsvarende carbon-alpha atom opløst. Hvis et udvalgt PDB har uopløste rester for en bestemt region af proteinet, vil denne region derfor blive udeladt fra PCA.
Bio3D-web er i øjeblikket begrænset til analysen af enkeltkæde PDB strukturer. Følgelig kan funktionelle bevægelser, der forekommer på kvaternærniveau, ikke udforskes ved anvendelse af den nuværende protokol. Selv om vi i øjeblikket udvikler nye algoritmer til at inkludere en sådan analyse i Bio3D-web, er den eneste nuværende mulighed via konventionel Bio3D-anvendelse.
Bio3D-web er den eneste online applikationIon, der gør det muligt at forespørge og identificere struktursæt, fortolke deres mønstre af sekvens og strukturelle variabilitet og udvinde mekanistiske informationer fra både analyse og forudsigelse af deres strukturelle plasticitet. En bred vifte af molekylære visualiseringsværktøjer og online-servere gør det muligt for forskere at udforske og analysere individuelle biomolekylære strukturer. Eksisterende værktøjer til analyse af sekvens, struktur og dynamik hos store heterogene proteinfamilier kræver ofte betydelig databehandlingskompetence og forbliver kun tilgængelige for brugere med relevant programmeringsfærdigheder. For eksempel Bio3D pakke kræver R8, Prody kræver python og Maven kræver Matlab viden 9, 10. Bio3D-web i kontrast kræver ingen programmeringskendskab og øger dermed tilgængeligheden og reducerer adgangsbarrieren til at udføre avanceret komparativ sekvens, struktur og dybNamikanalyse. Desuden er forberedelsen, kurering, annotering og oprydning af molekylære strukturer, som ofte er nødvendig til effektiv analyse, inkluderet i Bio3D-webtjenesten. Yderligere begrænses begrænsningen til at udføre en sådan analyse på mulige beregningsmæssige ressourcer af vores server-instans, der muliggør storskala analyse af mange strukturer, der kan initieres og styres fra enhver moderne webbrowser.
Åben udvikling af Bio3D-web er i gang (se https://bitbucket.org/Grantlab/bio3d). Vi fortsætter med at tilføje ny analysefunktionalitet og forbedre eksisterende metoder. Fremtidig udvikling vil fokusere på tilføjelse af fjernmatrixbaseret PCA og torsions-PCA, mere omfattende sekvensbevaringsmetoder, der omfatter en fylogenetisk komponent, identifikation af ensemblebindingssted og nye tilgange til dynamisk netværksanalyse på tværs af proteinfamilier. I denne henseende repræsenterer den aktuelle webapplikation startpunktetT for mange andre samarbejdsvillige strukturelle bioinformatiske analyse-arbejdsgange ved at muliggøre reproducerbare og delbare trin på brugerdefinerede eksperimentelle struktursæt. Vi planlægger også fremtidig support af rekonstruerede biologiske enheds koordinatsæt ud over individuelle og flere kæder fra den asymmetriske enhed af PDB strukturer. Yderligere funktioner omfatter forbedret opbevaring og indlæsning af samarbejdspartnere sammen med en mulighed for at fortryde.
Bio3D-web er en online ansøgning til interaktiv analyse af biomolekylære strukturdata. Bio3D-web kører på en hvilken som helst moderne webbrowser og giver funktionalitet til: (1) Identifikationen af relaterede proteinstruktur sætter til brugerdefinerede tærskler af lighed; (2) deres multiple alignment og struktur superposition; (3) Bevaringsanalyse af sekvens og struktur; (4) Inter-conformer-forholdskortlægning med hovedkomponentanalyse, og (5) sammenligning af forudsagt intern dynamik via ensemble ellerMal mode analyse. Denne integrerede funktionalitet giver en komplet arbejdsgang til undersøgelse af sekvens-struktur-dynamiske relationer inden for proteinfamilier og superfamilier. Ud over en praktisk nem at bruge dynamisk grænseflade til at udforske effekterne af parametervalg og metodevalg registrerer Bio3D-web også den komplette brugerindgang og efterfølgende grafiske resultater af en brugers session. Dette giver brugerne mulighed for nemt at dele og reproducere sekvensen af analysestrin, der skabte deres resultater. Bio3D-web implementeres udelukkende i R-sprog og er baseret på Bio3D- og Shiny R-pakkerne. Den kan køres fra vores online-server eller installeres lokalt på en hvilken som helst computer, der kører R. Dette omfatter lokal serverinstallation til at levere en brugerdefineret multi-bruger-instans med adgang til prioriterede strukturelle datasæt som dem, der er almindelige inden for lægemiddelindustrien. Fuld kildekode og omfattende dokumentation findes under en GPL-3 open source-licens fra: http://thegrantlab.org/ Bio3d / webapps
The authors have nothing to disclose.
Vi takker Dr. Guido Scarabelli og Hongyang Li for omfattende test gennem udvikling samt Bio3D bruger samfund og Universitetet i Bergen strukturelle bioinformatik workshop deltagere til feedback og kommentarer, der har forbedret denne ansøgning.
Bio3D-web | |||
Web-site | http://thegrantlab.org/bio3d-web/ | ||
Requirements | Web browser |