April 13th, 2022
Het doel van dit protocol is om efficiënt kleine molecuulstructuurbibliotheken te genereren en te beheren met behulp van open-source software.
Ons protocol laat zien hoe open source software elke onderzoeker in staat kan stellen om een computationele structuurbibliotheek te maken en te beheren. Dit protocol-appèl komt voort uit de openheid en flexibiliteit. Iedereen kan het gebruiken en aanpassen aan hun specifieke onderzoeksvraag.
Versies van dit protocol kunnen worden toegepast op toepassingen voor het ontdekken van geneesmiddelen, waardoor snel specifieke structuurbibliotheken worden gemaakt voor in silico-screening. Hoewel het protocol stap voor stap wordt uitgelegd, kunnen gebruikers, als ze niet bekend zijn met Java of basiscodering, eerst die bekijken voordat ze het protocol implementeren. Begin met het maken van een nieuwe map voor het project.
Plaats alle bestanden en uitvoerbare bestanden in deze map voor eenvoudige toegang. Download de nieuwste versie van Maygen als jar-bestand en de pakketbeheersoftware Anaconda. Zoek op Windows-systemen naar de Anaconda-prompt en klik op de resulterende snelkoppeling om uit te voeren.
Om een RDKit-omgeving in Anaconda te maken en de RDKit naar de omgeving te downloaden, typt u de opdracht op het scherm, drukt u op enter om uit te voeren en ja te antwoorden op eventuele vragen die tijdens de installatie opkomen. Download vervolgens de Jupyter Notebooks en tekstbestanden van de substraatpatronen uit de aanvullende bestanden, één tot vijf. Navigeer in de opdrachtprompt naar de map met de maygen.
jar uitvoerbaar bestand. Gebruik voor elke chemische formule van belang de opdracht die op het scherm wordt weergegeven om Maygen uit te voeren. Als de formule een vage formule is in plaats van een discrete formule, vervangt u het koppelteken F door een vage teken met koppeltekens en plaatst u eventuele elementintervallen tussen haakjes.
Navigeer in een Anaconda-prompt naar de map met de Jupyter Notebooks en activeer de RDKit-omgeving. Voor de gedownloade notebooks is RDKit vereist. Dus elk toekomstig gebruik ervan in dit protocol vereist dat ze worden geopend in de RDKit-omgeving.
Open vervolgens het Jupyter-notitieblok voor substructuurfiltering en sluit de bestandsnaam tussen aanhalingstekens als deze spaties bevat. Voer in de aangewezen cel aan het begin van het notitieblok het volledige bestandspad van het sdf-invoerbestand in. Het volledige bestandspad van het gewenste sdf-uitvoerbestand en het bestandspad van het slechte lijstbestand als tekenreeksen.
Als sommige substructuren in de gefilterde bibliotheek of een goede lijst moeten worden behouden, maakt u een txt-bestand met SMARTS-patronen voor die substructuren en plaatst u het pad naar het goede lijstbestand in de aangewezen regel aan het begin van het notitieblok. Selecteer in het menu bovenaan kernel, start opnieuw op en voer alles uit om de notebookkernel opnieuw op te starten en alle cellen uit te voeren. Een sdf-bestand met de gewenste naam wordt gemaakt in de opgegeven uitvoermap.
Herhaal deze stappen voor elk structuurbestand dat door Maygen wordt gegenereerd. Voor pseudoatom-vervanging opent u een Anaconda-prompt, navigeert u naar de map met de Jupyter Notebooks en activeert u de RDKit-omgeving. Open vervolgens de Jupyter Notebook voor pseudoatom vervanging.
Voer in de aangewezen cel aan het begin van het notitieblok het volledige bestandspad van het sdf-invoerbestand en het volledige bestandspad van het gewenste sdf-uitvoerbestand in als tekenreeksen. Start de notebookkernel opnieuw op en voer alle cellen uit om een sdf-bestand met de gewenste naam in de opgegeven uitvoermap te krijgen. Open op dezelfde manier een Anaconda-prompt voor aminozuur N- en C-termini-capping.
Navigeer naar de map met de Jupyter Notebooks en activeer de RDKit-omgeving. Open de Jupyter Notebook voor aminozuur capping. Voer in de aangewezen cel aan het begin van het notitieblok het volledige bestandspad van het sdf-invoerbestand en het volledige bestandspad van het gewenste sdf-uitvoerbestand in als tekenreeksen.
Start de notebookkernel opnieuw op en voer alle cellen uit om een sdf-bestand met de gewenste naam in de opgegeven uitvoermap te krijgen. Plaats voor het genereren van descriptoren alle sdf-bestanden waarvoor descriptoren moeten worden berekend in één map. Download vervolgens de PaDEL-descriptor, pak deze uit en pak deze uit naar die map.
Open een opdrachtprompt, navigeer naar de map met het PaDEL-descriptor jar-bestand en voer de PaDEL-descriptor uit voor de verzamelde sdf-bestanden. De chemische ruimte van alle gefilterde aminozuurbibliotheken wordt hier weergegeven. Zwarte markers vertegenwoordigen aminozuren uit de bibliotheken zonder zwavel en gele markers vertegenwoordigen aminozuren uit met zwavel verrijkte bibliotheken.
Hier worden VAIL- en VAIL_S bibliotheken weergegeven door cirkels. DEST- en DEST_S bibliotheken worden vertegenwoordigd door vierkanten. Proline- en Pro S-bibliotheken worden vertegenwoordigd door driehoeken en sterren vertegenwoordigen gecodeerde aminozuren.
Het bereik van mogelijke log P-waarden neemt toe met het moleculaire volume, zelfs binnen de bibliotheken die expliciet hydrofiele zijketens missen. Gecodeerde aminozuren met koolwaterstofzijketens zijn meer hydrofoob dan de meeste andere aminozuren met een vergelijkbaar volume uit hun respectieve bibliotheek. Dit is ook het geval voor methionine in vergelijking met andere leden van de VAILS-bibliotheek met vergelijkbare volumes.
Gecodeerde aminozuren met hydroxylzijketens behoorden tot de kleinste leden van de DEST-bibliotheek met asparaginezuur dat slechts iets groter was dan drie anine. De weergegeven afbeelding toont de gemiddelde Van der Waal-volumes van bibliotheken met zwavel en zonder zwavel. Zwavelsubstitutie leidde tot een lichte toename van het moleculair volume in alle bibliotheken.
De gemiddelde verdelingscoëfficiëntwaarden van bibliotheken met en zonder zwavel worden hier weergegeven. Het effect van zwavelsubstitutie op log P is niet zo homogeen als voor volume. De representatieve afbeelding toont de effecten van een trivalent pseudoatom op maygenstructuurgeneratie.
Het gebruik van een pseudoatom bij het genereren van structuren verminderde het aantal structuren gegenereerd met ongeveer drie ordes van grootte in de totale tijd die nodig was om die structuren te genereren met één tot twee ordes van grootte. Volgens dit protocol kunnen in de toekomst extra functionaliteiten worden geïntegreerd op basis van de behoeften van onderzoekers. Men zou bijvoorbeeld substructuurfilters in Maygen kunnen integreren om de nabewerkingsstap te vermijden.
Bibliotheekgeneratie, curatie en modificatie. Dit algemene proces kan andere moleculaire structuren en modificaties accommoderen met enige codeerkennis, waardoor onderzoekers computationele bibliotheken kunnen verkennen die verder gaan dan die van alfa-aminozuren. Dit protocol zal onderzoekers helpen hun computationele werk in de oorsprong van het levensveld te verbeteren.
Open source toolkits zullen enorm helpen bij deze inspanningen.
Dit protocol beschrijft het gebruik van open-source software om bibliotheken van kleine moleculaire structuren te creëren en onderhouden. Het benadrukt flexibiliteit en toegankelijkheid voor onderzoekers in medicijnontdekking.