October 18th, 2022
AAV-peptideweergavebibliotheek generatie en daaropvolgende validatie door de barcodering van kandidaten met nieuwe eigenschappen voor het maken van AAV's van de volgende generatie.
Dit protocol dicht een aanzienlijke kloof tussen de natuurlijke evolutie van virussen en hun gebruik als recombinante vectoren voor menselijke gentherapie door hun engineering, diversificatie en stratificatie mogelijk te maken. Deze techniek maakt de high-throughput parallelle screening op nieuwe, geïsoleerde of gemanipuleerde adeno-geassocieerde virussen, kortweg AAV, varianten mogelijk, waardoor wordt bespaard op dieraantallen, werk, kosten en tijd. De geïdentificeerde AVV capsid varianten kunnen de werkzaamheid en specificiteit van AAV-gebaseerde toediening van therapeutische transgenen verhogen, waardoor de vereiste virale dosis wordt verlaagd.
Dit zou de veiligheid en toepasbaarheid van gentherapie kunnen verbeteren. Dezelfde aanpak kan ook worden gebruikt voor capsid of promoter engineering van andere genafgiftevoertuigen die ons begrip van hun biologie en hun gebruik in gentherapie verbeteren. Promovendi Jonas Becker en Jixin Liu, postdoc Joanna Szumska en Margarita Zayas, maar ook onderzoeksassistenten Emma Gerstmann en Ellen Widtke van mijn laboratorium helpen de procedure te demonstreren.
Begin met het analyseren van de NGS-sequencinggegevens met Python 3 en Biopython. De NGS-analyse bestaat uit twee stappen. Zoek voor de eerste stap in de sequentiebestanden naar reeksen die voldoen aan specifieke criteria, zoals flankerende reeksen, lengte en locatie met behulp van script één en een configuratiebestand dat de benodigde informatie biedt.
Voor de tweede stap vertaalt u de geëxtraheerde sequenties vanaf de AGWGGC-reeks met behulp van script nummer twee en de configuratie en zuordnung. txt-bestanden die de benodigde informatie bieden. Bereid twee mappen voor:script en gegevens.
Kopieer de gecomprimeerde Gzip-bestanden die het resultaat zijn van de sequencing naar de gegevensmap. Kopieer vervolgens de Python- en configuratiebestanden naar de scriptmap zoals beschreven in het tekstmanuscript. Voordat u de scripts uitvoert, opent u de zuordnung.
txt-bestand en voeg twee door tabs gescheiden kolommen toe. Voer de namen van de Gzip-bestanden in kolom één en de gewenste eindnaam in kolom twee in. Wijzig de variabelen in het configuratiebestand zoals beschreven in het tekstmanuscript.
Start met de specifieke opdracht de detectie en extractie van de variantvolgorde. De uitvoer bestaat uit TXT-bestanden met de geëxtraheerde DNA-sequenties en hun aantal reads. De header van dit bestand bevat statistische gegevens en deze gegevens worden overgebracht naar de volgende bestanden.
Deze TXT-gegevens zijn het invoerbestand voor script nummer twee waarin de DNA-sequenties worden vertaald, gerangschikt en geanalyseerd. Start met behulp van de specifieke opdracht PV-vertaling en analyse van de tekstuitvoerbestanden van script één zoals beschreven in het tekstmanuscript. De uitvoerbestanden van script nummer twee krijgen een naam met behulp van de tweede kolom van de opzoektabel in zuordnung.
txt met extensies op basis van het type analyse. Zorg ervoor dat de drie uitvoerbestanden statistische gegevens bevatten in de eerste rijen en een eerste kolom met de index van elke DNA-sequentie uit de invoertekstbestanden. De overige kolommen moeten bestaan uit de DNA-sequentie, het aantal reads, forward of reverse read en de vertaalde peptidesequentie.
De ongeldige reeksen moeten NA hebben en niet geldig zijn in de laatste twee kolommen. Visualiseer de uitvoerbestanden met behulp van beschikbare software op basis van de behoeften van de gebruiker. Om de analyse van de NGS-sequencinggegevens uit te voeren met behulp van aangepaste code in Python 3, omvat de workflow de detectie van barcodesequenties geleid door flankerende sequenties, hun lengte en locatie, evenals analyse van barcodeverrijking en -distributie over de set weefsels.
Bereid twee mappen voor:script en gegevens. Kopieer de gecomprimeerde Gzip-bestanden die het resultaat zijn van de sequencing naar de gegevensmap. Kopieer vervolgens de python- en configuratiebestanden naar de scriptmap zoals beschreven in het tekstmanuscript.
Voordat u het script uitvoert, maakt u twee door tabs gescheiden tekstbestanden:de capsidvariantie. txt-bestand met de streepjescodesequenties toegewezen aan AAV capsid-variantnamen en de verontreiniging. txt-bestand met barcodesequenties die afkomstig zijn van mogelijke besmetting.
Bewerk ten slotte het configuratiebestand om de informatie van het pad naar de map met volgordegegevens, de volgorde van flankerende gebieden van de streepjescodes, hun positie en venstergrootte voor streepjescodedetectie op te nemen. Voer het streepjescodedetectiescript uit met de meegeleverde paden en configuratiebestanden met behulp van de respectieve opdracht. De uitvoer van deze opdrachtuitvoering zijn TXT-bestanden met hertellingen per capsid-variant en het totale aantal leesbewerkingen dat is hersteld van de onbewerkte gegevens.
Om de verdeling van AAV-capsid met streepjescode tussen weefsels of organen in de zuordnung te evalueren. txt-bestand, wijs de naam van elk tekstbestand dat is verkregen uit de streepjescodedetectierun toe aan een weefsel- of orgaannaam. Voeg de namen van tekstbestanden in de eerste kolom en de bijbehorende weefsel- of orgaannamen toe in de door tabs gescheiden toewijzing.
Maak een orgel. txt-bestand met de lijst met namen voor on- en off-target orgels, die overeenkomen met de namen in de opdracht Zuordnung. txt-bestand.
Maak vervolgens normalization_organ. txt en normalization_variant. Txt-tabblad Tekstbestanden met genormaliseerde waarden voor alle Capsid-varianten en alle organen en weefsels.
In de eerste kolom met de normalization_organ. txt-bestand, schrijf de namen die voor elk orgaan zijn gegeven en de tweede kolom met normalisatiewaarden voor het overeenkomstige weefsel. Vul de eerste kolom van de normalization_variant.
txt-bestand met de lijst met capsid-namen en de tweede kolom met de genormaliseerde waarden van de gelezen tellingen voor elke capsid in de gegroepeerde bibliotheek. Bewerk het configuratiebestand door de volledige paden naar alle extra bestanden op te geven en voer het streepjescodeanalysescript uit met deze specifieke opdracht. Het barcode-analysescript voert verschillende bestanden uit, zoals de tekstbestanden met relatieve concentratie of RC-waarden van capsid-distributie binnen verschillende weefsels op basis van meerdere eerder beschreven normalisatiestappen, en het spreadsheetbestand dat tekstbestandsgegevens combineert tot samengevoegde matrixgegevens.
Visualiseer de gegevens en voer clusteranalyse uit van de matrixgegevens zoals beschreven in het tekstmanuscript. Het script zal de relatieve concentratie invoeren. XLS-bestanden en genereer twee plots van hiërarchische clusterheatmap en hoofdcomponentanalyse.
Als u plots of PNG-parameters wilt wijzigen, opent u het R-script en volgt u de instructies in de opmerkingensectie. De gekwantificeerde regio's van het AAV2-rep-gen toonden aan dat 99,2% positief was voor ITR, wat suggereert dat de AAV-capsiden het volledige virale genoom bevatten. In alle drie de sets vertegenwoordigden de geëxtraheerde reads op basis van handtekeningsequenties die specifiek zijn voor de bibliotheek ongeveer 94% van de totale reads, wat wijst op een goede kwaliteit.
Hiervan waren meer dan 99% geldige PV-lezingen en meer dan 99% van de geldige PV-lezingen waren uniek, wat suggereert dat de bibliotheek in evenwicht was met een hoge interne diversiteit. De twee belangrijkste takken van de heatmaphiërarchie weerspiegelden het verschil in de transductie-efficiëntie van capside-varianten. De linkertak met de meerderheid van de capsid-varianten omvatte alle capsiden die een hoge relatieve concentratiewaarde vertoonden over de meeste weefsels.
Afgezien van opvallend hoge leverspecificiteit, vertoonden drie andere capsiden specificiteit in het middenrif, skeletspieren, biceps en hersenen. De rechtertak van de hiërarchische clustering omvatte de capside-varianten met een algehele lagere transductie-efficiëntie die het meest zichtbaar was in de twaalfvingerige darm en de pancreas. De belangrijkste componentanalyse voor de oorspronkelijke subgroep vormt het cluster van capsidvarianten met hoge leverspecificiteit en schetst het VAR60 capsid outstanding muscle tropism.
Wanneer u dit protocol probeert, moet u letten op typefouten. De syntaxis is ook anders als u de Windows-opdrachtprompt gebruikt in vergelijking met Linux. Na de identificatie van nieuwe AAV-varianten moet het therapeutische en translationele potentieel worden geverifieerd in een overleden of groter diermodel.
Deze techniek maakt een directe zij-aan-zij vergelijking van AAV-varianten onder identieke omstandigheden mogelijk en is uiterst veelzijdig, waardoor de weg wordt vrijgemaakt voor de vertaling ervan bij grote dieren of zelfs bij mensen.
View the full transcript and gain access to thousands of scientific videos
Dit protocol behandelt de techniek en diversificatie van adeno-geassocieerde virussen (AAV's) voor toepassingen in gentherapie. Het maakt hoge-doorvoer screening van AAV varianten mogelijk om hun effectiviteit en specificiteit bij het leveren van therapeutische transgenen te verbeteren.