Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Amplification, Next-Generation-Sequenzierung und genomischer DNA Mapping von Retrovirale Integration Seiten

Published: March 22, 2016 doi: 10.3791/53840

Abstract

Retroviren zeigen Unterschrift Integration Präferenzen auf beiden lokaler und globaler Ebene. Hier präsentieren wir ein ausführliches Protokoll für (1) Erzeugung verschiedener Bibliotheken von retroviralen Integrationsstellen mit ligationsvermittelte PCR (LM-PCR) und Next-Generation-Sequencing (NGS), (2) die Abbildung der genomischen Ort jedes Virus- Host-Junction mit bedtools, und (3) die Daten für statistische Relevanz zu analysieren. Genomische DNA aus infizierten Zellen extrahiert wird durch Verdau mit Restriktionsenzymen oder durch Beschallung fragmentiert. Nach geeigneter DNA end-Reparatur werden doppelsträngigen Linker ligiert an die DNA-Enden, und semi-nested PCR wird unter Verwendung der Primer komplementär zu sowohl der langen terminalen Wiederholung (LTR) Ende des Virus und dem ligierten Linker-DNA durchgeführt. Die PCR-Primer tragen Sequenzen für DNA clustering während NGS erforderlich ist, das Erfordernis für separate Adaptorligation negieren. Qualitätskontrolle (QC) wird durchgeführt, um DNA-Fragment Größenverteilung zu bewerten und anzupassener DNA-Einbau vor NGS. Sequence-Ausgabedateien werden gefiltert für LTR-haltigen liest, und die Sequenzen der LTR und den Linker definieren, werden abgeschnitten entfernt. Getrimmten Wirtszellsequenzen sind mit einem Bezugsgenom kartiert BLAT verwenden und für minimal 97% Identität zu einem eindeutigen Punkt in dem Referenzgenom filtriert. Einzigartige Integrationsstellen sind für benachbarte Nukleotid (nt) Sequenz und Verteilung in Bezug auf verschiedene genomische Merkmale geprüft. Unter Verwendung dieses Protokolls, Integrationsort Bibliotheken von hoher Komplexität kann von genomischer DNA in drei Tagen konstruiert werden. Das gesamte Protokoll, das exogene virale Infektion von empfänglichen Gewebekulturzellen zur Integrationsstelle umfasst Analyse kann somit in etwa ein bis zwei Wochen durchgeführt werden. Neue Anwendungen dieser Technologie beziehen sich auf Langzeitanalyse von Integrationsstellen von HIV-infizierten Patienten.

Introduction

Integration von viraler DNA (vDNA) in das Wirtszellgenom ist ein wesentlicher Schritt in dem retroviralen Lebenszyklus. Die Integration wird durch das virale Enzym Integrase (IN) erreicht, die zwei verschiedene katalytische Prozesse ausführt, die 1 bis zur Gründung des stabil eingeführt Provirus führen. IN - Untereinheiten greifen in die Enden der linearen vDNA , die durch reverse Transkription erzeugt wird, die höhere Ordnung intasome mit vDNA bilden Enden zusammengehalten von einem IN Multimer 2-4. IN spaltet die 3' - stromabwärts gelegenen Enden der vDNA aus invariant 5'-CA-3' - Sequenzen in einem Verfahren , wie 3'-Verarbeitung bekannt, so dass an jedem Terminus vDNA 5-8 mit reaktiven Hydroxylgruppen 3' - Enden ausgespart. Die intasome wird anschließend in den Zellkern als Teil einer großen Anordnung von Host importiert und viralen Proteinen als preintegration Komplexes (PIC) bekannt 9-11. zelluläre Ziel-DNA (tDNA) Nach der Begegnung, verwendet in der vDNA 3'-Hydroxyl groups die tDNA oberen und unteren Stränge in versetzter Weise zu spalten und Phosphatgruppen 'die vDNA zu tDNA 5 schließt sich gleichzeitig durch den Prozess der Strangtransfer 12,13.

Retroviren zeigen Integration Präferenzen auf dem lokalen und globalen Maßstab. Auf lokaler Ebene bestehen Integrationsstellen Konsens von schwach konserviert Palindrom tDNA - Sequenzen, die von den vDNA Insertionsstellen 14,15 von etwa fünf Minuten vor zehn bp stromaufwärts und stromabwärts erstrecken. Weltweit 16 Retroviren zielen auf spezielle Chromatin Anmerkungen. Es gibt sieben verschiedene retrovirale Gattungen - alpha durch epsilon, lenti und spuma. Die Lentiviren, darunter HIV-1, begünstigen die Integration in den Körpern der aktiv transkribierten Gene 17, während die gammaretroviruses bevorzugt in Websites Transkriptionsstart integrieren (TSS) und aktive Enhancer - Regionen 18-20. In scharfem Gegensatz dazu wird Spumavirus stark in Richtung heterochrom voreingenommenatic Regionen, wie zum Beispiel Gen-armen Lamina-assoziierte Domänen 21. Lokale tDNA Grundeinstellungen sind zu einem großen Teil diktiert durch spezifische Netze von Nukleoprotein Kontakte zwischen IN und tDNA 13,22,23. Für die Lentiviren und gammaretroviruses, Integration in Bezug auf genomische Annotationen ist zum großen Teil bestimmt durch Wechselwirkungen zwischen IN und verwandten zellulären Faktoren 24-27. Eine Änderung , die Besonderheiten der IN-tDNA Interaktion Netzwerk 13,22,23,28 und stören oder Re-Engineering IN-Host - Faktoren - Wechselwirkungen 25-27,29-32 Strategien sind nachweislich Integration auf lokaler und globaler Ebene retargeten sind.

Die Macht der DNA-Sequenzierungsverfahren verwendet retroviralen Integrationsstellen zum Katalog immens in den letzten Jahrzehnten zugenommen. Integrationsstellen wurden in Pionierarbeit mit aufwendige Reinigung und manuelle Klonen Techniken gewonnen nur eine Handvoll von einzigartigen Websites pro Studie 33,34 zu ergeben.Die Kombination von LM-PCR - Amplifikation von LTR-Wirt - DNA Junctions mit der Fähigkeit, individuelle Integrationsstellen zu kartieren Mensch und Maus Entwurf das Feld transformiert Genomen, wobei die Anzahl der Seiten von exogenen Gewebekulturzellinfektionen zu mehreren hundert bis tausend 17 zunehmenden gewonnen , 18. Die jüngere Kombination von LM-PCR mit NGS Methodik Bibliothek Tiefe explodierenden gesendet. Im Einzelnen ergab Pyrosequenzierung in der Größenordnung von Zehntausenden von einzigartigen Integrationsstellen 30,35-38, während Bibliotheken durch die Verwendung von DNA - Clustering sequenziert können 19-21,39 Millionen von Sequenzen ergeben. Hier beschreiben wir eine optimierte LM-PCR-Protokoll zur Amplifikation und Sequenzierung von retroviralen Integrationsstellen DNA-Clustering NGS verwenden. Das Verfahren beinhaltet erforderliche Adaptersequenzen in die PCR-Primer und damit direkt in die amplifizierte DNA-Moleküle, wodurch ausgeschlossen ist die Voraussetzung für eine zusätzliche Adaptorligation Schritt vor der Sequencing 40. Die bioinformatische Analyse-Pipeline, von der Analyse der rohen Sequenzdaten für LTR-Wirts-DNA-Kreuzungen zur Kartierung der einzigartigen Integrationsstellen genomische Funktionen relevant, ist auch allgemein beschrieben. In Übereinstimmung mit der Priorität aus früheren methodologischen Protokolle auf diesem Gebiet etabliert 36,38,41-43 können benutzerdefinierte Skripts die Fertigstellung der einzelnen Schritte in der Bioinformatik Pipeline zur Unterstützung entwickelt werden. Die Nützlichkeit und die Empfindlichkeit des Protokolls wird durch Amplifizieren Sequenzierung mit repräsentativen Daten veranschaulicht, und Abbilden HIV-1 Integrationsstellen von Gewebekulturzellen in der ungefähren Multiplizität der Infektion (MOI) von 1,0 infiziert sind, sowie eine Titrationsreihe dieser DNA DNA nicht infizierte Zell Schritte in verdünnten bis 5-fach zu einer maximalen Verdünnung von 1: 15.625 die ungefähre äquivalente MOI von 6,4 x 10 -5 zu erhalten.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Generieren Virus Stocks

Hinweis: Ein Flussdiagramm der Nassbank Aspekt dieses Protokoll in Abbildung 1 dargestellt ist , um die Details der viralen Lager Produktion und die anschließende Infektion von Gewebekulturzellen werden in der Regel auf verschiedene Arten von Retroviren gelten.. Bei einigen Experimenten kann die Zielzelle , die endogene virale Rezeptor (en) nicht exprimieren, und in solchen Fällen ist die Konstruktion von pseudotypisierten retroviralen Partikeln heterologe virale Hüll - Glycoprotein, zB das G - Glykoprotein von vesikulären Stomatitis - Virus (VSV-G) beherbergt wird erforderlich für die Infektion 44,45.

Hinweis: Vorkehrung getroffen werden sollten, wenn sie mit HIV-1 zu arbeiten. Obwohl spezifische Leitlinien von Institution zu Institution variieren, alle Virus-basierten Arbeiten sollten in einem eigenen, Betreiber beschränkt biologischen Sicherheitsschrank durchgeführt werden (in der Regel als Gewebekultur Haube bezeichnet). Persönliche Schutzausrüstungdas schließt Gesichtsschutz, Überschuhe, Doppelhandschuh-Schicht und eine Ganzkörper-Overall Anzug sollte jederzeit getragen werden. Alle flüssigen Abfälle aus virusbezogenen Experimenten ergeben, sollten mit Bleichmittel (10% Endkonzentration), und alle Abfälle einschließlich Feststoffe inaktiviert werden sollte vor der Entsorgung autoklaviert werden.

  1. Einen Tag vor der Transfektion Platte 3,3 x 10 6 HEK293T - Zellen in 10 ml Dulbecco-modifiziertem Eagle Medium (DMEM) , ergänzt mit 10% (v / v) fötalem Rinderserum und 1% (v / v) Penicillin / Streptomycin (10.000 U / ml Lager) in jedem der fünf 100-mm-Schalen.
    Hinweis: Ergänzte-DMEM bezeichnet als DMEM-FPS von diesem Punkt an.
  2. Am nächsten Tag, Transfektion der Zellen mit 10 ug Plasmid voller Länge retroviralen molekulare Klone oder 9 ug Kuvert gelöscht single-round-Vektoren mit 1 ug eines VSV-G-Expressionskonstrukt unter Verwendung von im Handel erhältlichen Transfektionsreagenzien oder Calciumphosphat tragen.
    1. Inkubieren Sie die cells bei 37 ° C in einer befeuchteten Zellkultur - Inkubator mit 5% CO 2 (dieser Zustand im folgenden als "Gewebekultur - Inkubator"). Nach etwa 48 Stunden, ernten die virushaltigen Zellmedien eine volumetrische Pipette und es durch ein 0,45-um-Filter durch Schwerkraftfluss passieren.
    2. Konzentriere das Virus durch Ultrazentrifugation bei 200.000 · g für 1 Stunde bei 4 ° C. Resuspendieren des Virus-Pellet in 500 ul DMEM-FPS, enthaltend 20 U DNase, und Inkubieren bei 37 ° C für 1 Stunde.
      Hinweis: Die DNase Schritt die Rückgewinnung von unerwünschten Plasmidsequenzen zu reduzieren hilft, indem die Hauptlast der Plasmid DNA eliminiert, die aus dem Transfektionsverfahren anhält.
  3. Bestimmen Sie p24 - Konzentration 46 mit einem HIV-1 - p24 - Antigen - Capture - Kit nach den Anweisungen des Herstellers.
    Hinweis: Virus - Konzentration kann auch durch reverse Transkriptase - Aktivitätstest 47,48 bestimmt werden. Alternativ kann die Ebene der funktionellen Virusbestimmt werden MOI durch die Messung. Dies wird am leichtesten unter Verwendung von fluoreszenzaktivierter Zellsortierung mit Viren durchgeführt, die fluoreszierenden Reportergene wie enhanced green fluorescent protein exprimieren. MOI Bestimmung kann besonders nützlich sein, wenn sie mit primären Zellen arbeiten, die nicht das gleiche Niveau der Infektion als optimierte Zelllinien unterstützen.

2. Infect Zellen, die mit Virus

  1. Platte 3,0 x 10 5 HEK293T Zellen pro Vertiefung in einer Platte mit 6 Vertiefungen in 2,5 ml DMEM-FPS und über Nacht in einem Gewebekultur - Inkubator inkubiert.
    Anmerkung: Die Anzahl der einzelnen Integrationsstellen mit diesem Protokoll wiederhergestellt ist direkt proportional zu der Anzahl der Zellen und die Menge des aktiven Virus bei der Infektion verwendet.
  2. Infect Zellen mit einer endgültigen viralen p24-Konzentration von 500 ng / ml in einem Endvolumen von 500 & mgr; l frisches DMEM-FPS für 2 h in einem Gewebekultur-Inkubator, fügen dann 2 ml DMEM-FPS vorgewärmt auf 37 ° C pro Vertiefung und weiterhin Inkubation.
  3. Beim48 Stunden nach der Infektion, die Medien zu entfernen und die Zellen mit 2 ml phosphatgepufferter Salzlösung (PBS) waschen. 0,5 ml Trypsin-EDTA vorgewärmt auf 37 ° C, und nach ein paar Sekunden visuell inspizieren die Vertiefungen für die Zell dislodgement.
  4. 2 ml vorgewärmt DMEM-FPS und Resuspendieren der Zellen durch vorsichtiges Auf- / Ab-Pipettieren mit einer volumetrischen Pipette ~ 10-mal. Die Lösung wird in einem 75 cm 2 Gewebekulturflasche mit 18 ml vorgewärmten DMEM-FPS, und Inkubation der Zellen in einem Gewebekultur - Inkubator.
  5. Nach minimal von fünf Tagen nach Beginn der Infektion, sammeln Sie die Zellen, die durch die Medien zu entfernen, waschen mit 5 ml PBS, 2 ml vorgewärmtes Trypsin-EDTA und resuspendieren mit 5 ml vorgewärmten DMEM-FPS durch Pipettieren. Zentrifugieren Sie die Lösung für 5 min bei Raumtemperatur bei 2500 · g, und den Überstand verwerfen.
    Hinweis: Obwohl die Integration unter diesen Bedingungen Plateaus bei etwa 48 Stunden nach der Infektion 49,50 werden die weiteren 3 Tagen Kultur erforderlich sufficiently die Konzentration von nicht integrierten DNA-Moleküle zu verdünnen, die von zellbasierten DNA Rekombination oder viral-vermittelten Autointegration ergeben.
  6. Extrahieren genomischer DNA aus dem Zellpellet eines im Handel erhältlichen Kits (siehe zB 51). Eluieren der DNA aus dem zugeführten Ionenaustauschsäule mit 200 ul 10 mM Tris-HCl, pH 8,5.
    Hinweis: Eine Teilmenge von Zellen sollte bei 48 Stunden nach der Infektion (Schritt 2.3) für eine Infektiosität Assay verteilt werden, um richtige Virus-Infektion vor der NGS zu gewährleisten.

3. Fragment genomischer DNA durch Ultraschallbehandlung oder durch Restriktionsenzymverdau

Hinweis: Beschallen Fragmente genomischer DNA in einer nahezu sequenzunabhängig und ist somit der bevorzugte Modus der Fragmentierung bei der Sequenzierung Proben mit einem niedrigen erwarteten Wiederfindungsrate (zB infizierte Patientenzellen oder bei relativ niedrigen MOI eingeleitet Infektionen). Darüber hinaus ermöglicht der Beschallung ein PCR-Duplikate eines parti zu unterscheidendere Integrationsort Sequenz aus einzigartige Integration an der gleichen Stelle, die die klonale Expansion von Provirus-enthaltenden Zellen in infizierten Patienten (siehe Schritt 11 unten) 39,52-54 zu unterscheiden , ist entscheidend.
Hinweis: Die DNA gespalten unmittelbar stromabwärts von dem stromaufwärtigen LTR zu verringern Amplifikation der internen viralen Sequenzen während LM-PCR werden sollte. Das Restriktionsenzym BglII , das 43 bp stromabwärts von der stromaufwärts U5 - Sequenz liegt , und das ist nicht kompatibel für die anschließende Ligation mit MseI-erzeugten DNA - Enden funktioniert gut mit vielen HIV-1 - Stämme (1B). Wenn DNA durch Beschallung der Vorbereitung, die interne-Spalter Restriktionsenzym sollte nach Linkerligation angewendet werden (siehe Abbildung 1C - E und Schritt 4.3).

  1. Für Beschallung, auf ein Endvolumen von 120 & mgr; l 10 & mgr; g genomische DNA in Nuclease-freiem Wasser mischen. mit Hilfe von Parametern für eine durchschnittliche Bruchgröße von 500 bp (zwei Runden der folgenden para beschallenm: Einschaltdauer: 5%; Intensität: 3; Zyklen pro Burst: 200; Zeit: 80 sec).
  2. Reinige beschallter DNA eine PCR-Reinigungs-Kit. Reparatur der DNA-Enden unter Verwendung eines DNA-End-Reparatur-Set und reinigen die DNA unter Verwendung eines PCR-Reinigungs-Kit. A-Schwanz der DNA unter Verwendung von Klenow - exo - Enzym und reinigen die A-tailed DNA eine PCR - Reinigungs - Kit. Siehe 51,52 für weitere Details der Kit - Nutzung.
  3. Für Restriktionsendonuklease-Verdau, schneiden 10 ug genomische DNA über Nacht bei 37 ° C in einem Volumen von 100 & mgr; l mit Puffer vom Hersteller und einem Cocktail von Enzymen geliefert (100 U jeweils), die 5'-TA-Überhänge erzeugen, sowie eine inkompatibel Enzym wie BglII spaltet stromabwärts von dem stromaufwärtigen viralen LTR. Reinige die DNA am nächsten Tag ein PCR-Reinigungs-Kit verwenden.
    Anmerkung: Keine der Restriktionsenzyme innerhalb des Terminals ~ 30 bp der viralen DNA Ende schneiden sollte, die von der LM-PCR-Protokolls amplifiziert wird. Dieses Protokoll verstärkt spezifisch die U5Ende der HIV-1-DNA.

4. Anneal Linkeroligonukleotide und Ligat zu Fragmentierte genomischer DNA

Hinweis: Bereiten eines asymmetrischen Linker einen Überhang enthält, der mit den oben genannten DNA - Fragmente (siehe Tabelle 1 für die Sequenzen von Oligonukleotiden , verwendet in diesem Protokoll) kompatibel ist. Der Linker an die mit beschallter DNA verwendet werden , müssen eine kompatible T-3' - Überhang enthalten, während der Linker für MseI-verdaute DNA ein kompatibles 5'-TA - Überhang enthalten (Abbildung 1). Der kurze Linker-Strang muss zusätzlich eine nicht verlängerbare chemische Modifikation enthalten, wie 3'-Amin, die nachfolgenden Amplifikationsreaktionen in Richtung auf die DNA von Interesse zu beschränken.
Hinweis: Wenn mehrere verschiedene Integrationsstelle Bibliotheken parallel vorbereitet und / oder beim Multiplexen einzigartige Proben auf dem gleichen Sequenzierungslauf, wird empfohlen, für jede Probe einzigartigen Linker zu verwenden, das Potenzial für die Probenquer Contamin zu begrenzenation während der PCR. Dies bedeutet, zusätzlich die Verwendung von einzigartigen Linker-Primern für jede Probe während der semi-nested PCR (unten beschrieben). Einzigartige Linker Stränge und Linker - Primer können durch Verwürfeln der Linkeroligonukleotid Sequenzen in Tabelle 1 aufgeführt , während die Aufrechterhaltung ähnliche Gesamt% GC - Gehalt und der geltenden Überhang Positionen ausgelegt sein.

  1. Tempern die kurzen und langen Linkers Stränge in 35 ul 10 mM Tris-HCl, pH 8,0 bis 0,1 mM EDTA (Endkonzentration von 10 & mgr; M jedes Oligonucleotid) durch Erhitzen auf 90 ° C und langsames Abkühlen auf Raumtemperatur in 1 ° -Schritten C pro min.
  2. Vorbereitung mindestens vier parallel Ligierungsreaktionen pro genomische DNA-Probe, die 1,5 uM ligierten Linker enthalten, 1 & mgr; g fragmentierte DNA und 800 U T4 DNA-Ligase in 50 ul. über Nacht bei 12 ° C ligieren. Reinige den nächsten Tag mit einem PCR Purification Kit.
  3. Für die Proben durch Beschallung hergestellt, verdauen das gereinigte Ligationsreaktion mit 100 U eines schränkungenEnzym spaltet von der stromaufwärtigen LTR nachgeschalteten (beispielsweise BglII für HIV-1) unter dem Hersteller über Nacht Bedingungen empfohlen. Reinige den DNA eine PCR Purification Kit.

5. Amplify Viral LTR-Host-Genomic DNA Junctions von Semi-Nested-PCR

Hinweis: Um für eine optimale Bibliothek Vielfalt gewährleisten, mindestens 4-8 parallel PCRs in Abhängigkeit von der DNA-Konzentration der rückgewonnenen Ligationsreaktion sollte für jede Probe sowohl für PCR Runden hergestellt werden. DNA-Template Konzentration sollte durch Spektrophotometrie quantifiziert werden. In diesem Protokoll verwenden die ersten und zweiten Runde der PCR verschachtelte LTR-spezifischen Primern, aber die gleiche Linker-spezifischen Primer für beide Runden (Tabelle 1) verwendet. Die zweite Runde LTR-spezifischen Primer und die Linker-spezifischen Primer kodieren Adaptersequenzen für DNA-Clustering sowie Sequenzierungsprimer-Bindungsstellen. Die verschachtelte LTR-spezifischen Primer kodiert auch eine 6-nt-Index-Sequenz, which kann unter verschiedenen Primern zum Multiplexen Bibliotheken innerhalb der gleichen Sequenzierungslauf variiert werden.

  1. Bereiten ersten Runde PCRs die Zutaten pro Röhrchen enthält , wie in Tabelle 2 aufgeführt.
    Hinweis: Der Linker-spezifischen Primer birgt 22 nt der Komplementarität an den Linker, einer Schmelztemperatur von 53 ° C, einen GC-Gehalt von 45%, und dessen 3'-Ende befindet 15-16 bp stromaufwärts vom 3'-Termini von die verschiedenen Linker langen Strängen (Tabelle 1). Die erste Runde 27 nt LTR-Primer hat eine Schmelztemperatur von 59 ° C, einen GC-Gehalt von 48%, und dessen 3'-Ende 34 bp stromaufwärts von dem HIV-1 U5-Terminus entfernt. Der Bereich der zweiten Runde 26 nt LTR-Primer, die für die HIV-1 LTR komplementär ist, hat eine Schmelztemperatur von 60 ° C, einen GC-Gehalt von 50%, und dessen 3'-Ende 18 bp stromaufwärts von dem viralen U5 befindet Terminus. Es wird empfohlen, dass Oligonukleotid Schmelztemperatur und GC-Gehalt dieser Parameter, wenn die Benutzer nachahmen solltenDesign von PCR - Primern mit veränderten Sequenzen (einschließlich der für die Verwendung mit anderen Retroviren) 21.
  2. Führen Sie erste PCR-Runde unter den folgenden Thermocycler-Parameter: Ein Zyklus: 94 ° C für 2 min; 30 Zyklen: 94 ° C für 15 sec, 55 ° C für 30 sec, 68 ° C für 45 sec; einen Zyklus: 68 ° C für 10 min.
  3. Pool Reaktionen und zu reinigen, um ein PCR-Reinigungs-Kit verwenden. Bereiten zweite Runde PCRs die Zutaten pro Röhrchen , das gemäß Tabelle 3. Führen Sie die zweite Runde der PCR - Thermocycler - Parameter unter Verwendung der in Schritt 5.2 beschrieben. Pool, die Reaktionen und reinigen die DNA, die eine kommerzielle PCR-Reinigungs-Kits nach den Anweisungen des Herstellers.
    Hinweis: Eine Vielzahl von empfohlenen Index Sequenzen kompatibel mit DNA - Clustering NGS 71 zur Verfügung stehen.

6. Führen Sie QC und NGS (In der Regel durch eine Sequenzierung Anlage abgeschlossen)

  1. (QC-Test # 1) bestätigen Schritt 5.3 Bibliothek DNA-Konzentration unter Verwendung eines FluorMeter 55. Kurz gesagt, bereiten Standards und experimentellen Proben in einem Gesamtvolumen von 200 ul Nuklease-freies Wasser. Wirbelröhren für 2-3 sec, für 2 min bei Raumtemperatur inkubieren, und dann die Proben in das Fluorometer gelesen.
    Anmerkung: Proben mit einer Mindestkonzentration von 2 nM DNA-Bibliothek in einem Mindestvolumen von 15 & mgr; l enthalten.
  2. (QC - Test # 2) DNA - Fragment Größenverteilung bestätigen einen bandbasierten Assay 56 verwendet wird .
    Hinweis: Eine ideale Verteilung eine relativ breite DNA Spitze ist zentriert um 500 bp in der Länge. Wenn eine erhebliche Menge an Material größer als 1 kb ist, dann ist es empfehlenswert, eine Größe Wahlverfahren zu integrieren, um längere DNA-Spezies zu eliminieren, die Brücke Verstärkung während Clustering behindern wird. Im Gegensatz dazu, wenn ein signifikanter Peak um 100 bis 200 bp ergibt, wurden ein Primer-Dimer kann während der PCR gebildet. In diesem Fall sollte das Verfahren optimiert werden, um die Bildung von Primer-Dimeren zu minimieren.
  3. (QC-Test # 3) Confirm richtigen Einbau von Adaptern in DNA - Bibliothek durch quantitative PCR 57.
  4. Führen Sie NGS nach der Anwendung der Literatur des Herstellers. Nutzen Sie einen Spike-in von 10% (w / w) & PHgr; X174-DNA, die durch die Bereitstellung ausgewogene Basenzusammensetzung zur Sequenzierung Laufechtzeit-Qualitätsmetriken zu optimieren.
    Hinweis: Die Integration Site-Sequenzierungsexperimenten typischerweise auf einzelne Ende 150 bp (SE150) oder Paired-End 150 bp (PE150) Sequenzierung unterzogen werden. PE150 ist besonders nützlich , um den Linker - Befestigungspunkt auf jedem DNA - Molekül zu erfassen (beispielsweise wenn Integrationsstellen auf Anzeichen einer Wirtszelle klonalen Expansion prüfenden).

7. Verwenden Sie ein Customized Python oder Perl-Skript Sequenzierungsdaten für LTR-Sequenzen enthält, Crop entfernt LTR und Linker-Sequenzen zu parsen und Karte zu Referenzgenom mit BLAT

  1. Scan FASTA-Dateien für LTR-Sequenz enthalten liest, Ernte LTR und Linker-Sequenzen entfernt von Host-genomischen DNA-Sequenz undexportieren diese Sequenzen auf eine neue FASTA-Datei. Karte abgeschnitten liest sowohl mit einem Referenzgenom (zB menschliche Genom Versionen hg19 oder GRCh38) und das virale Genom mit BLAT 58, mit Ausgangsintegrationsstelle Koordinaten in eine separate .txt - Datei exportiert werden , mit den folgenden Einstellungen:
    stepsize = 6, minIdentity = 97 und maxIntron = 0
  2. Parsen der BLAT Ausgangs .txt - Datei entfernen autointegrations (dh Nachweis , dass der LTR Ende in eine innere Region des viralen DNA - Genoms integriert ist) und andere Sequenzen Abbildung auf die HIV-1 - Genoms, und schaffen eine separate Ausgabe .txt - Datei , in der alle doppelten Integrationsstellen haben in einzelne, einzigartige koordinieren Treffer verdichtet.

8. Erstellen Sie .bed Dateien mit 15-Nt Intervalle Integrations Umgebung, wandeln diese zu FASTA-Dateien und Konstruieren Sequence Logos zur Anzeige Basiseinstellungen Umgebung Integration Seiten

  1. Erstellen Sie .bed Dateien, die ein Intervall von Basen Liste fürjeder Integrationsstelle. Mindestens 15 Basen (5 stromaufwärts und 10 stromabwärts) sind für die Sequenzlogo Generation vorgeschlagen. Generieren Sie eine FASTA - Datei aus diesen .bed Dateien durch die fastaFromBed Funktion von bedtools 59 verwenden und diesen Befehl ein :
    fastaFromBed -fi / Verzeichnis / to / Referenz / Genom / -name -s -bed 15_base_pair_file.bed -FO output_file.fasta
    Hinweis: Die Invariante viralen 5'-CA-3 'Dinucleotid verbunden ist DNA während der Integration zu hosten, und die Überprüfung der Kreuzung der LTR-Terminus an zelluläre DNA ist ein wichtiger erster Filter zu identifizieren Bona-fide-Integrationsstellen. Wir stellen zusätzlich Sequenz Logos von dieser Wirtspopulation DNA-Sequenz, die experimentellen Ergebnisse zu verifizieren. Als Retroviren umgebenden Präferenzen Basis Unterschrift zeigen ihre Integrationsstellen 14,15 dienen die Sequenz Logos , dass die abgebildeten genomischen Websites durch IN-vermittelte Integration entstand zur Validierung im Vergleich zu anderen Rekombinationsmechanismen wie nicht-homologe DNAEnde 60,61 Beitritt.
  2. Verwenden Sie WebLogo 3 (http://weblogo.threeplusone.com/create.cgi) Sequenz Logos aus den FASTA-Dateien zu erstellen. Klicken Sie auf "Wählen Sie Datei 'FASTA-Datei hochladen und verwenden Sie die folgenden Einstellungen: Ausgabeformat, PDF (Vektor); Logo Größe, groß; Erste Positionsnummer, -5; Logo Bereich -5 bis 5; Y-Achsen-Skala, 0,1, Y-Achsen-tic Abstand, 0,5, Farbschema, klassisch (NA).

9. Erstellen Zentralbasenpaar .bed Dateien, Check für die Probe Kreuzkontamination und Karte der Verteilung von Unique Integration Seiten Relativ zu Einschlägige Genomic Eigenschaften

  1. Da retrovirale Integration über die tDNA Stränge in einer gestaffelten Art und Weise erfolgt, stellen Sie die genauen Koordinaten der Integrationsstellen für die korrekte Zuordnung der genomischen Verteilung relativ zu genomischer Merkmale des zentralen bp des Zielortes Doppelarbeit zu reflektieren.
    1. Daher ist für 5 bp aus dem i-Offset-Viren wie HIV-1, erstellen Sie eine .bed Datei mit dem zentralen bp Duplizierenntegration Ort durch zwei Basen stromabwärts für Integrationen Abbildung auf den Plus-Strang und zwei Upstream-Basen für Integrationen Abbildung auf die Minus-Strang.
  2. Um zu überprüfen , für die Probenkreuzkontamination, die Berechnung der Anzahl der Integrationsstellen häufig zwischen den verschiedenen Bibliotheken unter Verwendung der bedtools Funktion schneiden zentrale bp schneiden .bed Dateien für zwei verschiedene Proben und über diesen Befehl ein :
    bedtools intersect -a -b central_basepair_1.bed central_basepair_2.bed -f 1.00 -r -s> overlap1v2.txt
  3. Zählen Sie die Anzahl der Zeilen in der Ausgabe overlap1v2.txt-Datei, um die genaue Anzahl der Websites häufig unter den beiden Bibliotheken zu quantifizieren, indem Sie den folgenden Befehl:
    wc -l overlap1v2.txt
  4. Laden Sie die RefSeq Anmerkung .bed Datei für die Version des Referenzgenoms , die für die Integration Standortkartierung von der UCSC Genomannotation Datenbank verwendet wurde (zB http://hgdownload.cse.ucsc.edu/goldenPath/hg38/datenbank) 62.
    1. Berechnen Sie die Anzahl der Integrationsstellen fallen innerhalb RefSeq Gene mithilfe des bedtools Funktion schneiden die zentrale Basenpaar .bed Datei zu schneiden , die für die Probe erzeugt wurde , mit der RefSeq .bed Datei nach diesem Befehl:
      bedtools intersect -a -b central_basepair_1.bed RefSeq_hg38.bed -u> RefSeq_sample1.bed
  5. Zählen Sie die Anzahl der Zeilen in der Ausgabe RefSeq_sample1.bed-Datei, um die genaue Anzahl der Websites, fallen in RefSeq Gene zu quantifizieren, indem Sie den folgenden Befehl:
    wc -l RefSeq_sample1.bed
  6. Wiederholen Sie die Schritte 9.3 und 9.4 für die Zuordnung von Integrationsstellen zu anderen Annotation von Interesse, für die ein Intervall .bed Datei zur Verfügung steht. Laden Sie die aktuelle CpG-Insel Anmerkung .bed-Datei für das Referenzgenom von Interesse aus der UCSC Genomannotation Datenbank, wie in Schritt 9.4 gerichtet.
    1. Berechnen Sie die Anzahl der Integrationsstellen innerhalb eines bestimmten di fallenHaltung (in diesem Beispiel dargestellt ist ein 5 kb Fenster) von CpG - Inseln durch die bedtools Fensterfunktion verwendet und im Anschluss an diesen Befehl ein :
      bedtools Fenster -w 2500 central_basepair_1.bed -b CpG_hg38.bed -u> CpG_sample1.bed
  7. Zählen Sie die Anzahl der Zeilen in der Ausgabe CpG_sample1.bed-Datei, um die genaue Anzahl der Websites innerhalb von 2,5 kb stromaufwärts oder stromabwärts von CpG-Inseln mit dem folgenden Befehl fallen zu quantifizieren:
    wc -l CpG_sample1.bed
  8. Wiederholen Sie die Schritte 9.6 und 9.7 für die Zuordnung von Integrationsstellen in der Nähe TSS. Generieren Sie eine alternative Version der RefSeq.bed-Datei, wobei genomische Mapping auf mehr als ein Gen-Koordinaten wurden nur ein einziges Gen, die an dieser Position angepasst. Dies verhindert, dass zu hohe Schätzung der Gendichte Integrationsstellen umgeben. Berechnen Sie die Gendichte im 1 Mb Region jeder Integrationsstelle umgeben von den bedtools Fensterfunktion verwendet und im Anschluss an diesen Befehl ein :
  9. Berechnen Sie die durchschnittliche Gendichte für alle Integrationen in dem Datensatz mit diesem Befehl folgt vor:
    awk '(sum + = $ 7) END (print "Average =" sum / NR)' GeneDensity_sample1.bed

10. Statistisch Integration Site - Distributionen unter Samples Vergleichen Mit Zweischwänziges exakte Test nach Fisher und Zweischwänziges Wilcoxon Rangsummentest in R

Hinweis: Die Verwendung des exakten Fisher-Test zum Vergleich der Anteil der Integrationsstellen innerhalb RefSeq Gene oder in einem Fenster von CpG-Inseln oder TSS, sondern verwenden Sie die Summe Wilcoxon-Rank-Test für die Verteilung in Gendichte Vergleich der Integrationsstellen umgeben. Das R - Programm ist bei http://www.r-project.org/ zur Verfügung.
Zweischwänziges exakten Fisher-Test:

  1. Mit den Zahlen berechnet wie in den Schritten 9.4 und 9.7 angewiesen, create Matrizen für jeden Vergleich in R der beobachteten Ereignisse (Integrationen innerhalb einer Anmerkung oder innerhalb eines Fensters eine Anmerkung umgibt) im Vergleich zu Orten bleiben durch diesen Befehl folgt vor :
    (Annotation_of_interest <- Matrix (c (SampleA # in, SampleA # verbleibenden SampleB # in, SampleB # Rest-), ​​nrow = 2, dimnames = list (c ( 'Mitte', 'Rest'), c ( 'SampleA', 'SampleB'))))
  2. Berechnen Sie den P - Wert für den Vergleich von zweiseitigen exakten Fisher-Test mit dem folgenden Befehl ein :
    fisher.test (annotation_of_interest, alternative = 'two.sided') $ p.value
    Zweischwänziges Wilcoxon Rangsummentest:
  3. Erstellen Sie eine durch Tabulatoren getrennte TXT-Datei, in der jede Spalte den Beispielnamen in der oberen Zelle enthält, gefolgt durch die folgenden Gen Dichtewerte für alle Integrationsstellen in dieser Bibliothek (aus der .bed Datei in Schritt 9.9 erzeugt) erhalten haben. Importieren Sie diese durch Tabulatoren getrennte TXT - Datei in R mit dem folgenden Befehl und navigating auf die richtige Datei-Verzeichnis:
    FILE-NAME <- as.data.frame (read.delim (file.choose (), header = T, check.names = FALSE, füllen = TRUE, sep = ' t'))
  4. Berechnen Sie den P - Wert für den Vergleich von zweiseitigen Wilcoxon - Rangsummentest mit dem folgenden Befehl ein :
    wilcox.test (Dateiname $ SampleA, Dateiname $ SampleB, alternative = 'two.sided', gepaart = F, genau = T) $ p.value
    Hinweis: P - Werte können nur bis zu einer bestimmten (extrem niedrige) Grenze in R berechnet werden, wonach Null wird durch das Programm zurückgegeben werden. Für massiv verschiedenen Proben , die eine P = 0 in R ergeben, schätzen den P - Wert als <2,2 x 10 -308.

11. Untersuchen Sie Raw Sequenzierungsdaten für Nachweis der klonalen Expansion der Zellen mit integrierten Virus-DNA

Hinweis: Ein kleines Potential für im Referenzgenom gleichen nt genau an der mehr als eine Integration vorhanden ist. Alternativ kann eine einzelne integration Ereignis kann aufgrund der während der Bibliothek Vorbereitung Verwendung von PCR in Sequenzierungsdaten redundant vorhanden sein und / oder durch Zell Vervielfältigung vor der DNA-Präparation. Neuere Analysen der genomischen DNA von HIV-infizierten Patienten haben diese Möglichkeiten zeichnen sich durch eine einzigartige Beschallung Scherstellen / Linker Befestigungspunkte zu identifizieren innerhalb von DNA - Sequenzen mit identischen Integrationsstellen 52-54 (die nur vor der PCR auftreten können). Derzeit gibt es eine Debatte darüber, ob Proviren in klonal expandierten Zellen tragen zur latenten Virusreservoir beherbergte, und somit ist es von besonderem Interesse, ihr Niveau der Expansion zu charakterisieren, wenn bei menschlichen Patienten Integrationsstellen zu studieren.

  1. Ähnlich wie bei dem in Schritt genannten Verfahren 8.1, erzeugen .bed Dateien ein Intervall von Basen erstreckt, in diesem Fall die Auflistung, 25 nt stromabwärts von jedem einzigartigen Integrationsstelle (upstream Basen sind hier nicht erforderlich). Generieren Sie eine FASTA-Datei aus diesen .bed Dateien (wie angewiesen inSchritt 8.1) durch die fastaFromBed Funktion von bedtools mit und im Anschluss an diesen Befehl ein :
    fastaFromBed -fi / Verzeichnis / to / Referenz / Genom / -name -s -bed 25_base_pair_file.bed -FO output_file.fasta
    Hinweis: Um die Spezifität der einzelnen verbessern suchen, wird empfohlen, mindestens 25 nt stromabwärts von jeder Integrationsstelle zu extrahieren für klonalen Expansion analysiert.
  2. Vorzugsweise ein individuelles Skript finden Sie in der Rohsequenzdaten FASTA-Datei für alle Strings eine exakte Übereinstimmung mit dem 25 nt stromabwärts von jedem einzigartigen Integrationsstelle und deponieren diese Sequenzen in eine neue Datei enthält. Trim LTR und Linker-Sequenzen aus den rohen Saiten. Merge PE-Sequenz liest, indem liest auf der Rückseite Ergänzung Umwandlung, Trimmen LTR und Linker-Sequenzen, und dann READ2 Strings ihre READ1 Paar zuweisen, wenn die Strings nt mindestens 20 überlappende teilen.
  3. Scannen Sie die Linker-Befestigungspunkte von jeder Integrationsstelle Block. Klassifizieren jedes Integration als "klonal expandierten &# 34; wenn Linker Befestigungspunkte sind ≥3 auseinander bp.
    Hinweis: Ein Protokoll zur klonalen Expansion Analyse ohne Sequenz verschmelzenden liest wurde 52 beschrieben.
    Anmerkung: Fragmentation des Genoms an der exakt gleichen Stelle durch Beschallung führt zu einer Unterschätzung des Ausmaß der klonalen Expansion und Methoden , um die sich ergebende experimentelle Bias korrigiert wurden 63,64 beschrieben.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Tabelle 4 zeigt die Ergebnisse eines repräsentativen Experiments , die Empfindlichkeit von NGS zu veranschaulichen für die Integrationsstellen von einer Kultur von infizierten Zellen gewonnen wird . Nicht infizierte Zell - DNA wurde in dem im Durchschnitt jede Zelle eine Integration 40 enthaltene genomische DNA von einer Infektion zu seriell verdünnt verwendet. 15.625: Verdünnungen wurden in Schritten von fünf zu einer maximalen Verdünnung von 1 hergestellt. Genomischer DNA in der Titrationsreihe wurde dann durch Beschallung fragmentiert oder durch Verdau mit Restriktionsendonukleasen MseI und BglII, gefolgt von LM-PCR. Die Anzahl der einzigartigen Integrationsstellen, sowie die Anzahl der Stellen Mapping proximal zu ausgewählten genomischen Annotationen, wurden nach dem obigen Protokoll berechnet. Die Datenanalyse ergab, Dutzende von einzigartigen Integrationsstellen (1-2% der Menge erholte sich von ordentlich genomische DNA) aus Bibliotheken aus Zellen hergestellt gewonnen, wo in der Theorie nur eine in 15.625 infiziert war. Wenn Integrationsstelle Datensätze Analyse ist es wichtig, die Daten zu einem aufeinander abgestimmten Satz von zufälligen genomischen Standorten zu vergleichen, die ein angepaßtes zufallsgesteuert oder MRC genannt wird. Da die repräsentative Ergebnisse genomische DNA durch Restriktionsenzym-Verdau oder durch Beschallung geschert werden zwei verschiedene Datensätze MRC wurden konstruiert. MRC enz enthielt 50.000 einzigartige genomische Websites , die durch zufällig Websites von hg19 in der Nähe zu den Standorten der MseI und BglII Restriktionsenzymverdau, während MRC zufällig beherbergte 10.000 Standorte erzeugt ohne Normalisierung für Entfernung von Set genomischen Marker ausgewählt wird . Nur die Websites, die auf einer einzigartigen genomischen Stelle abgebildet zurück werden können, sollten in MRC-Datensätze verwendet werden. Als Beschallungs Scheren genomischer DNA im Wesentlichen frei von Sequenz Bias, MRC zufällig durch Fragmentierung der DNA durch Beschallung hergestellt , wie mehr für Datensätze angezeigt werden. Eine alternative Art der SteuerungsintegrationWebsite - Datenmenge kann durch Umsetzen von rekombinanter Proteingehalt , intasome Nukleoproteinkomplex 21 oder PICs extrahiert aus akut infizierten Zellen 17 mit deproteinierten genomischen DNA und dann im Anschluss an die LM-PCR und NGS Protokolle 21 in vitro erzeugt werden.

P - Werte für einen Vergleich der Verteilung der Integrationsstellen gewonnen durch Beschallung gegen Restriktionsverdau (Vergleich zwischen dem ordentlichen Proben), sowie zum Vergleich mit dem MRC enz und MRC Zufalls sind in Figur 2 dargestellt. Die Verteilung der Integrationsstellen gewonnen folgende Beschallen war ähnlich denen durch Restriktions gewonnene Enzym für alle Anmerkungen verdauen sucht, mit der größten Varianz offensichtlich in Bezug auf die Nähe zu CpG islands. Wie erwartet 18,65 beide Datensätze unterschieden sich signifikant von den MRCs in Bezug auf Integrationen innerhalb RefSeq Gene und Gen - dichte rund um die durchschnittliche Integrationsstelle, während beide Datensätze zu den MRCs waren ähnlich in Bezug auf die Verteilung relativ zu CpG-Inseln und TSS. Da relativ wenige HIV-1 Integrationsstellen innerhalb von 2,5 kb einer CpG Insel oder TSS Karte erholte sich die Gesamtzahl der Seiten zu erhöhen , ist wahrscheinlich , um die Variabilität zu verringern , die zwischen Datensätzen (Tabelle 4 und Figur 2) entstehen können. Sequence Logos die Echtheit der Integrationsstelle Daten zu bestätigen , die in 3 gezeigt. Die Consensus - HIV-1 - Integrationsstelle 14,22 (-3) TDG (G / V) TWA (C / B) CHA (+7) ( auf Basis der international Union of Biochemistry Basiscodes geschrieben, der Backslash zeigt die Position des vDNA Plus-Strang verbinden, und die unterstrichenen zeigt die 5-bp-Sequenz nach der HIV-1-Integration und DNA-Reparatur dupliziert) ist offensichtlich für Bibliotheken, die von beiden Fragmentierungstechniken hergestellt, obwohl der Grad der Sicherheit nimmt mit zunehmender Verdünnung der infizierten ZelleDNA. Die zufälligen Stellen aus dem MRC-Datensatz hingegen ausgerichtet ist fehlgeschlagen spürbare Mengen an Basispräferenzen zu erzeugen.

Abbildung 1
Abb . 1: Flussdiagramm Abbildung der Integrationsstelle Bibliothek Vorbereitungen (A) generieren Virusstämme von HEK293T Zellen transfizieren, Ernte und Filterüberstand 48 Stunden später, konzentriert durch Ultrazentrifugation und infizieren Zielzellen mit geeigneten Konzentration des Virus. Mindestens fünf Tage nach der Infektion, extrahieren genomischer DNA. Siehe die Abschnitte 1 und 2 der Haupttext für weitere experimentelle Details. (B und C) Fragment gereinigter genomischer DNA durch Verdau mit Restriktionsenzymen oder durch Beschallung. Das Restriktionsenzym Cocktail sollte ein Enzym (zB BglII) umfassen spaltet stromabwärts von der vorgeschalteten viralen LTR-Zähler wählen , um für LM-PCR Verstärkung der internen vDNA Sequenzen. Grüne Stern und verzweigte Pfeil in (C) bezeichnen , dass BglII sollte nach Linker - Ligation verwendet werden. Rote Highlights Virussequenz, während schwarze Highlights zelluläre Sequenz Host. Implizite DNA Bruchstellen (nicht maßstäblich) durch "X" markiert HIV-1 enthält zahlreiche MseI und BglII-Stellen; nur diejenigen, die für die Protokoll gezeigt. Die Klammern oberhalb der Karten bezeichnen die U5-Zell-DNA Regionen bevorzugt verstärkt durch LM-PCR. (D) Man reinige fragmentierte DNA (dann End-Reparatur und der A-Schwanz im Falle Beschallung) und ligieren bis (E) kompatibel asymmetrischen Linkermoleküle (blau gefärbt). Magenta Kreise in (D) zeigen die Integrationsstelle , die verstärkt werden. Sterne am 3'-Enden der Linker kurzen Stränge bezeichnen Amino Blockierung Modifikationen. (F) Conduct erste Runde der Semi-Nested - PCR unter Verwendung der ersten Runde LTR - Primer (rot) und Linker - Primer (blau). in tseine PCR Runde kodiert die Linker-Primer für die DNA-Clustering und NGS Primer-Bindungssequenzen (zusammengefasst als grüne Anhängsel zum blauen Linker-Primer), während die LTR-Primer solche Sequenzen fehlt. (G) Reinige ersten Runde PCR - Produkt und zweite Runde der Semi-Nested - PCR durchzuführen. In dieser Runde der PCR, verwenden den gleichen Linker-Primer wie in der ersten Runde (Blau + Grün Anhängsel) zusammen mit der zweiten Runde LTR-Primer (rot), die DNA-Clustering und NGS Primerbindungssequenzen sowie einem Barcode zum Multiplexen trägt ( gruppiert als grüne Anhängsel an den roten LTR-Primer). (H) Reinige zweite Runde PCR-Produkt als letzte Bibliothek Integrationsstelle (in Magenta geboxt, mit Integration vor Ort durch Magenta Kreis markiert). Senden aliquoten zu Sequenzierungseinrichtung für QC und NGS. Bitte klicken Sie hier , um eine größere Version dieser Figur zu sehen.

"2" Abbildung 2:. P - Werte für einen Vergleich der Integration Seiten Amplified Nach dem DNA - Fragmentation durch Ultraschall - Behandlung oder durch Restriktionsenzymverdau gegen Jeweilige MRCs Zahl der Integrationsstellen innerhalb RefSeq Genen und in der Nähe CpG - Inseln und TSS sowie regionale Gendichte Profile werden aufgelistet in . Tabelle 4 P - Werte ≥ 0,05 in Fett- und Kursivdruck hervorgehoben sind ein P - Werte berechnet , indem exakten Fisher-Test b P - Werte berechnet durch Wilcoxon - Rangsummentest c MRC enz:... angepasst Zufallskontrolle; eine Reihe von 50.000 einzigartige Integrationsstellen wurde durch zufälliges Auswählen Positionen in der Nähe MseI / BglII - Restriktionsstellen in hg Build produziert 19. d MRC random: Zufallssteuerung enthält 10.000 einzigartige Integrationsstellen von zufällig selecti produziert abgestimmtng Positionen in hg19 ohne Normierung auf Restriktionsstelle Nähe. Bitte hier klicken , um eine größere Version dieser Figur zu sehen.

Figur 3
Abbildung 3: Sequenz Logos Depicting HIV-1 - Basiseinstellungen von repräsentativen Experiment Bibliotheken Integration Websites von Bibliotheken hergestellt , indem man (A) Verdauung mit Restriktionsenzymen oder (B) Beschallungs WebLogo Software wurden ausgerichtet.. Jede Verdünnung in der Titrationsreihe dargestellt, aus ordentlich DNA an der Oberseite der Figur zur maximalen Verdünnung von 1: 15.625 an der Unterseite. (C) Sequence Logo für die MRC von 50.000 einzigartigen genomischen Seiten. Fehlerbalken stellen die Standardabweichung im wesentlichen in Baseneinbaus zu einer bestimmten Position. Genauer gesagt ist die total Höhe jeder Fehlerbalken entspricht dem Doppelten der kleinen Probenkorrektur 66, die in relativ kleinen Datenmengen für Unterschätzung der Entropie steuert. Die x-Achse repräsentiert Wirtszelle genomischer DNA nt Positionen relativ zu der Integrationsstelle am Punkt Null. Bitte hier klicken , um eine größere Version dieser Figur zu sehen.

Tabelle 1
. Tabelle 1: Oligonukleotidsequenzen für Linker Aufbau und PCR Amplification Linker-spezifische und zweiten Runde LTR - Primern codieren DNA clustering Adaptersequenzen, die farbcodiert sind wie folgt: Schwarz, Basen komplementär zu dem Linker oder an die HIV-1 LTR; rot, eindeutigen Index oder Barcode; grün, Sequenzierungsprimer-Bindungsstellen; blau, Adaptersequenzen für DNA-Clustering. Einseitige (SE) Sequenzierung reactions die Sequenzierungsprimer verwenden , die in die zweite Runde LTR - Primer READ1 (grün) Sequenz anlagert, während Paired-End (PE) Reaktionen sowohl verwenden (READ1 und READ2) Sequenzierprimer a . Linker kurze Stränge enthalten 3 'Amino blockiert Modifikation. Bitte klicken Sie hier , um eine größere Version dieser Tabelle anzuzeigen.

Reagens So fügen Sie pro Reaktion
Erste Runde LTR-Primer (15 & mgr; M): 2,5 ul
Linker-spezifischen Primer (15 uM): 0,5 ul
10x PCR-Puffer: 2,5 ul
dNTPs (jeweils 2,5 mM) 0,5 ul
DNA-Polymerase-Mix: 0,5 ul
Ligierungsreaktion: 100 ng
Nuklease-freies Wasser: bis zu 25 & mgr; l

Tabelle 2:. Rezept für die erste Runde PCR Die Menge jeder spezifizierten Reagenzes an jede einzelne PCR - Röhrchen hinzugefügt werden , ist angegeben.

Reagens So fügen Sie pro Reaktion
Zweite Runde LTR-Primer (15 & mgr; M): 2,5 ul
Linker-spezifischen Primer (15 uM): 0,5 ul
10x PCR-Puffer: 2,5 ul
dNTPs (jeweils 2,5 mM) 0,5 ul
DNA-Polymerase-Mix: 0,5 ul
Erste Runde PCR: 100 ng
Nuklease-freies Wasser: bis zu 25 & mgr; l

Tabelle 3:. Zweite Runde PCR Rezept Die Menge jedes Reagenz zu jedem PCR - Röhrchen hinzugefügt werden , ist angegeben.

<td> Digest, 1: 125
Bibliothek #Unique Seiten % RefSeq ein % CpG +/- 2,5 kb b % TSS +/- 2,5 kb c Durchschn. Gene Dichte +/- 500 kb d
Ultraschall-Behandlung, ordentlich 3169 71.2 5.1 3.7 15.8
Beschallen, 1: 5 366 75.1 2.7 3 16.3
254 74 7.1 5.1 16.7
Beschallen, 1: 125 430 69,8 6.9 6 14.6
Beschallen, 1: 625 314 65,6 5.6 6.7 13.5
Beschallen, 1: 3.125 116 73,6 3.5 2.5 13.1
Beschallen, 1: 15.625 72 62,5 0 1.4 14.7
Digest, ordentlich 7428 69,8 3.6 2.9 15.2
Digest, 1: 5 1460 71,4 4.4 3.4 14.9
Digest, 01.25 394 68,8 4.3 3.3 15.8
172 71 0 3 14
Digest, 1: 625 134 73,9 3.7 3.7 14.1
Digest, 1: 3.125 100 83.1 6.4 5.2 19.1
Digest, 1: 15.625 73 74 4.1 1.4 9.7
MRC enz e 50.000 44.7 4.2 4 8.7
MRC zufällig f 10.000 41.3 5.3 4.2 8.6

Tabelle 4: Genomic Verteilung der Integrationsstellen von repräsentativen Titrationsreihe Der Prozentsatz der gesamten Integrationsstellen th.im Herbst innerhalb RefSeq Gene, b innerhalb von 2,5 kb von CpG - Inseln, und c innerhalb von 2,5 kb von TSS d Die Gendichte innerhalb von 1 Mb die durchschnittliche Integrationsstelle rund um e MRC enz:.. zufallsgesteuert abgestimmt; eine Reihe von 50.000 einzigartige Integrationsstellen wurde durch zufälliges Auswählen Positionen in der Nähe MseI / BglII - Restriktionsstellen in hg19 erzeugt f MRC zufällig. angepassten Kontroll zufällig durch zufälliges Auswählen Positionen in hg19 ohne Normierung auf festen Positionen produziert 10.000 einzigartige Integrationsstellen enthält.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Ein Protokoll für die Analyse der retroviralen Integrationsstellen von der ersten Virusinfektionsschritt durch Kartierung von genomischen Verteilungsmuster, beschrieben. Dieses Protokoll ist anwendbar auf jeden beliebigen Retrovirus und infizierbare Zelltyp. Darüber hinaus ist der Test sehr empfindlich Pipeline, mit dem Potential , eine zufriedenstellende Anzahl von einzigartigen Integrationsstellen von seriellen Verdünnungen der genomischen DNA äquivalent zu einer Infektion mit einer MOI von 6,4 x 10 -5 initiiert zu erholen. Diese Empfindlichkeit macht das Protokoll besonders nützlich, wenn Proben von infizierten Patienten angewendet, die eine niedrige Viruslast enthalten kann, in denen nur ein kleiner Teil der Zellen wird ein integriertes Provirus beherbergen. Im Einklang mit früheren Methodik Papiere in diesem Bereich 36,38,41-43, mehrere Schritte in der Bioinformatik Teil dieses Protokolls wird für die Verarbeitung von großen Dateien von Sequenzdaten von der Entwicklung individueller Skripte profitieren. Während 58 BLAT ist die mapping Dienstprogramm in diesem Protokoll beschrieben, können Benutzer finden Bowtie 67 (http://bowtie-bio.sourceforge.net/index.shtml) eine geeignete Alternative zu sein.

Eine alternative Bioinformatik Pipeline wurde zur Bestimmung von Moloney - Maus - Leukämie - Virus (MoMLV) Integrationsstellen 19 vor kurzem berichtet. Diese Pipeline ist nützlich, da es in Standalone-Software entwickelt wurde, die öffentlich zugänglich ist, und ist ganz in mächtig, dass es wurde ursprünglich verwendet, Hunderttausende von einzigartigen MoMLV Integrationsstellen abzubilden. Allerdings wurde die zur Verfügung stehende Software ursprünglich entwickelt, um speziell die gemeldete MoMLV-Datensatz neu analysieren, und so wäre die Neuprogrammierung notwendig, um die Pipeline zu gestalten experimentelle Designs (die Funktionalität des Werkzeugs zu wechseln wurde vor kurzem erweitert, um Adeno-assoziierten Virus und Tol2 umfassen und Ac / Ds - Transposon - Vektoren 68). Darüber hinaus beschrieben, dass das Protokoll die Erzeugung der vorläufigen Integrationsstelle .bedDatei, aber nicht spezifische Schritte erforderlich sind, um den Karten Websites Layout genomische Annotationen relevant. Leser können die "Vector Integration Site - Analyse" finden Server 69, die bei der Überprüfung des aktuellen Manuskript, nützlich zu analysieren , um die NGS - Sequenzen erzeugt unter Verwendung der hier beschriebene Protokoll veröffentlicht wurde.

Bestimmte Punkte sollten hervorgehoben werden, wenn ein beliebiges Protokoll mit Hilfe retroviraler Integrationsstelle Datensätze zu analysieren. Wenn mehrere Bibliotheken in Tandem Vorbereitung besteht ein erhebliches Potenzial für eine Probe Kreuzkontamination. Selbst eine sehr geringe Höhe der Probenübersprechens können die Ergebnisse auf das Niveau verschleiern eine NGS Lauf unbrauchbar zu leisten. Deshalb sind alle Nassbank Arbeiten sollten in einem sterilisierten, gewidmet Laminarströmungsabzug oder PCR-Workstation abgeschlossen sein. Eine Reihe von Pipetten und Reagenzien wie nukleasefreiem Wasser sollte nur auf Integrationsstelle Verstärkung gewidmet sein. Die Verwendung von einzigartigen Linker für jede Bibliothek Vorbereitung kann das Potenzial begrenzenfür Querverstärkung und auch für die Identifizierung von Crossover erlauben liest in jeder Bibliothek in den rohen FASTA-Dateien.

Es ist wichtig, die Vor-und Nachteile der Verwendung von Ultraschall-Behandlung im Vergleich zu Restriktionsendonukleaseverdau zu fragmentieren genomische DNA zu betrachten. Auf der einen Seite stellt Beschallung eine relativ zufällige Verteilung der Scherpunkte, aber die anschließend erforderlichen DNA-Reparatur und A-tailing Schritte konsequent die Ausbeute an Linkerligationsprodukte zu reduzieren, im Vergleich zu Ligationen mit dem Restriktionsenzym-erzeugten sticky ends durchgeführt. Auf der anderen Seite stellt Restriktionsenzymverdau eine weniger ausgezahlt Population von Scherstellen, die immer eine gewisse Tendenz in den gewonnenen Daten einführen. Verwendung einer Restriktions - Endonuclease stromaufwärts LTR - Sequenzen zu verwerfen wird in beiden Fällen (Figur 1) führen in dem Verlust eines kleinen Bruchteil der Integrationsstellen , die von dieser Stelle in dem Genom stromaufwärts liegen. Alle Daten, Bias, die zur Folge haben können, können ad seingekleidet durch die enzymatische Verdauung aus dem Protokoll während Bibliothek Vorbereitung weggelassen und die Vielzahl Herausfiltern von den Sequenzierungsdaten Upstream-LTR-Sequenzen von führt.

Obwohl das aktuelle Protokoll sehr empfindlich ist und in der Lage Millionen von Integrationsstellen 21,40, nur etwa ein Drittel aller verfügbaren Integrationen zu erzeugen könnte erwartet werden , in einem bestimmten Experiment verstärkt werden , auch mit den besten der Bibliothek Zubereitungen (Ref. 70 und nicht veröffentlichte Beobachtungen). Dies kann zu Komplikationen führen, wenn die Proben aus niedrigen MOI Infektionen oder Patienten zu analysieren, die niedrige Viruslast beherbergen. Diese Einschränkung kann durch wiederholtes Sequenzierung der gleichen Bibliothek Vorbereitung und / oder Sequenzierung mehrere Bibliotheken abgeleitet von der gleichen DNA-Probe parallel im Teil überwunden werden. Zukünftige Erhöhungen der Assay-Empfindlichkeit entsprechend sehr vorteilhaft auf die Förderung translationale Anwendungen von retroviralen Integrationsstelle Sequenzierung.

Subscription Required. Please recommend JoVE to your librarian.

Acknowledgments

Wir danken unseren Kollegen Stephen Hughes und Henry Levin für Ratschläge, die kritisch war die NGS-Protokoll für retrovirale Integrationsstelle Sequenzierung im Engelman Labor zu etablieren. Diese Arbeit wurde von der US National Institutes of Health gewährt AI039394 und AI052014 (bis ANE) und AI060354 (Harvard University Center for AIDS Research) unterstützt.

Materials

Name Company Catalog Number Comments
DMEM Gibco 11965-084 Standard cell culture medium, compatible with HEK293T cells
Fetal Bovine Serum Thermo Scientific SH 30088.03 Different lots of serum may need to be pre-screened for optimal viral production
Penicillin/Streptomycin Corning 30-002-Cl Antibiotics to be added to DMEM
Phosphate-Buffered saline Mediatech 21-040-CV Used to wash cells
Trypsin EDTA Corning 25-053-CI Used to detach adherent cells from tissue culture plates
PolyJet SignaGen Laboratories SL100688 DNA transfection reagent
0.45 µm Filters Thermo Scientific 09-740-35B Used to filter virus particle-containing cell culture media
Turbo DNase Ambion AM2239 Used to degrade carryover plasmid DNA from virus stocks
HIV-1 p24 Antigen Capture Assay ABL Inc. 5447 Used to quantify yield of virus production
DNeasy Blood & Tissue Kit Qiagen 69506 Used to purify genomic DNA from cells
Sonicator Covaris S2 With this model of sonicator perform two rounds of duty cycle, 5%; intensity, 3; cycles per burst, 200; time, 80 sec
Nuclease-Free Water GeneMate G-3250-125 Commercially-available water is recommended to reduce the possibility of sample cross-contamination
QIAQuick PCR Purification Kit Qiagen 28106 Used to purify DNA during library construction
End-It DNA End-Repair Kit Epicentre ER81050 Used to repair DNA ends of sonicated DNA samples
Klenow Fragment (3'-5' exo–) New England Biolabs (NEB) M0212S Used with dATP to A-tail repaired DNA fragments
dATP Thermo Scientific R0141 Deoxyadenosine triphosphate
MseI NEB R0525L Restriction endonuclease for genomic DNA cleavage
BglII NEB R0144L Restriction endonuclease to suppress amplification of upstream HIV-1 U5 sequence
T4 DNA Ligase NEB M0202L/6218 Enzyme for covalent joining of compatible DNA ends
DNA Oligonucleotides Integrated DNA Technologies custom Have the company purify the oligos. HPLC purification suffices for DNAs <30 nucleotides; PAGE purify longer DNAs 
Advantage 2 Polymerase Mix Clontech 639202 Commercial mix containing DNA polymerase for PCR
dNTPs (100 mM solutions) Thermo Scientific R0181 Dilute the four chemicals on ice with sterile water to reach the intermediate worrking concentrations of 2.5 mM each dNTP
NanoDrop Thermo Scientific NanoDrop 2000 Spectrophotometer for determination of DNA concentration
Qubit Fluorimeter Life Technologies Qubit® 3.0 Fluorometer used to confirm integration site library DNA concentration
2200 TapeStation System Agilent G2964AA Tape-based assay to confirm integration site library DNA size distribution
MiSeq Illumina SY-410-1003 Used for NGS

DOWNLOAD MATERIALS LIST

References

  1. Craigie, R., Bushman, F. D. HIV DNA integration. Cold Spring Harb. Perspect. Med. 2, a006890 (2012).
  2. Li, M., Mizuuchi, M., Burke, T. R. J., Craigie, R. Retroviral DNA integration: reaction pathway and critical intermediates. EMBO J. 25, 1295-1304 (2006).
  3. Hare, S., Gupta, S. S., Valkov, E., Engelman, A., Cherepanov, P. Retroviral intasome assembly and inhibition of DNA strand transfer. Nature. 464, 232-236 (2010).
  4. Hare, S., Maertens, G. N., Cherepanov, P. 3'-processing and strand transfer catalysed by retroviral integrase in crystallo. EMBO J. 31, 3020-3028 (2012).
  5. Fujiwara, T., Mizuuchi, K. Retroviral DNA integration: structure of an integration intermediate. Cell. 54, 497-504 (1988).
  6. Roth, M. J., Schwartzberg, P. L., Goff, S. P. Structure of the termini of DNA intermediates in the integration of retroviral DNA: dependence on IN function and terminal DNA sequence. Cell. 58, 47-54 (1989).
  7. Brown, P. O., Bowerman, B., Varmus, H. E., Bishop, J. M. Retroviral integration: structure of the initial covalent product and its precursor, and a role for the viral IN protein. Proc. Natl. Acad. Sci. USA. 86, 2525-2529 (1989).
  8. Pauza, C. D. Two bases are deleted from the termini of HIV-1 linear DNA during integrative recombination. Virology. 179, 886-889 (1990).
  9. Bowerman, B., Brown, P. O., Bishop, J. M., Varmus, H. E. A nucleoprotein complex mediates the integration of retroviral DNA. Genes Dev. 3, 469-478 (1989).
  10. Bukrinsky, M. I., et al. Active nuclear import of human immunodeficiency virus type 1 preintegration complexes. Proc. Natl. Acad. Sci. USA. 89, 6580-6584 (1992).
  11. Miller, M. D., Farnet, C. M., Bushman, F. D. Human immunodeficiency virus type 1 preintegration complexes: studies of organization and composition. J. Virol. 71, 5382-5390 (1997).
  12. Engelman, A., Mizuuchi, K., Craigie, R. HIV-1 DNA integration: mechanism of viral DNA cleavage and DNA strand transfer. Cell. 67, 1211-1221 (1991).
  13. Maertens, G. N., Hare, S., Cherepanov, P. The mechanism of retroviral integration from X-ray structures of its key intermediates. Nature. 468, 326-329 (2010).
  14. Holman, A. G., Coffin, J. M. Symmetrical base preferences surrounding HIV-1, avian sarcoma/leukosis virus, and murine leukemia virus integration sites. Proc. Natl. Acad. Sci. USA. 102, 6103-6107 (2005).
  15. Wu, X., Li, Y., Crise, B., Burgess, S. M., Munroe, D. J. Weak palindromic consensus sequences are a common feature found at the integration target sites of many retroviruses. J. Virol. 79, 5211-5214 (2005).
  16. Kvaratskhelia, M., Sharma, A., Larue, R. C., Serrao, E., Engelman, A. Molecular mechanisms of retroviral integration site selection. Nucleic Acids Res. 42, 10209-10225 (2014).
  17. Schroder, A. R., et al. HIV-1 integration in the human genome favors active genes and local hotspots. Cell. 110, 521-529 (2002).
  18. Wu, X., Li, Y., Crise, B., Burgess, S. M. Transcription start regions in the human genome are favored targets for MLV integration. Science. 300, 1749-1751 (2003).
  19. LaFave, M. C., et al. MLV integration site selection is driven by strong enhancers and active promoters. Nucleic Acids Res. 42, 4257-4269 (2014).
  20. De Ravin, S. S., et al. Enhancers are major targets for murine leukemia virus vector integration. J. Virol. 88, 4504-4513 (2014).
  21. Maskell, D. P., et al. Structural basis for retroviral integration into nucleosomes. Nature. 523, 366-369 (2015).
  22. Serrao, E., et al. Integrase residues that determine nucleotide preferences at sites of HIV-1 integration: implications for the mechanism of target DNA binding. Nucleic Acids Res. 42, 5164-5176 (2014).
  23. Aiyer, S., et al. Structural and sequencing analysis of local target DNA recognition by MLV integrase. Nucleic Acids Res. 43, 5647-5663 (2015).
  24. Ciuffi, A., et al. A role for LEDGF/p75 in targeting HIV DNA integration. Nat. Med. 11, 1287-1289 (2005).
  25. Sharma, A., et al. BET proteins promote efficient murine leukemia virus integration at transcription start sites. Proc. Natl. Acad. Sci. USA. 110, 12036-12041 (2013).
  26. Gupta, S. S., et al. Bromo- and extraterminal domain chromatin regulators serve as cofactors for murine leukemia virus integration. J. Virol. 87, 12721-12736 (2013).
  27. De Rijck, J., et al. The BET family of proteins targets moloney murine leukemia virus integration near transcription start sites. Cell Rep. 5, 886-894 (2013).
  28. Demeulemeester, J., et al. HIV-1 integrase variants retarget viral integration and are associated with disease progression in a chronic infection cohort. Cell Host Microbe. 16, 651-662 (2014).
  29. Meehan, A. M., et al. LEDGF/p75 proteins with alternative chromatin tethers are functional HIV-1 cofactors. PLoS Pathog. 5, e1000522 (2009).
  30. Ferris, A. L., et al. Lens epithelium-derived growth factor fusion proteins redirect HIV-1 DNA integration. Proc. Natl. Acad. Sci. USA. 107, 3135-3140 (2010).
  31. Gijsbers, R., et al. LEDGF hybrids efficiently retarget lentiviral integration into heterochromatin. Mol. Ther. 18, 552-560 (2010).
  32. Aiyer, S., et al. Altering murine leukemia virus integration through disruption of the integrase and BET protein family interaction. Nucleic Acids Res. 42, 5917-5928 (2014).
  33. Jahner, D., Jaenisch, R. Integration of Moloney leukaemia virus into the germ line of mice: correlation between site of integration and virus activation. Nature. 287, 456-458 (1980).
  34. Stevens, S. W., Griffith, J. D. Human immunodeficiency virus type 1 may preferentially integrate into chromatin occupied by L1Hs repetitive elements. Proc. Natl. Acad. Sci. USA. 91, 5557-5561 (1994).
  35. Wang, G. P., Ciuffi, A., Leipzig, J., Berry, C. C., Bushman, F. D. HIV integration site selection: analysis by massively parallel pyrosequencing reveals association with epigenetic modifications. Genome Res. 17, 1186-1194 (2007).
  36. Wang, G. P., et al. DNA bar coding and pyrosequencing to analyze adverse events in therapeutic gene transfer. Nucleic Acids Res. 36, e49 (2008).
  37. Roth, S. L., Malani, N., Bushman, F. D. Gammaretroviral integration into nucleosomal target DNA in vivo. J. Virol. 85, 7393-7401 (2011).
  38. Ciuffi, A., Barr, S. D. Identification of HIV integration sites in infected host genomic DNA. Methods. 53, 39-46 (2011).
  39. Gillet, N. A., et al. The host genomic environment of the provirus determines the abundance of HTLV-1-infected T-cell clones. Blood. 117, 3113-3122 (2011).
  40. Matreyek, K. A., et al. Host and viral determinants for MxB restriction of HIV-1 infection. Retrovirology. 11, 90 (2014).
  41. Ciuffi, A., et al. Methods for integration site distribution analyses in animal cell genomes. Methods. 47, 261-268 (2009).
  42. Brady, T., et al. A method to sequence and quantify DNA integration for monitoring outcome in gene therapy. Nucleic Acids Res. 39, e72 (2011).
  43. Beard, B. C., Adair, J. E., Trobridge, G. D., Kiem, H. P. High-throughput genomic mapping of vector integration sites in gene therapy studies. Methods Mol. Biol. 1185, 321-344 (2014).
  44. Page, K. A., Landau, N. R., Littman, D. R. Construction and use of a human immunodeficiency virus vector for analysis of virus infectivity. J. Virol. 64, 5270-5276 (1990).
  45. Emi, N., Friedmann, T., Yee, J. K. Pseudotype formation of murine leukemia virus with the G protein of vesicular stomatitis virus. J. Virol. 65, 1202-1207 (1991).
  46. Wehrly, K., Chesebro, B. p24 antigen capture assay for quantification of human immunodeficiency virus using readily available inexpensive reagents. Methods. 12, 288-293 (1997).
  47. Goff, S., Traktman, P., Baltimore, D. Isolation and properties of Moloney murine leukemia virus mutants: use of a rapid assay for release of virion reverse transcriptase. J. Virol. 38, 239-248 (1981).
  48. Willey, R. L., et al. In vitro mutagenesis identifies a region within the envelope gene of the human immunodeficiency virus that is critical for infectivity. J. Virol. 62, 139-147 (1988).
  49. Butler, S. L., Hansen, M. S., Bushman, F. D. A quantitative assay for HIV DNA integration in vivo. Nat. Med. 7, 631-634 (2001).
  50. Brussel, A., Sonigo, P. Analysis of early human immunodeficiency virus type 1 DNA synthesis by use of a new sensitive assay for quantifying integrated provirus. J. Virol. 77, 10119-10124 (2003).
  51. Serrao, E., Ballandras-Colas, A., Cherepanov, P., Maertens, G. N., Engelman, A. N. Key determinants of target DNA recognition by retroviral intasomes. Retrovirology. 12, 39 (2015).
  52. Maldarelli, F., et al. HIV latency. Specific HIV integration sites are linked to clonal expansion and persistence of infected cells. Science. 345, 179-183 (2014).
  53. Wagner, T. A., et al. HIV latency. Proliferation of cells with HIV integrated into cancer genes contributes to persistent infection. Science. 345, 570-573 (2014).
  54. Cohn, L. B., et al. HIV-1 integration landscape during latent and active infection. Cell. 160, 420-432 (2015).
  55. Li, X., Ben-Dov, I. Z., Mauro, M., Williams, Z. Lowering the quantification limit of the QubitTM RNA HS assay using RNA spike-in. BMC Mol. Biol. 16, 9 (2015).
  56. Padmanaban, A., Walker, D. M. Analysis of high molecular weight genomic DNA using the Agilent 2200 TapeStation and genomic DNA ScreenTape. Publication number 5991-1797EN Agilent Technologies. , Agilent Technologies, Inc. Santa Clara, CA. (2013).
  57. Kapa library quantification technical guide version v1.14. , KapaBiosystems. Boston, MA. (2014).
  58. Kent, W. J. BLAT--the BLAST-like alignment tool. Genome Res. 12, 656-664 (2002).
  59. Quinlan, A. R., Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26, 841-842 (2010).
  60. Gaur, M., Leavitt, A. D. Mutations in the human immunodeficiency virus type 1 integrase D,D(35)E motif do not eliminate provirus formation. J. Virol. 72, 4678-4685 (1998).
  61. Varadarajan, J., McWilliams, M. J., Hughes, S. H. Treatment with suboptimal doses of raltegravir leads to aberrant HIV-1 integrations. Proc. Natl. Acad. Sci. USA. 110, 14747-14752 (2013).
  62. Kent, W. J., et al. The human genome browser at UCSC. Genome Res. 12, 996-1006 (2002).
  63. Berry, C. C., et al. Estimating abundances of retroviral insertion sites from DNA fragment length data. Bioinformatics. 28, 755-762 (2012).
  64. Firouzi, S., et al. Development and validation of a new high-throughput method to investigate the clonality of HTLV-1-infected cells based on provirus integration sites. Genomic Med. 6, 46 (2014).
  65. Mitchell, R. S., et al. Retroviral DNA integration: ASLV, HIV, and MLV show distinct target site preferences. PLoS Biol. 2, E234 (2004).
  66. Schneider, T. D., Stormo, G. D., Gold, L., Ehrenfeucht, A. Information content of binding sites on nucleotide sequences. J. Mol. Biol. 188, 415-431 (1986).
  67. Langmead, B. Chapter 11, Unit 11. 17, Aligning sort sequencing reads with Bowtie. Curr. Protoc. Bioinformatics. , (2010).
  68. LaFave, M. C., Varshney, G. K., Burgess, S. M. GeIST: a pipeline for mapping integrated DNA elements. Bioinformatics. 31, 3219-3221 (2015).
  69. Hocum, J. D., et al. VISA - Vector Integration Site Analysis server: a web-based server to rapidly identify retroviral integration sites from next-generation sequencing. BMC Bioinformatics. 16, 212 (2015).
  70. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15, 1431-1436 (2009).
  71. TruSeq Library Prep Pooling Guide. Guidelines for pooling TruSeq libraries for Illumina sequencing systems that require balanced index combinations. , Source: https://support.illumina.com/downloads/truseq-library-prep-pooling-guide-15042173.html (2015).

Tags

Virologie Heft 109 Retrovirus HIV-1 Integration Integrase Integrationsstellen Sequenzierung der nächsten Generation
Amplification, Next-Generation-Sequenzierung und genomischer DNA Mapping von Retrovirale Integration Seiten
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Serrao, E., Cherepanov, P.,More

Serrao, E., Cherepanov, P., Engelman, A. N. Amplification, Next-generation Sequencing, and Genomic DNA Mapping of Retroviral Integration Sites. J. Vis. Exp. (109), e53840, doi:10.3791/53840 (2016).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter