We describe a protocol for amplifying retroviral integration sites from the genomic DNA of infected cells, sequencing the amplified virus-host junctions, and then mapping these sequences to a reference genome. We also describe techniques to quantify the distribution of integration sites relative to various genomic annotations using BEDTools.
Retroviren zeigen Unterschrift Integration Präferenzen auf beiden lokaler und globaler Ebene. Hier präsentieren wir ein ausführliches Protokoll für (1) Erzeugung verschiedener Bibliotheken von retroviralen Integrationsstellen mit ligationsvermittelte PCR (LM-PCR) und Next-Generation-Sequencing (NGS), (2) die Abbildung der genomischen Ort jedes Virus- Host-Junction mit bedtools, und (3) die Daten für statistische Relevanz zu analysieren. Genomische DNA aus infizierten Zellen extrahiert wird durch Verdau mit Restriktionsenzymen oder durch Beschallung fragmentiert. Nach geeigneter DNA end-Reparatur werden doppelsträngigen Linker ligiert an die DNA-Enden, und semi-nested PCR wird unter Verwendung der Primer komplementär zu sowohl der langen terminalen Wiederholung (LTR) Ende des Virus und dem ligierten Linker-DNA durchgeführt. Die PCR-Primer tragen Sequenzen für DNA clustering während NGS erforderlich ist, das Erfordernis für separate Adaptorligation negieren. Qualitätskontrolle (QC) wird durchgeführt, um DNA-Fragment Größenverteilung zu bewerten und anzupassener DNA-Einbau vor NGS. Sequence-Ausgabedateien werden gefiltert für LTR-haltigen liest, und die Sequenzen der LTR und den Linker definieren, werden abgeschnitten entfernt. Getrimmten Wirtszellsequenzen sind mit einem Bezugsgenom kartiert BLAT verwenden und für minimal 97% Identität zu einem eindeutigen Punkt in dem Referenzgenom filtriert. Einzigartige Integrationsstellen sind für benachbarte Nukleotid (nt) Sequenz und Verteilung in Bezug auf verschiedene genomische Merkmale geprüft. Unter Verwendung dieses Protokolls, Integrationsort Bibliotheken von hoher Komplexität kann von genomischer DNA in drei Tagen konstruiert werden. Das gesamte Protokoll, das exogene virale Infektion von empfänglichen Gewebekulturzellen zur Integrationsstelle umfasst Analyse kann somit in etwa ein bis zwei Wochen durchgeführt werden. Neue Anwendungen dieser Technologie beziehen sich auf Langzeitanalyse von Integrationsstellen von HIV-infizierten Patienten.
Integration von viraler DNA (vDNA) in das Wirtszellgenom ist ein wesentlicher Schritt in dem retroviralen Lebenszyklus. Die Integration wird durch das virale Enzym Integrase (IN) erreicht, die zwei verschiedene katalytische Prozesse ausführt, die 1 bis zur Gründung des stabil eingeführt Provirus führen. IN – Untereinheiten greifen in die Enden der linearen vDNA , die durch reverse Transkription erzeugt wird, die höhere Ordnung intasome mit vDNA bilden Enden zusammengehalten von einem IN Multimer 2-4. IN spaltet die 3' – stromabwärts gelegenen Enden der vDNA aus invariant 5'-CA-3' – Sequenzen in einem Verfahren , wie 3'-Verarbeitung bekannt, so dass an jedem Terminus vDNA 5-8 mit reaktiven Hydroxylgruppen 3' – Enden ausgespart. Die intasome wird anschließend in den Zellkern als Teil einer großen Anordnung von Host importiert und viralen Proteinen als preintegration Komplexes (PIC) bekannt 9-11. zelluläre Ziel-DNA (tDNA) Nach der Begegnung, verwendet in der vDNA 3'-Hydroxyl groups die tDNA oberen und unteren Stränge in versetzter Weise zu spalten und Phosphatgruppen 'die vDNA zu tDNA 5 schließt sich gleichzeitig durch den Prozess der Strangtransfer 12,13.
Retroviren zeigen Integration Präferenzen auf dem lokalen und globalen Maßstab. Auf lokaler Ebene bestehen Integrationsstellen Konsens von schwach konserviert Palindrom tDNA – Sequenzen, die von den vDNA Insertionsstellen 14,15 von etwa fünf Minuten vor zehn bp stromaufwärts und stromabwärts erstrecken. Weltweit 16 Retroviren zielen auf spezielle Chromatin Anmerkungen. Es gibt sieben verschiedene retrovirale Gattungen – alpha durch epsilon, lenti und spuma. Die Lentiviren, darunter HIV-1, begünstigen die Integration in den Körpern der aktiv transkribierten Gene 17, während die gammaretroviruses bevorzugt in Websites Transkriptionsstart integrieren (TSS) und aktive Enhancer – Regionen 18-20. In scharfem Gegensatz dazu wird Spumavirus stark in Richtung heterochrom voreingenommenatic Regionen, wie zum Beispiel Gen-armen Lamina-assoziierte Domänen 21. Lokale tDNA Grundeinstellungen sind zu einem großen Teil diktiert durch spezifische Netze von Nukleoprotein Kontakte zwischen IN und tDNA 13,22,23. Für die Lentiviren und gammaretroviruses, Integration in Bezug auf genomische Annotationen ist zum großen Teil bestimmt durch Wechselwirkungen zwischen IN und verwandten zellulären Faktoren 24-27. Eine Änderung , die Besonderheiten der IN-tDNA Interaktion Netzwerk 13,22,23,28 und stören oder Re-Engineering IN-Host – Faktoren – Wechselwirkungen 25-27,29-32 Strategien sind nachweislich Integration auf lokaler und globaler Ebene retargeten sind.
Die Macht der DNA-Sequenzierungsverfahren verwendet retroviralen Integrationsstellen zum Katalog immens in den letzten Jahrzehnten zugenommen. Integrationsstellen wurden in Pionierarbeit mit aufwendige Reinigung und manuelle Klonen Techniken gewonnen nur eine Handvoll von einzigartigen Websites pro Studie 33,34 zu ergeben.Die Kombination von LM-PCR – Amplifikation von LTR-Wirt – DNA Junctions mit der Fähigkeit, individuelle Integrationsstellen zu kartieren Mensch und Maus Entwurf das Feld transformiert Genomen, wobei die Anzahl der Seiten von exogenen Gewebekulturzellinfektionen zu mehreren hundert bis tausend 17 zunehmenden gewonnen , 18. Die jüngere Kombination von LM-PCR mit NGS Methodik Bibliothek Tiefe explodierenden gesendet. Im Einzelnen ergab Pyrosequenzierung in der Größenordnung von Zehntausenden von einzigartigen Integrationsstellen 30,35-38, während Bibliotheken durch die Verwendung von DNA – Clustering sequenziert können 19-21,39 Millionen von Sequenzen ergeben. Hier beschreiben wir eine optimierte LM-PCR-Protokoll zur Amplifikation und Sequenzierung von retroviralen Integrationsstellen DNA-Clustering NGS verwenden. Das Verfahren beinhaltet erforderliche Adaptersequenzen in die PCR-Primer und damit direkt in die amplifizierte DNA-Moleküle, wodurch ausgeschlossen ist die Voraussetzung für eine zusätzliche Adaptorligation Schritt vor der Sequencing 40. Die bioinformatische Analyse-Pipeline, von der Analyse der rohen Sequenzdaten für LTR-Wirts-DNA-Kreuzungen zur Kartierung der einzigartigen Integrationsstellen genomische Funktionen relevant, ist auch allgemein beschrieben. In Übereinstimmung mit der Priorität aus früheren methodologischen Protokolle auf diesem Gebiet etabliert 36,38,41-43 können benutzerdefinierte Skripts die Fertigstellung der einzelnen Schritte in der Bioinformatik Pipeline zur Unterstützung entwickelt werden. Die Nützlichkeit und die Empfindlichkeit des Protokolls wird durch Amplifizieren Sequenzierung mit repräsentativen Daten veranschaulicht, und Abbilden HIV-1 Integrationsstellen von Gewebekulturzellen in der ungefähren Multiplizität der Infektion (MOI) von 1,0 infiziert sind, sowie eine Titrationsreihe dieser DNA DNA nicht infizierte Zell Schritte in verdünnten bis 5-fach zu einer maximalen Verdünnung von 1: 15.625 die ungefähre äquivalente MOI von 6,4 x 10 -5 zu erhalten.
Ein Protokoll für die Analyse der retroviralen Integrationsstellen von der ersten Virusinfektionsschritt durch Kartierung von genomischen Verteilungsmuster, beschrieben. Dieses Protokoll ist anwendbar auf jeden beliebigen Retrovirus und infizierbare Zelltyp. Darüber hinaus ist der Test sehr empfindlich Pipeline, mit dem Potential , eine zufriedenstellende Anzahl von einzigartigen Integrationsstellen von seriellen Verdünnungen der genomischen DNA äquivalent zu einer Infektion mit einer MOI von 6,4 x 10 -5 …
The authors have nothing to disclose.
Wir danken unseren Kollegen Stephen Hughes und Henry Levin für Ratschläge, die kritisch war die NGS-Protokoll für retrovirale Integrationsstelle Sequenzierung im Engelman Labor zu etablieren. Diese Arbeit wurde von der US National Institutes of Health gewährt AI039394 und AI052014 (bis ANE) und AI060354 (Harvard University Center for AIDS Research) unterstützt.
DMEM | Gibco | 11965-084 | Standard cell culture medium, compatible with HEK293T cells |
Fetal Bovine Serum | Thermo Scientific | SH 30088.03 | Different lots of serum may need to be pre-screened for optimal viral production |
Penicillin/Streptomycin | Corning | 30-002-Cl | Antibiotics to be added to DMEM |
Phosphate-buffered saline | Mediatech | 21-040-CV | Used to wash cells |
Trypsin EDTA | Corning | 25-053-CI | Used to detach adherent cells from tissue culture plates |
PolyJet | SignaGen Laboratories | SL100688 | DNA transfection reagent |
0.45 µm Filters | Thermo Scientific | 09-740-35B | Used to filter virus particle-containing cell culture media |
Turbo DNase | Ambion | AM2239 | Used to degrade carryover plasmid DNA from virus stocks |
HIV-1 p24 Antigen Capture Assay | ABL Inc. | 5447 | Used to quantify yield of virus production |
DNeasy Blood & Tissue Kit | Qiagen | 69506 | Used to purify genomic DNA from cells |
Sonicator | Covaris | S2 | With this model of sonicator perform two rounds of duty cycle, 5%; intensity, 3; cycles per burst, 200; time, 80 sec |
Nuclease-Free Water | GeneMate | G-3250-125 | Commercially-available water is recommended to reduce the possibility of sample cross-contamination |
QIAQuick PCR Purification Kit | Qiagen | 28106 | Used to purify DNA during library construction |
End-It DNA End-Repair Kit | Epicentre | ER81050 | Used to repair DNA ends of sonicated DNA samples |
Klenow Fragment (3'-5' exo–) | New England Biolabs (NEB) | M0212S | Used with dATP to A-tail repaired DNA fragments |
dATP | Thermo Scientific | R0141 | Deoxyadenosine triphosphate |
MseI | NEB | R0525L | Restriction endonuclease for genomic DNA cleavage |
BglII | NEB | R0144L | Restriction endonuclease to suppress amplification of upstream HIV-1 U5 sequence |
T4 DNA Ligase | NEB | M0202L/6218 | Enzyme for covalent joining of compatible DNA ends |
DNA Oligonucleotides | Integrated DNA Technologies | custom | Have the company purify the oligos. HPLC purification suffices for DNAs <30 nucleotides; PAGE purify longer DNAs |
Advantage 2 Polymerase Mix | Clontech | 639202 | Commercial mix containing DNA polymerase for PCR |
dNTPs (100 mM solutions) | Thermo Scientific | R0181 | Dilute the four chemicals on ice with sterile water to reach the intermediate worrking concentrations of 2.5 mM each dNTP |
NanoDrop | Thermo Scientific | NanoDrop 2000 | Spectrophotometer for determination of DNA concentration |
Qubit Fluorimeter | Life Technologies | Qubit® 3.0 | Fluorometer used to confirm integration site library DNA concentration |
2200 TapeStation System | Agilent | G2964AA | Tape-based assay to confirm integration site library DNA size distribution |
MiSeq | Illumina | SY-410-1003 | Used for NGS |