We describe a protocol for amplifying retroviral integration sites from the genomic DNA of infected cells, sequencing the amplified virus-host junctions, and then mapping these sequences to a reference genome. We also describe techniques to quantify the distribution of integration sites relative to various genomic annotations using BEDTools.
preferências de integração assinatura retrovírus exposição em ambos as escalas local e global. Aqui, apresentamos um protocolo detalhado para (1) geração de diversas bibliotecas de sites de integração retrovirais utilizando PCR amplificação mediada por ligação (LM-PCR) e sequenciamento de próxima geração (NGS), (2) o mapeamento da localização genômico de cada a vírus acolher junção usando BEDTools, e (3) para analisar os dados de relevância estatística. O ADN genómico extraído a partir de células infectadas está fragmentado por digestão com enzimas de restrição ou por sonicação. Depois de DNA final de reparação adequado, os ligantes de cadeia dupla são ligadas para as extremidades do DNA, e PCR com iniciadores semi-internos é conduzida usando iniciadores complementares para tanto a extremidade mais longa repetição terminal (LTR) do vírus e o ADN ligante ligado. Os iniciadores de PCR transportar sequências necessárias para o agrupamento de ADN durante NGS, eliminando a exigência de ligação adaptador separado. Controlo de Qualidade (QC) é conduzido para avaliar a distribuição de tamanho de fragmento de ADN e adaptarer incorporação de ADN antes de NGS. arquivos de saída de seqüência são filtrados para LTR contendo lê, e as sequências que definem o LTR e o ligante são cortadas de distância. sequências celulares hospedeiras aparadas são mapeados para um genoma de referência usando BLAT e são filtrados para 97% de identidade minimamente para um ponto único no genoma de referência. locais de integração únicas são examinados para nucleotídeo adjacente (nt) sequência e distribuição relativa a várias características genômicas. Usando este protocolo, as bibliotecas local de integração de alta complexidade pode ser construído a partir de ADN genómico em três dias. Todo o protocolo que engloba infecção virai exógeno de células de cultura de tecidos sensíveis à análise do local de integração pode, portanto, ser realizada em cerca de uma a duas semanas. Recentes aplicações desta tecnologia referem-se a análise longitudinal de locais de integração a partir de pacientes infectados com HIV.
A integração de ADN virai (vDNA) no genoma da célula hospedeira é um passo essencial no ciclo de vida retroviral. A integração é conseguida pela integrase viral enzima (NOS), que realiza dois processos catalíticos distintos que levam à criação do provírus inserida estavelmente um. EM subunidades envolver as extremidades do vDNA linear que é gerada por meio de transcrição reversa, formando o intasome de ordem superior com vDNA extremidades unidas por um multímero 4/2 NO. EM cliva 'extremidades do vDNA jusante da invariantes 5'-CA-3' a 3 em sequências de um processo conhecido como 3'-processamento, deixando um recesso 3 'termina com grupos hidroxilo reactivos em cada terminal vDNA 5-8. O intasome subsequentemente é importado para o núcleo como parte de uma grande assembléia de acolhimento e proteínas virais conhecido como o complexo de pré-integração (PIC) 9-11. Depois de encontrar alvo celular DNA (DNAt), IN utiliza a vDNA 3'-hidroxil groups para clivar o topo DNAt e fios de fundo de forma escalonada e, simultaneamente, se junta ao vDNA para grupos fosfato DNAt 5 'através do processo de transferência de cadeia 12,13.
preferências do site integração exposição retrovírus nas escalas local e global. Localmente, locais de integração de consenso consistem em sequências DNAt palindr�icas fracamente conservados que vão desde cerca de 5-10 pb a montante ea jusante dos locais de inserção vDNA 14,15. Globalmente, os retrovírus alvo anotações de cromatina específicos 16. Há sete géneros retroviral diferente – alpha através de epsilon, lenti e SPUMA. Os lentivírus, que incluem HIV-1, favorecer a integração dentro dos corpos dos genes ativamente transcritas 17, enquanto os gammaretroviruses integrar preferencialmente em locais de transcrição de início (TSSS) e regiões potenciador ativos 18-20. Em nítido contraste, Spumavirus é fortemente inclinado para heterochromregiões ATIC, como domínios associados a lâmina de genes dos pobres 21. Preferências de base DNAt locais são em grande parte ditada pelas redes específicas de contatos nucleoproteína entre IN e DNAt 13,22,23. Para os lentivírus e gammaretroviruses, a integração em relação ao anotações genômicas é em grande parte regido por interações entre IN e fatores celulares cognatos 24-27. Alterando as especificidades da rede de interação IN-DNAt 13,22,23,28 e perturbando ou re-engenharia IN-hospedeiro interações fator 25-27,29-32 são estratégias comprovadas para redirecionar integração nos níveis locais e globais, respectivamente.
O poder dos procedimentos de seqüenciamento de DNA usados para catalogar locais de integração retrovirais aumentou imensamente nas últimas décadas. Locais de integração foram recuperados no trabalho pioneiro utilizando purificação trabalhoso e técnicas de clonagem manuais para produzir apenas um punhado de sites únicos por 33,34 estudo.A combinação de amplificação por LM-PCR de junções de ADN LTR-hospedeiro com a capacidade para mapear locais de integração individuais de genomas projectos de rato humanos e transformadas no domínio, com o número de sítios recuperados a partir de infecções de células de cultura de tecidos exógeno aumentando a várias centenas a milhares 17 , 18. A combinação mais recente LM-PCR com a metodologia NGS enviou disparada profundidade biblioteca. Especificamente, proporcionou pyrosequencing da ordem de dezenas de milhares de locais de integração única 30,35-38, enquanto bibliotecas sequenciado através da utilização do agrupamento de ADN pode produzir milhões de sequências únicas 19-21,39. Aqui nós descrevemos um protocolo LM-PCR otimizado para amplificar e sequenciar locais de integração retrovirais utilizando NGS DNA de agrupamento. O método incorpora necessária sequências adaptadoras para os iniciadores de PCR e, portanto, directamente para as moléculas de ADN amplificados, impedindo assim a necessidade de um passo adicional do adaptador de ligação antes da sequenciamento 40. O gasoduto análise bioinformática, a partir da análise de dados de sequenciamento brutos para junções de ADN LTR-host para o mapeamento dos locais de integração únicas para pertinentes características genômicas, também é geralmente descrita. De acordo com a precedência estabelecida a partir de protocolos metodológicos anteriores neste campo 36,38,41-43, scripts personalizados podem ser desenvolvidos para auxiliar a conclusão de etapas específicas no pipeline de bioinformática. A utilidade e a sensibilidade do protocolo é ilustrado com dados representativos amplificando, sequenciação e mapeamento de HIV-1 os locais de integração a partir de células de cultura de tecidos infectadas na multiplicidade de infecção aproximada (MOI) de 1,0, bem como uma série de titulação de este DNA diluiu-se através do DNA celular infectada em 5 vezes etapas para uma diluição máxima de 1: 15.625 para se obter o equivalente MOI aproximada de 6,4 x 10 -5.
Um protocolo para a análise de sítios de integração retroviral, a partir do passo inicial de infecção pelo vírus através do mapeamento dos padrões de distribuição genómicas, é descrito. Este protocolo é aplicável a qualquer retrovírus e qualquer tipo de célula infectáveis. Além disso, a tubagem de ensaio é muito sensível, com o potencial de recuperar um número de locais de integração satisfatória únicas a partir de diluições em série de ADN genómico equivalente ao de uma infecção iniciada…
The authors have nothing to disclose.
Somos gratos aos nossos colegas Stephen Hughes e Henry Levin para o conselho que foi fundamental para estabelecer o protocolo de NGS para retroviral sequenciamento local de integração no laboratório Engelman. Este trabalho foi financiado pelo National Institutes of Health concede AI039394 e AI052014 (a ANE) e AI060354 (Centro Harvard University for AIDS Research).
DMEM | Gibco | 11965-084 | Standard cell culture medium, compatible with HEK293T cells |
Fetal Bovine Serum | Thermo Scientific | SH 30088.03 | Different lots of serum may need to be pre-screened for optimal viral production |
Penicillin/Streptomycin | Corning | 30-002-Cl | Antibiotics to be added to DMEM |
Phosphate-buffered saline | Mediatech | 21-040-CV | Used to wash cells |
Trypsin EDTA | Corning | 25-053-CI | Used to detach adherent cells from tissue culture plates |
PolyJet | SignaGen Laboratories | SL100688 | DNA transfection reagent |
0.45 µm Filters | Thermo Scientific | 09-740-35B | Used to filter virus particle-containing cell culture media |
Turbo DNase | Ambion | AM2239 | Used to degrade carryover plasmid DNA from virus stocks |
HIV-1 p24 Antigen Capture Assay | ABL Inc. | 5447 | Used to quantify yield of virus production |
DNeasy Blood & Tissue Kit | Qiagen | 69506 | Used to purify genomic DNA from cells |
Sonicator | Covaris | S2 | With this model of sonicator perform two rounds of duty cycle, 5%; intensity, 3; cycles per burst, 200; time, 80 sec |
Nuclease-Free Water | GeneMate | G-3250-125 | Commercially-available water is recommended to reduce the possibility of sample cross-contamination |
QIAQuick PCR Purification Kit | Qiagen | 28106 | Used to purify DNA during library construction |
End-It DNA End-Repair Kit | Epicentre | ER81050 | Used to repair DNA ends of sonicated DNA samples |
Klenow Fragment (3'-5' exo–) | New England Biolabs (NEB) | M0212S | Used with dATP to A-tail repaired DNA fragments |
dATP | Thermo Scientific | R0141 | Deoxyadenosine triphosphate |
MseI | NEB | R0525L | Restriction endonuclease for genomic DNA cleavage |
BglII | NEB | R0144L | Restriction endonuclease to suppress amplification of upstream HIV-1 U5 sequence |
T4 DNA Ligase | NEB | M0202L/6218 | Enzyme for covalent joining of compatible DNA ends |
DNA Oligonucleotides | Integrated DNA Technologies | custom | Have the company purify the oligos. HPLC purification suffices for DNAs <30 nucleotides; PAGE purify longer DNAs |
Advantage 2 Polymerase Mix | Clontech | 639202 | Commercial mix containing DNA polymerase for PCR |
dNTPs (100 mM solutions) | Thermo Scientific | R0181 | Dilute the four chemicals on ice with sterile water to reach the intermediate worrking concentrations of 2.5 mM each dNTP |
NanoDrop | Thermo Scientific | NanoDrop 2000 | Spectrophotometer for determination of DNA concentration |
Qubit Fluorimeter | Life Technologies | Qubit® 3.0 | Fluorometer used to confirm integration site library DNA concentration |
2200 TapeStation System | Agilent | G2964AA | Tape-based assay to confirm integration site library DNA size distribution |
MiSeq | Illumina | SY-410-1003 | Used for NGS |