Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Amplificação, sequenciamento de próxima geração, e Genomic DNA Mapeamento das retrovirais Integração Sites

Published: March 22, 2016 doi: 10.3791/53840

Abstract

preferências de integração assinatura retrovírus exposição em ambos as escalas local e global. Aqui, apresentamos um protocolo detalhado para (1) geração de diversas bibliotecas de sites de integração retrovirais utilizando PCR amplificação mediada por ligação (LM-PCR) e sequenciamento de próxima geração (NGS), (2) o mapeamento da localização genômico de cada a vírus acolher junção usando BEDTools, e (3) para analisar os dados de relevância estatística. O ADN genómico extraído a partir de células infectadas está fragmentado por digestão com enzimas de restrição ou por sonicação. Depois de DNA final de reparação adequado, os ligantes de cadeia dupla são ligadas para as extremidades do DNA, e PCR com iniciadores semi-internos é conduzida usando iniciadores complementares para tanto a extremidade mais longa repetição terminal (LTR) do vírus e o ADN ligante ligado. Os iniciadores de PCR transportar sequências necessárias para o agrupamento de ADN durante NGS, eliminando a exigência de ligação adaptador separado. Controlo de Qualidade (QC) é conduzido para avaliar a distribuição de tamanho de fragmento de ADN e adaptarer incorporação de ADN antes de NGS. arquivos de saída de seqüência são filtrados para LTR contendo lê, e as sequências que definem o LTR e o ligante são cortadas de distância. sequências celulares hospedeiras aparadas são mapeados para um genoma de referência usando BLAT e são filtrados para 97% de identidade minimamente para um ponto único no genoma de referência. locais de integração únicas são examinados para nucleotídeo adjacente (nt) sequência e distribuição relativa a várias características genômicas. Usando este protocolo, as bibliotecas local de integração de alta complexidade pode ser construído a partir de ADN genómico em três dias. Todo o protocolo que engloba infecção virai exógeno de células de cultura de tecidos sensíveis à análise do local de integração pode, portanto, ser realizada em cerca de uma a duas semanas. Recentes aplicações desta tecnologia referem-se a análise longitudinal de locais de integração a partir de pacientes infectados com HIV.

Introduction

A integração de ADN virai (vDNA) no genoma da célula hospedeira é um passo essencial no ciclo de vida retroviral. A integração é conseguida pela integrase viral enzima (NOS), que realiza dois processos catalíticos distintos que levam à criação do provírus inserida estavelmente um. EM subunidades envolver as extremidades do vDNA linear que é gerada por meio de transcrição reversa, formando o intasome de ordem superior com vDNA extremidades unidas por um multímero 4/2 NO. EM cliva 'extremidades do vDNA jusante da invariantes 5'-CA-3' a 3 em sequências de um processo conhecido como 3'-processamento, deixando um recesso 3 'termina com grupos hidroxilo reactivos em cada terminal vDNA 5-8. O intasome subsequentemente é importado para o núcleo como parte de uma grande assembléia de acolhimento e proteínas virais conhecido como o complexo de pré-integração (PIC) 9-11. Depois de encontrar alvo celular DNA (DNAt), IN utiliza a vDNA 3'-hidroxil groups para clivar o topo DNAt e fios de fundo de forma escalonada e, simultaneamente, se junta ao vDNA para grupos fosfato DNAt 5 'através do processo de transferência de cadeia 12,13.

preferências do site integração exposição retrovírus nas escalas local e global. Localmente, locais de integração de consenso consistem em sequências DNAt palindr�icas fracamente conservados que vão desde cerca de 5-10 pb a montante ea jusante dos locais de inserção vDNA 14,15. Globalmente, os retrovírus alvo anotações de cromatina específicos 16. Há sete géneros retroviral diferente - alpha através de epsilon, lenti e SPUMA. Os lentivírus, que incluem HIV-1, favorecer a integração dentro dos corpos dos genes ativamente transcritas 17, enquanto os gammaretroviruses integrar preferencialmente em locais de transcrição de início (TSSS) e regiões potenciador ativos 18-20. Em nítido contraste, Spumavirus é fortemente inclinado para heterochromregiões ATIC, como domínios associados a lâmina de genes dos pobres 21. Preferências de base DNAt locais são em grande parte ditada pelas redes específicas de contatos nucleoproteína entre IN e DNAt 13,22,23. Para os lentivírus e gammaretroviruses, a integração em relação ao anotações genômicas é em grande parte regido por interações entre IN e fatores celulares cognatos 24-27. Alterando as especificidades da rede de interação IN-DNAt 13,22,23,28 e perturbando ou re-engenharia IN-hospedeiro interações fator 25-27,29-32 são estratégias comprovadas para redirecionar integração nos níveis locais e globais, respectivamente.

O poder dos procedimentos de seqüenciamento de DNA usados ​​para catalogar locais de integração retrovirais aumentou imensamente nas últimas décadas. Locais de integração foram recuperados no trabalho pioneiro utilizando purificação trabalhoso e técnicas de clonagem manuais para produzir apenas um punhado de sites únicos por 33,34 estudo.A combinação de amplificação por LM-PCR de junções de ADN LTR-hospedeiro com a capacidade para mapear locais de integração individuais de genomas projectos de rato humanos e transformadas no domínio, com o número de sítios recuperados a partir de infecções de células de cultura de tecidos exógeno aumentando a várias centenas a milhares 17 , 18. A combinação mais recente LM-PCR com a metodologia NGS enviou disparada profundidade biblioteca. Especificamente, proporcionou pyrosequencing da ordem de dezenas de milhares de locais de integração única 30,35-38, enquanto bibliotecas sequenciado através da utilização do agrupamento de ADN pode produzir milhões de sequências únicas 19-21,39. Aqui nós descrevemos um protocolo LM-PCR otimizado para amplificar e sequenciar locais de integração retrovirais utilizando NGS DNA de agrupamento. O método incorpora necessária sequências adaptadoras para os iniciadores de PCR e, portanto, directamente para as moléculas de ADN amplificados, impedindo assim a necessidade de um passo adicional do adaptador de ligação antes da sequenciamento 40. O gasoduto análise bioinformática, a partir da análise de dados de sequenciamento brutos para junções de ADN LTR-host para o mapeamento dos locais de integração únicas para pertinentes características genômicas, também é geralmente descrita. De acordo com a precedência estabelecida a partir de protocolos metodológicos anteriores neste campo 36,38,41-43, scripts personalizados podem ser desenvolvidos para auxiliar a conclusão de etapas específicas no pipeline de bioinformática. A utilidade e a sensibilidade do protocolo é ilustrado com dados representativos amplificando, sequenciação e mapeamento de HIV-1 os locais de integração a partir de células de cultura de tecidos infectadas na multiplicidade de infecção aproximada (MOI) de 1,0, bem como uma série de titulação de este DNA diluiu-se através do DNA celular infectada em 5 vezes etapas para uma diluição máxima de 1: 15.625 para se obter o equivalente MOI aproximada de 6,4 x 10 -5.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Gerar stocks de vírus

Nota: Um diagrama de fluxo do aspecto banco molhado deste protocolo está representado na Figura 1 Os detalhes da produção de estoque viral e infecção subsequente de células de cultura de tecido geralmente se aplicam a diferentes tipos de retrovírus.. Para algumas experiências, a célula alvo pode não expressam o receptor virai endógeno (s), e em tais casos, a construção de partículas retrovirais pseudotipados albergando heterólogo glicoproteína do envelope viral, por exemplo, da glicoproteína G do vírus da estomatite vesicular (VSV-G), será necessária para a infecção 44,45.

Nota: Devem ser tomadas precauções quando se trabalha com HIV-1. Embora orientações específicas vão variar de instituição para instituição, todo o trabalho à base de vírus deve ser realizada em um, operador restrito gabinete de segurança biológica dedicado (normalmente referido como uma capa de cultura de tecido). equipamentos de proteção individuaisque inclui proteção para o rosto, tampas da sapata, uma camada de luvas duplo, e um terno macacão de corpo inteiro deve ser usado em todos os momentos. Todos os resíduos líquidos resultantes de experiências relacionadas com o vírus deve ser inactivada com água sanitária (concentração final de 10%), e todos os resíduos, incluindo os sólidos devem ser autoclavados antes do descarte.

  1. Um dia antes da transfecção, placa de 3,3 x 10 6 células HEK293T em 10 ml de Dulbecco Modified Eagle Médium (DMEM) suplementado com 10% (v / v) de soro fetal bovino e 1% (v / v) de penicilina / estreptomicina (10.000 U / ml de caldo), em cada uma das cinco placas de 100 mm.
    Nota: suplemento de DMEM é referido como DMEM-FPS a partir deste ponto.
  2. No dia subsequente, transfectar as células com 10 ng de plasmídeo portador de clones moleculares retrovirais de comprimento total ou 9 ug de vectores circulares único excluído-envelope com 1 ug de uma construção de expressão de VSV-G, utilizando reagentes de transfecção disponíveis comercialmente ou fosfato de cálcio.
    1. Incubar a cells a 37 ° C numa incubadora de cultura de células humidificada com 5% de CO 2 (esta condição daqui em diante referido como "incubador de cultura de tecido"). Após aproximadamente 48 horas, recolher o meio celular contendo vírus, utilizando uma pipeta volumétrica e passá-la através de um filtro de 0,45 um fluxo por gravidade.
    2. Concentra-se o vírus por ultracentrifugação a 200000 xg durante 1 h a 4 ° C. Ressuspender o sedimento de vírus em 500 ul de DMEM-FPS contendo 20 U de ADNase, e incubar durante 1 hora a 37 ° C.
      Nota: O passo de ADNase ajuda a reduzir a recuperação de sequências de plasmídeo indesejados, eliminando o peso de DNA de plasmídeo que persiste a partir do procedimento de transfecção.
  3. Determinar a concentração de p24 46 utilizando um kit de captura de antigénio de p24 do VIH-1 de acordo com as instruções do fabricante.
    Nota: A concentração do vírus também pode ser determinada por ensaio da actividade de transcriptase reversa 47,48. Alternativamente, o nível de vírus funcional podeser determinada pela medição MOI. Isto é mais facilmente realizado utilizando células activadas por fluorescência com vírus que expressam genes repórteres fluorescentes, tais como proteína fluorescente verde melhorada. determinação MOI pode ser particularmente útil quando se trabalha com células primárias que não podem suportar o mesmo nível de infecção como linhas celulares optimizadas.

2. Células infectar com o vírus

  1. Placa de 3,0 x 10 5 células HEK293T por poço numa placa de 6 poços em 2,5 ml de DMEM-FPS e incubar durante a noite numa incubadora de cultura de tecidos.
    Nota: o número de sítios de integração únicas recuperados com este protocolo é directamente proporcional ao número de células e a quantidade de vírus activos utilizados na infecção.
  2. Infectar as células com uma concentração de p24 virai final de 500 ng / ml num volume final de 500 ul fresco de DMEM-FPS durante 2 h numa incubadora de cultura de tecidos, em seguida, adiciona-se 2 ml de DMEM-FPS pré-aquecido a 37 ° C por poço e continuar a incubação.
  3. em48 horas após a infecção, remova a mídia e lavar as células com 2 ml de solução salina fosfato tamponada (PBS). Adicione 0,5 ml de tripsina-EDTA pré-aquecido a 37 ° C, e depois de alguns segundos inspeccione visualmente os poços para desalojamento célula.
  4. Adicionar 2 ml de pré-aquecido DMEM-FPS e voltar a suspender as células mediante gentil up / down pipetagem com uma pipeta volumétrica ~ 10 vezes. Transferir a solução para um balão de cultura de 75 centímetros de tecidos contendo 2 18 ml pré-aquecido DMEM-FPS, e incubar as células numa incubadora de cultura de tecidos.
  5. Após minimamente cinco dias a partir do início da infecção, recolher as células, removendo os meios de comunicação, lava-se com 5 ml de PBS, adicionar 2 ml pré-aquecido tripsina-EDTA, e ressuspender com 5 ml pré-aquecido DMEM-FPS por pipetagem. Centrifugar a solução durante 5 min à temperatura ambiente a 2500 xg, e desprezar o sobrenadante.
    Nota: Embora a integração sob estas condições planaltos em cerca de 48 horas após a infecção 49,50, o adicional de 3 dias de cultura são obrigados a sufficientlY diluir a concentração de moléculas de DNA não integrados que resultam da recombinação de ADN baseado em células ou autointegration mediada por vírus.
  6. Extracto de ADN genómico a partir do sedimento celular utilizando um kit disponível comercialmente (por exemplo, ver 51). Elui-se o ADN a partir da coluna de permuta iónica fornecido com 200 ul de Tris-HCl a 10, pH 8,5.
    Nota: uma alíquota de células deve ser repartida em 48 horas pós-infecção (Passo 2.3) para um ensaio de infecciosidade para assegurar a infecção pelo vírus adequado antes de NGS.

3. ADN fragmento genómico por sonicação ou por Enzima de Restrição Digest

Nota: fragmentos sonicação DNA genômico de uma forma independente de sequência virtualmente e é, portanto, o preferido de fragmentação no seqüenciamento amostras com uma baixa taxa esperada recuperação (por exemplo, células de pacientes infectados ou infecções iniciadas a relativamente baixa MOI). Por outro lado, ultra-sons permite distinguir duplicados de PCR de um partisequência do sítio de integração cular de integrações únicas no mesmo local, o que é crítico para distinguir a expansão clonal de células contendo pró-vírus em pacientes infectados (ver Passo 11 abaixo) 39,52-54.
Nota: O ADN deve ser clivada imediatamente a jusante da LTR a montante para diminuir a amplificação de sequências virais internas durante LM-PCR. A enzima de restrição BglII que está 43 pb a jusante da sequência U5 a montante e que é incompatível para subsequente ligação com ADN MseI-gerado termina funciona bem com muitas estirpes de HIV-1 (Figura 1B). Quando se prepara DNA por sonicação, a enzima de restrição de clivagem interna deve ser aplicado após a ligação ligante (ver Figura 1C - E e Passo 4.3 abaixo).

  1. Por ultra-sons, mistura de 10 ug de ADN genómico em água isenta de nuclease para um volume final de 120 ul. Sonicate usando parâmetros para um tamanho médio de ruptura de 500 pb (duas rodadas de o seguinte parágrafometros: Ciclo de funcionamento: 5%; Intensidade: 3; ciclos por explosão: 200; tempo: 80 segundos).
  2. Purifica-se o DNA sonicado utilizando um kit de purificação de PCR. Reparar as extremidades do DNA utilizando um estojo de fim-de reparação do ADN e purifica-se o ADN utilizando um kit de purificação de PCR. A-cauda ao ADN de Klenow utilizando exo - enzima e purificar o ADN de cauda-A utilizando um kit de purificação de PCR. Consulte 51,52 para obter detalhes adicionais de uso de kit.
  3. Para a digestão com endonucleases de restrição, corte de 10 ug de ADN genómico durante a noite a 37 ° C num volume de 100 ul com tampão fornecido pelo fabricante e um cocktail de enzimas (100 L cada) que geram saliências 5'-AT, bem como um enzima incompatíveis tais como BglII que cliva a jusante do LTR viral a montante. Purifica-se o ADN no dia seguinte utilizando um kit de purificação de PCR.
    Nota: Nenhum dos enzimas de restrição deve cortar dentro do terminal de ~ 30 pb da extremidade do ADN viral que é amplificado pelo protocolo LM-PCR. Este protocolo amplifica especificamente o U5final do HIV-1 DNA.

4. Hibridar Linker oligonucleotídeos e ligarão a fragmentada DNA genômico

Nota: Preparar um ligante assimétrica contendo uma saliência que é compatível com os fragmentos de ADN acima (ver Tabela 1 para as sequências dos oligonucleótidos utilizados neste protocolo). O ligante a ser utilizado com o DNA sonicado deve conter uma saliência compatível T-3 ', enquanto que o ligante de ADN digerido MseI-deve conter uma saliência compatível 5'-AT (Figura 1). O filamento de ligação curto deve conter adicionalmente uma modificação química não-extensível, tal como 3'-amina, para limitar as reacções de amplificação subsequentes para com o ADN de interesse.
Nota: Quando a preparação de várias bibliotecas sítio de integração diferentes em paralelo e / ou quando as amostras originais de multiplexagem no mesmo sequenciação de execução, é recomendável usar ligadores únicos para cada amostra a limitar o potencial para a amostra cruzada contaminção durante a PCR. Isto implica adicionalmente o uso de iniciadores ligantes únicos para cada amostra durante a PCR com iniciadores semi-internos (descrito abaixo). Fios ligantes originais e iniciadores ligador pode ser concebido por embaralhamento as sequências de oligonucleótidos ligantes listados na Tabela 1, mantendo a teor de% GC global semelhante e posições saliência aplicáveis.

  1. Emparelhar as cadeias curtas e longas ligantes em 35 ul de Tris-HCl a 10, pH 8,0-0,1 mM de EDTA (concentração final de 10 jiM de cada oligonucleótido) por aquecimento a 90 ° C e arrefecimento lento até à temperatura ambiente em intervalos de 1 ° C por min.
  2. Preparar pelo menos quatro reacções de ligação paralelas por amostra de ADN genómico, que contêm 1,5 uM ligante ligado, ADN fragmentado 1 ug e 800 U de ligase de ADN de T4 em 50 ul. Ligadura durante a noite a 12 ° C. Purifica-se no dia seguinte com um kit de purificação de PCR.
  3. Para amostras preparadas por sonicação, digestão a reacção de ligação purificado com 100 L de uma restricenzima ção que cliva a jusante da LTR a montante (por exemplo, BglII para o HIV-1) sob o fabricante de condições recomendadas durante a noite. Purifica-se o ADN utilizando um kit de purificação de PCR.

5. Amplify virais LTR-anfitrião DNA genômico Junções por PCR Semi-aninhados

Nota: Para assegurar a diversidade da biblioteca óptima, pelo menos, 4-8 PCR paralelas, dependendo da concentração de DNA da reacção de ligação recuperado, deve ser preparada para cada amostra para duas voltas de PCR. concentração de molde de ADN devem ser quantificada por espectrofotometria. Neste protocolo, os primeiro e segundo ciclos de PCR, primers específicos empregar-LTR aninhadas, mas o mesmo iniciador específico do ligante é usado para ambas as fases (Tabela 1). O segundo primer específico-LTR rodada e as sequências de adaptador primário codificação específica do vinculador para o agrupamento do DNA, bem como locais de ligação de iniciador de sequenciação. O primer específico aninhado-LTR também codifica uma sequência de índice de 6 nt, WHich pode variar entre os diferentes primers para bibliotecas de multiplexação dentro do mesmo sequenciamento prazo.

  1. Prepare primeiros PCRs redondos contendo os ingredientes por tubo como listados na Tabela 2.
    Nota: O iniciador específico do ligante abriga 22 nt de complementaridade com o ligante, uma temperatura de fusão de 53 ° C, um conteúdo GC de 45%, e a sua extremidade 3 'está localizado a montante 15-16 pb de terminais 3' de os diferentes ligantes longos fios (Tabela 1). A primeira ronda de 27 nt LTR iniciador tem uma temperatura de fusão de 59 ° C, um conteúdo GC de 48%, e a sua extremidade 3 'está localizado 34 pb a montante do terminal U5 do HIV-1. A região da segunda volta iniciador 26 nt LTR que é complementar ao VIH-1 LTR tem uma temperatura de fusão de 60 ° C, um conteúdo GC de 50%, e a sua extremidade 3 'está localizado 18 pb a montante do U5 viral terminus. Recomenda-se que a temperatura oligonucleotídeo fusão e GC-índice deve imitar esses parâmetros se os usuáriosiniciadores de PCR projeto com sequências alteradas (incluindo para uso com outros retrovírus) 21.
  2. Execute primeira rodada PCR nas seguintes parâmetros termociclador: Um ciclo: 94 ° C durante 2 minutos; 30 ciclos: 94 ° C durante 15 seg, 55 ° C durante 30 seg, 68 ° C durante 45 seg; um ciclo: 68 ° C durante 10 min.
  3. Piscina reacções e purifica-se utilizando um kit de purificação de PCR. Prepare segundo PCRs redondos que contêm os ingredientes por tubo conforme Tabela 3. Execute a segunda rodada de PCR utilizando os parâmetros termociclador descritos no Passo 5.2. Reunir as reacções e purifica-se o ADN utilizando um kit de purificação de PCR comercial seguindo as instruções do fabricante.
    Nota: Uma variedade de sequências de índice recomendadas compatíveis com NGS DNA de agrupamento estão disponíveis 71.

6. Execute QC e NGS (normalmente terminada por um serviço de sequenciação)

  1. (QC ensaio # 1) Confirmar Passo 5.3 concentração de DNA da biblioteca usando um flúormedidor de 55. Resumidamente, preparar padrões e amostras experimentais em um volume final de 200 de água livre de nuclease ul. tubos de vórtice durante 2-3 segundos, incubar à temperatura ambiente durante 2 min e, em seguida, ler as amostras no fluorómetro.
    Nota: As amostras devem conter uma concentração mínima de 2 nM de ADN da biblioteca num volume mínimo de 15 ul.
  2. (QC ensaio # 2) Confirmar distribuição de tamanho de fragmento de ADN utilizando um ensaio à base de fita 56.
    Nota: A distribuição ideal é um pico de ADN relativamente larga centrado em torno de 500 pb de comprimento. Se uma quantidade significativa de material é maior do que 1 kb, então recomenda-se a incorporar um processo de selecção de tamanho para eliminar as espécies de ADN mais longos, o que vai impedir a amplificação ponte durante o agrupamento. Em contrapartida, se um pico significativo é aparente cerca de 100 a 200 pb, um dímero de primer pode ter formado durante a PCR. Neste caso, o processo deve ser optimizada para minimizar a formação de dimeros de iniciadores.
  3. (QC ensaio # 3) Confirm incorporação adequada de adaptadores em biblioteca de ADN por PCR quantitativa 57.
  4. Executar NGS seguinte literatura aplicação do fabricante. Utilizar uma espiga em de 10% (w / w) ΦX174 ADN, que irá optimizar a métrica de qualidade de tempo real, proporcionando a composição de base equilibrada para a sequenciação de execução.
    Nota: experimentos local de integração de seqüenciamento são normalmente submetidos a única final de 150 pb (SE150) ou emparelhado-end 150 pb (PE150) sequenciamento. PE150 é particularmente útil para capturar o ponto de fixação vinculador em cada molécula de ADN (por exemplo, aquando do exame de locais de integração para a evidência da expansão clonal da célula hospedeira).

7. Use um script Python ou Perl personalizado para analisar Sequenciamento de dados para LTR contendo seqüências, Colheita de distância LTR e sequências ligantes, e Mapa de genoma de referência com BLAT

  1. ficheiros FASTA de digitalização para LTR contendo sequência lê, LTR de culturas e sequências de ligação longe de sequência de DNA genómico hospedeiro eexportar estas sequências para um novo arquivo FASTA. Mapa cortada lê tanto a um genoma de referência (por exemplo, versões do genoma hg19 humanos ou GRCh38) e o genoma viral usando BLAT 58, com local de integração de saída coordenadas exportado para um arquivo .txt separado, utilizando as seguintes definições:
    stepSize = 6, minIdentity = 97, e maxIntron = 0
  2. Analisar a saída BLAT txt ficheiro, remover autointegrations (isto é evidência de que o fim LTR tem integrado numa região interna do genoma de ADN virai) e outras sequências de mapeamento para o genoma do VIH-1, e criar uma saída separada txt ficheiro no qual todos os locais de integração duplicados foram condensadas em individuais, únicas coordenar hits.

8. Criar arquivos .bed que compreendam intervalos 15-NT circundantes Integrações, converter esses arquivos para FASTA, e construir Sequence Logos para exibir Preferências de Base redor Sites Integração

  1. Criar arquivos .bed que listam um intervalo de bases paracada local de integração. Pelo menos 15 bases (5 a montante e a jusante 10) são sugeridos para a geração de sequência de logotipo. Gerar um arquivo FASTA a partir desses arquivos .bed usando a função fastaFromBed de BEDTools 59 e este comando:
    fastaFromBed-fi / diretório / para / de referência / genoma / -name -s -cama 15_base_pair_file.bed Fo output_file.fasta
    Nota: O viral 5'-CA-3 'dinucleótido invariante é unida a acolher de ADN durante a integração, e a verificação da junção terminal do LTR de ADN celular é um filtro inicial importante para identificar bona fide locais de integração. Nós, adicionalmente, compilar logos sequência deste host população sequência de DNA para verificar os resultados experimentais. Como retrovírus exibir preferências assinatura base que cercam seus locais de integração 14,15, os logos sequência servir para validar que os locais genómicos mapeadas surgiu através da integração IN-mediada, em comparação com outros mecanismos de recombinação tais como DNA não homólogoacabar juntando 60,61.
  2. Use WebLogo 3 (http://weblogo.threeplusone.com/create.cgi) para criar logotipos de sequência a partir dos arquivos FASTA. Clique em "Escolher arquivo" para fazer o upload do arquivo FASTA, e use as seguintes configurações: Formato de saída, PDF (vetor); tamanho do logotipo, grande; Primeiro número da posição, -5; gama Logo, -5 a 5; escala do eixo Y, 0,1, espaçamento tic do eixo Y, 0,5, esquema de cores, clássico (NA).

9. Criar Base Central Par .bed arquivos, verifique por Amostra contaminação cruzada, e mapear a distribuição de originais Integração Sites Relativo ao Features pertinentes Genomic

  1. Uma vez que a integração retroviral ocorre de forma escalonada entre os fios DNAt, ajustar as coordenadas exactas de locais de integração de modo a reflectir o pb central da duplicação local alvo para o mapeamento genómico correcto de distribuição relativa a características genómicas.
    1. Portanto, para 5 pb duplicação de vírus como o HIV-1, crie um arquivo .bed com o deslocamento do i pb Centrallocal NTEGRAÇÃO por duas bases a jusante para o mapeamento de integrações para a cadeia positiva, e duas bases a montante para o mapeamento de integrações à cadeia menos.
  2. Para verificar se há contaminação cruzada de amostras, calcular o número de locais de integração comuns entre as diferentes bibliotecas usando os BEDTools cruzam função para se cruzam bp centro .bed arquivos para duas amostras diferentes e seguindo este comando:
    bedtools cruzam -a central_basepair_1.bed -b central_basepair_2.bed -f 1,00 r -s> overlap1v2.txt
  3. Contar o número de linhas dentro do arquivo overlap1v2.txt de saída a fim de quantificar o número exato de locais comuns entre as duas bibliotecas usando o seguinte comando:
    wc -l overlap1v2.txt
  4. Baixe o arquivo .bed RefSeq anotação para a versão do genoma de referência que foi utilizado para o mapeamento local de integração do banco de dados UCSC Genome Anotação (por exemplo http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database) 62.
    1. Calcule o número de locais de integração abrangidos genes RefSeq usando os BEDTools cruzam função para intersectar o arquivo .bed par de bases central que foi gerado para a amostra com o RefSeq .bed seguinte arquivo este comando:
      bedtools cruzam -a central_basepair_1.bed -b RefSeq_hg38.bed u> RefSeq_sample1.bed
  5. Contar o número de linhas dentro do arquivo RefSeq_sample1.bed de saída a fim de quantificar o número exato de sites de queda nos genes RefSeq usando o seguinte comando:
    wc -l RefSeq_sample1.bed
  6. Repita os passos 9.3 e 9.4 para locais de integração de mapeamento para qualquer outra anotação de interesse para o qual um intervalo .bed arquivo está disponível. Baixe o arquivo .bed mais atual CpG ilha de anotação para o genoma de juro de referência do Banco de Dados do Genoma UCSC Anotação conforme indicado no Passo 9.4.
    1. Calcular o número de locais de integração caindo dentro de uma determinada diposição (ilustrado neste exemplo é uma janela de 5 kb) de ilhas de CpG utilizando a funo de janela de BEDTools e seguindo este comando:
      janela bedtools -w 2500 central_basepair_1.bed -b CpG_hg38.bed u> CpG_sample1.bed
  7. Contar o número de linhas dentro do ficheiro CpG_sample1.bed de saída, a fim de quantificar o número exacto de sítios que caem dentro de 2,5 kb a montante ou a jusante de ilhas de CpG utilizando o comando seguinte:
    wc -l CpG_sample1.bed
  8. Repita os passos 9.6 e 9.7 para locais de integração de mapeamento nas proximidades das EAT. Gerar uma versão alternativa do arquivo RefSeq.bed, onde genômica coordenadas de mapeamento para mais de um gene foram ajustados para refletir apenas um único gene presente nessa posição. Isso impede que superestimação da densidade gene circundante locais de integração. Calcular a densidade gene na região de 1 Mb redor de cada local de integração usando a função de janela BEDTools e seguindo este comando:
  9. Calcular a densidade média gene para todas as integrações no conjunto de dados, seguindo este comando:
    awk '(soma + = $ 7) END (impressão "Média =", soma / NR) "GeneDensity_sample1.bed

10. Estatisticamente Compare Integração site Distribuições entre as amostras usando dois de cauda teste exato de Fisher e Dois-atado Wilcoxon Rank Sum Test em R

Nota: o teste exato de Fisher Use para comparar a proporção de locais de integração dentro de genes RefSeq ou dentro de uma janela de ilhas CpG ou TSSs, mas usar o teste de Wilcoxon para comparar a distribuição da densidade gene em torno dos locais de integração. O programa está disponível em R http://www.r-project.org/.
Bicaudal teste exato de Fisher:

  1. Usando os números calculados conforme indicado nos Passos 9.4 e 9.7, create matrizes para cada comparação em R de ocorrências observadas (integrações dentro de uma anotação ou dentro de uma janela em torno de uma anotação) versus restantes locais, seguindo este comando:
    (Annotation_of_interest <- matriz (c (SampleA # in, SampleA # restante, SampleB # in, SampleB # restante), nrow = 2, dimnames = list (c ( 'Center', 'Restante'), c ( 'SampleA', 'SampleB'))))
  2. Calcule o valor P para a comparação por bicaudal teste exato de Fisher com o seguinte comando:
    fisher.test (annotation_of_interest, alternativa = 'two.sided') $ p.value
    Bicaudal de Wilcoxon rank sum:
  3. Criar um arquivo .txt delimitado por tabulação em que cada coluna contém o nome da amostra na célula superior, seguido abaixo dos valores de densidade de genes para todos os locais de integração em que biblioteca (obtido a partir do arquivo .bed gerado no Passo 9.9). Importar este arquivo .txt delimitado por tabulação em R usando o seguinte comando e navigating para o diretório do arquivo correto:
    FILENAME <- as.data.frame (read.delim (file.choose (), header = T, check.names = FALSE, preencha = TRUE, setembro = ' t'))
  4. Calcule o valor P para a comparação por bicaudal teste de Wilcoxon com o seguinte comando:
    wilcox.test (FILENAME $ SampleA, FILENAME $ SampleB, = alternativas "two.sided ', emparelhado = F, exato = T) $ p.value
    Nota: Os valores de P pode ser calculado apenas até um certo (extremamente baixo) limite em R, após o qual zero será retornado pelo programa. Para maciçamente diferentes amostras que produzem uma P = 0 em R, estimar o valor P como <2,2 x 10 -308.

11. Examine Raw Seqüenciamento de Dados para a evidência de expansão clonal de células contendo DNA Integrada Viral

Nota: Existe uma pequena possibilidade de mais de uma integração no exato nt no genoma de referência. Alternativamente, em uma únicategração caso podem tornar-se presentes em forma redundante de dados de sequenciação, devido à utilização de PCR durante a preparação da biblioteca e / ou através de duplicação de células antes da preparação do ADN. Análises recentes de DNA genômico de pacientes infectados pelo HIV têm distinguido estas possibilidades através da identificação de pontos pontos sonicação de cisalhamento / fixação de ligação únicos (que só pode surgir antes da PCR) dentro de sequências de DNA que contêm locais de integração idênticos 52-54. Não existe actualmente um debate quanto ao facto de provírus abrigadas no interior das células clonalmente expandidas contribuir para o reservatório viral latente, e, portanto, é de particular interesse para caracterizar o seu nível de expansão ao estudar os locais de integração em pacientes humanos.

  1. Semelhante ao procedimento listado na etapa 8.1, gerar ficheiros .bed listagem de um intervalo de bases estendendo-se, neste caso, de 25 nt a jusante de cada local de integração único (bases a montante são aqui desnecessários). Gerar um arquivo FASTA a partir desses arquivos .bed (conforme indicado noPasso 8.1) usando a função fastaFromBed de BEDTools e seguindo este comando:
    fastaFromBed-fi / diretório / para / de referência / genoma / -name -s -cama 25_base_pair_file.bed Fo output_file.fasta
    Nota: Para melhorar a especificidade de cada pesquisa é recomendado para extrair pelo menos 25 nt a jusante de cada local de integração para análises expansão clonal.
  2. De preferência usando um script personalizado, procure o arquivo FASTA dados de seqüência cru para todas as cadeias que contêm uma correspondência exata com a 25 nt a jusante de cada local de integração único, e depositar estas sequências em um novo arquivo. Apare LTR e sequências de ligação das cordas matérias. Mesclar sequência PE lê através da conversão de leituras para o complemento reverso, aparando as sequências LTR e vinculador, e depois atribuir cordas READ2 ao seu par READ1 se as cordas partilham pelo menos 20 sobreposição nt.
  3. Digitalizar os pontos de fixação vinculador de cada bloco local de integração. Classificar cada integração como "clonagem expandiu &# 34; Se os pontos de fixação ligante são ≥3 pb separados.
    Nota: Um protocolo para a análise expansão clonal, sem sequência fusão lê tem sido descrita 52.
    Nota: A fragmentação do genoma no mesmo local exato por ultra-sons leva a uma subestimação da extensão da expansão clonal, e métodos para corrigir o viés experimental resultante foram descritos 63,64.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

A Tabela 4 lista os resultados de uma experiência representativa para ilustrar a sensibilidade de NGS para a recuperação de locais de integração a partir de uma cultura de células infectadas. DNA celular não infectados foi utilizado para diluir em série de ADN genómico a partir de uma infecção em que todas as células, em média, continha uma integração 40. As diluições foram preparadas em passos de cinco a uma diluição máxima de 1: 15.625. O ADN genómico da série de titulação foi depois fragmentado por sonicação ou por digestão com endonucleases de restrição BglII e MseI, seguido por LM-PCR. O número de locais de integração original, bem como o número de sítios proximal mapeamento para anotações genómicas seleccionadas, foram calculados de acordo com o protocolo acima. A análise dos dados revelou dezenas de locais de integração únicos (1-2% do valor recuperado a partir do ADN genómico puro) recuperados a partir de bibliotecas preparadas a partir de células que, em teoria, apenas um em cada 15.625 foi infectadas. Ao analisar conjuntos de dados do site de integração, é fundamental para comparar os dados para um conjunto combinado de sítios genómicos aleatórios, que é chamado um controlo aleatório combinado ou MRC. Como os resultados representativos cortado DNA genômico pela restrição de digestão enzimática ou por ultra-sons, dois conjuntos de dados MRC diferentes foram construídos. MRC Enz continha 50.000 locais genómicos únicos gerados por seleção aleatória de locais de hg19 na proximidade com os locais de restrição MseI e BglII de digestão enzimática, enquanto MRC aleatórios abrigavam 10.000 locais gerado sem normalização de distância definidos marcadores genômicos. Apenas os locais que podem ser mapeadas de volta para um local genómico original deve ser utilizado em conjuntos de dados de MRC. Como tesouras sonicação ADN genómico essencialmente livre de polarização de sequência, MRC aleatório pode ser visto como mais aplicável a conjuntos de dados produzidos por fragmentação de ADN através de sonicação. Um estilo alternativo de integração de controleconjunto de dados local pode ser gerado in vitro por meio de reacção na proteína recombinante, intasome nucleoproteína complexo 21, ou PICs extraído de células infectadas de forma aguda com 17 de ADN genómico desproteinizado, e, em seguida, na sequência da LM-PCR e NGS protocolos 21.

Os valores de p para comparação da distribuição de locais de integração recuperado por sonicação contra digestão de restrição (comparação entre as amostras puro), bem como para a comparação com o MRC Enz e MRC aleatória, são apresentados na Figura 2. A distribuição dos locais de integração recuperado seguinte sonicação foi semelhante àqueles recuperados por restrição enzima digerir para todas as anotações examinados, com a maior variância evidente em termos de proximidade com ilhas de CpG. Como esperado 18,65 ambos os conjuntos de dados diferem significativamente dos MRCs em termos de integrações dentro genes RefSeq e gene density em torno do site médio de integração, enquanto ambos os conjuntos de dados foram semelhantes aos MRCs em termos de distribuição relativa às ilhas CPG e das EAT. Desde relativamente poucos locais de integração de HIV-1 mapear dentro de 2,5 kb de uma ilha CpG ou TSS, aumentando o número total de locais recuperada é susceptível de diminuir a variabilidade que pode surgir entre conjuntos de dados (Tabela 4 e Figura 2). Logotipos sequência para confirmar a autenticidade dos dados do local de integração são mostrados na Figura 3. O consenso do HIV-1 local de integração 14,22 (-3) TDG (G / V) TWA (C / B) Cha (7) ( escrito usando União Internacional de códigos de base Biochemistry; a barra invertida indica a posição de vDNA plus-strand juntar, e o sublinhado indica a sequência de 5-BP duplicado seguindo o HIV-1 a integração e a reparação do ADN) é aparente para as bibliotecas preparadas por ambas as técnicas de fragmentação, embora o grau de certeza diminui com o aumento de diluição da célula infectadaADN. Os locais aleatórios alinhados a partir do conjunto de dados MRC pelo contrário não conseguiu gerar níveis apreciáveis ​​de preferências de base.

figura 1
Figura 1:. Fluxograma de Ilustração de Preparações Integração Biblioteca Site (A) Gerar stocks de vírus por transfecção de células HEK293T, coleta e filtragem de sobrenadante 48 horas mais tarde, a concentração por ultracentrifugação, e infectando células alvo com a concentração adequada de vírus. Pelo menos cinco dias após a infecção, extrair ADN genómico. Consulte as Secções 1 e 2 do texto principal para obter detalhes experimentais adicionais. (B e C) do fragmento purificado de DNA genómico através de digestão com enzimas de restrição ou por sonicação. O coquetel de enzimas de restrição deve incluir uma enzima (por exemplo, BglII) que se unirá a jusante da LTR viral montante de contra-selecção para LM-PCR amplificação de sequências vDNA internos. Asterisco verde e ramificada seta em (C) indicam que BglII deve ser aplicado após a ligação ligante. destaques vermelhos sequência viral, enquanto destaques pretos hospedam sequência celular. break points DNA implícita (sem escala) são marcados por "X." HIV-1 contém numerosos sítios MseI e BglII; apenas aqueles relevantes para o protocolo são mostrados. Os suportes acima dos mapas indicam as regiões do DNA U5-celular preferencialmente amplificados pela LM-PCR. (D) Purifica-se o ADN fragmentado (em seguida acabar-reparação e A-cauda no caso de ultra-sons) e ligar-se a moléculas ligantes assimétricos (E) compatível (de cor azul). Círculos magenta em (D) indicar o local de integração que será amplificado. Os asteriscos nas extremidades 3 'dos ​​filamentos de ligante curto denotam amino bloqueio modificações. Primeira rodada (F) Conduta de PCR semi-nested utilizando primeiro iniciador rodada LTR (vermelho) e primer vinculador (azul). em tseu ciclo de PCR, o iniciador ligante codifica para o agrupamento de DNA e NGS sequências (agrupadas como um apêndice verde para o primer vinculador azul) ligação primer, enquanto o primer LTR carece de tais sequências. (G) Purificar primeiro produto PCR rodada e conduzir segunda rodada de PCR semi-nested. Neste ciclo de PCR, utilizar o mesmo iniciador ligante tal como na primeira ronda (azul + apêndice verde), em conjunto com o segundo iniciador rodada LTR (vermelho) que transporta o agrupamento de ADN e as sequências de ligação ao iniciador NGS, bem como um código de barras para a multiplexação ( agrupadas como um apêndice verde para o primer LTR vermelho). (H) Purificar segundo produto PCR rodada como a biblioteca local de integração final (caixa em magenta, com local de integração marcado pelo círculo magenta). Submeta alíquota para serviço de sequenciação para QC e NGS. Por favor clique aqui para ver uma versão maior desta figura.

"Figura Figura 2:. Os valores de P para a comparação dos locais de integração Amplified sequência de ADN A fragmentação por sonicação ou por restrição digestão enzimática contra MRCs respectivos números de locais de integração dentro de genes RefSeq e ilhas CpG próximas e das EAT, bem como perfis de densidade gene regionais, estão listados na Os valores de P tabela 4 ≥0.05 são destacadas em negrito e itálico valor de P calculados pelo exatos valores de p de Fisher teste b calculados pelo teste de Wilcoxon rank sum c MRC enz:.... correspondida controlo aleatório; um conjunto de 50.000 locais de integração únicas foi produzido pela seleção aleatória de posições na proximidade de locais de restrição MseI / BglII na compilação hg 19. d MRC aleatória: correspondida controlo aleatório contendo 10.000 locais de integração exclusivos produzidos por acaso SELECTposições ng em hg19 sem normalização para o sítio de restrição de proximidade. Por favor clique aqui para ver uma versão maior desta figura.

Figura 3
Figura 3: Sequência de logotipos que descreve o HIV-1 a partir de bibliotecas de Base Preferências experiência representativa locais de integração a partir de bibliotecas preparadas por (a) a digestão com enzimas de restrição ou (B) de ultra-sons foram alinhadas utilizando o software. WebLogo. Cada diluição em série de titulação é descrito, a partir do ADN limpo no topo da figura para a diluição máxima de 1: 15.625, na parte inferior. Logotipo (C) Sequência para o MRC de 50.000 locais genómicos únicos. As barras de erro representam essencialmente o desvio padrão na incorporação de base em qualquer posição particular. Mais especificamente, o taltura otal de cada barra de erro é equivalente a duas vezes a correção pequena amostra de 66, que controla a subestimação da entropia presente em relativamente pequenos conjuntos de dados. O eixo x representa posições DNA nt genômicos de células hospedeiras em relação ao sítio de integração no ponto zero. Por favor clique aqui para ver uma versão maior desta figura.

tabela 1
. Tabela 1: primers redondos LTR-específicas ligante oligonucleotídico sequências para Linker Construção e Amplificação por PCR e segundo codificar sequências de adaptador agrupamento de DNA, que são cores codificadas da seguinte forma: preto, bases complementares ao ligante ou para o HIV-1 LTR; vermelho, índice ou código de barras único; verde, sequenciamento locais de ligação do iniciador; azul, sequências de adaptador para agrupamento DNA. Single-end (SE) rea sequenciaçãoCÇÕES irá utilizar o iniciador de sequenciação que emparelha com a segunda sequência rodada LTR iniciador READ1 (verde), enquanto de gama emparelhado reacções (PE) vai utilizar tanto (READ1 e READ2) os iniciadores de sequenciação. Um ligante cadeias curtas conter 3 'amino bloqueio modificação. por favor clique aqui para ver uma versão maior desta tabela.

Reagente Para Adicionar per Reaction
Primeiro iniciador LTR redondo (15 uM): 2,5 ul
-Linker específica primário (15 M): 0,5 ul
tampão de PCR 10x: 2,5 ul
dNTPs (2,5 mM cada) 0,5 ul
DNA Polymerase Mix: 0,5 ul
reacção de ligação: 100 ng
água livre de nuclease: até 25 ul

Tabela 2:. Receita para o primeiro ciclo de PCR A quantidade de cada reagente especificado para ser adicionada a cada tubo de PCR individual é indicado.

Reagente Para Adicionar per Reaction
Segundo iniciador LTR redondo (15 uM): 2,5 ul
-Linker específica primário (15 M): 0,5 ul
tampão de PCR 10x: 2,5 ul
dNTPs (2,5 mM cada) 0,5 ul
DNA Polymerase Mix: 0,5 ul
Primeiro PCR rodada: 100 ng
água livre de nuclease: até 25 ul

Tabela 3:. Receita segunda ronda de PCR A quantidade de cada reagente para ser adicionada a cada tubo de PCR é indicada.

<td> Digest, 1: 125
Biblioteca Sites #Unique % RefSeq um CpG% +/- 2,5 kb b % TSS +/- 2,5 kb c AVG. Gene Densidade +/- 500 kb d
A sonicação, puro 3169 71,2 5.1 3.7 15,8
A sonicação, 1: 5 366 75,1 2.7 3 16.3
254 74 7.1 5.1 16,7
A sonicação, 1: 125 430 69,8 6.9 6 14,6
A sonicação, 1: 625 314 65,6 5.6 6,7 13,5
A sonicação, 1: 3125 116 73,6 3,5 2.5 13.1
A sonicação, 1: 15.625 72 62,5 0 1.4 14,7
Digest, puro 7428 69,8 3.6 2.9 15.2
Digest, 1: 5 1.460 71,4 4.4 3.4 14,9
Digest, 01:25 394 68,8 4.3 3.3 15,8
172 71 0 3 14
Digest, 1: 625 134 73,9 3.7 3.7 14.1
Digest, 1: 3125 100 83,1 6.4 5.2 19.1
Digest, 1: 15.625 73 74 4.1 1.4 9,7
MRC Enz e 50.000 44,7 4.2 4 8,7
MRC f aleatória 10.000 41,3 5.3 4.2 8.6

Tabela 4: Distribuição genômico de locais de integração de Representante Series Titulação A percentagem de locais de integração total de th.na queda dentro de genes RefSeq, b dentro de 2,5 kb de ilhas CpG e c dentro de 2,5 kb de TSSs d A densidade gene dentro de 1 Mb cercam o site médio integração e MRC enz:.. correspondida controlo aleatório; um conjunto de 50.000 locais de integração únicas foi produzido pela seleção aleatória de posições na proximidade de locais de restrição MseI / BglII em hg19 f MRC aleatória:. controlo aleatório combinado contendo 10.000 locais de integração únicas produzidas por seleção aleatória de posições em hg19 sem normalização para posições fixas.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Um protocolo para a análise de sítios de integração retroviral, a partir do passo inicial de infecção pelo vírus através do mapeamento dos padrões de distribuição genómicas, é descrito. Este protocolo é aplicável a qualquer retrovírus e qualquer tipo de célula infectáveis. Além disso, a tubagem de ensaio é muito sensível, com o potencial de recuperar um número de locais de integração satisfatória únicas a partir de diluições em série de ADN genómico equivalente ao de uma infecção iniciada com um MOI de 6,4 x 10 -5. Esta sensibilidade faz com que o protocolo especialmente útil quando aplicada a amostras provenientes de pacientes infectados que podem conter uma carga viral baixa, em que apenas uma pequena fracção das células vai abrigar um provírus integrado. Consistente com papéis metodologia anterior neste campo 36,38,41-43, várias etapas na porção bioinformática deste protocolo irá beneficiar o desenvolvimento de scripts personalizados para o processamento de grandes arquivos de dados em seqüência. Enquanto BLAT 58 é a mapping utilitário descrito neste protocolo, os usuários podem encontrar Bowtie 67 (http://bowtie-bio.sourceforge.net/index.shtml) para ser uma alternativa adequada.

Um gasoduto bioinformática alternativa foi relatado recentemente para a determinação de Moloney vírus da leucemia murina (MoMLV) locais de integração 19. O gasoduto é útil na medida em que foi desenvolvido em software independente que está disponível ao público, e é bastante poderosa na medida em que foi originalmente usado para mapear centenas de milhares de sites de integração MoMLV únicas. No entanto, o software disponível foi originalmente concebido para especificamente re-analisar o conjunto de dados de MoMLV relatados, e assim a reprogramação seria necessário personalizar a tubagem para alternar modelos experimentais (a funcionalidade da ferramenta foi recentemente expandido para incluir vírus adeno-associados e Tol2 e Ac / Ds transposon vetores 68). Para além disso, que o protocolo descrito geração do local de integração preliminar .bedarquivo, mas não colocar para fora as etapas específicas necessárias para sites de mapas para pertinentes anotações genômicas. Os leitores podem encontrar o "Vector Integração Análise Site" servidor 69, que foi lançado durante a revisão do manuscrito atual, útil para analisar as sequências NGS gerados utilizando o protocolo descrito aqui.

Alguns pontos devem ser enfatizados quando se usa qualquer protocolo para analisar conjuntos de dados do site de integração retrovirais. Ao preparar várias bibliotecas em conjunto, existe um potencial significativo para a contaminação cruzada de amostras. Mesmo um nível muito reduzido de crosstalk amostra pode obscurecer os resultados ao nível da prestação de uma corrida NGS inutilizável. Portanto, todo o trabalho wet-banco deve ser concluída em uma capela de fluxo laminar dedicado esterilizado ou estação de trabalho PCR. Um conjunto de pipetas e reagentes tais como água livre de nuclease deve ser dedicado exclusivamente à amplificação local de integração. A utilização de ligadores únicos para cada preparação de biblioteca podem limitar o potencialcruzada para a amplificação e também permitir a identificação de passagem lê dentro de cada biblioteca nos ficheiros FASTA-primas.

É importante considerar os prós e contras do uso de sonicação contra restrição digestão endonuclease para fragmentar o ADN genómico. Por um lado, ultra-sons proporciona uma distribuição relativamente aleatória de pontos de corte, mas os passos de reparação de ADN e A-tailing subsequentemente necessários reduzir consistentemente a produção de produtos de ligação do linker, em comparação com ligaduras realizados com extremidades coesivas geradas com enzimas de restrição. Por outro lado, a digestão com enzimas de restrição fornece uma população inferior-pagos de pontos de cisalhamento, o que irá invariavelmente conferem um certo grau de polarização nos dados recuperados. Utilizando uma endonuclease de restrição para descartar sequências LTR a montante vai em ambos os casos (Figura 1) resultar na perda de uma pequena fracção dos sítios de integração que se situam a montante do referido local no genoma. Qualquer viés de dados que pode resultar pode ser advestida omitindo a digestão enzimática a partir do protocolo durante a preparação da biblioteca e filtrando a multidão de resultar sequências LTR a montante a partir dos dados de sequenciamento.

Embora o protocolo atual é bastante sensível e capaz de gerar milhões de locais de integração únicas 21,40, apenas cerca de um terço de todas as integrações disponíveis pode ser esperado para ser amplificado em um determinado experimento, mesmo com a melhor das preparações biblioteca (ref 70. e observações não publicadas). Isso pode causar complicações ao analisar amostras de infecções ou pacientes de baixo MOI que abrigam baixa carga viral. Esta limitação pode ser superada em parte por sequenciação repetidamente a mesma preparação da biblioteca e / ou sequenciação de várias bibliotecas derivadas a partir da mesma amostra de ADN em paralelo. Aumentos futuros de sensibilidade do ensaio, consequentemente ser muito benéfico para as aplicações de translação Desenvolvimento de técnicas de sequenciamento retroviral local de integração.

Subscription Required. Please recommend JoVE to your librarian.

Acknowledgments

Somos gratos aos nossos colegas Stephen Hughes e Henry Levin para o conselho que foi fundamental para estabelecer o protocolo de NGS para retroviral sequenciamento local de integração no laboratório Engelman. Este trabalho foi financiado pelo National Institutes of Health concede AI039394 e AI052014 (a ANE) e AI060354 (Centro Harvard University for AIDS Research).

Materials

Name Company Catalog Number Comments
DMEM Gibco 11965-084 Standard cell culture medium, compatible with HEK293T cells
Fetal Bovine Serum Thermo Scientific SH 30088.03 Different lots of serum may need to be pre-screened for optimal viral production
Penicillin/Streptomycin Corning 30-002-Cl Antibiotics to be added to DMEM
Phosphate-Buffered saline Mediatech 21-040-CV Used to wash cells
Trypsin EDTA Corning 25-053-CI Used to detach adherent cells from tissue culture plates
PolyJet SignaGen Laboratories SL100688 DNA transfection reagent
0.45 µm Filters Thermo Scientific 09-740-35B Used to filter virus particle-containing cell culture media
Turbo DNase Ambion AM2239 Used to degrade carryover plasmid DNA from virus stocks
HIV-1 p24 Antigen Capture Assay ABL Inc. 5447 Used to quantify yield of virus production
DNeasy Blood & Tissue Kit Qiagen 69506 Used to purify genomic DNA from cells
Sonicator Covaris S2 With this model of sonicator perform two rounds of duty cycle, 5%; intensity, 3; cycles per burst, 200; time, 80 sec
Nuclease-Free Water GeneMate G-3250-125 Commercially-available water is recommended to reduce the possibility of sample cross-contamination
QIAQuick PCR Purification Kit Qiagen 28106 Used to purify DNA during library construction
End-It DNA End-Repair Kit Epicentre ER81050 Used to repair DNA ends of sonicated DNA samples
Klenow Fragment (3'-5' exo–) New England Biolabs (NEB) M0212S Used with dATP to A-tail repaired DNA fragments
dATP Thermo Scientific R0141 Deoxyadenosine triphosphate
MseI NEB R0525L Restriction endonuclease for genomic DNA cleavage
BglII NEB R0144L Restriction endonuclease to suppress amplification of upstream HIV-1 U5 sequence
T4 DNA Ligase NEB M0202L/6218 Enzyme for covalent joining of compatible DNA ends
DNA Oligonucleotides Integrated DNA Technologies custom Have the company purify the oligos. HPLC purification suffices for DNAs <30 nucleotides; PAGE purify longer DNAs 
Advantage 2 Polymerase Mix Clontech 639202 Commercial mix containing DNA polymerase for PCR
dNTPs (100 mM solutions) Thermo Scientific R0181 Dilute the four chemicals on ice with sterile water to reach the intermediate worrking concentrations of 2.5 mM each dNTP
NanoDrop Thermo Scientific NanoDrop 2000 Spectrophotometer for determination of DNA concentration
Qubit Fluorimeter Life Technologies Qubit® 3.0 Fluorometer used to confirm integration site library DNA concentration
2200 TapeStation System Agilent G2964AA Tape-based assay to confirm integration site library DNA size distribution
MiSeq Illumina SY-410-1003 Used for NGS

DOWNLOAD MATERIALS LIST

References

  1. Craigie, R., Bushman, F. D. HIV DNA integration. Cold Spring Harb. Perspect. Med. 2, a006890 (2012).
  2. Li, M., Mizuuchi, M., Burke, T. R. J., Craigie, R. Retroviral DNA integration: reaction pathway and critical intermediates. EMBO J. 25, 1295-1304 (2006).
  3. Hare, S., Gupta, S. S., Valkov, E., Engelman, A., Cherepanov, P. Retroviral intasome assembly and inhibition of DNA strand transfer. Nature. 464, 232-236 (2010).
  4. Hare, S., Maertens, G. N., Cherepanov, P. 3'-processing and strand transfer catalysed by retroviral integrase in crystallo. EMBO J. 31, 3020-3028 (2012).
  5. Fujiwara, T., Mizuuchi, K. Retroviral DNA integration: structure of an integration intermediate. Cell. 54, 497-504 (1988).
  6. Roth, M. J., Schwartzberg, P. L., Goff, S. P. Structure of the termini of DNA intermediates in the integration of retroviral DNA: dependence on IN function and terminal DNA sequence. Cell. 58, 47-54 (1989).
  7. Brown, P. O., Bowerman, B., Varmus, H. E., Bishop, J. M. Retroviral integration: structure of the initial covalent product and its precursor, and a role for the viral IN protein. Proc. Natl. Acad. Sci. USA. 86, 2525-2529 (1989).
  8. Pauza, C. D. Two bases are deleted from the termini of HIV-1 linear DNA during integrative recombination. Virology. 179, 886-889 (1990).
  9. Bowerman, B., Brown, P. O., Bishop, J. M., Varmus, H. E. A nucleoprotein complex mediates the integration of retroviral DNA. Genes Dev. 3, 469-478 (1989).
  10. Bukrinsky, M. I., et al. Active nuclear import of human immunodeficiency virus type 1 preintegration complexes. Proc. Natl. Acad. Sci. USA. 89, 6580-6584 (1992).
  11. Miller, M. D., Farnet, C. M., Bushman, F. D. Human immunodeficiency virus type 1 preintegration complexes: studies of organization and composition. J. Virol. 71, 5382-5390 (1997).
  12. Engelman, A., Mizuuchi, K., Craigie, R. HIV-1 DNA integration: mechanism of viral DNA cleavage and DNA strand transfer. Cell. 67, 1211-1221 (1991).
  13. Maertens, G. N., Hare, S., Cherepanov, P. The mechanism of retroviral integration from X-ray structures of its key intermediates. Nature. 468, 326-329 (2010).
  14. Holman, A. G., Coffin, J. M. Symmetrical base preferences surrounding HIV-1, avian sarcoma/leukosis virus, and murine leukemia virus integration sites. Proc. Natl. Acad. Sci. USA. 102, 6103-6107 (2005).
  15. Wu, X., Li, Y., Crise, B., Burgess, S. M., Munroe, D. J. Weak palindromic consensus sequences are a common feature found at the integration target sites of many retroviruses. J. Virol. 79, 5211-5214 (2005).
  16. Kvaratskhelia, M., Sharma, A., Larue, R. C., Serrao, E., Engelman, A. Molecular mechanisms of retroviral integration site selection. Nucleic Acids Res. 42, 10209-10225 (2014).
  17. Schroder, A. R., et al. HIV-1 integration in the human genome favors active genes and local hotspots. Cell. 110, 521-529 (2002).
  18. Wu, X., Li, Y., Crise, B., Burgess, S. M. Transcription start regions in the human genome are favored targets for MLV integration. Science. 300, 1749-1751 (2003).
  19. LaFave, M. C., et al. MLV integration site selection is driven by strong enhancers and active promoters. Nucleic Acids Res. 42, 4257-4269 (2014).
  20. De Ravin, S. S., et al. Enhancers are major targets for murine leukemia virus vector integration. J. Virol. 88, 4504-4513 (2014).
  21. Maskell, D. P., et al. Structural basis for retroviral integration into nucleosomes. Nature. 523, 366-369 (2015).
  22. Serrao, E., et al. Integrase residues that determine nucleotide preferences at sites of HIV-1 integration: implications for the mechanism of target DNA binding. Nucleic Acids Res. 42, 5164-5176 (2014).
  23. Aiyer, S., et al. Structural and sequencing analysis of local target DNA recognition by MLV integrase. Nucleic Acids Res. 43, 5647-5663 (2015).
  24. Ciuffi, A., et al. A role for LEDGF/p75 in targeting HIV DNA integration. Nat. Med. 11, 1287-1289 (2005).
  25. Sharma, A., et al. BET proteins promote efficient murine leukemia virus integration at transcription start sites. Proc. Natl. Acad. Sci. USA. 110, 12036-12041 (2013).
  26. Gupta, S. S., et al. Bromo- and extraterminal domain chromatin regulators serve as cofactors for murine leukemia virus integration. J. Virol. 87, 12721-12736 (2013).
  27. De Rijck, J., et al. The BET family of proteins targets moloney murine leukemia virus integration near transcription start sites. Cell Rep. 5, 886-894 (2013).
  28. Demeulemeester, J., et al. HIV-1 integrase variants retarget viral integration and are associated with disease progression in a chronic infection cohort. Cell Host Microbe. 16, 651-662 (2014).
  29. Meehan, A. M., et al. LEDGF/p75 proteins with alternative chromatin tethers are functional HIV-1 cofactors. PLoS Pathog. 5, e1000522 (2009).
  30. Ferris, A. L., et al. Lens epithelium-derived growth factor fusion proteins redirect HIV-1 DNA integration. Proc. Natl. Acad. Sci. USA. 107, 3135-3140 (2010).
  31. Gijsbers, R., et al. LEDGF hybrids efficiently retarget lentiviral integration into heterochromatin. Mol. Ther. 18, 552-560 (2010).
  32. Aiyer, S., et al. Altering murine leukemia virus integration through disruption of the integrase and BET protein family interaction. Nucleic Acids Res. 42, 5917-5928 (2014).
  33. Jahner, D., Jaenisch, R. Integration of Moloney leukaemia virus into the germ line of mice: correlation between site of integration and virus activation. Nature. 287, 456-458 (1980).
  34. Stevens, S. W., Griffith, J. D. Human immunodeficiency virus type 1 may preferentially integrate into chromatin occupied by L1Hs repetitive elements. Proc. Natl. Acad. Sci. USA. 91, 5557-5561 (1994).
  35. Wang, G. P., Ciuffi, A., Leipzig, J., Berry, C. C., Bushman, F. D. HIV integration site selection: analysis by massively parallel pyrosequencing reveals association with epigenetic modifications. Genome Res. 17, 1186-1194 (2007).
  36. Wang, G. P., et al. DNA bar coding and pyrosequencing to analyze adverse events in therapeutic gene transfer. Nucleic Acids Res. 36, e49 (2008).
  37. Roth, S. L., Malani, N., Bushman, F. D. Gammaretroviral integration into nucleosomal target DNA in vivo. J. Virol. 85, 7393-7401 (2011).
  38. Ciuffi, A., Barr, S. D. Identification of HIV integration sites in infected host genomic DNA. Methods. 53, 39-46 (2011).
  39. Gillet, N. A., et al. The host genomic environment of the provirus determines the abundance of HTLV-1-infected T-cell clones. Blood. 117, 3113-3122 (2011).
  40. Matreyek, K. A., et al. Host and viral determinants for MxB restriction of HIV-1 infection. Retrovirology. 11, 90 (2014).
  41. Ciuffi, A., et al. Methods for integration site distribution analyses in animal cell genomes. Methods. 47, 261-268 (2009).
  42. Brady, T., et al. A method to sequence and quantify DNA integration for monitoring outcome in gene therapy. Nucleic Acids Res. 39, e72 (2011).
  43. Beard, B. C., Adair, J. E., Trobridge, G. D., Kiem, H. P. High-throughput genomic mapping of vector integration sites in gene therapy studies. Methods Mol. Biol. 1185, 321-344 (2014).
  44. Page, K. A., Landau, N. R., Littman, D. R. Construction and use of a human immunodeficiency virus vector for analysis of virus infectivity. J. Virol. 64, 5270-5276 (1990).
  45. Emi, N., Friedmann, T., Yee, J. K. Pseudotype formation of murine leukemia virus with the G protein of vesicular stomatitis virus. J. Virol. 65, 1202-1207 (1991).
  46. Wehrly, K., Chesebro, B. p24 antigen capture assay for quantification of human immunodeficiency virus using readily available inexpensive reagents. Methods. 12, 288-293 (1997).
  47. Goff, S., Traktman, P., Baltimore, D. Isolation and properties of Moloney murine leukemia virus mutants: use of a rapid assay for release of virion reverse transcriptase. J. Virol. 38, 239-248 (1981).
  48. Willey, R. L., et al. In vitro mutagenesis identifies a region within the envelope gene of the human immunodeficiency virus that is critical for infectivity. J. Virol. 62, 139-147 (1988).
  49. Butler, S. L., Hansen, M. S., Bushman, F. D. A quantitative assay for HIV DNA integration in vivo. Nat. Med. 7, 631-634 (2001).
  50. Brussel, A., Sonigo, P. Analysis of early human immunodeficiency virus type 1 DNA synthesis by use of a new sensitive assay for quantifying integrated provirus. J. Virol. 77, 10119-10124 (2003).
  51. Serrao, E., Ballandras-Colas, A., Cherepanov, P., Maertens, G. N., Engelman, A. N. Key determinants of target DNA recognition by retroviral intasomes. Retrovirology. 12, 39 (2015).
  52. Maldarelli, F., et al. HIV latency. Specific HIV integration sites are linked to clonal expansion and persistence of infected cells. Science. 345, 179-183 (2014).
  53. Wagner, T. A., et al. HIV latency. Proliferation of cells with HIV integrated into cancer genes contributes to persistent infection. Science. 345, 570-573 (2014).
  54. Cohn, L. B., et al. HIV-1 integration landscape during latent and active infection. Cell. 160, 420-432 (2015).
  55. Li, X., Ben-Dov, I. Z., Mauro, M., Williams, Z. Lowering the quantification limit of the QubitTM RNA HS assay using RNA spike-in. BMC Mol. Biol. 16, 9 (2015).
  56. Padmanaban, A., Walker, D. M. Analysis of high molecular weight genomic DNA using the Agilent 2200 TapeStation and genomic DNA ScreenTape. Publication number 5991-1797EN Agilent Technologies. , Agilent Technologies, Inc. Santa Clara, CA. (2013).
  57. Kapa library quantification technical guide version v1.14. , KapaBiosystems. Boston, MA. (2014).
  58. Kent, W. J. BLAT--the BLAST-like alignment tool. Genome Res. 12, 656-664 (2002).
  59. Quinlan, A. R., Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26, 841-842 (2010).
  60. Gaur, M., Leavitt, A. D. Mutations in the human immunodeficiency virus type 1 integrase D,D(35)E motif do not eliminate provirus formation. J. Virol. 72, 4678-4685 (1998).
  61. Varadarajan, J., McWilliams, M. J., Hughes, S. H. Treatment with suboptimal doses of raltegravir leads to aberrant HIV-1 integrations. Proc. Natl. Acad. Sci. USA. 110, 14747-14752 (2013).
  62. Kent, W. J., et al. The human genome browser at UCSC. Genome Res. 12, 996-1006 (2002).
  63. Berry, C. C., et al. Estimating abundances of retroviral insertion sites from DNA fragment length data. Bioinformatics. 28, 755-762 (2012).
  64. Firouzi, S., et al. Development and validation of a new high-throughput method to investigate the clonality of HTLV-1-infected cells based on provirus integration sites. Genomic Med. 6, 46 (2014).
  65. Mitchell, R. S., et al. Retroviral DNA integration: ASLV, HIV, and MLV show distinct target site preferences. PLoS Biol. 2, E234 (2004).
  66. Schneider, T. D., Stormo, G. D., Gold, L., Ehrenfeucht, A. Information content of binding sites on nucleotide sequences. J. Mol. Biol. 188, 415-431 (1986).
  67. Langmead, B. Chapter 11, Unit 11. 17, Aligning sort sequencing reads with Bowtie. Curr. Protoc. Bioinformatics. , (2010).
  68. LaFave, M. C., Varshney, G. K., Burgess, S. M. GeIST: a pipeline for mapping integrated DNA elements. Bioinformatics. 31, 3219-3221 (2015).
  69. Hocum, J. D., et al. VISA - Vector Integration Site Analysis server: a web-based server to rapidly identify retroviral integration sites from next-generation sequencing. BMC Bioinformatics. 16, 212 (2015).
  70. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15, 1431-1436 (2009).
  71. TruSeq Library Prep Pooling Guide. Guidelines for pooling TruSeq libraries for Illumina sequencing systems that require balanced index combinations. , Source: https://support.illumina.com/downloads/truseq-library-prep-pooling-guide-15042173.html (2015).

Tags

Virology Edição 109 Retrovírus HIV-1 a integração integrase locais de integração a próxima geração de sequenciamento
Amplificação, sequenciamento de próxima geração, e Genomic DNA Mapeamento das retrovirais Integração Sites
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Serrao, E., Cherepanov, P.,More

Serrao, E., Cherepanov, P., Engelman, A. N. Amplification, Next-generation Sequencing, and Genomic DNA Mapping of Retroviral Integration Sites. J. Vis. Exp. (109), e53840, doi:10.3791/53840 (2016).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter