Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Método de Implementação de Retroviral Bidirecional e Metodologia de PCR e Análise Quantitativa de Dados Workflow

Published: June 14, 2017 doi: 10.3791/55812
* These authors contributed equally

Summary

Este manuscrito descreve o procedimento experimental e análise de software para um ensaio de site de integração bidirecional que pode simultaneamente analisar DNA de junção vetor-hospedeiro a montante e a jusante. Os produtos de PCR bidirecionais podem ser usados ​​para qualquer plataforma de seqüência a jusante. Os dados resultantes são úteis para uma comparação quantitativa de alto rendimento de alvos de DNA integrados.

Abstract

Os ensaios do Site de Integração (IS) são um componente crítico do estudo dos sites de integração retroviral e sua importância biológica. Nos recentes estudos de terapia de genes retrovirais, os ensaios de IS, em combinação com a sequenciação da próxima geração, foram utilizados como ferramenta de rastreamento celular para caracterizar as populações de células-tronco clonais que compartilham o mesmo IS. Para a comparação precisa de repetir os clones de células-tronco dentro e entre diferentes amostras, a sensibilidade de detecção, a reprodutibilidade dos dados e a capacidade de alto rendimento do ensaio estão entre as qualidades de ensaio mais importantes. Este trabalho fornece um fluxo de trabalho detalhado de análise de dados e dados para a análise IS bidirecional. O ensaio bidirecional pode simultaneamente seqüenciar junções vetor-host a montante e a jusante. Comparado com as abordagens convencionais de seqüenciamento IS unidirecional, a abordagem bidirecional melhora significativamente as taxas de detecção de IS e a caracterização de eventos de integração em ambas as extremidades de tEle alvo DNA. O encanamento de análise de dados descrito aqui identifica e enumera com precisão as seqüências IS idênticas através de várias etapas de comparação que mapeiam as seqüências IS no genoma de referência e determinam erros de seqüenciamento. Usando um procedimento de ensaio otimizado, publicamos recentemente os padrões de repovoamento detalhados de milhares de clones de células estaminais hematopoiéticas (HSC) após transplante em macacos rhesus, demonstrando pela primeira vez o ponto de tempo preciso do repovoamento de HSC e a heterogeneidade funcional de HSCs no Sistema de primatas. O protocolo a seguir descreve o procedimento experimental passo a passo e fluxo de trabalho de análise de dados que identifica e quantifica precisamente as seqüências IS idênticas.

Introduction

Retroviruses inserem seu DNA genômico no genoma do hospedeiro em vários locais. Esta propriedade única, que pode contribuir para o desenvolvimento de cânceres e outras formas de patogênese viral, tem o benefício irônico de tornar esses vírus altamente acessíveis à engenharia celular para terapia genética e pesquisa de biologia básica. O site de integração viral (IS) - a localização no genoma do hospedeiro onde um DNA estrangeiro (vírus) está integrado - tem implicações importantes para o destino dos vírus integrados e das células hospedeiras. Os ensaios IS foram utilizados em várias configurações de pesquisa biológica e clínica para estudar a seleção do site de integração retroviral e patogênese, desenvolvimento do câncer, biologia das células-tronco e biologia do desenvolvimento 1 , 2 , 3 , 4 . Baixa sensibilidade de detecção, baixa reprodutibilidade de dados e freqüente contaminação cruzada estão entreOs principais fatores que limitam as aplicações dos ensaios IS aos estudos atuais e planejados.

Muitas tecnologias de análise IS foram desenvolvidas. Os ensaios de locais de integração baseados em enzimas de restrição, incluindo a Reação em Cadeia de Polimerase (PCR) 5 , a PCR inversa 6 e o PCR 7 da Medição Lineada por Amplificação (LAM), são os mais amplamente utilizados. O uso de enzimas de restrição específicas do site, no entanto, gera um viés durante a recuperação do IS, permitindo apenas um subconjunto de integromes (um DNA estrangeiro integrado no genoma do hospedeiro) na proximidade do site de restrição a ser recuperado 4 . As tecnologias de ensaio que avaliam mais detalhadamente o vetor IS também foram introduzidas nos últimos anos. Esses ensaios empregam várias estratégias, incluindo o PCR 8 mediado por Transposon, não restritivo (nr) -LAM PCR 9 , enzima de restrição do tipo II-mDigestão editada 10 , cisalhamento mecânico 11 e PCR aleatória baseada em hexâmero (Re-free PCR) 12 , para fragmentar DNAs genômicos e amplificar IS. As tecnologias atuais têm níveis variáveis ​​de sensibilidade de detecção, cobertura de genoma, especificidade de alvo, capacidade de alto rendimento, complexidade de procedimentos de teste e vies na detecção de frequências relativas de sites alvo. Dadas as diferentes qualidades dos ensaios existentes e a variedade de propósitos para os quais eles podem ser usados, a abordagem de ensaio ideal deve ser cuidadosamente selecionada.

Este trabalho fornece procedimentos experimentais detalhados e um fluxo de trabalho de análise de dados computacionais para um ensaio bidirecional que melhora significativamente as taxas de detecção e a precisão da quantificação da seqüência ao analisar simultaneamente o IS a montante e a jusante do DNA alvo integrado (ver Figura 1 para uma visão esquemática dos procedimentos de ensaio ). Esta abordagem também forneceS os meios para caracterizar o processo de integração retroviral (por exemplo, a fidelidade da duplicação do site alvo e as variações nas seqüências genômicas das inserções a montante e a jusante). Outros métodos bidirecionais foram utilizados principalmente para clonagem e seqüenciamento de ambas as extremidades do DNA alvo 11 , 13 , 14 . Este ensaio é amplamente otimizado para a quantificação de alto rendimento e reproduzível de clones marcados por vetores, utilizando o método de LM-PCR bem estabelecido e o mapeamento de análise computacional e para quantificar as junções a montante e a jusante. A análise bidirecional com a enzima TaqαI provou ser útil para quantificação clonal de alto rendimento em estudos pré-clínicos de terapia de células-tronco 2 , 15 . Este artigo descreve um método modificado usando um cortador mais freqüente (RsaI / CviQI - motivo: GTAC) que dobra tAs chances de detectar integromes em comparação com um teste baseado em TaqαI . Procedimentos detalhados de análise experimental e de dados que utilizam as enzimas do motivo GTAC para o lentiviral (NL4.3 e suas derivadas) e as análises do vector IS da gama-retroviral (vetores pMX) são descritas. Os oligonucleótidos utilizados no ensaio estão listados na Tabela 1 . Um script de programação interno para análise de seqüência IS é fornecido no documento suplementar.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Gerando Bibliotecas de Seqüência de Junção (esquerda) e a jusante (direita)

  1. Preparação do linkador de DNA:
    1. Prepare uma solução de ADN de ligação de 10 μL adicionando 2 μL de oligos de LINQUER_A 100 μM (final: 20 μM), 2 μL de oligos de LINQUER_B 100 μM (final: 20 μM), 2 μL de NaCl 5 M (final: 1M) e 4 μL de água livre de nuclease num tubo de PCR. Consulte a Tabela 1 para as sequências do linker.
    2. Incube a solução de DNA do linker a 95 ° C durante 5 minutos em um instrumento de PCR, pare o programa de corrida e desligue o instrumento do PCR. Deixe a solução do linker no instrumento por 30 minutos para esfriar lentamente o DNA do linker. A solução de DNA do linker pode ser armazenada a 4 ° C.
  2. Extensão de iniciador de biotina específica para LTR:
    1. Use um espectrofotômetro UV-Vis para determinar a concentração de DNA e os valores de 260/280 nm do DNA genômico de in vivoOu experiências in vitro . Diluir 1-2 μg de DNA genômico da amostra para um volume final de 170 μL de solução de DNA genômico usando água livre de nuclease.
    2. Prepare uma reação de PCR de 200 μl misturando 2,5 μL de cada 10 μM de iniciadores de biotina específicos de HIV-1 (L-BPs e R-BPs na Tabela 1 : total de 10 μL para quatro iniciadores específicos de lentivírus), 20 μL de termostato 10X Tampão de DNA-polimerase, 4 μL de dNTPs 10 mM (final: 200 μM de cada dNTP), 3 μL de 2,5 U / μL de polimerase de ADN termostável e 163 μL de DNA genômico.
      NOTA: Para os vetores de gammaretroviral (vetores pMX), use 5 μL de cada um dos dois iniciadores de biotina específicos de pMX 10 μM (L-BP e R-BP: total de 10 μL) em vez dos quatro iniciadores de biotina específicos de HIV-1 acima.
    3. Divida a solução em quatro tubos de PCR (cada 50 μL) e realize um único ciclo de extensão sob a seguinte condição: 94 ° C durante 5 min, 56 ° C durante 3 min, 72 ° C por 5Min, e 4 ° C para armazenamento.
    4. Junte todas as quatro reações de PCR em um tubo de microcentrífuga de 2 mL e siga o procedimento de purificação por PCR do kit de purificação por PCR. Eluir com 50 μL de tampão de eluição (tampão de eluição diluído em água 5 vezes fornecido no kit). Proceda imediatamente com o passo 1.3.1 ou armazene o DNA eluído a -20 ° C.
  3. Digestão RsaI e CviQI
    1. Prepare uma reação de digestão de 100 μL adicionando 50 μL de DNA (a partir do passo 1.2.4), 10 μL de 10x de tampão A e 2 μL (20 U) de enzima RsaI. Incubar a 37 ° C por 1 h em um instrumento de PCR.
    2. Adicionar 1 μL (10 U) de enzima CviQI à reação e incubar a 25 ° C durante 30 min em um instrumento de PCR. Proceda imediatamente com o passo 1.4.1
  4. Término complicado:
    1. Prepare uma mistura de 4,5 μL contendo 2,5 μL de fragmento grande de DNA Polymerase I (klenow) e 2 μL de DNTPs 10 mM. Transferência 181; L da mistura para a amostra de DNA da etapa 1.3.2. O volume total será de 102 μL. Misture bem com vortex e incube a 25 ° C durante 1 h em um instrumento de PCR. Proceda imediatamente com o passo 1.6.1.
  5. Preparação de esferas de estreptavidina:
    1. Responda brevemente a solução de pérolas de estreptavidina e transfira 50 μL para um novo tubo de microcentrífuga de 2 mL. Remova o sobrenadante usando o suporte magnético e lave as contas com 200 μL de solução de ligação.
    2. Ressuspender as contas em 100 μL de solução de ligação e colocar o tubo longe do suporte magnético. Proceda imediatamente com o passo 1.6.1.
  6. Ligação de grânulos de estreptavidina:
    1. Transfira 100 μL de amostra de DNA (passo 1.4.1) para a solução de grânulos re-suspenso de 100 μl (passo 1.5.2) e misture cuidadosamente por pipetagem para evitar qualquer formação de espuma da solução. Incubar o tubo à temperatura ambiente durante 3 h em uma roda rotativa ou rolo.
    2. Use o suporte magnético para capturar as contas e descarte o sobrenadante. Lavar as contas duas vezes em 400 μL de solução de lavagem e duas vezes em 400 μL de tampão de ligase de DNA 1x T4 (diluído a partir de solução 10X usando água isenta de nuclease).
    3. Ressuspender as contas em 200 μL de 1x T4 DNA ligase tampão (diluído a partir de solução 10X com água livre de nuclease) e colocá-lo longe do suporte magnético. Proceda imediatamente com o passo 1.7.1.
  7. Ligação ligante:
    1. Prepare uma solução de reação de ligadura de 400 μL em um tubo de microcentrífuga de 2 mL, misturando 0,5 μL do agente de ligação de DNA (etapa 1.1.2), 10 μL de tampão de ADN-ligase T4 de 10x, 20 μL de tampão de ADN-ligase T4 5X (contendo 25% de polietileno Glicol), 5 μL de T4 DNA ligase, 164,5 μL de água isenta de nuclease e 200 μL das esferas re-suspensas (etapa 1.6.3). Coloque o tubo de reação na roda rotativa e incube à temperatura ambiente (22 ° C) durante 3 h (ou 16 ° CO / N). Lave as contas duas vezes com a solução de lavagem e duas vezes com tampão de DNA polimerase termostável 1X (diluído a partir de solução 10x usando água livre de nuclease) usando o suporte magnético.
    2. Ressuspender as contas em 50 μL de 1x tampão de PCR termostático de DNA polimerase e mantê-la afastada do suporte magnético. Proceda imediatamente com o passo 1.8.1 ou armazene a 4 ° C por até um dia.
  8. Pré-amplificação do DNA da junção esquerda e direita:
    1. Preparar uma reação de PCR de 200 μL adicionando 10 μL de iniciador 1L 10 μM, 10 μL de iniciador 1R 10 μM, 20 μL de Primer 1 de 10 μM (Tabela 1), 10 μL de tampão de DNA-polimerização termostável 10X, 4 μL de DNTPs 10 mM (final: 200 μM de cada dNTP), 8 μL (20 U) de polimerase de ADN termostável e 88 μL de água livre de nuclease para as pérolas ressurcidas (50 μL) do passo 1.7.3.
    2. Alíquota a mistura de reação em 4 tubos de PCR (cada 501; L) e realizar PCR com a seguinte condição: 94 ° C de incubação durante 2 min; 25 ciclos de 94 ° C durante 20 s, 56 ° C durante 25 s e 72 ° C durante 2 min; E uma extensão final a 72 ° C durante 5 min.
    3. Junte todas as 4 reações de PCR em um tubo de microcentrífuga de 2 mL e siga o procedimento de purificação por PCR do kit de purificação por PCR. Eluir com 50 μL de tampão de eluição.
    4. Determine a concentração de DNA e os valores de 260/280 nm usando um espectrofotômetro UV-Vis; O DNA pode ser armazenado a -20 ° C até estar pronto para o próximo passo. Prossiga com as etapas 1.9.1 / 1.10.1 (opcional) ou diretamente com as etapas 1.11.1 / 1.12.1.
  9. Removendo o amplicão de DNA interno do lado esquerdo (opcional):
    1. Transfira até 100 ng de produto de PCR DNA do passo 1.8.4 para um tubo de microcentrífuga de 2 mL e ajuste o volume para 10 μL usando água livre de nuclease.
    2. Prepare uma reação enzimática de restrição direcionada especificamente ao lado interno do lado interno DNA amplicon.
      NOTA: A condição da reação pode variar dependendo da escolha da enzima. Por exemplo, ao remover o DNA interno do lado esquerdo de vetores lentivirais baseados em NL4.3, adicione 1 μL de pvuII , 2 μL de tampão B e 7 μL de água livre de nuclease. Incubar a 37 ° C por 1 h em um instrumento de PCR. Proceda imediatamente com o passo 1.11.1 ou armazene a -20 ° C.
  10. Removendo o amplicão de DNA interno do lado direito (opcional):
    1. Proceda da mesma forma que no passo 1.9.1.
    2. Prepare uma reação enzimática de restrição direcionada especificamente ao amplicão de DNA interno do lado direito.
      NOTA: Por exemplo, ao remover o DNA interno do lado direito dos vetores lentivirais baseados em NL4.3, adicione 1 μL de sfoI , 2 μL de tampão B e 7 μL de água livre de nuclease. Incubar a 37 ° C por 1 h em um instrumento de PCR. Proceda imediatamente com o passo 1.12.1 ou armazene a -20 ° C.
  11. EsquerdaAmplificação específica da função:
    1. Preparar uma reação de PCR de 50 μL misturando 5 μL de DNA a partir do passo 1.8.4 (ou do passo opcional 1.9.2), 5 μL de iniciador 2L 10 μM (final: 1 μM), 5 μL de Primer μ μ μ 1 (Final: 1 μM), 5 μL de 10x tampão de ADN polimerase termostável, 1 μL de dNTP 10 mM (final: 200 μM de cada dNTP), 2 μL (5 U) de polimerase de ADN termoestável e 27 μL de isento de nuclease agua.
    2. Realize o PCR com a seguinte condição: incubação a 94 ° C durante 3 min; 8-15 ciclos de 94 ° C durante 20 s, 56 ° C durante 25 s e 72 ° C durante 2 min; E uma extensão final a 72 ° C durante 5 min.
      NOTA: O DNA amplificado pode ser armazenado a -20 ° C. * Sugestão de otimização do número de ciclos.
    3. Siga o procedimento de purificação por PCR do kit de purificação por PCR. Eluir com 50 μL de tampão de eluição. Determine a concentração de DNA e os valores de 260/280 nm.
  12. Todos os procedimentos são idênticos à "Amplificação específica da junção esquerda" (passos 1.11.1-1.11.3), exceto pelo uso de diferentes iniciadores; Use o iniciador específico da junção direita (2R-primer, veja a Tabela 1 ) nesta etapa.
  • Teste de variação do comprimento do amplicão PCR:
    1. Analise as variações do comprimento do amplicão de PCR realizando eletroforese em gel de agarose a 2% ou eletroforese capilar ( Figura 2 ).
      NOTA: Este é um passo essencial para confirmar a conclusão dos procedimentos de ensaio e para fazer uma avaliação aproximada dos padrões IS com base nos padrões de banda de PCR. O amplicão de PCR purificado das etapas 1.11.3 e 1.12.3 pode ser usado para várias plataformas de seqüenciamento de DNA. Proceda com os procedimentos adequados de preparação da amostra para o seqüenciamento clássico da terminação da cadeia (Sanger) ou seqüenciamento da próxima geração. O DNA pode ser armazenado a -20 °C;
  • 2. Análise de Seqüência de Computação IS

    1. Preparação de arquivos de dados:
      1. Prepare três arquivos de dados de entrada: um arquivo de dados de seqüência de formato fasta (Test_data.fa em dados suplementares), um arquivo tsv para os motivos de pesquisa para seqüências de vetores e conectores (Demultiplexing_Trimming_blunt_GTAC.tsv em dados suplementares) e um arquivo tsv para informações de enzimas de restrição (Enzyme.tsv em dados suplementares).
        NOTA: Estes arquivos são necessários para demultiplexação, corte de sequências de vetores e de vinculadores e remoção de seqüências vetoriais internas ( Figura 3A ). Instruções detalhadas passo a passo para implementar o fluxo de trabalho computacional são fornecidas no arquivo README.txt nos dados suplementares.
    2. Análise computacional:
      1. Execute demultiplexação e corte de scripts.
        NOTA: A seqüência em bruto será processada para demultiplexação e para o trimminG das sequências de vetor, linker e primer (veja STEP-1 no arquivo README.txt suplementar).
      2. Execute o comando de mapeamento (veja STEP-2 no arquivo README.txt) para mapear as seqüências processadas para o genoma de referência usando uma ferramenta de alinhamento semelhante a BLAST (BLAT; www.genome.ucsc.edu).
      3. Execute o script de análise IS quantitativo (consulte o STEP-3 no arquivo README.txt).
        NOTA: Dois arquivos de saída (Initial_count_without_homopolymer_correction.txt e Final_count.txt) serão gerados. Mais detalhes sobre mapeamento e estratégias de enumeração de seqüência podem ser encontrados no "arquivo README.txt nos dados suplementares e nas publicações anteriores 2 , 15 .

    Subscription Required. Please recommend JoVE to your librarian.

    Representative Results

    O ensaio IS bidirecional gerou diferentes tamanhos de amplicões de PCR para as junções de hospedeiros vetoriais a montante (esquerda) e a jusante (direita) ( Figura 2 ). O tamanho de um amplicon de PCR depende da localização do motivo GTAC mais próximo a montante e a jusante de um integrome. O ensaio também produziu amplicões internos de PCR de DNA: seqüências retrovirais perto do trato de polipurina e o local de ligação do iniciador foram amplificados concomitantemente durante a PCR de junção esquerda e direita, respectivamente. As bandas de amplicão de PCR podem ser visualizadas por eletroforese capilar ou de agarose (2%).

    Após a seqüenciamento, as seqüências de junção esquerda e direita foram analisadas por um script de programação interno para pré-processamento de seqüências em bruto (incluindo demultiplexação e corte de vetor e DNA de ligação), mapeando as seqüências IS no genoma, identificando e contando IS idênticosSequências e aplicação de procedimentos de correção de erros ( Figura 3 ). Os locais do fim 5 'das seqüências de consulta no genoma de referência são considerados IS e são usados ​​para a contagem inicial de cada IS. Os critérios que determinam as duas seqüências de correspondência - as seqüências de junção a montante (esquerda) e a jusante (direita) originadas a partir do mesmo integrome - são baseados nos padrões de sequência de nucleótidos da integração conjunta específica do retrovírus e são os seguintes: (i) Duas seqüências de junção Alinhar no genoma nas orientações opostas. (Ii) O IS das duas sequências de junção é separado por uma sobreposição de 5 pb para vírus do vírus da imunodeficiência humana (HIV) e uma sobreposição de 4 pb para vírus do vírus da leucemia murina (MLV). Os primeiros 5 pb das duas junções de HIV e 4 pb de junções MLV são complementares ao reverso.

    As contagens de seqüências IS são determinadas em três etapas: (1) mapeando as seqüências IS no genomaUsando BLAT, que gera a qualidade do mapeamento e separa as seqüências IS individuais em grupos "single-hit", "multi-hit", "no hit" e "outros"; (2) usando a Ferramenta de Pesquisa de Alinhamento Local Básico (BLAST) para comparar seqüências de sucesso único com outras seqüências subópticamente mapeadas, incluindo multi-hits, no-hits e outros; E (3) identificar e corrigir erros de seqüenciamento, incluindo erros de homopolímero. As sequências multi-hit são sequências IS que podem alinhar duas ou mais posições genômicas com um alto índice de mapeamento. Embora ainda sejam úteis para identificar e quantificar populações clonais, as sequências multi-hit não podem ser usadas para caracterizar os padrões de distribuição do site de integração genômica (por exemplo, associação com genes, repetições ou outros caracteres genômicos). Em alguns casos raros, as duas seqüências de junção apresentam diferentes qualidades de mapeamento. Por exemplo, um mostra "single-hit", enquanto a seqüência de correspondência mostra "multi-hit". Nesses casos, ambosAs sequências são tratadas como seqüências "single-hit".

    Uma porção de sequências IS com escores de mapeamento sub-ótimos, mostrando alta proporção de genoma (identidade) com um tamanho de consulta anormal (QSIZE), ou vice-versa, foram separadas de "no-hits" e agrupadas em "outros" por um adicional e muitas vezes Reavaliação manual. Por exemplo, ao usar o BLAT para o mapeamento do genoma, algumas seqüências de IS podem mostrar QSIZE anormal devido a nucleotídeos com falta de correspondência no primeiro ou no último 5-10 nucleótidos. Essas seqüências muitas vezes não atendem aos critérios de mapeamento para o status de "single-hit" ou "multi-hit", apesar de ter um resultado de mapeamento de qualidade relativamente alta.

    Uma amostra de arquivo de dados de sequência bruta (Test_DATA.fa: 33,374 seqüências) e arquivos de dados de saída de amostra são fornecidos como dados suplementares. 1 μg de DNA genômico de células de repovoamento humano, transduzido com emprestado Os vetores iviral (FG12) em um mouse 17 humanizado de medula óssea / fígado / timo (BLT) foram analisados ​​usando o ensaio bidirecional. Retroviral IS foi encontrado em todo o genoma. Tipicamente, os vetores lentivirais estão representados em excesso nos genes, enquanto que os vetores gama-retrovirais estão sobre-representados nos locais de início da transcrição 16 ( Figura 4 ). A partir de duas amostras de células repoblantes humanas, um total de 1.081 seqüências - 851 da junção a montante (esquerda) e 230 junções a jusante (direita) - foram qualificadas como seqüências IS. A partir dessas seqüências, identificaram-se 93 IS únicos na esquerda e 50 IS únicos nas junções direitas. Destes, 44 foram identificados em ambas as junções (esquerda e direita), mostrando um total de 99 integromes únicos nas amostras de teste. IS são significativamente enriquecidos em genes (66%, p <0,0001) em comparação com eventos aleatórios ( Figura 4A ).

    As amostras de sequências do site de integração do vetor gama-retrovírus do vetor (pMX) também estão incluídas no arquivo de dados do teste. De uma amostra celular mista de Pmx, transduzida com pMX que expressa Oct4, cMyc, Klf4 e Sox2, 1.611 sequências IS e 129 únicas Foram identificados. Foram identificados 65 e 76 IS únicos nas junções esquerda e direita, respectivamente, 12 em ambas as junções.

    Foi anteriormente demonstrado que os amplicões de PCR de ≥500 pb são mal sequenciados na plataforma de pirosequência, enquanto que os amplicões de PCR de <500 pb são geralmente bem sequenciados, sem um viés notável no que se refere aos comprimentos de sequência 15 . Assim, dados de seqüência de ≥ 500 amixs de PCR de PCR foram excluídos para remover a tendência de sequenciação associada ao comprimento. Somente foram utilizados dados de <500 pb de amplicon de PCR (denominado como vetor quantificável integrome, ou QVI) para análise quantitativa de clonal. As freqüências de detecção relativa de integromes vetoriaisForam calculados usando apenas as contagens de seqüência de junções de IS gerando <ampcolões de PCR de 500 pb ( Figura 4B -4D , também veja a Tabela 2 ). Aproximadamente 77% dos vetores podem ser analisados ​​quantitativamente por esta estratégia ( Figura 4B ). Como resultado, as freqüências calculadas para cada QVI deveriam sobreestimar as freqüências verdadeiras na amostra ( Figura 4E ) em 1.25x.

    figura 1
    Figura 1: uma visão esquemática da análise do site de integração bidirecional. O DNA retroviral de cadeia dupla (preto e vermelho) flanqueado por DNA celular (azul) é mostrado. As setas representam iniciadores de oligonucleótidos, e as setas com um asterisco representam iniciadores de biotina. DNA Linker são indicados por linhas roxas. Resumidamente, uma extensão linear da esquerdaOs iniciadores de biotina (L-BP) e os iniciadores de biotina direita (R-BP) a partir da Repetição do Terminal Longo viral (LTR) geram DNA IS de duas cadeias biotiniladas. Após a digestão com CviQI e RsaI, o ADN de cadeia dupla biotinilado é enriquecido utilizando ligação específica de estreptavidina-biotina e são ligados com ADN de ligação. Os DNAs de junção vetor-hospedeiro ligados-ligados capturados com estreptavidina são amplificados por uma PCR de dois passos: pré-amplificação (amplificação das junções esquerda e direita) seguido de duas PCRs aninhadas, cada uma delas direcionada para as junções esquerda e direita. Clique aqui para ver uma versão maior desta figura.

    Figura 2
    Figura 2: Imagem de amplicão de PCR representativa. ( A ) A análise de eletroforese capilar mostra comprimentos variáveis ​​do amplificador de PCRLicons em vetores lentivirinos (FG12) locais de integração após a digestão pvuII ou sfoI . As bandas de PCR variáveis ​​para junções de hospedagem de vetores a montante (esquerda) e a jusante (direita) são mostradas. As cabeças de seta sombrias indicam os amplicões de DNA do vetor interno remanescentes após a digestão de pvuII ou sfoI. O marcador de tamanho de DNA (0.1 - 2.5 kbp) está na pista M. As cabeças de seta aberta indicam marcadores de alinhamento (15 e 5.000 pb). Os marcadores de alinhamento de DNA são usados ​​para a calibração da variação do tempo de migração em todos os canais. ( B ) Sites de integração do vetor gama-retroviral (pMX) em clones de células murinas transduzidas com múltiplos vetores pMX. Os DNAs de junção esquerda e direita, bem como amplicões de DNA de vetor interno (cabeças de seta), são mostrados. As cabeças da flecha escura e aberta indicam o DNA interno do vetor e os marcadores de alinhamento, respectivamente. O marcador de tamanho de DNA (50-1,500 pb) está na pista M. Detalhes na eletroforese capilar podem ser encontrados na empresaprotocolo. Clique aqui para ver uma versão maior desta figura.

    Figura 3
    Figura 3: Análise de Seqüência de Site de Integração. ( A ) Um fluxograma para análise de dados computacionais. São necessários três arquivos de dados, incluindo um arquivo de seqüência de formato fasta, um arquivo com motivos de seqüência de referência para demultiplexação e recorte, e um arquivo com informações de enzimas de restrição. Os arquivos de exemplo, incluindo Test_DATA.fa (dados de seqüência), Demultiplexing_Trimming.tsv (motivos da sequência de pesquisa) e Enzyme.tsv (seqüência de reconhecimento de enzimas de restrição), são fornecidos como arquivos de dados suplementares. As seqüências processadas (sequências do genoma do hospedeiro) da Parte 1 serão mapeadas na referência usando BLAT. Localizações no final 5 'da seqüência de consultaEs no genoma de referência são considerados os sites de integração ( Tabela 2 ). As contagens de seqüência para cada IS são determinadas em três etapas: (1) mapeando seqüências IS no genoma usando BLAT; (2) comparando as seqüências de IS de um único toque (alinhando-se em um site exclusivo do genoma do hospedeiro) com outras sequências que foram subópticamente mapeadas no genoma; E (3) identificar e corrigir erros de seqüenciamento. Mais detalhes sobre mapeamento e estratégias de enumeração de sequências podem ser encontrados em estudos anteriores 2 , 15 . ( BC ) Duas amostras de sequências de DNA de cadeia simples para as junções vetor-host a jusante (B) e a montante (C) são mostradas. Os iniciadores de pirosequência A e B (verde) são utilizados para PCR e sequenciação de gotículas. Os códigos de cores concordam com os da Figura 1 . A sequência de junção a jusante da amostra (B) inclui Primer A (verde), MID (verde), final do vetor U5 (vermelho), genoma do hospedeiro (azul), liNker (roxo) e Primer B (verde). Em um seqüenciamento de DNA misto (a montante e a jusante), o Primer A é usado para seqüenciar as junções a jusante (B) e o iniciador B é usado para seqüenciar as junções a montante. A sequência de junção a montante da amostra (C) inclui Primer B, MID, Vector U3 end, host genome, linker e Primer A. Por favor, clique aqui para ver uma versão maior dessa figura.

    Figura 4
    Figura 4: Exemplo representativo da análise do site de integração bidirecional. ( A ) Integração percentual em repetições de genes (refseq), Alu e LINE 1 (L1) de vetores lentivirais em células de repovoamento de mouse humanizadas (LV-huMice), em comparação com 10.000 eventos de integração aleatória gerados por silico . Os sites de integração são mapeadosPara o genoma humano (hg19). Os sites de integração do LV-huMice são significativamente representados em Genes ( p <0.0001, aproximação do qui-quadrado) ( B ) Análise in silico de 10.000 eventos de integração aleatória. Com uma abordagem unidirecional, aproximadamente 52% dos integromes aleatórios geraram amplicões de PCR de <500 pb, enquanto que com uma abordagem bidirecional, 77% geraram um amplicon de PCR de <500 pb nas junções esquerda ou direita. Os amplicões de PCR com mais de 500 pb são sequencialmente ineficazmente com a plataforma de pirosequência 2 , 15 e, portanto, devem ser excluídos das análises quantitativas de dados. ( C ) Estratégia para quantificação clonal. Cada clone individual compartilha o mesmo vetor integrome (ou IS). As frequências relativas das junções esquerda (x) e direita (y) são combinadas para representar as quantidades relativas das populações clonais (integromes vetoriais quantificáveis ​​ou QVI). Integ Os sites de ração que não possuem um motivo GTAC dentro de 450 pb são desqualificados (dQ) e removidos da análise de quantificação. ( D ) As frequências relativas (em relação a todas as sequências de QVI) de 44 clones de QVI em células de repovoamento de ratos humanizados são mostradas em um esquema de cores (branco a vermelho: 0 a 0,16). ( E ) Sobreestimação esperada de freqüências clonais com análise bidirecional. Com base na análise de integração aleatória in silico 10.000, é esperada uma sobre-estimação de 1,25 vezes ao usar enzimas de motivo GTAC ( RsaI e CviQI ) devido a aproximadamente 20% de clones de dQ. Recomenda-se uma sobre-estimação de 2,56x devido a aproximadamente 60% de clones de dQ ao usar a enzima do motivo TCGA ( TaqαI ). Clique aqui para ver uma versão maior desta figura.

    Oad / 55812 / 55812table1.jpg "/>
    Tabela 1: Oligonucleótidos para Lentiviral e Gamma-retroviral Vector Integration Site Analysis. * 5BioTEG: modificação da biotina no final 5 '. Clique aqui para ver uma versão maior desta tabela.

    mesa 2
    Tabela 2: dados representativos da contagem de seqüência do site de inserção. Clique aqui para ver uma versão maior desta tabela.
    1 Mapa: as sequências do site de integração podem ser mapeadas em uma localização única (single-hit) ou vários loci (multi-hit) do genoma de referência. NA (não disponível): nenhuma seqüência foi detectada.
    2 STRD: orientação da seqüência de consulta no genoma
    3 QLEN: o comprimento da seqüência de consulta
    4 GLEN: o comprimento esperado da sequência do site de integração, calculado com base na distância do motivo GTAC disponível mais próximo no genoma para o site de inserção. GLEN <450 pb são aceitos para análises quantitativas.
    5 Total_Count: contagem total de sequências
    6 Sites de integração são mostrados por um número de cromossomo (CHR) e um número de site para a junção direita (CHR_SITE1) e um número para a junção esquerda (CHR_SITE2). CHR_SITE1 e CHR_SITE2 são separados por 5 píxeles para vetores lentivíricos e 4 pparços para vetores MLV (pMX)
    7 Seqüência conta para a junção direita (R_A) e a junção esquerda da amostra A (L_A); A sequência conta para a junção direita (R_B) e a junção esquerda da amostra B (L_B)
    * Desqualificado (dQ): GLEN ≥450 in silico bp

    Subscription Required. Please recommend JoVE to your librarian.

    Discussion

    O ensaio bidirecional permite a análise simultânea de ambas as sequências de junção de DNA do vetor do vetor a montante (esquerda) e a jusante (direita) e é útil em uma série de aplicações de terapia genética, células-tronco e pesquisa de câncer. O uso de enzimas com motivo GTAC (RsaI e CviQI) e a abordagem de PCR bidirecional melhora significativamente as chances de detectar um integrome (ou uma população clonal) quando comparado aos ensaios baseados em enzimas de TCGA-padrão ( TaqαI ) 2 , 15 e outros Abordagens unidirecionais LM-PCR 5 . O ensaio bidirecional melhora a análise de IS, particularmente nas amostras de DNA limitadas que geralmente surgem em estudos clínicos ou de modelos de pequenos animais.

    As etapas 1.1-1.7 são um passo crítico e devem ser feitas sem atrasos desnecessários. Essas etapas geralmente são feitas em um dia. O teste de enzimas antes destes passos é altamente recomendado. DegrauS 1.9 e 1.10 são opcionais. Essas etapas irão reduzir as seqüências internas do DNA do vetor que são amplamente concomitantes com as sequências IS. A Tabela 1 fornece conjuntos de iniciadores adequados para analisar o IS de vetores de tipo selvagem NL4.3 HIV-1, NL4.3, incluindo FG12 21 e vectores de gammaretroviral baseados em pMX 22 . Dependendo das variações de nucleótidos nas sequências de repetição terminal longa (LTR), o projeto do primer e a abordagem experimental podem precisar de uma modificação adequada.

    O software blat usado para mapeamento é compatível apenas com o formato fasta e não funciona com arquivos fastq. Pode-se converter os arquivos rápidos em fasta usando várias ferramentas de software, como FASTX-Toolkit ou BBTools. Um usuário com conhecimento básico de python pode usar o Biopython para converter os arquivos fastq em fasta para mapeá-los com blat.

    Espera-se que uma parte do IS não seja detectada com o I bidirecionalS e, mesmo que detectado, não se qualificará para a quantificação clonal a jusante. Quando as enzimas do motivo GTAC foram usadas, aproximadamente 23% dos integromes nos dados da sequência gerados pela plataforma pyrosequencing não passaram os critérios de análise para a análise quantitativa da sequência IS ( Figura 4 ). Quando a cobertura abrangente de SI é crítica, por exemplo, no monitoramento de segurança de células geneticamente modificadas em configurações de terapia genética, é aconselhável escolher um ensaio com acesso genômico irrestrito a IS 8 , 9 , 10 , 11 , 12 ou para reanalisar o Mesma amostra com uma combinação diferente ou otimizada de restrictases 4 , 18 .

    IS ensaios com acesso genômico irrestrito, como PCR LAM não restritivo e aproximação de cisalhamento aleatórioOaches 19 , 20 , possuem uma promessa particular para uma análise abrangente de SI. Essas abordagens utilizam tecnologias que são relativamente difíceis de controlar, tornando difícil prever o resultado da fragmentação do DNA genômico e da amplificação de IS. Por outro lado, os ensaios IS que utilizam enzimas de restrição bem caracterizadas têm dois benefícios principais: (1) É relativamente fácil calibrar e otimizar os ensaios, pois os resultados do ensaio são mais previsíveis devido à especificidade da reação enzimática e à disponibilidade de Sequências do genoma de referência. (2) Os dados de seqüência são altamente reprodutíveis uma vez que as condições de ensaio foram otimizadas. O PCR bidirecional com condições otimizadas provou ser útil para quantificação clonal em grande escala e precisa 2 , 15 . Embora apenas uma parcela das populações clonais existentes tenha sido analisada devido ao viés da enzima de restrição, as quantidades de indivíduos Os clones foram medidos com precisão, permitindo assim a determinação precisa das variações do tamanho do clone dentro e entre amostras. Foi gerado um número suficiente de clones para determinar os padrões de comportamento das células-tronco e a heterogeneidade funcional.

    Os amplicões de PCR produzidos a partir deste procedimento de PCR bidirecional são adequados para qualquer plataforma de seqüência a jusante. Devido à alta sensibilidade do ensaio, deve-se ter o máximo cuidado para prevenir a contaminação cruzada através da realização de experimentos em uma sala livre de contaminação. A inclusão de um experimento de controle negativo (sem modelo) é aconselhável para todas as etapas de PCR. Mesmo com a prática mais cuidadosa, a prevenção da contaminação cruzada de amostras para amostras é extremamente difícil. Assim, ao comparar populações clonais de diferentes amostras, é aconselhável empregar um controle de colisão, que remova dados potencialmente contaminados 23 e um corte para clones pouco confiáveis ​​e não confiáveis> 2, a fim de minimizar o ruído do DNA contaminado. A abordagem bidirecional gera dados IS para ambas as extremidades dos integromes, proporcionando assim uma oportunidade adicional para reduzir possíveis erros de detecção falsos positivos.

    Subscription Required. Please recommend JoVE to your librarian.

    Disclosures

    Os autores não têm nada a revelar.

    Acknowledgments

    O financiamento foi fornecido pelos Institutos Nacionais de Subsídios de Saúde R00-HL116234, U19 AI117941 e R56 HL126544; O National Science Foundation Grant DMS-1516675; Fundação Nacional de Pesquisa da Coréia (NRF-2011-0030049, NRF-2014M3C9A3064552); E o programa de iniciativa KRIBB.

    Materials

    Name Company Catalog Number Comments
    Thermostable DNA polymerase Agilent 600424 PicoMaxx Polymerase
    Thermostable DNA polymerase buffer Agilent 600424 PicoMaxx Polymerase buffer
    Deoxynucleotide (dNTP) solution mix New England Biolabs N0447L dNTP solution mix (10 mM each)
    PCR tubes VWR International 53509-304 PCR Strip Tubes With Individual Attached Caps
    2 mL microcentrifuge tube Molecular Bioproducts 3453 microcentrifuge tubes
    PCR purification kit Qiagen 28106
    RsaI  New England Biolabs R0167L restriction enzyme
    CviQI New England Biolabs R0639L restriction enzyme
    Buffer A New England Biolabs B7204S NEB CutSmart buffer
    DNA Polymerase I large (klenow) fragment  New England Biolabs M0210L Blunting
    streptavidin beads solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    Binding Solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    Washing Solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    magnetic stand ThermoFisher 12321D DynaMag™-2 Magnet
    T4 DNA ligase New England Biolabs M0202L T4 DNA ligase
    10X T4 DNA ligase buffer New England Biolabs B0202S T4 DNA ligase reaction buffer
    5X T4 DNA ligase buffer Invitrogen  46300-018 T4 DNA ligase buffer with polyethylene glycol-8000
    UV-Vis spectrophotometer Fisher Scientific S06497 Nanodrop 2000
    pvuII new England Biolabs R0151L restriction enzyme
    sfoI new England Biolabs R0606L restriction enzyme
    Buffer B new England Biolabs B7203S NEB buffer 3.1
    Nuclease free water Integrated DNA Technologies 11-05-01-14
    Capillary electrophoresis Qiagen 9001941 QIAxcel capillary electrophoresis
    Veriti 96-well Fast Thermal Cycler Thermo Fisher Scientific 4375305 PCR Instrument
    Rotating wheel (or Roller) Eppendorf M10534004 Cell Culture Roller Drums
    DNA size marker Qiagen 929559 QX size marker (100 - 2,500 bp)
    DNA size marker Qiagen 929554 QX size marker (50 - 1,500 bp)
    DNA alignment markers Qiagen 929524 QX DNA Alignment Marker
    genomc DNA Not Available Not Available Sample genomc DNA from in vivo or in vitro experiments

    DOWNLOAD MATERIALS LIST

    References

    1. Serrao, E., Engelman, A. N. Sites of Retroviral DNA Integration: From Basic Research to Clinical Applications. Crit. Rev. Biochem. Mol. Bio. 51 (1), 26-42 (2016).
    2. Kim, S., et al. Dynamics of HSPC Repopulation in Nonhuman Primates Revealed by a Decade-Long Clonal-Tracking Study. Cell Stem Cell. 14 (4), 473-485 (2014).
    3. Bushman, F. Retroviral integration and human gene therapy. J. Clin. Invest. 117 (8), 2083-2086 (2007).
    4. Bystrykh, L. V., Verovskaya, E., Zwart, E., Broekhuis, M., de Haan, G. Counting stem cells: methodological constraints. Nat Meth. 9 (6), 567-574 (2012).
    5. Schröder, A., et al. HIV-1 integration in the human genome favors active genes and local hotspots. Cell. 110 (4), 521-529 (2002).
    6. Silver, J., Keerikatte, V. Novel use of polymerase chain reaction to amplify cellular DNA adjacent to an integrated provirus. J. Virol. 64, 3150 (1990).
    7. Schmidt, M., et al. High-resolution insertion-site analysis by linear amplification-mediated PCR (LAM-PCR). Nat. Meth. 4 (12), 1051-1057 (2007).
    8. Brady, T., et al. A method to sequence and quantify DNA integration for monitoring outcome in gene therapy. Nucleic Acids Res. 39 (11), e72 (2011).
    9. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15 (12), 1431-1436 (2009).
    10. Kim, S., Kim, Y., Liang, T., Sinsheimer, J., Chow, S. A high-throughput method for cloning and sequencing human immunodeficiency virus type 1 integration sites. J. Virol. 80 (22), 11313-11321 (2006).
    11. Maldarelli, F., et al. Specific HIV integration sites are linked to clonal expansion and persistence of infected cells. Science. 345 (6193), 179-183 (2014).
    12. Wu, C., et al. High Efficiency Restriction Enzyme-Free Linear Amplification-Mediated Polymerase Chain Reaction Approach for Tracking Lentiviral Integration Sites Does Not Abrogate Retrieval Bias. Hum. Gene. Ther. 24 (1), 38-47 (2013).
    13. Aker, M., Tubb, J., Miller, D. G., Stamatoyannopoulos, G., Emery, D. W. Integration Bias of Gammaretrovirus Vectors following Transduction and Growth of Primary Mouse Hematopoietic Progenitor Cells with and without Selection. Mol. Ther. 14 (2), 226-235 (2006).
    14. Gabriel, R., Kutschera, I., Bartholomae, C. C., von Kalle, C., Schmidt, M. Linear Amplification Mediated PCR; Localization of Genetic Elements and Characterization of Unknown Flanking DNA. J Vis Exp. (88), e51543 (2014).
    15. Kim, S., et al. High-throughput, sensitive quantification of repopulating hematopoietic stem cell clones. J. Virol. 84 (22), 11771-11780 (2010).
    16. Mitchell, R., et al. Retroviral DNA integration: ASLV, HIV, and MLV show distinct target site preferences. PLoS Biol. 2 (8), e234 (2004).
    17. Melkus, M., et al. Humanized mice mount specific adaptive and innate immune responses to EBV and TSST-1. Nat. Med. 12 (11), 1316-1322 (2006).
    18. Bystrykh, L. V. A combinatorial approach to the restriction of a mouse genome. BMC Res Notes. 6, 284 (2013).
    19. Beard, B. C., Adair, J. E., Trobridge, G. D., Kiem, H. -P. High-throughput genomic mapping of vector integration sites in gene therapy studies. Methods Mol Biol. , 321-344 (2014).
    20. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15 (12), 1431-1436 (2009).
    21. Qin, X., An, D., Chen, I., Baltimore, D. Inhibiting HIV-1 infection in human T cells by lentiviral-mediated delivery of small interfering RNA against CCR5. Proc Natl Acad Sci U S A. 100 (1), 183-188 (2003).
    22. Kitamura, T., et al. Retrovirus-mediated gene transfer and expression cloning: powerful tools in functional genomics. Exp. Hematol. 31 (11), 1007-1014 (2003).
    23. Cartier, N., et al. Hematopoietic stem cell gene therapy with a lentiviral vector in X-linked adrenoleukodystrophy. Science. 326 (5954), 818-823 (2009).

    Tags

    Genetics Retrovirus sites de integração sequenciação de próxima geração terapia genética retroviral células-tronco cânceres código de barras celular bioinformática
    Método de Implementação de Retroviral Bidirecional e Metodologia de PCR e Análise Quantitativa de Dados Workflow
    Play Video
    PDF DOI DOWNLOAD MATERIALS LIST

    Cite this Article

    Suryawanshi, G. W., Xu, S., Xie, Y., More

    Suryawanshi, G. W., Xu, S., Xie, Y., Chou, T., Kim, N., Chen, I. S. Y., Kim, S. Bidirectional Retroviral Integration Site PCR Methodology and Quantitative Data Analysis Workflow. J. Vis. Exp. (124), e55812, doi:10.3791/55812 (2017).

    Less
    Copy Citation Download Citation Reprints and Permissions
    View Video

    Get cutting-edge science videos from JoVE sent straight to your inbox every month.

    Waiting X
    Simple Hit Counter