Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Двунаправленная ретровирусная интеграция сайта Методология ПЦР и количественный анализ данных

Published: June 14, 2017 doi: 10.3791/55812
* These authors contributed equally

Summary

В этой рукописи описывается экспериментальная процедура и программный анализ для анализа двунаправленного интеграционного сайта, который может одновременно анализировать ДНК-перекрестный узел вверх и вниз по течению. Двунаправленные продукты ПЦР могут использоваться для любой последующей секвенирующей платформы. Полученные данные полезны для высокопроизводительного количественного сравнения интегрированных целей ДНК.

Abstract

Анализы интеграции (IS) являются критическим компонентом исследования сайтов ретровирусной интеграции и их биологического значения. В недавних исследованиях ретровирусной генной терапии ИСС-анализы в сочетании со последовательностью следующего поколения использовались в качестве инструмента отслеживания клеток для характеристики популяций клоновых стволовых клеток, имеющих один и тот же ИБ. Для точного сравнения репопулирующих клонов стволовых клеток внутри и между разными образцами чувствительность обнаружения, воспроизводимость данных и высокая пропускная способность анализа являются одними из самых важных характеристик анализа. Эта работа обеспечивает подробный рабочий процесс анализа протоколов и данных для двунаправленного анализа ИС. Двунаправленный анализ может одновременно кодировать как переходы, так и нижестоящие узлы-хозяины. По сравнению с обычными однонаправленными подходами секвенирования ИС двунаправленный подход значительно улучшает скорость обнаружения ИБ и характеристику событий интеграции на обоих концах tОн нацеливается на ДНК. Конвейер анализа данных, описанный здесь, точно идентифицирует и перечисляет идентичные последовательности IS посредством нескольких этапов сравнения, которые отображают последовательности IS на эталонный геном и определяют ошибки последовательности. Используя оптимизированную процедуру анализа, мы недавно опубликовали подробные образцы репопуляции тысяч клонов Hematopoietic Stem Cell (HSC) после трансплантации в макаках резуса, впервые демонстрируя точную временную точку репопуляции HSC и функциональную гетерогенность HSCs в Система приматов. В следующем протоколе описывается пошаговая экспериментальная процедура и рабочий процесс анализа данных, который точно идентифицирует и количественно идентифицирует идентичные последовательности IS.

Introduction

Ретровирусы вставляют свою геномную ДНК в геном хозяина в разных местах. Это уникальное свойство, которое может способствовать развитию рака и других форм вирусного патогенеза, имеет ироничную выгоду от того, чтобы эти вирусы были сильно поддаются клеточной инженерии для генной терапии и фундаментальных исследований в области биологии. Вирусный сайт интеграции (IS) - местоположение гена хозяина, в котором интегрирована чужая ДНК (вирус), имеет важные последствия для судьбы как интегрированных вирусов, так и клеток-хозяев. Анализы IS были использованы в различных биологических и клинических исследованиях для изучения селекции и патогенеза сайтов ретровирусной интеграции, развития рака, биологии стволовых клеток и биологии развития 1 , 2 , 3 , 4 . Низкая чувствительность обнаружения, низкая воспроизводимость данных и частое перекрестное загрязнение относятся к числуКлючевые факторы, ограничивающие применение ИСП-анализов для текущих и запланированных исследований.

Разработаны многие технологии анализа IS. Наиболее широко используются анализы сайтов интеграции на основе рестрикционных ферментов, в том числе Linker-Mediated (LM) полимеразная цепная реакция (ПЦР) 5 , обратная ПЦР 6 и ПЦР 7 с линейной амплификацией (LAM). Однако использование сайтов-специфических рестрикционных ферментов создает смещение во время извлечения ИС, позволяя только подмножество интегромов (чужой ДНК, интегрированной в геном хозяина) вблизи рестрикционного сайта, подлежащего восстановлению. 4 . В последние годы также были внедрены аналитические технологии, которые более всесторонне оценивают векторные ИС. Эти анализы используют различные стратегии, в том числе МС-транспозон-опосредованную ПЦР- 8 , нерезистивный (nr) -LAM ПЦР 9 , рестрикционный фермент типа IIПищевое расщепление 10 , механическое срезание 11 и случайную ПЦР (без повторной ПЦР) на основе гексамера 12 , для фрагментации геномных ДНК и амплификации ИС. Современные технологии имеют различные уровни чувствительности обнаружения, охват генома, специфичность мишени, высокую пропускную способность, сложность процедур анализа и предубеждения при определении относительных частот целевых сайтов. Учитывая различные качества существующих анализов и разнообразие целей, для которых они могут быть использованы, следует тщательно подобрать оптимальный подход к анализу.

Эта работа обеспечивает подробные экспериментальные процедуры и рабочий процесс анализа вычислительных данных для двунаправленного анализа, который значительно улучшает скорость обнаружения и точность количественной оценки последовательности, одновременно анализируя ИС вверх и вниз по течению от интегрированной целевой ДНК (см. Рисунок 1 для схематического обзора процедур анализа ). Этот подход также обеспечиваетS - средство для характеристики процесса ретровирусной интеграции (например, верность дублирования целевого сайта и вариации геномных последовательностей восходящих и нисходящих вставок). Другие двунаправленные методы были в основном использованы для клонирования и секвенирования обоих концов ДНК-мишени 11 , 13 , 14 . Этот анализ широко оптимизирован для высокопроизводительной и воспроизводимой количественной оценки векторизованных клонов с использованием хорошо зарекомендовавшего себя метода LM-PCR и картографирования вычислительного анализа, а также для количественного определения обоих восходящих и нисходящих соединений. Двунаправленный анализ с ферментом TaqαI оказался полезным для высокопроизводительной клональной квантификации в доклинических исследованиях генной терапии стволовых клеток 2 , 15 . В этой статье описывается модифицированный метод с использованием более частого резака (RsaI / CviQI - motif: GTAC), который удваивает tОн имеет шансы обнаружить интегромы по сравнению с анализом на основе TaqαI . Описаны подробные процедуры экспериментального анализа и анализа данных, которые используют ферменты мотивации GTAC для лентивирусов (NL4.3 и его производных) и вектора γ-ретровирусных (pMX-векторов). Олигонуклеотиды, используемые в анализе, перечислены в таблице 1 . Внутренний сценарий программирования для анализа последовательности IS представлен в дополнительном документе.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Создание восходящих (левых) и нижестоящих (правых) -функций последовательностных библиотек

  1. Получение ДНК-линкера:
    1. Подготовьте 10 мкл линкерного ДНК-раствора, добавив 2 мкл 100 мкМ олигонов LINKER_A (окончательный: 20 мкМ), 2 мкл 100 мкМ олигонов LINKER_B (окончательный: 20 мкМ), 2 мкл 5 М NaCl (окончательный: 1 М) и 4 мкл свободной от нуклеазы воды в ПЦР-трубке. См. Таблицу 1 для последовательностей компоновщика.
    2. Инкубируйте раствор ДНК-линкера при 95 ° C в течение 5 минут в инструменте ПЦР, остановите программу прогона и выключите питание инструмента ПЦР. Оставьте раствор линкера в приборе в течение 30 мин, чтобы медленно охладить ДНК-линкер. Раствор ДНК-линкера можно хранить при 4 ° С.
  2. LTR-специфическое расширение биотина-праймера:
    1. Используйте спектрофотометр UV-Vis для определения концентрации ДНК и значений 260-280 нм геномной ДНК in vivoИли in vitro . Разбавьте 1-2 мкг образца геномной ДНК до конечного объема 170 мкл раствора геномной ДНК, используя воду без нуклеазы.
    2. Приготовление 200 мкл ПЦР-реакции путем смешивания 2,5 мкл каждого из 10 мкМ ВИЧ-1-специфических праймеров биотина (L-BP и R-BP в таблице 1 : всего 10 мкл для четырех лентивирусспецифических праймеров), 20 мкл 10X термостабильного ДНК-полимеразный буфер, 4 мкл 10 мМ dNTP (окончательный: 200 мкМ каждого dNTP), 3 мкл терморезистентной ДНК-полимеразы 2,5 U / мкл и 163 мкл геномной ДНК.
      ПРИМЕЧАНИЕ. Для гаммаретровирусных векторов (векторы pMX) используют 5 мкл каждого из двух 10 мкМ pMX-специфичных праймеров биотина (L-BP и R-BP: всего 10 мкл) вместо четырех вышеуказанных биотин-праймеров, специфичных для ВИЧ-1.
    3. Разделите раствор на четыре трубки ПЦР (каждые 50 мкл) и выполните один цикл удлинения при следующих условиях: 94 ° C в течение 5 минут, 56 ° C в течение 3 минут, 72 ° C для 5Мин и 4 ° C для хранения.
    4. Объедините все четыре реакции ПЦР в 2 мл микроцентрифужную пробирку и следуйте процедуре очистки ПЦР в наборе для очистки ПЦР. Элюат с 50 мкл элюирующего буфера (5-кратный разбавленный водой буфер элюирования, предусмотренный в комплекте). Немедленно перейдите к шагу 1.3.1 или сохраните элюированную ДНК при -20 ° C.
  3. RsaI и расщепление CviQI
    1. Подготовьте реакцию расщепления 100 мкл, добавив 50 мкл ДНК (из стадии 1.2.4), 10 мкл 10-буфера A и 2 мкл (20 U) фермента RsaI. Инкубируйте при 37 ° C в течение 1 часа в инструменте ПЦР.
    2. Добавьте 1 мкл (10 U) фермента CviQI к реакции и инкубируйте при 25 ° C в течение 30 минут в приборе ПЦР. Немедленно перейдите к шагу 1.4.1
  4. Тупой конец:
    1. Подготовьте 4,5-мкл смесь, содержащую 2,5 мкл большого фрагмента ДНК полимеразы I (klenow) и 2 мкл 10 мМ dNTP. Перенос 181; L смеси к образцу ДНК с этапа 1.3.2. Общий объем составит 102 мкл. Хорошо перемешать путем встряхивания и инкубации при 25 ° C в течение 1 часа в приборе для ПЦР. Немедленно перейдите к шагу 1.6.1.
  5. Получение гранул стрептавидина:
    1. Кратко встряхните раствор стрептавидина и перенесите 50 мкл в новую 2 мл микроцентрифужную пробирку. Удаляют супернатант с помощью магнитной подставки и промывают гранулы 200 мкл связующего раствора.
    2. Повторно суспендируйте шарики в 100 мкл связующего раствора и удалите трубку с магнитной подставки. Немедленно перейдите к шагу 1.6.1.
  6. Связывание стрептавидина:
    1. Перенесите 100 мкл ДНК образца (этап 1.4.1) в 100 мкл повторно суспендированного раствора шарика (шаг 1.5.2) и тщательно перемешайте пипетированием, чтобы избежать вспенивания раствора. Инкубируйте трубку при комнатной температуре в течение 3 часов на вращающемся колесе или валике.
    2. Используйте магнитную подставку для захвата бусинок и выбросьте супернатант. Вымойте гранулы дважды в 400 мкл моющего раствора и дважды в 400 мкл 1х T4 ДНК-лигазного буфера (разбавленный из 10X раствора с использованием воды, свободной от нуклеазы).
    3. Ресуспендируют гранулы в 200 мкл 1x T4 ДНК-лигазного буфера (разбавленного из 10-кратного раствора с использованием воды, свободной от нуклеазы) и помещают ее в сторону от магнитной подставки. Немедленно перейдите к шагу 1.7.1.
  7. Лигирование линкера:
    1. Подготовьте реакционный раствор для липирования объемом 400 мкл в 2 мл микроцентрифужной пробирке путем смешивания 0,5 мкл ДНК-линкера (стадия 1.1.2), 10 мкл 10x T4 ДНК-лигазного буфера, 20 мкл 5X T4 ДНК-лигазного буфера (содержащего 25% полиэтилена Гликоль), 5 мкл ДНК-лигазы Т4, 164,5 мкл свободной от нуклеазы воды и 200 мкл повторно взвешенных гранул (этап 1.6.3). Поместите реакционную трубку на вращающееся колесо и инкубируйте при комнатной температуре (22 ° C) в течение 3 часов (или 16 ° СО / Н). Промывайте гранулы дважды промывочным раствором и дважды с 1X термостабильным ДНК-полимеразным буфером (разбавленным из 10-кратного раствора с использованием воды без нуклеазы) с использованием магнитной подставки.
    2. Ресуспендируют гранулы в 50 мкл 1х термостабильного ДНК-полимеразной ПЦР-буфера и удаляют его с магнитной подставки. Немедленно перейдите к шагу 1.8.1 или храните при температуре 4 ° C в течение одного дня.
  8. Предварительное усиление как левой, так и правой частей ДНК:
    1. Приготовление 200 мкл ПЦР-реакции путем добавления 10 мкл 10 мкМ 1L-праймера, 10 мкл 10 мкМ 1R-праймера, 20 мкл 10 мкМ праймера Link1 (таблица 1), 10 мкл 10X термостабильного ДНК-полимеразного буфера, 4 мкл 10 мМ dNTP (окончательный: 200 мкМ каждого dNTP), 8 мкл (20 U) термостабильной ДНК-полимеразы и 88 мкл свободной от нуклеазы воды к повторно суспендированным шарикам (50 мкл) с этапа 1.7.3.
    2. Аликвоту реакционной смеси в 4 ПЦР-пробирки (каждые 501; L) и проводят ПЦР со следующим условием: инкубация 94 ° C в течение 2 мин; 25 циклов 94 ° С в течение 20 с, 56 ° С в течение 25 с и 72 ° С в течение 2 мин; И конечное удлинение при 72 ° С в течение 5 мин.
    3. Объедините все 4 реакции ПЦР в 2 мл микроцентрифужную пробирку и следуйте процедуре очистки ПЦР в наборе для очистки ПЦР. Элюируйте 50 мкл буфера для элюирования.
    4. Определить концентрацию ДНК и 260/280 нм с помощью спектрофотометра UV-Vis; ДНК можно хранить при -20 ° С до готовности к следующему этапу. Выполните шаги 1.9.1 / 1.10.1 (необязательно) или непосредственно с шагами 1.11.1 / 1.12.1.
  9. Удаление внутреннего ДНК-амплификатора левой стороны (необязательно):
    1. Перенесите до 100 нг ДНК-продукта ПЦР с шага 1.8.4 в 2 мл микроцентрифужную пробирку и отрегулируйте объем до 10 мкл с использованием воды, свободной от нуклеазы.
    2. Подготовьте реакцию рестрикционного фермента, специально ориентированную на левую внутреннюю DNA-ампликон.
      ПРИМЕЧАНИЕ. Условия реакции могут различаться в зависимости от выбора фермента. Например, при удалении левой ДНК левой стороны из лентивирусных векторов на основе NL4.3 добавляют 1 мкл pvuII , 2 мкл буфера B и 7 мкл свободной от нуклеазы воды. Инкубируйте при 37 ° C в течение 1 часа в инструменте ПЦР. Немедленно перейдите к шагу 1.11.1 или храните при -20 ° C.
  10. Удаление правого внутреннего амплификатора ДНК (необязательно):
    1. Выполните то же, что и в шаге 1.9.1.
    2. Подготовьте реакцию рестрикционного фермента, специально предназначенную для правого внутреннего амплификатора ДНК.
      ПРИМЕЧАНИЕ. Например, при удалении внутренней ДНК правой стороны из лентивирусных векторов на основе NL4.3 добавьте 1 мкл sfoI , 2 мкл буфера B и 7 мкл свободной от нуклеазы воды. Инкубируйте при 37 ° C в течение 1 часа в инструменте ПЦР. Немедленно перейдите к шагу 1.12.1 или храните при -20 ° C.
  11. Оставил-специфическое усиление:
    1. Подготовьте 50 мкл ПЦР-реакции путем смешивания 5 мкл ДНК со стадии 1.8.4 (или с необязательной стадии 1.9.2), 5 мкл 10 мкМ 2L-праймера (окончательный: 1 мкМ), 5 мкл 10 мкМ праймера Link2 (Конечный: 1 мкМ), 5 мкл 10х термостабильного ДНК-полимеразного буфера, 1 мкл 10 мМ dNTP (окончательный: 200 мкМ каждого dNTP), 2 мкл (5 U) термостабильной ДНК-полимеразы и 27 мкл нуклеазы воды.
    2. Проведите ПЦР со следующим условием: инкубация 94 ° C в течение 3 мин; 8-15 циклов 94 ° С в течение 20 с, 56 ° С в течение 25 с и 72 ° С в течение 2 мин; И конечное удлинение при 72 ° С в течение 5 мин.
      ПРИМЕЧАНИЕ. Амплифицированную ДНК можно хранить при -20 ° C. * Предлагается оптимизация числа циклов.
    3. Следуйте процедуре очистки ПЦР в наборе для очистки ПЦР. Элюируйте 50 мкл буфера для элюирования. Определите концентрацию ДНК и значения 260/280 нм.
  12. Все процедуры идентичны «усилению по левому краю» (шаги 1.11.1-1.11.3), за исключением использования разных праймеров; Используйте праймер-специфический праймер (2R-праймер, см. Таблицу 1 ) на этом этапе.
  • Тест вариации длины амплификатора ПЦР:
    1. Проанализируйте вариации длины ампликона ПЦР, выполнив 2% -ный электрофорез в агарозном геле или капиллярный электрофорез ( рис. 2 ).
      ПРИМЕЧАНИЕ. Это важный шаг для подтверждения завершения процедур анализа и проведения грубой оценки шаблонов ИС на основе шаблонов полосы ПЦР. Очищенный ПЦР-ампликон из стадий 1.11.3 и 1.12.3 может быть использован для различных платформ секвенирования ДНК. Выполните соответствующие процедуры подготовки образцов для классического секвенирования последовательности (Sanger) или последовательности следующего поколения. ДНК может храниться при -20 °; С.
  • 2. Вычислительный анализ последовательностей ИС

    1. Подготовка файлов данных:
      1. Подготовьте три файла входных данных: файл данных последовательности fasta (Test_data.fa в дополнительных данных), файл tsv для поисковых мотивов для векторных и линкерных последовательностей (Demultiplexing_Trimming_blunt_GTAC.tsv в дополнительных данных) и файл tsv для информации о рестрикционных ферментах (Enzyme.tsv в дополнительных данных).
        ПРИМЕЧАНИЕ. Эти файлы необходимы для демультиплексирования, обрезки векторных и линкерных последовательностей и удаления внутренних векторных последовательностей ( рисунок 3A ). Подробные пошаговые инструкции для выполнения вычислительного рабочего процесса содержатся в файле README.txt в дополнительных данных.
    2. Вычислительный анализ:
      1. Запустите сценарии демультиплексирования и обрезки.
        ПРИМЕЧАНИЕ. Необработанная последовательность будет обработана для демультиплексирования и для тримминкаG векторных, линкерных и праймерных последовательностей (см. STEP-1 в дополнительном файле README.txt).
      2. Запустите команду сопоставления (см. STEP-2 в файле README.txt), чтобы отобразить обработанные последовательности в эталонный геном, используя инструмент выравнивания BLAST (BLAT; www.genome.ucsc.edu).
      3. Запустите количественный сценарий анализа IS (см. STEP-3 в файле README.txt).
        ПРИМЕЧАНИЕ. Создаются два выходных файла (Initial_count_without_homopolymer_correction.txt и Final_count.txt). Более подробные сведения о сопоставлении и стратегии перечисления последовательностей можно найти в файле README.txt в дополнительных данных и в предыдущих публикациях 2 , 15 .

    Subscription Required. Please recommend JoVE to your librarian.

    Representative Results

    Двунаправленный анализ ИС генерировал различные размеры ПЦР-ампликонов как для восходящих (левых), так и для нисходящих (правых) хостов-узлов ( рис. 2 ). Размер ПЦР-ампликона зависит от местоположения ближайшего моста GTAC вверх и вниз от интегрома. Анализ также продуцировал внутренние ДНК-ПЦР-ампликоны: ретровирусные последовательности вблизи полипуринового тракта и сайт связывания праймера были последовательно амплифицированы в ходе ПЦР левого и правого каналов соответственно. ПЦР-ампликонные полосы можно визуализировать с помощью капиллярного или агарозного (2%) электрофореза.

    После секвенирования последовательности левого и правого стыков анализировали с помощью собственного сценария программирования для предварительной обработки необработанных последовательностей (включая демультиплексирование и обрезку вектора и линкерной ДНК), отображение последовательностей ИС в геноме, идентификацию и подсчет идентичных ISПоследовательности и применения процедур коррекции ошибок ( рисунок 3 ). Местоположения 5'-конца последовательностей запросов в эталонном геноме считаются ИС и используются для начального подсчета каждого ИС. Критерии, определяющие две согласованные последовательности: восходящие (левые) и нижестоящие (правые) последовательности переходов, происходящие из одного и того же интегрома, основаны на шаблонах нуклеотидных последовательностей согласованной интеграции с ретровирусом и являются следующими: (i) Две последовательности последовательностей Выровнять по геном в противоположных ориентациях. (Ii) ИС двух последовательностей соединения разделяют перекрытием 5-bp для векторов вируса иммунодефицита человека (ВИЧ) и перекрытием 4-bp для векторов вируса лейкоза мыши (MLV). Первые 5 п.н. двух перекрестков ВИЧ и 4 п.о. MLV-переходов обратно дополняют друг друга.

    Последовательность IS-последовательностей определяется в три этапа: (1) отображение IS-последовательностей на геномИспользуя BLAT, который генерирует качество отображения и разделяет отдельные последовательности IS в группы с одним ударом, «с несколькими ударами», «без удара» и «другие»; (2) с помощью основного инструмента поиска локального выравнивания (BLAST) для сравнения последовательностей с одним ударом с другими субоптимально отображенными последовательностями, включая множественные удары, без хитов и другие; И (3) выявление и исправление ошибок последовательности, включая ошибки гомополимера. Последовательности с несколькими ударами представляют собой последовательности ИБ, которые могут выровнять две или более геномных позиций с высоким показателем сопоставления. Хотя они еще полезны для идентификации и количественного определения популяций клона, последовательности с несколькими ударами не могут использоваться для характеристики геномных схем распределения сайтов интеграции (например, ассоциация с генами, повторами или другими геномными символами). В некоторых редких случаях две последовательности переходов показывают разные качества отображения. Например, один показывает «single-hit», в то время как последовательность совпадений показывает «multi-hit». В таких случаях обаПоследовательности рассматриваются как последовательности с одним ударом.

    Часть IS-последовательностей с субоптимальными показателями отображения, показывающая высокое процентное соответствие генома (идентичность) с аномальным размером запроса (QSIZE) или наоборот, была отделена от «no-hits» и сгруппирована в «другие» для дополнительного и часто Ручная переоценка. Например, при использовании BLAT для картирования генома некоторые IS-последовательности могут отображать ненормальный QSIZE из-за нулевых нуклеотидов, совпадающих с ошибками, в первом или последнем 5-10 нуклеотидах. Эти последовательности часто не соответствуют критериям сопоставления для статуса «с одним ударом» или «с несколькими ударами», несмотря на наличие относительно качественного результата сопоставления.

    В качестве дополнительных данных предоставляется пример файла данных необработанной последовательности (Test_DATA.fa: 33374 последовательностей) и файлы выходных данных образца. 1 мкг геномной ДНК из человеческих репопуляционных клеток, трансдуцированных с помощью ссуды (FG12) в мышином костном мозге / печени / тимусе (BLT) 17 , анализировали с использованием двунаправленного анализа. Retroviral IS были обнаружены во всем геноме. Как правило, лентивирусные векторы чрезмерно представлены в генах, тогда как гамма-ретровирусные векторы перепредставлены в местах начала транскрипции 16 ( фиг. 4 ). Из двух образцов человеческих репопуляционных клеток в общей сложности 1081 последовательность-851 из восходящего (левого) и 230 нисходящего (правого) переходов были квалифицированы как последовательности ИБ. Из этих последовательностей было идентифицировано 93 уникальных ИС в левой и 50 уникальных ИС в правых узлах. Из них 44 были идентифицированы в обоих (левом и правом) соединениях, и в тестовых образцах было обнаружено 99 уникальных интегромов. IS значительно обогащены генами (66%, p <0,0001) по сравнению с случайными событиями ( рисунок 4A ).

    «> Примерные последовательности сайтов интеграции гамма-ретровирусов (pMX) также включены в файл данных испытаний. Из смешанного образца ячейки Pmx, сконструированного с использованием pMX, выражающего Oct4, cMyc, Klf4 и Sox2, 1611 IS-последовательностей и 129 уникальных IS идентифицированы. Из 65 и 76 уникальных ИС, идентифицированных в левом и правом перекрестках, соответственно, 12 были в обоих перекрестках.

    Ранее было показано, что ПЦР-ампликоны ≥500 п.о. плохо секвенированы на платформе пиросеквенирования, тогда как ампликоны ПЦР <500 п.о., как правило, хорошо секвенированы без заметного смещения относительно длины последовательности 15 . Таким образом, данные последовательности из ПЦР-ампликонов ≥ 500 пар оснований были исключены для устранения смещения последовательности, связанного с длиной. Для количественного клонального анализа использовались только данные из 500 мкг ПЦР-ампликона (называемого квантифицируемым векторным интегромом или QVI). Относительные частоты обнаружения векторных интегромовБыли рассчитаны с использованием только количества последовательностей IS-переходов, генерирующих амплификаторы ПЦР 500pp ( рис. 4B -4D , также см. Таблицу 2 ). Приблизительно 77% векторов можно количественно проанализировать с помощью этой стратегии ( рис. 4B ). В результате ожидается, что рассчитанные частоты для каждого QVI будут переоценивать истинные частоты в образце ( рис. 4Е ) на 1,25x.

    Рисунок 1
    Рисунок 1: Схематический вид анализа двунаправленного интеграционного сайта. Показана двухцепочечная ретровирусная ДНК (черная и красная), фланкированная клеточной ДНК (синяя). Стрелки представляют собой олигонуклеотидные праймеры, а стрелки со звездочкой представляют собой праймеры биотина. ДНК-линкера обозначают фиолетовыми линиями. Вкратце, линейное расширение слеваПраймеры биотина (L-BP) и правые праймеры биотина (R-BP) из вирусного длинного терминального повтора (LTR) генерируют биотинилированную двухцепочечную ДНК IS. После переваривания с помощью CviQI и RsaI биотинилированную двухцепочечную ДНК обогащают с использованием связывания стрептавидин-биотин и лигируют с линкерной ДНК. Стрептавидин-захваченные линкер-лигированные ДНК-связывающие ДНК-хозяина амплифицируют с помощью двухступенчатой ​​ПЦР-предварительной амплификации (усиления как левого, так и правого переходов), за которой следуют две вложенные ПЦР, каждая из которых нацелена на левое и правое переходы. Нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

    фигура 2
    Рисунок 2: Репрезентативное изображение ампликона ПЦР. ( A ) Анализ капиллярного электрофореза показывает различную длину ПЦР-усилителяЛиконов в лентивирусных векторных (FG12) сайтах интеграции после pvuII или sfoI переваривания . Показаны различные диапазоны ПЦР для восходящих (левых) и нисходящих (правых) узлов узла. Темные стрелочные головы указывают на наличие внутренних векторных ДНК-ампликонов, оставшихся после расщепления pvuII или sfoI. Маркер размера ДНК (0,1 - 2,5 кбит) находится на М-полосе. Открытые стрелочные головки указывают маркеры выравнивания (15 и 5000 пар оснований). Маркеры выравнивания ДНК используются для калибровки изменения времени миграции по всем каналам. ( B ) Гамма-ретровирусные (pMX) сайты векторной интеграции в клонах мышиных клеток, трансдуцированные с несколькими векторами pMX. Показаны ДНК слева и справа, а также внутренние векторные ДНК-ампликоны (головки стрелок). Темные и открытые стрелочные головки обозначают внутренние векторные ДНК и маркеры выравнивания соответственно. Маркер размера ДНК (50-1,500 п.н.) находится на М-полосе. Подробности о капиллярном электрофорезе можно найти в компаниипротокол. Нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

    Рисунок 3
    Рисунок 3: Анализ последовательности узлов интеграции. ( A ) Блок-схема для анализа вычислительных данных. Требуются три файла данных, включая файл последовательности fasta, файл с мотивами последовательности ссылок для демультиплексирования и обрезки, а также файл с информацией о рестрикционных ферментах. В качестве дополнительных файлов данных представлены примеры файлов, включая Test_DATA.fa (данные последовательности), Demultiplexing_Trimming.tsv (мотивы последовательности поиска) и Enzyme.tsv (последовательность распознавания рестрикционного фермента). Обработанные последовательности (последовательности хозяин-геном) из части 1 будут сопоставлены с ссылкой с использованием BLAT. Расположение на 5'-конце секвенции запросаEs в эталонном геноме считаются сайтами интеграции ( табл. 2 ). Количество последовательностей для каждого ИС определяется тремя шагами: (1) сопоставление последовательностей ИС с геномом с использованием BLAT; (2) сравнение однократных IS-последовательностей (выравнивание на уникальный сайт гена хозяина) с другими последовательностями, которые были субоптимально отображены на геном; И (3) выявление и исправление ошибок последовательности. Более подробную информацию о картографировании и схемах перечисления последовательностей можно найти в предыдущих исследованиях 2 , 15 . ( BC ) Показаны две примерные одноцепочечные последовательности ДНК для нисходящих (B) и восходящих (C) переходов между вектором и хозяином. Пиросеквенирующие праймеры A и B (зеленый) используются для капельной ПЦР и секвенирования. Цветовые коды согласуются с цветовыми кодами, показанными на рисунке 1 . Последовательность (B) последовательности нисходящего потока включает праймер A (зеленый), MID (зеленый), векторный U5 конец (красный), геном хозяина (синий), liNker (фиолетовый) и Primer B (зеленый). В смешанном (вверх и вниз) секвенировании ДНК Primer A используется для секвенирования нисходящих соединений (B), а Primer B используется для секвенирования восходящих соединений. Примерная последовательность (C) восходящего потока включает в себя праймер B, MID, векторный U3 конец, геном хозяина, компоновщик и Primer A. Пожалуйста , нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

    Рисунок 4
    Рисунок 4: Репрезентативный пример анализа сайта двунаправленной интеграции. ( A ) Процентная интеграция в генах (refseq), Alu и LINE 1 (L1) повторения лентивирусных векторов в гуманизированных клетках-реципиентах мыши (LV-huMice) по сравнению с силико-генерируемыми 10000 случайными событиями интеграции. Интегрированные сайты сопоставленыНа человеческий геном (hg19). Объекты интеграции LV-huMice значительно превосходят представленные гены ( p <0,0001, хи-квадратное приближение) ( B ) В силиковом анализе 10 000 событий случайной интеграции. При однонаправленном подходе примерно 52% случайных интегромов генерировали ПЦР-ампликоны <500 б.п., тогда как при двунаправленном подходе 77% генерировали ПЦР-ампликон <500 б.п. в левом или правом перекрестках. ПЦР-ампликоны длиной более 500 п.н. неэффективно секвенированы с помощью пиросеквенирующего пласта для 2 , 15 и поэтому должны исключаться из анализа количественных данных. ( C ) Стратегия количественной количественной оценки. Каждый отдельный клон имеет один и тот же векторный интегром (или IS). Относительные частоты левого (x) и правого (y) -переходов объединяются для представления относительных величин клональных популяций (количественных векторных интегромов или QVI). Integ Сайты рациона, которые не имеют мотива GTAC в пределах 450 bp, дисквалифицированы (dQ) и удалены из анализа количественной оценки. ( D ) Относительные частоты (относительно всех последовательностей QVI) из 44 QVI-клонов у гуманизированных мышей, повторно заполняющих клетки, показаны в цветовой схеме (от белого до красного: от 0 до 0,16). ( E ) Ожидаемая переоценка клональных частот с двунаправленным анализом. Основываясь на анализе случайной интеграции Silico 10000, ожидается, что при использовании GTF-мотирующих ферментов ( RsaI и CviQI ) ожидается чрезмерная оценка в 1,25 раза из-за примерно 20% dQ-клонов. Ожидается, что чрезмерная оценка 2.56x будет вызвана примерно 60% dQ-клонами при использовании фермента- мозаики TCGA ( TaqαI ). Нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

    Oad / 55812 / 55812table1.jpg "/>
    Таблица 1: Олигонуклеотиды для анализа лентивиральной и гамма-ретровирусной векторной интеграции. * 5BioTEG: модификация биотина на 5'-конце. Нажмите здесь, чтобы просмотреть большую версию этой таблицы.

    Таблица 2
    Таблица 2: Данные счетчика последовательных данных вставки. Нажмите здесь, чтобы просмотреть большую версию этой таблицы.
    1 Карта: последовательности сайтов интеграции могут быть сопоставлены с уникальным местоположением (с одним ударом) или с несколькими локусами (с несколькими ударами) эталонного генома. NA (недоступно): последовательность не обнаружена.
    2 STRD: ориентация последовательности запросов в геноме
    3 QLEN: длина последовательности запросов
    4 GLEN: ожидаемая длина последовательности сайта интеграции, рассчитанная на основе расстояния от ближайшего доступного моста GTAC в геноме до места вставки. GLEN <450 bp принимаются для количественного анализа.
    5 Total_Count: общий счетчик последовательностей
    6 Сайты интеграции показаны числом хромосом (CHR) и номером сайта для правого соединения (CHR_SITE1) и числом для левого соединения (CHR_SITE2). CHR_SITE1 и CHR_SITE2 разделены на 5 bp для лентивирусных векторов и 4 bp для векторов MLV (pMX)
    7 Последовательность подсчитывает правый переход (R_A) и левый переход образца A (L_A); Последовательности последовательностей для правого соединения (R_B) и левого соединения образца B (L_B)
    * Дисквалифицирован (dQ): GLEN ≥450 в силиконе bp

    Subscription Required. Please recommend JoVE to your librarian.

    Discussion

    Двунаправленный анализ позволяет одновременно анализировать как последовательности восходящего (левого), так и нижестоящего (правого) вектора-хозяина ДНК-соединения и полезен в ряде применений генной терапии, стволовых клеток и исследований рака. Использование ферментов GTAC-motif (RsaI и CviQI) и двунаправленный подход к ПЦР значительно улучшает шансы обнаружения интегрома (или клональной популяции) по сравнению с предыдущими анализами на основе TCGA-мотив ( TaqαI ) 2 , 15 и другими Однонаправленные подходы LM-PCR 5 . Двунаправленный анализ улучшает анализ ИБ, особенно в ограниченных образцах ДНК, которые часто возникают в клинических исследованиях или исследованиях на животных.

    Шаги 1.1-1.7 являются критическим шагом и должны выполняться без лишних задержек. Эти шаги обычно выполняются за один день. Тестирование ферментов до этих шагов настоятельно рекомендуется. шагS 1.9 и 1.10 являются необязательными. Эти этапы уменьшают внутренние векторные последовательности ДНК, которые одновременно амплифицируются с последовательностями ИБ. В таблице 1 представлены наборы праймеров, подходящие для анализа ИБ вирусов NL4.3 с нуклеотидом NL4.3 с ВИЧ-1, NL4.3, включая FG12 21 и гаммаретровирусные векторы на основе pMX 22 . В зависимости от вариаций нуклеотидов в длинных терминальных повторных (LTR) последовательностях, дизайн праймера и экспериментальный подход могут нуждаться в надлежащей модификации.

    Программное обеспечение blat, используемое для сопоставления, совместимо только с форматом fasta и не работает с файлами fastq. Можно преобразовать файлы fastq в fasta с помощью различных программных инструментов, таких как FASTX-Toolkit или BBTools. Пользователь с базовыми знаниями python может использовать Biopython для преобразования файлов fastq в fasta для их сопоставления с blat.

    Ожидается, что часть ИС не будет обнаружена с двунаправленным IS и, даже если обнаружено, не будет квалифицироваться для количественной оценки клонирования ниже по течению. Когда использовались ферменты GTAC-motif, приблизительно 23% интегромов в данных последовательности, генерируемых платформой пиросеквенирования, не прошли критерии анализа для количественного анализа последовательности IS ( рисунок 4 ). Когда комплексное покрытие IS является критическим, например, при контроле за безопасностью генно-инженерных клеток в установках генной терапии, целесообразно выбрать анализ с неограниченным доступом к геному IS 8 , 9 , 10 , 11 , 12 или повторно проанализировать Тот же образец с другой или оптимизированной комбинацией рестриктаз 4 , 18 .

    IS с неограниченным доступом к геному, таким как неограничивающая ПЦР LAM и случайное сдвиг appr19 , 20 , уделили особое внимание всестороннему анализу ИС. Эти подходы используют технологии, которые относительно сложно контролировать, что затрудняет прогнозирование результатов фрагментации геномной ДНК и усиления ИС. С другой стороны, анализ ИС с использованием хорошо охарактеризованных рестрикционных ферментов имеет два основных преимущества: (1) Относительно легко откалибровать и оптимизировать анализы, поскольку результаты анализа более предсказуемы из-за специфики реакции фермента и наличия Эталонных последовательностей генома. (2) Данные последовательности являются высоковоспроизводимыми после оптимизации условий анализа. Двунаправленная ПЦР с оптимизированными условиями оказалась полезной для крупномасштабной и точной количественной количественной оценки 2 , 15 . Хотя только часть существующих клональных популяций была проанализирована из-за смещения фермента рестрикции, количество индивидуумов Л были точно измерены, что позволило точно определить вариации размера клона внутри и между образцами. Было создано достаточное количество клонов для определения моделей поведения стволовых клеток и функциональной гетерогенности.

    ПЦР-ампликоны, полученные из этой двунаправленной процедуры ПЦР, подходят для любой последующей секвенирующей платформы. Из-за высокой чувствительности анализа следует проявлять максимальную осторожность, чтобы предотвратить перекрестное загрязнение путем проведения экспериментов в помещении, свободном от загрязнения. Включение отрицательного (без шаблона) контрольного эксперимента рекомендуется для всех этапов ПЦР. Даже с самой тщательной практикой предотвращение перекрестного заражения образцов к образцам чрезвычайно сложно. Таким образом, при сравнении клональных популяций из разных образцов целесообразно использовать контроль столкновений, который удаляет потенциально загрязненные данные 23 , и отсечку для низкочастотных ненадежных клонов> 2, чтобы минимизировать шум от перекрестно загрязненной ДНК. Двунаправленный подход генерирует данные IS для обоих концов интегромов, тем самым обеспечивая дополнительную возможность уменьшить потенциальные ложноположительные ошибки обнаружения.

    Subscription Required. Please recommend JoVE to your librarian.

    Disclosures

    Авторам нечего раскрывать.

    Acknowledgments

    Финансирование осуществлялось Национальными институтами здравоохранения Грантов R00-HL116234, U19 AI117941 и R56 HL126544; Национальный научный фонд Грант DMS-1516675; Национальный исследовательский фонд Кореи (NRF-2011-0030049, NRF-2014M3C9A3064552); И инициатива KRIBB.

    Materials

    Name Company Catalog Number Comments
    Thermostable DNA polymerase Agilent 600424 PicoMaxx Polymerase
    Thermostable DNA polymerase buffer Agilent 600424 PicoMaxx Polymerase buffer
    Deoxynucleotide (dNTP) solution mix New England Biolabs N0447L dNTP solution mix (10 mM each)
    PCR tubes VWR International 53509-304 PCR Strip Tubes With Individual Attached Caps
    2 mL microcentrifuge tube Molecular Bioproducts 3453 microcentrifuge tubes
    PCR purification kit Qiagen 28106
    RsaI  New England Biolabs R0167L restriction enzyme
    CviQI New England Biolabs R0639L restriction enzyme
    Buffer A New England Biolabs B7204S NEB CutSmart buffer
    DNA Polymerase I large (klenow) fragment  New England Biolabs M0210L Blunting
    streptavidin beads solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    Binding Solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    Washing Solution Invitrogen  60101 Dynabeads kilobaseBINDER kit
    magnetic stand ThermoFisher 12321D DynaMag™-2 Magnet
    T4 DNA ligase New England Biolabs M0202L T4 DNA ligase
    10X T4 DNA ligase buffer New England Biolabs B0202S T4 DNA ligase reaction buffer
    5X T4 DNA ligase buffer Invitrogen  46300-018 T4 DNA ligase buffer with polyethylene glycol-8000
    UV-Vis spectrophotometer Fisher Scientific S06497 Nanodrop 2000
    pvuII new England Biolabs R0151L restriction enzyme
    sfoI new England Biolabs R0606L restriction enzyme
    Buffer B new England Biolabs B7203S NEB buffer 3.1
    Nuclease free water Integrated DNA Technologies 11-05-01-14
    Capillary electrophoresis Qiagen 9001941 QIAxcel capillary electrophoresis
    Veriti 96-well Fast Thermal Cycler Thermo Fisher Scientific 4375305 PCR Instrument
    Rotating wheel (or Roller) Eppendorf M10534004 Cell Culture Roller Drums
    DNA size marker Qiagen 929559 QX size marker (100 - 2,500 bp)
    DNA size marker Qiagen 929554 QX size marker (50 - 1,500 bp)
    DNA alignment markers Qiagen 929524 QX DNA Alignment Marker
    genomc DNA Not Available Not Available Sample genomc DNA from in vivo or in vitro experiments

    DOWNLOAD MATERIALS LIST

    References

    1. Serrao, E., Engelman, A. N. Sites of Retroviral DNA Integration: From Basic Research to Clinical Applications. Crit. Rev. Biochem. Mol. Bio. 51 (1), 26-42 (2016).
    2. Kim, S., et al. Dynamics of HSPC Repopulation in Nonhuman Primates Revealed by a Decade-Long Clonal-Tracking Study. Cell Stem Cell. 14 (4), 473-485 (2014).
    3. Bushman, F. Retroviral integration and human gene therapy. J. Clin. Invest. 117 (8), 2083-2086 (2007).
    4. Bystrykh, L. V., Verovskaya, E., Zwart, E., Broekhuis, M., de Haan, G. Counting stem cells: methodological constraints. Nat Meth. 9 (6), 567-574 (2012).
    5. Schröder, A., et al. HIV-1 integration in the human genome favors active genes and local hotspots. Cell. 110 (4), 521-529 (2002).
    6. Silver, J., Keerikatte, V. Novel use of polymerase chain reaction to amplify cellular DNA adjacent to an integrated provirus. J. Virol. 64, 3150 (1990).
    7. Schmidt, M., et al. High-resolution insertion-site analysis by linear amplification-mediated PCR (LAM-PCR). Nat. Meth. 4 (12), 1051-1057 (2007).
    8. Brady, T., et al. A method to sequence and quantify DNA integration for monitoring outcome in gene therapy. Nucleic Acids Res. 39 (11), e72 (2011).
    9. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15 (12), 1431-1436 (2009).
    10. Kim, S., Kim, Y., Liang, T., Sinsheimer, J., Chow, S. A high-throughput method for cloning and sequencing human immunodeficiency virus type 1 integration sites. J. Virol. 80 (22), 11313-11321 (2006).
    11. Maldarelli, F., et al. Specific HIV integration sites are linked to clonal expansion and persistence of infected cells. Science. 345 (6193), 179-183 (2014).
    12. Wu, C., et al. High Efficiency Restriction Enzyme-Free Linear Amplification-Mediated Polymerase Chain Reaction Approach for Tracking Lentiviral Integration Sites Does Not Abrogate Retrieval Bias. Hum. Gene. Ther. 24 (1), 38-47 (2013).
    13. Aker, M., Tubb, J., Miller, D. G., Stamatoyannopoulos, G., Emery, D. W. Integration Bias of Gammaretrovirus Vectors following Transduction and Growth of Primary Mouse Hematopoietic Progenitor Cells with and without Selection. Mol. Ther. 14 (2), 226-235 (2006).
    14. Gabriel, R., Kutschera, I., Bartholomae, C. C., von Kalle, C., Schmidt, M. Linear Amplification Mediated PCR; Localization of Genetic Elements and Characterization of Unknown Flanking DNA. J Vis Exp. (88), e51543 (2014).
    15. Kim, S., et al. High-throughput, sensitive quantification of repopulating hematopoietic stem cell clones. J. Virol. 84 (22), 11771-11780 (2010).
    16. Mitchell, R., et al. Retroviral DNA integration: ASLV, HIV, and MLV show distinct target site preferences. PLoS Biol. 2 (8), e234 (2004).
    17. Melkus, M., et al. Humanized mice mount specific adaptive and innate immune responses to EBV and TSST-1. Nat. Med. 12 (11), 1316-1322 (2006).
    18. Bystrykh, L. V. A combinatorial approach to the restriction of a mouse genome. BMC Res Notes. 6, 284 (2013).
    19. Beard, B. C., Adair, J. E., Trobridge, G. D., Kiem, H. -P. High-throughput genomic mapping of vector integration sites in gene therapy studies. Methods Mol Biol. , 321-344 (2014).
    20. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15 (12), 1431-1436 (2009).
    21. Qin, X., An, D., Chen, I., Baltimore, D. Inhibiting HIV-1 infection in human T cells by lentiviral-mediated delivery of small interfering RNA against CCR5. Proc Natl Acad Sci U S A. 100 (1), 183-188 (2003).
    22. Kitamura, T., et al. Retrovirus-mediated gene transfer and expression cloning: powerful tools in functional genomics. Exp. Hematol. 31 (11), 1007-1014 (2003).
    23. Cartier, N., et al. Hematopoietic stem cell gene therapy with a lentiviral vector in X-linked adrenoleukodystrophy. Science. 326 (5954), 818-823 (2009).

    Tags

    Генетика выпуск 124 ретровирус сайты интеграции секвенирование следующего поколения ретровирусная генная терапия стволовые клетки раки клеточное кодирование биоинформатика
    Двунаправленная ретровирусная интеграция сайта Методология ПЦР и количественный анализ данных
    Play Video
    PDF DOI DOWNLOAD MATERIALS LIST

    Cite this Article

    Suryawanshi, G. W., Xu, S., Xie, Y., More

    Suryawanshi, G. W., Xu, S., Xie, Y., Chou, T., Kim, N., Chen, I. S. Y., Kim, S. Bidirectional Retroviral Integration Site PCR Methodology and Quantitative Data Analysis Workflow. J. Vis. Exp. (124), e55812, doi:10.3791/55812 (2017).

    Less
    Copy Citation Download Citation Reprints and Permissions
    View Video

    Get cutting-edge science videos from JoVE sent straight to your inbox every month.

    Waiting X
    Simple Hit Counter