Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Amplification, следующего поколения Секвенирование и геномную ДНК Mapping ретровирусных интеграции сайты

Published: March 22, 2016 doi: 10.3791/53840

Abstract

Ретровирусы проявляют предпочтения интеграции подписи на местном и глобальном масштабах. Здесь мы представляем подробный протокол для (1) генерации различных библиотек ретровирусных сайтов интеграции с использованием лигирования-опосредованной PCR (LM-ПЦР) и следующего поколения секвенирования (NGS), (2), отображающую геномную расположение каждого вирусоподобные принимающей узел с использованием BEDTools, и (3) анализ данных для статистической значимости. Геномную ДНК, выделенную из инфицированных клеток, раздроблена перевариванием ферментами рестрикции или с помощью ультразвука. После того, как подходящий ДНК конечного ремонта двухцепочечную линкеры лигировали на концы ДНК, и полупрозрачные, гнездовую ПЦР проводят с использованием праймеров, комплементарных как длинный концевой повтор (LTR), конец вируса и сшита ДНК линкера. ПЦР-праймеры несут последовательности, необходимые для кластеризации ДНК во время NGS, отрицая требование для отдельного адаптера перевязки. Контроль качества (QC) проводится с целью оценки распределения размера фрагмента ДНК и адаптироватьэр включение ДНК до начала NGS. Выходные файлы последовательности фильтруются для LTR-содержащих читает, и последовательности, определяющие LTR и компоновщик обрезаются прочь. Обрезанные последовательности клеток-хозяев отображаются на референсный геном с использованием BLAT и фильтруются для минимально 97% идентичности к единственной точке, в эталонном геноме. Уникальные сайты интеграции тщательно изучаются для смежных нуклеотидов (нт) последовательности и распределения по отношению к различным геномных особенностей. Используя этот протокол, библиотеки интеграции сайтов высокой сложности могут быть построены из геномной ДНК в течение трех дней. Таким образом, весь протокол, который включает в себя экзогенный вирусная инфекция клеток восприимчивых тканевых культур к анализу интеграции сайта может быть проведена в приблизительно одной до двух недель. Последние применения этой технологии относятся к продольной анализу интеграционных участков от ВИЧ-инфицированных пациентов.

Introduction

Интеграция вирусной ДНК (vDNA) в геном клетки-хозяина является важным шагом в жизненном цикле ретровирусов. Интеграция осуществляется с помощью вирусного фермента интегразы (IN), которая осуществляет два различных каталитических процессов , которые приводят к созданию стабильно вставленной провирусом 1. В субъединицы участвовать концы линейного vDNA , который генерируется с помощью обратной транскрипции, образуя intasome высшего порядка с vDNA концы скрепляются с помощью IN мультимеров 2-4. В расщепляет 'концы vDNA вниз по течению от инвариантных 5'-СА-3' 3 последовательностей в процессе , известном как 3'-обработки, в результате чего утоплена 3 'концы с реактивными гидроксильными группами на каждом vDNA концевой 5-8. Intasome затем импортируется в ядро как часть большого сборки хозяина и вирусных белков , известных как preintegration комплекс (ПОС) 9-11. Столкнувшись с клеточной ДНК-мишени (tDNA), IN использует vDNA 3'-гидроксил Groвзлетов расщеплять верхнюю и нижнюю tDNA пряди в шахматном порядке и одновременно соединяет vDNA к tDNA 5 'фосфатных групп в процессе передачи цепи 12,13.

Ретровирусы предпочтения выставляется интеграция сайтов на локальном и глобальном масштабах. Локально, сайты интеграции на основе консенсуса состоят из слабо консервативных последовательностей палиндромных tDNA , которые охватывают приблизительно от 9:55 б.п. вверх и вниз по течению от вставки сайтов vDNA 14,15. В глобальном масштабе, ретровирусы ориентированы на конкретные хроматина аннотаций 16. Есть семь различных ретровирусная родов - альфа через эпсилон, Ленти и spuma. В лентивирусов, в том числе ВИЧ-1, в пользу интеграции в рамках органов активно расшифрованных генов 17, в то время как gammaretroviruses преимущественно интегрироваться в транскрипционных сайтов начальной (ЦСС) и активных областей усиливающих 18-20. В резком контрасте, spumavirus сильно смещен в сторону heterochromАИКТ регионы, такие как ген бедных листовых пластинок ассоциированных доменов 21. Местные базовые предпочтения tDNA в значительной степени продиктованы конкретными сетями нуклеопротеидных контактов между IN и tDNA 13,22,23. Для лентивирусах и gammaretroviruses, интеграция по отношению к геномных аннотаций в значительной степени регулируется взаимодействием между IN и родственными клеточных факторов 24-27. Изменяя специфику взаимодействия сети IN-tDNA 13,22,23,28 и срыве или реинжиниринг IN-хозяина фактор взаимодействия 25-27,29-32 проверенные стратегии перенацелить интеграции на местном и глобальном уровнях, соответственно.

Мощность процедур секвенирования ДНК, используемых в каталог ретровирусных сайтов интеграции чрезвычайно возросло за последние десятилетия. Интеграционные сайты были восстановлены в пионерской работе , используя трудоемкую очистку и ручных методов клонирования для получения только несколько уникальных участков на исследование 33,34.Сочетание LM-ПЦР - амплификации переходов ДНК ДКП-хозяевах с возможностью отображения отдельных участков интеграции на человека и проекты мыши геномы трансформированных поле, с количеством сайтов , добытых инфекций экзогенный для тканевой культуры клеток увеличением до нескольких сотен до тысяч 17 , 18. Более поздние комбинация LM-PCR с методологией NGS послал глубины библиотеки стремительно растет. В частности, Пиросеквенирование дали порядка десятков тысяч уникальных сайтов интеграции 30,35-38, в то время как библиотеки секвенировали посредством использования кластеризацию ДНК может принести миллионы уникальных последовательностей 19-21,39. Здесь мы опишем оптимизированный протокол LM-PCR для амплификации и секвенирования ретровирусных сайтов интеграции с использованием ДНК кластеризации NGS. Способ включает в себя адаптер требуется последовательностей в ПЦР-праймеров и, следовательно, непосредственно в усиленных молекул ДНК, тем самым исключающие требование дополнительного шага адаптера лигирования до начала sequenCing 40. Трубопровод биоинформатики анализ, из синтаксического анализа исходных данных секвенирования для LTR-ДНК хозяина переходов к отображению уникальных сайтов интеграции на соответствующие геномные функции, как правило, также описаны. В соответствии с очередности , установленной из предыдущих методологических протоколов в этой области 36,38,41-43, пользовательские скрипты могут быть разработаны , чтобы помочь завершению конкретных шагов в трубопроводе биоинформатики. Полезность и чувствительность протокола иллюстрируется данными, приближенными путем амплификации, секвенирование и картирование ВИЧ-1 интеграционные сайты из клеток для культивирования тканей, инфицированных при приблизительной множественности инфекции (MOI) 1,0, а также ряд титрование этой ДНК разбавленный через неинфицированному клеточную ДНК в 5-кратно до максимального разведении 1: 15625 , чтобы получить приблизительный эквивалент MOI 6,4 х 10 -5.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Сформировать запасов вируса

Примечание: Блок - схема мокрого стендовых аспекту данного протокола показан на рисунке 1 Детали вирусной животноводческой продукции и последующей инфекции культуры ткани клеток, как правило , относятся к различным видам ретровирусов.. Для некоторых экспериментов, клетка - мишень не может выразить эндогенный вирусный рецептор (ы), и в таких случаях строительство pseudotyped ретровирусных частиц , несущих гетерологичные вирусный гликопротеин оболочки, например, G гликопротеин от вируса везикулярного стоматита (VSV-G), будет требуется для инфекции 44,45.

Примечание: предосторожность следует соблюдать осторожность при работе с ВИЧ-1. Хотя конкретные рекомендации будут варьироваться от одного учреждения к другому, все вирусы на основе работа должна проводиться в специальном, оператор ограничен шкаф биологической безопасности (обычно упоминается как капот культуре ткани). Правильное средства индивидуальной защитыкоторая включает в себя защиту лица, бахилы, двойной слой перчаток и комбинезона костюм всего тела следует носить в любое время. Все жидкие отходы в результате связанных с вирусом экспериментов должны быть инактивированной с отбеливателем (конечная концентрация 10%), и все отходы, включая твердые материалы следует автоклавировать перед утилизацией.

  1. За один день до трансфекции, пластины 3,3 х 10 6 клетки HEK293T в 10 мл Дульбекко в модификации Дульбекко (DMEM) , дополненной 10% (об / об) фетальной бычьей сыворотки и 1% (об / об) пенициллин / стрептомицин (10000 Ед / мл акций) в каждой из пяти 100-мм чашках.
    Примечание: Дополненный-DMEM, упоминается как DMEM-FPS с этого момента.
  2. На последующий день, трансфекции клеток с 10 мкг плазмиды, несущей полнометражных ретровирусные молекулярные клоны или 9 мкг конвертов с делецией однообходных векторов 1 мкг в конструкции экспрессии VSV-G с использованием коммерчески доступных реагентов трансфекции или фосфата кальция.
    1. Выдержите гргезов при 37 ° С в увлажненной культивирования клеток инкубаторе с 5% CO 2 (это условие в дальнейшем именуемые как "тканевой культуры инкубатор»). Примерно через 48 ч, урожай вируссодержащих клеточную среду, используя мерную пипетку и передать его через фильтр с размером пор 0,45 мкм самотеком.
    2. Концентрат вируса с помощью ультрацентрифугирования при 200000 х г в течение 1 ч при 4 ° С. Ресуспендируют вирус осадок в 500 мкл DMEM-FPS, содержащий 20 U ДНКазы, и инкубировали в течение 1 часа при 37 ° С.
      Примечание: Ступень ДНКазы помогает уменьшить восстановление нежелательных плазмидных последовательностей за счет устранения тяжесть плазмидной ДНК, которая сохраняется от процедуры трансфекции.
  3. Определить концентрацию p24 46 с использованием ВИЧ-1 р24 антигена комплект захвата в соответствии с инструкциями изготовителя.
    Примечание: концентрация Вирус также может быть определена с помощью анализа 47,48 активности обратной транскриптазы. В качестве альтернативы, уровень функционального вируса можетопределяется путем измерения Mol. Это наиболее легко сделать с помощью флуоресценции Активированный сортировки клеток с вирусами, которые экспрессируют флуоресцентные репортерные гены, такие как усиленный зеленый флуоресцентный белок. определение MOI может быть особенно полезно при работе с первичными клетками, которые могут не поддерживать такой же уровень инфекции, оптимизированных клеточных линий.

2. инфицировать клетки с вирусом

  1. Пластина 3,0 х 10 5 HEK293T клеток на лунку в 6-луночный планшет в 2,5 мл DMEM-FPS и инкубировать в течение ночи в инкубаторе тканевых культур.
    Примечание: Число уникальных сайтов интеграции извлекаемых с этим протоколом, прямо пропорционально числу клеток и количества активного вируса, используемых в инфекции.
  2. Инфицировать клетки при конечной концентрации вируса р24 500 нг / мл в конечном объеме 500 мкл свежей DMEM-FPS в течение 2 ч в инкубаторе тканевых культур, а затем добавляют 2 мл DMEM-ФПС предварительно нагретый до 37 ° С на лунку и продолжают инкубацию.
  3. В48 ч после заражения, носитель извлечь и промыть клетки с 2 мл фосфатно-буферном солевом растворе (PBS). Добавить 0,5 мл трипсин-ЭДТА предварительно нагревают до 37 ° С, и через несколько секунд визуально осмотреть лунки для клеток смещение.
  4. Добавьте 2 мл подогретого DMEM-FPS и ресуспендирования клеток путем осторожного вверх / вниз пипеткой с объемным пипеткой ~ 10 раз. Переносят раствор до 75 см 2 для культуры ткани колбу , содержащую 18 мл подогретого DMEM-ФПС, и инкубировать клетки в инкубаторе тканевых культур.
  5. После того, как минимально пять дней после начала инфекции, сбора клеток путем удаления носителя, промывают 5 мл PBS, добавляют 2 мл подогретого трипсин-ЭДТА, и вновь суспендируют с 5 мл предварительно подогретой среде DMEM-FPS пипетированием. Центрифуга раствор в течение 5 мин при комнатной температуре при 2500 х г, и отбросить супернатант.
    Примечание: Несмотря на то, интеграция в этих условиях плато при температуре около 48 ч после заражения 49,50, дополнительные 3 дня культуры обязаны sufficientlY разбавить концентрацию неинтегрированных молекул ДНК, которые являются результатом клеточной ДНК-рекомбинации или вирусно-опосредованного Автоинтеграция.
  6. Извлечение геномной ДНК из осадка клеток с использованием коммерчески доступного набора (например, см 51). Элюции ДНК с прилагаемого ионообменную колонку с 200 мкл 10 мМ Трис-HCl, рН 8,5.
    Примечание: аликвоту клеток должны быть распределены на 48 ч после заражения (этап 2.3) для анализа инфекционности обеспечения надлежащей вирусной инфекции до NGS.

ДНК 3. Фрагмент геномную путем обработки ультразвуком или рестрикционным Digest

Примечание: Ультразвуком фрагментов геномной ДНК в последовательности практически-независимым способом , и, таким образом , предпочтительный способ фрагментации , когда секвенирования образцов с низкой скоростью восстановления ожидаемой (например, инфицированные клетки пациента или инфекции , инициированные при относительно низком MOI). Кроме того, обработка ультразвуком позволяет различать ПЦР дубликаты в Partiлярных последовательность интеграции сайта с уникальной интеграции в том же месте, что очень важно , чтобы отличить клональной экспансии провирусом клеток , содержащих у инфицированных пациентов (см Шаг 11 ниже) 39,52-54.
Примечание: ДНК должна быть расщеплены непосредственно ниже по потоку от верхней по потоку LTR, чтобы уменьшить усиление внутренних вирусных последовательностей во время LM-PCR. Рестриктаза BglII , который лежит 43 пар оснований ниже по потоку от верхней по потоку последовательности U5 и что несовместима для последующего лигирования с MseI-генерируемой концов ДНК , хорошо работает со многими штаммов ВИЧ-1 (Фигура 1В). При получении ДНК , с помощью обработки ультразвуком, рестриктазы внутренний расщепляющие следует применять после линкера лигирования (см фиг.1С - E и шаге 4.3 ниже).

  1. Для обработки ультразвуком, смесь 10 мкг геномной ДНК в нуклеазы без воды до конечного объема 120 мкл. Разрушать ультразвуком с использованием параметров для среднего размера разрыва 500 б.п. (два раунда следующего пунктаметров: рабочий цикл: 5%; Интенсивность: 3; циклов в порыве: 200; Время: 80 сек).
  2. Очищают обрабатывают ультразвуком ДНК с использованием набора для очистки ПЦР. Устранить концов ДНК с использованием набора конечных репарации ДНК и очищают ДНК с использованием набора для очистки ПЦР. A-хвост ДНК с помощью Кленова экзо - фермент и очищают ДНК А-белохвост с использованием набора для очистки ПЦР. Обратитесь к 51,52 дополнительных деталей использования комплекта.
  3. Для рестрикционной эндонуклеазой, вырезать 10 мкг геномной ДНК в течение ночи при 37 ° С в объеме 100 мкл с помощью буфера, поставляемых производителем и смеси ферментов (100 ед каждого), которые генерируют 5'-TA свесов, а также несовместимыми фермент, такой как BglII, который расщепляет вниз по течению от входного вирусного LTR. Очищают ДНК на следующий день с использованием набора для очистки ПЦР.
    Примечание: Ни один из ферментов рестрикции не должны разрезать в терминале ~ 30 п.н. вирусного конца ДНК, который амплифицируют с помощью протокола LM-PCR. Этот протокол специально усиливает U5конец ДНК ВИЧ-1.

4. отжечь Linker олигонуклеотиды и лигируют к фрагментированным геномной ДНК

Примечание: Подготовить асимметричный линкер , содержащий выступ , который совместим с указанными выше фрагментами ДНК (см таблицу 1 для последовательностей олигонуклеотидов , используемых в данном протоколе). Линкер должен использоваться с ДНК облучали ультразвуком должна содержать совместимый "свес Т-3, в то время как линкер для MseI-расщепленной ДНК должна содержать совместимые 5'-TA свеса (рисунок 1). Короткий компоновщик прядь должна дополнительно содержать непродолжаемой химической модификации, такие как 3'-амин, чтобы ограничить последующие реакции амплификации в направлении ДНК, представляющей интерес.
Примечание: При подготовке нескольких различных библиотек интеграции узлов параллельно и / или при мультиплексировании уникальных образцов на том же секвенирования перспективе, рекомендуется использовать уникальные линкеров для каждого образца, чтобы ограничить потенциал для образца перекрестного contaminAtion во время ПЦР. Это дополнительно предполагает использование уникальных компоновщика праймеров для каждого образца в течение полу-гнездовой ПЦР (как описано ниже). Уникальные прядей линкера и компоновщика праймеры могут быть сконструированы путем скремблирования олигонуклеотидных последовательностей компоновщика , перечисленные в таблице 1 , при сохранении в целом сходно% содержание GC и применимые позиции сверхмандатов.

  1. Прокалить короткие и длинные нити компоновщика в 35 мкл 10 мМ Трис-HCl, рН 8.0-0.1 мМ ЭДТА (конечная концентрация 10 мкМ каждого нуклеотида) при нагревании до 90 ° С и медленно охлаждают до комнатной температуры с шагом 1 ° C в минуту.
  2. Приготовьте по меньшей мере, четыре параллельных реакций лигирования за геномной ДНК образца, которые содержат 1,5 мкМ лигирован компоновщик, 1 мкг фрагментированной ДНК и 800 U ДНК-лигазы Т4 в 50 мкл. Лигирования в течение ночи при 12 ° С. Очищают на следующий день с использованием набора для очистки ПЦР.
  3. Для образцов, полученных с помощью ультразвука, переваривать очищают реакцию лигирования с 100 ед в ОГРАНИЧЕНИЯМИции фермента , который расщепляет вниз по течению от верхнего LTR (например, BglII для ВИЧ-1) в соответствии с рекомендациями завода - изготовителя условия в течение ночи. Очищают ДНК с использованием набора для очистки ПЦР.

5. AMPLIFY Вирусные LTR-Host геномную ДНК Развязки по Semi-гнездовой ПЦР

Примечание: Для обеспечения оптимального разнообразия библиотеки, по крайней мере, 4-8 параллельных МКП, в зависимости от концентрации ДНК извлеченной реакции лигирования, должны быть подготовлены для каждого образца для обоих раундах ПЦР. концентрации ДНК-матрицы должна быть определена количественно с помощью спектрофотометрии. В этом протоколе первый и второй раунды ПЦР используют вложенными ДКП-специфических праймеров, но тот же линкер-специфического праймера используется для обоих раундов (таблица 1). Второй раунд LTR-специфического праймера и компоновщик-специфического праймера кодируют последовательности адаптеров для кластеризации ДНК, а также сайты связывания праймеров для секвенирования. Вложенный LTR-специфического праймера также кодирует последовательность индексов 6 нт, ВГIch можно варьировать среди различных праймеров для мультиплексирования библиотек в пределах того же секвенирования перспективе.

  1. Подготовка первого раунда МКП , содержащие ингредиенты , на пробирку, которые перечислены в таблице 2.
    Примечание: Линкер-специфического праймера укрывает 22 нт комплементарности к линкеру, температура плавления 53 ° С, GC-содержанием 45%, а его 3'-конце расположен 15-16 пар оснований в обратном направлении от 3'-концу Различные линкерные длинные нити (таблица 1). Первый раунд 27 нт ДКП праймер имеет температуру плавления 59 ° С, GC-содержанием 48%, а его 3 'конец находится 34 пар оснований в обратном направлении от U5-конца ВИЧ-1. Область второго раунда праймера 26 нт LTR, который является дополнением к ВИЧ-1 LTR имеет температуру плавления 60 ° С, GC-содержание 50%, а его 3 'конце находится 18 пар оснований выше по течению от вирусного U5 конечная остановка. Рекомендуется, чтобы температура плавления олигонуклеотида и GC-содержание должно имитировать эти параметры, если пользователидизайн ПЦР - праймеры с измененными последовательностями ( в том числе для использования с другими ретровирусов) 21.
  2. Запуск первого раунда ПЦР при следующих параметрах амплификатора: один цикл: 94 ° С в течение 2 мин; 30 циклов: 94 ° C в течение 15 сек, 55 ° С в течение 30 сек, 68 ° C в течение 45 сек; один цикл: 68 ° С в течение 10 мин.
  3. Бассейн реакции и очищают с использованием набора для очистки ПЦР. Подготовка второго раунда , содержащие МКП ингредиенты на пробирку в соответствии с таблицей 3. Запуск второго раунда ПЦР с использованием параметров Термоциклеры , описанных в шаге 5.2. Объединяют реакции и очищают ДНК с использованием коммерческого набора для очистки ПЦР в соответствии с инструкциями изготовителя.
    Примечание: Разнообразие рекомендуемых индексов последовательностей ДНК , совместимых с кластерными NGS доступны 71.

6. Выполните QC и NGS (Обычно это с помощью секвенирования фонда)

  1. (КК тест # 1) Подтвердить Шаг 5.3 Библиотека концентрация ДНК с использованием фтораметр 55. В кратком изложении, подготовить стандарты и экспериментальных образцов в конечном объеме 200 мкл нуклеазы без воды. Вихревые трубки в течение 2-3 сек, инкубировать при комнатной температуре в течение 2 мин, а затем прочитать образцы в флуорометре.
    Примечание: Образцы должны содержать минимальную концентрацию 2 ДНК библиотеки ЯМ в минимальном объеме 15 мкл.
  2. (КК тест # 2) Подтвердить распределение размера фрагмента ДНК с использованием анализа ленты на основе 56.
    Примечание: идеальное распределение является относительно широкий пик ДНК центрирующий около 500 пар оснований в длину. Если значительное количество материала больше, чем 1 кб, то рекомендуется включить процедуру выбора размера для устранения более длинных видов ДНК, которые будут затруднять моста усиление во время кластеризации. В противоположность этому, если значительный пик очевидно, около 100 до 200 пар оснований, праймера димер может быть сформирована в процессе ПЦР. В этом случае процедура должна быть оптимизирована, чтобы свести к минимуму образование димеров праймеров.
  3. (КК тест # 3) Confirm надлежащее включение адаптеров в библиотеку ДНК с помощью количественной ПЦР 57.
  4. Выполните следующие приложения NGS документации изготовителя. Использование спайка-в 10% (вес / вес) ΦX174 ДНК, которая позволит оптимизировать метрики качества в режиме реального времени, обеспечивая сбалансированную базовую композицию для секвенирования перспективе.
    Примечание: эксперименты Интеграция сайта секвенирования обычно подвергают однократному конец 150 пар оснований (SE150) или парноконцевое 150 пар оснований (PE150) секвенирования. PE150 особенно полезно , чтобы захватить точку присоединения линкера на каждой молекуле ДНК (например, при интеграции сайтов рассматривая на наличие клеток - хозяев клональной экспансии).

7. Используйте настроенную Python или PERL скрипт для синтаксического анализа секвенирования данных для LTR-содержащих нуклеотидные последовательности, кадрирование прочь LTR и компоновщик последовательностях, и Карта Reference Геном с Блат

  1. Сканировать файлы FASTA для LTR-содержащих последовательность чтения, растениеводстве LTR и компоновщика последовательностей от хозяина геномной ДНК-последовательности, иэкспортировать эти последовательности в новый файл FASTA. Карта обрезается читает как эталонного генома (например , версии генома человека hg19 или GRCh38) и вирусный геном с использованием BLAT 58 с выходным сигналом интеграции сайта координаты экспортируются в отдельный текстовый файл, используя следующие параметры:
    размера шага = 6, minIdentity = 97, и maxIntron = 0
  2. Проанализировать выход Блат .txt файл, удалить autointegrations (то есть доказательства того, что конец LTR была интегрирована во внутреннюю область вирусного генома ДНК) и отображения других последовательностей к ВИЧ-1 генома, а также создать отдельный выход .txt файл , в котором все сайты дублирующие интеграции были сжаты в отдельные, уникальные хиты координат.

8. Создание .bed файлов, содержащих интервалы 15-нть Ближ.населенные интеграций, конвертировать эти файлы в FASTA и Построить Sequence логотипы для отображения базовых настроек Ближайшие интеграции Сайтов

  1. Создание .bed файлов со списком интервал оснований длякаждая интеграция сайта. По крайней мере 15 оснований (5 вверх и 10 вниз по течению) предлагаются для генерации последовательности логотипа. Сформировать FASTA файл из этих .bed файлов с помощью функции fastaFromBed из BEDTools 59 и эту команду:
    fastaFromBed -fi / Каталог / к / ссылка / геном / -name -s 15_base_pair_file.bed -fo Постельное output_file.fasta
    Примечание: Инвариант вирусный 5'-СА-3 'динуклеотид присоединяется к ДНК хозяина в процессе интеграции, а также проверки стык конечной остановки LTR к клеточной ДНК является важным первичный фильтр для идентификации добросовестных сайтов интеграции. Мы дополнительно компилировать логотипы последовательность из этой популяции хозяина ДНК-последовательности, чтобы проверить результаты эксперимента. Как ретровирусы отображать базовые настройки подписи окружающих их интеграции сайтов 14,15, логотипы последовательности служат для подтверждения того, что возникла отображенные геномные сайты через IN-опосредованной интеграции по сравнению с другими механизмами рекомбинации , такие как негомологичной ДНКконец присоединения 60,61.
  2. Используйте WebLogo 3 (http://weblogo.threeplusone.com/create.cgi) для создания логотипов последовательности из FASTA файлов. Нажмите на кнопку "Выбрать файл", чтобы загрузить файл FASTA, и используйте следующие настройки: Output Format, PDF (вектор); размер логотипа, большой; Первый номер позиции, -5; Диапазон логотипа, от -5 до 5; Y-ось шкалы, 0,1, Y-ось крестики расстояние, 0,5, Цветовая схема, классический (NA).

9. Создание центральной базы пара .bed файлы, проверить наличие образца перекрестного загрязнения и карты распределения уникальная интеграция Сайты по сравнению с геномных Особенности Соответствующая

  1. Поскольку ретровирусная интеграция происходит в шахматном порядке через пряди tDNA, настроить точные координаты интеграции сайтов, чтобы отразить центральную п.н. дублирования целевого сайта для корректного отображения геномной распределения по отношению к геномных особенностей.
    1. Таким образом, для 5 пар оснований дублируя вирусы, как ВИЧ-1, создают .bed файл с центральным п.н., смещенной от Integration сайт двумя основаниями вниз по течению для картирования интеграций до + цепи и двумя основаниями вверх по течению для интеграций отображения на минус нити.
  2. Для проверки образца перекрестного загрязнения, рассчитать количество интеграционных сайтов распространенных среди различных библиотек при помощи функции BEDTools пересекаются функции пересекаются центральная п.н. .bed файлы для двух различных образцов и следуя этой команды:
    bedtools -a пересекаются central_basepair_1.bed -b central_basepair_2.bed -f 1,00 -r -s> overlap1v2.txt
  3. Подсчитать количество строк в файле вывода overlap1v2.txt для того, чтобы количественно оценить точное количество сайтов распространенных среди двух библиотек, используя следующую команду:
    туалет -l overlap1v2.txt
  4. Скачать файл .bed RefSeq аннотаций для версии референсного генома , который был использован для отображения интеграции сайта из базы данных УСК Геном аннотации (например , http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database) 62.
    1. Подсчитать количество сайтов интеграции генов , входящих в RefSeq при помощи функции BEDTools пересекаются функцию , чтобы пересекать .bed файл центральной пары оснований , который был создан для образца с RefSeq .bed файл следующие команды:
      bedtools -a пересекаются central_basepair_1.bed -b RefSeq_hg38.bed -u> RefSeq_sample1.bed
  5. Подсчитать количество строк в файле вывода RefSeq_sample1.bed для того, чтобы количественно оценить точное количество сайтов, попадающих в генах RefSeq с помощью следующей команды:
    туалет -l RefSeq_sample1.bed
  6. Повторите шаги 9.3 и 9.4 для интеграции отображения сайтов на любую другую пометку интерес, для которых интервал .bed файл доступен. Скачать самую последнюю CpG острова аннотаций файл .bed для референсного генома интереса из базы данных УСК Геном аннотации, как указано в пункте 9.4.
    1. Подсчитайте число интеграции сайтов, попадающий в определенном диПозиция (показано в данном примере представляет собой окно 5 т.п.н.) CpG островков с помощью функции окна BEDTools и после этой команды:
      Окно bedtools -w 2500 central_basepair_1.bed -b CpG_hg38.bed -u> CpG_sample1.bed
  7. Подсчитать количество строк в файле вывода CpG_sample1.bed для того, чтобы количественно оценить точное количество сайтов, попадающих в 2,5 кб выше или ниже по потоку от CpG островков с помощью следующей команды:
    туалет -l CpG_sample1.bed
  8. Повторите шаги 9.6 и 9.7 для сайтов интеграции отображения поблизости TSSS. Сформировать альтернативную версию файла RefSeq.bed, где геномная координаты отображения более чем одного гена, были скорректированы с учетом только одного гена, присутствующего в этой позиции. Это предотвращает завышение плотности генов окружающей интеграции сайтов. Вычислить плотность генов в 1 Мб области вокруг каждого интеграции сайта с помощью оконной функции BEDTools и после этой команды:
  9. Вычислить среднюю плотность генов для всех интеграций в наборе данных, выполнив следующую команду:
    AWK '(сумма + = $ 7) END (печать "Average =", сумма / NR)' GeneDensity_sample1.bed

10. Статистически Сравнить Интеграция сайта Распределения среди образцов с использованием двух хвостами точный критерий Фишера и двухвостый Wilcoxon Rank Sum Test в R

Примечание: точный критерий Фишера Используйте для сравнения доли интеграции сайтов в пределах генов RefSeq или в пределах окна CpG островков или TSSS, но использовать тест Вилкоксона суммы ранга для сравнения распределения плотности генов, окружающих сайтов интеграции. Программа R доступна на http://www.r-project.org/.
Два хвостами точного критерия Фишера:

  1. Используя числа, рассчитанные в соответствии с инструкциями на этапах 9.4 и 9.7, крЭАТС матриц для каждого сравнения в R наблюдаемых явлений (интеграций внутри аннотацию или внутри окна , окружающего аннотацию) в зависимости от оставшихся сайтов, выполнив следующую команду:
    (Annotation_of_interest <- матрица (с (SampleA # в, SampleA # остальные, SampleB # в, SampleB # остальные), nrow = 2, dimnames = список (с ( 'Центр', 'Remainder'), с ( 'SampleA', 'SampleB'))))
  2. Вычислить значение P для сравнения двумя хвостами точный критерий Фишера с помощью следующей команды:
    fisher.test (annotation_of_interest, альтернативная = 'two.sided') $ p.value
    Два хвостами Вилкоксона ранговой суммы:
  3. Создайте файл с разделителями табуляции .txt, в котором каждый столбец содержит имя образца в верхней ячейке, а затем ниже значениями плотности генов для всех сайтов интеграции в этой библиотеке (полученной из .bed файла, созданного на шаге 9.9). Импорт этой табуляции .txt файл в R , используя следующую команду и наvigating в правильный каталог файла:
    FILENAME <- as.data.frame (read.delim (file.choose (), заголовок = T, check.names = FALSE, заполнить = TRUE, SEP = ' т'))
  4. Вычислить значение P для сравнения двумя хвостами Вилкоксона критерий суммы рангов с помощью следующей команды:
    wilcox.test (Filename $ SampleA, FILENAME $ SampleB, альтернативных = 'two.sided', в паре = F, точный = T) $ p.value
    Примечание: Значения P могут быть рассчитаны только до определенного (очень низкая) предел в R, после чего ноль будет возвращен программой. Для массово различных образцов , которые дают P = 0 в R, оценить величину Р , как <2,2 · 10 -308.

11. Изучение Raw секвенирования данных для доказательства клональной экспансии клеток, содержащих интегрированную ДНК Вирусный

Примечание: Небольшой потенциал существует более одной интеграции в том же нт референсный геном. В качестве альтернативы, один вtegration событие может стать избыточно присутствует в последовательности данных в связи с использованием ПЦР в процессе подготовки библиотеки и / или путем дублирования клеток перед препарата ДНК. Недавно проведенный анализ геномной ДНК из ВИЧ-инфицированных пациентов отличились эти возможности путем выявления уникальных точек точки Озвучивание сдвига / крепления (линкер , которые могут возникнуть только перед ПЦР) в пределах ДНК - последовательностей , содержащих идентичные сайты интеграции 52-54. Существует в настоящее время дебаты относительно того, является ли вклад провирусы укрывал в клонированных расширенных клеток в латентной вирусной резервуара, и, таким образом, представляет особый интерес, чтобы охарактеризовать уровень их расширения при изучении сайтов интеграции у больных людей.

  1. По аналогии с процедурой, указанной в пункте 8.1, генерируют .bed также файлы интервал баз расширяясь, в данном случае, 25 нт вниз по течению от каждого уникального сайта интеграции (вверх по течению базы не нужны здесь). Создает FASTA файл из этих .bed файлов (как указано вШаг 8.1) с помощью функции fastaFromBed из BEDTools и после этой команды:
    fastaFromBed -fi / Каталог / к / ссылка / геном / -name -s 25_base_pair_file.bed -fo Постельное output_file.fasta
    Примечание: Для повышения специфичности каждого поиска рекомендуется извлечь по меньшей мере, 25 нт вниз по течению от каждой интеграции сайта для клоновая расширения анализа.
  2. Предпочтительно с помощью пользовательского сценария, поиск файла FASTA необработанные данные о последовательности для всех строк, содержащих точное совпадение с 25 нт вниз по течению от каждого уникального сайта интеграции, и внести эти последовательности в новый файл. Обрежьте LTR и компоновщика последовательности из исходных строк. Слияние последовательность PE читает путем преобразования читает в обратном дополнения, зачистка LTR и линкерные последовательности, а затем назначив read2 строк в их READ1 пары, если строки разделяют по меньшей мере 20 перекрывающихся нт.
  3. Сканирование точек крепления линкер каждого блока интеграции сайта. Классифицировать каждую интеграцию как "клонированных расширен &# 34; если точки крепления линкер являются ≥3 п.н. друг от друга.
    Примечание: Протокол для клонального анализа расширения без слияния последовательности чтений было описано 52.
    Примечание: Фрагментация генома в то же самое место с помощью ультразвуковой обработки приводит к недооценке степени клональной экспансии, а также методы для коррекции полученного экспериментального смещения были описаны 63,64.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

В таблице 4 приведены результаты типичного эксперимента , чтобы проиллюстрировать чувствительность NGS для восстановления интеграции сайтов из культуры инфицированных клеток. Незараженных клеточной ДНК использовали для серийно разбавленных геномную ДНК от инфекции , в которой каждая ячейка в среднем содержала один интеграции 40. Разведения были подготовлены на этапах от пяти до максимального разведении 1: 15625. Геномную ДНК в серии титрование затем фрагментированы с помощью обработки ультразвуком, или путем расщепления с помощью рестрикционных эндонуклеаз MseI и BglII, а затем LM-PCR. Рассчитывали количество уникальных сайтов интеграции, а также количество сайтов отображения проксимального к выбранным геномных аннотациями, в соответствии с вышеуказанным протоколом. Анализ данных показал, десятки уникальных сайтов интеграции (1-2% от суммы оправился от аккуратной геномной ДНК), выделенных из библиотек, приготовленных из клеток, где в теории была заражена только один в 15625. При анализе массивов данных интеграции сайта, крайне важно, чтобы сравнить данные согласованного набора случайных геномных сайтов, который называется подобранный случайный контроль или MRC. По мере того как показательные результаты стриженый геномной ДНК с помощью рестриктазой или путем обработки ультразвуком, были построены два различных набора данных MRC. MRC Энц содержала 50000 уникальных геномных сайтов , генерируемые случайным образом выбирают сайты из hg19 в непосредственной близости к местам MseI и BglII рестриктазой, в то время как MRC случайные питали 10000 сайтов генерируется без нормализации для расстояния от установленных геномных маркеров. Только сайты, которые могут быть отображены обратно к уникальному геномного месте следует использовать в MRC наборов данных. В качестве обработки ультразвуком ножницы геномной ДНК , по существу свободной от смещения последовательности, КРМ случайным образом можно рассматривать как более применимы к наборам данных , полученных в результате фрагментации ДНК путем обработки ультразвуком. Альтернативный стиль интеграции управлениясайт набора данных могут быть сгенерированы в пробирке путем взаимодействия рекомбинантного белка, intasome нуклеопротеид комплекс 21, или ТОС , экстрагированных из остро инфицированных клеток 17 с депротеинизированной геномной ДНК, а затем после LM-PCR и НГС протоколы 21.

Значения P для сравнения распределения интеграционных сайтов извлеченного с помощью ультразвука по сравнению с ограничением дайджеста (сравнение между аккуратных образцов), а также для сравнения с MRC ENZ и MRC случайным, отображаются на рисунке 2. Распределение интеграции сайтов выздоровел Следующий Озвучивание аналогичны тем, которые извлекали ферментом рестрикции переваривать для всех исследованных аннотациями, с наибольшей дисперсией очевидной с точки зрения близости к CpG островов. Как и ожидалось 18,65 оба набора данных значительно отличались от МРК с точки зрения интеграции в пределах генов RefSeq и гена Density окружающих средний сайт интеграции, в то время как оба набора данных были похожи на МРК с точки зрения распределения по отношению к CpG островков и TSSS. Поскольку относительно небольшое число ВИЧ-1 интеграция сайтов на карте в пределах 2,5 кб остров CpG или TSS, увеличивая общее количество сайтов выздоровел, вероятно, уменьшить изменчивость , которая может возникнуть между наборами данных (таблица 4 и рисунок 2). Последовательность логотипы для подтверждения подлинности интеграции данных сайта показаны на рисунке 3. Консенсус ВИЧ-1 интеграция сайта 14,22 (-3) TDG (G / V) TWA (C / B) Cha (+7) ( написана с использованием Международный союз базовых кодов биохимия, обратной косой черты указывает положение vDNA плюс нити присоединения, и подчеркивание указывает на 5 пар оснований последовательности продублированы следующие ВИЧ-1, интеграции и ремонт ДНК) очевидны для библиотек, полученных обоими методами фрагментации, хотя степень уверенности уменьшается с увеличением разбавления инфицированной клеткиДНК. Случайные сайты выравненные из набора данных MRC в отличие от этого не в состоянии произвести заметное количество базовых предпочтений.

Рисунок 1
Рисунок 1:. Блок - схема Иллюстрация Подготовка интеграции библиотечных сайта (A) Создание вирусных запасов путем трансфекции HEK293T клеток, сбор и фильтрация супернатанта 48 ч позже, концентрируясь с помощью ультрацентрифугирования, и инфицирование клетки - мишени с соответствующей концентрацией вируса. По крайней мере, через пять дней после заражения, извлечения геномной ДНК. Обратитесь к разделам 1 и 2 основного текста для дополнительных подробностей эксперимента. и С) Фрагмент геномной ДНК очищают путем расщепления ферментами рестрикции или с помощью ультразвука. Сужение ферментный коктейль должен включать фермент (например , BglII) , который расщепляет вниз по течению от вверх по течению вирусного LTR контратак выберите для LM-PCR усиление внутренних последовательностей vDNA. Зеленый звездочка и разветвленными стрелка в (С) обозначает , что BglII следует применять после линкера лигирования. Красные основные моменты вирусные последовательности, в то время как черные моменты клетки-хозяина последовательности. Точки Подразумеваемая перерыв ДНК (не в масштабе) помечены "X" ВИЧ-1 содержит многочисленные сайты MseI и BglII; только те, которые относятся к протоколу показаны. Скобки выше карты обозначают U5-клеточные участки ДНК преимущественно усугубленные LM-PCR. (D) Очищают фрагментированной ДНК (тогда конечным ремонт и А-хвост в случае озвучивания) и лигируют к (Е) , совместимых асимметричных молекул линкера (синего цвета). Magenta круги (D) указывают на сайт интеграции , который будет усилено. Звездочки на концах 3 'линкера коротких нитей обозначают Аминоблокирующие модификации. (F) Проведение первого раунда полу-гнездовой ПЦР с использованием первого раунда праймера LTR (красный) и компоновщика праймера (синий). В тего ПЦР круглые, компоновщик праймер кодирует кластеризация ДНК и связывания последовательностей (сгруппированных в виде зеленого придаток синего линкерной праймера) NGS праймера, в то время как праймер LTR не хватает таких последовательностей. (G) Очищают первый раунд ПЦР - продукт и провести второй раунд полу-гнездовой ПЦР. В этом раунде ПЦР, используют один и тот же линкер грунтовку, как в первом раунде (синий + зеленый придатков), вместе со вторым круглым праймера LTR (красного цвета), который переносит кластеризацию ДНК и последовательности праймера связывания NGS, а также штрих-кода для мультиплексирования ( сгруппированы в виде зеленого придаток к красной LTR праймера). (H) Очищают второго раунда ПЦР-продукта в качестве конечной библиотеки интеграции сайта (зажаты в пурпурного, с интеграционной сайта, отмеченного пурпурного круга). Отправить кратны секвенирования объекта для контроля качества и НГС. Пожалуйста , нажмите здесь , чтобы посмотреть увеличенную версию этой фигуры.

Рис . 2: P Значения для сравнения интеграции сайтов Amplified После фрагментацию ДНК путем обработки ультразвуком или путем расщепления рестриктазами в сравнении с соответствующими МРК Число интеграционных сайтов в пределах генов RefSeq и близлежащие острова CpG и ЦСС, а также профили региональных плотности генов, перечислены в значения Таблица 4 P ≥0.05 выделены жирным шрифтом и курсивом текста в виде P значения , рассчитанные по точным значениям Фишера тест B P , вычисленных Вилкоксона критерий суммы рангов с MRC Энц:.... соответствует случайный контроль; набор 50000 уникальных сайтов интеграции был произведен путем случайного выбора позиции в непосредственной близости от сайтов рестрикции MseI / BglII в сборке 19. рт.ст. d MRC случайным образом : соответствует случайный контроль , содержащий 10000 уникальных сайтов интеграции производства случайным образом selectiнг позиции в hg19 без нормализации на месте ограничение близости. Пожалуйста , нажмите здесь , чтобы посмотреть увеличенную версию этой фигуры.

Рисунок 3
Рисунок 3: Последовательность Логотипы изображающая ВИЧ-1 Базовые предпочтения из репрезентативных библиотек Эксперимент по интеграции сайтов из библиотек , подготовленных (A) расщеплением ферментами рестрикции или (B) озвучивания были приведены в соответствие с использованием программного обеспечения WebLogo.. Каждое разведение в серии титрование изображен, из аккуратной ДНК в верхней части рисунка до максимального разведении 1: 15625 в нижней части. (C) Последовательность логотип для MRC 50000 уникальных геномных сайтов. Столбики ошибок по существу представляют собой стандартное отклонение базовой регистрации в любом конкретном положении. Более конкретно, тОБЩИЙ высота каждого бара ошибки эквивалентна удвоенной небольшой коррекции образца 66, который контролирует за недооценки энтропии , присутствующей в относительно небольших наборов данных. Ось Х представляет клетки - хозяина геномных ДНК позиции нт относительно сайта интеграции в нулевой точке. Пожалуйста , нажмите здесь , чтобы посмотреть увеличенную версию этой фигуры.

Таблица 1
. Таблица 1: олигонуклеотидные последовательности для Linker строительства и ПЦР - амплификации линкер-специфические и второй раунд праймеров ДКП кодируют ДНК кластеризация адаптера последовательности, которые имеют цветовую маркировку следующим образом : черный, оснований , комплементарную линкера или к ВИЧ-1 LTR; красный, уникальный индекс или штрих-код; зеленый, секвенирование праймера сайты связывания; синий, адаптер последовательности для кластеризации ДНК. Single-конец (SE) секвенирование REActions будет использовать секвенирования праймер , который гибридизуется ко второму туру праймера READ1 LTR (зеленый) последовательности, в то время как парного (PE) реакции будут использовать оба (READ1 и read2) секвенирования праймеров. линкером короткие нити содержат 3 'Аминоблокирующие модификацию. Пожалуйста , нажмите здесь , чтобы посмотреть увеличенную версию этой таблицы.

реактив Добавление в реакции
Первый праймер Круглый LTR (15 мкМ): 2,5 мкл
Линкер-специфического праймера (15 мкМ): 0,5 мкл
10x ПЦР буфер: 2,5 мкл
дНТФ (2,5 мм каждый) 0,5 мкл
ДНК-полимераза смесь: 0,5 мкл
Реакция лигирования: 100 нг
Нуклеазы без воды: до 25 мкл

Таблица 2:. Рецепт первом раунде ПЦР Количество каждого указанного реагента , которые будут добавлены к каждой отдельной ПЦР трубка показана.

реактив Добавление в реакции
Второй раунд LTR праймера (15 мкМ): 2,5 мкл
Линкер-специфического праймера (15 мкМ): 0,5 мкл
10x ПЦР буфер: 2,5 мкл
дНТФ (2,5 мм каждый) 0,5 мкл
ДНК-полимераза смесь: 0,5 мкл
Первый раунд ПЦР: 100 нг
Нуклеазы без воды: до 25 мкл

Таблица 3:. Второй раунд ПЦР Рецепт Количество каждого реагента , чтобы быть добавлены в каждую пробирку PCR указывается.

<TD> Digest, 1: 125
Библиотека #Unique Сайты % RefSeq % CpG +/- 2,5 кб б % TSS +/- 2,5 кб с Avg. Гена плотности +/- 500 кб d
Озвучивание, аккуратный 3169 71,2 5.1 3.7 15.8
Обработку ультразвуком, 1: 5 366 75,1 2.7 3 16,3
254 74 7.1 5.1 16.7
Обработку ультразвуком, 1: 125 430 69,8 6.9 6 14.6
Обработку ультразвуком, 1: 625 314 65,6 5.6 6.7 13.5
Озвучивание, 1: 3125 116 73,6 3.5 2.5 13.1
Обработку ультразвуком, 1: 15625 72 62,5 0 1.4 14.7
Дайджест, аккуратный 7428 69,8 3.6 2.9 15,2
Дайджест, 1: 5 1460 71,4 4.4 3.4 14,9
Digest, 1:25 394 68,8 4.3 3.3 15.8
172 71 0 3 14
Дайджест, 1: 625 134 73,9 3.7 3.7 14.1
Дайджест, 1: 3125 100 83,1 6.4 5.2 19,1
Дайджест, 1: 15625 73 74 4.1 1.4 9.7
MRC Энц е 50000 44,7 4.2 4 8.7
MRC случайным образом е 10000 41,3 5.3 4.2 8.6

Таблица 4: геномная Распределение интеграции сайтов из представителя серии титрования Процент от общего числа сайтов интеграции тыс.при падении в пределах RefSeq генов, Ь в пределах 2,5 кб CpG островков, и с в пределах 2,5 кб TSSS d Плотность генов в пределах 1 Мб , окружающих средний сайт интеграции электронной MRC Энц:.. соответствует случайный контроль; набор 50000 уникальных сайтов интеграции был произведен путем случайного выбора позиции в непосредственной близости от сайтов рестрикции MseI / BglII в hg19 F MRC случайным:. совпавшего случайного управления , содержащий 10000 уникальных сайтов интеграции , полученные путем случайного выбора позиции в hg19 без нормализации на фиксированных позициях.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Протокол для анализа ретровирусных сайтов интеграции, от начальной стадии вирусной инфекции с помощью картирования геномных схем распределения, описан. Этот протокол применим к любому ретровируса и любого заражае- типа клеток. Кроме того, трубопровод анализа весьма чувствителен, с потенциалом , чтобы восстановить удовлетворительное количество уникальных сайтов интеграции с серийными разведениями геномного эквивалента ДНК , что инфекции , инициированного с MOI 6,4 х 10 -5. Эта чувствительность делает протокол особенно полезен при применении к образцам из инфицированных пациентов, которые могут содержать низкий уровень вирусной нагрузки, где только небольшая часть клеток будет питать интегрированный провируса. В соответствии с методологией предыдущих работ в этой области 36,38,41-43, несколько шагов в части биоинформатики этого протокола выиграют от разработки пользовательских сценариев для обработки больших файлов данных последовательностей. В то время как BLAT 58 маpping утилиты , описанной в этом протоколе, пользователи могут найти Боути 67 (http://bowtie-bio.sourceforge.net/index.shtml) , чтобы быть подходящей альтернативой.

Альтернативным трубопровода биоинформатики Недавно сообщалось , для определения вируса мышиного лейкоза Молони (MoMLV) интеграции сайтов 19. Этот газопровод полезен тем, что он был разработан в самостоятельное программное обеспечение, которое в открытом доступе, и является достаточно мощным, что он был первоначально использован для отображения сотни тысяч уникальных сайтов интеграции MoMLV. Тем не менее, доступное программное обеспечение было первоначально разработано специально для повторного анализа сообщил MoMLV набор данных, и поэтому перепрограммирование будет необходимо настроить трубопровод чередовать экспериментальных конструкций (функциональность инструмента недавно был расширен за счет включения аденоассоциированный вирус и Tol2 и Ac / Ds транспозонов векторы 68). Кроме того, этот протокол описывает поколение сайта предварительной интеграции .bedфайл, но не выкладывайте конкретные шаги, необходимые для карты сайтов на соответствующие геномные аннотаций. Читатели могут найти "Вектор интеграции Анализ сайта" сервер 69, который был выпущен в ходе обзора текущей рукописи, полезные для анализа последовательностей NGS , сгенерированные с использованием протокола , описанного здесь.

Некоторые моменты следует подчеркнуть, при использовании любого протокола для анализа наборов данных ретровирусных интеграции сайта. При подготовке нескольких библиотек в тандеме, значительный потенциал существует для образца перекрестного загрязнения. Даже очень маленький уровень перекрестных помех дискретизации может затенить результаты до уровня рендеринга перспективе NGS непригодным для использования. Таким образом, вся мокрая-скамейка работа должна быть завершена в стерилизованную, посвященном ламинарный или ПЦР-станции. Набор пипеток и реагентов, таких как нуклеазы без воды должен быть посвящен исключительно для усиления интеграции сайта. Использование уникальных линкеров для каждого препарата библиотеки может ограничить потенциалдля поперечного усиления, а также позволяет идентифицировать кроссовер читает внутри каждой библиотеки в сырых FASTA файлов.

Важно, чтобы рассмотреть плюсы и минусы использования ультразвука по сравнению с рестрикционной эндонуклеазой фрагментировать геномной ДНК. С одной стороны, обработка ультразвуком обеспечивает относительно случайное распределение касательных точек, однако в дальнейшем требуется ремонт, ДНК и хвостохранилища шаги последовательно снижает выход компоновщика лигирования продуктов по сравнению с перевязку, выполненных с ферментом рестрикции сгенерированных липкими концами. С другой стороны, ферментами рестрикции обеспечивает менее ОТПУЩЕНЫ популяцию сдвига точек, которые будут неизменно ввести некоторые погрешности в восстановленных данных. Используя рестриктазой отбрасывать вверх по течению последовательности LTR будут в обоих случаях (рис 1) приводит к потере небольшой части интеграции сайтов, лежащих выше по течению от этого сайта в геноме. Любые смещения данных, которые могут привести может быть объявлениеодеты, опуская ферментативного расщепления из протокола во время подготовки библиотеки и фильтрации множества в результате вверх по течению последовательности LTR из данных секвенирования.

Хотя текущий протокол весьма чувствителен и способен генерировать миллионы уникальных сайтов интеграции 21,40, только около одной трети всех имеющихся интеграций может быть как ожидается, будет усиливаться в данном эксперименте , даже с лучшими из библиотеки препаратов (см. 70 и неопубликованные наблюдения). Это может вызвать осложнения при анализе образцов от низких инфекций МВД России или пациентов, которые укрывают низкой вирусной нагрузки. Это ограничение может быть преодолено частично путем повторного секвенирования же препарат библиотеки и / или секвенирования несколько библиотек, полученных из того же образца ДНК параллельно. Будущее повышение чувствительности анализа, соответственно, будет очень полезным для Содействуя поступательных применений ретровирусов секвенирования интеграции сайта.

Subscription Required. Please recommend JoVE to your librarian.

Acknowledgments

Мы благодарны нашим коллегам Стивен Хьюз и Генри Левин за советом, что имеет решающее значение для установления протокола NGS для ретровирусов секвенирования интеграции сайта в лаборатории Энгельман. Эта работа была поддержана США Национальных институтов здравоохранения гранты AI039394 и AI052014 (к АНХ) и AI060354 (Harvard University Центр исследований в области СПИДа).

Materials

Name Company Catalog Number Comments
DMEM Gibco 11965-084 Standard cell culture medium, compatible with HEK293T cells
Fetal Bovine Serum Thermo Scientific SH 30088.03 Different lots of serum may need to be pre-screened for optimal viral production
Penicillin/Streptomycin Corning 30-002-Cl Antibiotics to be added to DMEM
Phosphate-Buffered saline Mediatech 21-040-CV Used to wash cells
Trypsin EDTA Corning 25-053-CI Used to detach adherent cells from tissue culture plates
PolyJet SignaGen Laboratories SL100688 DNA transfection reagent
0.45 µm Filters Thermo Scientific 09-740-35B Used to filter virus particle-containing cell culture media
Turbo DNase Ambion AM2239 Used to degrade carryover plasmid DNA from virus stocks
HIV-1 p24 Antigen Capture Assay ABL Inc. 5447 Used to quantify yield of virus production
DNeasy Blood & Tissue Kit Qiagen 69506 Used to purify genomic DNA from cells
Sonicator Covaris S2 With this model of sonicator perform two rounds of duty cycle, 5%; intensity, 3; cycles per burst, 200; time, 80 sec
Nuclease-Free Water GeneMate G-3250-125 Commercially-available water is recommended to reduce the possibility of sample cross-contamination
QIAQuick PCR Purification Kit Qiagen 28106 Used to purify DNA during library construction
End-It DNA End-Repair Kit Epicentre ER81050 Used to repair DNA ends of sonicated DNA samples
Klenow Fragment (3'-5' exo–) New England Biolabs (NEB) M0212S Used with dATP to A-tail repaired DNA fragments
dATP Thermo Scientific R0141 Deoxyadenosine triphosphate
MseI NEB R0525L Restriction endonuclease for genomic DNA cleavage
BglII NEB R0144L Restriction endonuclease to suppress amplification of upstream HIV-1 U5 sequence
T4 DNA Ligase NEB M0202L/6218 Enzyme for covalent joining of compatible DNA ends
DNA Oligonucleotides Integrated DNA Technologies custom Have the company purify the oligos. HPLC purification suffices for DNAs <30 nucleotides; PAGE purify longer DNAs 
Advantage 2 Polymerase Mix Clontech 639202 Commercial mix containing DNA polymerase for PCR
dNTPs (100 mM solutions) Thermo Scientific R0181 Dilute the four chemicals on ice with sterile water to reach the intermediate worrking concentrations of 2.5 mM each dNTP
NanoDrop Thermo Scientific NanoDrop 2000 Spectrophotometer for determination of DNA concentration
Qubit Fluorimeter Life Technologies Qubit® 3.0 Fluorometer used to confirm integration site library DNA concentration
2200 TapeStation System Agilent G2964AA Tape-based assay to confirm integration site library DNA size distribution
MiSeq Illumina SY-410-1003 Used for NGS

DOWNLOAD MATERIALS LIST

References

  1. Craigie, R., Bushman, F. D. HIV DNA integration. Cold Spring Harb. Perspect. Med. 2, a006890 (2012).
  2. Li, M., Mizuuchi, M., Burke, T. R. J., Craigie, R. Retroviral DNA integration: reaction pathway and critical intermediates. EMBO J. 25, 1295-1304 (2006).
  3. Hare, S., Gupta, S. S., Valkov, E., Engelman, A., Cherepanov, P. Retroviral intasome assembly and inhibition of DNA strand transfer. Nature. 464, 232-236 (2010).
  4. Hare, S., Maertens, G. N., Cherepanov, P. 3'-processing and strand transfer catalysed by retroviral integrase in crystallo. EMBO J. 31, 3020-3028 (2012).
  5. Fujiwara, T., Mizuuchi, K. Retroviral DNA integration: structure of an integration intermediate. Cell. 54, 497-504 (1988).
  6. Roth, M. J., Schwartzberg, P. L., Goff, S. P. Structure of the termini of DNA intermediates in the integration of retroviral DNA: dependence on IN function and terminal DNA sequence. Cell. 58, 47-54 (1989).
  7. Brown, P. O., Bowerman, B., Varmus, H. E., Bishop, J. M. Retroviral integration: structure of the initial covalent product and its precursor, and a role for the viral IN protein. Proc. Natl. Acad. Sci. USA. 86, 2525-2529 (1989).
  8. Pauza, C. D. Two bases are deleted from the termini of HIV-1 linear DNA during integrative recombination. Virology. 179, 886-889 (1990).
  9. Bowerman, B., Brown, P. O., Bishop, J. M., Varmus, H. E. A nucleoprotein complex mediates the integration of retroviral DNA. Genes Dev. 3, 469-478 (1989).
  10. Bukrinsky, M. I., et al. Active nuclear import of human immunodeficiency virus type 1 preintegration complexes. Proc. Natl. Acad. Sci. USA. 89, 6580-6584 (1992).
  11. Miller, M. D., Farnet, C. M., Bushman, F. D. Human immunodeficiency virus type 1 preintegration complexes: studies of organization and composition. J. Virol. 71, 5382-5390 (1997).
  12. Engelman, A., Mizuuchi, K., Craigie, R. HIV-1 DNA integration: mechanism of viral DNA cleavage and DNA strand transfer. Cell. 67, 1211-1221 (1991).
  13. Maertens, G. N., Hare, S., Cherepanov, P. The mechanism of retroviral integration from X-ray structures of its key intermediates. Nature. 468, 326-329 (2010).
  14. Holman, A. G., Coffin, J. M. Symmetrical base preferences surrounding HIV-1, avian sarcoma/leukosis virus, and murine leukemia virus integration sites. Proc. Natl. Acad. Sci. USA. 102, 6103-6107 (2005).
  15. Wu, X., Li, Y., Crise, B., Burgess, S. M., Munroe, D. J. Weak palindromic consensus sequences are a common feature found at the integration target sites of many retroviruses. J. Virol. 79, 5211-5214 (2005).
  16. Kvaratskhelia, M., Sharma, A., Larue, R. C., Serrao, E., Engelman, A. Molecular mechanisms of retroviral integration site selection. Nucleic Acids Res. 42, 10209-10225 (2014).
  17. Schroder, A. R., et al. HIV-1 integration in the human genome favors active genes and local hotspots. Cell. 110, 521-529 (2002).
  18. Wu, X., Li, Y., Crise, B., Burgess, S. M. Transcription start regions in the human genome are favored targets for MLV integration. Science. 300, 1749-1751 (2003).
  19. LaFave, M. C., et al. MLV integration site selection is driven by strong enhancers and active promoters. Nucleic Acids Res. 42, 4257-4269 (2014).
  20. De Ravin, S. S., et al. Enhancers are major targets for murine leukemia virus vector integration. J. Virol. 88, 4504-4513 (2014).
  21. Maskell, D. P., et al. Structural basis for retroviral integration into nucleosomes. Nature. 523, 366-369 (2015).
  22. Serrao, E., et al. Integrase residues that determine nucleotide preferences at sites of HIV-1 integration: implications for the mechanism of target DNA binding. Nucleic Acids Res. 42, 5164-5176 (2014).
  23. Aiyer, S., et al. Structural and sequencing analysis of local target DNA recognition by MLV integrase. Nucleic Acids Res. 43, 5647-5663 (2015).
  24. Ciuffi, A., et al. A role for LEDGF/p75 in targeting HIV DNA integration. Nat. Med. 11, 1287-1289 (2005).
  25. Sharma, A., et al. BET proteins promote efficient murine leukemia virus integration at transcription start sites. Proc. Natl. Acad. Sci. USA. 110, 12036-12041 (2013).
  26. Gupta, S. S., et al. Bromo- and extraterminal domain chromatin regulators serve as cofactors for murine leukemia virus integration. J. Virol. 87, 12721-12736 (2013).
  27. De Rijck, J., et al. The BET family of proteins targets moloney murine leukemia virus integration near transcription start sites. Cell Rep. 5, 886-894 (2013).
  28. Demeulemeester, J., et al. HIV-1 integrase variants retarget viral integration and are associated with disease progression in a chronic infection cohort. Cell Host Microbe. 16, 651-662 (2014).
  29. Meehan, A. M., et al. LEDGF/p75 proteins with alternative chromatin tethers are functional HIV-1 cofactors. PLoS Pathog. 5, e1000522 (2009).
  30. Ferris, A. L., et al. Lens epithelium-derived growth factor fusion proteins redirect HIV-1 DNA integration. Proc. Natl. Acad. Sci. USA. 107, 3135-3140 (2010).
  31. Gijsbers, R., et al. LEDGF hybrids efficiently retarget lentiviral integration into heterochromatin. Mol. Ther. 18, 552-560 (2010).
  32. Aiyer, S., et al. Altering murine leukemia virus integration through disruption of the integrase and BET protein family interaction. Nucleic Acids Res. 42, 5917-5928 (2014).
  33. Jahner, D., Jaenisch, R. Integration of Moloney leukaemia virus into the germ line of mice: correlation between site of integration and virus activation. Nature. 287, 456-458 (1980).
  34. Stevens, S. W., Griffith, J. D. Human immunodeficiency virus type 1 may preferentially integrate into chromatin occupied by L1Hs repetitive elements. Proc. Natl. Acad. Sci. USA. 91, 5557-5561 (1994).
  35. Wang, G. P., Ciuffi, A., Leipzig, J., Berry, C. C., Bushman, F. D. HIV integration site selection: analysis by massively parallel pyrosequencing reveals association with epigenetic modifications. Genome Res. 17, 1186-1194 (2007).
  36. Wang, G. P., et al. DNA bar coding and pyrosequencing to analyze adverse events in therapeutic gene transfer. Nucleic Acids Res. 36, e49 (2008).
  37. Roth, S. L., Malani, N., Bushman, F. D. Gammaretroviral integration into nucleosomal target DNA in vivo. J. Virol. 85, 7393-7401 (2011).
  38. Ciuffi, A., Barr, S. D. Identification of HIV integration sites in infected host genomic DNA. Methods. 53, 39-46 (2011).
  39. Gillet, N. A., et al. The host genomic environment of the provirus determines the abundance of HTLV-1-infected T-cell clones. Blood. 117, 3113-3122 (2011).
  40. Matreyek, K. A., et al. Host and viral determinants for MxB restriction of HIV-1 infection. Retrovirology. 11, 90 (2014).
  41. Ciuffi, A., et al. Methods for integration site distribution analyses in animal cell genomes. Methods. 47, 261-268 (2009).
  42. Brady, T., et al. A method to sequence and quantify DNA integration for monitoring outcome in gene therapy. Nucleic Acids Res. 39, e72 (2011).
  43. Beard, B. C., Adair, J. E., Trobridge, G. D., Kiem, H. P. High-throughput genomic mapping of vector integration sites in gene therapy studies. Methods Mol. Biol. 1185, 321-344 (2014).
  44. Page, K. A., Landau, N. R., Littman, D. R. Construction and use of a human immunodeficiency virus vector for analysis of virus infectivity. J. Virol. 64, 5270-5276 (1990).
  45. Emi, N., Friedmann, T., Yee, J. K. Pseudotype formation of murine leukemia virus with the G protein of vesicular stomatitis virus. J. Virol. 65, 1202-1207 (1991).
  46. Wehrly, K., Chesebro, B. p24 antigen capture assay for quantification of human immunodeficiency virus using readily available inexpensive reagents. Methods. 12, 288-293 (1997).
  47. Goff, S., Traktman, P., Baltimore, D. Isolation and properties of Moloney murine leukemia virus mutants: use of a rapid assay for release of virion reverse transcriptase. J. Virol. 38, 239-248 (1981).
  48. Willey, R. L., et al. In vitro mutagenesis identifies a region within the envelope gene of the human immunodeficiency virus that is critical for infectivity. J. Virol. 62, 139-147 (1988).
  49. Butler, S. L., Hansen, M. S., Bushman, F. D. A quantitative assay for HIV DNA integration in vivo. Nat. Med. 7, 631-634 (2001).
  50. Brussel, A., Sonigo, P. Analysis of early human immunodeficiency virus type 1 DNA synthesis by use of a new sensitive assay for quantifying integrated provirus. J. Virol. 77, 10119-10124 (2003).
  51. Serrao, E., Ballandras-Colas, A., Cherepanov, P., Maertens, G. N., Engelman, A. N. Key determinants of target DNA recognition by retroviral intasomes. Retrovirology. 12, 39 (2015).
  52. Maldarelli, F., et al. HIV latency. Specific HIV integration sites are linked to clonal expansion and persistence of infected cells. Science. 345, 179-183 (2014).
  53. Wagner, T. A., et al. HIV latency. Proliferation of cells with HIV integrated into cancer genes contributes to persistent infection. Science. 345, 570-573 (2014).
  54. Cohn, L. B., et al. HIV-1 integration landscape during latent and active infection. Cell. 160, 420-432 (2015).
  55. Li, X., Ben-Dov, I. Z., Mauro, M., Williams, Z. Lowering the quantification limit of the QubitTM RNA HS assay using RNA spike-in. BMC Mol. Biol. 16, 9 (2015).
  56. Padmanaban, A., Walker, D. M. Analysis of high molecular weight genomic DNA using the Agilent 2200 TapeStation and genomic DNA ScreenTape. Publication number 5991-1797EN Agilent Technologies. , Agilent Technologies, Inc. Santa Clara, CA. (2013).
  57. Kapa library quantification technical guide version v1.14. , KapaBiosystems. Boston, MA. (2014).
  58. Kent, W. J. BLAT--the BLAST-like alignment tool. Genome Res. 12, 656-664 (2002).
  59. Quinlan, A. R., Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26, 841-842 (2010).
  60. Gaur, M., Leavitt, A. D. Mutations in the human immunodeficiency virus type 1 integrase D,D(35)E motif do not eliminate provirus formation. J. Virol. 72, 4678-4685 (1998).
  61. Varadarajan, J., McWilliams, M. J., Hughes, S. H. Treatment with suboptimal doses of raltegravir leads to aberrant HIV-1 integrations. Proc. Natl. Acad. Sci. USA. 110, 14747-14752 (2013).
  62. Kent, W. J., et al. The human genome browser at UCSC. Genome Res. 12, 996-1006 (2002).
  63. Berry, C. C., et al. Estimating abundances of retroviral insertion sites from DNA fragment length data. Bioinformatics. 28, 755-762 (2012).
  64. Firouzi, S., et al. Development and validation of a new high-throughput method to investigate the clonality of HTLV-1-infected cells based on provirus integration sites. Genomic Med. 6, 46 (2014).
  65. Mitchell, R. S., et al. Retroviral DNA integration: ASLV, HIV, and MLV show distinct target site preferences. PLoS Biol. 2, E234 (2004).
  66. Schneider, T. D., Stormo, G. D., Gold, L., Ehrenfeucht, A. Information content of binding sites on nucleotide sequences. J. Mol. Biol. 188, 415-431 (1986).
  67. Langmead, B. Chapter 11, Unit 11. 17, Aligning sort sequencing reads with Bowtie. Curr. Protoc. Bioinformatics. , (2010).
  68. LaFave, M. C., Varshney, G. K., Burgess, S. M. GeIST: a pipeline for mapping integrated DNA elements. Bioinformatics. 31, 3219-3221 (2015).
  69. Hocum, J. D., et al. VISA - Vector Integration Site Analysis server: a web-based server to rapidly identify retroviral integration sites from next-generation sequencing. BMC Bioinformatics. 16, 212 (2015).
  70. Gabriel, R., et al. Comprehensive genomic access to vector integration in clinical gene therapy. Nat. Med. 15, 1431-1436 (2009).
  71. TruSeq Library Prep Pooling Guide. Guidelines for pooling TruSeq libraries for Illumina sequencing systems that require balanced index combinations. , Source: https://support.illumina.com/downloads/truseq-library-prep-pooling-guide-15042173.html (2015).

Tags

Вирусологии выпуск 109 ретровируса ВИЧ-1 интеграция интегразы интеграция сайтов следующего поколения секвенирования
Amplification, следующего поколения Секвенирование и геномную ДНК Mapping ретровирусных интеграции сайты
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Serrao, E., Cherepanov, P.,More

Serrao, E., Cherepanov, P., Engelman, A. N. Amplification, Next-generation Sequencing, and Genomic DNA Mapping of Retroviral Integration Sites. J. Vis. Exp. (109), e53840, doi:10.3791/53840 (2016).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter