Genetics

Обнаружение редких событий, с помощью Исправлена ошибка ДНК и РНК последовательности

Published: August 3, 2018 doi: 10.3791/57509

Wing H. Wong*^1,2, R. Spencer Tong*^1,2, Andrew L. Young^1,2, Todd E. Druley^1,2

¹Department of Pediatrics, Division of Hematology and Oncology, Washington University School of Medicine, ²Center for Genome Sciences and Systems Biology, Washington University School of Medicine

* These authors contributed equally

Summary

Секвенирование нового поколения (НГС) является мощным инструментом для геномной характеристика, который ограничен высокой погрешность платформы (~0.5–2.0%). Мы описываем наши методы Исправлена ошибка последовательности, которые позволяют нам избежать NGS ошибка оценить и выявить мутации в вариант аллеля фракций же редки, как 0,0001.

Abstract

Обычные секвенирование нового поколения техники (НГС) позволили огромные геномной характеристика для более десяти лет. В частности NGS был использован для анализа спектра клоновых мутаций в злокачественности. Хотя гораздо более эффективным, чем традиционные методы Сэнгер, NGS борется с выявления редких клоновых и subclonal перегласовок из-за его высокой погрешность, % ~0.5–2.0. Таким образом, стандартные NGS имеет предел обнаружения мутаций, которые > 0,02 вариант аллеля дроби (VAF). Хотя клиническое значение для перегласовок этой редкой у больных без известных заболеваний остается неясным, пациентов лейкемии значительно улучшились исходы при остаточной болезни < 0,0001 подачей cytometry. Для смягчения этого артефакта фон NGS, были разработаны многочисленные методы. Здесь мы описываем метод для исправления ошибок ДНК и РНК последовательности (ECS), который включает в себя пометки отдельных молекул с 16 bp случайный индекс для исправления ошибок и 8 bp пациент индекса для мультиплексирования. Наш метод может обнаруживать и отслеживать клоновых мутации в вариант аллеля фракции (VAFs) на два порядка ниже, чем предел обнаружения NGS и редким, как 0,0001 VAF.

Introduction

Как мы возраста, подверженности мутагенов и стохастические ошибки во время результат деления клеток в накопление соматических аберраций в геноме и это лежит в основе основополагающих патогенеза злокачественной трансформации, нейро развития болезней, педиатрии расстройств и нормального старения¹^,². Соматические мутации с болезнью вождение потенциал являются важные диагностические и прогностические biomarkers для раннего обнаружения и риска управления³^,⁴^,⁵. Чтобы лучше понять физиологические clonogenesis, который будет информировать клинических и исследовательские решения, точное количественное определение и характеристика этих мутаций имеет первостепенное значение. Секвенирование нового поколения (НГС) в настоящее время используется для изучения клоновых мутации в гетерогенных образцов ДНК; Однако, NGS ограничивается выявления мутаций в > 0,02 вариант аллеля дроби (VAF) — из-за присущего погрешность 0,5 – 2,0% от виртуализации платформ⁶^,^,⁷⁸. В результате отслеживание диагностически и прогностически значительные соматических варианты на нижней VAF нельзя достичь с помощью стандартных NGS.

Недавно различные методы были разработаны для того, чтобы обойти погрешность NGS⁸^,⁹^,¹⁰^,¹¹. Эти методы используют молекулярные пометки, что позволяет коррекции ошибок после виртуализации. Каждая молекула или геномных фрагмент в библиотеке последовательности маркирован с случайных уникальной молекулярной идентификатор (UMI), относящихся к этой молекулы. UMIs построены перестановок строки рандомизированных нуклеотидов (N 8 – 16). Второй образец специфические штрих также интегрированы в процесс, который позволяет мультиплексирование нескольких образцов в же NGS последовательности запуска. Амплификации PCR выполняется на молекулярно меткой Библиотека, и впоследствии библиотека отправляется для виртуализации. Во время подготовки библиотека ожидается, что ошибки будут случайным образом представил геномной фрагмент во время ПЦР-амплификации и последовательности⁸. Чтобы удалить последовательность случайных ошибок, сырой последовательности читает сгруппированы по UMI. Артефакты из последовательности, как ожидается, не присутствовать в всех читает с же UMI на той же геномную позиции благодаря стохастический характер введения, в то время как истинный вариант будет добросовестно усиливается и виртуализированных в всех чтений, которые разделяют же UMI. Артефакты, bioinformatically удалены. Здесь мы опишем три метода Исправлена ошибка виртуализации (ECS) оптимизированы в лаборатории для ДНК для определения единичных нуклеотидных варианты (SNVs) и небольшие вставки удаление (Indels) и РНК для облегчения количественной оценки экспрессии генов ниже Порог ошибки NGS.

Первый метод описывает способ искать редкие соматических событие с помощью гена конкретных грунты, разработанный исследователями. До подготовки библиотека исследователи должны разработать грунтовки выделять фрагменты интерес. Мы использовали Primer3 веб приложение (http://bioinfo.ut.ee/primer3-0.4.0/). Ампликонов 200 – 250 bp являются идеальными для полимеразной цепной реакции (ПЦР), как они будут, как только были включены UMIs, создания перекрывающихся паре конец читает с 150 bp в паре конец читает. Условия оптимального грунтовка дизайн использоваться: минимальный размер грунтовки = 19; Оптимальное грунтовка размер = 25; Максимальная грунтовка размер = 30; Минимальный ТМ = 64 ° C; Оптимальное ТМ = 70 ° C; Максимальная ТМ = 74 ° C; Максимальная разница ТМ = 5 ° C; Минимальное содержание GC = 45; Максимальное содержание GC = 80; Возвращаемое число с = 20; Максимум 3' конца стабильность = 100.

В метод 2 мы описываем метод, объединяющий ECS-ДНК протокол с Illumina химия обследовать клоновых SNVs и малых Indels же редки, как 0,0001 VAF использование коммерчески доступных гена панелей, которые включают сотни ампликонов. Мы использовали TruSight миелоидной секвенирования панели (Illumina) для нашего эксперимента и разработан расширенной группы включить дополнительные гены интереса для педиатрических миелоидного заболеваний. Эти панели не предлагают уникальные идентификаторы молекулярной (UMIs), которые облегчат коррекции ошибок, поэтому мы добавили наши собственные стратегии адаптер для этих групп. ECS должны работать одинаково хорошо с любым из других групп, призванных обогатить генов, связанных с различными заболеваниями. После изоляции ДНК и последующей количественной оценки из ткани или образец интерес, рекомендуется иметь по крайней мере 500 нг акций ДНК за образец. Мы регулярно делать одной последовательности библиотеки с помощью 250 нг ДНК с целью захватить как много уникальных геномной фрагмент как можно ниже по течению читает дедупликации и VAF вычисления. Библиотеку Факультативный реплицировать последовательности могут быть сделаны с оставшиеся 250 нг ДНК. Мы всегда делают два реплицировать библиотеки на образец, и мы считаем, что только те события, которые самостоятельно обнаружены в обоих реплицирует как истинных положительных результатов. Мы также реализована модель геномной позицию конкретного биномиальное ошибок для повышения точности вариант вызова⁴^,¹³.

И наконец мы описываем метод сцепления ECS РНК последовательности для квантификации Стенограмма с использованием готовых панелей QIAseq целевых РНК (Qiagen). UMIs необходимые для устранения дублирования и исправление ошибок были включены в наборы, и исследователи могут сделать библиотеки, следуя рекомендациям изготовителя. Bioinformatically, исследователи могут следовать трубопровода, предусмотренных для ECS-ДНК, которая будет подробно в разделе протокол.

Protocol

1. целевой исправлена ошибка последовательности ДНК

ПЦР-амплификация фрагментов геномной интерес.
1. Используйте высококачественный ДНК полимеразы для того чтобы усилить ампликонов (Таблица материалов, пункт 1). Усилить реакции PCR с соблюдением следующих условий в тепловой циклователь: 30 s на 98 ° C; 18-40 циклов 10 s на 98 ° C, 30 сек при 66 ° C и 30 s при 72 ° C; 2 мин при 72 ° C; Держите на 4 ° C.
2. Очищайте продуктов ПЦР с парамагнитными бусины (Таблица материалов, пункт 2). Добавьте реакции PCR корда в соотношении 1: 1.8 (том реакции PCR: шарик объем) согласно протоколу производителя. Элюировать с 20 мкл ddH₂O.
3. Количественную оценку концентрации ДНК (Таблица материалов, пункт 3), чтобы определить окончательный концентрации ДНК.
4. Запуск на геле агарозы 2% (Таблица материалов, пункт 4) чтобы подтвердить размер ампликонов Алиготе ДНК.
  Примечание: В качестве альтернативы, исследователи могут выбрать для выполнения анализа Bioanalyzer на продукты PCR, чтобы определить размер усиливается геномной фрагментов, а также концентрация продуктов.
Секвенирование адаптер отжига
1. Получите i7 адаптеры (Таблица материалов, пункт 5). Используйте их, поскольку они предоставляются для последующих шагов.
2. Приобрести адаптеры i5 16N коммерчески с следующую последовательность oligo (материалы таблицы пункта 6): ACACTCTTTCCCTACACGACGCTCTTCCGATCT AATGATACGGCGACCACCGAGATCTACAC(N1:25252525)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1) (N1)
  Примечание: 16N i5 Адаптеры заменить стандартный i5 адаптеры, и они являются адаптеры со строкой 16 случайных-нуклеотида для облегчения ECS.
3. Сделать 16N i5 адаптер рабочего раствора: 40 µL 100 мкм 16N i5 адаптер акций, 10 мкл буфера TE и 10 мкл раствора NaCl 500 мкм.
4. Аликвота 7,5 мкл рабочего раствора i5, подготовленных на шаге 1.2.3 в отдельной скважины ПЦР.
5. Добавьте 5 мкл пример конкретных i7 адаптера в соответствующее скважины.
6. Инкубируйте на 95 ° C за 5 мин, затем охладить на 1 ° С каждые 30 s до 4 ° C в тепловая велосипедист.
7. Держите на 4 ° C.
Конец ремонт и dA хвостохранилища библиотек
Примечание: Параллельно с адаптер отжига, один можно выполнить конец ремонт и dA хвостохранилища на ПЦР ампликонов от шага 1.1. После завершения этих шагов производится перевязка отожженная адаптеров на конце отремонтированы и dA белохвост ампликонов ПЦР с шагом 1,2. После перевязки адаптер строительство библиотеки ECS является полным.
1. Начните с более 1 мкг начиная ДНК (минимум ~ 200 ng)
2. Выполните ремонтно конец и dA хвост на ампликонов (Таблица материалов, пункт 7).
  1. Добавление 3.0 мкл конце приготовительный фермент смесь и 6,5 мкл буфера окончания ремонта.
  2. Инкубировать смесь для 30 мин при 20 ° C, затем в течение 30 мин при температуре 65 ° C и удерживайте при 4 ° C.
3. Выполняют лигирование отожженная адаптеров (Таблица материалов, пункт 8).
  1. Мкл 2,5 Отожженная адаптеров из шага 2, 15 мкл Блант/TA лигаза Mastermix и 1 мкл лигирование усилитель.
  2. Инкубировать смесь для 15 мин при 20 ° C, затем в течение 15 минут при 37 ° C.
4. Очистка библиотек с магнитной бусины (материалы Таблица пункт 2): добавить реакции PCR бисером в соотношении изменение 1: 0.75 (том реакции PCR: магнитный шарик тома):
  1. Пипетка 62.6 мкл раствора магнитный шарик в 83.5 мкл продуктов ПЦР из шага 1.2.7.
  2. Передача смеси 1.5 мл низкой привязки.
  3. Тщательно перемешать, закупорить вверх и вниз по крайней мере 10 раз.
  4. Оставьте смесь стоять при комнатной температуре в течение 5 минут.
  5. Место трубу на магнитный держатель. Инкубировать в течение 2 минут при комнатной температуре или до супернатант ясно.
  6. Удалите супернатант.
  7. Вымойте бусины с 200 мкл на 70% спирте.
  8. Инкубируйте 30 s. удалить этанола.
  9. Повторите этанола мыть раз.
  10. Просушите бисер.
  11. Элюировать с 20 мкл ddH₂O.
    Примечание: Это изменение в реакции PCR магнитный шарик соотношение преференциально будет удалить фрагменты ДНК, которые меньше, чем 200 bp.
Количественная оценка, капелька цифровой PCR
Примечание: Точные мутации количественная оценка требует строгого соблюдения количество молекул каждой библиотеки, которые загружаются на программы sequencer. Для достижения этой цели, количественной количество молекул для отдельных библиотек на единицу объема осуществляется с помощью цифровой платформы ПЦР (ddPCR) QX200 капли — Количественная ПЦР является альтернативным вариантом. После анализа ddPCR индикация будет указывать количество молекул в мкл каждой библиотеки.
1. Разбавьте ECS библиотек 1:1,000 разбавлением постепенно с коэффициентом 10 газа ПЦР-пробирки.
2. Подготовить следующие mastermix для ddPCR в 1,5 мл трубки: 10 мкл смеси ПЦР (Таблица материалов, пункт 9), 0,2 мкл P5 грунтовки, 0.2 мкл P7 грунтовки, 5 мкл ECS очищен продукта из шага 1.4.1. и 4,5 мкл ddH₂O.
3. Аликвота 20 мкл mastermix в каждый образец хорошо убедившись, что есть кратным 8.
  1. Аликвота 70 мкл капля масла поколения (Таблица материалов, пункт 10) в каждой скважины. Обложка кассету с резиновой прокладкой.
4. Сделайте капель с помощью капли генератора (Таблица материалов, пункт 11).
5. С помощью многоканальных дозаторов, загрузите капельки, созданного на шаге 1.4.4 в PCR пластина обеспечить что дозирование образца делается медленно в течение 5 секунд, чтобы избежать сдвига ДНК.
6. Усилить сигнал в капли для 40 циклов в тепловая велосипедист, используя следующие условия: 5 мин при 95 ° C; 40 циклов 30 s при 95 ° C, 1 мин на 63 ° C; 5 мин при 4 ° C, 5 минут при 90 ° C; а затем, удерживая при 4 ° C.
7. Подготовка ddPCR шаблон капелька читателя машины (Таблица материалов, пункт 11). Обеспечения спецификации для параметров для Абсолютной количественной оценки и использования QX200 ddPCR Ева Грин Супермикс.
8. После завершения анализа ddPCR, убедитесь, что установить порог же разногласия во всех образцах.
9. С помощью индикации концентрации от QX200 капли читателя, Алиготе соответствующий объем ввести желаемое количество молекул в последующем шаге.
Амплификации PCR библиотек для виртуализации
1. Подготовить следующие mastermix нужное количество молекул из шага 1.4.9: 25 мкл Q5 Mastermix (Таблица материалов, пункт 1), 2,5 мкл P5 праймера (10 мкм), 2,5 мкл P7 праймера (10 мкм), X µL ДНК, 20 X мкл ddH₂O.
2. Усилить библиотек из шага 1.5.1 в тепловая велосипедист, с использованием следующих условий: 30 s на 98 ° C; 20-кратной 10 s на 98 ° C, 30 s на 63 ° C, 30 сек при 72 ° C; 2 мин при 72 ° C; а затем, удерживая при 4 ° C.
3. Очистка библиотек с магнитной бусины (таблица материалов, пункт 2): добавить реакции PCR для магнитной бусины в изменение соотношения 1: 0.75 (том реакции PCR: магнитный шарик тома).
  1. Пипетка 37,5 мкл раствора магнитный шарик в 50 мкл ПЦР продукты из шага 1.5.2.
  2. Передача смеси 1.5 мл низкой привязки.
  3. Тщательно перемешать, закупорить вверх и вниз по крайней мере 10 раз.
  4. Оставьте смесь стоять при комнатной температуре в течение 5 мин.
  5. Место трубу на магнитный держатель. Инкубировать в течение 2 минут при комнатной температуре или до супернатант ясно.
  6. Удалите супернатант.
  7. Вымойте бусины с 200 мкл на 70% спирте.
  8. Инкубируйте 30 s. удалить этанола.
  9. Повторите этанола мыть раз.
  10. Просушите бисер.
  11. Элюировать с 20 мкл ddH₂O.
4. Запуск на 2% агарозном геле для подтверждения размера ампликонов Алиготе ДНК.
5. Количественную оценку концентрации ДНК (Таблица материалов, пункт 3), чтобы определить концентрацию отдельных библиотек ECS.
6. Объединять библиотеки в эквимолярных количествах.
  Примечание: например, исследователи могут объединять восемь библиотек в эквимолярных группы⁴ с 4 миллионов начиная молекул для виртуализации с использованием виртуализации платформы, которая выводит считывает до 400 млн. Консервативно рекомендуется использовать в среднем десяти необработанных читает для коррекции ошибок за молекул. Это займет до 360 миллионов читает (4 миллионов молекул * 8 библиотеки * 10 читает для коррекции ошибок). С 4 миллионов уникальных молекул в библиотеке исследователи может рассчитывать получить теоретические означает консенсус, читать освещение 7042 x за ампликон (4 миллиона/568 ампликонов из панели гена).
7. Количественную оценку концентрации ДНК (Таблица материалов, пункт 3), чтобы определить концентрацию пуле ECS библиотеки.
8. Представить обобщённые библиотека ECS на примерно 4 Нм.
9. Укажите следующие параметры последовательности Illumina виртуализации платформ (MiSeq, HiSeq или NextSeq): 2 x 144 паре конец читает, 8 циклов индекс 1 и 16 циклов индекса 2.

2. ген панели с Исправлена ошибка секвенирования ДНК

Гибридизация oligos от гена панелей
Примечание: В этот шаг, один будет построить последовательность библиотек с помощью измененного Протокола Illumina TruSight или TruSeq для включения UMIs (Таблица материалов, пункт 17).
1. Гибридизируйте oligos на геномной фрагмент после производителя протокол. Использование 250 нг ДНК (или любое желаемое количество исходного материала).
2. Удаление несвязанных oligos производителя протоколом.
3. Выполните расширение перевязка после производителя протокол.
  Примечание: Изменения производителя протокол приступить ниже.
Включение i5 и i7 адаптеры через PCR
1. Подготовьте mastermix ПЦР, закупорить следующих реагентов в трубку размера соответствующего тома: 37,5 мкл Q5 Mastermix (Таблица материалов, пункт 1), 6 мкл 10 мкм 16N i5 адаптеров (подробно метод 1, шаг 1.2.2), 6 мкл адаптеров (использование разных i7 i7 Адаптеры для отдельных образцов для мультиплексирования) и 22 мкл раствора расширение перевязка с бусами из шага 2.1.3.
  Примечание: Q5 Mastermix заменяет mastermix полимеразы, предоставляемый Illumina. Q5 полимеразы усиливает геномной фрагмент с высокой точностью и меньше интродуцированных ошибок.
2. Запустите программу ПЦР на тепловая велосипедист, используя следующие параметры: 30 s на 98 ° C, 4-6 циклов 10 s на 98 ° C, 30 s при 66 ° C, 30 s при 72 ° C; 2 мин при 72 ° C, а затем провести на 4 ° C.
  Примечание: Количество циклов зависит размер панели. Из нашего опыта 4-цикла PCR является достаточным, если группа ген имеет около 1500 различных пар генов конкретных oligos, в то время как группа с 500-600 пар oligos требует 6 циклов PCR.
3. Очистить ПЦР-реакции с магнитной бусины (таблица материалов, пункт 2): добавить реакции PCR для магнитной бусины в модифицированных 1 реакции PCR: 0,75 магнитный шарик соотношение:
  1. Пипетка 56,25 мкл раствора магнитный шарик в 75 мкл продуктов ПЦР из шага 2.2.2.
  2. Передача смеси 1.5 мл низкой привязки.
  3. Тщательно перемешать, закупорить вверх и вниз по крайней мере 10 раз.
  4. Оставьте смесь стоять при комнатной температуре в течение 5 мин.
  5. Место трубу на магнитный держатель. Проинкубируйте 2 мин при комнатной температуре или до супернатант ясно.
  6. Удалите супернатант.
  7. Вымойте бусины с 200 мкл на 70% спирте.
  8. Инкубируйте 30 s. удалить этанола.
  9. Повторите этанола мыть раз.
  10. Просушите бисер.
  11. Элюировать с 20 мкл ddH₂O.
Количественно библиотек с помощью QX200 ddPCR платформы.
1. Выполните шаг 1.4 в методе 1.
  Примечание: 4 миллионов молекул были нормализованы в образец библиотеки⁴ в результате представитель (рис. 2) для получения теоретической означает 7,042 уникально индексированных молекул (4 миллиона разделены 568 ген специфического oligos).
Усилить и нормализовать библиотек для виртуализации.
1. Усилить желаемое количество молекул с помощью следующих mastermix для окончательного PCR, на общую сумму 50 мкл: 25 мкл Q5 Mastermix, 2 мкл P5 праймера (1 мкм), 2 мкл P7 праймера (1 мкм) и 21 мкл молекул ДНК.
2. Запустите программу ПЦР на тепловая велосипедист, с помощью следующего параметра: 30 s на 98 ° C; 16 циклов 10 s на 98 ° C, 30 s при 66 ° C, 30 сек при 72 ° C; 2 мин при 72 ° C; а затем, удерживая при 4 ° C.
3. Очистка библиотек последовательности с использованием магнитной бусины (Таблица материалов, пункт 2): добавить реакции PCR для магнитной бусины в модифицированных 1 реакции PCR: 0,75 магнитный шарик соотношение:
  1. Пипетка 37,5 мкл раствора магнитный шарик в 50 мкл ПЦР продукты из шага 2.4.2.
  2. Передача смеси 1.5 мл низкой привязки.
  3. Тщательно перемешать, закупорить вверх и вниз по крайней мере 10 раз.
  4. Оставьте смесь стоять при комнатной температуре в течение 5 мин.
  5. Место трубу на магнитный держатель. Проинкубируйте 2 мин при комнатной температуре или до супернатант ясно.
  6. Удалите супернатант.
  7. Вымойте бусины с 200 мкл на 70% спирте.
  8. Инкубируйте 30 s. удалить этанола.
  9. Повторите этанола мыть раз.
  10. Просушите бисер.
  11. Элюировать с 20 мкл ddH₂O.
4. Запуск Алиготе eluted дна (~ 3 мкл) на 2% агарозном геле для подтверждения размера ампликонами.
5. Количественную оценку концентрации ДНК (Таблица материалов, пункт 3), чтобы определить концентрацию отдельных библиотек ECS.
6. Объединять библиотеки в эквимолярных количествах. Обратитесь к методу 1 шаг 1.5.6. а также обсуждение более подробную информацию об объединении.
7. Представить обобщённые библиотека ECS на примерно 4 Нм.
8. Укажите следующие параметры последовательности Illumina виртуализации платформ (MiSeq, HiSeq или NextSeq): 2 x 144 паре конец читает, 8 циклов индекс 1 и 16 циклов индекса 2.
ECS Bioinformatic обработки и анализа
1. Получить образец demultiplexed читает от секвенсор или выполняет демультиплексирование сырой последовательности гласит в различные образцы с использованием i7 адаптер последовательности bioinformatically с помощью пользовательского скрипта.
2. Обрежьте первые 30 нуклеотидов каждого demultiplexed чтения для удаления oligo последовательности из панели ген.
3. Совместите чтений, которые разделяют же UMIs друг с другом в форме чтения семей.
  Примечание: Исследователи могут использовать UMI-известно программного обеспечения таких как MAGERI¹³ для извлечения чтения семей. В пределах UMI последовательности в этом эксперименте было разрешено не расстояние Хемминга увеличения специфичности метода.
4. Выполнение дедупликации и исправление ошибок с использованием следующих параметров.
  1. Использование ≥5 читать считывания пары в той же семье. Рекомендуется использовать как минимум три чтения пар.
  2. Сравните нуклеотидов в каждой позиции во всех читает в той же семье чтения и генерировать консенсус нуклеотидов, если есть по крайней мере 90% согласование читает для конкретного нуклеотидов. N Если есть меньше, чем 90% соглашения предусматривают нуклеотидной позиции.
  3. Отбросить консенсуса чтений, которые имеют > 10% от общего числа нуклеотидов консенсус, вызываемой как н.
5. Выравнивание всех сохранить консенсус читает локально для hg19 или hg38 генома человека ссылку, с помощью предпочтительного aligner(s) исследователя как Bowtie2 и ВСБ.
6. Процесс выравнивания читает с Mpileup, с помощью параметров – BQ0 – d 10,000,000,000,000 для удаления покрытия порогов для обеспечения надлежащего pileup ' а вывода независимо от VAF.
7. Отфильтровывать позиции с менее чем 1000 x консенсуса, читать освещение.
  Примечание: Исследователь определяет минимальное покрытие для каждой нуклеотидной позиции произвольно, рекомендуется иметь по крайней мере 500 x консенсуса, читать освещение для анализа ниже по течению.
8. Биномиальное распределение для вызова единичных нуклеотидных варианты (ОНП) используйте сохраненные данные из шага 2.5.7 со следующими параметрами. Биномиальное статистика будет основываться на геномной позиции специфичные ошибки модели. Каждая позиция геномной независимо моделируется после суммирования ошибок ставки всех образцов для этой конкретной позиции. Следуя примеру:
  Вероятность возникновения нуклеотидов профиля в заданной позиции геномной, p
  ∑ Вариант RF2 ∑ всего РФС
  = 26/255505
  = 0.000101759
  Биномиальное вероятность 24 варианта RFs из 35911 всего РФС, P(X ≥ x) в образце K
  = 1 - binomial(24, 35911, 0.000101759)
  = 2.26485E-13
  Примечание: Для каждой геномной позиции запрашивается, там будет три возможных мутационного изменений (например,A > T, A > C, A > G), и каждый из которых будет представлено как фон артефакт. Соматические события, которые значительно отличаются от фона после коррекции Бонферрони сохраняются. В примере, показанном в таблице 1, количество проверок было 11, следовательно Бонферрони исправлены p-значение ≤0.00454545 (0.05/11) требуется для вызова события как статистически значительным.
9. Соматические события обязаны присутствовать в обоих реплицирует от же образца; в противном случае рассматривают их как ложных срабатываний.

Table 1
Таблица 1: Пример, демонстрирующий способ построить модель позиции-Двухчленный ошибки.

3. Исправлена ошибка последовательности РНК

Помимо оценки для перегласовок на уровне ДНК, интегрируйте ECS панелями различных целевых РНК последовательности для выявления редких или низкой изобилие транскрипт на уровне РНК. Объединив ECS с готовых панелей Qiagen РНК последовательности, мы продемонстрировали цифровой количественной оценки экспрессии генов для стенограммы с всего лишь десять копий без необходимости нормализации против уборки ген. UMIs, необходимых для исправления ошибок были интегрированы в панель.
1. Выполняйте общее извлечение RNA (Таблица материалов, пункт 20).
2. Осуществлять подготовку библиотека ECS-РНК по данным производителя протокол (Таблица материалов, пункт 19).
3. Выполняйте биоинформатики трубопровода согласно 2.5.1–2.5.6 шаг. Метод 2, изложенные в предыдущем разделе. После шага 2.5.6 количество считываний унифицированных консенсуса на ген представляет уровень экспрессии гена без необходимости нормализации длины ген.

Representative Results

С Targeted Error-Corrected секвенирования ДНК мы выполнили доказательство принцип эксперимента, разбавляя мутант пациента ДНК в коммерческих геномной ДНК. Пациент был мутации в GATA1 (chrX:48650264, C > G) с оригинальной VAF 0,19. На рисунке 1 мы демонстрируем, что ECS количественный уровень мэм для единичных нуклеотидных вариант.

Рисунок 1: разбавление серии GATA1 SNV демонстрируя, что ECS количественный уровень мэм. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Мы также показывают, что ECS-ДНК надежно обнаруживает редкие клоновых мутаций в генах периодически в взрослых острый миелоидный лейкоз (ОМЛ) в здоровых пожилых лиц⁴. Мы получили образцы Баффи пальто от 20 здоровых лиц в исследовании здоровья медсестра накренился примерно ~ 10 лет друг от друга. Мы применили протокола группа ECS-ДНК на этих примерах. Для этого эксперимента мы адаптированы Illumina TruSight миелоидной секвенирования группа, состоящая из 568 ампликонов (Дополнительные сведения о списке гена на https://www.illumina.com/products/by-type/clinical-research-products/trusight-myeloid.html) и виртуализации 80 библиотек из 20 человек (2 коллекции в разное время точек, 2 реплицирует на человека за время точка) с помощью Illumina NextSeq платформу, которая создается в среднем 47,7 млн в паре конец читает и в среднем 3,4 млн. Исправлена ошибка последовательности консенсус за библиотека⁴. Средняя нуклеотидов охвата каждой библиотеки был примерно 6000 x (3,4 миллионов разделенных 568). Для каждого образца мы построили позицию ошибки профиль, с помощью виртуализированного библиотек, которые не из той же пробы. Мы нашли 109 клоновых соматических мутаций, которые были представлены в обоих реплицирует момент времени по крайней мере одной коллекции. Эти мутации у VAF, начиная от 0,0003-0.1451. Мы выбрали 21 мутации с известными космических представлений и проверить все 21 мутаций в одной или двух точек время коллекции, с помощью ddPCR (n = 34, Рисунок 2, взято из молодых et al. 2016⁴).

Рисунок 2: мутации, выявленные ECS были проверены через ddPCR с весьма совпадающие VAFs. (n = 34, от молодых et al. 2016⁴). Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

В отношении уровня Исправлена ошибка выражения, с помощью протокола ECS-РНК мы адаптировали гена панели, с помощью QIAseq химии, которая состоит из 416 генов, известный должен быть связан с различными рака (взято из QIAseq человека рак транскриптом панели) и мы усиленный наиболее часто выраженной экзона данного гена (ген список в дополнительный материал 1). Мы последовательно библиотек, платформе Illumina MiSeq в паре конец формат, который дал в среднем 8,3 миллиона считывает за библиотеки, и нам удалось захватить в среднем 0.417 миллионов Исправлена ошибка консенсуса последовательностей. Мы показали, что уровень экспрессии низкой изобилие Стенограмма (< 1000 Стенограмма фото в 50 нг всего РНК) высоко воспроизводима между реплицирует (точка данных n = 300, рис. 3). Проверка по ddPCR (шесть отдельных генов различной степени выражения) показали, что уровень экспрессии генов правильно захвачен ECS протокол без необходимости нормализации.

Рисунок 3: Top, корреляция Стенограмма рассчитывает на ECS-РНК между реплицирует того же образца (n = 300). Внизу, Стенограмма счетчиков идентифицируется ECS были подтверждены ddPCR (n = 6). Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Discussion

Здесь мы демонстрируем набор протоколов Исправлена ошибка последовательности, которые могут быть легко реализованы для изучения мутации с низким VAFs в различных заболеваний. Наиболее важным фактором является включение UMIs с каждой молекулы до последовательности, как они дают возможность коррекции ошибок сырье гласит. Описанные здесь методы позволяют исследователям включать индивидуальные UMIs коммерчески доступных гена панелей и самостоятельно разработанные oligos ген специфического.

Стандартный протокол NGS исключает выявления мутации с VAF ниже 2% из-за последовательности ошибок, и это ограничивает применение NGS в исследованиях, где выявление редких вариантов имеет решающее значение. В обход стандартной ставке ошибка NGS, ECS позволяет чувствительной обнаружение этих сырых вариантов. Например обнаружение патогенных мутаций, когда эти мутации сначала возникают (поэтому имеющие низкий VAF) необходимо сообщить раннего вмешательства болезни¹⁴^,¹⁵. В исследованиях лейкемии, обнаружения минимальной остаточной болезни (остаточная лейкозных клеток после лечения) информирует стратификации риска и могут быть использованы для информирования варианты лечения в манере, что двоичный поток гранулярных оценок нельзя. Кроме того ECS применяется для обнаружения циркулирующего опухоли нуклеиновой кислоты и оценить метастатическим потенциалом в твердой опухоли пациентов путем оценки присутствия/отсутствия, а также вариант бремя определенных мутаций, которые являются характеристиками основного опухоль¹⁶.

Как показано в таблице 1, власть, используя модель на основе биномиальное распределение положение конкретных ошибок для вызова вариантов во многом зависит количество виртуализированного библиотек, а также глубина последовательности используется для построения модели ошибка. Надежность ошибка модели увеличивается с большее количество образцов и больше последовательности глубины. Рекомендуется использовать по крайней мере 10 виртуализированного образцы с в среднем Исправлена ошибка чтения освещение 3000 x за образец для создания ошибка профиля для каждой выборки. Положение конкретных подход аналогичен MAGERI, но вместо того чтобы использовать статистическую погрешность для всех шести различных подстановки типов (A > C/T > G, A > G/T > C, A > T/T >, C > A/G > T, C > G/G > C C > T/G > A)¹³, мы модели каждой замены независимо в каждой позиции. Например, показатель Ошибка C > T в заданной позиции геномной отличается от другой позиции. Наш подход также учитывает эффект пакетного последовательность, как уровень базового замещения, наблюдается в одной последовательности выполнения может отличаться от другого запуска. Поэтому важно для модели каждой позиции для замены всех типов, особенно когда образцов из разных последовательности выполняется объединены для построения модели.

Важным соображением при проектировании ECS эксперимент является желаемой обнаружения порога. Красота NGS исследований является, что они могут быть легко масштабируется с точки зрения генов/цели интерес, порог обнаружения (продиктовано глубина секвенирования), и количество лиц запрашивается. Например, если ученые заинтересованы найти редкие мутации в два ампликонов с порога обнаружения 0,0001, они могут объединять максимально 75 проб в одной последовательности запуска с помощью химии MiSeq V2, который выводит читает до 15 миллионов (2 ампликонов * 10000 молекулы * 10 читает для коррекции ошибок * 75 образцов = 15 миллионов последовательности чтения). Исследователи могут варьироваться количество молекул, вдаваясь в последовательности или количество проб имелось в одной последовательности, выполнения для настройки порога обнаружения. В наших исследований, мы стремились найти мутации с порога обнаружения 0,0001 VAF (1:10, 000) с использованием панели Illumina ген. Мы регулярно использовать 250 нг начиная ДНК, чтобы убедиться, что достаточно молекул зафиксированы достижения вышеупомянутых обнаружения порога. Исследователи могут выбрать, чтобы начать с меньшее количество ДНК (50 нг рекомендуется) Если предел обнаружения нужного > 0.001 VAF.

Как UMIs добавляются на индексы i5, последовательности настройки должны быть внесены соответствующие поправки. Например мы использовали 16 N UMIs, и последовательности параметров были 2 x 144 парных конец читает, 8 циклов индекс 1 и 16 циклов индекса 2 в отличие от обычных 8 циклов индекса 2. Увеличение индекса 2 цикла компенсируется снижением общего числа циклов, выделенных для операции чтения. Если исследователи предпочитают использовать 12N UMIs¹⁰^,¹⁷, настройки следует изменить на 12 циклов индекса 2.

Этот метод на основе UMI последовательности оптимизирована для исправления ошибок последовательности. Она остается оптимальным в борьбе с ПЦР jackpotting, который является проблемой для всех на основе усиления метода. Мы исполняли раундов после виртуализации и пост биоинформатики для проверки с помощью ddPCR, и мы вряд ли обнаружить каких-либо ложных срабатываний из-за jackpotting ПЦР. Тем не менее рекомендуется, что ученые проводят эксперименты с использованием высокоточных полимеразы для обеспечения низкой амплификации ошибки.

Disclosures

Авторы не имеют ничего сообщать.

Acknowledgments

Мы благодарим участников Детская онкология группа AAML1531 исследования и медсестер медицинского исследования за их вклад в форме пациентов образцов. Эта работа финансировалась национальных институтов здравоохранения (UM1 CA186107, RO1 CA49449 и RO1 CA149445), Детская Discovery институт Вашингтонского университета Сент-Луисе Детская больница (MC-II-2015-461) и Эли Сет Мэтьюз Лейкемия фонда.

Materials

Name	Company	Catalog Number	Comments
Q5 High Fidelity Hot Start Master Mix	New England BioLabs	M0492S
Agencourt AMPure XP	Beckman Coulter	A63880
Qubit dsDNA HS Assay Kit	Thermo Fisher Scientific	Q32854
SYBR Safe DNA Gel Stain	Thermo Fisher Scientific	S33102
Truseq Custom Amplicon Index Kit	Illumina	FC-130-1003
UMI i5 adapter sequences	Integrated DNA Technologies	-
NEBNext Ultra End Repair/dA-Tailing Module	New England BioLabs	E7442S
NEBNext Ultra II Ligation Module	New England BioLabs	E7595S
QX200 ddPCR EvaGreen Supermix	Bio-Rad	1864034
QX200 Droplet Generation Oil for EvaGreen	Bio-Rad	1864005
QX200 Droplet Digital PCR System	Bio-Rad	1864001
ddPCR 96-Well Plates	Bio-Rad	12001925
DG8 Cartridges for QX200/QX100 Droplet Generator	Bio-Rad	1864008
DG8 Gaskets for QX200/QX100 Droplet Generator	Bio-Rad	1863009
Bioanalyzer	Agilent Genomics	G2939BA
TapeStation	Agilent Genomics	G2991AA
TruSight Myeloid Sequencing Panel	Illumina	FC-130-1010
Bowtie 2	Johns Hopkins University	-
Customized QIAseq Targeted RNA Panel	Qiagen	-
Rneasy Plus Mini Kit (50)	Qiagen	74134