Genetics

드문 이벤트 감지 오류 수정 DNA와 RNA 시퀀싱을 사용 하 여

Published: August 3, 2018 doi: 10.3791/57509

Wing H. Wong*^1,2, R. Spencer Tong*^1,2, Andrew L. Young^1,2, Todd E. Druley^1,2

¹Department of Pediatrics, Division of Hematology and Oncology, Washington University School of Medicine, ²Center for Genome Sciences and Systems Biology, Washington University School of Medicine

* These authors contributed equally

Summary

차세대 시퀀싱 (NGS) 플랫폼 (~0.5–2.0%)의 높은 오류 속도 의해 제한 되는 genomic 특성 분석을 위한 강력한 도구입니다. NGS 오류율을 제거 하 고 변형 대립 유전자 분수 0.0001 희귀에서 변이 감지 수 있는 오류 수정 시퀀싱의 우리의 방법을 설명 합니다.

Abstract

기존의 차세대 시퀀싱 기술 (NGS) 10 년 이상에 대 한 거 대 한 게놈 특성에 대 한 수 있다. 특히, NGS 악성에 클론 돌연변이의 스펙트럼을 분석 하 사용 되었습니다. 비록 전통적인 Sanger 방법, 식별 하는 ~0.5–2.0 %의 그것의 높은 에러율으로 인해 드문 클론와 subclonal 돌연변이와 NGS 투쟁 보다 훨씬 더 효율적. 따라서, 표준 NGS는 돌연변이 대 한 검색의 제한이 > 0.02 변형 대립 유전자 분수 (VAF). 이 환자에서 희소 한 돌연변이 대 한 임상 중요성 동안 알려진된 질병 불분명, 남아 없이 백혈병 치료 하는 환자 크게 향상 결과 잔여 질병 때 < 0.0001 cytometry에 의해. NGS의이 artefactual 배경, 완화 하기 위해 수많은 방법이 개발 되었습니다. 여기 오류 수정 DNA와 RNA 시퀀싱 (ECS), 개별 분자 임의의 인덱스 오류 수정에 대 한 혈압의 16와 다중화 8 혈압 환자 특정 인덱스를 태그를 포함 하는 방법을 설명 합니다. 우리의 방법은 감지 하 고 변형 대립 유전자 분수 (VAFs) 두 배나 NGS의 검출 한계 보다 낮은 희귀 0.0001 VAF에 클론 변이 추적할 수 있습니다.

Introduction

우리가 나이, mutagens, 게놈, 그리고이에 체세포 착오의 축적에서 세포 분열 결과 중 확률 오류 노출에 기초가 악성 변화의 근본적인 병 인 신경 발달 질환, 소아 질환과 정상적인 노화¹^,². 질병-운전 잠재력 체세포 돌연변이 조기 발견 및 위험 관리³^,^,⁴⁵에 대 한 중요 한 진단 및 예 후 바이오 마커. 더 나은 physiologic clonogenesis 이해, 어떤 임상 통보 되며 결정, 정확한 정량화 및이 돌연변이의 특성화 연구 기본 중요성 이다. 차세대 시퀀싱 (NGS)은 현재 이기종 DNA 샘플; 클론 변이 공부 하는 데 사용 됩니다. 그러나, NGS 식별에서 돌연변이로 제한 됩니다 > 0.02 변형 대립 유전자 분수 (VAF)-0.5-2.0의 고유한 오류 비율 때문 시퀀싱 플랫폼⁶^,⁷^,8%. 그 결과, 추적 진단 및 prognostically 중요 한 체세포 변종 낮은 VAF에 얻을 수 없다 표준 NGS를 사용 하 여.

최근, 다양 한 방법은 NGS⁸^,⁹^,^,¹⁰¹¹의 오류율을 회피 하기 위해 개발 되었습니다. 이러한 방법을 활용 분자 태그, 시퀀싱 후 오류 수정 가능 하 게 합니다. 각 분자 또는 시퀀싱 라이브러리에서 게놈 단편으로는 임의의 독특한 분자 식별자 (우미) 그 분자에 관련 된 태그입니다. Umi는 무작위 뉴클레오티드 (8-16 N)의 문자열의 순열에 의해 구성 됩니다. 두 번째 샘플 전용 바코드 또한 동일한 NGS 시퀀싱 실행에 여러 샘플을 멀티플렉싱 있도록 워크플로에 통합 된다. PCR 증폭 분자로 태그 라이브러리에서 수행 되 고 그 후 라이브러리 시퀀싱에 대 한 전송 됩니다. 라이브러리 준비 동안 PCR 증폭 및 시퀀싱⁸동안 오류 게놈 단편을 무작위로 소개 것 이다는 예상 된다. 임의의 연속 오류를 제거 하려면 원시 시퀀싱 읽기 우미에 따라 그룹화 됩니다. 시퀀싱에서 아티팩트 하지 진정한 variant를 충실 하 게 증폭 하 고 같은 바다를 공유 하는 모든 읽기에 시퀀싱 것 소개의 확률적 특성으로 인해 동일한 게놈 위치에 동일한 우미와 모든 읽기에 있을 예정 이다. 아티팩트는 제거 하는 bioinformatically. 여기, 우리가 설명 하는 세 가지 방법의 오류 수정 시퀀싱 (ECS) 단일 뉴클레오티드 변종 (SNVs) 및 작은 삽입-삭제 (Indels), 식별 하기 위해 dna 그리고 RNA 유전자 발현 아래의 정량화를 촉진 하기 위해 실험실에 최적화 된 NGS 오류 임계값입니다.

첫 번째 방법은 연구자에 의해 설계 된 유전자 특정 뇌관을 사용 하 여 희귀 체세포 이벤트에 대 한 보고 하는 방법을 설명 합니다. 라이브러리 준비, 이전 연구자 관심의 파편을 대상으로 프라이 머를 설계 해야 합니다. 우리가 사용 하는 웹 애플 리 케이 션 Primer3 (http://bioinfo.ut.ee/primer3-0.4.0/). 200-250 bp의 Amplicons 연쇄 반응 (PCR)에 대 한 이상적인 Umi 통합 되었습니다 일단이 것으로, 150 bp 쌍 간 읽기와 쌍 간 읽기 중복 생성. 사용 될 최적의 뇌관 디자인 조건: 최소 뇌관 크기 = 19; 최적의 뇌관 크기 = 25; 최대 뇌관 크기 = 30; 최소 Tm = 64 ° C; 최적의 Tm = 70 ° C; 최대 Tm = 74 ° C; 최대 Tm 차이 = 5 ° C; 최소 GC 내용 = 45; 최대 GC 내용 = 80; 반환 번호 = 20; 최대 3' 끝 안정성 = 100.

방법 2에서 우리가 ECS DNA 프로토콜 클론 SNVs 및 작은 Indels 희귀 0.0001 VAF amplicons의 수백을 포함 하는 상업적으로 이용 가능한 유전자 패널을 사용 하 여 조사를 Illumina 화학 결합 하는 방법을 설명 합니다. 우리는 우리의 실험에 대 한 TruSight 골수성 시퀀싱 패널 (Illumina)를 사용 하 고 소아 골수성 질환에 대 한 관심의 추가 유전자를 포함 하는 확장 된 패널을 설계. 이러한 패널 팬 들은 그래서 우리 자신의 어댑터 전략이이 패널에 추가 했습니다 오류 정정을 촉진 것이 독특한 분자 식별자 (Umi)의 정보를 제공 하지는. ECS 작동 한다 다른 질병와 관련 된 유전자에 대 한 풍부 하 게 설계 된 다른 패널의 동등 하 게 잘. DNA 분리 및 조직 또는 관심의 샘플에서 후속 정량화, 다음 것이 좋습니다 적어도 500 재고 DNA 견본 당 ng. 우리는 정기적으로 250를 사용 하 여 단일 시퀀싱 라이브러리 확인 중복 및 VAF 계산으로 가능한 한 많은 독특한 게놈 단편으로 하류 캡처하기 위해 DNA의 ng 읽습니다. 선택적 복제 시퀀싱 라이브러리 나머지 250으로 만들어질 수 있다 DNA의 ng. 우리는 항상 표본, 당 2 개의 복제 라이브러리 만들고 참 긍정으로 둘 다 복제에 독립적으로 검색 하는 이벤트에만 생각. 우리는 또한⁴^,¹³전화 이체의 정확도를 높이 genomic 위치 특정 이항 오류 모델 구현.

마지막으로,는 상용 QIAseq 대상 RNA 패널 (Qiagen)를 사용 하 여 사본 정량화에 대 한 RNA 시퀀싱에 ECS를 연결 하는 방법에 설명 합니다. 중복에는 Umi 필요한 오류 수정 키트에 통합 되었습니다 및 연구원은 제조 업체의 권장 사항에 따라 라이브러리를 만들 수 있습니다. Bioinformatically, 연구자는 ECS-DNA, 프로토콜 섹션에서 자세히 설명 될 것 이다를 위한 파이프라인을 따를 수 있습니다.

Protocol

1. 타겟 dna 시퀀싱 오류 수정

관심의 게놈 조각의 PCR 증폭
1. 고 충실도 DNA 중 합 효소를 사용 하 여 증폭 (자료 테이블, 항목 1) amplicons. 증폭 PCR 반응 열 cycler에 다음 조건: 30 s 98 ° c; 10의 18-40 주기 98 ° C, 30에서 s 66 ° c, s 및 30 s 72 ° c; 72 ° C에서 2 분 4 ° c.에서 개최
2. 상자성 구슬 (자료 테이블, 항목 2) PCR 제품을 정화. 1: 1.8 비율로 구슬에 PCR 반응 추가 (PCR 반응 볼륨: 볼륨 구슬) 제조 업체의 프로토콜에 따라. 20 µ L ddH₂오의와 함께 elute
3. 계량 (재료 표, 항목 3) DNA의 최종 농도 결정 하는 DNA의 농도.
4. amplicons의 크기를 확인 하려면 2 %agarose 젤 (자료 테이블, 항목 4)에 DNA의 약 수를 실행 합니다.
  참고: 또는, 연구원 증폭 게놈 조각의 크기 뿐만 아니라 제품의 농도 결정 하기 위해 PCR 제품에 Bioanalyzer 분석을 수행 하기 위해 선택할 수 있습니다.
어댑터는 어 닐 링 시퀀싱
1. (자료 테이블, 항목 5) i7 어댑터를 얻을. 그들은 후속 단계에 대 한 제공 되는 그들을 사용 합니다.
2. 16N i5 어댑터 다음 올리고 시퀀스 (자료 테이블 항목 6) 상업 구매: AATGATACGGCGACCACCGAGATCTACAC(N1:25252525)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1) (N1) ACACTCTTTCCCTACACGACGCTCTTCCGATCT
  참고: 16N i5 어댑터는 표준 i5 어댑터를 교체 하 고 ECS를 촉진 하기 위하여 16 임의의 뉴클레오티드의 문자열로 어댑터.
3. 16N i5 어댑터 작업 솔루션: 주식의 100 µ M 16N i5 어댑터 40 µ L, 10 µ L의 TE 버퍼, 그리고 10 µ L 500 µ M NaCl 솔루션의.
4. 별도 PCR 웰 스 1.2.3 단계에서 준비 i5 작업 솔루션의 aliquot 7.5 µ L.
5. 해당 우물에 샘플 특정 i7 어댑터의 5 µ L를 추가 합니다.
6. 5 분 동안 95 ° C에 품 어 다음 모든 30 1 ° C로 냉각 열 cycler에서 4 ° c s.
7. 4 ° c.에서 개최
끝-수리 및 라이브러리의 다-미행
참고: 어댑터 어 닐 링와 병렬로 하나 수행할 수 최종 수리 및 다 미행 단계 1.1에서 PCR amplicons. 단계 완료, 다음 최종 수리 및 PCR amplicons 다 꼬리에 단계 1.2에서 단련 된 어댑터의 결 찰이 수행 됩니다. 다음 어댑터 결 찰, ECS 도서관 건설 완료 됩니다.
1. 최대 1 µ g의 DNA를 시작으로 시작 (최소 ~ 200 ng)
2. (자료 테이블, 항목 7) amplicons에 최종 수리 및 다 꼬리를 수행 합니다.
  1. 최종 준비 효소 혼합의 3.0 µ L 및 최종 수리 버퍼의 6.5 µ L를 추가 합니다.
  2. 65 ° C에서 30 분 동안 다음 20 ° C에서 30 분 동안 혼합 품 어와 4 ° c.에서 개최
3. (자료 테이블, 항목 8) 단련된 어댑터에 결 찰을 수행 합니다.
  1. 2 단계, 블런트/TA 리가 Mastermix의 15 µ L 및 결 찰 증강의 1 µ L에서 단련 된 어댑터의 2.5 µ L를 추가 합니다.
  2. 다음 37 ° c.에 15 분 동안 20 ° C에서 15 분 동안 혼합을 품 어
4. 마그네틱 구슬 (자료 테이블 항목 2) 라이브러리 정리: 구슬에 PCR 반응 수정된 1: 0.75 비율에 추가 (PCR 반응 볼륨: 마그네틱 비드 볼륨):
  1. 마그네틱 비드 솔루션의 62.6 µ L 단계 1.2.7에서에서 PCR 제품의 83.5 µ L로 플라스틱.
  2. 1.5 mL 낮은 바인딩 튜브에 혼합물을 전송.
  3. 적어도 10 배를 위아래로 pipetting으로 철저 하 게 혼합.
  4. 5 분 동안 실내 온도에 서 서 혼합물을 두십시오.
  5. 자석 홀더에 튜브를 놓습니다. 실내 온도에 또는 상쾌한까지 2 분 동안 품 어 분명 하다.
  6. 상쾌한을 제거 합니다.
  7. 구슬 200 µ L의 70% 에탄올으로 씻는 다.
  8. 30 미 제거 에탄올에 대 한 품 어.
  9. 한 번 에탄올 세척 단계를 반복 합니다.
  10. 구슬 건조
  11. 20 µ L ddH₂오의와 함께 elute
    참고:이 수정 자석 구슬 비율에 PCR 반응에서 우선적으로 200 보다 작은 DNA 조각 제거할 것 이다 혈압.
물방울에 의해 정량화 디지털 PCR
참고: 정확한 돌연변이 정량화 시퀀서에 로드 되는 각 라이브러리의 분자의 수의 엄격한 준수를 요구 한다. 이 위해 QX200 방울 디지털 PCR (ddPCR) 플랫폼을 사용 하 여 수행은 단위 부피 당 개별 라이브러리에 대 한 분자의 수를 측정-정량 PCR 대체 옵션입니다. DdPCR 분석에 따라 판독 라이브러리 당 µ L 당 분자의 수를 지정 합니다.
1. 증분 PCR 스트립-튜브에 10 배 희석 하 여 ECS 라이브러리 1:1,000을 희석.
2. 1.5 mL 튜브에 ddPCR에 대 한 다음 mastermix 준비: PCR 혼합 (자료 테이블, 항목 9), P5 뇌관, P7 뇌관, 단계 1.4.1에서에서 ECS 청소 제품의 5 µ L의 0.2 µ L의 0.2 µ L의 10 µ L., 그리고 4.5 µ L ddH₂o.
3. 각 mastermix의 aliquot 20 µ L 샘플 잘 8의 배수는 다는 것을 확신 합니다.
  1. Aliquot 70 µ L 기름의 작은 물방울 생성 (자료 테이블, 항목 10) 각 유 정에. 고무 가스 켓으로 카세트 커버.
4. 방울 방울 발생기 (자료 테이블, 항목 11)를 사용 하 여 확인 합니다.
5. 멀티 채널 피 펫을 사용 하 여 생성 단계에서 1.4.4 PCR 플레이트 보장으로 DNA를 기울이기 방지 하려면 5 초 기간 동안 천천히 수행 되는 샘플의 pipetting 방울 로드 합니다.
6. 다음과 같은 조건을 사용 하 여 열 cycler에서 40 주기 위한 작은 물방울에서 신호를 증폭: 95 ° C에서 5 분 30의 40 주기 1 분 63 ° C에서 95 ° C에서 s 4 ° C, 90 ° C에서 5 분에서 5 분 다음 4 ° c.에서 개최
7. DdPCR 템플릿 드롭릿 리더 기계 (자료 테이블, 항목 11)를 준비 합니다. 절대 정량화 를 사용 하 여 매개 변수에 대 한 사양을 확인은 QX200 ddPCR에 바 그린 Supermix.
8. DdPCR 분석 완료 되 면 모든 샘플에서 동일한 분열 임계값을 설정 해야 합니다.
9. QX200 물방울 리더, 약 분자의 원하는 수 다음 단계를 적절 한 볼륨 수에서에서 농도 판독을 사용 하 여.
시퀀싱에 대 한 라이브러리의 PCR 증폭
1. 1.4.9 단계에서 분자의 원하는 수에 대 한 다음 mastermix 준비: Q5 Mastermix (자료 테이블, 항목 1), P5 뇌관의 2.5 µ L의 25 µ L (10 µ M), P7 뇌관의 2.5 µ L (10 µ M), DNA, ddH₂O. X 20 µ L의 X µL
2. 증폭 단계 1.5.1 다음 조건을 사용 하 여 열 cycler에서에서 라이브러리: 30 s 98 ° c; 10의 20 주기 98 ° C, 30에서 s 63 ° C, 30에서 s s 72 ° c; 72 ° C에서 2 분 다음 4 ° c.에서 개최
3. 마그네틱 구슬 (자료 테이블, 항목 2) 라이브러리 정리: 자석에 PCR 반응에는 수정 비즈 1: 0.75 비율 추가 (PCR 반응 볼륨: 마그네틱 비드 볼륨).
  1. 마그네틱 비드 솔루션의 37.5 µ L 단계 1.5.2에서에서 50 µ L PCR 제품으로 플라스틱.
  2. 1.5 mL 낮은 바인딩 튜브에 혼합물을 전송.
  3. 적어도 10 배를 위아래로 pipetting으로 철저 하 게 혼합.
  4. 5 분 동안 실내 온도에 서 서 혼합물을 두십시오.
  5. 자석 홀더에 튜브를 놓습니다. 실내 온도에 또는 상쾌한까지 2 분 동안 품 어 분명 하다.
  6. 상쾌한을 제거 합니다.
  7. 구슬 200 µ L의 70% 에탄올으로 씻는 다.
  8. 30 미 제거 에탄올에 대 한 품 어.
  9. 한 번 에탄올 세척 단계를 반복 합니다.
  10. 구슬 건조
  11. 20 µ L ddH₂오의와 함께 elute
4. amplicons의 크기를 확인 하는 2 %agarose 젤에서 DNA의 약 수를 실행 합니다.
5. 계량 (재료 표, 항목 3) 별도 ECS 라이브러리의 농도 결정 하는 DNA의 농도.
6. 아데닌 양의 라이브러리를 풀.
  참고: 예를 들어 연구자 수 풀까지 400 백만 읽기 출력 시퀀싱 플랫폼을 사용 하 여 연속에 대 한 분자를 시작 하는 4 백만 아데닌 그룹⁴ 에 8 개의 라이브러리. 보수적으로, 분자 당 오류 수정에 대 한 10 개의 원시 읽기의 평균을 사용 하는 것이 좋습니다. 이 360 백만 읽기를 걸릴 것 이다 (4 백만 분자 * 8 라이브러리 * 10 읽는 오류 수정에 대 한). 라이브러리 당 4 백만 고유 분자로, 연구원은 이론적인 의미 합의 amplicon (유전자 패널에서 4 백만/568 amplicons) 당 7042 x의 범위를 기대할 수 있습니다.
7. 계량 (재료 표, 항목 3) 풀링된 ECS 라이브러리의 농도 결정 하는 DNA의 농도.
8. 대략 4에서 풀링된 ECS 도서관 제출 nM.
9. Illumina의 시퀀싱 플랫폼 (MiSeq, HiSeq 또는 NextSeq) 다음 시퀀싱 설정을 제공: 2 x 144 한 쌍-엔드 읽습니다, 8 인덱스 1 주기와 16 주기 인덱스 2.

2. 유전자의 DNA 시퀀싱 오류 수정 패널

유전자 패널에서 oligos의 교 잡
참고:이 단계에서 Umi (자료 테이블, 항목 17)를 통합 하는 수정된 Illumina TruSight 또는 TruSeq 프로토콜을 사용 하 여 시퀀싱 라이브러리를 건설할 것 이다 하나.
1. 제조 업체의 프로토콜을 따르고 게놈 조각에 oligos 교배 DNA (또는 시작 물자의 원하는 금액)의 사용 250 ng.
2. 언바운드 oligos 다음 제조 업체의 프로토콜을 제거 합니다.
3. 확장-결 찰을 수행 다음 제조 업체의 프로토콜.
  참고: 제조업체의 프로토콜에 대 한 수정 아래 시작합니다.
PCR 통해 i5 및 i7 어댑터의
1. 적절 한 볼륨 크기의 관으로 다음 시 약 pipetting으로 PCR mastermix 준비: Q5 Mastermix (자료 테이블, 항목 1), 6 µ L 10 µ M 16N i5 어댑터 (에 자세한 방법 1, 단계 1.2.2), i7 어댑터 (사용 다른 i7의 6 µ L의 37.5 µ L 다중화에 대 한 별도 샘플에 대 한 어댑터) 및 22 µ L 단계의 2.1.3 구슬과 확장 결 찰 솔루션의.
  참고: Q5 Mastermix Illumina에서 제공 하는 중 합 효소 mastermix를 대체 합니다. Q5 중 합 효소는 높은 충실도와 적은 도입된 오류 게놈 단편을 증폭 시키고 있다.
2. PCR 프로그램을 실행 하는 다음 매개 변수를 사용 하 여 열 cycler에: 30 s 98 ° C에, 10의 4-6 주기 98 ° C, 30에서 s 66 ° C, 30에서 s s 72 ° c; 72 ° C, 및 4 ° c.에 대기에서 2 분
  참고: 주기 수 패널 크기에 따라 달라 집니다. 우리의 경험에서 oligos의 500-600 쌍 패널 PCR의 6 주기를 요구 하는 반면 4 사이클 PCR 유전자 패널 유전자 특정 oligos의 약 1500 다른 쌍 있으면 충분 하다.
3. 마그네틱 구슬 (자료 테이블, 항목 2) PCR 반응 정리: 수정된 1 PCR 반응에서 PCR 반응 자석 구슬 추가: 0.75 자석 구슬 비율:
  1. 마그네틱 비드 솔루션의 56.25 µ L 단계 2.2.2에서에서 PCR 제품의 75 µ L로 플라스틱.
  2. 1.5 mL 낮은 바인딩 튜브에 혼합물을 전송.
  3. 적어도 10 배를 위아래로 pipetting으로 철저 하 게 혼합.
  4. 5 분 동안 실내 온도에 서 서 혼합물을 두십시오.
  5. 자석 홀더에 튜브를 놓습니다. 실내 온도에 또는 상쾌한까지 2 분 동안 품 어 분명 하다.
  6. 상쾌한을 제거 합니다.
  7. 구슬 200 µ L의 70% 에탄올으로 씻는 다.
  8. 30 미 제거 에탄올에 대 한 품 어.
  9. 한 번 에탄올 세척 단계를 반복 합니다.
  10. 구슬 건조
  11. 20 µ L ddH₂오의와 함께 elute
QX200 ddPCR 플랫폼을 사용 하 여 라이브러리를 계량.
1. 1.4 방법 1의에서 단계를 따릅니다.
  참고: 4 백만 분자 7,042 고유 하 게 인덱싱된 분자 (568 유전자 특정 oligos 나눈 4 백만)의 이론적 의미를 얻으려면 샘플 라이브러리⁴ 는 대표적인 결과 (그림 2)에서 당 정상화 했다.
증폭 하 고 시퀀싱에 대 한 라이브러리를 정상화.
1. 다음 mastermix를 사용 하 여 최종 PCR 총 50 µ L에 대 한 분자의 원하는 수 증폭: Mastermix Q5, P5 뇌관의 2 µ L의 25 µ L (1 µ M), P7 뇌관의 2 µ L (1 µ M), 그리고 DNA 분자의 21 µ L.
2. 다음 매개 변수를 사용 하 여 열 cycler에 PCR 프로그램 실행: 30 s 98 ° c; 10의 16 주기 98 ° C, 30에서 s 66 ° C, 30에서 s s 72 ° c; 72 ° C에서 2 분 다음 4 ° c.에서 개최
3. 마그네틱 구슬 (자료 테이블, 항목 2)를 사용 하 여 시퀀싱 라이브러리 정리: 수정된 1 PCR 반응에서 PCR 반응 자석 구슬 추가: 0.75 자석 구슬 비율:
  1. 2.4.2 단계에서 50 µ L PCR 제품으로 자석 구슬 솔루션의 37.5 µ L 플라스틱.
  2. 1.5 mL 낮은 바인딩 튜브에 혼합물을 전송.
  3. 적어도 10 배를 위아래로 pipetting으로 철저 하 게 혼합.
  4. 5 분 동안 실내 온도에 서 서 혼합물을 두십시오.
  5. 자석 홀더에 튜브를 놓습니다. 실내 온도에 또는 상쾌한까지 2 분 동안 품 어 분명 하다.
  6. 상쾌한을 제거 합니다.
  7. 구슬 200 µ L의 70% 에탄올으로 씻는 다.
  8. 30 미 제거 에탄올에 대 한 품 어.
  9. 한 번 에탄올 세척 단계를 반복 합니다.
  10. 구슬 건조
  11. 20 µ L ddH₂오의와 함께 elute
4. 달리 eluted DNA의 약 수 (~ 3 µ L)는 amplicons의 크기를 확인 하는 2 %agarose 젤에.
5. 계량 (재료 표, 항목 3) 별도 ECS 라이브러리의 농도 결정 하는 DNA의 농도.
6. 아데닌 양의 라이브러리를 풀. 1.5.6 방법 1 단계를 참조 하십시오. 그리고 또한 토론에 대 한 자세한 내용은 풀링입니다.
7. 대략 4에서 풀링된 ECS 도서관 제출 nM.
8. Illumina의 시퀀싱 플랫폼 (MiSeq, HiSeq 또는 NextSeq) 다음 시퀀싱 설정을 제공: 2 x 144 한 쌍-엔드 읽습니다, 8 인덱스 1 주기와 16 주기 인덱스 2.
ECS Bioinformatic 처리 및 분석
1. 시퀀서에서 샘플 역다중화 읽기를 얻거나 다른 샘플 i7 어댑터 시퀀스 bioinformatically를 사용 하 여 사용자 지정 스크립트에 원시 시퀀스 읽기 디 멀티플렉싱 수행.
2. 유전자 패널에서 올리고 시퀀스를 제거 하려면 각 역다중화 읽기의 처음 30 뉴클레오티드 떨어져 트림.
3. 읽기 읽기 가족을 형성 하기 위하여 서로 동일한 Umi를 공유 하는 정렬.
  참고: 연구원 읽기 가족 추출 MAGERI¹³ 등 우미 인식 소프트웨어를 사용할 수 있습니다. 아니 hamming 거리 방법의 특이성을 증가이 실험에서 우미 시퀀스 내에서 허용 되었다.
4. 중복 및 오류 수정 사용 하 여 매개 변수를 권장 하는 다음을 수행 합니다.
  1. 사용 ≥5 읽기 같은 쌍 가족을 읽고. 3 읽기 쌍의 최소 것이 좋습니다.
  2. 같은 읽기 가족에 모든 읽기에 걸쳐 모든 포지션에서 뉴클레오티드를 비교 하 고 90% 이상의 경우 합의 뉴클레오티드를 생성 특정 염기에 대 한 읽기 사이에서 일치. 90% 계약 미만 경우 N 뉴클레오티드 위치에 대 한 호출 합니다.
  3. 버리고 있는 합의 읽기 > 명으로 호출 되 고 합의 세포핵의 총 수의 10%
5. Bowtie2 및 BWA 등 연구원의 기본 aligner(s)를 사용 하 여 hg19 또는 hg38 인간 참조 게놈을 로컬로 모든 유지 합의 읽기를 맞춥니다.
6. 프로세스 Mpileup 매개 변수를 사용 하 여 읽기 정렬-BQ0-d VAF에 적절 한 탑 쌓기 출력 되도록 범위 임계값을 제거 하는 10,000,000,000,000.
7. 미만 1000 x 합의 범위와 위치 밖으로 필터링.
  참고: 각 뉴클레오티드 위치에 대 한 최소 범위를 임의로 결정 하는 연구원이 좋습니다 적어도 500 x 합의 다운스트림 분석에 대 한 범위를가지고.
8. 다음 매개 변수 2.5.7 단계에서 보관 된 데이터에 단일 뉴클레오티드 변종 (Snp) 전화를 이항 분포를 사용 합니다. 이항 통계 genomic 위치 특정 오류 모델을 기반으로 합니다. 각 게놈 위치는 특정 위치에 대 한 모든 샘플의 오류 요금 요약 후 독립적으로 모델링 됩니다. 다음 예제에서는:
  지정 된 genomic 위치, p 뉴클레오티드 프로필의 확률
  ∑ 변형 RF2 ∑ 총 RFs
  26/255505 =
  0.000101759 =
  24 변종 35911 총 RFs, P중 RFs의 이항 확률 (X ≥ x) 샘플 K에
  = 1-binomial(24, 35911, 0.000101759)
  2.26485E =-13
  참고: 쿼리 각 게놈 위치에 대 한 것 세 가지 가능한 mutational 변화 (즉,A > T, A > C, A > G), 각각의 배경 유물으로 나타낼 것 이다. 체세포 이벤트는 Bonferroni 보정 후 크게 다른 배경 유지 됩니다. 표 1에 표시 된 예제에서 수행 하는 테스트의 수는 11, 따라서는 Bonferroni 수정 p-≤0.00454545 값 (0.05/11) 중요 한 통계로 이벤트를 호출 하는 데 필요한 했다.
9. 체세포 이벤트는 모두 복제에; 동일한 견본에서 존재 하는 데 필요한 그렇지 않으면 가양성으로 그들을 간주 한다.

Table 1
표 1: 예제 위치 특정 이항 오류 모델을 구성 하는 방법을 설명 합니다.

3. RNA의 연속 오류 수정

DNA 수준에서 돌연변이 대 한 평가 뿐만 아니라 RNA 수준에서 드문 또는 낮은 풍부 대 본을 검출 하기 위하여 다양 한 타겟된 RNA 시퀀싱 패널 ECS 통합. 상용 Qiagen RNA 시퀀싱 패널 ECS를 결합 하 여 우리는 몇 가지 내부 관리 유전자에 대 한 정규화를 위한 필요 없이 10 부로와 성적 증명서에 대 한 유전자 발현의 디지털 정량화 시연. Umi 오류 정정에 필요한 패널에 통합 되어 있다.
1. 총 RNA 추출 (자료 테이블, 항목 20)을 수행 합니다.
2. ECS RNA 라이브러리 준비 제조 업체의 프로토콜 (자료 테이블, 항목 19)에 따라 실시 합니다.
3. 생물 정보학 파이프라인 단계 2.5.1–2.5.6에 따라 수행 합니다. 이전 섹션에서 설명 하는 방법 2. 2.5.6 단계, 후 진 당 정렬된 합의 읽기 수 유전자 길이 정규화에 대 한 필요 없이 유전자의 식 수준을 나타냅니다.

Representative Results

Targeted Error-Corrected dna 시퀀싱, 함께 우리는 돌연변이 환자 상업 genomic DNA에 DNA를 diluting 원리 실험의 증거를 수행 했습니다. 환자 GATA1 돌연변이 했다 (chrX:48650264, C > G) 0.19의 원래 VAF와. ECS 단일 뉴클레오티드 변종 1:10,000의 수준으로 양적은 그림 1 에서 설명 합니다.

그림 1: GATA1 SNV 보여주는 ECS 1:10,000의 수준으로 양적은 희석 시리즈. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

우리는 또한 ECS DNA 안정적으로 성인 급성 골수성 백혈병 (AML) 건강 한 노인 개인⁴에 recurrently 유전자에 드문 클론 변이 감지 하는지 보여준다. 우리는 간호사의 건강 연구 틀 약 떨어져 ~ 10 년에서에서 20 건강 한 개인에서 버 피 코트 샘플을 얻었다. 우리는이 샘플에 ECS-DNA 패널 프로토콜을 적용. 이 실험에 대 한 우리 Illumina TruSight 골수성 시퀀싱 패널 568 amplicons (자세한 내용은 https://www.illumina.com/products/by-type/clinical-research-products/trusight-myeloid.html에 유전자 목록에) 구성 된 적응 및 시퀀싱 20 개인에서 80 라이브러리 (다른 시간 지점에서 2 컬렉션, 시간 당 개인 당 2 복제 지점) 47.7 백만 쌍 간 읽기의 평균 및 오류를 수정 하는 3.4 백만의 평균을 생성 Illumina NextSeq 플랫폼을 사용 하 여 도서관⁴당 합의 시퀀스입니다. 라이브러리 당 평균 뉴클레오티드 커버리지 (3.4 수백만 568로 나눈 값) x 6000 대략 이었다. 각 샘플에 대 한 우리는 동일한 샘플에서 되지 않은 시퀀스 된 라이브러리를 사용 하 여 위치 특정 오류 프로필을 건설 한다. 우리는 하나 이상의 컬렉션 시간 지점의 두 복제에 109 클론 체세포 돌연변이 발견. 이러한 돌연변이 VAF 0.0003-0.1451에서 배열 있다. 우리가 알려진된 우주 표현으로 21 돌연변이 선택 하 고 하나 또는 두 개의 컬렉션 시간 포인트 ddPCR를 사용 하 여 모든 21 돌연변이 확인 (n = 34, 그림 2, 젊은 외. 2016⁴에서 적응).

그림 2: ECS로 식별 하는 돌연변이 매우 조화 된 VAFs와 ddPCR를 통해 확인 했다. (n = 34, 젊은 외. 2016⁴수정). 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

ECS RNA 프로토콜을 사용 하 여 오류 수정 식 수준에 관하여 우리 다양 한 암 (QIAseq 인간의 암 Transcriptome 패널에서 적응), 그리고 우리와 관련 된 것으로 알려진 416 유전자의 구성 된 QIAseq 화학을 사용 하 여 유전자 패널 사용자 정의 ( 보충 자료1에서 유전자 목록) 주어진된 유전자의 가장 일반적으로 표현한 exon 증폭. 우리 쌍 간 형식 라이브러리, 당 8.3 백만 읽기의 평균을 준 Illumina MiSeq 플랫폼을 사용 하 여 라이브러리를 시퀀싱 그리고 우리 0.417 백만 오류 수정 합의 시퀀스의 평균을 잡으려고 관리. 우리 식 수준 낮은 풍부한 사본 보여주었다 (< 50에서 1000 사본 수 총 RNA의 ng) 복제 사이 높은 재현성은 (데이터 요소 n = 300, 그림 3). DdPCR (식의 다양 한 정도의 6 선택 된 유전자)에 의해 유효성 검사 유전자의 식 수준 올바르게 정규화에 대 한 필요 없이 ECS 프로토콜에 의해 점령 되었습니다 했다 설명 했다.

그림 3: 상단, 대 본의 상관 관계 계산 ECS RNA에 의해 동일한 샘플의 복제 사이 (n = 300). 하단, ECS로 식별 하는 건의 했다 ddPCR에 의해 확인 하는 사본 (n = 6). 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

Discussion

다른 질병에 낮은 VAFs와 돌연변이 연구를 쉽게 구현할 수 있는 오류 수정 시퀀싱 프로토콜의 집합을 설명 합니다. 그들은 원시 읽기 오류 보정을 가능 하 게 가장 중요 한 요소 시퀀싱 전에 각 분자 Umi의 법인입니다. 여기에 설명 된 방법을 상용 유전자 패널을 자체 설계 유전자 특정 oligos 사용자 지정된 Umi를 통합 하는 연구를 허용 합니다.

표준 NGS 프로토콜 precludes 시퀀싱 오류 비율 때문 2% 아래 VAF와 변이의 탐지 하 고이 희소 한 이체의 탐지는 중요 한 연구에서 NGS의 응용 프로그램을 제한 합니다. 우회 표준 NGS 오류율, ECS이 원시 이체의 민감한 감지 수 있습니다. 예를 들어, 이러한 돌연변이 처음 (따라서 데 낮은 VAF) 발생 때 병원 성 변이의 탐지 병¹⁴^,¹⁵의 조기 개입에 게 필수적입니다. 백혈병 연구, 최소한의 잔류의 검출에에서 질병 (잔여 leukemic 세포 후 처리) 위험 계층을 알립니다 및 이진 흐름 cytometric 평가 수 없습니다 하는 방식으로 치료 옵션을 통보 하는 데 사용할 수. 또한, ECS 순환 종양 핵 산을 검출 하 고 단단한 종양 환자에서 전이성 잠재력을 평가 하는 존재/부재로의 기본 특성은 특정 돌연변이의 변형 부담을 평가 하 여 적용 됩니다. 종양¹⁶.

표 1에서처럼 변종 전화 위치 특정 오류 이항 분포-기반 모델을 사용 하 여 전원 시퀀싱 오류 모델을 구축 하는 데 사용의 깊이 뿐만 아니라 시퀀스 라이브러리의 수에 따라 달라 집니다. 오류 모델의 견고성 샘플 및 시퀀싱 깊이 더 높은 수가 증가합니다. 각 샘플에 대 한 오류 프로필 범위의 오류 수정 읽기 샘플 당 3000 x의 평균 최소한 10 시퀀스 샘플을 사용 하는 것이 좋습니다. 위치-특정 방식은 비슷한 MAGERI, 하지만 모든 6 다른 대체 종류에 대 한 집계 오류 비율을 사용 하는 대신 (A > C/T > G, A > G/T > C, A > T/T > A, C > A/G > T, C > G/G > C C > T/G > A)¹³, 우리 모든 위치에 독립적으로 각 대체 모델. 예를 들어, C의 오류 비율 > T는 genomic 위치는 다른 위치에서 다른. 우리의 접근 방법 또한 걸립니다 계정에 연속 배치 효과 관찰 한 시퀀싱 실행 기본 대체 속도에서 실행 하는 다른 다를 수 있습니다. 따라서 그것은 특히 다른 시퀀싱 실행에서 샘플 모델 구축 풀링되지 때 모든 대체 형식에 대 한 각 위치를 모델링 하는 것이 중요.

ECS 실험을 설계할 때 중요 한 고려 사항은 원하는 검출 임계값입니다. NGS 연구의 아름다움은 그 그들은 쉽게 확장할 수 유전자/대상 관심, 검출 임계값 (시퀀싱의 깊이 의해 결정), 및 쿼리 하는 개인의 수의 점에서. 예를 들어 연구원은 0.0001의 감지 임계값을 갖는 2 개의 amplicons에 드문 돌연변이 찾을 관심이 있다면, 그들은 최대 15 백만 읽기 출력 MiSeq V2 화학을 사용 하 여 실행 한 시퀀싱에 극대로 75 샘플 수영장 수 (2 amplicons * 10000 분자 * 10 오류 수정에 대 한 읽기 * 75 샘플 15 백만 시퀀싱 읽기 =). 연구원은 시퀀싱 또는 단일 시퀀스 검출 임계값 조정 실행에 풀링된 샘플 수로가 하는 분자의 수를 변화할 수 있다. 우리의 연구에서 우리 0.0001 VAF (1:10, 000)의 감지 임계값으로 돌연변이 찾을 목적 Illumina 유전자 패널을 사용 하 여. 우리가 일상적으로 250를 사용 하 여 상기 검출 임계값을 달성 하기 위해 충분 한 분자 캡처되는지 확인에 DNA 시작의 ng. 연구팀은 DNA의 낮은 금액으로 시작 하도록 선택할 수 있습니다 (50 ng는 것이 좋습니다) 원하는 검색 제한이 > 0.001 VAF.

Umi i5 인덱스에 추가 됩니다, 시퀀싱 설정을 적절 하 게 수정 되어야 할. 예를 들어 16 N Umi, 사용 하 고 시퀀싱 설정 된 2 x 144 짝된 끝 읽기, 인덱스 1의 8 주기 및 인덱스 2의 일반적인 8 사이클 반대로 인덱스 2의 16 주기. 인덱스 2 주기 증가 사이클 읽기에 할당 된의 총 수에 있는 감소에 의해 보상 된다. 연구원은 12N Umi¹⁰^,¹⁷를 사용 하기로 선택한 경우 인덱스 2의 12 주기를 설정은 변경 되어야 합니다.

이 우미 기반 시퀀싱 방법은 시퀀싱 오류 수정 최적화 됩니다. 모든 확대 기반 방법에 대 한 문제는 차선의 PCR jackpotting 처리에 남아 있습니다. 라운드 후 시퀀싱 및 게시물-생물 정보학 유효성 검사 ddPCR를 사용 하 여 수행 하 고 거의 PCR jackpotting 때문에 어떤 잘못 된 반응 감지. 그럼에도 불구 하 고, 연구원은 낮은 증폭 오류를 고화질 중 합 효소를 사용 하 여 실험을 실시 하는 것이 좋습니다.

Disclosures

저자는 공개 없다.

Acknowledgments

우리 아 이들의 종양학 그룹 AAML1531 연구 및 환자 샘플의 형태로 그들의 공헌에 대 한 간호사 건강 연구에서 참가자를 감사합니다. 이 작품은 건강의 국가 학회 (UM1 CA186107, RO1 CA49449 RO1 CA149445), 아 이들의 발견 연구소의 워싱턴 대학교 세인트 루이스 어린이 병원 (엠씨-II-2015-461)와 일 라이 세스 매튜 스 백혈병 재단에 의해 투자 되었다.

Materials

Name	Company	Catalog Number	Comments
Q5 High Fidelity Hot Start Master Mix	New England BioLabs	M0492S
Agencourt AMPure XP	Beckman Coulter	A63880
Qubit dsDNA HS Assay Kit	Thermo Fisher Scientific	Q32854
SYBR Safe DNA Gel Stain	Thermo Fisher Scientific	S33102
Truseq Custom Amplicon Index Kit	Illumina	FC-130-1003
UMI i5 adapter sequences	Integrated DNA Technologies	-
NEBNext Ultra End Repair/dA-Tailing Module	New England BioLabs	E7442S
NEBNext Ultra II Ligation Module	New England BioLabs	E7595S
QX200 ddPCR EvaGreen Supermix	Bio-Rad	1864034
QX200 Droplet Generation Oil for EvaGreen	Bio-Rad	1864005
QX200 Droplet Digital PCR System	Bio-Rad	1864001
ddPCR 96-Well Plates	Bio-Rad	12001925
DG8 Cartridges for QX200/QX100 Droplet Generator	Bio-Rad	1864008
DG8 Gaskets for QX200/QX100 Droplet Generator	Bio-Rad	1863009
Bioanalyzer	Agilent Genomics	G2939BA
TapeStation	Agilent Genomics	G2991AA
TruSight Myeloid Sequencing Panel	Illumina	FC-130-1010
Bowtie 2	Johns Hopkins University	-
Customized QIAseq Targeted RNA Panel	Qiagen	-
Rneasy Plus Mini Kit (50)	Qiagen	74134