Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

유전 변이의 아미노산 수준 신호-잡음 분석을 사용 하 여 Variant Pathogenicity의 가능성 확인

Published: January 16, 2019 doi: 10.3791/58907

Summary

아미노산 수준 신호-잡음 분석 주어진 인구의 유전 변이 배경으로 정규화는 주어진된 아미노산 위치에 유전 변이의 보급을 결정 합니다. 이 인구 (잡음)에 희소 한 이체의 주파수 이상으로 상승 하는 단백질 시퀀스 (신호) 내에서 변형 "핫스폿"의 확인에 대 한 수 있습니다.

Abstract

비용 및 다음 세대 유전자 시퀀싱의 속도 발전 임상 전체 exome 및 전체 게놈 테스트의 폭발이 생성. 유전 증후군과 관련 된 가능성이 병원 성 변이의 증가 식별을 주도하 고 있다, 그러나 그것은 또한 극적으로 증가 수 알 수 없는 의미 (VUS)의 유전 이체를 우연히 발견. 이 이체의 임상적 의미를 결정 하는 것은 과학자와 임상에 대 한 주요 도전 이다. Pathogenicity의 가능성을 결정에서 원조 하는 접근 방식을 단백질 시퀀스 레벨에서 신호 대 잡음 분석 이다. 이 프로토콜에서 알려진된 단백질의 높은 가능성과 기본 시퀀스의 영역을 식별 하기 위해 토폴로지를 단백질의 각 아미노산 위치에 변형 주파수를 활용 하 여 아미노산 수준 신호-잡음 분석 하는 방법을 설명 합니다. (상대적인 인구 "배경" 변이) pathologic 변화. 이 메서드는 다음 세대 유전 테스트에 의해 확인 된 그들 같이 VUSs의 진단 무게를 구체화 하는 데 사용할 수 있습니다 높은 pathologic 신호의 아미노산 잔류물 위치 "핫스팟"를 식별할 수 있습니다.

Introduction

접근성 및 약에 있는 유전학의 역할 유전자 시퀀싱 플랫폼의 급속 한 향상 혁명을 했다. 일단, 단일 유전자 또는 유전자의 소수에 국한, 비용에서 감소 및 시퀀싱 유전자는 게놈의 전체의 일상적인 시퀀싱 주도하 고 있다 다음 세대의 속도 증가 순서 (전체 exome 시퀀싱, WES) 코딩의 전체 게놈 ( 전체 게놈 시퀀싱, WGS) 임상 설정에서. 웨스와 WGS 사용 되었습니다 자주 비판적으로 아픈 신생아와 유전 증후군에 대 한 우려와 함께 어린이의 설정에서 어디 그것은 임상 관리1,2를 변경할 수 있습니다 입증 된 진단 도구입니다. 유전 증후군과 관련 된 가능성이 병원 성 변이의 증가 식별을 주도하 고 있다, 하는 동안 그것은 또한 극적으로 덧붙여 발견된 유전 이체, 또는 예기치 않은 긍정적인 결과 알 수 없는 진단의 수를 증가 중요성 (VUS)입니다. 이 이체의 일부는 무시 하 고 보고 되지, 변종에 지역화 하는 동안 잠재적으로 치명적인 또는 매우 병 적인 질병와 관련 된 유전자는 자주 보고. 현재 지침에 부수적 변종 갑자기 심장 죽음 predisposing 질병 cardiomyopathies 등의 개발과 관련 된 유전자를 포함 하 여 환자에 게 의료 혜택의 수 있습니다 특정 유전자에 발견의 보고 하는 것이 좋습니다, channelopathies3. 이 권장 사항은 SCD predisposing 질병의 위험에 개인을 캡처 하도록 설계 되었습니다, 비록 변형 검출의 감도 훨씬 특이성을 초과 합니다. 이 VUSs의 증가에 반영 되 고 덧붙여 불분명 진단 유틸리티까지 주어진된 인구4에 각각 질병의 주파수를 초과 하는 이체를 확인. 같은 하나의 질병, 긴 QT 증후군 (LQTS), 심장 이온 채널을 부호화 하는 유전자를 지역화 하는 돌연변이 의해 발생 하는 정식 심장 channelopathy 또는 단백질, 그 결과 상호 작용 하는 채널 지연 심장 repolarization5. 심전도, 휴식에 장기간된 QT 간격으로 본이 지연된 repolarization torsades de pointes등 잠재적으로 치명적인 심 실 부정맥을 전기 경향에 발생 합니다. 다양 한 유전자 돌연변이 KCNQ1에서이 질병의 개발에 연결 된 동안-난에 인코딩Ks 칼륨 채널 (KCNQ1, Kv7.1) 이며 LQTS 1 형의 원인6아래 예제로 활용 됩니다. 변형 해석에 복잡성을 보여주는, LQTS 관련 유전자, 소위 "배경 유전 변이" 희소 한 이체의 존재는 앞에서 설명한7,8되었습니다.

알려진된 병원 성 이체의 큰 대 요-스타일 데이터베이스, 뿐만 아니라 여러 전략 효과 다른 이체를 생산할 예정 이다 예측에 대 한 존재 합니다. 일부는 선별 등 Polyphen 2, deleteriousness,910예측을 소설 아닌 동의어 이체의 많은 수를 필터링 할 수 있는 알고리즘을 기반으로 합니다. 이러한 도구의 광범위 한 사용에도 불구 하 고 낮은 특이성 "호출" 임상 VUSs11에 관해서 그들의 적용을 제한 합니다. "신호 대 잡음" 분석 문제의 loci에서 알려진된 pathologic 변이의 주파수는 인구에서 희소 한 유전 변이 대 한 정규화에 따라 질병와 관련 된 되 고 variant의 가능성을 식별 하는 도구입니다. 변종 유전자 loci를 지역화 그곳에 높은 신호-잡음, 인구 기반 유사에 비해 질병 관련 돌연변이의 높은 보급은 더 높습니다 스스로를 해야하는 질병 관련. 더, 희귀 한 변종 발견 덧붙여 희귀 인구 이체의 높은 주파수를 가진 유전자에 지역화 질병 관련 된 주파수, 낮은 신호-잡음에 비해, 질병 관련 될 가능성이 있을 수 있습니다. 신호 대 잡음 분석의 진단 유틸리티 cardiomyopathies 및 channelopathies;에 대 한 유전자 검사에 대 한 최신 가이드라인에 그림 되었습니다. 그러나, 그것은 전체 유전자 수준 또는 도메인-특정 레벨12에서 고용만 있다. 최근, 주어진 pathologic 변종은 (질병 데이터베이스, 문학에서 코 호트 연구) 및 인구 기반 제어 변종 (Exome 집계 컨소시엄, ExAC 및 게놈 집계 데이터베이스, GnomAD13)의 증가 가용성 이 단백질의 기본 시퀀스 내에서 개별 아미노산 위치에 적용 되었습니다. 아미노산 수준 신호-잡음 분석 보다는 가능성이 "배경" 유전자 변형으로 LQTS와 관련 된 질병 관련 유전자에 덧붙여 확인 된 변종 분류에 유용한 입증 했다. KCNQ1를 포함 하 여, LQTS와 관련 된 세 가지 주요 유전자 들이 우연히 발견 된 변종 부족 개별 아미노산 위치에이 이체의 주파수 드문 반영 제안 중요 한 신호 대 잡음 비율, 인구 변화 질병 관련 돌연변이 보다는. 또한 때 단백질 도메인 토폴로지 높은 신호 대 잡음, pathologic 돌연변이 단백질14의 주요 기능 도메인으로 "핫스폿"의 영역에 대 한 중첩 되었다. 이 방법론 1) 가능성 variant는 질병 또는 인구 관련 결정 하 고 2) 인간의 질병과 관련 된 단백질의 중요 한 새로운 기능 도메인 식별 약속을 보유 하고있다.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. 유전자와 특정 스플라이스 Isoform의 식별

참고: 여기, 우리가 관심 관련 된 관심의 질병의 병 인 유전자에 대 한 합의 순서를 식별 하기 위해 합15 의 사용 설명 ( KCNQ1 돌연변이 LQTS와 관련 된). 대안 합을 통해 생명 공학 정보 (NCBI)16 에 대 한 국립 센터와 캘리포니아 대학, 산타 크루즈 (UCSC) 인간 게놈 브라우저17 RefSeq 포함 ( 재료의 표참조).

  1. 합 홈페이지에 종 ( 인간) 드롭다운 메뉴에서 선택한 관심 약어의 유전자 ( KCNQ1) 필드에 입력 합니다. "이동" 클릭
  2. 관심사의 유전자에 해당 하는 링크를 선택 합니다 (예: "KCNQ1 (인간의 유전자)"
  3. 관심 관심 ID의 사본에 "사본 테이블"에서 해당 링크를 선택 합니다 (즉, TranscriptID ENST00000155840.10, NM_000218 [RNA 사본], NP_000209 [단백질 제품의 RNA 사본]).
    참고: 정확한 사본 합의 시퀀스 선택 되도록 관련 문학에의 검토 필요 합니다.
  4. 참고 대 본 특정 NM와 나중에 참조할 "성적표 테이블"의 "RefSeq" 열에 있는 NP 식별 번호.
  5. NCBI 단백질 데이터베이스에서 새로운 웹 페이지를 열려면 NP ID 번호와 연결 된 링크를 선택 합니다.
  6. 관심사의 유전자 사본에 대 한 단백질 (기본) 시퀀스를 "기원" 섹션으로 스크롤하십시오.
  7. 단백질 기능 (기능 도메인, 바인딩 도메인, 포스트 번역 상 수정 사이트)의 목록을 "기능" 섹션까지 스크롤.
    참고: NCBI 단백질 데이터베이스를 통해 또는 문학에서 기본 소스에서이 정보 또한 얻을 수 있습니다. 이 단계 5에서에서 더 논의 될 것입니다.

2. 만들기 실험 유전자 변형 데이터베이스 ("신호")

참고: 여기, 관심 질병을 가진 개인 사이 질병 관련 된 이체의 주파수와 관심사의 유전자에서 질병 관련 된 이체의 데이터베이스를 만드는 방법을 설명 합니다. 이 데이터베이스는 많은 형태를 취할 수 하 고는 "신호" (긍정적인 표현 형 유전 변이) 제어 변형 데이터베이스에 대 한 정규화 됩니다 나타냅니다. 덧붙여 식별 단백질 2) VUSs, 등의 소설 기능 도메인 VUSs, 질병 관련 된 변종의 가능성을 확인 하기 위해 비교를 식별 하는 VUSs에 대 한 비교에 대 한 1) 질병 관련 된 변형 등이 있습니다. pathogenicity입니다. 질병 관련 된 변종 KCNQ1에 수 여 됩니다 그림; 그러나, 메서드는 덧붙여 식별 VUSs의 분석 또는 실험적인 이체의 다른 세트는 동일 합니다.

  1. 관심 있는 관심사의 유전자는 포괄적으로 모든 판단은 대 한 genotyped의 질병과 관련 없는 인덱스의 경우/판단은의 cohort(s)를 식별 ( 연구 식별 24 없는 판단은 변종 KCNQ1 200에서 호스팅 개인 LQTS와 KCNQ1 유전자 심문을 복종 되었다).
    참고: 이러한 동료 실험적인 유전 분석, 문학, 또는 둘 다의 조합에서 확인할 수 있습니다.
    1. 코 호트 기반 되지 않은 연구를 제외 (즉, 단일 돌연변이 양성 개인 사례 보고서), 관심, 유전자에 대 한 개인 genotyped의 총 수를 제공 하지 않습니다 또는 포괄적으로 유전자 유전자 (분석 하지 않습니다 만 KCNQ1 exons 2-4의 "대상된" 유전자 검사) 이러한 배제는 variant의 주파수의 계산.
    2. 없는 판단은 하로이-변형 주파수 (LQTS 20 환자의 코 호트에서 KCNQ1 돌연변이와 4 없는 개인 식별즉, 연구를 예상할 수 있는 관련된 개인을 제외 하는 개인이 포함 합니다. 이러한 판단은 중 5 다른 돌연변이 양성 혈 연 가족의 일부입니다. 모든 가족 구성원을 제외 하 고 4 없는 판단은 포함).
  2. 모든 실험 유전 이체 확인 된 cohort(s)에서 컴파일
    1. 야생-타입 아미노산, 아미노산 위치 및 변형 아미노산 (즉, 알라닌 아미노산 번호 212 valine, Ala212Val 또는 A212V로 변경)을 포함 하는 명칭을 지정 합니다. 명명법에의 한 같은 종류는 그림 1에서 보여 줍니다.
    2. 확인 모든 실험 유전 이체의 변형 명명법 1.4 단계에서 설명한 것 처럼 동일한 참조 유전자 사본에 기반 합니다. 실험적인 유전 이체는 동일한 참조 유전자 사본에 주석 처리 하지 경우 다음 사본 맞춤을 사용 하 여 참조 사본으로 변형 위치 reannotate (단계 1.2 참조)
  3. 변종 탐험 되 고 질문에 따라 적용 되지 않는 제외 합니다.
    1. 게놈의 단백질을 변경 하지 않는 변종 비 코딩 영역 지역화 제외 변종 동의어, intronic 이체, 5' 또는 3' 번역된 지역 [UTR], 그리고 intergenic 지역 등 변종 시퀀스 (즉, 보고는 pathologic 5 ' localizes KCNQ1에 변형 코딩 영역의 UTR 것 제외 하지 단백질 시퀀스 변경 예측으로).
    2. 연구에 대 한 포함 기준을 충족 하지 않는 이체를 제외 합니다. 질병 관련 된 변종에 변종 이상 pathologic 간주 됩니다 포함 됩니다.
      1. 각 variant 현재 고려 병원 성, 가능성이 확인 병원 성, 또는 하지 양성 적어도, 상호 ClinVar 데이터베이스와 변형에 의해 ( 재료의 표참조).
      2. 유전자와 관심의 변종 ( KCNQ1 Y111C) ClinVar 검색 필드에 입력 하십시오, "검색"을 선택
      3. "변형/위치" 열 아래 관심의 변종을 식별 합니다.
      4. "임상 의미" 열 아래 pathogenicity의 합의 해석 참고 ( KCNQ1 Y111C 해석으로 "병원").
      5. 이체는 포함 "가능성이 병원 성" 또는 "병원 성"
      6. "충돌 해석 pathogenicity 의"의 명칭으로 변형을 포함 "불확 실한 의미," 기록을 사용할 수 있는 경우 ("제공 되지 않음") 또는 연구 보증 하는 경우.
      7. 변종으로 지정 제외 "가능성이 양성" ( KCNQ1-A62T).
  4. 각 실험 변형 위치의 사소한 대립 유전자 주파수 (MAF)를 계산 합니다.
    1. 어떻게 어떤 대립 유전자 ( KCNQ1 Y111C heterozygous 돌연변이 2 없는 개인, 변종-긍정적인 대립 유전자의 수에서 발견 되는 2 경우) 각 해당 variant에 대 한 긍정적인 했다 계산 합니다.
    2. 코 호트 내에서 시퀀싱 하는 대립 유전자의 총 수를 계산
      1. 각 코 호트 연구 (2.1 단계)에 순서가 개인의 총 수를 note
      2. 2 대립 유전자의 총 수를 결정 하 여 개인의 총 수를 곱하면.
        참고:이 추정 2 중 게놈에 의하여 각 대립 유전자의 각 개별 호스트 2.
    3. 각 아미노산 위치 (단계 2.4.2에서에서 단계 2.4.1/alleles에서 대립 유전자)에 대 한 변종-긍정적인 개인의 총 수를 계산 합니다. 예를 들어, 2 없는 각 개인 각각, 100 및 200 LQTS 괴로움 개인의 동료에서 heterozygous KCNQ1 Y111C 돌연변이 호스트 다음 아미노산 위치 111에서 실험적인 이체의 주파수는 2 변종/((100+200 individuals ) * 2 대립 유전자/개별) (즉, MAF 0.0033 결합).
    4. 각 실험 이체의 각각 농림 부로 각 변형에 대 한이 값을 계산 합니다. 대 한 자세한 내용은 단계 4.2를 참조 하십시오.

3. 만들기 제어 유전자 변형 데이터베이스 ("잡음")

참고: 여기, 통제 인구에 관련 된 주파수 관심사의 유전자에 제어 이체의 데이터베이스를 만드는 방법을 설명 합니다. 이 데이터베이스는 "잡음을" (형 부정, 인구 기반 유전 변이)는 실험 변형 데이터베이스 정규화 될 배경입니다 나타냅니다. 이것을 "제어" 변화 라고 합니다.

  1. 건강 하 고, 없는 판단은의 cohort(s)를 식별 하거나 사용 하는 큰 인구 기반 연구를 주어진된 인구 사이 희소 한 이체를 식별.
    참고:이 데이터베이스에 대 한 소스는 다양 하 고 포함: 1) 건강 한 개인 또는 그렇지 않으면 표현 형 부정 개인 대상이 생어 시퀀싱, 또는 공개적으로 개최 데이터베이스는 문제의 질병은 인구 기반 개인의 2와 같은 주파수에서 드문) 1000 게놈 프로젝트 (N = 1094 과목)18, 3) 국가 심 혼, 폐, 혈액 연구소 이동 Exome 시퀀싱 프로젝트 (ESP, N 5,379 과목)19, 4) Exome 집계 컨소시엄 (ExAC, N 60,706 과목)13 , 또는 5) 게놈 집계 데이터베이스 (GnomAD, N = 138,632 개인)13 ( 재료의 표참조). GnomAD 데이터베이스 설명 예로 활용 될 것입니다.
    1. ( KCNQ1) GnomAD 홈페이지에 검색 상자에 관심사의 유전자를 입력 합니다.
    2. 브라우저 선택 올바른 유전자 및 관심 (1.4 단계)의 성적 확인.
    3. "말은 범위"와 "보험 줄거리."를 검토 하 여 시퀀싱의 소재 시의 적절 한 범위 인지 확인
    4. "Missense + LoF."를 선택 하 여 코딩 하는 유전자 변형 시퀀스 선택
    5. 선택 "내보내기 테이블을 CSV," 텍스트 편집기 파일을 생성 하는 "알 수 없음." 라는
    6. 클럭이 파일 하 고 새로운 확장 "*.csv" ( "KCNQ1 제어 Variation.csv")를 포함 합니다.
    7. ( 테이블의 자료참조) *.csv 파일의 분석을 위한 적절 한 소프트웨어 프로그램을 사용 하 여 파일을 엽니다.
  2. "단백질 결과." 표시 된 열에 있는 유전 변이 변경 단백질 식별
  3. 실험적인 유전 이체 (2.3.1 단계)으로 이러한 제어 유전자 변형 같은 제외 기준 적용 됩니다.
  4. 각 제어 variant의 MAF를 식별 합니다.
    1. Variant를 항구를 발견 하는 대립 유전자의 수를 나타냅니다 "대립 유전자 개수" 열을 찾습니다.
    2. 아미노 산 성 위치를 주어이에 시퀀싱 하는 대립 유전자의 총 수를 나타냅니다 "대립 유전자 번호" 열을 찾습니다.
      참고: 대립 유전자 시퀀싱의 총 수는 범위 해당 위치에 따라 달라 집니다. 높은 적용의 지역 2 접근 합니다 * GnomAD 내에서 개인의 총 수 (즉, 138,632 개인에 대 한 완전 한 범위 포함 genotyped 277,264 총 대립 유전자).  반대로, 낮은 범위의 영역 감소 총 대립 유전자 수 있을 것 이다
    3. 농림 부는 미리 "대립 유전자 주파수" 열에서 계산 되 고 "대립 유전자 수" "대립 유전자 수입니다."로 나눈 값을 나타내는 variant를 찾습니다
      참고: 인간의 유전자는 각 대립 유전자의 2 개의 ( 1 발견 10 명 heterozygous 변형이 있는 것은 1/20의 농림 부)
    4. 각 제어 이체의 각각 농림 부로 각 변형에 대 한 농림 부 note.
      참고: GnomAD 구성 된 각 인종/민족적인 그룹에 대 한 변형 특정 농림 부는 "대립 유전자 주파수."의 오른쪽 열에서 볼 수 있습니다.
  5. 희소 한 이체는 제어 변종 "일반."로 제외 됩니다에 대 한 농림 부 임계값을 적용
    1. MAF 임계값 임계값 아래 모든 진정한 질병 관련 된 변종 (단계 2 참조) 또한 제어 데이터베이스에서 관찰 포함 최대 값을 설정 (, 모든 질병 관련 KCNQ1 변종 또한 GnomAD에서 발견 중에 가장 일반적인 이체 MAF는 0.009, 0.01의 임계값 이상 모든 GnomAD 변종 제외 되어야 하는 다음).
  6. 실험 변형 명명법 제어 동일 인지 확인 (단계 2.2 참조).
  7. 파일을 저장 합니다. 어떤 경우에이 파일 형식 확장명을 변경 해야 합니다.

4. 아미노산 수준 신호 대 잡음 계산 및 매핑

  1. 각 아미노산 위치 제어 변종에 대 한 농림 부를 계산 (예 KCNQ1 GnomAD 이체를 포함 된 그림 1 참조).
    1. 그래프 지원 스프레드시트에서 모든 실험적인 이체의 위치의 열을 만듭니다.
    2. 떠나야만 변형 위치 변형 텍스트를 제거 합니다.
      참고: 다양 한 기능/수식 자동으로 세포 (그림 1, C 열, 참조 테이블의 재료) 내에서 이러한 텍스트 요소를 삭제 하려면 활용할 수 있습니다.
    3. 정렬 오름차순 값 식별 위치는 (그림 1, E; 열 연관 1 이상의 변종에 변종 즉, 아미노산 위치 10에에서 나열 됩니다 두 번 위치에서 2 독특한 변종 나타냅니다 열 전자).
    4. 지정 된 위치 (그림 1, G 및 H 열)에 대 한 모든 MAFs의 합계를 복용 함으로써 주어진된 위치와 관련 된 각 변형에 대 한 농림 부를 결합 한다.
  2. 각 아미노산 위치는 실험 변종에 대 한 농림 부 계산 (모의 KCNQ1 pathologic 이체를 포함 된 그림 2 참조).
    1. 4.1.1에 유사한 유행에서 아미노산 위치는 실험적인 이체 (그림 2, B 열)의 열을 만듭니다.
    2. 각 변형 위치 단계 2.4 (그림 2, 열 C G)에서 그 위치와 관련 된 모든 이체의 MAF 계산 합니다.
  3. 회전 만들기 실험 둘 다에 대 한 농림 부 및 제어 이체의 평균.
    1. 4.1와 4.2를 농림 부로 아무 변형 있는 아미노산 위치에 대 한 셀을 포함 하도록 만든 열 확장 = 0. (그림 3)입니다.
      1. ( 1 676 KCNQ1, 그림 3, 열 C와 나)의 유전자에서 모든 아미노산 위치를 포함 하는 열을 만듭니다.
      2. 제어 및 실험 데이터 집합에 대 한 변형 하지 않은 모든 위치에 대 한 0의 농림 부를 추가 합니다.
        참고:이 일반적으로 사용된 하는 소프트웨어 프로그램 (그림 3, 열 D와 J, 재료의 표참조)에 "VLOOKUP" 기능을 이용 하 여 자동으로 할 수 있습니다.
    2. 회전을 만들고 각에 대 한 평균 실험 및 제어 유행 열.
      참고:이 인접 위치 pathogenicity의 유추에 대 한 수 및 수 수 변경, 또는 심지어 제외, 연구의 요구에 맞게.
      1. 모두에 농림 부의 압 연 평균을 나타내는 열 만들기는 제어 및 실험 데이터 세트 (그림 3, E 및 K 열).
      2. 압 연 평균 열에서 N 맨끝 및 5 변형 된 위치에 C-터미널 위치 5 다른 위치에 대 한 각각 농림 부의 평균을 놓습니다.
        참고:이 회전 만듭니다 + 5의 평균. 미만 5 아미노산 잔류물, 앞으로 또는 다음, 압 연 평균 위치 (즉, N 또는 C terminus) 위치에 대 한 압 연 평균 걸릴 것입니다만 계정에 존재 하는 그 잔류물 (즉, 회전에서 평균 3만 8, 아미노산 위치 1에서 농림 부의 평균 것 아미노산 위치 계산 이러한 MAFs 8로 나눈 값의 합으로).
  4. 2 낮은 롤링 MAF 나누어 최소 제어 주파수를 계산 합니다.
    1. 신호 대 잡음 비율을 계산할 때 0으로 나누기를 방지 하려면 최소 주파수를 제어 0의 MAF와 셀을 변경 합니다.
  5. (그림 4) 아미노산 수준 신호 대 잡음 비율을 계산 합니다.
    1. 각 아미노산 위치 평균 평균 롤링 각각 제어 하 여 압 연 실험을 나눕니다.
    2. 이 비율 (y 축) 아미노산 위치 (x 축) 그래프.

5. 단백질 도메인 토폴로지 오버레이

  1. 기능 도메인/기능, 합의 아미노산 위치 또는 포스트 번역 상 수정, 관심 (단계 1.7)의 단백질의 영역을 식별 합니다.
    참고: 이러한 도메인을 식별 하는 다양 한 자료를 활용할 수 있습니다. 이러한 리소스, 뿐만 아니라 새로운 단백질에 상 상속 도메인을 식별 하는 데 리소스는 문학20에 잘 검토 되었습니다 했습니다. 이 프로토콜은 NCBI, 널리 이용 되 고 강력한 ( 재료의 표참조)를 통해 사용할 수 있는 단백질 데이터베이스를 설명 합니다.
  2. 단백질 도메인/기능과 관련 된 아미노산 위치를 식별 합니다.
    1. NCBI의 웹 페이지를 엽니다.
    2. 관심사의 단백질의 NP 검색 필드에 입력 합니다.
    3. 알려진된 단백질 도메인을 식별 하 고 기능을 "기능"에서 카탈로그
    4. 식별 하 고 도메인 이름/유형 및 아미노산 위치 합니다.
    5. 관심 주 시퀀스의 단백질에 영역을 시각화 하는 기능에 해당 하는 링크를 선택 합니다.
  3. 도메인/특징의 경계를 포함 하는 열을 만듭니다.
    1. 아미노산 위치 열 수 있도록 신호: 소음 열 다음 열을 만듭니다 (그림 5A, C 열)를 참조.
    2. 각 도메인/기능의 N 맨끝 또는 C 터미널 측면에서 해당 셀을 식별 하 고 ( KCNQ1의 S1 막 횡단 도메인의 N 맨끝 도메인은 아미노산 위치 122, C 터미널 도메인 이며 위치 하는 경우 각 셀에 1을 배치 142, 다음 1에에서 배치 됩니다 아미노산 위치 122 142에 대 한 행).
    3. 도메인/기능, 중복에 대 한 다른 값 (예: 1.5, 2, 2.5); 1을 변경 하 여 여러 도메인을 표시 이 도메인을 구별에 지원할 수 있습니다.
  4. (그림 5B) x 축에서 y 축과 아미노산 위치 이러한 경계는 그래프를 만듭니다.
  5. 4.4 단계에서 만든 신호-잡음 그래프와이 그래프를 오버레이 합니다.
  6. 알려진된 단백질 도메인/기능 및 신호-잡음 분석 간의 상관 관계를 식별 합니다.

6. 변형 위치 오버레이

  1. 4.4 및 5.4 단계에서 생산 하는 그래프의 오버레이 대 한 개별 변형 위치를 매핑하십시오.
    1. 행 열에 것 이다 아미노산 위치 (그림 5A, 열 D)에 해당 하는 도메인/기능 열 다음 열을 만듭니다.
    2. 각 이체를 포함 하는 위치에 해당 하는 추가 행에서 각 셀에 1을 놓습니다.
    3. (그림 5C) x 축에서 y 축과 아미노산 위치로이 열 그래프를 만듭니다.
  2. 신호 대 잡음 그래프 4.4 단계에서 만든 및 단계 5.4에서에서 만든 도메인 그래프와이 그래프를 오버레이 합니다.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

아미노산 수준 신호 잡음 분석을 위한 KCNQ1 대표 결과 그림 6에서 묘사 된다. 이 예제에서는 드문 이체 GnomAD 코 호트 (제어 코 호트)에서 식별 된 덧붙여 식별 웨스 이체 (실험 일대 #1), 그리고 LQTS 케이스 관련 된 변종 간주 가능성이 질병 관련 (실험 일대 #2) 묘사 된다. 또한, 웨스와 LQTS 일대 변형 주파수를 비교 하는 신호 대 잡음 분석 GnomAD 변형 주파수 묘사에 대 한 정규화. LQTS 관련 된 변종 채널 기 공, 선택 필터와 KCNE1 바인딩 도메인에 해당 도메인에서 높은 신호 대 잡음 비율을 설명 했다. 비교에서는, 웨스 코 호트에서 우연히 발견 된 변종 않았다 명확 하 게 설명 하지 이러한 변종 배경 유전 변이 반영 하는 것을 건의 높은 신호-잡음 상승의 특정 지역. 이 예제에서는 변종 MAFs; 위에 언급 된 대로 사용 되지 않았다 그러나, 그것은 보여줍니다 모든 동일한 원리의 설명.

Figure 1
그림 1 : 제어 변형 데이터베이스 MAF 계산의 예. 열 A는 직접 GnomAD 제어 희귀 변종 수입. 열 B, 문자 제거에 대 한 예를 들어 수식을 사용 하 여 variant 명명법에서 왼쪽 면, 위치 관련 된 텍스트의 삭제 (: b 2에 대 한 "오른쪽 = (A2, LEN (A2)-5", 테이블의 자료를 참조). C 열, 관련된 수식을 사용 하 여 variant 명명법에서 오른쪽 양면, 위치 관련 된 텍스트의 삭제 (: c 2에 대 한 "= LEFT(B2,LEN(B2)-3"). D 열, 결과 정렬 아미노산 위치 되지 않은. 열 E, 아미노산 위치 중복 위치 식별을 위해 허용 하는 오름차순 방식에서 정렬. GnomAD에서 가져온로 열 F, 각 변형에 대 한 농림 부 관련 된. 열 G 및 H, 주어진된 아미노산 위치 (각 변형 특정 위치에 농림 부의 합계)에 대 한 농림 부를 결합. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

Figure 2
그림 2 : 농림 부 계산 실험 변형 데이터베이스의 예. 열 A의 목록 LQTS 관련 돌연변이 KCNQ1에서 질병 관련 돌연변이 실험 데이터베이스를 나타내는 조롱. 열 B, 돌연변이 위치 각 변형에 해당. C 열, 모의 연구 1 내의 돌연변이 양성 개인의 수. 각은 heterozygous 돌연변이 사업자도 추정. 개인 연구에 genotyped의 총 수는 시트의 아래쪽에 위치 해 있습니다. D, 모의 연구 2에 있는 돌연변이 양성 개인의 수 열. 열 E, 모의 연구 3 돌연변이 양성 개인의 수입니다. 열 F, 모든 연구에서 관찰 된 변이 호스팅 전체 돌연변이 양성 개인. 참고 다른 돌연변이 같은 아미노산 위치와 관련 된 결합 되어야 합니다. 열 G, 각 변이 아미노산 위치는 예를 들어 수식을 사용 하 여 MAF (: g 2 "=2/(176*2)"에 대 한 재료의 표참조). KCNQ1 로커 스의 2 대립 유전자를 수행 하는 모든 개인 이후 heterozygous 것으로 추정 되 고 각 개인 추정, 총 개인 2 대립 유전자 주파수에 대 한에 의해 곱해 야 한다. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

Figure 3
그림 3 : 압 연 제어 및 실험적인 이체에 대 한 평균 계산의 예. 열 A와 B, GnomAD 변형 위치와 각각 MAFs를 제어합니다. C 열, 아미노산에서 KCNQ1의 모든 아미노산 위치 마지막에 위치합니다. 변형 없이 열 D, GnomAD 변종 농림 부는 농림 부와 위치 대신 0의 모든 위치에 대 한. 이 산출 될 수 있다 자동으로 VLOOKUP 함수를 사용 하 여 (즉, d 2, "IFERROR(VLOOKUP(C2,A:B,2,),0), = 재료의 표참조). 열 E, 압 연의 평균 위치 (즉, E2, "SUM(D2:D7)/6 =" 및 "= SUM(D2:D12)/11") E7는 예제 수식을 사용 하 여 농림 부. 열 G 및 H, LQTS 실험적인 이체 각각 MAFs와 위치. 열 나 KCNQ1의 모든 아미노산 위치. 열 J, LQTS 변종 모든 위치에 대 한 농림 부. 열 K, LQTS MAF를 압 연입니다. 회색 채우기 셀은 어디 MAF 값 열 B와 H는 확장 열 D와 J에 각각, 그것은 중요 한 모든 세포는 적절 한 수식에 대 한 "숫자"로 포맷 된 C/I. 유의 열에 각각 위치와는 상관의 예 작동. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

Figure 4
그림 4 : 신호 대 잡음 분석 및 그래프의 예. 왼쪽, 예제 데이터베이스 및 계산입니다. 열 A, KCNQ1의 모든 아미노산 위치. 열 B, LQTS 실험 농림 부 회전 각 위치에 대 한 평균입니다. 열 C, GnomAD 각 위치에 대 한 농림 부 압 연 평균을 제어합니다. D: 신호 대 잡음 비율 (즉, D2, "B2/C2 ="에 대 한). 아미노산 위치 (x 축) 대 신호 대 잡음 비율 (y 축)의 그래프의 오른쪽, 예. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

Figure 5
그림 5 : 단백질의 변형 위치 매핑 예. A, 예제 데이터베이스 및 계산입니다. 열 A, KCNQ1의 모든 아미노산 위치. 열 B, KCNQ1 위치는 GnomAD에서 확인 된 드문 제어 변종. C 열, 값이 포함 된 셀의 N 또는 단자 측면에 해당 하는 도메인 매핑 열 식별 KCNQ1 단백질 도메인 또는 기능. S1 도메인에서 아미노산 122 N 맨끝 경계는 대부분 N 맨끝 도메인으로 값이 없는 여기 설명 되어 있습니다. 열 D, 변형 매핑 열 1에 포함 된 셀 KCNQ1에 해당 하는 곳 위치는 희귀 변종 지역화 합니다. 회색 채우기 셀 열 대답에 있는 각각의 위치와 상관 관계를 변형 위치 B 열에서 D 열으로 확장 되는 두 가지 예는 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

Figure 6
그림 6 : KCNQ1의 아미노산 수준 신호-잡음 분석의 예-KCNQ1 인코딩 (Kv7.1). 최고, 변형 위치 드문 GnomAD, 코 호트 변종 (블랙), 덧붙여 식별을 포함 하 여 수직 라인 시연 웨스 조회 (파란색), 변형 및 변형 LQTS cases(green)에서 확인. 기능 도메인 설명 되어 있습니다. LQTS 케이스 이체 GnomAD 변종 (녹색 선)으로 정규화의 상대 주파수 웨스 (파란 선)에 비해 그려져 있습니다. S1-S6, 막 횡단 도메인; SF, 이온 선택 필터; KCNE1 그리고 AKAP9, 각각 단백질 바인딩 도메인입니다. 이전 작업14수정된으로 재발급된 권한. 이 그림의 더 큰 버전을 보려면 여기를 클릭 하십시오.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

높은 처리량 유전자 검사는 고급 극적으로 그것의 응용 프로그램 및 가용성에서 지난 10 년간. 그러나, 잘 설립 유전 토대, cardiomyopathies, 등 많은 질병에 확장 테스트 실패 했다 진단 수율21개선. 또한, 많은 확인 된 이체의 진단 유틸리티에 대 한 상당한 불확실성이 있다. 이것은 부분적으로 말하자면 확인 된 희귀 변종 WES에 WGS misdiagnosis22이어질 수 있는 발견의 증가. 아미노산 수준 신호-잡음 분석 예측 변형 pathogenicity 확고 전략에 근거 하 고 변형 해석 수정 대규모 인구 기반 게놈 연구 활용의 이점을 제공 한다.

이 프로토콜의 가장 중요 한 단계 중 하나는 다양 한 제어 및 실험 동료는 다음과 같습니다. 많은 공개적으로 사용 가능한 큰 게놈 연구의 현재 날짜에서 138,632 개인 만큼 큰 것이 프로토콜 제어 동료 대표에 대 한 수 수 있는 GnomAD와 같은 집계 데이터베이스를 통해 액세스할 수 있습니다. 이러한 집계 동료에서 모든 과목은 표면적으로 건강, 희귀 질병의 설정에서 큰 샘플 크기가이 리소스 귀중 한 만들고 엄격한 MAF 제외 임계값에 대 한 수 있습니다. 일반적인 이체의 배제는 그들은 매우 침투 Mendelian 질병의 원인이 될 가능성이 필요 합니다. 이전 작업을 바탕으로, channelopathy 관련 유전자에 대 한 0.01 0.0001 심근 유전자에 대 한의 MAF 임계값 적절 한 있을 수 있습니다와 독립적인 그룹23,24에 의해 검증 되었습니다. 중요 한 것은, MAF 임계값의 중요성을 감안할 때,이 해야 설정 되며 각 연구에 대 한 독립적으로 검증. MAF 임계값은 실험적인 코 호트, channelopathies 및 cardiomyopathies 설립자 돌연변이의 잘 설립 존재를 주어진 적용 되지 필요. 실험적인 코 호트의 크기 영역 어디 변종 클러스터 수 있습니다;을 식별 하기에 충분 해야 그러나, 더 엄격한 크기가입니다. 또한, 실험 일대는이 병원 성 신호의 정확성을 감소 것으로 문학, 내 양성으로 알려진 변종 포함 되지 않습니다.

제대로 선택 제외 기준 해석 및 결과의 적용에 대 한 중요 한 이기도 합니다. 이 프로토콜 동의어 이체 등 특정 돌연변이 클래스를 제외 하는 것이 좋습니다, 하지만 이들은 질병 프로세스는 해로운 동의어 이체 확인된25,26되었습니다 포함 feasibly 수 있습니다. 또한 때 다양 한 제외 기준 모두 실험에 적용 됩니다 및 그룹 제어, 그것은 수 수의 신호-잡음 매핑 계층 돌연변이 하위 클래스 (즉, 변종 잘라내기를 비교 missense)에 의해.

MAFs 롤링 평균 이웃 아미노산에 참여의 유추에 대 한 허용 하는 설정. 예를 들어 아미노산 위치 35 pathologic 이체를 포함 하 고 중요 한 단백질 도메인, 다음 36 pathogenicity 때 돌연변이의 정도 할 수 있습니다 위치에 있는. 마찬가지로, 기본 시퀀스의 스트레칭 있어야 희귀 제어 변종, 많은 양의 아미노산이이 지역 내에서 드문 이체를 호스트 하지 않는 아직 드문 이체는 인구에 있는 포함의 더 높은 가능성이 있을 수 있습니다 다음. 이 프로토콜에서 압 연 평균 5 +는,이 범위 수 수에 따라 달라 집니다 사용자의 원하는 레벨의 신호 대 잡음 비율 및 공부 되는 특정 단백질의 해결책. LQTS, interrogated KCNQ1예제에서-인코딩된 KCNQ1 채널 ~ 10 아미노산, 그 규모14에 중요 한 결과 반영 하기 위해 그들의 원하는 해상도 조정 하려면 저자 라는 스패닝의 막 횡단 도메인 몇 개 있다. 더 이상 기본 순서와 단백질 길이 단백질에 대 한 롤링 평균 범위 제어 편차 없이 단백질 시퀀스의 더 큰 범위 때문에 증가 될 필요가 있습니다.

이 방법에는 몇 가지 제한이 있습니다. 앞에서 설명 했 듯이 충분 한 표현 형-긍정적인 인구 putative pathologic 변종은 호스팅 분명 pathologic 신호를 운전 하기 위해서는 식별 되어야 합니다. 또한, 이러한 pathologic 변종은 변수 penetrance, 따라서 진정으로 pathologic 돌연변이 질병 표현 형을 참고 하지 수 있거나 그렇지 않으면 하지 완전히 침투 하 고 질병 일으키는. 유전 질병의 보급은 많은 공개 GnomAD, 같은 데이터베이스는 종종 "건강 한 동료"를 간주 됩니다 개최, 인구 연구이 데이터베이스에서 유사한. 으로,이 프로토콜 exonic 유전자 이체에서 아미노산, 병원 성 intronic 접합 이체 monogenic 질병에 재생할 수 있습니다 역할을 제외 하는 코드 인 아미노 산 수준의 변화에 특히 초점을 맞추고. 이 cardiomyopathies, 해상도의 확장에에서 그들의 최근 시연된 역할을 주어 접근 intergenic "핫스팟"으로 식별에 게 보증 될 수 있습니다. 또한, 농림 부 임계값의 응용 프로그램, 비록 존재 농림 부 보다는 질병의 유행, 기여할 수 질병 병 인27,28와 인구에 특정 "위험 대립 유전자" 놓칠 수 있습니다. 이러한 제한에도 불구 하 고이 분석 적응력이 이며 임상 질병 pathogenicity 적절 한 때의 상대적인 확률 적용을 제공 하는 중요 한 역할을 재생할 수 있습니다.

마지막으로, 아미노산 수준 신호 대 잡음 계산 pathologic 돌연변이 이용 하 여 단백질 내에서 중요 한 영역을 식별 하는이 분석의 취향을 감안할 때, 단백질의 비 발한 기능 도메인을 식별의 가능성을 제공 되 고 공부. 주어진 높은 pathogenicity 신호--소음 기 공, 선택 필터, S2 막 횡단 도메인, 도메인과 KCNQ1, 지역 내에서 "pathogenicity의 피크"의 식별의 KCNE1 바인딩 도메인 등의 이온 채널의 주요 위치에서의 관찰 알려진된 기능 없이 단백질의 새로운 중요 한 도메인을 제안할 수 있습니다. 예를 들어 LQTS 관련 돌연변이의 pathogenicity의 표시 된 피크 발견 되었습니다 KCNH2의 아미노산 잔류물 912-930에 지역화-인코딩된 KCNH2 (Kv11.1). 단백질의이 지역은 아니 식별 기능 도메인은 아직 LQTS 관련 돌연변이14표시 성향을 보여줍니다. 단백질 토폴로지 지식의 확장, 더 정교한 proteomics 수 feasibly 향상의 2 차, 3 차를 포함 하는 단백질의 기본 구조에 따라 신호 대 잡음 비율 분석에서 나중에이 방법의 해상도 또는 제 사기 구조입니다. 이 분석, 인공 지능, 기계 학습 등 첨단된 계산 과학의 월급 중 소설 패턴을 식별 하는 기회 pathologic 인구 기반 유전자 변형 대 강력한 하는 경우 이러한 데이터베이스 변종 생성된29,30일 수 있다. 차례로,이 메서드는 더 나은 특성화 및 특정 질병의 유전자 형 관계를 예측에 도움 고 유전자 검사의 진단 수율을 개선 하기 위해 개인의 질병의 사전 테스트 가능성과 함께에서 사용할 수 있습니다. 또한,이 분석 생물학 소설 단백질을 발견 하 고 질병 변경 될 때 매니페스트는 인간 게놈 내 소설 loci를 식별할 수 있습니다.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

저자는 공개 없다.

Acknowledgments

APL은 여는 국립 연구소의 건강 K08-HL136839 지원 하 고 있다.

Materials

Name Company Catalog Number Comments
1000 Genome Project N/A www.internationalgenome.org
ClinVar N/A www.ncbi.nlm.nih.gov/clinvar
Ensembl Genome Browser N/A uswest.ensembl.org/index.html
Excel Microsoft office.microsoft.com/excel/ Used for all example formulas and functions
Exome Aggregation Consortium  N/A www.exac.broadinstitute.org
Genome Aggregation Database  N/A www.gnomad.broadinstitute.org
National Center for Biotechnology Information Domain and Structure Database N/A www.ncbi.nlm.nih.gov/guide/domains-structures/
National Center for Biotechnology Information Gene Database N/A www.ncbi.nlm.nih.gov/gene/
National Center for Biotechnology Information Protein Database N/A www.ncbi.nlm.nih.gov/protein/
National Heart, Lung, and Blood Institute GO Exome Sequencing Project N/A www.evs.gs.washington.edu/EVS/
SnapGene GSL Biotech LCC www.snapgene.com
University of California, Santa Cruz Human Genome Browser N/A www.genome.ucsc.edu

DOWNLOAD MATERIALS LIST

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Meng, L., et al. Use of Exome Sequencing for Infants in Intensive Care Units: Ascertainment of Severe Single-Gene Disorders and Effect on Medical Management. Journal of the American Medical Association Pediatrics. 171 (12), 173438 (2017).
  3. Kalia, S. S., et al. Recommendations for reporting of secondary findings in clinical exome and genome sequencing, 2016 update (ACMG SF v2.0): a policy statement of the American College of Medical Genetics and Genomics. Genetics in Medicine. 19 (2), 249-255 (2017).
  4. Landstrom, A. P., Ackerman, M. J. The Achilles' heel of cardiovascular genetic testing: distinguishing pathogenic mutations from background genetic noise. Clinical Pharmacology and Therapeutics. 90 (4), 496-499 (2011).
  5. Landstrom, A. P., Tester, D. J., Ackerman, M. J. Role of genetic testing for sudden death predisposing heart conditions in athletes. Sports Cardiology Essentials. Lawless, C. , Springer. New York, NY. (2011).
  6. Wang, Q., et al. Positional cloning of a novel potassium channel gene: KVLQT1 mutations cause cardiac arrhythmias. Nature Genetics. 12 (1), 17-23 (1996).
  7. Kapa, S., et al. Genetic testing for long-QT syndrome: distinguishing pathogenic mutations from benign variants. Circulation. 120 (18), 1752-1760 (2009).
  8. Ackerman, M. J., et al. Ethnic differences in cardiac potassium channel variants: implications for genetic susceptibility to sudden cardiac death and genetic testing for congenital long QT syndrome. Mayo Clinic Proceedings. 78 (12), 1479-1487 (2003).
  9. Kumar, P., Henikoff, S., Ng, P. C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nature Protocols. 4 (7), 1073-1081 (2009).
  10. Adzhubei, I., Jordan, D. M., Sunyaev, S. R. Predicting functional effect of human missense mutations using PolyPhen-2. Current Protocols in Human Genetics. , Chapter 7 (Unit 7.20) (2013).
  11. Flanagan, S. E., Patch, A. M., Ellard, S. Using SIFT and PolyPhen to predict loss-of-function and gain-of-function mutations. Genetic Testing and Molecular Biomarkers. 14 (4), 533-537 (2010).
  12. Ackerman, M. J., et al. HRS/EHRA expert consensus statement on the state of genetic testing for the channelopathies and cardiomyopathies this document was developed as a partnership between the Heart Rhythm Society (HRS) and the European Heart Rhythm Association (EHRA). Heart Rhythm. 8 (8), 1308-1339 (2011).
  13. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  14. Landstrom, A. P., et al. Amino acid-level signal-to-noise analysis of incidentally identified variants in genes associated with long QT syndrome during pediatric whole exome sequencing reflects background genetic noise. Heart Rhythm. 15 (7), 1042-1050 (2018).
  15. Hubbard, T., et al. Ensembl 2005. Nucleic Acids Research. 33, Database issue 447-453 (2005).
  16. O'Leary, N. A., et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Research. 44, 733-745 (2016).
  17. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  18. The 100 Genome Projects Consortium. An integrated map of genetic variation from 1,092 human genomes. Nature. 491 (7422), 56-65 (2012).
  19. Fu, W., et al. Analysis of 6,515 exomes reveals the recent origin of most human protein-coding variants. Nature. 493 (7331), 216-220 (2013).
  20. Mulder, N. J., Apweiler, R. Tools and resources for identifying protein families, domains and motifs. Genome Biology. 3 (1), (2002).
  21. Cirino, A. L., et al. A Comparison of Whole Genome Sequencing to Multigene Panel Testing in Hypertrophic Cardiomyopathy Patients. Circulation Cardiovascular Genetics. 10 (5), (2017).
  22. Landstrom, A. P., et al. Interpreting Incidentally Identified Variants in Genes Associated With Catecholaminergic Polymorphic Ventricular Tachycardia in a Large Cohort of Clinical Whole-Exome Genetic Test Referrals. Circulation Arrhythmia and Electrophysiology. 10 (4), (2017).
  23. Whiffin, N., et al. Using high-resolution variant frequencies to empower clinical genome interpretation. Genetics in Medicine. 19 (10), 1151-1158 (2017).
  24. Walsh, R., et al. Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples. Genetics in Medicine. 19 (2), 192-203 (2017).
  25. Buske, O. J., Manickaraj, A., Mital, S., Ray, P. N., Brudno, M. Identification of deleterious synonymous variants in human genomes. Bioinformatics. 31 (5), 799 (2015).
  26. Wen, P., Xiao, P., Xia, J. dbDSM: a manually curated database for deleterious synonymous mutations. Bioinformatics. 32 (12), 1914-1916 (2016).
  27. Bagnall, R. D., et al. Whole Genome Sequencing Improves Outcomes of Genetic Testing in Patients With Hypertrophic Cardiomyopathy. Journal of the American College of Cardiology. 72 (4), 419-429 (2018).
  28. Giudicessi, J. R., Roden, D. M., Wilde, A. A. M., Ackerman, M. J. Classification and Reporting of Potentially Proarrhythmic Common Genetic Variation in Long QT Syndrome Genetic Testing. Circulation. 137 (6), 619-630 (2018).
  29. Sundaram, L., et al. Predicting the clinical impact of human mutation with deep neural networks. Nature Genetics. 50, 1161-1170 (2018).
  30. Krittanawong, C., Zhang, H., Wang, Z., Aydar, M., Kitai, T. Artificial Intelligence in Precision Cardiovascular Medicine. Journal of the American College of Cardiology. 69 (21), 2657-2664 (2017).

Tags

유전학 문제점 143 유전자 분석 유전자 검사 돌연변이 토폴로지 불확 실한 의미의 변종 전체 exome 시퀀싱
유전 변이의 아미노산 수준 신호-잡음 분석을 사용 하 여 Variant Pathogenicity의 가능성 확인
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Jones, E. G., Landstrom, A. P.More

Jones, E. G., Landstrom, A. P. Determining the Likelihood of Variant Pathogenicity Using Amino Acid-level Signal-to-Noise Analysis of Genetic Variation. J. Vis. Exp. (143), e58907, doi:10.3791/58907 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter