Method Article

마찬가지로 효과적인 이진 분류 공연으로 여러 바이오 마커 하위 집합 선택

DOI:

10.3791/57738

October 11th, 2018

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

기존 알고리즘 바이오 마커 검출 데이터 집합에 대 한 하나의 솔루션을 생성합니다. 이 프로토콜의 여러 마찬가지로 효과적인 솔루션의 존재 및 고 생물 의학 연구원 제안된 과제에 대 한 데이터 세트를 조사 수 있도록 사용자 친화적인 소프트웨어를 제공. 컴퓨터 과학자 들은 팬 들은이 기능에 그들의 바이오 마커 검출 알고리즘의 정보를 제공할 수도 있습니다.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

바이오 마커 검출 높은 처리량 'omics' 연구자에 대 한 생물 더 중요 한 질문 중 하나 이며 특정된 데이터 집합에 대 한 최적화 된 성능 측정 한 biomarker 하위 집합을 생성 하는 거의 모든 기존 바이오 마커 검출 알고리즘 . 그러나, 최근 연구도 동일 또는 유사 하 게 효과적 분류 공연 여러 바이오 마커 하위 집합의 존재 증명. 이 프로토콜은 이진 분류 공연, 사용자 정의 자르기 보다 더 하위 집합 바이오 마커 검출을 위한 간단 하 고 간단한 방법론을 선물 한다. 데이터 준비 및 로드, 초기 정보 요약, 매개 변수 조정, 바이오 마커 검사, 결과 시각화 및 해석, 바이오 마커 유전자 주석, 및에 결과 및 시각화 수출의 프로토콜 구성 출판 품질입니다. 제안 된 바이오 마커 전략 스크리닝 직관적 이며 바이오 마커 검출 알고리즘 개발에 대 한 일반적인 규칙을 보여 줍니다. 사용자 친화적인 그래픽 사용자 인터페이스 (GUI) 프로그래밍 언어 파이썬, 생물 의학 연구원은 그들의 결과에 직접 액세스할 수 있도록 사용 하 여 개발 되었다. 소스 코드와 kSolutionVis의 설명서는 http://www.healthinformaticslab.org/supp/resources.php에서 다운로드할 수 있습니다.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

하나는 가장 일반적으로 이진 분류 조사 하 고 도전적인 데이터 마이닝, 생물 의학 영역에서 문제 샘플 가장 정확한 차별 전원1, 의 두 그룹에 대 한 훈련 분류 모델을 구축 하는 2 , 3 , 4 , 5 , 6 , 그러나 7., 생물 의학 분야에서 생성 하는 큰 데이터는 고유의 "큰 p 작은 n" 패러다임, 기능의 일반적으로 샘플6,,89의 수 보다 훨씬 더 큰 숫자와 함께. 따라서, 생물 의학 연구원 overfitting 문제8,9를 피하기 위해 분류 알고리즘을 활용 하기 전에 기능 치수를 줄일 필요가 있다. ....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

참고: 다음 프로토콜 정보 분석 절차의 세부 사항 및 주요 모듈의 의사 코드를 설명합니다. 자동 분석 시스템은 파이썬 버전 3.6.0 파이썬 모듈 팬더, abc, numpy, scipy, sklearn, sys, PyQt5, sys, mRMR, 수학과 matplotlib를 사용 하 여 개발 되었다. 이 연구에 사용 된 재료는 재료의 테이블에에서 나열 됩니다.

1. 준비 데이터 매트릭스 레이블 클래스

  1. 그림 1A에서 볼 수 있듯이 탭 또는 쉼표로 구분 된 매트릭스 파일 데이터 매트릭스 파일을 준비 합니다.
    참고: 각 행에는 기능, 모든 값 이며 첫 번째 항목 기능 이름. 기능은 microarray 기반 transcriptome 데이터 집합에 대 한 ID를 probeset 또는 methylomic 데이터 집합의 메 틸 화 값 시스테인 잔류물과 같은 다른 값 ID 있을 수 있습니다. 각 열 샘플 이름 되 고 첫 번째 항목으로 주어진된 샘플의 기능 값을 제공 합니다. 행 탭 (그림 1B) 또는 쉼표 (그림 1C)에 의해 열으로 구분 됩니다.....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

이 워크플로 (그림 6)의 목표는 이진 분류 데이터 집합에 대 한 유사한 효율성으로 여러 바이오 마커 하위 집합을 검색 하는입니다. 전체 과정은 두 개의 예제 데이터 집합 ALL1 및 ALL2 최근 출판 바이오 마커 검출에서 추출 연구12,48에 의해 나와 있습니다. 사용자는 보조 자료에 지시에 따라 kSolutionVis를 설치할 수 있습니다.

데이터 집합 ALL1 95 B-세포와 33 T-세포의 12 625 transcriptomic 기능 모든 환자의 혈액 샘플 프로 파일링. 그러나 dataset ALL2 감지 식 레벨 65 12 625 transcriptomic 기능 하지 않았다 모든 환자는 치료 후에.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

이 연구는 이진 분류 사용자 지정 데이터 집합의 따라 하기 쉬운 멀티 솔루션 바이오 마커 검출 및 특성화 프로토콜을 제공합니다. 소프트웨어는 사용자와 소프트웨어의 GUI를 사용 하 여 쉽게 그들의 데이터 집합을 조사 하는 생물 의학 연구원을 수 있도록 다양 한 파일 형식에 대 한 유연한 가져오기/내보내기 인터페이스에 중점을 둔다. 이 연구는 또한 유사 하 게 효과적인 모델링 공연, 이전 많은 기존 바이오 마커 검출 알고리즘에 의해 무시 하나 이상의 솔루션 생성의 필요성을 강조 한다. 미래에 새롭게 개발된 된 바이오 마커 검출 알고리즘 충분 한 모델링 공연 모든 중간 biomarker 하위 집합을 기록 하 여이 옵션을 포함할 수 있습니다.

이 프로토콜, 소프트웨어는 올바르게 서식이 지정 된 입력된 파일에 의존 하는 완전 자동 시스템으로 최대 중요성의 1-5 단계 있습니다. 그것은 우리의 테스트 단계, 데이터 매트릭스에서 샘플 이름 잘못 일치를 발견 하 고 클래스 레이블 파일 어디 .......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

우리는이 보고서와 관련 된 충돌의 관심 있다.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

이 작품은 중국 과학원 (XDB13040400)와 길 림 대학에서 시작 그랜트의 전략적 우선 순위 연구 프로그램에 의해 지원 되었다. 익명 검토자와 생물 의학 테스트 사용자 유용성 및 kSolutionVis의 기능 개선에 그들의 건설적인 의견을 주셔서 감사 했다.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
하드웨어
laptopLenovoX1 카본모든 컴퓨터가 작동합니다. 권장 최소 구성: 1GB 추가 하드 디스크 공간, 1GB 메모리, 2.0MHz CPU
NameCompany카탈로그 번호Comments
Software
Python 3.0WingWareWing Personal모든 Python 프로그래밍 및 실행 환경은 Python 버전 3.0 이상을 지원합니다
.

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Heckerman, D., et al. Genetic variants associated with physical performance and anthropometry in old age: a genome-wide association study in the ilSIRENTE cohort. Scientific Reports. 7, 15879(2017).
  2. Li, Z., et al.

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Biomarker DetectionBinary ClassificationFeature Subset SelectionPerformance MeasurementGraphical User InterfaceData PreparationParameter TuningResult VisualizationGene AnnotationExport Visualization

Related Articles