May 22nd, 2018
여기에 우리가 현재 proteogenomic 도구 포고와 빠른, 양적, 포스트 번역 상 수정 및 변형에 대 한 프로토콜 사용 참조 게놈에 질량 분석을 통해 식별 하는 펩 티 드의 매핑. 이 도구는 사용 하 여 통합 및 proteogenomic 및 개인 proteomic 연구와 직교 게놈 데이터 시각화의.
이 소프트웨어 프로토콜의 전반적인 목표는 PoGo를 사용하여 질량 분석 실험의 관련 번역 후 변형 및 정량적 정보와 펩타이드를 매핑하여 게놈을 참조하고 직교 유전체학 데이터와의 통합 및 시각화를 가능하게 하는 것을 입증하는 것입니다. 이 도구는 질량 분석 단백질체학 검색에 의해 생성된 펩타이드 목록에 게놈 정보를 추가하여 RNA 염기서열분석 데이터와의 통합을 촉진할 수 있도록 도와줍니다. 이 도구의 가장 큰 장점은 사용이 간편하고 빠르며 번역 후 수정, 정량 분석 및 아미노산 분산과 같은 추가 정보를 지원한다는 것입니다.
시작하려면 함께 제공되는 텍스트 프로토콜에 설명된 대로 이 비디오에 표시된 소프트웨어를 다운로드하여 설치하십시오. 설치가 완료되면 PoGo GUI 실행 파일 폴더로 이동하고 PoGo GUI 아이콘을 두 번 클릭하여 프로그램을 시작합니다. PoGo 실행 파일 옆에 있는 선택 버튼을 사용합니다.
그런 다음 실행 파일 폴더에서 관련 운영 체제 하위 폴더로 이동하고 실행 가능한 PoGo 파일을 선택합니다. 열기 버튼을 클릭하여 선택을 확인합니다. 다음으로, 선택을 클릭하여 단백질 염기서열에 대한 참조 입력 파일을 선택합니다.
데이터 폴더로 이동하여 번역 금식일 파일을 선택합니다. 열기를 클릭하여 선택을 확인합니다. 선택 버튼을 사용하여 대본 주석 파일을 선택합니다.
그런 다음 데이터 폴더로 이동하여 주석 GTF 파일을 선택하고 열기를 클릭합니다. 펩타이드 파일 옆에 있는 추가 버튼을 사용하여 펩타이드 식별 파일을 추가합니다. 여기에서 지원되는 MZ 탭, MZ Ident ML 또는 MZ ID 형식 또는 탭으로 구분된 4열 형식의 파일을 선택합니다.
또한 출력 형식 선택에서 BED NGTF 옆에 있는 확인란을 선택 취소합니다. PTM BED 및 GCT만 선택된 상태로 두십시오. 그런 다음 드롭다운 선택 항목에서 데이터에 적합한 종을 선택하고 시작을 클릭하여 매핑을 시작합니다.
먼저 _ptm. bed로 끝나는 PoGo 출력 파일을 통합 유전체학 뷰어에 로드합니다. 이 과정을 반복하여 _noptm.bed로 끝나는 파일도 불러옵니다.
이 파일에는 수정 없이 발견된 모든 펩타이드가 포함되어 있습니다. 트랙을 목록의 원하는 위치로 끌어다 놓아 순서를 변경합니다. 각 파일은 트랙을 식별하는 파일 이름과 함께 별도의 트랙으로 표시됩니다.
각 트랙은 처음에 축소된 방식으로 표시됩니다. 이를 확장하려면 트랙 이름을 마우스 오른쪽 버튼으로 클릭하고 sequences를 포함한 펩타이드의 전체 보기를 보려면 extended를 선택합니다. 이제 gct로 끝나는 파일을로드하십시오.
이 파일에는 펩타이드 정량 분석 정보가 포함되어 있습니다. 이전에 로드된 파일과 달리 주석이 달린 각 샘플은 별도의 트랙으로 로드됩니다. 드래그 앤 드롭 작업을 사용하여 원하는 대로 샘플을 재구성합니다.
드롭다운 메뉴에서 염색체를 선택하거나, 확대할 염색체 섹션을 길게 클릭하거나, 게놈 좌표를 입력하여 게놈 내부를 탐색합니다. PoGo 매핑은 그래픽 사용자 인터페이스 또는 명령줄 인터페이스를 사용하여 수행할 수 있습니다. 프로토콜의 이 부분에서는 명령줄 인터페이스를 사용하여 호환성을 강조 표시합니다.
텍스트 프로토콜의 이전 단계를 통해 얻은 변이 펩타이드를 참조 게놈에 매핑하려면 명령 프롬프트를 열고 PoGo의 실행 파일 폴더로 이동합니다. 그런 다음 여기에 표시된 명령을 입력합니다. Enter 키를 눌러 실행을 확인하고 실행이 완료될 때까지 기다렸다가 더 이상 진행하지 않습니다.
integrative genomics viewer에서 mismatch 없이 그리고 mismatch로 매핑된 펩타이드를 시각화합니다. PoGo 그래픽 사용자 인터페이스 소프트웨어에서 펩타이드 파일 옆에 있는 추가 버튼을 사용하여 펩타이드 식별 파일을 추가하고 단일 또는 여러 파일을 선택한 다음 펩타이드 파일 아래의 빈 필드로 끌어다 놓습니다. 그런 다음 출력 형식 섹션에서 PTM BED, GTF 및 GCT 옆의 확인란을 선택 취소하고 BED만 선택된 상태로 둡니다.
또한 여러 입력 파일을 단일 출력으로 병합 옵션을 선택합니다. 이렇게 하면 입력 파일의 모든 펩타이드를 결합하는 단일 출력 파일이 생성됩니다. 이 옵션을 선택하지 않은 상태로 두면 각 입력 파일에 대해 개별적으로 프로그램이 순차적으로 실행됩니다.
다음으로, 드롭다운에서 금식일 NGTF 파일과 일치하는 데이터에 적합한 종을 선택합니다. 선택되면 시작 버튼을 클릭하여 매핑을 시작합니다. 매핑된 펩타이드에서 추적 허브를 생성하려면 터미널 창을 열고 명령 프롬프트에 다음 명령을 입력합니다.
Enter 키를 눌러 실행을 확인합니다. 실행을 완료하는 데 짧은 시간만 걸립니다. 완료되면 생성된 트랙 허브를 모든 콘텐츠와 함께 웹에서 액세스할 수 있는 FTP 서버 또는 GitHub로 전송합니다.
웹 브라우저에서 UCSC 게놈 브라우저로 이동하여 My Data Track Hubs를 선택합니다. 그런 다음 내 허브 탭을 클릭합니다. 트랙 허브에 대한 URL을 텍스트 필드에 복사한 다음 허브 추가를 클릭하여 트랙 허브를 로드합니다.
마지막으로 게놈 브라우저를 선택하여 브라우저 보기로 들어갑니다. 사용자 지정 트랙 허브가 목록 맨 위에 표시됩니다. 여러 BED 파일이 트랙 허브의 기반을 구축한 경우 각 파일은 허브 내에서 별도의 트랙으로 표시됩니다.
PoGo와 다른 두 가지 단백질유전체학 매핑 도구는 여기에서 전체 메모리 사용 및 분석 런타임에 대해 비교됩니다. PoGo는 속도와 메모리 모두에서 다른 도구보다 성능이 훨씬 뛰어나며 펩타이드와 관련된 번역 후 수정 및 정량적 정보를 게놈에 매핑할 수 있습니다. PoGo는 게놈 내 펩타이드 매핑의 고유성과 관련하여 쉬운 시각적 보조 도구를 제공하기 위해 착색 옵션을 활용합니다.
빨간색 매핑은 단일 전사체에 대한 고유성을 나타내고 블록 강조 표시는 단일 유전자에 대한 매핑을 나타냅니다. 회색 매핑은 여러 유전자 간에 공유되는 펩타이드를 보여줍니다. PoGo의 PTM BED 옵션은 변형된 아미노산 잔류물에서 두꺼운 블록으로 변형의 위치를 나타내는 다양한 유형의 번역 후 변형을 수용하기 위해 색상 코드를 재정의합니다.
여기에 표시된 대장암의 단백질체 데이터에서, 단 두 개의 펩타이드만이 확인되었으며 각 펩타이드는 단일 인산화를 보여주었습니다. 출력 GCT 파일의 정보는 펩타이드가 적용되는 게놈 영역에 대한 정량적 값을 제공합니다. 스플라이스 접합을 가로지르는 펩타이드는 연결되지 않고 부분으로 나뉩니다.
접합에 대한 보다 포괄적인 정보를 보려면 출력 GTF 파일이 추가로 필요합니다. 참조 단백질 염기서열 및 주석이 다운로드되고 설정되면 염기서열 불일치가 허용되지 않을 때 5분 이내에 수천 개의 펩타이드를 게놈 좌표에 매핑할 수 있습니다. PoGo를 사용하여 참조 게놈에 펩타이드를 매핑하려고 시도하는 동안 단백질 코딩 전사체의 번역된 염기서열 및 관련 전사체 주석을 사용하는 것을 기억하는 것이 중요합니다.
이 동영상을 시청한 후에는 PoGo 및 PoGo GUI를 사용하여 단백질체학 질량 분석 실험의 펩타이드를 관련 정보와 함께 참조된 게놈에 매핑하고 시각화하는 방법을 잘 이해하게 될 것입니다.
이 문서는 질량 분석을 통해 식별된 펩타이드를 참조 게놈에 신속하고 정량적으로 매핑하기 위해 설계된 단백질체학 도구인 PoGo를 소개합니다. 이는 단백질체학 데이터와 직교 유전체학 데이터를 통합하고 시각화하는 것을 용이하게 합니다.