I - TASSER 파이프라인을 사용하여 단백질의 구조와 기능 특성화 기반 컴퓨터에 대한 지침이 설명되어 있습니다. 쿼리 단백질 시퀀스에서 시작, 3D 모델은 여러 스레딩 정렬을 사용하여 생성 및 구조 조립 시뮬레이션을 반복하고 있습니다. 기능성 inferences는 이후 알려진 구조와 기능을 가진 단백질 일치를 기반으로 그려져있다.
Method Article
I - TASSER 파이프라인을 사용하여 단백질의 구조와 기능 특성화 기반 컴퓨터에 대한 지침이 설명되어 있습니다. 쿼리 단백질 시퀀스에서 시작, 3D 모델은 여러 스레딩 정렬을 사용하여 생성 및 구조 조립 시뮬레이션을 반복하고 있습니다. 기능성 inferences는 이후 알려진 구조와 기능을 가진 단백질 일치를 기반으로 그려져있다.
게놈 시퀀싱 프로젝트는 생물 학적 역할에 대한 이해를 향상시키기 위해 자신의 구조와 기능에 대한 지식을 필요로 단백질 시퀀스의 수백만을 계산합니다. 실험 방법이 단백질의 작은 일부분에 대한 자세한 정보를 제공할 수 있지만, 전산 모델링을 실험적으로 uncharacterized 아르 단백질 분자의 대부분 필요합니다. I - TASSER 서버는 단백질 구조와 기능의 고해상도 모델링을위한 온라인 작업대입니다. 단백질 시퀀스 감안할 때, I - TASSER 서버에서 전형적인 출력, 보조 구조 예측을 포함 각 물질의 용매 접근성, 스레딩 및 구조 정렬에 의해 감지 동종 템플릿 단백질, 최대 다섯 전체 길이 차 구조 모델 및 구조 기반을 예측 효소 분류에 대한 주석 기능, 유전자 온톨로지 조건과 단백질 - 리간드 결합 사이트. 모든 예측은 신뢰 점수 태그가있는예측은 실험 데이터를 모르고하는 방법 정확하게 알려줍니다. 최종 사용자의 특별한 요청을 촉진하기 위해서, 서버는 사용자가 지정한 간 잔여 거리를 수락하고 대화형 I - TASSER 모델링을 변경하려면지도를 연락 채널을 제공하고, 또한 사용자가 템플릿으로 어떤 단백질을 지정할 수 있습니다, 또는 서식 파일을 제외 구조 조립 시뮬레이션 중에 단백질. 구조 정보는 I - TASSER 예측의 품질을 향상 목적으로 실험 증거 또는 생물 학적 지식을 바탕으로 사용자가 수집한 수 있습니다. 서버가 최근 사회 전체 CASP 실험에서 최고의 단백질 구조에 대한 프로그램 및 기능 예측으로 평가되었다. 온라인 I - TASSER 서버를 사용하는 100 개 이상의 나라에서> 20000 등록 과학자들은 현재이 있습니다.
방법 개요
순서 - 투 - 구조 - 투 - 기능 패러다임에 따라 구조와 기능 모델링을위한 I - TASSER 절차 1-4의 연속 4 단계를 포함 : LOMETS 5 (A) 템플릿 식별, reassembly하여 복제 (B) 조각 구조 교환 몬테카를로 시뮬레이션 6, REMO 7 FG - MD 8을 사용 (C) 원자 수준의 구조 상세 및 (D) COFACTOR 9를 사용 구조 기반의 기능 해석.
템플릿 식별이 : 사용자가 제출한 쿼리 시퀀스 들어, 시퀀스가 먼저 메타 스레딩 서버를 로컬에 설치된 LOMETS에 의해 대표 PDB 구조 라이브러리를 통해 스레드입니다. 스레딩 비슷한 구조를 가지고 또는 쿼리 단백질과 비슷한 구조 모티브를 포함할 수 있습니다 템플릿 단백질을 식별에 사용되는 시퀀스 구조의 정렬 절차입니다. 동종 templ의 범위를 늘리려면먹고 탐지, LOMETS 다른 스레딩 방법을 다루는 여러 최첨단 알고리즘을 결합한 제품입니다. 다른 스레드 프로그램은 서로 다른 점수 시스템과 정렬 감성을 가지고 있기 때문에, 각 스레딩 프로그램에서 생성된 스레딩 정렬의 품질로 정의됩니다 정상화 Z - 점수로 평가됩니다 : 
Z - 점수는 프로그램에 의해 생성된 모든 정렬의 통계 의미에 대한 상대 표준 편차 단위로 점수가 어디에 있는지, 그리고 Z 0 '좋은을 차별화하는 데 대규모 스레딩 벤치 마크 테스트를 5 기준으로 결정하는 프로그램 - 특정 Z - 점수 차단됩니다 '와'나쁜 '템플릿. 높은 Z - 점수 템플릿 상단 템플릿은 일반적으로 정렬이 좋은 모델에 해당하는 것을 의미 다른 서식 파일, 대부분의보다 훨씬 높은 정렬 평가 점수를 의미합니다. 상단 스레딩 템플릿의 대부분은 안녕있다면정규 GH는 Z - 점수, 최종 I - TASSER 모델의 정확성은 일반적으로 높습니다. 그러나 단백질은 대형이고 스레딩 제휴의 범위는 쿼리 단백질의 작은 지역에 갇혀있다면, 높은 표준 Z - 점수는 반드시 전체 길이 모델 높은 모델링의 정확성을 의미하지는 않습니다. 각 스레딩 프로그램에서 상위 2 스레딩 정렬은 구조 어셈블리의 다음 단계에 대한 수집 및 사용하고 있습니다.
구조 조립 시뮬레이션을 반복 : 스레딩 절차에 따라 쿼리 시퀀스는 정렬과 unaligned 지역 스레딩로 나뉩니다. unaligned 루프 지역은 순이 론적 모델링에 의해 만들어진하는 동안 스레딩 정렬 지속 조각, 템플릿에서 excised 및 구조 어셈블리를 직접 사용됩니다. 구조 조립 절차는 복제 교환 몬테카를로 시뮬레이션 6 안내 격자 시스템에서 수행됩니다. I - TASSER 역장 수소 보를 포함상호 작용 10, PDB 11 SVMSEQ 12 시퀀스 기반의 연락처 예측 및 LOMETS 5 스레딩 템플릿에서 수집된 공간 억제의 알려진 단백질 구조에서 파생된 지식 기반 통계 에너지 조건을 nding. 시뮬레이션 동안 저온 복제에서 생성된 conformational 디코이 낮은 자유 에너지 상태의 구조를 파악하기 위해 SPICKER 13 클러스터된 수 있습니다. 상단 클러스터의 클러스터 centroids는 모든 클러스터 구조 디코의 3D 좌표를 평균하여 최종 모델 생성에 사용하여 얻을 수 있습니다. 시뮬레이션 및 클러스터링 절차는 steric 충돌을 제거하고 더욱 글로벌 토폴로지를 수정을 위해 두 번 반복됩니다.
원자 수준의 모델 구축 및 개선 : SPICKER 클러스터링 후 얻은 클러스터 centroids는 단백질 모델 (는 C의 α와 대량의 사이드 체인 센터 대표 각 물질)와 H를 감소거리를 제한 생물 학적 응용 프로그램입니다. 감소 모델의 전체 원자 모델의 건설은 두 단계로 이루어집니다. 첫 번째 단계에서, REMO 7 H - 결합 네트워크를 최적화하여 C - 알파 성분의 전체 원자 모델을 만드는 데 사용됩니다. 두 번째 단계에서, REMO 전체 원자 모델 추가로 백본 비틀림 각도, 본드 길이와 사이드 체인 rotamer 오리 엔테이션을 향상 FG - MD 14,에 의해 정제되며, 분자 동적 시뮬레이션에 의해,로에서 검색한 구조 파편에 의해 안내 에 의해 PDB 구조 TM 번 맞춥니다. FG - MD 세련된 모델은 I - TASSER로 차 구조 예측을위한 최종 모델로 사용됩니다.
생성된 모델의 품질은 LOMETS 스레딩 정렬의 Z - 점수와 I - TASSER 시뮬레이션의 융합, 수학적으로 공식화에 따라 정의된 신뢰 점수 (C - 점수)을 기준으로 예상됩니다 
어디에 13 식별 구조 클러스터의 구조 디코의 다중성이며 M 더하다는 클러스터링에 제출된 디코의 총계입니다; 클러스터 centroids에 클러스터된 디코의 평균 RMSD이며 Norm.Z - 점수는 (i) 나는 LOMETS 5 서버를 스레딩 세기에서 얻은 상단 스레딩 정렬의 표준 Z - 점수 (Eq. 1)이며 N은 LOMETS에 사용되는 서버의 개수입니다.
C - 점수는 I - TASSER 모델의 품질과 강한 상관 관계가 있습니다. C - 점수와 단백질의 길이를 결합함으로써, 최초로 I - TASSER 모델의 정확성은 TM - 점수와 RMSD 15 2에 대한 0.08의 평균 오류가 예상됩니다. 일반적으로 C - 점수>와 모델 - 1.5은 올바른 이길 것으로 예상된다. 여기 RMSD 및 TM - 점수는 모두 모델과 기본 구조 사이의 topological 유사성 잘 알려져 조치하고 있습니다. TM - 점수 valu[0, 1]에서 알면서도 범위, 높은 점수가 더 나은 구조는 16,17 일치 나타냅니다. 그러나 낮은 순위 모델 (즉, 2 차 -5 일 모델)에 대한, TM - 점수와 RMSD로 C - 점수의 상관 관계가 훨씬 약한입니다 (~ 0.5), 그리고 것은 절대 모델 품질의 신뢰성 평가를 위해 사용할 수 없습니다.
첫번째 모델은 항상 I - TASSER 시뮬레이션에서 최고의 모델인가? 이 질문에 대한 답변은 대상 유형에 따라 다릅니다. 쉽게 목표에 대한, 첫 번째 모델은 일반적으로 최고의 모델이며 C - 점수는 일반적으로 모델의 나머지 부분보다 훨씬 높다. 그러나, 스레드는 상당한 템플릿 히트가없는 하드 타겟 들어, 첫 번째 모델은 반드시 최고의 모델이 아니므로 I - TASSER 사실은 최고의 템플릿과 모델을 선택하는 어려움이있다. 그것은 따라서 하드 타겟에 대한 모든 5 모델을 분석하고 그들 실험 정보 및 생물 학적 지식을 바탕으로 선택하는 것이 좋습니다.
기능 predictions : 마지막 단계에서, FG - MD에서 발생하는 최종 3 차원 모델은 즉, 단백질 기능의 세 측면을 예측하는 데 사용됩니다 :) 효소위원회 (EC) 번호 18 (B) 유전자 온톨로지 (GO) 19 용어와 ( C) 작은 분자 리간드에 대한 바인딩 사이트. 모두 세 가지 측면 들어, 기능 해석은 알려진 구조와 기능 PDB의 템플릿 단백질에 글로벌 및 로컬 유사성에 따라 단백질의 기능을 예측하는 새로운 접근이다 COFACTOR를 사용하여 생성됩니다. 첫째, 예측 모델의 글로벌 토폴로지는 20 TM은 - 정렬 구조 정렬 프로그램을 사용하여 기능 템플릿 라이브러리에 대해 일치하는 것입니다. 다음 대상 모델에 가장 유사한 단백질의 집합들은 글로벌 구조 유사성을 기반으로 라이브러리에서 선택, 그리고 광범위한 지역 정보 검색은 바인딩 / 활성 사이트 지역 근처의 구조와 순서 유사성을 식별하는 수행됩니다. 결과 글로벌 및 로컬 유사성 점수는 순위를하는 데 사용됩니다템플릿 단백질 (기능 homologues)와 최고 점수 히트에 따라 주석을 (EC 번호와 유전자 온톨로지 19 조항) 전송. 마찬가지로, 리간드 바인딩 사이트 잔류물과 리간드 바인딩 모드는 최고 점수 함수 템플릿 9 알려진 리간드 바인딩 사이트 잔류물과 쿼리의 로컬 정렬 기반으로 유추됩니다.
기능의 품질 (EC와 GO 용어)는 I - TASSER의 예측은 쿼리와 템플릿 간의 세계와 지역 유사성을 측정하기위한 한 방법입니다 상동 기능 점수 (FH - 점수)에 따라 평가하고,로 정의됩니다 : 
C - 점수는 EQ에 정의된 예측 모델의 품질 추정치입니다. (2) TM - 점수는 모델과 템플릿 단백질 사이의 구조적 유사성을 글로벌 대책, RMSD 알리 TM - 정렬 20 구조적으로 정렬 영역의 모델과 템플릿 구조 간의 RMSD입니다; Cov은 구조적 배열 (즉, 쿼리의 길이로 나눈 구조적으로 정렬 잔류물의 비율)의 범위를 나타냅니다; ID 알리 TM - 정렬 정렬의 순서 정체성이다. EC 번호 예측에 대한 예상 신뢰 점수는 또한 계산 정의된 로컬 지역 내의 쿼리와 템플릿 간의 적극적인 사이트 검색 (ACM)를 평가하기위한 용어를 포함 : 
N t이 지역 내에서 현재 템플릿 잔류물의 수를 나타냅니다 여기서 N 알리가 정렬 쿼리 템플릿 잔여물 쌍 번호입니다, D II가 정렬 잔류의 I 번째 쌍 사이의 C α 거리이며, D 0 = 3.0입니다 거리의 단절은, M II는 정렬 잔류의 ith 쌍 사이의 BLOSUM 점수입니다. 일반적으로 FH - 점수의 범위에 [0, 5]와 ACM의 점수는 [사이의 0, 2] 어디에 더 자신감이 기능 할당을 나타내는 높은 점수. ACM 점수도 지역 구조와 BS - 점수로 언급됩니다 리간드 바인딩 사이트, 근처 시퀀스 유사를 평가하는 데 사용됩니다.
1. 단백질 시퀀스 제출
2. 결과의 가용성
3. 차 구조 및 용매 접근성 예측
4. 차 구조 예측
5. LOMETS 대상 템플릿 정렬
6.PDB에 구조 analogs
7. COFACTOR를 사용하여 기능 예측
8. 효소위원회 번호 예측
9. 유전자 온톨로지 (GO) 기간 예측
10. 단백질 - 리간드 결합 사이트 예측
11. 대표 결과

그림 1은 I - TASSER 결과 페이지의 발췌가 게재 (A) FASTA는 쿼리 순서를 포맷;. (B) 이차 구조와 관련된 신뢰 점수를 예측하며, (C) 잔류 용매의 접근을 예측했다. 분석 핵심 지역 및 쿼리에 잠재적인 수화 사이트는 각각 시안과 붉은 사각형으로 강조 표시됩니다.

그림 2.

그림 3. LOMETS 5 스레딩 프로그램에 의해 10 대 식별 스레딩 템플릿과 제휴를 보여주는 I - TASSER 결과 페이지의 예. 스레딩 정렬의 품질은 가치> 1 자신감 정렬을 반영하는 정규화된 Z - 점수 (녹색으로 강조 표시)에 따라 평가됩니다. 해당 쿼리 잔류물에 동일 템플릿에 정렬된 잔류물은 보존 잔여물 / 모티브의 존재를 나타내기 위해 색상으로 강조하는 동안 대부분의 정렬의 부족 상단 템플릿 쿼리 단백질과 unaligned 잔류물 여러 도메인의 존재가 도메인 링커 지역에 해당 나타냅니다. 그림 3의 전체 크기 버전을 보려면 여기를 클릭하십시오.

그림 4. 식별 10 대 식별 구조 analogs 및 구조 정렬, 보여주는 결과 페이지의 예를 들면 20 구조적 정렬 프로그램을 TM 번 맞춥니다. 에 표시된 analogs의 순위는 구조 정렬의 TM - 점수 (파란색으로 강조 표시)을 기반으로합니다. TM - 점수 <0.3 두 개의 임의의 구조 사이의 유사성을 의미하는 동안 TM - 점수> 0.5은 두 비해 구조가 유사한 토폴로지를 나타냅니다. "-"unaligned 지역에 의해 표시되는 동안 구조적으로 정렬된 잔기 쌍은 그들의 아미노 산 속성에 따라 색상으로 강조 표시됩니다.ove.com/files/ftp_upload/3259/3259fig4large.jpg "> 그림 4의 전체 크기 버전을 보려면 여기를 클릭하십시오.

그림 5. PDB 도서관에서 검색어 단백질의 식별 효소 homologues를 보여주는 I - TASSER 결과 페이지의 예. EC 번호 예측의 신뢰 수준은 EC - 점수> 1.1 쿼리 템플릿 단백질 사이의 기능적 유사성 (EC 번호의 동일한 처음 3 자리)를 나타냅니다 EC - 점수 (녹색으로 강조 표시)를 기반으로 분석됩니다.

그림 6. 보여주는 I - TASSER 결과 페이지의 예제는 쿼리 단백질에 대한 장기 예측을 이동합니다. 유전자 온톨로지 템플릿 라이브러리에서 쿼리 단백질에 대한 기능 homologues들은 FH - 점수 (오렌지 사각형)에 따라 순위가 결정됩니다. 이러한 최고 점수 조회에서 공통 기능 기능은 gener으로 파생됩니다 검색어 단백질의 최종 GO 용어 예측을 먹었어요. 예측 GO 용어의 품질은 예상 GO - 점수 (녹색 표시), GO - 점수> 0.5은 신뢰할 수있는 예측을 나타냅니다.을 기반으로 그림 6의 전체 크기 버전을 보려면 여기를 클릭하십시오.

그림 7. COFACTOR 9 알고리즘을 사용하여 상위 10 단백질 리간드 바인딩 사이트 예측을 보여주는 I - TASSER 결과 페이지의 예. 예측 바인딩 사이트의 순위는 쿼리의 일반적인 구속력 주머니를 공유 예측 리간드 conformations의 숫자에 따라 달라집니다. BS - 점수 (빨간색으로 강조 표시) 지역의 순서와 예측하고 템플릿의 구속력 사이트 간의 구조 유사성을 측정하기위한 한 방법입니다, 그리고 바인딩 사이트 주머니의 절약을 분석하는 데 유용합니다.
les/ftp_upload/3259/3259fig8.jpg "/>
그림 8. 잔류 - 잔류 문의 / 거리 제한을 지정하는 데 사용되는 외부 구속 파일의 예입니다.

그림 9. I - TASSER 서버 템플릿 단백질을 지정에 사용되는 구속 파일의 예. 또는 (B) 3D 형식, 사용자 (A) FASTA 형식 중 쿼리 템플릿 정렬을 지정할 수 있습니다.

그림 10. I - TASSER 구조 모델링 절차 중에 템플릿을 제외하고 사용 예제 파일입니다. 첫 번째 열에는 제외하는 템플릿 단백질의 PDB ID를 포함하고 있습니다. 두 번째 열은 템플릿 라이브러리에있는 다른 유사한 템플릿에 사용되는 시퀀스 신분 컷오프를 지정하는 데 사용됩니다.
위에 제시 프로토콜 구조와 I - TASSER 서버를 사용하여 함수 모델링을위한 일반적인 지침입니다. 이 자동화된 절차는 단백질의 대부분 잘 작동하지만, 인간의 개입은 종종 특히 PDB 라이브러리에 가까운 템플릿 부족한 단백질을 위해, 크게 모델링의 정확도를 개선하는 데 도움이됩니다. (B) 구조 어셈블리를 개선하기 위해 외부 구속을 제공,, 멀티 도메인 단백질 (A) 분리 및 (C) 모델링하는 동안 템플릿을 제거 : 사용자는 다음과 같은 방법으로 I - TASSER 모델링하는 동안 개입하실 수 있습니다.
분할 다중 도메인 단백질 :
오랜 단백질 시퀀스가 자주 실험과 전산 두 기술을 사용하여 구조 해설 어렵게 만드는 유연 링커 지역에 의해 곁에 여러 도메인을 포함합니다. 도메인 독립적으로 엔티티를 접는하고 독특한 분자 기능을 수행할 수있는 그럼에도 불구하고, 그것은이다별도로 각 도메인 긴 다중 도메인 단백질과 모델을 분할하는 것이 바람직하다. 모델링 도메인은 개별적에만 예측 프로세스 속도를하지 않을뿐만 아니라, 쿼리 템플릿 정렬의 품질보다 신뢰할 수있는 구조와 기능 예측의 결과로, 증가합니다.
단백질 시퀀스에서 도메인 경계는 그러한 NCBI CDD 24 PFAM 25 InterProScan 26로 자유롭게 사용할 외부 프로그램을 사용하여 온라인으로 예측할 수 있습니다. LOMETS 스레딩 정렬이 쿼리 단백질에 사용할 수있는 경우 또한, 도메인 경계는 시각 (단계 5.4 참조) 상단 스레딩 템플릿 unaligned 잔류 긴 펼쳐진을 식별하여 찾을 수 있습니다. 이러한 unaligned 지역은 대부분 도메인 링커 지역에 해당합니다. 다중 도메인 템플릿 정렬 모든 쿼리 도메인으로 템플릿 PDB 라이브러리에 이미있는 경우 다음 쿼리 단백질은 전체 길이로 모델 수 있습니다.
외부 구속을 제공
I - TASSER의 구조 조립 시뮬레이션은 주로 템플릿을 스레딩 LOMETS에서 수집한 공간적 구속하여 안내하고 있습니다. 템플릿 라이브러리에 좋은 스레딩 히트 (Norm. Z - 점수> 1)이 쿼리 단백질 들어, 파생된 공간 억제는 높은 정확도의 대부분이며, I - TASSER이 단백질에 대한 고해상도 구조 모델을 생성합니다. Contrarily, 약한가 쿼리 단백질 또는 전혀 스레딩 히트 (Norm. Z - 점수 <1), 수집 공간 억제는 종종 때문에 템플릿과 정렬의 불확실성의 오류가 포함되어 있습니다. 이러한 단백질 타겟 들어, 사용자가 지정한 공간 정보는 예측 모델의 품질을 향상시키기 위해 매우 도움이 될 수 있습니다. 사용자는 두 가지 방법으로 I - TASSER 서버로 외부 구속을 제공할 수 있습니다 :A. 연락처 / 거리 제한을 지정
실험적 특징 상호 잔여물 연락처 / 거리, NMR의 예 또는가교 실험을 구속 파일을 업로드하여 지정할 수 있습니다. 예를 들어 파일을 열 1 규제의 종류를 지정합니다 그림 8에 표시됩니다 "DIST"또는 "접촉"즉. 거리 구속에 대한 (DIST), 컬럼 2, 4 잔류 위치를 (I, J)를 포함, 컬럼 3, 5 두 지정한 원자 사이의 거리를 지정 잔여물 및 열 6 원자 유형을 포함합니다. 문의 묶기 위해 (연락처), 컬럼 2, 3 연락해야 잔류물의 위치를 (I, J)가 포함되어 있습니다. 이러한 접촉 잔여 쌍 측면 체인 센터 사이의 거리는 PDB 알려진 구조에서 관찰 거리에 따라 결정됩니다. I - TASSER의 구조 상세 시뮬레이션 동안 지정된 거리에 가까운 이러한 원자 쌍을 그릴려고합니다.
B.는 단백질 구조 템플릿을 지정
LOMETS 스레딩 프로그램은 쿼리 제자에 대한 그럴듯한 주름을 찾을 대표 PDB 라이브러리를 사용EIN. 대표적인 구조 라이브러리를 사용하면 시퀀스 구조의 정렬을 계산하는 데 필요한 시간을 줄이기 위해 도움이되지만 그것이하더라도, 그것은 좋은 템플릿 단백질이 도서관에서보고 있거나 템플릿 LOMETS 스레딩 프로그램에서 확인되지 않았을 수도 있습니다 도서관에 존재. 이러한 경우에는 사용자는 템플릿으로 원하는 단백질 구조를 지정해야합니다.
추가 템플릿으로 단백질 구조를 지정하려면, 사용자는 하나 PDB 형식의 구조 파일을 업로드하거나 PDB 라이브러리에 쌓인 단백질 구조의 PDB ID를 지정할 수 있습니다. I - TASSER이 소집 프로그램 23을 사용하여 쿼리 템플릿 정렬을 생성하고 지정된 사용자 템플릿과 구조 조립 시뮬레이션을 안내 LOMETS 템플릿 모두에서 공간적 구속을 수집합니다. LOMETS 묶기의 정확성이 다른 대상에 대해 서로 다른이기 때문에 LOMETS 묶기의 무게는 쉬운 (상동) 타에 강해체계적으로 우리의 벤치 마크 훈련 조정되었습니다 하드 (비 상동) 목표에보다 rgets.
사용자는 자신의 쿼리 템플릿 정렬을 지정할 수 있습니다. FASTA 형식 (그림 9A)와 3D 형식 (그림 9B) : 서버는 두 형식의 정렬을 허용합니다. FASTA 형식은 표준에서 설명 http://zhanglab. ccmb.med.umich.edu / FASTA / . 3D 형식은 표준 PDB 포맷 (유사합니다 http://www.wwpdb.org/documentation/format32/sect9.html )하지만 템플릿에서 파생된 두 개의 추가 열이 원자 기록 (그림 9B 참조)에 추가됩니다 :
열 10-30 : 아톰 (단 C - 알파)와 잔여물 질의 순서에 대한 이름입니다.
열 31-54 : 템플릿에 해당 원자에서 복사한 쿼리의 C - 알파 원자 좌표.
열 55-59 : 대응 잔여물 번호를 템플릿에이 배열을 기반으로
열 60-64 : 대응 잔여물 이름 템플릿에
템플릿 단백질을 제외
단백질은 유연한 분자 및 생물 학적 활동을 변경하는 여러 conformational 상태를 채택할 수 있습니다. 예를 들어, 많은 단백질 kinases 및 막 단백질의 구조 활성 및 비활성 두 형태에서 해결되었습니다. 또한 행 리간드의 존재 또는 부재는 큰 구조적 움직임을 일으킬 수 있습니다. 템플릿의 모든 conformational 상태는 스레딩 프로그램에 똑같지만, 그것은 하나의 특정 상태에있는 템플릿을 사용하여 쿼리를 모델하는 것이 바람직하다. 서버에 새로운 옵션은 사용자가 구조를 모델링하는 동안 템플릿 단백질을 제외 수 있습니다. 이 기능은 또한 사용자가 모델링에 사용되는 템플릿의 상동 수준을 선택할 수 있도록합니다. 사용자는 템플릿 단백질 천을 제외시킬 수 있습니다톰 I - TASSER 도서관으로 :
A.이 시퀀스 신분 컷오프 지정
사용자는 I - TASSER 템플릿 라이브러리에서 상동 단백질을 제외하려면이 옵션을 사용할 수 있습니다. 상동 수준이 시퀀스 신분 컷오프에 따라 설정, 쿼리 및 쿼리 순서의 시퀀스 길이로 나눈 템플릿 단백질 사이의 동일 물질의 수를 즉. 예를 들어, 제공되는 양식에 "70%"의 사용자 유형,> 70 %를 쿼리 단백질 내가 - 것입니다 I - TASSER 템플릿 라이브러리에서 제외 될 수있는 시퀀스 ID를 가진 모든 템플릿 단백질.
B. 특정 템플릿 단백질을 제외
특정 템플릿 단백질은 제외하는 구조의 PDB ID를 포함하는 목록을 업로드하여 I - TASSER 템플릿 라이브러리에서 제외시킬 수 있습니다. 예제 파일은 그림 10에 표시됩니다. 같은 단백질은 PDB 라이브러리에서 여러 항목, I - TASSER SE로 존재 수 있듯이rver는 기본적으로 지정된 템플릿 (COLUMN1에서)뿐만 아니라 평범한 생활을 도서관에서 다른 모든 템플릿> 지정된 템플릿 90 %를 제외합니다. 사용자는 ID를 모든 템플릿> 지정된 템플릿 단백질 70 %가 제외됩니다 다른 신분 컷오프, 예를 들어 70 %, 지정할 수 있습니다.
관심 없음 충돌 선언하지 않습니다.
이 프로젝트는 알프레드 P. 슬로안 재단, NSF 경력 수상 (DBI 1,027,394), 그리고 일반 의료 과학 국립 연구소 (GM083107, GM084222)에 의해 부분적으로 지원됩니다.
Request permission to reuse the text or figures of this JoVE article
Request Permission