August 16th, 2017
이 프로토콜의 목표는 명명법과 분류에 대 한 일관 된 기준 부족 그룹에서 분기 단백질에 대 한 참조를 개발 하는 것입니다. 이 기준 분석과 전체적으로 그룹의 토론을 촉진 하며 설립된 이름을 사용할 수 있습니다.
이 절차의 전반적인 목표는 표준 스프레드시트 소프트웨어를 사용하여 명명법 및 분류에 대한 일관된 기준이 없는 그룹의 발산하는 단백질에 대한 참조를 개발하는 것입니다. 이 방법은 무척추 동물 방어를 포함하는 방어 펩타이드의 시스테인 안정화 알파-베타 슈퍼패밀리와 같이 혼동되거나 일관성이 없는 명명법을 가진 관련 단백질 간의 관계를 명확히 하는 데 도움이 될 수 있습니다. 이 기술의 주요 장점은 관심 단백질의 간단한 시각적 표현을 제공한다는 것입니다.
먼저 관심 단백질 그룹의 정의 특성을 식별합니다. 예를 들어, phormia terraenovae의 곤충 방어 및 원조의 용액 구조에서 CS 알파-베타 폴드는 CS 알파-베타 슈퍼패밀리를 정의합니다. 이 습곡은 또한 시스테인 안정화 나선(cysteine-stabilized helix)이라고 하는 더 작은 모티프를 포함하며, 이는 CXC의 상류에 있는 CXXXC에 의해 식별됩니다.
4개의 시스테인은 2개의 이황화 결합을 형성합니다. CS 알파-베타 모티프를 완성하기 위해 세 번째 이황화 결합은 추가 한 쌍의 시스테인에 의해 형성됩니다. 궁극적으로 단백질의 구조 또는 기능과 관련된 몇 가지 중요한 특징을 아는 것이 중요합니다.
이것이 없으면 참조를 생성할 수 있는 근거가 없습니다. 이제 이러한 정의 기능을 스프레드시트에 입력합니다. 보존된 피처에 대해 열을 사용하고 이러한 피처 사이의 공간을 표현합니다.
숫자를 맞출 수 있을 만큼 열의 너비를 유지하고 일관된 너비를 지정합니다. 행에서 시퀀스를 설명합니다. 시퀀스를 기능으로 나타내려면 fill 함수를 사용하여 기능 상자를 색상으로 채웁니다.
그런 다음 피처 사이의 간격을 나타내기 위해 그 사이의 상자에 아미노산 수를 입력합니다. 이제 구조적 데이터베이스와 게시된 결과를 기반으로 그룹의 구성원으로 이전에 설정된 대표 염기서열을 추가합니다. 필요에 따라, 추가 시스테인과 같은 염기서열의 부분군을 정의할 수 있는 특징을 추가합니다.
지정된 염기서열에서 특징이 누락된 경우, 상자를 채워지지 않은 상태로 두고 중간에 있는 아미노산을 나타내는 상자와 결합합니다. 이를 위해 Merge and Center 기능을 사용합니다. 대표 서열이 입력되면 명확하게 관련된 서열의 그룹을 식별합니다.
그런 다음 이러한 그룹의 특성을 요약합니다. 피처 사이의 아미노산 수가 다양하면 하이픈을 사용하여 범위를 나타내거나 슬래시를 사용하여 몇 가지 특정 숫자를 나타냅니다. 필요에 따라 관련성이 있거나 참조에 포함할 만큼 일반적이지 않을 수 있는 기능에 창의적으로 주석을 추가합니다.
예를 들어, 시스테인은 슈퍼패밀리에서 중요하기 때문에 추가 시스테인의 존재를 표시할 수 있습니다. 때때로, 새로 식별된 염기서열을 스프레드시트에 추가할 때, 한 종의 염기서열은 완보동물과 같은 슈퍼패밀리의 여러 다른 그룹에 속합니다. 완료되면 스프레드시트의 행을 정렬하여 종 내의 변이 또는 분류 그룹 간의 변이를 강조 표시할 수 있습니다.
이 데모는 무료로 제공되는 MEGA 6 소프트웨어를 사용합니다. 그러나 다른 소프트웨어도 유사하게 사용할 수 있습니다. 새 정렬을 시작하려면 정렬 탭에서 정렬을 편집/작성을 선택합니다.
그런 다음 나타나는 상자에서 새 선형 작성을 선택하고 확인을 클릭합니다. 그런 다음 단백질을 선택합니다. 이제 Edit 메뉴에서 Insert Sequence from File을 선택하여 시퀀스를 가져옵니다. 시퀀스는 FASTA 형식이어야 합니다.
다양한 아미노산 유형을 반영하는 배경색이 기본적으로 표시되며 디스플레이 메뉴에서 토글로 끌 수 있습니다. 모든 염기서열이 입력되면 flexing arm 아이콘을 클릭한 다음 Align Protein을 클릭하여 근육 알고리즘을 사용하여 염기서열을 정렬합니다. 메시지가 표시되면 정렬을 위해 아무것도 선택되지 않았습니다.
모두 선택하시겠습니까?팝업이 나타나면 확인을 선택합니다. 일부 매개변수는 팝업 창에서 변경할 수 있지만 이 데모에서는 기본값으로 충분합니다. 이제 단백질 슈퍼패밀리의 중요한 특징을 기반으로 정렬을 확인하십시오.
상단 막대는 아미노산이 완전히 보존되는 모든 위치에 별표를 표시합니다. 초기 정렬은 4개의 보존된 시스테인 중 3개를 식별합니다. 하나의 염기서열은 명백히 잘못 정렬되어 있습니다.
잘못 정렬된 시퀀스를 수정하려면 대시를 강조 표시하고 실수로 아미노산을 삭제하지 않고 Delete 키를 누릅니다. 그런 다음 공간을 추가하여 아미노산을 적절한 정렬로 이동합니다. 염기서열을 수동으로 정렬한 후, CXXXC 모티프의 마지막 시스테인이 정렬 전체에 걸쳐 보존된다는 점에 유의하십시오.
시퀀스의 가장 중요한 기능의 우선 순위를 지정하기 위해 수동 조정이 필요한 경우가 많습니다. 이전에 확립된 CS 알파-베타 슈퍼패밀리의 스프레드시트 정렬은 결합 형성의 5가지 기본 패턴을 드러냈습니다. 새로 확인된 완보동물 염기서열은 이러한 패턴의 완전한 스펙트럼에 속했습니다.
다음으로, 이 단백질 그룹이 어떻게 진화했을 수 있는지 조사하기 위해 계통발생학적 분석이 사용되었습니다. 그러나 시퀀스는 일반적으로 짧고 매우 다양합니다. 따라서 결과 나무는 제대로 분해되지 않았고 통찰력을 거의 제공하지 못했습니다.
다중 염기서열 정렬은 참조를 사용하여 최적화되었지만 최대우도 분석과 베이지안 계통발생학적 분석에서 여전히 해상도가 낮았습니다. 대부분의 clades는 낮은 수준의 지원 만 가졌습니다. 그러나 두 나무 중 적어도 하나에서 5개의 소그룹이 지원되었습니다.
분류학적 그룹 내에서 다른 시스테인 수를 가진 서열은 다른 그룹에서 동일한 패턴을 가진 서열보다 더 밀접하게 관련될 수 있습니다. 이 동영상을 시청한 후에는 스프레드시트 소프트웨어를 사용하여 중요한 단백질 특성을 간단하게 시각화하는 방법을 잘 이해하게 될 것입니다. 이 절차를 시도하는 동안 단백질 그룹에 대해 가장 관련성이 높은 특성을 결정하는 것은 종종 반복적인 프로세스이며 참조 자료의 수정이 필요할 수 있음을 기억하는 것이 중요합니다.
새로운 시퀀스는 항상 스프레드시트에 추가할 수 있으며, 분류 및 분석에 유용할 수 있는 새로운 기능을 추가할 수 있는 여러 버전을 쉽게 사용할 수 있습니다. 스프레드시트 정렬을 통해 구조적 및 기능적 특징을 쉽게 시각화할 수 있지만, 계통발생학적 분석과 같은 다른 방법을 수행하여 진화적 관계에 대한 추가 통찰력을 제공할 수 있습니다.
View the full transcript and gain access to thousands of scientific videos
이 프로토콜은 현재 일관성 있는 명명법과 분류 기준이 부족한 그룹 내의 다양한 단백질을 위한 참조 자료를 만드는 것을 목표로 합니다. 관련 단백질 간의 관계를 명확히 함으로써 이 참조 자료는 그룹에 대한 논의와 분석을 향상시킬 것입니다.