August 16th, 2017
Celem tego protokołu jest opracowanie odniesienia dla rozbieżnych białek w grupie, która nie ma spójnych kryteriów nomenklatury i klasyfikacji. Odniesienie to ułatwi analizy i dyskusję na temat grupy jako całości i może być używane jako uzupełnienie ustalonych nazw.
Ogólnym celem tej procedury jest wykorzystanie standardowego oprogramowania arkusza kalkulacyjnego do opracowania odniesienia dla rozbieżnych białek w grupie, która nie ma spójnych kryteriów nomenklatury i klasyfikacji. Ta metoda może pomóc w wyjaśnieniu relacji między powiązanymi białkami, które mają mylącą lub niespójną nomenklaturę, taką jak stabilizowana cysteiną nadrodzina peptydów obronnych alfa-beta, która obejmuje obronę bezkręgowców. Główną zaletą tej techniki jest to, że zapewnia prostą wizualną reprezentację interesujących białek.
Na początek zidentyfikuj cechy definiujące grupę białek, która jest przedmiotem zainteresowania. Na przykład fałd CS alfa-beta w strukturze roztworu obrony przed owadami i pomocy z phormia terraenovae definiuje nadrodzinę CS alfa-beta. Fałd ten zawiera również mniejszy motyw zwany helisą stabilizowaną cysteiną, który jest identyfikowany przez CXXXC przed CXC.
Cztery cysteiny tworzą dwa wiązania dwusiarczkowe. Aby uzupełnić motyw CS alfa-beta, dodatkowe wiązanie dwusiarczkowe jest tworzone przez dodatkową parę cystein. Ostatecznie bardzo ważne jest, aby znać przynajmniej kilka ważnych cech związanych ze strukturą lub funkcją białka.
Bez tego nie ma podstaw do generowania referencji. Teraz wprowadź te definiujące cechy do arkusza kalkulacyjnego. Kolumny służą do reprezentowania zachowanych obiektów oraz do reprezentowania odstępów między tymi obiektami.
Kolumny powinny być wystarczająco szerokie, aby zmieściły się liczby, i nadaj im stałą szerokość. W wierszach opisz sekwencje. Aby wskazać sekwencję jako obiekt, wypełnij pole funkcji kolorem, używając funkcji wypełnienia.
Następnie, aby wskazać odstępy między obiektami, wprowadź liczbę aminokwasów w polu pomiędzy. Teraz dodaj reprezentatywne sekwencje, które zostały wcześniej ustalone jako członkowie grupy na podstawie strukturalnych baz danych i opublikowanych wyników. W razie potrzeby dodaj cechy, które mogą zdefiniować podgrupę sekwencji, takie jak dodatkowa cysteina.
Jeśli w danej sekwencji brakuje cech, pozostaw pole niewypełnione i połącz je z polami reprezentującymi aminokwasy pośrednie. Aby to zrobić, skorzystamy z funkcji Scal i Wyśrodkuj. Po wprowadzeniu reprezentatywnych sekwencji należy zidentyfikować grupy wyraźnie powiązanych sekwencji.
Następnie podsumuj charakterystykę tych grup. Gdy liczba aminokwasów między cechami jest różna, użyj łącznika, aby wskazać zakres lub ukośników, aby wskazać kilka określonych liczb. W razie potrzeby twórczo dodawaj adnotacje do funkcji, które mogą być istotne lub nie są na tyle powszechne, aby uwzględnić je w odwołaniu.
Na przykład, ponieważ cysteiny są ważne w nadrodzinie, obecność dodatkowych cystein można oznaczyć. Czasami, podczas dodawania nowo zidentyfikowanych sekwencji do arkusza kalkulacyjnego, sekwencje jednego gatunku należą do kilku różnych grup nadrodziny, na przykład w przypadku niesporczaków. Po zakończeniu wiersze arkusza kalkulacyjnego można następnie posortować, aby podkreślić różnice w obrębie gatunku lub różnice między grupami taksonomicznymi.
W tej demonstracji wykorzystano ogólnodostępne oprogramowanie MEGA 6. Jednak inne oprogramowanie może być używane w podobny sposób. Aby rozpocząć nową linię trasowania, wybierz opcję Edytuj/zbuduj wyrównanie na karcie Wyrównanie.
Następnie wybierz opcję Utwórz nową linię trasowania w wyświetlonym polu i kliknij przycisk OK. Następnie wybierz Białko. Teraz wybierz opcję Wstaw sekwencję z pliku w menu Edycja, aby zaimportować sekwencje. Sekwencje muszą być w formacie FASTA.
Kolory tła odzwierciedlające różne typy aminokwasów są wyświetlane domyślnie i można je wyłączyć za pomocą przełącznika w menu Wyświetlacz. Po wprowadzeniu wszystkich sekwencji kliknij ikonę zginanego ramienia, a następnie Wyrównaj białko, aby wyrównać sekwencje za pomocą algorytmu mięśniowego. Jeśli pojawi się komunikat, Nic nie wybrano do wyrównania.
Zaznacz wszystko? wyskakuje i wybierz przycisk OK. Niektóre parametry można zmienić w wyskakującym okienku, ale w przypadku tej demonstracji wystarczą wartości domyślne. Teraz sprawdź wyrównanie w oparciu o ważne cechy nadrodziny białek.
Górny pasek pokazuje gwiazdkę w dowolnej pozycji, w której aminokwas jest całkowicie zachowany. Początkowe wyrównanie identyfikuje trzy z czterech konserwatywnych cystein. Jedna sekwencja jest wyraźnie niedopasowana.
Aby naprawić niewyrównaną sekwencję, zaznacz kreski i naciśnij Delete bez przypadkowego usuwania aminokwasów. Następnie przesuń aminokwasy do ich prawidłowego ułożenia, dodając spacje. Po ręcznym wyrównaniu sekwencji należy zauważyć, że ostatnia cysteina motywu CXXXC jest zachowana w całym wyrównaniu.
Ręczna regulacja jest często konieczna, aby nadać priorytet najważniejszym cechom sekwencji. Wyrównanie arkusza kalkulacyjnego wcześniej ustalonej nadrodziny CS alfa-beta ujawniło pięć podstawowych wzorców tworzenia wiązań. Nowo zidentyfikowane sekwencje niesporczaków mieściły się w pełnym spektrum tych wzorców.
Następnie wykorzystano analizy filogenetyczne w celu zbadania, w jaki sposób ta grupa białek mogła ewoluować. Sekwencje są jednak na ogół krótkie i bardzo rozbieżne. W związku z tym powstałe drzewa były słabo rozwiązane i oferowały niewielki wgląd.
Wyrównanie wielu sekwencji zostało zoptymalizowane przy użyciu odniesienia, ale nadal występowała słaba rozdzielczość w analizie maksymalnego prawdopodobieństwa i w bayesowskiej analizie filogenetycznej. Większość kladów miała tylko niski poziom wsparcia. Jednak pięć małych grup było wspieranych w co najmniej jednym z dwóch drzew.
Sekwencje o różnej liczbie cysteiny w grupie taksonomicznej mogą być bliżej spokrewnione niż sekwencje o tym samym wzorcu z różnych grup. Po obejrzeniu tego filmu powinieneś dobrze zrozumieć, jak używać oprogramowania do obsługi arkuszy kalkulacyjnych do generowania prostej wizualizacji ważnych cech białka. Próbując wykonać tę procedurę, należy pamiętać, że określenie najistotniejszych cech dla grupy białek jest często procesem iteracyjnym i prawdopodobnie konieczna będzie rewizja odniesienia.
Do arkusza kalkulacyjnego zawsze można dodawać nowe sekwencje, a także łatwo jest mieć wiele wersji pozwalających na dodawanie nowych funkcji, które mogą być przydatne do klasyfikacji i analizy. Chociaż wyrównanie arkusza kalkulacyjnego umożliwia łatwą wizualizację cech strukturalnych i funkcjonalnych, inne metody, takie jak analiza filogenetyczna, mogą być wykonane w celu uzyskania dodatkowego wglądu w relacje ewolucyjne.
View the full transcript and gain access to thousands of scientific videos
Celem tego protokołu jest stworzenie referencji dla różnych białek w grupie, która obecnie brakuje spójnej nomenklatury i kryteriów klasyfikacji. Wyjaśniając relacje między powiązanymi białkami, referencja ta poprawi dyskusje i analizy grupy.