March 12th, 2012
Baza danych ITS2 to środowisko pracy do wnioskowania filogenetycznego, jednocześnie uwzględniające sekwencję i drugorzędną strukturę wewnętrznego transkrybowanego przekładki 2. Obejmuje to gromadzenie danych z dokładnymi adnotacjami, przewidywanie struktury, wielokrotne wyrównywanie sekwencji i struktury oraz szybkie obliczanie drzew. Krótko mówiąc, ten stół warsztatowy upraszcza pierwsze analizy filogenetyczne za pomocą kilku kliknięć.
Gen rybosomalny z wewnętrzną transkrypcją dystansową lub I TS dwa jest jednym z najważniejszych markerów w systematyce molekularnej. Badania prowadzone w ciągu ostatnich 20 lat koncentrowały się głównie na wykorzystaniu dwóch sekwencji I Ts do rekonstrukcji filogenetycznej. Jednak drugorzędowa struktura I TS dwa jest coraz częściej wykorzystywana w dziedzinie wnioskowania filogenetycznego z kilku powodów.
Analiza struktury drugorzędowej rozszerza taksonomiczną stosowalność tego markera, podczas gdy szybko ewoluująca, a zatem bardzo zmienna sekwencja I TS two nadaje się głównie do analizy filogenetycznej na poziomie gatunku lub niższym. Dodanie informacji strukturalnych pozwala na jednoczesną analizę na wyższym poziomie taksonomicznym ze względu na silnie zachowaną strukturę dwuporodową składającą się z czterech charakterystycznych cech. W związku z tym wyniki analizy struktury drugorzędowej mogą poprawić rozdzielczość filogenetyczną uzyskaną z sekwencji pierwszorzędowej.
Witajcie, drodzy koledzy, nazywam się Matthias Wolf. Pracuję w Instytucie Dowodów od około ośmiu lat. Pracuję na Wydziale Bioinformatyki w centrum biologicznym Uniwersytetu w Würzburgu w Niemczech.
Dzisiaj chcielibyśmy zaprezentować Wam krótki filmik na temat korzystania z bazy danych I ts two. Cześć, jestem y Chu. Powodem powstania tego filmu jest to, że baza danych I Ts two jest w rzeczywistości nie tylko bazą danych do przechowywania, ale także udostępniamy wiele narzędzi, które pozwalają poprawić analizę filogenetyczną.
W tym filmie chcemy pokazać, jak pracować z tymi narzędziami i jak połączyć wszystkie te narzędzia ze sobą. Poprawny. Wyznaczenie dwubiegunowej sekwencji I Ts może mieć kluczowe znaczenie dla przewidywania struktury. W związku z tym zaimplementowano interfejs internetowy dla adnotacji opartej na modelu ukrytego znacznika.
Aby uzyskać poprawną adnotację do swoich dwóch sekwencji IT, możesz wkleić je do edytora sekwencji u góry strony. Jest to demonstrowane przez wczytywanie przykładowych sekwencji planów. Sam edytor sekwencji sprawdza, czy dwie sekwencje I TS są prawidłowe, czy nie, i wyświetla komunikaty o błędach.
Na przykład, gdy używasz znaków innych niż PAC Po wybraniu odpowiedniego HMM możesz rozpocząć proces, klikając adnotację co 5,8 s i 28 SRNA Które mogły być zidentyfikowane przez program, jest usuwane, pozostawiając poprawnie opisane Its dwie sekwencje, które znajdowały się pomiędzy. W rezultacie, pokazane są dwie sekwencje rozdzielane I TS, a także przewidywana hybryda 5,8 s i 28 S-R-R-N-A. Jako potwierdzenie dokładności adnotacji HMM po adnotacji nowo zachowanych dwóch sekwencji, struktury drugorzędowe mogą być określane na dwa sposoby.
Pierwsze przewidywanie można osiągnąć za pomocą modelowania homologicznego z pełnym zestawem sekwencji i struktur bazy danych służących jako szablony. Aby przewidzieć strukturę adnotacji, należy przewidzieć strukturę z dwoma sekwencjami kliknięć. Jeśli twoja prawa sekwencja dwóch może złożyć się bezpośrednio w typową strukturę dwucząsteczkową, wynik jest natychmiast przedstawiony.
Teraz możesz wybrać jedną z kilku opcji, aby dalej przetwarzać strukturę sekwencji, w tym dodawać ją do puli danych. Jeśli masz prawo tutaj, dwie sekwencje nie mogą złożyć bezpośrednio, wykonywane jest wyszukiwanie w bazie danych. Wynikowa strona pokazuje najlepsze uderzenia wybuchem, w tym modelowanie homologii dla każdego tworzywa sztucznego jako szablonu.
Po kliknięciu na znak plus zostaną wyświetlone szczegóły, możesz wybrać wybrane pary struktury sekwencji i dodać je do puli danych, albo przez śledzenie i upuszczanie, albo za pomocą menu kontekstowego po kliknięciu prawym przyciskiem myszy. Drugim podejściem jest ręczne wprowadzenie jednej lub wielu sekwencji, w tym ich struktur pomocniczych jako szablonów w celu przeniesienia najbardziej odpowiednich struktur pomocniczych do sekwencji zapytań. Jest to demonstrowane przez załadowanie przykładowego pliku dla wielu szablonów.
Klikając opcję Przewiduj najlepsze szablony, wykonujesz modelowanie homologii z ustawieniami domyślnymi. Program do modelowania homologii obliczy wszystko względem wszystkich struktur i wyświetli najlepsze kombinacje szablonów zapytań. W wynikowej tabeli można zobaczyć, które szablony z powodzeniem mogą używać jego struktury pomocniczej do modelowania jednej lub kilku sekwencji zapytań.
Ponownie, szczegóły wyników można otworzyć za pomocą kliknięcia na znak plus, ponieważ pełne podejście do modelowania homologii jest niezależne od I TS dwa. Może być używany do przewidywania drugorzędowej struktury dowolnego RNA, biorąc pod uwagę homologiczną cząsteczkę o znanej strukturze. Również wynikowe pary struktur sekwencji można dodawać do puli danych za pomocą przeciągania i tr lub za pomocą menu kontekstowego, które otwiera się po kliknięciu prawym przyciskiem myszy.
Oprócz ogólnej struktury, dla I TS dwóch opisano konserwatywne motywy, takie jak sekwencja A-U-G-G-U poprzedzająca wierzchołek trzeciej helisy i piramida perynowa w niedopasowaniu w drugiej helisie. To niedopasowanie UU jest otoczone dwoma motywami, jednym na lewo od drugiej helisy i jednym na prawo między drugą a trzecią helisą z dodatkowym potrójnym nukleotydem A. Po przekształceniu tych motywów sekwencyjnych w hms, teraz zapewniamy identyfikację tych motywów w sekwencjach będących przedmiotem zainteresowania.
Aby wyszukać te motywy, wprowadź sekwencję zapytań w polu wyszukiwania i wybierz odpowiedni model. Ponownie jest to demonstrowane, ładując przykładowy plik dla planów. Aby rozpocząć obliczenia, kliknij na wyszukiwanie motywów.
Znaleziono dwa motywy, które są oznaczone adnotacjami i wyróżnione w sekwencjach zapytań. Jedną z możliwości pobrania dwóch par struktur sekwencyjnych z bazy danych I Ts two jest funkcja wyszukiwania. Pozwala użytkownikowi na wyszukiwanie struktur sekwencji według nazwy taksonu lub identyfikatora banku genów.
Aby wyszukać strukturę sekwencji według identyfikatora GenBank, wpisz GI w polu wyszukiwania i kliknij szukaj. Lista działań pojawi się w nowej karcie. Szczegóły struktury sekwencji można wyświetlić, klikając przycisk pokaż szczegóły.
Możesz także wyświetlić sekwencję S kierowaną przez wszystkie trafienia na karcie, klikając pokaż strukturę sekwencji według przeciągania i upuszczania lub za pomocą menu kontekstowego za pomocą kliknięcia prawym przyciskiem myszy, wybrane struktury sekwencji można dodać do puli danych. Oprócz wyszukiwania par struktur sekwencji według gi można wpisać nazwę taksonu w polu wyszukiwania, która jest obsługiwana przez pojawiające się pole wyszukiwania na żywo. Po wyświetleniu nowej karty z listą wszystkich trafień możesz uzyskać dostęp do tych samych funkcji, co poprzednio.
Na przykład dodawanie wyboru do puli danych za pomocą przeciągania i upuszczania. Drugą możliwością pobierania par struktur sekwencji z bazy danych jest funkcja przeglądania. Tutaj tekst jest różny.
Zgodnie z bazą danych taksonomii NCBI dane są dostępne poprzez strukturę przypominającą drzewo. Po lewej stronie strony internetowej. Klikając znak plus, możesz wyświetlić tekst jeden poziom niżej.
Klikając na nazwę taksonu, otwierasz nową zakładkę zawierającą każdą strukturę sekwencji, parę taksonu. Oprócz wyszukiwania sekwencji i struktur z identyfikatorami banku CEM lub informacjami o gatunkach, baza danych I Ts two zapewnia również wyszukiwanie oparte na eksplozji. Jednak wyróżniające się procedury obróbki strumieniowo-ściernej często nie są w stanie zidentyfikować odległych pokrewnych.
To dwie sekwencje ze względu na dużą rozbieżność sekwencji. Aby przezwyciężyć tę przeszkodę, wdrożyliśmy wyszukiwanie wybuchowe oparte na sekwencji i strukturze, które zawiera informacje o wysoce konserwatywnej strukturze do poszukiwania homologii. Odbywa się to poprzez przetłumaczenie struktury sekwencji na 12-literową sekwencję pseudobiałka.
Stąd pobieranie próbek gatunków, które zaczyna się od dowolnej sekwencji zainteresowania i obejmuje. Szerokie zakresy taksonomiczne stały się tak proste, jak błyskawiczne wyszukiwanie. Aby przeprowadzić wyszukiwanie blast, możesz wpisać sekwencje zapytań w edytorze sekwencji.
Jeśli sekwencja zapytania jest zwykłą sekwencją nukleotydową bez struktury, dla sekwencji zawierających ich struktury drugorzędowe używany jest typowy algorytm blast n. Interfejs sieciowy wykorzystuje algorytm I Ts two blast. Rozpocznij proces, klikając blast.
Po kilku chwilach twoje trafienia wybuchowe są wyświetlane w nowym kranie. W tym miejscu zobaczysz jedno dotknięcie dla każdej sekwencji zapytań. Klikając na pokaż wyrównania, możesz przewijać wyrównania tynku Tak jak poprzednio, możesz wybrać wybrane pary struktur sekwencji i umieścić je w puli danych.
Podczas pracy nad bazą danych ITS two pula danych mogła zostać wypełniona kilkoma strukturami sekwencji. Możesz uzyskać dostęp do swojej puli danych w dowolnym momencie i wyświetlić jej zawartość. Następnym krokiem analizy jest wyrównanie struktury wielosekwencyjnej.
Kliknij pozycję Analizuj zestaw danych, a następnie sekwencję i strukturę, aby wykonać wyrównanie struktury sekwencji. Teraz zostaniesz poproszony o wybranie trybu graficznego swojego wyrównania. W przypadku dużego zestawu sekwencji zaleca się wybór wersji slim.
Ponieważ nasza pula danych zawiera tylko kilka struktur sekwencyjnych, wybieramy pełny tryb graficzny. Po zakończeniu obliczeń wyrównanie zostanie dodane do puli danych. Podświetlając jedną stronę pary podstaw, automatycznie podświetlasz jej odpowiednik.
Wreszcie, wyrównanie może być bezpieczne za pomocą kliknięcia na bezpieczne wyrównanie. Gdy jesteś zadowolony z jakości wyrównania struktury sekwencji, możesz obliczyć filogenetyczne drzewo łączące sąsiada, klikając przycisk analizuj zestaw danych, a następnie sąsiad. Dołączenie do wynikowego drzewa pojawi się w nowej karcie.
Możesz dowolnie skalować swoje drzewo za pomocą paska przewijania, przekierować drzewo, klikając dowolny węzeł lub liść drzewa, a następnie przekierować je do tego węzła. Jeśli chcesz usunąć takson ze swojej puli danych, kliknij liść i wybierz. Usuń ten węzeł z puli.
Teraz możesz ponownie obliczyć swoje wyrównanie i drzewo ze zredukowanym próbkowaniem taksonu za pomocą kliknięcia na bezpieczne drzewo. Możesz zapisać swoje drzewo filogenetyczne w formacie NU. Kliknij o tej witrynie, a następnie narzędzia, aby znaleźć dodatkowe informacje na temat samodzielnych narzędzi na sprzedaż i pro s.
Oprócz funkcji łączenia wyrównania w sąsiedztwie, którą zapewnia również interfejs sieciowy bazy danych I Ts two, można teraz uzyskać dostęp do kilku nowych funkcji, na przykład ograniczenia gatunków opartych na zmianach opartych na kompensacji. W ciągu ostatnich minut chcieliśmy pokazać Ci kilka sztuczek, dzięki którym możesz poprawić swoją analizę filogenetyczną. Pokazaliśmy Ci, jak zebrać dane z bazy danych I Ts two, wyrównać je z czterema komórkami, a na koniec obliczyć drzewa za pomocą Pro S.In wszystkich tych krokach wzięliśmy pod uwagę nie tylko sekwencję, ale także sekwencję i strukturę. Pewny.
Mamy nadzieję, że podobał Ci się nasz mały film i ciężkie budowanie drzew. Dobranoc.
Baza danych ITS2 służy jako kompleksowe narzędzie do analizy filogenetycznej, integrujące dane sekwencyjne i informacje o strukturze wtórnej wewnętrznego przestrzennika transkrypcyjnego 2 (ITS2). Ułatwia dokładne oznaczanie, przewidywanie struktury i ujednolicenie, czyniąc proces analizy filogenetycznej bardziej wydajnym.