April 11th, 2019
OpenProt to swobodnie dostępna baza danych, która wymusza policistroniczny model genomów eukariotycznych. W tym miejscu przedstawiamy protokół korzystania z baz danych OpenProt podczas przeszukiwania zestawów danych spektrometrii mas. Wykorzystanie bazy danych OpenProt do analizy eksperymentów proteomicznych pozwala na odkrycie nowych i wcześniej niewykrywalnych białek.
OpenProt jest pierwszą bazą danych, która pozwala na polisystroniczną adnotację genomów eukariotycznych, rozpoznaje potencjał kodowy protogenów i umożliwia odkrycie wcześniej niewykrywalnych białek. Zaprojektowaliśmy ten protokół tak, aby był dostępny dla wszystkich użytkowników bez konieczności posiadania rozległych umiejętności bioinformatycznych. Aby zrozumieć i stawić czoła dzisiejszym wyzwaniom w medycynie, musimy w pełni zrozumieć krajobraz proteomiczny oraz wszystkie podmioty i ich dynamikę.
OpenProt zapewnia taką możliwość. Chociaż w tym przypadku OpenProt jest używany do analizy eksperymentów patonomicznych, może być również używany z innymi systemami, ponieważ po prostu zapewnia bardziej jasną definicję proteomu. Zacznij od otwarcia witryny OpenProt i skorzystania z linku z menu górnej strony, aby otworzyć stronę pobierania.
Kliknij na interesujący Cię gatunek na podstawie danych eksperymentalnych z analiz i pożądanego typu białka. Kliknij AllProts, Isoforms i RefProds, aby wygenerować pliki zawierające wszystkie znane i nowe typy białek obecne w bazie danych OpenProt i jeśli to możliwe, kliknij adnotację, z której zostały narysowane sekwencje białek. Kliknij na poziom dowodów potwierdzających niezbędnych do rozważenia białka zgodnie z celem badania.
Następnie kliknij wszystkie przewidywane, aby wygenerować pliki zawierające wszystkie przewidywania OpenProt i kliknij żądany format pliku do pobrania. W przypadku anayz proteomicznych należy wybrać plik białkowy FASTA. Plik readme będzie zawierał wszystkie niezbędne informacje na temat formatu pliku.
Aby obsłużyć bazę danych, zaloguj się do odpowiedniej instancji narzędzia proteomicznego i utwórz nową historię. Aby zaimportować pobraną bazę danych OpenProto, kliknij przycisk Prześlij. Aby wprowadzić przepływ pracy obsługi bazy danych, przejdź do strony przepływu pracy, ponownie kliknij przycisk Prześlij, a następnie kliknij przycisk uruchom przepływ pracy.
Następnie wybierz zaimportowaną bazę danych OpenProt jako dane wejściowe i zmień nazwę uzyskanego pliku Fasta na coś znaczącego. Baza danych jest gotowa do wykorzystania do analiz proteomicznych. Aby przygotować plik spektrometrii mas, otwórz bezpłatne narzędzie MS Convert z pakietu kreatora proteo i prześlij plik danych do analizy.
Wybierz katalog dla danych wyjściowych i ustaw żądany format pliku na mzML, a następnie użyj algorytmu opartego na falkach na pierwszym i drugim poziomie spektrometrii mas, aby wybrać filtr wybierania wartości szczytowych i rozpocząć konwersję. W celu ilościowego oznaczania białka utwórz nową historię, a następnie przeciągnij i upuść poprzednio utworzoną bazę danych do nowej historii. Kliknij przycisk Prześlij, aby zaimportować przekształcony plik danych mzML.
Otwórz stronę przepływu pracy, ponownie kliknij przycisk Prześlij, aby zaimportować żądany przepływ pracy, a następnie wybierz opcję uruchom przepływ pracy, aby przejrzeć różne parametry. Wybierz zaimportowany plik danych mzML i wprowadź wcześniej utworzoną bazę danych jako plik bazy danych Fasta. Ponieważ przepływ pracy korzysta z X!
Wyszukiwarka tandemowa, kliknij Prześlij, aby zaimportować X! Domyślny plik konfiguracyjny tandemu. Aby uwzględnić znaczny wzrost rozmiaru podczas korzystania z całej bazy danych OpenProt, należy użyć rygorystycznego współczynnika fałszywych wykrywania.
W celu kontroli jakości uruchom narzędzie informacji o pliku na danych wyjściowych filtru identyfikatorów, aby zapewnić typowe metryki wydajności, takie jak liczba dopasowań widma peptydów lub liczba zidentyfikowanych peptydów i białek. W przypadku eksploracji baz danych OpenProt wróć do witryny OpenProt i otwórz stronę wyszukiwania. Kliknij na interesujący nas gatunek, dla którego zidentyfikowano białko, i wprowadź numer dostępu do białka w polu zapytania o białko.
Kliknij surge, a pojawi się tabela zawierająca podstawowe informacje dla poszukiwanego białka. Następnie kliknij link szczegółów. Nowo otwarta strona będzie zawierała przeglądarkę genomu, która jest wyśrodkowana na białku, którego dotyczy zapytanie, a także inne informacje.
Aby uzyskać sekwencje białek lub DNA, kliknij łącza białka lub DNA odpowiednio na kartach informacyjnych Następnie kliknij karty, aby przeglądać szczegółowe informacje na temat spektrometrii mas, dowodów, profilowania rybosomów, wykrywania i konserwacji oraz zidentyfikowanych domen białkowych. W tej reprezentatywnej analizie większość białek zidentyfikowanych w oryginalnym artykule została również zidentyfikowana przy użyciu bazy danych OpenProt 2_pep lub bazy danych OpenProt_all, co pokazuje, że bazy danych OpenProt są w stanie zapewnić identyfikację i kwantyfikację białek porównywalną z obecnymi procedurami opartymi na bazach danych InterPro KB. 11 dobrze obsadzonych białek, które nie są jeszcze oznaczone w bazach danych, zidentyfikowano we wszystkich zestawach danych z pewnymi peptydami przy użyciu bazy danych OpenProt 2_pep.
Odkryto 29 nowych białek we wszystkich zestawach danych z pewnymi peptydami przy użyciu bazy danych OpenProt_all. Zalecany rygorystyczny wskaźnik fałszywych odkryć nie wpłynął na najbardziej pewną identyfikację białek, chociaż zmniejszył całkowitą liczbę zidentyfikowanych białek. Odkryto jedno z nowych białek, które jest interaktorem białka Raf-1.
Białka te nie były wcześniej wykrywane za pomocą spektrometrii mas ani profilowania rybosomów i wykazały dobrą jakość widma. Należy pamiętać, aby upewnić się, że wybrane parametry są adekwatne do projektu eksperymentu i zawsze weryfikować jakość dowodów sportowych podczas zgłaszania nowych odkryć białkowych. Protokół ten można dostosować do wszystkich odgórnych eksperymentów proteomicznych, zwłaszcza gdy jest używany z proteomiką funkcjonalną.
Pozwoli to na dogłębne badania przesiewowe i zrozumienie interakcji białek i szlaków komórkowych. OpenProt zwraca uwagę na znaczne niedoszacowanie krajobrazu protomicznego przekazywanego przez obecne notacje genomiczne i podkreśla polisystroniczny charakter genów eukariotycznych. Jest to zupełnie nowa ścieżka badań.
Piękno tego protokołu polega na tym, że nie wymaga on rozległych umiejętności bioinformatycznych, a ponieważ korzysta z odległych serwerów, można go uruchomić na dowolnym komputerze.
OpenProt to pionierska baza danych, która obsługuje policyteroniczny model genomów eukariotycznych, ułatwiając odkrywanie wcześniej niewykrywalnych białek. Ten protokół opisuje sposób korzystania z baz OpenProt do analizy zestawów danych spektrometrii mas, ułatwiając odkrycia proteomiczne badaczom bez rozległych umiejętności bioinformatycznych.