October 11th, 2018
Istniejące algorytmy generują jedno rozwiązanie dla zestawu danych do wykrywania biomarkerów. Protokół ten pokazuje istnienie wielu podobnie skutecznych rozwiązań i przedstawia przyjazne dla użytkownika oprogramowanie, które pomaga naukowcom biomedycznym badać swoje zestawy danych pod kątem proponowanego wyzwania. Informatycy mogą również zapewnić tę funkcję w swoich algorytmach wykrywania biomarkerów.
Miara ta może pomóc w znalezieniu odpowiedzi na kluczowe pytania w dziedzinie wykrywania biomedycznego dotyczące generowania wielu rozwiązań. Główną zaletą tej techniki jest to, że zapewnia ona przyjazny dla użytkownika graficzny interfejs użytkownika, który pomaga badaczom biomedycznym w wykrywaniu wielu wad funkcjonalnych. Zacznij od załadowania macierzy danych i etykiet klas do oprogramowania.
Kliknij przycisk Załaduj macierz danych, aby wybrać plik metryk danych określony przez użytkownika, a następnie załaduj etykiety klas, aby wybrać odpowiedni plik etykiety klasy. Aby określić etykiety klas w liczbie najwyżej sklasyfikowanych obiektów, wybierz nazwy klas dodatnich i ujemnych w odpowiednich polach rozwijanych, a następnie wybierz liczbę 10 jako liczbę najwyżej sklasyfikowanych obiektów w polu listy rozwijanej X pierwszych, aby wyświetlić kompleksowy ekran podzbioru obiektów. Aby dostroić parametry systemu do różnych parametrów, wybierz dokładność pomiaru wydajności jako pole rozwijane dokładności zrównoważonej dokładności dla wybranego klasyfikatora maszyn uczących się ekstremalnie.
Następnie wybierz wartość odcięcia 0,7 dla określonego pomiaru wydajności w polu wejściowym odcięcia wydajności. Aby uruchomić potok, kliknij przycisk Analizuj i wybierz wartość 0,7 jako domyślną wartość odcięcia pomiaru wydajności. A 10 to domyślna liczba najlepszych podzbiorów obiektów.
Następnie zbierz i zinterpretuj funkcje wykryte przez oprogramowanie. Aby wygenerować wykres punktowy 3D przedstawiający 10 najważniejszych cech podzbiorów z najlepszymi wynikami klasyfikacji wykrytymi przez oprogramowanie, kliknij przycisk Analizuj i posortuj trzy cechy w podzbiorze funkcji w kolejności rosnącej ich rang, używając rang trzech obiektów jako osi F1, F2 i F3. Zmień wartość odcięcia wydajności na 0,7 i kliknij przycisk Analizuj, aby wygenerować wykres punktowy 3D podzbiorów obiektów z wartością pomiaru odcięcia wydajności większą lub równą wydajności.
Następnie kliknij opcję Dostrajanie 3D, aby otworzyć nowe okno do ręcznego dostrajania kątów widzenia wykresu punktowego 3D i zmniejszenia, aby zmniejszyć nadmiarowość wykrytych podzbiorów obiektów. Aby dodać adnotację do genu zarówno na poziomie sekwencji DNA, jak i białka, otwórz stronę internetową bazy danych Davida i kliknij link do konwersji identyfikatora genu, aby wprowadzić identyfikatory cech pierwszego podzbioru biomarkerów przygotowanego zestawu danych. Kliknij łącze listy genów i kliknij przycisk prześlij listę, aby pobrać interesujące Cię adnotacje, a następnie pokaż listę genów, aby uzyskać listę symboli genów.
Następnie otwórz stronę internetową bazy danych GeneCards i wprowadź nazwę interesującego genu w polu wejściowym zapytania do bazy danych, aby znaleźć adnotacje tego genu. Otwórz bazę danych Online Mendol Inheritance in Man i wyszukaj gen, aby znaleźć adnotacje tego genu w bazie danych. Aby dodać adnotacje do zakodowanych białek, otwórz stronę bazy danych bazy wiedzy UniProt i wyszukaj adnotacje genu z tej bazy danych.
Otwórz system predykcyjny oparty na grupach lub serwer internetowy GPS i pobierz sekwencję białka kodowaną przez gen biomarkera z bazy danych bazy wiedzy UniProt i użyj narzędzia GPS online, aby przewidzieć pozostałości białek po modyfikacji przejściowej. Aby opisać interakcje białko-białko i wzbogacone moduły funkcjonalne, otwórz stronę serwera sieci Web i użyj bazy danych ciągów, aby przeszukać windę w poszukiwaniu interesujących genów, aby znaleźć ich zaaranżowane właściwości. Aby wyeksportować wykryte podzbiory biomarkerów do dalszej analizy, kliknij przycisk eksportuj tabelę i wybierz odpowiedni format tekstowy do zapisania plików.
Następnie wyeksportuj wykresy wizualizacji jako pojedyncze pliki obrazów, klikając przycisk Zapisz pod każdym wykresem i wybierając odpowiedni format obrazu do zapisania każdego pliku. W tym reprezentatywnym eksperymencie dwa zestawy danych zostały sformatowane jako pliki CSV i załadowane do oprogramowania, jak pokazano. W pierwszym zestawie danych 128 próbek z 12 625 cechami i etykietami poszczególnych klas załadowano ostateczną matrycę danych zawierającą 95 próbek ujemnych i 33 próbki dodatnie.
Podobne operacje przeprowadzono również dla drugiego trudnego zbioru danych. Wyszukiwanie słowa kluczowego specyficznego dla użytkownika w nazwach funkcji powoduje wyświetlenie histogramu funkcji dla każdego zestawu danych. Po wykonaniu algorytmu potoku dla każdego zestawu danych wykryto 120 kwalifikowanych podzbiorów biomarkerów dla łatwego do rozróżnienia zestawu danych, przy czym 57 podzbiorów biomarkerów trypletowych wykazało 100% dokładność.
Wykryto jednak tylko 76 podzbiorów biomarkerów dla trudnego zestawu danych. A przy niższej dokładności podzbioru biomarkerów, co sugeruje, że biomarkery są specyficzne dla fenotypu, co stanowi kolejne poważne wyzwanie w wykrywaniu biomarkerów. Korzystając z tej procedury, należy pamiętać, że przyszły problem z wyborem ma wiele rozwiązań.
Zapoznaj się z najlepszymi parametrami karty SIM. Po opracowaniu technika ta utorowała drogę naukowcom biomedycznym do badania wykrywania biomedycznego za pomocą wielu rozwiązań.
View the full transcript and gain access to thousands of scientific videos
Ten protokół demonstruje istnienie wielu skutecznych rozwiązań dla zestawów danych do wykrywania biomarkerów. Zapewnia przyjazny dla użytkownika interfejs oprogramowania, aby pomóc badaczom biomedycznym w ich badaniach.