Method Article

Platforma maszyn wirtualnych dla profesjonalistów niezajmujących się informatyką do wykorzystania głębokiego uczenia do klasyfikowania sekwencji biologicznych danych metagenomicznych

DOI:

10.3791/62250

September 25th, 2021

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Ten samouczek opisuje prostą metodę konstruowania algorytmu głębokiego uczenia do przeprowadzania 2-klasowej klasyfikacji sekwencji danych metagenomicznych.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Różnorodne zadania związane z klasyfikacją sekwencji biologicznych, takie jak klasyfikacja gatunków, klasyfikacja funkcji genów i klasyfikacja gospodarzy wirusów, są oczekiwanymi procesami w wielu analizach danych metagenomicznych. Ponieważ dane metagenomiczne zawierają dużą liczbę nowych gatunków i genów, w wielu badaniach potrzebne są wysokowydajne algorytmy klasyfikacji. Biolodzy często napotykają wyzwania związane ze znalezieniem odpowiednich narzędzi do klasyfikacji sekwencji i adnotacji do konkretnego zadania i często nie są w stanie samodzielnie skonstruować odpowiedniego algorytmu z powodu braku niezbędnej wiedzy matematycznej i obliczeniowej. Techniki głębokiego uczenia stały się ostatnio popularnym tematem i wykazują silne zalety w wielu zadaniach klasyfikacyjnych. Do tej pory opracowano wiele wysoce rozbudowanych pakietów głębokiego uczenia, które umożliwiają biologom konstruowanie ram głębokiego uczenia zgodnie z własnymi potrzebami bez dogłębnej znajomości szczegółów algorytmu. W tym samouczku przedstawiamy wskazówki dotyczące konstruowania łatwej w użyciu struktury uczenia głębokiego do klasyfikacji sekwencji bez konieczności posiadania wystarczającej wiedzy matematycznej lub umiejętności programowania. Cały kod jest optymalizowany w maszynie wirtualnej, dzięki czemu użytkownicy mogą bezpośrednio uruchamiać kod przy użyciu własnych danych.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Technika sekwencjonowania metagenomicznego omija proces izolacji szczepu i bezpośrednio sekwencjonuje całkowite DNA w próbce środowiskowej. W związku z tym dane metagenomiczne zawierają DNA z różnych organizmów, a większość sekwencji biologicznych pochodzi z nowych organizmów, których nie ma w obecnej bazie danych. Zgodnie z różnymi celami badawczymi, biolodzy muszą sklasyfikować te sekwencje z różnych perspektyw, takich jak klasyfikacja taksonomiczna1, klasyfikacja wirusowo-bakteryjna2,3,4, klasyfikacja plazmidu chromosomowego3....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. Instalacja maszyny wirtualnej

  1. Pobierz plik maszyny wirtualnej ze strony (https://github.com/zhenchengfang/DL-VM).
  2. Pobierz oprogramowanie VirtualBox ze strony https://www.virtualbox.org.
  3. Rozpakuj plik ".7z" za pomocą odpowiedniego oprogramowania, takiego jak "7-Zip", "WinRAR" lub "WinZip".
  4. Zainstaluj oprogramowanie VirtualBox, klikając przycisk Dalej w każdym kroku.
  5. Otwórz oprogramowanie VirtualBox i kliknij przycisk Nowy, aby utworzyć maszynę wirtualną.
  6. Krok 6: Wprowadź określoną nazwę maszyny wirtualnej w ramce "Nazwa", wybierz Linux jako system operacy....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

W naszej poprzedniej pracy opracowaliśmy serię narzędzi do klasyfikacji sekwencji dla danych metagenomicznych, stosując podejście podobne do tego tutorialu3,11,12. Jako przykład zdeponowaliśmy pliki sekwencji podzbioru zestawu treningowego i zestawu testowego z naszego poprzedniego work3,11 na maszynie wirtualnej.

Fang & Zhou

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Ten samouczek zawiera przegląd dla biologów i początkujących projektantów algorytmów, jak skonstruować łatwą w użyciu strukturę uczenia głębokiego do klasyfikacji sekwencji biologicznych w danych metagenomicznych. Ten samouczek ma na celu zapewnienie intuicyjnego zrozumienia uczenia głębokiego i rozwiązanie problemu polegającego na tym, że początkujący często mają trudności z zainstalowaniem pakietu uczenia głębokiego i napisaniem kodu algorytmu. W przypadku niektórych prostych zadań klasyfikacji użytkownicy mogą używać .......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Autorzy oświadczają, że nie występują konflikty interesów.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

To badanie było wspierane finansowo przez Narodową Fundację Nauk Przyrodniczych Chin (81925026, 82002201, 81800746, 82102508).

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Komputer PC lub serwerNA NASugerowana pamięć: >6 GB
Oprogramowanie VirtualBoxNANALink: https://www.virtualbox.org

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Liang, Q., Bible, P. W., Liu, Y., Zou, B., Wei, L. DeepMicrobes: taxonomic classification for metagenomics with deep learning. NAR Genomics and Bioinformatics. 2 (1), (2020).
  2. Ren, J., et al. VirFinder: a novel k -....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Deep LearningBiological Sequence ClassificationMetagenomic DataVirtual MachineSequence Classification ToolsOne Hot EncodingSpecies ClassificationGene Function ClassificationViral Host ClassificationDeep Learning Framework

Related Articles