Platforma maszyn wirtualnych dla profesjonalistów niezajmujących się informatyką do wykorzystania głębokiego uczenia do klasyfikowania sekwencji biologicznych danych metagenomicznych

Zhencheng Fang; Hongwei Zhou

doi:10.3791/62250

Method Article

Platforma maszyn wirtualnych dla profesjonalistów niezajmujących się informatyką do wykorzystania głębokiego uczenia do klasyfikowania sekwencji biologicznych danych metagenomicznych

DOI:

10.3791/62250

⸱

September 25th, 2021

Zhencheng Fang¹^,² , Hongwei Zhou¹^,³

¹Microbiome Medicine Center, Department of Laboratory Medicine, Zhujiang Hospital, Southern Medical University, ²Center for Quantitative Biology, Peking University, ³State Key Laboratory of Organ Failure Research, Southern Medical University

Summary

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Ten samouczek opisuje prostą metodę konstruowania algorytmu głębokiego uczenia do przeprowadzania 2-klasowej klasyfikacji sekwencji danych metagenomicznych.

Abstract

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Różnorodne zadania związane z klasyfikacją sekwencji biologicznych, takie jak klasyfikacja gatunków, klasyfikacja funkcji genów i klasyfikacja gospodarzy wirusów, są oczekiwanymi procesami w wielu analizach danych metagenomicznych. Ponieważ dane metagenomiczne zawierają dużą liczbę nowych gatunków i genów, w wielu badaniach potrzebne są wysokowydajne algorytmy klasyfikacji. Biolodzy często napotykają wyzwania związane ze znalezieniem odpowiednich narzędzi do klasyfikacji sekwencji i adnotacji do konkretnego zadania i często nie są w stanie samodzielnie skonstruować odpowiedniego algorytmu z powodu braku niezbędnej wiedzy matematycznej i obliczeniowej. Techniki głębokiego uczenia stały się ostatnio popularnym tematem i wykazują silne zalety w wielu zadaniach klasyfikacyjnych. Do tej pory opracowano wiele wysoce rozbudowanych pakietów głębokiego uczenia, które umożliwiają biologom konstruowanie ram głębokiego uczenia zgodnie z własnymi potrzebami bez dogłębnej znajomości szczegółów algorytmu. W tym samouczku przedstawiamy wskazówki dotyczące konstruowania łatwej w użyciu struktury uczenia głębokiego do klasyfikacji sekwencji bez konieczności posiadania wystarczającej wiedzy matematycznej lub umiejętności programowania. Cały kod jest optymalizowany w maszynie wirtualnej, dzięki czemu użytkownicy mogą bezpośrednio uruchamiać kod przy użyciu własnych danych.

Introduction

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Technika sekwencjonowania metagenomicznego omija proces izolacji szczepu i bezpośrednio sekwencjonuje całkowite DNA w próbce środowiskowej. W związku z tym dane metagenomiczne zawierają DNA z różnych organizmów, a większość sekwencji biologicznych pochodzi z nowych organizmów, których nie ma w obecnej bazie danych. Zgodnie z różnymi celami badawczymi, biolodzy muszą sklasyfikować te sekwencje z różnych perspektyw, takich jak klasyfikacja taksonomiczna¹, klasyfikacja wirusowo-bakteryjna²^,³^,⁴, klasyfikacja plazmidu chromosomowego³....

Access restricted. Please log in or start a trial to view this content.

Protocol

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. Instalacja maszyny wirtualnej

Pobierz plik maszyny wirtualnej ze strony (https://github.com/zhenchengfang/DL-VM).
Pobierz oprogramowanie VirtualBox ze strony https://www.virtualbox.org.
Rozpakuj plik ".7z" za pomocą odpowiedniego oprogramowania, takiego jak "7-Zip", "WinRAR" lub "WinZip".
Zainstaluj oprogramowanie VirtualBox, klikając przycisk Dalej w każdym kroku.
Otwórz oprogramowanie VirtualBox i kliknij przycisk Nowy, aby utworzyć maszynę wirtualną.
Krok 6: Wprowadź określoną nazwę maszyny wirtualnej w ramce "Nazwa", wybierz Linux jako system operacy....

Access restricted. Please log in or start a trial to view this content.

Results

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

W naszej poprzedniej pracy opracowaliśmy serię narzędzi do klasyfikacji sekwencji dla danych metagenomicznych, stosując podejście podobne do tego tutorialu³^,¹¹^,¹². Jako przykład zdeponowaliśmy pliki sekwencji podzbioru zestawu treningowego i zestawu testowego z naszego poprzedniego work³^,¹¹ na maszynie wirtualnej.

Fang & Zhou

Access restricted. Please log in or start a trial to view this content.

Discussion

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Ten samouczek zawiera przegląd dla biologów i początkujących projektantów algorytmów, jak skonstruować łatwą w użyciu strukturę uczenia głębokiego do klasyfikacji sekwencji biologicznych w danych metagenomicznych. Ten samouczek ma na celu zapewnienie intuicyjnego zrozumienia uczenia głębokiego i rozwiązanie problemu polegającego na tym, że początkujący często mają trudności z zainstalowaniem pakietu uczenia głębokiego i napisaniem kodu algorytmu. W przypadku niektórych prostych zadań klasyfikacji użytkownicy mogą używać .......

Access restricted. Please log in or start a trial to view this content.

Disclosures

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Autorzy oświadczają, że nie występują konflikty interesów.

Acknowledgements

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

To badanie było wspierane finansowo przez Narodową Fundację Nauk Przyrodniczych Chin (81925026, 82002201, 81800746, 82102508).

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
Name	Company	Catalog Number	Comments
Komputer PC lub serwer		NA NA	Sugerowana pamięć: >6 GB
Oprogramowanie VirtualBox	NA	NA	Link: https://www.virtualbox.org

References

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Liang, Q., Bible, P. W., Liu, Y., Zou, B., Wei, L. DeepMicrobes: taxonomic classification for metagenomics with deep learning. NAR Genomics and Bioinformatics. 2 (1), (2020).
Ren, J., et al. VirFinder: a novel k -....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Platforma maszyn wirtualnych dla profesjonalistów niezajmujących się informatyką do wykorzystania głębokiego uczenia do klasyfikowania sekwencji biologicznych danych metagenomicznych

In This Article

Summary

Abstract

Introduction

Protocol

Results

Discussion

Disclosures

Acknowledgements

Materials

References

Reprints and Permissions

Tags

Related Articles