Method Article

Een virtueel machineplatform voor niet-computerprofessionals voor het gebruik van deep learning om biologische sequenties van metagenomische gegevens te classificeren

DOI:

10.3791/62250

September 25th, 2021

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Deze zelfstudie beschrijft een eenvoudige methode om een deep learning-algoritme te construeren voor het uitvoeren van 2-klasse sequentieclassificatie van metagenomische gegevens.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Een verscheidenheid aan biologische sequentieclassificatietaken, zoals soortenclassificatie, genfunctieclassificatie en virale gastheerclassificatie, zijn verwachte processen in veel metagenomic data-analyses. Aangezien metagenomische gegevens een groot aantal nieuwe soorten en genen bevatten, zijn in veel studies hoogwaardige classificatiealgoritmen nodig. Biologen komen vaak uitdagingen tegen bij het vinden van geschikte sequentieclassificatie- en annotatietools voor een specifieke taak en zijn vaak niet in staat om zelf een overeenkomstig algoritme te construeren vanwege een gebrek aan de nodige wiskundige en computationele kennis. Deep learning technieken zijn sinds kort een populair onderwerp en laten sterke voordelen zien in veel classificatietaken. Tot op heden zijn er veel sterk verpakte deep learning-pakketten ontwikkeld, die het voor biologen mogelijk maken om deep learning-frameworks te bouwen volgens hun eigen behoeften zonder diepgaande kennis van de algoritmedetails. In deze zelfstudie bieden we een richtlijn voor het bouwen van een eenvoudig te gebruiken deep learning-raamwerk voor sequentieclassificatie zonder dat er voldoende wiskundige kennis of programmeervaardigheden nodig zijn. Alle code is geoptimaliseerd in een virtuele machine, zodat gebruikers de code rechtstreeks kunnen uitvoeren met hun eigen gegevens.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

De metagenomic sequencing techniek omzeilt het stamisolatieproces en sequenties direct het totale DNA in een omgevingsmonster. Metagenomische gegevens bevatten dus DNA van verschillende organismen en de meeste biologische sequenties zijn van nieuwe organismen die niet aanwezig zijn in de huidige database. Volgens verschillende onderzoeksdoeleinden moeten biologen deze sequenties classificeren vanuit verschillende perspectieven, zoals taxonomische classificatie1,virus-bacterieclassificatie2, 3,4,chromosoom-plasmideclassificatie3,

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. De installatie van de virtuele machine

  1. Download het bestand van de virtuele machine van (https://github.com/zhenchengfang/DL-VM).
  2. Download de VirtualBox software van https://www.virtualbox.org.
  3. Decomprimeert het bestand ".7z" met behulp van gerelateerde software, zoals "7-Zip", "WinRAR" of "WinZip".
  4. Installeer de VirtualBox-software door in elke stap op de knop Volgende te klikken.
  5. Open de VirtualBox-software en klik op de knop Nieuw om een virtuele machine te maken.
  6. Stap 6: Voer de opgegeven naam van de virtuele machine in het frame "Naam" in, selecteer Linux

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

In ons vorige werk ontwikkelden we een reeks sequentieclassificatietools voor metagenomic data met behulp van een benadering vergelijkbaar met deze tutorial3,11,12. Als voorbeeld hebben we de reeks bestanden van de subset van trainingsset en testset van ons vorige werk3,11 in de virtuele machine gedeponeerd.

Fang &Zhou11

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Deze zelfstudie biedt een overzicht voor biologen en beginners in algoritmeontwerp over het bouwen van een eenvoudig te gebruiken deep learning-raamwerk voor biologische sequentieclassificatie in metagenomische gegevens. Deze tutorial is bedoeld om intuïtief inzicht te geven in deep learning en de uitdaging aan te gaan die beginners vaak moeilijk hebben om het deep learning-pakket te installeren en de code voor het algoritme te schrijven. Voor sommige eenvoudige classificatietaken kunnen gebruikers het framework gebruike.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

De auteurs verklaren dat er geen belangenconflicten zijn.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Dit onderzoek werd financieel ondersteund door de National Natural Science Foundation of China (81925026, 82002201, 81800746, 82102508).

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
PC or serverNANASuggested memory: >6GB
VirtualBox softwareNANALink: https://www.virtualbox.org

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Liang, Q., Bible, P. W., Liu, Y., Zou, B., Wei, L. DeepMicrobes: taxonomic classification for metagenomics with deep learning. NAR Genomics and Bioinformatics. 2 (1), (2020).
  2. Ren, J., et al. VirFinder: a novel k -....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Deep LearningBiological Sequence ClassificationMetagenomic DataVirtual MachineSequence Classification ToolsOne Hot EncodingSpecies ClassificationGene Function ClassificationViral Host ClassificationDeep Learning Framework

Related Articles