Method Article

Une plate-forme de machine virtuelle pour les professionnels non informatiques pour l’utilisation de l’apprentissage profond pour classer les séquences biologiques de données métagénomiques

DOI:

10.3791/62250

September 25th, 2021

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Ce didacticiel décrit une méthode simple pour construire un algorithme d’apprentissage profond pour effectuer une classification de séquence à 2 classes de données métagénomiques.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Diverses tâches de classification des séquences biologiques, telles que la classification des espèces, la classification de la fonction des gènes et la classification de l’hôte viral, sont des processus attendus dans de nombreuses analyses de données métagénomiques. Étant donné que les données métagénomiques contiennent un grand nombre d’espèces et de gènes nouveaux, des algorithmes de classification très performants sont nécessaires dans de nombreuses études. Les biologistes rencontrent souvent des difficultés pour trouver des outils de classification et d’annotation de séquences appropriés pour une tâche spécifique et ne sont souvent pas en mesure de construire eux-mêmes un algorithme correspondant en raison d’un manque de connaissances mathématiques et informatiques nécessaires. Les techniques d’apprentissage profond sont récemment devenues un sujet populaire et présentent de forts avantages dans de nombreuses tâches de classification. À ce jour, de nombreux packages d’apprentissage profond hautement packagés, qui permettent aux biologistes de construire des cadres d’apprentissage profond en fonction de leurs propres besoins sans connaissance approfondie des détails de l’algorithme, ont été développés. Dans ce didacticiel, nous fournissons une ligne directrice pour la construction d’un cadre d’apprentissage profond facile à utiliser pour la classification des séquences sans avoir besoin de connaissances mathématiques ou de compétences en programmation suffisantes. Tout le code est optimisé dans une machine virtuelle afin que les utilisateurs puissent exécuter directement le code à l’aide de leurs propres données.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

La technique de séquençage métagénomique contourne le processus d’isolement de la souche et séquence directement l’ADN total dans un échantillon environnemental. Ainsi, les données métagénomiques contiennent de l’ADN de différents organismes, et la plupart des séquences biologiques proviennent de nouveaux organismes qui ne sont pas présents dans la base de données actuelle. Selon différents objectifs de recherche, les biologistes doivent classer ces séquences sous différents angles, tels que la classification taxonomique1,la classification virus-bactérie 2,3,4, la classificat....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. L’installation de la machine virtuelle

  1. Téléchargez le fichier de la machine virtuelle à partir de (https://github.com/zhenchengfang/DL-VM).
  2. Téléchargez le logiciel VirtualBox à partir de https://www.virtualbox.org.
  3. Décompressez le fichier « .7z » à l’aide de logiciels associés, tels que « 7-Zip », « WinRAR » ou « WinZip ».
  4. Installez le logiciel VirtualBox en cliquant sur le bouton Suivant à chaque étape.
  5. Ouvrez le logiciel VirtualBox et cliquez sur le bouton Nouveau pour créer une machine virtuelle.
  6. Étape 6: Entrez le nom de la machine virtuelle spécifiée dans le cadre « N....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Dans nos travaux précédents, nous avons développé une série d’outils de classification de séquences pour les données métagénomiques en utilisant une approche similaire à ce tutoriel3,11,12. À titre d’exemple, nous avons déposé les fichiers de séquence du sous-ensemble de l’ensemble d’entraînement et de l’ensemble de tests de notre travail précédent3,11 dans la machine vi.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Ce didacticiel fournit une vue d’ensemble pour les biologistes et les débutants en conception d’algorithmes sur la façon de construire un cadre d’apprentissage profond facile à utiliser pour la classification des séquences biologiques dans les données métagénomiques. Ce tutoriel vise à fournir une compréhension intuitive de l’apprentissage profond et à relever le défi que les débutants ont souvent du mal à installer le package d’apprentissage profond et à écrire le code de l’algorithme. Pour certaines tâches de classific.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Les auteurs déclarent qu’il n’y a pas de conflits d’intérêts.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Cette enquête a été soutenue financièrement par la Fondation nationale des sciences naturelles de Chine (81925026, 82002201, 81800746, 82102508).

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
PC ou serveurNANAMémoire suggérée : >6GB
Logiciel VirtualBoxNANALien : https://www.virtualbox.org

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Liang, Q., Bible, P. W., Liu, Y., Zou, B., Wei, L. DeepMicrobes: taxonomic classification for metagenomics with deep learning. NAR Genomics and Bioinformatics. 2 (1), (2020).
  2. Ren, J., et al. VirFinder: a novel k -....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Deep LearningBiological Sequence ClassificationMetagenomic DataVirtual MachineSequence Classification ToolsOne Hot EncodingSpecies ClassificationGene Function ClassificationViral Host ClassificationDeep Learning Framework

Related Articles