Method Article

Una plataforma de máquina virtual para profesionales no informáticos para usar el aprendizaje profundo para clasificar secuencias biológicas de datos metagenómicos

DOI:

10.3791/62250

September 25th, 2021

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Este tutorial describe un método simple para construir un algoritmo de aprendizaje profundo para realizar la clasificación de secuencias de 2 clases de datos metagenómicos.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Una variedad de tareas de clasificación de secuencias biológicas, como la clasificación de especies, la clasificación de la función génica y la clasificación del huésped viral, son procesos esperados en muchos análisis de datos metagenómicos. Dado que los datos metagenómicos contienen un gran número de nuevas especies y genes, se necesitan algoritmos de clasificación de alto rendimiento en muchos estudios. Los biólogos a menudo enfrentan desafíos para encontrar herramientas adecuadas de clasificación y anotación de secuencias para una tarea específica y, a menudo, no pueden construir un algoritmo correspondiente por sí mismos debido a la falta del conocimiento matemático y computacional necesario. Las técnicas de aprendizaje profundo se han convertido recientemente en un tema popular y muestran fuertes ventajas en muchas tareas de clasificación. Hasta la fecha, se han desarrollado muchos paquetes de aprendizaje profundo altamente empaquetados, que hacen posible que los biólogos construyan marcos de aprendizaje profundo de acuerdo con sus propias necesidades sin un conocimiento profundo de los detalles del algoritmo. En este tutorial, proporcionamos una guía para construir un marco de aprendizaje profundo fácil de usar para la clasificación de secuencias sin la necesidad de suficientes conocimientos matemáticos o habilidades de programación. Todo el código está optimizado en una máquina virtual para que los usuarios puedan ejecutar directamente el código utilizando sus propios datos.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

La técnica de secuenciación metagenómica evita el proceso de aislamiento de la deformación y secuencia directamente el ADN total en una muestra ambiental. Por lo tanto, los datos metagenómicos contienen ADN de diferentes organismos, y la mayoría de las secuencias biológicas son de organismos nuevos que no están presentes en la base de datos actual. De acuerdo con diferentes propósitos de investigación, los biólogos necesitan clasificar estas secuencias desde diferentes perspectivas, como la clasificación taxonómica1,la clasificaciónvirus-bacteria2,3,

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. La instalación de la máquina virtual

  1. Descargue el archivo de la máquina virtual desde (https://github.com/zhenchengfang/DL-VM).
  2. Descargue el software VirtualBox desde https://www.virtualbox.org.
  3. Descomprima el archivo ".7z" utilizando software relacionado, como "7-Zip", "WinRAR" o "WinZip".
  4. Instale el software VirtualBox haciendo clic en el botón Siguiente en cada paso.
  5. Abra el software VirtualBox y haga clic en el botón Nuevo para crear una máquina virtual.
  6. Paso 6: Ingrese el nombre de la máquina virtual especificado en el marco "Nombre", seleccione Linux

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

En nuestro trabajo anterior, desarrollamos una serie de herramientas de clasificación de secuencias para datos metagenómicos utilizando un enfoque similar a este tutorial3,11,12. Como ejemplo, depositamos los archivos de secuencia del subconjunto de conjunto de entrenamiento y conjunto de prueba de nuestro trabajo anterior3,11 en la máquina virtual.

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Este tutorial proporciona una visión general para biólogos y principiantes en diseño de algoritmos sobre cómo construir un marco de aprendizaje profundo fácil de usar para la clasificación de secuencias biológicas en datos metagenómicos. Este tutorial tiene como objetivo proporcionar una comprensión intuitiva del aprendizaje profundo y abordar el desafío que los principiantes a menudo tienen dificultades para instalar el paquete de aprendizaje profundo y escribir el código para el algoritmo. Para algunas tareas de clasif.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Los autores declaran que no hay conflictos de intereses.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Esta investigación fue apoyada financieramente por la Fundación Nacional de Ciencias Naturales de China (81925026, 82002201, 81800746, 82102508).

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
PC o servidorNANA Memoria sugerida: >6 GB
Software VirtualBoxNANAEnlace: https://www.virtualbox.org

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Liang, Q., Bible, P. W., Liu, Y., Zou, B., Wei, L. DeepMicrobes: taxonomic classification for metagenomics with deep learning. NAR Genomics and Bioinformatics. 2 (1), (2020).
  2. Ren, J., et al. VirFinder: a novel k -....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Deep LearningBiological Sequence ClassificationMetagenomic DataVirtual MachineSequence Classification ToolsOne Hot EncodingSpecies ClassificationGene Function ClassificationViral Host ClassificationDeep Learning Framework

Related Articles