Method Article

פלטפורמת מכונה וירטואלית לאנשי מקצוע שאינם אנשי מחשב לשימוש בלמידה עמוקה כדי לסווג רצפים ביולוגיים של נתונים מטגנומיים

DOI:

10.3791/62250

September 25th, 2021

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

מדריך זה מתאר שיטה פשוטה לבניית אלגוריתם למידה עמוקה לביצוע סיווג רצף של 2 מחלקות של נתונים מטגנומיים.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

מגוון משימות סיווג רצף ביולוגי, כגון סיווג מינים, סיווג תפקודי גנים וסיווג מארח ויראלי, צפויים בתהליכים ניתוחי נתונים מטגנומיים רבים. מכיוון שנתונים מטגנומיים מכילים מספר רב של מינים וגנים חדשניים, נדרשים במחקרים רבים אלגוריתמים לסיווג בעלי ביצועים גבוהים. ביולוגים נתקלים לעתים קרובות באתגרים במציאת כלי סיווג וביאור מתאימים למשימה מסוימת ולעתים קרובות אינם מסוגלים לבנות אלגוריתם מקביל בעצמם בגלל היעדר הידע המתמטי והחישובי הדרוש. טכניקות למידה עמוקה הפכו לאחרונה לנושא פופולרי ומראים יתרונות חזקים במשימות סיווג רבות. עד כה פותחו חבילות רבות של למידה עמוקה ארוזות מאוד, המאפשרות לביולוגים לבנות מסגרות למידה עמוקה בהתאם לצרכים שלהם ללא ידע מעמיק בפרטי האלגוריתם. במדריך זה, אנו מספקים קו מנחה לבניית מסגרת למידה עמוקה קלה לשימוש לסיווג רצף ללא צורך בידע מתמטי מספיק או מיומנויות תכנות. כל הקוד ממוטב במחשב וירטואלי, כך שמשתמשים יכולים להפעיל ישירות את הקוד באמצעות הנתונים שלהם.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

טכניקת הריצוף המטגנומית עוקפת את תהליך בידוד המתח ומרצפת ישירות את הדנ"א הכולל במדגם סביבתי. לפיכך, נתונים מטגנומיים מכילים DNA של אורגניזמים שונים, ורוב הרצפים הביולוגיים הם מאורגניזמים חדשניים שאינם קיימים במסד הנתונים הנוכחי. על פי מטרות מחקר שונות, ביולוגים צריכים לסווג רצפים אלה מנקודות מבט שונות, כגון סיווג טקסונומי1, סיווג חיידקי וירוס2,3,4, סיווג כרומוזום-פלסמיד3,5,6,7, וביאור תפקוד גנים (כגון סיווג גנים עמידים לאנטיב....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. התקנת המכונה הווירטואלית

  1. הורד את קובץ המחשב הווירטואלי מ -(https://github.com/zhenchengfang/DL-VM).
  2. הורד את תוכנת VirtualBox https://www.virtualbox.org.
  3. שחרר לחץ על הקובץ ".7z" באמצעות תוכנות קשורות, כגון "7-Zip", "WinRAR" או "WinZip".
  4. התקן את תוכנת VirtualBox על-ידי לחיצה על לחצן הבא בכל שלב.
  5. פתח את תוכנת VirtualBox ולחץ על לחצן חדש כדי ליצור מחשב וירטואלי.
  6. שלב 6: הזן את שם המחשב הווירטואלי שצוין במסגרת "שם", בחר לינוקס כמערכת ההפעלה במסגרת "הקלד", בחר באובוונטו במסגרת "גירסה" ולחץ על לחצן הבא.
  7. הקצה את גודל הזיכ....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

בעבודה הקודמת שלנו, פיתחנו סדרה של כלי סיווג רצף עבור נתונים metagenomic באמצעות גישה דומה זה הדרכה3,11,12. כדוגמה, הפקדנו את קבצי הרצף של קבוצת המשנה של ערכת האימונים ומבחן שנקבע מהעבודההקודמתשלנו 3,11 במכונה הווירטואלית.

פאנג וג'ואו11 נועדו לזהות את חלבוני הנגיף הפרוקריוטה המלאים והחלקיים מנתונים וירומיים. הקובץ "p_tr.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

מדריך זה מספק סקירה כללית עבור ביולוגים ואלגוריתמים לעצב מתחילים על איך לבנות מסגרת למידה עמוקה קלה לשימוש לסיווג רצף ביולוגי בנתונים metagenomic. מדריך זה נועד לספק הבנה אינטואיטיבית של למידה עמוקה ולהתמודד עם האתגר כי למתחילים לעתים קרובות מתקשים להתקין את חבילת למידה עמוקה וכתיבת הקוד עבור האלגוריתם. עבור כמה משימות סיווג פשוטות, משתמשים יכולים להשתמש במסגרת כדי לבצע את משימות הסיווג.

בהתחשב בכך שביולוגים רבים אינם מכירים את שורת הפקודה של מערכת ההפעלה לינוקס, התקנו מראש את כל התוכנות התלוי.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

המחברים מצהירים כי אין ניגודי עניינים.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

חקירה זו נתמכה כלכלית על ידי הקרן הלאומית למדעי הטבע של סין (81925026, 82002201, 81800746, 82102508).

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
מחשב או שרתNANA זיכרון מומלץ: >6GB
תוכנת VirtualBoxNA קישור: https://www.virtualbox.org

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Liang, Q., Bible, P. W., Liu, Y., Zou, B., Wei, L. DeepMicrobes: taxonomic classification for metagenomics with deep learning. NAR Genomics and Bioinformatics. 2 (1), (2020).
  2. Ren, J., et al. VirFinder: a novel k -....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Deep LearningBiological Sequence ClassificationMetagenomic DataVirtual MachineSequence Classification ToolsOne Hot EncodingSpecies ClassificationGene Function ClassificationViral Host ClassificationDeep Learning Framework

Related Articles