Method Article

منصة آلة افتراضية للمهنيين غير الكمبيوتر لاستخدام التعلم العميق لتصنيف التسلسلات البيولوجية للبيانات الميتاجنومية

DOI:

10.3791/62250

September 25th, 2021

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

يصف هذا البرنامج التعليمي طريقة بسيطة لبناء خوارزمية التعلم العميق لأداء تصنيف تسلسل من فئتين من البيانات metagenomic.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

ومن المتوقع القيام بمجموعة متنوعة من مهام تصنيف التسلسل البيولوجي، مثل تصنيف الأنواع وتصنيف وظائف الجينات وتصنيف المضيف الفيروسي، بعمليات في العديد من تحليلات البيانات الميتاجنومية. وبما أن البيانات الميتاجنومية تحتوي على عدد كبير من الأنواع والجينات الجديدة، فإن هناك حاجة إلى خوارزميات تصنيف عالية الأداء في العديد من الدراسات. غالبا ما يواجه علماء الأحياء تحديات في العثور على أدوات تصنيف التسلسل والتعليق المناسبة لمهمة محددة ، وغالبا ما لا يكونون قادرين على بناء خوارزمية مقابلة بمفردهم بسبب نقص المعرفة الرياضية والحسابية اللازمة. تقنيات التعلم العميق أصبحت مؤخرا موضوعا شعبيا وتظهر مزايا قوية في العديد من مهام التصنيف. حتى الآن ، تم تطوير العديد من حزم التعلم العميق المعبأة للغاية ، والتي تجعل من الممكن لعلماء الأحياء بناء أطر تعلم عميقة وفقا لاحتياجاتهم الخاصة دون معرفة متعمقة بتفاصيل الخوارزمية. في هذا البرنامج التعليمي، ونحن نقدم مبادئ توجيهية لبناء سهلة الاستخدام إطار التعلم العميق لتصنيف تسلسل دون الحاجة إلى المعرفة الرياضية الكافية أو مهارات البرمجة. يتم تحسين كافة التعليمات البرمجية في جهاز ظاهري بحيث يمكن للمستخدمين مباشرة تشغيل التعليمات البرمجية باستخدام البيانات الخاصة بهم.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

تتجاوز تقنية التسلسل الميتاجنومي عملية عزل السلالة وتسلسل الحمض النووي الإجمالي مباشرة في عينة بيئية. وهكذا، تحتوي البيانات الميتاجنومية على الحمض النووي من كائنات حية مختلفة، ومعظم التسلسلات البيولوجية هي من كائنات حية جديدة غير موجودة في قاعدة البيانات الحالية. وفقا لأغراض بحثية مختلفة، يحتاج علماء الأحياء إلى تصنيف هذه التسلسلات من وجهات نظر مختلفة، مثل التصنيف التصنيفي1، وتصنيف البكتيرياالفيروسات 2،3،4، تصنيف الكروموسومات البلازميد3،5،6،7....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. تركيب الجهاز الظاهري

  1. تحميل ملف الجهاز الظاهري من (https://github.com/zhenchengfang/DL-VM).
  2. تحميل برنامج فيرتثلبوإكس من https://www.virtualbox.org.
  3. فك ضغط ملف ".7z" باستخدام البرامج ذات الصلة، مثل "7-Zip" أو "WinRAR" أو "WinZip".
  4. تثبيت برنامج فيرتثلبوإكس بالنقر فوق الزر التالي في كل خطوة.
  5. افتح برنامج فيرتثلبوإكس وانقر فوق الزر جديد لإنشاء جهاز ظاهري.
  6. الخطوة 6: أدخل اسم الجهاز الظاهري المحدد في إطار "الاسم"، وحدد لينكس كنظام تشغيل في إطار "النوع"، وحدد أوبونتو في إطار "الإصدار" وانقر على الزر التالي.
  7. تخصيص حجم الذا....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

في عملنا السابق، قمنا بتطوير سلسلة من أدوات تصنيف تسلسل للبيانات metagenomic باستخدام نهج مماثل لهذا البرنامج التعليمي11،12. كمثال، قمنا بإيداع ملفات تسلسل مجموعة التدريب الفرعية ومجموعة الاختبار من عملنا السابق3،11 في الجهاز الظاهري.

فانغ وتشو11 تهدف إلى تحديد كامل وجزئي prokaryote فيروس virion البروتينات من بيانات ف.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

يوفر هذا البرنامج التعليمي لمحة عامة لعلماء الأحياء والمبتدئين تصميم خوارزمية حول كيفية بناء إطار التعلم العميق سهلة الاستخدام لتصنيف التسلسل البيولوجي في البيانات metagenomic. يهدف هذا البرنامج التعليمي إلى توفير فهم بديهي للتعلم العميق ومعالجة التحدي الذي يواجه المبتدئين في كثير من الأحيان صعوبة في تثبيت حزمة التعلم العميق وكتابة التعليمات البرمجية للخوارزمية. بالنسبة لبعض مهام التصنيف البسيطة، يمكن للمستخدمين استخدام إطار العمل لتنفيذ مهام التصنيف.

وبالنظر إلى أن العديد من علماء الأحياء ليس.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

ويعلن أصحاب البلاغ أنه لا يوجد تضارب في المصالح.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

وقد دعم هذا التحقيق ماليا المؤسسة الوطنية للعلوم الطبيعية في الصين (81925026، 82002201، 81800746، 82102508).

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
الكمبيوتر الشخصي أو الخادمNANAالذاكرة المقترحة: >6 جيجابايت
برنامج VirtualBoxNANA الرابط: https://www.virtualbox.org

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Liang, Q., Bible, P. W., Liu, Y., Zou, B., Wei, L. DeepMicrobes: taxonomic classification for metagenomics with deep learning. NAR Genomics and Bioinformatics. 2 (1), (2020).
  2. Ren, J., et al. VirFinder: a novel k -....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Deep LearningBiological Sequence ClassificationMetagenomic DataVirtual MachineSequence Classification ToolsOne Hot EncodingSpecies ClassificationGene Function ClassificationViral Host ClassificationDeep Learning Framework

Related Articles