Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

גילוי רצף הרומן מאת גנומיקה מופחתים

Published: January 25, 2019 doi: 10.3791/58877

Summary

המטרה של פרוטוקול זה היא להשתמש שילוב של חישובית ומחקר ספסל למצוא רצפי חדשניים אשר לא ניתן להפריד בקלות בין רצף טיהור משותף, אשר עשוי להיות מוכר באופן חלקי בלבד.

Abstract

גנומיקה מופחתים ניתן להשתמש במחקר כלשהו שבו המטרה היא לזהות את הרצף של גנים, חלבונים או אזור כללי שמוטבעת בתוך הקשר גנומית גדול. גנומיקה מופחתים מאפשר חוקר לבודד המטרה רצף של עניין (T) על ידי רצף מקיף ומחסר החוצה מרכיבים גנטיים מוכרים (הפניה, R). השיטה יכולה לשמש לזיהוי רצפים הרומן המיטוכונדריה, מהכלורופלסט, וירוסים, או germline מוגבלת כרומוזומים, יעיל במיוחד כאשר T לא יכול להיות בקלות מבודד מ ר מתחיל עם הנתונים גנומית מקיף (R + T), השיטה משתמש בסיסי מקומי יישור חיפוש כלי (פיצוץ) נגד רצף הפניה או רצפים, כדי להסיר את התאמת ידועים רצפי (R), משאיר מאחור את המטרה (T). עבור חיסור לפעול בצורה הטובה ביותר, R צריך להיות טיוטה שלמה יחסית שחסרה לו ט מאז רצפים שנותרו לאחר חיסור נבדקים דרך כמותיים תגובת שרשרת פולימראזית (qPCR), R לא צריך להיות מושלם. שיטת העבודה. כאן אנחנו קישור צעדים חישובית עם מדרגות ניסיוני לתוך מחזור זה יכול להיות iterated בהתאם לצורך, ברצף הסרת מספר רצפי הפניה וכוונון החיפוש אחר טי היתרון של גנומיקה מופחתים הוא כי ברצף ולחלוטין היעד ניתן לזהות אפילו במקרים שבהם טיהור פיזית קשה, בלתי אפשרי או יקר. החיסרון של השיטה הוא מציאת הפניה מתאימה עבור חיסור וקבלת T-חיובי ושלילי דגימות לבדיקת qPCR. אנו מתארים שלנו ויישום שיטת הזיהוי של הגן הראשון של כרומוזום germline מוגבלת של זברה פינק. במקרה זה סינון חישובית מעורב 3 הפניות (R), ברצף להסיר מעל בשלושה מחזורים: מכלול לא שלם גנומית, הנתונים הגולמיים גנומית, ונתונים transcriptomic.

Introduction

מטרת שיטה זו הוא לזהות של הרומן היעד (T) רצף גנומית, DNA או RNA, ההקשר גנומית, או הפניה (R) (איור 1). השיטה זו שימושית במיוחד אם היעד לא יכולה להיות מופרדים פיזית, או שזה יהיה יקר לעשות זאת. רק כמה אורגניזמים לחלוטין סיימו את הגנום עבור חיסור, אז חידוש מפתח בשיטה שלנו היא שילוב של חישובית של השיטות הספסל לתוך מעגל הפעלת חוקרים לבודד המטרה רצפים כאשר ההפניה היא פגומה, או טיוטה הגנום של אורגניזם שאינו-מודל. בסוף מחזור, בדיקות qPCR משמש כדי לקבוע אם יש צורך חיסור נוסף. רצף המאומת המועמד T יראה זיהוי סטטיסטית בדגימות T-חיוביות מוכרות על-ידי qPCR.

גלגולים של השיטה יושמו גילוי חדש חיידקי סמים מטרות שאין המארח homologs1,2,3,4 , זיהוי של וירוסים הרומן לנשאים נגועים 5,6. בנוסף זיהוי של T, השיטה יכול לשפר את r: לאחרונה השתמשנו בשיטת לזהות גנים חסרים 936 מן הגנום הפניה זברה פינק גן חדש של כרומוזום germline בלבד (T)7. גנומיקה מופחתים הוא יקר במיוחד כאשר T צפוי להיות מאוד מתפצלת של רצפי ידוע, או כאשר זהותו של T אינה מוגדרת בהרחבה, כמו זברה פינק מוגבלת germline כרומוזום7.

ואחרת לא זיהוי חיובי של T מראש, יתרון מפתח של מופחתים גנומיקה היא שזה לא משוחדת. במחקר שנערך לאחרונה, Readhead. ואח בדק את הקשר בין מחלת אלצהיימר ושפע ויראלית באזורים במוח ארבעה. עבור זיהוי ויראלי, Readhead. et al. ליצור מסד נתונים של וירוסים 5158, מגבילה מאוד את הסוכנים ויראלי המחקר שלהם שיכול לזהות. גנומיקה מופחתים יכול שימשו כדי להשוות בין הבריאים ואת הגנום אלצהיימר על מנת לבודד וירוסים הרומן הקשורים במחלה, ללא קשר הדמיון שלהם לגורמי ידוע. אמנם ישנם וירוסים פילוח האדם מוכרים 263, ההערכה היא כי כ 1.67 מיליון שעדיין לא התגלו מינים ויראלי קיימים, עם 631,000-827,000 מהם יש אפשרות להדביק בני אדם9.

בידוד של וירוסים הרומן הוא אזור שבו מופחתים גנומיקה יעיל במיוחד, אך מחקרים ייתכן שלא תזדקק השיטה מחמירים. לדוגמה, מחקרים זיהוי וירוסים הרומן השתמשו מוטים רצף תפוקה גבוהה ואחריו שעתוק במהופך, BLASTx עבור רצפי ויראלי5 או העשרה של חומצות גרעין נגיפיות כדי לחלץ ולהפוך לתמלל ויראלי רצפים 6. בעוד מחקרים אלה המועסקים דה נובו רצף והרכבה, חיסור לא שימש כי הרצפים היעד זוהו באופן חיובי באמצעות פיצוץ. אם וירוסים ולחלוטין, לא קשורים (או קרובים רחוקים) וירוסים אחרים, גנומיקה מופחתים היה טכניקה שימושית. היתרון של גנומיקה מופחתים הוא כי ניתן להשיג רצפי אשר הינם חדשים לחלוטין. אם הגנום של האורגניזם ידוע, זה ניתן להפחית לעזוב כל רצפי ויראלי. כך למשל, במחקר שפורסם שלנו בודדנו רצף ויראלי הרומן של זברה פינק באמצעות גנומיקה מופחתים, למרות שזה לא כוונה המקורי שלנו7.

גנומיקה מופחתים גם הוכיח שימושי בזיהוי מטרות חיסון חיידקי, מוטיבציה מאת לעליה דרמטית עמידות לאנטיביוטיקה1,2,3,4. כדי למזער את הסיכון של תגובה אוטואימונית, חוקרים צמצמתי את מטרות אפשריות של החיסון על-ידי חיסור כל החלבונים שיש homologs לארח אדם. מחקר אחד מסוים, מסתכלים על Corynebacterium pseudotuberculosis, ביצע חיסור של הגנום מארח חוליות מן הגנום חיידקית מספר כדי להבטיח אפשרי סמים מטרות לא ישפיע על חלבונים ב המארחים שמוביל לתופעות לוואי 1. תהליך עבודה בסיסי של מחקרים אלה היא להוריד את פרוטאום חיידקי, לקבוע חלבונים חיוניים, להסיר חלבונים יתיר, השתמש BLASTp כדי לבודד את החלבונים חיוניים, BLASTp נגד פרוטאום המארח כדי להסיר את כל החלבונים עם המארח homologs 1 , 2 , 3 , 4. במקרה זה, גנומיקה מופחתים להבטיח כי החיסונים פיתחו לא יהיו תופעות את המטרה מארח1,2,3,4.

השתמשנו גנומיקה מופחתים כדי לזהות את הגן הראשון חלבונים על מוגבלת germline כרומוזום (GRC) (במקרה זה, T), הנמצא germlines אבל לא סומאטית רקמות של שני המינים10. לפני במחקר זה, המידע רק גנומית היה ידוע אודות למרפאה היה אזור החוזרות על עצמן11. דה נובו ההרכבה בוצעה ב- RNA וסודרו מן השחלה ואת teste רקמות (R + T) מן הפרושים זברה למבוגרים. חיסול חישובית של רצפי התבצע בעזרת שפורסמו סומאטית (שריר) הגנום רצף (R1)12, שלו raw (סנגר) לקרוא נתונים (R2), transcriptome (R3) סומאטית (המוח)13. שימוש רציף ושלוש הפניות הסיע את qPCR בדיקות בשלב 5 של כל מחזור (איור 2א), מראה כי סינון נוסף היה נדרש. הגן α-SNAP שהתגלו אושר דרך qPCR של ה-DNA ו- RNA, ו שיבוט רצף. אנחנו מראים בדוגמה שלנו כי שיטה זו היא גמישה: זה לא תלויה התאמת חומצות גרעין (DNA לעומת ה-RNA), ניתן לבצע את החיסור הפניות (R) מורכבות של הרכבות או קריאות raw.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. דה נובו להרכיב מתחיל רצף

הערה: נתונים הדור הבא ברצף (הגדרות) יכול לשמש, כל עוד הרכבה ניתן להפיק את הנתונים האלה. נתוני קלט מתאים כולל אילומינה, PacBio, או Nanopore אוקספורד הקראה התאספו לתוך קובץ fasta. עבור קונקרטיות, סעיף זה מתאר הרכבה transcriptomic מבוססי אילומינה ספיציפית המחקר זברה פינק ביצענו7; אולם להיות מודע כי הפרטים משתנים לפי פרוייקט. לפרויקט בדוגמה שלנו, הנתונים הגולמיים היו נגזרת של MiSeq, קריאות לזווג כ-10 מיליון, התקבלו כל דגימה.

  1. השתמש Trimmomatic 0.32 נקודות14 כדי להסיר מתאמים אילומינה ובסיסים באיכות נמוכה. בשורת הפקודה, הזן:
    java-ג'אר PE trimmomatic-0.32.jar-phred33 forward.fq.gz reverse.fq.gz - baseout quality_and_adaptor_trimmed ILLUMINACLIP:TruSeq3-PE.fa:2:30:10 מובילים: 3 נגרר: 3 SLIDINGWINDOW:4:20 MINLEN:40
  2. שימוש אגס15 נ' 0.9.6 כדי ליצור קריאות הממוזג באיכות גבוהה של trimmomatic פלט סינכרוניות לזווג, באמצעות פרמטרים ברירת המחדל. בשורת הפקודה, הזן:
    אגס -f < quality_and_adaptor_trimmed_1P.fastq > - r < quality_and_adaptor_trimmed_2P.fastq >
  3. שימוש זוחלים נ' 1.116 כדי לתקן שגיאה הקריאות מיוצר באמצעות אגס. לפי התקנון צעד אחר צעד שמתואר17.
  4. השתמש טריניטי נ' 2.4.018 במצב ברירת המחדל כדי להרכיב את רצפי המתוקן. עבור ספריות סטרנד ספציפי, השתמש בפרמטר - SS_lib_type. הפלט הוא קובץ fasta (your_assembly.fasta). בשורת הפקודה, הזן:
    טריניטי - seqType בזה..--SS_lib_type FR – max_memory 10 גרם – פלט Trinity_output - שמאל quality_and_adaptor_trimmed_forward_paired_reads.fq – נכון quality_and_adaptor_trimmed_reverse_paired_reads.fq – ה -CPU 10
    הערה: הפלט יוצב בספרייה החדשה, Trinity_output, ואת מכלול תיקרא 'Trinity.fasta' אשר שהיישום כמו Your_assembly.fasta במקרה הצורך. ראה באתר טריניטי לפרטים נוספים: https://github.com/trinityrnaseq/trinityrnaseq/wiki/Running-Trinity.

2. לפוצץ את מכלול נגד הרצף הפניה

הערה: שימוש שלב זה כאשר ההפניה של מכלול או זמן קורא כמו סנגר; אם הוא מורכב אילומינה raw יקרא, ראה שלב 3 שלהלן עבור מיפוי קריאות לשאילתה. כל השלבים הפיצוץ הושלמו עם גירסה 2.2.29+ למרות הפקודות צריך לעבוד על כל גרסה ההדף האחרונה.

  1. להפוך מסד נתונים הפיצוץ של הרצף הפניה (nucleotide_reference.fasta) בשורת הפקודה. מזינים שורת הפקודה הבאה:
    makeblastdb - dbtype nucl-ב nucleotide_reference.fasta-. nucleotide_reference.db
  2. הפיצוץ-משחק הרכבה שאילתה (נוצר בשלב 1) למסד הנתונים של הפניה. כדי לקבל קובץ פלט, השתמש [-את BLAST_results.txt] כדי להפיק פלט טבלאי (נדרש עבור שלבי העיבוד הבאים עם פיתון קבצי script), להשתמש [-outfmt 6]. אפשרויות אלה ניתן לשלב בכל סדר, כך לדוגמה להשלים הפקודה היא [blastn-שאילתה your_assembly.fasta - db nucleotide_reference.db-. BLAST_results.txt - outfmt 6]. אם הגדרה הערך האלקטרוני בלתי רצוי, השתמש באפשרות - evalue באמצעות מספר מתאים, למשל [1e-evalue-6]. להיות מודע אולם זה מחזור מופחתים בצורה יעילה היפוך evalue את הגדרת כפי שמתואר בדיון.
  3. עבור ערך מוגבר להשתמש רצפי חלבונים מההרכבה השאילתה הפיצוץ עם נוקלאוטיד מתורגם הפיצוץ (tBLASTn), אשר מבצעת 6-דרך תרגום של מסד הנתונים (נוקלאוטיד). שיטה זו מומלצת עבור רוב מערכות-דגם, מתחמק מהבעיה של ביאורים חלבון לא שלם.
    1. ודא הקוד הגנטי הנכון נבחר עתה האורגניזם למד, שימוש באפשרות - db_gencode. כדי לקבל חלבון רצפים עבור השאילתה, הפעל את הפקודה TransDecoder.LongOrfs (מתוך חבילת TransDecoder נ' 3.0.1) לזהות את המסגרות הכי הרבה זמן קריאה פתוחה מן השאילתה שהורכב רצפים. הפקודה היא [TransDecoder.LongOrfs -t your_assembly.fasta]; הפלט ימוקם בספריה בשם 'transcripts.transdecoder_dir', מכילה קובץ בשם longest_orfs.pep המכיל את הרצף הארוך ביותר החזוי חלבון של כל רצף ב- your_assembly.fasta.
    2. לשימוש tBLASTn, הפעל את הפקודה [tblastn-שאילתה longest_orfs.pep - db nucleotide_reference.db-. BLAST_results.txt - outfmt 6]. אם הפניה חלבון באיכות גבוהה זמין, השתמש חלבון תואמים עם BLASTp ולא tBLASTn.
    3. להפוך מסד נתונים הפיצוץ של ההפניה חלבון [פרוט - dbtype makeblastdb-ב protein_reference.fasta-את protein_reference.db] ולאחר מכן [blastp-שאילתה longest_orfs.pep - db protein_reference.db-. BLAST_results.txt - outfmt 6]. הקפד לשמור את התוצאות כקובץ לעיבוד במורד הזרם, ולהשתמש טבלאי (outfmt 6) על מנת להבטיח שהסקריפטים פיתון יוכלו לנתח אותם כראוי.

3. מפת קורא אל ההרכבה

הערה: שיטה זו ניתן להשתמש אם ערכת הנתונים ההפניה מורכבת קריאות גנומית raw, יותר מאשר רצפים שהורכב או רצף סנגר, בשימוש במקרה שבו הפיצוץ (שלב 2.1).

  1. באמצעות BWA-MEM נ' 0.7.1219 -bowtie220, מפת קריאות raw שהורדת (raw_reads.fastq) אל מכלול שאילתה. הפלט יהיה בפורמט .sam. הפקודות הן כדלקמן: תחילה אינדקס ההרכבה: [bwa אינדקס your_assembly.fasta], ולאחר מכן למפות את הקריאות [bwa mem your_assembly.fasta raw_reads.fastq > mapped.sam]. (הערה ' >' סמל כאן הוא לא גדול-מאשר לחתום; במקום זה מנחה את הפלט להיכנס mapped.sam הקובץ).

4. השתמש את פיתון Script כדי להסיר את כל רצפי התאמת

הערה: סיפק עבודה סקריפטים 2.7 פייתון.

  1. בעקבות בשלב 2, להשתמש בקובץ script פיתון מופחתים באמצעות הפקודה [./Non-matching_sequences.py your_assembly.fasta BLAST_results.txt]. לפני הפעלת קובץ ה-script, ודא כי קובץ הפלט הפיצוץ בתבנית 6 (טבלאי). התסריט יהיה הפלט קובץ שאינו תואם רצפים בתבנית fasta בשם your_assembly.fasta_non-matching_sequences_BLAST_results.txt.fasta, גם התאמת רצף עבור רשומות, כמו your_assembly.fasta_matching_sequences_BLAST_ קובץ results.txt.fasta. הלא תואם יהיו החשובים ביותר, וגם מקור פוטנציאלי רצפים T לבדיקת עוד יותר מחזורי גנומיקה מופחתים.
  2. ביצוע שלב 3, להפעיל את removeUnmapped.py סקריפט פיתון לקחת בתור קלט את .sam מהשלב 3.1, מזהה את השמות של רצפי שאילתה ללא כל קריאות תואמות, שומר אותם לקובץ טקסט חדש. השתמש בפקודה [./removeUnmapped.py mapped.sam], הפלט יהיה mapped.sam_contigs_with_no_reads.txt. (התוכנית תיצור קובץ סאם בראד-למטה עם קריאות שלא מופו כל הסיר; קובץ זה ניתן להתעלם למטרות של פרוטוקול זה, אבל עשוי להיות שימושי עבור ניתוחים אחרים).
  3. כמו הפלט של השלב הקודם הוא רשימה של שמות רצף בקובץ טקסט שנקרא mapped.sam_contigs_with_no_reads.txt, לחלץ קובץ fasta עם רצפי אלה: [./getContig.py your_assembly.fasta mapped.sam_contigs_with_no_reads.txt]. הפלט יהיה קובץ בשם mapped.sam_contigs_with_no_reads.txt.fasta.

5. עיצוב תחל את הרצף הנשאר

הערה: בשלב זה יש קובץ fasta המכיל רצפי המועמד T. סעיף זה מתאר qPCR כדי השפעול לבדוק אם הם באים מ- T או מאזורים לא מוכרת ר אם חיסור בשלב 4 מוסר על כל רצפי, ואז ההרכבה ההתחלתית נכשלה כוללים T או החיסור שיתכן גם מחמירים.

  1. השתמש Geneious21 כדי לקבוע רצפים של האופטימלית פריימר באופן ידני.
    1. סמן רצף המועמד של 21-28 bp פריימר לפנים. הימנע ריצות של 4 או יותר של כל בסיס. נסה למקד אזור עם שילוב אחידה למדי של כל basepairs. G בודדת או C בקצה 3' הוא מועיל, עוזר כדי לעגן את המפתח.
    2. לחץ על הכרטיסיה סטטיסטיקה בצד ימין של המסך כדי להציג הרצף של ההערכה טמפרטורת ההיתוך (Tm) כמו אזור מועמד מסומן. נראה כדי לקבל חום ההיתוך בין 55-60 מעלות צלזיוס, תוך הימנעות חזרה רצפים ארוכים של G/c
    3. בצע את שלבים 5.1.1. 5.1.2 לבחור פריימר הפוכה, ממוקם 150-250 בסיסים 3' של פריימר לפנים,.... בעוד המרחק פריימר לא צריך להתאים, ה-Tm החזוי צריך להיות הכי קרוב ככל האפשר ל Tm של פריימר לפנים. הקפד להפוך משלים הרצף (אם ימנית בתוך Geneious כאשר הרצף מואר זה אפשרות בתפריט).
  2. השתמש בפונקציה עיצוב פריימר , המצויה סרגל הכלים העליון בחלון רצף.
    1. לחץ על לחצן עיצוב פריימר . הכנס את האזור כדי להגביר תחת אזור היעד.
    2. תחת הכרטיסיה מאפיינים , הכנס הגודל הרצוי טמפרטורת ההיתוך (Tm), % GC (ראה שלב 5.1.1.).
    3. לחץ על אישור כדי לקבל תחל שנוצר. להזמין את תחל באמצעות שירות oligo מותאם אישית.
  3. אמת תחל עם ה-DNA שליטה (קידוד T ו- R) כדי למטב את זמן Tm וסיומת. השתמש Taq קבוע בג'ל כדי לראות את הגודל הלהקה, אך ניתן גם לבצע אופטימיזציה עם qPCR הבאים השיטות בשלב 6.
    1. להפוך דילולים X 10 של תחל ויוצאים כך תחל יש ריכוז של 10 μM.
    2. להשתמש בשילוב ה-PCR של 0.5 μL של dNTP, 0.5 μL של פריימר לפנים, 0.5 μL של פריימר הפוכה, μL 0.1 של אנזימים, 2 μL של תבנית, 0.75 μL של מגנזיום, μL 2.5 מאגר 18.15 μL של מים כך שאין μL 25 לכל תבנית עם ריכוז של 5 ng / ΜL.
    3. בדוק את תחל ב טמפרטורות ההיתוך שונים בתוכנית ה-PCR. בדרך כלל ביצועים אופטימליים הוא הטמפרטורות שנמדדו להמיס מעט מתחת ה-Tm החזוי של תחל את, אבל בדרך כלל לא מעל 60 מעלות צלזיוס. לבדוק גם להרחבת אופטימלית זמני באמצעות מדריך זה: 1 דקה לכל 1000 bp (לכן, בדרך כלל 10-30 שניות בהתאם לאורך אמפליקון).
    4. לבצע בג'ל מובילים כדי לאשר תחל להגביר את השתלשלות הדברים הצפויה. הפעל μL 25 של המוצר qPCR מעורבב עם μL 5 6 X גליצרול לצבוע על 2% טה agarose ג'ל ב- 200 וולט למשך 20 דקות.

6. qPCR אימות של הרצף הנותרים

הערה: שלב זה דורש תחל לאמת ותנאים PCR שהוקמה בשלב 5.

  1. לרוץ כל תבנית שהפקידים במיקס הבא; ΜL 12.5 של מיקס מאסטר PowerSYBR ירוק, 0.5 μL של פריימר לפנים עם ריכוז של μM 10, 0.5 μL של פריימר הפוכה עם ריכוז של 10 μM, 10.5 μL של מים ו- 1 μL של תבנית ה-DNA (על ריכוז של 2 ng/μL) , כך שכל אחד טוב מכיל 25 μL של הנפח הכולל.
  2. מנהל תוכנית qPCR הודיע על ידי טמפרטורה מאומתים, הארכת זמן משלב 4. אנחנו תוכנן ואומת תחל כל כך שיהיה תואם מחזור שני שלבים, 95 מעלות צלזיוס במשך 10 דקות להמיס הראשונית, ואז 40 מחזורי של 95 ° C עבור s 30 ו- 60 ° C עבור 1 דקות. אולם, תוכנית 3 שלבים (להמיס-anneal-הרחבת) עשוי להיות אופטימלי יותר צבעי בסיס, צריך להיות מותאם במידת הצורך. אנו ממליצים כי עקומות denaturing הסופי ניתן להפיק לפחות בפעם הראשונה תחל המועסקים ב- qPCR כדי לאמת ההגברה של מוצר אחד של DNA.
  3. מדד qPCR/SYBR Green אותות יחסית אקטין (או פקד אחר מתאים "R") מאת טי עבור כל המקרים לחשב את הממוצע, סטיית התקן של 2-(ג'ין Ct - β-אקטין Ct).
  4. (אופציונלי) לבצע בג'ל מובילים כדי לאשר מוצר המתאים לגודל זיהוי על-ידי qPCR. כאן, לרוץ 25 μL של המוצר qPCR מעורבב עם μL 5 6 x גליצרול לצבוע על 2% טה agarose ג'ל ב- 200 וולט למשך 20 דקות.

7. חוזר עם הפניה חדשה בחבישת נתונים.

הערה: אם שלב 6 מאומת הרצפים המזוהים מ- T, סיום מחזור כאן (איור 2א). עם זאת, מגוון רחב של שיקולים עשויים להניע כהמשך של המחזור, לדוגמה אם רצפים R רבים יישארו בקובץ או אם אף אחד של הרצף המועמד T היו אומת על-ידי qPCR בשלב 6.

  1. לקבל הפניה חדשה. שלב זה מאפשר של איטרציה חדש של המחזור והוא עשוי לכלול נתונים גולמיים גנומית, הנתונים הגולמיים של RNA-seq או datasets מורכבים אחרים. משאבי יקר עבור הפניית נתונים כוללים את מסד הנתונים הגנום במרכז הלאומי לקבלת מידע ביוטכנולוגיה (https://www.ncbi.nlm.nih.gov/genome) אילו חנויות התאספו הגנום נגיש דרך FTP (ftp://ftp.ncbi.nlm.nih.gov/genomes/), את Omnibus ביטוי גנים (https://www.ncbi.nlm.nih.gov/geo/) שבו מאוחסנים קריאות raw רצף הדור הבא. בפרויקט הגנום עשוי לספק את הנתונים רצף raw שלהם דרך אחרים הקשורים לפרוייקט אתרי אינטרנט ובסיסי.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

לאחר הפעלת הפיצוץ, קובץ הפלט יהיה רשימה של רצפי מהשאילתה התואמות במסד הנתונים. לאחר חיסור פיתון, מספר רצפי צורות להיות מושגת, ונבדק על ידי qPCR. התוצאות של זה, ואת השלבים הבאים, נדונים להלן.

שלילי התוצאה. ישנן שתי תוצאות שליליות אפשריות כי ניתן לראות לאחר הפיצוץ רצף הפניה. ייתכנו תוצאות הפיצוץ, כלומר כי הרצף סה כ אין כל רצפי דומה להפניה. זה עשוי להיות שגיאה בבחירת את רצף ההתייחסות הנכונה עבור המדגם וסודרו. אפשרות אחרת היא כי ישנם רצפים ייחודי אין בהרכבה ההתחלתי (הכל יופחת משם), ולכן אין גנים אשר נמצא על הרצף של עניין. בדוק מהיכן ההפניה ולהבטיח שזה לא הרקמה אותו כמו מכלול שאילתה.

לאחר סינון חישובית, qPCR תניב תוצאה שלילית, ראו דוגמאות איור 3א, 3B, C שבו שם היה אין הבדל איתור על-פני ציפור רקמות. פאנלים א' באמצעות C הם הגנים נציג חיסור שונים מחזורי, אילו איטראציות מוטיבציה מחזור מופחתים נוספים ופיתוח של השיטה (איור 2א, 2 ב).

תוצאה חיובית. תוצאה חיובית - זיהוי רצף היעד. האמיתי--הוא אישר כאשר qPCR דנ א גנומי מראה זיהוי סטטיסטית ברקמה / דוגמה עניין ביחס ההפניה (איור 3ד'). הפרויקט מופחתים במקרה זה התחיל עם רצף של RNA מרקמות germline של זכר ונקבה בוגרים זברה פינק, לקבל 10 מיליון זוגות קריאה של מכל מין. לשם קיצור, נתאר את העיבוד של הרצף השחלה בלבד, שבו תעתיקים 167,929 התקבלו על ידי דה נובו העצרת. השיטה גנומיקה מופחתים (BLASTn) שימש כדי לחסל את כל רצפי שתאמו את הגנום סומאטית שפורסמו12, אשר עזבו 5,060 התעתיקים המתאימים 598 חלבונים ייחודיים, המציין כי רבים של התרשימים היו noncoding. סנגר קריאות raw המשמש ליצירת מכלול ואז שימשו את הרמה הבאה של חיסור מאת tBLASTn, מניב חלבונים 78. אחד חיסור הסופי התבצע בעזרת RNA-seq raw קוראת מתוך lobule השמיעה13, אשר עזבו שמונה חלבונים. חלבונים אלה היו בורחים דרך NCBI nr הפיצוץ, שש של החלבונים היו ויראלי, אחד היה אזור חוזרות הציפורים, האחרון היה α-הצמד germline מוגבלת7 (איור 2B). במהלך תהליך זה, זוהו הגנים סומאטית 935 שלא נכללו בעבר הביאור הגנום כולו; כמה הראו הגברה qPCR אחיד על פני רקמות (איור 3א, 3B, ג 3). הגן α-SNAP אומתה להיות germline מוגבלת באמצעות qPCR, כי היא הייתה דלה ברקמת סומאטית ביחס testis DNA איפה זה היה נוכח רמות מקביל אקטין (איור 3ד').

מה יכול להשתבש. הבעיה העיקרית שחייבים להכריעו כאשר בשיטה זו היא להבטיח כי הרצף התייחסות נאותה משמש. רצף ההתייחסות הטובה ביותר מכמס, במובן הרחב ביותר, את המורכבות גנומית שבו מוטבע על הרצף של עניין (T). משמעות הדבר עשויה להיות כי רצף בצורות שונות; transcriptome, הרכבה, הנתונים הגולמיים או נתונים מתוך מחקרים רבים צריך לשמש גם הפניות (איור 1). במחקר זברה פינק, פיתחנו תחל RNA רצף נתונים; עם זאת, תחל לא תמיד עבד בשל נוכחותם של אינטרונים בין או בתוך אתרי קישור תחל ב- DNA. . בדקנו כל פריימר שנקבעו על ידי ה-PCR את הדנ א של testis DNA שמקודד את המטרה (T) והן את ההפניה (R), שהופך אותו פקד חיובי מתאימים. פריימר כשל בשלב זה מצריך התכנון ובדיקות של תחל חדש עד ערכה מתאימה מזוהה. החלת תקן החסרונות של שיטות מבוססות-PCR: הגברה תנאים חייבים להיות מוטב, הגברה ירידה לפרטים אושרה על-ידי בדיקה ו/או פקדים שיבוט, ואת תבנית לא חייבים להיות כלולים כל הניסויים. לקבלת מידע נוסף אודות מבחני qPCR, ראה22.

Figure 1
איור 1 . הגישה מופחתים iteratively יכול להסיר את מספר הפניות (R) להתאושש רק את היעד רצף של עניין (T) הכולל נתונים גנומית. רצפי הפניה של פרויקטים בודדים אינם יכולים לחפוף בדיוק בדרך זו, והוא עשוי לכלול נתונים (datasets) לא הצביע על הדמות. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 2
באיור 2שיטות חזותי. (א) מחזור מופחתים מפרטים טכניים. יכול להיות iterated המחזור כמה פעמים לפי הצורך, בכל פעם ניצול רצפי התייחסות ברורה, כדי להשיג את התוצאות הטובות ביותר. (ב) דוגמה ספציפית של מחזור מופחתים של צעדים ביצעו ב. בידרמן ואח 7, עם צעדים ספורים כמו A, ועם מספר רצפי שנותרו בכל שלב המוצג. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 3
איור 3 . נתוני לדוגמה כולל תוצאות שליליות וחיוביות תוצאות qPCR. (א) qPCR הדנ א הגנומי של CHD8, תוצאה שלילית. (ב) qPCR הדנ א הגנומי של DNMT1, תוצאה שלילית. (ג) Genomic DNA qPCR של CHD7, תוצאה שלילית. (ד) qPCR הדנ א הגנומי של NAPAG, המאשר נוכחות במיוחד testis ודוגמאות המחסור הכבד, שחלה ביחס אקטין, תוצאה חיובית. כל לוחות מציינים הממוצע ± סטיית התקן של שלוש מדידות. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

בעוד גנומיקה מופחתים הוא רב עוצמה, זה לא בגישה לשירי, המחייב התאמה אישית מספר השלבים החשובים, וכן בחירה זהירה של רצפי הפניה ודוגמאות מבחן. אם מכלול שאילתה באיכות ירודה, סינון צעדים אולי רק לבודד חפצים הרכבה. לכן, חשוב יסודי לאמת את מכלול דה נובו באמצעות פרוטוקול האימות המתאים לפרוייקט ספציפי. עבור ה-RNA-seq, הנחיות מסופקים על אתר טריניטי18 , ה-dna כלי כמו REAPR23 יכול לשמש. עוד צעד קריטי כשמשתמשים הפיצוץ הוא הבחירה של e-הערך המתאים, אשר יקבע החיסור יהיה רגוע או מחמירים. עם זאת, היפוך מתרחשת בשיטה: התאמה מחמירים יותר לבצע הפניה היא למעשה חיסור פחות מחמירים, כפי שאינו תואם רצפים הם לא יופחת. לפיכך, ערך גדול יותר (מחמירים פחות) e-אמור לשמש בפיצוץ חיסור מחמירים יותר. צעד חיוני הסופי של הפרוטוקול הוא הפניה הבחירה. ליעילות הגדול ההפניה צריכה להיות ככל הניתן; עם זאת, זה לא צריך להיות מושלם כי בדיקות qPCR מאשר אם רצפים הנותרים הם T או R, אם סינון נוסף הוא הכרחי. במהלך יישום הפרוטוקול, הפניות חדש עשוי לשמש צר יותר למטה הגנים לאימות. נציין כי לפעמים בשיטת תואמים עשויים להשתנות: עבור קבצי script מופחתים השלב האחרון אנחנו המשמשת את האלגוריתם BWA למיפוי קריאות raw על גבי הרצף שאילתה, ומשמש פיתון מותאם אישית לזיהוי רצפי שאילתה עם שאין התאמה קורא (איור 2B).

מגבלות של שיטה זו כוללים את הזמינות של רצף הפניה. לדוגמה, מאייר. ואח הערכה הגנום מיטוכונדריאלי של הדניסובי חדש; הם השתמשו אנושי, Denisovan רגשים ללכוד דנ א מיטוכונדריאלי, אשר וסודרו למפות התייחסות אנושית בגודל24. במקרה זה, היו לא-הפניית הנתונים הקיימים הגנום הגרעיני, כי החוקרים יכול לקבל המופחת נגד כדי להשיג את גנום מיטוכונדריאלי, המחייב את מיפוי קריאה אלטרנטיבית אסטרטגיה24. אהיה אבודה בכל מחוזות מיטוכונדריון הרומן ביחס ההפניה מיטוכונדריאלי האנושי diverged בהרחבה על ידי מיפוי קריאה. גנומיקה מופחתים מציעה גישה אפשר לקבל פחות מכפי מיפוי קריאה אבל הוא לא תמיד ישים בהתאם שאלת המחקר, במקרה זה רמות נמוכות של DNA עתיק מנעה את סוג רצף הכיסוי הנדרש (הרכבה דה נובו שלב 1 מתוך גנומיקה מופחתים).

טיהור פיזי מספק שיטה חלופית נוספת כדי גנומיקה מופחתים. טיהור של DNA או RNA משמשת לעתים קרובות בין כלורופלסט כל רצף הגנום מיטוכונדריאלי בגלל הגנום אבחון אלה הם הרבה יותר קטן מאשר הגנום הגרעיני25,26,27,28. האדם ושל אחרים קטן מיטוכונדריאלי הגנום יכול להיות מבודד על רצף באמצעות הגברה באמצעות שתי קבוצות פריימר ואחריו טיהור25. עם זאת, גנומיקה מופחתים עשוי להיות שימושי עבור מקרים שבו הגנום מיטוכונדריאלי גדולה באופן חריג, האתרים מחייב פריימר מתפצלת או לא יביא הגנום המלא. דוגמה לכך היא ב- ciliates, אשר יש גדול, מתבדרת, הגנום מיטוכונדריאלי ליניארי29. מיפוי הגנום הפניה אינה אפשרות מעשית עבור ciliates עקב סטייה גבוהה על פני מינים וחוסר homologs אפילו על-פני genuses30. באמצעות גנומיקה מופחתים, גנום מיטוכונדריאלי ciliate יכול להיות מבודדת, נותחו תוך מזעור הפוטנציאל של חסרים מקטעים של הגנום. באופן דומה, בעוד הגישה הרכבה של דה נובו שימש מכלול הגנום של כלורופלסט אשוחית סיטקה, הפער סגירה מעורבת השוואתי לקרוא מיפוי נגד השיפוצים לבן, פוטנציאל היכרות עם הטיה על אתרים אלה31.

בהתאם הפרויקט, גנומיקה מופחתים עשוי להציע זמן ועלות יתרונות ביחס גישות טיהור או מיפוי, תוך שהיא מציעה פחות הטיה בתהליך הגילוי. במצבים מסוימים, הרצף היעד לא יכול להיות בקלות מבודד כי זה ידוע לחלוטין, היא חיונית להישרדות תא (המיטוכונדריה), או גדול מדי כדי להפריד בין על ידי אלקטרופורזה בג'ל סטנדרטי. מבוסס על גודל טיהור electrophoretic ודורשת משמעותי חומר המוצא (אשר עשוי להיות יקר) תוך אופטימיזציה תנאים על ניסיונות מרובים. אלקטרופורזה בג'ל הדופק-שדה (PFGE) מאפשר הפרדה בין שברי DNA עד7 10 bp (10 Mb) אבל לוקח 2-3 ימים, כמויות גדולות של חומרים, ציוד מיוחד לפעמים שאינו זמין מסחרית32. בידרמן. et al., הרצף היחידה הידועה של כרומוזום מוגבלת germline היה noncoding חוזר7. כרומוזום זה הוא הגדול ביותר הציפור, למעלה מ- 100 מגה ב אורך10, טיהור היה בלתי אפשרי; לפיכך, גנומיקה מופחתים היה מסוגל לעשות מה שיטות אחרות יכול לא. בעידן הגנומי לעתים קרובות זול יותר ומהיר יותר רצף עכשיו, ולאחר סינון על-ידי מחשב אחר כך. מתן אפשרות הגילוי של רצפי ולחלוטין, גנומיקה מופחתים מנצל שילוב של גישות לבודד רצפים הרומן גם ללא רצף ההתייחסות מושלם.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

המחברים אין לחשוף.

Acknowledgments

המחברים להכיר מישל בידרמן, אליסה פדרסן, קולין. ג'יי Saldanha לסיוע שלהם עם הפרויקט גנומיקה זברה פינק בשלבים שונים. אנו גם להכיר יבגני Bisk עבור מחשוב ניהול המערכת אשכול ואת NIH גרנט 1K22CA184297 (ל J.R.B.) NIH NS 042767 (ל C.J.S).

Materials

Name Company Catalog Number Comments
Accustart II Taq DNA Polymerase Quanta Bio 95141
Blasic Local Alignment Search Tool (BLAST) https://github.com/trinityrnaseq/trinityrnaseq/wiki/Transcriptome-Assembly-Quality-Assessment
Bowtie 2 https://www.python.org/download/releases/2.7/
BWA-MEM v. 0.7.12 https://github.com/BenLangmead/bowtie2
Geneious https://blast.ncbi.nlm.nih.gov/Blast.cgi
PEAR v. 0.9.6 http://www.mybiosoftware.com/reptile-1-1-short-read-error-correction.html
Personal Computer Biomatters http://www.geneious.com/
PowerSYBR qPCR mix ThermoFisher 4367659
Python v. 2.7 https://sco.h-its.org/exelixis/web/software/pear/
Reptile v.1.1 https://alurulab.cc.gatech.edu/reptile
Stratagene Mx3005P Agilent Technologies 401456
TransDecoder v. 3.0.1 https://sourceforge.net/projects/bio-bwa/files/
Trinity v. 2.4.0 https://github.com/TransDecoder/TransDecoder/wiki

DOWNLOAD MATERIALS LIST

References

  1. Barh, D., et al. A Novel Comparative Genomics Analysis for Common Drug and Vaccine Targets in Corynebacterium pseudotuberculosis and other CMN Group of Human Pathogens. Chemical Biology & Drug Design. 78 (1), 73-84 (2011).
  2. Sarangi, A. N., Aggarwal, R., Rahman, Q., Trivedi, N. Subtractive Genomics Approach for in Silico Identification and Characterization of Novel Drug Targets in Neisseria Meningitides Serogroup B. Journal of Computer Science & Systems Biology. 2 (5), (2009).
  3. Kaur, N., et al. Identification of Druggable Targets for Acinetobacter baumannii Via Subtractive Genomics and Plausible Inhibitors for MurA and MurB. Applied Biochemistry and Biotechnology. 171 (2), 417-436 (2013).
  4. Rathi, B., Sarangi, A. N., Trivedi, N. Genome subtraction for novel target definition in Salmonella typhi. Bioinformation. 4 (4), 143-150 (2009).
  5. Epstein, J. H., et al. Identification of GBV-D, a Novel GB-like Flavivirus from Old World Frugivorous Bats (Pteropus giganteus) in Bangladesh. PLoS Pathogens. 6 (7), (2010).
  6. Kapoor, A., et al. Identification of Rodent Homologs of Hepatitis C Virus and Pegiviruses. MBio. 4 (2), (2013).
  7. Biederman, M. K., et al. Discovery of the First Germline-Restricted Gene by Subtractive Transcriptomic Analysis in the Zebra Finch, Taeniopygia guttata. Current Biology. 28 (10), 1620-1627 (2018).
  8. Readhead, B., et al. Multiscale Analysis of Independent Alzheimer's Cohorts Finds Disruption of Molecular, Genetic, and Clinical Networks by Human Herpesvirus. Neuron. 99, 1-19 (2018).
  9. Carroll, D., et al. The global virome project. Science. 359 (6378), 872-874 (2016).
  10. Pigozzi, M. I., Solari, A. J. Germ cell restriction and regular transmission of an accessory chromosome that mimics a sex body in the zebra finch. Taeniopygia guttata. Chromosome Research. 6, 105-113 (1998).
  11. Itoh, Y., Kampf, K., Pigozzi, M. I., Arnold, A. P. Molecular cloning and characterization of the germline-restricted chromosome sequence in the zebra finch. Chromosoma. 118, 527-536 (2009).
  12. Warren, W. C., et al. The genome of a songbird. Nature. 464, 757-762 (2010).
  13. Balakrishnan, C. N., Lin, Y. C., London, S. E., Clayton, D. F. RNAseq transcriptome analysis of male and female zebra finch cell lines. Genomics. 100, 363-369 (2012).
  14. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  15. Zhang, J., Kobert, K., Flouri, T., Stamatakis, A. PEAR: a fast and accurate Illumina Paired-End reAd mergeR. Bioinformatics. 30, 614-620 (2014).
  16. Yang, X., Dorman, K. S., Aluru, S. Reptile: representative tiling for short read error correction. Bioinformatics. 26, 2526-2533 (2010).
  17. MacManes, M. D., Eisen, M. B. Improving transcriptome assembly through error correction of high-throughput sequence reads. PeerJ. 1 (113), (2013).
  18. Grabherr, M. G., et al. Full-length transcriptome assembly from RNA-seq data without a reference genome. Nature Biotechnology. 29, 644-652 (2011).
  19. Li, H. Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM. arXiv. , (2013).
  20. Langmead, B., Salzberg, S. Fast gapped-read alignment with Bowtie 2. Nature Methods. 9, 357-359 (2012).
  21. Kearse, M., et al. Geneious Basic: an integrated and extendable desktop software platform for the organization and analysis of sequence data. Bioinformatics. 28 (12), 1647-1649 (2012).
  22. Peirson, S. N., Butler, J. N. Quantitative polymerase chain reaction. Methods in Molecular Biology. 362, 349-362 (2007).
  23. Hunt, M., Kikuchi, T., Sanders, M., Newbold, C., Berriman, M., Otto, T. D. REAPR citation: REAPR: a universal tool for genome assembly evaluation. Genome Biology. 14 (5), (2013).
  24. Meyer, M., et al. A mitochondrial genome sequence of a hominin from Sima de los Huesos. Nature. 505 (7483), 403-406 (2013).
  25. Gunnarsdóttir, E. D., Li, M., Bauchet, M., Finstermeier, K., Stoneking, M. High-throughput sequencing of complete human mtDNA genomes from the Philippines. Genome Research. 21 (1), 1-11 (2010).
  26. King, J. L., et al. High-quality and high-throughput massively parallel sequencing of the human mitochondrial genome using the Illumina MiSeq. Forensic Science International: Genetics. 12, 128-135 (2014).
  27. Yao, X., et al. The First Complete Chloroplast Genome Sequences in Actinidiaceae: Genome Structure and Comparative Analysis. Plos One. 10 (6), (2015).
  28. Zhang, Y., et al. The Complete Chloroplast Genome Sequences of Five Epimedium Species: Lights into Phylogenetic and Taxonomic Analyses. Frontiers in Plant Science. 7, (2016).
  29. Swart, E. C., et al. The Oxytricha trifallax Mitochondrial Genome. Genome Biologyogy and Evolution. 4 (2), 136-154 (2011).
  30. Barth, D., Berendonk, T. U. The mitochondrial genome sequence of the ciliate Paramecium caudatum reveals a shift in nucleotide composition and codon usage within the genus Paramecium. BMC Genomics. 12 (1), (2011).
  31. Coombe, L., et al. Assembly of the Complete Sitka Spruce Chloroplast Genome Using 10X Genomics' GemCode Sequencing Data. Plos One. 11 (9), (2016).
  32. Herschleb, J., Ananiev, G., Schwartz, D. C. Pulsed-field gel electrophoresis. Nature Protocols. 2 (3), 677-684 (2007).

Tags

גנטיקה גיליון 143 חיסור גנומית qPCR קריאה הפיצוץ פיתון מיפוי הרכבה דה נובו העיצוב תחל
גילוי רצף הרומן מאת גנומיקה מופחתים
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Asalone, K. C., Nelson, M. M.,More

Asalone, K. C., Nelson, M. M., Bracht, J. R. Novel Sequence Discovery by Subtractive Genomics. J. Vis. Exp. (143), e58877, doi:10.3791/58877 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter