הגנום MRI - משאב ציבורי עבור לימוד דפוסי בתוך רצף הדנ"א הגנומי

Biology
 

Summary

אנו מציגים את אתר האינטרנט הציבורי חישובית לניתוח רצפי הגנומי. הוא מזהה דפוסי רצף DNA שאינו אקראי עם קומפוזיציות שונות נוקלאוטיד. משאב זה גם מייצר רצפים אקראיים עם רמות שונות של מורכבות.

Cite this Article

Copy Citation | Download Citations | Reprints and Permissions

Prakash, A., Bechtel, J., Fedorov, A. Genomic MRI - a Public Resource for Studying Sequence Patterns within Genomic DNA. J. Vis. Exp. (51), e2663, doi:10.3791/2663 (2011).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

ללא קידוד אזורי הגנומי של אאוקריוטים מורכבים, כולל אזורים, אינטרונים intergenic, קטעים מתורגמים של אקסונים, הם מאוד לא אקראי בהרכב נוקלאוטיד שלהם מורכב פסיפס מורכב של דפוסים רצף. דפוסים אלה כוללים שנקרא Mid-Range (MRI) Inhomogeneity אזורים - רצפי נוקליאוטידים באורך 3-10 כי הם מועשרים בסיס שילוב מסוים או של בסיסים (למשל (G + T) עשיר, purine עשיר, וכו ' ). אזורים MRI קשורים מבנים DNA יוצא דופן (אי - B-טופס), כי לעתים קרובות מעורבים ברגולציה של ביטוי גנים, רקומבינציה, ותהליכים גנטיים אחרים (Fedorova & Fedorov 2010). קיומו של משוא פנים קיבעון חזק בתוך אזורים MRI נגד מוטציות נוטים להפחית inhomogeneity הרצף שלהם בנוסף תומך את הפונקציונליות ואת החשיבות של הרצפים גנומית (פראקאש et al. 2009).

כאן אנו מדגימים משאב זמין באינטרנט באופן חופשי - חבילת הגנום תוכנית MRI - (. בכטל et al 2008) תוכנן עבור ניתוח חישובית של רצפים גנומיים כדי למצוא ולאפיין דפוסי MRI שונים בתוכם. חבילה זו מאפשרת גם דור של רצפים אקראיים עם מאפיינים שונים ברמה של התכתבות עם רצפי DNA טבעי קלט. המטרה העיקרית של משאב זה היא להקל על בחינה של אזורים המכריע של ה-DNA הלא קידוד שעדיין נחקר כמעט ולהמתין חיפושי הכרה יסודית.

Protocol

כל התוכניות השתמשו בעיתון נכתב באמצעות perl, וכל דפי אינטרנט שנוצרו באמצעות PHP.

1. נקודת התחלה:

פתח את דף הבית של חבילה ברשת ה-MRI הגנום בבית http://mco321125.meduohio.edu/ ~ jbechtel / gmri /. משאב האינטרנט גם מספק הוראות / הסברים על התוכניות של "עזרה (How-to/README)" על הקישור, בעוד כל החומרים שפורסמו על אלגוריתמים MRI ו דומה הגנום המפורטות "קישורים למשאבים רלוונטיים" הקישור.

2. הכנה של רצף העלאת קלט (ים).

יצירת קובץ עם רצף FASTA בתבנית (ים) כדי להפעיל הפעלה ניתוח GMRI. כל רצף נוקליאוטידים בפורמט זה צריך להיות קדמו עם בשורה אחת מתחיל עם הדמות ">" המייצג מזהה, ואחריו באותה שורה על ידי תיאור קצר של רצף זה. רצפי נוקליאוטידים לניתוח GMRI מאפשרת גם דמויות כמו R, Y, N, X, וכו 'Hwever, לא, T, C, G תווים לא תטופל על ידי התוכנית יהיה לדלג. רצפים בהם אלמנטים חוזרים להיות "רעולי פנים" (הוחלף על ידי "N" S) יכול לשמש קלט. שים לב כי הם רצף תווים תלויית.

  1. בגין הפעלת GMRI על ידי לחיצה על כפתור "התחל או על חדש" בדף הבית הגנום ה-MRI. זה לוקח את המשתמש לדף שבו רצפי נוקליאוטידים ניתן להעלות.
  2. העתקה והדבקה בתבנית FASTA שלך רצפים או להעלות קובץ המכיל את רצפי מהמחשב המקומי באמצעות "בחר קובץ" כפתור.
  3. לחץ על "הפעלה חדשה להתחיל עם זה קובץ" כפתור. הודעת אישור יופיע מעל החלון קלט הקובע כי "רצף שלך נטען בהצלחה" אתה צריך גם לקבל אלפאנומריים "GMRI מזהה" [האתר קורא לזה "תווית מושב"] עבור ההפעלה שלך (למשל b16yMj), אשר ניתן להשתמש כדי לאחזר להמשיך ישיבה עד שבועיים לאחר השימוש הראשון.

הערה: מעתה את רצפי קלט מכונים "userfile".

3. קבל הפצה תדירות oligonucleotide של רצפים קלט (אופציונלי).

לחץ על הכרטיסייה "SRI Analyzer" (השורה העליונה) על מנת לקבל התפלגות של תדרים oligonucleotide עבור סט שלם של רצפי קלט. ראשי תיבות SRI מייצג inhomogeneity לטווח קצר. בנקודה זו, המשתמש יכול לציין את אורך oligonucleotides הגבוהה ביותר (למעלה מ - 2-9 נוקלאוטידים, ברירת המחדל של 6 לילות) עבור תדרים אשר יחושב. בחירה זו נעשית על ידי לחיצה על האפשרות הרצויה בתוך תיבת "גודל מקסימלי oligomer" הרשימה. ואז לחצו על "נתח קובץ" על מנת ליזום חישוב. ייצוג גס של הרכב רצף קלט יופיע מיד כטבלה קצר באמצע הדף אינטרנט להורדה כמו "userfile.comp.tbl". טבלה זו מייצגת רק את oligonucleotides הנפוץ ביותר ואת לפחות בתוך רצף קלט.

הטבלה כולה תדר עבור כל oligonucleotides אפשרי שנוצר כקובץ בשם "userfile.comp", אשר ניתן להשיג באמצעות "להוריד קובץ הרכב" הקישור.

הערה: SRI מנתח סופרת את מערכת שלמה של כל oligonucleotides חופפים.

4. יצירת רצפים אקראיים עם הרכב oligonucleotide זהה את רצפי קלט (אופציונלי).

(השלמת שלב 3 של הפרוטוקול נדרש למשימה זו).

  1. לחץ על הכרטיסייה "מחולל SRI" (השורה העליונה) לפתוח דף אינטרנט חדש שיוצר רצפים אקראיים. בחר את מספר דגימות של רצפים אקראיים להיות שנוצר באמצעות תיבת רשימה בדף אינטרנט זה. כל הקבצים הללו יכילו רצפים מדגם אקראי של מספר באותו אורך וככל רצפים תשומה "userfile". יתר על כן, אם רצף קלט שאינו מכיל, T, C, G או תווים, את רצף אקראי יהיה "N" זה בדיוק כמו העמדות ברצף קלט.
  2. בחר את אורך הארוכה oligonucleotides עבורו תדרים יהיה מקורב של רצפים אקראיים. זה יכול להיות נבחר על ידי בחירת האפשרות לרמת oligomer הרצוי (למשל, "4-מרס" במשך ארבע בסיס oligonucleotides) בטבלה במרכז המסך. זה יש לציין כאן כי רצפים אקראיים יכלול לא רק את התדרים משוער ברמה oligomer הנבחר, אלא גם את התדרים המקביל רמות oligomer קצר, כמו רצף קלט. תנודות קטנות oligonucleotideתדרים של קלט אקראי רצפים אפשריים עקב ההליך דגם מרקוב להחיל עבור הדור של רצפים אקראיים.
  3. הפעל את התוכנית על ידי לחיצה על "צור קובץ" כפתור. אם רצפי קלט גדולים זה יכול לקחת כמה דקות כדי ליצור רצפים אקראיים. לפיכך, המשתמש צריך להמתין עד כחול "הורד" הקישורים מופיעים בחלק התחתון של דף זה. מגדיר אקראי ממוקמים קבצים בעלי שמות כגון "userfile.randX_Y" כאשר X הוא מספר אקראי להגדיר את Y היא רמת oligomer נבחר (לדוגמא "userfile_rand2_4").

5. ניתוח Inhomogeneity אמצע טווח (MRI) של קלט רצפים אקראיים.

  1. לחץ על הכרטיסייה "MRI Analyzer" (השורה העליונה), אשר פותח דף אינטרנט חדש המנתח את inhomogeneity אמצע טווח של הרכב של רצפי נוקליאוטידים.
  2. בחר ברצף כדי להיות מנותח מן "קובץ לנתח את" תיבת הרשימה (בחירה בין רצף הקלט מגדיר שנוצר רצפים אקראיים יכול להתבצע כאן).
  3. בחר את סוג התוכן של ה-MRI כדי להיות מנותח באמצעות תיבת הרשימה המוצעת. (שבע אפשרויות תוכן זמינים: G + C, G + A, G + T, A; G, C, או ט ')
  4. בחר את אורך החלון עבורו רצפים עשירים בתוכן ותוכן דל תיבחן דרך "גודל חלון" תיבת הרשימה (ברירת המחדל היא 50 נוקלאוטידים; טווח תקף 30-1000).
  5. בחר את הסף העליון סף נמוך יותר עבור אזורים עשירים בתוכן ותוכן דל, בהתאמה. ספים אלו יכולה להיות מוגדרת במספר המדויק של נוקלאוטידים מסוים בחלון הנוכחי (שימוש באפשרות במספר בתיבת הרשימה) או בשיעור של נוקלאוטידים אלו בחלון (באמצעות האופציה על ידי אחוז)
  6. אחרי כל חמשת בחירות שנעשו (למשל: = "userfile" רצף; תוכן = GC: גודל החלון = 50; סף עליון = 35; סף תחתון = 15), להפעיל את התוכנית על ידי לחיצה על כפתור Analyze קובץ. התוכנית סורקת את כל רצפי מ לקלט הנבחר ברציפות. בכל שלב היא מקבלת קטע רצף הנוכחי עם אורך שווה לגודל חלון שצוין ומחשב אם המספר או האחוז של נוקלאוטידים של התוכן הנבחר הוא מעל הסף העליון או מתחת לסף התחתון. אם החלון אינו תואם או קריטריונים, החלון חופפים הבא (מוזז על ידי אחד נוקליאוטידים) נבחרה עבור ניתוח זהה. כאשר חלון שבו נמצא רצף עונה אחת הדרישות סף הרכב או עניים ועשירים בתוכן, התוכנית שומרת את הרצף של חלון זה בקובץ פלט ויוצר ספייק על הפלט הגרפי. אחרי זה, התוכנית קופצת לחלון שאינן חופפות הבא הסמוכים קורות תהליך הסריקה עד סוף הרצף הוא הגיע.
  7. לאחר השלמת התוכנית, קישור אל קובץ הפלט (עם השם "userfile_GC_50_35 .. 15", למשל לעיל) מופיע ייצוג גרפי של התוצאות מוצג באמצע של דף האינטרנט (ראה איור 1). בתערוכה זו גרפי רצפים כל קלט מן userfile הם בשרשור למחרוזת אחת כפי שהוצגו קו שחור אופקי על ציר ה-X, עם אורך kilobases (KB) כמוצג להלן. תוכן עשיר כל האזורים לאורך רצפים קלט מסומנים כחול קוצים "כלפי מעלה", וכן תוכן העניים באזורים כמו אדום קוצים "כלפי מטה". המספרים הכולל של חלונות תוכן עשיר תוכן עניים מוצגים parenthses במקרא בתחתית של נתון זה (32 ו -19, בהתאמה). הנתון משמש כדי להמחיש את השפע היחסי ואת הסדר של אזורי ה-MRI. בינתיים פרטים ספציפיים מוצגים קובץ הפלט (ראה איור 3). בקובץ זה, כל קטעי רצף נוקליאוטידים התואמים תוכן עשיר או עני קריטריונים הקואורדינטות שלהן זמינים למשתמש כרשימת על פי העמדות שלהם ברציפות לאורך קובץ הקלט.
  8. לאחר השלמת ניתוח MRI עבור רצף הנבחר משתמש יכול להתחיל תהליך חדש בתוך אותו דף אינטרנט ידי ביצוע שינויים פרמטרים ו / או קבצי קלט. לדוגמה, כדי לבחון את מדגם אקראי שנוצר בעבר # 1 עם הפרמטרים MRI זהה, המשתמש רק צריך לשנות את קובץ לנתח אפשרות לבחור את הקובץ "userfile_rand1_4", ואז ללחוץ על כפתור Analyze קובץ שוב. קובץ חדש תצוגה גרפית יחליף את הישן. התוצאות של בדיקות ודמויות כולם תחת כל "מפגש lable" (GMRI מזהה) יישמר ויהיה זמין במשך שבועיים מפעילות האחרון. כדי לשמור את התוצאות / התאנהures לצמיתות, המשתמש צריך לבחור את "קבצים להורדה" הכרטיסייה (השורה העליונה) ולהוריד את המושב כולו או קבצים בודדים, לפי הצורך.
  9. עם בדף זה Analyzer MRI אינטרנט שהמשתמש יכול ללמוד
    • (G + C) עשיר (A + T) עשיר האזורים
    • Purine (A + G) עשיר פירימידין (C + T) באזורים עשירים
    • Keto (G + T) עשיר אמינו (A + C) עשיר האזורים
    • עשיר, עני האזורים
    • G-G-עשירים לעניים האזורים
    • T-T-עשירים לעניים האזורים
    • C-C-עשירים לעניים האזורים
  10. המהדורה העדכנית ביותר של ה-MRI הגנום יש אפשרות חדשה לחקר אזורים עשירים עם purine (R) / פירימידין (Y) דפוסי לסירוגין שעשוי בצורת Z-DNA תצורות. נכון לעכשיו, אפשרות זו זמינה מהקישור "Z-DNA" וזה עובד על בסיס זהה באזורים אחרים MRI הנ"ל. המשתמש צריך לבחור סף עליון ותחתון למספר (ר"י + YR) dinucleotides חופפים בחלון הסריקה. התוכנית מייצרת פלט גרפי דומה קובץ של קטעי DNA מועשר מדולדל על ידי לסירוגין purines ו pyrimidines. המשוערת Z-DNA באזורים חייב להיות מועשר על ידי לסירוגין R / Y בסיסים (ראה סקירה F & F 2011).

6. תוכניות נוספות במסגרת חבילת ה-MRI הגנום (אופציונלי).

המשאב MRI הגנום יש גם שתי אפשרויות מתקדמות עבור הדור של רצפים אקראיים מאוד ספציפי. הם זמינים דרך "מחולל ה-MRI" ו "CDS Generator" כרטיסיות בשורה העליונה.

  1. גנרטור MRI יוצר רצפים אקראיים עם הרכב oligonucleotide זהה לזה של הקובץ קלט (בדומה SRI גנרטור). עם זאת, בנוסף, רצפים אקראיים לחקות דפוס MRI מסוים שצוין על ידי המשתמש. בתוך דף אינטרנט זה המשתמש צריך לציין מתיבת רשימה דפוס MRI בפרט להיות חיקה. תיבת הרשימה מכילה את כל תבניות נבדקו בפגישה זו על ידי בדיקת MRI מנתח (למשל "userfile_GC_50_35 .. 15"). רצף אקראי שנוצר עם אפשרות זו תהיה oligonucleotide הרכב זהה לזה של הקובץ קלט שנבחרו גם אותו GC-עשיר, עני דפוסי כמו לראות "userfile_GC_50_35 .. 15".
  2. CDS גנרטור משמש אקראיות של רצפי חלבון קידוד. שומרת על אותו רצף חומצות אמינו כמו זה מקודד על ידי קלט המשתמש שצוין. בנוסף התוכנית שומרת על קודון אותו di-קודון הטיות כמפורט בטבלה משתמש נבחר קלט. הגרסה המקוונת של הגנרטור CDS מקבל גם רצף חלבון כקלט. כל האפשרויות האחרות של התוכנית מוצעות רק דרך עצמאית סקריפטים Perl זמינה להורדה מדף הגנום העיקרי MRI האינטרנט.

7. נציג תוצאות

פרוטוקול זה מאפשר למשתמש ללמוד inhomogeneity ההלחנה של רצפי נוקליאוטידים. חשוב לציין, הוא גם תומך דור של מגוון רחב של רצפים אקראיים עם הרכב oligonucleotide קירוב של רצפי קלט. בדרך כלל, רצפי הגנום של אאוקריוטים מורכבים אינם הומוגניים בהרכב, אלא מייצגים פסיפס המורכב מקטעי רצף מועשר על ידי נוקלאוטידים מסוים (לדוגמה, purine עשיר, (G + T) עשיר, (A + T) עשיר, וכו '). דפוסים אלה בקנה מידה אמצע טווח (3-10 נ"ב) הם דמיינו ידי פלט גרפי של מנתח MRI שמראה שנבחרו תוכן עשיר מגזרים כמו קוצים כחול העליון תוכן מגזרים עניים כמו קוצים האדום התחתון (ראה איורים 1 ו -2). בדרך כלל, מספר כל האזורים תוכן עשיר תוכן עניים ברצף הטבעי (איור 1) נמצא על סדר פעמים גבוה יותר מאשר מספר את אותם סוגי אזורים רצפים אקראיים המתאים (איור 2) בעל oligonucleotide אותו הרכב. אלה קטעים ברצף עם inhomogeneity אמצע טווח בהרכב נוקלאוטיד עשוי לעניין למשתמש. הם זמינים קבצים הגנום פלט MRI לחקירה נוספת.

איור 1
באיור 1. דוגמה הפלט מנתח MRI הגרפי משלב 5.7. התוצאות הושגו על מדגם של 44 אינטרונים האדם. ברים כחול מייצגים עמדות GC-אזורים עשירים לאורך אינטרונים אלה. ברים האדום מייצג GC-לעניים (או עשירים) MRI אזורים. ציר y מכיל סף עליון ותחתון עבור סוג תוכן מסוים.

איור 2
איור 2. MRI הפלט Analyzer עבור רצף אקראי "userfile.rand1_4".
Graphical ייצוג MRI בתוך רצף אקראי באמצעות תוכנית גנרטור SRI.

איור 3
איור 3. דוגמה בתחילת קובץ פלט טקסטואלי מתוך מנתח MRI.
רצפים כל תוכן עשיר תוכן עניים זוהה על ידי תוכנית מוצגים בעמודה (הרביעי) האחרון. המיקומים היחסיים שלהם, הנמדד במספר חלונות, מוצגים בעמודה הראשונה. העמודות השנייה והשלישית הם אינדיקטורים עבור אזורים עשירים בתוכן ותוכן דל, בהתאמה.

Discussion

אזורים עם הרכב נוקלאוטיד הומוגניות על אמצע טווח קשקשים (3-10 נוקלאוטידים) הם גדותי בגנומים של אאוקריוטים מורכבים יכולים להימצא בכל מקום (אזורים intergenic, אינטרונים, אזורי מתורגמת של אקסונים, אלמנטים חוזרים). אזורים אלו קשורים לעיתים קרובות עם תצורות ה-DNA יוצא דופן. למשל, רצפים purine-/pyrimidine-rich נוטים ליצור וטריפלקסים DNA (H-DNA); רצפים לסירוגין purine / פירימידין בסיסים הקשורים Z-DNA תצורות: (G + C) עשיר האזורים התערוכה מומים מבניים ב-B הדנ"א יכול להיות מועדים מחשוף עמוד השדרה; (A + T) עשיר האזורים עלול ליצור מבנה יוצא דופן - ה-DNA ההתרה אלמנט; וכו '(נבדקה על ידי Fedorov & Fedorova 2010). חלק מאותם אמצע טווח דפוסים (למשל (G + T) עשיר אזורים) נחקרות בקושי ועדיין מחכים חיפושי הכרה יסודית. המטרה העיקרית של משאב אינטרנט MRI הגנום שלנו היא לסייע למשתמשים זיהוי של אזורים אלה MRI לניתוח ניסיוני נוסף שלהם לחקירה של פונקציות אפשרי שלהם. הידע של אזורים MRI יכול להיות משולב בתוך ולשפר את הדור החדש של תכניות מנבא גן (שפרד 2010) ולקדם את ההבנה שלנו של הגנום פונקציות ומאפיינים.

Disclosures

אין ניגודי אינטרסים הכריז.

Acknowledgments

אנחנו אסירי תודה על סמואל שפרד, פיטר Bazeley, וג'ון דיוויד בל לניהול של דפי אינטרנט הגנום MRI. עבודה זו נתמכה על ידי הלאומית למדע "חקירת תפקידים אינטרון הסלולר" קרן הפרס קריירה [מספר מענק MCB-0643542].

Materials

Name Company Catalog Number Comments
Computer with Internet
Files with nucleotide sequences for examination

DOWNLOAD MATERIALS LIST

References

  1. Bechtel, J. M., Wittenschlaeger, T., Dwyer, T., Song, J., Arunachalam, S., Ramakrishnan, S. K., Shepard, S., Fedorov, A. Genomic mid-range inhomogeneity correlates with an abundance of RNA secondary structures. BMC Genomics. 9, 284-284 (2008).
  2. Prakash, A., Shepard, S., Mileyeva-Biebesheimer, O., He, J., Hart, B., Chen, M., Amarachiniha, S., Bechtel, J., Fedorov, A. Molecular forces shaping human genomic sequence at mid-range scales. BMC Genomics. 10, 513-513 (2009).
  3. Fedorov, A., Fedorova, L. Chapter 3: An Intricate Mosaic of Genomic Patterns at Mid-range Scale. Advances in Genomic Sequence Analysis and Pattern Discovery. 65-91 (2010).
  4. Shepard, S. S. Chapter 4: Binary-abstracted Markov models and their application to sequence classificatio. The characterization and utilization of middle-range sequence patterns within human genome [dissertation]. The University of Toledo. 57-157 (2010).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Usage Statistics