Method Article

رواية النظرية الافتراضية تغيير نقطة حسابي لتحليل الجينوم-اسعة من أنواع البيانات المتنوعة ChIPseq

DOI:

10.3791/4273

December 10th, 2012

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

تغيير وجهة نظرنا النظرية الافتراضية (BCP) خوارزمية يستند دولة من بين الفن النمذجة التقدم في التغيير عبر نقاط نماذج ماركوف المخفية ويطبقها على لونين مناعي التسلسل (ChIPseq) تحليل البيانات. BCP يؤدي جيدا في كل أنواع البيانات واسعة النطاق والمنقط، ولكن تتفوق في تحديد بدقة قوية والجزر استنساخه من تخصيب هيستون منتشر.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

ChIPseq هو أسلوب يستخدم على نطاق واسع للتحقيق في البروتين DNA التفاعلات. يتم إنشاء ملفات تعريف الكثافة قراءة باستخدام التسلسل التالي من البروتين DNA محددة وقصيرة محاذاة يقرأ إلى الجينوم مرجعية. وكشف مناطق التخصيب والقمم، والتي تختلف في كثير من الأحيان بشكل كبير في الشكل، اعتمادا على البروتين الهدف 1. على سبيل المثال، غالبا ما تربط عوامل النسخ في موقع وبطريقة تسلسل معين وتميل إلى إنتاج الذروة نقطي، بينما هي تعديلات بسيطة أكثر انتشارا وتتميز الجزر، واسعة الانتشار من تخصيب 2. تحديد هذه المناطق بشكل موثوق كان محور عملنا.

استخدمت خوارزميات لتحليل البيانات ChIPseq منهجيات مختلفة، من الاستدلال 3-5 على نماذج أكثر صرامة الإحصائية، على سبيل المثال نماذج ماركوف المخفية (HMMs) 6-8. سعينا إلى حل تقلل من ضرورة يصعب تحديد والمخصصة المعلمات التي غالبا ماتنازلات القرار ويقلل من قابليتها للاستخدام بديهية من الأداة. فيما يتعلق HMM القائم على الأساليب، ونحن تهدف للحد من إجراءات تقدير المعلمة وبسيطة، والتصنيفات الدولة محدودة التي تستخدم في كثير من الأحيان.

بالإضافة إلى ذلك، تحليل البيانات التقليدية ChIPseq ينطوي التصنيف من المتوقع قراءة ملامح كثافة نقطية أو إما منتشر ثم طلب بعد ذلك الأداة المناسبة. نحن تهدف إلى زيادة الحاجة إلى استبدال هذين النموذجين متميزة مع نموذج واحد أكثر تنوعا، والتي يمكن أن تعالج باقتدار طائفة كاملة من أنواع البيانات.

لتحقيق هذه الأهداف، ونحن لأول مرة بناء إطار إحصائي أن غرار طبيعي ChIPseq هياكل البيانات باستخدام مسبقا في طليعة HMMs والتي تستخدم فقط الصيغ الصريحة، والابتكار حاسما لمزايا أدائها. نماذج الكشف عن مجريات الأمور أكثر تعقيدا بعد ذلك، لدينا تسع دول HMM مخفي لا حصر له من خلالالنظرية الافتراضية النموذج. طبقنا لتحديد نقاط تغيير معقول في كثافة القراءة، التي تحدد مزيد من شرائح تخصيب اليورانيوم. كشف تحليلنا كيف لنا نقطة تغيير النظرية الافتراضية (BCP) خوارزمية كان التعقيد يشهد انخفاض الحسابية من قبل وقت التشغيل مختصرة وأثر الذاكرة. تم تطبيق الخوارزمية بنجاح BCP إلى كل من الذروة ونقطي منتشر تحديد الجزيرة مع دقة قوية ومحدودة المعلمات المعرفة من قبل المستخدم. هذا يتضح كلا من براعة وسهولة الاستخدام. وبناء على ذلك، فإننا نعتقد أنه يمكن تنفيذها بسهولة في مدى واسع من أنواع البيانات والمستخدمين النهائيين على نحو تتم مقارنة بسهولة ويتناقض، مما يجعلها أداة عظيمة لتحليل البيانات ChIPseq التي يمكن أن تساعد في التعاون وتأييد بين المجموعات البحثية. هنا، علينا أن نبرهن تطبيق BCP إلى عامل النسخ الموجودة والبيانات 10،11 اللاجينية 12 إلى توضيح فائدتها.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. إعداد ملفات الإدخال لتحليل BCP

  1. محاذاة قصيرة التسلسل يقرأ المنتجة من أشواط (رقاقة والمكتبات المدخلات) إلى الجينوم مرجعية مناسبة باستخدام المحاذاة المفضل قراءة قصيرة البرمجيات. ينبغي تحويل المواقع تعيينها إلى 6 بيانات العمود الموسعة متصفح (BED) شكل 13 (UCSC متصفح الجينوم، http://genome.ucsc.edu/ )، وهو خط المفصول في قراءة معين مما يدل على كروموسوم معين، تبدأ الموقف (0-إلى)، نهاية الموقف (نصف مفتوحة)، وقراءة الاسم ونقاط (اختياري)، وحبلا.

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

BCP تتفوق في تحديد مناطق واسعة في تخصيب تعديل البيانات هيستون. كنقطة مرجعية، ونحن في السابق مقارنة نتائجنا لتلك التي SICER أداة القائمة التي أثبتت أداء قويا. لتوضيح مزايا أفضل BCP، ودرسنا على تعديل هيستون التي تم دراستها بشكل جيد لإرساء أساس لتقييم معدلات النجاح. ومع وضع هذا في الاعتبار، ونحن ثم تحليلها H3K36me3، منذ فقد تبين أن أضم بقوة مع الهيئات الجينات المحولة بنشاط (الشكل 1). في المقابل، قد H3K36me3 أيضا ثبت أن تكون حصرية المتبادل لعلامات H3K27m.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

شرعنا في تطوير نموذج لتحليل البيانات التي يمكن أن ChIPseq تحديد كل منقط ومنتشر بشكل جيد على قدم المساواة هياكل البيانات. حتى الآن، كانت مناطق التخصيب، ولا سيما المناطق المنتشر، والتي تعكس حجم التوقع يفترض من جزيرة كبيرة ويصعب التعرف عليها. لمعالجة هذه المشاكل، ونحن استخدام التقدم في تكنولوجيا أحدث HMM، التي تمتلك العديد من المزايا أكثر النماذج القائمة والكشف عن مجريات الأمور HMMs أقل المبتكرة.

نموذجنا يجعل من است.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

الإعلان عن أي تضارب في المصالح.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

STARR مؤسسة جائزة (MQZ)، NIH منحة ES017166 (MQZ)، NSF منحة DMS0906593 (HX).

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
اسم كاشف شركة كتالوج رقم التعليقات (اختياري)
لينكس على أساس محطة العمل

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Park, P. J. ChIP-seq: advantages and challenges of a maturing technology. Nat. Rev. Genet. 10, 669-680 (2009).
  2. Barski, A., et al. High-resolution profiling of histone methylations in the human genome. Cell. 129, 823-837 (2007).
  3. Zhang, Y., ....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Bayesian Change Point AlgorithmChIPseq Data AnalysisHidden Markov ModelsGenome wide EnrichmentHistone Modification IdentificationTranscription Factor BindingPoisson Distribution ModelingPosterior Mean DensityEnriched Region DetectionNext Generation Sequencing

Related Articles