Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

تحديد احتمال الإمراضية متغير باستخدام تحليل الإشارات إلى الضجيج مستوى الأحماض الأمينية للتنوع الوراثي

Published: January 16, 2019 doi: 10.3791/58907

Summary

يحدد تحليل الإشارات إلى الضجيج من الأحماض الأمينية-مستوى انتشار التنوع الوراثي في موضع معين من الأحماض الأمينية طبعت على خلفية التنوع الوراثي لعدد معين من السكان. وهذا يسمح لتحديد الخيار "النقاط الساخنة" ضمن تسلسل بروتين (الإشارة) التي ترتفع وتيرة المتغيرات نادرة وجدت في عدد سكان (الضوضاء).

Abstract

لقد ولدت التقدم في التكلفة والسرعة للتسلسل الوراثية الجيل القادم انفجار عزمي كله السريرية واختبار الجينوم كله. في حين أن هذا قد أدى إلى زيادة تحديد الطفرات المسببة للأمراض المحتملة المرتبطة المتلازمات الوراثية، فإنه أيضا زاد زيادة كبيرة العدد المناسبة العثور على المتغيرات الجينية ذات أهمية غير معروفة (فوس). تحديد الأهمية السريرية لهذه المتغيرات تحديا كبيرا للعلماء والأطباء. نهج للمساعدة في تحديد احتمالات الإمراضية تحليل إشارة إلى الضوضاء على مستوى تسلسل البروتين. ويصف هذا البروتوكول وسيلة لتحليل الإشارات إلى الضجيج مستوى الأحماض الأمينية أن روافع تردد متغير في كل موضع من الأحماض الأمينية من البروتين مع طبولوجيا البروتين المعروفة لتحديد مجالات التسلسل الأساسي مع احتمال ارتفاع باثولوجي التباين (بالنسبة إلى السكان "الخلفية" التباين). هذا الأسلوب يمكن تحديد موقع بقايا الأحماض الأمينية "النقاط الساخنة" من إشارة مرضية عالية، والتي يمكن استخدامها لتحسين وزن فوس التشخيص مثل تلك التي حددها الوراثية الجيل القادم اختبار.

Introduction

ثورة التحسن السريع في منصات التسلسل الجيني بإمكانية الوصول ودور علم الوراثة في الطب. مرة واحدة تنحصر في مورثة واحدة أو عدد قليل من الجينات، خفض التكلفة وزيادة سرعة جيل التالي التسلسل الجيني قد أدى الروتينية تسلسل الجينوم برمتها الترميز تسلسل (تسلسل عزمي كله، ويس) و (الجينوم الكامل تسلسل الجينوم كله، WGS) في الإعداد السريرية. ويس والأفرقة العاملة قد استخدمت كثيرا في الإعداد لأمراض خطيرة حديثي الولادة والأطفال مع إيلاء اهتمام لمتلازمة وراثية حيث أنها أداة تشخيص ثبت أنه يمكن تغيير الإدارة السريرية1،2. في حين أن هذا قد أدى إلى زيادة تحديد الطفرات المسببة للأمراض المحتملة المرتبطة المتلازمات الوراثية، زاد زيادة كبيرة أيضا العدد من المتغيرات الجينية وبالمناسبة وجدت، أو نتائج إيجابية غير متوقعة، والتشخيص غير معروف أهمية (فوس). في حين أن بعض هذه المتغيرات تجاهلها ولا يبلغ عنها، المتغيرات إضفاء الطابع المحلي على غالباً ما ترد الجينات المرتبطة بأمراض قاتلة أو المهووسين عاليا. وتوصي المبادئ التوجيهية الحالية الإبلاغ عن متغيرات عرضية وجدت في الجينات المحددة التي قد تكون ذات فائدة طبية للمرضى، بما في ذلك الجينات المرتبطة بتطور الأمراض مؤهبة موت القلب المفاجئ مثل القلب و تشانيلوباثيس3. على الرغم من أن هذه التوصية صمم للقبض على الأفراد المعرضين لخطر مرض مؤهبة SCD، حساسية الكشف عن البديل يتجاوز خصوصية. وهذا ينعكس في عدد متزايد من فوس وحددت المتغيرات المناسبة مع أداة تشخيصية غير واضحة أن تتجاوز وتيرة الأمراض كل منهما في معين من سكان4. هو واحد من هذه الأمراض، طويلة متلازمة كيو تي (LQTS)، المتعارف عليه تشانيلوباثي القلب الناجمة عن الطفرات إضفاء الطابع المحلي على الجينات التي ترميز قنوات أيون القلب، أو قناة تتفاعل البروتينات، مما أدى إلى تأخر repolarization القلب5. Repolarization تأخر هذا، ينظر إلى جانب فاصل كيو تي مطولة في يستريح رسم القلب، يؤدي نزعة كهربائية لعدم انتظام ضربات البطين قاتلة مثل torsades de pointes. في حين قد تم ربط عدد من الجينات لتطور هذا المرض، الطفرات في KCNQ1-ترميز أنا البوتاسيومKs قناة (KCNQ1, Kv7.1) هو السبب في لقتس نوع 1 وتستخدم كمثال أدناه6. توضح التعقيد في التفسير البديل، كان وجود متغيرات نادرة في الجينات المرتبطة لقتس، ما يسمى "التباين الوراثي الخلفية" هو موضح سابقا7،8.

بالإضافة إلى قواعد البيانات الكبيرة على غرار خلاصة وافية من المتغيرات المسببة للأمراض المعروفة، توجد عدة استراتيجيات للتنبؤ بتأثير المتغيرات المختلفة سوف تنتج. ويستند بعض الخوارزميات، مثل التدقيق و 2 بوليفين، والتي يمكن تصفية عدد كبير من المتغيرات غير مترادفين رواية للتنبؤ ديليتيريوسنيس9،10. وعلى الرغم من استخدام واسع النطاق لهذه الأدوات، حدود نوعية منخفضة قابليتها للتطبيق عندما يتعلق الأمر "استدعاء" السريرية فوس11. تحليل "إشارة إلى الضوضاء" هو أداة التي تحدد احتمال متغير يجري المرتبطة بالمرض استناداً إلى تكرار الاختلاف باثولوجي المعروف في المكان المعني تطبيع ضد الاختلاف الجيني نادرة من عدد سكان. المتغيرات إضفاء الطابع المحلي على المكاني الوراثية حيث يوجد انتشار المرتفع للطفرات المرتبطة بالمرض مقارنة المستندة إلى السكان التباين، ارتفاع إشارات إلى ضجيج، من المرجح أن تكون مرتبطة بالمرض أنفسهم. متغيرات أخرى، نادرة العثور على الترجمة المناسبة لجينات بتردد عالي من المتغيرات السكانية نادرة مقارنة بالمرتبطة بمرض التردد، انخفاض إشارات إلى ضجيج، قد تكون أقل احتمالاً لأن تكون مرتبطة بالمرض. وقد تجلى الأداة التشخيصية لتحليل الإشارات إلى الضجيج في أحدث المبادئ التوجيهية للاختبار الجيني للقلب وتشانيلوباثيس؛ بيد أنها استخدمت فقط على مستوى الجينات كاملة أو مجال معين مستوى12. في الآونة الأخيرة، ونظرا لزيادة توافر المتغيرات باثولوجي (المرض قواعد البيانات، ودراسات الأتراب في الأدب) ومتغيرات التحكم المستندة إلى السكان (اتحاد التجميع عزمي، إيزاك وقاعدة التجميع الجينوم، جنوماد13)، وهذا طبق لمواقف الأحماض الأمينية الفردية ضمن التسلسل الرئيسي للبروتين. تحليل الإشارات إلى الضجيج مستوى الأحماض الأمينية قد أثبتت أنها مفيدة في تصنيف المتغيرات المناسبة التي تم تحديدها في الجينات المرتبطة لقتس كاحتمال الاختلاف الجيني "الخلفية" بدلاً من المرتبطة بالمرض. بين الجينات الرئيسية الثلاثة المرتبطة لقتس، بما في ذلك KCNQ1، تفتقر هذه المتغيرات التي تم تحديدها بالمناسبة نسب هامة في إشارة إلى الضوضاء، مما يوحي بأن تواتر هذه المتغيرات في المواقف الفردية من الأحماض الأمينية تعكس نادرة تباين السكان بدلاً من الطفرات المرتبطة بالمرض. وعلاوة على ذلك، عندما كان مضافين مخطط المجال الخاصة بالبروتين ضد المناطق عالية إشارة إلى الضوضاء، وباثولوجي الطفرات "النقاط الساخنة" مترجمة إلى المجالات الوظيفية الرئيسية ل البروتينات14. ويبشر هذا المنهجية في تحديد 1) احتمال البديل هو المرض أو السكان المرتبطة و 2) تحديد مجالات وظيفية حرجة رواية بروتين المرتبطة بالأمراض التي تصيب البشر.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. تحديد الجينات و Isoform الوصلة المحددة للفائدة

ملاحظة: هنا، نحن شرح استخدام انسيمبل15 لتحديد تسلسل توافق الآراء لجينات الفائدة التي ترتبط بالآلية المرضية لهذا مرض الاهتمام (أي KCNQ1 من الطفرات المرتبطة لقتس). وتشمل بدائل انسيمبل ريفسيق عن طريق المركز الوطني لمعلومات التكنولوجيا الحيوية (نكبي)16 ، وجامعة كاليفورنيا، "سانتا كروز" (التسخن) "المتصفح المجين البشري"17 (انظر الجدول للمواد).

  1. في الصفحة الرئيسية انسيمبل، حدد الأنواع (أي البشرية) في القائمة المنسدلة، وإدخال جينات اختصار الفائدة في هذا المجال (أي KCNQ1). انقر فوق "انتقال"
  2. حدد الارتباط المطابق للجينات للفائدة (أي "KCNQ1 (الجينات البشرية)"
  3. حدد الارتباط المقابلة لنسخة معرف تهم تهم من الجدول "نسخة" (أي ENST00000155840.10 ترانسكريبتيد، NM_000218 [نسخة الحمض النووي الريبي]، NP_000209 [البروتين المنتج لنسخة الحمض النووي الريبي]).
    ملاحظة: مطلوب مراجعة للأدبيات ذات الصلة لضمان تحديد تسلسل توافق النسخة الصحيحة.
  4. ملاحظة خاصة بنسخة شمال البحر الأبيض المتوسط والتي أرستها أرقام التعريف للرجوع إليها في المستقبل في العمود "ريفسيق" في الجدول "نسخة".
  5. حدد الارتباط المرتبطة برقم معرف NP إلى فتح صفحة جديدة من قاعدة البيانات "نكبي البروتين".
  6. قم بالتمرير إلى أسفل إلى المقطع "الأصل" للحصول على تسلسل البروتين (الأولية) لنسخة الجين من الفائدة.
  7. قم بالتمرير إلى المقطع "ميزات" للحصول على قائمة بالميزات البروتين (المجالات الوظيفية، المجالات الملزمة، ومواقع التعديل بوستترانسلاشونال).
    ملاحظة: يمكنك أيضا الحصول على هذه المعلومات عن طريق قاعدة البيانات "نكبي البروتين" أو من المصادر الأولية في الأدب. سيناقش هذا الأمر كذلك في الخطوة 5.

2-إنشاء قاعدة البديل الوراثية التجريبية ("إشارة")

ملاحظة: هنا، نحن توضح كيفية إنشاء قاعدة بيانات من المتغيرات المرتبطة بالمرض في الجينات للفائدة مع تواتر المتغيرات المرتبطة بالمرض بين الأفراد بهذا مرض الاهتمام. قاعدة البيانات هذه يمكن أن تتخذ أشكالاً عديدة، ويمثل "إشارة" (النمط الظاهري-إيجابية الاختلاف الجيني) التي سيتم تطبيع ضد قاعدة متغير عنصر التحكم. وهذا يمكن أن تتضمن متغيرات 1) المرتبطة بالمرض للمقارنة ضد فوس فوس رواية مجالات وظيفية من البروتين و/أو 2) فوس، بما في ذلك التعرف على المناسبة، لمقارنة المتغيرات المرتبطة بالمرض لتحديد احتمال تحديد القدرة الإمراضية. وسوف تعرض المتغيرات المرتبطة بالمرض في KCNQ1 للتوضيح؛ ومع ذلك، الأسلوب هو نفسه بالنسبة تحليل فوس المناسبة المحددة أو أي مجموعة أخرى من المتغيرات التجريبية.

  1. تحديد cohort(s) من الحالات مؤشر/ذات غير صلة بهذا مرض الاهتمام الذي كان جينوتيبيد شاملة لجميع ذات الجينات للفائدة (أي دراسة تحدد 24 ذات غير صلة استضافة المتغيرات في KCNQ1 من أصل 200 الأفراد مع لقتس الذين تعرضوا للاستجواب KCNQ1 الوراثية).
    ملاحظة: يمكن تحديد هذه الأفواج من الأدب، من التحليل الجيني تجريبية، أو مزيج من كليهما.
    1. استبعاد الدراسات التي لا تستند إلى الفوج (أي تقرير حالة تصف الطفرات الإيجابية فرد واحد)، لا توفر العدد الإجمالي للأفراد جينوتيبيد للجينات للفائدة، أو غير تحليل شامل وراثيا (الجينات أي لفحص الوراثي "مستهدفة" لالا KCNQ1 exons 2-4) هذه يحول دون حساب تواتر متغير.
    2. وتشمل الأفراد الذين تكون ذات غير صلة، واستبعاد الأفراد ذات الصلة كهذا يمكن تقدير الإفراط ترددات البديل (أي دراسة تحدد 4 الأفراد لا علاقة لها مع الطفرات KCNQ1 في مجموعة من 20 مريضا مع لقتس. واحدة من هذه ذات جزء من عائلة مع 5 أهالي الطفرات الإيجابية الأخرى. استبعاد جميع أفراد الأسرة، وتشمل فقط ذات غير صلة 4).
  2. تجميع جميع المتغيرات الجينية التجريبية الموجودة في cohort(s) التي تم تحديدها
    1. تعيين تسميات يحتوي على البرية من نوع من الأحماض الأمينية، والموقف من الأحماض الأمينية، والأحماض الأمينية البديل (أي ألانين في الحمض الأميني رقم 212 تغيرت إلى فالين، Ala212Val أو A212V). واحد مثل هذا النوع من التسمية يتضح في الشكل 1.
    2. وتؤكد أن التسميات البديل لجميع المتغيرات الجينية تجريبي يستند إلى نفس نسخة الجين إشارة كما ذكر في الخطوة 1، 4. إذا لم يتم المشروح التجريبية المتغيرات الجينية في نسخة الجين المرجع نفسه، ثم رينوتاتي الموقف البديل لنسخة المراجع استخدام محاذاة النص (راجع الخطوة 1، 2)
  3. استبعاد المتغيرات التي ليست قابلة للتطبيق حسب المسألة التي يجري استكشافها.
    1. تسلسل المتغيرات استبعاد إضفاء الطابع المحلي للمناطق غير ترميز الجينوم أو المتغيرات التي لا تغير من البروتين مثل المتغيرات مترادفين، إينترونيك، والمنطقة غير مترجمة 5 'أو 3' [UTR]، ومنطقة إينتيرجينيك المتغيرات (أي المبلغ عنها باثولوجي متغير في KCNQ1 التي يموضع إلى 5 ' UTR منطقة الترميز ستستبعد كما من المتوقع عدم تغيير تسلسل البروتين).
    2. استبعاد المتغيرات التي لا تفي بمعايير الاشتمال للدراسة. للمتغيرات المرتبطة بالمرض، وهذا يشمل المتغيرات التي لم تعد تعتبر مرضية.
      1. التأكد من أن كل متغير يعتبر حاليا المسببة للأمراض، يرجح أن المسببة للأمراض، أو على الأقل غير حميدة، بالإسناد الترافقي المتغيرات مع قاعدة البيانات كلينفار (انظر الجدول للمواد).
      2. إدخال الجينات والبديل من الفائدة في حقل البحث كلينفار (أي KCNQ1 Y111C)، حدد "بحث"
      3. تحديد البديل الاهتمام ضمن العمود "التباين/موقع".
      4. لاحظ تفسير توافق الإمراضية تحت عمود "أهمية سريرية" (أي KCNQ1-Y111C يتم تفسيرها كما "الممرضة").
      5. وتشمل المتغيرات التي "المحتمل المسببة للمرض" أو "المسببة للمرض".
      6. تتضمن المتغيرات مع التسميات "التفسيرات المتضاربة للقدرة الإمراضية،" "غير مؤكدة أهمية،" أو عندما يتوفر لا سجل ("لم ترد") إذا اقتضى الأمر ذلك بالدراسة.
      7. استبعاد المتغيرات التي سميت "يحتمل حميدة" (أي KCNQ1-A62T).
  4. حساب تردد اليل طفيفة (ماف) لكل موقف متغير تجريبي.
    1. حساب كيف أي الآليلات كانت إيجابية بالنسبة لكل متغير منها (أي إذا KCNQ1-Y111C يتم العثور على الطفرات متخالف في الأفراد لا علاقة لها 2، عدد الآليلات البديل الإيجابي هو 2).
    2. حساب إجمالي عدد الآليلات متسلسلة ضمن الفوج
      1. ملاحظة العدد الإجمالي للأفراد متسلسلة في كل دراسة الأتراب (الخطوة 2، 1)
      2. اضرب العدد الإجمالي للأفراد 2 لتحديد إجمالي عدد الآليلات.
        ملاحظة: هذا يفترض جينومات النباتات حيث كل الأجهزة المضيفة المستقلة 2 لكل اليل.
    3. حساب العدد الإجمالي للأفراد البديل الإيجابي لكل موقف من الأحماض الأمينية (الآليلات في 2.4.1/alleles خطوة بخطوة 2.4.2). على سبيل المثال، إذا لا علاقة لها 2 الأفراد كل استضافة متخالف الطفرات KCNQ1-Y111C في أفواج من الأفراد المنكوبة لقتس 100 و 200، على التوالي، ثم تواتر المتغيرات التجريبية في الموقف من الأحماض الأمينية 111 هو الخيارين 2/((100+200 individuals ) * الآليلات 2/الفرد) (أي الجمع بين وزارة الزراعة والحراجة 0.0033).
    4. حساب هذه القيمة لكل متغير ماف كل منهما لكل متغير تجريبي. للحصول على تفاصيل إضافية راجع الخطوة 4، 2.

3. إنشاء التحكم الوراثي متغير قاعدة البيانات ("الضجيج")

ملاحظة: هنا، نحن توضح كيفية إنشاء قاعدة بيانات لمتغيرات التحكم في الجينات للفائدة مع تردد مرتبطة السكان تحكم. وتمثل قاعدة البيانات هذه "الضجيج" (سالب النمط الظاهري، والمستندة إلى السكان التنوع الوراثي) وهي الخلفية التي سيتم تطبيع قاعدة الخيار التجريبي. وهذا هو يشار إلى تباين "السيطرة".

  1. تحديد cohort(s) ذات صحية، ولا علاقة لها أو الاستفادة من الدراسات السكانية الكبيرة لتحديد المتغيرات نادرة بين عدد معين من سكان.
    ملاحظة: مصادر لقاعدة البيانات هذه هي متنوعة وتشمل: 1) تعرض الأشخاص الأصحاء و/أو الأفراد خلاف ذلك النمط الظاهري سالب سانغر التسلسل، أو قواعد بيانات علنية عقدت للأفراد على أساس السكان الذي المرض في السؤال نادرة في تواتر مثل 2) 1000 "مشروع الجينوم" (N = 1,094 المواضيع)18، 3) الوطني للقلب والرئة والدم انتقل معهد اكسومي تسلسل المشروع (ESP، ن = 5,379 المواضيع)19, 4) "اكسومي تجميع كونسورتيوم" (اكساك، ن = المواضيع 60,706)13 ، و/أو 5) "الجينوم تجميع قاعدة البيانات" (جنوماد, N = الأفراد 138,632)13 (انظر الجدول للمواد). سوف تستخدم قاعدة البيانات جنوماد كمثال توضيحي.
    1. إدخال جينات الفائدة في مربع البحث في الصفحة الرئيسية جنوماد (أي KCNQ1).
    2. تأكد من تحديد المستعرض بالجينات الصحيح ونسخة من الفائدة (الخطوة 1، 4).
    3. التأكد من وجود التغطية المناسبة لترتيب موضع باستعراض "تعني التغطية" و "تغطية الأرض."
    4. حدد الترميز الاختلاف التسلسل الجيني بتحديد "مغلطه + LoF."
    5. حدد "جدول التصدير إلى CSV،" الذي سيقوم بإنشاء ملف TextEdit المسمى "معروف."
    6. ريلابيل الملف وتتضمن ملحق جديد "*.csv" (أي "عنصر تحكم KCNQ1 Variation.csv").
    7. افتح الملف باستخدام برنامج برمجيات مناسبة لتحليل ملفات *.csv (انظر الجدول للمواد).
  2. تحديد البروتين تغيير التباين الوراثي في العمود المسمى "البروتين نتيجة."
  3. تطبيق نفس معايير الاستبعاد لهذه المتغيرات الجينية التحكم المتغيرات الجينية التجريبية (الخطوة 2.3.1).
  4. تحديد ماف لكل متغير عنصر التحكم.
    1. قم بتحديد موقع العمود "اليل العدد"، الذي يشير إلى عدد الآليلات العثور على إيواء البديل.
    2. حدد عمود "اليل عدد ''، الذي يشير إلى مجموع عدد الآليلات متسلسلة في ذلك نظراً لموقف الأحماض الأمينية.
      ملاحظة: مجموع عدد الآليلات متسلسلة ستختلف التغطية في هذا الموقع. وستتصل مناطق التغطية العالية 2 * العدد الإجمالي للأفراد داخل جنوماد (أي للأفراد 138,632، تغطية كاملة تشمل 277,264 مجموع الآليلات جينوتيبيد).  على العكس من ذلك، سيكون مناطق التغطية أقل عدد انخفاض إجمالي اليل
    3. حدد موقع الخيار ماف الذي يحسب مسبقاً في العمود "اليل التردد" ويمثل "اليل" العد مقسوماً على عدد "اليل".
      ملاحظة: الجينوم البشري قد اثنين من كل اليل (أي 1 الموضوع وجدت أن البديل متخالف في 10 أشخاص قد ماف 1/20)
    4. علما وزارة الزراعة والحراجة لكل متغير ماف كل منهما لكل متغير عنصر التحكم.
      ملاحظة: يمكن رؤية متغير ماف محددة لكل مجموعة عرقية/إثنية يتألف من جنوماد في الأعمدة إلى يمين "اليل التردد."
  5. تطبيق عتبة ماف نادرة المتغيرات أعلاه والتي تستثني مراقبة المتغيرات ك "المشتركة".
    1. تعيين العتبة ماف إلى القيمة القصوى التي يتم تضمين جميع حقاً المرتبطة بالمرض المتغيرات (راجع الخطوة 2) لاحظ أيضا في قاعدة بيانات مراقبة عتبة (أي، بين جميع المرتبطين بالمرض KCNQ1 المتغيرات وجد أيضا في جنوماد هو متغير مشترك أعلى ماف 0.009، ثم ينبغي أن تستبعد جميع المتغيرات جنوماد عتبة 0.01).
  6. التأكد من مطابقة لعنصر التحكم تسمية المتغير التجريبي (راجع الخطوة 2، 2).
  7. حفظ الملف. وفي بعض الحالات، قد يتطلب هذا تغيير النوع/ملحق اسم الملف.

4-الأحماض الأمينية مستوى إشارة إلى الضوضاء حساب ورسم الخرائط ذات الصلة

  1. حساب ماف لكل موقف من الأحماض الأمينية مع متغير عنصر تحكم (انظر الشكل 1 الذي يحتوي على متغيرات جنوماد KCNQ1 سبيل المثال).
    1. في جدول بيانات، الرسوم بيانية-قادرة على إنشاء عمود لمواقف جميع المتغيرات التجريبية.
    2. قم بإزالة النص البديل لمغادرة الموقف البديل فقط.
      ملاحظة: يمكن استخدام مختلف وظائف/الصيغ تلقائياً حذف هذه العناصر النص داخل الخلايا (الشكل 1، العمود C؛ انظر الجدول للمواد).
    3. فرز المتغيرات في قيمة تصاعدي لتحديد التي لها مواقف أكثر من 1 البديل المرتبطة به (الشكل 1، العمود E؛ يتم سرد أي موقف من الأحماض الأمينية 10 مرتين في العمود E الذي يشير إلى متغيرات فريدة 2 في الموضع).
    4. الجمع بين ماف لكل متغير المقترنة لموقف معين بأخذ مجموع كل مافس لموضع محدد (الشكل 1، العمود زاي وحاء).
  2. حساب ماف لكل موقف من الأحماض الأمينية مع متغير تجريبي (انظر الشكل 2 التي تحتوي على متغيرات باثولوجي KCNQ1 وهمية).
    1. بطريقة مماثلة ل 4.1.1، إنشاء عمود من وظائف الأحماض الأمينية التي تكون المتغيرات التجريبية (الشكل 2، العمود B).
    2. لكل موقف متغير، حساب ماف لكافة المتغيرات المرتبطة بهذا الموقف من الخطوة 2، 4 (الشكل 2، العمود ج-ز).
  3. إنشاء المتداول متوسط ماف على حد سواء التجريبية ومراقبة المتغيرات.
    1. قم بتوسيع الأعمدة التي تم إنشاؤها في 4.1 و 4.2 لتضمين الخلايا لمواقف من الأحماض الأمينية التي لها لا متغير ماف = 0. (الشكل 3).
      1. إنشاء عمود يحتوي على جميع الوظائف من الأحماض الأمينية في الجينات للفائدة (أي 1 إلى 676 ل KCNQ1، الرقم 3، العمود C وأنا).
      2. إضافة ماف 0 لجميع المواقع التي ليس لها بدائل للتحكم ومجموعات البيانات التجريبية.
        ملاحظة: يمكن أن يتم ذلك تلقائياً باستخدام الدالة "VLOOKUP" في أحد البرامج مستخدمة شيوعاً (انظرالشكل 3، العمود D و J، الجدول للمواد).
    2. إنشاء المتداول المتوسط لكل التجريبية ومراقبة انتشار العمود.
      ملاحظة: هذا يسمح لاستدلال الإمراضية موقف المتاخمة ويمكن تعديلها، أو حتى استبعادها، لتناسب احتياجات الدراسة.
      1. إنشاء عمود يمثل متوسط التداول لوزارة الزراعة والحراجة على حد سواء لمراقبة ومجموعات البيانات التجريبية (الشكل 3، العمود E و K).
      2. في العمود المتوسط المتداول، مكان متوسط ماف كل منهما لمواقف الخيار 5 مواقع البديل الطرفي ن و 5 ج-محطة لموقف معين.
        ملاحظة: وهذا يخلق المتداول متوسط من +/-5. للمواقف مع مخلفات الأحماض الأمينية 5 أقل من السابق، أو عقب، موقع متوسط متداول (أي ن-أو ج-المحطة)، المتوسط الدوار فقط ستأخذ في الاعتبار تلك المخلفات الموجودة (أي المتداول متوسط في الموقف من الأحماض الأمينية 3 ستكون في متوسط وزارة الزراعة والحراجة في المواقف من الأحماض الأمينية 1 على الرغم من 8، محسوبة على أنها المجموع من هذه مافس مقسوماً على 8).
  4. حساب تردد مراقبة الحد الأدنى بقسمة ماف أدنى المتداول 2.
    1. تغيير أي خلية مع عنصر تحكم ماف 0 إلى التردد الأدنى لتجنب القسمة على 0 عند حساب نسبة الإشارة إلى الضجيج.
  5. حساب نسبة الإشارة إلى الضوضاء مستوى الحمض الأميني (الشكل 4).
    1. تقسيم كل موقف الأحماض الأمينية التجريبية المتداول متوسط بمراقبة كل منها المتداول متوسط.
    2. إنشاء رسم بياني هذا نسبة المحور (ص) مقابل الأحماض الأمينية الموضع (س).

5-البروتين المجال طبولوجيا تراكب

  1. تحديد مواقع الأحماض الأمينية توافق المجالات/ميزات وظيفية، أو مناطق التعديل بوستترانسلاشونال، ومن البروتين للفائدة (الخطوة 1، 7).
    ملاحظة: يمكن استخدام عدد من الموارد لتحديد هذه المجالات. هذه الموارد، فضلا عن الموارد لتحديد المجالات المفترضة في الرواية والبروتينات، واستعرضت أيضا في الأدب20. وسيصف هذا البروتوكول البروتين قاعدة البيانات المتاحة من خلال نكبي، التي تستخدم على نطاق واسع وقوى (انظر الجدول للمواد).
  2. تحديد المواقف من الأحماض الأمينية المرتبطة بالبروتين المجالات/الميزات.
    1. فتح صفحة ويب نكبي.
    2. الدخول NP بروتين الفائدة في حقل البحث.
    3. تحديد نطاقات البروتين المعروفة وهي ميزات الفهارس تحت "الميزات".
    4. تحديد ولاحظ مواقف المجال اسم/نوع والأحماض الأمينية.
    5. حدد الارتباط المقابلة للميزة إلى تصور المنطقة على بروتين تسلسل الاهتمام الرئيسي.
  3. إنشاء عمود يحتوي على حدود المجالات/الملامح.
    1. إنشاء عمود بجوار عمود الإشارات: الضوضاء بحيث يمكن أن يكون العمود الموضع من الأحماض الأمينية المشار إليها (الشكل 5ألف، العمود C).
    2. تحديد الخلايا المناظرة في الجانب الطرفي ن أو ج-محطة لكل مجال/ميزة ومكان 1 في كل خلية (أي إذا كان المجال الطرفي ن المجال S1 ترانسميمبراني من KCNQ1 من الأحماض الأمينية موقف 122، والمجال ج-الطرفية موقف 142، ثم 1 يوضع في الصف لموقف من الأحماض الأمينية 122 و 142).
    3. بالنسبة لتداخل المجالات/ميزات، عرض نطاقات متعددة عن طريق تغيير 1 لقيم أخرى (أي 1، 5، 2، 2، 5)؛ ويمكن أن يساعد في التمييز بين المجالات.
  4. إنشاء رسم بياني بهذه الحدود كموقف المحور الصادي والأحماض الأمينية على المحور السيني (الشكل 5ب).
  5. تراكب هذا الرسم البياني مع الرسم البياني إشارة إلى الضوضاء التي تم إنشاؤها في الخطوة 4، 4.
  6. تحديد العلاقات المتبادلة بين نطاقات البروتين المعروفة/الميزات وتحليل الإشارات إلى الضجيج.

6-أما البديل موقف تراكب

  1. خريطة المواقف الفردية الخيار لتراكب للرسوم البيانية التي أنتجت في الخطوات 4، 4 و 5-4.
    1. إنشاء عمود بجوار العمود المجال/ميزة مثل تتوافق الصفوف في العمود إلى المواقف من الأحماض الأمينية (الشكل 5ألف، العمود D).
    2. ضع 1 في كل خلية في الصف وأضاف المقابل إلى موضع الذي يحتوي على متغير كل منهما.
    3. إنشاء رسم بياني مع هذا العمود كموقف المحور الصادي والأحماض الأمينية على المحور السيني (الشكل 5ج).
  2. تراكب هذا الرسم البياني مع الرسم البياني إشارة إلى الضوضاء التي تم إنشاؤها في الخطوة 4، 4 والرسم البياني النطاق التي تم إنشاؤها في الخطوة 5، 4.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

نتيجة ممثل لإشارة مستوى الأحماض الأمينية لتحليل الضوضاء KCNQ1 هو مبين في الشكل 6. في هذا المثال، نادرة المتغيرات المحددة في الفوج جنوماد (مراقبة الفوج)، تعتبر ويس المناسبة تحديد المتغيرات (الفوج التجريبية #1)، والمتغيرات المرتبطة بقضية لقتس يصور المحتمل المرتبط بالمرض (التجريبية الفوج #2). علاوة على ذلك، تحليل الإشارات إلى الضجيج مقارنة تواتر متغير الفوج ويس ولقتس تطبيع ضد جنوماد ويرد تردد متغير. المتغيرات المرتبطة لقتس أظهرت ارتفاع نسبة إشارة إلى الضجيج في المجالات المقابلة مع قناة المسام وتصفية الانتقائية والمجال KCNE1-ملزمة. وبالمقارنة، لم تثبت المتغيرات المناسبة التي تم تحديدها في الفوج ويس وضوح مناطق معينة من ارتفاع إشارة إلى الضوضاء عالية، مما يوحي بأن هذه المتغيرات تعكس التنوع الوراثي في الخلفية. ولم تستخدم هذا المثال متغير مافس كما أشير أعلاه؛ ومع ذلك، فإنه يوضح جميع المبادئ نفسها كما هو موضح.

Figure 1
الشكل 1 : مثال لقاعدة بيانات متغير عنصر التحكم مع حساب ماف. مباشرة استيراد العمود A، جنوماد مراقبة المتغيرات نادرة. العمود B، وحذف النص من جانب اليسار، غير متعلقة بموقف من تسمية متغير استخدام صيغة مثال لإزالة حرف (أي: ل B2 "= حق (A2, LEN (A2)-5"، انظر الجدول للمواد). العمود C، وحذف النص على وجه حق، غير متعلقة بموقف من تسمية متغير باستخدام صيغة ذات صلة (أي: ل C2 "= LEFT(B2,LEN(B2)-3"). العمود D، التي لم يتم فرزها الناتجة من الأحماض الأمينية وظائف. العمود هاء، مواقف من الأحماض الأمينية مرتبة بشكل تصاعدي للسماح للتعرف على مواقف مكررة. العمود F، المرتبطة ماف لكل متغير كمستوردة من جنوماد. العمود زاي، وحاء، الجمع بين وزارة الزراعة والحراجة لموقف معين من الأحماض الأمينية (مجموع كل متغير ماف في موضع معين). الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 2
الشكل 2 : مثال لقاعدة بيانات متغير تجريبي مع حساب ماف. العمود A، قائمة بأسماء وهمية الطفرات المرتبطة لقتس في KCNQ1 الذي يمثل قاعدة بيانات تجريبية الطفرات المرتبطة بالمرض. العمود B، موقف الطفرة المقابلة لكل متغير. العمود C، وعدد من الأفراد الطفرات الإيجابية داخل صورية الدراسة 1. كل ما يفترض أن يكون طفرة متخالف الناقلين. العدد الإجمالي للأفراد جينوتيبيد في الدراسة الموجود في الجزء السفلي من الورقة. العمود D، عد الفرد طفرة إيجابية في صورية الدراسة 2. العمود E، عدد الطفرات الإيجابية الفردية في صورية الدراسة 3. عمود و من مجموع الأفراد الطفرات الإيجابية استضافة الطفرة الملحوظة في جميع الدراسات. علما أنه ينبغي الجمع بين الطفرات المتميزة المرتبطة بنفس الموقف من الأحماض الأمينية. العمود ز، وزارة الزراعة والحراجة لكل موقف الطفرة والأحماض الأمينية استخدام صيغة مثال (أي: ل G2 "=2/(176*2)"، انظر الجدول للمواد). علما أنه يفترض أن تكون متخالف منذ جميع الأفراد، وكل فرد يفترض أن تحمل الآليلات 2 لمحور KCNQ1، مجموع الأفراد الذين ينبغي أن يكون مضروباً في 2 للتردد اليل. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 3
الشكل 3 : مثال لحساب المتوسط للتحكم والمتغيرات التجريبية المتداول. العمود A و B، مواقف متغير عنصر التحكم جنوماد ومافس كل منهما. العمود C، ضع جميع المناصب من الأحماض الأمينية KCNQ1 من الأحماض الأمينية إلى النهائي. العمود D، البديل جنوماد ماف لجميع الوظائف مع ماف 0 بدلاً من المواقف دون متغير. وهذا يمكن حسابها تلقائياً باستخدام دالة VLOOKUP (أي ل D2، "= IFERROR(VLOOKUP(C2,A:B,2,),0)، انظر الجدول للمواد). العمود هاء، المتداول في المتوسط من موقف وزارة الزراعة والحراجة باستخدام صيغة مثال (أي E2، "= SUM(D2:D7)/6" و E7، "= SUM(D2:D12)/11"). العمود زاي، وحاء، مواقف لقتس متغير تجريبي مع مافس كل منهما. العمود الأول، جميع المناصب من الأحماض الأمينية KCNQ1. العمود J، البديل لقتس ماف لجميع المواقف. العمود K, المتداول ماف لقتس. خلايا تعبئة رمادية أمثلة حيث يتم توسيع ماف قيم من أعمدة ب وح في العمود D و J، على التوالي، والذي ربط مع مواقفها في العمود C/أولاً-"علما" أن من الأهمية بمكان أن يتم تنسيق الخلايا كافة "أرقام" للصيغة المناسبة سير عمل. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 4
الشكل 4 : مثال لتحليل الإشارات إلى الضجيج والرسوم البيانية. اليسار ومثال قاعدة البيانات والعمليات الحسابية. العمود A، جميع المناصب من الأحماض الأمينية KCNQ1. العمود B، لقتس التجريبية ماف متوسط التداول لكل موقف. العمود C، جنوماد لمراقبة ماف متوسط التداول لكل موقف. دال: الإشارات إلى الضجيج نسبة (أي ل D2، "= B2/C2"). المثال الصحيح، من الرسم البياني للإشارات إلى الضجيج نسبة المحور (ص) مقابل الموقف من الأحماض الأمينية (س). الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 5
الشكل 5 : مثال للبروتين، وتعيين الموقف البديل. ألف مثال قاعدة البيانات والعمليات الحسابية. العمود A، جميع المناصب من الأحماض الأمينية KCNQ1. العمود B، KCNQ1 المواقف التي يكون متغير عنصر تحكم نادرة المحددة في جنوماد. العمود C، حدد العمود تعيين المجال حيث تتوافق مع الخلايا التي تحتوي على القيم إلى جانب ن أو ج-محطة KCNQ1 البروتين المجالات أو ميزات. ما المجال الطرفي ن معظم المجال S1 على الحدود الطرفي ن في الأحماض الأمينية 122، تتم الإشارة إلى أية قيم هنا. العمود D، العمود تعيين متغير حيث تتوافق مع الخلايا التي تحتوي على 1 KCNQ1 المواقف التي ترجمة المتغيرات نادرة. خلايا تعبئة رمادية هي أمثلة اثنين التي توسع فيها مواقف البديل في العمود B إلى العمود D التي ترتبط بموقف كل منهما في العمود a الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 6
الرقم 6 : مثال لتحليل الإشارات إلى الضجيج مستوى الأحماض الأمينية KCNQ1-ترميز KCNQ1 (Kv7.1)- أظهر مناصب أعلى، متغير مع خطوط عمودية، بما في ذلك جنوماد نادرة الفوج المتغيرات (أسود)، وبالمناسبة-وحدد المتغيرات في الإحالات ويس (الأزرق)، والمتغيرات المحددة في cases(green) لقتس. تتم الإشارة إلى المجالات الوظيفية. ويرد التواتر النسبي لقتس متغيرات حالة تطبيع للمتغيرات جنوماد (الخط الأخضر) مقارنة ويس (الخط الأزرق). S1-S6، المجالات transmembrane؛ سادس، أيون انتقائية التصفية؛ KCNE1 و AKAP9، مجالات ملزمة البروتين الخاصة بكل منها. تم التعديل وطبع بإذن من العمل السابق14. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Subscription Required. Please recommend JoVE to your librarian.

Discussion

الاختبارات الجينية الفائق تقدما هائلا في تطبيقه وتوفر على مدى العقد الماضي. ومع ذلك، العديد من الأمراض مع راسخة الأسس الوراثية، مثل القلب، اختبار الموسعة قد أخفقت في تحسين الغلة التشخيص21. علاوة على ذلك، هناك عدم يقين كبيرة فيما يتعلق بالأداة التشخيصية للعديد من المتغيرات التي تم تحديدها. وهذا جزئيا بسبب تزايد عدد المتغيرات نادرة وبالمناسبة المحددة اكتشف ويس والأفرقة العاملة، التي يمكن أن تؤدي إلى خطأ في التشخيص22. تحليل الإشارات إلى الضجيج مستوى الأحماض الأمينية تستند استراتيجيات راسخة للتنبؤ بمتغير الإمراضية ويوفر ميزة الاستفادة من دراسات الجينوم المستندة إلى السكان على نطاق واسع صقل التفسير البديل.

ويترتب على أن إحدى الخطوات الأكثر أهمية لهذا البروتوكول هو اختيار عنصر التحكم والأفواج التجريبية. العديد من الدراسات المتاحة للعموم الجينوم كبيرة يتم الوصول إليها من خلال قواعد بيانات تجميعية، مثل جنوماد، التي يمكن أن تسمح للممثل الأفواج التحكم في هذا البروتوكول أن تكون كبيرة بقدر الأفراد 138,632 في هذا التاريخ. على الرغم من أن ليس جميع المواضيع في هذه الأفواج الكلي يتمتعون بصحة جيدة ظاهرياً، حجم العينة كبيرا في الإعداد لمرض نادر يجعل هذا المورد لا تقدر بثمن ويسمح لعتبة استبعاد ماف صارمة. استبعاد متغيرات مشتركة أمر ضروري لأنها من المحتمل أن تكون سببا من أسباب المرض مندلية شدة الاختراق. استناداً إلى العمل السابق، قد يكون من المناسب عتبة ماف 0.01 للجينات المرتبطة تشانيلوباثي و 0.0001 للجينات اعتلال عضلة القلب وتم التحقق من قبل المجموعات المستقلة23،24. الأهم من ذلك، نظراً لأهمية عتبة وزارة الزراعة والحراجة، وهذا ينبغي تعيين والتحقق من صحتها لكل دراسة بشكل مستقل. لا يلزم تطبيق عتبة ماف للأتراب تجريبية، نظراً لوجود الطفرات مؤسس في تشانيلوباثيس والقلب راسخة. يجب أن تكون كافية لتحديد المجالات حيث يمكن المجموعة المتغيرات؛ حجم الفوج التجريبية ومع ذلك، هناك لا حجم صارمة. بالإضافة إلى ذلك، لا ينبغي أن تشمل الفوج التجريبية المتغيرات التي من المعروف أن حميدة داخل الأدب، كما أن هذا سوف يقلل من صحة الإشارة المسببة للأمراض.

تحديد معايير الاستبعاد بشكل صحيح أيضا حاسمة بالنسبة لتفسير وتطبيق النتيجة. على الرغم من أن هذا البروتوكول يوصي باستبعاد بعض فئات طفرة مثل المتغيرات مرادفاً، هذه عمليا يمكن إدراج عمليات المرض الذي كانت المتغيرات مرادفاً الضارة المحددة25،26. بالإضافة إلى ذلك، عندما يتم تطبيقها على حد سواء التجريبية مختلف معايير الاستبعاد والتحكم في مجموعات، فإنه يمكن أن تسمح للتقسيم الطبقي لتعيين إشارة إلى الضوضاء بالطفرة فرعية (أي مقارنة مغلطه للمتغيرات اقتطاع).

الإعداد متوسط التداول مافس تسمح باستدلال مشاركة للأحماض الأمينية المجاورة. على سبيل المثال، إذا كان الموقف من الأحماض الأمينية 35 يحتوي على متغير باثولوجي ويتواجد في مجال البروتين الحرجة، ثم موقف قد يكون 36 درجة من القدرة الإمراضية عند تحور. وبالمثل، ينبغي أن تمتد من تسلسل الأولية كمية كبيرة من متغيرات تحكم نادرة، ثم الأحماض الأمينية داخل هذه المنطقة التي لا تستضيف المتغيرات نادرة قد يكون لديك احتمال أعلى من التي تحتوي على أنواع نادرة وجدت في عدد سكان. في حين متوسط التداول في هذا البروتوكول +/-5، هذا النطاق يمكن أن تختلف استناداً إلى المستخدم المطلوب مستوى القرار نسبة الإشارة إلى الضوضاء والبروتين محددة قيد الدراسة. في مثال لقتس، الاستجواب KCNQ1-ترميز KCNQ1 القناة قد عدة مجالات transmembrane تمتد الأحماض الأمينية ~ 10، مما دفع المؤلف ضبط بالدقة المطلوبة تعكس نتائج هامة في هذا الجدول14. للبروتينات، ويعد التسلسل الأساسي والبروتين طول فترة المتوسط الدوار قد تحتاج إلى زيادة نظراً ليمتد أكبر من تسلسل البروتين دون التحكم التباين.

وهناك العديد من القيود على هذا الأسلوب. كما ذكر سابقا، يجب تحديد عدد سكان النمط الظاهري-إيجابية كافية استضافة المتغيرات باثولوجي المفترضة من أجل محرك أقراص إشارة واضحة مرضية. بالإضافة إلى ذلك، قد تكون هذه المتغيرات باثولوجي بينيترانسي متغير، هكذا طفرات مرضية حقاً قد لا المجاهرة النمط الظاهري مرض أو خلاف ذلك لا تكون قد تماما الاختراق والمرض تسبب. بينما كثير عقدت علنا قواعد البيانات، مثل جنوماد، غالباً ما تعتبر "أفواج صحية"، انتشار الأمراض الوراثية من المحتمل مماثلة في قاعدة البيانات هذه كالدراسات السكانية. المفصلة، يركز هذا البروتوكول تحديداً على التغييرات على مستوى الأحماض الأمينية الناتجة عن المتغيرات الجينات اكسونيك التعليمات البرمجية للأحماض الأمينية، مما يستبعد الدور الذي قد يقوم متغيرات الربط إينترونيك المسببة للأمراض في مرض مونوجينيك. نظراً لدورها أظهرت مؤخرا في القلب، توسيع نطاق القرار هذا النهج قد يكون هناك مبرر لتحديد إينتيرجينيك "النقاط الساخنة"، وكذلك. وعلاوة على ذلك، قد تفوت تطبيق عتبة ماف معينة "الآليلات خطر"، على الرغم من الموجودة في السكان مع ماف أعلى من أن انتشار المرض قد تسهم في المرض المرضية27،28. وعلى الرغم من هذه القيود، هذا التحليل قابل للتكيف، ويمكن أن تلعب دوراً رئيسيا في توفير الأطباء ينطبق احتمال نسبي للقدرة الإمراضية المرض عند الاقتضاء.

وأخيراً، نظراً للميل من هذا التحليل لتحديد المناطق الحرجة داخل بروتين، مستوى الأحماض الأمينية إشارة إلى الضوضاء حسابات استخدام الطفرات باثولوجي يقدم إمكانية تحديد مجالات وظيفية جديدة من البروتينات ويجري درس. ونظرا لمراقبة عالية القدرة الإمراضية إشارة إلى الضوضاء في المواقع الرئيسية لقنوات أيون، مثل المجال المسام وتصفية الانتقائية، S2 transmembrane المجال والمجال ملزمة KCNE1 من KCNQ1، تحديد "ذروة القدرة الإمراضية" داخل منطقة من البروتين دون دالة معروفة قد توحي مجال الحرج رواية. على سبيل المثال، حددت ذروة ملحوظ في القدرة الإمراضية للطفرات المرتبطة لقتس إضفاء الطابع المحلي على الأحماض الأمينية بقايا 912-930 من KCNH2--ترميز KCNH2 (Kv11.1). هذه المنطقة من البروتين أي مجال وظيفي شخصية لم يوضح ميل ملحوظ للطفرات المرتبطة لقتس14. كما يوسع معرفة طوبولوجيا البروتين، البروتيوميات أكثر تطورا يمكن عمليا تحسين دقة هذا الأسلوب في المستقبل من تحليل نسبة الإشارة إلى الضوضاء على طول الهيكل الرئيسي للبروتين تدرج في التعليم الثانوي والتعليم العالي، أو هيكل رباعي. بالإضافة للعلوم الحاسوبية المتقدمة لهذا التحليل، مثل آلة التعلم والذكاء الاصطناعي، وتتيح الفرصة للتعرف على أنماط الرواية بين باثولوجي مقابل المستندة إلى السكان التنوع الوراثي، إذا كانت قوية قواعد البيانات هذه يمكن أن تكون المتغيرات ولدت29،30. وفي المقابل، هذا الأسلوب يمكن أن تساعد في وصف أفضل والتنبؤ بالعلاقة النمط الظاهري النمط الوراثي لأمراض محددة واستخدامها بالاقتران مع احتمال اختبار قبل الفرد للمرض إلى زيادة غلة التشخيص من الاختبارات الجينية. علاوة على ذلك، قد اكتشف علم الأحياء البروتين رواية هذا التحليل وتحديد الرواية المكاني داخل الجينوم البشري التي تتظاهر بالمرض عندما غيرت.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

الكتاب ليس لها علاقة بالكشف عن.

Acknowledgments

معتمد من الألغام المضادة للأفراد بالوطنية معاهد للصحة K08-HL136839.

Materials

Name Company Catalog Number Comments
1000 Genome Project N/A www.internationalgenome.org
ClinVar N/A www.ncbi.nlm.nih.gov/clinvar
Ensembl Genome Browser N/A uswest.ensembl.org/index.html
Excel Microsoft office.microsoft.com/excel/ Used for all example formulas and functions
Exome Aggregation Consortium  N/A www.exac.broadinstitute.org
Genome Aggregation Database  N/A www.gnomad.broadinstitute.org
National Center for Biotechnology Information Domain and Structure Database N/A www.ncbi.nlm.nih.gov/guide/domains-structures/
National Center for Biotechnology Information Gene Database N/A www.ncbi.nlm.nih.gov/gene/
National Center for Biotechnology Information Protein Database N/A www.ncbi.nlm.nih.gov/protein/
National Heart, Lung, and Blood Institute GO Exome Sequencing Project N/A www.evs.gs.washington.edu/EVS/
SnapGene GSL Biotech LCC www.snapgene.com
University of California, Santa Cruz Human Genome Browser N/A www.genome.ucsc.edu

DOWNLOAD MATERIALS LIST

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Meng, L., et al. Use of Exome Sequencing for Infants in Intensive Care Units: Ascertainment of Severe Single-Gene Disorders and Effect on Medical Management. Journal of the American Medical Association Pediatrics. 171 (12), 173438 (2017).
  3. Kalia, S. S., et al. Recommendations for reporting of secondary findings in clinical exome and genome sequencing, 2016 update (ACMG SF v2.0): a policy statement of the American College of Medical Genetics and Genomics. Genetics in Medicine. 19 (2), 249-255 (2017).
  4. Landstrom, A. P., Ackerman, M. J. The Achilles' heel of cardiovascular genetic testing: distinguishing pathogenic mutations from background genetic noise. Clinical Pharmacology and Therapeutics. 90 (4), 496-499 (2011).
  5. Landstrom, A. P., Tester, D. J., Ackerman, M. J. Role of genetic testing for sudden death predisposing heart conditions in athletes. Sports Cardiology Essentials. Lawless, C. , Springer. New York, NY. (2011).
  6. Wang, Q., et al. Positional cloning of a novel potassium channel gene: KVLQT1 mutations cause cardiac arrhythmias. Nature Genetics. 12 (1), 17-23 (1996).
  7. Kapa, S., et al. Genetic testing for long-QT syndrome: distinguishing pathogenic mutations from benign variants. Circulation. 120 (18), 1752-1760 (2009).
  8. Ackerman, M. J., et al. Ethnic differences in cardiac potassium channel variants: implications for genetic susceptibility to sudden cardiac death and genetic testing for congenital long QT syndrome. Mayo Clinic Proceedings. 78 (12), 1479-1487 (2003).
  9. Kumar, P., Henikoff, S., Ng, P. C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nature Protocols. 4 (7), 1073-1081 (2009).
  10. Adzhubei, I., Jordan, D. M., Sunyaev, S. R. Predicting functional effect of human missense mutations using PolyPhen-2. Current Protocols in Human Genetics. , Chapter 7 (Unit 7.20) (2013).
  11. Flanagan, S. E., Patch, A. M., Ellard, S. Using SIFT and PolyPhen to predict loss-of-function and gain-of-function mutations. Genetic Testing and Molecular Biomarkers. 14 (4), 533-537 (2010).
  12. Ackerman, M. J., et al. HRS/EHRA expert consensus statement on the state of genetic testing for the channelopathies and cardiomyopathies this document was developed as a partnership between the Heart Rhythm Society (HRS) and the European Heart Rhythm Association (EHRA). Heart Rhythm. 8 (8), 1308-1339 (2011).
  13. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  14. Landstrom, A. P., et al. Amino acid-level signal-to-noise analysis of incidentally identified variants in genes associated with long QT syndrome during pediatric whole exome sequencing reflects background genetic noise. Heart Rhythm. 15 (7), 1042-1050 (2018).
  15. Hubbard, T., et al. Ensembl 2005. Nucleic Acids Research. 33, Database issue 447-453 (2005).
  16. O'Leary, N. A., et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Research. 44, 733-745 (2016).
  17. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  18. The 100 Genome Projects Consortium. An integrated map of genetic variation from 1,092 human genomes. Nature. 491 (7422), 56-65 (2012).
  19. Fu, W., et al. Analysis of 6,515 exomes reveals the recent origin of most human protein-coding variants. Nature. 493 (7331), 216-220 (2013).
  20. Mulder, N. J., Apweiler, R. Tools and resources for identifying protein families, domains and motifs. Genome Biology. 3 (1), (2002).
  21. Cirino, A. L., et al. A Comparison of Whole Genome Sequencing to Multigene Panel Testing in Hypertrophic Cardiomyopathy Patients. Circulation Cardiovascular Genetics. 10 (5), (2017).
  22. Landstrom, A. P., et al. Interpreting Incidentally Identified Variants in Genes Associated With Catecholaminergic Polymorphic Ventricular Tachycardia in a Large Cohort of Clinical Whole-Exome Genetic Test Referrals. Circulation Arrhythmia and Electrophysiology. 10 (4), (2017).
  23. Whiffin, N., et al. Using high-resolution variant frequencies to empower clinical genome interpretation. Genetics in Medicine. 19 (10), 1151-1158 (2017).
  24. Walsh, R., et al. Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples. Genetics in Medicine. 19 (2), 192-203 (2017).
  25. Buske, O. J., Manickaraj, A., Mital, S., Ray, P. N., Brudno, M. Identification of deleterious synonymous variants in human genomes. Bioinformatics. 31 (5), 799 (2015).
  26. Wen, P., Xiao, P., Xia, J. dbDSM: a manually curated database for deleterious synonymous mutations. Bioinformatics. 32 (12), 1914-1916 (2016).
  27. Bagnall, R. D., et al. Whole Genome Sequencing Improves Outcomes of Genetic Testing in Patients With Hypertrophic Cardiomyopathy. Journal of the American College of Cardiology. 72 (4), 419-429 (2018).
  28. Giudicessi, J. R., Roden, D. M., Wilde, A. A. M., Ackerman, M. J. Classification and Reporting of Potentially Proarrhythmic Common Genetic Variation in Long QT Syndrome Genetic Testing. Circulation. 137 (6), 619-630 (2018).
  29. Sundaram, L., et al. Predicting the clinical impact of human mutation with deep neural networks. Nature Genetics. 50, 1161-1170 (2018).
  30. Krittanawong, C., Zhang, H., Wang, Z., Aydar, M., Kitai, T. Artificial Intelligence in Precision Cardiovascular Medicine. Journal of the American College of Cardiology. 69 (21), 2657-2664 (2017).

Tags

علم الوراثة، 143 قضية، التحليل الجيني، والاختبارات الجينية، الطفرة، طوبولوجيا، البديل من أهمية غير مؤكد، تسلسل عزمي كله
تحديد احتمال الإمراضية متغير باستخدام تحليل الإشارات إلى الضجيج مستوى الأحماض الأمينية للتنوع الوراثي
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Jones, E. G., Landstrom, A. P.More

Jones, E. G., Landstrom, A. P. Determining the Likelihood of Variant Pathogenicity Using Amino Acid-level Signal-to-Noise Analysis of Genetic Variation. J. Vis. Exp. (143), e58907, doi:10.3791/58907 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter