लक्षित अगली पीढ़ी अनुक्रमण एक समय और लागत कुशल दृष्टिकोण है कि दोनों रोग अनुसंधान और नैदानिक निदान में तेजी से लोकप्रिय होता जा रहा है । प्रोटोकॉल यहां वर्णित जटिल अनुक्रमण के लिए आवश्यक कार्यप्रवाह और आनुवंशिक वेरिएंट है कि रोग में योगदान की पहचान करने के लिए इस्तेमाल किया bioinformatics प्रक्रिया प्रस्तुत करता है ।
अगली पीढ़ी के अनुक्रमण (NGS) जल्दी क्रांति है कैसे संवैधानिक रोग के आनुवंशिक निर्धारकों में अनुसंधान किया जाता है । तकनीक अनुक्रमण के लाखों के साथ अत्यधिक कुशल है एक कम समय अवधि में उत्पादन किया जा रहा है और अपेक्षाकृत कम कीमत पर पढ़ता है । विशेष रूप से, लक्षित NGS अध्ययन की बीमारी के आधार पर विशेष रूप से ब्याज की जीनोमिक क्षेत्रों के लिए जांच ध्यान केंद्रित करने में सक्षम है । न केवल यह आगे लागत को कम करता है और इस प्रक्रिया की गति में वृद्धि, लेकिन यह गणना बोझ है कि अक्सर NGS के साथ कम करती है । हालांकि लक्षित NGS जीनोम के कुछ क्षेत्रों के लिए प्रतिबंधित है, ब्याज की संभावित उपंयास loci की पहचान को रोकने, यह एक उत्कृष्ट तकनीक जब एक phenotypically और आनुवंशिक रूप से विषम बीमारी के साथ सामना करना पड़ सकता है, जिसके लिए वहां है पहले आनुवंशिक संघों जाना जाता है । अनुक्रमण तकनीक की जटिल प्रकृति की वजह से, यह बारीकी से उच्च कवरेज और गुणवत्ता के अनुक्रमण पढ़ता प्राप्त करने के क्रम में प्रोटोकॉल और तरीकों का पालन करने के लिए महत्वपूर्ण है । इसके अलावा, एक बार अनुक्रमण पढ़ता प्राप्त कर रहे हैं, एक परिष्कृत bioinformatics कार्यप्रवाह सही नक्शा एक संदर्भ जीनोम के लिए पढ़ता है, वेरिएंट को कॉल करने के लिए, और वेरिएंट गुणवत्ता मैट्रिक्स पारित सुनिश्चित करने के लिए उपयोग किया जाता है । वेरिएंट भी व्याख्या और उनके नैदानिक महत्व है, जो चिकित्सा आनुवंशिकी और जीनोमिक्स Pathogenicity दिशानिर्देश के अमेरिकन कॉलेज को लागू करने से मानकीकृत किया जा सकता है के आधार पर उपचारात्मक होना चाहिए । यहां प्रस्तुत तरीकों को पैदा करने और एक लक्षित अनुक्रमण पैनल से NGS डेटा का विश्लेषण, एक मॉडल के रूप में ONDRISeq neurodegenerative रोग पैनल का उपयोग, वेरिएंट है कि नैदानिक महत्व का हो सकता है की पहचान करने में शामिल कदम प्रदर्शित करेगा ।
विभिंन स्थितियों के आनुवंशिक निर्धारकों को परिभाषित करने के रूप में अनुसंधान में एक उच्च प्राथमिकता पर लेता है और क्लिनिक में, अगली पीढ़ी के अनुक्रमण (NGS) के लिए एक उच्च प्रवाह और लागत प्रभावी उपकरण के लिए इन लक्ष्यों को प्राप्त करने के लिए साबित हो रहा है1,2 ,3. लगभग 40 वर्षों के लिए, सैंज अनुक्रमण आनुवंशिक वेरिएंट की पहचान करने के लिए सोने के मानक किया गया था4; हालांकि, आनुवंशिक विविधता या अज्ञात आनुवंशिक एटियलजि के साथ रोगों के लिए, कई संभावित उंमीदवार जीन का मूल्यांकन किया जाना चाहिए, अक्सर समवर्ती । इस संदर्भ में, सैंज अनुक्रमण महंगा और समय लेने वाली हो जाता है । हालांकि, NGS डीएनए टुकड़े के लाखों के बड़े पैमाने पर समानांतर अनुक्रमण शामिल है, एक लागत और समय कुशल तकनीक के लिए अनुमति देता है एक साथ जीनोम के विभिंन क्षेत्रों में आनुवंशिक भिंनता की एक विस्तृत श्रृंखला का पता लगाने के लिए ।
sequencing डीएनए के लिए NGS के तीन प्रकार के होते हैं: 1) पूरे-जीनोम अनुक्रमण (WGS), 2) पूरे-exome अनुक्रमण (वेस), और 3) लक्षित अनुक्रमण5. WGS एक व्यक्ति के पूरे जीनोमिक सामग्री का मूल्यांकन करता है, जबकि वेस अनुक्रमण केवल प्रोटीन के जीनोम6कोडिंग क्षेत्रों में शामिल है । लक्षित अनुक्रमण, इसके विपरीत, आम रोग तंत्र या ज्ञात नैदानिक phenotype द्वारा जुड़े अपेक्षाकृत कुछ विशिष्ट जीन के आधार पर जीनोम के विशिष्ट क्षेत्रों पर केंद्रित है । या तो exons या introns, या जीन के एक जीन या विशिष्ट समूह के किसी भी intergenic क्षेत्रों इस दृष्टिकोण का उपयोग कर निर्दिष्ट किया जा सकता है । इसलिए, लक्षित अनुक्रमण एक उत्कृष्ट दृष्टिकोण जब पहले से ही उंमीदवार के लिए ब्याज की बीमारी के साथ जुड़े जीन ज्ञात की नींव है हो सकता है । जीनोम के विशिष्ट क्षेत्रों लक्ष्यीकरण अनावश्यक और अप्रासंगिक आनुवंशिक भिंनता है कि बादल या नैदानिक व्याख्या से विचलित कर सकते है के उंमूलन के लिए अनुमति देता है । जबकि WGS और वेस दोनों उच्च गुणवत्ता वाले डेटा की एक बड़ी राशि का उत्पादन, डेटा की राशि भारी हो सकता है । न केवल डेटा की इस बड़ी राशि है अभिकलनी गहन bioinformatics विश्लेषण की आवश्यकता होती है, लेकिन डेटा भंडारण अक्सर समस्या7उपस्थित कर सकते हैं । डेटा भंडारण की यह चुनौती भी WGS और वेस, जो अक्सर शुरू नहीं माना जाता है जब अनुक्रमण के खर्च की गणना करने के लिए अतिरिक्त लागत कहते हैं । इसके अलावा, यद्यपि यह कम है, WGS और वेस की लागत अपेक्षाकृत अधिक रहती है । लक्षित अनुक्रमण एक अधिक लागत कुशल विकल्प है, खासकर जब व्यक्तियों की एक बड़ी संख्या के अनुक्रमण की आवश्यकता है हो सकता है ।
ओंटारियो Neurodegenerative रोग अनुसंधान पहल (ONDRI) एक बहु मंच, प्रांतीय चौड़ा, प्रेक्षणीय पलटन अध्ययन निस्र्पक सहित पांच Neurodegenerative रोगों, है: 1) अल्जाइमर रोग और हल्के संज्ञानात्मक हानि, 2) पेशीशोषी पार्श्व स्केलेरोसिस, 3) frontotemporal मनोभ्रंश, 4) पार्किंसंस रोग, और 5) संवहनी संज्ञानात्मक हानि8. ONDRI जीनोमिक्स उपसमूह इस पलटना अक्सर छूट, अभी तक अत्यंत महत्वपूर्ण आनुवंशिक परिदृश्य इन phenotypically और आनुवंशिक रूप से विषम रोगों के आधारभूत लक्षण वर्णन के भाग के रूप में स्पष्ट करने के लिए लक्ष्य है । Neurodegenerative रोगों इस प्रकार NGS के तरीके के लिए उपयुक्त उंमीदवारों और विशेष रूप से लक्षित अनुक्रमण के लिए कर रहे हैं ।
हम कस्टम-बनाया गया है एक लक्षित NGS पैनल, ONDRISeq, को अनुक्रम 528 प्रतिभागियों प्रोटीन के लिए ONDRI में शामिल-कोडिंग क्षेत्रों के 80 जीन है कि पहले ब्याज की पांच बीमारियों के साथ संबद्ध किया गया है । इस पद्धति के साथ, हम एक केंद्रित और कुशल तरीके से उच्च गुणवत्ता वाले NGS डेटा का दोहन करने में सक्षम हैं । डिजाइन और कई सामंजस्य अध्ययन के साथ ONDRISeq पैनल के सत्यापन पहले वर्णित किया गया है, जिसके लिए ONDRISeq पैनल के उपंयास की पहचान करने में सक्षम था, 216 के ७२.२% में संभव नैदानिक महत्व के दुर्लभ वेरिएंट पैनल सत्यापन के लिए इस्तेमाल किया मामलों की 9. हालांकि NGS प्रौद्योगिकी तेजी से उंनत और हाल के वर्षों में उल्लेखनीय है, कई शोधकर्ताओं ने एक चुनौती का सामना जब प्रयोग करने योग्य, व्याख्या वेरिएंट10की एक सूची में कच्चे डेटा प्रसंस्करण । इसके अलावा, वेरिएंट की व्याख्या जटिल हो सकता है, खासकर जब कई कि दुर्लभ या उपंयास11के साथ सामना करना पड़ा ।
यहाँ, हम एक उदाहरण के रूप में ONDRISeq अध्ययन का उपयोग करके चरण-दर-चरण तरीके से, लक्षित NGS की कार्यप्रणाली और पुनर्अनुक्रमणन के लिए आवश्यक संबद्ध bioinformatics कार्यप्रवाह, भिन्न कॉलिंग, और भिन्न एनोटेशन का वर्णन करते हैं. NGS डेटा की पीढ़ी के बाद, कच्चे अनुक्रमण फ़ाइलें सही वेरिएंट कॉल करने के क्रम में मानव संदर्भ जीनोम के लिए गठबंधन किया जाना चाहिए । वेरिएंट तो बाद में संस्करण उपचारात्मक प्रदर्शन करने के क्रम में व्याख्या की जानी चाहिए । हम भी सही संस्करण pathogenicity वर्गीकृत करने के लिए चिकित्सा ‘ जेनेटिक्स मानकों और दिशा निर्देशों के अमेरिकी कॉलेज के हमारे कार्यांवयन की व्याख्या करेंगे ।
डीएनए नमूना निष्कर्षण से पथ में ब्याज की है कि जब एक रोगी के निदान, रोग प्रगति, और संभव उपचार के विकल्प पर विचार कर सकते हैं की पहचान करने के लिए, यह महत्वपूर्ण है की विविध प्रकृति की पहचान करने के लिए आवश्यक कार्यप्रणाली दोनों अनुक्रमण और उचित डेटा प्रोसेसिंग के लिए । यहां वर्णित प्रोटोकॉल लक्षित NGS और बाद में संभावित नैदानिक महत्व के दुर्लभ वेरिएंट की पहचान करने के लिए आवश्यक bioinformatic विश्लेषण के उपयोग का एक उदाहरण है । विशेष रूप से, हम ONDRI जीनोमिक्स उपसमूह द्वारा उठाए गए दृष्टिकोण जब ONDRISeq कस्टम डिजाइन NGS पैनल का उपयोग कर प्रस्तुत करते हैं ।
यह मान्यता है कि इन तरीकों एक विशिष्ट NGS मंच के आधार पर विकसित किया गया है और वहाँ अन्य अनुक्रमण प्लेटफार्मों और लक्ष्य संवर्धन किट है कि इस्तेमाल किया जा सकता है । हालांकि, NGS मंच और डेस्कटॉप साधन (सामग्री की तालिका) अपने प्रारंभिक अमेरिकी खाद्य और औषधि प्रशासन (एफडीए) अनुमोदन के आधार पर चुना गया था46। यह प्राधिकरण NGS प्रोटोकॉल की पसंद के साथ किया जा सकता जो उच्च-गुणवत्ता sequencing और अनुक्रमण पर रखा जा सकता जो विश्वसनीयता को प्रतिबिंबित करता है पढ़ता है ।
हालांकि कवरेज की गहराई के साथ सटीक अनुक्रमण पढ़ता प्राप्त करना बहुत महत्वपूर्ण है, अंतिम दुर्लभ संस्करण विश्लेषण के लिए आवश्यक bioinformatics प्रसंस्करण महत्वपूर्ण है और अभिकलनी गहन किया जा सकता है । sequencing प्रक्रिया में उत्पन्न हो सकने वाली त्रुटियों के कई स्रोतों के कारण, एक मज़बूत bioinformatics पाइपलाइन पेश किया जा सकता जो विभिन्न अशुद्धियों के लिए सही होना चाहिए । वे मानचित्रण की प्रक्रिया में, प्रवर्धन पूर्वाग्रह पुस्तकालय की तैयारी में पीसीआर प्रवर्धन द्वारा शुरू की, और प्रौद्योगिकी sequencing कलाकृतियों का उत्पादन47में से उत्पंन हो सकता है । कोई फर्क नहीं पड़ता पढ़ने मैपिंग और भिन्न कॉलिंग करने के लिए उपयोग किया गया सॉफ़्टवेयर, स्थानीय पुनर्संरेखण, डुप्लिकेट मैप की गई पढ़ता को निकालने, और भिन्न रूप से कॉल करते समय गुणवत्ता नियंत्रण के लिए उचित पैरामीटर सेट करने सहित इन त्रुटियों को कम करने के लिए सामान्य तरीके हैं । इसके अतिरिक्त, भिन्नता कॉलिंग के दौरान चुने गए पैरामीटर्स के आधार पर अध्ययन के लिए सबसे उपयुक्त क्या है हाथ11भिन्न हो सकते हैं । न्यूनतम कवरेज और एक संस्करण और आसपास के न्यूक्लियोटाइड कि यहां लागू किया गया के गुणवत्ता स्कोर के रूप में उपयुक्त विशिष्टता और संवेदनशीलता के बीच एक संतुलन बनाने के लिए चुना गया । इन मापदंडों ONDRISeq पैनल के लिए मान्य किया गया है के आधार पर तीन अलग आनुवंशिक तकनीक के साथ सामंजस्य कॉलिंग, के रूप में पहले वर्णित, सहित: 1) चिप आधारित genotyping; 2) allelic भेदभाव परख; और 3)9सैंज अनुक्रमण ।
सही संस्करण बुला निंनलिखित, क्रम में संभावित नैदानिक महत्व, एनोटेशन और उपचारात्मक के उन निर्धारित करने के लिए आवश्यक हैं । अपनी खुली पहुंच मंच के कारण, ANNOVAR दोनों एनोटेशन और प्रारंभिक संस्करण स्क्रीनिंग या उंमूलन के लिए एक उत्कृष्ट उपकरण है । के अलावा आसानी से सुलभ जा रहा है, ANNOVAR किसी भी VCF फ़ाइल के लिए लागू किया जा सकता है, कोई बात नहीं क्या अनुक्रमण मंच प्रयोग किया जाता है, और शोध26की जरूरतों के आधार पर अनुकूलन योग्य है ।
एनोटेशन के बाद, वेरिएंट यदि वे नैदानिक महत्व के होना करने के लिए विचार किया जाना चाहिए यह निर्धारित करने के लिए व्याख्या की जानी चाहिए । न केवल यह प्रक्रिया जटिल हो जाता है, लेकिन यह अक्सर मनोवाद और मानव त्रुटि के लिए प्रवण है । इस कारण से, ACMG किसी भी संस्करण के pathogenicity के लिए सबूत का आकलन करने के लिए दिशानिर्देश निर्धारित किया है । हम एक गैर पर्याय, दुर्लभ संस्करण आधारित मैनुअल उपचारात्मक दृष्टिकोण है, जो इन दिशानिर्देशों के आधार पर निर्माण किया है और व्यक्तिगत रूप से प्रत्येक संस्करण है कि एक कस्टम डिजाइन अजगर स्क्रिप्ट के साथ पाइप लाइन के माध्यम से पारित करने में सक्षम है आकलन द्वारा सुरक्षा लागू है कि दिशानिर्देशों के आधार पर वेरिएंट को वर्गीकरण । इस तरह, प्रत्येक संस्करण रोगजनक की एक रैंकिंग, संभावना रोगजनक, अनिश्चित महत्व, की संभावना सौम्य, या सौम्य सौंपा है, और हम संस्करण उपचारात्मक प्रक्रिया के लिए मानकीकरण और पारदर्शिता जोड़ने में सक्षम हैं । यह पहचान करने के लिए महत्वपूर्ण है कि संस्करण उपचारात्मक के विशेष, bioinformatics पाइपलाइन से परे, अनुसंधान की जरूरतों के आधार पर व्यक्तिगत रूप से किया जाएगा, और इसलिए प्रस्तुत तरीके के दायरे से परे था ।
हालांकि यहां प्रस्तुत तरीके ONDRI के लिए विशिष्ट हैं, जब ब्याज की संवैधानिक रोगों की एक बड़ी संख्या पर विचार अनुवाद किया जा सकता है वर्णित कदम । कई phenotypes के लिए जीन संघों की संख्या में वृद्धि के रूप में, लक्षित NGS एक दृष्टिकोण है कि पिछले अनुसंधान कि क्षेत्र में किया गया है पर कैपिटल कर सकते है प्रेरित परिकल्पना के लिए अनुमति देता है । फिर भी, वहां लक्षित NGS और पद्धति प्रस्तुत करने की सीमाएं हैं । केवल जीनोम के विशिष्ट क्षेत्रों पर ध्यान केंद्रित करके, खोज के क्षेत्रों में रुचि के उपंयास alleles तक ही सीमित हैं । इसलिए, उपंयास जीन या अंय जीनोमिक loci अनुक्रमण लक्ष्य है, जो WGS या वेस दृष्टिकोण के साथ पता चला सकता है, की पहचान नहीं की जा सकती द्वारा कवर से परे । वहां भी जीनोम के भीतर क्षेत्र है कि NGS दृष्टिकोण के साथ सही अनुक्रम के लिए मुश्किल हो सकता है, दोहराया दृश्यों का एक उच्च डिग्री के साथ उन सहित48 या उन है कि जीसी सामग्री में अमीर है49। सौभाग्य से, जब लक्षित NGS का उपयोग, वहां एक प्राथमिकताओं जीनोमिक क्षेत्रों के साथ अपनेपन का एक उच्च डिग्री है अनुक्रम, और क्या इन तकनीकी चुनौतियों का सामना हो सकता है । अंत में, वर्तमान में NGS डेटा से प्रतिलिपि संख्या वेरिएंट का पता लगाने के मानकीकृत50नहीं है । हालांकि, इन चिंताओं के bioinformatics समाधान क्षितिज पर हो सकता है; नए अभिकलनी उपकरण ONDRI रोगियों में भिन्नता के इन अतिरिक्त रूपों का विश्लेषण करने में मदद कर सकते हैं.
अपनी सीमाओं के बावजूद, लक्षित NGS उच्च गुणवत्ता वाले डेटा प्राप्त करने में सक्षम है, एक परिकल्पना के भीतर संचालित दृष्टिकोण है, जबकि शेष अपने WGS और वेस समकक्षों की तुलना में कम खर्चीला । न केवल इस पद्धति कुशल और निर्देशित अनुसंधान के लिए उपयुक्त है, लक्षित NGS के नैदानिक कार्यांवयन तेजी से बढ़ रहा है । इस तकनीक में विभिन्ना रोगों के आणविक मार्ग के संबंध में कई तरह के सवालों के जवाब दिए जा रहे हैं. यह भी अपेक्षाकृत कम लागत पर एक सटीक नैदानिक उपकरण में विकसित किया जा रहा है जब वेस और WGS का विरोध किया । यहां तक कि जब सोने की तुलना में मानक सैंज अनुक्रमण, लक्षित NGS अपने समय में प्रतिस्पर्धा कर सकते है और लागत कुशलता । इन कारणों के लिए, यह एक वैज्ञानिक या चिकित्सक जो प्राप्त करता है और NGS डेटा का उपयोग करता है के लिए महत्वपूर्ण है, उदाहरण के लिए, एक प्रयोगशाला या नैदानिक रिपोर्ट में पाठ के रूप में दिया, को समझने के लिए जटिल “ब्लैक बॉक्स” कि परिणाम पर निर्भर । यहां प्रस्तुत तरीकों में मदद करनी चाहिए उपयोगकर्ताओं को NGS डेटा की पीढ़ी और व्याख्या अंतर्निहित प्रक्रिया को समझते हैं ।
The authors have nothing to disclose.
हम अपने अध्ययन के साथ उनकी सहमति और सहयोग के लिए सभी ONDRI प्रतिभागियों का शुक्रिया अदा करना चाहेंगे । ONDRI जांचकर्ताओं के लिए धंयवाद (www । ONDRI.ca/people), हमारे नेतृत्व जांचकर्ता (MJS), और ONDRI शासी समितियों सहित: कार्यकारी समिति, संचालन समिति, प्रकाशन समिति, भर्ती समिति, मूल्यांकन प्लेटफार्मों, और परियोजना प्रबंधन टीम । हम उनकी तकनीकी विशेषज्ञता के लिए लंदन के रीजनल जीनोमिक्स सेंटर का भी शुक्रिया अदा करते हैं । AAD लंदन और मिडिलसेक्स परास्नातक स्नातक अनुसंधान छात्रवृत्ति के अल्जाइमर सोसायटी द्वारा समर्थित है । SMKF ALS कनाडा टिम ई. Noël Postdoctoral फैलोशिप द्वारा समर्थित है ।
4 ml EDTA K2 tubes | Fisher Scientific | 02-689-4 | |
1 M Tris Buffer | Bio Basic Canada Inc. | SD8141 | |
Gentra Puregene Blood Kit | Qiagen | 158389 | 1000 mL Kit. This is the blood extraction kit, referred to in step 1.3. |
NanoDrop-1000 Spectrophotometer | Thermo Fisher Scientific | ND-2000 | Replaced by the NanoDrop-2000 Spectrophotometer. This is the full-spectrum spectrophotometer, referred to in steps 1.4 and 2.1.2. |
Qubit 2.0 fluorometer | Invitrogen | Q32866 | This is a fluorometer appropriate for the quantification of DNA, referred to in steps 2.1.4, 2.1.6, 2.2.3, and 3.1.3. |
Nextera Rapid Custom Capture Enrichment Kit | Illumina, Inc. | FC-140-1009 | Specifically designed for the ONDRISeq panel, sequencing the exons of 80 genes, resulting in 971,388 base pairs of sequence in paired-end reads of 150 bases in length; 288 samples per kit. This is the target enrichment kit, referred to in steps 2.2, 2.2.2, 2.2.3, 3.1.5, 3.1.6, 3.4.1, and the Discussion. |
2100 BioAnalyzer | Agilent Technologies | G2939BA | This is a automated electrophoresis system, referred to in step 3.1.4. |
High Sensitivity DNA Reagent Kit | Agilent Technologies | 5067-4626 | 110 Samples per kit; This is a DNA quality analysis kit, referred to in step 3.1.4. |
MiSeq Reagent Kit v3 | Illumina, Inc. | MS-102-3003 | 600 Cycle Kit; This is the NGS desktop instrument reagent kit, referred to in step 3.1. |
MiSeq Personal Genome Sequencer | Illumina, Inc. | SY-410-1003 | This is a NGS desktop instrument, referred to in steps 2.2.1, 3.1, 3.1.1, 3.1.2, 3.1.8, 3.2, 4.2.6, the Representative Results, and the Discussion. |
Experiment Manager | Illumina, Inc. | This is NGS technology software, referred to in step 3.1.1 and Figure 1. https://support.illumina.com/sequencing/sequencing_software/experiment_manager/downloads.html | |
BaseSpace | Illumina, Inc. | SW-410-1000 | This is a cloud-based computing environment, referred to in steps 3.1.2, 3.2, 3.3, 3.3.1, 3.3.2, 3.4, 3.4.1, 3.4.2 and 3.4.3. https://basespace.illumina.com/ |
CLC Genomics Workbench 10.1.1 | Qiagen | 832000 | Open source options for data pre-processing are also available that can model the workflow used in this protocol. This is the software used for data pre-processing, referred to throughout step 4 and in Figure 2. |
Annotate Variation | http://annovar.openbioinformatics.org/en/latest/user-guide/download/ | ||
RefSeq | National Center for Biotechnology Information | https://www.ncbi.nlm.nih.gov/refseq/ | |
dbSNP138 | National Center for Biotechnology Information | https://www.ncbi.nlm.nih.gov/projects/SNP/snp_summary.cgi?view+summary=view+summary&build_id=138 | |
Exome Aggregation Consortium | Broad Institute | http://exac.broadinstitute.org/ | |
National Heart, Lung, and Blood Institute Exome Sequencing Project European Cohort | University of Washington and the Broad Institute | http://evs.gs.washington.edu/EVS/ | |
ClinVar | National Center for Biotechnology Information | https://www.ncbi.nlm.nih.gov/clinvar/ | |
Combined Annotation Dependent Depletion | University of Washington and Hudson-Alpha Institute for Biotechnology | http://cadd.gs.washington.edu/ | |
Sorting Intolerant from Tolerant | J. Craig Venter Instutite | http://sift.jcvi.org/ | |
PolyPhen-2 | Brigham and Women's Hospital, Harvard Medical School | http://genetics.bwh.harvard.edu/pph2/ | |
Human Gene Mutation Database | Qiagen | 834050 | This is a disease mutation database, referred to in step 5.2 and the Representative Results. https://portal.biobase-international.com/cgi-bin/portal/login.cgi?redirect_url=/hgmd/pro/start.php |
Splicing-based Analysis of Variants | Frey lab, University of Toronto | http://tools.genes.toronto.edu/ | |
Human Splicing Finder | Aix Marseille Université | http://www.umd.be/HSF3/HSF.shtml | |
Other materials | |||
Centrifuge | |||
Disposable transfer pipets |