Burada, birçok insan ve model organizma veritabanlarına verimli bir şekilde erişmek ve analiz etmek için bir protokol salıyoruz. Bu protokol, yeni nesil sıralama çalışmalarından tanımlanan hastalığa neden olan aday varyantları analiz etmek için MARRVEL kullanımını göstermektedir.
İnsan genetikçiler, bütün eksom/genom dizilimi sayesinde hastalık fenomenilerle ayrıştıran nadir varyantları tanımlarlar. Belirli bir varyantın patojenik olup olmadığını değerlendirmek için, ilgi geninin genetik bir hastalıkla bağlantılı olup olmadığını, belirli varyantın daha önce bildirilip bildirilmediğini ve model organizmada hangi işlevsel verilerin mevcut olduğunu belirlemek için birçok veritabanını sorgulamak gerekir. genin insandaki işlevi hakkında ipuçları verebilecek veritabanları. MARRVEL (Nadir Varyant Patlaması için Model organizma Toplu Kaynaklar) fare, fare, zebra balığı, meyve sineği, nematod solucanı, fizyon dahil olmak üzere yedi model organizmada insan genleri ve varyantları ve bunların ortolog genleri için tek noktadan oluşan bir veri toplama aracıdır. maya ve tomurcuklanan maya. Bu Protokol’de, MARRVEL’in ne için kullanılabileceğine genel bir bakış sunmaktayız ve bilinen bir hastalığa neden olan gende (VUS) bilinmeyen öneme (VUS) veya belirsiz öneme sahip bir genin (GUS) varyantının nasıl kullanılabileceğini değerlendirmek için farklı veri kümelerinin nasıl kullanılabileceğini tartışıyoruz. Patojenik. Bu protokol, bir kullanıcı geni ile başlayan ve ilgi nin bir varyantı olmayan birden fazla insan veritabanını aynı anda arayarak bir kullanıcıya rehberlik edecektir. Ayrıca OMIM, ExAC/gnomAD, ClinVar, Geno2MP, DGV ve DECHIPHER’den gelen verilerin nasıl kullanılacağını tartışıyoruz. Ayrıca, her insan geni ile ilişkili model organizmalarda ortolog aday genlerinin, ifade kalıplarının ve GO terimlerinin bir listesini nasıl yorumlanacağımızı gösteriyoruz. Ayrıca, sağlanan değer protein yapısal etki alanı ek açıklamaları tartışmak ve ilgi bir varyant evrimsel olarak korunmuş etki alanı veya amino asit etkiler olup olmadığını değerlendirmek için birden fazla tür protein hizalama özelliği nasıl kullanılacağını açıklar. Son olarak, bu web sitesinin üç farklı kullanım durumlarını tartışacağız. MARRVEL, hem klinik hem de temel araştırmacılar için tasarlanmış kolay erişilebilir bir açık erişim web sitesidir ve fonksiyonel çalışmalar için deneyler tasarlamak için bir başlangıç noktası olarak hizmet vermektedir.
Yeni nesil sıralama teknolojisinin kullanımı hem araştırma hem de klinikgenetik laboratuvarlarda genişlemektedir 1. Bütün eksozum (WES) ve tüm genom dizilemesi (WGS) analizleri, bilinen hastalığa neden olan genlerde bilinmeyen önemi (VUS) ve mendeli bir hastalıkla henüz ilişkili olan genlerdeki varyantları (GUS: belirsiz genler) ortaya koymaktadır. önemi). Klinik dizi raporunda gen lerin ve varyantların bir listesini sunan tıbbi genetikçiler, hangi varyantın hastada görülen belirli bir fenotipten sorumlu olabileceğini değerlendirmek için daha fazla bilgi edinmek için birden fazla çevrimiçi kaynağı el ile ziyaret etmelidir. . Bu süreç zaman alıcıdır ve etkinliği son derece bireyin uzmanlığına bağlıdır. Çeşitli kılavuz kağıtları yayınlanmış olmasına rağmen2,3, WES ve WGS yorumu henüz varyant analizi için standart bir metodoloji olduğu için manuel kürleme gerektirir. VUS’un yorumlanması için, daha önce bildirilen genotip-fenotip ilişkisi, kalıtım şekli ve genel popülasyondaki alel frekansları hakkındaki bilgiler değerli hale gelir. Buna ek olarak, varyantın kritik bir protein etki alanını mı etkilediği veya evrimsel olarak korunmuş bir kalıntının patojenizlik olasılığını artırıp azaltabileceği bilgisi de artabilir veya azaltabilir. Tüm bu bilgileri toplamak için, bilgi World Wide Web’e dağılmış olduğundan, genellikle 10-20 insan ve model organizma veritabanlarında gezinmek gerekir.
Benzer şekilde, belirli genler ve yollar üzerinde çalışan model organizma bilim adamları genellikle bulgularını insan hastalığı mekanizmalarına bağlamakla ilgilenirler ve insan genomik alanında üretilen bilgiden yararlanmak isterler. Ancak, insan genomu ile ilgili veri setlerinin hızla genişlemesi ve evrimi nedeniyle, yararlı bilgiler sağlayan veritabanlarını belirlemek zor olmuştur. Buna ek olarak, çoğu model organizma veritabanları günlük olarak belirli bir organizma ile çalışan araştırmacılar için tasarlanmış olduğundan, çok zordur, örneğin, bir fare araştırmacı için bir Drosophila veritabanında belirli bilgileri aramak için ve tam tersi. Tıbbi genetikçiler tarafından yapılan varyant yorumlama araştırmalarına benzer şekilde, yararlı insan ve diğer model organizma bilgilerinin tanımlanması zaman alıcıdır ve model organizma araştırmacısının arka planına büyük ölçüde bağlıdır. MARRVEL (Nadir Varyant Patlaması için Model organizma Toplu Kaynaklar) 4, her iki kullanıcı grubu için de iş akışlarını kolaylaştırmak için tasarlanmış bir araçtır.
MARRVEL (http://marrvel.org) klinisyenler ve araştırmacılar için verimli ve tutarlı bir şekilde sistematik veri toplayan merkezi bir arama motoru olarak tasarlanmıştır. 20 veya daha fazla kamuya açık veritabanlarından gelen bilgilerle, bu program kullanıcıların hızlı bir şekilde bilgi toplamasına ve yinelemeli aramalar yapmadan çok sayıda insan ve model organizma veritabanlarına erişmesine olanak tanır. Arama sonuç sayfaları, bireylerin ham verilere erişmesine ve kaynaklar tarafından sağlanan ek bilgileri toplamasına olanak tanıyan orijinal bilgi kaynaklarına köprüler de içerir.
VCF veya BAM dosyaları ve genellikle tescilli/ticari yazılım yüklemeleri şeklinde büyük sıralama veri girişi gerektiren varyant önceliklendirme araçlarının çoğu aksine, MARRVEL herhangi bir web tarayıcısında çalışır. İnternete bağlı olduğu sürece ücretsiz olarak kullanılabilir ve taşınabilir cihazlarla (örn. akıllı telefonlar, tabletler) uyumludur. Birçok klinisyen ve araştırmacı genellikle bir seferde bir veya birkaç gen ve varyantları aramak gerekir bu yana biz bu biçimi seçti. MarrveL için toplu indirme ve API (uygulama programlama arabirimi) özellikleri geliştirdiğimizi ve kullanıcıların gerekirse özelleştirilmiş sorgu araçları aracılığıyla bir seferde yüzlerce gen ve varyantı bir seferde küratörlük edebilmelerini sağlayacağımızı unutmayın.
Geniş uygulama yelpazesi nedeniyle, bu protokolde, MARRVEL’in görüntülediğimiz farklı veri kümelerinde nasıl gezineceğiniz konusunda geniş kapsamlı bir yaklaşım açıklayacağız. Belirli kullanıcıların ihtiyaçlarına göre uyarlanmış daha fazla hedeflenen örnek Temsilci Sonuçları bölümünde açıklanacaktır. MarrveL çıktısı hala değerli bilgileri ayıklamak için insan genetiği veya model organizmalar da arka plan bilgisi belirli bir düzeyde gerektirir dikkat etmek önemlidir. Okuyucuları, MARRVEL küratörlüğünde bulunan orijinal veritabanlarının her birinin işlevini açıklayan birincil kağıtları listeleyen tabloya yönlendiririz (Tablo 1). Aşağıdaki protokol üç bölüme ayrılmıştır: (1) Bir aramaya nasıl başlanır, (2) MARRVEL insan genetiği çıktılarının nasıl yorumlanacağı ve (3) MARRVEL’deki model organizma verilerinin nasıl kullanılacağı. Temsilci Sonuçları bölümünde daha odaklı ve özel yaklaşımlar açıklanmıştır. MARRVEL aktif olarak güncellenmektedir, bu nedenle veri kaynakları hakkında ayrıntılı bilgi için lütfen geçerli web sitesinin SSS sayfasına bakın. MARRVEL ana sayfasının alt kısmındaki e-posta gönderimi formu aracılığıyla güncelleme bildirimleri almak için MARRVEL kullanıcılarının kaydolmasını önemle tavsiye ederiz.
Bu protokoldeki kritik adımlar, ilk girişi (adım 1.1-1.3) ve çıktının sonraki yorumunu içerir. Arama sonuçlarının negatif olmasının en yaygın nedeni, bir genin ve/veya varyantın tanımlanabileceği birçok yololmasıdır. MARRVEL zamanlanan bazda güncelleştirilirken, bu güncelleştirmeler MARRVEL’in bağlantı verdiği farklı veritabanları arasındaki kopukluklara neden olabilir. Bu nedenle, sorun gidermedeki ilk adım, genin veya varyantın alternatif adlarının başarılı bir arama sonucuna yol pa…
The authors have nothing to disclose.
Dr. Rami Al-Ouran, Seon-Young Kim, Yanhui (Claire) Hu, Ying-Wooi Wan, Naveen Manoharan, Sasidhar Pasupuleti, Aram Comjean, Dongxue Mao, Michael Wangler, Hsiao-Tuan Chao, Stephanie Mohr ve Norbert Perrimon’a gelişim deki desteklerinden dolayı teşekkür ederiz. MARRVEL bakımı. Samantha L. Deal ve J. Michael Harnish’e bu el yazmasına yaptıkları katkıları için minnettarız.
MARRVEL’in ilk gelişimi kısmen NIH Commonfund (U54NS093793) ve NIH Araştırma Altyapı Programları Ofisi (ORIP) (R24OD022005) aracılığıyla Teşhis Edilmemiş Hastalıklar Ağ Modeli Organizmalar Tarama Merkezi tarafından desteklenmiştir. JW NIH Eunice Kennedy Shriver Ulusal Çocuk Sağlığı ve İnsangelişimi Enstitüsü (F30HD094503) ve Robert ve Janice McNair Vakfı McNair MD / Doktora Öğrenci Akademik Programı BCM tarafından desteklenmektedir. HJB, NIH Ulusal Genel Tıp Bilimleri Enstitüsü (R01GM067858) tarafından daha da desteklenir ve Howard Hughes Tıp Enstitüsü’nde araştırmacıdır. ZL, NIH Ulusal Genel Tıp Bilimleri Enstitüsü (R01GM120033), Ulusal Yaşlanma Enstitüsü (R01AG057339) ve Huffington Vakfı tarafından desteklenir. SY, NIH Ulusal Sağırlık ve Diğer İletişim Bozuklukları Enstitüsü (R01DC014932), Simons Vakfı (SFARI Ödülü: 368479), Alzheimer Derneği (Yeni Araştırmacı Araştırma Bursu: 15-364099), Naman Ailesi’nden ek destek aldı. Temel Araştırma Fonu ve Caroline Wiess Hukuk Fonu Moleküler Tıp Araştırma için.
Human Genetics | ClinVar | PMID: 29165669 | https://www.ncbi.nlm.nih.gov/clinvar/ |
Human Genetics | DECIPHER | PMID: 19344873 | https://decipher.sanger.ac.uk/ |
Human Genetics | DGV | PMID: 24174537 | http://dgv.tcag.ca/dgv/app/home |
Orthology Prediction | DIOPT | PMID: 21880147 | https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl |
Human Gene/Transcript Nomenclature | Ensembl | PMID: 29155950 | https://useast.ensembl.org/ |
Human Genetics | ExAC | PMID: 27535533 | http://exac.broadinstitute.org/ |
Primary Model Organism Databases | FlyBase (Drosophila) | PMID:26467478 | http://flybase.org |
Model Organism Database Integration Tools | Gene2Function | PMID: 28663344 | http://www.gene2function.org/search/ |
Human Genetics | Geno2MP | N/A | http://geno2mp.gs.washington.edu/Geno2MP/ |
Human Genetics | gnomAD | PMID: 27535533 | http://gnomad.broadinstitute.org/ |
Gene Ontology | GO Central | PMID: 10802651, 25428369 | http://www.geneontology.org/ |
Human Gene/Protein Expression | GTEx | PMID: 29019975, 23715323 | https://gtexportal.org/home/ |
Human Gene Nomenclature | HGNC | PMID: 27799471 | https://www.genenames.org/ |
Primary Model Organism Databases | IMPC (mouse) | PMID: 27626380 | http://www.mousephenotype.org/ |
Primary Model Organism Databases | MGI (mouse) | PMID:25348401 | http://www.informatics.jax.org/ |
Model Organism Database Integration Tools | Monarch Initiative | PMID: 27899636 | https://monarchinitiative.org/ |
Human Variant Nomenclature | Mutalyzer | PMID: 18000842 | https://mutalyzer.nl/ |
Human Genetics | OMIM | PMID: 28654725 | https://omim.org/ |
Primary Model Organism Databases | PomBase (fission yeast) | PMID:22039153 | https://www.pombase.org/ |
Literature | PubMed | N/A | https://www.ncbi.nlm.nih.gov/pubmed/ |
Primary Model Organism Databases | RGD (rat) | PMID:25355511 | https://rgd.mcw.edu/ |
Primary Model Organism Databases | SGD (budding yeast) | PMID: 22110037 | https://www.yeastgenome.org/ |
Human Gene/Protein Expression | The Human Protein Atlas | PMID: 21752111 | https://www.proteinatlas.org/ |
Primary Model Organism Databases | WormBase (C. elegans) | PMID:26578572 | http://wormbase.org |
Primary Model Organism Databases | ZFIN (zebrafish) | PMID:26097180 | https://zfin.org/ |