Summary
ここでは、多くのヒトおよびモデル生物データベースに効率的にアクセスして分析するためのプロトコルを提示する。このプロトコルは、次世代シーケンシングの取り組みから同定された候補疾患を引き起こす変異体を分析するためにMARRVELを使用することを示しています。
Abstract
全エキソメ/ゲノムシーケンシングを通じて、ヒト遺伝学者は疾患現象と分離する稀な変異体を同定する。特定の変異体が病原性であるかどうかを評価するには、多くのデータベースを照会して、対象遺伝子が遺伝病に関連しているかどうか、特定の変異体が以前に報告されているかどうか、およびモデル生物で利用可能な機能データを判別する必要があります。ヒトにおける遺伝子の機能に関する手がかりを提供する可能性のあるデータベース。MARRVEL(希少変異体探索のためのモデル生物集約リソース)は、マウス、ラット、ゼブラフィッシュ、フルーツフライ、線虫、核分裂を含む7つのモデル生物におけるヒト遺伝子および変異体およびその直腸遺伝子のためのワンストップデータ収集ツールです。酵母、および発芽酵母。このプロトコルでは、MARRVELが何に使用できるかの概要を説明し、既知の疾患を引き起こす遺伝子における未知の有意性(VUS)の変異体または不確定有意性(GUS)の遺伝子の変異体が可能であるかどうかを評価するために、異なるデータセットをどのように使用できるかを議論します。病原 性。このプロトコルは、関心のある変異体の有無にかかわらず、ヒト遺伝子から始まる複数のヒトデータベースを同時に検索する方法をユーザーに案内します。また、OMIM、ExAC/gnomAD、クリンバー、ジェノ2MP、DGV、デチッパーのデータの活用方法についても説明します。さらに、各ヒト遺伝子に関連するモデル生物におけるオルテオログ候補遺伝子、発現パターン、およびGO項のリストを解釈する方法を示す。さらに、我々は提供される価値タンパク質構造ドメインアノテーションについて議論し、多種タンパク質アライメント機能を使用して、目的の変異体が進化的に保存されたドメインまたはアミノ酸に影響を与えるかどうかを評価する方法を説明する。最後に、このウェブサイトの3つの異なるユースケースについて説明します。MARRVELは臨床および基礎研究者のために設計されている容易にアクセス可能なオープンアクセスのウェブサイトであり、機能的研究のための実験を設計するための出発点として役立つ。
Introduction
次世代シーケンシング技術の使用は、研究と臨床遺伝研究所の両方で拡大しています 1.全エキソメ(WES)と全ゲノムシーケンシング(WGS)の解析により、既知の疾患を引き起こす遺伝子における未知の有意性(VUS)の多くの稀な変異体と、メンデリアン病(GUS:不確定遺伝子)にまだ関連していない遺伝子の変異体が多数明らかになっています。意義)。臨床配列報告書に遺伝子と変異体のリストを提示し、医療遺伝学者は、関心のある患者に見られる特定の表現型に対してどの変異体が関与している可能性があるかを評価するために、複数のオンラインリソースを手動で訪問する必要があります。.このプロセスは時間がかかり、その有効性は個人の専門知識に大きく依存します。いくつかのガイドライン論文が2、3に発表されているが、WESとWGSの解釈は、バリアント分析のための標準化された方法論がまだないので、手動キュレーションを必要とする。VUSの解釈では、以前に報告された遺伝子型表現型関係、継承の様式、および一般集団における対立遺伝子頻度に関する知識が貴重になる。さらに、変異体が重要なタンパク質ドメインに影響を与えるか、または進化的に保存された残基に影響を与えるかについての知識は、病原性の可能性を増加または減少させる可能性がある。これらの情報をすべて収集するには、通常、情報が World Wide Web を介して散在するため、10 ~ 20 人の人間およびモデルの生物データベースをナビゲートする必要があります。
同様に、特定の遺伝子や経路に取り組むモデル生物科学者は、その知見をヒトの疾患メカニズムに結び付け、ヒトゲノム分野で生み出されている知識を活用したいと考えていることが多い。しかし、ヒトゲノムに関するデータセットの急速な拡大と進化により、有用な情報を提供するデータベースの特定は困難でした。また、ほとんどのモデル生物データベースは、日常的に特定の生物を扱う研究者のために設計されているので、例えば、マウス研究者がショウジョウバエデータベース内の特定の情報を検索することは非常に困難です。その逆も同様です。医学遺伝学者によって行われるバリアント解釈検索と同様に、有用なヒトおよび他のモデル生物情報の同定は時間がかかり、モデル生物研究者の背景に大きく依存する。MARRVEL(希少バリアント探索のためのモデル生物集約リソース)4は、ワークフローを合理化するために、ユーザーの両方のグループのために設計されたツールです。
MARRVEL(http://marrvel.org)は、臨床医や研究者のために効率的かつ一貫した方法で体系的にデータを収集する集中検索エンジンとして設計されました。20以上の一般に利用可能なデータベースからの情報を使用すると、このプログラムは、ユーザーが迅速に情報を収集し、再検索なしで人間やモデルの生物データベースの多数にアクセスすることができます。検索結果ページには、元の情報源へのハイパーリンクも含まれているため、個人は生データにアクセスし、ソースから提供される追加情報を収集できます。
VCFまたはBAMファイルの形式で大規模なシーケンスデータ入力を必要とするバリアントの優先順位付けツールの多くとは対照的に、MARRVELは、多くの場合、独自の/商用ソフトウェアのインストール、任意のWebブラウザ上で動作します。インターネットに接続している限り、スマートフォンやタブレットなどのポータブルデバイスと無償で使用できます。多くの臨床医や研究者は、通常、一度に1つまたはいくつかの遺伝子と変異体を検索する必要があるため、私たちは、この形式を選択しました.私たちは、最終的にユーザーが必要に応じてカスタマイズされたクエリツールを介して一度に数百の遺伝子やバリアントをキュレーションできるように、MARRVEL用のバッチダウンロードとAPI(アプリケーションプログラミングインタフェース)機能を開発しています。
アプリケーションの広い範囲のために、このプロトコルでは、MARRVELが表示する異なるデータセットをナビゲートする方法に関する広く包括的なアプローチを説明します。特定のユーザーのニーズに合わせて調整された、よりターゲットを絞った例については、「代表的な結果」セクションで説明します。MARRVELの出力は、貴重な情報を抽出するために、ヒト遺伝学またはモデル生物のいずれかで一定のバックグラウンド知識を必要とすることに注意することが重要です。読者は、MARRVEL (表 1) によってキュレーションされた各元のデータベースの機能を説明する一次論文を一覧表示する表を参照します。次のプロトコルは、(1)検索の開始方法、(2)MARRVELヒト遺伝学の出力の解釈方法、(3)MARRVELにおけるモデル生物データの利用方法の3つのセクションに分かれています。「代表的な結果」セクションでは、より焦点を絞った具体的なアプローチについて説明します。MARRVELは積極的に更新中ですので、データソースの詳細については、現在のウェブサイトのFAQページをご覧ください。MARRVELのホームページ下部にある電子メール送信フォームを通じて更新通知を受け取るために、MARRVELのユーザーがサインアップすることを強くお勧めします。
Subscription Required. Please recommend JoVE to your librarian.
Protocol
1. 検索を開始する方法
- ヒト遺伝子およびバリアントベースの検索については、手順 1.1.1.-1.1.2 を実行します。ヒト遺伝子ベースの検索(バリアント入力なし)の場合は、ステップ1.2に進みます。モデル生物の遺伝子ベースの検索については、手順 1.3.1.-1.3.2 を参照してください。
- http://marrvel.org/のMARRVEL4のホームページに移動します。まず、ヒト遺伝子シンボルを入力します。候補遺伝子名が各文字入力の入力ボックスの下に表示されていることを確認します。検索が陰性に戻った場合は、HUGO遺伝子命名法委員会のウェブサイト5(HGNC;https://www.genenames.org/)を使用して、使用される遺伝子シンボルが最新であることを確認してください。
- 人間のバリアントを入力します。検索バーは、ExACおよびGnomAD6でバリアントが表示される方法に似たゲノム位置と、HGVSガイドラインに従ってトランスクリプトベースの命名法の2種類のバリアント命名法と互換性があります。このような形式の例は、検索ボックス内の灰色のテキストで示されています。ゲノム位置命名法の場合は、hg19/GRCh37 に従って座標を使用します。
注: 検索でエラーが返された場合、最も一般的な問題は、遺伝子シンボルが最新でないか、バリアント命名法が正しくないかです。このような場合、HGNC (https://www.genenames.org/)、ムタライザー7 (https://www.mutalyzer.nl/)、および TransVar8 (https://bioinformatics.mdanderson.org/transvar/) Web サイトは、エラーを修正するための優れたリソースです。HGNCは、すべてのヒト遺伝子に公式遺伝子記号とそのエイリアスを提供します。 - 遺伝子名が最新であることを確認した後もエラーメッセージが表示される場合は、Mutalyzer と TransVar を使用してバリアントの命名法を確認および変換します。
- HGNCのごく最近の遺伝子シンボルの変化など、遺伝子の同義語を使用して、ソースデータを更新するために「フィードバック」タブを使用してMARRVELオペレーティングチームに連絡してください。日付。
- ヒト遺伝子シンボルを入力し、ヒトバリアント検索バーを空白のままにします。エラーが発生した場合は、HGNC (https://www.genenames.org/) に移動して公式遺伝子シンボルを確認するか、古い遺伝子シンボルを試してください。
- 上部バナー(図1)の「モデル生物検索」タブをクリックするか、http://marrvel.org/modelに移動します。選択したモデル生物を選択し、モデル生物遺伝子シンボルを入力します。名前が自動完成したので、遺伝子シンボルをクリックし、[検索]をクリックします。検索結果が陰性の場合は、モデル生物データベースで使用されている公式遺伝子シンボルを確認してください(表1)。
- 検索結果が依然として負の場合は、DIOPT (DRSC 統合オルソログ予測ツール、https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl) および HCOP (https://www.genenames.org/tools/hcop/) にアクセスして、良好な予測オルソログがないかどうかを評価します。関心のある遺伝子。DIOPTはDRSC(ショウジョウバエRNAiスクリーニングセンター)が運営するオルソログ予測検索エンジンで、HCOPはHGNCが開発した同様のスイートです。
注: BLAST (https://blast.ncbi.nlm.nih.gov/Blast.cgi) を使用した追加の検索により、DIOPT および HCOP で使用される予測アルゴリズムによって見逃される可能性のあるオルソログをユーザーが見つけることができます。 - 選択の予測人間のオルトログの下部にある MARRVEL をクリックします。DIOPTスコア9とモデル生物にヒト遺伝子からのベストスコアをチェックしますか?ヒト遺伝子の選択のために。手順 2 に進みます。
注:DIOPTスコア9(https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl)は、2つの生物の遺伝子のペアが互いにオルソロゴスであると予測するオルソログ予測アルゴリズムの数の値です。これらの値と、このスコアの計算に使用される特定のアルゴリズムの詳細については、Hu et al9を参照してください。ヒト遺伝子からモデル生物へのベストスコアが「はい」の場合、ヒト遺伝子が目的の遺伝子の真のヒトオルソログである可能性が高いことを示していますが、特に複数のヒト遺伝子がオルソロゴスである場合は例外が発生する可能性があります。進化中の遺伝子複製事象による複数のモデル生物遺伝子。対象遺伝子が複数の種で多様な進化を遂げた複雑な遺伝子ファミリーの一員である場合、ユーザーは、関心のある遺伝子ファミリーの広範な系統解析を行った出版物を特定し、最も多くを同定する必要があります。可能性の高いオルトログ候補遺伝子。
2. 遺伝子と変異体の検索のためのMARRVELヒト遺伝学の出力を解釈する方法
注: 結果ページには、7 つのヒューマン データベースが表示されます (表 1、図1)。出力ボックスごとに、右上隅に[外部リンク]ボタン(対角矢印の小さなボックス)があり、詳細は元のデータベースにリンクします。
- 表示される最初のデータベースであるOMIM (https://www.omim.org/のオンラインメンデリアン継承)10をクリックします。
注:OMIMは、ヒトの遺伝病や形質に関する情報を集約し、要約する手動でキュレーションされたデータベースです。- OMIMの「ヒト遺伝子説明」ボックスを使用して、遺伝子および遺伝子産物に関して知られていることの簡単な概要を説明します。
- この遺伝子が既知の疾患を引き起こす遺伝子であるかどうかを判断するには、[遺伝子-表現型リレーションシップ]ボックスを使用します。このボックスは、目的の遺伝子と手動でキュレーションされた既知の疾患または表現型の関連付けを提供します。
- OMIM ボックスから報告されたアエレを使用して、OMIM によってキュレーションされた病原性変異体のリストを取得します。
注:新しい疾患遺伝子発見に関する出版物の手動キュレーションは、任意の遺伝子疾患関連がOMIMに現れるのに必要であるため、いくつかのタイムラグや欠落した出版物は誤解につながる可能性があります。ユーザーは PubMed (https://www.ncbi.nlm.nih.gov/pubmed/) 検索を実行して、最近の文献も調べることをお勧めします (4.1.2..を参照)。OMIM でキュレーションされた追加情報については、アンバーガー10,11 を参照してください。
- クリックエクサック(エキソメ集約コンソーシアム、http://exac.broadinstitute.org/)6とグノムAD(ゲノム集約データベース、http://gnomad.broadinstitute.org/)、重篤な小児疾患を除外するために選択された人々のWESおよびWGSに基づく大規模な集団ゲノムデータベース。
注: ExAC には約 60,000 の WES が含まれていますが、gnomAD には約 120,000 の WES と約 15,000 WGS が含まれています。ExACとgnomADの両方は、特に重度の小児疾患の対照集団データベースとして使用することができますが、その解釈はある程度の注意が必要です。一般に、gnomAD は ExAC に含まれるほとんどのコホートも gnomAD に含まれるため、ExAC の更新および拡張バージョンと見なすことができます。ただし、いくつかの例外があるため (それぞれhttp://exac.broadinstitute.org/aboutおよびhttp://gnomad.broadinstitute.org/aboutのコホート情報を参照)、MARRVEL は両方のソースからのデータを表示します。- [制御母集団遺伝子の概要]ボックスを使用して、一般集団で機能 (LOF) の対位損失が見つかる確率などの遺伝子レベルの統計情報を取得します。これはExACのpLI(LOF不耐性の確率)スコアと呼ばれ、特定の遺伝子に対するLOF対立遺伝子の単一コピーがハプロ不十分なメカニズムを介して支配的な疾患を引き起こす可能性を推測するために使用することができます。
注:遺伝子のpLIスコアを見ると、特にデノボ変異体に関連する重篤な小児疾患として存在する支配的な疾患を扱う場合に価値があります。遺伝子のpLIスコアが0.00の場合、それはLOF変異体に対して非常に耐性があり、遺伝子が支配的なハプロイン充足機構を介して疾患を引き起こす可能性が低いことを意味します。しかし、これは必ずしも他の支配的な機能ゲイン(GOF)または支配的な負の媒介機構が病気を引き起こす可能性を排除するものではありません。また、劣性疾患を引き起こす遺伝子は、一般集団でキャリアが見られると予想されるので、pLIスコアが低い可能性があります。一方、遺伝子のpLIスコアが1.00の場合、この遺伝子のコピー1枚の損失が人間の健康に有害である可能性があります。DOMINO(https://wwwfbm.unil.ch/domino/)などのウェブサイトでの追加の検索は、支配的な障害を引き起こす特定の遺伝子の変異体の可能性を評価するために組み合わせて使用することもできます。 - 次の2つのボックスを使用して、ExACおよびgnomADに関心のある変異体の対立遺伝子周波数を取得し、患者が優勢または劣性疾患を有するかどうかに応じて、その変異体が病原性であるかどうかを解釈するのに役立ちます。このボックスは、検索の入力時にユーザーがバリアント情報を入力した場合にのみ表示されます。
注:1つは劣性疾患のシナリオを仮定し、関心のある遺伝子のpLIスコアが低い場合は、ここに記載されている対立遺伝子周波数に注意を払う必要があります。一部の遺伝学者は、重度の劣性遺伝性疾患2を引き起こす可能性のある病原性変異体の最大対立遺伝子頻度として0.005~0.0001のカットオフポイントを確立することができる。一方、支配的な疾患シナリオを仮定する場合、対照集団内で同一または類似の変異体を見つける可能性は低くなります。繰り返しますが、これは、遅発性疾患、軽度の提示を伴う疾患、ExAC/gnomAD研究者によってスクリーニングされていない精神疾患または疾患がまだ含まれている可能性があり、変異体がまだ支配的な病原性である可能性があるため、注意が必要です。バリアント。また、これらのデータベース12、13、14の少数の個人で見つかった小児条件にリンクされた変異体のいくつかのインスタンスがあり、不完全な浸透または体性モザイク13に起因する可能性がある,15歳,16.さらに、ExACおよびgnomADはホモ接合状態で見つかった変異体を表示するが、化合物ヘテロ接合状態で変異体のいずれかが見つかったかどうかは示さない。最後に、これらのデータベースで見つかったいくつかのバリアントは、シーケンスングの技術的な課題(例えば、低シーケンスカバレッジ、反復シーケンス)のために低い信頼度としてタグ付けされています。これらのデータセットをより詳しく調えるには、外部リンクボタンを使用して元の ExAC および gnomAD Web サイトにアクセスして追加情報を取得することをお勧めします。
- [制御母集団遺伝子の概要]ボックスを使用して、一般集団で機能 (LOF) の対位損失が見つかる確率などの遺伝子レベルの統計情報を取得します。これはExACのpLI(LOF不耐性の確率)スコアと呼ばれ、特定の遺伝子に対するLOF対立遺伝子の単一コピーがハプロ不十分なメカニズムを介して支配的な疾患を引き起こす可能性を推測するために使用することができます。
- ワシントン大学メンデリアン遺伝学センターのWESベースのデータ集「ジェノ2 MP(遺伝子型からメンデリアン表現型ブラウザ、http://geno2mp.gs.washington.edu/Geno2MP/)」をクリックします。これは、影響を受けた個人といくつかの表現の説明を持つ影響を受けていない親戚の約9,600エキソメ(1/18/2019の時点)が含まれています(図1)。
- このコホートの対象のバリアントの対立頻度を取得するには、疾患母集団ボックスを使用します。
- 遺伝子表現型リレーションシップボックスを使用して、関心のある変異体を持つ個人のHPO(ヒト表現型オントロジー)17項を取得します。これは、同じ病気を持つ可能性のある患者を探すための多くの方法の一つです。
注:対象遺伝子が患者の疾患に関連していると疑われ、Geno2MPで一致が見つかった場合、追加の重要な情報が表示される範囲を超えてデータソースに存在する可能性があります。- Geno2MPの遺伝子特異的ページへの外部リンクボタンをクリックし、患者のものと類似した変異(例えば、誤解、LOF)をフィルタリングし、変異体のリストを慎重に確認します。高いCADD18スコアを持つバリアントにメモを取り、HPOプロファイルをクリックします。たとえば、20 より高い CADD スコアは、有害であると予測されるすべてのバリアントの上位 1% 内に収め、10 より高い CADD スコアは上位 10% 以内です。HPO 用語は、ヒトの型の標準化された説明を提供します。ここでは、バリアントが影響を受ける個人または親戚で識別されたかどうかを確認してください。
- 患者と同じ臓器系に影響を受ける患者に変異体が見つかった場合は、Geno2MP ウェブサイトで提供される機能を使用して、これらの症例を Geno2MP に提出した医師に連絡するために電子メール フォームを使用することを検討してください。
注:すべての医師がそのような問い合わせに応答するわけではないので、患者のマッチメイキングの他の方法を探求する必要があります。同じ疾患の影響を受ける患者のコホートを収集する他の方法は、GeneMatcher19 (https://www.genematcher.org/) やマッチメーカー交換19,20 (https://www.matchmakerexchange.org/)。マッチメイキング21の詳細については、JoVE の付属の記事を参照してください。
- 国立衛生研究所(NIH)がサポートするClinVar(https://www.ncbi.nlm.nih.gov/clinvar/)22データベースを使用して、研究者や臨床医が病原性の判定の有無にかかわらずバリアントを提出し、チェックを行います。 単一ヌクレオチド変異体(SNV)、小さなインデルおよびより大きなコピー数のバリエーション(CNV)。
- 一番上の行を使用して、ClinVar で報告された各タイプのバリアントの数の概要を確認します (図1)。
- ClinVar から報告されたアエレレスのボックス内の下のバリアントの一覧を確認します。
注: 最初の検索にバリアントが含まれていた場合、ティールで強調表示されたバリアントは、関心のあるバリアントのゲノム位置を含むすべてのバリアントです[大きなCNVを含む、多くの場合、ゲノム座標とラベル付けされています。x1 (削除) と...x3 (複製)]。
- DGV23(ゲノム変異体、http://dgv.tcag.ca/dgv/app/homeのデータベース)とDECIPHER24(ensemblリソースを使用したヒトにおけるgenomiC変動および表現型のデータバス、https://decipher.sanger.ac.uk/)を使用します。CNV. DGVのコレクションは、54,000人以上の個人から構造バリアントの最大のパブリックアクセスコレクションです。このデータベースには、最大72の異なる研究から、確認時に、報告された健康な個人のサンプルが含まれています。同様に、DECIPHER から表示されるデータには、制御母集団の一般的なバリアントが含まれます。
注:MARRVELはDECIPHIERから患者由来のデータを表示する権限を持っていないため、ユーザーはDECIPHERウェブサイトに直接アクセスして、潜在的に病原性のCNV情報にアクセスすることをお勧めします。- コントロール母集団のコピー数変動 (DGV データベース)ボックスをクリックして、対象遺伝子を含むバリアントを取得します。コピー番号の変動のサイズ、サブタイプ、参照などの情報は、同じボックスに含めることができます。
- [共通コピー番号バリアント (DECIPHER データベース)]ボックスをクリックして、対象のバリアントのゲノム位置を含むバリアントを取得します。この情報は、遺伝子が対照個体で複製または削除されているかどうかを判断するのに役立ちます。
注:目的の遺伝子が対照集団の多くの個体で削除された場合、この遺伝子はLOF変異体に対して非常に耐性がある可能性が高いことを意味する。低pLIスコアと同様に、これは、この遺伝子の単一コピー損失がハプロイン充足機構を介して重篤な疾患を引き起こす可能性が低いことを示唆している。しかし、これは必ずしも特定の誤解と切り捨てアレエレによって引き起こされる機能または支配的な負のメカニズム(例えば、反形態、多形および新生性の対向性)の他の支配的なゲインを除外するものではありません。 これらのデータに対する可能な制限には、取得したデータのソースと方法の変動、病原性CNVの不完全な浸透に関する情報の欠如、および個人がデータ収集後に特定の疾患を発症したかどうかが含まれます。
3. MARRVELでモデル生物データを使用する方法
- 遺伝子機能表を使用して、ヒト、ラット、マウス、ゼブラフィッシュ、ショウジョウバエ、Cエレガン、発芽酵母および核分裂酵母を含む8つのモデル生物の以下の情報を得ます。
- 遺伝子名: 各遺伝子名は、それぞれのモデル生物データベースの遺伝子ページにハイパーリンクされているので、これらのリンクをクリックして、各モデル生物で利用可能な方言の情報とリソースの詳細を調べます。たとえば、FlyBase25 (http://flybase.org/) では、生成されたすべての対立遺伝子、それぞれの型分、および公共ストックセンターからの各対立遺伝子の可用性のリストが表示されます。
- PubMedリンク:PubMedリンクをクリックすると、各生物の関心遺伝子に関連する出版物のリストに移動します。これらのリンクを使用しないと、PubMedでヒト遺伝子を直接検索すると、古い遺伝子エイリアスを使用してヒト遺伝子を参照するいくつかの出版物が欠落する可能性があります。同様に、モデル生物の遺伝子名は歴史的に変動している可能性があります。
- ディオプト9スコア: この列をチェックして、遺伝子が目的のヒト遺伝子のオルトログである可能性が高いと予測するオルコログ予測アルゴリズムの数のスコアを確認します。1 つは、固体オルソログ候補を識別するために合理的なカットオフとして 3 以上の DIOPT スコアを使用できます。しかし、本物のオルソログは、相同性が限られているため、DIOPTスコアが1のみの場合があります。遺伝子機能表の上部にある「最良のDIOPTスコア遺伝子のみを表示」ボックスをオフにして、通常はオルソログではない相同遺伝子を含むすべての候補を表示します。
- 発現: 対象となる遺伝子またはタンパク質がヒトまたはモデルの生物データベースで発現することが報告されている組織のリストについては、この列を確認してください。ヒト遺伝子およびタンパク質発現データは、それぞれGTEx26(https://gtexportal.org/)およびヒトタンパク質アトラス27(https://www.proteinatlas.org/)から取得されています。一部のボタンには、ヒート マップを使用して式パターンを表示する人間用やフライ用など、ポップアップ リンクを含むボタンがあり、他のボタンはそれぞれのモデルの組織データベース ページにハイパーリンクされています。
- 遺伝子オントロジー 28(GO)用語:実験的証拠コードでフィルタリングし、それぞれのヒトまたはモデル生物データベースから取得します。「計算分析エビデンスコード」と「電子アニテーションエビデンスコード」(予測)に基づくGO用語は表示されません。必要に応じて、各モデル生物のウェブサイトにアクセスして、この情報を収集してください。
- モナーク・イニシアティブ29(https://monarchinitiative.org/)やIMPC30(http://www.mousephenotype.org/):モナーク・イニシアティブ・ハイパーリンクを使用してフェノグリッド・ページに移動する特定のヒト遺伝子について、既知のヒト疾患に対する関心遺伝子に関連するフェノタイプと、型表が重複するモデル生物変異体との間の迅速な比較を提供するチャートである。マウス遺伝子が国際マウス表現型コンソーシアム(IMPC)によって作られた、または計画されたノックアウトマウスを持っている場合、「IMPC」は、ノックアウトマウスの表現型と公共ストックセンターからの入手可能性を詳細にするページにリンクします。
- 人間タンパク質ドメイン:ヒト遺伝子タンパク質ドメインボックスを使用して、ヒト遺伝子の予測タンパク質ドメインを取得します。データは、Pfam (https://pfam.xfam.org/)とCCD (保存ドメイン データベース、https://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml) を使用するDIOPTから派生します。2 つのソースでアニストが付いたドメインの重複が原因で、単一の残渣に複数回アニセトが付加される可能性があります。
- 多重タンパク質アライメントボックスを使用して、ヒト(hs)、ラット(rn)、マウス(mm)、ゼブラフィッシュ(dr)、フルーツフライ(dm)、ワーム(ce)、酵母(scおよびsp)を含むDIOPT9によって生成されたアミノ酸の多重アライメントを得ます。目的のアミノ酸を強調表示するには、ボックスの下部までスクロールし、以下のアミノ酸番号を入力すると、目的のアミノ酸がティールで強調表示されます。アライメントはDIOPTによって提供され、MAFFTアライタ(アミノ酸またはヌクレオチド配列のための多重アライメントプログラム、https://mafft.cbrc.jp/alignment/software/31)を使用する。
注:数値に基づいて強調表示されるアミノ酸が期待されるものでない場合は、アライメントに使用される異なるスプライシングアイソフォームが原因である可能性があります。原則として、DIOPT はこのボックスに最も長いアイソフォームを使用して表示します。また、十分に保存されていない遺伝子のセグメントでは、デフォルトパラメータを使用した多種配列のアライメントが最適でない場合があります。Clustal オメガや ClustalW/X (http://www.clustal.org/)32などの他の Web サイトやソフトウェアを使用して、それに応じて位置合わせパラメータと行列を最適化することをお勧めします。
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
人間の遺伝学者とモデル生物の科学者は、それぞれ異なる目的の結果を持つ、異なる方法でMARRVELを使用しています。以下は、MARRVELの可能な用途の3つのビネットです。
優勢疾患における変異体の病原性の評価
MARRVELを訪問するユーザーのほとんどは、まれな人間の変異体が特定の病気を引き起こす可能性を分析するために、このウェブサイトを使用しています.例えば、TBX2の誤ったセンス(17:59477596 G>P.R20Q)バリアントは、異形性の特徴と口蓋裂、心不全、骨格および数字の異常、甲状腺関連の小さな家族において、常染色体支配的な方法で分離することが判明した。フェノタイプ、および免疫欠陥12.これらの症状に罹患した母親と2人の子供は変異体を運んだが、父親はそうしなかった。9歳の息子は最も重症の表現型を持っていたのに対し、36歳の母親と6歳の娘は軽度の形態を持っていた。この変異体が病原性である可能性があるかどうかを評価するために、http://MARRVEL.orgの開始ページに遺伝子と変異体を入力してMARRVEL検索を開始することができます。バリアント検索バーは、「染色体」を示すために元の臨床報告書に記載されている場合、バリアントの前にChrを除去する必要があります。元の研究の時点で、結果ページは、この遺伝子に関連するOMIM表現型がないことを示し、この変異体はgnomADで一度だけ見つかりませんが、ExAC、ClinVar、またはGeno2MPでは見つかりませんでした。一人の個体のこの同定は、p.R20Qが病原性変異体であることに対する証拠かもしれないと思うかもしれませんが、家族の母親が軽度の形態の疾患を示したことに注意することが重要です。1/~150,000個個のバリアントは確かに非常にまれなバリアントであり、同一のバリアントを持つ個体の同定は、表現性または浸透性の低下によって説明される可能性があります。遺伝子機能表では、患者の表現型を参照して(GTExおよびプロテインアトラスを介して)ヒトの関連組織で遺伝子が発現されているかどうかを確認することがしばしば有用である。この場合、患者は複数の組織に表現型を有し、心臓、および免疫関連臓器を含む遺伝子も広く発現されるので、発現パターンは一致する。
MARRVELに表示されるモデル生物情報に基づいて、遺伝子がC.エレガンスおよびショウジョウバエからヒトおよび目的のアミノ酸に保存されていることがわかりますが、p.R20は進化を通じて非常に保存されています。図2(ラットTbx2がこの領域ではうまく整列しないことに注意してください)。マウスおよびゼブラフィッシュのフェ記視情報は、この遺伝子が心血管系、頭蓋顔面/口蓋、および数字を含む多数の組織の発達または機能に影響を与えることを示す。要するに、これらのデータは、この変異体がおそらく病原性であり、さらなる機能的研究が貴重であることを示唆している。遺伝子と変異体がC.エレガンスやショウジョウバエのような生物に保存されていることを考えると、無脊椎動物の機能的研究は、脊椎動物モデル生物で同じ実験を行う場合に比べて、より速く、安価になるだろう。ゼブラフィッシュ、マウス、ネズミなど。この場合の機能的アッセイの設計と実行方法に関する Harnish et al.21の付随する記事を参照してください12.このファミリー疾患におけるこの遺伝子/変異体の関与は、GeneMatcherを使用して同じ遺伝子のデノボミスセンス変異体と重複するフェノタイプを有する無関係の8歳の男性患者の同定によってさらに強化された。2つのファミリーの変異体はいずれもショウジョウバエの実験を用いて機能的であることが判明し、TBX2における希少変異体の病原性をさらに支持した。この疾患は最近、OMIMの「椎体異常および可変内分泌およびT細胞機能障害(VETD、OMIM#618223)」としてキュレーションされている。TBX2 17:59477596 G>A の出力全体については、図 3を参照してください。
劣性疾患における変異体の病原性の評価
優勢な疾患と劣性疾患のヒト変異体の分析には大きな違いがあります。例えば、pLIスコア、マイナー対立遺伝子頻度、および対照母集団における欠損の存在は、2つの対立遺伝子が任意の表現型を明らかにする必要があるため、それほど重要ではない。
劣性疾患の分析の一例は、ここで要約されているユンら33およびWangら4で詳述されている。15歳の少女は発達遅延、小頭症、運動失調、運動障害、低血圧、言語障害、脳異常、およびコーパスカロスム33の低形成を示した。プロバンド、彼女の影響を受けていない両親、および影響を受けていない兄弟はWESを受け取りました。プロマンドに特有の変異体と集団では稀であった変異体をフィルタリングした後、13種類の遺伝子の変異体が残った。ここで説明するプロトコルに従って13人の候補の手動フィルタリングおよび分析は、機能的研究の良い候補としてOGDHLの1つの特定の変異体の優先順位付けをもたらした。OGDHLのp.S778L(10:50946295 G>A)を他の変異体よりも優先的に導いた重要な情報には、(1)OMIMにおける以前の疾患関連がない、(2)対照集団に見つからない変異体、(3)遺伝子オントロジーに関連する微小管およびミトコンドリア、神経障害34、35、(4)ヒト小脳において高発現する2つのシステム、この患者に重度の影響を受ける組織、および(5)高い影響を及ぼす関心の変異体保存されたアミノ酸(酵母からヒトへ)および触媒ドメイン4内に位置する。この遺伝子のpLIスコアは0.00ですが、この場合のこのバリアント/遺伝子の優先順位付けには影響しません。OGDHL 10:50946295 G>A の MARRVEL 出力については、図 4を参照してください。
並行して行われたモデル生物研究は、OGdh(Nc73EFとも呼ばれる)の損失、OGDHLのショウジョウバエ性オルソログ、神経系において、神経系において、神経変性表現型と一致することを示した。 プロマンドの神経障害33.ショウジョウバエの機能的研究は、目的の変異体(p.S778L)がタンパク質機能に影響を与えることを示し、この疾患の強力な候補遺伝子を作る。それ以来、新しい神経障害に関連するOGDHLの潜在的な病原性変異体に関するこの情報は、ごく最近、OMIM(https://www.omim.org/entry/617513)に組み込まれているが、まだ疾患表現型が割り当てられていない2019年1月現在、報告されているケースは1件のみです。
目的のモデル生物遺伝子のヒトオルトログは遺伝病に関連しているのか?
多くのモデル生物研究者は、対象遺伝子のヒトオルトログが遺伝病と関連があるかどうかを調べたいと考えるかもしれません。この例では、フライノッチ(N)遺伝子のヒトオルトログが遺伝病と何らかの関連性があるかどうかを調べます。これを行うには、「モデル生物探索(1.3.1.-1.3.2.)」を実行し、種名として「ショウジョウバエメラノガスター」を選択し、モデル生物遺伝子名として「N」を選択します。このフライ遺伝子の4つの予測ヒトオルソログは、結果ウィンドウにNOTCH1、NOTCH2、NOTCH3、およびノッチ4として表示されます。4つの遺伝子は、フライNと各ヒト遺伝子の相同性の程度により、異なるDIOPTスコア(NOTCH1の場合は10/12、NOTCH2は8/12、NOTCH4の場合は5/12)を持っています。「ヒト遺伝子からフライまでのベストスコア」を4つの遺伝子すべてに対して「はい」と記載していることを考慮すると、各ヒト遺伝子からの逆探索は、最も可能性の高いオルトログ候補としてフライN遺伝子をピックアップします。実際、4つのヒトNOTCH遺伝子は、無脊椎動物系統36から分裂した後に脊椎動物系統で起こった全ゲノム複製事象の2ラウンド中に単一のノッチ遺伝子から生じたと考えられている。各ヒト遺伝子の「MARRVEL it」ボタンをクリックすると、NOTCH1-4のヒト遺伝子ベースの出力を得ることができます。 各遺伝子の結果ページでは、OMIMのトップボックスは、NOTCH1、2、および3が遺伝病に関連しているが、NOTCH4は現在、ヒトの疾患と関連していないことを示している。 NOTCH4の変異体がゲノム全体の関連研究(GWAS)37、38に基づいて統合失調症に関連しているかどうかについての議論があったことに注意してください。一般に、OMIM は一部の例外(APOE、PTPN22など) を除いて GWAS データをキュレーションしないため、この情報は OMIM ウィンドウからは使用できません。同様に、OMIMは一般的にがん関連の体細胞変異情報をキュレーションしないため、これらの遺伝子の体細胞変異が特定の癌タイプに関連しているかどうかに関する情報は、いくつかの例外(例えばTP53、RB1、BRCA1)。 PubMedまたはMonarchボックスをクリックすると、OMIM でキュレーションされていない病気関連の論文を特定できます。フライ遺伝子Nおよびヒト遺伝子NOTCH4のMARRVEL出力全体については、図5を参照してください。
図 1.MARRVEL 検索からの代表的な出力。この具体例は、「TBX2/17:59477596 G>A」(http://marrvel.org/search/pair/TBX2/17:59477596%20G%3EA)の遺伝子/変異体検索を示しています。左側のサイドバーは、データ出力のナビゲーションをサポートします。ここでの「外部リンク」記号は、UCSCゲノムブラウザの適切なページへのリンクを提供することに注意してください(https://genome.ucsc.edu/)。上部のタブは、モデル生物の遺伝子ベースの検索を実行し、MARRVELに関する追加情報を取得し、ユーザーのフィードバックを提供することを可能にします。「検索結果」パネルには、画像に示されているソースからの遺伝子とバリアント情報が表示されます。この図のより大きなバージョンを表示するには、ここをクリックしてください。
図 2.TBX2のモデル生物オルトログ表と多種アライメントの概要。A) MARRVELは、DIOPTツールに基づいて、各種のトップオルソログ候補を選択します。例えば、ショウジョウバエバイ遺伝子に対して示される10/12のDIOPTスコアは、DIOPTが使用する12のオルソロジー予測プログラムのうち10を意味し、biがヒトTBX2の最も可能性の高いフライオルソログであると予測した。遺伝子の25%はヒトと比較してゼブラフィッシュで複製されるので、MARRVELは2つのパラロゴ遺伝子(この場合はtbx2aおよびtbx2b)を表示します。 B)複数種のアライメントウィンドウのスナップショット。特定の生物[この場合はヒト(hs)]を選択し、目的のアミノ酸に入ることによって、1つはティール中の特定のアミノ酸を強調することができる。この例では、ヒトTBX2のp.R20はマウス(mm1)、ゼブラフィッシュオルソログ(dr1およびdr2)、ショウジョウバエ(dm1)およびC.エレガンス(ce1)で保存されているようである。ラットTbx2は他の種と比較してよく整列していないようです, 多種のアライメントを実行するためにDIOPTによって使用されるアイソフォームに起因する可能性が最も高いです.この図のより大きなバージョンを表示するには、ここをクリックしてください。
図 3: TBX2 17:59477596 G>A の出力全体。このファイルをダウンロードするには、ここをクリックしてください。
図 4: OGDHL 10:50946295 G>A用マーベル出力。このファイルをダウンロードするには、ここをクリックしてください。
図 5:フライ遺伝子Nおよびヒト遺伝子NOTCH4に対するMARRVEL出力。 このファイルをダウンロードするには、ここをクリックしてください。
データベースの種類 | データベースの名前 | URL/データベースへのリンク | マーヴェルへの包含の根拠 | リファレンス (PMID) |
ヒト遺伝学 | クリンバー | https://www.ncbi.nlm.nih.gov/clinvar/ | ClinVarは、人間のバリエーションと型分の違いの関係の報告の公開アーカイブであり、証拠を裏付けています。研究者や臨床医によって報告された解釈を持つ変異体は、変異体が病原性である可能性を分析するために貴重です。 | プミッド: 29165669 |
ヒト遺伝学 | 解読 | https://decipher.sanger.ac.uk/ | MARRVEL に表示される DECIPHER データには、制御母集団の一般的なバリアントが含まれています。表示されるデータには、入力バリアントのゲノム位置をカバーする構造バリアントが含まれます。DECIPHERはまた、影響を受ける個人のためのバリアントと目の前の情報が含まれていますが、唯一の彼らのウェブサイトを介して直接アクセスすることができます。 | プミッド: 19344873 |
ヒト遺伝学 | DGV | http://dgv.tcag.ca/dgv/app/home | 私たちの知るうまで、DGVは54,000人以上の個人から構造バリアントの最大のパブリックアクセスコレクションです。データベースには、最大72の異なる研究から、確認時に、報告された健康な個人のサンプルが含まれています。このデータに対する可能な制限には、病原性CNVの不完全な浸透に関する情報の欠如を取得したデータのソースと方法の変動、および個人がデータ収集後に関連疾患を発症するかどうかが含まれます。 | プミッド: 24174537 |
オルソロジー予測 | ディオプト | https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl | DIOPTは、目的のヒト遺伝子のタンパク質配列に対して6つのモデル生物において最良の予測オルソログの複数のタンパク質配列アライメントを提供した。アライメントは、特定のアミノ酸の保存に関する情報と機能性タンパク質ドメインを提供します。 | プミッド: 21880147 |
ヒト遺伝子/転写産物命名法 | エンセンブル | https://useast.ensembl.org/ | Ensembl遺伝子のボイドは、異なるデータベースをリンクするために使用されます。 | プミッド:29155950 |
ヒト遺伝学 | エクサック | http://exac.broadinstitute.org/ | ExACには60,000以上のエキソメが含まれており、gnomAD(http://gnomad.broadinstitute.org/)以外は、重度の早期発症メンデリアン型を持つ個人に対して選択されたエキソメの最大のパブリックコレクションです。MARRVELの目的のために、ExACおよびgnomADはマイナーな対立遺伝子頻度を計算するための最良の制御母集団データセットとして機能する。ExAC からの出力を 2 セット提供します。最初の出力は、期待される数対観測された数の誤りおよび機能喪失(LOF)の対位の遺伝子中心の概観である。pLI(LOF不耐性の確率)と呼ばれるメトリックは、生殖年齢前の特定の変異体に対する選択的圧力を反映しています。pLIスコア1.00は、この遺伝子が任意のLOF変異体に対して非常に不耐性であり、この遺伝子のハプロインの充足がヒトの疾患を引き起こす可能性があることを意味する。2 番目の出力は、特定のバリアントに関連する ExAC からのデータです。ExAC で同一のバリアントが見られる場合、MARRVEL はマイナーな対立遺伝子周波数を表示します。 | プミッド: 27535533 |
主なモデル生物データベース | フライベース (ショウジョウバエ) | http://flybase.org | MARRVELは、複数のモデル生物データベースからデータを収集し、表示します。GO用語を用いて遺伝子の分子・細胞・生物学的機能の概要を提供する。最も可能性の高いオルソログは DIOPT によって導き出されます。 | プミッド:26467478 |
モデル生物データベース統合ツール | 遺伝子2機能 | http://www.gene2function.org/search/ | マーヴェルはDIOPTとGene2Functionと連携し、「モデル生物検索」機能を提供しています。ハイパーリンクは、ユーザーが多数の MO データベースを統合し、MARREL の方法とは異なるスタイルで表示する Web サイトにアクセスするために提供されます。 | プミッド: 28663344 |
ヒト遺伝学 | ジェノ2MP | http://geno2mp.gs.washington.edu/Geno2MP/ | Geno2MPは、メンデリアン遺伝学のためのワシントン大学センターからのサンプルのコレクションです。これは、影響を受けた個人と影響を受けていない親戚の約9,650のエキソメが含まれています。このデータベースは、表現型と継承情報のモードを特定の対遺数にリンクします。表現型の場合、対象患者の罹患した臓器系をGeno2MPの罹患者と比較することにより、一致する可能性を見出してもよい。対立遺伝子、継承モード、および表現型の一致は、変異型が病原性である可能性が高い確率を高めます。しかし、サンプルサイズが小さいため、負の関連性は必ずしも変異体の病原性優先度を低下させるわけではない。関心のある患者の主治医に連絡するメカニズムは、元のソースに提供される。 | N/a |
ヒト遺伝学 | グノムAD | http://gnomad.broadinstitute.org/ | gnomAdには、様々な疾患特異的および集団遺伝学的研究の一部として配列された無関係な個体からの合計123,136個のエキソメ配列と15,496の全ゲノム配列が含まれています。ExAC データのかなりの部分が gnomAD に統合されます。MARRVELでは現在、特定のバリアントに関連する母数周波数を表示しています。 | プミッド: 27535533 |
遺伝子オントロジー | GO セントラル | http://www.geneontology.org/ | MARRVELは、各遺伝子の実験的証拠から得られる遺伝子オントロジー(GO)用語(分子機能、細胞成分、および生物学的プロセス)のみを表示します。これらは、「計算分析エビデンスコード」と「電子アニテーション証拠コード」(予測)に基づく「実験的証拠コード」とGO用語によってフィルタリングされます。 | PMID: 10802651, 25428369 |
ヒト遺伝子/タンパク質発現 | GTEx | https://gtexportal.org/home/ | MARRVELは、各遺伝子のヒト組織においてmRNAおよびタンパク質発現パターンの両方を表示する。発現パターンは、患者および/またはモデル生物で観察される表現型に洞察を追加することができます。 | PMID:29019975、23715323 |
ヒト遺伝子命名法 | HGNC | https://www.genenames.org/ | HGNC公式遺伝子記号は、MARRVEL検索に使用されます。 | プミッド: 27799471 |
主なモデル生物データベース | IMPC (マウス) | http://www.mousephenotype.org/ | MARRVELは、IMPCウェブサイト上のマウス遺伝子ページへのハイパーリンクを提供します。IMPCによって作られたノックアウトマウスがあった場合、アッセイとその結果の網羅的なリストが公開され、遺伝子が失われたときに表現型に関する洞察を提供することができます。一部の情報はMGIでキュレーションされていますが、タイムラグがあるかもしれません。 | プミッド:27626380 |
主なモデル生物データベース | MGI (マウス) | http://www.informatics.jax.org/ | MARRVELは、複数のモデル生物データベースからデータを収集し、表示します。GO用語を用いて遺伝子の分子・細胞・生物学的機能の概要を提供する。最も可能性の高いオルソログは DIOPT によって導き出されます。 | プミド:25348401 |
モデル生物データベース統合ツール | モナーク・イニシアティブ | https://monarchinitiative.org/ | MARRVELは、モナーク・イニシアティブ上のヒト遺伝子のフェノグリッドへのリンクを提供します。このグリッドは、モデル生物の表現型と既知のヒト疾患との比較を提供する。 | プミッド: 27899636 |
ヒトバリアント命名法 | ムタリザー | https://mutalyzer.nl/ | MARRVELは、MutalyzerのAPIを使用して、異なるバリアント命名法をゲノム位置に変換します。 | プミッド: 18000842 |
ヒト遺伝学 | Omim | https://omim.org/ | OMIMから引き出す3つの主要な情報は、遺伝子機能、関連する型分項、および報告された対等変性です。遺伝子が既知のメンデリアン表現型(#エントリ)に関連しているかどうかを知ることは有用である。この知識を持たない遺伝子は、新しい遺伝子発見の候補です。このカテゴリーである遺伝子の場合、患者の表現型が報告された疾患および表現型、ならびに文献内の患者のものと一致しない場合、これは目的の遺伝子に表現型拡張を提供する機会を増加させる。 | プミッド: 28654725 |
主なモデル生物データベース | ポンベース(核分裂酵母) | https://www.pombase.org/ | MARRVELは、複数のモデル生物データベースからデータを収集し、表示します。GO用語を用いて遺伝子の分子・細胞・生物学的機能の概要を提供する。最も可能性の高いオルソログは DIOPT によって導き出されます。 | プミド:22039153 |
文学 | Pubmed | https://www.ncbi.nlm.nih.gov/pubmed/ | MARRVELは、「ジーン」ベースのPubMed検索へのハイパーリンクを提供します。このリンクをクリックすると、以前の遺伝子名と記号に基づいて対象遺伝子を参照する生物医学論文を検索できます。 | N/a |
主なモデル生物データベース | RGD (ラット) | https://rgd.mcw.edu/ | MARRVELは、複数のモデル生物データベースからデータを収集し、表示します。GO用語を用いて遺伝子の分子・細胞・生物学的機能の概要を提供する。最も可能性の高いオルソログは DIOPT によって導き出されます。 | プミド:25355511 |
主なモデル生物データベース | SGD (発芽酵母) | https://www.yeastgenome.org/ | MARRVELは、複数のモデル生物データベースからデータを収集し、表示します。GO用語を用いて遺伝子の分子・細胞・生物学的機能の概要を提供する。最も可能性の高いオルソログは DIOPT によって導き出されます。 | PMID: 22110037 |
ヒト遺伝子/タンパク質発現 | ヒトタンパク質アトラス | https://www.proteinatlas.org/ | MARRVELは、各遺伝子のヒト組織においてmRNAおよびタンパク質発現パターンの両方を表示する。発現パターンは、患者および/またはモデル生物で観察される表現型に洞察を追加することができます。 | プミッド: 21752111 |
主なモデル生物データベース | ワームベース (C. エレガンス) | http://wormbase.org | MARRVELは、複数のモデル生物データベースからデータを収集し、表示します。GO用語を用いて遺伝子の分子・細胞・生物学的機能の概要を提供する。最も可能性の高いオルソログは DIOPT によって導き出されます。 | プミッド:26578572 |
主なモデル生物データベース | ZFIN (ゼブラフィッシュ) | https://zfin.org/ | MARRVELは、複数のモデル生物データベースからデータを収集し、表示します。GO用語を用いて遺伝子の分子・細胞・生物学的機能の概要を提供する。最も可能性の高いオルソログは DIOPT によって導き出されます。 | プミド:26097180 |
表 1.MARRVEL のデータ ソースの一覧。MARRVEL がデータを取得するすべてのデータベースをこの表に示します。データベースごとに、データベースの種類、URL/リンク、MARRVEL に含める根拠、およびプライマリ参照を一覧表示します。
Subscription Required. Please recommend JoVE to your librarian.
Discussion
このプロトコルの重要な手順には、最初の入力 (手順 1.1-1.3) とその後の出力の解釈が含まれます。検索結果が陰性である最も一般的な理由は、遺伝子や変異体を記述できる多くの方法があるためです。MARRVEL はスケジュールに基づいて更新されますが、これらの更新プログラムによって、MARRVEL がリンクしている異なるデータベース間で切断が発生する可能性があります。したがって、トラブルシューティングの最初のステップは、遺伝子またはバリアントの代替名が検索結果の成功につながるかどうかを常にチェックすることです。それでも解決できない場合は、http://marrvel.org/messageのフィードバックフォームを使用して開発チームにメッセージを送信してください。
MARRVELに対する1つの制限は、遺伝子および変異体分析に必要な有用なデータベースがすべて含まれていないことです。例えば、CADD18などの病原性予測アルゴリズムは現在提供されていない。同様に、遺伝子の既知の疾患を引き起こす変異体への構造的および機能的なリンクを提供し得るタンパク質構造情報およびタンパク質相互作用情報は、現在MARRVELに表示されていない。次回のメジャーアップデートでは、モデル生物のウェブサイト、IMPC、モナーク・イニシアティブ、ゲノム資源同盟(AGR、https://www.alliancegenome.org/)からのより多くの先見情報を取り入れることに加えて、この情報をMARRVELに統合する予定です。MARRVELは希少疾患の研究を容易にするために設計されたので、プログラムは現在生殖細胞変異体に焦点を当てており、体細胞変異情報へのアクセスを提供していません。このプロトコルの公開時点では、がん遺伝学関連データベースは統合されていない。MARRVELは積極的に開発され、アップグレードされているので、我々は非常にフィードバックを高く評価し、強く既存のユーザーが統合される将来の追加のデータベースのためにhttp://marrvel.org/messageにニュースレターにサインアップすることを奨励します。
MARRVELからのデータは、病原性である可能性のある変異体に優先順位を付けるために使用することができますが。しかし、病原性を実証するためには、類似のジェノタイプと現象を持つ他の患者を特定するか、または機能的研究を行い、関心の変異体が関連する機能的な結果を有するという確かな証拠を提供する必要があります。病気の状態。モデル生物で実験的に調査する価値がある場合に役立つ可能性があるMARRVEL以外の追加情報の詳細については、付属の記事Harnish et al21を参照してください。モデル生物を使用してヒトの変異体を研究する次のステップを踏むためには、ヒト遺伝学者とモデル生物研究者がつながり、協力できる必要があります。GeneMatcherおよびマッチメーカー交換コンソーシアムの一部である他のゲノムコンソーシアムは、この次のステップを容易にするリソースです。ユーザーがカナダに居住している場合は、希少疾患モデルおよびメカニズムネットワーク(RDMM、http://www.rare-diseases-catalyst-network.ca/)に登録して、臨床医やモデル生物研究者を特定し、39を共同で共同作業を行う意欲を示します。.日本(J-RDMM、https://irudbeyond.nig.ac.jp/en/index.html)、欧州(RDMM-ヨーロッパ、http://solve-rd.eu/rdmm-europe/)、オーストラリア(オーストラリア機能ゲノミクスネットワーク:https://www.functionalgenomics.org.au/)は、最近、カナダのRDMMモデルは、自国/地域における同様のコラボレーションを促進します。さらに、BioLitMine(https://www.flyrnai.org/tools/biolitmine/web/)などのツールを使用することで、以前に対象遺伝子に取り組んできた主任研究者の間で潜在的な協力者を探すことができます。
最後に、MARRVELに加えて、Gene2Function 40(http://www.gene2function.org/)、モナーク・イニシアティブ29(https://monarchinitiative.org/)、アライアンスなど、多くの異種間データマイニングツールを利用できます。ゲノム資源(AGR、https://www.alliancegenome.org/)。Gene2Functionは種間データへのアクセスを提供し、モナーク・イニシアティブは型分比較を提供しますが、MARRVELはヒトの変異体に重点を置き、ヒトゲノムデータをモデル生物と結び付けています。AGRは、6つのモデル生物データベースと、異なるデータベースからのデータを統一的な方法で統合し、各データベースによって蓄積されたデータのアクセシビリティを高める遺伝子オントロジーコンソーシアムを含むイニシアチブです。これらのリソースは補完的であり、ユーザーは各データベースの強みを理解して、コミュニティの研究者が蓄積した膨大な知識をナビゲートする必要があります。MARRVELの開発が進むにつれて、モデル生物におけるヒト変異体の研究に関連するデータベースを増やす予定です。MARRVELの包括的な目標は、臨床医や研究者が、可能な限りシンプルなインターフェースを維持しながら有用な情報を統合することにより、ヒトの遺伝子とバリアントを分析し、さらなる研究を行うための簡単な方法を提供することです。
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
著者は何も開示していない。
Acknowledgments
ラミ・アル・ウーラン博士、ソン・ヨン・キム、ヤンホイ(クレア)Hu、イン・ウーイ・ワン、ナヴィーン・マノハラン、サシダル・パスプラティ、アラム・コムジャン、ドンクス・マオ、マイケル・ワングラー、Hsiao-Tuan Chao、ステファニー・モール、ノーバート・ペリモンに感謝します。マーヴェルのメンテナンス。サマンサ・L・ディールとJ・マイケル・ハーニッシュがこの原稿に対する意見を述てくださったことに感謝しています。
MARRVELの初期開発は、NIHコモンファンド(U54NS093793)およびNIH研究インフラプログラム(ORIP)(R24OD022005)を通じて、未診断疾患ネットワークモデル生物スクリーニングセンターによって一部支援されました。JWは、NIHユーニス・ケネディ・シュライバー国立小児保健・人間開発研究所(F30HD094503)とロバート・アンド・ジャニス・マクネア財団マクネア財団(BCM)の学生奨学生プログラムによって支援されています。HJBは、NIH国立総合医学研究所(R01GM067858)によってさらにサポートされ、ハワードヒューズ医学研究所の研究者です。ZLは、NIH国立総合医学研究所(R01GM120033)、国立老化研究所(R01AG057339)、ハフィントン財団によって支援されています。SYは、NIH国立難聴およびその他のコミュニケーション障害研究所(R01DC014932)、サイモンズ財団(SFARI賞:368479)、アルツハイマー病協会(新研究者研究助成金:15-364099)、ナマンファミリーから追加の支援を受けました。基礎研究基金とキャロライン・ウィース分子医学研究基金
Materials
Name | Company | Catalog Number | Comments |
Human Genetics | ClinVar | PMID: 29165669 | https://www.ncbi.nlm.nih.gov/clinvar/ |
Human Genetics | DECIPHER | PMID: 19344873 | https://decipher.sanger.ac.uk/ |
Human Genetics | DGV | PMID: 24174537 | http://dgv.tcag.ca/dgv/app/home |
Orthology Prediction | DIOPT | PMID: 21880147 | https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl |
Human Gene/Transcript Nomenclature | Ensembl | PMID: 29155950 | https://useast.ensembl.org/ |
Human Genetics | ExAC | PMID: 27535533 | http://exac.broadinstitute.org/ |
Primary Model Organism Databases | FlyBase (Drosophila) | PMID:26467478 | http://flybase.org |
Model Organism Database Integration Tools | Gene2Function | PMID: 28663344 | http://www.gene2function.org/search/ |
Human Genetics | Geno2MP | N/A | http://geno2mp.gs.washington.edu/Geno2MP/ |
Human Genetics | gnomAD | PMID: 27535533 | http://gnomad.broadinstitute.org/ |
Gene Ontology | GO Central | PMID: 10802651, 25428369 | http://www.geneontology.org/ |
Human Gene/Protein Expression | GTEx | PMID: 29019975, 23715323 | https://gtexportal.org/home/ |
Human Gene Nomenclature | HGNC | PMID: 27799471 | https://www.genenames.org/ |
Primary Model Organism Databases | IMPC (mouse) | PMID: 27626380 | http://www.mousephenotype.org/ |
Primary Model Organism Databases | MGI (mouse) | PMID:25348401 | http://www.informatics.jax.org/ |
Model Organism Database Integration Tools | Monarch Initiative | PMID: 27899636 | https://monarchinitiative.org/ |
Human Variant Nomenclature | Mutalyzer | PMID: 18000842 | https://mutalyzer.nl/ |
Human Genetics | OMIM | PMID: 28654725 | https://omim.org/ |
Primary Model Organism Databases | PomBase (fission yeast) | PMID:22039153 | https://www.pombase.org/ |
Literature | PubMed | N/A | https://www.ncbi.nlm.nih.gov/pubmed/ |
Primary Model Organism Databases | RGD (rat) | PMID:25355511 | https://rgd.mcw.edu/ |
Primary Model Organism Databases | SGD (budding yeast) | PMID: 22110037 | https://www.yeastgenome.org/ |
Human Gene/Protein Expression | The Human Protein Atlas | PMID: 21752111 | https://www.proteinatlas.org/ |
Primary Model Organism Databases | WormBase (C. elegans) | PMID:26578572 | http://wormbase.org |
Primary Model Organism Databases | ZFIN (zebrafish) | PMID:26097180 | https://zfin.org/ |
References
- Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
- Richards, S., et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genetics in Medicine. 17 (5), 405-424 (2015).
- MacArthur, D. G., et al. Guidelines for investigating causality of sequence variants in human disease. Nature. 508 (7497), 469-476 (2014).
- Wang, J., et al. MARRVEL: Integration of Human and Model Organism Genetic Resources to Facilitate Functional Annotation of the Human Genome. American Journal of Human Genetics. 100 (6), 843-853 (2017).
- Povey, S., et al. The HUGO Gene Nomenclature Committee (HGNC). Human Genetics. 109 (6), 678-680 (2001).
- Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
- Wildeman, M., van Ophuizen, E., den Dunnen, J. T., Taschner, P. E. Improving sequence variant descriptions in mutation databases and literature using the Mutalyzer sequence variation nomenclature checker. Human Mutation. 29 (1), 6-13 (2008).
- Zhou, W., et al. TransVar: a multilevel variant annotator for precision genomics. Nature Methods. 12 (11), 1002-1003 (2015).
- Hu, Y., et al. An integrative approach to ortholog prediction for disease-focused and other functional studies. BMC Bioinformatics. 12, 357 (2011).
- Amberger, J. S., Hamosh, A. Searching Online Mendelian Inheritance in Man (OMIM): A Knowledgebase of Human Genes and Genetic Phenotypes. Current Protocols in Bioinformatics. 58, 1 (2017).
- Amberger, J. S., Bocchini, C. A., Scott, A. F., Hamosh, A. OMIM.org: leveraging knowledge across phenotype-gene relationships. Nucleic Acids Research. 47, 1038-1043 (2019).
- Liu, N., et al. Functional variants in TBX2 are associated with a syndromic cardiovascular and skeletal developmental disorder. Human Molecular Genetics. 27 (14), 2454-2465 (2018).
- Ropers, H. H., Wienker, T. Penetrance of pathogenic mutations in haploinsufficient genes for intellectual disability and related disorders. European Journal of Medical Genetics. 58 (12), 715-718 (2015).
- Shashi, V., et al. De Novo Truncating Variants in ASXL2 Are Associated with a Unique and Recognizable Clinical Phenotype. American Journal of Human Genetics. 100 (1), 179 (2017).
- Chen, R., et al. Analysis of 589,306 genomes identifies individuals resilient to severe Mendelian childhood diseases. Nature Biotechnology. 34 (5), 531-538 (2016).
- Halvorsen, M., et al. Mosaic mutations in early-onset genetic diseases. Genetics in Medicine. 18 (7), 746-749 (2016).
- Kohler, S., et al. The Human Phenotype Ontology in 2017. Nucleic Acids Research. 45 (1), 865-876 (2017).
- Rentzsch, P., Witten, D., Cooper, G. M., Shendure, J., Kircher, M. CADD: predicting the deleteriousness of variants throughout the human genome. Nucleic Acids Research. 47 (1), 886-894 (2019).
- Sobreira, N., Schiettecatte, F., Valle, D., Hamosh, A. GeneMatcher: a matching tool for connecting investigators with an interest in the same gene. Human Mutation. 36 (10), 928-930 (2015).
- Sobreira, N. L. M., et al. Matchmaker Exchange. Current Protocols in Human Genetics. 95 (9), 31-39 (2017).
- Harnish, M., Deal, S., Wangler, M., Yamamoto, S. In vivo functional study of disease-associated rare human variants using Drosophila. Journal of Visualized Experiments. , (2019).
- Harrison, S. M., et al. Using ClinVar as a Resource to Support Variant Interpretation. Current Protocols in Human Genetics. 89, 11-18 (2016).
- MacDonald, J. R., Ziman, R., Yuen, R. K., Feuk, L., Scherer, S. W. The Database of Genomic Variants: a curated collection of structural variation in the human genome. Nucleic Acids Research. 42, Database issue 986-992 (2014).
- Firth, H. V., et al. DECIPHER: Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources. American Journal of Human Genetics. 84 (4), 524-533 (2009).
- Thurmond, J., et al. FlyBase 2.0: the next generation. Nucleic Acids Research. 47, 759-765 (2019).
- Consortium, G. T. Human genomics. The Genotype-Tissue Expression (GTEx) pilot analysis: multitissue gene regulation in humans. Science. 348 (6235), 648-660 (2015).
- Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas--a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
- The Gene Ontology, C. The Gene Ontology Resource: 20 years and still GOing strong. Nucleic Acids Research. , (2018).
- Mungall, C. J., et al. The Monarch Initiative: an integrative data and analytic platform connecting phenotypes to genotypes across species. Nucleic Acids Research. 45 (1), 712-722 (2017).
- Meehan, T. F., et al. Disease model discovery from 3,328 gene knockouts by The International Mouse Phenotyping Consortium. Nature Genetics. 49 (8), 1231-1238 (2017).
- Katoh, K., Rozewicki, J., Yamada, K. D. MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization. Brief Bioinform. , (2017).
- Sievers, F., Higgins, D. G. Clustal Omega for making accurate alignments of many protein sequences. Protein Science. 27 (1), 135-145 (2018).
- Yoon, W. H., et al. Loss of Nardilysin, a Mitochondrial Co-chaperone for alpha-Ketoglutarate Dehydrogenase, Promotes mTORC1 Activation and Neurodegeneration. Neuron. 93 (1), 115-131 (2017).
- Deal, S., Yamamoto, S. Unraveling novel mechanisms of neurodegeneration through a large-scale forward genetic screen in Drosophila. Frontiers in Genetics. 9, (2019).
- Matamoros, A. J., Baas, P. W. Microtubules in health and degenerative disease of the nervous system. Brain Research Bulletin. 126, Pt 3 217-225 (2016).
- Theodosiou, A., Arhondakis, S., Baumann, M., Kossida, S. Evolutionary scenarios of Notch proteins. Molecular Biology and Evolution. 26 (7), 1631-1640 (2009).
- Shayevitz, C., Cohen, O. S., Faraone, S. V., Glatt, S. J. A re-review of the association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 159 (5), 477-483 (2012).
- Wang, Z., et al. A review and re-evaluation of an association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 141 (8), 902-906 (2006).
- Oriel, C., Lasko, P. Recent Developments in Using Drosophila as a Model for Human Genetic Disease. International Journal of Molecular Sciences. 19 (7), (2018).
- Hu, Y., Comjean, A., Mohr, S. E., FlyBase, C., Perrimon, N. Gene2Function: An Integrated Online Resource for Gene Function Discovery. G3. 7 (8), Bethesda. 2855-2858 (2017).