本稿では、空間トランスクリプトミクスのための動的でインタラクティブなデータベースであるDeepSpaceDBを使用するためのプロトコルを紹介し、組織組織化と疾患関連遺伝子発現を探るための解析ワークフローと例を提供します。
Method Article
本稿では、空間トランスクリプトミクスのための動的でインタラクティブなデータベースであるDeepSpaceDBを使用するためのプロトコルを紹介し、組織組織化と疾患関連遺伝子発現を探るための解析ワークフローと例を提供します。
空間トランスクリプトミクスは、位置情報を保存しながら組織サンプル中の遺伝子発現パターンをキャプチャできる急速に進化する技術です。生物学研究やバイオインフォマティクスに幅広い用途があり、研究者はさまざまな組織、状態、疾患にわたる遺伝子発現の空間的変動を調査および追跡できるようになります。空間トランスクリプトミクスのデータ分析が注目を集めるにつれ、公開されているデータセットの数が増加しています。しかし、空間トランスクリプトミクスは依然として高度に専門化された実験技術であり、技術的および財政的制約が大きい。空間データへのアクセスを容易にするために、私たちは最近、空間トランスクリプトミクスデータ探索のための包括的で動的なデータベースであるDeepSpaceDBを開発しました。この記事では、データベースのコンポーネントとそのナビゲーションの概要を、いくつかの例を使用して詳細なワークフローを紹介します。まず、マウス脳サンプルの分析が実証され、品質指標、空間的に変化する遺伝子と経路、海馬と視床下部の間の遺伝子発現の変動が調査されます。次に、免疫活性に関連する差次的に発現する遺伝子の同定と注釈は、結腸直腸起源の転移領域とマウス肝臓の健康な組織の遠隔領域を比較することによってさらに調査されます。DeepSpaceDB は、高度なツールとインタラクティブな機能を備えており、空間トランスクリプトミクス研究の貴重なリソースとして機能し、組織組織と疾患生物学のより深い調査を可能にします。
空間トランスクリプトミクスは、研究者が組織切片内の空間情報を保持しながら遺伝子発現を分析できるようにする新しい技術であり、組織構造、細胞の不均一性、および微小環境の影響を前例のない解像度で研究できるようにします1,2。しかし、この技術の可能性にもかかわらず、アクセスと分析は依然として限られており、空間トランスクリプトミクスは多くの研究室にとって法外なコストであり、データ分析には高度なバイオインフォマティクスのスキルが必要です。
公開データベースの開発は、この新たな実験モダリティへのアクセスを広げる 1 つの方法です。いくつかの空間トランスクリプトミクスデータベースが作成されています。1つ目はSpatialDBでしたが、サンプル数が限られており、更新されていません3。SODB、SOAR、およびSTOmicsDBデータベースには、多くの異なるプラットフォームからの多数のサンプルが含まれており、データリポジトリ4,5,6として大きな役割を果たします。ただし、分析ツールは限られており、インタラクティブ性に欠けています。この問題に対処するために、私たちは最近、技術的障壁を下げ、アクセシビリティを拡大するように設計された、公開されている空間トランスクリプトミクスデータセットの厳選されたユーザーフレンドリーなデータベースであるDeepSpaceDBを開発しました7。この記事では、データベースの検索、サンプル品質の検査、視覚化ツール、組織スライス内のインタラクティブに選択された領域の比較など、このデータベースのいくつかのツールについて説明します。マウス脳サンプルと結腸直腸転移のあるマウス肝臓の分析という2つの代表的な例を使用して詳細なプロトコルを提示し、これらのツールを実際の文脈で実証します。これらのツールを通じて、DeepSpaceDB は、より幅広い研究者が独自のデータや社内のバイオインフォマティクス能力を必要とせずに空間トランスクリプトミクスを活用できるようにします。データ収集、品質管理、処理ワークフロー、およびDeepSpaceDBに含まれるデータと機能の包括的な説明は、Honcharuk etal 7によって詳細に提供されています。
1. 例1:マウス脳サンプルの解析
注:このセクションでは、マウスの脳サンプルの分析を、DeepSpaceDBで利用可能なさまざまな特徴とプロットをナビゲートして説明します(データベースへのリンクは 材料表にあります)。
2.実施例2:マウス肝臓における結腸直腸起源の転移領域における免疫活性に関連する異なる発現遺伝子の同定および注釈
注:サンプル内比較は、現在のセクションで検討されています。これは、2つの異なるサンプルに基づいて、結腸直腸起源の転移領域と肝臓切片内の健康な組織の遠隔領域との間で差次的に発現する遺伝子の同定と注釈によって説明されます。免疫活性に関連する特定の調節不全遺伝子の空間的発現は、組織切片でさらに視覚化されます。
実施例1は、マウス脳サンプルの分析を示し、リードカウント、空間的に変化する遺伝子と経路、海馬と皮質の間の遺伝子発現変動などのパラメーターを検証しました。まず、マウス脳サンプルDSID001557の品質を、いくつかの品質尺度に対して評価しました:「検出された遺伝子」(図1A)、「リードカウント」(図1B)、および「ミト」(ミトコンドリアリードの割合;図1C)。これは、検出された遺伝子の数が少なく、リード数が少ないことに基づいて、脳サンプルの左側にある品質の低い領域を明確に強調しました。他のすべてのサンプルに対するサンプルの相対的な品質を理解するために、データベースの「サンプルの相対的な品質」タブをクリックすると、カウントと否のグラフが表示されました。スポットごとに検出された遺伝子の数(平均)。分析対象のサンプルでは、スポットごとに3500〜4000個の遺伝子が検出されました(図1D)。サンプルの解剖学的特徴は、[画像注釈]タブを使用してさらに分析されました。一般的な注意として、これらの注釈は、組織画像をより小さな部分に切り取り、観察可能な特徴8を記述するようにLLMに依頼することによって生成されました。これらはサンプルの解釈を支援するための大まかな指示であり、慎重に解釈する必要があります。サンプルのサブセット(特にヒト乳がんサンプル)については、ヒトの専門家による注釈も利用できます。ただし、日常的な診断に使用される画像と比較して Visium H&E 画像の品質が低いことを考慮すると、提供されている注釈は研究目的のみを目的としています。サンプルDSID001557の場合は、海馬領域、皮質層、神経膠症を伴う密な細胞層など、マウス脳のさまざまな領域の注釈が表示されたスライス上にカーソルを移動します。サンプルスライスの基本的な解剖学的特徴を理解することから、細胞型クラスターや空間的に変化する遺伝子や経路などの詳細な特徴がさらに調査されました。マウスの脳サンプルには合計15個のクラスターがあり、サンプルスライス全体で色分けで表されました(図1E)。サンプルに関連する空間的に可変性の高い遺伝子には、Nrgn、Slc17a7、Ly6h、およびDdnがあります(図2)。Nrgnは、シナプス可塑性と空間学習の媒介におけるNrgnコードタンパク質(ニューログラニン)の役割を示す文献的証拠に従って、海馬領域で高い発現を示しました15。グルタミン作動性ニューロンの神経伝達に重要な小胞性グルタミン酸トランスポーターをコードする遺伝子であるSlc17a716と、シナプス後細胞骨格の構造を調節するタンパク質をコードする遺伝子であるDdn17も海馬領域で高発現していました。対照的に、遺伝子Ly6hの発現は、皮質細胞の膜におけるLy6hの制限的なシナプスの役割を示す文献に従って、皮質領域に局在していました18。同様に、サンプルスライス全体で経路の活性を視覚化しました(図3)。空間的に可変の経路は、海馬領域のシナプス可塑性と神経伝達物質活性の調節、および皮質領域の神経ペプチドシグナル伝達の調節により、空間的に可変遺伝子の機能的役割と一致して活性化されることが観察されました。
最後に、マウス脳サンプルの海馬領域と視床下部の間で差次的に発現する遺伝子を特定するために、Tissue Explorerタブが利用されました。関心領域に関連するスポットは、画像注釈からのガイダンスで選択されました(図4A)。生成された散布図から、同定された差次的に発現する遺伝子のいくつかは、PmchやTtrなどの他のいくつかの遺伝子に加えて、空間的に変動する上位の遺伝子(Nrgn、Slc17a7、Ddn)の中にありました。これらの遺伝子の発現は、サンプルスライスで視覚化されました。Pmchは、視床下部の外側領域で特異的に過剰発現していました(図4B;図4Aの緑色の選択領域と比較して)。この遺伝子はメラニン濃縮ホルモンの前駆体をコードし、エネルギー恒常性の維持に関与しています19。対照的に、遺伝子Ttrは、学習および空間記憶におけるその機能的役割に従って、海馬領域(図4C、図4Aの赤色の選択領域と比較して)で特異的に発現した20。このデータベースを用いて異なるマウス脳領域間のサンプル内比較を行うことで、空間的遺伝子発現や経路活性に基づいて領域特異的な機能的特徴を浮き彫りにすることができました。
実施例2では、データベースを肝臓における結腸直腸転移に関連する免疫シグネチャの同定に利用した。結腸直腸転移のある腫瘍領域と遠隔の健康な肝組織の間で、DSID001005(図5A-C)とDSID001007(図5D-F)の2つのサンプルの適切なスポット選択を通じて、サンプル内比較を実施しました。データは、Rを使用して条件ごとに2回の繰り返しで再分析されました。結腸直腸転移のある腫瘍領域と健康な肝組織の間で実施された差次的発現分析により、選択されたパラメーターに基づいて、138の遺伝子のダウンレギュレーションと115の遺伝子のアップレギュレーションが明らかになりました(図6A、B)。KEGG経路解析では、薬物代謝や化学発がんなどのダウンレギュレーションされた遺伝子の経路の濃縮が実証されましたが(図6C)、アップレギュレートされた遺伝子は、とりわけ白血球の経内皮遊走、焦点接着、細胞周期に対応するシグネチャを示しました(図6D)。白血球の経内皮遊走が免疫活性に与える関連性に着目し、このカテゴリーで検出された上位遺伝子が同定され、DeepSpaceDBで空間発現が観察されました。興味深いことに、白血球経内皮遊走のカテゴリーで検出された遺伝子Cldn7、Cldn4、およびActg1は、健康な肝組織を持つ遠隔領域ではなく、サンプルの腫瘍領域(Epcam+部位)でアップレギュレーションを示しました(図7)。これにより、白血球の活発な動員を伴う肝臓の腫瘍部位で駆動される免疫活性の性質についての洞察が得られました。要約すると、DeepSpaceDB を使用したサンプル内分析により、多様な生物学的洞察の抽出が可能になります。インタラクティブなツールと再分析ワークフローを通じて空間トランスクリプトームデータを比較することで、研究者は組織特異的な遺伝子発現と機能的不均一性に関する仮説を生成および検証できます。

図1:サンプルの品質測定。 (A)検出された遺伝子の数、(B)リード数、および(C)スポットあたりのミトコンドリアリードの割合。(D)データベース内の他のすべてのサンプルの分布と比較した、このサンプルのスポットあたり検出された遺伝子の平均数。(E)組織スライス全体にスポットクラスターを配置します。 この図の拡大版を表示するには、ここをクリックしてください。

図2:空間的に可変性の高い上位遺伝子の発現。 (A) Nrgn、(B) Slc17a7、(C) Ly6h、および (D) Ddn。 この図の拡大版を表示するには、ここをクリックしてください。

図3:上位の空間的に可変経路の活性。 (A)神経ペプチドシグナル伝達、(B)シナプス可塑性の調節、(C)神経伝達物質輸送。 この図の拡大版を表示するには、ここをクリックしてください。

図4:マウス脳の2つの選択された領域間の遺伝子発現パターンの比較。 (A)サンプル内比較のための視床下部および海馬領域でのスポット選択。選択した領域 1 は赤で、領域 2 は緑で表示されます。視床下部と海馬領域の間の差次発現遺伝子(B) Pmch および(C) Ttr の空間的発現パターン。 この図の拡大版を表示するには、ここをクリックしてください。

図5:2つの転移性マウス肝臓サンプルの特性。 サンプルDSID001005の場合:(A) エプカム マーカー発現、(B)スポットクラスター、および(C)サンプル内比較のための癌性および遠隔領域の選択された領域。サンプルDSID001007の場合:(D) エプカム マーカー発現、(E)スポットクラスター、および(F)サンプル内比較用の癌性領域と遠隔領域の選択された領域。どちらのサンプルでも、腫瘍スポットは赤で示された領域にあり、非腫瘍スポットは緑で示された領域にあります。 この図の拡大版を表示するには、ここをクリックしてください。

図6:再解析結果。 (A)再解析で使用したワークフローの概略図。(B)癌性領域と遠隔領域の間で差次的に発現する遺伝子を表す火山プロット。(C)アップレギュレーション遺伝子と(D)ダウンレギュレーション遺伝子のKEGG経路濃縮 この図の拡大版を表示するには、ここをクリックしてください。

図7:遺伝子の空間的発現。 (A) Cldn7、(B) Cldn4、および(C)組織スライスDSID001005中の Actg1 。遺伝子の空間的発現(D) Cldn7、(E) Cldn4、および(F)組織スライスDSID001007中の Actg1 。 この図の拡大版を表示するには、ここをクリックしてください。
補足ファイル1-4:肝転移のデータファイルとRスクリプトの例。このファイルをダウンロードするには、ここをクリックしてください。
ここでは、DeepSpaceDBにおける空間トランスクリプトミクスデータのナビゲーション、検索、解析を概説する2つの包括的なプロトコルを紹介しました。ほとんどの空間オミクスデータベースは、さまざまなプラットフォーム3,4,5,6を使用して生成された多数のサンプルからのデータの収集に焦点を当てていますが、DeepSpaceDBは、ユーザーが空間トランスクリプトミクスの特徴を深く効率的に探索できるようにするインタラクティブなツールの開発に焦点を当てています。このレベルの機能を有効にするために、現在のリリースはVisiumプラットフォームのみに焦点を当てています。高解像度プラットフォームの出現に伴い、それに応じて DeepSpaceDB を拡張し、そのようなデータをユーザーフレンドリーな方法で処理および統合するための新しい戦略を開発する予定です。
DeepSpaceDBを使用すると、ユーザーはサンプルの品質指標(遺伝子数、読み取り深度など)を評価し、データセット間で比較できます。このデータベースには、ラベルが割り当てられたデータベース全体にわたる教師なしクラスタリング、組織学的画像からの構造的および病理学的特徴のLLMベースの検出、増え続けるサンプルのサブセットに対する専門家による組織学的アノテーションなど、多層アノテーションが含まれています。さらに、ユーザーはサンプル内またはサンプル間で関心のある領域をインタラクティブに選択して遺伝子発現を比較できるため、腫瘍と間質、疾患領域と健康領域などの領域間の空間的コントラストの研究が可能になります。このような機能は、一般に他のデータベース3、4、5、6には欠けている。空間的に変動する遺伝子や経路、細胞型予測、クラスタリング結果などのその他の機能も利用できます。まとめると、このデータベースは空間トランスクリプトミクス データを探索する際の障壁を大幅に下げます。さまざまな組織や状態からのサンプルに自由にアクセスでき、ユーザーは簡単なポイント アンド クリック操作でサンプルをナビゲートできます。高度なバイオインフォマティクスの専門知識は必要ありません。とはいえ、発現パターンを正確に解釈し、Tissue Explorerツールで関心のある領域を選択するには、マーカー遺伝子と組織構造に関する事前知識が必要になる可能性があります。
ここでは紹介していませんが、ユーザーは独自のサンプルをアップロードし、同じツールの多くを適用して分析することもできます。このデータベースは、2つの異なる組織スライス間のサンプル間比較もサポートしており、たとえば、病変組織と健康な対照組織との比較が可能です。最後に、生データと処理されたデータ、およびすべての派生分析出力をダウンロードでき、ダウンストリームのワークフローとカスタム分析をサポートします。これらのツールのいくつかについては、データベースのチュートリアル ページで短いチュートリアル ビデオを使用できます。
データベースにはまだ改善が必要な側面があります。1つは、組織スライス内の各場所での細胞型と細胞型組成の正確な予測です。DeepSpaceDBの現在のバージョン(バージョン1.0)では、ロバスト細胞型分解(RCTD)21と呼ばれる方法を使用して、各Visiumスポットの細胞型組成を予測しました。RCTD は、最近のベンチマーク研究22 で比較的良好なパフォーマンスを発揮しました。RCTDによる予測は、がんを保有するマウスの肝臓に関する最近の研究でも実験的に検証される可能性があります23。しかし、細胞型予測の精度の包括的な評価は行われていません。関連する問題は、RCTDやその他の細胞型予測方法では、注釈付きの細胞型を含む参照データセットが必要であることです。一般に、各空間位置の細胞型(または細胞型組成)は、この参照データセットの遺伝子発現パターンとの比較を通じて予測されます。ただし、各Visiumサンプルに適したリファレンスを選択することは、必ずしも簡単ではありません。参考文献は、主要な細胞型を欠いているか、逆に、組織スライス24に存在しない細胞型を含むかもしれない。さらに、1つの細胞型内では、細胞は、不活性免疫細胞と活性化免疫細胞など、劇的に異なる状態にある可能性があります25。参照データセットに存在する細胞状態は、多くの場合、患者の疾患モデルから取得される空間サンプルの細胞状態と必ずしも一致するとは限りません。どちらの問題も、不正確な予測につながる可能性があります。今後、この問題に取り組んでいきたいと考えています。
空間トランスクリプトミクスの分野が急速に進化し続けるにつれて、細胞間相互作用、空間ドメイン、空間的に可変遺伝子の予測など、空間データのさまざまな側面を分析するための計算ツールがますます多く開発されています(たとえば、26、27、28を参照)。この急増はこの分野のダイナミズムを反映していますが、ツールをキュレーションしてこのデータベースに統合するという課題も生じています。最も堅牢で広く適用可能な方法を確実に含めるために、データセットと分析タスク全体でツールのパフォーマンスを評価する体系的なベンチマーク研究が緊急に必要とされています22,29,30。このような取り組みは、データベースに含めるためのツールの情報に基づいた選択と優先順位付けを導くために不可欠です。
他の空間トランスクリプトミクスデータベースは、多くの異なるプラットフォームから多数のサンプルを収集しようとしますが、DeepSpaceDBでは、いくつかの一般的なプラットフォームに焦点を当て、ユーザーがデータをより詳細に簡単に探索できるインタラクティブで直感的なツールを実装するという、別の戦略を使用することにしました。私たちのデータベースには、現在のバージョン1.0のVisiumサンプルのみが含まれていますが、将来のアップデートでは他のプラットフォームのサンプルも含める予定です。
著者らは開示するものは何もない。
著者は、秘書の協力をしてくれた原田祐一氏に感謝したいと思います。本研究は、JST NBDC(助成番号JPMJND2303、A.V.)およびAMED(助成番号JP24gm2010003、A.V.)の支援を受けました。本研究は、日本学術振興会科研費(20H03451、24K02236、24KK0147;S.K.)、JST FOREST (JPMJFR2062;S.K)、JST ムーンショット (JPMJMS2011-61;S.K.)の1999年1月12日。資金提供者は、研究デザイン、データ収集と分析、出版の決定、または原稿の準備において何の役割も果たさなかった。
| Name | Company | Catalog Number | Comments |
|---|---|---|---|
| clusterProfiler (クラスタプロファイラー) | R パッケージ - バージョン 4.14.6 | ||
| ディープスペースDB | バージョン > 1.0 | データベースへのリンク: www.deepspacedb.com | |
| リマ | R パッケージ - バージョン 3.62.2 | ||
| R | バージョン 4.4.2 | ||
| RStudio | 仮定 | バージョン 2024.12 |
Request permission to reuse the text or figures of this JoVE article
Request Permission