Method Article

DeepSpaceDBを使用した空間トランスクリプトミクスデータセットのマイニング

DOI:

10.3791/68892

September 5th, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

本稿では、空間トランスクリプトミクスのための動的でインタラクティブなデータベースであるDeepSpaceDBを使用するためのプロトコルを紹介し、組織組織化と疾患関連遺伝子発現を探るための解析ワークフローと例を提供します。

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

空間トランスクリプトミクスは、位置情報を保存しながら組織サンプル中の遺伝子発現パターンをキャプチャできる急速に進化する技術です。生物学研究やバイオインフォマティクスに幅広い用途があり、研究者はさまざまな組織、状態、疾患にわたる遺伝子発現の空間的変動を調査および追跡できるようになります。空間トランスクリプトミクスのデータ分析が注目を集めるにつれ、公開されているデータセットの数が増加しています。しかし、空間トランスクリプトミクスは依然として高度に専門化された実験技術であり、技術的および財政的制約が大きい。空間データへのアクセスを容易にするために、私たちは最近、空間トランスクリプトミクスデータ探索のための包括的で動的なデータベースであるDeepSpaceDBを開発しました。この記事では、データベースのコンポーネントとそのナビゲーションの概要を、いくつかの例を使用して詳細なワークフローを紹介します。まず、マウス脳サンプルの分析が実証され、品質指標、空間的に変化する遺伝子と経路、海馬と視床下部の間の遺伝子発現の変動が調査されます。次に、免疫活性に関連する差次的に発現する遺伝子の同定と注釈は、結腸直腸起源の転移領域とマウス肝臓の健康な組織の遠隔領域を比較することによってさらに調査されます。DeepSpaceDB は、高度なツールとインタラクティブな機能を備えており、空間トランスクリプトミクス研究の貴重なリソースとして機能し、組織組織と疾患生物学のより深い調査を可能にします。

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

空間トランスクリプトミクスは、研究者が組織切片内の空間情報を保持しながら遺伝子発現を分析できるようにする新しい技術であり、組織構造、細胞の不均一性、および微小環境の影響を前例のない解像度で研究できるようにします1,2。しかし、この技術の可能性にもかかわらず、アクセスと分析は依然として限られており、空間トランスクリプトミクスは多くの研究室にとって法外なコストであり、データ分析には高度なバイオインフォマティクスのスキルが必要です。

公開データベースの開発は、この新たな実験モダリティへのアクセスを広げる 1 つの方法です。いくつかの空間トランスクリプトミクスデータベースが作成されています。1つ目はSpatialDBでしたが、サンプル数が限られており、更新されていません3。SODB、SOAR、およびSTOmicsDBデータベースには、多くの異なるプラットフォームからの多数のサンプルが含まれており、データリポジトリ4,5,6として大きな役割を果たします。ただし、分析ツールは限られており、インタラクティブ性に欠けています。この問題に対処するために、私たちは最近、技術的障壁を下げ、アクセシビリティを拡大するように設計された、公開されている空間トランスクリプトミクスデータセットの厳選されたユーザーフレンドリーなデータベースであるDeepSpaceDBを開発しました7。この記事では、データベースの検索、サンプル品質の検査、視覚化ツール、組織スライス内のインタラクティブに選択された領域の比較など、このデータベースのいくつかのツールについて説明します。マウス脳サンプルと結腸直腸転移のあるマウス肝臓の分析という2つの代表的な例を使用して詳細なプロトコルを提示し、これらのツールを実際の文脈で実証します。これらのツールを通じて、DeepSpaceDB は、より幅広い研究者が独自のデータや社内のバイオインフォマティクス能力を必要とせずに空間トランスクリプトミクスを活用できるようにします。データ収集、品質管理、処理ワークフロー、およびDeepSpaceDBに含まれるデータと機能の包括的な説明は、Honcharuk etal 7によって詳細に提供されています。

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. 例1:マウス脳サンプルの解析

注:このセクションでは、マウスの脳サンプルの分析を、DeepSpaceDBで利用可能なさまざまな特徴とプロットをナビゲートして説明します(データベースへのリンクは 材料表にあります)。

  1. サンプルの選択
    1. データベースタブをクリックし、フィルターを使用して、生物マウス、臓器、およびソースzenodoを選択します。結果のサンプル間を移動し、サンプルDSID001557を選択します。または、検索ボックスを使用してデータベースで "DSID001557" という用語を検索し、このサンプルを選択します。
    2. サンプルをクリックし、 100 μL生理食塩水-NK細胞に2×106 細胞(i.v.週に1回、合計5回注射)として説明を確認します。
  2. 品質分析
    1. [ 品質 ]タブをクリックして、選択したサンプルの品質を評価します。 品質測定 ドロップダウンメニューから、 検出遺伝子 (図1A)、 リードカウント (図1B)、 Mito (図1C)などのさまざまなオプションを選択して、サンプルスライス全体の各スポットのそれぞれのパラメーターを視覚化します。
  3. 画像注釈
    1. [ 画像注釈 ] タブに移動して、サンプル スライスのさまざまな領域を識別します。
    2. サンプルスライスの上にマウスカーソルを移動します。大規模言語モデル(LLM)によって予測された注釈は、サンプル画像の一部についてグリッドベースの方法で表示され、解剖学的構造と関連する条件8に関する情報が表示されます。
  4. クラスター分析
    1. サンプルスライスのセルタイプクラスターについてより深く理解するには、[ クラスター] タブに移動します。クラスターの2D埋め込みが、サンプルスライス上のスポット全体で色分けされたクラスターの表現とともに表示されます(図1E)。
  5. 空間的に変化する遺伝子と経路
    1. [遺伝子]タブに移動し、サンプル9,10中の空間的に可変の遺伝子(SVG、発現レベルが組織の位置によって異なる遺伝子)に注意します。これらのSVGは、Kullback-Leibler発散測度(表のD_KL)を採用したsingleCellHaystack関数を使用して予測され、各遺伝子の発現パターンがランダムに予想されるものとどの程度異なるかを評価します(図2)。p値が低い遺伝子(表の負のlog.p.adjが大きい)はSVGとしてリストされます。
      注:遺伝子発現データは、Seurat R(バージョン5)パッケージ11で使用されるデフォルトパラメータを使用して正規化されました。実際には、各スポットの各遺伝子のリードをそのスポットのリードの総数で割り、スケールファクター10,000を掛けました。次に、log(0)の問題を回避するために、1を加算した後に自然対数を計算しました。[ 遺伝子 ]タブに表示されるプロットは、この正規化されたデータを示しています。
    2. リスト内の上位の遺伝子のいくつかをクリックします。これにより、組織スライス全体の遺伝子の空間プロットが生成され、スポットは発現レベルごとに色分けされます(図2)。トップスコアの遺伝子は、明らかに異なる空間的発現パターンを持っています。
    3. さらに[経路]タブに移動して、個々の遺伝子ではなく、遺伝子のセット(たとえば、共通の生物学的経路に関連する遺伝子)の活性を調べます。空間的に可変の経路は、上記のSVGと同様の方法でリストされています(図3)。経路活性は、それらに関連する遺伝子の発現レベルに基づいて推定されます7,11
      注:経路活性は、Seurat Rパッケージ関数addModuleScore11を使用して推定されました。簡単に言うと、この関数は、遺伝子のセット(例えば、共通の経路に関与する遺伝子のセット)を入力として受け取り、いくつかの処理ステップの後にそれらの平均発現レベルを返します。実際には、正の値は平均よりも高いアクティビティを意味し、負の値は平均よりも低いアクティビティを意味します。「 経路」 タブに表示されるプロットは、このモジュールのスコア・データを示しています。
    4. リスト内の上位の経路のいくつかをクリックします。これにより、組織スライスを横切る経路の空間プロットが生成され、スポットは活動レベルに合わせて色分けされます。いくつかの経路には、活動の異なる空間パターンがあります(図3)。
  6. サンプル内遺伝子発現比較
    1. [ Tissue Explorer ] タブに移動し、[ Manual Selection] を選択します (まだ選択されていない場合)。次に、マウスカーソルを使用して、マウスの脳スライスの海馬領域の左側のスポットを選択します。セット 1 をクリックし、[ セットに追加] を選択します。これにより、右側のスライスで選択したすべてのスポットが強調表示されます(図4A)。
    2. 次に、 セット2をクリックし、マウスカーソルを使用して、マウス脳スライスの視床下部領域のスポットを選択します。[ セットに追加]をクリックすると、右側のスライスで選択したすべてのスポットが強調表示されます(図4A)。
    3. スポット選択プロセスが完了したら、 遺伝子発現の比較 ボタンをクリックします。これにより、両方の領域間で選択したスポットの平均遺伝子発現値と散布図表現を含むテーブルが生成されます。個々のスポットにカーソルを移動して、両方の領域の遺伝子名と遺伝子の平均発現を確認します。
    4. 遺伝子発現比較結果に基づいて、差次的に発現する遺伝子を特定し、[ 遺伝子 ]タブに再度移動して、サンプルスライス全体でそれらの発現を視覚化します(図4B、C)。
      注:上記の手順を通じて、DeepSpaceDBを使用して、マウス脳空間トランスクリプトミクスサンプルの特徴を調査できます。

2.実施例2:マウス肝臓における結腸直腸起源の転移領域における免疫活性に関連する異なる発現遺伝子の同定および注釈

注:サンプル内比較は、現在のセクションで検討されています。これは、2つの異なるサンプルに基づいて、結腸直腸起源の転移領域と肝臓切片内の健康な組織の遠隔領域との間で差次的に発現する遺伝子の同定と注釈によって説明されます。免疫活性に関連する特定の調節不全遺伝子の空間的発現は、組織切片でさらに視覚化されます。

  1. データベースナビゲーションとサンプル選択
    1. [ データベース] タブをクリックし、フィルター を使用して、生物マウス、臓器 肝臓、および 状態癌を選択します。結果のサンプルから、サンプル DSID001005を選択します。サンプルをクリックし、 サンプルが結腸直腸癌起源の転移を含むマウス肝臓からのものであるという説明を確認します。
    2. [ Tissue Explorer ] タブに移動し、[ 手動選択] を選択します。次に、マウスカーソルを使用して、 Epcam マーカーの陽性発現に基づいて同定された肝臓サンプルDSID001005の腫瘍領域(結腸直腸転移)のスポットを選択します(図5A)。 セット 1 をクリックし、[ セットに追加] を選択します。これにより、右側のスライスで選択したすべてのスポットが強調表示されます(図5C)。
    3. 次に、 セット2をクリックし、マウスカーソルを使用して、肝臓サンプルの遠くの非腫瘍領域のスポットを選択します。セット に追加をクリックすると、右側のスライスで選択したすべてのスポットが強調表示されます(図5C)。
  2. 選択されたスポット間の遺伝子発現の比較
    1. スポット選択プロセスが完了したら、 遺伝子発現の比較 ボタンをクリックします。これにより、両方の領域間で選択したスポットの平均遺伝子発現値と散布図表現を含むテーブルが生成されます。マウスカーソルを個々のスポットに移動し、両方の領域の遺伝子名と遺伝子の平均発現を調べます。
    2. 遺伝子発現データを使用してより詳細な分析を行うには、[ CSV をダウンロード ] オプションを選択します。これにより、サンプルの2つの領域の遺伝子発現データのカンマ区切り値(CSV)ファイルが生成されます。
    3. サンプル「DSID001007」に対して、手順2.1.1-2.1.3および2.2.1-2.2.2を繰り返します。結腸直腸癌起源の転移を含むマウス肝臓からの別のスライスとしての説明を確認します。
  3. Rプログラミングによるデータ解析
    1. 上記の手順により、サンプル DSID001005 とサンプル DSID001007 の 2 つの CSV ファイルが作成されることを確認します。どちらのファイルにも、各サンプルで行われた 2 つの選択 (腫瘍組織と非腫瘍組織) の平均遺伝子発現を表す 2 つの列が含まれています。
    2. CSVファイルをRに読み込み、条件ごとに2回の反復でさらに下流分析を行うためにマージします(つまり、結腸直腸癌転移のある腫瘍領域、および肝臓の遠隔健康な組織)。 補足資料のRスクリプトとデータファイルを参照してください。
    3. R(バージョン4.4.2)12 のlimmaパッケージ(バージョン3.62.2)を使用して、データの差次発現解析を行い、両方のサンプルの結腸直腸転移領域を として分類し、両方のサンプルの遠隔の健康な領域を 対照として分類します。logFCのフィルターを0.5>、調整されたp値を0.05<でアップレギュレーションされた遺伝子を取得します。同様に、logFCのフィルター<-0.5、調整されたp値<0.05でダウンレギュレーションされた遺伝子を取得します。
      注:これらの遺伝子セットは、次のステップで腫瘍の影響を受ける生物学的経路を特定するために使用されます(図6A、B)。
    4. R13 のclusterProfilerパッケージ(バージョン4.14.6)を使用して、京都遺伝子とゲノム百科事典(KEGG)14 のダウンレギュレーションおよびアップレギュレーションされた遺伝子の経路の解析を行います。0.05< q 値の厳密なフィルターに基づいて、ダウンレギュレーションおよびアップレギュレーションされた遺伝子に関連する重要な経路を特定します。免疫経路、免疫活性、または関連するシグネチャに関連する遺伝子に焦点を当てます(図6B)。
  4. 遺伝子特異的データマイニング
    1. 次に、「 空間的に可変の遺伝子」 セクションで遺伝子名を検索し、標的遺伝子の空間発現を確認します。遺伝子名をクリックすると、組織スライス全体にわたる遺伝子の空間プロットが生成され、スポットは発現レベル用に色分けされています(図7)。
    2. 遠く離れた健康な肝組織に対して、結腸直腸転移部位で空間的に発現パターンを持つ特定の遺伝子を同定します。遺伝子の機能的関連性、または他の臓器や条件における遺伝子の発現は、データベースでさらに調査できます。
    3. [ 検索 ] タブを選択し、種を マウスとして選択します。 遺伝子で検索 オプションをクリックし、遺伝子名を入力します。遺伝子の臓器と状態分布の概要が表示され、さらに分析できます。
      注:上記の手順を通じて、DeepSpaceDBを使用して、マウス肝臓空間トランスクリプトミクスサンプルの転移領域と非転移領域の間の遺伝子発現パターンを調査できます。

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

実施例1は、マウス脳サンプルの分析を示し、リードカウント、空間的に変化する遺伝子と経路、海馬と皮質の間の遺伝子発現変動などのパラメーターを検証しました。まず、マウス脳サンプルDSID001557の品質を、いくつかの品質尺度に対して評価しました:「検出された遺伝子」(図1A)、「リードカウント」(図1B)、および「ミト」(ミトコンドリアリードの割合;図1C)。これは、検出された遺伝子の数が少なく、リード数が少ないことに基づいて、脳サンプルの左側にある品質の低い領域を明確に強調しました。他のすべてのサンプルに対するサンプルの相対的な品質を理解するために、データベースの「サンプルの相対的な品質」タブをクリックすると、カウントと否のグラフが表示されました。スポットごとに検出された遺伝子の数(平均)。分析対象のサンプルでは、スポットごとに3500〜4000個の遺伝子が検出されました(図1D)。サンプルの解剖学的特徴は、[画像注釈]タブを使用してさらに分析されました。一般的な注意として、これらの注釈は、組織画像をより小さな部分に切り取り、観察可能な特徴8を記述するようにLLMに依頼することによって生成されました。これらはサンプルの解釈を支援するための大まかな指示であり、慎重に解釈する必要があります。サンプルのサブセット(特にヒト乳がんサンプル)については、ヒトの専門家による注釈も利用できます。ただし、日常的な診断に使用される画像と比較して Visium H&E 画像の品質が低いことを考慮すると、提供されている注釈は研究目的のみを目的としています。サンプルDSID001557の場合は、海馬領域、皮質層、神経膠症を伴う密な細胞層など、マウス脳のさまざまな領域の注釈が表示されたスライス上にカーソルを移動します。サンプルスライスの基本的な解剖学的特徴を理解することから、細胞型クラスターや空間的に変化する遺伝子や経路などの詳細な特徴がさらに調査されました。マウスの脳サンプルには合計15個のクラスターがあり、サンプルスライス全体で色分けで表されました(図1E)。サンプルに関連する空間的に可変性の高い遺伝子には、NrgnSlc17a7Ly6hおよびDdnがあります(図2)。Nrgnは、シナプス可塑性と空間学習の媒介におけるNrgnコードタンパク質(ニューログラニン)の役割を示す文献的証拠に従って、海馬領域で高い発現を示しました15。グルタミン作動性ニューロンの神経伝達に重要な小胞性グルタミン酸トランスポーターをコードする遺伝子であるSlc17a716と、シナプス後細胞骨格の構造を調節するタンパク質をコードする遺伝子であるDdn17も海馬領域で高発現していました。対照的に、遺伝子Ly6hの発現は、皮質細胞の膜におけるLy6hの制限的なシナプスの役割を示す文献に従って、皮質領域に局在していました18。同様に、サンプルスライス全体で経路の活性を視覚化しました(図3)。空間的に可変の経路は、海馬領域のシナプス可塑性と神経伝達物質活性の調節、および皮質領域の神経ペプチドシグナル伝達の調節により、空間的に可変遺伝子の機能的役割と一致して活性化されることが観察されました。

最後に、マウス脳サンプルの海馬領域と視床下部の間で差次的に発現する遺伝子を特定するために、Tissue Explorerタブが利用されました。関心領域に関連するスポットは、画像注釈からのガイダンスで選択されました(図4A)。生成された散布図から、同定された差次的に発現する遺伝子のいくつかは、PmchTtrなどの他のいくつかの遺伝子に加えて、空間的に変動する上位の遺伝子(NrgnSlc17a7Ddn)の中にありました。これらの遺伝子の発現は、サンプルスライスで視覚化されました。Pmchは、視床下部の外側領域で特異的に過剰発現していました(図4B;図4Aの緑色の選択領域と比較して)。この遺伝子はメラニン濃縮ホルモンの前駆体をコードし、エネルギー恒常性の維持に関与しています19。対照的に、遺伝子Ttrは、学習および空間記憶におけるその機能的役割に従って、海馬領域(図4C図4Aの赤色の選択領域と比較して)で特異的に発現した20。このデータベースを用いて異なるマウス脳領域間のサンプル内比較を行うことで、空間的遺伝子発現や経路活性に基づいて領域特異的な機能的特徴を浮き彫りにすることができました。

実施例2では、データベースを肝臓における結腸直腸転移に関連する免疫シグネチャの同定に利用した。結腸直腸転移のある腫瘍領域と遠隔の健康な肝組織の間で、DSID001005(図5A-C)とDSID001007(図5D-F)の2つのサンプルの適切なスポット選択を通じて、サンプル内比較を実施しました。データは、Rを使用して条件ごとに2回の繰り返しで再分析されました。結腸直腸転移のある腫瘍領域と健康な肝組織の間で実施された差次的発現分析により、選択されたパラメーターに基づいて、138の遺伝子のダウンレギュレーションと115の遺伝子のアップレギュレーションが明らかになりました(図6AB)。KEGG経路解析では、薬物代謝や化学発がんなどのダウンレギュレーションされた遺伝子の経路の濃縮が実証されましたが(図6C)、アップレギュレートされた遺伝子は、とりわけ白血球の経内皮遊走、焦点接着、細胞周期に対応するシグネチャを示しました(図6D)。白血球の経内皮遊走が免疫活性に与える関連性に着目し、このカテゴリーで検出された上位遺伝子が同定され、DeepSpaceDBで空間発現が観察されました。興味深いことに、白血球経内皮遊走のカテゴリーで検出された遺伝子Cldn7Cldn4、およびActg1は、健康な肝組織を持つ遠隔領域ではなく、サンプルの腫瘍領域(Epcam+部位)でアップレギュレーションを示しました(図7)。これにより、白血球の活発な動員を伴う肝臓の腫瘍部位で駆動される免疫活性の性質についての洞察が得られました。要約すると、DeepSpaceDB を使用したサンプル内分析により、多様な生物学的洞察の抽出が可能になります。インタラクティブなツールと再分析ワークフローを通じて空間トランスクリプトームデータを比較することで、研究者は組織特異的な遺伝子発現と機能的不均一性に関する仮説を生成および検証できます。

figure-results-1
図1:サンプルの品質測定。 (A)検出された遺伝子の数、(B)リード数、および(C)スポットあたりのミトコンドリアリードの割合。(D)データベース内の他のすべてのサンプルの分布と比較した、このサンプルのスポットあたり検出された遺伝子の平均数。(E)組織スライス全体にスポットクラスターを配置します。 この図の拡大版を表示するには、ここをクリックしてください。

figure-results-2
図2:空間的に可変性の高い上位遺伝子の発現。 (A) Nrgn、(B) Slc17a7、(C) Ly6h、および (D) Ddnこの図の拡大版を表示するには、ここをクリックしてください。

figure-results-3
図3:上位の空間的に可変経路の活性。 (A)神経ペプチドシグナル伝達、(B)シナプス可塑性の調節、(C)神経伝達物質輸送。 この図の拡大版を表示するには、ここをクリックしてください。

figure-results-4
図4:マウス脳の2つの選択された領域間の遺伝子発現パターンの比較。 (A)サンプル内比較のための視床下部および海馬領域でのスポット選択。選択した領域 1 は赤で、領域 2 は緑で表示されます。視床下部と海馬領域の間の差次発現遺伝子(B) Pmch および(C) Ttr の空間的発現パターン。 この図の拡大版を表示するには、ここをクリックしてください。

figure-results-5
図5:2つの転移性マウス肝臓サンプルの特性。 サンプルDSID001005の場合:(A) エプカム マーカー発現、(B)スポットクラスター、および(C)サンプル内比較のための癌性および遠隔領域の選択された領域。サンプルDSID001007の場合:(D) エプカム マーカー発現、(E)スポットクラスター、および(F)サンプル内比較用の癌性領域と遠隔領域の選択された領域。どちらのサンプルでも、腫瘍スポットは赤で示された領域にあり、非腫瘍スポットは緑で示された領域にあります。 この図の拡大版を表示するには、ここをクリックしてください。

figure-results-6
図6:再解析結果。 (A)再解析で使用したワークフローの概略図。(B)癌性領域と遠隔領域の間で差次的に発現する遺伝子を表す火山プロット。(C)アップレギュレーション遺伝子と(D)ダウンレギュレーション遺伝子のKEGG経路濃縮 この図の拡大版を表示するには、ここをクリックしてください。

figure-results-7
図7:遺伝子の空間的発現。 (A) Cldn7、(B) Cldn4、および(C)組織スライスDSID001005中の Actg1 。遺伝子の空間的発現(D) Cldn7、(E) Cldn4、および(F)組織スライスDSID001007中の Actg1この図の拡大版を表示するには、ここをクリックしてください。

補足ファイル1-4:肝転移のデータファイルとRスクリプトの例。このファイルをダウンロードするには、ここをクリックしてください。

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

ここでは、DeepSpaceDBにおける空間トランスクリプトミクスデータのナビゲーション、検索、解析を概説する2つの包括的なプロトコルを紹介しました。ほとんどの空間オミクスデータベースは、さまざまなプラットフォーム3,4,5,6を使用して生成された多数のサンプルからのデータの収集に焦点を当てていますが、DeepSpaceDBは、ユーザーが空間トランスクリプトミクスの特徴を深く効率的に探索できるようにするインタラクティブなツールの開発に焦点を当てています。このレベルの機能を有効にするために、現在のリリースはVisiumプラットフォームのみに焦点を当てています。高解像度プラットフォームの出現に伴い、それに応じて DeepSpaceDB を拡張し、そのようなデータをユーザーフレンドリーな方法で処理および統合するための新しい戦略を開発する予定です。

DeepSpaceDBを使用すると、ユーザーはサンプルの品質指標(遺伝子数、読み取り深度など)を評価し、データセット間で比較できます。このデータベースには、ラベルが割り当てられたデータベース全体にわたる教師なしクラスタリング、組織学的画像からの構造的および病理学的特徴のLLMベースの検出、増え続けるサンプルのサブセットに対する専門家による組織学的アノテーションなど、多層アノテーションが含まれています。さらに、ユーザーはサンプル内またはサンプル間で関心のある領域をインタラクティブに選択して遺伝子発現を比較できるため、腫瘍と間質、疾患領域と健康領域などの領域間の空間的コントラストの研究が可能になります。このような機能は、一般に他のデータベース3456には欠けている。空間的に変動する遺伝子や経路、細胞型予測、クラスタリング結果などのその他の機能も利用できます。まとめると、このデータベースは空間トランスクリプトミクス データを探索する際の障壁を大幅に下げます。さまざまな組織や状態からのサンプルに自由にアクセスでき、ユーザーは簡単なポイント アンド クリック操作でサンプルをナビゲートできます。高度なバイオインフォマティクスの専門知識は必要ありません。とはいえ、発現パターンを正確に解釈し、Tissue Explorerツールで関心のある領域を選択するには、マーカー遺伝子と組織構造に関する事前知識が必要になる可能性があります。

ここでは紹介していませんが、ユーザーは独自のサンプルをアップロードし、同じツールの多くを適用して分析することもできます。このデータベースは、2つの異なる組織スライス間のサンプル間比較もサポートしており、たとえば、病変組織と健康な対照組織との比較が可能です。最後に、生データと処理されたデータ、およびすべての派生分析出力をダウンロードでき、ダウンストリームのワークフローとカスタム分析をサポートします。これらのツールのいくつかについては、データベースのチュートリアル ページで短いチュートリアル ビデオを使用できます。

データベースにはまだ改善が必要な側面があります。1つは、組織スライス内の各場所での細胞型と細胞型組成の正確な予測です。DeepSpaceDBの現在のバージョン(バージョン1.0)では、ロバスト細胞型分解(RCTD)21と呼ばれる方法を使用して、各Visiumスポットの細胞型組成を予測しました。RCTD は、最近のベンチマーク研究22 で比較的良好なパフォーマンスを発揮しました。RCTDによる予測は、がんを保有するマウスの肝臓に関する最近の研究でも実験的に検証される可能性があります23。しかし、細胞型予測の精度の包括的な評価は行われていません。関連する問題は、RCTDやその他の細胞型予測方法では、注釈付きの細胞型を含む参照データセットが必要であることです。一般に、各空間位置の細胞型(または細胞型組成)は、この参照データセットの遺伝子発現パターンとの比較を通じて予測されます。ただし、各Visiumサンプルに適したリファレンスを選択することは、必ずしも簡単ではありません。参考文献は、主要な細胞型を欠いているか、逆に、組織スライス24に存在しない細胞型を含むかもしれない。さらに、1つの細胞型内では、細胞は、不活性免疫細胞と活性化免疫細胞など、劇的に異なる状態にある可能性があります25。参照データセットに存在する細胞状態は、多くの場合、患者の疾患モデルから取得される空間サンプルの細胞状態と必ずしも一致するとは限りません。どちらの問題も、不正確な予測につながる可能性があります。今後、この問題に取り組んでいきたいと考えています。

空間トランスクリプトミクスの分野が急速に進化し続けるにつれて、細胞間相互作用、空間ドメイン、空間的に可変遺伝子の予測など、空間データのさまざまな側面を分析するための計算ツールがますます多く開発されています(たとえば、262728を参照)。この急増はこの分野のダイナミズムを反映していますが、ツールをキュレーションしてこのデータベースに統合するという課題も生じています。最も堅牢で広く適用可能な方法を確実に含めるために、データセットと分析タスク全体でツールのパフォーマンスを評価する体系的なベンチマーク研究が緊急に必要とされています22,29,30。このような取り組みは、データベースに含めるためのツールの情報に基づいた選択と優先順位付けを導くために不可欠です。

他の空間トランスクリプトミクスデータベースは、多くの異なるプラットフォームから多数のサンプルを収集しようとしますが、DeepSpaceDBでは、いくつかの一般的なプラットフォームに焦点を当て、ユーザーがデータをより詳細に簡単に探索できるインタラクティブで直感的なツールを実装するという、別の戦略を使用することにしました。私たちのデータベースには、現在のバージョン1.0のVisiumサンプルのみが含まれていますが、将来のアップデートでは他のプラットフォームのサンプルも含める予定です。

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

著者らは開示するものは何もない。

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

著者は、秘書の協力をしてくれた原田祐一氏に感謝したいと思います。本研究は、JST NBDC(助成番号JPMJND2303、A.V.)およびAMED(助成番号JP24gm2010003、A.V.)の支援を受けました。本研究は、日本学術振興会科研費(20H03451、24K02236、24KK0147;S.K.)、JST FOREST (JPMJFR2062;S.K)、JST ムーンショット (JPMJMS2011-61;S.K.)の1999年1月12日。資金提供者は、研究デザイン、データ収集と分析、出版の決定、または原稿の準備において何の役割も果たさなかった。

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
clusterProfiler (クラスタプロファイラー)R パッケージ - バージョン 4.14.6
ディープスペースDBバージョン > 1.0データベースへのリンク: www.deepspacedb.com
リマR パッケージ - バージョン 3.62.2
Rバージョン 4.4.2
RStudio仮定バージョン 2024.12

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. The expanding vistas of spatial transcriptomics. Nat Biotechnol. 41 (6), 773-782 (2023).">Tian, L., Chen, F., Macosko, E. Z. The expanding vistas of spatial transcriptomics. Nat Biotechnol. 41 (6), 773-782 (2023).
  2. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).">Moses, L., Pachter, L. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).
  3. SpatialDB: A database for spatially resolved transcriptomes. Nucleic Acids Res. 48 (D1), D233-D237 (2020).">Fan, Z., Chen, R., Chen, X. SpatialDB: A database for spatially resolved transcriptomes. Nucleic Acids Res. 48 (D1), D233-D237 (2020).
  4. SODB facilitates comprehensive exploration of spatial omics data. Nat Methods. 20 (3), 387-399 (2023).">Yuan, Z., et al. SODB facilitates comprehensive exploration of spatial omics data. Nat Methods. 20 (3), 387-399 (2023).
  5. STOmicsDB: A comprehensive database for spatial transcriptomics data sharing, analysis and visualization. Nucleic Acids Res. 52 (D1), 1053-1061 (2024).">Xu, Z., et al. STOmicsDB: A comprehensive database for spatial transcriptomics data sharing, analysis and visualization. Nucleic Acids Res. 52 (D1), 1053-1061 (2024).
  6. SOAR elucidates biological insights and empowers drug discovery through spatial transcriptomics. Sci Adv. 11 (24), 7450(2025).">Li, Y., et al. SOAR elucidates biological insights and empowers drug discovery through spatial transcriptomics. Sci Adv. 11 (24), 7450(2025).
  7. DeepSpaceDB: A spatial transcriptomics atlas for interactive in-depth analysis of tissues and tissue microenvironments. bioRxiv. , (2025).">Honcharuk, V., et al. DeepSpaceDB: A spatial transcriptomics atlas for interactive in-depth analysis of tissues and tissue microenvironments. bioRxiv. , (2025).
  8. arXiv. , OpenAI. http://arxiv.org/abs/2303.08774 (2023).">GPT-4 technical report. arXiv. , OpenAI. http://arxiv.org/abs/2303.08774 (2023).
  9. A clustering-independent method for finding differentially expressed genes in single-cell transcriptome data. Nat Commun. 11 (1), 1-10 (2020).">Vandenbon, A., Diez, D. A clustering-independent method for finding differentially expressed genes in single-cell transcriptome data. Nat Commun. 11 (1), 1-10 (2020).
  10. A universal tool for predicting differentially active features in single-cell and spatial genomics data. Sci Rep. 13 (1), 1-14 (2023).">Vandenbon, A., Diez, D. A universal tool for predicting differentially active features in single-cell and spatial genomics data. Sci Rep. 13 (1), 1-14 (2023).
  11. Dictionary learning for integrative, multimodal, and scalable single-cell analysis. Nat Biotechnol. 42 (2), 293-304 (2024).">Hao, Y., et al. Dictionary learning for integrative, multimodal, and scalable single-cell analysis. Nat Biotechnol. 42 (2), 293-304 (2024).
  12. Limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47(2015).">Ritchie, M. E., et al. Limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47(2015).
  13. ClusterProfiler: An R package for comparing biological themes among gene clusters. OMICS. 16 (5), 284-287 (2012).">Yu, G., Wang, L. G., Han, Y., He, Q. Y. ClusterProfiler: An R package for comparing biological themes among gene clusters. OMICS. 16 (5), 284-287 (2012).
  14. KEGG for taxonomy-based analysis of pathways and genomes. Nucleic Acids Res. 51 (D1), D587-D592 (2023).">Kanehisa, M., et al. KEGG for taxonomy-based analysis of pathways and genomes. Nucleic Acids Res. 51 (D1), D587-D592 (2023).
  15. Association between NRGN gene polymorphism and resting-state hippocampal functional connectivity in schizophrenia. BMC Psychiatry. 19 (1), 108(2019).">Zhang, Y., et al. Association between NRGN gene polymorphism and resting-state hippocampal functional connectivity in schizophrenia. BMC Psychiatry. 19 (1), 108(2019).
  16. Glutamate, aspartate and nucleotide transporters in the SLC17 family form four main phylogenetic clusters: evolution and tissue expression. BMC Genomics. 11, 17(2010).">Sreedharan, S., et al. Glutamate, aspartate and nucleotide transporters in the SLC17 family form four main phylogenetic clusters: evolution and tissue expression. BMC Genomics. 11, 17(2010).
  17. Sequencing of hippocampal and cerebellar transcriptomes provides new insights into the complexity of gene regulation in the human brain. Neurosci Lett. 541, 263-268 (2013).">Twine, N. A., Janitz, C., Wilkins, M. R., Janitz, M. Sequencing of hippocampal and cerebellar transcriptomes provides new insights into the complexity of gene regulation in the human brain. Neurosci Lett. 541, 263-268 (2013).
  18. Expression of the Ly-6 family proteins Lynx1 and Ly6H in the rat brain is compartmentalized, cell-type specific, and developmentally regulated. Brain Struct Funct. 219 (6), 1923-1934 (2014).">Thomsen, M. S., et al. Expression of the Ly-6 family proteins Lynx1 and Ly6H in the rat brain is compartmentalized, cell-type specific, and developmentally regulated. Brain Struct Funct. 219 (6), 1923-1934 (2014).
  19. The role of melanin concentrating hormone (MCH) in the central chemoreflex: A knockdown study by siRNA in the lateral hypothalamus in rats. PLoS ONE. 9 (8), e103585(2014).">Li, N., Nattie, E., Li, A. The role of melanin concentrating hormone (MCH) in the central chemoreflex: A knockdown study by siRNA in the lateral hypothalamus in rats. PLoS ONE. 9 (8), e103585(2014).
  20. Transthyretin-a key gene involved in regulating learning and memory in brain, and providing neuroprotection in Alzheimer disease via neuronal synthesis of transthyretin protein. J. Behav. Brain Sci. 8 (2), 77-92 (2018).">Iqbal, J. Transthyretin-a key gene involved in regulating learning and memory in brain, and providing neuroprotection in Alzheimer disease via neuronal synthesis of transthyretin protein. J. Behav. Brain Sci. 8 (2), 77-92 (2018).
  21. Robust decomposition of cell type mixtures in spatial transcriptomics. Nat Biotechnol. 40 (4), 517-526 (2021).">Cable, D. M., et al. Robust decomposition of cell type mixtures in spatial transcriptomics. Nat Biotechnol. 40 (4), 517-526 (2021).
  22. Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution. Nat Methods. 19 (6), 662-670 (2022).">Li, B., et al. Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution. Nat Methods. 19 (6), 662-670 (2022).
  23. Murine breast cancers disorganize the liver transcriptome in a zonated manner. Commun Biol. 6 (1), 1-12 (2023).">Vandenbon, A., et al. Murine breast cancers disorganize the liver transcriptome in a zonated manner. Commun Biol. 6 (1), 1-12 (2023).
  24. Missing cell types in single-cell references impact deconvolution of bulk data but are detectable. Genome Biol. 26 (1), 86(2025).">Ivich, A., et al. Missing cell types in single-cell references impact deconvolution of bulk data but are detectable. Genome Biol. 26 (1), 86(2025).
  25. A periodic table of cell types. Development. 146 (12), dev169854(2019).">Xia, B., Yanai, I. A periodic table of cell types. Development. 146 (12), dev169854(2019).
  26. Deciphering spatial domains from spatially resolved transcriptomics with an adaptive graph attention auto-encoder. Nat Commun. 13 (1), 1739(2022).">Dong, K., Zhang, S. Deciphering spatial domains from spatially resolved transcriptomics with an adaptive graph attention auto-encoder. Nat Commun. 13 (1), 1739(2022).
  27. Mapping cellular interactions from spatially resolved transcriptomics data. Nat Methods. 21, 1830-1842 (2024).">Zhu, J., et al. Mapping cellular interactions from spatially resolved transcriptomics data. Nat Methods. 21, 1830-1842 (2024).
  28. Giotto: A toolbox for integrative analysis and visualization of spatial expression data. Genome Biol. 22 (1), 1-31 (2021).">Dries, R., et al. Giotto: A toolbox for integrative analysis and visualization of spatial expression data. Genome Biol. 22 (1), 1-31 (2021).
  29. Benchmarking spatial clustering methods with spatially resolved transcriptomics data. Nat Methods. 21 (4), 712-722 (2024).">Yuan, Z., et al. Benchmarking spatial clustering methods with spatially resolved transcriptomics data. Nat Methods. 21 (4), 712-722 (2024).
  30. Benchmarking algorithms for spatially variable gene identification in spatial transcriptomics. Bioinformatics. 41 (4), btaf131(2025).">Chen, X., et al. Benchmarking algorithms for spatially variable gene identification in spatial transcriptomics. Bioinformatics. 41 (4), btaf131(2025).

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Spatial TranscriptomicsGene Expression PatternsDeepSpaceDB DatabaseTissue Slice AnalysisSpatially Variable GenesDifferential Gene ExpressionTumor MicroenvironmentMouse Brain SampleColorectal Cancer MetastasisBioinformatics Tools

Related Articles