本プロトコルは、がんゲノムアトラス(TCGA)、遺伝子型-組織発現(GTEx)プロジェクト、マイクロアレイプラットフォームからの公開データセットを用いて、突然変異プロファイル、コピー数変異、遺伝子発現、臨床アウトカムを統合し、m6A修飾調節因子のシ リコ 遺伝学的、分子的、予後解析を行うアプローチを提示します。
Method Article
本プロトコルは、がんゲノムアトラス(TCGA)、遺伝子型-組織発現(GTEx)プロジェクト、マイクロアレイプラットフォームからの公開データセットを用いて、突然変異プロファイル、コピー数変異、遺伝子発現、臨床アウトカムを統合し、m6A修飾調節因子のシ リコ 遺伝学的、分子的、予後解析を行うアプローチを提示します。
N6-メチルアデノシン(m6A)は真核転写産物における最も豊富な内部RNA修飾であり、RNA代謝、遺伝子発現、細胞恒常性において重要な役割を果たします。m6A調節因子の調節障害(「書き手」「消しゴム」「リーダー」など)は、がん生物学にますます関与しているとされています。しかし、乳がんにおける彼らの包括的な役割はまだ理解されていません。本方法論の主な目的は、バイオインフォマティクス初心者に対し、公開されているがんデータセットを活用して突然変異解析を行い、遺伝子発現変化を評価し、患者生存率との関連を検証するためのステップバイステップの枠組みを提供することです。ケーススタディとして、乳がんにおけるm6A調節因子は、Cancer Genome Atlas(TCGA)、Genotype-Tissue Expression(GTEx)プロジェクト、およびマイクロアレイプラットフォームのデータセットを用いて解析されました。トランスクリプトミクスプロファイルを体系的に解析し、乳がんにおけるm6A調節成分の予後関連性を評価するワークフローを示しました。この分析枠組みを用いて、主要なm6A調節因子間で遺伝的変異や発現の違いが明確に見られました。METTL14、CBLL1、YTHDC1、HNRNPC、HNRNPA2B1、RBMXなどの複数の調節因子は患者の生存率向上と関連し、YWHAGは全体的な生存率が低いと関連していました。本研究は、乳がんにおけるm6A調節遺伝子の包括的なシステムゲノミクス概要を提供するとともに、実用的かつ再現性の高いウェブベースのバイオインフォマティクスワークフローを示します。これらの発見は乳がんにおけるエピトランスクリプトム調節の理解を深め、新しいm6Aベースの診断および治療戦略の開発の基盤を提供します。
エピトランスクリプトミック修飾は転写後遺伝子調節の重要な層であり、多様な細胞過程や疾患状態に寄与します。これまでに170以上のRNA修飾が確認された中で、N6-メチルアデノシン(m6A)は真核生物mRNAにおいて最も多く、よく特徴づけられている1。METTL3/METTL14を含む「ライター」複合体によってインストールされ、FTOやALKBH5などの「消しゴム」によって除去され、YTHやIGF2BPファミリーのメンバーを含む「リーダー」タンパク質によって解釈されるm6Aは、RNAのスプライシング、安定性、輸送、翻訳を調整し、発生、分化、ストレス応答などの主要な生物学的プロセスに影響を与えます。
m6A調節成分の変化は、幅広い悪性腫瘍で報告されています4.多くのがんでは、異常なm6A活性が悪性表現型を引き起こします。例えば、METTL3の発現が上昇すると、ハリネズミ経路およびMYC RNAメチル化を調節することで前立腺がんの発症と進行を促進します5,6。当初、急性骨髄性白血病におけるがん性影響に関与することが判明しましたが、FTOは肝臓、肺がん、大腸がんにおける腫瘍進行を促進することが示されました(7,8,9,10)。しかし、FTOおよびALKBH5の文脈依存的な役割が特定され、m6A介在の調節が二重に作用していることを示し、発がん性と腫瘍抑制シグナル伝達の両方を促進することを示しています(11,12,13,14)。YTHDF1/2/3を含むM6Aリーダー、異質核リボ核タンパク質(hnRNPs)、インスリン様成長因子-2 mRNA結合タンパク質(IGF2BP1-3)も発がん性と関連していることが確認されています 15,16,17。
乳がんにおいて、m6A調節因子が頻繁に調節不全を発し、腫瘍サブタイプ、免疫関連の特徴、臨床アウトカムと関連している可能性が増える証拠が示唆されています(18,19)。複数の機構的研究により、METTL3は乳がんにおいて頻繁に上行される腫瘍促進因子として位置づけられています。METTL3を媒介するm6Aの導入は、増殖、上皮間葉転移(EMT)、転移、化学療法抵抗性を促進する転写本の翻訳を安定化または促進することができます。METTL3はBcl-2を標的化することで乳がんの進行を促進することも示されています。ALKBH5はNANOGやその他の幹関連分子を通じてがん幹細胞プログラムの調節に関与しているとされていますが、その影響は腫瘍の文脈によって異なります22。
近年、m6A調節因子のリストが拡大し続ける中、新たに特定された調節因子が乳がんでどのように調節不均衡になっているかについての最新情報が必要です。表1は、書き込み器、リーダー、消去器を含むm6Aレギュレーターの一覧を示しています。さらに、LRPPRCやYWHAGなどの新規m6A調節因子ががん進行に関与することが確認されています 23,24,25。そのため、既知のすべてのm6A調節因子の包括的な遺伝的・分子的特徴解析が、限られたバイオインフォマティクスの背景を持つ研究者が用いられるツールを用いて乳がんにおいて実施されました。
本Methods記事の目的は、公開されているがんゲノミクスリソースを用いて、乳がんにおけるm6A調節因子を解析するための段階的なプラットフォームベースのバイオインフォマティクスプロトコルを提示することです。The Cancer Genome Atlas(TCGA)(www.cancer.gov/tcga)、Genotype Tissue Expression(GTEx)プロジェクト26、cBioPortalやUCSC Xenaなどのウェブベースの分析プラットフォームのデータセットを用いて、このプロトコルは突然変異プロファイル、遺伝子発現変異、患者生存との関連を評価するための再現可能なワークフローを示しています。この可視化されアクセスしやすいアプローチは、がんバイオインフォマティクスに初心者の研究者がエピトランスクリプトミックデータ解析を採用することを目的としています。
注:m6Aメチル化調節因子をコードする遺伝子のリスト(書き手、リーダー、消しゴムに分類)は表 1に示されています。挙げられたすべての遺伝子は、その後の変異、発現パターン、全生存率の解析に含まれました。本研究で使用されるすべてのソフトウェアおよびツールは 材料表に記載されています。
1. m6A調節因子における遺伝的変異の同定
2. UCSC Xenaを用いたm6A調節因子の比較トランスクリプトミック解析。
3. Kaplan-Meier プロッターを用いたm6A調節因子の予後的重要性評価。
乳がんにおけるm6aメチル化調節因子の変異的状況
TCGAデータセットのゲノム解析に関する以前の研究では、DNAメチル化調節因子をコードする複数の遺伝子の再発変異が報告されています。本研究では、cBioPortalを用いて「Breast Invasive Carcinoma(TCGA、PanCancer Atlas)」データセットを解析し、m6A RNAメチル化の書き手、リーダー、消去装置をコードする遺伝子の変異プロファイルを調べました。この解析では、乳がん患者における多様な遺伝的変異が明らかになり、遺伝子ごとに変異頻度が大きく異なり、CNBPおよびRBM15Bでは0.4%、VIRMAでは12%に及びました(図1A)。遺伝子増幅が最も一般的な変異であり、追加の事象としては深い欠失、塩基置換、複数の同時変異が含まれていました。特に、m6A関連機能を調節する遺伝子の変異が476人(コホートの48%)で検出され、乳がんにおけるm6A修飾動態の重要性が強調されました(図1B)。変異タイプの頻度は異なったものの、乳がんのすべての分子サブタイプでこのような変異が観察されました(図1C)。検証のために、PIK3CA、TP53、CDH1、GATA3を参照対照遺伝子として含めました(図1A)。注目すべきは、m6A調節機構の変化が乳がんに限られなかったことです。TCGAパンキャンサーアトラスの32研究から10,953人の患者から10,967サンプルを分析した結果、幅広いがんタイプにおいて保存された変異パターンが明らかになりました。最近では、前立腺がん(PCa)ではm6A経路が頻繁に変化し、全体として腫瘍原原性の役割を果たすことが示されています32。これらの発見は、m6A RNA修飾の書き手、リーダー、消去器をコードする遺伝子に影響を与える変異が複数のがんに共通する特徴であることを示しています(図2)。
乳がんにおける異常遺伝子発現プロファイル
新たな証拠は、トランスクリプトムの乱れが腫瘍形成の主要な要因であることを強調しており、異常な遺伝子発現は乳がんにおけるバイオマーカーとしての可能性を示しています。これを調査するために、正常乳腺組織を表すTCGAおよびGenotype Tissue Expression(GTEx)プロジェクトのデータを使って、m6A修飾を制御する遺伝子の転写レベルを解析しました。 図3Aに示すように、乳がんサンプルでは様々なm6A関連遺伝子が有意な異常反応を示しました。腫瘍組織では正常対照群と比較してアップレギュレーションおよびダウンレギュレーションが観察されました。METTL3とWTAPは、いずれもライター複合体の構成要素であり、他の遺伝子とともにダウンレギュレーションされ、VIRMA、YTHDF1、YTHDF3など他の遺伝子もアップレギュレーションされていました。 図3B は、TCGAおよびGTExコホート間で個々の遺伝子の発現プロファイルの違いをさらに示しています。これらの発見は、m6Aメチル化ライター、リーダー、イレーザーをコードする遺伝子が乳がんにおいて広範な転写脱調を経験していることを示し、病気の進行における潜在的な関連性を強調しています。
m6A機構遺伝子と患者の予後における役割
遺伝的変異や遺伝子発現の変化ががん患者の間で非常に一般的であることが観察された後、乳がんにおけるこれらの発現変化の予後的関連性が調査されました。マイクロアレイデータセットを統合したKaplan-Meier(KM)プロッターツール30を用いて、1880人の乳がん患者のコホートでm6A調節遺伝子の発現に基づいて総生存期間(OS)を評価しました。この分析により、METTL14、CBLL1、YTHDC1、HNRNPC、HNRNPA2B1、RBMXの発現上昇が、生存期間の改善と有意に関連していることが明らかになりました。対照的に、YWHAGの過剰発現は生存率の低下と相関していました(図4)。対照として、予後の良好および不良を示す既知のマーカーであるCCND2とTOP2Aを含みました。m6A調節因子をコードする他の遺伝子は、患者の生存率と統計的に有意な相関を示しませんでした(補足図)。これらの発見は、乳がん予後に役立つ可能性のあるm6Aメチル化調節遺伝子の一部を浮き彫りにしています。

図1: 乳がんにおけるm6Aの書き手、リーダー、消しゴムの遺伝子の遺伝子変異。 (A)996人の乳がん患者にまたがる変異の分布を示し、各グレーラインは個別の症例を表しています。色分けされたバーは、ミスセンス変異、深い欠失、増幅、フレーム内変異、切断変異など、さまざまな変異タイプを示しています。PIK3CA、TP53、CDH1、GATA3といったよく特徴付けられた遺伝子は、確立された変異頻度からポジティブコントロールとして含まれます。(B) 患者コホート全体におけるm6A調節遺伝子の変異頻度。(C) 乳がんサブタイプによるm6A調節遺伝子の遺伝的変化パターン。 この図の拡大版はこちらをクリックしてご覧ください。

図2: 多様ながんタイプにおけるm6Aの書き手、リーダー、消しゴムをコードする遺伝子の変異頻度。 この分析は、TCGAの汎がんアトラスのデータに基づいており、32のがん研究で10,953人の患者から10,967サンプルが集まりました。 この図の拡大版はこちらをクリックしてご覧ください。

図3:m6Aの書き出し、リーダー、消しゴムをコードする遺伝子の発現異常。 (A) すべての遺伝子の過剰発現(赤いバー)と過発現(青いバー)が表示される。GTExおよびTCGAのデータを用いて、正常乳がんと乳がんのサンプルを比較しました。(B) この図は、正常患者と乳がん患者の個別遺伝子発現の比較を示しています。ゼナはウェルチのt検定を用いて各遺伝子のp値を決定します。 この図の拡大版はこちらをクリックしてご覧ください。

図4:m6Aの書き手、読者、消しゴムの発言プロファイルと乳がん予後との関連。カプラン・マイヤー生存曲線は患者の総生存率を示し、X軸は時間(月)、Y軸は全体の生存確率を示します。赤い線は高発現群、黒い線は低発現群を表します。患者は中央値遺伝子発現レベルに基づいて階層化されました。p値は対数ランク検定を用いて決定されました。この図の拡大版はこちらをクリックしてご覧ください。
補足図:m6A調節因子のメンバーは、Kaplan-Meier生存曲線で示されるように、患者の全生存期間と有意な相関を示していません。赤い線は高発現群、黒い線は低発現群を表します。このファイルをダウンロードするには、こちらをクリックしてください。
| 種類 | 遺伝子シンボル |
| 脚本家 | METTL3 |
| METTL14 | |
| ZC3H13 | |
| WTAP | |
| RBM15 | |
| RBM15B | |
| METTL16 | |
| CBLL1 | |
| KIAA1429/VIRMA | |
| 読者 | YTHDF1 |
| YTHDF2 | |
| YTHDF3 | |
| YTHDC1 | |
| YTHDC2 | |
| HNRNPA2B1 | |
| HNRNPC | |
| HNRNPG/RBMX | |
| IGF2BP1 | |
| IGF2BP2 | |
| IGF2BP3 | |
| CNBP | |
| ELAVL1 | |
| SND1 | |
| PRRC2A | |
| PRRC2B | |
| PRRC2C | |
| EIF3A | |
| FMR1 | |
| FXR1 | |
| FXR2 | |
| LRPPRC | |
| MSI2 | |
| イレーサー | ALKBH5 |
| FTO |
表1: m6Aの書き手、読者、消しゴムをコードする遺伝子。 表1は、真核RNAにおけるm6A修飾の設置、認識、除去に関与する主要な遺伝子ファミリーの概要を示しています。
本手法の記事は、がん研究におけるあらゆる遺伝子シグネチャーの体系的なマルチオミクスプロファイリングおよび臨床翻訳のための包括的でアクセスしやすく統合されたワークフローを提供しており、乳がんにおけるm6A RNAメチル化調節因子の解析を通じて示されています。これらの主要な公共バイオインフォマティクスプラットフォームを組み合わせることで、研究者は高度な計算専門知識を必要とせずにゲノム発見から臨床的に関連性のある仮説へと効率的に進むことができます。
この手法の主な強みは、モジュール型で仮説生成パイプラインです。このプロトコルはユーザーを論理的な順序に沿って導きます。まず遺伝子改変遺伝子を特定し(cBioPortalを用いて)、次にバッチ補正環境下での発現異常を評価(UCSC Xenaを使用)、最後にその異常調節が患者の生存に与える臨床的影響(Kaplan-Meier Plotterを用いて)評価します。DNAからRNA、臨床結果に至るまでの段階的な解析は、候補遺伝子を優先的に研究する結果となります。例えば、このワークフローをm6A調節因子に適用することで、YWHAG(頻繁な変異、生存不良の予後)などの遺伝子を機能検証の優先度の高いターゲットとして効率的に特定できます。
このプロトコルの汎がん分析設計は、その有用性をさらに高めており、研究者は分子署名が特定のがんに特異的なものか、腫瘍形成の共通の特徴であるかを迅速に判断できるようにしています。これは本研究でm6A機構の広範な変化で観察されました。汎がん分析により、m6Aの書き手、読者、消しゴムに影響を及ぼす変異は乳がんに限らず、複数の悪性腫瘍に共通していることが明らかになりました。これは、異常なm6A調節が多様な腫瘍型におけるがん発生の特徴であり、RNAスプライシング、安定性、翻訳、非コードRNA活性など複数のがんおよび生理学的プロセスに影響を与えるという蓄積された証拠と一致しています。33。
この方法論的アプローチは非常に適応性が高いです。m6A調節因子で実証されていますが、同じワークフローは、これらのデータベースにあるあらゆるがんタイプにおけるRNA-seq実験による免疫チェックポイント遺伝子、代謝酵素、または新規遺伝子シグネチャーの特性解析に即座に適用可能です。この段階的な形式は、ウェットラボの科学者が高度な インシリコ 解析を行う障壁を下げ、ゲノムデータから生物学的洞察への移行を加速させます。
結論として、このプロトコルはがん関連遺伝子の文脈化のための堅牢な枠組みを提供します。突然変異の風景を示すことに加え、m6Aの調節因子における双方向の発現変化も明らかになりました。この発見はエピトランスクリプトームの複雑さを強調し、異なるがんにおけるMETTL3およびYTHDFファミリータンパク質の二重役割に見られる文脈依存機能の確立されたパラダイムを強化しています(34,35)。m6A軸はトリプルネガティブ乳がんにおける増殖、転移、免疫回避の調節にも役割を果たすことが示されています36,37。興味深いことに、生存解析では予後有意なm6A調節因子の一部が特定されました。METTL14、CBLL1、YTHDC1、HNRNPC、HNRNPA2B1、RBMXの発現上昇は良好なアウトカムと関連し、YWHAG発現は全生存率の低下と相関しました。これらの発見は、m6A調節因子が予後バイオマーカーとして臨床的に有用であることを支持しています。CBLL1は以前の研究でも良好予後のある要因の一つとして特定されました。しかし、m6A規制機関の最新メンバーを取り入れた現在の分析では、RBMXやYWHAGなど、それぞれ生存期間が良好または劣化した追加メンバーが特定されました。異なる調節因子が悪予後または好転予後を予測できることは、m6A修飾ががん生物学における二重かつ文脈特異的な機能を強調しています。YTHDF1およびYTHDF3は腫瘍で有意にアップレギュレーションされますが、全生存期間との相関がないのは、読者間での機能的冗長性、がんサブタイプ間の文脈依存的な役割、あるいは個々の発現レベルではなく比率や純m6A調節ネットワークを考慮する必要があることを反映している可能性があります。さらに、VIRMAは最も高い変異頻度(12%、主に増幅)を示しましたが、乳がんにおける全生存率と有意な相関はありませんでした。一つの可能な説明は、hIgh VIRMAの発現はm6A沈着の可能性の上昇を示しており、必要な下流リーダーや標的mRNAが存在して攻撃的な腫瘍行動に翻訳できるかどうかは示さないということです。注目すべきは、コホートではYTHDF1およびYTHDF3が過剰発現した一方で、YTHDC1およびYTHDC2は有意にダウンレギュレーションされていたことです。この不一致の発現パターンは、がん性出力に必要な特定の著者と読者の機能的組み合わせが乳がんでは機能しない可能性を示唆しています。したがって、高い発現率にもかかわらず、VIRMAはこの文脈で支配的なドライバーとして機能しない可能性があります(補足図)。
著者らは、このシリコパイプラインにおける主な制約を認めています。分析は本質的に相関的であり、強い関連性は特定しますが、メカニズム的な因果関係を確立するものではありません。このような因果関係は、機能ゲノミクスやm6A経路の成分を標的とする小分子阻害剤の使用によって確立できます。特に、最初のMETTL3標的ペプチド阻害剤であるRSM3が最近開発され、in vivoの前立腺がんモデルで抗がんの可能性が示されました。この方法論的ワークフローは、候補標的を特定し、これらの治療介入から最も恩恵を受けそうな患者集団を階層化するための貴重なツールとなります。
この原稿の一部は、AIベースの言語ツールの助けを借りて改訂され、明瞭さと可読性が向上しました。すべての実質的な内容、解釈、分析、結論は著者自身のものです。利益相反は存在しないと宣言します。
幸いにも、アルファイサル大学からの助成金(IRG 25450)がRMに認められました。
| Name | Company | Catalog Number | Comments |
|---|---|---|---|
| cBioPortal | メモリアル・スローン・ケタリングがんセンター | https://www.cbioportal.org | |
| 遺伝子型-組織発現(GTEx) | GTExコンソーシアム | https://gtexportal.org | |
| カプラン・マイヤー・プロッター | ジョーフィー研究所/A5ジェネティクス社 | https://kmplot.com | |
| がんゲノムアトラス(TCGA) | 国立がん研究所(NCI) | https://www.cancer.gov/tcga | |
| UCSC Xena ブラウザ | カリフォルニア大学サンタクルーズ校 | https://xenabrowser.net |
Request permission to reuse the text or figures of this JoVE article
Request Permission