Summary
ここでは、 in vivo RNA:RNA相互作用の研究に使用されるキメラRNAシーケンシングデータを分析するためのバイオインフォマティクスパイプラインのインストールと使用を実証するプロトコルを紹介します。
Abstract
近年、マイクロRNA(miRNA)などの低分子ノンコーディングRNA(sncRNA)と標的RNAとのin vivo 遺伝子制御相互作用の理解が、キメラRNAの形成とその後のシーケンシングライブラリーを通じて、架橋とそれに続くライゲーションを使用してsncRNA:標的RNAの相互作用を捕捉する生化学的アプローチによって進められています。キメラRNAシーケンシングのデータセットは、miRNA予測ソフトウェアよりもゲノムワイドで曖昧さの少ないインプットを提供しますが、このデータを意味のある実用的な情報に抽出するには、追加の分析が必要であり、計算のバックグラウンドを持たない研究者を思いとどまらせる可能性があります。このレポートでは、エントリーレベルの計算生物学者が最新のオープンソースソフトウェアツールであるSmall Chimeric RNA Analysis Pipeline(SCRAP)をインストールして適用するためのチュートリアルを提供します。プラットフォームの要件、更新、およびパイプラインの手順と主要なユーザー入力変数の操作について説明します。生物学者がキメラRNAシーケンシングアプローチから洞察を得るための障壁を減らすことは、複数の生物学的状況における制御性sncRNAと標的RNAの相互作用の発見に基づく研究の出発点となる可能性があります。
Introduction
低分子ノンコーディングRNAは、分化や発生、シグナルプロセシング、疾患などの多様なプロセスにおいて、一連の遺伝子からの発現を調整する転写後の役割について高度に研究されています1,2,3。マイクロRNA(miRNA)を含む遺伝子制御低分子ノンコーディングRNA(sncRNA)の標的転写産物を正確に決定する能力は、基礎レベルと翻訳レベルの両方でRNA生物学の研究にとって重要です。miRNAシード配列とその潜在的な標的との間に予想される相補性を利用するバイオインフォマティクスアルゴリズムは、miRNA:標的RNA相互作用の予測に頻繁に使用されています。これらのバイオインフォマティクスアルゴリズムは成功していますが、他の場所でレビューされているように、偽陽性と偽陰性の両方の結果を隠す可能性もあります4,5,6。最近、いくつかの生化学的アプローチが設計され、実装されており、in vivo架橋とそれに続くライゲーションステップの組み込みにより、in vivoでのsncRNA:標的RNA相互作用の明確かつ半定量的な決定が可能になり、sncRNAを標的に物理的に結合させて単一のキメラRNA 4,5,7,8,9,10を形成します.その後、キメラRNAからシーケンシングライブラリを調製することで、シーケンシングデータの計算処理により、sncRNA:標的RNAの相互作用を評価することができます。このビデオでは、キメラRNAシーケンシングライブラリ6からsncRNA:target RNA相互作用の頑健で再現性のある解析を可能にするように設計された、small chimeric RNA analysis pipeline(SCRAP)と呼ばれる計算パイプラインをインストールして使用するためのチュートリアルを提供します。
このチュートリアルの目的は、sncRNA:標的RNA相互作用のキメラ分子読み出しを提供する生化学的アプローチによって生成されたデータの分析に対する障壁を下げることにより、研究者が純粋に予測的なバイオインフォマティクスアルゴリズムへの過度の依存を回避するのを支援することです。このチュートリアルでは、ハイブリッドの架橋、ライゲーション、シーケンシング(CLASH)や内因性アルゴノート結合RNAの共有結合ライゲーション(CLEAR-CLIP)7,9など、いくつかの既存の生化学プロトコルによって生成できるキメラRNAシーケンシングデータを解析するために開発されたパイプラインSCRAPを使用して、エントリーレベルの計算科学者をガイドするための実践的な手順とヒントを提供します。
SCRAPの使用は、他の計算パイプラインと比較して、キメラRNAシーケンシングデータの解析にいくつかの利点を提供します6。顕著な利点の 1 つは、パイプライン内のステップでカスタムおよび/またはサポートされていないスクリプトに依存することが多い代替パイプラインと比較して、パイプライン内の広範な注釈と、十分にサポートされ、定期的に更新されるバイオインフォマティクス スクリプトへのコールアウトの組み込みです。この機能により、SCRAPは安定性が高まり、研究者がパイプラインに慣れ親しみ、その使用をワークフローに組み込むことがより価値のあるものになります。また、SCRAPは、sncRNA:target RNA相互作用のピークの呼び出しにおいて、他のパイプラインよりも優れた性能を発揮し、クロスプラットフォーム機能を持つことが実証されています(以前の出版物6で詳述)。
このチュートリアルを修了すると、ユーザーは (i) SCRAP のプラットフォーム要件を把握して SCRAP パイプラインをインストールし、(ii) リファレンスゲノムをインストールし、SCRAP のコマンドラインパラメータを設定し、(iii) ピーク呼び出し基準を理解し、ピーク呼び出しとピークアノテーションを実行できるようになります。
このビデオでは、RNA生物学を研究する研究者が、シーケンシャルライブラリ調製に対する生化学的アプローチの1つを通じて得られたキメラRNAシーケンシングデータにおいて、メッセンジャーRNAなどの標的RNAとのsncRNA相互作用を解析するために、計算パイプラインSCRAPをインストールし、最適に使用する方法を実践的に詳細に説明します。
SCRAPはコマンドラインユーティリティです。一般的に、以下のガイドに従って、ユーザーは(i)SCRAPをダウンロードしてインストールし(https://github.com/Meffert-Lab/SCRAP)、(ii)リファレンスゲノムをインストールしてSCRAPを実行し、(iii)ピークコールとアノテーションを実行する必要があります。
この手順の計算手順の詳細については、https://github.com/Meffert-Lab/SCRAP を参照してください。この記事では、エントリーレベルの計算スキルを持つ研究者がキメラRNAシーケンシングライブラリデータセットにSCRAPをインストール、最適化、および使用できるようにするためのセットアップと背景情報を提供します。
Subscription Required. Please recommend JoVE to your librarian.
Protocol
注:プロトコルは、SCRAPを使用してキメラRNAシーケンシングライブラリを解析するために必要なソフトウェアのダウンロードとインストールから始まります。
1. インストール
- SCRAP をインストールする前に、分析に使用するマシンに依存関係 Git と Miniconda をインストールします。Git は既にインストールされている可能性があります。たとえば、Mac OSXプラットフォームでは、どのgitを使用してこれを検証し、「 git 」ユーティリティが存在し、このディレクトリにインストールされていることを確認します。Minicondaが どのcondaを使用してインストールされているかを確認します。何も返されない場合は、Miniconda をインストールします。Miniconda のインストールには 400 MB のディスク容量が必要です。
- Miniconda をインストールする方法はいくつかあり、プラットフォームによって異なります。Windows、MacOS、Ubuntu へのインストールに関する詳細な手順については、Meffert Lab GitHub リポジトリ [https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md] の PLATFORM-SETUP マークダウン ファイルを参照してください。Linuxユーザーの場合、Linuxには独自のデフォルトパッケージマネージャー(apt)があります。この調査に固有のケースでは、コマンド brew install Miniconda を使用して、既存のパッケージ マネージャー brew を使用して Miniconda をインストールします。
注:「brew」と呼ばれる「Homebrew」は、AppleのオペレーティングシステムであるmacOSへのソフトウェアのインストールを簡素化するオープンソースのソフトウェアパッケージ管理システムです。 - conda を初めてインストールする場合は、使用中の特定のシェルに対して conda init を実行します。この例では、使用されているシェルは zsh です。次に、シェルを閉じてから再度開きます。conda が正常にインストールされた場合は、ターミナル セッション内でアクティブ化された 基本 環境が表示されます。
- Miniconda をインストールする方法はいくつかあり、プラットフォームによって異なります。Windows、MacOS、Ubuntu へのインストールに関する詳細な手順については、Meffert Lab GitHub リポジトリ [https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md] の PLATFORM-SETUP マークダウン ファイルを参照してください。Linuxユーザーの場合、Linuxには独自のデフォルトパッケージマネージャー(apt)があります。この調査に固有のケースでは、コマンド brew install Miniconda を使用して、既存のパッケージ マネージャー brew を使用して Miniconda をインストールします。
- SCRAP ソースをダウンロードし、その依存関係をインストールします。
- SCRAPソースを取得するための推奨される方法は、Gitを使用することです。これにアクセスするには、git clone https://github.com/Meffert-Lab/SCRAP を実行してソース コードの最新のコピーを取得します。
- condaの改良されたパッケージ・ソルバーであるmambaをインストールし、次のコマンドを使用して、SCRAP_environment.ymlから独自のconda環境にSCRAPのすべての依存関係をインストールします。
conda install -n base conda-forge::mamba (コンダ インストール -n ベース conda-forge::マンバ)
マンバenvは、-fスクラップ/ SCRAP_environment.yml -nスクラップを作成します
- 次に、SCRAP のリファレンス インストールを実行します。リファレンスインストールで使用される引数は、sncRNA-mRNA相互作用が分析されている生物に固有です。
bash SCRAP / bin / Reference_Installation.sh -r full / path / to / SCRAP / -mは-g hg38 -s humanを持っています- リファレンスインストール用のSCRAPソースフォルダのディレクトリを指定します。インストール手順は、 fasta および annotation フォルダー内のファイルを使用して実行されます。省略せずにフルパスを一覧表示します。スラッシュで終わります。
- miRbase の正しい種の略語については、 README.md の表を参照してください。最新の参照ゲノムは、https://genome.ucsc.edu/ または https://www.ncbi.nlm.nih.gov/data-hub/genome/ で見つけることができます。この例では、hg38 をマウスGRCm38ゲノムに使用します。
- 現在、アノテーションの対象種は、ヒト、マウス、ワームです。SCRAPソースフォルダのannotationディレクトリにある対応するspecies.annotation.bedファイルを表示します。 分析に別の種を使用する場合は、同じ命名スキーム species.annotation.bed に従う annotation.bed ファイルを指定します。
2. SCRAPの実行
- 依存関係とSCRAPがインストールされたので、スクリプトを実行します SCRAP.sh
bashのスクラップ/ bin / SCRAP.sh -d フル/パス/ツー/CLASH_Human/ -a フル/パス/ツー/CLASH_Human/CLASH_Human_Adapters.txt -p no -f はい -r full/path/to/SCRAP/ -m は -g hg38 です。- サンプルディレクトリへのパス全体を省略せずに一覧表示します。 図 1 に示すように、サンプル名と完全に一致するフォルダー名でサンプル・ディレクトリーをフォーマットします。
- リストされているパスは、すべてのサンプルフォルダを含むディレクトリへのパスであり、個々のサンプルフォルダやサンプルファイルへのパスではありません(手順2.1のコマンドラインを参照)。
- 次に、アダプター ファイルへのパス全体を一覧表示します。アダプタファイル内のサンプル名が、前述のフォルダ名およびファイル名と一致していることを確認します(手順2.1のコマンドラインを参照)。
- サンプルがペアエンドであるかどうか、およびpre-miRNAおよび/またはtRNAのフィルタリングを実行するかどうかを示します。必要に応じて、rRNAクリーニング用のフィルターを追加します(ステップ2.1のコマンドラインを参照)。
注:ユーザーは、サンプルの種類と実験目標に応じて、これらのフィルターを使用することを決定する場合と使用しない場合があります。実験デザインに応じて、pre-miRNA、tRNA、およびrRNAは、実際のsncRNA:target RNAキメラの利用可能なシーケンシング深度を消費する可能性があり、ユーザーはフィルターを使用してそれらを除外できます。ただし、特定の状況では、このようなフィルタリングを避けたい場合があります(たとえば、ミトコンドリアrRNAを含むミトコンドリアゲノムにsncRNAターゲットをマッピングするなど)。 - 次に、参照ディレクトリへのパス全体、miRbaseの省略形、および参照ゲノムの省略形をリストします(手順2.1のコマンドラインを参照)。
注: スクリプトは、データセットのサイズと使用しているコンピューターの CPU によっては、完了するまでに数時間かかる場合があります。
3. ピークコールとアノテーション
- SCRAP の実行が終了したら、出力に他のファイルと共に SAMPLE.aligned.unique.bam ファイルが含まれていることを確認します。これは、ユーザーが提供した参照ゲノムへのターゲットRNAのアライメントを含むバイナリファイルです。
- 次に、Peak_Calling.shを実行してピークコールを実行します。
bash SCRAP/bin/Peak_Calling.sh -d CLASH_Human/ -a CLASH_Human/CLASH_Human_Adapters.txt -c 3 -l 2 -f no -r SCRAP/ -m は -g hg38 を持っています。
注:ピークコールはSCRAPの機能であり、研究者がキメラRNAライブラリー内の最も頑健で再現性の高い低分子ノンコーディングRNA:標的RNA相互作用を容易に評価できるように設計されています。たとえば、この機能は、研究者がさらなる調査のために選択したい相互作用を特定するのに役立ちます。以下のステップ 3.2.2 では、ピークが呼び出される厳密さを定義するために使用する基準をユーザーが設定する方法について説明します (これには、ピークが呼び出されるために発生した必要がある一意の相互作用またはシーケンシングリードの数と、この特定の相互作用が発生している必要があるライブラリの数が含まれます)。- ここでも、サンプルフォルダを含むディレクトリへのフルパスとアダプタファイルをリストします(ステップ3.2のコマンドラインを参照)。
- 次に、ピークを呼び出すために必要なシーケンシングリードの最小数を設定します(ステップ3.2のコマンドラインを参照)。
- 呼び出すためにピークを含む必要がある個別のシーケンシングライブラリの最小数を設定します(ステップ3.2のコマンドラインを参照)。
注: 3.2.2 と 3.2.3 の両方の値の選択は、シーケンスされたサンプルの性質と、サンプルの数またはサンプルの種類によって異なります。ここで、ピークを呼び出すには、サンプル中の少なくとも3つのキメラシーケンシングリードが必要であり、ピークは少なくとも2つのサンプルによって支持されていなければならない。例えば、特定の条件に対して多くのシーケンシングライブラリーの複製があるデータセットを評価する研究者は、より多くのサンプルシーケンシングライブラリーにリードが存在することを要求することを決定するかもしれません。 - 同じファミリーの sncRNA が同じピークに寄与する必要があるかどうかを示します。例えば、同じファミリーのmiRNAはシード配列を共有するため、これらのmiRNAは、共有および重複する遺伝子標的のセットに結合することができます。ユーザーは、集合的なピークを評価することで、これらのターゲットに対するファミリの完全な影響を特定できます(手順3.2のコマンドラインを参照)。
- 次に、参照ディレクトリへのフルパス、miRBase の省略形、および参照ゲノムの省略形を指定します (手順 3.2 のコマンド ラインを参照)。
- ピーク呼び出しが完了したら、ピークアノテーションを実行します。
bashスクラップ/ bin / Peak_Annotation.sh -p CLASH_Human / peaks.bed -r SCRAP / -s人間- ピーク呼び出しから得られたpeaks.bed(または peaks.family.bed )ファイルへのフルパス、参照ディレクトリへのフルパス、およびアノテーションに必要な種をリストします。
4. データの可視化
注:これで、SCRAPを使用した分析のすべての手順が完了しました。データを視覚化するには、いくつかの方法をお勧めします。
- 視覚化するすべての .bam (バイナリ SAM ファイル) ファイルをマージします (samtools merge)。
- マージされた結果の .bam ファイルをソートします (samtools sort)。ファイルの内容は、samtools がインデックスを作成できるように、行ごとにソートされます。
- ソートされた .bam ファイルにインデックスを付けます (samtools index)。BAI(バイナリsamtoolsフォーマットインデックス)ファイルが生成され、統合ゲノミクスビューア(IGV)での可視化が可能になります。
- 最後に、並べ替えられた .bam とインデックス付きの .bai ファイルを IGV で開きます。
注:SncRNA:ターゲットRNA相互作用は、いくつかの調査固有の方法でフォローアップのために優先順位を付けることができます。一般的な初期アプローチの 1 つは、最もキメラなシーケンシングリードによってどのピークが支持される相互作用を評価することです。関心のある相互作用は、検出された相互作用からのsncRNAおよび標的RNAの両方についての配列を入力することにより、RNAstructureパッケージからDuplexFoldウェブサーバを用いて視覚化することもできる11。各ピークについて、染色体(第1列)とゲノム座標(開始:第1列、終了:第2列)は、ピークアノテーションで生成されたpeaks.bed.species.annotation.txtファイル内にあります。特にmiRNAでは、再現性のある機能的相互作用は広範なシードマッチド結合を欠いている可能性がありますが(例えば、相互作用は3'代償結合を使用する可能性があります)、ターゲットRNAの同族結合モチーフにおけるシードマッチド部位の存在は、機能的に重要な検出された相互作用の検証的特徴として評価することができます4,12。.補助的なデータ処理には、異なる生物学的条件におけるピーク間の差異リードカバレッジの比較や、経路解析ツールを用いた経路への制御遺伝子のクラスタリングの評価が含まれる可能性があります。
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
CLEAR-CLIP9 を用いて作製した既公開のシークエンスデータセットについて、SCRAPの改変版(rRNAフィルタリングの改良を施したSCRAPリリース2.0)で検出したsncRNA:target RNAの結果を 図2 および 表1に示します。ユーザーは、SCRAPでのピークコールによる信頼性の高い相互作用の分離後に発生するイントロン領域との相対的な分画miRNA相互作用の減少を実感できます。SCRAPを使用した分析からの追加データは、このパイプライン6の最初の公開でも入手できます。実験的アプローチによっては、結果のアーチファクトを減らすために、調製されたキメラRNAライブラリーからのシーケンシングデータのフィルタリングが必要になる場合があります。シーケンシングライブラリの生化学的調製が最適でない、および/またはシーケンシングデータのフィルタリングが最適でないと、Argonauteによって結合されたsncRNAおよび標的RNAのライゲーションから生じなかったリードが不正確に含まれる可能性があります。これらのアーチファクトリードには、プライマー二量体またはアダプター二量体、rRNA、およびpre-miRNAが含まれます。 表 2 は、結果で検出される可能性のあるアーティファクトと、考えられる解決策を示しています。
図1:データディレクトリのフォーマット。 各シーケンシングライブラリの生リードを含むファイルは、.fastq.gz形式で提供する必要があります。(A) ライブラリがペアエンドでない場合は、単一の.fastq.gzファイルが解析に使用されます。このファイルの名前は「SAMPLE.fastq.gz」にする必要があります(SAMPLEは、ユーザーがアダプタファイルで指定した正確なサンプル名です)。ファイルは、サンプル名と完全に一致するフォルダー内に含まれている必要があります。(B)ペアエンドシーケンシングライブラリの場合、2つの.fastq.gzファイルが使用されます。これらのファイルの名前は「SAMPLE-R1.fastq.gz」と「SAMPLE-R2.fastq.gz」で、サンプル名と完全に一致するフォルダー内に配置する必要があります。SAMPLEという名前のディレクトリはすべて、ユーザーが「サンプルディレクトリ」としてSCRAPに提供する同じ親ディレクトリ内に配置する必要があります。 この図の拡大版をご覧になるには、ここをクリックしてください。
図2:miRNA:ターゲットRNA相互作用のターゲットタイプおよびピークコールメソッド別の割合。キメラ sncRNA:ターゲット RNA シーケンシング CLEAR-CLIP (SRR2413277 - SRR2413295)9 を使用して調製したライブラリから公開されているデータを、rRNA フィルタリングを実装した SCRAP (SCRAP release 2.0) の修正バージョンを使用して解析しました。pre-miRNA、tRNA、および rRNA をフィルタリングし、「高信頼度」(最低 3 リードおよび 2 ライブラリ)および「すべての相互作用」(最低 1 リードおよび1ライブラリ)に個別のピークコール設定を使用しました。相互作用は、miRNAファミリー別または非グループ化しました。カテゴリー(CDS、5' UTR、遺伝子間、イントロン、3'UTR)のキメラ RNA リードの相対的な割合を計算し、グラフ化しました。この図の拡大版をご覧になるには、ここをクリックしてください。
すべてのインタラクション | 信頼性の高いインタラクション | |||
個々の miRNA | miRNA ファミリー | 個々の miRNA | miRNA ファミリー | |
CDSの | 8675 | 8679 | 925 | 1046 |
5フィートUTR | 338 | 338 | 38 | 43 |
インタージェニック | 2230 | 2230 | 320 | 339 |
イントロン | 9522 | 9519 | 382 | 406 |
3' UTRの | 6814 | 6813 | 548 | 644 |
インタラクション総数: | 31033 | 31034 | 4219 | 4597 |
表1:miRNA:target RNA相互作用のキメラリードカウント(ターゲットタイプ別およびピークコールメソッド別)。 CLEAR-CLIP (SRR2413277 - SRR2413295)9 を用いて調製したライブラリーから公開されているキメラ sncRNA:target RNA シーケンシングデータを、rRNA フィルタリングを実装した SCRAP (SCRAP release 2.0) の修正版を用いて解析しました。pre-miRNA、tRNA、および rRNA をフィルタリングし、miRNA ファミリー別または非グループ化の高信頼度(最低 3 リードおよび2ライブラリ)およびすべて(最小 1 リードおよび1ライブラリ)の相互作用に個別のピークコール設定を使用しました。各条件について、検出されたmiRNA:target RNA相互作用のうち、ターゲットRNA相互作用がコード配列(CDS)、5'非翻訳領域(5'UTR)、遺伝子間領域、イントロン、または3'非翻訳領域(3'UTR)のカテゴリーにマッピングされた合計数がリストされています。
潜在的な汚染物質 | 検出対象 | 原因 | 考えられる解決策 | |||
プライマーダイマー | 配列が増幅プライマーの5'末端と一致するmiRNAと、配列がプライマーの残りの部分と一致する標的RNAとの間で検出される相互作用。 | 増幅後のPCR産物の不適切なサイズ分離(すなわち、ゲル抽出)。 | ほとんどのプライマーダイマーは、長さが短いため、アダプターの取り外し後にSCRAPによって無視されます。それらが持続する場合は、フィルターにプライマー配列を追加することを検討してください。 | |||
rRNA(rRNA) | 任意のmiRNAと既知のrRNAまたはlncRNA(Gm26917およびGm42418)との相互作用 | Argonaute複合体の非効率的な単離(すなわち、免疫沈降およびゲル分離)。 | rRNAのコンタミネーションが豊富な場合、rRNAフィルタリングが必要になることがよくあります。 | |||
tRNA と pre-miRNA | 同じ tRNA の分解産物である tRNA フラグメント、または同じ pre-miRNA から産生された 5p および miRNA 間の相互作用。 | 真のsncRNA:標的RNAキメラまたは低組織アルゴノート発現の低存在量。 | tRNAフィルタリングとpre-miRNAフィルタリング。 |
表2:潜在的な汚染物質シーケンシングリードと溶液。
Subscription Required. Please recommend JoVE to your librarian.
Discussion
sncRNA:標的RNA相互作用の分析のためのSCRAPパイプラインの使用に関するこのプロトコルは、計算分析に入ろうとしている研究者を支援するように設計されています。チュートリアルの完了は、このパイプラインのインストールと使用、およびキメラRNAシーケンシングライブラリから得られたデータを分析するためのそのアプリケーションに必要な手順を通じて、エントリーレベル以上の計算経験を持つ研究者を導くことが期待されています。このプロトコルの完了に不可欠な手順には、SCRAPの正しいリファレンスインストールと実行が含まれますが、これは時間がかかり、特にAnacondaを使用した依存関係のインストールやコマンドライン引数の入力中に注意を払わなかった場合、エラーの原因となる可能性があります。
ここでは、キメラsncRNA:標的RNAシーケンシングライブラリの解析にSCRAPパイプラインを実用化するためのヒントとステップに特に焦点を当てています。SCRAPは、sncRNA:標的RNA相互作用の検出において、他のキメラRNA解析プラットフォームよりも優れていることがわかっています6,13。これは、キメラRNAの形成に関与する生化学的ステップの結果として観察される特徴(例:3'ショルダリング)を検出するために特別に開発されたSCRAPのピークコール機能によるものと考えられます。クロマチン免疫沈降シーケンシング(CHIP-seq)アプリケーションの下流など、異なる生化学的アプローチのための他のピークコール法は、平均の周囲に対称的に分布し、通常、キメラsncRNA:ターゲットRNAライブラリーのピーク特徴の検出にはあまり適さないデータのピークを検出するために開発されています。ただし、ユーザーは、特にデータがこの説明に当てはまらない場合に、ニーズにより適した他の計算パイプラインの使用をテストしたい場合があります。
SCRAP のハードウェア要件は最小限ですが、SCRAP ランタイムはデータセットのサイズに比例して拡張できません。初心者レベルを超えている研究者、または多数のデータセットまたはシーケンシングカバレッジの高いデータセットを持っている研究者は、分析ステップを高速化できる方法でSCRAPを使用したいと思うかもしれません。大規模なデータセット (通常は 10 億回の読み取り>) では、強化されたファイル ストレージ機能とデータの読み取り/書き込み速度が必要になるため、大規模なデータセットの分析には、ハイパフォーマンス コンピューティング (HPC) クラスターで SCRAP を実行することが望ましい場合があります。並列化とパフォーマンスの向上を実現するSCRAP最適化は、GitHub(https://github.com/Meffert-Lab/)で公開される予定です。このSCRAPの更新バージョン(リリース2.0)では、rRNAやその他の汚染物質のフィルターも改善されています。
他のインターフェイスと同様に、ユーザーはコマンドラインインターフェイスを使用するときに必然的に問題に遭遇する可能性があります。最も一般的なものには、スペルミス、誤ったパス、パッケージのインストール/バージョン管理などがあります。調査員は、コマンドライン引数を書くときに注意を払い、タイプミスを避け、ファイルまたはフォルダへのパスを正確に再現することをお勧めします(「タブ」オートコンプリートの使用はこれに役立ちます)。SCRAP の依存関係は Anaconda を介して管理されるため、調査担当者はパッケージのインストールやバージョンの更新で問題に遭遇する可能性が低くなります。
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
著者は何も開示していません。
Acknowledgments
BH Powell氏やWT Mills IV氏など、有益な議論をしてくれたMeffert研究所のメンバーに、パイプラインの設置と実施に関する重要なフィードバックをいただいたことに感謝します。この研究は、Braude Foundation賞、Maryland Stem Cell Research Fund Launch Program、Blaustein Endowment for Pain Research and Education賞、NINDS RO1NS103974およびNIMH RO1MH129292 to M.K.M.の支援を受けました。
Materials
Name | Company | Catalog Number | Comments |
Genomes | UCSC Genome browser | N/A | https://genome.ucsc.edu/ or https://www.ncbi.nlm.nih.gov/data-hub/genome/ |
Linux | Linux | Ubuntu 20.04 or 22.04 LTS recommended | |
Mac | Apple | Mac OSX (>11) | |
Platform setup | GitHub | N/A | https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md] |
SCRAP pipeline | GitHub | N/A | https://github.com/Meffert-Lab/SCRAP |
Unix shell | Unix operating system | bash >=5.0 | |
Unix shell | Unix operating system | zsh (5.9 recommended) | |
Windows | Windows | WSL Ubuntu 20.04 or 22.04 LTS |
References
- Morris, K. V., Mattick, J. S.
The rise of regulatory RNA. Nature Reviews Genetics. 15 (6), 423-437 (2014). - Li, X., Jin, D. S., Eadara, S., Caterina, M. J., Meffert, M. K. Regulation by noncoding RNAs of local translation, injury responses, and pain in the peripheral nervous system. Neurobiology of Pain (Cambridge, Mass.). 13, 100119 (2023).
- Shi, J., Zhou, T., Chen, Q. Exploring the expanding universe of small RNAs. Nature Cell Biology. 24 (4), 415-423 (2022).
- Broughton, J. P., Lovci, M. T., Huang, J. L., Yeo, G. W., Pasquinelli, A. E. Pairing beyond the seed supports microRNA targeting specificity. Molecular Cell. 64 (2), 320-333 (2016).
- Grosswendt, S., et al. Unambiguous identification of miRNA:target site interactions by different types of ligation reactions. Molecular Cell. 54 (6), 1042-1054 (2014).
- Mills, W. T., Eadara, S., Jaffe, A. E., Meffert, M. K. SCRAP: a bioinformatic pipeline for the analysis of small chimeric RNA-seq data. RNA. 29 (1), 1-17 (2023).
- Helwak, A., Kudla, G., Dudnakova, T., Tollervey, D. Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding. Cell. 153 (3), 654-665 (2013).
- Hoefert, J. E., Bjerke, G. A., Wang, D., Yi, R. The microRNA-200 family coordinately regulates cell adhesion and proliferation in hair morphogenesis. Journal of Cell Biology. 217 (6), 2185-2204 (2018).
- Moore, M. J., Zhang, C., Gantman, E. C., Mele, A., Darnell, J. C., Darnell, R. B. Mapping Argonaute and conventional RNA-binding protein interactions with RNA at single-nucleotide resolution using HITS-CLIP and CIMS analysis. Nature Protocols. 9 (2), 263-293 (2014).
- Bjerke, G. A., Yi, R. Integrated analysis of directly captured microRNA targets reveals the impact of microRNAs on mammalian transcriptome. RNA. 26 (3), 306-323 (2020).
- Reuter, J. S., Mathews, D. H. RNAstructure: software for RNA secondary structure prediction and analysis. BMC Bioinformatics. 11 (1), 129 (2010).
- Moore, M. J., et al. miRNA-target chimeras reveal miRNA 3′-end pairing as a major determinant of Argonaute target specificity. Nature Communications. 6 (1), 8864 (2015).
- Travis, A. J., Moody, J., Helwak, A., Tollervey, D., Kudla, G. Hyb: a bioinformatics pipeline for the analysis of CLASH (crosslinking, ligation and sequencing of hybrids) data. Methods (San Diego, Calif.). 65 (3), 263-273 (2014).