Biology

Учебное пособие по вычислительному анализу химерных малых некодирующих РНК: библиотеки секвенирования целевых РНК

Published: December 1, 2023 doi: 10.3791/65779

Sreenivas Eadara¹, Xinbei Li¹, Emily A. Eiss¹, Mollie K. Meffert^1,2

¹Department of Biological Chemistry, Johns Hopkins University School of Medicine, ²Solomon H. Snyder Department of Neuroscience, Johns Hopkins University School of Medicine

Summary

Здесь мы представляем протокол, демонстрирующий установку и использование биоинформатического конвейера для анализа данных секвенирования химерной РНК, используемых при изучении взаимодействий РНК:РНК in vivo .

Abstract

Понимание регуляторных взаимодействий генов in vivo малых некодирующих РНК (sncRNAs), таких как микроРНК (miRNAs), с их РНК-мишенями было продвинуто в последние годы благодаря биохимическим подходам, которые используют кросс-линкинг с последующим лигированием для захвата взаимодействий sncRNA:целевая РНК путем образования химерных РНК и последующих библиотек секвенирования. В то время как наборы данных, полученные при секвенировании химерной РНК, предоставляют полногеномные и значительно менее неоднозначные входные данные, чем программное обеспечение для прогнозирования микроРНК, преобразование этих данных в значимую и полезную информацию требует дополнительного анализа и может отпугнуть исследователей, не имеющих вычислительной подготовки. Этот отчет представляет собой учебное пособие для специалистов по вычислительной биологии начального уровня в установке и применении новейшего программного инструмента с открытым исходным кодом: Small Chimeric RNA Analysis Pipeline (SCRAP). Приведены требования к платформе, обновления, а также объяснение этапов конвейера и манипуляций с ключевыми переменными, вводимыми пользователем. Снижение барьера для биологов в получении информации от химерных подходов к секвенированию РНК может дать толчок к исследованиям регуляторных взаимодействий sncRNA:РНК-мишени в различных биологических контекстах, основанных на открытиях.

Introduction

Малые некодирующие РНК хорошо изучены на предмет их посттранскрипционной роли в координации экспрессии наборов генов в различных процессах, таких как дифференцировка и развитие, обработка сигналов и заболевания ^1,2,3. Способность точно определять целевые транскрипты геннорегуляторных малых некодирующих РНК (sncRNAs), включая микроРНК (miRNAs), имеет важное значение для изучения биологии РНК как на базовом, так и на трансляционном уровнях. Биоинформатические алгоритмы, использующие ожидаемую комплементарность между семенной последовательностью микроРНК и ее потенциальными мишенями, часто используются для прогнозирования взаимодействий микроРНК с целевой РНК. Несмотря на то, что эти биоинформатические алгоритмы оказались успешными, они также могут давать как ложноположительные, так и ложноотрицательные результаты, как было рассмотрено в других статьях ^4,5,6. В последнее время было разработано и внедрено несколько биохимических подходов, которые позволяют однозначно и полуколичественно определять взаимодействия sncRNA:РНК-мишень in vivo путем сшивания in vivo и последующего включения этапа лигирования для физического присоединения sncRNA к мишени с образованием единой химерной РНК 4,5,7,8,9,10 . Последующая подготовка секвенирующих библиотек из химерных РНК позволяет оценить взаимодействия sncRNA:РНК-мишень путем компьютерной обработки данных секвенирования. В этом видео представлено учебное пособие по установке и использованию вычислительного конвейера, называемого малым конвейером анализа химерной РНК (SCRAP), который предназначен для обеспечения надежного и воспроизводимого анализа взаимодействий sncRNA:целевая РНК из библиотек секвенирования химерной РНК⁶.

Цель данного учебного пособия состоит в том, чтобы помочь исследователям избежать чрезмерной зависимости от чисто прогностических биоинформатических алгоритмов путем снижения барьеров для анализа данных, полученных с помощью биохимических подходов, обеспечивая химерные молекулярные считывания взаимодействий sncRNA:целевая РНК. В этом учебном пособии содержатся практические шаги и советы, которые помогут начинающим специалистам по вычислительной технике использовать конвейер SCRAP, разработанный для анализа данных секвенирования химерной РНК, которые могут быть получены с помощью нескольких существующих биохимических протоколов, включая сшивание, лигирование и секвенирование гибридов (CLASH) и ковалентное лигирование эндогенных аргонавт-связанных РНК - сшивание и иммунопреципитацию (CLEAR-CLIP)^7,9.

Использование SCRAP дает ряд преимуществ для анализа данных секвенирования химерной РНК по сравнению с другими вычислительными конвейерами⁶. Одним из существенных преимуществ является обширное аннотирование и включение выносок в хорошо поддерживаемые и регулярно обновляемые биоинформатические сценарии в конвейере по сравнению с альтернативными конвейерами, которые часто полагаются на пользовательские и/или неподдерживаемые сценарии для этапов конвейера. Эта функция обеспечивает стабильность SCRAP, что делает более полезным для исследователей ознакомиться с конвейером и включить его использование в свой рабочий процесс. Также было продемонстрировано, что SCRAP превосходит альтернативные конвейеры в вызове пиков взаимодействий sncRNA:целевая РНК и обладает кроссплатформенной функциональностью, как подробно описано в предыдущей публикации⁶.

К концу этого учебного пособия пользователи смогут (i) узнать требования к платформе для SCRAP и установить конвейеры SCRAP, (ii) установить эталонные геномы и настроить параметры командной строки для SCRAP, и (iii) понять критерии пиковых вызовов и выполнять пиковые вызовы и пиковые аннотации.

В этом видео будет подробно описано, как исследователи, изучающие биологию РНК, могут установить и оптимально использовать вычислительный конвейер SCRAP для анализа взаимодействий sncRNA с целевыми РНК, такими как матричные РНК, в данных химерного секвенирования РНК, полученных с помощью одного из обсуждаемых биохимических подходов к подготовке библиотеки секвенирования.

SCRAP — это утилита командной строки. Как правило, следуя приведенному ниже руководству, пользователю необходимо (i) загрузить и установить SCRAP (https://github.com/Meffert-Lab/SCRAP), (ii) установить референсные геномы и запустить SCRAP, и (iii) выполнить пиковый вызов и аннотацию.

Более подробную информацию о шагах вычислений в этой процедуре можно найти на https://github.com/Meffert-Lab/SCRAP. В этой статье мы предоставим настройку и справочную информацию, которая позволит исследователям с вычислительными навыками начального уровня устанавливать, оптимизировать и использовать SCRAP в наборах данных библиотеки химерного секвенирования РНК.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

ПРИМЕЧАНИЕ: Протокол начнется с загрузки и установки программного обеспечения, необходимого для анализа библиотек секвенирования химерной РНК с помощью SCRAP.

1. Установка

Перед установкой SCRAP установите зависимости Git и Miniconda на компьютере, который будет использоваться для анализа. Скорее всего, Git уже установлен. Например, на платформе Mac OSX проверьте это с помощью какой команды git, чтобы убедиться, что утилита " git " присутствует и установлена в этом каталоге. Проверьте, установлена ли Miniconda с помощью каких conda. Если ничего не возвращается, установите Miniconda. Для установки Miniconda требуется 400 МБ дискового пространства.
1. Существует несколько способов установки Miniconda, и они различаются в зависимости от платформы. Обратитесь к файлу markdown PLATFORM-SETUP в репозитории Meffert Lab GitHub [https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md], где есть дальнейшие инструкции по установке на Windows, MacOS и Ubuntu. Для пользователей Linux есть свой собственный менеджер пакетов по умолчанию (apt). В случае, относящемся к данному исследованию, используйте команду brew install Miniconda, чтобы установить Miniconda с помощью существующего менеджера пакетов brew.
  ПРИМЕЧАНИЕ: «Homebrew», называемая «brew», — это система управления пакетами программного обеспечения с открытым исходным кодом, которая упрощает установку программного обеспечения в операционной системе Apple, macOS.
2. Если conda устанавливается впервые, запустите conda init для конкретной используемой оболочки. В приведенном ниже примере используется оболочка zsh. Затем закройте и снова откройте оболочку. Если conda была успешно установлена, будет видна базовая среда, активированная во время сеанса терминала.
Загрузите исходный код SCRAP и установите его зависимости.
1. Предпочтительным методом получения исходного кода SCRAP является использование Git. Чтобы получить доступ к нему, выполните команду git clone https://github.com/Meffert-Lab/SCRAP, чтобы получить последнюю копию исходного кода.
2. Установите mamba, улучшенный решатель пакетов для conda, и установите все зависимости для SCRAP из SCRAP_environment.yml в его собственную среду conda, используя следующие команды:
  conda install -n base conda-forge::mamba
  mamba env create -f SCRAP/SCRAP_environment.yml -n SCRAP
Затем запустите эталонную установку для SCRAP. Аргументы, используемые в референсной установке, будут специфичны для организма, чьи взаимодействия sncRNA-мРНК анализируются.
bash SCRAP/bin/Reference_Installation.sh -r full/path/to/SCRAP/ -m has -g hg38 -s human
1. Укажите каталог исходной папки SCRAP для эталонной установки. Затем шаги по установке будут выполнены с использованием файлов в папках fasta и annotation . Перечислите полный путь без сокращений. Заканчивается косой чертой.
2. Обратитесь к таблицам в README.md для получения правильных аббревиатур видов miRbase. Актуальные референсные геномы можно найти в https://genome.ucsc.edu/ или https://www.ncbi.nlm.nih.gov/data-hub/genome/. В этом примере hg38 будет использоваться для мышиного генома GRCm38.
3. В настоящее время для аннотации включены следующие виды: человек, мышь и червь. Просмотрите соответствующие файлы species.annotation.bed в каталоге аннотаций в исходной папке SCRAP. Если для анализа требуется использовать другой вид, предоставьте файл annotation.bed, который соответствует той же схеме именования species.annotation.bed.

2. Запуск SCRAP

Теперь, когда зависимости и SCRAP установлены, запустите скрипт SCRAP.sh
bash SCRAP/bin/SCRAP.sh -d полный/путь/к/CLASH_Human/ -a полный/путь/к/CLASH_Human/CLASH_Human_Adapters.txt -p нет -f да -r полный/путь/к/SCRAP/ -m has -g hg38
1. Перечислите весь путь к примерам каталогов без каких-либо сокращений. Отформатируйте каталоги образцов так, чтобы имя папки точно совпадало с именем образца, как показано на рисунке 1.
2. Обратите внимание, что указанный путь — это путь к каталогу, содержащему все образцы папок, а не путь к какой-либо отдельной папке или файлу образца (см. командную строку на шаге 2.1).
3. Далее перечислите весь путь к файлу адаптера. Убедитесь, что имена примеров в файле адаптера совпадают с ранее упомянутыми именами папок и именами файлов (см. командную строку на шаге 2.1).
4. Укажите, являются ли образцы парными и будет ли проводиться фильтрация по пре-микроРНК и/или тРНК. При необходимости добавьте фильтр для очистки рРНК (см. командную строку в шаге 2.1).
  ПРИМЕЧАНИЕ: Пользователи могут принять или не решить использовать эти фильтры в зависимости от типов выборки и целей эксперимента. В зависимости от дизайна эксперимента, пре-микроРНК, тРНК и рРНК могут использовать доступную глубину секвенирования для реальных хиер sncRNA:целевая РНК, и пользователи могут использовать фильтры для их исключения. Тем не менее, пользователи могут захотеть избежать такой фильтрации при определенных обстоятельствах (например, сопоставление мишеней sncRNA с митохондриальным геномом, который содержит митохондриальные рРНК).
5. Затем перечислите весь путь к ссылочному каталогу, аббревиатуру miRbase и референсную аббревиатуру генома (см. командную строку на шаге 2.1).
  ПРИМЕЧАНИЕ: Выполнение сценария может занять несколько часов, в зависимости от размера набора данных и используемого ЦП.

3. Пиковый вызов и аннотация

После завершения работы SCRAP убедитесь, что выходные данные включают, помимо других файлов, файл SAMPLE.aligned.unique.bam. Это бинарный файл, содержащий выравнивание целевых РНК по предоставленному пользователем референсному геному.
Теперь выполните пиковые вызовы , выполнив Peak_Calling.sh.
bash SCRAP/bin/Peak_Calling.sh -d CLASH_Human/ -a CLASH_Human/CLASH_Human_Adapters.txt -c 3 -l 2 -f no -r SCRAP/ -m has -g hg38
ПРИМЕЧАНИЕ: Пиковый вызов — это функция SCRAP, которая предназначена для того, чтобы позволить исследователям легко оценивать наиболее надежные и воспроизводимые небольшие некодирующие взаимодействия РНК:целевая РНК в своих химерных библиотеках РНК. Эта функция, например, может помочь исследователям в выявлении взаимодействий, которые они, возможно, захотят выбрать для дальнейшего изучения. На шаге 3.2.2 ниже описывается, как пользователь устанавливает критерии, которые он хочет использовать для определения строгости, с которой вызывается пик - это включает в себя количество уникальных взаимодействий или последовательных чтений, которые должны произойти для вызова пика, а также количество библиотек, в которых должно произойти это конкретное взаимодействие.
1. Опять же, перечислите полные пути к каталогу, содержащему примеры папок, и файлу адаптера (см. командную строку в шаге 3.2).
2. Затем установите минимальное количество операций чтения последовательности, необходимое для вызова пика (см. командную строку в шаге 3.2).
3. Установите минимальное количество различных библиотек секвенирования, которые должны содержать пик для его вызова (см. командную строку в шаге 3.2).
  ПРИМЕЧАНИЕ: Выбор значений как для 3.2.2, так и для 3.2.3 будет зависеть от характера секвенированных образцов и количества образцов или типов образцов. В этом случае для вызова пика требуется не менее 3 считываний химерного секвенирования в выборке, и пик должен поддерживаться не менее чем 2 выборками. Например, исследователь, оценивающий набор данных, в котором имеется много репликаций библиотек секвенирования для данного условия, может принять решение о том, что чтение должно присутствовать в большем количестве библиотек секвенирования выборки.
4. Укажите, должны ли sncRNA одного семейства вносить свой вклад в один и тот же пик. Например, поскольку микроРНК одного и того же семейства имеют общие семенные последовательности, эти микроРНК могут связывать общие и перекрывающиеся наборы генов-мишеней; Пользователь может захотеть определить полное влияние семейства на эти цели, оценив их коллективные пики (см. командную строку на шаге 3.2).
5. Затем укажите полный путь к референсному каталогу, аббревиатуру miRBase и референсную аббревиатуру генома (см. командную строку на шаге 3.2).
После завершения пикового вызова запустите аннотацию пика.
bash SCRAP/bin/Peak_Annotation.sh -p CLASH_Human/peaks.bed -r SCRAP/ -s human
1. Укажите полный путь к результирующему файлу peaks.bed (или peaks.family.bed) из пикового вызова, полный путь к ссылочному каталогу и желаемый вид для аннотации.

4. Визуализация данных

ПРИМЕЧАНИЕ: Все шаги по анализу с использованием SCRAP завершены. Для визуализации данных рекомендуется несколько подходов:

Объедините все файлы .bam (бинарный файл SAM), которые необходимо визуализировать вместе (samtools merge).
Отсортируйте получившийся объединенный файл .bam (samtools sort). Содержимое файла сортируется построчно, чтобы samtools мог индексироваться.
Проиндексируйте отсортированный файл .bam (индекс samtools). Файл BAI (binary samtools format index) генерируется для визуализации в средстве просмотра интегративной геномики (IGV).
Наконец, откройте получившийся отсортированный файл .bam и индексированный .bai в IGV.
ПРИМЕЧАНИЕ: Взаимодействие SncRNA:Целевая РНК, представляющее интерес, может быть приоритетным для последующего наблюдения несколькими способами, специфичными для исследования. Один из общих первоначальных подходов состоит в том, чтобы оценить взаимодействия, для которых пики поддерживаются наиболее химерными чтениями секвенирования. Интересующие взаимодействия также могут быть визуализированы с помощью веб-сервера DuplexFold из пакета RNAstructure путем ввода последовательности как для sncRNA, так и для целевой РНК из обнаруженного взаимодействия¹¹. Для каждого пика хромосома (первый столбец) и геномные координаты (начало: 1-й столбец, конец: 2-й столбец) можно найти в файле peaks.bed.species.annotation.txt, созданном в аннотации пика. В частности, для микроРНК, в то время как воспроизводимые и функциональные взаимодействия могут отсутствовать обширное связывание с семенами (например, взаимодействия могут использовать 3'-компенсаторное связывание), наличие сайтов, совпадающих с семенами, в родственном связывающем мотиве РНК-мишени, тем не менее, может быть оценено как валидационный признак функционально важных обнаруженных взаимодействий ^4,12. Обработка вспомогательных данных может включать в себя сравнение дифференциального покрытия считывания между пиками в различных биологических условиях и, возможно, оценку кластеризации регулируемых генов в пути с помощью инструмента анализа путей.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Результаты для sncRNA:target RNA, обнаруженной модифицированной версией SCRAP (SCRAP release 2.0, в которой реализованы модификации для фильтрации рРНК) на ранее опубликованных наборах данных секвенирования, подготовленных с использованием CLEAR-CLIP⁹ , показаны на рисунке 2 и в таблице 1. Пользователи могут оценить уменьшение относительной доли взаимодействия микроРНК с интронными областями, которое происходит после выделения высокодоверительных взаимодействий пиковым вызовом в SCRAP. Дополнительные данные, полученные в результате анализа с использованием SCRAP, также доступны в первоначальной публикации этого конвейера⁶. В зависимости от экспериментального подхода может потребоваться фильтрация данных секвенирования из подготовленных библиотек химерных РНК для уменьшения артефактов в результатах. Неоптимальная биохимическая подготовка библиотеки секвенирования и/или неоптимальная фильтрация данных секвенирования могут привести к неправильному включению прочтений, которые не возникли в результате лигирования sncRNA и РНК-мишеней, связанных Argonaute. Эти артефактные считывания могут включать димеры праймеров или димеры-адаптеры, рРНК и пре-микроРНК. В таблице 2 описаны возможные артефакты, которые могут быть обнаружены в результатах, и возможные решения.

Рисунок 1: Форматирование каталогов данных. Файлы, содержащие необработанные операции чтения для каждой библиотеки виртуализации, должны быть предоставлены в формате .fastq.gz. (A) Если библиотеки не являются парными, в анализе будет использоваться один .fastq.gz файл. Этот файл должен называться 'SAMPLE.fastq.gz', где SAMPLE - это точное имя образца, указанное пользователем в файле адаптера. Файл должен содержаться в папке, точно совпадающей с именем образца. (B) Для библиотек парного секвенирования будут использоваться два .fastq.gz файла. Эти файлы должны называться 'SAMPLE-R1.fastq.gz' и 'SAMPLE-R2.fastq.gz' и должны находиться в папке, точно соответствующей имени образца. Все такие каталоги с именем SAMPLE должны располагаться в одном и том же родительском каталоге, который пользователь предоставит SCRAP в качестве «каталога образцов». Пожалуйста, нажмите здесь, чтобы увидеть увеличенную версию этого рисунка.

Рисунок 2: Соотношение взаимодействий микроРНК:целевая РНК по методам Target Type и Peak Calling. Химерное секвенирование sncRNA:целевая РНК Опубликованные данные из библиотек, подготовленных с помощью CLEAR-CLIP (SRR2413277 - SRR2413295)⁹, были проанализированы с использованием модифицированной версии SCRAP (SCRAP release 2.0) с реализованной фильтрацией рРНК. Пре-микроРНК, тРНК и рРНК были отфильтрованы, и использовались различные настройки пиковых вызовов для «высокой достоверности» (минимум 3 чтения и 2 библиотеки) и «всех взаимодействий» (минимум 1 чтение и 1 библиотека). Взаимодействия группировались по семействам микроРНК или не группировались. Рассчитаны и построены графики относительных долей прочтений химерной РНК для категорий (CDS, 5' UTR, intergenic, intron, 3'UTR). Пожалуйста, нажмите здесь, чтобы увидеть увеличенную версию этого рисунка.

	Все взаимодействия		Взаимодействие с высокой степенью достоверности
	Индивидуальные микроРНК	Семейства микроРНК	Индивидуальные микроРНК	Семейства микроРНК
СДС	8675	8679	925	1046
5' УТР	338	338	38	43
Интергенный	2230	2230	320	339
Интрон	9522	9519	382	406
3' УТР	6814	6813	548	644
Общее количество взаимодействий:	31033	31034	4219	4597

Таблица 1: Химерное считывание Количество взаимодействий микроРНК:РНК-мишени по типу мишени и методу вызова пика. Данные секвенирования химерной sncRNA:целевой РНК, опубликованные из библиотек, подготовленных с помощью CLEAR-CLIP (SRR2413277 - SRR2413295)⁹ , были проанализированы с использованием модифицированной версии SCRAP (SCRAP release 2.0) с реализованной фильтрацией рРНК. Пре-микроРНК, тРНК и рРНК были отфильтрованы, и использовались различные настройки пиковых вызовов для высокодостоверных (минимум 3 чтения и 2 библиотеки) и всех (минимум 1 чтение и 1 библиотека) взаимодействий, сгруппированных по семействам микроРНК или несгруппированных. Для каждого условия перечислены подсчеты общего количества обнаруженных взаимодействий микроРНК:целевая РНК, в которых взаимодействие целевой РНК было сопоставлено с категорией кодирующей последовательности (CDS), 5'-нетранслируемой области (5' UTR), межгенной области, интрона или 3'-нетранслируемой области (3'UTR).

Потенциальный загрязнитель	Обнаружено как	Причины	Возможные решения
Димеры грунтовки	Взаимодействия, обнаруженные между микроРНК, последовательность которых соответствует 5'-концу амплификационного праймера, и целевой РНК, последовательность которой соответствует остальной части праймера.	Неправильное разделение по размерам (т.е. экстракция геля) продукта ПЦР после амплификации.	Большинство праймерных димеров не будут приняты во внимание SCRAP после снятия адаптера из-за их небольшой длины. Если они сохраняются, рассмотрите возможность добавления последовательностей праймеров в фильтр.
рРНК	Взаимодействия между произвольными микроРНК и известными рРНК или днкРНК Gm26917 и Gm42418	Неэффективное выделение (т.е. иммунопреципитация и гелевое разделение) комплексов Argonaute.	Фильтрация рРНК часто необходима при обильном загрязнении рРНК.
тРНК и пре-микроРНК	Взаимодействия между фрагментами тРНК, которые являются продуктами деградации одной и той же тРНК или 5p и 3p микроРНК, продуцируемыми из одной и той же пре-микроРНК.	Низкая распространенность истинных химер sncRNA:целевая РНК или низкая экспрессия тканевого Argonaute.	тРНК-фильтрация и пре-микроРНК-фильтрация.

Таблица 2: Считывание и решение секвенирования потенциальных загрязняющих веществ.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Этот протокол по использованию конвейера SCRAP для анализа взаимодействий sncRNA:РНК-мишени предназначен для помощи исследователям, которые приступают к вычислительному анализу. Ожидается, что по завершении учебного пособия исследователи с опытом вычислений начального уровня или выше пройдут через шаги, необходимые для установки и использования этого конвейера и его применения для анализа данных, полученных из библиотек химерного секвенирования РНК. Шаги, критически важные для завершения этого протокола, включают правильную установку ссылок и запуск SCRAP, что может занять много времени и стать источником ошибок, особенно если не были приняты меры предосторожности при установке зависимостей с помощью Anaconda или вводе аргументов командной строки.

Особое внимание здесь было уделено советам и шагам по практическому использованию конвейера SCRAP для анализа химерных библиотек секвенирования sncRNA:target RNA. Было обнаружено, что SCRAP превосходит другие платформы анализа химерной РНК в обнаружении взаимодействий sncRNA:целевая РНК ^6,13. Это может быть связано с функцией пикового вызова SCRAP, которая была разработана специально для обнаружения особенностей (например, 3'-плеча), которые наблюдаются в результате биохимических этапов, участвующих в образовании химерных РНК. Другие методы вызова пиков для различных биохимических подходов, такие как последующее секвенирование хроматина (CHIP-seq), были разработаны для обнаружения пиков в данных, которые симметрично распределены вокруг среднего значения и, как правило, не так хорошо работают при обнаружении пиковых характеристик химерных библиотек sncRNA:целевая РНК. Тем не менее, пользователи могут захотеть протестировать использование других вычислительных конвейеров, которые могли бы лучше работать для их нужд, особенно если их данные не соответствуют этому описанию.

Несмотря на то, что SCRAP имеет минимальные требования к оборудованию, среда выполнения SCRAP плохо масштабируется в зависимости от размера набора данных. Исследователи, которые не являются новичками или имеют большое количество наборов данных или наборов данных с высоким уровнем секвенирования, могут захотеть использовать SCRAP таким образом, чтобы ускорить этапы анализа. Поскольку большие наборы данных (обычно > 1 миллиард операций чтения) требуют расширенных возможностей хранения файлов и скорости чтения/записи данных, для анализа больших наборов данных может потребоваться запуск SCRAP в кластере высокопроизводительных вычислений (HPC). Оптимизация SCRAP, которая должна обеспечить распараллеливание и повышение производительности, будет доступна на GitHub (https://github.com/Meffert-Lab/). Эта обновленная версия SCRAP (выпуск 2.0) также имеет улучшенные фильтры для рРНК и других загрязняющих веществ.

Как и в случае с любым интерфейсом, пользователи неизбежно могут столкнуться с трудностями при использовании интерфейса командной строки. К наиболее распространенным из них относятся орфографические ошибки, неверные пути и установка пакетов/управление версиями. Следователям рекомендуется проявлять осторожность и избегать опечаток при написании аргументов командной строки, а также точно воспроизводить пути к файлам или папкам (в этом может помочь использование автозаполнения с помощью табуляции). Управление зависимостями для SCRAP осуществляется с помощью Anaconda, поэтому исследователи с меньшей вероятностью столкнутся с проблемами при установке пакетов или обновлении версий.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Авторам нечего раскрывать.

Acknowledgments

Мы благодарим сотрудников лаборатории Мефферта за полезные обсуждения, в том числе Б.Х. Пауэлла и У.Т. Миллса IV, за критические отзывы об описании установки и реализации трубопровода. Эта работа была поддержана премией Фонда Брауде, программой запуска Фонда исследований стволовых клеток штата Мэриленд, премией Фонда Блаустейна за исследования и образование в области боли, а также RO1MH129292 NINDS RO1NS103974 и NIMH для M.K.M.

Materials

Name	Company	Catalog Number	Comments
Genomes	UCSC Genome browser	N/A	https://genome.ucsc.edu/ or https://www.ncbi.nlm.nih.gov/data-hub/genome/
Linux	Linux	Ubuntu 20.04 or 22.04 LTS recommended
Mac	Apple	Mac OSX (>11)
Platform setup	GitHub	N/A	https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md]
SCRAP pipeline	GitHub	N/A	https://github.com/Meffert-Lab/SCRAP
Unix shell	Unix operating system	bash >=5.0
Unix shell	Unix operating system	zsh (5.9 recommended)
Windows	Windows	WSL Ubuntu 20.04 or 22.04 LTS

DOWNLOAD MATERIALS LIST

References

Morris, K. V., Mattick, J. S. The rise of regulatory RNA. Nature Reviews Genetics. 15 (6), 423-437 (2014).
Li, X., Jin, D. S., Eadara, S., Caterina, M. J., Meffert, M. K. Regulation by noncoding RNAs of local translation, injury responses, and pain in the peripheral nervous system. Neurobiology of Pain (Cambridge, Mass.). 13, 100119 (2023).
Shi, J., Zhou, T., Chen, Q. Exploring the expanding universe of small RNAs. Nature Cell Biology. 24 (4), 415-423 (2022).
Broughton, J. P., Lovci, M. T., Huang, J. L., Yeo, G. W., Pasquinelli, A. E. Pairing beyond the seed supports microRNA targeting specificity. Molecular Cell. 64 (2), 320-333 (2016).
Grosswendt, S., et al. Unambiguous identification of miRNA:target site interactions by different types of ligation reactions. Molecular Cell. 54 (6), 1042-1054 (2014).
Mills, W. T., Eadara, S., Jaffe, A. E., Meffert, M. K. SCRAP: a bioinformatic pipeline for the analysis of small chimeric RNA-seq data. RNA. 29 (1), 1-17 (2023).
Helwak, A., Kudla, G., Dudnakova, T., Tollervey, D. Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding. Cell. 153 (3), 654-665 (2013).
Hoefert, J. E., Bjerke, G. A., Wang, D., Yi, R. The microRNA-200 family coordinately regulates cell adhesion and proliferation in hair morphogenesis. Journal of Cell Biology. 217 (6), 2185-2204 (2018).
Moore, M. J., Zhang, C., Gantman, E. C., Mele, A., Darnell, J. C., Darnell, R. B. Mapping Argonaute and conventional RNA-binding protein interactions with RNA at single-nucleotide resolution using HITS-CLIP and CIMS analysis. Nature Protocols. 9 (2), 263-293 (2014).
Bjerke, G. A., Yi, R. Integrated analysis of directly captured microRNA targets reveals the impact of microRNAs on mammalian transcriptome. RNA. 26 (3), 306-323 (2020).
Reuter, J. S., Mathews, D. H. RNAstructure: software for RNA secondary structure prediction and analysis. BMC Bioinformatics. 11 (1), 129 (2010).
Moore, M. J., et al. miRNA-target chimeras reveal miRNA 3′-end pairing as a major determinant of Argonaute target specificity. Nature Communications. 6 (1), 8864 (2015).
Travis, A. J., Moody, J., Helwak, A., Tollervey, D., Kudla, G. Hyb: a bioinformatics pipeline for the analysis of CLASH (crosslinking, ligation and sequencing of hybrids) data. Methods (San Diego, Calif.). 65 (3), 263-273 (2014).

Biology

Учебное пособие по вычислительному анализу химерных малых некодирующих РНК: библиотеки секвенирования целевых РНК

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.