Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Chimeric Small Noncoding RNA에 대한 전산 분석 튜토리얼: 표적 RNA 염기서열분석 라이브러리

Published: December 1, 2023 doi: 10.3791/65779

Summary

여기에서는 in vivo RNA:RNA 상호 작용 연구에 사용되는 키메라 RNA 염기서열 분석 데이터를 분석하기 위한 생물정보학 파이프라인의 설치 및 사용을 보여주는 프로토콜을 제시합니다.

Abstract

microRNA(miRNA)와 같은 작은 비코딩 RNA(sncRNA)와 표적 RNA의 생체 내 유전자 조절 상호 작용에 대한 이해는 키메라 RNA 및 후속 염기서열 분석 라이브러리의 형성을 통해 sncRNA:표적 RNA 상호 작용을 포착하기 위해 교차 결합 후 결찰을 사용하는 생화학적 접근 방식에 의해 최근 몇 년 동안 발전되었습니다. 키메라 RNA 염기서열 분석의 데이터 세트는 miRNA 예측 소프트웨어보다 게놈 전체에 대한 모호성이 훨씬 적은 입력을 제공하지만, 이 데이터를 의미 있고 실행 가능한 정보로 추출하려면 추가 분석이 필요하며 계산 배경이 부족한 연구자를 설득할 수 있습니다. 이 보고서는 초급 컴퓨터 생물학자가 최신 오픈 소스 소프트웨어 도구인 SCRAP(Small Chimeric RNA Analysis Pipeline)를 설치하고 적용할 수 있도록 지원하는 자습서를 제공합니다. 플랫폼 요구 사항, 업데이트, 파이프라인 단계 및 주요 사용자 입력 변수 조작에 대한 설명이 제공됩니다. 생물학자가 키메라 RNA 염기서열 분석 접근법에서 통찰력을 얻을 수 있는 장벽을 줄이면 여러 생물학적 맥락에서 조절 sncRNA:표적 RNA 상호 작용에 대한 발견 기반 조사를 시작할 수 있습니다.

Introduction

작은 비코딩 RNA는 분화 및 발달, 신호 처리 및 질병과 같은 다양한 과정에서 유전자 제품군의 발현을 조정하는 전사 후 역할에 대해 고도로 연구되고 있습니다 1,2,3. microRNA(miRNA)를 포함한 유전자 조절 소형 비코딩 RNA(sncRNA)의 표적 전사체를 정확하게 결정하는 능력은 기본 및 번역 수준 모두에서 RNA 생물학 연구에 중요합니다. miRNA 시드 서열과 잠재적 표적 사이의 예상되는 상보성을 활용하는 생물정보학 알고리즘은 miRNA:표적 RNA 상호작용의 예측에 자주 사용되어 왔습니다. 이러한 생물정보학 알고리즘은 성공적이었지만 다른 곳에서 검토된 바와 같이 위양성 및 위음성 결과를 모두 보유할 수도 있습니다 4,5,6. 최근에, 단일 키메라 RNA 4,5,7,8,9,10을 형성하기 위해 sncRNA를 표적에 물리적으로 부착하기 위한 ligation 단계의 in vivo 교차결합 및 후속 통합에 의한 in vivo sncRNA:target RNA 상호작용의 모호하지 않고 반정량적인 결정을 가능하게 하는 몇 가지 생화학적 접근법이 설계 및 구현되었습니다 . 키메라 RNA로부터 염기서열분석 라이브러리의 후속 준비를 통해 염기서열분석 데이터의 전산 처리를 통해 sncRNA:표적 RNA 상호작용을 평가할 수 있습니다. 이 비디오는 키메라 RNA 염기서열 분석 라이브러리에서 sncRNA:표적 RNA 상호 작용의 강력하고 재현 가능한 분석을 허용하도록 설계된 소형 키메라 RNA 분석 파이프라인(SCRAP)이라는 계산 파이프라인을 설치하고 사용하는 방법에 대한 자습서를 제공합니다6.

이 튜토리얼의 목표는 sncRNA:표적 RNA 상호 작용의 키메라 분자 판독을 제공하는 생화학적 접근 방식을 통해 생성된 데이터 분석에 대한 장벽을 낮춤으로써 연구자가 순수 예측 생물정보학 알고리즘에 대한 과도한 의존을 피할 수 있도록 지원하는 것입니다. 이 튜토리얼은 하이브리드의 교차결합, 연결 및 염기서열분석(CLASH) 및 내인성 아르고나우트 결합 RNA의 공유 결합 및 면역침전(CLEAR-CLIP)7,9을 포함한 여러 기존 생화학 프로토콜에 의해 생성될 수 있는 키메라 RNA 염기서열 분석 데이터를 분석하기 위해 개발된 파이프라인 SCRAP을 사용하여 초급 컴퓨터 과학자를 안내하는 실용적인 단계와 팁을 제공합니다.

SCRAP의 사용은 다른 계산 파이프라인에 비해 키메라 RNA 염기서열 분석 데이터 분석에 몇 가지 이점을 제공한다6. 한 가지 두드러진 장점은 파이프라인의 단계에 대해 사용자 지정 및/또는 지원되지 않는 스크립트에 의존하는 대체 파이프라인과 비교하여 파이프라인 내에서 잘 지원되고 정기적으로 업데이트되는 생물정보학 스크립트에 대한 광범위한 주석과 콜아웃의 통합입니다. 이 기능은 SCRAP에 안정성을 부여하여 연구원이 파이프라인에 익숙해지고 워크플로에 사용을 통합하는 데 더 가치가 있습니다. SCRAP는 또한 sncRNA:target RNA 상호 작용의 피크를 호출하는 데 있어 대체 파이프라인을 능가하는 것으로 입증되었으며, 이전 간행물6에 자세히 설명된 바와 같이 플랫폼 간 기능을 갖는 것으로 입증되었습니다.

이 자습서를 마치면 사용자는 (i) SCRAP에 대한 플랫폼 요구 사항을 파악하고 SCRAP 파이프라인을 설치하고, (ii) 참조 게놈을 설치하고 SCRAP에 대한 명령줄 매개 변수를 설정하고, (iii) 피크 호출 기준을 이해하고 피크 호출 및 피크 주석을 수행할 수 있습니다.

이 비디오는 RNA 생물학을 연구하는 연구원이 염기서열분석 라이브러리 준비에 대한 논의된 생화학적 접근 방식 중 하나를 통해 얻은 키메라 RNA 염기서열분석 데이터에서 전령 RNA와 같은 표적 RNA와의 sncRNA 상호 작용을 분석하기 위해 계산 파이프라인인 SCRAP를 설치하고 최적으로 사용하는 방법을 실용적으로 자세히 설명합니다.

SCRAP는 명령줄 유틸리티입니다. 일반적으로 아래 가이드에 따라 사용자는 (i) SCRAP(https://github.com/Meffert-Lab/SCRAP)를 다운로드하여 설치하고, (ii) 참조 게놈을 설치하고 SCRAP를 실행하고, (iii) 피크 호출 및 주석을 수행해야 합니다.

이 절차의 계산 단계에 대한 자세한 내용은 https://github.com/Meffert-Lab/SCRAP 에서 확인할 수 있습니다. 이 기사에서는 초급 수준의 계산 기술을 갖춘 연구자가 키메라 RNA 염기서열 분석 라이브러리 데이터 세트에 SCRAP를 설치, 최적화 및 사용할 수 있도록 설정 및 배경 정보를 제공합니다.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

참고: 프로토콜은 SCRAP를 사용하여 키메라 RNA 염기서열 분석 라이브러리를 분석하는 데 필요한 소프트웨어를 다운로드하고 설치하는 것으로 시작됩니다.

1. 설치

  1. SCRAP를 설치하기 전에 분석에 사용할 컴퓨터에 종속성 Git 및 Miniconda를 설치합니다. Git이 이미 설치되어 있을 수 있습니다. 예를 들어 Mac OSX 플랫폼에서 which git을 사용하여 이를 확인하여 " git " 유틸리티가 있고 이 디렉토리에 설치되어 있는지 확인합니다. Miniconda가 어떤 conda를 사용하여 설치되었는지 확인하십시오. 아무 것도 반환되지 않으면 Miniconda를 설치합니다. Miniconda를 설치하려면 400MB의 디스크 공간이 필요합니다.
    1. Miniconda를 설치하는 몇 가지 방법이 있으며 플랫폼에 따라 다릅니다. Windows, MacOS 및 Ubuntu에 설치하기 위한 추가 지침이 있는 Meffert Lab GitHub 리포지토리 [https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md]의 PLATFORM-SETUP 마크다운 파일을 참조하십시오. Linux 사용자의 경우 Linux에는 자체 기본 패키지 관리자(apt)가 있습니다. 이 연구와 관련된 경우 brew install Miniconda 명령을 사용하여 기존 패키지 관리자인 brew를 사용하여 Miniconda 를 설치합니다.
      참고: 'brew'라고 하는 'Homebrew'는 Apple의 운영 체제인 macOS에서 소프트웨어 설치를 단순화하는 오픈 소스 소프트웨어 패키지 관리 시스템입니다.
    2. conda를 처음 설치하는 경우 사용 중인 특정 셸에 대해 conda init 를 실행합니다. 이 예제에서 사용 중인 셸은 zsh입니다. 그런 다음 셸을 닫았다가 다시 엽니다. conda가 성공적으로 설치되면 터미널 세션 내에서 활성화된 기본 환경이 표시됩니다.
  2. SCRAP 소스를 다운로드하고 해당 종속성을 설치합니다.
    1. SCRAP 소스를 얻는 기본 방법은 Git을 사용하는 것입니다. git clone https://github.com/Meffert-Lab/SCRAP 를 실행하여 소스 코드의 최신 복사본을 가져옵니다.
    2. conda에 대한 향상된 패키지 솔버인 mamba를 설치하고 다음 명령을 사용하여 SCRAP_environment.yml에서 자체 conda 환경으로 SCRAP에 대한 모든 종속성을 설치합니다.
      conda 설치 -n base conda-forge :: 맘바
      맘바 환경 생성 -f 스크랩/SCRAP_environment.yml -n 스크랩
  3. 그런 다음 SCRAP에 대한 참조 설치를 실행합니다. 참조 설치에 사용된 인수는 sncRNA-mRNA 상호 작용이 분석되는 유기체에 따라 다릅니다.
    bash SCRAP / bin / Reference_Installation.sh -r 전체 / 경로 / SCRAP / -m -g hg38 -s human
    1. 참조 설치를 위해 SCRAP 원본 폴더의 디렉터리를 제공합니다. 그런 다음 fasta annotation 폴더 내의 파일을 사용하여 설치 단계를 수행합니다. 축약형 없이 전체 경로를 나열합니다. 슬래시로 끝납니다.
    2. 올바른 miRbase 종 약어는 README.md 의 표를 참조하십시오. 최신 참조 게놈은 https://genome.ucsc.edu/ 또는 https://www.ncbi.nlm.nih.gov/data-hub/genome/ 에서 찾을 수 있습니다. 이 예에서 hg38 은 마우스 GRCm38 게놈에 사용됩니다.
    3. 현재 주석에 포함된 종은 인간, 생쥐벌레입니다. SCRAP 소스 폴더의 주석 디렉토리에서 해당 species.annotation.bed 파일을 봅니다. 분석을 위해 다른 종을 사용하려는 경우 동일한 명명 체계 species.annotation.bed를 따르는 annotation.bed 파일을 제공합니다.

2. SCRAP 실행

  1. 이제 종속성과 SCRAP이 설치되었으므로 스크립트를 실행합니다 SCRAP.sh
    bash SCRAP/bin/SCRAP.sh -d 전체/경로/CLASH_Human/-a 전체/경로/CLASH_Human/CLASH_Human_Adapters.txt -p no -f 예 -r 전체/경로/to/SCRAP/ -m에는 -g hg38이 있습니다.
    1. 샘플 디렉터리에 대한 전체 경로를 축약형 없이 나열합니다. 그림 1과 같이 샘플 이름과 정확히 일치하는 폴더 이름으로 샘플 디렉터리의 형식을 지정합니다.
    2. 나열된 경로는 개별 샘플 폴더 또는 샘플 파일의 경로가 아니라 모든 샘플 폴더가 포함된 디렉터리의 경로입니다(2.1단계의 명령줄 참조).
    3. 그런 다음 어댑터 파일의 전체 경로를 나열합니다. 어댑터 파일의 샘플 이름이 이전에 언급한 폴더 이름 및 파일 이름과 일치하는지 확인하십시오(2.1단계의 명령행 참조).
    4. 샘플이 paired-end인지 여부와 pre-miRNA 및/또는 tRNA에 대한 필터링을 수행할지 여부를 나타냅니다. 원하는 경우 rRNA 세척을 위한 필터를 추가합니다(2.1단계의 명령줄 참조).
      참고: 사용자는 샘플 유형 및 실험 목표에 따라 이러한 필터를 사용할지 여부를 결정할 수 있습니다. 실험 설계에 따라 pre-miRNA, tRNA 및 rRNA는 실제 sncRNA:target RNA 키메라에 사용 가능한 염기서열분석 깊이를 소비할 수 있으며 사용자는 필터를 사용하여 이를 제외할 수 있습니다. 그러나 사용자는 특정 상황(예: sncRNA 표적을 미토콘드리아 rRNA를 포함하는 미토콘드리아 게놈에 매핑)에서 이러한 필터링을 피하기를 원할 수 있습니다.
    5. 그런 다음 참조 디렉터리의 전체 경로, miRbase 약어 및 참조 게놈 약어를 나열합니다(2.1단계의 명령줄 참조).
      참고: 사용 중인 컴퓨터의 데이터 세트 크기 및 CPU에 따라 스크립트를 완료하는 데 몇 시간이 걸릴 수 있습니다.

3. 피크 호출 및 주석

  1. SCRAP 실행이 완료되면 출력에 다른 파일 중에서 SAMPLE.aligned.unique.bam 파일이 포함되어 있는지 확인합니다. 이것은 사용자가 제공한 참조 게놈에 대한 표적 RNA의 정렬을 포함하는 바이너리 파일입니다.
  2. 이제 Peak_Calling.sh를 실행하여 피크 호출을 수행합니다.
    bash SCRAP / bin / Peak_Calling.sh -d CLASH_Human / -a CLASH_Human / CLASH_Human_Adapters.txt -c 3 -l 2 -f no -r SCRAP / -m에는 -g hg38이 있습니다.
    참고: 피크 콜링은 SCRAP의 기능으로, 연구원이 키메라 RNA 라이브러리 내에서 가장 강력하고 재현 가능한 작은 비코딩 RNA:표적 RNA 상호 작용을 쉽게 평가할 수 있도록 설계되었습니다. 예를 들어 이 기능은 연구원이 추가 조사를 위해 선택할 수 있는 상호 작용을 식별하는 데 도움이 될 수 있습니다. 아래의 3.2.2 단계는 사용자가 피크가 호출되는 엄격성을 정의하는 데 사용할 기준을 설정하는 방법을 설명합니다 - 여기에는 피크가 호출되기 위해 발생해야 하는 고유한 상호 작용 또는 시퀀싱 읽기의 수와 이 특정 상호 작용이 발생해야 하는 라이브러리의 수가 포함됩니다.
    1. 다시 샘플 폴더 및 어댑터 파일을 포함하는 디렉토리의 전체 경로를 나열하십시오(3.2단계의 명령행 참조).
    2. 다음으로, 피크를 호출하는 데 필요한 최소 시퀀싱 판독 횟수를 설정합니다(3.2단계의 명령줄 참조).
    3. 호출하기 위해 피크를 포함해야 하는 고유한 시퀀싱 라이브러리의 최소 수를 설정합니다(3.2단계의 명령줄 참조).
      참고: 3.2.2 및 3.2.3에 대한 값 선택은 시퀀싱된 샘플의 특성과 샘플 또는 샘플 유형 수에 따라 달라집니다. 여기서 피크를 호출하려면 샘플에서 최소 3개의 키메라 시퀀싱 판독이 필요하며, 피크는 최소 2개의 샘플에 의해 지원되어야 합니다. 예를 들어, 주어진 조건에 대해 많은 염기서열분석 라이브러리 반복실험이 있는 데이터 세트를 평가하는 연구자는 더 많은 수의 표본 염기서열분석 라이브러리에 판독이 존재하도록 결정할 수 있습니다.
    4. 동일한 계열의 sncRNA가 동일한 피크에 기여해야 하는지 여부를 나타냅니다. 예를 들어, 동일한 패밀리의 miRNA가 시드 서열을 공유하기 때문에, 이러한 miRNA는 유전자 표적의 공유 및 중첩 세트와 결합할 수 있습니다. 사용자는 집합적 피크를 평가하여 이러한 목표에 대한 패밀리의 전체 영향을 식별할 수 있습니다(3.2단계의 명령줄 참조).
    5. 그런 다음 참조 디렉터리의 전체 경로, miRBase 약어 및 참조 게놈 약어를 지정합니다(3.2단계의 명령줄 참조).
  3. 피크 호출이 완료되면 피크 주석을 실행합니다.
    bash 스크랩 / bin / Peak_Annotation.sh -p CLASH_Human / peaks.bed -r 스크랩 / -s 인간
    1. 피크 호출에서 결과 peaks.bed(또는 peaks.family.bed ) 파일의 전체 경로, 참조 디렉터리의 전체 경로 및 주석에 사용할 종을 나열합니다.

4. 데이터 시각화

참고: 이제 SCRAP을 사용한 모든 분석 단계가 완료되었습니다. 데이터를 시각화하려면 다음과 같은 몇 가지 방법을 사용하는 것이 좋습니다.

  1. 함께 시각화하려는 모든 .bam(바이너리 SAM 파일) 파일을 병합합니다(samtools 병합).
  2. 병합된 결과 .bam 파일을 정렬합니다(samtools 정렬). 파일 내용은 samtools가 색인을 생성할 수 있도록 한 줄씩 정렬됩니다.
  3. 정렬된 .bam 파일(samtools 인덱스)을 인덱싱합니다. 통합 유전체학 뷰어(IGV)에서 시각화할 수 있도록 BAI(바이너리 samtools 형식 색인) 파일이 생성됩니다.
  4. 마지막으로 IGV에서 정렬된 결과 .bam 및 인덱싱된 .bai 파일을 엽니다.
    참고: SncRNA: 관심 표적 RNA 상호 작용은 여러 가지 조사별 방법으로 후속 조치에 우선 순위를 지정할 수 있습니다. 한 가지 일반적인 초기 접근법은 가장 키메라 염기서열분석 판독에서 피크가 지원되는 상호 작용을 평가하는 것입니다. 관심있는 상호작용은 검출된 상호작용11로부터 sncRNA 및 표적 RNA 둘 다에 대한 서열을 입력함으로써 RNAstructure 패키지로부터 DuplexFold Web Server를 사용하여 또한 시각화될 수 있다. 각 피크에 대해 염색체(첫 번째 열) 및 게놈 좌표(시작: 첫 번째 열 끝: 두 번째 열)는 피크 주석에서 생성된 peaks.bed.species.annotation.txt 파일 내에서 찾을 수 있습니다. 특히 miRNA의 경우, 재현 가능하고 기능적인 상호작용은 광범위한 seed-matched binding이 부족할 수 있지만(예를 들어, 상호작용은 3' compensatory binding을 사용할 수 있음), 그럼에도 불구하고 표적 RNA의 cognate binding motif에 seed-matched site의 존재는 기능적으로 중요한 검출된 상호작용의 검증 특징으로 평가될 수 있습니다 4,12. 보조 데이터 처리에는 뚜렷한 생물학적 조건에서 피크 간의 차등 판독 범위 비교와 경로 분석 도구를 사용하여 조절된 유전자를 경로로 클러스터링하는 것을 잠재적으로 평가하는 것이 포함될 수 있습니다.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

CLEAR-CLIP9 를 사용하여 준비한 이전에 발표된 염기서열분석 데이터 세트에서 변형된 버전의 SCRAP(rRNA 필터링을 위한 수정을 구현하는 SCRAP 릴리스 2.0)에 의해 검출된 sncRNA:target RNA에 대한 결과는 그림 2표 1에 나와 있습니다. 사용자는 SCRAP에서 피크 호출에 의한 신뢰도 높은 상호 작용의 분리 후에 발생하는 인트론 영역과의 상대적 분획 miRNA 상호 작용의 감소를 이해할 수 있습니다. SCRAP를 사용한 분석의 추가 데이터는 이 파이프라인6의 초기 게시에서도 사용할 수 있습니다. 실험적 접근 방식에 따라 결과의 아티팩트를 줄이기 위해 준비된 키메라 RNA 라이브러리의 염기서열 분석 데이터 필터링이 필요할 수 있습니다. 염기서열분석 라이브러리의 최적이 아닌 생화학적 준비 및/또는 염기서열분석 데이터의 최적이 아닌 필터링은 Argonaute에 결합된 sncRNA 및 표적 RNA의 ligation에서 발생하지 않은 read의 잘못된 포함을 초래할 가능성이 있습니다. 이러한 아티팩트 판독에는 프라이머 이량체 또는 어댑터 이량체, rRNA 및 pre-miRNA가 포함될 수 있습니다. 표 2 에서는 결과에서 감지될 수 있는 가능한 아티팩트와 잠재적 솔루션에 대해 설명합니다.

Figure 1
그림 1: 데이터 디렉터리의 형식 지정 각 시퀀싱 라이브러리에 대한 원시 읽기가 포함된 파일은 .fastq.gz 형식으로 제공되어야 합니다. (A) 라이브러리가 쌍을 이루지 않은 경우 단일 .fastq.gz 파일이 분석에 사용됩니다. 이 파일의 이름은 'SAMPLE.fastq.gz'여야 하며, 여기서 SAMPLE은 어댑터 파일에서 사용자가 제공한 정확한 샘플 이름입니다. 파일은 샘플 이름과 정확히 일치하는 폴더 내에 포함되어야 합니다. (B) paired-end sequencing 라이브러리의 경우 두 개의 .fastq.gz 파일이 사용됩니다. 이러한 파일의 이름은 'SAMPLE-R1.fastq.gz' 및 'SAMPLE-R2.fastq.gz'여야 하며 샘플 이름과 정확히 일치하는 폴더 내에 있어야 합니다. SAMPLE이라는 이름의 모든 디렉토리는 사용자가 SCRAP에 "샘플 디렉토리"로 제공하는 동일한 상위 디렉토리 내에 위치해야 합니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 2
그림 2: 표적 유형 및 Peak Calling 방법에 따른 miRNA:표적 RNA 상호 작용의 비율. 키메라 sncRNA:표적 RNA 염기서열분석 CLEAR-CLIP (SRR2413277 - SRR2413295)9를 사용하여 준비된 라이브러리에서 발표된 데이터는 rRNA 필터링이 구현된 수정된 버전의 SCRAP(SCRAP 릴리스 2.0)을 사용하여 분석되었습니다. pre-miRNA, tRNA 및 rRNA를 필터링하고, 'high-confidence'(최소 3회 판독 및 2개 라이브러리) 및 '모든 상호작용'(최소 1회 판독 및 1개 보관)에 대해 뚜렷한 피크 콜링 설정을 사용했습니다. 상호작용은 miRNA 패밀리에 의해 그룹화되거나 그룹화되지 않았습니다. 범주(CDS, 5' UTR, intergenic, intron, 3'UTR)에 대한 키메라 RNA 판독의 상대적 분율을 계산하고 그래프로 표시했습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

모든 인터랙션 신뢰도가 높은 교호작용
개별 miRNA miRNA 제품군 개별 miRNA miRNA 제품군
증권 시세 표시기 8675 8679 925 1046
5' UTR 338 338 38 43
유전자 간 2230 2230 320 339
인트론 9522 9519 382 406
3' UTR 6814 6813 548 644
총 상호 작용 수: 31033 31034 4219 4597

표 1: 타겟 유형 및 피크 호출 방법별 miRNA:타겟 RNA 상호 작용의 키메라 판독 횟수. CLEAR-CLIP (SRR2413277 - SRR2413295)9 를 사용하여 제조된 라이브러리에서 발표된 Chimeric sncRNA:target RNA sequencing 데이터는 rRNA 필터링이 구현된 SCRAP(SCRAP release 2.0)의 수정된 버전을 사용하여 분석되었습니다. pre-miRNA, tRNA 및 rRNA를 필터링하고, miRNA 패밀리 또는 비그룹화된 높은 신뢰도(최소 3개의 판독 및 2개의 라이브러리) 및 모든(최소 1개의 판독 및 1개의 라이브러리) 상호작용에 대해 뚜렷한 피크 콜링 설정을 사용했습니다. 각 조건에 대해, 표적 RNA 상호작용이 코딩 서열(CDS), 5' 미번역 영역(5' UTR), 유전자간 영역, 인트론 또는 3' 미번역 영역(3'UTR)의 범주에 매핑된 총 검출된 miRNA:표적 RNA 상호작용의 카운트가 나열됩니다.

잠재적 오염 물질 다음으로 감지됨 원인 잠재적 해결책
프라이머 다이머 염기서열이 증폭 프라이머의 5' 말단과 일치하는 miRNA와 염기서열이 프라이머의 나머지 부분과 일치하는 표적 RNA 간의 상호 작용이 감지되었습니다. 증폭 후 PCR 산물의 부적절한 크기 분리(즉, 겔 추출). 대부분의 프라이머 이량체는 길이가 짧기 때문에 어댑터 제거 후 SCRAP에서 무시됩니다. 이러한 현상이 지속되면 필터에 프라이머 염기서열을 추가하는 것이 좋습니다.
rRNAs (rRNA) 임의의 miRNA와 알려진 rRNA 또는 lncRNA Gm26917 및 Gm42418 간의 상호 작용 Argonaute 복합체의 비효율적인 분리(즉, 면역침전 및 겔 분리). rRNA 여과는 rRNA 오염이 많을 때 종종 필요합니다.
tRNA 및 pre-miRNA 동일한 tRNA의 분해 산물인 tRNA 단편 또는 동일한 pre-miRNA에서 생산된 5p 및 3p miRNA 간의 상호 작용. 진정한 sncRNA:표적 RNA 키메라 또는 낮은 조직 Argonaute 발현의 존재가 적습니다. tRNA 필터링 및 pre-miRNA 필터링.

표 2: 잠재적 오염 물질 염기서열분석 판독 및 용액.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

sncRNA:target RNA 상호 작용 분석을 위한 SCRAP 파이프라인 사용에 대한 이 프로토콜은 전산 분석을 시작하는 연구자를 지원하기 위해 설계되었습니다. 이 튜토리얼을 완료하면 초급 이상의 계산 경험이 있는 연구자에게 이 파이프라인과 키메라 RNA 염기서열 분석 라이브러리에서 얻은 데이터를 분석하기 위한 애플리케이션의 설치 및 사용에 필요한 단계를 안내할 수 있을 것으로 예상됩니다. 이 프로토콜의 완료에 중요한 단계에는 올바른 참조 설치 및 SCRAP 실행이 포함되며, 이는 시간이 많이 소요될 수 있으며 특히 Anaconda를 사용하여 종속성을 설치하거나 명령줄 인수를 입력하는 동안 주의를 기울이지 않은 경우 오류의 원인이 될 수 있습니다.

여기서는 키메라 sncRNA:표적 RNA 염기서열분석 라이브러리 분석을 위한 SCRAP 파이프라인의 실제 사용을 위한 팁과 단계에 특히 중점을 두었습니다. SCRAP는 sncRNA:표적 RNA 상호 작용 검출에서 다른 키메라 RNA 분석 플랫폼을 능가하는 것으로 밝혀졌습니다 6,13. 이는 키메라 RNA의 형성과 관련된 생화학적 단계의 결과로 관찰되는 특징(예: 3' 숄더링)을 검출하기 위해 특별히 개발된 SCRAP의 피크 호출 기능 때문일 수 있습니다. 크로마틴 면역침전 염기서열분석(CHIP-seq) 애플리케이션의 다운스트림과 같은 별개의 생화학적 접근법을 위한 다른 피크 콜링 방법은 평균을 중심으로 대칭적으로 분포된 데이터의 피크를 검출하기 위해 개발되었으며 일반적으로 키메라 sncRNA:표적 RNA 라이브러리의 피크 기능을 검출하는 데 잘 수행되지 않습니다. 그러나 사용자는 특히 데이터가 이 설명에 맞지 않는 경우 요구 사항에 더 잘 맞을 수 있는 다른 계산 파이프라인의 사용을 테스트할 수 있습니다.

SCRAP에는 최소한의 하드웨어 요구 사항이 있지만 SCRAP 런타임은 데이터 세트 크기에 따라 제대로 확장되지 않습니다. 초보자 수준을 넘어섰거나 광범위한 수의 데이터 세트 또는 염기서열 분석 범위가 높은 데이터 세트를 보유한 연구자는 분석 단계를 가속화할 수 있는 방식으로 SCRAP을 사용할 수 있습니다. 대규모 데이터 세트(일반적으로 10억 회 읽기 >)에는 향상된 파일 스토리지 기능과 데이터 읽기/쓰기 속도가 필요하므로 대규모 데이터 세트를 분석하려면 HPC(고성능 컴퓨팅) 클러스터에서 SCRAP를 실행하는 것이 필요할 수 있습니다. 병렬화 및 향상된 성능을 제공해야 하는 SCRAP 최적화는 GitHub(https://github.com/Meffert-Lab/)에서 사용할 수 있습니다. 이 업데이트된 버전의 SCRAP(릴리스 2.0)에는 rRNA 및 기타 오염 물질에 대한 필터도 개선되었습니다.

다른 인터페이스와 마찬가지로 사용자는 명령줄 인터페이스를 사용할 때 필연적으로 어려움에 직면할 수 있습니다. 가장 일반적인 것은 맞춤법 오류, 잘못된 경로 및 패키지 설치/버전 관리입니다. 조사관은 명령줄 인수를 작성할 때 주의를 기울이고 오타를 피하고 파일 또는 폴더의 경로를 정확하게 재현하는 것이 좋습니다('탭' 자동 완성을 사용하면 도움이 될 수 있음). SCRAP에 대한 종속성은 Anaconda를 통해 관리되므로 조사자가 패키지 설치 또는 버전 업데이트와 관련된 문제가 발생할 가능성이 적습니다.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

저자는 공개할 것이 없습니다.

Acknowledgments

파이프라인의 설치 및 구현에 대한 중요한 피드백을 제공해 주신 BH Powell 및 WT Mills IV를 포함하여 유용한 토론을 해주신 Meffert 연구소 구성원에게 감사드립니다. 이 연구는 Braude Foundation 상, Maryland Stem Cell Research Fund Launch Program, Blaustein Endowment for Pain Research and Education 상, NINDS RO1NS103974 및 NIMH RO1MH129292 to M.K.M.의 지원을 받았습니다.

Materials

Name Company Catalog Number Comments
Genomes UCSC Genome browser N/A https://genome.ucsc.edu/ or https://www.ncbi.nlm.nih.gov/data-hub/genome/
Linux Linux Ubuntu 20.04 or 22.04 LTS recommended
Mac Apple Mac OSX (>11)
Platform setup GitHub N/A https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md]
SCRAP pipeline GitHub N/A https://github.com/Meffert-Lab/SCRAP
Unix shell Unix operating system bash >=5.0
Unix shell Unix operating system zsh (5.9 recommended)
Windows Windows WSL Ubuntu 20.04 or 22.04 LTS

DOWNLOAD MATERIALS LIST

References

  1. Morris, K. V., Mattick, J. S. The rise of regulatory RNA. Nature Reviews Genetics. 15 (6), 423-437 (2014).
  2. Li, X., Jin, D. S., Eadara, S., Caterina, M. J., Meffert, M. K. Regulation by noncoding RNAs of local translation, injury responses, and pain in the peripheral nervous system. Neurobiology of Pain (Cambridge, Mass.). 13, 100119 (2023).
  3. Shi, J., Zhou, T., Chen, Q. Exploring the expanding universe of small RNAs. Nature Cell Biology. 24 (4), 415-423 (2022).
  4. Broughton, J. P., Lovci, M. T., Huang, J. L., Yeo, G. W., Pasquinelli, A. E. Pairing beyond the seed supports microRNA targeting specificity. Molecular Cell. 64 (2), 320-333 (2016).
  5. Grosswendt, S., et al. Unambiguous identification of miRNA:target site interactions by different types of ligation reactions. Molecular Cell. 54 (6), 1042-1054 (2014).
  6. Mills, W. T., Eadara, S., Jaffe, A. E., Meffert, M. K. SCRAP: a bioinformatic pipeline for the analysis of small chimeric RNA-seq data. RNA. 29 (1), 1-17 (2023).
  7. Helwak, A., Kudla, G., Dudnakova, T., Tollervey, D. Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding. Cell. 153 (3), 654-665 (2013).
  8. Hoefert, J. E., Bjerke, G. A., Wang, D., Yi, R. The microRNA-200 family coordinately regulates cell adhesion and proliferation in hair morphogenesis. Journal of Cell Biology. 217 (6), 2185-2204 (2018).
  9. Moore, M. J., Zhang, C., Gantman, E. C., Mele, A., Darnell, J. C., Darnell, R. B. Mapping Argonaute and conventional RNA-binding protein interactions with RNA at single-nucleotide resolution using HITS-CLIP and CIMS analysis. Nature Protocols. 9 (2), 263-293 (2014).
  10. Bjerke, G. A., Yi, R. Integrated analysis of directly captured microRNA targets reveals the impact of microRNAs on mammalian transcriptome. RNA. 26 (3), 306-323 (2020).
  11. Reuter, J. S., Mathews, D. H. RNAstructure: software for RNA secondary structure prediction and analysis. BMC Bioinformatics. 11 (1), 129 (2010).
  12. Moore, M. J., et al. miRNA-target chimeras reveal miRNA 3′-end pairing as a major determinant of Argonaute target specificity. Nature Communications. 6 (1), 8864 (2015).
  13. Travis, A. J., Moody, J., Helwak, A., Tollervey, D., Kudla, G. Hyb: a bioinformatics pipeline for the analysis of CLASH (crosslinking, ligation and sequencing of hybrids) data. Methods (San Diego, Calif.). 65 (3), 263-273 (2014).

Tags

이번 달 JoVE 202호
Chimeric Small Noncoding RNA에 대한 전산 분석 튜토리얼: 표적 RNA 염기서열분석 라이브러리
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Eadara, S., Li, X., Eiss, E. A.,More

Eadara, S., Li, X., Eiss, E. A., Meffert, M. K. Computational Analysis Tutorial for Chimeric Small Noncoding RNA: Target RNA Sequencing Libraries. J. Vis. Exp. (202), e65779, doi:10.3791/65779 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter