Method Article

R을 사용한 MiRNA-Seq 데이터 처리 및 생물정보학 분석을 위한 검증된 워크플로

DOI:

10.3791/68760

October 24th, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

여기에서는 R을 사용하여 miRNA-Seq 데이터를 분석하는 프로토콜을 제시합니다. 이 워크플로를 통해 연구자는 miRNA 조절 네트워크와 다양한 생물학적 및 임상 질문에서 miRNA의 중요성을 탐색할 수 있습니다. 이 연구는 miRNA 생물정보학 분야의 초보자와 숙련된 연구자 모두를 위한 실용적인 가이드 역할을 하고자 합니다.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

MicroRNA(miRNA)는 광범위한 생리학적 및 병리학적 과정에 영향을 미치는 중요한 전사 후 조절자입니다. 고처리량 시퀀싱 기술의 발전으로 miRNA-Seq은 miRNA 발현 패턴을 프로파일링하기 위한 강력한 도구로 부상했습니다. 그러나 이러한 데이터를 안정적으로 해석하려면 표준화되고 재현 가능한 분석 파이프라인이 필요합니다. 여기에서는 R을 사용한 miRNA-Seq 데이터 처리 및 생물정보학 분석을 위한 검증된 워크플로를 제시합니다. 이 프로토콜에는 원시 데이터 전처리, 품질 관리, 정렬, 정량화, 정규화, 차등 발현 분석, 표적 예측, 기능 강화 및 규제 네트워크 구축을 포함한 모든 필수 단계가 포함됩니다. 유연성과 투명성을 위해 설계된 이 워크플로는 널리 채택된 R 패키지를 통합하고 종별 주석 및 모듈식 사용자 정의를 지원합니다. 또한 사용자는 선별된 데이터베이스와 Cytoscape와 같은 시각화 도구를 활용하여 다운스트림 생물학적 해석을 수행하도록 안내됩니다. 이 프로토콜은 강력한 통계 분석을 지원할 뿐만 아니라 miRNA-mRNA 상호 작용과 질병 메커니즘에서의 역할에 대한 의미 있는 통찰력을 제공합니다. 특히 miRNA 바이오마커 발견, 질병 모델링 또는 통합 다중 오믹스 연구를 수행하는 초보자와 숙련된 연구자 모두에게 적합합니다.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

MicroRNA(miRNA)는 전사 후1단계에서 작용하여 유전자 발현에 상당한 영향을 미치는 짧은 비암호화 RNA 분자입니다. 이들은 일반적으로 표적 메신저 RNA(mRNA)의 3' 비번역 영역(UTR)에 있는 상보적 서열에 결합하여 mRNA 분해 또는 번역 억제를 유발함으로써 기능합니다1. 지난 20년 동안 miRNA는 세포 증식, 분화, 세포사멸, 면역 반응 및 장기 발달을 포함한 다양한 생물학적 과정의 중심 조절자로 점점 더 인식되고 있습니다2. 더욱이, miRNA 발현의 조절 장애는 암, 심혈관 질환, 신경 장애 및 신장 질환과 같은 수많은 질병의 발병기전과 관련이 있습니다3. 이러한 발견은 치료 표적일 뿐만 아니라 임상 진단에서 최소 침습 바이오마커로서도 miRNA의 잠재력을 강조합니다.

차세대 염기서열 분석(NGS) 기술의 출현으로 miRNA 연구는 새로운 시대로 접어들었습니다. 알려진 miRNA로 제한되는 마이크로어레이 기반 방법과 달리 miRNA 시퀀싱(miRNA-Seq)은 다양한 샘플 유형 및 조건....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

참고: 소프트웨어 링크가 있는 재료는 재료 표에 나열되어 있습니다.

1. RNA 샘플 및 서열 라이브러리 준비

참고: 이 계산 워크플로 외부에서 RNA 추출 및 시퀀싱을 수행합니다. miRNA 시퀀싱 데이터를 분석하는 방법은 여러 가지가 있습니다. 이 섹션에서는 하나의 실용적인 맥락을 제공합니다.

  1. 총 RNA 추출: 작은 RNA 분리에 최적화된 키트(예: miRNA 분리 키트)를 사용하여 생물학적 샘플에서 총 RNA를 추출합니다. 제조업체의 프로토콜을 주의 깊게 따르십시오. RNase가 없는 소모품을 사용하고 분해를 최소화하기 위해 샘플을 얼음 위에 보관하십시오.
  2. RNA 무결성 및 양 평가: 추출된 RNA 1-2 μL를 Bioanalyzer 또는 동등한 장치에서 실행합니다. 신뢰할 수 있는 시퀀싱을 위해 RNA 무결성 번호(RIN)를 확인하고 ≥ 7.0인지 확인하십시오. 분광 광도계 또는 형광계를 사용하여 농도를 기록합니다.
  3. 소형 RNA 라이브러리 구성: 상용 소형 RNA-seq 라이브러리 준비 키트를 사용하여 총 RN....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

GSE133530에서 microRNA 발현 매트릭스를 다운로드하여 직접 차등 발현 분석을 수행했습니다. 보충 파일 1의 데이터 세트에 대한 예제 분석 R 스크립트를 제공했습니다. 데이터 세트는 크기가 다른 16개의 신장 낭종(최소 낭종: 1-5mL 미만, n = 10, 중간 낭종: 10-25mL 사이, n = 4, 큰 낭종: 50mL 이상, n = 4) 및 최소 낭성 조직(MCT, n = 7, 1회 복제 포함) 4개의 PKD1 다낭성 신장에서. 또한, 고립된 신세포암으로 진단된 3개의 신장절제술 표본에서 악성 종양이 없는 신장 피질 조직을 얻었고 정상 대조군(n = 4)으로 사용되었습니다. 가장 명백하게 변화된 miRNA를 찾기 위해 소형, 중형 및 대형 낭종의 샘플과 정상 대조군 조직을 비교했습니다. 그림 1A 에서 볼 수 있듯이, ADPKD 샘플로부터의 miRNA 발현 패턴은 대조군 .......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

miRNA-Seq 데이터 분석은 판독의 작은 크기와 중복성으로 인해 뚜렷한 문제를 안고 엄격한 품질 관리 및 전처리가 중요합니다. 워크플로에서 가장 중요한 단계 중 하나는 어댑터 트리밍입니다. miRNA의 길이는 약 22개의 뉴클레오티드이기 때문에 어댑터 서열은 적절하게 제거되지 않으면 쉽게 판독을 지배할 수 있습니다. 정확한 트리밍을 수행하지 않으면 오탐 판독값이 정렬되지 않고 팽창될 수 있습니다. 마찬가지로, 매핑 정확도를 손상시킬 수 있는 낮은 품질의 베이스를 제거하기 위해 정렬 전에 품질 필터링을 구현해야 합니다. 매핑과 정량화는 또 다른 필수 단계를 나타냅니다. 판독이 종종 엑손에 걸쳐 있는 표준 mRNA-Seq 데이터와 달리 miRNA 판독은 콤팩트하며 알려진 miRNA 유전자좌에 완벽하게 정렬되어야 합니다. 엄격한 매개변수와 함께 Bowtie를 사용하면 특히 miRBase와 같은 데이터베이스에서 성숙한 miRNA 서열에 매핑할 때 정확한 정렬이 보장됩니다........

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

저자는 경쟁 이해관계가 없음을 선언합니다.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

우리는 이 프로젝트를 지원하는 자금 지원 기관과 협력자에게 감사를 표합니다. 상하이 과학 기술 혁신 실행 계획(22Y11905500, 24142201800), PLA 해군 제905호 병원 기관 프로젝트(2024Q021), 창닝구 보건위원회 청소년 연구 프로젝트(2024QN29) 및 해군 의과대학 연구 프로젝트(2024QN040).

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Agilent-021827 인간 miRNA 마이크로어레이애질런트/인간 샘플의 마이크로RNA 프로파일링을 위한 상용 어레이
나비넥타이존스 홉킨스 대학교http://bowtie-bio.sourceforge.net/index.shtml시퀀싱 판독을 긴 참조 서열에 정렬하기 위한 소프트웨어 도구
clusterProfiler(R 패키지)생체전도체https://bioconductor.org/packages/clusterProfiler/고처리량 생물학적 데이터의 기능 강화 분석 및 시각화를 위해 설계된 R 패키지입니다.
컷어댑트오픈 소스https://cutadapt.readthedocs.io처리량이 높은 시퀀싱 판독에서 어댑터 서열, 프라이머, 폴리-A 테일 및 기타 원치 않는 단편을 제거하는 명령줄 도구입니다.
사이토스케이프사이토스케이프 컨소시엄https://cytoscape.org/복잡한 생물학적 네트워크의 시각화 및 분석을 위해 설계된 오픈 소스 소프트웨어 플랫폼입니다.
DESeq2(R 패키지)생체전도체https://bioconductor.org/packages/DESeq2/카운트 데이터의 차등 유전자 발현 분석을 위해 설계된 R 패키지
EnhancedVolcano(R 패키지)생체전도체https://bioconductor.org/packages/EnhancedVolcano/  출판 품질의 화산 플롯을 생성하도록 설계된 R 패키지입니다.
패스트QC바브라함 생물정보학https://www.bioinformatics.babraham.ac.uk/projects/fastqc/처리량이 많은 시퀀싱 데이터를 위한 오픈 소스 품질 관리 도구입니다.
featureCounts (기능 개수)서브리드 / SourceForgehttp://subread.sourceforge.net/게놈 특징에 매핑된 판독값을 계산하는 데 사용되는 프로그램
HTSeq 수Python 패키지https://htseq.readthedocs.io정렬된 고처리량 시퀀싱 판독 값이 유전자 또는 엑손과 같은 게놈 특징과 겹치는 수를 계산하는 명령줄 도구입니다. 나는
Illumina Human v2 MicroRNA 발현 비드칩일루미나 /인간 샘플의 마이크로RNA 프로파일링을 위한 상용 어레이
multiMiR(R 패키지)생체전도체https://bioconductor.org/packages/multiMiR/예측되고 실험적으로 검증된 microRNA&ndash의 가장 큰 통합 컬렉션을 제공하는 R 패키지; 질병 및 약물과의 연관성과 함께 상호 작용을 표적으로 삼습니다.
조직. Hs.eg.db(R 패키지)생체전도체https://bioconductor.org/packages/org.Hs.eg.db/인간(호모 사피엔스) 유전체학 연구를 위해 설계된 주석 패키지입니다.
R 소프트웨어R 프로젝트https://www.r-project.org/통계 컴퓨팅을 위한 오픈 소스 프로젝트
Rstudio (리스튜디오)포지트 PBC/통합 개발 환경은 R 및 Python의 생산성을 높이는 데 도움이 됩니다.
샘툴오픈 소스http://www.htslib.org/차세대 염기서열 분석(NGS) 데이터를 조작하기 위한 소프트웨어 패키지입니다.

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Hsu, P. W., et al. miRNAMap: genomic maps of microRNA genes and their target genes in mammalian genomes. Nucleic Acids Res. 34 (Database issue), D135-D139 (2006).
  2. Fragiadaki, M. Lessons from....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

MiRNA SeqMiRNA ExpressionData ProcessingBioinformatics AnalysisDifferential ExpressionTarget PredictionFunctional EnrichmentRegulatory NetworkR PackagesCytoscape Visualization

Related Articles