Method Article

대량 RNA-seq 데이터를 기반으로 한 전사체 분석

DOI:

10.3791/69611

January 16th, 2026

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

본 프로토콜은 원시 데이터에서 기능 풍부 분석까지 대량 RNA-seq 과정을 분석하는 완전한 파이프라인을 구축합니다.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

비알코올성 지방간(NAFL)은 일반적으로 양성 질환으로 간주됩니다; 그러나 비알코올성 지방간염(NASH)으로 진행되면 환자들은 말기 간 질환 발병 위험이 유저히 증가합니다. 많은 연구들이 NAFL에서 NASH로의 전환 기전을 밝히려는 시도를 하고 있습니다. 고처리량 시퀀싱 기술(예: 대량 RNA-seq)은 전사체를 분석하여 분자의 발현, 신호 전달 경로의 활성화 및 질병 진행과 관련된 기타 요인을 밝혀내어 연구자들에게 더 깊은 이해를 제공했습니다. 연구자들이 질병 치료의 잠재적 표적을 식별하기 위해 분석할 수 있는 풍부한 오픈 소스 데이터가 있습니다. 그러나 관련 연구는 전사체의 상류 분석을 위한 효율적이고 신뢰할 수 있는 프로세스의 부재로 인해 제한을 받고 있습니다. 여기서는 고도로 재현 가능하고 사용자 친화적인 상류 분석과 관련된 차별 유전자 분석 파이프라인을 제공하여 사적 또는 공공 데이터의 표준화된 처리와 심층 파싱을 달성합니다. 파이프라인은 네 단계로 나뉩니다: (1) 데이터의 품질 관리; (2) 유전자 지도 작성; (3) 차별 유전자 분석; 그리고 (4) 함수해석학. 이 과정은 질병 변형의 분자 메커니즘을 밝히고, Bulk RNA-seq 데이터를 분석하여 잠재적 약물 표적과 치료 접근법을 선별하는 데 연구자들을 지원하는 것을 목표로 합니다.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

비알코올성 지방간 질환(NAFLD)은 전 세계적으로 가장 흔한 만성 간 질환으로, 인구의 4분의 1 이상에게 영향을 미칩니다. 최근 수십 년간 발생률이 급격히 증가했습니다1, 2, 3. 특히 더 진행된 형태인 비알코올성 지방간염(NASH)이 증가하는 질병 부담은 전 세계적으로 큰 보건 도전이자 무거운 경제적 부담을 안겨줍니다. NAFLD의 1단계는 비알코올성 지방간(NAFL)으로, 염증과 섬유화를 동반하여 NASH로 진행될 수 있습니다. 후자는 간경변증과 간세포암(HCC)을 포함한 말기 간 질환으로의 진행 위험을 크게 높입니다5,6,7. HCC 발생률과 사망률은NASH 8,9 증가와 연관되어 있으며, 2030년까지 NAFLD/NASH가 간 이식의 주요 적응....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

시연 목적으로, Lan Bai 등이 생성한 공개 데이터셋 PRJNA1023502 상류 및 하류 분석의 각 단계를 설명하는 데 사용되었습니다. 이 데이터셋은 오픈 액세스 NCBI SRA 데이터베이스에서 유래하므로 추가적인 권한이나 윤리적 승인이 필요하지 않습니다. 필요한 모든 소프트웨어 및 R-패키지 버전을 확인하려면 재료표 를 참조하세요. 공개된 데이터셋은 6개의 비-NASH, 6개의 NAFL, 6개의 NASH 간 RNA-seq 샘플로 구성PRJNA1023502. 이 프로토콜에서는 SRA 데이터베이스에서 데이터 검색, 품질 관리(fastp), 정렬(HISAT2), 정량화(featureCounts), 그리고 하위 차별 발현 및 기능 풍부 분석 등 대량 RNA-seq 워크플로우의 모든 단계를 시연하는 데 사용되었습니다.

1. SRA 툴킷 설치

  1. SRA 툴킷 공식 웹사이트를 방문하여 버전 3.2.1을 다운로드하세요.

2. 공개 데이터 다운로드

  1. SRA 번호....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

벌크 RNA-seq의 상류 분석 워크플로우는 그림 1A에 나와 있습니다. 이 워크플로우는 리눅스 플랫폼에서 다음 주요 단계를 순차적으로 실행합니다: 첫째, fastp를 사용해 저품질 읽기와 어댑터 시퀀스를 제거하기 위해 원시 시퀀싱 데이터의 엄격한 품질 관리를 수행합니다; 이후 HISAT2는 고품질 리드를 참조 게놈에 정렬하며, Samtools가 정렬 파일을 변환하고 정렬합니다; 마지막으로, FeatureCounts는 유전자 수준 정량화를 수행하여 유전자 발현 매트릭스를 생성하여 후속 분석에 고품질 입력을 제공합니다. 이후 처리 및 통계 분석은 R 환경 내에서 수행되며, 관련 워크플로우와 필요한 소프트웨어 패키지는 그림 1B에 나와 있습니다. 분석을 위해 발표된 연구에서 6개의 비-NASH, 6개의 NAFL, 6개의 NASH 샘플로 구성되었습니다

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

대량 RNA-seq 데이터 분석은 유전체학, 생물정보학, 통계학, 컴퓨터 과학을 통합하는 학제간 작업으로 특징지어집니다. 완전한 분석 워크플로우는 원시 데이터 전처리, 품질 관리, 서열 정렬, 유전자 수준 정량화, 데이터 정규화, 차별 발현 분석, 생물학적 해석 등 여러 상류 및 하류 단계를 포함합니다. 이 중 원시 시퀀싱 리드를 고품질 유전자 발현 매트릭스로 정확히 변환하는 것이 특히 중요한데, 이는 상류 처리 과정에서 발생하는 오류가 모든 하위 생물학적 결론으로 전파될 수 있기 때문입니다. 따라서 투명하고 표준화된 상류 분석 워크플로우를 구축하는 것은 전사체 연구의 재현성을 높이기 위해 필수적입니다.

이 프로토콜은 fastp(읽기 트리밍 및 품질 관리용), HISAT2(스플라이스 인식 정렬용), featureCounts(유전자 수준 정량화용) 등 널리 사용되는 도구를 통합한 간소화되고 완전한 스크립트 기반 워크플로우.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

저자들은 이해 상충이 없다고 선언한다.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

저자들은 이 연구에 사용된 공개 데이터베이스의 관리자들에게 감사의 뜻을 전합니다.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
바이오마르트생체도체2.64.0Ensembl의 유전자 주석
clusterProfiler생체도체4.16.0기능 풍부 분석
DESeq2생체도체1.48.1차별표현 분석
팩토마인R아그로파리테크2.11.0PCA 및 다변량 분석
Fastp오픈진1.0.1FASTQ 데이터의 품질 관리 및 필터링
특징 수(FeatureCounts)월터 앤 엘리자 홀 의학연구소 생물정보학 부서2.0.0그리고 nbsp; 유전자 발현 정량화를 위해 각 유전자에 매핑된 리드 수를 세세요
GGPLOT2가설3.5.2데이터 시각화
그레펠카밀 슬로비코프스키0.9.6겹치지 않는 텍스트 라벨
그리지스클라우스 O. 윌케0.5.6능선 구역 만들기
HISAT2존스 홉킨스 대학교2.2.1필터링된 고품질 리드를 기준 게놈과 정렬하세요
RR 코어 팀 4.5.0데이터 계산, 분석 및 시각화를 위한 환경
콜러브루어에리히 노이비르트1.1.3플롯을 위한 색상 팔레트
샘툴대규모 유전체학 작업 흐름1.22.0효율적인 검색 및 접근을 위해 SAM 파일을 변환하고 처리합니다
SRA 툴킷국립 생명공학 정보 센터3.2.1NCBI SRA 데이터베이스에서 원시 시퀀싱 데이터를 획득하고 전처리합니다

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Asrani, S. K., Devarbhavi, H., Eaton, J., Kamath, P. S. Burden of liver diseases in the world. J Hepatol. 70 (1), 151-171 (2019).
  2. Friedman, S. L., Neuschwander-Tetri, B. A., Rinella, M., Sanyal, A. J. Mechanisms of NAFLD development and therapeutic strategies. Nat Med. 24 (7), 908-922 (2018).
  3. <....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Bulk RNA SeqTranscriptomic AnalysisDifferential Gene AnalysisFunctional AnalysisQuality ControlGene MappingNonalcoholic Fatty LiverSteatohepatitis ProgressionMolecular MechanismsDisease Biomarkers

Related Articles