RESEARCH
Peer reviewed scientific video journal
Video encyclopedia of advanced research methods
Visualizing science through experiment videos
EDUCATION
Video textbooks for undergraduate courses
Visual demonstrations of key scientific experiments
BUSINESS
Video textbooks for business education
OTHERS
Interactive video based quizzes for formative assessments
Products
RESEARCH
JoVE Journal
Peer reviewed scientific video journal
JoVE Encyclopedia of Experiments
Video encyclopedia of advanced research methods
EDUCATION
JoVE Core
Video textbooks for undergraduates
JoVE Science Education
Visual demonstrations of key scientific experiments
JoVE Lab Manual
Videos of experiments for undergraduate lab courses
BUSINESS
JoVE Business
Video textbooks for business education
Solutions
Language
ko_KR
Menu
Menu
Menu
Menu
DOI: 10.3791/55009-v
Blake L. Joyce1,2, Asher K. Haug-Baltzell3, Jonathan P. Hulvey4, Fiona McCarthy5, Upendra Kumar Devisetty1,6, Eric Lyons1,2,3
1BIO5 Institute,University of Arizona, 2The School of Plant Sciences,University of Arizona, 3Genetics GIDP,University of Arizona, 4Biology Department,University of Massachusetts Amherst, 5School of Animal and Comparative Biomedical Sciences,University of Arizona, 6CyVerse,University of Arizona
Please note that some of the translations on this page are AI generated. Click here for the English version.
이 프로토콜은 초보 생물정보학자를 위한 comparative de novo transcriptome assembly and annotation workflow를 간략하게 설명합니다. 워크플로우는 CyVerse를 통해 완전히 무료로 사용할 수 있으며 데이터 스토어로 연결됩니다. 명령줄 및 그래픽 사용자 인터페이스가 사용되지만 필요한 모든 코드를 복사하여 붙여넣을 수 있습니다.
이 절차의 전반적인 목표는 원시 FASTQ 파일에서 시작하여 De Novo 전사체학을 통해 차등 유전자 발현을 평가, 조합, 주석 작성 및 비교하는 것입니다. 이 방법은 어떤 전사체가 유기체 내부에 있는지, 이러한 전사체가 해당 유기체 내부에서 무엇을 하는지, 실험 조건 간의 차이점은 무엇인지 등을 포함하여 비교 생물학 및 분자 생물학의 질문에 답하는 데 도움이 될 수 있습니다. 이 기술의 주요 장점은 대화형 환경을 제공한다는 것입니다.
온디맨드 컴퓨팅 리소스를 제공하며 연구원이 RNA-Seq 데이터를 즉시 분석할 수 있도록 합니다. 이 방법은 생물학적 시스템이 어떻게 변화하는지 이해하기 위해 여러 조직, 조건, 시점을 포함하는 단일 유기체 내의 실험을 비교하는 연구자에게 특히 유용합니다. 이 방법은 게놈이 없는 비모델 유기체에 초점을 맞추고 있지만, 게놈 어셈블리를 사용할 수 있는 유기체, 심지어 어셈블리에 수만 또는 수십만 개의 골격이 있는 유기체에도 적용할 수 있습니다.
시작하려면 Discovery Environment에서 Atmosphere에 액세스합니다. 등록 페이지로 이동하여 무료 CyVerse 계정을 요청하세요. 기관 이메일을 사용하여 계정에 등록합니다.
그런 다음 앱 및 서비스 탭으로 이동하여 Atmosphere에 대한 액세스를 요청합니다. 검색 환경에 대한 액세스 권한이 자동으로 부여됩니다. DE로 축약된 Discovery Environment에 로그인합니다. 그런 다음 데이터 탭을 선택하여 데이터 저장소의 모든 폴더를 포함하는 메뉴를 표시합니다.
프로젝트와 연결된 모든 데이터를 저장할 주 프로젝트 폴더를 만듭니다. 데이터 창 맨 위에 있는 도구 모음을 찾아 파일, 새 폴더를 선택합니다. 폴더 이름 또는 입력 출력 파일 이름에 공백이나 특수 문자를 사용하지 마십시오.
대신 적절한 경우 밑줄이나 대시를 사용합니다. 원시 FASTQ 시퀀스 파일과 폴더 1_Raw_Sequence를 Folder A_Raw_Reads이라는 하위 폴더에 업로드합니다. 2기가비트 미만의 파일의 경우 데이터 저장소의 단순 업로드 기능을 사용하여 기본 DE 데스크톱에서 데이터 단추를 클릭하여 데이터 창 도구 모음으로 이동합니다.
업로드, 데스크톱에서 단순 업로드를 선택합니다. 그런 다음 찾아보기 단추를 선택하여 로컬 컴퓨터의 원시 FASTQ 시퀀싱 파일로 이동합니다. DE에서 FastQC 앱을 사용하여 업로드된 원시 시퀀싱 읽기를 평가합니다. 기본 DE 데스크톱에서 앱 단추를 선택하여 DE에서 사용할 수 있는 모든 분석 앱이 포함된 창을 엽니다. 창 맨 위에 있는 검색 도구 모음에서 FastQC 도구에 대한 창을 검색합니다.
FASTQ 파일이 두 개 이상 있는 경우 다중 파일 버전을 엽니다. 파일을 선택하고 새 폴더를 만든 다음 이 폴더를 출력 폴더로 선택합니다. FASTQ 읽기 파일을 입력 데이터 선택이라는 도구 창에 로드하고 분석 시작을 선택합니다.
DE에서 프로그래밍 가능한 Trimmomatic 앱을 검색하여 엽니다. 원시 FASTQ 읽기 파일의 폴더를 설정 섹션에 업로드합니다. 시퀀싱 파일이 단일 엔드인지 쌍 엔드인지 선택합니다.
찾아보기 단추를 선택하고 파일 경로를 보기 상자에 붙여 넣어 제공된 표준 제어 파일을 사용합니다. Trimmomatic 제어 파일을 선택하고 해석을 시작합니다. 품질 트리밍 시퀀스 읽기를 보려면 DE에서 Sickle 앱을 검색하여 엽니다. 트리밍된 FASTQ 읽기를 입력 읽기로 선택하고 출력 파일의 이름을 바꿉니다.
옵션에 품질 설정을 포함합니다. wiki 페이지로 이동하여 최신 버전의 Atmosphere 인스턴스를 엽니다. Trinity and Trinotate 이미지의 최신 버전에 대한 링크를 선택합니다.
Login To Launch 버튼을 선택한 다음 Atmosphere 인스턴스의 이름을 지정합니다. 인스턴스 크기를 medium3 또는 large3 중에서 선택합니다. 인스턴스를 시작하고 빌드될 때까지 기다립니다.
애트머스피어 이미지가 스핀업되지 않는 경우 더 작은 인스턴스를 신청하거나 더 큰 할당을 위해 Jetstream에 신청할 수 있습니다. 모든 세부 사항은 컴패니언 위키에 있습니다. Trinity 출력 파일을 DE의 폴더 3_Assembly로 이동하고 폴더에 A_Trinity_de_novo_assembly 레이블을 지정합니다.
Trinity를 실행하려면 명령줄 지식이 필요하며 대규모 분석을 완료하는 데 며칠 또는 몇 주가 걸릴 수 있습니다. 명령줄을 이해하는 데 도움이 되도록 Wiki에 링크된 무료 리소스가 있습니다. 조립된 각 전사체에 A_Trinity_de_novo_assembly 폴더 내의 하위 폴더를 제공합니다.
각 전사체와 관련된 유기체 및 치료법의 학명을 포함한 고유한 이름을 사용한 다음 3_Assembly 폴더에 Folder B_rnaQUAT_Output라는 다른 하위 폴더를 만듭니다. De Novo rnaQUAST라는 앱을 엽니다. 분석의 이름을 지정하고 폴더 B_rnaQUAST_Output를 출력 폴더로 선택합니다.
Discovery Environment에서 De Novo Trinity Assembly 출력 fasta 파일에서 transcript decoder를 검색하고 transdecoder를 실행합니다. 분석 DE.Name 에서 deseq2 앱을 열고 출력 폴더를 4_Differential_Expresssion로 선택합니다. Input 섹션에서 Trinity Assembly 실행의 counts 테이블 파일을 선택합니다.
또한 contig 이름을 찾을 수 있는 열을 선택합니다. counts 데이터 테이블 파일의 열 머리글을 입력하여 비교할 열을 확인합니다. 각 조건 사이에 쉼표를 포함합니다.
contig 이름이 포함된 첫 번째 열 머리글을 포함하지 마십시오. 반복실험의 경우 동일한 이름을 반복합니다. 두 번째 줄에서 비교할 두 조건의 이름을 제공합니다.
첫 번째 줄에 제공된 열 머리글 이름을 찾습니다. 여기에 표시된 것은 각 전처리 단계 이후의 염기서열분석 판독에 대한 체계적인 비교입니다. 트리밍 후 읽기는 기울어진 GC 콘텐츠와 시퀀스 콘텐츠를 덜 가져야 하며 품질 점수가 높은 읽기에 대한 비율이 더 커야 합니다.
De Novo 전사체를 조립하려면 고품질 판독이 필요합니다. 빠른 QC의 결과는 염기서열 분석되는 유기체와 샘플에 따라 다릅니다. 다운스트림에서 비교될 모든 샘플의 균일성을 기준으로 하는 것이 사전 처리 판독의 주요 목표입니다.
rnaQUAST는 부스트 코드를 활용하여 분류학적 clades에서 알려진 핵심 유전자를 기반으로 어셈블리에 대한 요약 통계를 생성합니다. 어셈블러의 정확도는 전사체당 불일치 수와 표준 유전자와 일치하는 전사체 수에 의해 드러납니다. 여기에 제시된 마지막 4개의 하위 플롯은 contig 및 isoform length에 대한 요약 통계량과 예상되는 isoform의 적용 범위를 제공합니다.
NAx는 y축의 길이보다 길이가 긴 contigs의 백분율을 나타냅니다. 조립된 분획은 가장 긴 단일 조립 전사체를 길이로 나눈 값입니다. 여기서 covered fraction은 BUSCO의 핵심 원핵 또는 진핵 유전자에 의해 예상되는 완전히 조립된 전사체의 동형의 백분율입니다.
이 동영상을 시청한 후에는 전사체를 조립하고 입력하는 방법을 잘 이해하게 될 것입니다. 또한 이 프로토콜을 사용하면 두 조건 간의 차등 유전자 발현을 검출할 수 있습니다. 일반적으로 개인은 생물 정보 패키지가 너무 많고 이와 관련된 설정 및 변수가 많기 때문에 어려움을 겪으며 일반적으로 실제로 실행하려면 명령줄에 대한 지식이 있어야 합니다.
다른 연구자들이 수행된 작업을 이해할 수 있도록 데이터 입력 및 분석 출력에 레이블을 지정하고 구성하는 것이 중요합니다. 완료된 주문 단계, 프로그램 버전 및 샘플 정보를 포함해야 합니다. 또한 폴더 또는 파일 이름의 공백을 생략합니다.
새로운 도구와 새 버전의 도구가 지속적으로 통합되고 있지만 이전 버전의 도구도 유지되고 있습니다. 모든 변경 사항은 컴패니언 위키에 기록됩니다. 이 절차에 따라 네트워크 분석, GO 농축 및 대사 경로 식별과 같은 다른 생물정보학 방법을 수행하여 표현형 변이, 발현 프로파일을 변경하는 조건, 기능 유전체학에 대한 관심 유전자 식별과 같은 질문에 답할 수 있습니다.
Related Videos
12:10
Related Videos
13.9K Views
10:19
Related Videos
18.1K Views
09:35
Related Videos
18.3K Views
09:40
Related Videos
9.2K Views
12:14
Related Videos
5.9K Views
06:41
Related Videos
14.4K Views
14:58
Related Videos
4.8K Views
06:40
Related Videos
1.8K Views
10:22
Related Videos
565 Views
03:08
Related Videos
1K Views