Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

미르머신: 식물 miRNA 주석을 위한 원스톱 상점

Published: May 1, 2021 doi: 10.3791/62430

Summary

여기에서는 1) 알려진 miRNA와 새로운 miRNA를 보다 정확하게 식별할 수 있고 2) 완전히 자동화되어 자유롭게 사용할 수 있는 새롭고 완전히 자동화된 miRNA 파이프라인인 mirMachine을 제시합니다. 이제 사용자는 간단한 제출 스크립트를 실행하여 완전히 자동화된 mirMachine 파이프라인을 실행할 수 있습니다.

Abstract

다양한 유형의 비암호화 RNA 중에서 마이크로RNA(miRNA)는 틀림없이 지난 10년 동안 주목을 받아 왔습니다. 유전자 발현의 전사 후 조절자로서 miRNA는 가뭄 및 질병과 같은 생물학적 스트레스에 대한 발달 및 반응을 포함하여 다양한 세포 경로에서 중요한 역할을 합니다. 고품질 참조 게놈 서열을 보유하면 miRNA 서열이 고도로 보존되는 여러 식물 종에서 miRNA를 식별하고 주석을 달 수 있습니다. 전산 miRNA 식별 및 주석 프로세스는 대부분 오류가 발생하기 쉬운 프로세스이므로 상동성 기반 예측은 예측 정확도를 높입니다. 우리는 지난 10년 동안 miRNA 주석 파이프라인인 SUmir를 개발하고 개선했으며, 그 이후로 여러 식물 게놈에 사용되었습니다.

본 연구는 (i) 2차 구조 예측에 대한 추가 필터링 단계를 추가하고, (ii) 완전 자동화하고, (iii) 이전 파이프라인을 사용하여 작은 RNA 시퀀싱 판독을 기반으로 하는 상동성 또는 새로운 miRNA를 기반으로 알려진 miRNA를 예측하는 새로운 옵션을 도입함으로써 완전 자동화된 새로운 miRNA 파이프라인인 mirMachine (miRNA Machine)을 제시합니다. 새로운 miRNA 파이프라인인 mirMachine은 애기장대 정보 리소스, TAIR10, 애기장대 게놈 방출 및 국제 밀 게놈 시퀀싱 컨소시엄(IWGSC) 밀 참조 게놈 v2를 사용하여 테스트되었습니다.

Introduction

차세대 염기서열분석 기술의 발전으로 RNA 구조와 조절 요소에 대한 이해가 넓어졌으며 기능적으로 중요한 비코딩 RNA(ncRNA)가 밝혀졌습니다. 다양한 유형의 ncRNA 중에서 마이크로 RNA (miRNA)는 식물 1,2에서 길이가 19에서 24 뉴클레오티드 사이 인 작은 RNA의 기본 조절 클래스를 구성합니다. 선충류에서 최초의 miRNA가 발견 된 이후 Caenorhabditis elegans3, miRNA의 존재와 기능은 동물 및 식물 게놈에서도 광범위하게 연구되었습니다 4,5,6. miRNA는 절단 또는 번역 억제를 위해 mRNA를 표적으로 하여 기능합니다7. 축적된 증거는 또한 miRNA가 성장 및 발달8, 자가 생물 발생9 및 여러 생물학적 및 비생물적 스트레스 반응10을 포함하여 식물의 광범위한 생물학적 과정에 관여한다는 것을 보여주었습니다.

식물에서 miRNA는 처음에 pri-miRNA11이라고 하는 긴 1차 전사체에서 처리됩니다. 핵 내부의 RNA 중합효소 II에 의해 생성된 이들 pri-miRNA는 불완전한 폴드백 구조(12)를 형성하는 긴 전사체이다. pri-miRNA는 나중에 pre-miRNA11이라고 하는 miRNA의 내인성 단일 가닥(ss) 헤어핀 전구체를 생성하기 위해 절단 과정을 거칩니다. pre-miRNA는 단일 가닥이 이중 가닥 구조로 접혀 miRNA 듀플렉스(miRNA/miRNA*)13를 절제하는 헤어핀 유사 구조를 형성합니다. 다이서 유사 단백질은 miRNA/miRNA* 듀플렉스의 두 가닥을 절단하여 2-뉴클레오티드 3'-오버행14,15를 남깁니다. miRNA 듀플렉스는 핵 내부에서 메틸화되어 miRNA의 3'-말단을 분해 및 우리딜화 활성으로부터 보호합니다16,17. 헬리카제는 수출 후 메틸화된 miRNA 이중체를 풀고 성숙한 miRNA를 세포질18의 RNA 유도 침묵 복합체(RISC)에 노출시킵니다. 듀플렉스의 한 가닥은 RISC에 통합된 성숙한 miRNA인 반면 다른 가닥인 miRNA*는 분해됩니다. miRNA-RISC 복합체는 표적 서열에 결합하여 완전 상보성의 경우 mRNA 분해 또는 부분 상보성의 경우 번역 억제를 유도한다13.

발현 및 생물발생 특징에 기초하여, miRNA 주석에 대한 가이드라인이15,19에 기재되었다. 정의된 가이드라인에 따라 Lucas와 Budak은 식물9에서 상동성 기반 인실리코 miRNA 식별을 수행하기 위해 SUmir 파이프라인을 개발했습니다. SUmir 파이프라인은 SUmirFind 및 SUmirFold라는 두 개의 스크립트로 구성되었습니다. SUmirFind는 2개 이하의 불일치가 있는 히트를 포함하고 더 짧은 히트(blastn-short-unapped -penalty -1 -reward 1)에 대한 편향을 피하기 위해 수정된 매개변수를 사용하여 NCBI(National Center for Biotechnology Information) 기본 로컬 정렬 검색 도구(BLAST) 스크리닝을 통해 알려진 miRNA 데이터 세트에 대해 유사성 검색을 수행합니다. SUmirFold는 UNAfold21을 사용하여 BLAST20 결과로부터 추정되는 miRNA 서열의 2차 구조를 평가합니다. SUmirFold는 헤어핀 구조의 특성을 식별하여 miRNA를 작은 간섭 RNA와 구별합니다. 또한, 매개 변수, 최소 배 에너지 지수 > 0.67 및 GC 함량 24-71 %에 의해 miRNA를 tRNA 및 rRNA와 같은 다른 ssRNA와 구별합니다. 이 파이프라인은 (i) 민감도 증가, (ii) 주석 정확도 증가, 및 (iii) 예측된 miRNA 유전자(22)의 게놈 분포를 제공하기 위한 2개의 추가 단계를 추가함으로써 최근에 업데이트되었다. 식물 miRNA 서열23의 높은 보존성을 감안할 때, 이 파이프라인은 원래 상동성 기반 miRNA 예측을 위해 설계되었습니다. 그러나 새로운 miRNA는 밀접하게 관련된 종 간의 miRNA의 서열 보존에 크게 의존했기 때문에 이 생물정보학 분석으로 정확하게 식별할 수 없었습니다.

이 논문은 1) 알려진 miRNA와 새로운 miRNA를 보다 정확하게 식별할 수 있고(예를 들어, 파이프라인은 이제 sRNA-seq 기반 새로운 miRNA 예측 및 상동성 기반 miRNA 식별을 사용함) 2) 완전히 자동화되고 자유롭게 사용할 수 있는 새롭고 완전히 자동화된 miRNA 파이프라인인 mirMachine을 제시합니다. 출력에는 예측된 miRNA의 게놈 분포도 포함되었습니다. mirMachine은 밀 및 애기장대 게놈에서 상동성 기반 및 sRNA-seq 기반 예측 모두에 대해 테스트되었습니다. 처음에는 자유 소프트웨어로 출시되었지만 UNAfold는 지난 10년 동안 상용 소프트웨어가 되었습니다. 이 업그레이드를 통해 2차 구조 예측 도구가 UNAfold에서 RNAfold로 전환되어 mirMachine을 자유롭게 사용할 수 있습니다. 이제 사용자는 간단한 제출 스크립트를 실행하여 완전히 자동화된 mirMachine 파이프라인을 실행할 수 있습니다(예제는 https://github.com/hbusra/mirMachine.git 에서 제공됨).

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. 소프트웨어 종속성 및 설치

  1. 홈 사이트에서 또는 conda를 사용하여 소프트웨어 종속성을 설치합니다.
    1. Perl이 아직 설치되지 않은 경우 홈 사이트(https://www.perl.org/get.html)에서 다운로드하여 설치합니다.
      참고: 표시된 결과는 Perl v5.32.0을 사용하여 예측되었습니다.
    2. 정렬 프로그램인 Blast+를 홈 사이트(https://www.ncbi.nlm.nih.gov/books/NBK279671/)에서 실행 파일 및 소스 코드로 다운로드합니다.
      참고: 표시된 결과는 BLAST 2.6.0+를 사용하여 예측되었습니다.
    3. https://www.tbi.univie.ac.at/RNA/ 에서 RNAfold의 미리 컴파일 된 패키지를 설치하십시오.
    4. 또는 다음 conda를 사용하여 이러한 소프트웨어를 설치하십시오: i) conda install -c bioconda blast; ii) conda install -c bioconda viennarna.

2. 미르머신 설정 및 테스트

  1. https://github.com/hbusra/mirMachine.git GitHub에서 최신 버전의 mirMachine 스크립트 및 mirMachine 제출 스크립트를 다운로드한 다음 스크립트 경로를 PATH로 설정합니다.
  2. GitHub에 제공된 테스트 데이터를 사용하여 mirMachine과 모든 종속성이 올바르게 다운로드되었는지 확인합니다.
  3. 아래 표시된 테스트 데이터에서 mirMachine을 실행합니다.
    bash mirMachine_submit.sh -f iwgsc_v2_chr5A.fasta -i mature_high_conf_v22_1.fa.filtered.fasta -n 10
    참고: 테스트 데이터에 밀 게놈의 염색체가 하나만 포함되어 있으므로 -n 옵션을 10으로 설정합니다. 기본적으로 -n 옵션은 20으로 설정됩니다.
  4. 예측된 성숙한 miRNA, 예측된 전구체 및 염색체에서의 위치에 대한 hairpins.tbl.out.tbl 출력 파일을 제어합니다.
  5. 로그 파일에서 프로그램 출력 및 경고를 확인합니다.

3. 상동성 기반 miRNA 동정

  1. 아래 표시된 bash 스크립트를 사용하여 mirMachine을 실행합니다.
    bash mirMachine_submit.sh -f $genome_file -i $input_file -m $mismatches -n $number_of_hits
  2. 예측된 miRNA를 확인합니다. 예측된 miRNA에 대해 $input_file.results.tbl.hairpins.tbl.out.tbl이라는 출력 파일을 찾습니다. pre-miRNA FASTA 서열에 대해 $input_file.results.tbl.hairpins.fsa라는 출력 파일을 찾습니다. 헤어핀 로그 파일에 대해 $input_file.results.tbl.hairpins.log 라는 출력 파일을 찾습니다.

4. 새로운 miRNA 식별

  1. sRNA-seq FASTQ 파일을 적절한 FASTA 형식으로 전처리합니다. 필요한 경우 어댑터를 다듬습니다. 품질이 낮은 읽기를 다듬지 마십시오. 대신 제거하십시오. N이 포함된 읽기를 제거합니다. FASTQ 파일을 FASTA 파일($input_파일)로 변환합니다.
  2. 아래 표시된 bash 스크립트를 사용하여 mirMachine을 실행합니다.
    bash mirMachine_submit.sh -f $genome_file -i $input_file -n $number_of_hits -sRNAseq -lmax $lmax -lmin $lmin -rpm $rpm
    참고: $mismatches 은 sRNA-seq 기반 예측을 위해 0으로 설정되었습니다.
  3. 예측된 miRNA를 확인합니다. 예측된 miRNA에 대해 $input_file.results.tbl.hairpins.tbl.out.tbl이라는 출력 파일을 찾습니다. pre-miRNA FASTA 서열에 대한 $input_file.results.tbl.hairpins.fsa라는 출력 파일을 찾습니다. 헤어핀 로그 파일에 대해 $input_file.results.tbl.hairpins.log 라는 출력 파일을 찾습니다.

5. 고급 매개 변수

참고: 기본값은 게놈 파일과 입력 miRNA 파일을 제외한 모든 매개변수에 대해 정의됩니다.

  1. -db 옵션을 blast 데이터베이스로 설정하여 파이프라인 내에서 빌드 참조 데이터베이스를 건너뜁니다.
  2. -m 옵션을 허용되는 불일치 수로 설정합니다.
    참고: 디폴트로, - m 옵션은 상동성 기반 예측의 경우 1로 설정되고 sRNA-seq 기반 예측의 경우 0으로 설정되었습니다.
  3. -n을 정렬 후 제거할 적중 횟수로 설정합니다(기본값은 20). 종에 따라 변경하십시오.
  4. -long을 사용하여 의심 목록에 대한 보조 구조를 평가합니다.
  5. -s를 사용하여 sRNA-seq 데이터를 기반으로 한 새로운 miRNA 예측을 활성화합니다.
  6. -lmax 옵션을 스크리닝에 포함할 sRNA-seq 판독의 최대 길이로 설정합니다.
  7. -lmax 옵션을 스크리닝에 포함할 sRNA-seq 판독의 최소 길이로 설정합니다.
  8. -rpm 옵션을 사용하여 백만개당 읽기 수(RPM) 임계값을 설정합니다.
    참고: pri-miRNA/pre-miRNA의 길이와 같은 고급 매개변수의 경우 숙련된 사용자는 관심 연구를 위해 스크립트를 수정하는 것이 좋습니다. 또한 사용자가 일부 단계를 건너뛰거나 수정된 출력을 사용하려는 경우 줄 시작 부분에 # 을 추가하여 해당 줄을 건너뛰어 제출 스크립트를 수정할 수 있습니다.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

상술한 miRNA 파이프라인인 mirMachine을 파이프라인의 성능을 빠르게 평가하기 위한 테스트 데이터에 적용하였다. miRBase v22.1에 침착된 신뢰도가 높은 식물 miRNA만이 IWGSC 밀 RefSeq 게놈 v224의 염색체 5A에 대해 스크리닝되었습니다. mirMachine_find 최대 1개의 불일치가 허용되는 189개의 고신뢰도 miRNA의 비중복 목록에 대해 312개의 히트를 반환했습니다(표 1). mirMachine_fold 2차 구조 평가에 따라 이들 중 49개를 추정 miRNA로 분류했습니다. 가장 많이 대표되는 miRNA 그룹은 miR9666이었으며 총 18개의 miRNA가 확인되었습니다(그림 1). 일부 miRNA는 동일한 성숙 miRNA를 공유하지만 다른 pre-miRNA 서열에서 처리되었습니다. 이러한 miRNA는 miRNA 패밀리 이름 뒤에 고유 번호(예: miR156-5p-1 및 miR156-5p-2)로 이름이 변경되었습니다. 49 개의 추정 miRNA 중 20 개의 중복되지 않은 성숙 miRNA 서열이 확인되었습니다. 일부 miRNA는 하나 이상의 유전자좌에서 전사될 수 있어 더 많은 수의 miRNA가 표시됩니다. 테스트 데이터에서 miR9666-3p-5는 감지 가닥 (602887137)과 안티센스 가닥 (542053079)에 두 번 표시되었습니다. 모든 위치는 GitHub의 TestData 출력 파일 아래에 mature_high_conf_v22_1.fa.filtered.fasta.results.tbl. hairpins.tbl.out.tbl.

하나의 식물 게놈에서의 발현 증거는 식물에서 miRNA의 보존을 고려할 때 충분합니다. 그러나 신뢰도가 높은 miRNA 데이터 세트는 제한된 양의 데이터만 제공합니다. 따라서 신뢰도가 높거나 실험적으로 검증된 miRNA를 참조 데이터 세트로 사용하고 발현 검증 단계를 건너뛰거나 참조 데이터 세트로 사용 가능한 모든 식물 miRNA를 사용하고 나중에 발현 증거를 찾는 것이 사용자의 선호입니다. 여기에서는 식물 게놈 중 하나에서 실험적으로 검증 된 높은 신뢰도의 miRNA가 참조 세트로 사용되었으므로 테스트 데이터에 대한 발현 검증 단계를 건너 뛰었습니다.

mirMachine은 Arabidopsis thaliana (Arabidopsis, TAIR10 릴리스) 및 Triticum aestivum (밀, IWGSC RefSeq v2)을 포함한 단자엽 및 쌍자엽 식물을 사용하여 벤치마킹되었습니다. 상동성 기반 및 sRNA-seq 기반 예측의 성능을 평가하고, 그 결과를 NGS 기반 miRNA 예측 도구인 miRDP225와 비교하였다. 상동성-기반 예측은 miRbase v2226에 침착된 식물 성숙 miRNA 서열의 비중복 리스트를 사용하여 실행하였다. sRNA-seq 기반 예측은 공개적으로 이용 가능한 데이터 세트를 사용하여 실행되었습니다. 애기장대의 경우 GSM2094927, 밀의 경우 GSM1294661. 원시 결과 외에도, 동일한 sRNA-seq 데이터 세트를 사용하여 성숙한 miRNA 및 miRNA 별 서열의 발현 증거에 대해 상동성 기반 예측을 필터링했습니다.

그림 2는 각 도구의 성능과 두 종의 mirMachine 설정을 보여줍니다. 민감도는 확인된 알려진 miRNA의 총 수를 식별된 총 miRNA 수로 나눈 값으로서 계산하였다. 결과는 mirMachine이 애기장대 데이터에서 민감도와 진정한 긍정적 예측 측면에서 miRDP2를 능가하는 것으로 나타났습니다. 밀 데이터의 경우, 발현 증거에 의해 뒷받침되는 mirMachine 상동성 기반 예측은 miRDP2보다 더 나은 민감도를 제공했습니다. 두 게놈 모두에서 miRDP2는 mirMachine sRNA-seq 및 발현 증거가 있는 상동성 기반 예측에 비해 더 많은 수의 참양성을 예측했습니다. miRDP2는 알려진 miRNA의 예측을 위해 발현 역치(RPM, 백만 개당 판독 횟수)를 10에서 1로 낮추어 참양성 예측을 높인다는 점에 유의해야 합니다. 일반적으로 mirMachine은 새로운 miRNA와 알려진 miRNA를 모두 식별하는 데 사용할 수 있습니다. mirMachine의 한 가지 장점은 특정 조직 및 조건의 제한 없이 추정 miRNA의 게놈 전체 분포를 예측할 수 있다는 것입니다. 마지막으로, mirMachine은 사용자 친화적이며 특정 연구 목적을 위해 적중 횟수, 불일치, miRNA 길이 및 RPM과 같은 매개 변수를 조정할 수있는 유연성을 제공합니다. 종합하면, mirMachine은 전사체와 식물의 게놈에서 추정되는 miRNA에 대한 정확한 예측을 제공합니다.

Figure 1
그림 1: IWGSC 밀 참조 게놈 v2의 염색체 5A에서 확인된 miRNA 패밀리의 분포. 데이터 레이블은 miRNA 패밀리와 각 miRNA 패밀리에 속하는 miRNA의 수를 보여줍니다. 약어 : miRNA = 마이크로 RNA; IWGSC = 국제 밀 게놈 시퀀싱 컨소시엄. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 2
그림 2: 미르머신의 성능 평가. miRDP2 소프트웨어와 상동성 기반 및 sRNA-seq 기반 예측 및 miRDP2 소프트웨어를 사용한 mirMachine에 대해 예측된 알려진 miRNA의 총 수(참양성)와 민감도를 비교합니다. 약어 : miRNA = 마이크로 RNA. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

게놈 게놈 크기 참조 miRNA 데이터 세트 조회수 mirMachine_find 조회수 mirMAchine_fold # miRNA 패밀리 중
테스트 데이터 ~ 0.7 기가 189 312 49 9
크르5A

표 1: 미르머신의 통계. 시험 데이터는 IWGSC 밀 참조 게놈 v2의 염색체 5A에서 나온 것이다. 약어 : miRNA = 마이크로 RNA; IWGSC = 국제 밀 게놈 시퀀싱 컨소시엄.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

당사의 miRNA 파이프라인인 SUmir는 지난 10년 동안 많은 식물 miRNA의 식별에 사용되었습니다. 여기에서 우리는 완전히 자동화되고 자유롭게 사용할 수 있는 새로운 miRNA 식별 및 주석 파이프라인인 mirMachine을 개발했습니다. 더욱이, 이전 파이프라인을 포함하되 이에 제한되지 않는 다수의 miRNA 식별 파이프라인은 UNAfold 소프트웨어(21)에 의존했는데, 이는 한때 자유롭게 이용가능했음에도 불구하고 시간이 지남에 따라 상용 소프트웨어가 되었다. 이 새롭고 완전히 자동화된 미르머신은 더 이상 UNAfold에 의존하지 않습니다. 대신에, 비엔나RNA 패키지(27 )로부터 자유롭게 이용가능한 RNAfold가 2차 구조 예측을 위해 사용된다. 또한 mirMachine의 모든 스크립트는 조정 가능한 매개 변수가있는 bash 스크립트로 수집되어 mirMachine을 완전히 자동화되고 자유롭게 사용할 수있는 miRNA 예측 및 주석 도구로 만들었습니다.

미르머신은 식물 miRNA의 특성과 생물 발생의 이점을 얻었습니다. 동물 프리-miRNA와는 대조적으로, 식물 프리-miRNA는 길이 및 구조적 특징이 가변적이다15. 결과적으로, miRNA의 특성 및 이들의 생물 발생15에 따라 식물 miRNA의 식별을위한 기준이 설정되었다. 식물 pre-miRNA의 길이가 현저하게 변할 수 있고 수백 개의 뉴클레오티드 길이가 될 수 있기 때문에 pre-miRNA 길이에 대한 컷오프는 설정되지 않았습니다. 대신, 길이가 ~ 700 bp로 제한된 pri-miRNA 구조 접힘이 먼저 평가되었습니다. 나중에, 후보 pri-miRNA 서열로부터 pre-miRNA 서열을 예측하고, 적절한 폴딩 통계를 위해 평가하였다.

많은 식물 게놈, 특히 밀과 보리와 같은 농경학적으로 중요한 곡물은 매우 반복적인 게놈28,29,30을 가지고 있습니다. 높은 반복 함량 외에, 배수체는 이들 식물24 중 일부에서 관찰되어, 인실리코 식별 및 miRNA 구조의 특성화에 추가적인 복잡성을 도입한다. 반복은 성숙한 형태의 miRNA와 유사한 siRNA31의 생산을 위한 주요 공급원입니다. 그러나 그들은 생물 발생과 기능이 다릅니다32,33. 후보 miRNA 목록에서 siRNA를 제거하는 것은 극히 어렵습니다. 사실, 가장 널리 사용되는 miRNA 데이터베이스인 miRBase26은 miRNA34,35로 잘못 주석이 달린 많은 수의 siRNA를 포함하는 것으로 보고되었습니다. 생물 발생의 차이에 따라 mirMachine은 안티센스 가닥과 완벽한 쌍을 이루는 작은 RNA를 siRNA로 필터링하고 해당 서열을 의심 테이블에 배치합니다. 또한 mirMachine에는 후보 RNA를 siRNA로 필터링하기 위한 최대 적중 횟수를 정의하는 -n 옵션이 있습니다.

실리코에서 예측된 모든 miRNA를 검증하기 위해서는 발현 증거가 필요합니다. miRNA는 식물 게놈 중에서 고도로 보존되기 때문에 식물 게놈 중 하나에서 발현 증거는 예측된 miRNA의 유효성을 확인하기에 충분해야 합니다. 초기 스크리닝 과정에서 신뢰도가 높고 성숙한 miRNA 서열을 사용하면 예측된 모든 miRNA에 대한 발현 증거를 제공할 수 있는 이점이 있습니다. 그러나 초기 miRNA 데이터 세트의 짧은 목록은 게놈에서 포괄적인 miRNA 세트의 예측을 제한합니다. 또는 miRBase 데이터베이스에 기탁된 식물 miRNA의 전체 세트를 신뢰도가 높은 miRNA에 대한 필터링 대신 초기 데이터 세트로 사용할 수 있습니다. 사용자는 관심 종에 대한 발현 데이터를 사용할 수 없는 경우 식물 게놈 중 하나 이상에 대한 발현 서열 태그, miRNA 마이크로어레이 또는 소형 RNA 시퀀싱 데이터를 통해 발현 증거를 찾는 것이 좋습니다.

상동성 기반 miRNA 예측은 알려진 miRNA 계열의 게놈 전체 분포를 밝히는 데 도움이 될 수 있습니다. 이러한 miRNA는 특정 조직 및 조건에서 발현될 가능성이 있습니다. 상동성 기반 예측의 단점은 새로운 miRNA 패밀리를 식별하는 능력이 부족하다는 것입니다. 대조적으로, sRNA-seq 기반 예측은 많은 수의 위양성 비용을 갖는 새로운 miRNA를 식별할 수 있습니다. 따라서 최상의 접근 방식을 선택하는 것은 사용자와 관심 연구에 달려 있습니다. 여기에 제시된 mirMachine은 알려진 miRNA와의 상동성 또는 sRNA 시퀀싱을 기반으로 miRNA를 식별하는 데 도움이 될 수 있습니다.

Subscription Required. Please recommend JoVE to your librarian.

Materials

Name Company Catalog Number Comments
https://www.ncbi.nlm.nih.gov/books/NBK279671/ Blast+
https://github.com/hbusra/mirMachine.git mirMachine submission script
https://www.perl.org/get.html Perl
https://www.tbi.univie.ac.at/RNA/ RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

DOWNLOAD MATERIALS LIST

References

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), author reply 9-10 6-9 (2010).

Tags

생물학 171 호
미르머신: 식물 miRNA 주석을 위한 원스톱 상점
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Cagirici, H. B., Sen, T. Z., Budak,More

Cagirici, H. B., Sen, T. Z., Budak, H. mirMachine: A One-Stop Shop for Plant miRNA Annotation. J. Vis. Exp. (171), e62430, doi:10.3791/62430 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter