Genetics

목초의 군 유전체학 분석

Published: January 13, 2017 doi: 10.3791/54936

Richard K. Tennant¹, Christine M. Sambles¹, Georgina E. Diffey¹, Karen A. Moore¹, John Love¹

Introduction

메타 지노믹스는 DNA의 직접 분석 환경 시료에서 발견 ^한 생물학적 공동체로부터 정제 원래 ^침전물이 검색된 unculturable 세균을 검출하는 데 사용된다. 메타 지노믹스는 널리 인간 마이크로 바이 ^{식별 3} 바다 ^4에서 심지어 커피 기계 ⁵ 개발 세균 사회의 분석을 위해 미생물 집단을 분류하는 등의 응용 프로그램 다수 사용되어왔다. 차세대 시퀀싱 기술의 도입은 큰 서열 처리량 출력 결과. 따라서, DNA 서열 ⁶ 경제적이되었고 행할 수 시퀀싱의 깊이는 매우 강력한 분석 도구가 될 메타 지노믹스있게 증가 하였다.

군 유전체학 염기 서열의 실제 분자 측면에서 "프런트 엔드"향상된에서의 성장을 주도했다분류 학적 분류 ^7-9, 기능 주석 ^{10, 11} 및 DNA 시퀀스 데이터의 시각적 표현 ^{(12, 13)에} 사용할 실리 생물 정보학 도구입니다. 사용할 수의 증가 수는 변함없이 시퀀스 게놈 ^(15)의 "백엔드"참조 데이터베이스에 대해 수행되는 미생물 군집의 분류에 더 정확성을 수 있습니다 원핵 생물과 진핵 생물 ⁽¹⁴⁾ 게놈 염기 서열. 두 가지 주요 접근법이 군 유전체학 분석을 위해 채택 될 수있다.

더욱 통상적 인 방법은 박테리아 게놈의 코딩 영역 16S rRNA 유전자 분석이다. 16S rRNA의 높은 원핵 생물 종 사이 보존하지만 구 하이퍼 가변 영역을 나타내고있다 (V1 - V9) 종 식별 ^(16)에 대해 이용 될 수있다. 더 긴 서열의 도입 (≤ 300 bp의 페어링 단부) 특히 두 하이퍼 가변 영역에 걸친 DNA 서열 분석에 대해 허용V3가 - V4 영역 ^(17). 이러한 옥스포드 나노 기공 ^(18)와 PacBIO ^(19)와 같은 다른 시퀀싱 기술, 발전은 전체 16S rRNA 유전자가 연속적으로 염기 서열을 할 수 있도록 않습니다.

16S rDNA의 기반 라이브러리 종 식별에 타겟팅 방법을 제공하며, 자연 정제 된 샘플 내에서 발생하는 낮은 카피 수의 DNA의 검출을 가능하게하지만, 샷건 서열 라이브러리 중 하나 (16S)에 의해 증폭없는 DNA 영역을 포함 할 수 종의 검출을 허용 rRNA의 마커 프라이머 서열은 사용하거나 템플릿 서열 및 증폭 프라이머의 서열 사이의 차이는 ^{(20, 21)가} 너무 큰 때문이다. DNA 중합 효소는 DNA 복제의 높은 정확도를 갖지만 또한,베이스 오류 불구 PCR 증폭시 발생하는 이러한 통합 에러 종 ^(22)을 원래의 잘못된 분류 될 수있다. 템플릿 서열의 PCR 증폭의 편견uences가 발생할 수 있습니다; 최종 앰플 리콘 풀 같은 티민 글리콜 등 ^(23)과 마찬가지로 비 천연 염기 변형을 나타내는 하에서 높은 GC 함량을 갖는 DNA의 서열은 DNA 중합 효소 ²⁴ 서열 DNA의 증폭에 장애를 일으키는 정지 할 수있을 수있다. 반대로, 샷건 서열 DNA 라이브러리 시료로부터 추출하고이어서 사전 시퀀싱 제조에 짧은 DNA 쇄 길이로 세분화 된 정제 DNA의 전체를 사용하여 제조 된 DNA 라이브러리이다. 금융 비용 신뢰성 시퀀싱 깊이 앰플 리콘 서열 ^{(26)의보다} 큰 도달해야하지만 샷건 서열 분석에 의해 생성 된 DNA 서열의 분류 학적 분류는, 16S rRNA의 앰플 리콘 서열 ^{(25)에보다} 정확하게 비교할 때. 샷건 시퀀싱 메타 지노믹스의 주요 이점은 그들이왔다 일단 샘플의 다양한 게놈의 시퀀스 영역은 유전자 탐사에 사용할 수 있다는 것입니다분류 학적 ⁽²⁷⁾ 분류되었습니다.

군 유전체학 시퀀스 데이터 생물 정보학 도구의 계속 증가하는 영역에 의해 분석된다. 이러한 도구는, 예를 들어, 다양한 애플리케이션을 수행 할 수 있으며, 한 쌍의 단부의 중첩 원시 시퀀스 데이터 ^(28)의 품질 관리 분석은 서열의 드 노보 어셈블리 콘티 및 지지체 ^{(30, 31),} 분류 학적 분류 및 시각화 판독 ²⁹ 읽 순서는 읽고 시퀀스 ^7,12,32,33 조립 순서 ^{34, 35의} 기능 주석을 조립의.

옥수수와 같은 발효 곡물 (ZEA가 메이스)에서 전 세계 농민에 의해 생산 된 사일리지는, 주로 가축 사료로 사용된다. 사일리지는 박테리아의 유산균 특검팀로 처리됩니다. 발효 ^{36 도움을하지만} 지금까지 사일리지에있는 다른 미생물 집단의 제한된 지식이 있습니다. fermentatioN 프로세스 사일리지 ⁽³⁷⁾ 내에 보급되고 바람직하지 않고 잠재적으로 유해한 미생물을 초래할 수있다. 효모 및 곰팡이에 더하여, 박테리아 사일리지 발효의 무산소 환경에 적응하고, 특히 자주 가축 질병보다는 옥수 ^(38)의 분해와 관련된다. 사일리지 사일로 충전 따라서 옥수 ^(39)의 pH를 증가 부티르산로 락트산, 혐기성 소화의 생성물을 변환 할 때 실수로 토양에서 첨가 될 수 부티르산 박테리아가 남아있다. pH의 증가는 일반적으로 최적의 사일리지 발효 조건 ^(38)에서 성장을 지속 할 수 없을 것이다 부패 박테리아의 급증으로 이어질 수 있습니다. 클로스 트리 디움 종. , 리스테리아 종. 및 바실러스 종. gastr 살아남은 세균 포자로, 특히 젖소 사료 사일리지에 특히 관심있다ointestinal 기관 ^(40)는 동물과 인간의 사망 ^{37,39,41-44에,} 드문 경우에, 식품 사슬을 입력 식품 부패로 이어질 수 있습니다. 이 사료 변질에 의한 의학적 치료 및 가축 손실의 정확한 경제적 영향을 추정하기 어려운 반면 게다가, 확산이 발생했다하면 팜에 유해 할 가능성이있다.

군 유전체학 방법을 이용하여 우리가되도록 교정 동작을 가능 옥수 샘플에 존재하는 미생물의 개체수를 분류하고 또한 차례로 잠재적 가축에 해로운 영향을 가질 것이다 옥수 부패와 관련된 미생물 커뮤니티를 식별 할 수 있다는 가설 사일리지 전에 찍은 음식 소스로 사용한다.

Protocol

1. 사이트 위치

이러한 농장 같은 적절한 사이트에서 사일리지 시료를 수집합니다. 여기서, 농장은 Ballydulea, (주) 코크, 아일랜드 (51 ° 51'58.4 "N 8 ° 16'48.7"W)에 위치했다.

2. DNA 추출

참고 : DNA 추출은 제조업체의 지침에 따라 상용 키트를 사용하여 수행 하였다. 어떠한 시료를 함유하지 않는 음성 대조군은 라이브러리 제조 방법에서 사용 하였다.

공급 된 용해 튜브에 978 μL의 인산 나트륨 완충액 122 μL 토양 용해 완충액으로 샘플을 400 mg의 - (100)를 추가한다.
6.0 m / s의 속도로 40 초 동안 균질화에 용해 튜브를 배치하여 샘플 균질화.
원심 분리기 해물을 15 분 동안 14,000 XG에와 단백질 침전물 솔루션의 250 μL (PPS)를 포함하는 깨끗한 마이크로 원심 분리 관에 뜨는을 전송합니다. 10 회 원심 분리를 반전시켜 용액을 섞어5 분 동안 14,000 XG에.
깨끗한 15 ML의 원심 분리기 튜브에 1 mL의 DNA 결합 행렬에 뜨는을 추가합니다. 3 분 동안 계속해서, 튜브를 뒤집어 용액을 혼합한다. 혼합물 후, 3 분 동안 정착 상층 액 500 μL를 취소 할 수 있습니다. 나머지 뜨는을 섞는다.
1 분 동안 14,000 XG에 스핀 필터와 원심 분리기에 현탁액 600 μL를 전송합니다. 여과 액을 취소하고 나머지 서스펜션 과정을 반복합니다.
다음 1 분 동안 14,000 XG에 원심 분리기, 피펫 팅하여 혼합, 스핀 필터 내에서 DNA 결합 행렬에 세척 완충액 500 μL를 추가합니다.
여과 액을 취소하고 2 분 모든 세척 버퍼가 제거되었는지 확인하는 14,000 XG에 다시 스핀 필터를 원심 분리기. 5 분 동안 23 ℃에서 스핀 필터를 건조.
사전 따뜻한 (70 ℃)에 DNase의없는 물 (DES) 및 다시 중단 스핀 필터 내에서 DES의 100 μL의 DNA 결합 행렬. 깨끗한 1.5 ML의 마이크로 원심 분리기 TU에 스핀 필터로 이동하고 1 분은 DNA를 용출하는 14,000 XG에 원심 분리기. 추가 분석을 수행 할 때까지 -20 ℃에서 정제 된 DNA를 저장합니다.

3. DNA 정제하여 DNA 정제 비즈

주 : DNA 추출 순수한 DNA 샘플을 위해 정제 비드를 사용하여 정제 전 군 유전체학 라이브러리에 준비 얻었다.

사용하기 전에 30 분 동안 23 ℃에서 구슬을 품어. DNA의 샘플에 구슬이 볼륨을 추가하고 5 분 동안 23 ℃에서 솔루션을 품어.
5 분 동안 분리 자석에 샘플을 배치 한 후 상층 액을 버린다. 200 μL 신선한 80 % 에탄올 (EtOH를) 두 번 구슬을 씻으십시오. 공기를 10 분 동안 비드를 건조.
분리 자석에서 샘플을 제거하고 용출 버퍼 (EB)의 50 μL를 추가, 피펫 팅하여 혼합한다.
그 후 다시 3 분의 분리 자석 위에 샘플을 놓고 5 분 동안 23 ℃에서 서스펜션을 품어.
TR깨끗한 튜브에 DNA를 포함하는 상층 액을, ansfer. 구슬을 폐기하십시오.
섹션 4에 따라 정제 된 DNA를 정량화.

정제 된 DNA의 4 정량

참고 : 정제 된 DNA에 형광 분석기 제조업체의 지침에 따라 이중 가닥 (dsDNA) 고감도 (HS) 분석 키트를 사용하여 정량 하였다.

시약하기 위해 버퍼 : 1 비율 199를 사용하여 작업 솔루션을 준비합니다.
작업 용액 190 μL 각 DNA 표준의 10 μL를 추가합니다.
솔루션을 작업의 190 μL에 정제 된 DNA의 10 μL를 추가합니다. 최종 부피는 200 μL해야합니다. 2 분 동안 23 ℃에서 표준 및 DNA 샘플을 품어.
화면의 지시를 사용하여 형광 분석기의 DNA 샘플 전에 표준을 분석합니다.

5. 샷건 시퀀싱 라이브러리 준비

참고 : 샷건 시퀀싱 라이브러리가를 사용하여 제조 하였다제조업체의 지침을 사용하여 상용 라이브러리 준비 키트.

0.2 NG / μL 사용 EB에 DNA 샘플을 희석. 이 농도 이하 이미 상관 샘플을 음성 대조군, 즉, 현재의 농도로 남겨진다.
버퍼, 5 μL 효소 믹스 10 μL로 정제 된 DNA의 5 μL를 섞는다. 5 분 동안 55 ℃에서 샘플을 품어.
버퍼를 중화의 5 μL를 추가하고 5 분 동안 23 ℃에서 솔루션을 품어.
샘플 특정 순서 인덱스의 각 5 μL, 15 μL PCR의 마스터 믹스를 추가합니다.
열 순환기에서, 10 초, 30 초 55 C와 30 초 72 ˚C 95 ˚C의 12주기 전에 3 분 30 초 95 ˚C 72 ℃에서 샘플을 품어. 5 분 동안 72 ℃에서 마지막으로 샘플을 품어.
전과하지만 EB 30 μL의 최종 용출 비드 정제를 사용하여 제조 된 DNA를 정제 하였다.

6. Library 수량 및 품질 검사

참고 : 준비 라이브러리의 양과 질은 상용 키트와 장비를 사용하여 평가 하였다.

사용하기 전에 30 분 동안 23 ℃에서 상기 키트 부품 인큐베이션.
2,000 rpm에서 1 분간 버퍼와 소용돌이의 2 μL로 DNA의 2 μL를 추가합니다.
이 튜브의 아래쪽에 있도록 시료를 스핀.
악기에 샘플 튜브, 분석 테이프 및 팁을 삽입하고 소프트웨어의 지시에 따라 분석을 수행합니다.

7. DNA 시퀀싱

300 bp의 페어링 단부 서열 ^45를 사용하여 시퀀싱 서비스 서열 제조 정량 DNA 서열 라이브러리 샘플을 옮긴다.

원시 시퀀스 데이터의 8 분석

주 : 리눅스 운영 체제를 사용하여 각 프로그램의 명령 프로토콜 단계를 이하에 나타낸다. S에 사용되는 파이프 라인equence 데이터 분석은도 1에 도시되어있다. 프로그램은 분석하기 전에 사용자가 설치되어야한다. 이 프로세스는 각각의 샘플에 대해 개별적으로 수행되어야한다.

분석하고 앞으로 다음, 명령 줄 / 경로에 파일 / fastqc에 입력하여 FastQC ^(46)를 이용하여 DNA 시퀀스 데이터를 시각화하고 원료가 raw_read1.fastq raw_read2.fastq를 읽고 역.
-o output_fastqc 및 -f fastq하여 원시 읽기 파일의 파일 형식을 입력하여 출력 폴더를 지정합니다.
출력 파일 (그림 2) 볼 수 있습니다.
경로에 파일 / fastqc raw_read1.fastq raw_read2.fastq -o OUTPUT_DIRECTORY -f fastq.

9. 품질 관리 트리밍 및 필터링 시퀀스 데이터

명령 행 자바 -jar / 경로에 파일 / trimmomatic-0.35.jar에 입력하여 트리밍 프로그램, Trimmomatic ^{(28)를 실행합니다.}
지정 파일은 'PE'를 입력하여 최종 파일을 쌍으로. 국가가 16 중앙 홍보ocessing 장치 (CPU는) -threads (16)을 입력하여 프로그램에 의해 사용되어야한다.
원시 앞으로의 이름을 입력하여 QC 검사에 두 개의 파일을 나열하고 읽고 역. 출력 파일의 접두사는 -baseout 사일리지를 입력하여 결정된다.
ILLUMINACLIP을 입력하여 프로그램에 대한 옵션을 정의합니다 NexteraPE-PE.fa : 2 : 30 : 10 선도적 : 3 TRAILING : 3 SLIDINGWINDOW : 4 : 20 CROP : 200 HEADCROP : 15 minlen이 36.
완료되면, 이전과 FastQC를 사용하여 트리밍 된 서열을 분석하고 성공적으로 수행 된 트리밍되도록하여 로우 시퀀스 데이터의 출력을 비교한다.
참고 : 소프트웨어 도구, Trimmomatic이, 최고의 품질이 낮은 또는 N 기지 제거하여 더 읽어 트림 (아래를 품질 3), 품질이 낮은 또는 N 기지 후행 제거 (아래를 품질 3) 각 4베이스 넓은 슬라이딩 윈도우 읽을 검색. 매개 변수는 기본 당 평균 품질이 어느 36 기지 긴 아래 읽어 드롭 후 20 이하로 떨어질 때 절단 설정했다. 마지막으로, 15 기지는 FR 자른했다OM 각각의 헤드는 판독 및 판독 개시로부터 200 염기를 유지 하였다 자른 읽는다. 마지막 단계는 긴 시퀀싱 할 때 일부 품질 문제를 극복하기 위해 수행되었다 (> 200 BP)를 읽습니다. 이러한 특정 샘플 ^(28)에 대해 조정될 수있다.
자바 -jar /path-to-file/trimmomatic-0.35.jar PE -threads 16 raw_read1.fastq raw_read2.fastq -baseout 사일리지 ILLUMINACLIP : NexteraPE-PE.fa : 2 : 30 : 10 선도적 : 3 TRAILING : 3 SLIDINGWINDOW : 4 : 20 CROP : 200 HEADCROP : 15 minlen이 : 36

10 Metagenome 조립

의 짝이 트리밍 병합하면 짝이 읽기 다음에 고양이를 입력하여 읽 silage_read2_unpaired.fastq silage_read1_unpaired.fastq. 입력하여 새 파일에 파일 쓰기> silage_merged_unpaired.fastq
고양이 silage_read1_unpaired.fastq silage_read2_unpaired.fastq> silage_merged_unpaired.fastq
드 노보는 염기 서열 DNA를 조립, 입력 / 경로에 의해 스페이드 (상트 페테르부르크 게놈 어셈블러) ³⁰ 사용- 파일 / spades.py. 16 CPU가 --meta 입력하여 적용해야하는 군 유전체학 매개 변수 (16) -t 입력하여 것을 사용되도록 지정합니다.
앞으로 손질 확인하면 사용 -1 silage_read1_paired.fastq을 읽고 반대 -2 silage_read2_paired.fastq으로 읽습니다. 병합 된 부대는 -s silage_merged_unpaired.fastq에 의해 지정됩니다 읽습니다.
silage_spades을 -o 입력하여 출력 폴더를 정의합니다.
경로에 파일 / spades.py은 -t 16 --meta -1 silage_read1_paired.fastq -2 silage_read2_paired.fastq -s silage_merged_unpaired.fastq -o silage_spades

11. 짝 엔드 읽기 오버랩

DNA 서열의 쌍 명령 줄 / 경로에 파일 / 플래시에 입력하여 FLASH (Short의 빠른 길이 조정 읽습니다) ^(29)를 사용하여 읽기 병합합니다. 16 CPU가 사일리지를 -o 입력하여 (16)와 출력 접두사를 -t 사용하여 사용해야 함을 지정합니다.
손질 확인 silage_trimmed_R1.fastq silage_trimmed_R2.fastq을 입력하여 읽고
경로에 파일 / 플래시 1 -t6 -o는 silage_read1_paired.fastq silage_read2_paired.fastq을 번쩍

(12) 분류 학적 분류

종류 / 경로-에 파일 / 크라켄 및 / 경로에 파일 / 표준을 --db 입력하여 데이터베이스를 지정합니다.
16 개의 CPU가 --threads (16)을 입력하여 사용하는 것을 정의하고 FLASHed_silage_extendedFrags_kraken.txt을 --output 사용하여 출력 폴더를 식별합니다. 입력 파일 이름을 입력하고, FLASHed_silage.extendedFrags.fastq
경로에 파일 / 크라켄 --db 표준 --thread 16 --output FLASHed_silage_extendedFrags_kraken.txt FLASHed_silage.extendedFrags.fastq
주 : 크라켄 ^7하여 조립 된 DNA 서열 비계의 분류가 가능한 모든 원핵 생물 (Prokaryote)의 게놈 서열을 함유 최신 표준 크라켄 데이터베이스에 대해 완료되었다.
-f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int 컷을 입력하여 출력 파일에서 새 파일로 전송 컬럼 2, 3

-f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int 컷

ktImportTaxonomy을 입력하여 크로나 ^(12)에 새 파일을 가져옵니다. FLASHed_silage_extendedFrags_kraken.int을 입력하여 입력 파일을 지정합니다. FLASHed_silage_extendedFrags_kraken.out.html을 -o 입력하여 출력 파일을 확인합니다.
경로에 파일 / ktImportTaxonomy FLASHed_silage_extendedFrags_kraken.int -o FLASHed_silage_extendedFrags_kraken.out.html

13. 기능 주석

MG-RAST ⁴⁷ 웹 사이트, http://metagenomics.anl.gov/로 이동합니다. 필요한 경우 새 사용자로 등록합니다. 로그인 후, "업로드"버튼을 클릭합니다. 10 단계에서 조립 된 비계를 업로드합니다.
파일을 업로드 한 후, "제출"하고 지시 사항을 따르 클릭하고 분석의 완료를 기다리고 있습니다.
분석이 완료되면, EM을 통해 전송 된 링크를 볼MG-RAST에서, 또는 대안 AIL, "진행"을 클릭합니다. 완료된 작업의 목록이 있습니다. 관련 작업 ID에 다음 "다운로드 페이지"링크를 클릭합니다.
다운로드 페이지에서 제목 "단백질 클러스터링 90 %"에서, 550.cluster.aa90.faa을 예측 단백질 파일을 다운로드 단백질 버튼을 클릭합니다.
같은 추정되는 특정 CAZy 효소 클래스에 속하는 단백질을 분류하기 위해 CAZy 데이터베이스 ^(48)에 다운로드 된 단백질을 비교한다. 파일에서 탄수화물 - 활성 효소 데이터베이스 (CAZy)를 다운로드는 다음과 같습니다 AA.zip, CE.zip, GH.zip, GT.zip 및 PL.zip. 이러한 파일은 각각 다음과 효소 클래스를 나타냅니다 보조 활동 (AA), 탄수화물 에스 테라 제 (CE), 글리코 사이드 가수 분해 효소 (GH), 글리코 트랜스퍼 (GT)과 다당류 리아제 (PL)를.
데이터베이스 파일의 압축을 풀고 USEARCH UBLAST의 ALGOR를 사용 CAZy 데이터베이스 단백질 단백질 유사성을 결정함으로써 단백질 주석ithm ^49. 5 데이터베이스가 .txt 파일 유형을 반복하는 (*이 .txt에서 난 용) 떠들썩한 파티 루프를 사용하려면 "*이 .txt에서 난 용, 할".
ublast 알고리즘을 사용하기 위해 매개 변수 -ublast와 입력 / 경로에 파일을 / usearch8에 의해 USEARCH를 실행합니다. 이어서 MG-RAST "mgmXXXXXX.3.550.cluster.aa90.faa"다운로드 단백질 시퀀스 파일의 이름을 입력.
데이터베이스 파일을 나타 내기 위해 "$ i가 -db"및 1E ^-5에서 E-값 임계 값을 지정하는 유형, 유형 "-evalue 1E-5"를 사용합니다.
표적 서열의 발견 이후 검색을 종료하고, 따라서 표적 효소 클래스 GH 예, 유형 "1 -masaccepts"에 속하는 것으로 그 단백질 서열을 분류한다.
16 개의 CPU 유형을 사용 "16 -threads"및 ATAB 구분 된 텍스트 형식 "-blast6out"로 출력 파일의 형식을 지정해야 함을 정의합니다. 출력 파일 형식 "$의 i.ublast"를 확인합니다. t, bash는 루프를 종료하려면타 입 "; 완료"
*이 .txt에 대한 전;
할 / 경로에 파일을 / 내가 -evalue usearch8 -ublast ../mgmXXXXXX.3.550.cluster.aa90.faa -db $ 1E-5 -maxaccepts 1 -threads 16 $ i.ublast -blast6out;
끝난

14 떠올리 CAZy 주석

떠들썩한 파티 루프를 사용하여 각 효소 클래스 단백질 ID 목록을 벤 다이어그램으로 CAZy 주석의 출력을 시각화 생성합니다. "*의 .ublast에서 난 용, 수행"을 입력합니다.
출력 파일에서 새 파일을 열 1을 전송하려면, 유형 "고양이 $ 전 | -f 1> $의 i.list를 잘라".
루프 입력을 종료합니다 "; 완료".
텍스트 편집기에서 .list 파일을 엽니 다. 상기 웹 사이트로 이동으로 5 세트의 수를 선택하고 별도의 상자에 각리스트 파일의 내용을 붙여. .SVG 파일로 생성 된 다이어그램을 다운로드합니다.
난 *의 .ublast에 대한;
고양이 $의 난을 | 잘라 -f 1> $ i.list;
끝난

Representative Results

생물 정보학 처리하기 전에, 원시 순서는 정돈 된 읽기 및 어댑터는 Trimmomatic 소프트웨어 ^(28)를 사용하여 제거 하였다. 트리밍 및 필터링 단계 후에, 시퀀스의 50 %로 감소 된 읽기 수 (표 1)를 판독한다. 평균 기본 phred 점수는 (그림 2) 품질 관리 후> (30)이었다.

중첩 영역이 하나 이상 생성하는 판독 FLASH 소프트웨어 ^(29)를 사용하여 합병 한 DNA 서열 쌍 겹치지는 별도의 파일에 저장하고 읽는다. 45.47 %가 성공적으로 결합 (105343) 읽습니다. 의 중복을 따르면 그 결과 확장 된 조각 크라켄 소프트웨어 ^(7)를 사용하여 세균의 분류 학적 분류를 시행하고 이후 크로나 소프트웨어 (그림 3)과 시각화하고, 읽기의 플래시를 사용하여 읽습니다.

분포는도 4에서 볼 수있다. metagenome에서 가장 풍부한 종의 유산균했다. (24 %, 후벽 균), 코리 네 박테 리움 종. (8 % 방선균) 프로피 SPP. (3 %, 방선균) 및 프레 보 텔라 (Prevotella) 종. (3 % 의간 균류). 질병에 연루 동물의 건강에 중요한 종은 관찰되었다 클로스 트리 디움 종. (1 %), 바실러스 종. (0.6 %), 리스테리아 종. (0.2 %)을 사일리지 샘플에 존재하는 것으로 예상 하였다.

기능 주석 읽기 조립을 수행 하였다. metagenome는 손질 여과 사용하여 스페이드 어셈블러 ^(30)를 사용하여 조립했다쌍 엔드와 짝이 92,284 비계를 생성 읽습니다. 셀룰라아제를 식별하기 위해, 단백질 MG-RAST를 이용하여 예측 및 탄수화물 - 활성 효소 데이터베이스 (CAZy)을 사용하여 주석 하였다. 97,562 예측 단백질, 6357은 CAZy 데이터베이스 (그림 5)를 구성하는 다섯 가지 효소 클래스 중 하나의 추정 탄수화물 - 활성 효소로 주석했다. 결과는 하나 이상의 CAZy 효소 수준의 주석을 함유하는 단백질을 포함 통계의 분포를 나타내는 InteractiVenn 소프트웨어 ^(50)를 사용하여 벤 다이어그램으로 시각화 하였다. 이들 중, 3861는 글리코 시드 가수 분해 효소의 활성을 가질 것으로 예측하고, 상기 기능을 확인하는 실험으로 특성화 될 것이다.

그림 1 : 목초의 분석을위한 바이오 인포 매틱스 메타 지노믹스 파이프 라인. 두 가지 주요 방법이었다사일리지, 분류 학적 분류 및 기능 주석의 마이크로 바이 옴을 조사하는 데 사용됩니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 2 : 전에베이스 당과 트리밍 및 어댑터 제거 후 시퀀스 품질. FASTQC에서 당 염기 서열 품질 플롯은 시퀀스의 길이에 걸쳐 평균 phred 점수 전후 품질 관리를 판독 나타낸다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 3 : 분류학 Classifica솔리드 목초의 세균 마이크로 바이 옴의 기. 플래시가 크라켄 ^7을 사용하여 수행하고 이후 크로나로 가시화되었다에서 손질과 중첩 시퀀스의 분류 읽습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 4 : 고체 목초의 세균 마이크로 바이 옴에서 4 가장 풍부한 문 (phyla)의 분류 학적 등급 분포. 4 개의 가장 풍부한 문 (phyla) 내 세균의 각 클래스의 비율입니다. 후벽 균 : 클로스 트리 디아 (적색) 및 바실러스 (다크 블루) 프로 테오 박테리아 : 델타 / 엡실론 (핑크), 알파 (파란색 창백), 감마 (오렌지)와 베타 (청록색); 의간 균류 : Flavobacteriia (진한 파란색)과 Bacteroidia(녹색 창백); 방선균 : Coriobacteriia (어두운 보라색)과 다른 방선균 (진한 녹색). 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 5 : 솔리드 목초 마이크로 바이 옴에서 예측 된 프로테옴의 CAZy 주석. 고체 사일리지 마이크로 바이의 예측 프로테옴에서 CAZy 주석의 다섯 효소 클래스의 분포를 나타낸 벤 다이어그램. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

# 원시 읽기	# 필터링 읽기 (쌍) # 필터링 읽기	# 읽기 번쩍
(쌍)	# 필터링 읽기 (쌍) # 필터링 읽기	# 읽기 번쩍	(짝)
2,374,949 × 2	231,679 × 2	1892534	105343

표 1 : 시퀀싱의 요약 테이블 읽습니다.

Discussion

실리코 분석에서 환경 시료 내에 존재하는 미생물 커뮤니티 우수한 파악할 수 있지만, 분류 학적 분류 관련 제어에 관련 시퀀싱의 적합한 깊이 전체를 캡처 달성되었음을 행할 증명하는 것이 중요 ⁽⁵¹⁾ 본 인구.

모든 계산 분석, 유사한 목적을 달성하는 많은 경로가 존재한다. 우리가 본 연구에 사용한 방법은 사일리지 마이크로 바이에 분석의 범위를 달성하기 위해 함께 가져왔다 적합하고 간단한 방법의 예이다. 다양한 생물 정보학 도구 및 기술의 계속 늘어나고 인스턴스 Phylosift ⁸ MetaPhlAn2 ⁵² 들어 군 유전체학 데이터를 분석 할 수 있으며, 이러한 샘플의 관련성에 대해 조사 및 분석 REQ 전에 평가되어야⁵³ uired. 군 유전체학 분석 방법은 분류, 순서 깊이와 순서의 질에 사용할 수에 대한 데이터베이스에 의해 제한됩니다.

여기 시연 생물 정보학 처리는 로컬, 높은 전원이 공급되는 시스템에서 수행 하였다 그러나 클라우드 기반 시스템도 사용할 수 있습니다. 이러한 클라우드 기반 서비스에 적합한 강력한 로컬 워크 스테이션의 높은 비용 투자없이 필요한 연산 능력의 임대를 허용합니다. 이러한 방법의 잠재적 인 응용 따라서 먹이 사슬에 들어가는 것을 방지 더 해로운 박테리아가 존재하지 않도록 농업에서 그것의 사용 전에 사료를 평가하는 것이다.

Materials

Name	Company	Catalog Number	Comments
FastDNA SPIN Kit for Soil	MP Bio	116560200	DNA Extraction
DNA FastPrep	MP Bio	116004500	DNA Extraction
Agencourt AMPure XP beads	Beckman Coulter	A63880	DNA Purification
Elution Buffer	Qiagen	19806	DNA Purification
Qubit Fluorometer	Thermo Fisher	Q33216	DNA Quantification
Qubit dsDNA HS Assay Kit	Thermo Fisher	Q32854	DNA Quantification
Nextera XT DNA Library Prep Kit	Illumina	FC-131-1024	Library Preparation
Nextera XT Index Kit	Illumina	FC-131-1001	Library Preparation
TapeStation 2200	Agilent	G2964AA	DNA Quantification
HS D100 ScreenTape	Agilent	5067-5584	DNA Quantification
HS D100 ScreenTape Reagents	Agilent	5067-5585	DNA Quantification
TapeStation Tips	Agilent	5067-5153	DNA Quantification
TapeStation Tubes	Agilent	401428 and 401425	DNA Quantification
HiSeq 2500	Illumina		DNA Sequencing - provided by a sequencing service
High Power Analysis Workstation	Various		Local or cloud based, user preferred system