Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

저하된 FFPE-RNA 시료의 시퀀싱 및 분석을 위한 최적화

Published: June 8, 2020 doi: 10.3791/61060
* These authors contributed equally

Summary

이 방법은 포르말린 고정 파라핀 임베디드(FFPE) RNA 샘플로부터 얻을 수 있는 서열 데이터의 질 및 양을 개선하는 단계를 설명한다. 우리는 FFPE-RNA 샘플의 품질을 보다 정확하게 평가하고, 시퀀싱 라이브러리를 준비하고, FFPE-RNA 샘플의 데이터를 분석하는 방법론을 설명합니다.

Abstract

RNA 시퀀싱(RNA-seq)에 의한 유전자 발현 분석은 잠재적으로 저항 및/또는 감수성 메커니즘뿐만 아니라 다양한 질병의 기초에 대한 기계적 이해로 이어질 수 있는 임상 샘플에 대한 고유한 통찰력을 가능하게 합니다. 그러나, 임상 견본에 있는 조직 형태를 보존하기 위한 일반적인 방법을 나타내는 FFPE 조직은, 유전자 발현 프로파일링 분석을 위한 제일 근원이 아닙니다. 이러한 샘플에서 얻은 RNA는 종종 분해, 단편화 및 화학적으로 변형되어 최적이 아닌 시퀀싱 라이브러리로 이어집니다. 차례로, 이들은 유전자 발현 분석 및 돌연변이 발견을 위해 믿을 수 없을 지도 모르다 나쁜 질 순서 데이터를 생성합니다. FFPE 샘플을 최대한 활용하고 품질이 낮은 샘플에서 최상의 데이터를 얻으려면 실험 설계를 계획하고 시퀀싱 라이브러리를 준비하며 데이터 분석 중에 특정 예방 조치를 취하는 것이 중요합니다. 여기에는 정밀한 시료 품질 관리(QC)에 적합한 메트릭의 사용, 시퀀싱 라이브러리 생성 동안 다양한 단계에 가장 적합한 방법 식별, 신중한 라이브러리 QC 등이 포함됩니다. 또한 RNA-seq 데이터에서 아티팩트를 식별하고, 오염 및 낮은 품질 판독을 필터링하고, 유전자 커버리지의 균일성을 평가하고, 생물학적 복제물 중 유전자 발현 프로필의 재현성을 측정하기 위해서는 서열 데이터 분석을 위한 올바른 소프트웨어 도구 및 매개 변수를 적용하는 것이 중요합니다. 이러한 단계는 매우 이질적인 RNA 샘플의 프로파일링을 위한 높은 정확도와 재현성을 보장할 수 있습니다. 여기에서 우리는 FFPE RNA 조직에서 얻은 것과 같은 낮은 품질의 RNA로부터 얻은 유용한 데이터의 양을 증가시키는 데 도움이 될 수 있는 샘플 QC, 라이브러리 준비 및 QC, 시퀀싱 및 데이터 분석을 위한 다양한 단계를 설명합니다.

Introduction

차세대 염기서열 분석 방식을 사용하여 다양한 유형의 샘플에서 풍부한 정보를 얻을 수 있었습니다. 그러나 오래되고 잘 보존되지 않은 샘플은 시퀀스 데이터를 생성하는 일반적으로 사용되는 방법에 대해 작동하지 않으며 종종 잘 설정된 프로토콜을 수정해야 합니다. FFPE 조직은 임상 시편1,2,3에,3널리 활용되어 온 이러한 샘플 유형을 나타낸다. FFPE 보존은 조직 형태를 유지하는 동안, FFPE 조직에 있는 핵산은 일반적으로 각종 무질서의 밑에 분자 기계장치에 관하여 중요한 통찰력으로 이끌어 낼 수 있는 게놈 정보를 검색하는 것을 어렵게 만드는 손상 및 분해의 넓은 범위를 전시합니다.

RNA 염기서열 분석에 의해 생성된 유전자 발현 데이터는 종종 질병 및 저항 메커니즘을 연구하는 데 중요한 역할을 하며 DNA 돌연변이 분석을 보완합니다. 그러나, RNA는 FFPE 조직에서 정확한 유전자 발현 데이터를 생성하는 것이 더 도전적이기 때문에 분해에 더 취약합니다. 더욱이, 시퀀싱의 광범위한 가용성 및 경제성이 비교적 최근이기 때문에, 오래된 표본은 종종 RNA 무결성을 보존하는 데 필요한 조건에서 저장되지 않았다. FFPE 견본을 위한 문제점의 몇몇은 파라핀에 포함하기 때문에 RNA의 분해, 시퀀싱에 요구되는 효소 프로세스에 단편화 또는 불응성으로 이끌어 내는 RNA의 화학적 수정, 및 폴리 A 꼬리의 손실을 포함합니다, 역전사제4를위한 프라이머로 올리고-dT의 적용성을 제한하는. 또 다른 과제는 조직에 있는 RNA와 같은 불안정한 분자의 추가 저하로 이끌어 낼 수 있는 최적이 아닌 조건의 FFPE 견본의 취급/저장입니다5. 이것은 RNA 염기서열 분석에 의한 유전자 발현 분석이 견본을 위해 예상되지 않았을 때 한 번에 집합되었을 수 있는 오래된 견본을 위해 특히 관련이 있습니다. 이러한 모든 경우 유용한 서열 데이터를 생성하는데 사용할 수 있는 추출된 RNA의 품질 및 양이 감소합니다. 성공 확률이 낮고, 시퀀싱 비용이 높기 때문에 많은 연구자들이 잠재적으로 유용한 FFPE 샘플에서 유전자 발현 데이터를 생성하고 분석하지 못하게 되었습니다. 최근 몇 년 동안 의 몇몇 연구 결과는 더 적은 및/또는 더 최근 견본을 위한 이기는 하지만 유전자 발현 분석2,,6,,7,,8,,9를위한 FFPE 조직의 유용성을 설명했습니다.

타당성 조사로서, 우리는 RNA 시퀀싱 및 유전자 발현 분석을 위한 감시, 역학 및 최종 결과(SEER) 암 레지스트리로부터 3개의 잔류 조직 저장소로부터 FFPE 종양 조직 표본으로부터 추출된 RNA를 사용하였다10. 임상 병리학 실험실에서 조달, 고급 난소 장액 선암에서 FFPE 조직은 RNA 추출 하기 전에 다양 한 조건 하에서 7-32 년에서 저장 되었다. 대부분의 경우에 이 블록은 미래에 어떤 민감한 유전 분석든지의 기대 없이 년 동안 다른 사이트에 저장되었기 때문에, 핵산을 보존하기 위하여 많은 주의를 취하지 않았습니다. 따라서, 대부분의 견본은 박테리아로 오염된 견본의 큰 비율로, 나쁜 질 RNA를 전시했습니다. 그럼에도 불구하고, 우리는 유전자 정량화를 수행하고, 유전자 커버리지의 균일성 및 연속성을 측정하고, 재현성을 측정하기 위해 생물학적 복제중 Pearson 상관 분석을 수행할 수 있었습니다. 주요 서명 유전자 패널의 세트에 기초하여, 우리는 암 게놈 아틀라스 (TCGA) 데이터와 우리의 연구 결과에 있는 견본을 비교하고 견본의 대략 60%가 비교한 유전자 발현 단면도11가있었다는 것을 확인했습니다. 다양한 QC 결과와 샘플 메타데이터 간의 상관관계를 바탕으로, 사용 가능한 시퀀스 데이터를 생성할 가능성이 높은 샘플을 식별하기 위한 예측 값이 좋은 주요 QC 메트릭을확인했습니다 11.

여기에서는 FFPE-RNA 품질 평가, 추출된 RNA 샘플에서 시작되는 시퀀싱 라이브러리 생성 및 시퀀싱 데이터의 생물 정보 분석에 사용되는 방법론을 설명합니다.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. RNA 수량 및 품질 평가

  1. 미리 정의된 기준에 따라 FFPE 샘플을 선택하고 적절한 방법(예를 들어, FFPE-핵산 추출 키트, 재료 표)을사용하여 RNA를 추출한다.
    참고 : FFPE-RNA 추출에 사용할 수있는 몇 가지 다른 방법이 있으며, 아주 적은 조직으로 작동하고 양질의 RNA12,13,,14를추출 할 수있는 새로운 미세 해부 방법을 포함합니다.
  2. 모든 단계에서 RNA의 무결성을 보존하기 위해 최대한주의를 기울여야합니다. 여기에는 RNase 무료 탈이온수 작업, RNase 무료 플라스틱 제품 사용, RNase 오염 제거 시약으로 FFPE 블록과 접촉하는 모든 기기 청소 등이 포함됩니다.
  3. RNA는 취급하는 동안 열화를 최소화하기 위해 달리 명시되지 않는 한 항상 신중하게 취급하고 얼음에 보관해야 합니다.
  4. 충분한 물질을 사용할 수 있는 경우, 가능한 한 많은 샘플에서 생물학적 복제를 생성하기 위해 FFPE 블록의 하나 이상의 영역에서 RNA를 추출합니다. 충분한 RNA 수율을 가진 몇몇 견본을 위해, 기술적인 복제로 처리하기 위하여 추출한 RNA를 2로 분할합니다.
  5. 가능하면, QC(즉, QC aliquot)에 대한 추출 후 소량의 샘플을 별도로 수집하여 RNA의 분해를 초래할 가능성이 있는 시료의 반복적인 취급 및 동결 해동 주기를 피한다.
  6. RNA의 품질(바람직하게는 QC aliquot에서) RNA QC 시스템(예를 들어, RNA 나노 칩을 사용하는 민첩한 바이오 분석기 시스템, 재료 표)에서실행하여 제조업체의 지침에 따라 확인합니다.
  7. DV 200 및 DV100 값을 200 nt(DV200) 또는 100 nt(DV100)크기로 백분율로 계산하여 샘플내RNA 프래그먼트의 분포를 분석합니다(예: Bioanalyzer 2100 Expert 소프트웨어 사용).200
  8. DV200 및 DV100중에서 지정된 샘플 집합에 대한 값의 더 큰 확산이 있는 메트릭을 식별하고 본인성 정도에 따라 샘플을 그룹화할 수 있는 메트릭을 선택합니다.
    참고: 더 많은 손상되지 않은 RNA 분자(즉, 높은 DV200 값, DV200 > 40%를 가진 대부분의 샘플 세트)의 경우, DV200은 유용한 QC 메트릭이 될 가능성이 높습니다. 그러나, 더 저하된 전사체(즉, 낮은 DV200 값, DV200 < 40%)가 있는 샘플 세트의 경우, DV100이 유용할 가능성이 더 높습니다.
  9. QC 메트릭을 기반으로 DV100 < 40%가 있는 샘플을 식별합니다. 이러한 정도의 성능 저하는 유용한 시퀀싱데이터(11)를생성하지 않을 가능성이 높기 때문에, 이러한 샘플처리를 피하는 것이 바람직하다. 이러한 시료를 교체할 수 있는 경우 DV100 > 50%의 샘플을 포함하도록 품질을 이상적으로 확인해야 합니다.

2. 시퀀싱 라이브러리 준비

  1. 섹션 1에서 평가된 샘플의 품질에 따라 시퀀싱 라이브러리를 생성하기 위한 적절한 방법을 식별합니다.
    1. 열화가 매우 적고 DV200 값이 높은 샘플 세트의 경우 mRNA 시퀀싱(즉, 폴리아데닐화된 전사체의 포획), 표적 RNA 염기서열 분석(즉, 관심 있는 특정 유전자에 대한 포획 프로브의 사용), RNA 엑솜 시퀀싱(즉, 코딩 전사체를 풍부하게 하는 포획 프로브의 사용), 또는 총 RNA 시퀀싱(즉, RNA 전체 RNA 를 시퀀스로 서열화하기 위한 무작위 프라이머 사용). 그러나, 고정 과정은 추출된 RNA에 바이어스를 도입할 수 있다는 점에 유의하는 것이 중요하다. 따라서 캡처 접근 방식은 DV200 값이 높은 경우에도 모든 경우에 잘 작동하지 않을 수 있습니다.
    2. 샘플 세트에 높은 분해(DV200 < 30%)가 포함된 시료를 포함하는 경우, 이러한 특정 영역이 분해된 샘플에서 누락될 수 있기 때문에 전사체의 특정 영역의 캡처에 의존하지 않는 총 RNA 라이브러리 준비 방법을 사용한다. cDNA의 생성을 위한 무작위 프라이머의 사용은 최종 라이브러리에서 사용 가능한 RNA의 더 높은 표현으로 이끌어 내고, 그러므로, FFPE RNA 견본을 위해 더 적합합니다.
    3. 분해가 높은 샘플 세트의 리보소말 RNA 고갈의 경우 RNaseH 기반 방법을 사용합니다. 이들은 rRNA 특이적 DNA 프로브가 rRNA에 결합하고, 이중 가닥 분자가 RNaseH에 의해 소화되고, 남은 프로브가 DNase에 의해 정리되는 방법들입니다(예를 들어, NEBNext rRNA 고갈 키트, 재료 표). 이러한 메서드는 다른 방법8보다성능이 저하된 샘플에 더 적합합니다.
  2. 시퀀싱 라이브러리를 생성하려면 RNA가 더 저하된 샘플(DV100 <, 60%)에 대해 더 높은 입력 량(가능한 경우)을 사용합니다. 합리적으로 좋은 품질의 RNA를 가진 샘플 동안 (DV100 > 60%) 더 낮은 입력 량(FFPE-RNA를 사용하여 이 프로토콜에 대해 가장 낮은 테스트된 것은 ~ 20ng),더 저하된 RNA(DV100 < 60%)에서도 양호한 서열 데이터를 산출할 수 있으며, 더 높은 입력 량(예를 들어, >100 ng)으로 시작하는 것이 좋습니다.
    참고: 충분한(예: >500 ng) 샘플을 사용할 수 있는 경우 필요한 경우 라이브러리 준비를 반복하기 위해 샘플의 절반 이상을 저장하는 것이 좋습니다. 낮은 입력 샘플(예: <100 ng)의 경우 일반적으로 전체 양을 사용하고 충분한 다양성라이브러리를 생성하는 것이 좋습니다.
  3. 열화가 높은 샘플에서 총 RNA seq 라이브러리를 생성하기 위한 적합한 라이브러리 준비 키트를 선택한 후(예: ILLumina용 NEBNext Ultra II RNA 라이브러리 준비 키트, 재료 표참조), 제조업체의 지침에 따라 라이브러리를 생성합니다.
    참고: 라이브러리 준비 동안, 분해된 시료에 대한 RNA 단편화 단계를 건너뛰고 첫 번째 가닥 cDNA 합성을 위한 무작위 프라이머의 사용을 보장하는 것이 중요합니다.
  4. 효율성과 속도를 향상시되리, 특히 낮은 입력 샘플의 경우 비드 기반 정화 및 크기 선택 단계에 강한 고정 자석이 있는 적절한 자기 랙을 사용하십시오(재료 참조).
  5. 어댑터 결부 DNA의 PCR 농축을 위해 입력 DNA의 양에 따라 증폭 주기 수를 조정하여 라이브러리 분자의 불필요한 중복을 피하면서 최대 표현을 보장합니다. 낮은 입력 FFPE-RNA 샘플(<100 ng)의 경우 16-18증폭 주기를 권장하며, 높은 입력 샘플(1,000ng)은 일반적으로 12-14회 증폭 라운드에서 충분한 라이브러리 양을 생성합니다.
  6. 제조업체의 지침에 따라 PCR 증폭 및 정리에 따라 적절한 플랫폼에서 라이브러리 농도 및 분자 분포를 분석하여 라이브러리 품질을 평가합니다(예: 민첩한 바이오분석기 DNA 칩, 재료 표참조). 프라이머 피크(~80bp) 또는 어댑터-디머 피크(~128bp)가 있는 시료의 경우 정리를 반복하여 해당 피크를 제거합니다.
  7. 각 라이브러리의 평균 라이브러리 크기를 계산합니다(예: Bioanalyzer 2100 Expert 소프트웨어 사용).

3. 시퀀싱 라이브러리 QC

  1. 라이브러리에 과도한 프라이머와 어댑터-디머가 없고 후속 시퀀싱에 충분한 농도가 있음을 확인한 후 qPCR로 추가 수량화합니다.
    참고: 클러스터 생성이 라이브러리 농도를 향한 민감도 때문에 비용이 많이 드는 시퀀싱 런이 성능 저하 또는 과부하를 방지하는 데 는 정확한 정량화가 필수적입니다. 정량적 실시간 PCR(qPCR) 방법은 초과 클러스터링을 초래하지 않으면서 Illumina 플랫폼에서 클러스터 밀도를 개선하는 데 유용합니다. qPCR 방법은 모든 라이브러리 분자(예: 민첩한 바이오분석기)의 정성적 및/또는 정량적 분석에 기반한 방법보다 더 정확하고 민감하며, 이는 플로우셀에 클러스터를 형성하는 양쪽 끝에 어댑터 서열이 모두 있는 템플릿을 측정하기 때문입니다. 그러나 결과를 표준 곡선과 비교할 수 있도록 모든 샘플에 크기 보정을 적용해야 하므로 라이브러리 크기를 미리 알려야 합니다.
    주의: 실험실 코트와 장갑은 qPCR을 수행할 때 항상 착용해야 하며 제조업체의 지침에 따라 생체 안전 캐비닛에서 절차를 수행해야 합니다.
    1. 적합한 키트(예: Illumina 라이브러리용 KAPA SYBR FAST qPCR 마스터 믹스, 라이브러리 정량화 키트의 일부, 재료 표참조)를 사용하여 각 샘플에 대해 3개의 복제본이 있는 96개의 웰 플레이트를 표준, 포지티브 컨트롤(예: PhiX 제어, 재료 표참조) 및 템플릿 제어 없음(NTC)을 설정합니다. NTC는 DNA 라이브러리없이 qPCR 혼합물이다. 양성 대조군은 공지된 농도 및 단편 크기를 가진 임의의 라이브러리일 수 있다.
      1. 공급업체 프로토콜에 따라 표준의 최소 6개 희석을 준비합니다.
    2. 모든 구성 요소 (즉, qPCR 마스터 믹스, 라이브러리, 표준)를 추가 한 후 밀봉 필름으로 플레이트를 덮고 스퀴지를 사용하여 필름이 플레이트와 균일하고 안전하게 접촉할 수 있도록합니다.
    3. 소용돌이와 적어도 1 분 동안 1,500 rpm에서 플레이트를 아래로 회전. 시각적으로 우물의 바닥에 기포가 없는지 확인하기 위해 플레이트를 검사합니다.
    4. 열 사이클러(예: CFX96 터치 시스템, 재료 표참조)에서 제조업체의 권장 설정을 사용하여 플레이트를 설정합니다.
    5. 데이터 분석을 위해 액세스할 수 있는 실행 폴더를 저장합니다.
    6. 데이터 분석 중에 경사가 -3.1 ~ -3.6 범위, 효율이 90%에서 110%이며R2(표준 곡선에 대해 얻은 상관 관계 계수)가 0.98이상인지 확인합니다.
  2. 풀링: 시퀀싱 준비 라이브러리의 qPCR 농도가 얻어지면 샘플당 필요한 시퀀싱 판독 횟수와 계측기의 시퀀싱 출력에 따라 각 라이브러리의 풀 등가량이 증가합니다.
  3. 풀의 QC: 3.1 단계에서 설명한 것과 동일한 프로토콜에 따라 qPCR을 통해 라이브러리 풀을 다시 정량화합니다.

4. 시퀀싱

  1. 실행 매개 변수에 따라 시퀀싱 시약 키트를 당기고 사용 설명서를 따라 해동합니다. Illumina 웹 사이트에서 Illumina 악기의 시퀀싱에 대한 모든 사용자 가이드의 최신 버전을 확인하십시오.
  2. 시약이 완전히 해동되었는지 확인하고 시약 트레이를 4 °C에 놓습니다. 시약이 해동된 후 2시간 이상 실행을 시작해야 합니다. 이렇게 하지 않을 경우 실행 결과의 품질에 영향을 줄 수 있습니다.
  3. 카트리지를 5x 반전하여 시약을 혼합하고 벤치를 가볍게 두드려 기포를 줄입니다.
  4. 포장되지 않은 플로우 셀 패키지를 실온에서 30분 동안 따로 둡니다.
  5. 플로우 셀 패키지를 풀고 보풀이 없는 알코올 닦음으로 유동 셀의 유리 표면을 청소합니다. 낮은 보풀 실험실 조직으로 유리를 건조.
  6. Illumina "실험 관리자" 응용 프로그램을 엽니다. "샘플시트 만들기"를선택한 다음 시퀀서를 선택하고"다음"을 클릭합니다.
  7. Illumina 시퀀서 기준(예: Illumina 실험 관리자, 소프트웨어 가이드)에 따라 샘플 시트를 만들고 업로드합니다.
  8. 프롬프트에서 시약 키트 바코드에서 스캔하고 설정 매개 변수 실행을 입력합니다(예: 단일 인덱싱된 PE 75 사이클 실행의 경우 76-8-76을입력합니다).
  9. 시퀀서 사용자 가이드 권장 사항에 따라 라이브러리 풀을 변성하고 희석합니다(예: Illumina의 NextSeq 500 시스템 가이드, 재료 표참조).
  10. 제어 라이브러리 PhiX(재료 표 참조)를적절한 농도로 변성하고 희석합니다(예를 들어, NextSeq에 대한 1.8 pM).
  11. 샘플 라이브러리와 PhiX 제어를 혼합하여 1% PhiX 제어 부피 비를 생성합니다.
  12. 변성 및 희석된 시료를 지정된 저장소의 시약 카트리지에 로드합니다.
  13. 플로우셀, 버퍼 카트리지 및 시약 카트리지를 로드합니다.
  14. 자동 검사 및 검토를 수행하여 실행 매개 변수가 시스템 검사를 통과하는지 확인합니다.
  15. 자동 검사가 완료되면 시퀀싱 실행을 시작하려면 시작을 선택합니다.

5. 데이터 분석 및 품질 평가

참고: 일반적인 RNA-seq 데이터 분석 워크플로우(그림1)에는전처리 및 QC, 게놈 및 사후 정렬 QC, 유전자 및 전사체 정량화, 샘플 상관 분석, 서로 다른 샘플 그룹 간의 차동 분석, 처리 조건 및 유전자 세트 농축 및 경로 분석이 포함됩니다.

RNA-seq 데이터는 유전자 프로파일링의 정확도에 영향을 미치고 잘못된 결론으로 이어질 수 있는 품질 문제가 있을 수 있습니다. 따라서 초기 QC는 시퀀싱 품질, 오염, 시퀀싱 커버리지 바이어스 및 기타 아티팩트 소스에 대한 검사를 매우 중요합니다. 여기에 설명된 워크플로와 유사한 RNA-Seq QC 파이프라인을 적용하면 아티팩트를 감지하고 다운스트림 분석 전에 필터링 또는 보정을 적용하는 것이 좋습니다.

  1. 전처리
    참고: 여기에는 다중화, 시퀀스 읽기 품질 평가, GC 콘텐츠, 시퀀싱 어댑터의 존재, 과대 표현된 k-mers및 PCR 중복 읽기가 포함됩니다. 이 정보는 시퀀싱 오류, PCR 아티팩트 또는 오염을 감지하는 데 도움이 됩니다.
    1. Demultiplex 일루미나 시퀀싱은 Illumina 소프트웨어 도구 bcl2fastq2를 사용하여 샘플 시트에 정의된 각 샘플에 대해 원시 FASTQ 파일을 생성합니다. 바코드 충돌이 없는 경우 샘플 인덱스 바코드에서 하나의 불일치가 시퀀싱 오류를 허용하도록 허용합니다.
    2. FASTQC15 소프트웨어 도구를 실행하여 원시 FASTQ 파일에 대한 품질 검사를 수행하여 시퀀싱 읽기의 품질 이나 이상이 없는 것을 감지합니다.
    3. 어댑터 및 저품질 베이스 트리밍의 경우 Cutadapt16 또는 Trimmomatic17 소프트웨어 도구를 사용하여 시퀀싱 어댑터와 낮은 품질의 베이스를 트리밍합니다. 쌍-끝 fastq 파일에 트리밍된 읽기를 저장합니다.
    4. 오염 스크린
      1. FASTQ_screen18을 실행하여다른 종과의 교차 오염 가능성을 감지합니다.
      2. Kraken219의 미니 크라켄을 실행하여 오염 종의 분류를 식별합니다.
  2. 참조 게놈 및 포스트 정렬 QC에 대한 정렬
    1. 트리밍된 판독값은 STAR정렬기(20)를사용하여 기준 게놈 서열(GRCh Build hg19 또는 hg38)에 정렬될 수 있다. 접합 된 전사체 정렬을 안내하기 위해 Gencode 부수 GTF 파일을 적용합니다. 새로운 접합 접합에 대한 민감도를 높이기 위해 STAR 2 패스를 실행하는 것이 좋습니다. 두 번째 패스에서는 모든 판독이 첫 번째 패스에서 추가된 유전자와 성적증명서 및 새로운 접합을 사용하여 다시 매핑됩니다.
    2. 정렬 후 QC를 수행합니다.
      1. Picard의21MarkDuplicates를 실행하여 샘플에서 고유하거나 중복되지 않은 읽기의 양을 결정하여 라이브러리 복잡성을 평가합니다.
      2. 피카드의 CollectRnaSeqMetrics 프로그램을 실행하여 코딩, 인트로닉, 내원성, UTR 영역 및 유전자 체 범위에 대한 매핑 백분율을 수집합니다.
      3. RSeQC22를 실행하여 읽기 쌍 내부 거리, CDS 엑손 간의 읽기 분포, 5'UTR, 3'UTR, 인트론, TSS_up_1kb, TSS_up_5kb, TSS_up_10kb, TES_down_1kb, TES_down_5kb, TES_down_10kb, 읽기 GC 콘텐츠, 접합 포화도 및 라이브러리 가닥 정보를 결정합니다.
      4. 다중 QC23을 실행하여 집계된 보고서를 HTML 형식으로 생성합니다.
  3. 유전자 정량화 및 교정 분석
    1. RSEM24를 실행하여 유전자 및 전사체에 대한 표준화된 판독 횟수뿐만 아니라 원시 카운트를 얻을 수 있습니다. RPKM(백만 읽기당 엑손 모델의 킬로베이스당 읽기), FPKM(매핑된 읽기당 엑손 모델의 킬로베이스당 단편), TPM(백만 개당 전사체)과 같은 판독 카운트 측정은 가장 자주 보고된 RNA-seq 유전자 발현 값입니다. 노이즈 임계값 미만으로 표현된 유전자(예: TPM < 1 또는 원시 카운트 <5)를 필터링할 수 있습니다.
    2. HTSeq 카운트 또는 기능 수와 같은 프로그램을 사용하여 각 성적표 시퀀스에 매핑된 판독의 원시 개수를 집계하기 위해 성적표 정량화를 수행합니다.
    3. R 스크립트를 사용하여 주 성분 분석(PCA)을 실행하여 배치 효과를 확인하고 지정된 데이터 집합 Principal Components Analysis 25의품질 맵을 평가합니다. 샘플 상관 분석은 상이한 메트릭 들 간의 Pearson 상관관계를 사용하여 수행될 수 있다.
  4. 차동 유전자 발현 분석
    1. 프로그램 edgeR26,,27 및/또는 limma-Voom28을 사용하여 샘플 조건 간의 유전자 차동 분석을 수행하고 TPM, TMM, DESeq또는 UpperQuartile을포함한 정규화 방법을 사용합니다.
    2. 비교를 위해 두 개의 DEG 목록을 호출하고 검출 감도와 정확도를 향상시키기 위해 최종 DEG를 얻으려면 적어도 두 개의 차동 분석 소프트웨어 도구를 실행하는 것이 좋습니다.
  5. 유전자 세트 농축 및 경로 분석
    1. 유전자 세트 농축 분석(GSEA) 29,,30을 수행하여 생물학적 조건 들 간의 통계적으로 유의하고 일치하는 차이를 보이는지 결정하기 위해 차등 발현 된 유전자 (DEGs) 목록의 측정에 따른 전사체의 순위에 기초한다.
    2. 유전자 온톨로지31, DAVID32,33기타 사용 가능한 소프트웨어 도구와 같은 리소스를 사용하여 기능 분석을 수행합니다.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

위에서 설명한 방법론은 7-32년 동안 다양한 조건하에서 저장된 67개의 FFPE 샘플에 적용하였다(중앙값 시료 저장 시간은 17.5년이었다). 여기에 제시된 데이터 집합 및 분석 결과는 Zhao 등11에이전에 기술되고 출판되었습니다. 앞에서 설명한 바와 같이 샘플 품질을 검사할 때(즉, 도 2의예시 트레이스), DV100은 고열RNA 샘플에 대한 더 작은 단편 크기의 비율을 정확하게 측정하는 것이 더 민감하기 때문에 DV200보다 더 유용한 것으로 나타났다.

주어진 샘플 세트에서, Illumina34에서권장하는 대로 샘플의 10% 미만(67개 중 7개)은 DV 200컷컷30%보다 높았습니다.200 샘플의 약 26%(67개 중 19개)는 DV100 > 60%(즉, 양호한 시퀀스 데이터를 생성할 가능성이 높음), 40%(67개 중 27개)는 DV100의 40%-60% 범위에 있었으며(즉, 양호한 시퀀스 데이터를 생성할 가능성이 낮지만, 67개 중 7개)는 DV100(67의 7개)이 매우 낮은 데이터(e.0.0)를 가졌다. 67개 샘플 중 14개에서 소프트웨어가 DV 값을 확인할 수 없습니다. 표 1은 상이한 DV100 카테고리의 샘플에 대한 QC 메트릭의 요약을 나타낸다. 모든 67개 샘플에 대한 자세한 QC 분석 및 데이터 상관 관계는 Zhao 등11을참조하십시오.

샘플 세트에서 높은 수준의 분해를 감안할 때, '토탈 RNA' 라이브러리 준비 방법을 선택하고, 일루미나용 NEBNext 울트라 II RNA 라이브러리 준비키트(표)를사용하여 시퀀싱 라이브러리를 제조하였다. 시료 열화의 높은 정도에도 불구하고 시퀀싱 라이브러리의 표현을 향상시키기 위해, 가능한 최대 RNA(사용 가능한 경우 1,000 ng)를 라이브러리 준비를 위한 입력으로 사용하였다. 추가적으로, FFPE-RNA 견본의 높은 분해는 rRNA 고갈 방법을 필요로 했습니다, 저하된 전사체는 mRNA 포획을 위한 폴리-A 꼬리를 갖지 않기 위하여 확률이 높았기 때문에. RNaseH를 사용하여 혼성화된 전사체의 특정 프로브 및 소화에 대한 혼성화에 의해 리보소말 RNA의 고갈에 이어, 나머지 전사체는 무작위 프라이머를 사용하여 cDNA로 전환되었다. 낮은 입력 샘플에서 준비된 라이브러리의 경우 크기 선택도 피할 수 있었습니다. 최종 라이브러리의 예제 트레이스는 그림 3에나와 있습니다.

고분해된 FFPE 샘플은 종양 샘플에서 유전자 발현 프로파일링을 위한 큰 도전을 나타낸다. 따라서 올바른 생물 정보학 분석 방법 및 소프트웨어 도구를 적용하면 데이터 세트의 아티팩트 또는 이상을 감지하여 유전자 정량화의 높은 정확도와 재현성을 보장하는 것이 중요합니다. 이 연구에 사용된 소프트웨어 도구는 보충 표에나열되어 있습니다. 주어진 샘플 세트에서는 그림 4에표시된 몇 가지 예제 메트릭과 함께 시퀀싱 및 라이브러리 품질 평가를 수행했습니다. 원시 fastq 파일 시퀀싱 품질 및 샘플 어댑터 콘텐츠에 대한 개요는 그림 4A그림 4B에각각 나와 있습니다. Fastqc 스크린은 그림 4C에표시된 샘플에서 세균 및 마우스 오염과 같은 오염을 감지하는 데 도움이 될 수 있습니다. 주어진 샘플 세트에서, 67개의 견본의 41는 5%-48% 세균성 오염이 있고, 6개의 견본은 4%-11% 마우스 오염이 있었습니다(그림 4C). STAR 정렬결과(도 4D)는기준 게놈에 매핑된 판독값의 비율, 참조 게놈에 고유하게 매핑된 판독비율, 및 다중 로시에 매핑되거나 매핑되지 않은 판독값의 비율을 나타냈다. 피카드 CollectRNA통계는 정렬 파일에 존재하는 백분율 mRNA, 인트로닉 및 간내 염기를 결정하는 데사용되었다(도 4E). 유전자와 전사체에 대한 읽기 범위의 균일성을 평가하기 위해, 우리는 유전자 신체 커버리지 플롯을 생성하는 Picard 소프트웨어 도구를 사용, 이는 모든 유전자의 각 뉴클레오티드 위치를 커버 읽기의 비율을 측정하는 것은 5′ UTR에 3′ UTR. 그림 4F는 일부 성능이 저하된 라이브러리가 3' 바이어스를 가지고 있으며, 여기서 더 많은 읽기가 5' 끝보다 3' 끝에 더 가깝게 매핑된다는 것을 보여줍니다.

FFPE 견본은 일반적으로 견본 저장, RNA 추출, 또는 견본 처리 도중 가변 저하 때문에 발생할 수 있는 유전자 발현 단면도에 있는 큰 가변성이 있습니다. 적절한 통계 적 방법을 사용하여 기본 패턴을 발견하고 샘플 간의 변동 및 상관 관계를 측정하는 것이 중요합니다. 우리는 67FFPE 견본의 부분 집합에서 생물학 복제의 6 쌍을 위한 주요 성분 분석 (PCA)를 적용했습니다. PCA 플롯은 전체 변동의 26%가 첫 번째 주성분에 의해 포착되었고 두 번째 및 세 번째 구성요소가 결합된 19%를 차지하는 것으로나타났습니다(그림 5). 6쌍의 복제물 중, 복제 쌍 2쌍은 복제 쌍 간의 유전자 발현 값을 비교할 때 마지막 4개의 샘플(0.7-0.8 사이의 상관값)보다 더 높은 변이(0.22 이하의 상관관계)를 가졌다. 복제본은 동일한 FFPE 블록에서 절단된 두 개의 상이한 조직 컬에서 RNA를 추출하여 생성되었기 때문에, 조직 연령은 여기에서 더 높은 분산의 요인이 아니었으며, 세균 오염의 다른 양에 의해 유발되었을 가능성이 높다(1%-55%) 뿐만 아니라 복제물 들 사이의 상이한 mRNA 함량(2-3배 차이)을 한다. 추출 후 mRNA 분해의 임의성은 또한 유사한 기원의 샘플 사이의 높은 차이에 기여할 수 있습니다.

Figure 1
그림 1: RNaseq 분석 워크플로우. 순서도는 전처리, 품질 평가, 참조매핑, 유전자 정량화 및 다양한 샘플 그룹 간의 차등 분석을 위한 분석 단계를 설명합니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 2
도 2: 6개의 상이한 FFPE-RNA 샘플의 예시 바이오분석기 트레이스. 수평축은 분자량(bp) 및 형광 단위(FU)를 나타내고 수직 축은 상이한 크기의 단편의 농도를 나타낸다. RNA 무결성 번호(RIN), DV200(즉, 조각의 백분율 >200 bp), DV100(즉, 조각의 백분율 >100 bp) 값이 각 프로파일에 표시됩니다. 각 프로파일에서 25 bp 피크는 분자량 마커를 나타낸다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 3
그림 3: 4개의 상이한 샘플에서 제조된 최종 라이브러리의 예시 바이오분석기 트레이스. 수평 축은 수직 축의 분자량(bp) 및 형광 단위(FU)를 나타내며, 다른 크기의 단편의 농도를 나타낸다. 하부(35bp 또는 50bp) 및 상부(10,380bp) 마커 피크는 각각 녹색과 보라색으로 표시됩니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 4
그림 4: QC 결과를 전처리하기 위한 다중 QC 보고서 예. (A)각 샘플에서 읽는 모든 시퀀싱의 Q30 베이스의 백분율을 보여주는 선부 차트입니다. (B)원시 fastq 파일에서 어댑터 콘텐츠를 시퀀싱합니다. (C)밀접하게 일치하는 종을 확인하는 오염 화면. (D)게놈 매핑 통계. (E) 젠코드 유전자 어노미에 기초한 분포읽기. (F)유전자 본문/성적 증명서 적용 범위는 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 5
도 5: 샘플 그룹 일치를 표시하는 예제 PCA 분석. 생물학적 복제에 대한 PCA 분석. 처음 두 주 성분에 투영을 사용하여 두 차원으로 플롯된 샘플이 있는 PCA 플롯입니다. 생물학적 복제는 동일한 색상으로 도시된다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

샘플 수 lib 준비를 위한 중앙값 입력(ng) 중앙값 린 중앙값 DV200 중앙값 DV100 중앙값 Lib 크기(bp) 평균 Lib 수율 (ng) 메디아 리브 몰러리티 (nM) 중앙값 시편 보관 시간(년) 중간 % 오염 중간 유전자 수
DV100 & 40% 7 237.6 2.5 6 34 445 24.5 7 22 27.4 14,759
DV100 40-60% 27 1000 2.5 12 51 408 19.8 5.9 18 9.9 10,202
DV100 >60% 19 1000 2.3 26 73 355 84.9 24 13 3.2 9,993

표 1: 샘플 세트 QC 메트릭의 요약입니다. 이 표는 DV100 값에 따라 그룹화된 샘플의 QC 메트릭을 보여 주었습니다. 각 그룹의 샘플 수가 나열되고 각 메트릭의 중앙값이 표시됩니다.

보충 표: 분석 소프트웨어 도구, 매개 변수 및 소프트웨어 참조. 이 표에는 RNA-seq 분석의 각 단계에서 사용되는 분석 소프트웨어 도구 및 매개 변수가 나열되어 있습니다. 소프트웨어 도구 참조가 표에 나열되어 있습니다. 이 표를 다운로드하려면 여기를 클릭하십시오.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

여기에 설명된 방법은 FFPE-RNA 샘플에서 양호한 서열 데이터를 얻는 데 필요한 주요 단계를 간략하게 설명합니다. 이 방법으로 고려해야 할 주요 사항은 다음과 같습니다: (1) 샘플 취급 및 동결 및 해동 주기를 최소화하여 추출 후 RNA가 가능한 한 잘 보존되도록 하십시오. 별도의 QC aliquots는 매우 유용합니다. (2) 지정된 샘플 세트에 가장 적합한 QC 메트릭을 사용합니다. RIN 값 및 DV200은 종종 열화된 샘플에 유용하지 않으며, DV100은 주어진 샘플 세트에서 품질을 평가하기 위한 선택의 메트릭일 수 있다. (3) 더 저하된 샘플의 경우 높은 샘플 입력을 사용하는 것이 가장 좋습니다. 입력량이 높을수록 최종 라이브러리의 다양성이 향상되고 중복이 낮아지므로 데이터 품질이 향상됩니다. FFPE-RNA 샘플의 모든 RNA가 효소 과정에 대한 높은 분해 및 내화성으로 인해 사용할 수 있는 것은 아니기 때문에 이러한 효과는 신선한 냉동 RNA에 비해 FFPE-RNA에서 더 두드러집니다. (4) 올리고-dT 또는 특이적 서열을 프라이머로서 사용하는 것과 는 반대로 역전사 단계에 대해 랜덤 프라이밍을 사용한다. 특정 프로브의 세트가 관심있는 모든 전사체에 대해 가능한 한 많은 서열을 커버할 수 없다면, 무작위 프라이머는 cDNA로 의 최대 수의 전사체(또는 단편)의 전환을 보장하기 위한 안전한 내기이다. 따라서, 총 RNA 라이브러리 준비 방법은 폴리-A 꼬리의 존재에 의존하는 mRNA 방법보다 분해된 샘플에 더 유용하다. (5) 정량적 실시간 PCR(qPCR)에 의한 라이브러리의 정확한 정량화는 시퀀서의 성능 저하 또는 과부하를 방지하는 데 중요합니다. (6) RNA-Seq QC 프로토콜을 시퀀싱하는 표준 포스트의 일부로 RNA의 잠재적인 오염을 평가합니다. 세균 오염 및 게놈 DNA 오염은 저장 조건 및 견본 준비 절차 때문에 FFPE 견본을 위해 일반적입니다. 외국 종으로 오염된 시료는 오염 정도에 따라 시퀀싱 커버리지를 낭비할 수 있습니다. 또한 내부 오염은 불완전한 rRNA 고갈로 인해 발생할 수 있으며, 이는 rRNA에 대한 읽기 매핑의 높은 비율로 이어집니다. DNase 소화 동안 비효율적인 게놈 DNA 제거는 전사체의 거짓 양성 발현 검출 또는 전사체의 잘못된 드노보 어셈블리로 이어질 수 있다. 라이브러리 준비 중에 도입된 어댑터 오염은 매우 짧은 RNA 단편을 가진 고분해된 RNA의 일반적인 문제이기도 합니다. 오염은 유전자 및 전사체 프로파일링 정확도에 영향을 미치고 잘못된 발견으로 이어질 수 있습니다. 따라서, 시료 또는 라이브러리 준비 단계 동안 오염원을 정확하게 식별하고 오염을 제거하거나, 데이터 처리 단계 동안 오염 판독을 필터링하는 것이 중요하다. (7) 전처리 및 후 정렬 품질 관리는 나쁜 품질과 낮은 mRNA 함량 샘플을 검출하는 데 중요합니다. 이러한 샘플은 추가 분석에서 제거되어야 합니다. 낮은 유전자 수를 생성하는 샘플에서 유전자 발현 데이터, 가난한 범위는주의해서 사용되어야한다. (8) 데이터 재현성을 보장하기 위해 샘플 분산 및 상관 관계를 측정하기 위해 생물학적 복제를 포함하는 것이 좋습니다.

FFPE 샘플은 많은 수의 질병에 대한 매우 귀중한 자원을 나타냅니다. 이러한 샘플에서 신뢰할 수 있는 서열 정보를 얻을 수 있는 능력은 다양한 장애, 저항 성 및 감수성 뒤에 있는 분자 메커니즘을 이해하기 위한 많은 연구를 도울 것입니다. 이러한 샘플에서 추출된 RNA의 빈번한 최적이 아닌 품질에 의해 부과되는 한계는 그러한 노력을 방해하지만, 여기에 설명된 단계는 이러한 한계를 어느 정도 완화하고 신뢰할 수 있는 유전자 발현 정보를 얻기 위해 FFPE-RNA를 최대한 활용할 수 있게 합니다.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

이 작품은 국립 암 연구소에 의해 투자 되었다 (NCI), 건강의 국가 학회 (NIH). Leidos 생물 의학 연구, Inc.는 NIH에 의해 완전히 투자되는 암 연구를 위한 프레드릭 국립 연구소를 위한 운영 및 기술 지원 계약자입니다. 몇몇 저자 (YZ, MM, KT, YL, JS, BT)는 Leidos 생물 의학 연구, Inc.와 제휴하고 있습니다, 그러나 저자의 모든 저자는 저자의 급여 및 연구 자료를 포함하여 국립 암 학회에 의해 완전히 투자됩니다. Leidos Biomedical Research, Inc.는 저자(YZ, MM, KT, YL, JS, BT) 또는 연구 용 자료에 대한 급여를 제공하지 않았으며, 연구 설계, 데이터 수집, 분석, 출판 결정 또는 원고 준비에 어떠한 역할도 하지 않았습니다.

Acknowledgments

우리는 다니엘 캐릭 박사에게 감사드립니다 (암 통제 및 인구 과학의 부, 국립 암 연구소) 지속적인 도움, 특히이 연구를 시작하고, 샘플을 제공하고, 데이터 분석 중에 유용한 제안을 위해. 우리는 진심으로 샘플 준비 및 시퀀싱 동안 자신의 도움을 위해 암 연구를위한 프레드릭 국립 연구소의 CCR 시퀀싱 시설의 모든 구성원에게 감사드립니다, 샘플 QC에 도움을 특히 브렌다 호, 도서관 QC에 대한 옥사나 독일어, 시퀀서를 실행하기위한 타티아나 스미르노바. 우리는 또한 데이터 분석 및 RNA-seq 파이프라인 구현을 돕는 시퀀싱 시설 생물 정보학 그룹의 Tsai-wei Shen및 애슐리 월튼에게 감사드립니다. 또한 RNaseq 분석 파이프라인 및 모범 사례 개발에 대한 지원을 위해 CCBR 및 NCBR에 감사드립니다.

Materials

Name Company Catalog Number Comments
2100 Bioanalyzer Agilent G2939BA
Agilent DNA 7500 Kit Agilent 5067-1506
Agilent High Sensitivity DNA Kit Agilent 5067-4626
Agilent RNA 6000 Nano Kit Agilent 5067-1511
AllPrep DNA/RNA FFPE Kit Qiagen 80234
CFX96 Touch System Bio-Rad 1855195
Library Quantification kit v2-Illumina KapaBiosystems KK4824
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina New England Biolabs E7765S https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) New England Biolabs E6310L
NextSeq 500 Sequencing System Illumina SY-415-1001 NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf
NextSeq PhiX Control Kit Illumina FC-110-3002
NSQ 500/550 Hi Output KT v2.5 (150 CYS) Illumina 20024907
10X Genomics Magnetic Separator 10X Genomics 120250
Rotator Multimixer VWR 13916-822
C1000 Touch Thermal Cycler Bio-Rad 1851197
Sequencing reagent kit Illumina 20024907
Flow cell package Illumina 20024907
Buffer cartridge and the reagent cartridge Illumina 20024907
Sodium hydroxide solution (0.2N) Millipore Sigma SX0607D-6
TRIS-HCL Buffer 1.0M, pH 7.0 Fisher Scientific 50-151-871

DOWNLOAD MATERIALS LIST

References

  1. Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
  2. Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
  3. Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
  4. Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
  5. von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
  6. Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
  7. Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
  8. Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
  9. Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
  10. Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
  11. Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
  12. Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
  13. Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
  14. Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
  15. Babraham Bioinformatics. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019).
  16. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
  17. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  18. Babraham Bioinformatics. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019).
  19. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
  20. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
  21. Broad Institute. , Available from: http://broadinstitute.github.io/picard/ (2019).
  22. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  23. Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
  24. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
  25. Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
  26. McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
  27. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  28. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
  29. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
  30. Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
  31. Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
  32. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  33. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  34. Evaluating RNA Quality from FFPE Samples. Illumina. , Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016).

Tags

유전학 문제 160 RNA 시퀀싱 포르말린 고정 파라핀 임베디드 FFPE 차세대 염기서열 분석 NGS RNA-seq 분석
저하된 FFPE-RNA 시료의 시퀀싱 및 분석을 위한 최적화
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Levin, Y., Talsania, K., Tran, B.,More

Levin, Y., Talsania, K., Tran, B., Shetty, J., Zhao, Y., Mehta, M. Optimization for Sequencing and Analysis of Degraded FFPE-RNA Samples. J. Vis. Exp. (160), e61060, doi:10.3791/61060 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter