Biology

교차 실험 비교를 위한 세포 주기 동기화 모델의 특성화 손실을 사용한 동기화된 시계열 데이터의 정렬

Published: June 9, 2023 doi: 10.3791/65466

Sophia A. Campione¹, Christina M. Kelliher², David A. Orlando³, Trung Q. Tran⁴, Steven B. Haase¹

¹Department of Biology, Duke University, ²Department of Biology, University of Massachusetts, ³Orlando Data Science LLC, ⁴Department of Computer Science, Duke University

Summary

동기화된 시계열 실험 분석의 한 가지 과제는 실험이 종종 동기 및 세포 주기 기간으로부터의 회복 기간이 다르다는 것입니다. 따라서 서로 다른 실험의 측정값을 집계하여 분석하거나 쉽게 비교할 수 없습니다. 여기에서는 단계별 비교가 가능하도록 실험을 정렬하는 방법을 설명합니다.

Abstract

세포 주기를 조사하는 것은 종종 세포가 세포 주기를 통과할 때 시계열로 다양한 매개변수를 측정하기 위해 세포 집단을 동기화하는 데 달려 있습니다. 그러나 유사한 조건에서도 반복 실험은 동기화에서 회복하고 세포 주기를 통과하는 데 필요한 시간의 차이를 나타내므로 각 시점에서 직접적인 비교가 불가능합니다. 실험 전반에 걸쳐 동적 측정을 비교하는 문제는 돌연변이 집단 또는 동기 회복 시간 및/또는 세포 주기 기간에 영향을 미치는 대체 성장 조건에서 악화됩니다.

우리는 이전에 세포의 동기 집단이 동기화에서 방출되고 세포 주기를 통해 진행되는 방식을 모니터링하는 CLOCCS(Characterizing Loss of Cell Cycle Synchrony)라는 파라메트릭 수학적 모델을 발표했습니다. 그런 다음 모델에서 학습된 매개 변수를 사용하여 동기화된 시계열 실험의 실험 시점을 정규화된 시간 척도(라이프라인 포인트)로 변환할 수 있습니다. lifeline scale은 실험 시작부터 경과 시간을 분 단위로 나타내는 대신 동기에서 세포 주기 진입까지의 진행을 나타내며 그 다음에는 세포 주기의 단계를 거칩니다. 라이프라인 포인트는 동기화된 모집단 내의 평균 세포 위상에 해당하기 때문에 이 정규화된 시간 척도를 통해 다양한 기간과 회복 시간을 가진 실험을 포함하여 실험 간에 직접 비교할 수 있습니다. 또한, 이 모델은 서로 다른 종(예: Saccharomyces cerevisiae 및 Schizosaccharomyces pombe) 간의 세포 주기 실험을 정렬하는 데 사용되어 세포 주기 측정을 직접 비교할 수 있어 진화적 유사점과 차이점을 밝힐 수 있습니다.

Introduction

세포주기가 진행됨에 따라 동기화된 세포 집단에 대한 시계열 측정은 세포주기 진행을 제어하는 메커니즘을 조사하기 위한 표준 방법입니다 1,2,3,4,5,6,7,8 . 동시성/릴리스 시계열 실험을 비교하는 기능은 이러한 동적 프로세스를 이해하는 데 매우 중요합니다. 결과를 확증하기 위해 반복 실험을 사용하면 결론의 재현성에 대한 신뢰도를 높일 수 있습니다. 또한 환경 조건, 돌연변이 간, 심지어 종 간의 비교를 통해 세포주기 조절에 대한 많은 새로운 통찰력을 발견 할 수 있습니다. 그러나 동시성으로부터의 회복 및 세포 주기 진행 속도의 실험 간 가변성은 복제물 간 또는 변경된 세포 주기 타이밍이 있는 실험 간에 시점 간 비교를 수행하는 능력을 손상시킵니다. 이러한 문제로 인해, 반복실험은 종종 전체 시계열(예: Spellman et ^al.4)에 포함되지 않습니다. 전체 시계열의 반복실험이 수집되면 데이터를 집계하여 분석할 수 없고 단일 반복이 분석에 사용되며 다른 반복실험은 종종 보충 수치로 강등됩니다(예: Orlando et ^al.8). 또한, 상이한 회복 또는 세포주기 진행 특성을 가진 실험 간의 비교는 어렵다. 관심 있는 사건과 세포 주기 랜드마크(예: 새싹 출현, S상 진입 또는 아나페이즈 시작) 사이의 더 작은 간격을 측정하면 이러한 랜드마크 이벤트를 추적하는 경우 오류를 줄이는 데 도움이 될 수 있습니다 1,2,3,9,10,11,12. 그러나 미묘하지만 중요한 차이는 이러한 임시 방법을 사용하여 감지되지 않거나 가려질 수 있습니다. 마지막으로, 단일 세포 분석은 동기화나 정렬에 의존하지 않고 세포 주기 진행을 분석할 수 있지만¹³, 단일 세포 연구에서 대규모 측정은 어렵고 비용이 많이 들 수 있습니다.

이러한 어려움을 극복하기 위해 우리는 동기화된 집단^14,15에 대한 시계열 측정 분석을 돕기 위해 CLOCCS(Characterizing Loss of Cell Cycle Synchrony) 모델을 개발했습니다. CLOCCS는 동기화된 세포가 동기화에서 해제되고 세포 주기를 통해 진행될 때 세포 주기 단계 전반에 걸쳐 동기화된 세포의 분포를 설명하는 유연한 수학적 모델입니다. 분지 과정 프레임워크를 통해 모델은 S. cerevisiae에서 관찰된 바와 같이 분열 후 모녀 세포의 비대칭 특성을 설명할 수 있으며 S. pombe와 같이 핵분열로 분열하는 유기체에 여전히 유용합니다. 이 모델은 다양한 측정 유형 세트에서 입력을 받아 셀 주기 단계를 지정할 수 있습니다. 그것은 시간 경과에 따른 발아 세포의 백분율 측정을 포함하는 발아 세포주기 단계 데이터를 수집 할 수 있으며, 발아되지 않은 G1 단계^14,15 외부의 세포 수를 추정 할 수 있습니다. 이 모델은 또한 DNA 함량을 측정하는 유세포 분석 데이터를 수집할 수 있으므로 G1에서 S로, S에서 G2로, M에서 G1로 획기적인 전이를 평가할 수 있습니다¹⁵. 형광 형태학적 마커는 또한 세포 주기 단계를 식별하는 데 사용할 수 있습니다. 미오신 고리, 핵 및 방추극체(SPB)의 형광 표지는 세포 주기 단계를 결정하는 데 사용할 수 있으며 이들은 CLOCCS 모델¹¹에 통합되었습니다. 그러나 이러한 측정은 이 프로토콜에서 설명되지 않습니다. 또한, septation index는 S. pombe¹⁴의 모델링 데이터를 위한 입력으로 사용되었습니다. 따라서 이 모델은 다양한 유기체의 세포 주기 분석에 사용할 수 있으며 추가로 확장할 수 있습니다.

CLOCCS는 입력 데이터에서 여러 매개변수(예: 신진 비율, DNA 함량)의 전체 베이지안 추론을 허용하는 매개변수 모델입니다. 이러한 매개변수에는 동기화로부터의 회복 시간, 세포 주기 기간의 길이(모녀 세포에 대해 별도로 추정됨) 및 각 시점에서 세포의 평균 세포 주기 위치가 포함됩니다. 이러한 매개변수는 모집단에서 평균 세포의 행동을 나타내므로 연구자는 각 시점을 생명선 지점으로 표현된 세포 주기 위치에 매핑할 수 있습니다. 라이프라인 포인트로의 변환은 CLOCCS 매개변수 lambda(λ) 및 mu0(μ₀)^14,15에 따라 달라집니다. 파라미터 λ는 모세포의 평균 세포 주기 주기에 상응한다. 그러나, 모녀 지연(^14,15)으로 인해^, 이것은 모녀 세포 모두를 포함하는 전체 집단의 평균 세포주기 기간이 아니다. CLOCCS는 모녀 지연에 해당하는 매개변수 델타(δ)를 추가로 추론하므로 전체 집단의 평균 세포 주기 기간을 계산할 수 있습니다. 마지막으로, 각 실험은 셀 주기 동기화에서 해제된 후에 시작되기 때문에 동기화 방법에서 복구하는 데 필요한 시간은 CLOCCS 매개 변수_{μ 0}으로 표시됩니다. CLOCCS는 입력 셀 사이클 위상 데이터에 모델을 피팅한 다음 랜덤 워크 마르코프 체인 몬테카를로 알고리즘^14,15를 사용하여 이러한 매개변수를 추론합니다. 여러 실험을 공통 세포 주기 수명 주기 시간 척도에 매핑함으로써 회복 시간 또는 세포 주기 기간이 동일하지 않은 복제 또는 실험 간에 직접적인 단계별 비교를 수행할 수 있습니다 8,14,15.

동기화된 모집단이 시계열^14,15,16,17 동안 어느 정도 동기화성을 잃기 때문에 동기화 손실률의 변동성은 실험 전반에 걸친 정량적 비교를 방해할 수도 있습니다. CLOCCS는 모집단의 위치와 분포의 분산을 식별하여 동시성 손실률의 차이를 설명합니다. 이 강력한 도구는 실험 전반에 걸쳐 구체적이고 상세한 비교를 가능하게 하여 복제물 간뿐만 아니라 환경 조건, 돌연변이 및 심지어 세포 주기 타이밍이 크게 다른 종 간에도 관련 비교를 직접 수행할 수 있는 기능을 제공합니다^14,15.

이 논문에서는 CLOCCS를 사용하여 동기/릴리스 시계열 실험의 데이터를 피팅하여 매개변수를 추정하고, 데이터를 공통 라이프라인 척도에 매핑한 다음, 반복 또는 실험 간에 관련 비교를 수행하는 방법을 설명합니다. 라이프라인 정렬을 통해 이러한 실험에서 직접 상별 비교가 가능하므로 복제물의 집계 및 비교가 가능하며 회복 타이밍 및 세포 주기 기간이 다른 실험 간에 보다 관련성 높은 비교를 수행할 수 있습니다.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. 세포주기 단계 및 실험 데이터 수집

원하는 동기화 방법을 사용하여 세포 주기에 대해 세포를 동기화한다 (예를 들어, Leman et al.18에 기술된 바와 같은 원심 용출 또는 Rosebrock 19에 기술된 바와 같은 짝짓기 페로몬 정지; Leman et al.18 및 Rosebrock¹⁹ 둘 다 동기화로부터 방출하기 위한 방법을 포함한다). 시계열 전체에서 샘플링을 시작하여 시계열의 길이가 최소 2개의 전체 셀 주기 기간인지 확인하고 최적으로 셀 주기당 최소 10개의 샘플을 수집합니다. 각 시점에서 아래에 설명된 대로 세포 주기 단계 데이터(신진 또는 유세포 분석)를 위한 샘플과 실험 데이터를 위한 샘플을 수집합니다.
신진 데이터를 세포 주기 단계 데이터로 사용하는 경우 CLOCCS 정렬을 위해 신진에 대한 데이터를 수집합니다.
1. 시계열 전체에서 샘플링합니다. 각 시점에 대해 세포를 수집하고 Leman et ^al.18에 설명된 대로 200μL의 초음파 처리된 세포 배양액과 200μL의 고정 용액을 혼합하여 고정합니다.
2. 표준 출아의 경우 40x 대물렌즈와 혈구계가 있는 투과광 현미경을 사용하여 시점당 최소 200개의 세포를 계산합니다. 세포 추가 amp1.2.1 단계의 le을 혈구계에 넣고 밀도가 계산을 방해하는 경우 희석합니다. 각 시점에서 싹이 트고 싹이 트지 않은 세포의 수를 기록합니다. 싹이 트는 세포의 백분율을 계산하고 싹이 트는 곡선의 각 시점에 대해 플로팅합니다.
  참고: 셀 사이클 단계 정보를 지정하는 다른 방법을 사용할 수 있지만 이 프로토콜에서는 설명하지 않습니다. 다른 방법은 CLOCCS readme 및 이전 작업¹¹에 설명되어 있습니다.
유세포 분석 DNA 함량 데이터를 세포 주기 단계 데이터로 사용하는 경우 유세포 분석 CLOCCS 정렬을 위해 유세포 분석 DNA 염색 데이터를 수집합니다.
1. 시계열 전체에서 샘플링합니다. 각 시점에 대해 세포를 수집하고 Haase 및 Reed²⁰에 설명된 대로 고정합니다.
2. DNA를 염색하고 표준 유세포 분석을 사용하여 분석합니다. S. cerevisiae 에 대한 권장 염색 프로토콜은 Haase and Reed²⁰에 설명되어 있습니다.
관련 오믹스 또는 관련 실험 데이터를 수집합니다. 표준 전사체 데이터의 경우 Leman et ^al.18 및 Kelliher et ^al.21,22에 설명된 대로 수집합니다. 다운스트림 정렬을 허용하기 위해 데이터가 셀 주기 단계 데이터를 포함하는 시점과 연관되어 있는지 확인합니다. 최적의 정렬을 위해 실험 데이터가 포함된 각 시점에 위상 데이터도 연결되어 있는지 확인하십시오.
참고: 실험 데이터는 다양한 형태를 취할 수 있습니다. 전통적으로, 우리는 시계열 전사체 실험을 정렬하기 위해 설명된 정렬 방법을 사용합니다. 그러나, 시점들과 연관된 임의의 타입의 데이터가 정렬될 수 있다(즉, 프로테오믹스(proteomics,²²).

2. 필요한 소프트웨어 설치

참고: 이 섹션에서는 Conda, Java 19 및 Git이 이미 설치되어 있다고 가정합니다(재료 표).

터미널에 다음 명령을 입력하여 CLOCCS_alignment 리포지토리를 다운로드합니다.
자식 복제 자식 복제 https://gitlab.com/haase-lab-group/cloccs_alignment.git
CLOCCS_alignment 리포지토리가 복제된 폴더의 터미널에 다음 명령을 입력하여 conda_req.yml 파일을 사용하여 Conda 환경을 만듭니다.
conda env create -f conda_req.yml

3. CLOCCS를 사용하여 실험 매개 변수화

CLOCCS_alignment 리포지토리의 CLOCCS 폴더에 있는 cloccs_v2023.jar 파일을 두 번 클릭하고 그래픽 사용자 인터페이스가 열릴 때까지 기다립니다. 이 화면에서는 CLOCCS 실행에 대한 옵션을 입력할 수 있으며 실행 후 결과를 표시합니다.
일반 설정을 입력합니다.
1. Sim Anneal, Burn In 및 Iterations를 관련 텍스트 입력 상자에 입력하여 설정합니다. Sim Anneal(시뮬레이션 어닐링)은 양호한 시작 파라미터 값을 식별하고, Burn In은 후방 모드를 검색하며, 최종 단계에서는 모든 후방 추론을 도출할 수 있습니다. 값이 높을수록 실행 시간이 늘어나지만 정확도도 높아집니다.
2. 온도를 섭씨로 지정하고 온도라고 표시된 텍스트 상자와 드롭다운 메뉴 Synchro를 사용하여 동기화 방법을 지정하여 실험 조건을 입력합니다. 방법, 각각.
3. 선택적으로 Advanced Settings(고급 설정) 메뉴에서 고급 설정을 구성합니다. 고급 설정을 사용하면 각 매개변수("mu0", "sigma0", "sigmav", "lambda", "bud.start", "bud.end")에 대해 사전을 설정할 수 있습니다.
  참고: 고급 설정에 대한 자세한 내용은 CLOCCS_alignment 리포지토리의 CLOCCS 폴더에 있는 readme.txt 찾을 수 있습니다.
시작 데이터에 사용할 설정을 입력합니다.
1. 모델 유형 드롭다운 메뉴에서 적절한 선택 항목을 선택합니다. 기본 옵션 Bud는 출아 효모에 대한 표준 출아 정보를 위한 것입니다.
  참고: 드롭다운 메뉴에는 다른 고급 옵션도 있습니다: 분열 없이 여러 번의 출아 주기를 거치는 돌연변이에 대한 출아 정보를 위한 돌연변이, 출아 정보 및 추가 스핀들 폴 바디 및 미오신 고리 정보를 위한 BudSSLSMR, 출아 정보 및 추가 분할 및 새싹목 핵 정보를 위한 BudNucDivNeck. 이러한 고급 옵션은 CLOCCS readme 및 이전 작업^11,14,15에 설명되어 있습니다.
2. 데이터 가져오기 패널을 사용하여 텍스트 입력 상자에 입력하거나 파일 선택 버튼을 클릭하여 파일을 업로드하여 데이터를 가져옵니다. 첫 번째 열은 시점을 지정합니다. 나머지 두 열은 새싹 데이터를 지정하며 새싹 제거되지 않은 셀 수(No Bud), 새싹 달린 셀 수(Bud) 또는 총 셀 수(Total) 옵션을 사용할 수 있습니다.
유세포 분석 데이터와 함께 사용할 설정을 입력합니다. 각 실험에 대해 3.3 단계 또는 3.4단계를 실행합니다.
참고: 유세포 분석 데이터와 신진 데이터를 함께 사용할 수 있습니다. 앞에서 함께 실행하는 것에 대해 설명했지만¹⁵, 이 도구의 경우 독립적으로 실행한 다음 비교해야 합니다.
1. 보충 파일 1(CLOCCS_alignment 리포지토리에 CLOCCS/flow_cytometry_conversion_instructions.txt으로도 있음)의 지침에 따라 .fcs 파일을 유세포 분석을 위한 올바른 CLOCCS 입력 형식으로 변환합니다.
2. 모델 유형(Model Type) 드롭다운 메뉴에서 흐름(Flow) 선택 항목을 선택합니다.
3. 데이터 가져오기 패널을 사용하여 데이터를 가져옵니다. 파일 선택을 클릭하고 3.4.1단계에서 생성된 파일을 선택합니다.
4. 피팅 횟수 상자에서 시점을 선택하여 유세포 분석 CLOCCS 피팅을 플로팅해야 하는 시점을 선택합니다.
신진 또는 유세포 분석에 대한 모든 입력이 선택되면 적용 버튼을 클릭한 다음 화면 상단의 샘플 버튼을 클릭합니다.
Predicted Fits 탭을 선택하여 예측 적합치가 있는 신진 곡선 또는 유세포 분석 플롯을 봅니다. 이 탭은 기본적으로 이전 단계 직후에 열립니다.
매개변수 히스토그램 탭을 선택한 다음 mu0, delta, sigma0, sigmav, lambda, bud.start, bud.end 등의 옵션에서 관심 있는 매개변수에 해당하는 하위 탭을 선택하여 각 매개변수에 대한 매개변수 히스토그램을 봅니다.
사후 점수 탭을 선택하여 사후 점수 그림을 봅니다.
설정을 보고 설정 탭을 선택하여 추가로 변경합니다. 로그 탭을 선택하여 이전 실행의 로그를 봅니다.
사후 매개변수(Posterior Parameters) 탭을 선택하여 피팅에서 CLOCCS 매개변수를 가져옵니다. 결과 테이블은 다음과 같은 형식을 갖습니다. 각 행은 매개 변수로 구성되며 마지막 행은 사후입니다. 열은 평균에 대한 예측 모수, 2.5% 신뢰 구간 하한, 97.5% 상한 신뢰 구간 및 합격률로 구성됩니다.
1. 각 실험에 대한 정렬에 사용된 파라미터, 즉 동기로부터의 회복 시간(μ₀) 및 모세포의 평균 세포 주기 기간(λ)을 기록합니다.
2. 모세포 기간(λ)과 딸 세포 기간(λ+δ)의 평균을 계산하여 세포 주기 기간을 계산하며, 여기서 δ는 딸 특이적 지연입니다.
  참고: 비교에 포함할 모든 실험에 대해 섹션 3을 반복합니다.

4. Python 변환 함수 및 CLOCCS 매개 변수를 사용하여 시점을 라이프라인 점으로 변환

참고: 시점과 라이프라인 지점 간의 변환에는 두 개의 변환 공식⁽²¹)이 필요합니다. 변환 및 데이터 시각화를 위한 Python 구현은 CLOCCS_alignment 리포지토리에서 사용할 수 있으며 아래에 설명되어 있습니다.

터미널에 conda activate 명령을 입력하여 Conda 환경을 활성화합니다CLOCCS_alignment
터미널에 jupyter notebook 명령을 입력하여 대화형 Python Notebook을 엽니다.
원하는 폴더에 새 Python Notebook을 만듭니다.
참고: 표준 사용을 보여주기 위해 예제 Notebook이 포함되어 있으며 CLOCCS_ 맞춤 리포지토리의 Alignment/JOVE_example.ipynb에서 찾을 수 있습니다.
첫 번째 셀에서 다음 명령을 실행하여 정렬 함수가 포함된 Python 파일을 가져옵니다.
%run path_to_repo/cloccs_alignment/Alignment/utilities를 실행합니다.py
1. CLOCCS_alignment 리포지토리의 경로를 path_to_repo로 대체합니다.
신진 데이터를 셀 주기 단계 데이터로 사용하는 경우 새 셀에서 다음 명령을 실행하여 각 시점의 신진 비율이 포함된 데이터 프레임을 가져옵니다.
budding_df = pd.read_csv("path_to_folder/budding_filename.tsv", sep ="\t", index_col=0)
1. 적절한 파일 경로와 파일 이름을 대체합니다. 파일이 .csv 파일인 경우 sep ="\t"를 제거하십시오.
신진 데이터를 셀 주기 단계 데이터로 사용하는 경우, 새 셀에 다음 함수를 입력하여 신진 데이터를 라이프라인 포인트 시간 척도에 맞춥니다.
aligned_budding_df = df_conversion_from_parameters(budding_df, 시점, param_mu0, param_lambda)
1. 시점의 경우 시점 목록을 budding_df 데이터 프레임의 인덱스로 대체합니다.
2. param_mu0 및 param_lambda의 경우 섹션 3의 신진 CLOCCS 실행에서 학습된 매개 변수를 실험으로 대체합니다.
유세포 분석 데이터를 사용하는 경우 새 셀에서 다음 명령을 실행하여 유세포 분석 데이터를 가져옵니다.
flow_samples = flow_cytometry_import(flow_input_folder)
1. flow_input_folder의 경우 유세포 분석 .fcs 파일이 포함된 폴더의 적절한 경로로 대체합니다.
유세포 분석 데이터를 사용하는 경우 새 셀에 다음 명령을 입력하여 각 실험의 시점과 수명선 지점 간의 변환표를 생성합니다.
flow_converter = convert_tp_to_ll(시점, param_mu0, param_lambda)
1. 시점의 경우 유세포 분석 데이터의 시점 목록으로 대체합니다.
2. param_mu0 및 param_lambda의 경우 실험을 위해 섹션 3에서 CLOCCS가 실행한 유세포 분석에서 학습된 매개 변수로 대체합니다.
새 셀에서 다음 명령을 실행하여 실험 데이터가 포함된 데이터 프레임을 Notebook으로 가져옵니다.
data_df = pd.read_csv("path_to_folder/exp_data_filename.tsv", 9월 ="\t", index_col=0)
1. 적절한 파일 경로와 파일 이름을 대체합니다. 파일이 .csv 파일인 경우 sep ="\t"를 제거하십시오.
  참고: 모든 테이블 형식 데이터에 대해 이 작업을 수행할 수 있습니다. 실험 데이터에는 단순히 시점이 데이터 프레임의 열 또는 인덱스로 있어야 합니다. 예제 데이터는 CLOCCS_alignment 리포지토리에서 찾을 수 있습니다.
새 셀에 다음 함수를 입력하여 실험 데이터를 라이프라인 포인트 시간 척도에 맞춥니다.
lifeline_aligned_df = df_conversion_from_parameters(data_df, 시점, param_mu0, param_lambda, 보간, 하한, 상위)
1. 시점의 경우 시점 목록을 이전 단계의 실험 data_df 인덱스 또는 열로 대체합니다.
2. param_mu0 및 param_lambda의 경우 CLOCCS에서 섹션 3에서 얻은 값을 대체합니다.
  참고: 매개 변수는 허용된 셀 주기 단계 데이터 형식 중 하나에서 수행된 모든 CLOCCS 실행에서 가져올 수 있습니다.
3. 필요에 따라 보간을 True 또는 False로 대체하거나 비워 둡니다(기본값은 False).
  참고: False로 설정하면 데이터가 보간되지 않습니다. True로 설정하면 라이프라인 포인트가 반올림되고 보간되어 라이프라인 포인트 사이의 값을 채우므로 라이프라인 포인트 범위 내에 정수당 포인트가 있습니다. 이를 통해 데이터 세트 간에 더 나은 비교가 가능합니다.
4. 필요에 따라 lowerll 및 upperll 을 None 또는 정수 값으로 대체합니다.
  참고: 없음으로 설정하면 보간 후의 모든 라이프라인 포인트가 유지됩니다. 정수가 제공되면 라이프라인 포인트의 범위가 lowerll 에서 upperll까지 데이터가 잘립니다. 이를 통해 다른 lowerll 또는 upperll을 사용하여 데이터 세트를 비교할 수 있습니다.
새 셀에 lifeline_aligned_df.to_csv("path_to_desired_location/name_of_file.tsv", sep = "\t") 명령을 입력하여 라이프라인에 맞춰진 데이터셋을 다운로드합니다.
비교에 포함할 모든 실험에 대해 4.5-4.11단계를 반복합니다.

5. 신진 곡선과 유세포 분석 데이터 비교

새 셀에 다음 명령을 입력하여 Python 유틸리티 함수를 사용하여 정렬하기 전에 새싹 곡선을 플로팅합니다.
plot_budding_curves(list_of_budding_curves, list_for_legend = leg_list, point_type = str_type, 제목 = str_title)
1. 원하는 모든 새싹 곡선의 데이터 프레임이 포함된 목록을 list_of_budding_curves-[bud_df1, bud_df2, bud_df3]에 대한 플로팅으로 대체합니다.
2. 원하는 경우 범례-[실험 1, 실험 2, 돌연변이]의 레이블 목록을 leg_list로 대체합니다. 그렇지 않은 경우 None을 제외하거나 대체합니다.
3. str_type 시간을 대체하십시오.
4. 원하는 경우 문자열 제목 Comparison Budding Curves 를 str_title로 대체합니다. 그렇지 않은 경우 None을 대체하거나 제외합니다.
5.1단계의 지침에 따라 Python 유틸리티 함수를 사용하여 정렬 후 신진 곡선을 플로팅하되, list_of_budding_curves 대신 정렬된 신진 곡선 목록을 사용하고 시간 대신 point_type 라이프라인을 사용하여 플로팅합니다.
유세포 분석 데이터를 플로팅하려면 4.8단계에서 생성된 변환기를 사용하여 해당 라이프라인 포인트에 .fcs 파일의 관련 데이터를 플로팅합니다.
변환기 테이블을 사용하여 라이프라인 포인트를 셀 주기 단계로 변환합니다(표 1).
참고: 5.1단계의 지침에 따라 그릴 수도 있지만 시간 대신 point_type 단계를 사용합니다.

6. 실험 데이터 비교

문헌 정보 또는 연구에 관심 있는 유전자를 기반으로 선 그래프에 표시할 유전자 목록을 결정합니다.
Python 유틸리티 파일에 제공된 plot_linegraph_comparison 사용하여 새 셀에 다음 명령을 입력하여 원본, 정렬 또는 정렬 및 보간된 데이터 프레임에 대해 선 그래프 비교를 수행합니다.
plot_linegraph_comparison(list_of_dfs, list_for_legend, 유전자 목록, point_type = str_type, 제목 = str_title)
1. list_of_dfs 위해 비교할 실험의 데이터 프레임 목록을 대체합니다.
  참고: 데이터 프레임은 정렬되지 않거나 정렬될 수 있습니다. 그러나 해당 point_type 6.2.4단계에서 입력해야 합니다.
2. list_for_legend에 대한 데이터 프레임 목록과 동일한 순서로 각 데이터 프레임의 제목 목록을 대체합니다.
3. 유전자 목록에 대해 플롯할 유전자 이름 목록(데이터 프레임의 인덱스에 포함되어야 함)을 대체합니다.
4. str_type 포인트 유형을 대체합니다. 6.2.1단계에서 정렬된 데이터 프레임에 대해 수명선 (기본값은 수명줄 포인트 스케일) 또는 위상 (셀 주기 단계 라이프라인 스케일)을 사용하거나 6.2.1단계에서 정렬되지 않은 데이터 프레임에 대해 시간을 사용하십시오.
5. str_title 대신 선택적 문자열 제목을 사용합니다.
상위 주기적 유전자를 결정하기 위해 문헌 또는 알고리즘을 사용하여 히트맵에 포함될 유전자 목록을 결정합니다.
참고: 적절한 히트맵 비교를 위해 6.2단계에서 데이터를 정렬, 보간 및 시간 척도 조정해야 합니다. 각 실험에 대해 동일한 시작 및 종료 수명줄 값을 가져야 합니다.
1. 주기성 알고리즘을 실행하여 상위 주기적 유전자(^23,24)를 결정하거나 원하는 대체 방법을 사용하여 유전자 목록(즉^, 문헌 결과)을 결정합니다.
2. 새 셀에서 다음 명령을 사용하여 .csv 또는 .tsv 유전자 목록 파일을 Notebook으로 가져옵니다.
  sort_df = pd.read_csv("path_to_folder/sorting_filename.tsv", sep="\t", index_col=0)
3. 적절한 파일 경로와 파일 이름을 대체합니다. 파일이 .csv 파일인 경우 sep="\t"를 제거합니다.
Python 유틸리티 파일에 제공된 함수 plot_heatmap_comparison 사용하여 새 셀에 다음 명령을 입력하여 정렬, 보간 및 위상 정렬 데이터 프레임에 대한 히트맵 비교를 수행합니다.
plot_heatmap_comparison(list_of_dfs, list_for_legend, 유전자 목록, 제목 = str_title)
1. list_of_dfs 비교하기 위해 실험의 정렬된 데이터 프레임 목록을 대체합니다.
2. list_for_legend에 대한 데이터 프레임 목록과 동일한 순서로 각 데이터 프레임의 제목 목록을 대체합니다.
3. 유전자 목록에 대해 플롯할 유전자 이름 목록(데이터 프레임의 인덱스에 포함되어야 함)을 대체합니다.
4. str_title 대신 선택적 문자열 제목을 사용합니다.
  참고: 목록의 첫 번째 데이터 프레임은 히트맵에서 유전자를 정렬하는 데 사용되는 데이터 프레임입니다. 유전자는 해당 데이터 프레임의 첫 번째 기간의 최대값으로 정렬되며 목록의 후속 데이터 프레임에 동일한 순서가 사용됩니다.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

위의 프로토콜과 그림 1 의 워크플로우에 설명된 단계를 5개의 세포 주기 동기화 시계열 실험에 적용하여 서로 다른 동기화 방법(짝짓기 페로몬 및 원심 용출¹⁸)을 사용한 복제물과 염기서열 분석 플랫폼(RNA 시퀀싱[RNA-seq] 및 마이크로어레이) 간의 두 가지 대표적인 비교를 입증했습니다. S. cerevisiae를 사용하여 여러 실험을 수행하고, 각 실험에 대해 세포 주기 단계 및 실험 데이터를 수집하였다. 워크플로에는 CLOCCS를 사용하여 다양한 동기화/릴리스 시계열 실험을 매개 변수화하고, 이러한 매개 변수를 사용하여 실험을 일반적인 비교 가능한 라이프라인 척도에 맞춘 다음, 두 가지 대표 비교에 이러한 정렬된 실험을 사용하는 작업이 포함됩니다.

반복실험 전반에 걸친 대표적인 비교를 입증하기 위해 동일한 균주와 동일한 실험 조건에서 수행된 세 가지 실험(조건 1)을 선택했습니다. 이 실험 중 2개는 서로의 직접 복제였으며 둘 다 마이크로어레이 분석을 통해 분석 되고 원심 용출을 통해 동기화되었습니다. 세 번째 실험은 RNA-seq 분석을 사용하여 분석되었으며 알파 인자 짝짓기 페로몬 정지를 통해 동기화되었습니다. 다양한 세포 주기 주기에 걸친 실험에 걸친 두 번째 비교를 입증하기 위해, 위의 조건 1 RNA-seq 실험(세포-주기 기간: 71분)을 조건 2(세포-주기 기간: 82분) 및 조건 3(세포-주기 기간: 110분)과 비교하였다(표 2). 각 실험에 대해, 세포는 각각의 조건에서 성장하고, 동기화되고, 방출되고, 그 다음 2개 이상의 세포 주기 기간에 걸쳐 샘플링되었습니다. 세포 주기 단계에 대한 정보를 제공하기 위해 신진 및/또는 유세포 분석 데이터를 수집하고, Leman et ^al.18(보충 표 S1)에 설명된 대로 마이크로어레이 또는 RNA-seq 시계열 전사체 데이터를 수집했습니다.

각 실험에 대해 데이터는 그림 2에 설명된 형식을 취했으며, 이는 데모를 위한 예로 조건 2 실험을 제시합니다. 각 데이터 세트에는 세포 주기 단계를 추론할 수 있는 신진 곡선이 있습니다. 이 곡선은 시계열의 각 시점에 대한 신진 백분율 값으로 구성되었으며, 이 값을 표시하여 여러 세포 주기 진동을 표시하는 신진 곡선을 생성했습니다(그림 2). 세포주기 단계 데이터는 또한 시계열의 각 시점에 대한 유세포 분석 DNA 함량 염색 데이터의 형태를 취했습니다. 조건 2에 대한 선택된 시점을 표시했습니다(그림 2). 유세포 분석 파일은 Python 유틸리티의 flow_cytometry_CLOCCS_file_from_fcs 함수를 사용하여 CLOCCS에 입력하기 위한 각 시점에 대한 각 로그 형광 빈의 셀을 포함하는 단일 테이블로 결합되었습니다. 각 데이터 세트에는 실험 데이터도 포함되어 있습니다. 이 경우 데이터는 전사체 데이터였으며 데이터는 각각 실험의 각 시점에서 RNA의 풍부도에 대한 값을 가진 유전자 행으로 구성되었습니다(그림 2).

우리는 CLOCCS의 사용과 조건 2 RNA-seq 데이터 세트에 대한 생명선 지점으로의 변환을 시연했습니다. 그러나 프로세스는 다른 실험에서도 동일했습니다. 출간 정보는 프로토콜 섹션 3에 설명된 바와 같이 및 도 3A에 도시된 바와 같이 CLOCCS 알고리즘에 입력되었다. Sim Anneal, Burn In, Iterations 및 Advanced Settings의 기본값이 사용되었습니다. 적절한 실험 조건을 선택하였다. "Bud"의 모델 유형을 신진 데이터에 사용했습니다. 결과적인 CLOCCS 출간 적합도는 해당 적합 곡선을 작은 95% 신뢰 대역으로 오버레이하는 데이터 포인트에 의해 입증된 바와 같이 출간 곡선이 적절하게 적합한지 확인하기 위해 관찰되었습니다(그림 3B 및 보충 그림 S1). 후방 매개변수 테이블(그림 3C)의 매개변수 μ₀ 및 λ는 정렬에 사용하기 위해 기록되었습니다. 조건 2에 대한 유세포 분석 데이터는 프로토콜 섹션 3에 설명된 대로 CLOCCS에 별도로 입력되었습니다. 현재 CLOCCS는 유세포 분석기가 1,024 개의 채널로 10 비트 데이터를 생성 할 것으로 예상합니다. 그러나 최신 유세포 분석기는 더 많은 채널을 가질 수 있습니다. 유세포 분석기는 1,024개 이상의 채널이 있는 데이터를 생성하기 때문에 데이터는 1,024개의 빈으로 분류되었습니다. 유세포 분석 세포 주기 단계 데이터를 사용하여 CLOCCS는 선택한 각 시점에 대한 CLOCCS 적합도를 생성하고(그림 3D 및 보충 그림 S2) 그림 3C의 신진 사후 매개변수 표와 유사한 사후 매개변수 테이블을 제공합니다. CLOCCS가 다른 실험들 각각에 대해 실행하는 출아에 대한 파라미터는 표 2에 기재되어 있고, CLOCCS가 실행하는 유동 세포측정에 대한 파라미터는 보충표 S2에 기재되어 있다.

모세포의 세포 주기 주기(λ) 및 회복 시간(μ₀)에 해당하는 CLOCCS 파라미터를 라이프라인 정렬에 사용하였다. λ가 반드시 세포 집단의 평균 세포 주기 주기를 나타내는 것은 아니라는 점에 유의하는 것이 중요합니다. 세포가 완전히 분열하는 경우, 동일한 수의 모세포와 딸 세포가 존재하므로, 평균 세포주기 기간은 모세포의 세포주기 기간 (λ)과 딸 세포의 세포주기 기간 사이의 평균 (λ + δ); 특히, 델타(δ)는 딸 특정 지연의 길이이다. 이것은 각 실험의 세포 주기 기간에 대해 사용한 계산입니다(표 2). 각 실험에 대해 해당 매개 변수 λ 및 μ₀ 은 조건 2에 대해 설명된 대로 Python 유틸리티 파일에 제공된 변환 함수 df_conversion_from_parameters에 사용되었습니다(그림 4A). 신진 곡선의 경우 데이터가 보간되지 않았습니다. 그러나 실험 데이터의 경우 각 라이프라인 포인트에 향상된 플로팅을 위해 보간된 데이터가 포함되도록 보간을 사용하여 라이프라인 정렬 데이터 세트를 다시 샘플링했습니다. 라이프라인에 맞춰진 데이터셋에 동일한 라이프라인 포인트 범위가 포함되도록 하기 위해 라이프라인 하한과 상한이 설정되어 해당 포인트의 데이터가 잘립니다. 이러한 lowerll 및 upperll 매개 변수는 보간이 True로 설정될 때 df_conversion_from_parameters 함수에 입력되었습니다. 조건 1 비교의 경우 모든 데이터 세트에 대해 각각 44 및 270으로 설정되었으며 환경 조건 간 비교의 경우 각각 50 및 300으로 설정되었습니다. 정렬 및 비교를 위해 이러한 함수를 사용하는 예제는 Python Notebook JOVE_example.ipynb 예제에서 볼 수 있으며, 그림을 생성하는 데 사용되는 코드는 CLOCCS_alignment 리포지토리의 JOVE_Figures.ipynb Notebook에서 볼 수 있습니다.

시점으로부터 라이프라인 점으로의 이러한 변환은 μ₀(회복 시간) 및 λ(어머니 기간)를 사용하는 두 개의 공식(21)(도 4A)에 의존한다. 첫 번째 공식은 Equation 1 회복 단계 공식입니다(그림 4A). 이 수식은 μ 0이 복구 시간에 해당하므로 μ₀까지의 시점으로 구성된 복구 단계 내의 시점에만 사용됩니다. 그런 다음 시점은 100개의 생명선 지점으로 끝나는 수명선 척도 범위로 변환되며(표 1), 회복 단계의 끝과 첫 번째 세포 주기의 시작을 표시합니다. 복구 후 단계에서는 두 번째 수식(그림 4A)을 사용하며, Equation 2 이 수식은 이후의 각 복구 후 시점을 100 이후의 라이프라인 시점으로 변환합니다. 각각의 후속 100개의 라이프라인 포인트는 새로운 셀 사이클에 해당하며, 첫 번째 사이클은 라이프라인 포인트 100 내지 200에 해당하고, 두 번째 사이클은 라이프라인 포인트 200 내지 300에 대응하는 식이다(표 1). 시점 포인트에서 라이프라인 포인트로의 변환은 해당 데이터 세트에 해당하는 CLOCCS 매개변수를 사용하여 각 데이터 세트에 개별적으로 적용됩니다. 각 데이터 세트가 라이프라인 스케일로 변환된 후 세포 주기 단계가 정렬되어 데이터 세트 간에 단계별 비교가 가능합니다.

표 3 은 신진 CLOCCS 실행의 매개변수를 사용하여 조건 2 데이터 세트의 대표 변환을 위해 선택한 시점을 각각의 라이프라인 지점으로 변환하는 것을 보여줍니다. 조건 2 RNA-seq에서 수집된 출아 데이터는 Python 노트북에서 plot_budding_curves Python 함수를 사용하여 정렬되지 않은 시간 척도(분 단위)와 라이프라인 포인트의 정렬된 시간 척도(그림 4C) 모두에 대해 시간 경과에 따른 출간 백분율을 보여주는 출아 곡선에 표시되었습니다. 라이프라인 포인트는 실험 및 세포 주기 단계 정보로 쉽게 변환될 수 있으며(표 1), 회복 단계와 첫 번째에서 세 번째 세포 주기는 그에 따라 손으로 색상으로 구분되었습니다(그림 4B, C). 각 라이프라인 포인트는 세포 주기 단계에 해당하기 때문에 라이프라인 정렬에 의해 결정된 세포 주기 단계를 사용하여 Python 함수를 통해 개별 유세포 분석 플롯에 레이블을 지정할 수 있습니다. 이들 상은 조건 2에 대한 유세포 분석을 통해 결정된 상과 일치하였다. 조건 2 데이터 세트에 대해 수집된 유세포 분석 데이터는 선택된 시점에 대해 플롯팅되고 유세포 분석 라이프라인 정렬에서 결정된 세포 주기 단계를 사용하여 레이블링되었습니다. 각각의 경우 데이터는 정렬에 의해 결정된 위상과 일치합니다(그림 4D).

각 샘플에 대한 각 유전자의 발현 수준은 동일하게 유지되지만 시점의 라벨링은 분 단위의 시간에서 생명선 지점으로 변경된다는 점에 유의하는 것이 중요합니다. 그러나 변환은 선형이 아닙니다. 회색으로 강조 표시된 복구 단계는 라이프라인 포인트로의 변환이 수행되면 실험 시간의 더 높은 비율을 차지합니다(그림 4B, C). 라이프라인 스케일의 장점은 실험 전반에 걸쳐 상세한 위상 정보와 위상 비교가 가능하다는 것입니다. 위상 정보는 위에서 설명한 대로 표 1에 표시된 대로 라이프라인 포인트에 포함되어 있습니다. 또한 G1은 각 세포 주기의 처음 15.5개 생명선 지점에, S는 다음 20개 생명선 지점에, G2/M은 다음 64.5개 생명선 지점에 포함됩니다(표 1). 그러나, 이는 회복 단계가 원래의 시점 척도에서 매우 짧게 나타나더라도, 각각의 연속적인 세포 주기의 동일한 시간 범위로 회복 시간을 인위적으로 제한한다. 이것은 각 실험의 단계가 정렬되어 있기 때문에 비교를 모호하게 하지 않습니다. 대부분의 경우 분 단위로 동시에 발생하는 시점보다는 동일한 실험 및 생물학적 단계에서 발생하는 지점에서 데이터를 비교하는 것이 더 적절합니다.

모든 실험이 Python 유틸리티 파일에 제공된 Python 함수를 사용하여 정렬된 라이프라인 척도로 변환되면 비교할 수 있습니다. 여기서는 실험 간의 두 가지 일반적인 비교, 즉 플랫폼과 동기화 방법 간에 유사한 실험의 반복 분석(그림 5)과 기간 길이가 변경되는 서로 다른 실험 조건 간의 비교(그림 6 및 그림 7)를 보여줍니다. 위에서 설명한 바와 같이, 첫 번째 비교는 2개의 용출된 마이크로어레이 복제물과 1개의 알파 인자 동기화 RNA-seq 실험에 걸쳐 있습니다. 정렬 전에 두 마이크로어레이 복제물은 유사한 동기화 및 세포 주기 역학을 보였지만 조건 1 마이크로어레이 2 복제는 약간 지연된 것으로 나타났습니다(그림 5A). 정렬되지 않은 데이터 세트를 비교할 때 가장 두드러진 차이점이 발견되었습니다. 조건 1 RNA-seq 두 번째 주기는 두 마이크로어레이 실험의 첫 번째 주기와 일치하는 것으로 나타났습니다. 그 차이는 다른 전사체 플랫폼과 관련이 있는 것이 아니라 다른 동기화 방법과 관련이 있을 가능성이 큽니다. 마이크로어레이 실험의 세포 집단은 원심 용출에 의해 동기화되었고, RNA-seq 실험의 집단은 짝짓기 페로몬 처리에 의해 동기화되었습니다. 실제로, 짝짓기 페로몬과의 동기화는 용출에 비해 회복 시간을 실질적으로 단축시켰다 (그림 5A 및 표 2).

경과 시간 측면에서 표시했을 때 반복실험 간의 명백한 차이에도 불구하고 라이프라인 정렬 후 곡선은 거의 동일했으며 반복실험 간에 보다 상세하고 관련성 있는 비교가 가능했습니다(그림 5B). 회복 단계는 각 실험이 동일한 라이프라인 지점에서 시작되도록 정렬되었고, 기간의 변동은 라이프라인 정렬에 의해 정규화되었습니다. 정렬로 인해 반복실험 전반에 걸쳐 동일한 라이프라인 지점의 실험 값이 동일한 세포 주기 단계에서 발생하므로 반복실험 전반에 걸쳐 실험 분산을 계산할 수 있습니다. 회수 및 세포주기 단계는 각 실험에서 세포주기 단계에 대한 추가 정보를 제공하기 위해 그림 5B에 표시되어 있습니다. 그런 다음 위에서 설명한 대로 유틸리티 파일에 제공된 Python 함수 df_conversion_from_parameters 사용하여 이 라이프라인 정렬을 실험 데이터 세트(그림 5C,D)에 적용할 수 있습니다.

그림 5D에서 전사체 데이터를 정렬하고 Python 노트북의 plot_linegraph_comparison Python 함수를 사용하여 CDC20 유전자에 대한 발현 역학을 플로팅했습니다. 정렬 전에, 마이크로어레이 실험의 첫 번째 피크 발현이 RNA-seq 실험의 두 번째 피크와 정렬된 것처럼 나타났다(도 5C); 그러나 정렬 후 각 데이터 세트의 첫 번째 세포 주기 피크가 적절하게 정렬되었습니다(그림 5D). 또한, 실험의 피크 너비는 RNA-seq 데이터 세트와 마이크로어레이 데이터 세트 간에 다른 것으로 나타났지만 정렬 후 피크 너비가 더 정렬되었습니다(그림 5C, D).

두 번째 비교는 서로 다른 세포 주기 주기를 가진 서로 다른 환경 조건에서의 실험 간의 비교입니다(그림 6). 위에서 설명한 바와 같이 여기에서는 조건 1의 S. cerevisiae 데이터 세트를 각각 71분, 82분 및 110분의 세포 주기 기간에 해당하는 조건 2 및 조건 3과 비교했습니다. 세포 주기 주기의 이러한 차이는 정렬되지 않은 신진 곡선에서 볼 수 있듯이 세포 주기 위상 정렬 전에 실험 전반에 걸쳐 비교할 때 불확실성을 초래했습니다. 주기 차이는 정렬되지 않은 신진 곡선에서 볼 수 있습니다(그림 6A). 그러나 이 프로토콜을 사용하여 CLOCCS를 정렬했을 때 세 곡선이 현저하게 유사해 보였으므로 실험 데이터의 비교가 가능했습니다(그림 6B).

유세포 분석 CLOCCS 파라미터를 사용하여 조건 1 및 조건 2를 공통 라이프라인 스케일에 정렬하고 DNA 함량 히스토그램을 조건 2 및 조건 1의 동등한 라이프라인 지점에 플롯팅했습니다. 라이프라인 포인트에 걸친 DNA 함량의 유세포 측정을 비교했습니다(그림 6C). DNA 함량 측정이 연속적이지 않고 쉽게 보간되지 않았기 때문에 가장 가까운 생명선 지점만 비교할 수 있었습니다. 비교 가능한 각 라이프라인 포인트에 대한 세포 주기 단계 데이터는 두 조건 간에 동일하지 않았으며(그림 6C), 이는 CLOCCS 적합치와 결과 매개변수가 조건 1에 대해 약간 잘못 정렬되었을 가능성이 있음을 나타냅니다. 이는 조건 2에 비해 조건 1에 대한 유세포 분석 데이터에 대한 CLOCCS 적합성이 더 낮기 때문일 수 있습니다(보충 그림 2). 그러나 정렬은 하나의 샘플에서만 벗어났으므로 여전히 개선된 위상별 비교가 가능합니다.

이어서, 실험 데이터에 대한 df_conversion_from_parameters 함수의 출아 CLOCCS 파라미터를 사용하여 조건 1, 조건 2 및 조건 3(도 7)에서 RNA-seq 실험에 대한 실험 데이터에 신진 라이프라인 정렬을 적용하였다. 전사체학 데이터를 정렬하고, 각 시계열별 CDC20 유전자의 유전자 발현을 3개의 실험에 대해 나타내었다. 정렬 전에 CDC20 의 전사체 역학은 겹치지 않았습니다(그림 7A). 정렬 후, CDC20 유전자 발현의 첫 번째 및 두 번째 피크는 세 데이터 세트 모두에 대해 훨씬 더 밀접하게 정렬되었습니다. 정렬 후, 피크가 동일한 세포 주기 단계에서 발생했지만 곡선의 모양이 다르다는 것이 분명해졌습니다(그림 7B). 조건 3은 세포 주기 기간의 차이를 고려한 후에도 다른 두 조건에 비해 더 낮고 더 넓은 첫 번째 피크를 가졌으며, 이는 이러한 차이가 테스트 중인 실험 조건과 관련이 있을 가능성이 있음을 시사합니다(그림 7B).

대규모 전사체 비교도 가능합니다. 이러한 비교를 위해 각 데이터 세트에서 주기성 알고리즘 JTK_CYCLE 23을 실행하고 상위 주기 유전자의 교차점을 취하여²⁷⁸ 개의 유전자를 선택했습니다. 그러나, 유전자는 임의의 원하는 방법을 사용하여 또는 문헌으로부터 선택될 수 있다. 이 유전자는 Python 노트북에서 plot_heatmap_comparison Python 함수를 사용하여 정렬되지 않은(그림 7C) 히트맵과 정렬된(그림 7D) 히트맵 모두에 대해 세 가지 조건 모두에 대해 동일한 순서로 표시되었습니다. 이러한 히트맵을 사용하면 수백 개의 유전자 수준 비교를 동시에 수행할 수 있습니다. 곡선 역학의 변화, 이웃 유전자에 대한 피크 시간 및 기간 길이 등에 대해 정렬되지 않은 실험을 비교할 수 있습니다(그림 7C). 그러나 시점이 조건 전반에 걸쳐 동일한 세포 주기 단계와 반드시 상관관계가 있는 것은 아니기 때문에 상세한 단계별 비교를 수행할 수 없었습니다. 두 번째 주기는 정렬 후 유사하게 나타났지만 첫 번째 주기는 조건 간에 약간 이동했습니다(그림 7D). 이러한 변화는 신진 세포주기 단계 정보가 조건 3에 대해 더 낮은 품질이었다는 사실을 반영할 수 있습니다. 그럼에도 불구하고, 세 가지 조건에 대한 실험의 정렬은 개선된 단계별 비교를 가능하게 했습니다. 정렬 이전에, 각 조건에서 발현의 첫 번째 피크가 동일한 세포주기 단계에서 발생하는지 여부가 불분명했다 (그림 7C); 그러나, 정렬 후, 실험은 단계별 방식으로 비교될 수 있었다(도 7D). 정렬 전에, 조건 3의 피크는 다른 두 조건에서보다 훨씬 더 넓게 나타났다 (도 7C); 그러나, 정렬 후, 조건 3의 피크는 정렬될 때 다른 조건과 유사한 폭을 갖는 것이 분명해졌다(도 7D).

이러한 대표적인 결과는 CLOCCS를 사용하여 실험을 공통 시간 척도에 맞추는 프로세스를 보여줍니다. 정렬 전에 직접 시점 비교는 종종 유사한 세포 주기 단계와 상관관계가 없습니다. 경과된 실험 시간(분)을 세포 주기 단계를 나타내는 생명선 지점으로 변환하면 세포 주기의 동일한 지점에서 실험 간에 단계별 및 생물학적으로 관련된 비교가 가능합니다.

그림 1: CLOCCS 라이프라인 정렬 워크플로우 개요. CLOCCS를 사용하여 두 개의 예제 데이터 세트를 정렬한 후 데이터 세트 간의 대표 비교를 위한 실험적 워크플로입니다. 프로토콜의 주요 단계는 각 데이터 세트에 대한 정렬되지 않은 세포 주기 단계 및 실험 데이터 수집(1단계), 각 데이터 세트의 매개변수화를 위한 CLOCCS 사용(2단계 및 3단계), 공통 라이프라인에 대한 데이터 세트의 정렬(4단계), 마지막으로 세포 주기 단계와 실험 역학의 비교(5단계 및 6단계)입니다. 정렬되지 않은 세포 주기 단계 데이터는 CLOCCS에 입력되어 학습된 매개변수를 제공한 다음 공통 라이프라인 척도에 정렬하는 데 사용됩니다. 그런 다음 이러한 정렬된 데이터 세트를 비교합니다. 약어: CLOCCS = 세포주기 동기화의 특성 분석. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 2: 워크플로우에 필요한 세포 주기 단계 및 실험 데이터의 형식. 워크플로우에 필요한 데이터는 세포 주기 단계 데이터와 세포 주기 실험 데이터의 두 가지 주요 구성 요소로 구성됩니다. 세포주기 단계 데이터는 시계열의 각 시점에 대한 세포주기 출아 데이터 또는 유세포 분석 DNA 함량 데이터로 구성될 수 있습니다. 실험 데이터는 다양한 형태를 취할 수 있지만, 이 경우 시계열의 모든 시점에 대한 각 유전자에 대한 유전자 발현 데이터로 구성된 전사체 데이터입니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 3: S. cerevisiae 세포 주기 데이터 세트에서 CLOCCS를 실행한 결과의 예. (A) 조건 2 시작 데이터에 대해 제공된 입력 값 및 설정이 있는 CLOCCS 그래픽 사용자 인터페이스의 스크린샷. 시간, 싹이 트지 않은 세포의 수, 싹이 트는 세포의 수, 모델 유형, 반복 및 조건 등이 입력됩니다. (B) 결과의 "예측 적합도" 탭 아래에 있는 조건 2에 대한 결과 CLOCCS 출아 적합도의 스크린샷. 각 데이터 포인트에는 데이터의 95% 이항 비율 신뢰 구간에 해당하는 연관된 샘플링 오차 막대가 있습니다(각 시점에 대해 최소 200개의 셀이 계산되었습니다[204셀에서 295셀 사이]). 결과 신진 적합 곡선은 CLOCCS 적합치의 95% 신뢰 구간에 대한 신뢰 구간을 보라색으로 보여줍니다. (C) 평균, 2.5% 신뢰 구간 및 97.5% 신뢰 구간에서 CLOCCS 매개변수로 구성된 조건 2 신진 CLOCCS 실행에 대한 결과 "사후 매개변수" 테이블의 스크린샷. 사후 및 합격률도 표시됩니다. (D) 유세포 분석 CLOCCS의 스크린샷은 70분 및 150분에서 조건 2에 적합합니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 4: 조건 2 데이터 세트에 대한 시점 지점에서 정렬된 라이프라인 지점으로의 변환 프로세스 예 . (A) 시점을 라이프라인 포인트로 변환하는 데 사용되는 변환 공식입니다. 시작 곡선을 변환하고 그리기 위한 Python Notebook의 Python 함수 스크린샷입니다. (B) 정렬되지 않은 조건 2 출아 곡선은 분 단위로 각 시점에 대한 출아 퍼센트를 보여줍니다. 세포 주기 및 회복 단계는 회복(회색), 첫 번째 세포 주기(파란색), 두 번째 세포 주기(자홍색) 및 세 번째 세포 주기(연어)로 강조 표시됩니다. (C) 정렬된 조건 2 출아 곡선은 동일한 출아 비율을 나타내지만 라이프라인 정렬 척도에 표시됩니다. 세포 주기 및 회복 단계는 패널 C에서와 같이 강조 표시됩니다. (D) 라이프라인 척도를 기반으로 하는 별개의 세포 주기 단계에 해당하는 조건 2의 선택 시점에 대한 정렬된 유세포 분석 플롯: G1의 시작, S상의 시작, G2/M의 시작 및 G2/M의 시작. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 5: 정렬된 조건 1 반복 실험과 정렬되지 않은 반복 실험의 비교에 대한 대표적인 결과입니다. 조건 1 반복의 비교: 조건 1 RNA-seq(파란색), 조건 1 마이크로어레이 1(보라색) 및 조건 1 마이크로어레이 2(회색). (A) 조건 1 데이터 세트에 대한 정렬되지 않은 신진 곡선입니다. (B) 조건 1 데이터 세트에 대해 정렬된 시작 곡선입니다. 라이프라인 포인트는 셀 사이클 단계로 변환되었으며 x축 아래에 색상으로 구분되어 있습니다. (C) 조건 1 데이터 세트에 대한 대표적인 유전자인 CDC20의 정렬되지 않은 유전자 발현. (D) 조건 1 데이터 세트에 대한 대표적인 유전자인 CDC20의 정렬된 유전자 발현. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 6: 다양한 기간의 실험에서 정렬된 세포 주기 단계 데이터와 정렬되지 않은 세포 주기 단계 데이터를 비교한 대표적인 결과입니다. 세 가지 다른 환경 조건 및 세 가지 다른 세포 주기 기간의 데이터 세트에 대한 세포 주기 단계 데이터 비교: 조건 1 RNA-seq(세포 주기 주기: 71분), 조건 2 RNA-seq(세포 주기 주기: 82분) 및 조건 3 RNA-seq(세포 주기 주기: 110분). (A) 데이터 세트에 대한 정렬되지 않은 시작 곡선입니다. (B) 데이터 세트에 대해 정렬된 신진 곡선입니다. (C) 조건 2(맨 위 줄)에 대한 유세포 분석 DNA 함량 히스토그램을 조건 1(맨 아래 줄)의 등가 생명선 지점과 비교합니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 7: 다양한 기간의 실험에서 정렬된 전사체 데이터와 정렬되지 않은 전사체 데이터를 비교한 대표적인 결과입니다. 그림 6의 데이터 세트와 관련된 전사체 데이터 비교: 조건 1 RNA-seq, 조건 2 및 조건 3. (A) 조건 1, 조건 2 및 조건 3 RNA-seq 데이터 세트에 대한 대표적인 유전자인 CDC20의 정렬되지 않은 유전자 발현. (B) 데이터 세트에 대한 CDC20 의 정렬된 유전자 발현. (C) 각 데이터 세트에 대해 동일한 순서로 상위 세포 주기 주기 유전자의 정렬되지 않은 히트맵. (D) 패널 C 의 동일한 세포 주기 주기 유전자의 라이프라인 정렬 히트맵이 동일한 순서로 표시됩니다. 보라색 점선은 라이프라인 포인트 100 및 200에 해당합니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

표 1: 라이프라인 포인트에서 세포 주기 위상으로의 전환. 라이프라인 포인트 척도와 실험의 해당 단계 간의 변환 키입니다. 라이프라인 포인트 0-100은 동기화에서 복구에 해당합니다. 각각의 후속 100개의 라이프라인 포인트는 새로운 셀 사이클에 해당하며, 처음 15.5개의 라이프라인 포인트는 G1에 해당하고, 다음 20개는 S-단계에 해당하며, 나머지 라이프라인 포인트는 G2/M에 해당합니다. 이 표를 다운로드하려면 여기를 클릭하십시오.

표 2: 신진 CLOCCS 매개변수. 생성된 CLOCCS 파라미터 "lambda" 및 "mu0"을 각각의 실험으로부터 대표 결과로부터 생성하였다. 추가적으로, 딸-특이적 지연 "델타" 및 계산된 세포-주기 기간이 각각의 실험에 대해 도시된다. 이 표를 다운로드하려면 여기를 클릭하십시오.

표 3: 시간 포인트(분)와 조건 2에 해당하는 해당 라이프라인 포인트 간의 변환을 보여주는 변환 표. 이 표를 다운로드하려면 여기를 클릭하십시오.

보충 그림 S1: CLOCCS 출진은 조건 1 및 조건 3에 적합합니다. (A) 조건 1 RNA 염기서열 출간 데이터, (B) 조건 1 마이크로어레이 1 출아 데이터, (C) 조건 1 마이크로어레이 2 출아 데이터, 및 (D) 조건 3 출아 데이터에 대한 결과 CLOCCS 출아 적합도의 스크린샷. 조건 2에 대한 CLOCCS 출아 적합도는 그림 3B에서 볼 수 있습니다. 95% 신뢰 대역 및 샘플링 오차 막대는 CLOCCS 문서^14,15 및 그림 3에 설명된 바와 같습니다. 각 시계열에 대한 각 시점에 대해 약 200개의 셀이 계수되었습니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 그림 S2: CLOCCS 유세포 분석은 조건 1 및 조건 2에 적합합니다. 유세포 분석 CLOCCS의 스크린샷은 조건 2(맨 위 행: A-D) 및 조건 1(맨 아래 행: E,F)에 대해 그림 6C에 표시된 샘플에 적합합니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 그림 S3: CLOCCS 매개변수의 변동에 대한 정렬의 민감도. CLOCCS 적합의 신뢰 구간 내에서 CLOCCS 매개변수 λ 및 μ0의 (A-C) 변동 및 매개변수의 큰 변동이 있는 (D,E)를 사용하여 조건 1 RNA-Seq 데이터 세트의 정렬 비교. (A) 매개변수 μ0, (B) 매개변수 λ 및 (C) 매개변수 μ0 및 λ 모두에 대한 CLOCCS에 의한 매개변수 표의 2.5% 및 97.5% 신뢰 값과 평균값 간의 비교. (D) μ0 파라미터의 큰 변화(μ0의 200% 내지 0.25%)와 비교하여 μ0에 대한 평균값을 사용한 정렬 간의 비교. (E) λ 파라미터의 큰 변화(λ의 200% 내지 0.25%)와 비교하여 λ에 대한 평균값을 사용한 정렬 간의 비교. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충표 S1: 각 실험에 대한 데이터 수집에 대한 설명. 각 실험에 대해 이 표는 신진 데이터, 유세포 분석 데이터, 전사체 데이터 및 동기화 방법에 대한 설명을 제공합니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 표 S2: 유세포 분석 CLOCCS 실행의 CLOCCS 매개변수. CLOCCS가 실행하는 조건 1 및 조건 2 유세포 분석에 대한 CLOCCS 매개 변수 "mu0" 및 "lambda"입니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 파일 1: 유세포 분석 데이터를 CLOCCS 입력 형식으로 변환하기 위한 지침. 유세포 분석 데이터와 함께 CLOCCS를 사용하려면 특정 입력 형식이 필요합니다. 이 파일은 이 변환을 수행하기 위해 파이썬 유틸리티 함수를 사용하는 방법을 설명하기 위해 프로토콜 단계 3.4.1에 대한 자세한 지침을 제공합니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

이 논문은 동기화된 세포 집단에 대한 시계열 실험의 데이터를 보다 정확하고 정량적으로 평가하는 방법을 제시합니다. 이 방법은 각 실험을 파라미터화하기 위해 신진 데이터 및 유세포 분석 DNA 함량 데이터와 같은 입력 세포 주기 단계 데이터를 사용하는 베이지안 추론 모델인 CLOCCS에서 학습된 매개변수를 활용합니다^(14,15). CLOCCS는 입력 세포 주기 단계 데이터를 사용하여 각 실험에 대한 파라미터를 추론한 다음 공통 라이프라인 척도에 맞추는 데 사용합니다. 여러 동시성/릴리스 시계열 실험을 단일 라이프라인 정렬 시간 척도로 변환하면 이전에는 어렵거나 불가능했던 실험과 여러 반복 실험의 집계 간에 단계별 관련 비교가 가능합니다.

이 프로토콜의 중요한 단계에는 데이터 수집, CLOCCS 실행, 데이터 세트 정렬 및 데이터 세트 간 비교가 포함됩니다. 먼저 이 프로토콜에서 사용하기 위해 데이터를 수집해야 합니다. 데이터는 관심 있는 문제에 관한 실험 데이터 함유 정보(즉, 전사체 데이터, 유전자 발현 데이터, 단백질체 데이터)와 세포 주기 단계 데이터 함유 세포 주기 단계에 대한 정보(즉, 출아 데이터, 유동 세포학적 DNA 함량 데이터)로 구성되어야 합니다. 그런 다음 CLOCCS에서 세포 주기 단계 데이터를 사용하여 각 실험에 대한 매개변수 정보를 수집할 수 있습니다. 매개변수 μ₀ (회복 단계 길이) 및 λ (어머니 세포 주기 기간)는 시점을 라이프라인 지점으로 변환하는 데 사용됩니다. 라이프라인 포인트 정렬을 통해 정렬된 시계열을 직접 비교할 수 있습니다.

이 방법의 한 가지 제한 사항은 적절한 정렬이 데이터에 대한 적절한 적합성을 식별하는 데 달려 있다는 것입니다. 최상의 CLOCCS 피팅을 달성하려면 세포 주기 단계 데이터의 품질과 CLOCCS에서 실험을 위한 올바른 입력 설정을 사용해야 합니다. 셀 주기 위상 데이터에 대한 피팅은 학습된 파라미터의 정확도를 결정하며, 따라서 이러한 파라미터의 사용에 따라 달라지기 때문에 정렬의 정확도에 큰 영향을 미칩니다. 매개변수의 광범위한 변경은 정렬에 큰 영향을 미치므로 CLOCCS 출력에 제공된 신뢰 구간 내에서 변경 사항이 최소한으로 유지됩니다(보충 그림 S3). 매개변수의 변화에 대한 이러한 민감도는 다양한 세포 주기 타이밍을 가진 데이터 세트 간의 정렬을 허용한다는 점에 유의하는 것이 중요합니다.

CLOCCS 피팅의 정확도는 결과 CLOCCS 피팅 곡선과 해당 오차 막대 및 오차 대역을 사용하여 결정할 수 있습니다(그림 3B, D, 보충 그림 S1 및 보충 그림 S2). CLOCCS 적합 탭은 원래의 데이터 포인트뿐만 아니라, CLOCCS 적합치의 신뢰 구간에 대응하는 신뢰 밴드를 갖는 CLOCCS 적합 곡선 및 카운트가 독립적인 이항 확률 변수(¹⁴)로 가정되기 때문에, 데이터의 95% 이항 비율 신뢰 구간에 대응하는 오차 막대를 표시한다. 예를 들어, 신진 데이터의 신뢰도 막대는 주어진 샘플에 대한 신진 세포의 비율에 대한 신뢰도를 측정합니다.

CLOCCS 피팅의 품질을 결정하는 한 가지 방법은 데이터의 오차 막대가 CLOCCS 피팅의 신뢰 구간 밴드와 겹치는지 여부를 결정하는 것을 포함한다. 또 다른 표시는 CLOCCS 적합도의 95% 신뢰 대역의 광범위성입니다. 일반적으로 밴드의 너비는 적합도가 높아질수록 감소합니다. 정렬 불량의 표시는 원래 데이터의 셀 주기 단계가 정렬에서 유추된 셀 주기 단계와 일치하지 않는 경우입니다. 각 정렬은 각 시점에 대해, 셀 주기 단계 정보 데이터에 의해 표시된 단계가 정렬에 의해 할당된 세포 주기 단계와 일치하는지 확인함으로써 이중-검사될 수 있다.

불량한 CLOCCS 적합 또는 불량한 정렬은 낮은 품질의 세포 주기 단계 데이터의 결과일 수 있습니다. 고품질 신진 데이터는 체포 직후 신진 비율이 매우 낮고 첫 번째 피크에서 매우 높은 신진 비율을 갖습니다. 후속 최고점과 최저점은 동시성을 잃지만 뚜렷하고 균일한 간격을 유지해야 합니다. 라이프라인 포인트는 모집단의 평균 세포 주기 단계를 나타내기 때문에 동기화가 불량하면 적절한 정렬도 방해할 수 있습니다. 고품질 유세포 분석 DNA 함량 데이터는 적절한 세포 주기 단계에 해당하는 각 시점에 대해 뚜렷한 1C 및 2C 피크를 갖습니다. 또한 불충분한 세포 주기 단계 데이터는 매개변수 식별 가능성 문제를 야기합니다. 충분한 데이터의 경우 매개 변수를 유추할 수 있으며 CLOCCS 실행 간에 크게 변경되지 않습니다. 그러나 이 프로토콜에 설명된 매개변수(lambda, delta, mu0)는 셀 주기 단계 데이터에 하나의 전체 세포 주기만 포함된 경우 얽힐 수 없습니다. 개선된 파라미터 추정을 허용하기 위해, CLOCCS 적합^14,15에 대해 충분하고 잘 구성된 세포 주기 데이터가 사용되어야 한다. 또한, CLOCCS 모델은 Orlando et ^al.15에 기술된 바와 같이 선행 정보를 사용하지만, 이 정보는 사용된 실험 조건에 더 잘 맞도록 조정될 수 있다.

세포 주기 단계 데이터의 품질이 양호한 경우 CLOCCS 설정을 다시 조정하면 보다 정확한 피팅을 생성하는 데 도움이 될 수 있습니다. 예를 들어 정확도를 높이기 위해 선택한 반복 횟수를 늘릴 수 있습니다. 알파 인자 정지는 용리에 비해 더 짧은 회복 시간과 관련이 있기 때문에 CLOCCS에서 올바른 동기화 방법이 선택되었는지 확인하는 것도 유용할 수 있습니다.

이 방법은 현재 지원되는 세포주기 단계 데이터 유형 측면에서도 제한적입니다. 그러나 CLOCCS는 유연하며 다른 유형의 데이터를 지원하도록 조정할 수 있습니다. 예를 들어, CLOCCS는 이전에 세포-주기 위상 식별자로서 사용하기 위해 방추 극체, 미오신 고리 및 핵⁽¹¹ )의 세포-주기 형광 표지를 지원하도록 적응되었다. 또한, S. cerevisiae 이외의 종과 함께 CLOCCS의 사용이 가능해졌습니다. CLOCCS는 S. pombe¹⁴의 세포 주기 단계에 대한 마커로 셉테이션 지표를 받아들일 뿐만 아니라 많은 종¹⁵에서 쉽게 수집할 수 있는 유세포 분석 DNA 함량 데이터를 받아들입니다. 이를 통해 완전히 다른 두 종에 대한 세포주기의 동일한 단계에서 실험 데이터를 비교할 수 있으며 진화 전반에 걸친 세포주기의 변화에 대한 통찰력을 제공 할 수 있습니다.

이 라이프라인 정렬 방법에는 지원되는 형태의 세포 주기 단계 데이터만 사용할 수 있지만, 이 방법은 사용되는 시계열 실험 데이터 유형과 무관합니다. 이 프로토콜에서 우리는 개별 유전자의 유전자 발현을 정렬하는 데 사용되며 수백 개의 유전자에 대한 시계열 전사체 데이터를 나란히 정렬하는 데 사용됩니다. 우리는 이 방법을 사용하여 플랫폼 간에 비교할 수 있으므로 유사한 조건에서 얻은 RNA-seq 데이터 세트와 마이크로어레이 데이터 세트를 비교할 수 있음을 보여주었습니다. 우리는 또한 이 방법을 사용하여 용리된 데이터 세트(조건 1 마이크로어레이)와 알파 인자 정지된 데이터 세트(조건 1 RNA-seq)를 비교하여 데이터 세트를 다른 동기화 방법과 정렬하는 데 사용할 수 있음을 보여주었습니다. 이전에 CLOCCS는 신진 세포 주기 위상 데이터²²를 사용하여 시계열 전사체 및 시계열 단백질체 데이터를 정렬하는 데에도 사용되어 mRNA 역학과 해당 단백질의 역학 간의 직접적인 비교를 가능하게 했습니다. CLOCCS는 또한 S. cerevisiae와 S. pombe¹⁴ 사이의 정렬 및 S. cerevisiae의 첫 번째 주기와 병원성 효모 Cryptococcus neoformans²¹ 사이의 정렬과 같이 종 전반에 걸쳐 시계열 데이터를 정렬하는 데 사용되었습니다. 마지막으로, CLOCCS 정렬은 현재 세포 주기 시계열 데이터에 특이적이며 다른 유형의 리듬 프로세스와 함께 사용하도록 아직 조정되지 않았습니다. 이것이 특히 관심을 가질 수 있는 한 영역은 일주기 리듬에 대한 것인데, 여기서 일주기 시간(CT)은 일반적으로 실험을 정렬하는 데 사용되지만 구현이 일관되게 적용되지는 않습니다. 또 다른 관심 분야는 말라리아 기생충과 같은 발달 리듬을 조사하는 것입니다. 예를 들어, Smith et ^al.25에 설명된 바와 같이 주기가 다른 Plasmodium falciparum 균주의 정렬은 균주 간에 보다 자세한 비교를 가능하게 합니다. 비교를 위한 이러한 주기적 과정의 정렬은 이러한 중요한 리드미컬한 생물학적 기능을 더 잘 이해할 수 있게 해줍니다. 이러한 유형의 세포 주기 비교는 이 프로토콜에 설명된 대로 라이프라인 정렬을 위해 CLOCCS를 사용하여 가능해졌습니다.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

저자는 공개할 이해 상충이 없습니다.

Acknowledgments

S. Campione과 S. Haase는 국립 과학 재단 (DMS-1839288)과 국립 보건원 (5R01GM126555)의 자금 지원을 받았습니다. 또한 저자는 원고에 대한 의견과 프로토콜 베타 테스트에 대해 Huarui Zhou(Duke University)에게 감사를 표합니다. 또한 Java 코드에 도움을 준 Francis Motta(Florida Atlantic University)와 Joshua Robinson에게도 감사드립니다.

Materials

Name	Company	Catalog Number	Comments
2x PBS			For Fixative Solution. Described in Leman 2014.
4% formaldehyde			For Fixative Solution.
100% Ethanol			For flow cytometry fixation. Described in Haase 2002.
CLOCCS			https://gitlab.com/haase-lab-group/cloccs_alignment.git
Flow Cytometer			For flow cytometry protocol.
Git			https://git-scm.com/
Java 19			https://www.oracle.com/java/technologies/downloads/#java19
Microscope			For counting cells and buds.
Miniconda			https://docs.conda.io/en/latest/
Protease solution			For flow cytometry protocol. Described in Haase 2002.
RNAse A solution			For flow cytometry protocol. Described in Haase 2002.
SYTOX Green Nucleic Acid Stain	Invitrogen	S7020	For flow cytometry staining. Described in Haase 2002.
Tris			pH 7.5

DOWNLOAD MATERIALS LIST

References

Tyers, M., Tokiwa, G., Futcher, B. Comparison of the Saccharomyces cerevisiae G1 cyclins: Cln3 may be an upstream activator of Cln1, Cln2 and other cyclins. EMBO Journal. 12 (5), 1955-1968 (1993).
Schwob, E., Nasmyth, K. CLB5 and CLB6, a new pair of B cyclins involved in DNA replication in Saccharomyces cerevisiae. Genes and Development. 7, 1160-1175 (1993).
Polymenis, M., Schmidt, E. V. Coupling of cell division to cell growth by translational control of the G1 cyclin CLN3 in yeast. Genes and Development. 11 (19), 2522-2531 (1997).
Spellman, P. T., et al. Comprehensive identification of cell cycle-regulated genes of the yeast Saccharomyces cerevisiae by microarray hybridization. Molecular Biology of the Cell. 9 (12), 3273-3297 (1998).
Cho, R. J., et al. A genome-wide transcriptional analysis of the mitotic cell cycle. Molecular Cell. 2 (1), 65-73 (1998).
Bar-Joseph, Z. Analyzing time series gene expression data. Bioinformatics. 20 (16), 2493-2503 (2004).
Pramila, T., Wu, W., Miles, S., Noble, W. S., Breeden, L. L. The Forkhead transcription factor Hcm1 regulates chromosome segregation genes and fills the S-phase gap in the transcriptional circuitry of the cell cycle. Genes and Development. 20 (16), 2266-2278 (2006).
Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
Nash, R., Tokiwa, G., Anand, S., Erickson, K., Futcher, A. B. The WHI1+ gene of Saccharomyces cerevisiae tethers cell division to cell size and is a cyclin homolog. EMBO Journal. 7 (13), 4335-4346 (1988).
Basco, R. D., Segal, M. D., Reed, S. I. Negative regulation of G1 and G2 by S-phase cyclins of Saccharomyces cerevisiae. Molecular and Cellular Biology. 15 (9), 5030-5042 (1995).
Mayhew, M. B., Robinson, J. W., Jung, B., Haase, S. B., Hartemink, A. J. A generalized model for multi-marker analysis of cell cycle progression in synchrony experiments. Bioinformatics. 27 (13), 295-303 (2011).
Qu, Y., et al. Cell cycle inhibitor Whi5 records environmental information to coordinate growth and division in yeast. Cell Reports. 29 (4), 987-994 (2019).
Di Talia, S., Skotheim, J. M., Bean, J. M., Siggia, E. D., Cross, F. R. The effects of molecular noise and size control on variability in the budding yeast cell cycle. Nature. 448 (7156), 947-951 (2007).
Orlando, D. A., et al. A probabilistic model for cell cycle distributions in synchrony experiments. Cell Cycle. 6 (4), 478-488 (2007).
Orlando, D. A., Iversen, E. S., Hartemink, A. J., Haase, S. B. A branching process model for flow cytometry and budding index measurements in cell synchrony experiments. Annals of Applied Statistics. 3 (4), 1521-1541 (2009).
Duan, F., Zhang, H. Correcting the loss of cell-cycle synchrony in clustering analysis of microarray data using weights. Bioinformatics. 20 (11), 1766-1771 (2004).
Darzynkiewicz, Z., Halicka, H. D., Zhao, H. Cell synchronization by inhibitors of DNA replication induces replication stress and DNA damage response: analysis by flow cytometry. Methods in Molecular Biology. 761, 85-96 (2011).
Leman, A. R., Bristow, S. L., Haase, S. B. Analyzing transcription dynamics during the budding yeast cell cycle. Methods in Molecular Biology. 1170, 295-312 (2014).
Rosebrock, A. P. Synchronization and arrest of the budding yeast cell cycle using chemical and genetic methods. Cold Spring Harbor Protocols. 2017 (1), (2017).
Haase, S. B., Reed, S. I. Improved flow cytometric analysis of the budding yeast cell cycle. Cell Cycle. 1 (2), 132-136 (2002).
Kelliher, C. M., Leman, A. R., Sierra, C. S., Haase, S. B. Investigating conservation of the cell-cycle-regulated transcriptional program in the fungal pathogen, Cryptococcus neoformans. PLoS Genetics. 12 (12), e1006453 (2016).
Kelliher, C. M., et al. Layers of regulation of cell-cycle gene expression in the budding yeast Saccharomyces cerevisiae. Molecular Biology of the Cell. 29 (22), 2644-2655 (2018).
Hughes, M. E., Hogenesch, J. B., Kornacker, K. JTK_CYCLE: An efficient nonparametric algorithm for detecting rhythmic components in genome-scale data sets. Journal of Biological Rhythms. 25 (5), 372-380 (2010).
Deckard, A., Anafi, R. C., Hogenesch, J. B., Haase, S. B., Harer, J. Design and analysis of large-scale biological rhythm studies: A comparison of algorithms for detecting periodic signals in biological data. Bioinformatics. 29 (24), 3174-3180 (2013).
Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Biology

교차 실험 비교를 위한 세포 주기 동기화 모델의 특성화 손실을 사용한 동기화된 시계열 데이터의 정렬

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.