Biology

Uitlijning van gesynchroniseerde tijdreeksgegevens met behulp van het karakteriserende Loss of Cell Cycle Synchrony Model voor vergelijkingen tussen experimenten

Published: June 9, 2023 doi: 10.3791/65466

Sophia A. Campione¹, Christina M. Kelliher², David A. Orlando³, Trung Q. Tran⁴, Steven B. Haase¹

¹Department of Biology, Duke University, ²Department of Biology, University of Massachusetts, ³Orlando Data Science LLC, ⁴Department of Computer Science, Duke University

Summary

Een uitdaging bij het analyseren van gesynchroniseerde tijdreeksexperimenten is dat de experimenten vaak verschillen in de duur van het herstel van synchronie en de celcyclusperiode. De metingen van verschillende experimenten kunnen dus niet in geaggregeerde vorm worden geanalyseerd of gemakkelijk worden vergeleken. Hier beschrijven we een methode voor het afstemmen van experimenten om fasespecifieke vergelijkingen mogelijk te maken.

Abstract

Het onderzoeken van de celcyclus hangt vaak af van het synchroniseren van celpopulaties om verschillende parameters in een tijdreeks te meten terwijl de cellen de celcyclus doorkruisen. Zelfs onder vergelijkbare omstandigheden vertonen replicatie-experimenten echter verschillen in de tijd die nodig is om te herstellen van synchronisatie en om de celcyclus te doorlopen, waardoor directe vergelijkingen op elk tijdstip worden voorkomen. Het probleem van het vergelijken van dynamische metingen tussen experimenten wordt verergerd in mutante populaties of in alternatieve groeiomstandigheden die de synchrone hersteltijd en / of de celcyclusperiode beïnvloeden.

We hebben eerder een parametrisch wiskundig model gepubliceerd met de naam Characterizing Loss of Cell Cycle Synchrony (CLOCCS) dat monitort hoe synchrone populaties van cellen vrijkomen uit synchronisatie en door de celcyclus gaan. De geleerde parameters uit het model kunnen vervolgens worden gebruikt om experimentele tijdpunten van gesynchroniseerde tijdreeksexperimenten om te zetten in een genormaliseerde tijdschaal (levenslijnpunten). In plaats van de verstreken tijd in minuten vanaf het begin van het experiment weer te geven, vertegenwoordigt de levenslijnschaal de progressie van synchronie naar celcyclusinvoer en vervolgens door de fasen van de celcyclus. Omdat levenslijnpunten overeenkomen met de fase van de gemiddelde cel binnen de gesynchroniseerde populatie, maakt deze genormaliseerde tijdschaal directe vergelijkingen tussen experimenten mogelijk, inclusief die met verschillende perioden en hersteltijden. Bovendien is het model gebruikt om celcyclusexperimenten tussen verschillende soorten (bijv. Saccharomyces cerevisiae en Schizosaccharomyces pombe) op elkaar af te stemmen, waardoor directe vergelijking van celcyclusmetingen mogelijk is, die evolutionaire overeenkomsten en verschillen kunnen onthullen.

Introduction

Tijdreeksmetingen op gesynchroniseerde populaties van cellen terwijl ze door de celcyclus gaan, is een standaardmethode voor het onderzoeken van de mechanismen die de progressie van de celcyclus regelen 1,2,3,4,5,6,7,8 . De mogelijkheid om vergelijkingen te maken tussen synchrone /release tijdreeksexperimenten is van vitaal belang voor ons begrip van deze dynamische processen. Het gebruik van replicatie-experimenten om bevindingen te bevestigen kan het vertrouwen in de reproduceerbaarheid van de conclusies vergroten. Bovendien kunnen vergelijkingen tussen omgevingsomstandigheden, tussen mutanten en zelfs tussen soorten veel nieuwe inzichten in celcyclusregulatie opleveren. Interexperimentele variabiliteit in het herstel van synchronisatie en in de snelheid van celcyclusprogressie schaadt echter het vermogen om tijd-punt-tot-tijd-puntvergelijkingen te maken tussen replicaten of tussen experimenten met veranderde celcyclustiming. Vanwege deze uitdagingen worden replicaties vaak niet opgenomen voor de volledige tijdreeks (bijv. Spellman et ^al.4). Wanneer replicaties voor de hele tijdreeks worden verzameld, kunnen de gegevens niet in geaggregeerde vorm worden geanalyseerd, maar wordt een enkele replicatie gebruikt voor analyse en andere replicaties worden vaak gedegradeerd tot aanvullende cijfers (bijv. Orlando et ^al.8). Bovendien zijn vergelijkingen tussen experimenten met verschillende herstel- of celcyclusprogressiekenmerken moeilijk. De metingen van kleinere intervallen tussen een gebeurtenis van belang en een oriëntatiepunt in de celcyclus (bijvoorbeeld knopopkomst, S-fase-invoer of begin van de anafase) kunnen helpen fouten te verminderen als deze oriëntatiepuntgebeurtenissen 1,2,3,9,10,11,12 ^{worden bijgehouden}. Subtiele maar belangrijke verschillen kunnen echter onopgemerkt blijven of worden verdoezeld met behulp van deze ad-hocmethoden. Ten slotte maken eencellige analyses het mogelijk om de progressie van de celcyclus te analyseren zonder te vertrouwen op synchronisatie of uitlijning¹³, hoewel grootschalige metingen in eencellige studies een uitdaging en duur kunnen zijn.

Om deze moeilijkheden te overwinnen, hebben we het Characterizing Loss of Cell Cycle Synchrony (CLOCCS) -model ontwikkeld om de analyse van tijdreeksmetingen op gesynchroniseerde populaties^14,15 te ondersteunen. CLOCCS is een flexibel wiskundig model dat de verdeling van gesynchroniseerde cellen over celcyclusfasen beschrijft terwijl ze worden vrijgegeven van synchronisatie en door de celcyclus gaan. Het vertakkingsprocesraamwerk stelt het model in staat om rekening te houden met de asymmetrische eigenschappen van moeder- en dochtercellen na deling, zoals waargenomen in S. cerevisiae, terwijl het nog steeds nuttig is voor organismen die delen door splijting, zoals S. pombe. Het model kan input nemen van een diverse reeks meettypen om de celcyclusfase te specificeren. Het kan ontluikende celcyclusfasegegevens opnemen, waaronder metingen van het percentage gebudded cellen in de loop van de tijd, waardoor het aantal cellen buiten de ongebudde G1-fase^14,15 kan worden geschat. Het model kan ook flowcytometrische gegevens opnemen die het DNA-gehalte meten, waardoor de beoordeling van historische overgangen van G1 naar S, S naar G2 en M naar G1¹⁵ mogelijk is. Fluorescerende morfologische markers kunnen ook worden gebruikt om de celcyclusfase te identificeren. De fluorescerende etikettering van myosineringen, kernen en spindelpoollichamen (SPB's) kan worden gebruikt om de celcyclusfase te bepalen, en deze werden opgenomen in het CLOCCS-model¹¹; Deze metingen worden echter niet beschreven in dit Protocol. Daarnaast werd de septatie-index gebruikt als input voor het modelleren van gegevens van S. pombe¹⁴. Zo kan het model worden gebruikt voor celcyclusanalyses in verschillende organismen en kan het verder worden uitgebreid.

CLOCCS is een parametrisch model dat de volledige Bayesiaanse gevolgtrekking van meerdere parameters uit de invoergegevens mogelijk maakt (bijv. Ontluikingspercentage, DNA-gehalte). Deze parameters omvatten de hersteltijd van synchronisatie, de lengte van de celcyclusperiode (afzonderlijk geschat voor moeder- en dochtercellen) en de gemiddelde celcycluspositie van de cellen op elk tijdstip. Deze parameters vertegenwoordigen het gedrag van de gemiddelde cel in de populatie, waardoor de onderzoeker elk tijdpunt in kaart kan brengen naar een celcycluspositie uitgedrukt als een levenslijnpunt. De omzetting naar levenslijnpunten is afhankelijk van de CLOCCS-parameters lambda (λ) en mu0 (μ₀)^14,15. De parameter λ komt overeen met de gemiddelde celcyclusperiode van de moedercellen. Vanwege de moeder-dochtervertraging^14,15 is dit echter niet de gemiddelde celcyclusperiode van de volledige populatie die zowel de moeder- als de dochtercellen omvat. CLOCCS leidt bovendien de parameterdelta (δ) af, die overeenkomt met de moeder-dochtervertraging en dus de berekening van de gemiddelde celcyclusperiode van de volledige populatie mogelijk maakt. Ten slotte, omdat elk experiment begint na het vrijgeven van celcyclussynchronisatie, wordt de tijd die nodig is om te herstellen van de synchronisatiemethode weergegeven door de CLOCCS-parameter μ₀. CLOCCS past een model aan op de invoercelcyclusfasegegevens en leidt deze parameters vervolgens af met behulp van een willekeurige wandeling Markov-keten Monte Carlo-algoritme^14,15. Door meerdere experimenten in kaart te brengen op een gemeenschappelijke celcycluslevenslijntijdschaal, kunnen directe fasespecifieke vergelijkingen worden gemaakt tussen replicaties of experimenten waarbij de hersteltijd of celcyclusperioden niet identiek zijn 8,14,15.

Aangezien gesynchroniseerde populaties in de loop van de tijdreeks^14,15,16,17 synchronie verliezen^, kan variabiliteit in de snelheid van synchroniteitsverlies ook kwantitatieve vergelijkingen tussen experimenten belemmeren. Door de locatie van populaties en de variantie in hun verdelingen te identificeren, verklaart CLOCCS verschillen in percentages van synchroniteitsverlies. Deze krachtige tool maakt specifieke en gedetailleerde vergelijkingen tussen experimenten mogelijk, waardoor het mogelijk is om direct relevante vergelijkingen te maken, niet alleen tussen replicaties, maar ook tussen omgevingsomstandigheden, mutanten en zelfs soorten met een dramatisch verschillende celcyclustiming^14,15.

Dit artikel beschrijft een methode die CLOCCS gebruikt om parameters te schatten door gegevens uit synchrone/releasetijdreeksexperimenten aan te passen, de gegevens toe te wijzen aan een gemeenschappelijke levenslijnschaal en vervolgens relevante vergelijkingen te maken tussen replicaties of experimenten. Lifeline-uitlijning maakt directe fasespecifieke vergelijkingen tussen deze experimenten mogelijk, wat de aggregatie en vergelijking van replicaties mogelijk maakt en relevantere vergelijkingen maakt tussen experimenten met verschillende hersteltijden en celcyclusperioden.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Verzamelen van celcyclusfase en experimentele gegevens

Synchroniseer de cellen met betrekking tot de celcyclus met behulp van de gewenste synchronisatiemethode (bijv. centrifugale elutriatie zoals beschreven in Leman et al.18 of paringsferomoonstilstand zoals beschreven in Rosebrock 19; zowel Leman et ^al.18 als Rosebrock¹⁹ bevatten ook methoden voor het vrijkomen van synchronie). Begin met het bemonsteren van de hele tijdreeks, zorg ervoor dat de tijdreeks ten minste twee volledige celcyclusperioden lang is en verzamel optimaal ten minste 10 monsters per celcyclus. Verzamel op elk tijdstip een monster voor gegevens over de celcyclusfase (ontluiking of flowcytometrie) en een monster voor experimentele gegevens, zoals hieronder beschreven.
Als u ontluikende gegevens gebruikt als de celcyclusfasegegevens, verzamel dan gegevens over ontluiking voor de CLOCCS-uitlijning.
1. Monster door de tijdreeks. Verzamel voor elk tijdstip cellen en fixeer ze door 200 μL gesonificeerde celcultuur te mengen met 200 μL fixatieve oplossing, zoals beschreven in Leman et ^al.18.
2. Tel voor standaard ontluiking ten minste 200 cellen per tijdspunt met behulp van een doorgelaten lichtmicroscoop met een 40x-objectief en een hemocytometer. Voeg het celmonster van stap 1.2.1 toe aan de hemocytometer en verdun als de dichtheid het tellen verhindert. Noteer het aantal gebudded en unbudded cellen op elk tijdstip. Bereken het percentage budded cellen en plot voor elk tijdspunt in een ontluikende curve.
  OPMERKING: Er zijn andere methoden beschikbaar voor het specificeren van de informatie over de celcyclusfase, maar deze worden niet beschreven in dit protocol. De andere methoden worden beschreven in de CLOCCS readme en in een eerder werk¹¹.
Als u flowcytometrische DNA-inhoudsgegevens gebruikt als de celcyclusfasegegevens, verzamelt u flowcytometrie-DNA-kleuringsgegevens voor de flow-cytometrische CLOCCS-uitlijning.
1. Monster door de tijdreeks. Verzamel voor elk tijdstip cellen en repareer ze zoals beschreven in Haase en Reed²⁰.
2. Kleuring het DNA en analyseer met behulp van standaard flowcytometrische analyse. Een aanbevolen kleuringsprotocol voor S. cerevisiae wordt beschreven in Haase en Reed²⁰.
Verzamel geassocieerde omics of gerelateerde experimentele gegevens. Voor standaard transcriptomische gegevens, verzamel zoals beschreven in Leman et ^al.18 en Kelliher et ^al.21,22. Zorg ervoor dat de gegevens zijn gekoppeld aan tijdpunten die celcyclusfasegegevens bevatten om stroomafwaartse uitlijning mogelijk te maken. Voor een optimale uitlijning moet u ervoor zorgen dat aan elk tijdstip met experimentele gegevens ook fasegegevens zijn gekoppeld.
OPMERKING: De experimentele gegevens kunnen vele vormen aannemen. Traditioneel gebruiken we de uitgelijnde methode die wordt beschreven voor het uitlijnen van transcriptomische experimenten met tijdreeksen. Elk type gegevens dat is gekoppeld aan tijdpunten kan echter worden uitgelijnd (d.w.z. proteomics²²).

2. De vereiste software installeren

OPMERKING: In dit gedeelte wordt ervan uitgegaan dat Conda, Java 19 en Git al zijn geïnstalleerd (Materiaalopgave).

Download de CLOCCS_alignment repo door de volgende opdracht in de terminal in te voeren:
git kloon git kloon https://gitlab.com/haase-lab-group/cloccs_alignment.git
Maak een Conda-omgeving met het bestand conda_req.yml door de volgende opdracht in te voeren in de terminal in de map waarin de CLOCCS_alignment repo is gekloond:
conda env create -f conda_req.yml

3. CLOCCS gebruiken om de experimenten te parametriseren

Dubbelklik op het cloccs_v2023.jar bestand in de map CLOCCS in de CLOCCS_alignment repo en wacht tot een grafische gebruikersinterface wordt geopend. Dit scherm maakt het mogelijk om opties in te voeren voor de CLOCCS-run en geeft de resultaten weer zodra deze zijn uitgevoerd.
Voer de algemene instellingen in.
1. Stel Sim Anneal, Burn In en Iteraties in door de bijbehorende tekstinvoervakken in te typen. Sim Anneal (gesimuleerd gloeien) identificeert goede startparameterwaarden, Burn In zoekt naar posterieure modi en de laatste fase maakt het mogelijk om alle posterieure gevolgtrekkingen te trekken. Hogere waarden verhogen de looptijd, maar verhogen ook de nauwkeurigheid.
2. Voer de experimentele omstandigheden in door de temperatuur in Celsius en de synchronisatiemethode op te geven met behulp van het tekstvak Temperatuur en het vervolgkeuzemenu Synchro. Methode, respectievelijk.
3. Configureer desgewenst de geavanceerde instellingen in het menu Geavanceerde instellingen. Met de geavanceerde instellingen kunnen priors worden ingesteld voor elk van de parameters ("mu0", "sigma0", "sigmav", "lambda", "bud.start", "bud.end").
  OPMERKING: Meer informatie over de geavanceerde instellingen is te vinden in het leesmij.txt in de map CLOCCS van de CLOCCS_alignment repo.
Voer de instellingen in voor gebruik met de ontluikende gegevens.
1. Kies de juiste selectie in het vervolgkeuzemenu Modeltype . De standaardoptie Bud is voor standaard ontluikende informatie voor ontluikende gist.
  OPMERKING: Andere meer geavanceerde opties bestaan ook in het vervolgkeuzemenu: Mutant voor ontluikende informatie voor mutanten die meerdere ontluikende cycli zonder deling ondergaan, BudSSLSMR voor ontluikende informatie en aanvullende spindelpoollichaam- en myosineringinformatie, en BudNucDivNeck voor ontluikende informatie en aanvullende informatie over delende en knophalskernen. Deze geavanceerde opties worden beschreven in het CLOCCS readme en in eerder werk^11,14,15.
2. Importeer de gegevens met behulp van het deelvenster Gegevensimport door in de tekstinvoervakken te typen of door een bestand te uploaden door op de knop Bestand selecteren te klikken. In de eerste kolom worden de tijdstippen aangegeven. De overige twee kolommen geven de ontluikende gegevens op en kunnen een van de volgende opties gebruiken: het aantal niet-toegewezen cellen (Geen knop), het aantal gekoppelde cellen (Bud) of het totale aantal cellen (Totaal).
Voer de instellingen in voor gebruik met de flowcytometrische gegevens. Voer voor elk experiment stap 3.3 of stap 3.4 uit.
OPMERKING: Flowcytometrische gegevens en ontluikende gegevens kunnen samen worden gebruikt. Hoewel we eerder beschreven dat we ze samen¹⁵ uitvoeren, moeten ze voor deze tool onafhankelijk worden uitgevoerd en vervolgens worden vergeleken.
1. Converteer de .fcs-bestanden naar het juiste CLOCCS-invoerformaat voor flowcytometrie door de instructies in Supplemental File 1 te volgen (ook te vinden in de CLOCCS_alignment repo als CLOCCS/flow_cytometry_conversion_instructions.txt).
2. Selecteer de stroomselectie in het vervolgkeuzemenu Modeltype .
3. Importeer de gegevens via het deelvenster Gegevens importeren. Klik op Bestand selecteren en selecteer het bestand dat is gegenereerd in stap 3.4.1.
4. Selecteer de tijdpunten waarvoor een flowcytometrische CLOCCS-fit moet worden uitgezet door de tijdpunten te selecteren in het vak Tijden voor passen .
Zodra alle ingangen zijn geselecteerd voor ontluikings- of flowcytometrie, klikt u op de knop Toepassen en klikt u vervolgens op de knop Voorbeeld boven aan het scherm.
Bekijk de ontluikende curve of flowcytometrieplots met de voorspelde pasvormen door het tabblad Voorspelde pasvormen te selecteren. Dit tabblad wordt standaard direct na de vorige stap geopend.
Bekijk de parameterhistogrammen voor elke parameter door het tabblad Parameter Histogrammen te selecteren en vervolgens het subtabblad te selecteren dat overeenkomt met de parameter van belang uit de volgende opties: mu0, delta, sigma0, sigmav, lambda, bud.start, bud.end, enz.
Bekijk de achterste scoregrafiek door het tabblad Posterieure score te selecteren.
Bekijk de instellingen en wijzig ze verder door het tabblad Instellingen te selecteren; bekijk het logboek van de vorige uitvoeringen door het tabblad Logboek te selecteren.
Haal de CLOCCS-parameters op uit de pasvorm door het tabblad Posterieure parameters te selecteren. De resulterende tabel heeft de volgende vorm: elke rij bestaat uit een parameter, waarbij de laatste rij de achterste is. De kolommen bestaan uit de voorspelde parameter voor het gemiddelde, het 2,5% lagere betrouwbaarheidsinterval, het 97,5% bovenste betrouwbaarheidsinterval en de acceptatiegraad.
1. Noteer de parameters die voor de uitlijning voor elk experiment worden gebruikt: de hersteltijd van synchronisatie (μ₀) en de gemiddelde celcyclusperiode van de moedercellen (λ).
2. Bereken de celcyclusperiode door het gemiddelde van de moedercelperiode (λ) en de dochtercelperiode (λ + δ) te berekenen, waarbij δ de dochterspecifieke vertraging is.
  OPMERKING: Herhaal sectie 3 met alle experimenten die in de vergelijkingen moeten worden opgenomen.

4. Conversie van tijdpunten naar levenslijnpunten met behulp van de Python-conversiefuncties en de CLOCCS-parameters

OPMERKING: Voor conversie tussen tijdpunten en levenslijnpunten zijn twee conversieformules^{vereist 21}. Een Python-implementatie voor conversie en gegevensvisualisatie is beschikbaar in de CLOCCS_alignment repo en wordt hieronder beschreven.

Activeer de Conda-omgeving door het volgende commando in de terminal in te voeren: conda activate CLOCCS_alignment
Open een interactief Python-notitieblok door de volgende opdracht in de terminal te typen: jupyter-notitieblok
Maak een nieuw Python-notitieblok in de gewenste map.
OPMERKING: Er is een voorbeeld van een notitieblok opgenomen om het standaardgebruik te demonstreren en is te vinden in Alignment/JOVE_example.ipynb in de CLOCCS_ alignment repo.
Importeer het Python-bestand met de uitlijningsfuncties door de volgende opdracht in de eerste cel uit te voeren:
%voeren path_to_repo/cloccs_alignment/Uitlijning/hulpprogramma's uit.py
1. Vervang het pad naar de CLOCCS_alignment repo door path_to_repo.
Als u ontluikende gegevens gebruikt als de celcyclusfasegegevens, importeert u een gegevensframe met het percentage dat op elk tijdstip is toegewezen door de volgende opdracht in een nieuwe cel uit te voeren:
budding_df = pd.read_csv("path_to_folder/budding_filename.tsv", sep ="\t", index_col=0)
1. Vervang het juiste bestandspad en de juiste bestandsnaam. Als het bestand een .csv bestand is, verwijdert u sep ="\t"
Als u ontluikende gegevens gebruikt als de celcyclusfasegegevens, lijnt u de ontluikende gegevens uit op een tijdschaal van een levenslijnpunt door de volgende functie in een nieuwe cel in te voeren:
aligned_budding_df = df_conversion_from_parameters(budding_df, tijdpunten, param_mu0, param_lambda)
1. Voor tijdspunten vervangt u een lijst met de tijdpunten door de index van het budding_df gegevensframe.
2. Vervang voor param_mu0 en param_lambda de geleerde parameters van de ontluikende CLOCCS-run in sectie 3 voor het experiment.
Als u flowcytometriegegevens gebruikt, importeert u de flowcytometriegegevens door de volgende opdracht in een nieuwe cel uit te voeren:
flow_samples = flow_cytometry_import(flow_input_folder)
1. Vervang voor flow_input_folder het juiste pad naar de map met de fcs-bestanden met flowcytometrie.
Als u flowcytometriegegevens gebruikt, genereert u een conversietabel tussen de tijdpunten en levenslijnpunten voor elk experiment door de volgende opdracht in een nieuwe cel te typen:
flow_converter = convert_tp_to_ll(tijdspunten, param_mu0, param_lambda)
1. Vervang voor tijdspunten een lijst met de tijdpunten uit de flowcytometriegegevens.
2. Vervang voor param_mu0 en param_lambda de geleerde parameters uit de flowcytometrie die CLOCCS in sectie 3 uitvoert voor het experiment.
Importeer het gegevensframe met de experimentele gegevens in het notitieblok door de volgende opdracht in een nieuwe cel uit te voeren:
data_df = pd.read_csv("path_to_folder/exp_data_filename.tsv", sep ="\t", index_col=0)
1. Vervang het juiste bestandspad en de juiste bestandsnaam. Als het bestand een .csv bestand is, verwijdert u sep ="\t".
  OPMERKING: Dit kan worden gedaan voor alle tabelgegevens. De experimentele gegevens moeten alleen de tijdpunten hebben als de kolommen of de index van het gegevensframe. Voorbeeldgegevens zijn te vinden in de CLOCCS_alignment repo.
Lijn de experimentele gegevens uit op een tijdschaal van een levenslijnpunt door de volgende functie in een nieuwe cel in te voeren:
lifeline_aligned_df = df_conversion_from_parameters(data_df, timepoints, param_mu0, param_lambda, interpoleren, lowerll, upperll)
1. Voor tijdspunten vervangt u een lijst met de tijdpunten als de index of de kolommen van de experimentele data_df uit de vorige stap.
2. Vervang voor param_mu0 en param_lambda de waarden die in rubriek 3 van CLOCCS zijn verkregen.
  OPMERKING: De parameters kunnen afkomstig zijn van elke CLOCCS-uitvoering die wordt uitgevoerd op een van de geaccepteerde gegevenstypen voor de celcyclusfase.
3. U kunt desgewenst interpoleren door Waar of Onwaar of leeg laten (de standaardwaarde is Onwaar).
  OPMERKING: Wanneer dit is ingesteld op Onwaar, worden de gegevens niet geïnterpoleerd. Wanneer dit is ingesteld op Waar, worden de levenslijnpunten afgerond en geïnterpoleerd om de waarden tussen de levenslijnpunten in te vullen, zodat er een punt per geheel getal is in het bereik van de levenslijnpunten. Dit maakt een betere vergelijking tussen datasets mogelijk.
4. U kunt desgewenst lowerll en upperll vervangen door Geen of gehele getallen.
  OPMERKING: Wanneer ingesteld op Geen, worden alle levenslijnpunten na interpolatie bewaard. Wanneer gehele getallen worden opgegeven, worden de gegevens afgekapt, zodat de levenslijnpunten variëren van de lowerll tot de upperll. Dit maakt vergelijking mogelijk tussen datasets met een andere lowerll of upperll.
Download de op de levenslijn uitgelijnde gegevensset door de volgende opdracht in een nieuwe cel in te voeren: lifeline_aligned_df.to_csv("path_to_desired_location/name_of_file.tsv", sep = "\t")
Herhaal stap 4.5-4.11 met alle experimenten die in de vergelijkingen moeten worden opgenomen.

5. Ontluikende curven en flowcytometriegegevens vergelijken

Plot de ontluikende curven voorafgaand aan de uitlijning met behulp van de python-hulpprogramma'sfunctie door de volgende opdracht in een nieuwe cel in te voeren:
plot_budding_curves(list_of_budding_curves, list_for_legend = leg_list, point_type = str_type, titel = str_title)
1. Vervang een lijst met de gegevensframes van alle gewenste ontluikende curven voor het plotten voor list_of_budding_curves-[bud_df1, bud_df2, bud_df3].
2. Vervang indien gewenst een lijst met de labels voor de legenda - [Experiment 1, Experiment 2, Mutant] voor leg_list. Zo niet, sluit dan Geen uit of vervang er geen.
3. Vervang tijd voor str_type.
4. Vervang desgewenst een tekenreekstitel Vergelijking Budding Curves voor str_title. Zo niet, vervang dan Geen, of sluit uit.
Plot de ontluikende curven na uitlijning met behulp van de python-hulpprogramma'sfunctie door de instructies in stap 5.1 te volgen, maar met een lijst met uitgelijnde ontluikende curven vervangen door list_of_budding_curves en met levenslijn voor point_type in plaats van tijd.
Om de flowcytometriegegevens te plotten, plot u de bijbehorende gegevens uit de FCS-bestanden op de overeenkomstige levenslijnpunten met behulp van de converter die in stap 4.8 is gegenereerd.
Converteer de levenslijnpunten naar de celcyclusfase met behulp van de convertertabel (tabel 1).
OPMERKING: Dit kan ook worden uitgezet door de instructies in stap 5.1 te volgen, maar met fase voor point_type in plaats van tijd.

6. Vergelijking van de experimentele gegevens

Bepaal de genenlijst die in de lijngrafieken moet worden uitgezet op basis van literatuurinformatie of de genen die van belang zijn voor het onderzoek.
Gebruik de meegeleverde plot_linegraph_comparison in het bestand met Python-hulpprogramma's om lijngrafiekvergelijkingen uit te voeren op het oorspronkelijke, uitgelijnde of uitgelijnde en geïnterpoleerde gegevensframe door de volgende opdracht in een nieuwe cel te typen:
plot_linegraph_comparison(list_of_dfs, list_for_legend, genelist, point_type = str_type, titel = str_title)
1. Vervang een lijst met de gegevensframes van de experimenten die moeten worden vergeleken voor list_of_dfs.
  OPMERKING: De gegevensframes kunnen niet worden uitgelijnd of uitgelijnd. De overeenkomstige point_type moet echter worden ingevoerd in stap 6.2.4.
2. Vervang een lijst met de titels voor elk gegevensframe in dezelfde volgorde als de lijst met gegevensframes voor list_for_legend.
3. Vervang een lijst met de gennamen (die moeten worden opgenomen in de index van de gegevensframes) die moeten worden uitgezet voor genelist.
4. Vervang het punttype door str_type. Gebruik levenslijn (de standaardwaarde is levenslijnpuntschaal) of fase (de levenslijnschaal van de celcyclusfase) voor de uitgelijnde gegevensframes in stap 6.2.1 of tijd voor de niet-uitgelijnde gegevensframes in stap 6.2.1.
5. Vervang een optionele tekenreekstitel door str_title.
Bepaal de genenlijst die moet worden opgenomen in de heatmap met behulp van de literatuur of algoritmen om de belangrijkste periodieke genen te bepalen.
OPMERKING: Voor een goede heatmapvergelijking moeten de gegevens worden uitgelijnd, geïnterpoleerd en aangepast in stap 6.2; Het moet voor elk experiment dezelfde begin- en eindwaarde voor de levenslijn hebben.
1. Voer periodiciteitsalgoritmen uit om de hoogste periodieke genen^23,24 te bepalen^, of gebruik de gewenste alternatieve methoden om de genenlijst te bepalen (d.w.z. literatuurresultaten).
2. Importeer een .csv- of .tsv-genenlijstbestand in het notitieblok met de volgende opdracht in een nieuwe cel:
  sort_df = pd.read_csv("path_to_folder/sorting_filename.tsv", sep="\t", index_col=0)
3. Vervang het juiste bestandspad en de juiste bestandsnaam. Als het bestand een .csv bestand is, verwijdert u sep="\t".
Gebruik de meegeleverde functie plot_heatmap_comparison in het bestand Python-hulpprogramma's om een heatmapvergelijking uit te voeren op het uitgelijnde, geïnterpoleerde en fase-uitgelijnde gegevensframe door de volgende opdracht in een nieuwe cel te typen:
plot_heatmap_comparison(list_of_dfs, list_for_legend, genelist, titel = str_title)
1. Vervang een lijst met de uitgelijnde gegevensframes van de experimenten die moeten worden vergeleken voor list_of_dfs.
2. Vervang een lijst met de titels voor elk gegevensframe in dezelfde volgorde als de lijst met gegevensframes voor list_for_legend.
3. Vervang een lijst met de gennamen (die moeten worden opgenomen in de index van de gegevensframes) die moeten worden uitgezet voor genelist.
4. Vervang een optionele tekenreekstitel door str_title.
  OPMERKING: Het eerste gegevensframe in de lijst is het frame dat zal worden gebruikt voor het ordenen van de genen in de heatmap. De genen worden geordend met het maximum in de eerste periode voor dat gegevensframe en dezelfde volgorde wordt gebruikt voor de volgende gegevensframes in de lijst.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

De stappen beschreven in het bovenstaande protocol en in de workflow in figuur 1 werden toegepast op vijf celcyclus gesynchroniseerde tijdreeksexperimenten om twee representatieve vergelijkingen aan te tonen: tussen replicaties met verschillende synchronisatiemethoden (paringsferomoon en centrifugale elutriatie¹⁸) en sequencingplatforms (RNA-sequencing [RNA-seq] en microarray), evenals tussen experimentele omstandigheden. Meerdere experimenten werden uitgevoerd met S. cerevisiae, en celcyclusfase en experimentele gegevens werden verzameld voor elk experiment. De workflow omvat het gebruik van CLOCCS om de verschillende synchrony/release time-series experimenten te parametriseren, deze parameters te gebruiken om de experimenten uit te lijnen op een gemeenschappelijke vergelijkbare levenslijnschaal en vervolgens deze uitgelijnde experimenten te gebruiken voor de twee representatieve vergelijkingen.

Om de representatieve vergelijking tussen replicaten aan te tonen, selecteerden we drie experimenten uitgevoerd met dezelfde stam en in dezelfde experimentele omstandigheden, genaamd Conditie 1. Twee van deze experimenten waren directe replicaties van elkaar, en beide werden geanalyseerd via microarray-analyse en gesynchroniseerd via centrifugale elutriatie. Het derde experiment werd geanalyseerd met behulp van RNA-seq-analyse en gesynchroniseerd via alfa-factor parende feromoonstop. Om de tweede vergelijking tussen experimenten met verschillende celcyclusperioden aan te tonen, werd het RNA-seq-experiment van toestand 1 (celcyclusperiode: 71 min) van bovenaf vergeleken met toestand 2 (celcyclusperiode: 82 min) en toestand 3 (celcyclusperiode: 110 min) (tabel 2). Voor elk experiment werden de cellen in hun respectieve omstandigheden gekweekt, gesynchroniseerd, vrijgegeven en vervolgens bemonsterd gedurende twee of meer celcyclusperioden. De ontluikende en/of flowcytometriegegevens werden verzameld om informatie te verschaffen over de celcyclusfase, en ofwel microarray- of RNA-seq-tijdreekstranscriptomische gegevens werden verzameld zoals beschreven in Leman et ^al.18 (aanvullende tabel S1).

Voor elk experiment namen de gegevens de vormen aan die worden beschreven in figuur 2, die het conditie 2-experiment presenteert als een voorbeeld voor demonstratie. Elke dataset had een ontluikende curve, die de gevolgtrekking van de celcyclusfase mogelijk maakte. Deze curve bestond uit een ontluikende procentwaarde voor elk tijdspunt in de tijdreeks, die vervolgens werd uitgezet om een ontluikende curve te produceren met meerdere celcyclusoscillaties (figuur 2). De celcyclusfasegegevens namen ook de vorm aan van flow-cytometrische DNA-inhoudskleuringsgegevens voor elk tijdspunt in de tijdreeks. Geselecteerde tijdpunten voor voorwaarde 2 werden uitgezet (figuur 2). De flowcytometriebestanden werden gecombineerd in een enkele tabel met de cellen in elke logfluorescentiebak voor elk tijdstip voor invoer in de CLOCCS met behulp van de functie flow_cytometry_CLOCCS_file_from_fcs in de Python-hulpprogramma's. Elke dataset bevatte ook experimentele gegevens. In dit geval waren de gegevens transcriptomische gegevens en de gegevens waren georganiseerd in rijen genen, elk met een waarde voor de overvloed aan RNA op elk tijdstip in het experiment (figuur 2).

We hebben het gebruik van CLOCCS en de conversie naar levenslijnpunten voor de Condition 2 RNA-seq dataset gedemonstreerd; Het proces was echter ook identiek voor de andere experimenten. De ontluikende informatie werd ingevoerd in het CLOCCS-algoritme zoals beschreven in protocolsectie 3 en zoals weergegeven in figuur 3A. De standaardwaarden voor Sim Anneal, Burn In, Iteraties en Advanced Settings werden gebruikt. De juiste experimentele omstandigheden werden geselecteerd. Het modeltype "Bud" werd gebruikt voor de ontluikende gegevens. De resulterende CLOCCS-ontluikende pasvormen werden bekeken om ervoor te zorgen dat de ontluikende curven goed pasten, zoals blijkt uit de gegevenspunten die de overeenkomstige pasvormcurve bedekken met een kleine 95% betrouwbaarheidsband (figuur 3B en aanvullende figuur S1). De parameters μ₀ en λ uit de tabel met posterieure parameters (figuur 3C) werden geregistreerd voor gebruik in de uitlijning. De flowcytometriegegevens voor toestand 2 werden afzonderlijk ingevoerd in CLOCCS, zoals beschreven in protocolsectie 3. Momenteel verwacht CLOCCS dat flowcytometers 10-bits gegevens produceren met 1.024 kanalen; Moderne flowcytometers kunnen echter meer kanalen hebben. Omdat onze flowcytometer gegevens produceert met meer dan 1.024 kanalen, werden de gegevens in 1.024 bakken weggegooid. Met flowcytometrie celcyclusfasegegevens produceert CLOCCS een CLOCCS die geschikt is voor elk geselecteerd tijdstip (figuur 3D en aanvullende figuur S2) en levert een tabel met posterieure parameters die vergelijkbaar is met de ontluikende tabel met posterieure parameters in figuur 3C. De parameters voor ontluiking die CLOCCS uitvoert voor elk van de andere experimenten worden beschreven in tabel 2, en de parameters voor de flowcytometrie die CLOCCS uitvoert, worden beschreven in aanvullende tabel S2.

De CLOCCS-parameters die overeenkomen met de celcyclusperiode van de moedercellen (λ) en de hersteltijd (μ₀) werden gebruikt voor de uitlijning van de levenslijn. Het is belangrijk op te merken dat λ niet noodzakelijkerwijs de gemiddelde celcyclusperiode van de celpopulatie vertegenwoordigt. In gevallen waarin de cellen een volledige deling ondergaan, zijn er een gelijk aantal moeder- en dochtercellen, dus de gemiddelde celcyclusperiode is het gemiddelde tussen de celcyclusperiode van de moedercellen (λ) en de celcyclusperiode van de dochtercellen (λ + δ); Specifiek is Delta (δ) de lengte van de dochterspecifieke vertraging. Dit is de berekening die we hebben gebruikt voor de celcyclusperiode voor elk experiment (tabel 2). Voor elk experiment werden vervolgens de overeenkomstige parameters λ en μ₀ gebruikt in de conversiefunctie df_conversion_from_parameters, geleverd in het Python-hulpprogrammabestand, zoals gedemonstreerd voor voorwaarde 2 (figuur 4A). Voor de ontluikende curven werden de gegevens niet geïnterpoleerd. Voor experimentele gegevens werden de op de levenslijn uitgelijnde datasets echter opnieuw bemonsterd met behulp van interpolatie, zodat elk levenslijnpunt geïnterpoleerde gegevens bevatte voor een betere plotting. Om ervoor te zorgen dat de op de levenslijn uitgelijnde gegevenssets hetzelfde bereik van levenslijnpunten hadden, werden de onderste en bovenste levenslijnlimieten ingesteld om de gegevens op die punten af te kappen. Deze lowerll- en upperll-parameters werden ingevoerd in de functie df_conversion_from_parameters toen de interpolatie was ingesteld op True. Voor de vergelijking van voorwaarde 1 werden ze ingesteld op respectievelijk 44 en 270 voor alle datasets, en voor de vergelijking tussen omgevingscondities werden ze ingesteld op respectievelijk 50 en 300. Een voorbeeld van het gebruik van deze functies voor uitlijning en vergelijking is te zien in het voorbeeld Python-notebook JOVE_example.ipynb, en de code die wordt gebruikt voor het genereren van de cijfers is te zien in het JOVE_Figures.ipynb-notitieblok in de CLOCCS_alignment repo.

Deze conversie van tijdspunten naar levenslijnpunten is afhankelijk van twee formules²¹ (figuur 4A) met μ₀ (hersteltijd) en λ (moederperiode). De eerste formule, , Equation 1 is de herstelfaseformule (figuur 4A). Deze formule wordt alleen gebruikt voor tijdspunten binnen de herstelfase, die bestaat uit de tijdpunten tot en met μ 0, omdat μ₀ overeenkomt met de hersteltijd. De tijdpunten worden vervolgens geconverteerd naar een levenslijnschaalbereik dat eindigt met 100 levenslijnpunten (tabel 1), wat het einde van de herstelfase en het begin van de eerste celcyclus markeert. De post-herstelfase gebruikt de tweede formule Equation 2 (figuur 4A), die elk volgend post-hersteltijdpunt omzet in een levenslijnpunt na 100. Elke volgende 100 levenslijnpunten komen overeen met een nieuwe celcyclus, waarbij de eerste cyclus overeenkomt met levenslijnpunten 100 tot 200, de tweede cyclus overeenkomt met levenslijnpunten 200 tot 300, enzovoort (tabel 1). De conversie van tijdpunten naar levenslijnpunten wordt op elke gegevensset afzonderlijk toegepast met behulp van de overeenkomstige CLOCCS-parameters voor die gegevensset. Nadat elke gegevensset is geconverteerd naar de levenslijnschaal, worden de celcyclusfasen uitgelijnd, waardoor fasespecifieke vergelijkingen tussen gegevenssets mogelijk zijn.

Tabel 3 toont de conversie van geselecteerde tijdpunten naar hun respectieve levenslijnpunten voor de representatieve conversie van de Condition 2-dataset met behulp van parameters uit de ontluikende CLOCCS-run. De ontluikende gegevens verzameld uit de Condition 2 RNA-seq werden uitgezet in een ontluikende curve die het percentage budded in de tijd toont voor zowel de niet-uitgelijnde tijdschaal in minuten (Figuur 4B) als de uitgelijnde tijdschaal in levenslijnpunten (Figuur 4C) met behulp van de Python-functie plot_budding_curves in een Python-notitieboek. De levenslijnpunten konden gemakkelijk worden omgezet in experimentele en celcyclusfase-informatie (tabel 1), en de herstelfase en de eerste tot derde celcycli werden dienovereenkomstig met de hand kleurgecodeerd (figuur 4B, C). Aangezien elk levenslijnpunt overeenkwam met een celcyclusfase, konden individuele flowcytometrieplots worden gelabeld via de Python-functies met behulp van de celcyclusfase bepaald door de uitlijning van de levenslijn. Deze fasen kwamen overeen met de fasen die werden bepaald via flow-cytometrische analyse voor conditie 2. De flowcytometriegegevens die voor de Condition 2-dataset werden verzameld, werden uitgezet voor geselecteerde tijdspunten en gelabeld met behulp van de celcyclusfase die werd bepaald op basis van de uitlijning van de levenslijn van de flowcytometrie. In elk geval kwamen de gegevens overeen met de fase die werd bepaald door de uitlijning (figuur 4D).

Het is belangrijk op te merken dat het expressieniveau van elk gen voor elk monster hetzelfde blijft, maar de etikettering van de tijdspunten wordt van tijd in minuten veranderd in levenslijnpunten. De conversie is echter niet lineair. De herstelfase, grijs gemarkeerd, neemt een hoger percentage van de experimentele tijd in beslag zodra de conversie naar levenslijnpunten is uitgevoerd (figuur 4B, C). Het voordeel van de levenslijnschaal is dat het gedetailleerde fase-informatie en fasevergelijkingen tussen experimenten mogelijk maakt. De fase-informatie is opgenomen in de levenslijnpunten, zoals hierboven beschreven en weergegeven in tabel 1. Bovendien bevindt G1 zich in de eerste 15,5 levenslijnpunten van elke celcyclus, S in de volgende 20 levenslijnpunten en G2/M in de volgende 64,5 levenslijnpunten (tabel 1). Dit beperkt echter kunstmatig de hersteltijd tot dezelfde tijdspanne van elke opeenvolgende celcyclus, zelfs als de herstelfase erg kort lijkt in de oorspronkelijke tijdschaal. Dit verdoezelt de vergelijkingen niet, omdat de fasen van elk experiment op elkaar zijn afgestemd. In de meeste gevallen is het relevanter om de gegevens te vergelijken op punten die zich voordoen in dezelfde experimentele en biologische fase in plaats van op tijdstippen die zich op hetzelfde moment in minuten voordoen.

Zodra alle experimenten zijn geconverteerd naar de uitgelijnde levenslijnschaal met behulp van de meegeleverde Python-functies in het Python-hulpprogrammabestand, kunnen ze worden vergeleken. Hier demonstreren we twee veel voorkomende vergelijkingen tussen experimenten: één tussen replicaties van een vergelijkbaar experiment tussen platforms en synchronisatiemethoden (figuur 5) en één tussen verschillende experimentele omstandigheden met een veranderende periodelengte (figuur 6 en figuur 7). Zoals hierboven beschreven, is de eerste vergelijking tussen twee geëlutrieerde microarray-replicaties en één alfafactor gesynchroniseerd RNA-seq-experiment. Vóór uitlijning vertoonden de twee microarray-replicaties vergelijkbare synchronisatie- en celcyclusdynamiek, maar de Condition 1 Microarray 2-replicatie leek enigszins vertraagd (figuur 5A). Het meest opvallende verschil werd gevonden bij het vergelijken van de niet-uitgelijnde datasets; de Condition 1 RNA-seq tweede cyclus leek in lijn met de eerste cyclus van de twee microarray experimenten. Het verschil was waarschijnlijk niet gerelateerd aan de verschillende transcriptomische platforms, maar eerder aan de verschillende synchronisatiemethoden. De celpopulaties in de microarray-experimenten werden gesynchroniseerd door centrifugale elutriatie, terwijl de populatie voor het RNA-seq-experiment werd gesynchroniseerd door een parende feromoonbehandeling. Inderdaad, synchronisatie met paringsferomoon verminderde de hersteltijd aanzienlijk in vergelijking met elutriatie (figuur 5A en tabel 2).

Ondanks de duidelijke verschillen tussen replica's wanneer ze werden uitgezet in termen van de verstreken tijd, waren de curven na de uitlijning van de levenslijn bijna identiek en werden meer gedetailleerde en relevante vergelijkingen tussen replicaties mogelijk gemaakt (figuur 5B). De herstelfase werd uitgelijnd, zodat elk experiment op hetzelfde levenslijnpunt begon en de variaties in periode werden genormaliseerd door uitlijning van de levenslijn. Vanwege de uitlijning traden experimentele waarden op hetzelfde levenslijnpunt over replicaten op in dezelfde celcyclusfase, waardoor berekeningen van de experimentele variantie tussen replicaten mogelijk werden. De herstel- en celcyclusfasen zijn gelabeld in figuur 5B om aanvullende informatie te geven over celcyclusfasen in elk van de experimenten. Deze levenslijnuitlijning kan vervolgens worden toegepast op de experimentele dataset (Figuur 5C, D) met behulp van de Python-functie df_conversion_from_parameters in het hulpprogrammabestand, zoals hierboven beschreven.

In figuur 5D werden de transcriptomische gegevens uitgelijnd en werd de expressiedynamiek voor het CDC20-gen uitgezet met behulp van de plot_linegraph_comparison Python-functie in een Python-notebook. Vóór de uitlijning leek het alsof de eerste piekexpressie van de microarray-experimenten overeenkwam met de tweede piek van het RNA-seq-experiment (figuur 5C); na uitlijning pieken de eerste celcycluspieken van elke dataset echter correct uitgelijnd (figuur 5D). Bovendien leek de piekbreedte van de experimenten te verschillen tussen de RNA-seq-dataset en de microarray-datasets, maar na uitlijning was de piekbreedte meer uitgelijnd (figuur 5C, D).

De tweede vergelijking is tussen experimenten in verschillende omgevingsomstandigheden met verschillende celcyclusperioden (figuur 6). Zoals hierboven beschreven, vergeleken we hier S. cerevisiae-datasets in toestand 1 met toestand 2 en toestand 3, die overeenkomen met celcyclusperioden van respectievelijk 71, 82 en 110 minuten. Deze verschillen in de celcyclusperiode leidden tot onzekerheid bij het vergelijken van experimenten voorafgaand aan de uitlijning van de celcyclusfase, zoals blijkt uit de niet-uitgelijnde ontluikende curven. De periodeverschillen zijn zichtbaar in de niet-uitgelijnde ontluikende curven (figuur 6A). Toen ze echter cloccs waren uitgelijnd met behulp van dit protocol, leken de drie curven opmerkelijk veel op elkaar, waardoor vergelijkingen van experimentele gegevens mogelijk waren (figuur 6B).

Met behulp van de flowcytometrie CLOCCS-parameters werden toestand 1 en toestand 2 uitgelijnd op een gemeenschappelijke levenslijnschaal en werden histogrammen van het DNA-gehalte uitgezet in toestand 2 en op gelijkwaardige levenslijnpunten in toestand 1. Flowcytometrische metingen van het DNA-gehalte over levenslijnpunten werden vergeleken (figuur 6C). Omdat de DNA-inhoudsmetingen niet continu waren en niet gemakkelijk konden worden geïnterpoleerd, konden we alleen de dichtstbijzijnde levenslijnpunten vergelijken. De celcyclusfasegegevens voor elk vergelijkbaar levenslijnpunt waren niet identiek tussen de twee omstandigheden (figuur 6C), wat aangeeft dat de CLOCCS-fits en de resulterende parameters waarschijnlijk enigszins verkeerd waren uitgelijnd voor toestand 1. Dit was waarschijnlijk te wijten aan de slechtere CLOCCS-fit met de flowcytometrische gegevens voor toestand 1 in vergelijking met toestand 2 (aanvullende figuur 2). De uitlijning week echter slechts in één steekproef af en maakt dus nog steeds verbeterde fasespecifieke vergelijkingen mogelijk.

De ontluikende lifeline-uitlijning werd vervolgens toegepast op de experimentele gegevens voor de RNA-seq-experimenten in Conditie 1, Conditie 2 en Conditie 3 (Figuur 7) door gebruik te maken van de ontluikende CLOCCS-parameters in de df_conversion_from_parameters functie op de experimentele gegevens. De transcriptomische gegevens werden uitgelijnd en de genexpressie van het gen CDC20 voor elke tijdreeks werd getoond voor de drie experimenten. Voorafgaand aan de uitlijning was de transcriptdynamiek van CDC20 niet-overlappend (figuur 7A). Na de uitlijning waren de eerste en tweede piek van de CDC20-genexpressie veel nauwer op elkaar afgestemd voor alle drie de datasets. Na uitlijning werd duidelijk dat de pieken zich in dezelfde celcyclusfase voordeden, maar dat de vormen van de krommen anders waren (figuur 7B). Toestand 3 had een lagere en bredere eerste piek in vergelijking met de andere twee omstandigheden, zelfs na rekening te hebben gehouden met de verschillen in de celcyclusperiode, wat suggereert dat deze verschillen waarschijnlijk verband hielden met de experimentele omstandigheden die werden getest (figuur 7B).

Er kunnen ook grootschalige transcriptomische vergelijkingen worden gemaakt. Voor deze vergelijkingen werden 278 genen geselecteerd door het periodiciteitsalgoritme JTK_CYCLE²³ op elke dataset uit te voeren en de kruising van de bovenste periodieke genen te nemen. Genen kunnen echter worden geselecteerd met behulp van elke gewenste methode of uit de literatuur. Deze genen werden in dezelfde volgorde uitgezet voor alle drie de voorwaarden, zowel voor de niet-uitgelijnde (figuur 7C) als de uitgelijnde (figuur 7D) heatmaps met behulp van de plot_heatmap_comparison Python-functie in een Python-notitieblok. Met deze heatmaps kunnen honderden vergelijkingen op genniveau tegelijkertijd worden gemaakt. Vergelijkingen tussen niet-uitgelijnde experimenten kunnen worden gemaakt met betrekking tot de verandering in curvedynamica, de piektijd ten opzichte van naburige genen en de periodelengte, enz. (Figuur 7C). Gedetailleerde fasespecifieke vergelijkingen konden echter niet worden gemaakt omdat de tijdstippen niet noodzakelijkerwijs correleren met dezelfde celcyclusfase tussen omstandigheden. Hoewel de tweede cycli na uitlijning vergelijkbaar leken, werden de eerste cycli enigszins verschoven tussen de omstandigheden (figuur 7D). Deze verschuiving kan het feit weerspiegelen dat de ontluikende celcyclusfase-informatie van lagere kwaliteit was voor toestand 3. Niettemin maakte de afstemming van de experimenten op de drie voorwaarden een verbeterde fasespecifieke vergelijking mogelijk. Voorafgaand aan de uitlijning was het onduidelijk of de eerste expressiepiek in elke toestand zou optreden in dezelfde celcyclusfase (figuur 7C); na uitlijning konden de experimenten echter fasespecifiek worden vergeleken (figuur 7D). Voorafgaand aan de uitlijning leken de pieken in conditie 3 veel breder dan in de andere twee omstandigheden (figuur 7C); na uitlijning werd echter duidelijk dat de pieken in conditie 3 een vergelijkbare breedte hadden als de andere omstandigheden wanneer ze werden uitgelijnd (figuur 7D).

Deze representatieve resultaten tonen het proces voor het gebruik van CLOCCS om experimenten af te stemmen op een gemeenschappelijke tijdschaal. Voorafgaand aan uitlijning correleren directe tijdpuntvergelijkingen vaak niet met een vergelijkbare celcyclusfase. De conversie van de verstreken experimentele tijd in minuten naar levenslijnpunten die de celcyclusfase vertegenwoordigen, maakt fasespecifieke en biologisch relevante vergelijkingen tussen experimenten op hetzelfde punt in de celcyclus mogelijk.

Figuur 1: Overzicht van de CLOCCS lifeline alignment workflow. De experimentele workflow voor de uitlijning van twee voorbeeldgegevenssets met behulp van CLOCCS, gevolgd door representatieve vergelijkingen tussen de gegevenssets. De belangrijkste stappen uit het protocol worden geïllustreerd: het verzamelen van niet-uitgelijnde celcyclusfase en experimentele gegevens voor elk van de datasets (stap 1), het gebruik van CLOCCS voor de parametrering van elke dataset (stap 2 en stap 3), de uitlijning van de datasets op een gemeenschappelijke levenslijn (stap 4) en ten slotte de vergelijking van de celcyclusfase en experimentele dynamiek (stap 5 en stap 6). De niet-uitgelijnde celcyclusfasegegevens worden ingevoerd in CLOCCS om aangeleerde parameters te bieden, die vervolgens worden gebruikt voor uitlijning op een gemeenschappelijke levenslijnschaal. Deze uitgelijnde datasets worden vervolgens vergeleken. Afkorting: CLOCCS = Characterizing Loss of Cell Cycle Synchrony. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 2: Indeling van de celcyclusfase en experimentele gegevens die nodig zijn voor de workflow. De gegevens die nodig zijn voor de workflow bestaan uit twee hoofdcomponenten: celcyclusfasegegevens en celcyclusexperimentele gegevens. De celcyclusfasegegevens kunnen bestaan uit gegevens over de ontluiking van de celcyclus of gegevens over het flowcytometrische DNA-gehalte voor elk tijdstip in de tijdreeks. De experimentele gegevens kunnen vele vormen aannemen, maar in dit geval zijn het transcriptomische gegevens, die bestaan uit genexpressiegegevens voor elk gen voor elk tijdspunt in de tijdreeks. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 3: Voorbeeld van resultaten van het uitvoeren van CLOCCS op een S. cerevisiae celcyclus dataset. (A) Een screenshot van de CLOCCS grafische gebruikersinterface met de invoerwaarden en instellingen die zijn geleverd voor ontluikende gegevens van Voorwaarde 2. De tijden, het aantal niet-gebuddeerde cellen en het aantal budded-cellen worden ingevoerd, evenals het modeltype, iteraties en voorwaarden, enz. (B) Een screenshot van de resulterende CLOCCS-ontluikende fit voor conditie 2 onder het tabblad "Voorspelde fit" van de resultaten. Elk datapunt heeft een bijbehorende steekproeffoutbalk die overeenkomt met de 95% binomiale verhoudingsbetrouwbaarheidsintervallen van de gegevens (voor elk tijdstip werden ten minste 200 cellen geteld [tussen 204 en 295 cellen]). De resulterende ontluikende pasvormcurve toont de betrouwbaarheidsband voor het 95% betrouwbaarheidsinterval van de CLOCCS-pasvorm in paars. (C) Een screenshot van de resulterende "Posterieure parameters" tabel voor de Conditie 2 ontluikende CLOCCS run bestaande uit de CLOCCS parameters bij het gemiddelde, het 2,5% betrouwbaarheidsinterval en het 97,5% betrouwbaarheidsinterval. De posterieure en acceptatiepercentages worden ook weergegeven. (D) Een screenshot van de flowcytometrie CLOCCS past voor conditie 2 op 70 min en 150 min. Klik hier om een grotere versie van deze figuur te bekijken.

Afbeelding 4: Voorbeeld van het conversieproces van tijdpunten naar uitgelijnde levenslijnpunten voor de Condition 2-gegevensset . (A) De conversieformules die worden gebruikt om van tijdspunten naar levenslijnpunten te converteren. Een screenshot van de Python-functies in het Python-notitieblok voor conversie en het plotten van de ontluikende curven. (B) De niet-uitgelijnde ontluikende curve van Voorwaarde 2 die het ontluikende percentage voor elk tijdspunt in minuten weergeeft. De celcyclus- en herstelfasen worden als volgt gemarkeerd: herstel (grijs), eerste celcyclus (blauw), tweede celcyclus (magenta) en derde celcyclus (zalm). (C) De uitgelijnde ontluikende curve van Voorwaarde 2 met dezelfde ontluikende percentages, maar uitgezet op de op de levenslijn uitgelijnde schaal. De celcyclus- en herstelfasen worden gemarkeerd zoals in paneel C. (D) De uitgelijnde flowcytometrie plots voor geselecteerde tijdspunten uit toestand 2 die overeenkomen met verschillende celcyclusfasen op basis van de levenslijnschaal: het begin van G1, het begin van de S-fase, het begin van G2/M en de late G2/M. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 5: Representatieve resultaten voor de vergelijking van de uitgelijnde en niet-uitgelijnde conditie 1-replicatie-experimenten. Vergelijking van de voorwaarde 1 repliceert: Conditie 1 RNA-seq (blauw), Voorwaarde 1 microarray 1 (paars) en Voorwaarde 1 microarray 2 (grijs). (A) De niet-uitgelijnde ontluikende curve voor de conditie 1-datasets. (B) De uitgelijnde ontluikende curve voor de conditie 1-datasets. De levenslijnpunten zijn omgezet naar de celcyclusfase en hebben een kleurcode onder de x-as. (C) De niet-uitgelijnde genexpressie van een representatief gen, CDC20, voor de condition 1 datasets. (D) De uitgelijnde genexpressie van een representatief gen, CDC20, voor de Condition 1 datasets. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 6: Representatieve resultaten voor de vergelijking van uitgelijnde en niet-uitgelijnde celcyclusfasegegevens over experimenten met verschillende perioden. Vergelijking van de celcyclusfasegegevens voor datasets met drie verschillende omgevingscondities en dus drie verschillende celcyclusperioden: Conditie 1 RNA-seq (celcyclusperiode: 71 min), Conditie 2 RNA-seq (celcyclusperiode: 82 min) en Conditie 3 RNA-seq (celcyclusperiode: 110 min). (A) De niet-uitgelijnde ontluikende curve voor de datasets. (B) De uitgelijnde ontluikende curve voor de datasets. (C) De flow-cytometrische DNA-inhoud histogrammen voor toestand 2 (bovenste rij) vergeleken met de equivalente levenslijnpunten in toestand 1 (onderste rij). Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 7: Representatieve resultaten voor de vergelijking van de uitgelijnde en niet-uitgelijnde transcriptomische gegevens over experimenten met verschillende perioden. Vergelijking van de transcriptomische gegevens geassocieerd met de datasets in figuur 6: Conditie 1 RNA-seq, Conditie 2 en Conditie 3. (A) De niet-uitgelijnde genexpressie van een representatief gen, CDC20, voor de RNA-seq-datasets van Conditie 1, Voorwaarde 2 en Toestand 3. (B) De uitgelijnde genexpressie van CDC20 voor de datasets. (C) De niet-uitgelijnde heatmap van de bovenste cell-cycle periodieke genen in dezelfde volgorde voor elke dataset. (D) De op de levenslijn uitgelijnde heatmaps van dezelfde periodieke genen uit de celcyclus van paneel C in dezelfde volgorde. De onderbroken paarse lijnen komen overeen met de levenslijnpunten 100 en 200. Klik hier om een grotere versie van deze figuur te bekijken.

Tabel 1: Levenslijn wijst naar celcyclusfaseconversie. De conversiesleutel tussen de levenslijnpuntschaal en de overeenkomstige fase in het experiment. Levenslijnpunten 0-100 komen overeen met herstel van synchronisatie. Elke volgende 100 levenslijnpunten komen overeen met een nieuwe celcyclus, waarbij de eerste 15,5 levenslijnpunten overeenkomen met G1, de volgende 20 overeenkomen met de S-fase en de resterende levenslijnpunten overeenkomen met G2 / M. Klik hier om deze tabel te downloaden.

Tabel 2: Ontluikende CLOCCS-parameters. De resulterende ontluikende CLOCCS-parameters "lambda" en "mu0" voor elk experiment uit de representatieve resultaten. Bovendien worden de dochterspecifieke vertraging "Delta" en de berekende celcyclusperiode voor elk experiment weergegeven. Klik hier om deze tabel te downloaden.

Tabel 3: Conversietabel met de conversie tussen tijdspunten in minuten en hun respectieve overeenkomstige levenslijnpunten voor Voorwaarde 2. Klik hier om deze tabel te downloaden.

Aanvullende figuur S1: CLOCCS ontluikende pasvormen voor conditie 1 en conditie 3. Screenshot van de resulterende CLOCCS ontluikende fit voor (A) de Condition 1 RNA seq budding data, (B) de Condition 1 microarray 1 budding data, (C) de Condition 1 microarray 2 budding data, en voor (D) de Condition 3 budding data. De CLOCCS ontluikende fit voor conditie 2 is te zien in figuur 3B. De 95%-betrouwbaarheidsband en de bemonsteringsfoutbalken zijn zoals beschreven in de CLOCCS-documentatie^14,15 en in figuur 3. Voor elk tijdspunt voor elke tijdreeks werden ongeveer 200 cellen geteld. Klik hier om dit bestand te downloaden.

Aanvullende figuur S2: CLOCCS-flowcytometrie past bij conditie 1 en conditie 2. Screenshot van de flowcytometrie die CLOCCS past voor de monsters die worden weergegeven in figuur 6C voor conditie 2 (bovenste rij: A-D) en conditie 1 (onderste rij: E,F). Klik hier om dit bestand te downloaden.

Aanvullende figuur S3: Gevoeligheid van de uitlijning voor variaties in de CLOCCS-parameters. Vergelijking van de uitlijning van de Condition 1 RNA-Seq dataset met behulp van (A-C) variaties in de CLOCCS parameters λ en μ0 binnen het betrouwbaarheidsinterval van de CLOCCS fit en (D,E) met grote variaties in de parameters. Vergelijking tussen de gemiddelde waarde met de 2,5% en 97,5% betrouwbaarheidswaarden in de parametertabel door CLOCCS voor (A) de parameter μ0, (B) de parameter λ, en (C) voor beide parameters μ0 en λ. (D) Vergelijking van de uitlijning met behulp van de gemiddelde waarde voor μ0 met grote variaties in de μ0-parameter (200% tot 0,25% van μ0). (E) Vergelijking van de uitlijning met behulp van de gemiddelde waarde voor λ in vergelijking met grote variaties in de λ-parameter (200% tot 0,25% van λ). Klik hier om dit bestand te downloaden.

Aanvullende tabel S1: Beschrijving van de gegevensverzameling voor elk experiment. Voor elk experiment bevat deze tabel een beschrijving van de ontluikende gegevens, flowcytometriegegevens, transcriptomische gegevens en synchronisatiemethode. Klik hier om dit bestand te downloaden.

Aanvullende tabel S2: CLOCCS-parameters van de flow-cytometrische CLOCCS-runs. De CLOCCS-parameters "mu0" en "lambda" voor de conditie 1 en conditie 2 flowcytometrie CLOCCS lopen. Klik hier om dit bestand te downloaden.

Aanvullend bestand 1: Instructies voor de conversie van de flow-cytometrische gegevens naar CLOCCS-invoerformaat. Voor het gebruik van CLOCCS met flow-cytometrische gegevens is een specifiek invoerformaat vereist. Dit bestand bevat meer gedetailleerde instructies met betrekking tot protocolstap 3.4.1 om uit te leggen hoe u de python-hulpprogrammafuncties kunt gebruiken om deze conversie uit te voeren. Klik hier om dit bestand te downloaden.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Dit artikel presenteert een methode voor het nauwkeuriger en kwantitatief beoordelen van gegevens uit tijdreeksexperimenten op gesynchroniseerde populaties van cellen. De methode maakt gebruik van geleerde parameters van CLOCCS, een Bayesiaans inferentiemodel dat gebruik maakt van input cel-cyclus fasegegevens, zoals ontluikende gegevens en flow-cytometrische DNA-inhoudsgegevens, om elk experiment te parametriseren^14,15. CLOCCS gebruikt de invoercelcyclusfasegegevens om de parameters voor elk experiment af te leiden, die vervolgens worden gebruikt voor uitlijning op een gemeenschappelijke levenslijnschaal. Het omzetten van meerdere synchrony/release tijdreeksexperimenten naar een enkele op de levenslijn uitgelijnde tijdschaal maakt fasespecifieke en relevante vergelijkingen tussen experimenten en de aggregatie van meerdere replicatie-experimenten mogelijk, die voorheen moeilijk of onmogelijk waren.

De kritieke stappen van dit protocol omvatten het verzamelen van de gegevens, het uitvoeren van CLOCCS, het uitlijnen van de gegevenssets en het vergelijken van de gegevenssets. Ten eerste moeten gegevens worden verzameld voor gebruik in dit protocol. De gegevens moeten bestaan uit zowel experimentele gegevens die informatie bevatten over de kwestie van belang (d.w.z. transcriptomische gegevens, genexpressiegegevens, proteomische gegevens) als celcyclusfasegegevens die informatie bevatten over de fase van de celcyclus (d.w.z. ontluikende gegevens, flowcytometrische DNA-inhoudsgegevens). Vervolgens kunnen de celcyclusfasegegevens in CLOCCS worden gebruikt om de parameterinformatie voor elk experiment te verzamelen. De parameters μ₀ (lengte herstelfase) en λ (moedercelcyclusperiode) worden gebruikt om de tijdspunten om te zetten in levenslijnpunten. De uitlijning van het levenslijnpunt maakt het mogelijk om de uitgelijnde tijdreeksen direct te vergelijken.

Een beperking van de methode is dat een goede uitlijning afhankelijk is van het identificeren van een goede pasvorm met de gegevens. Het bereiken van de beste CLOCCS-pasvorm is afhankelijk van de kwaliteit van de celcyclusfasegegevens en het gebruik van de juiste invoerinstellingen voor het experiment in CLOCCS. De aanpassing aan de celcyclusfasegegevens bepaalt de nauwkeurigheid van de geleerde parameters en heeft dus een grote invloed op de nauwkeurigheid van de uitlijning, omdat deze afhankelijk is van het gebruik van deze parameters. Aangezien brede veranderingen in de parameters de uitlijning sterk zouden beïnvloeden, blijven de veranderingen minimaal binnen het betrouwbaarheidsinterval dat in de CLOCCS-uitgang wordt geleverd (aanvullende figuur S3). Het is belangrijk op te merken dat deze gevoeligheid voor variaties in de parameters ook zorgt voor uitlijning tussen datasets met variërende celcyclustiming.

De nauwkeurigheid van de CLOCCS-pasvorm kan worden bepaald met behulp van de resulterende CLOCCS-fitcurve en de bijbehorende foutbalken en foutband (figuur 3B, D, aanvullende figuur S1 en aanvullende figuur S2). Het tabblad CLOCCS-fit toont de oorspronkelijke gegevenspunten, evenals de CLOCCS-fitcurve met de betrouwbaarheidsband die overeenkomt met het betrouwbaarheidsinterval van de CLOCCS-fit en de foutbalken die overeenkomen met het 95% binomiale proportiebetrouwbaarheidsinterval van de gegevens, aangezien de tellingen worden verondersteld onafhankelijke binomiale willekeurige variabelen^{te zijn 14}. De betrouwbaarheidsbalken op de ontluikende gegevens meten bijvoorbeeld het vertrouwen in het aandeel van gebuddeerde cellen voor een bepaald monster.

Een methode voor het bepalen van de kwaliteit van de CLOCCS-fit is om te bepalen of de foutbalken van de gegevens overlappen met de betrouwbaarheidsintervalband van de CLOCCS-fit. Een andere indicatie is de breedte van de 95% betrouwbaarheidsband van de CLOCCS fit. Over het algemeen neemt de breedte van de band af met een verhoogde goedheid van pasvorm. Een indicatie van slechte uitlijning is als de celcyclusfase van de oorspronkelijke gegevens niet overeenkomt met de celcyclusfase die is afgeleid van de uitlijning. Elke uitlijning kan dubbel worden gecontroleerd door te bevestigen dat voor elk tijdstip de fase die wordt aangegeven door de informatiegegevens van de celcyclusfase overeenkomt met de celcyclusfase die door de uitlijning is toegewezen.

Een slechte CLOCCS-pasvorm of slechte uitlijning kan het gevolg zijn van celcyclusfasegegevens van lage kwaliteit. Hoogwaardige ontluikende gegevens hebben een zeer laag ontluikingspercentage onmiddellijk na arrestatie en een zeer hoog ontluikingspercentage bij de eerste piek. De daaropvolgende pieken en dalen verliezen synchronie, maar moeten duidelijk en gelijkmatig verdeeld zijn. Omdat de levenslijnpunten de gemiddelde celcyclusfase van de populatie vertegenwoordigen, kan een slechte synchronisatie ook een goede uitlijning belemmeren. Hoogwaardige flow-cytometrische DNA-inhoudsgegevens hebben verschillende 1C- en 2C-pieken voor elk tijdstip dat overeenkomt met de juiste celcyclusfase. Bovendien leiden onvoldoende celcyclusfasegegevens tot problemen met de identificatie van parameters. In het geval van voldoende gegevens kunnen de parameters worden afgeleid en veranderen ze niet substantieel tussen CLOCCS-runs. De in dit protocol beschreven parameters (lambda, delta, mu0) kunnen echter niet worden ontward wanneer de celcyclusfasegegevens slechts één volledige celcyclus bevatten. Om een betere parameterschatting mogelijk te maken, moeten voldoende en goed geconstrueerde celcyclusgegevens worden gebruikt voor de CLOCCS-fits^14,15. Bovendien maakt het CLOCCS-model gebruik van eerdere informatie zoals beschreven in Orlando et ^al.15, maar deze informatie kan worden aangepast om beter aan te sluiten bij de gebruikte experimentele omstandigheden.

Als de kwaliteit van de celcyclusfasegegevens goed is, kan het opnieuw aanpassen van de CLOCCS-instellingen helpen om een nauwkeurigere pasvorm te produceren. Het aantal geselecteerde iteraties kan bijvoorbeeld worden verhoogd om de nauwkeurigheid te verbeteren. Bevestigen dat de juiste synchronisatiemethode is geselecteerd in CLOCCS kan ook nuttig zijn, omdat alfafactorstilstand gepaard gaat met een kortere hersteltijd in vergelijking met elutriatie.

Deze methode is ook beperkt in termen van de soorten celcyclusfasegegevens die momenteel worden ondersteund. CLOCCS is echter flexibel en kan worden aangepast om andere soorten gegevens te ondersteunen. CLOCCS is bijvoorbeeld eerder aangepast om de fluorescerende etikettering van de celcyclus van spindelpoollichamen, myosineringen en kernen¹¹ te ondersteunen voor gebruik als celcyclusfase-id's. Bovendien is het gebruik van CLOCCS bij andere soorten dan S. cerevisiae mogelijk gemaakt. CLOCCS accepteert septatie-indices als een marker voor de celcyclusfase in S. pombe¹⁴, evenals flow-cytometrische DNA-inhoudsgegevens, die gemakkelijk te verzamelen zijn voor veel soorten¹⁵. Dit maakt het mogelijk om experimentele gegevens in dezelfde fase van de celcyclus voor twee totaal verschillende soorten te vergelijken en kan inzicht geven in veranderingen in de celcyclus gedurende de evolutie.

Hoewel alleen ondersteunde vormen van celcyclusfasegegevens kunnen worden gebruikt met deze levenslijnuitlijningsmethode, is deze methode agnostisch voor het type tijdreeksexperimentele gegevens dat wordt gebruikt. In dit protocol hebben we het gebruik ervan aangetoond bij het uitlijnen van de genexpressie van een individueel gen, evenals transcriptomische gegevens van tijdreeksen voor honderden genen tegelijk. We hebben aangetoond dat deze methode kan worden gebruikt om verschillende platforms te vergelijken en dus vergelijkingen te maken tussen RNA-seq-datasets en microarray-datasets die in vergelijkbare omstandigheden zijn genomen. We hebben ook aangetoond dat deze methode kan worden gebruikt om datasets uit te lijnen met verschillende synchronisatiemethoden door een dataset te vergelijken die werd geëlutrieerd (Condition 1 Microarray) met een dataset die alpha factor arrested was (Condition 1 RNA-seq). Eerder werd CLOCCS ook gebruikt om tijdreekstranscriptomische en tijdreeksproteomische gegevens uit te lijnen met behulp van ontluikende celcyclusfasegegevens²², die directe vergelijkingen tussen de mRNA-dynamiek en de dynamiek van het overeenkomstige eiwit mogelijk maakten. CLOCCS is ook gebruikt om tijdreeksgegevens tussen soorten op elkaar af te stemmen, zoals voor uitlijning tussen S. cerevisiae en S. pombe¹⁴ en tussen de eerste cyclus van S. cerevisiae en de pathogene gist Cryptococcus neoformans²¹. Ten slotte is CLOCCS-uitlijning momenteel specifiek voor celcyclustijdreeksgegevens en is deze nog niet aangepast voor gebruik met andere soorten ritmische processen. Een gebied waar dit van bijzonder belang zou zijn, is voor circadiane ritmes, waar circadiane tijd (CT) conventioneel wordt gebruikt om experimenten uit te lijnen, hoewel de implementatie ervan niet consequent wordt toegepast. Een ander interessegebied is het onderzoeken van ontwikkelingsritmes, zoals die van de malariaparasiet. De uitlijning van Plasmodium falciparum-stammen met verschillende perioden, zoals beschreven in Smith et ^al.25, zou bijvoorbeeld meer gedetailleerde vergelijkingen tussen stammen mogelijk maken. De afstemming van deze periodieke processen voor vergelijking zou een beter begrip van deze belangrijke ritmische biologische functies mogelijk maken. Dit soort celcyclusvergelijkingen zijn mogelijk gemaakt door CLOCCS te gebruiken voor lifeline alignment, zoals beschreven in dit protocol.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

De auteurs hebben geen belangenconflicten bekend te maken.

Acknowledgments

S. Campione en S. Haase werden ondersteund door financiering van de National Science Foundation (DMS-1839288) en de National Institutes of Health (5R01GM126555). Daarnaast willen de auteurs Huarui Zhou (Duke University) bedanken voor het commentaar op het manuscript en voor het bètatesten van het protocol. We bedanken ook Francis Motta (Florida Atlantic University) en Joshua Robinson voor hun hulp met de Java-code.

Materials

Name	Company	Catalog Number	Comments
2x PBS			For Fixative Solution. Described in Leman 2014.
4% formaldehyde			For Fixative Solution.
100% Ethanol			For flow cytometry fixation. Described in Haase 2002.
CLOCCS			https://gitlab.com/haase-lab-group/cloccs_alignment.git
Flow Cytometer			For flow cytometry protocol.
Git			https://git-scm.com/
Java 19			https://www.oracle.com/java/technologies/downloads/#java19
Microscope			For counting cells and buds.
Miniconda			https://docs.conda.io/en/latest/
Protease solution			For flow cytometry protocol. Described in Haase 2002.
RNAse A solution			For flow cytometry protocol. Described in Haase 2002.
SYTOX Green Nucleic Acid Stain	Invitrogen	S7020	For flow cytometry staining. Described in Haase 2002.
Tris			pH 7.5

DOWNLOAD MATERIALS LIST

References

Tyers, M., Tokiwa, G., Futcher, B. Comparison of the Saccharomyces cerevisiae G1 cyclins: Cln3 may be an upstream activator of Cln1, Cln2 and other cyclins. EMBO Journal. 12 (5), 1955-1968 (1993).
Schwob, E., Nasmyth, K. CLB5 and CLB6, a new pair of B cyclins involved in DNA replication in Saccharomyces cerevisiae. Genes and Development. 7, 1160-1175 (1993).
Polymenis, M., Schmidt, E. V. Coupling of cell division to cell growth by translational control of the G1 cyclin CLN3 in yeast. Genes and Development. 11 (19), 2522-2531 (1997).
Spellman, P. T., et al. Comprehensive identification of cell cycle-regulated genes of the yeast Saccharomyces cerevisiae by microarray hybridization. Molecular Biology of the Cell. 9 (12), 3273-3297 (1998).
Cho, R. J., et al. A genome-wide transcriptional analysis of the mitotic cell cycle. Molecular Cell. 2 (1), 65-73 (1998).
Bar-Joseph, Z. Analyzing time series gene expression data. Bioinformatics. 20 (16), 2493-2503 (2004).
Pramila, T., Wu, W., Miles, S., Noble, W. S., Breeden, L. L. The Forkhead transcription factor Hcm1 regulates chromosome segregation genes and fills the S-phase gap in the transcriptional circuitry of the cell cycle. Genes and Development. 20 (16), 2266-2278 (2006).
Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
Nash, R., Tokiwa, G., Anand, S., Erickson, K., Futcher, A. B. The WHI1+ gene of Saccharomyces cerevisiae tethers cell division to cell size and is a cyclin homolog. EMBO Journal. 7 (13), 4335-4346 (1988).
Basco, R. D., Segal, M. D., Reed, S. I. Negative regulation of G1 and G2 by S-phase cyclins of Saccharomyces cerevisiae. Molecular and Cellular Biology. 15 (9), 5030-5042 (1995).
Mayhew, M. B., Robinson, J. W., Jung, B., Haase, S. B., Hartemink, A. J. A generalized model for multi-marker analysis of cell cycle progression in synchrony experiments. Bioinformatics. 27 (13), 295-303 (2011).
Qu, Y., et al. Cell cycle inhibitor Whi5 records environmental information to coordinate growth and division in yeast. Cell Reports. 29 (4), 987-994 (2019).
Di Talia, S., Skotheim, J. M., Bean, J. M., Siggia, E. D., Cross, F. R. The effects of molecular noise and size control on variability in the budding yeast cell cycle. Nature. 448 (7156), 947-951 (2007).
Orlando, D. A., et al. A probabilistic model for cell cycle distributions in synchrony experiments. Cell Cycle. 6 (4), 478-488 (2007).
Orlando, D. A., Iversen, E. S., Hartemink, A. J., Haase, S. B. A branching process model for flow cytometry and budding index measurements in cell synchrony experiments. Annals of Applied Statistics. 3 (4), 1521-1541 (2009).
Duan, F., Zhang, H. Correcting the loss of cell-cycle synchrony in clustering analysis of microarray data using weights. Bioinformatics. 20 (11), 1766-1771 (2004).
Darzynkiewicz, Z., Halicka, H. D., Zhao, H. Cell synchronization by inhibitors of DNA replication induces replication stress and DNA damage response: analysis by flow cytometry. Methods in Molecular Biology. 761, 85-96 (2011).
Leman, A. R., Bristow, S. L., Haase, S. B. Analyzing transcription dynamics during the budding yeast cell cycle. Methods in Molecular Biology. 1170, 295-312 (2014).
Rosebrock, A. P. Synchronization and arrest of the budding yeast cell cycle using chemical and genetic methods. Cold Spring Harbor Protocols. 2017 (1), (2017).
Haase, S. B., Reed, S. I. Improved flow cytometric analysis of the budding yeast cell cycle. Cell Cycle. 1 (2), 132-136 (2002).
Kelliher, C. M., Leman, A. R., Sierra, C. S., Haase, S. B. Investigating conservation of the cell-cycle-regulated transcriptional program in the fungal pathogen, Cryptococcus neoformans. PLoS Genetics. 12 (12), e1006453 (2016).
Kelliher, C. M., et al. Layers of regulation of cell-cycle gene expression in the budding yeast Saccharomyces cerevisiae. Molecular Biology of the Cell. 29 (22), 2644-2655 (2018).
Hughes, M. E., Hogenesch, J. B., Kornacker, K. JTK_CYCLE: An efficient nonparametric algorithm for detecting rhythmic components in genome-scale data sets. Journal of Biological Rhythms. 25 (5), 372-380 (2010).
Deckard, A., Anafi, R. C., Hogenesch, J. B., Haase, S. B., Harer, J. Design and analysis of large-scale biological rhythm studies: A comparison of algorithms for detecting periodic signals in biological data. Bioinformatics. 29 (24), 3174-3180 (2013).
Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Biology

Uitlijning van gesynchroniseerde tijdreeksgegevens met behulp van het karakteriserende Loss of Cell Cycle Synchrony Model voor vergelijkingen tussen experimenten

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.